|
- import { defineMock } from 'umi';
-
- export default defineMock({
- 'GET /api/mmp/workspace/getPublicDatasets': {
- msg: '操作成功',
- code: 200,
- data: {
- content: [
- {
- name: 'R1蒸馏模型数学推理能力测试集',
- identifier: 'public_dataset_20250519163052',
- description:
- '共728道数学推理题目,包括:\nMATH-500:一组具有挑战性的高中数学竞赛问题数据集,涵盖七个科目(如初等代数、代数、数论)共500道题。\nGPQA-Diamond:该数据集包含物理、化学和生物学子领域的硕士水平多项选择题,共198道题。\nAIME-2024:美国邀请数学竞赛的数据集,包含30道数学题。',
- is_public: true,
- time_ago: '2个月前',
- full_last_update_time: '2025-06-23T14:36:48.000+08:00',
- id: 91,
- visits: 1,
- praises_count: 1,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: '有机化学VLM',
- identifier: 'public_dataset_20250527113008',
- description: 'Dataset Card for "Chemistry_text_to_image"',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:06:32.000+08:00',
- id: 134,
- visits: 2,
- praises_count: 1,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: 'OQMD 开源量子材料数据集',
- identifier: 'public_dataset_20250527141950',
- description:
- 'QMD 包含了通过密度泛函理论 (DFT) 计算得到的超过 1,226,781 种材料的热力学和结构性质。数据库中的数据来源于无机晶体结构数据库 (ICSD),包括了近 300,000 种化合物的 DFT 总能量计算以及常见晶体结构的修饰',
- is_public: true,
- time_ago: '2个月前',
- full_last_update_time: '2025-06-23T14:38:43.000+08:00',
- id: 136,
- visits: 5,
- praises_count: 1,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: '不可降解和可生物降解的材料数据集',
- identifier: 'public_dataset_20250527142930',
- description:
- '此数据集包含大约 256K 图像(156K 原始数据),代表两类:可生物降解和不可生物降解。\n可生物降解,包含可被微生物自然分解的材料,如食物、植物、水果等。这种材料的废物可以加工成堆肥。\n不可生物降解,包含无法自然分解的材料,例如塑料、金属、无机元素等。这种材料的废料将被回收成新材料。',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:06:11.000+08:00',
- id: 137,
- visits: 2,
- praises_count: 1,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: '金属有机框架材料预测',
- identifier: 'public_dataset_20250527143028',
- description:
- '金属有机框架 (MOF) 是一类通过金属离子(或金属簇)和有机配体之间的配位键连接的结晶材料。MOF 材料具有多孔结构、高度可调和巨大的比表面积,使其在吸附、储气、分离、催化等领域具有广泛的应用潜力。预测合成是指通过计算机模拟和机器学习方法对新型 MOF 材料的合成路线和条件进行预测和设计。\n',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:06:01.000+08:00',
- id: 138,
- visits: 2,
- praises_count: 1,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: '纤维增强复合材料的弹性特性',
- identifier: 'public_dataset_20250527144649',
- description:
- '纤维增强复合材料弹性特性数据集主要包含其力学性能参数,如弹性模量(纵向、横向)、剪切模量、泊松比以及应力-应变关系等。数据通常通过实验测试(拉伸、压缩、弯曲试验)或计算模拟(有限元分析、细观力学模型)获得,涵盖不同纤维类型(碳纤维、玻璃纤维、芳纶等)、基体材料(环氧树脂、热塑性塑料等)及铺层方式(单向、编织、多轴向)的组合。',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:05:24.000+08:00',
- id: 142,
- visits: 2,
- praises_count: 1,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: 'OCR 合成材料',
- identifier: 'public_dataset_20250527144821',
- description:
- 'OCR(光学字符识别)合成材料数据集是用于训练和评估文本识别模型的专用数据集,主要包含人工生成的文本图像,模拟真实场景中的材料标签、说明书、包装文字等。这类数据集通常涵盖多种字体、背景、光照条件、扭曲变形及噪声干扰,以提高模型鲁棒性。数据可能包含金属、塑料、复合材料等工业材料的名称、参数(如成分、规格、批次号)及安全标识',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:05:18.000+08:00',
- id: 143,
- visits: 2,
- praises_count: 1,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: '钙钛矿稳定性',
- identifier: 'public_dataset_20250527145953',
- description:
- '这个钙钛矿稳定性数据集给出了潜在钙钛矿材料成分相对于用 DFT 计算的凸包的能量。钙钛矿数据集还包括包含钙钛矿结构中 A 位点、B 位点和 X 位点信息的列,以便对数据进行更高级的分组。',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:04:30.000+08:00',
- id: 148,
- visits: 2,
- praises_count: 1,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: '纳米颗粒毒性数据集',
- identifier: 'public_dataset_20250527150856',
- description:
- '该数据集是一个毒性数据集,由几列组成,捕获了纳米颗粒 (NPs) 的各种属性及其毒理学影响。该数据集包含与纳米颗粒 (NPs) 及其特性相关的各种特征,这些特征可能与毒性分类有关',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:04:41.000+08:00',
- id: 149,
- visits: 2,
- praises_count: 1,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: '3D多模态医疗数据集-分割-fanshuai',
- identifier: 'public_dataset_20250519151852',
- description: '大规模通用 3D 医疗图像分割数据集 (M3D-Seg)',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-22T10:20:52.000+08:00',
- id: 82,
- visits: 0,
- praises_count: 0,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: '中文基于满血DeepSeek-R1蒸馏数据集',
- identifier: 'public_dataset_20250519161406',
- description:
- '注意:提供了直接SFT使用的版本。将数据中的思考和答案整合成output字段,大部分SFT代码框架均可直接直接加载训练。\n本数据集为中文开源蒸馏满血R1的数据集,数据集中不仅包含math数据,还包括大量的通用类型数据,总数量为110K。\n为什么开源这个数据?\nR1的效果十分强大,并且基于R1蒸馏数据SFT的小模型也展现出了强大的效果,但检索发现,大部分开源的R1蒸馏数据集均为英文数',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-19T16:14:06.000+08:00',
- id: 88,
- visits: 0,
- praises_count: 0,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: '中文Text2SQL数据集',
- identifier: 'public_dataset_20250519165142',
- description:
- '同时包含用于训练和测试表格问答预训练模型的数据,数据集包含500条训练数据和100条测试数据。\n表格问答预训练模型的训练和测试数据,支持中文,支持通用领域的表格问答。另外,也可以从本model card中,点击数据集文件panel,然后点击数据文件选项,即可下载trian.zip和test.zip文件',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-19T16:51:43.000+08:00',
- id: 93,
- visits: 0,
- praises_count: 0,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: 'MatPES',
- identifier: 'public_dataset_20250521090336',
- description:
- '使用元素周期表几乎完全覆盖的势能面数据集来训练基础 电位 (FP),即机器学习原子间电位 (MLIP),几乎完全覆盖了周期性 桌子。MatPES 是材料虚拟实验室和材料项目的一项倡议,旨在解决此类材料 PES 数据集中的关键缺陷。',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:10:21.000+08:00',
- id: 100,
- visits: 2,
- praises_count: 0,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: 'innovation_contest/innov202305100905418',
- identifier: 'public_dataset_20250526093119',
- description:
- '1. 赛题解读PPT;2.根据流动状态分开的数据集,方便选手测试自己模型的变状态泛化性能\n新的数据中输入输出与均在一个文件夹中\n新的数据集中,模型文件简称对应的状态如下:\nCBFS 曲线后台阶 雷诺数Re=13700\nCDN 收缩扩张管道 Re=12600\nduct 方管 Re在文件名中包含,比如duct_Re1100.csv代表Re=1100\nperhill 周期山 Re=5600,文件名后面',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:08:27.000+08:00',
- id: 122,
- visits: 3,
- praises_count: 0,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: 'WIDERFace',
- identifier: 'public_dataset_20250526094839',
- description:
- '32,203张图像,并对393,703张像样本图像中所描述的在尺度、姿势和遮挡方面具有高度可变性的面孔进行标记。较宽的人脸数据集基于61个事件类进行组织。',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:08:18.000+08:00',
- id: 123,
- visits: 2,
- praises_count: 0,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: 'StanfordSentimentTreebank',
- identifier: 'public_dataset_20250526095521',
- description:
- '用于情感分析的数据集,其中包含11855个句子的语法分析树中215154个短语的细粒度情感标签,并为情感组成提出了新挑战。',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:08:12.000+08:00',
- id: 124,
- visits: 2,
- praises_count: 0,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: 'COCO',
- identifier: 'public_dataset_20250526100341',
- description:
- 'COCO是大规模的对象检测,分割和字幕数据集。 它包含:330K图像(标为> 200K),150万个对象实例,80个对象类别。',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:07:56.000+08:00',
- id: 125,
- visits: 2,
- praises_count: 0,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: 'BillionWords',
- identifier: 'public_dataset_20250526101006',
- description: '该项目的目的是为语言建模实验提供标准的培训和测试设置,包含10亿字。',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:07:47.000+08:00',
- id: 126,
- visits: 2,
- praises_count: 0,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: 'car_ims',
- identifier: 'public_dataset_20250527084401',
- description:
- '斯坦福汽车数据集包含196类汽车的16,185张图像。数据被分为8,144个训练图像和8,041个测试图像,其中每个类别已大致分为50-50个分割。',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:07:20.000+08:00',
- id: 128,
- visits: 2,
- praises_count: 0,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- {
- name: 'IU-xrays',
- identifier: 'public_dataset_20250527093542',
- description: '放射图像',
- is_public: true,
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:07:12.000+08:00',
- id: 129,
- visits: 2,
- praises_count: 0,
- create_by: 'fanshuai',
- owner: 'fanshuai',
- },
- ],
- pageable: {
- sort: {
- sorted: false,
- unsorted: true,
- empty: true,
- },
- pageNumber: 0,
- pageSize: 20,
- offset: 0,
- unpaged: false,
- paged: true,
- },
- last: false,
- totalElements: 39,
- totalPages: 2,
- first: true,
- number: 0,
- sort: {
- sorted: false,
- unsorted: true,
- empty: true,
- },
- numberOfElements: 20,
- size: 20,
- empty: false,
- },
- },
- 'GET /api/mmp/workspace/getPublicModels': {
- msg: '操作成功',
- code: 200,
- data: {
- content: [
- {
- id: 109,
- name: '介电',
- create_by: 'ceshi',
- description: '介电材料模型',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:09:54.000+08:00',
- owner: 'ceshi',
- identifier: 'public_model_20250522110231',
- is_public: true,
- praises_count: 2,
- },
- {
- id: 156,
- name: 'ChatGLM2-6B',
- create_by: 'fanshuai',
- description:
- 'ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上',
- time_ago: '2个月前',
- full_last_update_time: '2025-06-20T16:09:02.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528093916',
- is_public: true,
- praises_count: 1,
- },
- {
- id: 155,
- name: '鹏城·脑海(原鹏城·盘古)α-2.6B-CPU',
- create_by: 'fanshuai',
- description:
- '「鹏城·盘古α」由以鹏城实验室为首的技术团队联合攻关,首次基于“鹏城云脑Ⅱ”和国产MindSpore框架的自动混合并行模式实现在2048卡算力集群上的大规模分布式训练,训练出业界首个2000亿参数以中文为核心的预训练生成语言模型。鹏城·盘古α预训练模型支持丰富的场景应用,在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出,具备很强的小样本学习能力。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:03:36.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528093254',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 157,
- name: 'ernie-3.0-base-zh',
- create_by: 'fanshuai',
- description: '大规模知识增强预训练,用于语言理解和生成',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:03:08.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528094825',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 158,
- name: 'FastChat-T5',
- create_by: 'fanshuai',
- description:
- 'FastChat-T5是一款开源聊天机器人,通过微调Flan-t5-xl (3B参数)并基于从ShareGPT.收集的用户共享对话进行训练。它基于编码器-解码器变压器架构,能够自回归生成对用户输入的响应。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:03:19.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528101831',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 159,
- name: 'Kolors-IP-Adapter-Plus',
- create_by: 'fanshuai',
- description: '基于Kolors-Basemodel提供了IP-Adapter-Plus的权重和推理代码',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:03:01.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528102217',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 160,
- name: 'Florence-2-base',
- create_by: 'fanshuai',
- description:
- 'Florence-2是一款先进的视觉基础模型,采用提示式方法处理广泛的视觉和视觉-语言任务。Florence-2能够通过简单的文本提示来执行诸如字幕生成、物体检测和分割等任务。该模型利用了包含54亿个注释的FLD-5B数据集,这些注释覆盖了1.26亿张图像,从而掌握了多任务学习。模型的序列到序列架构使其在零样本和微调设置中表现出色,证明了其作为竞争性视觉基础模型的实力。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:02:55.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528102750',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 161,
- name: 'E5-base',
- create_by: 'fanshuai',
- description: '弱监督对比预训练的文本嵌入。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:02:48.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528103059',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 162,
- name: 'Mini-InternVL-Chat',
- create_by: 'fanshuai',
- description:
- '使用了与InternVL 1相同的数据来训练这个较小的模型。此外,由于较小模型的训练成本较低,我们在训练时采用了8K的上下文长度。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:02:39.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528105945',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 163,
- name: 'Verdict-Classifier',
- create_by: 'fanshuai',
- description:
- '该模型是基于xlm-roberta-base的微调版本,基于谷歌事实核查工具API提供的2,500条去重多语言判决,并通过谷歌云翻译API转换成65种语言',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:02:27.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528110545',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 164,
- name: 'Text2Vec-Base-Multilingual',
- create_by: 'fanshuai',
- description:
- '这是一个CoSENT(余弦句子)模型,它将句子映射到一个384维的密集向量空间,并可用于任务,例如句子嵌入、文本匹配或语义搜索。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:02:19.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528110858',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 167,
- name: 'Latex-OCR',
- create_by: 'fanshuai',
- description: '识别图像中的数学公式并转换为Latex源码。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T18:02:09.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528112153',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 169,
- name: 'XLNet',
- create_by: 'fanshuai',
- description:
- 'XLNet是一种基于新型广义置换语言建模目标的新型无监督语言表示学习方法。此外,XLNet采用Transformer-XL作为骨干模型,在处理长上下文的语言任务中表现出色。总体而言,XLNet在包括问答、自然语言推理、情感分析和文档排序在内的多种下游语言任务中取得了最先进的(SOTA)成果。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-28T17:29:05.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250528172905',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 173,
- name: ' GTE-base',
- create_by: 'fanshuai',
- description:
- 'GTE模型由阿里巴巴达摩学院训练。这些模型主要基于BERT框架,目前提供三种不同规模的版本,分别是GTE-large、GTE-base和GTE-small。GTE模型在大规模的相关文本对语料库上进行训练,涵盖了广泛的领域和场景。这使得GTE模型能够应用于文本嵌入的多种下游任务,如信息检索、语义文本相似性分析、文本重排序等。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-29T09:14:15.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250529091415',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 174,
- name: 'Tiny-lm',
- create_by: 'fanshuai',
- description:
- '此仓库提供了一个小型的1600万参数语言模型,该模型基于英文和日文维基百科数据训练。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-29T09:18:57.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250529091857',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 175,
- name: "Snowflake's Arctic-embed-s",
- create_by: 'fanshuai',
- description:
- 'snowflake-arctic-embed是一套文本嵌入模型,专注于创建高性能的高质量检索模型。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-29T09:23:58.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250529092358',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 176,
- name: 'ViTMatte model',
- create_by: 'fanshuai',
- description:
- 'ViTMatte是一种简单的图像抠图方法,旨在准确估计图像中的前景物体。该模型由一个Vision Transformer(ViT)和一个轻量级头部组成。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-29T09:41:07.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250529094107',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 177,
- name: 'Wartortle',
- create_by: 'fanshuai',
- description: '此模型专为语义自动补全功能而设计。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-29T09:44:43.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250529094443',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 179,
- name: 'Cerebras-GPT',
- create_by: 'fanshuai',
- description:
- 'Cerebras-GPT系列的发布旨在通过开放架构和数据集促进对大型语言模型(LLM)扩展规律的研究,并展示在Cerebras软硬件栈上训练LLM的简便性和可扩展性。所有Cerebras-GPT模型均可在Hugging Face.上获取。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-29T10:01:52.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250529100152',
- is_public: true,
- praises_count: 0,
- },
- {
- id: 180,
- name: 'Qwen2-1.5B-Instruct-AWQ',
- create_by: 'fanshuai',
- description:
- 'Qwen2是Qwen大语言模型系列的最新成员。我们为Qwen2推出了多个基础语言模型和指令调优语言模型,参数规模从0.5亿到72亿不等,其中包括一个专家混合模型。本仓库包含1.5亿参数的指令调优Qwen2模型。',
- time_ago: '3个月前',
- full_last_update_time: '2025-05-29T10:13:53.000+08:00',
- owner: 'fanshuai',
- identifier: 'public_model_20250529101353',
- is_public: true,
- praises_count: 0,
- },
- ],
- pageable: {
- sort: {
- sorted: false,
- unsorted: true,
- empty: true,
- },
- pageNumber: 0,
- pageSize: 20,
- offset: 0,
- unpaged: false,
- paged: true,
- },
- last: false,
- totalElements: 28,
- totalPages: 2,
- first: true,
- number: 0,
- sort: {
- sorted: false,
- unsorted: true,
- empty: true,
- },
- numberOfElements: 20,
- size: 20,
- empty: false,
- },
- },
- });
|