自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

OpenDataLab的博客

公开数据集平台资讯、资源分享

  • 博客(108)
  • 收藏
  • 关注

原创 MinerU2.5大模型发布了,有亿点点不一样

从评测结果来看,在权威的OmniDocBench基准测试中,MinerU2.5取得结果最优(SOTA),在布局检测、文本识别、表格识别、公式识别等关键指标上超越Gemini 2.5-Pro、GPT-4o等国际顶尖模型,对比开源文档解析方案(如MonkeyOCR、PP-StructureV3),MinerU2.5在解析精度、结构完整性和格式自然度方面同样处于优势地位。下一步,团队将持续拓展国际国内主流平台和开发工具的适配覆盖,进一步加强与重点行业应用的深度融合,打造更加开放、兼容、可扩展的技术生态体系。

2025-09-30 17:16:20 1436

原创 高性能文档解析引擎MinerU再升级,全方位刷新行业SOTA,全面助力AI Ready数据自由

具体来说,Miner2.5在复杂文档处理上的进步,体现在结构还原与语义理解的双重提升。未来,团队将继续拓展更广泛的软件生态,不仅涵盖更多国内外主流 AI 平台和开发工具,也将加强与垂直行业应用的深度融合,打造开放、兼容、可扩展的技术生态体系,以支持更丰富的应用场景和更高效的产业落地。MinerU 2.5独辟蹊径,采用首创的“二阶段”解析架构,同时支持原生分辨率处理,从根源上最大限度地降低了信息失真的概率,实现了对复杂文档又快又准的解析效果,在显著减少“幻觉”现象的同时,大幅提升了解析结果的可靠性。

2025-09-28 16:02:59 1092

原创 MinerU2.5! 公式、表格解析统统不在话下!

之前我们发布了MinerU2.5模型,包含网页端/桌面客户端端/api 在内点MinerU 全线产品已经集成了最新模型,这波直接把文档解析做到天花板 💯。📚 无论科研、金融还是教育场景,MinerU 都能帮你轻松搞定高质量文档解析,为知识库构建省时又省力!更赞的是 👉 中文公式、复杂数学公式、嵌套表格都做了深度优化!✅ 无线/少线表格一键解析。

2025-09-28 15:33:57 471

原创 告别“炼丹玄学”:上海AI实验室推出首个大模型数据竞技场OpenDataArena

数据在AI时代的重要性已经不言而喻,但悬而未决的是——如何精确量化这些数据的价值、辨别其优劣?为此,上海人工智能实验室OpenDataLab团队在数据领域持续深耕,正式推出了。地址:https://opendataarena.github.io/index.html工具:https://github.com/OpenDataArena/OpenDataArena-Tool数据:https://huggingface.co/OpenDataArena展开来说,在海量的SFT(监督式微调)

2025-08-29 18:56:02 911 1

原创 战略科学家对话:AI+科学,数据和人才是关键

针对当前生命科学领域文本类数据已经“不够用”的现实困境,孙勇奎分享了解决思路,“进一步挖掘人类的生物数据并同步建立新数据生成机制,可以更好地开展AI训练,甚至让AI自行检索全球科研成果,提出更具潜力的假说并加以验证,进而提高药物研发成功率。罗毅介绍了合肥实验室的“AI化学家”,经过三年的迭代,它已经能自动完成80%的化学实验。他还分享了一则案例,实验室一名偏理论研究的同学,在AI的辅助下,仅用六个月便研发出了一款具有领先性的防阻燃材料,“由此看来,AI能够帮助科学家实现跨学科的重大发现”。

2025-08-29 18:45:05 776

原创 MinerU又双叒更新了!化学解析×多模式翻译等多种功能上线!文档解析处理爽到飞起!

翻译功能,想怎么翻就怎么翻!全文翻译、模块翻译,多种模式随心切换,满足你所有的翻译姿势!系统默认接入限时免费的GPT-4o-mini引擎,同时支持接入DeepL、Google、DeepSeek、硅基流动、阿里云百炼、腾讯混元等主流翻译服务,满足不同用户的翻译需求。你的反馈会直接驱动我们的解析模型优化,让你成为MinerU的“秘密武器”!近期,MinerU就像是坐上了火箭,功能蹭蹭往上涨,简直要让你的文档处理体验“爽”到飞起!现在你可以选择页码范围解析,只关注你最关心的部分,降低解析成本,效率直线飙升!

2025-08-12 18:09:31 1074 1

原创 上海AI实验室发布MinerU2:通专融合路线如何补齐AI-Ready数据的最后一公里

随着模型技术发展,互联网数据趋同性导致通用大模型同质化,细分专业化成为深入行业落地的必然路径,这些数据常存在于私域,且以文档形式最为普遍。,支撑高质量AI-Ready的语料构建管线,将可解析场景延伸至科学数据领域,补齐AI-Ready数据的最后一公里,缩窄AGI促进科学发现的鸿沟,现已成为『书生』科学多模态大模型Intern-S1开源工具链中的重要一环。性能、速度跃升的同时,将可解析场景延伸至科学数据领域,补齐AI-Ready数据的最后一公里,缩窄AGI促进科学发现的鸿沟,已成为。

2025-08-12 17:19:53 964

原创 斩获ACL 2025最佳主题论文奖丨Meta-rater 框架,1% 算力锁定大模型最优数据

第63届国际计算语言学协会年(ACL 2025)于7月27日至8月1日在奥地利维也纳举行。作为NLP领域最具影响力的顶级盛会,今年的ACL依然吸引了全球众多顶尖学者参与,投稿数量与质量再创新高。在本届大会上,由上海人工智能实验室OpenDataLab团队与华东师范大学团队联合提出的研究成果Meta-rater框架聚焦于提升大语言模型预训练的数据筛选效率,相比以往依赖大规模试错的“黑箱式”方法,Meta-rater显著降低了算力开销,并通过多维度质量评估体系打破传统筛选标准的局限。

2025-08-12 17:12:38 1006

原创 官宣!MinerU 正式接入和鲸 ModelWhale,加速科研进程!

近日,大模型文档语料生产引擎双方联合升级的功能在 ModelWhale 平台全新升级发布会上正式亮相!此次合作将 MinerU 强大的文档解析能力深度集成至 ModelWhale 智能工具中,为科研工作提供坚实数据支持。

2025-08-12 17:04:30 420

原创 AI“压力面”,DeepSeek性能暴跌近30% | 上海AI Lab&清华&人大

摘要:上海人工智能实验室、清华大学等团队提出REST框架,通过同时测试多个问题对大模型进行"压力测试"。研究发现,在GSM8K等7个基准测试中,即便顶级模型如DeepSeek-R1,在多重问题压力下性能骤降近30%。REST有效解决了传统评测区分度低、成本高、脱离现实的问题,揭示了模型在预算分配、抗干扰等方面的不足,特别发现"过度思考"是性能下降主因。该研究为开发更强大的推理模型提供了新思路,相关代码和数据集已开源。

2025-07-28 15:58:51 1169

原创 ACL 2025|MathFusion题目融合框架出炉,让大模型数学推理能力倍增

MathFusion提出了一种创新的数学数据增强方法,通过融合不同数学问题来提升大模型的推理能力。该方法采用顺序、并列和条件三种融合策略,将原始问题组合成结构更复杂的新问题,从而增强模型处理关联性问题的能力。实验表明,仅需45K合成指令,MathFusion就能使模型在多个基准测试中平均准确率提升18.0个百分点,展现出卓越的数据效率和性能。该研究为提升大模型的复杂推理能力提供了新思路,相关成果已被ACL 2025接收。

2025-07-28 15:56:28 1106

原创 新工具开源!Vis3大模型数据可视化利器:填 AK/SK 直接预览 S3 数据,JSON/视频/图片秒开!本地文件也可用

通过其智能识别数据结构、交互式可视化的能力,使数据以网页、Markdown、图片等视图模式清晰呈现,关键字段一目了然,大幅降低数据理解成本,助力用户快速洞察数据价值。无论是进行数据展示,还是深度分析挖掘,都能找到契合的呈现方式,让数据理解更透彻。灵活高效的数据接入方式,让你摆脱数据读取的繁琐和限制,专注于可视化分析。工具通过智能解析引擎自动识别数据结构,再配以精巧的可视化布局,将复杂数据中的关键信息以可视化的方式清晰呈现,显著节省用户在数据预览和理解过程中所耗费的时间与精力,让数据解读更高效。

2025-07-11 08:30:00 841

原创 2025《“人工智能+”行业发展蓝皮书》: AI数据,驱动智能时代的核心引擎

另一方面, 数据开源使数据获取方式更便捷,随着国内外开源平台加速向多模态、工具链整合,以及社区协同方向的演进,开源平台正从从单一数据托管向。团队联合OpenGVLab团队基于前沿研究与实践,深度剖析了AI模型与数据需求升级、数据生产革新的双向赋能效应,以期帮助读者了解数据与模型协同进化的底层逻辑,在数据要素价值爆发的智能时代中抢占先机。从早期人工输入规则和知识图谱的符号主义,到深度学习时代,再到如今的大语言模型和多模态模型,每一次模型的技术突破都伴随着对数据需求的重新定义。

2025-07-10 08:30:00 869

原创 CVPR 2025|OmniDocBench:PDF解析能力维度的指南针,让文档解析评测更全面、更精细

从多个来源搜集了近20万个PDF,在这批数据中做了采样和聚类,筛选了6000张PDF页面,对这批数据做了页面级别的类别标签标注(包括PDF类型、布局、语种、页面特殊情况等),然后在这个标注基础上做了一个均衡采样,并且人工检查去除了敏感数据,最终筛选出了981张多样化的PDF页面,覆盖了9类文档来源的高质量标注数据,包括学术论文、教材等基础类型,以及手写笔记、密排报纸等高挑战性样本。相关的技术和工具正在蓬勃发展,引起了较多的关注,但是现有的文档解析方法在多样性和评测全面性上还存在较多局限性。

2025-07-09 08:30:00 1721

原创 MinerU × Cherry Studio:知识库再添动力!

业界顶尖的预处理技术,并支持灵活的部署方式,能够极大地优化文档信息在 AI 应用中的流转效率和准确性,同时充分尊重和保障用户的数据主权,最终为每一位 Cherry Studio 用户带来更流畅、更智能、更值得信赖的产品体验。强大的文档解析能力深度集成到 Cherry Studio 的知识库与未来的对话功能中,为您带来前所未有的文档处理与信息获取体验。后,您上传到知识库的文档将经过更精细的处理,使 AI 对文档内容的理解更加深入和准确,从而显著提升知识库问答的质量和相关性。

2025-07-09 08:30:00 1121

原创 MinerU 教程第三弹:零基础使用 n8n 调用 MinerU MCP 搭建文档处理自动化系统

本教程旨在帮助用户在 n8n 平台中,搭建一个基于。

2025-07-08 08:45:00 1570

原创 CVPR 2025|公式识别评测新指标CDM:视觉元素buff加成,让大模型公式识别评价更准确、更客观

大模型时代,基于个人文档库的 RAG 应用迅速崛起,而文档解析作为关键首步,直接决定了大模型对文档内容的理解程度与回答准确性。在面对科学类文档中大量的公式时,准确解析公式显得尤为关键。而评价一个模型是否准确的前提是有一个准确、公平的指标。然而,熟悉公式识别领域的人员会发现使用BLEU、EditDistance等纯文本指标无法准确地衡量公式识别的性能,原因是同一个公式存在多种Latex书写方式。

2025-07-08 08:30:00 1436

原创 MinerU MCP Server源码发布!打通大模型与MinerU,让 PDF 文档处理更 easy

交给大模型试试!

2025-07-07 15:17:41 2331 1

原创 全自动调整数据配比,解放LLM工程师丨上海AI Lab&上海交大联合团队提出创新数据均衡方法,让大语言模型不“偏科”

【摘要】上海AI实验室与上海交通大学等机构联合提出IDEAL框架,用于优化大型语言模型(LLM)多任务训练中的数据均衡问题。研究发现传统SFT训练会导致模型能力不均衡,简单增加弱势领域数据效果有限。IDEAL通过量化各领域数据对模型性能的影响,动态调整训练集分布,在Llama3-18B实验中显著提升模型综合表现(如编码能力提升尤为明显)。该方法突破性地证明:优化数据配比比单纯增加数据量更有效,且训练轮次过多可能加剧能力失衡。最佳超参数m=0.15时,模型在4领域基准测试中平均性能提升显著,为LLM多能力对齐

2025-07-07 14:40:57 837

原创 国家数据局点赞!OpenDataLab小语种数据标注方案入选《数据标注优秀案例集》

上海人工智能实验室OpenDataLab团队的小语种数据标注创新模式入选国家优秀案例。该团队打造了"万卷·丝路"多模态语料库,涵盖8种小语种的跨模态数据,并开发了LabelU和LabelLLM等开源工具。通过自主研发智能标注平台和标准化管理方案,标注效率提升50%,成本降低70%。创新亮点包括大模型标注技术、人机结合质检、系列标注工具开发及灵活的工作流程管理。该方案为小语种数据标注提供了高效解决方案,已开源相关资源供行业使用。

2025-06-30 17:18:18 1462

原创 上海AI实验室无人机视觉语言导航最新基准!OpenFly:空中VLN的全能工具链与大规模测试基准

论文提出了OpenFly平台,用于大规模数据收集和室外空中VLN任务。OpenFly集成了多种渲染引擎,生成了多样且高质量的数据。提出的OpenFly-Agent模型在多个评估指标上表现优异,验证了其有效性,并为未来的空中导航研究提供了一个全面的基准。本文仅做学术分享。

2025-06-30 17:02:38 1321

原创 零基础入门:MinerU 和 PyTorch、CUDA的关系

MinerU是一个基于PyTorch的深度学习模型运行程序,PyTorch支持多种加速方式,如CUDA和MPS,以提升运行速度。PyTorch是MinerU的核心库,必须安装,而torchvision作为辅助库,建议安装以支持图像处理任务。对于NVIDIA显卡用户,需安装NVIDIA显卡驱动和CUDA-Toolkit以启用GPU加速;而MacOS用户则可通过MPS加速。Anaconda作为Python科学计算平台,推荐用于环境管理。MinerU的运行仅需PyTorch和torchvision的CPU版本

2025-05-22 18:40:52 1503

原创 MinerU教程第二弹丨MinerU 本地部署保姆级“喂饭”教程

本文为MinerU的本地部署指南,MinerU是一款由上海人工智能实验室OpenDataLab团队开发的开源PDF转Markdown工具,适用于RAG、LLM语料准备等场景。文章详细介绍了MinerU的功能特性,包括文档处理、格式转换和运行环境支持。接着,提供了系统要求和基础环境配置的说明,并逐步指导用户完成Conda环境的创建、模型文件的下载以及GPU加速的配置。此外,文章还涵盖了功能测试、批量PDF转换、本地API服务的搭建和卸载MinerU的步骤。对于不熟悉代码或硬件条件有限的用户,推荐使用官方提供的

2025-05-22 18:31:39 17689 11

原创 MinerU教程第一弹丨Dify插件超详细配置攻略和工作流搭建案例,不允许还有人不会

MinerU与Dify联合研发的MinerU插件已在Dify市场上架,社区用户可通过该插件在Dify中搭建工作流。使用教程分为两种场景:一是配置MinerU官方在线API服务,需在Dify平台登录并添加MinerU插件,填写相关参数后即可使用;二是配置MinerU本地服务,前提是用户已在本地部署MinerU并构建了API服务,需在Dify中配置本地IP地址和端口。教程还提供了常见问题的解决方案,如处理PDF文件时遇到的错误,并指导用户如何通过修改Dify的配置文件来解决问题。最后,教程展示了如何通过Mine

2025-05-12 18:58:36 6634 8

原创 用“万卷·丝路”数据集打造阿拉伯语版DeepSeek(附免费算力与教程)

在大语言模型(LLMs)推动自然语言处理领域发展的背景下,通用大模型在特定语言和专业领域的应用面临挑战。低秩自适应(LoRA)技术作为一种高效、灵活的微调方法,正引领行业变革。OpenDataLab与和鲸社区联合举办的“大模型小语种方向Lora微调workshop”深入探讨了LoRA技术的原理和应用,特别是在小语种领域的独特价值。本次workshop使用OpenDataLab的“万卷・丝路2.0”语料库,涵盖了数据准备、模型优化、训练策略等关键环节,旨在帮助参与者掌握大模型微调的实践技能。活动提供了教程、工

2025-05-12 18:42:16 1044

原创 2025 OpenDataLab&和鲸社区『大模型赋能科研 』分享会圆满落幕!

在企业场景中,李浩鸣分享了利用大模型提升 SDR 工作流效率的实践经验,他介绍,传统会议纪要与信息提取工作耗时较长,而借助大模型,通过格式化字段提取,整个流程仅需 2-3 分钟即可完成。在多模态处理上,Google 模型优势明显,能高效处理音频、视频、PDF 等多种格式文档,对手写内容识别效果也较好,涉及多模态文档工作的用户可优先考虑;一起来看看他们的精彩分享。大模型在科研探索中发挥的价值远比以往任何时候都深入,无论是海量数据的处理、复杂文献的梳理,还是编程开发的瓶颈,大模型都能提供切实的解决方案。

2025-04-29 16:09:16 1200

原创 教程 | 给大模型插上小语种“翅膀”,附ms-swift韩语继续预训练与指令微调教程

在阿拉伯语、俄语、韩语、越南语、泰语5个语种基础上,新增塞尔维亚语、匈牙利语、捷克语等3个稀缺语料数据。在纯文本数据基础上,新增图片-文本、音频-文本、视频-文本、特色指令微调SFT四大模态数据,覆盖多模态研究全链路;整体数据总量超过1150万条,音视频时长超过2.6万小时,满足多种研究任务的需求。

2025-04-29 15:56:25 1105

原创 MinerU 偷偷放大招!3大新功能上线、模型重磅升级,解析效率超级加倍……

导出的文件能与WPS、浏览器、VSCode、Overleaf这些常用软件无缝衔接,不管是写论文、做报告、跨平台交互都能轻松搞定。● 引入paddleocr2torch技术方案,完全替代paddle框架以及paddleocr在项目中的使用,解决了paddle和torch的冲突问题,更实用的是,解析后的图片、表格、公式、文字元素。,使多行公式提取更精准、快速;

2025-04-21 13:57:42 1976

原创 【MinerU × LazyLLM】PDF无损拆包,让RAG更懂你的文章!附PDF解析组件选型与RAG案例分享

​针对PDF格式文档版式多样、解析难度大等难题,上海人工智能实验室推出了一款究极武器——MinerU,各位开发者在以往的开发过程中可能听说过这个名字,但这玩意儿究竟是个啥呢?本文将带你一同探索它的奇妙之处,并带大家使用LazyLLM,结合MinerU打造PDF解析与RAG应用的无缝链路。

2025-04-21 13:26:11 1567

原创 MinerU大上新!桌面客户端、新版API、国产化适配版全都有,更多功能等你解锁

2024年7月,上海人工智能实验室OpenDataLab团队正式推出了智能数据提取工具——。具备将混合图片、公式、表格、脚注等在内的复杂多模态 PDF 文档转化为Markdown格式的能力,可大幅提升AI语料的准备效率。凭借快速准确、开源易用的能力特性,受到广大用户及大模型开发者青睐,,GitHub星标数已接近2.5万,被开发者誉为“大模型时代的文档提取、转换神器”。2025年1月,迎来新年更新,本次亮点一览:● 客户端上线,下载即用,无需编程,无需登录,简单拖拽操作即可快速完成多文档提取。

2025-03-24 14:02:01 3911

原创 多语言语料库万卷·丝路2.0开源,数据模态全面升级,搭建文化交流互鉴AI桥梁

3月22日,上海人工智能实验室(上海AI实验室)联合新华社新闻信息中心、上海外国语大学、外研在线等,发布全新升级的,通过构建多语言开源数据底座,以人工智能赋能“一带一路”高质量建设。在“万卷·丝路1.0”的基础上,2.0语料库新增3类语料,涵盖共计数据,并运用精细化处理技术使数据质量达到“工业级”标准,实现“开箱即用”。”具有在5个语种基础上,新增等3个稀缺语料数据。在纯文本数据基础上,新增四大模态数据,覆盖多模态研究全链路;整体数据总量,音视频时长超过,满足多种研究任务的需求。

2025-03-24 12:22:23 1056

原创 遥感论文 | AAAI2025 | Urbench:多模态大模型在城市环境领域全新BenchMark,已开源,欢迎follow!

近年来,针对大型多模态模型(LMMs)的能力研究已覆盖多个领域,但专门针对城市环境的系统性评估体系仍较为匮乏。大多数现有的基准测试仅关注于单一视角下的区域级城市任务,无法全面评估 LMMs 在复杂城市环境中的表现。为此,本文提出了一个专为评估LMMs 在多视角城市场景中表现而设计的综合基准测试UrBench。本文三点贡献如下:一个多视角基准测试,旨在评估LMMs在城市环境中的表现。该基准包含14种城市任务,涵盖多个维度,既包括评估LMMs在城市规划能力的区域级任务,也涉及考察其应对日常问题的角色级任务。

2025-03-12 12:30:52 1421

原创 记一个大模型医学rag知识库应用案例实践

很多人想要结合RAG技术和大模型,打造自己的垂类AI助手,但是不知道怎么做?有一个基于工具的二开项目,是一个很典型的RAG技术在垂直场景应用的案例,大家可以参考它是怎么做的,动手也构建一个自己的AI助手作者基于,二次构建了深度优化的文档解析引擎,实现医疗文档的多模态解析与知识萃取,形成标准化知识库;

2025-03-12 12:22:28 1127

原创 打造跨语言智能工具与应用,“万卷·丝路”专项课题开放申请

随着共建“一带一路”进入高质量发展阶段,全球开发者对于多语言模型训练的需求不断增长,上海AI实验室联合大模型语料数据联盟成员发布了,为多语言大模型训练提供高质量数据支撑,助力全球开发者构建跨语言智能工具与应用。)现面向全社会开放多语言课题合作及应用案例征集,并提供丰富、多维的资源支持,欢迎大家报名。发布以来,吸引众多开发者积极下载、使用。围绕该语料库的开源应用,上海人工智能实验室联合大模型语料数据联盟,

2025-03-05 17:50:11 1042

原创 在AI模型训练架构尚未革新以前,数据仍是核心“秘籍”

智能文档解析工具,能够打通私域数据到大模型可用数据的最后一公里,在发布短短几个月内在 Github 上获得 2.6 万个星标,加速了数据准备、模型迭代和落地的效率。数据、模型和工具链的开源,加速了 AI技术的民主化,让大家不用“重复造轮子”,聚焦在已有成果上的二次创新。以大家常见的数学题为例,我们关注的不仅是问题的最终答案,还包括解题过程中的思考步骤,甚至是试错的过程,都是极高价值的。数据是模型训练的“粮食”。此外,现在模型的“智商”已经到较高水平,要寻找模型学的还不够的数据,比如“高知识密度”数据。

2025-02-28 14:48:57 382

原创 AAAI2025 |OpenDataLab三大成果:城市环境多模态大模型评测、创新遥感图-文分析、CRaFT优化LLM拒绝机制

近日,第39届AAAI公布了2025年论文录用结果,上海人工智能实验室OpenDataLab团队在多模态大模型评测、遥感图像理解与知识提取、语言大模型安全调优领域的研究成果受到认可,共有三篇论文被会议录用

2025-02-28 14:46:30 1144

转载 免费下载 | 百万机器人真机数据 AgiBot World 上架OpenDataLab

2024年底,在具身智能方向,上海人工智能实验室携手等智元机器人、国家地方共建人形机器人创新中心、上海库帕思重磅开源了,具身智能领域也迎来了「ImageNet」时刻!(智元世界)—— 一个汇集百万真实机器人数据的开源数据集。在这个具身数据的世界里,机器人不再只是进行简单的桌面任务,而是全方位融入我们的日常生活。机器人和人类和谐相处世界的大幕,正在徐徐拉开。2024,哪个场景最符合你对未来机器人的想象?作你的「家务管家」,洗衣、做饭都交给它?

2025-01-21 11:13:36 1049

原创 多语言语料库“万卷·丝路”发布,AI赋能共建“一带一路”

随着共建“一带一路”进入高质量发展新阶段,科技创新与合作将在其中发挥更关键的作用。上海人工智能实验室(上海AI实验室)通过研发先进数据智能技术,提供多语言语料库等举措,探索以人工智能赋能高质量共建“一带一路”。1月9日,上海AI实验室联合大模型语料数据联盟成员发布了,为多语言大模型训练提供高质量数据支撑。首期开源了包含泰、俄、阿、韩、越等五个语种的语料,(单语种均超过150GB),涵盖使用上述语种国家地区的生活、百科、文化、新闻等七大领域数据。

2025-01-10 20:28:00 1107

原创 重磅发布!IMIS-Bench:3.61 亿个掩码!开创性交互式医学图像分割基准数据集IMed-361M

交互式医学图像分割 (IMIS)通过结合用户交互输入(如点击、边界框或文本提示),将人工智能的高效计算与临床专家的专业经验紧密融合,能够实时生成符合临床需求的高质量分割结果。然而,该领域长期面临数据规模和质量的双重瓶颈,缺乏类似自然图像领域 SA-1B 数据集那样大规模、高密度、标注精确的数据集。这限制了交互式医学图像分割技术的研究深度和实际应用广度。因此,构建大规模、高密度的交互式医学图像分割数据集,不仅是突破当前技术瓶颈的重要环节,更是推动人工智能深度融入医疗实践、赋能临床决策的关键基础。

2024-12-06 18:46:05 1472 1

原创 最新MinerU直播回放来了,还有热门精华问答,速看!

11月20日,AI数据超能学院第3期直播,我们邀请了上海人工智能实验室 OpenDataLab数据提取工程师核心开发者赵小蒙在线详细讲解了的项目构成及最新模型效果,以及如何更好地基于进行二次开发和扩展应用。很多小伙伴意犹未尽,提了很多问题,我们整理了大家比较关心的内容,统一进行回复;另外附上了直播回放,以供参考。

2024-11-26 13:52:27 1374

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除