MTEB项目发布1.30.0版本:化学文本嵌入评估的重大升级

MTEB项目发布1.30.0版本:化学文本嵌入评估的重大升级

mteb MTEB: Massive Text Embedding Benchmark mteb 项目地址: https://gitcode.com/gh_mirrors/mt/mteb

MTEB(Massive Text Embedding Benchmark)是一个用于评估大规模文本嵌入模型的基准测试框架。该项目旨在为研究人员和开发者提供一个标准化的评估体系,用于比较不同文本嵌入模型在各种自然语言处理任务上的性能表现。通过涵盖多种任务类型(如分类、聚类、检索等)和领域(如通用、生物医学、金融等),MTEB已成为文本嵌入领域的重要参考基准。

近日,MTEB发布了1.30.0版本,这一版本最大的亮点是整合了ChemTEB(Chemical Text Embedding Benchmark),为化学领域的文本嵌入评估带来了全面的支持。这一更新标志着MTEB在专业领域评估能力上的重要扩展。

化学领域评估任务的全面引入

1.30.0版本新增了大量与化学相关的评估任务,覆盖了多种任务类型:

  1. 分类任务:新增了15个化学文献分类任务和2个SDS(安全数据表)分类任务,这些任务能够评估模型在化学文档分类方面的能力。

  2. 文本对分类任务

    • 新增了SMILES(简化分子线性输入规范)相关的文本对分类任务
    • AI生成的化学文本释义对分类任务
    • 跨来源段落对分类任务
    • PubChem同义词对分类任务
    • 多语言PubChem-Wiki对分类任务(支持12种语言)
  3. 双语文本挖掘任务:新增了Coconut SMILES和PubChem SMILES相关的双语文本挖掘任务,用于评估模型在不同化学表示之间的语义对齐能力。

  4. 检索任务:新增了化学领域的NQ(自然问题)和HotpotQA数据集子集作为检索任务,这些任务专门针对化学知识问答场景。

  5. 聚类任务:新增了2个化学文献聚类任务,用于评估模型在无监督化学文档组织方面的表现。

这些任务的引入使得MTEB能够全面评估嵌入模型在化学领域的表现,从分子表示到化学文献处理的各种场景。

新增模型支持

为了配合化学领域评估的需求,1.30.0版本还新增了对多种专业模型的支持:

  1. 基础化学模型:增加了专门针对化学领域训练的嵌入模型。

  2. SentenceTransformer模型:扩展了对多种SentenceTransformer模型的支持。

  3. Nomic BERT:增加了对Nomic BERT模型的支持,该模型在科学文本上表现出色。

  4. 商业API模型

    • 新增了Amazon Titan嵌入模型
    • 增加了Cohere Bedrock模型的支持
    • 完善了OpenAI模型的支持
  5. 双语模型:添加了英语E5和BGE v1/v1.5系列模型的各种规模版本。

这些模型的加入大大扩展了MTEB的评估范围,使得开发者能够比较开源模型与商业API在化学任务上的表现差异。

技术实现细节

  1. 动态截断处理:针对Amazon Titan等模型,实现了动态文本截断机制,确保长文本输入能够被正确处理。

  2. 错误处理增强:在评估脚本中添加了try-except块,使得在基准测试过程中遇到故障模型时可以跳过而不中断整个流程。

  3. 元数据完善:为所有化学相关任务补充了完整的元数据,包括创建日期、任务子类型、方言信息和样本创建方式等。

  4. 评估指标优化:改进了指标命名,使其更具描述性,便于结果解读。

  5. 数据集优化:更新了多个化学数据集的版本,处理了重复样本和异常长文本等问题。

对研究社区的意义

MTEB 1.30.0版本的发布,特别是ChemTEB的整合,为化学信息学和计算化学领域带来了重要的评估工具。研究人员现在可以:

  1. 系统地比较不同嵌入模型在化学任务上的表现
  2. 识别模型在分子表示、化学文献处理等专业场景中的优缺点
  3. 推动化学领域专用嵌入模型的发展
  4. 促进跨领域知识迁移研究

这一版本也体现了MTEB项目向专业化、领域化发展的趋势,为其他专业领域(如生物医学、法律等)的嵌入评估提供了参考范例。

未来展望

随着化学领域评估能力的建立,MTEB项目可能会继续向以下方向发展:

  1. 扩展更多专业领域的评估任务(如生物医学、材料科学等)
  2. 增加对多模态嵌入模型的支持(如结合分子图和文本的嵌入)
  3. 开发更精细的领域适应性评估指标
  4. 优化大规模评估的效率和可扩展性

MTEB 1.30.0版本的发布标志着文本嵌入评估向专业化、精细化迈出了重要一步,将为化学和相关领域的嵌入模型研究提供强有力的支持。

mteb MTEB: Massive Text Embedding Benchmark mteb 项目地址: https://gitcode.com/gh_mirrors/mt/mteb

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

邢征达Frida

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值