ToolBench:构建强大的开源LLMs工具使用能力
项目介绍
ToolBench 是一个开源、大规模、高质量的指令调整(SFT)数据集构建项目,旨在赋予开源大型语言模型(LLMs)掌握成千上万多样真实世界API的能力。通过收集和生成高质量的指令数据,ToolBench 提供了一个全面的数据集,包括训练和评估脚本,以及经过微调的强大模型 ToolLLaMA。
项目技术分析
ToolBench 的核心技术包括:
- API收集:从 RapidAPI 收集了 16464 个API,这是一个托管开发者提供的大规模真实世界API的平台。
- 指令生成:生成了涉及单工具和多工具场景的指令。
- 答案标注:采用深度优先搜索决策树方法(DFSDT),增强LLMs的规划和推理能力,提高标注效率。
- API Retriever:整合了API检索模块,为ToolLLaMA提供开放域的工具使用能力。
项目及技术应用场景
ToolBench 的应用场景广泛,特别适合以下领域:
- 自动化工具集成:帮助开发者快速集成和使用各种API,提高开发效率。
- 智能助手开发:为智能助手提供强大的工具使用能力,增强其解决复杂问题的能力。
- 研究与教育:为研究和教育提供高质量的数据集和模型,推动LLMs的发展。
项目特点
ToolBench 的主要特点包括:
- 开源性:完全开源,便于社区参与和贡献。
- 大规模数据集:包含超过12万个实例和46万次API调用。
- 高质量标注:采用DFSDT方法,确保标注的高质量和高效性。
- 易于扩展:数据创建过程易于扩展,支持更多API和指令的添加。
结语
ToolBench 不仅提供了一个强大的工具使用能力模型 ToolLLaMA,还为研究和开发提供了丰富的资源。无论你是开发者、研究人员还是教育工作者,ToolBench 都能为你提供支持。加入我们,一起推动开源LLMs的发展!
加入我们:在 Discord 加入我们,共同构建和完善 ToolBench!
数据下载:访问 Google Drive 下载数据集。
模型下载:获取 ToolLLaMA-2-7b-v2 模型,体验强大的工具使用能力。
贡献代码:访问 GitHub 贡献代码,成为项目的一部分。
ToolBench,让开源LLMs的工具使用能力更上一层楼!
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考