Tool Learning
文章平均质量分 90
聚焦大模型工具学习的相关研究。
依然易冷
专注LLM+Code,有空就更,欢迎关注,Push我更新。
Bytedancer一枚,从事大模型代码算法行业,可一起交流经验,全平台同名。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【LLM Tool Learning】Chain-of-Tools 项目关键代码解读
论文名称:Chain-of-Tools: Utilizing Massive Unseen Tools in the CoT Reasoning of Frozen Language Models;机构:苏州大学原创 2025-06-15 21:14:53 · 1193 阅读 · 0 评论 -
【LLM Tool Learning】论文分享: Chain-of-Tools
论文名称:Chain-of-Tools: Utilizing Massive Unseen Tools in the CoT Reasoning of Frozen Language Models;机构:苏州大学原创 2025-06-14 14:52:55 · 1519 阅读 · 0 评论 -
【LLM Tool Learning】论文分享:SWiRL(Multi-Step)
论文名称:Synthetic Data Generation & Multi-Step RL for Reasoning & Tool Use;机构:斯坦福大学计算机科学系 + Google DeepMind原创 2025-05-16 09:03:06 · 1445 阅读 · 0 评论 -
【LLM Tool Learning】论文分享:AutoCoA
论文名称:Agent models: Internalizing Chain-of-Action Generation into Reasoning models;机构:北京交通大学原创 2025-05-02 18:00:00 · 1051 阅读 · 0 评论 -
【LLM Tool Learning论文推荐】教大模型用外部搜索工具加强回答能力
R1-Searcher、Search-R1 以及 ReSearch原创 2025-05-02 14:30:00 · 389 阅读 · 0 评论 -
【LLM Tool Learning】论文分享:R1-Searcher
人大高瓴人工智能学院提出的两阶段RL框架,通过调用搜索工具增强LLM回答能力,优于一众RAG方法原创 2025-05-02 09:43:19 · 1352 阅读 · 0 评论 -
【LLM Tool Learning】论文分享:Search-R1
论文名称:ReSearch: Learning to Reason with Search for LLMs via Reinforcement Learning;机构:百川智能原创 2025-05-02 10:08:48 · 1337 阅读 · 0 评论 -
【LLM Tool Learning】论文分享:Search-R1
论文名称:Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning;机构:伊利诺伊大学厄巴纳-香槟分校 + 马萨诸塞大学阿默斯特分校原创 2025-05-02 09:55:16 · 889 阅读 · 0 评论
分享