
大模型技术-论文阅读
文章平均质量分 94
本专栏致力于针对大模型涉及的所有技术论文进行整理和汇总,包括但不限于:COT、RLHF、SFT等等~。
AI孙阁主
职业方向:自然语言处理、大模型微调
博客定位:编程语言、编程实战、模型框架、论文阅读、机器学习、深度学习、nlp基础、大模型微调等等......
个人简介:每个人都是一粒种子,是个种子就一定会发芽,就像李白所说“天生我材必有用”。事情的开始总是困难的,唯有坚持+耐心才能赢得胜利。另外一句诗送给自己也送给大家:“莫愁前路无知己,天下谁人不识君。”
展开
-
【论文分享02】A brief introduction to weakly supervised learning
本论文主要介绍了弱监督学习,探讨其在数据标注成本高场景下的应用,概述了相关研究的进展,为后续研究提供了参考。下面是论文的脑图。监督学习在有强监督信息时成果显著,但实际任务中获取监督信息成本高,弱监督学习愈发重要。文章主要聚焦不完全、不确切和不精确监督,而实际中多种类型常同时出现且还有其他类型的弱监督,感兴趣的同学们可以搜索相关的资料进行阅读。原创 2025-02-25 21:33:25 · 754 阅读 · 0 评论 -
【论文分享01】Communication is All You Need: Persuasion Dataset Construction via Multi-LLM Communication
该论文提出了一种多LLM通信框架,用于自动生成高质量、多样化的说服性对话数据,为说服相关研究提供了新途径和有价值的资源。下面是论文的脑图。原创 2025-02-18 21:36:23 · 976 阅读 · 0 评论 -
DeepSeek-R1技术报告快速解读
本篇是对DeepSeek-R1技术论文的简单整理,辅助大家快速了解DeepSeek-R1的相关技术背景。原创 2025-02-09 21:19:40 · 1967 阅读 · 0 评论 -
【kimi k1.5技术报告】KIMI K1.5: SCALING REINFORCEMENT LEARNING WITH LLMS
本文对Kimi K1.5的技术报告进行了简单的解读,供大家快速阅读和思考!!!原创 2025-01-24 14:54:26 · 996 阅读 · 0 评论 -
【论文阅读-思维链的构造方法02】4.1.2 Automatic Construction-02
本篇涉及4篇论文,是上一篇4.1.2 Automatic Construction-01的延续,旨在解决如何自动构建CoT。原创 2025-01-09 14:14:29 · 1693 阅读 · 12 评论 -
【论文阅读-思维链的构造方法02】4.1.2 Automatic Construction-01
本文是思维链综述中 4.1.2 Automatic Construction小结中涉及的前4篇论文,从三方面进行讲解:1)提出了什么问题?2)如何解决的?3)效果及展望。原创 2025-01-02 16:32:57 · 1372 阅读 · 0 评论 -
【论文阅读-思维链的构造方法01】4.1.1 Manual Prompting
【思维链综述】第四章节中-4.1.1 Manual Prompting小节涉及的5篇论文要点总结与方法对比。原创 2024-12-19 11:08:46 · 1145 阅读 · 10 评论 -
【思维链综述】-Navigate through Enigmatic Labyrinth A Survey of Chain of Thought Reasoning: Advances,
大模型技术 ----> 思维链原创 2024-11-22 14:48:56 · 1188 阅读 · 0 评论