大模型技术-论文阅读_AI孙阁主的博客-优快云博客

大模型技术-论文阅读

关注

文章平均质量分 94

本专栏致力于针对大模型涉及的所有技术论文进行整理和汇总，包括但不限于：COT、RLHF、SFT等等~。

关注数：文章数：8 文章阅读量：12098 文章收藏量：172

作者: AI孙阁主

职业方向：自然语言处理、大模型微调博客定位：编程语言、编程实战、模型框架、论文阅读、机器学习、深度学习、nlp基础、大模型微调等等...... 个人简介：每个人都是一粒种子，是个种子就一定会发芽，就像李白所说“天生我材必有用”。事情的开始总是困难的，唯有坚持+耐心才能赢得胜利。另外一句诗送给自己也送给大家：“莫愁前路无知己，天下谁人不识君。”

展开

专栏收录文章

【论文分享02】A brief introduction to weakly supervised learning

本论文主要介绍了弱监督学习，探讨其在数据标注成本高场景下的应用，概述了相关研究的进展，为后续研究提供了参考。下面是论文的脑图。监督学习在有强监督信息时成果显著，但实际任务中获取监督信息成本高，弱监督学习愈发重要。文章主要聚焦不完全、不确切和不精确监督，而实际中多种类型常同时出现且还有其他类型的弱监督，感兴趣的同学们可以搜索相关的资料进行阅读。

原创 2025-02-25 21:33:25 · 934 阅读 · 0 评论
【论文分享01】Communication is All You Need: Persuasion Dataset Construction via Multi-LLM Communication

该论文提出了一种多LLM通信框架，用于自动生成高质量、多样化的说服性对话数据，为说服相关研究提供了新途径和有价值的资源。下面是论文的脑图。

原创 2025-02-18 21:36:23 · 1138 阅读 · 0 评论
DeepSeek-R1技术报告快速解读

本篇是对DeepSeek-R1技术论文的简单整理，辅助大家快速了解DeepSeek-R1的相关技术背景。

原创 2025-02-09 21:19:40 · 2406 阅读 · 0 评论
【kimi k1.5技术报告】KIMI K1.5: SCALING REINFORCEMENT LEARNING WITH LLMS

本文对Kimi K1.5的技术报告进行了简单的解读，供大家快速阅读和思考！！！

原创 2025-01-24 14:54:26 · 1519 阅读 · 0 评论
【论文阅读-思维链的构造方法02】4.1.2 Automatic Construction-02

本篇涉及4篇论文，是上一篇4.1.2 Automatic Construction-01的延续，旨在解决如何自动构建CoT。

原创 2025-01-09 14:14:29 · 1871 阅读 · 12 评论
【论文阅读-思维链的构造方法02】4.1.2 Automatic Construction-01

本文是思维链综述中 4.1.2 Automatic Construction小结中涉及的前4篇论文，从三方面进行讲解：1）提出了什么问题？2）如何解决的？3）效果及展望。

原创 2025-01-02 16:32:57 · 1511 阅读 · 0 评论
【论文阅读-思维链的构造方法01】4.1.1 Manual Prompting

【思维链综述】第四章节中-4.1.1 Manual Prompting小节涉及的5篇论文要点总结与方法对比。

原创 2024-12-19 11:08:46 · 1287 阅读 · 10 评论
【思维链综述】-Navigate through Enigmatic Labyrinth A Survey of Chain of Thought Reasoning: Advances,

大模型技术 ----> 思维链

原创 2024-11-22 14:48:56 · 1433 阅读 · 0 评论

大模型技术-论文阅读

作者: AI孙阁主

【论文分享02】A brief introduction to weakly supervised learning

【论文分享01】Communication is All You Need: Persuasion Dataset Construction via Multi-LLM Communication

DeepSeek-R1技术报告快速解读

【kimi k1.5技术报告】KIMI K1.5: SCALING REINFORCEMENT LEARNING WITH LLMS

【论文阅读-思维链的构造方法02】4.1.2 Automatic Construction-02

【论文阅读-思维链的构造方法02】4.1.2 Automatic Construction-01

【论文阅读-思维链的构造方法01】4.1.1 Manual Prompting

【思维链综述】-Navigate through Enigmatic Labyrinth A Survey of Chain of Thought Reasoning: Advances,