LLM内核-快照系统

肩口鲲

于 2024-04-18 23:31:33 发布

阅读量915

点赞数 24

文章标签：语言模型设计模式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/EnsDoflamingo/article/details/137938413

版权

背景&现状

LLM Agent时代降临， AI模型的底座驱动工业生产活动。Agent的工程是一个综合性的工程，涉及到很多层面计算机知识。从系统设计的角度来说，沿用传统的Agent设计模式，AI模型Agent的设计逐步完成属于LLM特色迁移和转变。诸多环节（软件协议，通信规范，底座系统）的设计都发生了客观的变化。本文初步讨论快照设计模式: I. 什么是LLM快照 II. 在LLM底座Agent工程中作为LLM内核的意义和III. 落地。

大模型的“结构模式”

大模型，使用自回归的方式更新。每一次推理得到logits后，某种概率上“最大”求得的，根据具体策略而定。然后循环多次，直到大模型自己告知eos结束符时才结束一个序列文字的生成。每一次循环， LLM根据前文内容生成的文本，继续计算下文每一个词。

上图的自回归逐步进行，假如由于某种原因自回归的流程必须中断，长时间离线，甚至系统崩溃。所有的生成是否需要重新开始吗，答案是否定的。快照的设计由此诞生。

I. 大模型快照设计模式

首先是如何得到数据视图上的快照。比如上图中LLM中断生成，需要一部分中间变量存储，将来的某时恢复生成任务。人们首先容易想到的是存储上次生成的前文文本序列。另外，其他变量存储根据具体推理框架（huggingface deepspeed亦或是vllm）来制定，大体上分为①自回归生成的中间数据和②对应这些中间数据的元数据。

最低0.47元/天解锁文章

博客等级

码龄5年

7
原创

78
点赞

98
收藏

66
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: SE4AI测试备受争议的覆盖率法

下一篇：: AWQ介绍，构思 - PTQ简史(二)

最新评论

LLM内核-快照系统
优快云-Ada助手: 恭喜作者发布了第5篇博客“LLM内核-快照系统”！不断分享知识和经验对于自己的成长和他人的帮助都是非常宝贵的。在下一篇博客中，或许可以深入探讨快照系统的原理和应用场景，让读者能够更全面地了解这一技术。期待作者更多精彩的创作！
SE4AI测试备受争议的覆盖率法
优快云-Ada助手: 恭喜作者发布了第四篇博客，标题为“SE4AI测试备受争议的覆盖率法”。这篇博文探讨了备受争议的覆盖率法在SE4AI测试中的运用，引起了很多人的关注和讨论。作者在文章中提出了自己的见解和观点，为读者带来了新的思考角度。希望作者能够继续坚持创作，分享更多有价值的内容。在下一步的创作中，建议可以深入研究备受争议的覆盖率法在SE4AI测试中的实际应用案例，结合具体的数据和案例分析，进一步探讨其优缺点以及改进方法，为读者带来更加全面深入的了解。期待作者的下一篇作品，继续为我们带来新的启发和思考！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
模型量化 - PTQ简史(一）
优快云-Ada助手: 恭喜作者发表了第三篇博客，标题为“模型量化 - PTQ简史(一）”。阅读了您的文章，对PTQ的简史有了更深刻的了解，感谢您的分享。希望您可以继续坚持创作，分享更多有趣的内容。或许下一篇可以深入探讨PTQ的应用场景或者与其他模型量化方法的对比分析，这样可以让读者有更多的收获。期待您的下一篇作品！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
CausalNLP: 文本应用于因果关系
优快云-Ada助手: 很棒的博文！你对于文本与因果关系的应用做出了很深入的探讨，希望你能继续分享更多类似的内容。另外，除了因果关系，你可能还可以了解一下文本情感分析和主题建模的相关知识，这些都是与文本分析相关的重要技能，也许会对你的研究有所帮助。期待看到你更多的精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Nowcoder ‘01‘ 字符串题解
优快云-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/algorithm?utm_source=AI_act_algorithm

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。