大模型开发实践
文章平均质量分 76
赫连达
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型输入参数学习
top_p和top_k:用于控制生成文本的多样性和连贯性。较小的值会使生成的文本更连贯但缺乏多样性,较大的值会使生成的文本更随机和多样。:用于控制生成文本的随机性。较高的值增加随机性,较低的值增加确定性。:用于控制生成文本的长度。原创 2024-09-25 09:27:18 · 1774 阅读 · 0 评论 -
大模型类别区分
大模型是指那些拥有大量参数的机器学习模型,它们通常在大规模数据集上进行训练,并能够执行复杂的任务。随着深度学习技术的发展,大模型已经成为推动人工智能领域进步的重要力量。每种类型的模型都有其特定的应用场景和技术特点,选择合适的模型取决于具体的任务需求。随着技术的进步,不同类型的模型之间的界限也逐渐模糊,出现了更多跨领域的综合型大模型。原创 2024-09-23 16:58:30 · 830 阅读 · 0 评论 -
大模型版本区分
是一个通用的大型语言模型,适用于各种自然语言处理任务。是在通用模型基础上经过指令微调的版本,特别适合处理指令式的任务。选择哪个版本取决于你的具体需求。如果你需要一个通用的模型来处理多种任务,可以选择。如果你的任务涉及大量指令式的操作,建议使用。参考链接。原创 2024-09-20 15:52:14 · 13008 阅读 · 0 评论 -
fastchat与autogen使用要点澄清
utoGen是一个由Microsoft团队开发的开源框架,旨在简化大型语言模型(LLM)的工作流程编排和优化。这个框架特别适用于开发涉及对话自治性、代理数量和代理对话拓扑的下一代LLM应用。多代理对话框架:AutoGen允许使用多个代理进行对话和解决任务,这些代理是可定制和可对话的,并且可以无缝地允许人类参与。它们能在使用LLM、人类输入和工具的各种模式下运行2。简化和自动化LLM工作流:AutoGen简化了复杂LLM工作流的编排、自动化和优化,最大化了LLM模型的性能,并克服了它们的弱点。原创 2024-09-03 21:16:21 · 1452 阅读 · 0 评论
分享