基于大模型LLM 应用方案

原创已于 2025-03-26 09:42:45 修改

· 置顶 · 577 阅读

·

10

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#nlp #llama #人工智能

于 2024-12-28 15:53:16 首次发布

llm 专栏收录该内容

3 篇文章

订阅专栏

现如今LLM 应用面临的主要问题

准确性，2. 高成本，3. 专业性，4. 时效性，5. 安全性

信息偏差/幻觉 (大模型由于数据缺陷/知识边界会使用可靠性下降)
知识更新滞后性（LLM 基于静态数据集训练，可能导致知识更新滞后，无法及时反映最新信息动态。）
内容不可追溯：（LLM 生成的内容往往缺乏明确的信息来源，影响内容的可信度。）
推理能力限制：（LLM 可能缺乏必要的推理能力）
长文本处理能力较弱：（受限于有限的上下文窗口，处理速度随着输入长度增加而减慢）

主流方案

无训练成本

直接使用已经训练好的预训练模型，不需要额外训练，

1. 只通过输入或微调提示（Prompt Engineering）实现功能。

System Prompt + ICL（In-Context Learning）在 Prompt 中提供示例，模型基于示例进行推理+ CoT（Chain of Thought）通过推理链分步引导，模型逐步推理以提高复杂问题的解决能力：
提供明确的上下文和示例，指导模型分步骤推理，增强回答质量。

2. 限定回答范围（Guidance）：通过明确的指令限制模型输出格式和范围。

3. Retrieval Augmented Generation (RAG)通过检索外部知识，补充模型的生成能力。

基于检索返回的内容做Prompt增强
当前完整的 RAG 应用流程主要包含两个阶段：
- 数据准备阶段：数据提取——>文本分割——>向量化（embedding）——>数据入库
- 应用阶段：用户提问——>数据检索（召回）——>注入 Prompt——>LLM 生成答案
Bing-like 模式
结合全网搜索结果，增强模型的知识范围调用通用搜索引擎（如 Bing、Google）。调用通用搜索引擎（如 Bing、Google）。

Google Search Labs

4. Function Call + Plugins 通过外部工具（如函数调用、插件）扩展模型能力。

Function calling

5. Ensemble/Bagging 通过多次调用模型，使用不同提示或结果整合，提升回答的质量和一致性。

CoT-SC（Self-Consistency）：对一个问题生成多个答案，投票选出最佳答案。
Prompt Bagging：使用多个设计不同的 Prompt 输入，结合结果进行优化。
Ensemble Refinement：利用多个模型分别生成答案，最后组合成最终输出。

6.Reflection/System2 像人类一样非线性思考问题、reasoning、planning

ReAct、ToT

有训练成本

1. SFT（Supervised Fine-Tuning）通过监督微调对模型进行对齐（Alignment）

Full FT（全模型微调）：调整整个模型参数，适合大规模定制。
PEFT（Parameter-Efficient Fine-Tuning）：只调整部分参数（如 LoRA），资源友好。

具体方案

准备标注数据集。
选择微调方法：
- 全模型微调（Full Fine-tuning）。
- 参数高效微调（PEFT），如 LoRA。
使用分布式训练框架（如 Hugging Face Trainer）进行训练。

2. 增量预训练（Incremental Pretraining）增量预训练（Incremental Pretraining）

在特定领域数据上继续预训练模型，增强领域能力。 MOE

3. MOE（Mixture of Experts）MOE（Mixture of Experts）

通过动态激活模型的部分模块，提升大模型的训练效率和推理能力。好的数据配比、数据质量、训练技巧、训练资源。

总结建议

如果需要快速实现功能、资源有限，优先选择无训练成本方案，如：
- 使用 Prompt Engineering（ICL + CoT）改进回答质量。
- 结合检索增强模型（RAG）。
- 借助 Function Call 和 Plugin 扩展功能。
如果追求高精度、领域定制化或长期优化，选择有训练成本方案，如：
- 使用 SFT 对齐模型输出格式。
- 在特定领域内增量预训练或全面预训练新模型。

选择具体实现方案需根据应用场景、技术资源和业务需求综合评估。

博客等级

码龄12年

103
原创

230
点赞

536
收藏

137
粉丝

关注

私信

热门文章

分类专栏

llm 3篇
工具安装以及使用教程 12篇
基础 38篇
遇到问题解决问题 5篇
服务容器化 3篇
大数据 14篇
面试 1篇
微服务 4篇
study 13篇
杂记 10篇
h5 1篇

展开全部收起

上一篇：: 新手直播方案

下一篇：: LLM 大模型 token 消耗机制

最新评论

新手直播方案
十年之前: 为什么手机直播都是iPhone呢？因为iPhone的软件适配信是最好的软件，直播软件直接调用苹果的原相相机
Git 最佳实践规范
优快云-Ada助手: CS入门技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/gml?utm_source=AI_act_gml
linux 配置优化
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。
docxtemplater 前端h5 生成word 加echart 图教程
Hema仔: 同上+1
规则引擎基础知识
Mr.兰: 赞一个，看完博主整理的材料，非常有收获

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。