- 博客(3)
- 收藏
- 关注
原创 【RAG vs 微调】各适合什么场景?
特定领域、固定格式规范:对生成内容的需求是明确的(合同撰写、商务邮件)专业知识、准确度(医疗、法律条文、客户服务、技术支持)大规模知识库(微调效果差、成本高、可能会过拟合)开放问题、高鲁棒性:多知识库框架、多智能体框架。处理敏感数据(Llama 3.1 微调)多样性知识库(预料多样,无微调意义)已有高质量、高结构化的知识库、数据库。特点任务优化(情感分析、文本分类)分类工具(垃圾邮件、情感分析)知识库实施更新(法律判例)时效性要求高(最近股市动向)超小知识库(无法微调)速度(语音实施对话)
2024-11-07 00:16:52
380
原创 【传统 RAG】 难以解决的问题有哪些?
传统 RAG 难以解决的问题有哪些?开放性问题a. 开放性问题难以进行向量相似性匹配复杂的问题、需要长思考、思维链的问题a. 复杂的问题难以进行向量相似性匹配,也更多需要模型底层能力、思维链、或 o1 这样长思考能力的模型分散式数据查询a. 入 SQL 数据查询,数据分散到各处,或是数据上下文长度过大,难以使用向量检索知识生成a. 知识检索与知识生成本身就是矛盾的碎片化知识整合a. 碎片化的知识库,知识分散到各处,召回的内容难以覆盖;同时也会面临冗余信息过多、知识冲突的问题。当然,我们
2024-11-07 00:09:59
345
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
7