- 博客(6)
- 收藏
- 关注
原创 C6_System_Evaluation_Notes
如何量化追踪、迭代并提升RAG应用性能?当系统出现"幻觉"或答非所问时,如何快速定位问题根源?如何在多个技术方案中做出数据驱动的决策?面对不同RAG应用,如何客观评判优劣?如何确保系统在生产环境中的稳定性和可靠性?关键指标: 质量指标(平均忠实度分数、平均相关性分数、幻觉检测率、用户反馈评分)、性能指标(平均响应时间、95%分位响应时间、请求成功率、系统可用性)、业务指标(日活跃用户数、查询完成率、用户留存率、业务转化率)
2025-08-29 01:40:13
388
原创 C5_Formatted_Generation_Notes
格式化生成技术摘要 格式化生成技术是RAG系统的关键组件,解决AI输出结构化数据的问题。主要技术方案包括: Output Parsers:作为AI与程序间的翻译官,包含三种类型: StrOutputParser:简单文本处理 JsonOutputParser:JSON格式解析 PydanticOutputParser:强类型验证的结构化输出 Function Calling:让AI具备调用外部工具的能力,通过定义工具Schema实现API调用等复杂操作。 应用场景包括电商信息提取、简历结构化、合同分析等。技
2025-08-28 00:26:46
727
原创 C4_Advanced_Retrieval_Notes
文章摘要 本章系统介绍了高级检索与查询构建技术,涵盖混合搜索、查询构建、Text-to-SQL、查询重构与分发、高级检索五大核心技术。混合搜索融合关键词与语义搜索;查询构建实现自然语言到结构化查询的转换;Text-to-SQL解决数据库查询语言生成问题;查询重构优化问题表述,路由系统精准分配查询;高级检索技术包括重排序、内容压缩和质量校正。这些技术通过时序图展示了协同工作流程,共同提升信息检索的准确性、全面性和效率。
2025-08-25 00:00:26
275
原创 C3_Embedding_Notes
本章深入探讨了向量检索技术的核心环节,包括向量嵌入、多模态检索、向量数据库及索引优化。向量嵌入作为RAG的基石,将文本、图像等转换为数值向量,其质量直接影响检索效果。多模态嵌入突破模态限制,实现跨模态检索。向量数据库通过高效索引技术(如HNSW、IVF)支持海量向量快速查询。实战部分介绍了Milvus的生产级应用和索引优化技巧,如参数调优、内存管理。关键认知包括:选择适合维度的嵌入模型、距离度量的合理应用、归一化的重要性,以及根据数据规模选择索引策略。这些技术为构建高效RAG系统提供了坚实基础。
2025-08-23 01:14:58
803
原创 C1_RAG_learning_notes
RAG技术解析:检索增强生成的核心概念与实践 RAG(检索增强生成)是一种融合信息检索与文本生成的技术范式,通过为LLM接入动态更新的外部知识库来解决其固有局限。技术流程分为两个阶段:离线阶段包括数据加载、文本分块、向量化和存储;在线阶段则进行问题向量化、相似度检索和提示词生成。RAG能有效提升LLM回答的准确性、实时性和专业性,相比微调更具成本效益。根据复杂度可分为初级、高级和模块化三个演进阶段。实践中的关键挑战包括文本分块策略、Embedding模型选择、向量数据库优化以及检索结果的精准度提升,这些因素
2025-08-17 22:51:46
706
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅