
RAG 进阶
文章平均质量分 87
本专栏聚焦RAG系统进阶实践,详解从数据清洗、智能分块、QA对生成、向量化与数据库配置,到混合检索和重排序策略,助力构建高效、稳定、安全的智能检索生成系统,为技术专家和企业决策者提供前沿实战经验。
向日葵花籽儿
AI工程师:
NLP+AIGC+LLM+后端+DB(向量/非向量)
深度学习/算法优化/基础提升
Python/C++/(Java/JS/HTML)
近期专注内容:进阶RAG | 模型微调
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
# RAG | 检索 # 关键词检索的疑问及解答
下面是一份综合整理的笔记,帮助你快速区分和了解关键词检索(全文检索)与向量检索(语义检索)的核心原理和流程。● 倒排索引:将“每个词”映射到“出现该词的文档集合”中,以便快速定位包含这些关键词的文档。● 向量表示(Embedding):将文本(或句子、词)转化为一串数字向量,体现其语义信息。分词处理:将文本拆解成一个个词(Token),去除无关信息(如停用词、标点)。记录词出现位置:在“词→文档”映射里标注此词出现在哪些文档、位置或频率。○ 记录“词→文档ID”的映射,并存储相关信息(词频、位置等)。原创 2025-03-17 09:31:29 · 459 阅读 · 0 评论 -
# RAG 框架 # 一文入门 全链路RAG系统构建与优化 —— 架构、策略与实践
本文全面阐述了RAG系统从数据收集、数据清洗(包括领域专有名词处理)、智能数据分块与QA对生成,到向量化、向量数据库选择与配置,再到检索方式及重排序,直至整合输出、监控反馈和安全保障的全流程。通过这一完整方案,旨在为构建高效、稳定且安全的检索增强生成系统提供切实可行的解决方案。原创 2025-03-13 15:48:17 · 1828 阅读 · 0 评论