RAG
文章平均质量分 89
丁学文武
打球、跑步、徒步、露营️、骑行、滑雪️、游泳、冲浪
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
九种高级 RAG 技术及其实现方法
本文介绍了9种提升检索增强生成(RAG)系统性能的高级技术,包括文本分块、重新排序、元数据利用、混合搜索、查询重写、自动裁剪、上下文蒸馏以及LLM和嵌入模型微调。这些技术通过优化检索相关性和排序质量,解决基本RAG系统存在的噪声结果、无关上下文等问题。文章还推荐了Meilisearch、Weaviate等实现工具,并强调需要通过检索准确性、延迟等指标评估技术效果。这些方法能让RAG系统从简单检索升级为智能理解用户意图的上下文感知系统,显著提高生成质量。原创 2025-11-06 07:15:00 · 1332 阅读 · 0 评论 -
不再死记硬背,检索增强生成让AI实现开卷考试
摘要:检索增强生成(RAG)是一种融合信息检索与大模型的技术,通过实时检索外部知识库来提升AI回答的准确性和时效性。其核心优势包括解决传统大模型知识固化、信息过时等问题,同时降低训练成本。该技术运作分为离线知识库构建(数据收集、分块、向量化)和在线问答推理(检索-整合-生成)两个阶段。尽管面临系统复杂度、响应延迟等挑战,RAG技术通过动态更新知识的方式,显著提升了AI在专业领域和多轮对话中的表现,为AI应用落地提供了更可靠的技术支撑。原创 2025-11-04 07:15:00 · 508 阅读 · 0 评论 -
企业级 RAG 系统实战:10 个项目踩过的坑(附代码工程示例)
本文分享了企业级RAG系统的实战经验。作者基于在制药、金融等行业构建10余个RAG系统的实践,总结了关键挑战和解决方案:1)优先进行文档质量检测并分类处理;2)采用层级化分块策略替代固定分块;3)构建专业领域元数据架构;4)实施混合检索方法。文章详细介绍了文档评分系统、分层检索等技术实现,并对比了不同模型的成本效益(Qwen可节省85%成本)。核心观点认为企业RAG的成功70%依赖工程能力,20%来自领域知识,模型仅占10%。这些经验对于处理大规模非结构化企业文档具有重要参考价值。原创 2025-11-03 07:15:00 · 914 阅读 · 0 评论 -
RAG是AI版的“油电混动汽车”?
RAG(检索增强生成)技术作为当前AI应用的"标配功能",虽能快速构建知识问答系统,但其本质是"升级版文档检索工具"而非真正的认知智能。文章指出RAG三大局限:仅能语义匹配无法理解知识、缺乏推理能力、输出不可控,揭示其只是满足企业"确定性幻想"的过渡方案。真正的知识智能需将知识内化为模型参数,通过微调、多跳推理架构等实现理解与推理能力。RAG虽解决短期工程问题,但终将被能真正理解语义、构建逻辑的AI系统取代。当前热潮反而可能延缓AI认知能力的突破。原创 2025-10-27 07:30:00 · 819 阅读 · 0 评论 -
最新RAG技术架构演进路线图拆解
RAG技术从Naive RAG到Agentic RAG经历了显著演进:Naive RAG通过简单检索增强模型知识,但存在上下文断层;Graph RAG引入知识图谱解决信息分割问题;Agentic RAG则实现动态知识获取,支持多智能体协作。横向迭代包括Naive RAG的重排机制和多模态支持、Graph RAG的混合检索架构,以及Agentic RAG的灵活扩展设计。这些改进使RAG系统在知识完整性、查询复杂度和应用灵活性上持续提升,推动大模型在实际业务中的深度应用。原创 2025-10-14 07:00:00 · 1856 阅读 · 0 评论 -
Markdown:为大模型注入高质量非结构化数据,适用于微调、RAG、提示词
Markdown:提升大模型数据质量的理想中间格式 在当前大模型应用中,数据质量直接影响模型表现。传统非结构化数据(PDF、Word等)存在三大痛点:格式复杂干扰理解、Token使用效率低、结构信息易丢失。Markdown作为轻量级标记语言,凭借其原生亲和性(大模型训练时已接触大量Markdown数据)、Token高效性(比HTML节省60%字符)和结构保持性,成为连接非结构化数据与大模型的理想桥梁。通过专用工具将各类办公文档转换为Markdown格式,可显著提升RAG、摘要生成等AI任务的效果,同时降低3原创 2025-10-13 11:08:24 · 743 阅读 · 0 评论 -
大语言模型(LLM)是“预制菜”? 从应用到底层原理,在到中央厨房的深度解析
本文以大语言模型(LLM)为"预制菜"的类比,系统阐述了AI产业的范式转变。文章从标准化生产(预训练、数据处理、模型架构)、便捷消费(提示词工程、微调、RAG技术)两方面,解析了LLM如何实现智能能力的规模化生产与快速交付。同时指出当前存在的黑盒性、领域知识局限等挑战,并展望了从"预制菜"向"智能中央厨房"进化的未来趋势,即构建动态生态系统,实现从零构建到快速搭建的转变。这一类比深刻揭示了LLM对AI产业带来的效率革命和普惠价值。原创 2025-10-11 14:02:26 · 1090 阅读 · 0 评论 -
大模型原理与实践:第七章-大模型实战_第2部分-智能体Agent系统
摘要 本文介绍了大模型智能体(Agent)系统的核心概念与实践。Agent系统以大语言模型为核心,具备自主规划、记忆、工具调用等能力,显著区别于传统LLM的被动响应模式。文章从Agent的定义、分类体系入手,详细阐述了其ReAct框架和四大类型(任务导向型、规划推理型、多Agent系统和探索学习型)。实战部分展示了如何构建一个Tiny-Agent,包括初始化配置、工具函数定义及JSON Schema转换方法,为开发基于LLM的智能体系统提供了具体实现路径。该内容是大模型实战系列文章的第七章第2部分,属于完整原创 2025-10-10 07:45:00 · 2037 阅读 · 0 评论 -
大模型原理与实践:第七章-大模型实战_第1部分-评测+RAG检索增强生成
大模型实战指南:评测与RAG技术 本文是《第七章 大模型实战》的第1部分,聚焦两大核心内容: 大模型评测体系:详解MMLU、GSM8K等主流评测数据集,介绍Open LLM Leaderboard等权威榜单,提供数学评测代码实现示例,帮助开发者客观评估模型性能。 RAG检索增强生成:阐述RAG技术原理,通过构建Tiny-RAG框架的实战案例,展示如何结合检索系统增强大模型的生成能力。 作为大模型应用系列的第7章,本文承接前文的理论基础,为开发者提供从模型评估到增强落地的完整实践指导。后续章节将深入探讨监督微原创 2025-10-10 07:30:00 · 1112 阅读 · 0 评论 -
RAG 全流程核心技术深度解析:2-RAG完整案例实战示例
本文介绍了RAG(检索增强生成)技术的完整实现流程,包括环境搭建、文档加载、文本分块、向量化存储和问答链创建等核心步骤。通过Python代码示例展示了如何使用LangChain库构建一个企业智能知识问答系统,包括加载本地文档、文本切分、向量数据库构建(FAISS)、以及结合大语言模型(如GPT-3.5)实现检索增强的问答功能。文章还提供了优化的Prompt模板设计,并讨论了RAG在智能客服、文档问答和法律领域的应用前景,以及未来可能的发展方向如多模态融合和模型轻量化等。原创 2025-10-05 08:00:00 · 926 阅读 · 0 评论 -
RAG 全流程核心技术深度解析:1-工作原理+切片+召回+排序
本文深入解析了检索增强生成(RAG)技术的核心原理与应用。RAG通过将信息检索与大语言模型生成能力结合,有效解决大模型的"幻觉"问题、知识时效性不足和领域专业壁垒等关键问题。文章详细介绍了RAG的工作流程,包括准备阶段的分片(Chunking)和索引(Indexing)技术,以及回答阶段的召回、重排和生成过程。特别针对分片技术,对比分析了固定长度切分、递归字符切分、语义切分、结构切分和LLM智能切分五种方法的优缺点及适用场景。最后,文章还探讨了向量化(Embedding)的核心算法和主流原创 2025-10-05 08:00:00 · 1273 阅读 · 0 评论 -
大模型原理与实践:第一章-NLP基础概念完整指南_第1部分-概念和发展历史
《NLP基础概念完整指南》摘要 本指南系统介绍自然语言处理(NLP)的核心理论与技术发展。全文共七章,涵盖从基础概念到前沿大模型的全方位知识。第一章详细解析NLP基础,包括概念定义、发展历程、核心任务(分词、词性标注、实体识别等)和文本表示技术(词向量、语言模型等)。后续章节深入探讨Transformer架构原理、预训练语言模型、大语言模型技术及实践应用。文章通过技术演进视角,展现NLP从早期规则系统到统计方法,再到深度学习的范式转变,特别强调词嵌入、预训练模型等关键技术突破。伪代码示例直观展示不同时期NL原创 2025-09-29 18:12:26 · 1280 阅读 · 0 评论 -
NLP2SQL必备的9款神器,重新定义企业级ChatBI-AI问数场景
本文介绍了9款NLP2SQL工具,助力企业实现ChatBI智能数据分析。这些工具包括Chat2DB(支持多数据库的AI客户端)、SQL Chat(对话式SQL工具)、Vanna(Python RAG框架)、Dataherald(企业级NL2SQL引擎)、WrenAI(生成式BI智能体)、SuperSonic(腾讯音乐开源BI平台)、Awesome-Text2SQL(学习资源集合)、DuckDB-NSQL(本地化SQL模型)和LangChain SQL(框架集成方案)。文章从项目概述、核心技术、应用场景等维度原创 2025-09-29 08:00:00 · 1376 阅读 · 0 评论 -
AI 智能体 8 种常见的记忆(Memory)策略与技术实现
AI智能体记忆策略全解析:8种核心方案原理与实战 本文系统介绍了AI智能体实现记忆功能的8种核心策略,帮助开发者突破LLM上下文长度限制,实现更智能的对话系统: 全量记忆:存储所有对话历史,简单但不可持续 滑动窗口:仅保留最近N轮对话,平衡性能与记忆 相关性过滤:基于重要性评分选择性保留关键信息 摘要/压缩:提炼对话要点,节省空间保留核心内容 向量数据库:利用语义检索实现海量长期记忆 知识图谱:结构化存储关系型知识 分层记忆:区分短期工作记忆与长期知识库 类OS内存管理:模拟计算机内存分页机制 每种策略各有原创 2025-09-28 08:00:00 · 1139 阅读 · 0 评论 -
Dify 2.0 重磅升级!知识管道登场,RAG 开发效率直接翻倍
Dify 2.0推出知识管道功能,将RAG文档处理流程模块化。该功能通过可配置的流水线处理数据,支持多种数据源和解析插件(如MINERU、Unstructured),提供通用、父子分块等分段策略,并内置7种模板应对不同场景(如复杂PDF解析、LLM上下文增强)。知识管道开放了文档解析、分块和索引配置环节,显著提升了RAG开发的灵活性和处理效率。生产环境建议暂缓升级,体验版可拉取2.0.0-beta.2标签安装。原创 2025-09-23 20:15:04 · 1226 阅读 · 0 评论 -
Qwen3-Next:迈向更极致的训练推理性价比
Qwen团队发布新一代大模型Qwen3-Next,采用混合注意力机制与高稀疏度MoE架构,显著提升训练和推理效率。其80B参数模型仅激活3B参数,训练成本不到Qwen3-32B的10%,在长上下文任务中推理吞吐提升10倍以上。新模型在基准测试中表现优异,部分指标接近旗舰模型Qwen3-235B,并支持256K超长上下文处理。团队同时开源了相关代码和最佳实践,包括Transformers、SGLang和vLLM部署方案,以及微调指导。该架构创新为大模型发展提供了新方向,团队将持续优化并开发Qwen3.5版本。原创 2025-09-13 08:31:44 · 1145 阅读 · 0 评论 -
2025年最佳RAG重排序模型盘点:Cohere、bge-reranker、Voyage、Jina、ColBERT、FlashRank、MixedBread等对比
检索增强生成(RAG)技术通过结合信息检索与文本生成,显著提升了大型语言模型的性能。该技术核心在于重排序器,它能够优化初始检索结果,确保为模型提供最相关的上下文。文章详细介绍了2025年主流重排序模型的特点、性能及适用场景,包括Cohere、BGE、Voyage等商业和开源方案。同时阐述了评估重排序器有效性的关键指标,并为选择适合的重排序器提供了决策框架。RAG技术的进步使得AI应用能够生成更准确、可靠的回答,但需要根据具体需求在准确性、速度、成本之间做出权衡。原创 2025-09-12 07:45:00 · 1590 阅读 · 0 评论 -
Milvus-RAG-LangChain-RAG实践案例-增删改查操作
# 文章摘要 本文介绍了使用LangChain和Milvus构建RAG(检索增强生成)问答系统的完整流程。首先通过`DirectoryLoader`和`TextLoader`加载文档,使用递归切分器进行文本分块。然后创建Milvus向量数据库集合,将文档块通过OpenAI的text-embedding-ada-002模型嵌入后存储。最后构建RetrievalQA链,结合GPT-4o-mini模型实现基于检索的问答功能。系统可查询文档内容(如企业概况),并返回参考来源,演示了从文档处理到智能问答的端到端实现。原创 2025-09-11 07:45:00 · 196 阅读 · 0 评论 -
Milvus-LangChain-Agent-RAG完整问答实践案例
百得利集团是中国领先的豪华及超豪华汽车经销与服务集团,成立于1998年,总部位于北京,代理宾利、保时捷、奔驰、宝马等品牌。截至2025年,拥有15家4S经销店,覆盖全国8个省市。集团业务涵盖汽车销售、售后服务、金融保险及创新业务,致力于为客户提供全生命周期服务。2021年在原创 2025-09-09 07:45:00 · 385 阅读 · 0 评论 -
深度剖析GraphRAG项目架构:核心原理+底层源码+最佳实践的全面解析
GraphRAG项目架构深度解析:通过构建知识图谱解决传统RAG的语义碎片化和检索局限性问题。采用分层架构设计,包含API接口层、命令行界面层、配置管理模块等,核心使用Pydantic确保类型安全,Typer构建现代化CLI。系统通过定义面向图的数据结构表示知识图谱中的实体关系,实现更全面的复杂问题回答能力。项目亮点在于工作流引擎和原子操作实现的模块化设计,以及自动提取文档语义结构的能力,显著提升了对隐性关联和全局模式的发现效率。原创 2025-09-07 07:45:00 · 977 阅读 · 0 评论 -
SQLBot(ChatBI):智能数据分析工具-通过 MCP 进行服务端图表渲染与智能问数配置
SQLBot是一款基于大语言模型和RAG技术的智能问数系统,支持用户通过自然语言查询数据并生成可视化图表。该系统具有开箱即用、易于集成和安全可控三大优势,提供提问分析、深度探索、数据管理和看板搭建等核心功能。通过MCP服务支持多种集成方式,详细介绍了与MaxKB、Dify、Coze和n8n等平台的对接流程,包括服务配置、工具使用和示例演示。SQLBot实现了从自然语言到SQL的高效转换,为企业提供便捷的数据分析与决策支持能力。原创 2025-09-06 07:45:00 · 1753 阅读 · 0 评论 -
RAG检索系统核心技术深度解析:稀疏BM25+密集嵌入BGE-M3+混合检索(倒数排序RRF算法)+多模态嵌入BGE-VL+多种实战案例
摘要 本文深入解析RAG检索系统的核心技术,包括稀疏嵌入(BM25)、密集嵌入(BGE-M3)和多模态嵌入(BGE-VL)。BM25基于词频、逆文档频率和文档长度归一化进行检索,通过jieba分词实现中文处理。密集嵌入利用语义相似度进行检索,而多模态嵌入支持文本和图像混合检索。文章还介绍了混合检索策略(RRF算法)和多种实战案例,提供完整代码实现和性能对比,帮助构建高性能RAG检索系统。原创 2025-09-04 07:45:00 · 528 阅读 · 0 评论 -
RAG上下文压缩技术深度剖析-多场景案例实战
RAG上下文压缩技术深度解析:提升大模型效能的关键策略 摘要:RAG(检索增强生成)技术面临上下文窗口有限与信息密度低的挑战。本文深入剖析了上下文压缩技术的核心原理,提出三种创新策略:1)信息过滤策略,通过语义相似度计算去除噪音;2)生成摘要策略,利用大模型智能概括关键信息;3)两阶段处理架构,实现信息提炼与答案生成分工协作。研究显示,智能压缩技术可在保持90%以上信息完整性的同时,减少40%-60%的上下文长度,显著提升模型生成质量。文章通过代码实例展示了各策略的实现方案,并分析了其适用场景与优化方向,为原创 2025-09-03 07:45:00 · 2249 阅读 · 0 评论 -
PDF转Markdown:6种常用开源工具深度对比-实战案例
本文对比了6款主流开源PDF转Markdown工具,重点介绍了Marker和MinerU两款代表性工具。Marker是一款轻量级高性能解决方案,基于PyMuPDF和Tesseract OCR技术,处理速度快4倍,适合科研文献等基础格式转换。MinerU则是企业级高精度解析器,集成LayoutLMv3和YOLOv8深度学习模型,支持84种语言OCR,适用于学术文献管理和财务报表解析等高精度场景。文章详细提供了两款工具的安装配置指南、核心代码示例和批量处理脚本,帮助开发者根据实际需求选择合适工具。原创 2025-09-03 07:45:00 · 2185 阅读 · 0 评论 -
RAG系统中的五种文档分块策略:原理详解-全面对比-最佳实践(固定大小分块、语义分块、递归分块、文档结构分块、LLM大模型分块)
RAG系统中的文档分块策略直接影响检索效果和生成质量。本文详解五种分块方法:1)固定大小分块:简单高效但可能截断语义;2)语义分块:基于句子相似度保持语义连贯;3)递归分块:多层级处理复杂文档;4)文档结构分块:利用标题段落等结构化信息;5)LLM分块:利用大模型智能划分。每种策略都配有实现代码和优缺点分析,帮助开发者在实际项目中根据文档特性和应用场景选择合适的分块方法,优化RAG系统性能。原创 2025-09-01 16:22:02 · 1267 阅读 · 0 评论 -
RAG技术深度解析:从原理到企业级实战的全链路完整案例
RAG(检索增强生成)技术已成为解决大模型知识局限性的核心方案。本文从技术原理到企业级实战,深度剖析RAG系统的全链路实现。RAG能有效解决大模型的三大缺陷:知识时效性、幻觉问题和领域专业性不足,相比训练专属大模型可节省97.5%成本。文章详细解析了RAG系统架构,包括查询理解与预处理、混合检索策略等关键模块,并提供了完整的Python实现代码。通过实际案例证明,精心设计的RAG系统可将特定领域知识处理准确率从47%提升至89%以上,在财务合规等场景中效果显著。原创 2025-09-02 07:45:00 · 853 阅读 · 0 评论 -
RAG技术全面解析:构建商业级AI知识库问答的技术案例
RAG(检索增强生成)技术解析:解决大模型幻觉与知识时效性问题的企业级方案。该技术通过将知识与推理解耦,为LLM提供动态知识库支持,有效降低错误率至2%以下,显著提升专业领域准确率(如医疗诊断从31%提升至89%)。文章详解RAG四大工作流程(查询理解、知识检索、上下文构建、增强生成)及技术栈(向量数据库、Embedding模型等),结合金融合规等案例展示其85%效率提升效果,并给出混合检索、查询改写等优化策略。RAG凭借成本效益、数据主权等优势,正成为企业AI落地的核心技术选择。原创 2025-09-02 07:45:00 · 911 阅读 · 0 评论 -
Chroma-从入门到实践
ChromaDB 是一个轻量级的向量数据库,适用于存储和检索文本文档及其嵌入表示。本文展示了如何使用 ChromaDB 进行基本操作,包括创建集合、添加文档、查询相似文档以及持久化存储。通过示例代码,演示了如何创建临时和持久化客户端,以及如何通过 HTTP 方式运行 Chroma 服务器。此外,还介绍了如何使用预训练的嵌入模型(如 Sentence Transformer)处理文本,以及如何管理集合的元数据。ChromaDB 支持高效检索和索引,适用于语义搜索、推荐系统等场景。原创 2025-08-25 07:45:00 · 838 阅读 · 0 评论 -
【最新DeepSeek v3.1】DeepSeek 模型升级至V3.1,上下文长度扩至128k,深度技术解析与全面指南
DeepSeek-V3.1 深度解析:128K长文本处理与性能优化 核心升级:基于Transformer架构优化,采用分块注意力(GQA)和RoPE位置编码增强,支持128K长上下文处理,显著提升超长文本理解与多轮对话一致性。 性能表现: 速度:A100 GPU推理约60 tokens/秒 能力:长文档总结、代码跨文件分析、逻辑推理优化,减少幻觉生成 量化支持:兼容GPTQ/AWQ量化方案(INT4/INT8) 应用场景: 法律合同审查/技术文档问答 长篇内容创作/剧本生成 大型代码库分析与调试 获取方式:原创 2025-08-20 07:29:11 · 5358 阅读 · 0 评论
分享