RAG
文章平均质量分 71
大鹏的NLP博客
擅长大模型微调及RAG、Agent,自然语言处理,知识图谱,人工智能,大数据,K8S,软件工程等领域的技术及管理
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
AI 时代的生存法则——从“写代码”进化到“定义问题”,天生对老程序员友好
AI浪潮下,程序员的核心价值正从"写代码"转向"定义问题"。资深开发者的经验优势凸显:判断业务痛点、设计系统边界、确保稳定性等能力变得稀缺。AI淘汰的是执行型工程师,却放大了系统架构师的价值。关键在于从"代码实现"转型为"问题建模",用经验为AI划定边界。这要求老程序员必须完成认知跃迁,成为对商业结果负责的"现实世界建模者",而非固守技术细节。最终,责任意识和系统视角将成为AI时代最昂贵的竞争力。原创 2026-01-05 07:40:36 · 254 阅读 · 0 评论 -
从幻觉到真理:生产级 RAG 系统构建的深度指南
RAG系统开发存在"1/9定律":10%时间完成Demo,90%精力解决商用难题。三大核心挑战包括:检索质量(需混合检索避免语义漂移)、上下文优化(克服"中间迷失"效应)和非结构化数据处理(应对多模态内容)。ReRank技术是商用分水岭,可将准确率从60%提升至90%以上。生产级RAG需构建多级流水线,通过重写、混合检索、重排和过滤实现信息流精准管理。最终目标是将大模型从聊天工具升级为企业级知识大脑。原创 2026-01-04 22:42:02 · 493 阅读 · 0 评论 -
深度解析:RAG(检索增强生成)从提问到回答的通用工程逻辑
摘要:本文系统解析了RAG(检索增强生成)技术的工程实现全流程。RAG通过将用户问题转化为可检索形式,从外部知识库获取相关上下文,以此约束大模型生成可靠答案。文章详细拆解了标准RAG七步法:问题接收、改写、向量化、检索、结果整理、上下文构造和生成,并对比了RAG与传统LLM在知识更新、幻觉控制等方面的优势。RAG的本质是通过检索机制将模型置于确定的知识环境中,实现可控的知识推理与生成,为AI应用提供更可靠的解决方案。原创 2026-01-04 22:33:37 · 633 阅读 · 0 评论 -
Prompt Engineering 不完全设计宣言:关于如何让不确定的智能,运行在可负责的系统中
摘要: Prompt Engineering的核心并非“话术技巧”,而是通过系统性约束解决概率性大模型与确定性工程间的矛盾。其本质是设计可控、可审计、可容错的接口,而非追求模型“聪明”。关键原则包括:明确责任归属(设计者担责)、严格定义输入输出边界、限制自由度优先于增强能力、强制推理可审计、允许安全失败、多重校验推理、与系统协同设计、角色设定缩小概率空间,以及持续迭代优化。最终目标是构建即使模型不完美也能避免危害的可靠系统,实现“智能概率化,系统确定性”。(150字)原创 2026-01-04 21:54:03 · 586 阅读 · 0 评论 -
系统设计宣言:将不确定的 AI,锁进确定的系统里
《系统设计宣言:将不确定的AI锁进确定的系统》提出了一套应对AI参与现实决策的设计伦理。核心立场强调:当AI开始直接影响现实世界(如资金、医疗、交通等)时,必须建立责任边界。宣言指出AI本质具有不确定性(概率性、分布依赖、无法覆盖极端情况),因此系统设计必须包含确定性兜底结构,拒绝"AI直接执行后果"的高风险范式。作者提出五项原则:AI仅作输入而非终点、显式处理不确定性、确保AI失效时系统仍可运行、确定性系统优先于智能系统、禁止用算法转移责任。最终倡导一种边界清晰、权限受限的成熟智能观,原创 2025-12-31 21:55:37 · 461 阅读 · 0 评论 -
结合docling使用4种策略解析文档
本文介绍了4种文档解析策略及其适用场景:SEMANTIC(结构化文档)、HYBRID(通用文档)、FIXED_SIZE(无结构文档)和ELEMENT_BASED(表格/列表多的文档)。重点推荐HYBRID策略,它平衡了语义完整性和chunk大小。文档分块器可根据元素类型、层级和页码信息进行智能分块,并保留章节路径等元数据。通过修改strategy参数即可灵活切换不同解析策略,满足多样化需求。原创 2025-12-28 22:18:30 · 290 阅读 · 0 评论 -
使用docling基于语义结构的解析方式
本文提出了一种基于语义结构的文档解析方法,通过分析PDF文档的层级结构(如章节、段落)来组织文本片段,而非简单的按长度切分。系统采用DocumentConverter解析PDF,利用SemanticChunkBuilder类按标题层级构建语义块,保留章节路径等元数据。解析结果经SentenceTransformer向量化后存入ChromaDB,支持语义检索并展示相关章节信息。实验表明,该方法能有效保持文档的语义连贯性,为信息检索提供更结构化的结果。系统还提供章节分布统计功能,量化文档结构特征。原创 2025-12-28 22:01:30 · 92 阅读 · 0 评论
分享