大模型工程与应用技术
文章平均质量分 97
学习研究大模型相关技术,主要围绕应用技术与前沿技术。
maximejia
在科学上没有平坦的大道,只有不畏辛苦沿着陡峭山路攀登的人,才有希望达到光辉的顶点。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型RAG技术学习——索引构建
本文主要对面向RAG的索引构建进行了介绍,包括向量嵌入(文本嵌入、多模态嵌入)、向量数据库以及索引优化等内容。作为大模型RAG的基础和前提,索引构建的品质至关重要,需要精心设计与构建。原创 2025-09-26 01:01:30 · 1072 阅读 · 0 评论 -
大模型RAG技术学习——大模型RAG预处理
大模型RAG预处理的核心是将外部知识(结构化/非结构化文档)转换为向量化表示,构建高质量向量数据库。Unstructured作为主流文档处理库,支持多格式解析(PDF/Word/HTML等),能识别标题、正文、表格等元素类型,并提取元数据。文档加载质量直接影响后续检索和生成效果。当前主流工具包括PyMuPDF4LLM、TextLoader、LlamaParse等,其中Unstructured提供统一接口和模块化函数,特别适合LLM数据预处理。而针对文档文本分块,LangChain提供了丰富的方法可供调用。原创 2025-09-20 01:57:11 · 496 阅读 · 0 评论 -
大模型RAG技术学习——RAG技术基础
RAG(检索增强生成)技术融合信息检索与文本生成,通过动态检索外部知识库提升大型语言模型输出的准确性和实时性。其核心流程包括索引构建、语义检索和上下文生成三个阶段,技术演进从基础RAG发展到支持多轮检索、查询重写的高级RAG,再到模块化RAG实现复杂场景支持。RAG的关键优势包括降低模型幻觉、支持知识溯源、减少微调成本,并具有良好的可扩展性。构建RAG系统需完成数据准备、索引构建、检索优化和生成集成四个步骤,通过API接入大模型并配置Python环境即可实现基础功能。该技术为LLM应用提供了有效的信息增强。原创 2025-09-17 23:37:38 · 831 阅读 · 0 评论
分享