实操版：手把手教你搭建RAG及Embedding如何选择？（含完整代码）

最新推荐文章于 2025-04-04 23:07:43 发布

大F的智能小课

最新推荐文章于 2025-04-04 23:07:43 发布

阅读量54

点赞数 1

分类专栏：大模型理论和实战文章标签： embedding python 开发语言

本文链接：https://blog.youkuaiyun.com/zengzizi/article/details/145788006

版权

大模型理论和实战专栏收录该内容

52 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

一、5分钟搭建早餐推荐RAG（完整代码）

1.1 环境准备

# 安装依赖（推荐Python 3.10+）
pip install sentence-transformers llama-index python-dotenv

1.2 完整代码

# rag_breakfast.py
import os
from pathlib import Path
from llama_index.core import VectorStoreIndex, Simpl

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

大F的智能小课

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

大语言模型原理与工程实践：手把手教你训练 7B 大语言模型自动化训练框架

AI天才研究院

07-10

1211

近年来，大语言模型（Large Language Models，LLMs）在自然语言处理领域取得了突破性进展。从GPT-3到ChatGPT，再到最新的GPT-4，这些模型展现出了惊人的语言理解和生成能力，引发了学术界和产业界的广泛关注。然而，训练如此庞大的模型不仅需要海量的数据和计算资源，还需要复杂的工程实践和优化技巧。本文将深入探讨大语言模型的原理，并以7B参数规模的模型为例，详细介绍如何构建一个自动化训练框架，使读者能够亲自动手训练自己的大语言模型。

RAG入门实践：手把手Python实现搭建本地知识问答系统

Arbboter的专栏

02-20

2180

向量数据库是AI时代的“数据配对专家”，用向量化思维解决非结构化数据的存储和检索难题，尤其适合需要。

参与评论您还未登录，请先登录后发表或查看评论

RAG知识库搭建：手把手教你从零搭建自己的知识库

2401_82469710的博客

11-16

1414

RAG知识库搭建：手把手教你从零搭建自己的知识库

打造专属知识库：手把手教你构建RAG系统

2401_84204413的博客

07-14

1403

RAG通常指的是"Retrieval-Augmented Generation"，即“检索增强的生成”。这是一种结合了检索（Retrieval）和生成（Generation）的机器学习模型，通常用于自然语言处理任务，如文本生成、问答系统等。我们通过一下几个步骤来完成一个基于京东云官网文档的RAG系统数据的收集再整个RAG实施过程中无疑是最耗人工的，涉及到收集、清洗、格式化、切分等过程。这里我们使用京东云的官方文档作为知识库的基础。文档格式大概这样：每条数据是一个包含四个字段的json，这四个字段分别是"c

JinaCLIP×Milvus：手把手教你搭建多模态RAG系统

ZILLIZ

11-06

925

最近，多模态 Embedding 模型的爆火在各个行业引起了广泛关注，改变了机器理解文本和图像的方式。虽然多模态 Embedding 模型发展有了重要突破，但这些模型仍旧面临一些关键挑战，其中之一就是不同模态数据的 Gap 问题——即使代表的是同一个对象，图像和文本 Embedding 在向量空间中的距离也相隔甚远。在最近由 Zilliz 主办的非结构化数据 Meetup 上，Jina AI 的工...

RAG与知识库搭建，手把手教你构建RAG系统

qkh1234567的博客

11-13

3681

自从发现可以利用自有数据来增强大语言模型（LLM）的能力以来，如何将 LLM 的通用知识与个人数据有效结合一直是热门话题。关于使用微调（fine-tuning）还是检索增强生成（RAG）来实现这一目标的讨论持续不断。检索增强生成 (RAG) 是一种使用来自私有或专有数据源的信息来辅助文本生成的技术。它将检索模型（设计用于搜索大型数据集或知识库）和生成模型（例如大型语言模型 (LLM)，此类模型会使用检索到的信息生成可供阅读的文本回复）结合在一起。

【实战项目】手把手教你构建自己的RAG应用：从零开始，全面指南！

m0_65555479的博客

01-14

2283

RAGRAG 是一个人工智能框架，用于从外部知识库中检索事实，使大型语言模型（LLM）基于最准确的最新信息，并让用户深入了解 LLM 的生成过程。大语言模型训练完后，其内部知识库就已经确定了，所以它无法回答你超过其知识库内容的问题。除非你有能力对其进行微调，否则最简单的方法就是使用RAG检索外部知识库。有人可能会认为，RAG是不是就是让模型在回答问题前先去指定的外部知识库检索一下知识，然后再回答？

一文读懂RAGFlow：从 0 到 1教你搭建RAG知识库

2401_85390073的博客

02-26

3404

RAGFlow是一种融合了数据检索与生成式模型的新型系统架构，其核心思想在于将大规模检索系统与先进的生成式模型（如Transformer、GPT系列）相结合，从而在回答查询时既能利用海量数据的知识库，又能生成符合上下文语义的自然语言回复。该系统主要包含两个关键模块：数据检索模块和生成模块。数据检索模块负责在海量数据中快速定位相关信息，而生成模块则基于检索结果生成高质量的回答或文本内容。

构建专属知识库：RAG实操教程结合LangChain与Milvus向量数据库

2401_84204207的博客

09-09

1580

本文主要是 Milvus 向量数据实战总结。LLM 痛点以及解决方案RAG 是什么，为什么选用RAG。langchain文档加载器，chat model文档拆分的注意点，chat model区别。chat 示例代码。

自己手写了一个大模型RAG项目-06.使用自己的embedding模型

qq_35054222的博客

05-26

1475

修改里面的Embedding部分，替换成自己本地部署的Embedding模型，并且尝试多模态和单模态两种方式

【四.RAG技术与应用】【3.RAG系统搭建（上）：从零开始的构建指南】

再见孙悟空的专栏

03-04

最近被朋友问爆了：“听说RAG能搞智能客服/文档助手，到底怎么搭啊？”网上的教程要么太理论，要么直接甩代码让人懵逼。今天咱们就抛开高大上的概念，用最接地气的方式，从装环境到跑通第一个案例，把RAG这玩意儿拆开了揉碎了讲。

手把手系列｜使用Milvus、Llama 3、Ollama、LangChain本地设置RAG应用

python12345_的博客

08-23

965

RAG，即检索增强生成，是一种通过整合外部数据源来增强大语言模型（LLM）的技术。一个典型的 RAG 应用包括：索引流水线（Pipeline）：用于从外部数据源中摄取数据并对其进行索引，随后加载、拆分并将数据存储在 Milvus 中。检索和生成：将用户查询转换为 Embedding 向量，然后从 Milvus 中检索相关数据形成上下文，然后 LLM 上下文生成响应。文本将提供实用的操作指导，向您展示如何使用本地 LLM 构建 RAG 应用。欢迎初学者跟随本指南开始构建自己的问答机器人！

192.168.145.129

cqsizhuang的博客

04-03

341

学习 SQL 基础：SQL 是与数据库交互的语言，掌握基本的 SQL 语句，如SELECT、INSERT、UPDATE、DELETE等，以及数据定义语言（DDL），如CREATE TABLE、ALTER TABLE、DROP TABLE等。研究数据库内核：如果对数据库的底层原理感兴趣，可以深入研究 PostgreSQL 的内核代码，了解其存储引擎、查询优化器、事务处理等模块的实现原理，这有助于更深入地理解数据库的运行机制，提升性能优化和故障排查的能力。安装完成后，熟悉数据库的启动、停止等操作。

安装ROS1（Noetic）

qq_23022733的博客

04-01

137

wget http://fishros.com/install -O fishros && . fishros

在显卡上训练大模型

weixin_44245188的博客

04-02

1070

本文讲述了在昇腾910上面使用 LLaMA-13B 进行多机多卡模型训练；但目前在昇腾910上面，无论是基于MindSpore还是基于Pytorch进行大模型训练，总体都还不是很完善，就当前时间节点而言，经常会有一些奇奇怪怪的坑；虽然，从硬件层面上来说昇腾910具备训练大模型的能力，但是软件层面（无论是生态还是AI框架的易用性，对于业界最新大模型的支持和适配等）上还有很长的路要走。

Python 中的 `partial`：函数参数预设的艺术

蜗牛沐雨

04-01

1119

在 Python 的functools模块中，partial是一个非常实用的工具，用于创建一个新的函数，该函数是原函数的一个“部分应用”版本。所谓“部分应用”，是指预先设定原函数的一部分参数，从而生成一个新的函数，这个新函数在被调用时，只需要提供剩余的参数即可。partial的存在，使得我们可以更加灵活地处理函数参数，特别是在需要将函数作为参数传递，或者需要对函数进行一定程度的定制化时，partial能够大显身手。partial。

YO-CSA-T：基于上下文与空间注意力的实时羽毛球轨迹追踪系统解析

hasakie的博客

03-31

1104

本文围绕羽毛球轨迹实时追踪问题展开，提出了一种基于改进YOLOv8的检测网络（YO-CSA）和集成多模块的3D轨迹追踪系统。全文结构如下：摘要提出YO-CSA检测网络，结合上下文与空间注意力机制提升检测精度（mAP@0.75达90.43%）。构建实时3D轨迹追踪系统，集成检测、预测、补偿模块，帧率超130fps。引言背景：羽毛球高速飞行、易与环境混淆，传统检测方法精度不足。挑战：实时性、3D轨迹重建、遮挡补偿。贡献：轻量化检测网络、多维度时空约束策略、完整系统设计。相关工作。

chromium魔改——绕过无限debugger反调试

最新发布

weixin_45307278的博客

04-04

156

这种技术的核心是利用 JavaScript 的 debugger 语句，当开发者工具打开时，debugger 会触发断点，从而阻止代码继续执行。在了解实现原理后，我们现在的思路是让 debugger 关键字像 JavaScript 中的其他独立关键字一样，无需特定上下文即可单独执行。经过验证可以发现，运行 debugger 语句的效果与返回 null 是等价的。这些关键字在 JavaScript 中具有独立的意义和用途，我们的目标是使 debugger 关键字也能以类似的方式运行。

从零开始手把手教你大模型RAG

02-01

### 构建和训练大规模语言模型RAG #### 准备工作构建和训练像RAG这样的大规模语言模型涉及多个复杂的步骤和技术组件。为了确保成功实现这一目标，前期准备至关重要。这不仅包括硬件资源的选择，还包括软件环境搭建以及数据集的收集与处理。对于硬件而言，建议使用配备高性能GPU集群来加速计算过程；而对于软件，则需安装PyTorch框架及其依赖库，并配置相应的开发工具链[^1]。 #### 数据获取与预处理高质量的数据源是训练有效的大规模语言模型的基础。针对特定领域应用时，应优先考虑那些能够反映该领域特征并具有一定规模的真实语料作为训练素材。此外，还需对原始文本执行清洗、分词等一系列操作以便后续用于模型训练。 #### 模型架构设计 RAG（Retrieval-Augmented Generation）是一种结合检索机制与生成式方法于一体的混合型自然语言处理方案。其核心思想是在编码器端引入外部知识库查询功能，使得解码过程中可以充分利用已有信息提高回复质量。具体来说： - **检索模块**：负责从大量文档集合中快速定位最相关的片段； - **生成模块**：基于Transformer结构，接收来自检索部分的结果连同用户提问共同构成上下文输入序列，进而完成最终的回答合成任务[^2]。 #### 实现细节说明以下是简化版Python代码示例展示如何创建一个简单的RAG实例: ```python from transformers import RagTokenizer, RagRetriever, RagSequenceForGeneration tokenizer = RagTokenizer.from_pretrained("facebook/rag-token-base") retriever = RagRetriever.from_pretrained( "facebook/dpr-question_encoder-single-nq-base", index_name="exact", use_dummy_dataset=True, ) model = RagSequenceForGeneration.from_pretrained("facebook/rag-sequence-base") input_dict = tokenizer.prepare_seq2seq_batch( ["What is the capital of France?"], return_tensors="pt" ) generated_ids = model.generate(input_ids=input_dict["input_ids"]) print(tokenizer.batch_decode(generated_ids, skip_special_tokens=True)) ``` 此段脚本展示了加载预训练权重文件、定义检索器对象以及调用`generate()`函数生成答案的过程。当然实际项目里还需要进一步调整超参数设置以适应不同场景需求[^3]。