RAG_YXWik6的博客-优快云博客

RAG

关注

文章平均质量分 87

RAG即检索增强生成，在当下的人工智能领域应用广泛。 # 解锁RAG：革新内容生成的强大力量 ![{“type“:“load_by_key“,“key“:“banner_image_0“,“image_type“:“search“}]() 在人工智

关注数：文章数：6 文章阅读量：7048 文章收藏量：70

作者: YXWik6

西安程序员一枚，喜欢研究各种技术，AI大时代来临后开始热衷于AI领域的探索，所有文章技术工具内容均只用于学习，如有侵权请联系删除

展开

专栏收录文章

java 使用 spring AI 实战 RAG （Chroma 向量数据库+Advisor）

我这里用的：ollama+ qwen 大家可以根据自己的环境自行更改Windows版本Linux版本。

原创 2025-09-04 14:10:35 · 706 阅读 · 2 评论
Linux安装AnythingLLM

官网首页直接提供的Desktop脚本安装，只能够个人使用，无法多人使用。方式进行安装可以满足多人同时使用。我这里的模型是本地。

原创 2025-07-31 14:14:33 · 622 阅读 · 1 评论
Linux安装ragflow（含一键安装脚本）

脚本会在docker中安装 redis 、 minio 、 es 、mysql 、ragflow ，如果服务器存在这些服务的记得处理下，为避免ragflow的端口冲突，我在脚本中设置了端口为8880开始检测，如果没占用采用8880进行web端访问端口。如果重复运行脚本就需要执行以下命令进行清理后再重启。将以下两个文件放到docker目录下。进入项目的docker目录下。设置模型，前文中安装了。总结：服务器需要安装。上传到服务器进行解压。

原创 2025-07-29 14:42:58 · 747 阅读 · 1 评论
RAG理解

RAG（检索增强生成）技术的应用场景与实现原理。RAG通过将用户问题与向量数据库中的文档进行相似度匹配，再结合大模型生成答案，有效解决了模型幻觉和精度问题。相比微调方法，RAG成本更低，适合数据量较小的企业。文章详细介绍了RAG的工作流程：从文本向量化、向量数据库存储到相似度检索，并比较了Naive RAG的优缺点。最后指出当RAG精度不足时可结合知识图谱，并提供了入门Demo链接。RAG平衡了成本与效果，是当前大模型应用的重要技术方案。

原创 2025-06-19 11:56:07 · 845 阅读 · 0 评论
langchain +ollama +chroma+embedding模型实现RAG入门级Demo(python版)

RAGNaive RAG(朴素RAG)、(高级RAG)和(模块化RAG)RAG在成本效益上超过了原生LLM，但也表现出了几个局限性，这也更大家一个印象:入门容易，做好难。和的发展是为了解决Naive RAG中的缺陷。Naive RAG遵循一个传统的流程，包括索引、检索和生成，它也被称为“检索-阅读”框架，将查询(query)与文档的检索结合起来，通过大语言模型 (LLM) 生成答案。将数据先通过嵌入（embedding）算法转变为向量数据，然后存储在Chroma这种向量数据库。

原创 2025-04-21 17:18:04 · 1138 阅读 · 0 评论
RAGFlow安装+本地知识库+踩坑记录

RAGFlow是一种融合了数据检索与生成式模型的新型系统架构，其核心思想在于将大规模检索系统与先进的生成式模型（如Transformer、GPT系列）相结合，从而在回答查询时既能利用海量数据的知识库，又能生成符合上下文语义的自然语言回复。该系统主要包含两个关键模块：数据检索模块和生成模块。数据检索模块负责在海量数据中快速定位相关信息，而生成模块则基于检索结果生成高质量的回答或文本内容。

原创 2025-04-21 12:00:55 · 2994 阅读 · 1 评论

RAG

作者: YXWik6

java 使用 spring AI 实战 RAG （Chroma 向量数据库+Advisor）

Linux安装AnythingLLM

Linux安装ragflow（含一键安装脚本）

RAG理解

langchain +ollama +chroma+embedding模型实现RAG入门级Demo(python版)

RAGFlow安装+本地知识库+踩坑记录