RAG
文章平均质量分 87
RAG即检索增强生成,在当下的人工智能领域应用广泛。
# 解锁RAG:革新内容生成的强大力量
![{“type“:“load_by_key“,“key“:“banner_image_0“,“image_type“:“search“}]()
在人工智
YXWik6
西安程序员一枚,喜欢研究各种技术,AI大时代来临后开始热衷于AI领域的探索,所有文章技术工具内容均只用于学习,如有侵权请联系删除
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
java 使用 spring AI 实战 RAG (Chroma 向量数据库+Advisor)
我这里用的 :ollama+ qwen 大家可以根据自己的环境自行更改Windows版本Linux版本。原创 2025-09-04 14:10:35 · 706 阅读 · 2 评论 -
Linux安装AnythingLLM
官网首页直接提供的Desktop脚本安装,只能够个人使用,无法多人使用。方式进行安装可以满足多人同时使用。我这里的模型是 本地。原创 2025-07-31 14:14:33 · 622 阅读 · 1 评论 -
Linux安装ragflow(含一键安装脚本)
脚本会在docker中安装 redis 、 minio 、 es 、mysql 、ragflow ,如果服务器存在这些服务的记得处理下,为避免ragflow的端口冲突,我在脚本中设置了端口为8880开始检测,如果没占用采用8880进行web端访问端口。如果重复运行脚本就需要执行以下命令进行清理后再重启。将以下两个文件放到docker目录下。进入项目的docker目录下。设置模型,前文中安装了。总结:服务器需要安装。上传到服务器进行解压。原创 2025-07-29 14:42:58 · 747 阅读 · 1 评论 -
RAG理解
RAG(检索增强生成)技术的应用场景与实现原理。RAG通过将用户问题与向量数据库中的文档进行相似度匹配,再结合大模型生成答案,有效解决了模型幻觉和精度问题。相比微调方法,RAG成本更低,适合数据量较小的企业。文章详细介绍了RAG的工作流程:从文本向量化、向量数据库存储到相似度检索,并比较了Naive RAG的优缺点。最后指出当RAG精度不足时可结合知识图谱,并提供了入门Demo链接。RAG平衡了成本与效果,是当前大模型应用的重要技术方案。原创 2025-06-19 11:56:07 · 845 阅读 · 0 评论 -
langchain +ollama +chroma+embedding模型实现RAG入门级Demo(python版)
RAGNaive RAG(朴素RAG)、(高级RAG)和(模块化RAG)RAG在成本效益上超过了原生LLM,但也表现出了几个局限性,这也更大家一个印象:入门容易,做好难。和的发展是为了解决Naive RAG中的缺陷。Naive RAG遵循一个传统的流程,包括索引、检索和生成,它也被称为“检索-阅读”框架,将查询(query)与文档的检索结合起来,通过大语言模型 (LLM) 生成答案。将数据先通过嵌入(embedding)算法转变为向量数据,然后存储在Chroma这种向量数据库。原创 2025-04-21 17:18:04 · 1138 阅读 · 0 评论 -
RAGFlow安装+本地知识库+踩坑记录
RAGFlow是一种融合了数据检索与生成式模型的新型系统架构,其核心思想在于将大规模检索系统与先进的生成式模型(如Transformer、GPT系列)相结合,从而在回答查询时既能利用海量数据的知识库,又能生成符合上下文语义的自然语言回复。该系统主要包含两个关键模块:数据检索模块和生成模块。数据检索模块负责在海量数据中快速定位相关信息,而生成模块则基于检索结果生成高质量的回答或文本内容。原创 2025-04-21 12:00:55 · 2994 阅读 · 1 评论
分享