RAG入门
文章平均质量分 84
N2svtewg
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
wow-rag 第五章-流式部署 Task05
param=你好");如果需携带,选择 Fetch 方案,自行设置headers:{}原创 2025-07-24 10:02:18 · 1049 阅读 · 0 评论 -
wow-rag | 最脏最累的文档管理 Task04
掌握了索引动态增删与底层结构巡检的核心操作,为后续在线知识库更新、权限隔离、数据治理奠定基础。查 → 删 → 增 → 存;更新不支持就“删后再增”。这一节没有模型、没有 fancy UI,纯粹体力活。但是决定了 RAG 的上限。原创 2025-07-22 01:45:53 · 1619 阅读 · 0 评论 -
RAG 入门 Task03 初步体验问答引擎
改 llama-index 源码后 restart,否则 import cache。支持 AND / OR 逻辑、数值比较、原生 Qdrant Filter。调太大——噪声 > 信息,大模型更易 hallucinate。冷启动变热启动,调参不必反复算 embedding。:向量不稳,正式环境用智谱/千问 Embedding。,把「文本 → 向量 → 检索 → 生成」跑通。:模型、索引、向量库目录分清,相对/绝对。对多标签知识库非常友好,召回精度提升。—— 证据 + 相似度。看返回长度,验证链路。原创 2025-07-20 01:02:10 · 315 阅读 · 0 评论 -
RAG入门 Task02 正式上路搞定模型
利用openai-like或自定义llm/embedding类,封装大模型的调用流程,使其适配任意openai风格API。自定义OurLLM/OurEmbedding类可以做到:完全自控API参数与底层行为兼容所有需要llama_index风格接口的上层工具可后续扩展,便于调试和日志监控但自定义openai-like接口的方案。原创 2025-07-16 09:13:45 · 662 阅读 · 0 评论 -
RAG入门 Task01 手搓一个土的掉渣的RAG
datawhale AI 共学。原创 2025-07-16 00:50:19 · 919 阅读 · 0 评论
分享