自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 【多模态RAG-初版-“文搜图”&“图搜文”】

本文介绍了一个基于Milvus、DashScope和OpenRouter构建的多模态检索与生成系统。该系统实现了跨模态统一语义检索与生成闭环,支持"文搜图"、"图搜文"等场景。核心功能包括:将文本、图像等异构数据映射到1024维向量空间;支持多种跨模态检索方式;利用Qwen-VL大模型生成自然语言回答。系统采用模块化设计,包含入库、查询和生成三个阶段,适用于智能客服、图文知识库等场景。文章详细介绍了技术栈组成、系统架构和数据处理流程,展示了多模态RAG系统的可行性

2025-10-14 14:59:46 1068

原创 【milvus上手-提前知道】

当你启用 enable_dynamic_field=True 后,所有不在 schema 中定义的字段,在插入时会被 Milvus 自动打包进一个隐藏的 JSON 字段 $meta 中查询时,必须显式请求 "$meta"才能看到这些动态字段的内容。

2025-10-09 08:56:27 970

原创 【Milvus部署&架构&简单示例】

Milvus 通过 collection 组织数据,vchannel 分流写入,flowgraph 处理流水线,node 执行任务,schema 定义结构,index_type + metric_type 控制索引和查询精度,最终实现海量向量数据的高性能相似性搜索。Milvus 是一个为 AI 设计的分布式向量数据库,通过“协调器 + 代理 + 工作节点 + 消息队列 + 对象存储”的架构,实现海量向量数据的高速写入、索引构建和相似性搜索。💡 类比:就像硬盘,所有数据最终都存在这里,即使服务重启也不会丢。

2025-10-09 08:38:27 797

原创 【python - 代码框架 - 常用知识点】

json.loads() —— JSON 字符串【str】 → Python 对象【dict】父类定义:“通用流程框架和规范”,子类填充: “具体实现行为”。() 复用共性,通过重写方法实现个性——父类搭台,子类唱戏。子类通过重写,在父类授权的框架内,自主实现岗位专属行为。这个指的是要继承父类的功能,姓名,ID,但不是子类特有。💻 [小李] 上班第一件事,打开电脑,准备开始工作…💻 [小李] 上班第一件事,打开电脑,准备开始工作…💻 [小王] 上班第一件事,打开电脑,准备开始工作…

2025-10-08 10:52:49 587

原创 【高级-RAG-优化方法】

本文介绍了两种优化RAG(检索增强生成)系统的高级方法。第一部分介绍KnowFlow项目,它采用父子分块技术,将文档分为父分块(800-1500字符)和子分块(200-400字符),通过精确匹配子分块再返回父分块内容来保证搜索精确性和上下文完整性。第二部分探讨Milvus的多种增强技术,包括查询增强(如假设问题生成、回溯提示)、索引增强(自动合并块、分层索引)、检索器增强(句子窗口检索、元数据过滤)、生成器增强(提示压缩、块排序)以及管道增强(自我反省、代理查询路由)。这些方法共同提升了RAG系统的检索效率

2025-10-08 10:00:09 765

原创 【上下文工程 - RAG - 记忆系统 - 上下文管理 】

摘要: 本文系统探讨了RAG(检索增强生成)技术的原理、优化实践及挑战,提出了从提示词工程到上下文工程的范式升级。文章首先分析了优秀提示词设计的核心原则,进而阐释了上下文工程在动态知识供给、记忆系统管理和工具扩展方面的关键作用。针对RAG技术面临的检索精度、知识完整性及多跳推理等挑战,详细介绍了索引构建的分块策略(如小块检索-大块生成、元数据标注)和检索优化方法(如查询改写、HyDE技术)。通过层次化索引和多模态处理策略,有效提升了复杂文档的检索效率。该研究为构建高效、智能的RAG系统提供了系统化的工程实践

2025-10-08 09:30:00 1087

原创 【RAG_初版_调用模型&RAG—pipeline】

RAG-问题向量化-向量检索-重排-模型加工

2025-10-07 17:57:28 387

原创 【RAG_初版_向量库检索和重排序 】

RAG- 文档解析-分块-向量化入库-向量检索-重排序

2025-10-07 17:52:29 263

原创 【RAG_初版_milvus向量入库】

RAG—文档解析——切片——入milvus向量库

2025-10-05 22:58:29 304

原创 【RAG_初版_文本解析&分片】

RAG_文本解析_文本切片

2025-10-05 22:30:13 386

原创 【RAG_初版_embedding&rerank 模型下载调用】

RAG过程,embedding模型下载方法、调用测试rerank模型下载方法

2025-10-05 21:34:50 314

原创 身份证信息提取系统

🖥️ 用户输入 → 🤖 AI 解析 → ✏️ 人工编辑 → 💾 数据库存储 → 🎉 成功反馈 本系统通过 Streamlit 前端 + FastAPI 后端 + LLM AI 解析 + MySQL 存储,实现了身份证信息从“非结构化文本”到“结构化数据库记录”的完整自动化处理流程,具备高可用性、易扩展性和良好用户体验。

2025-09-06 22:57:27 624 1

身份证信息提取系统前端展示页面

身份证信息提取系统前端展示页面

2025-09-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除