茴香豆rag笔记

文章讲述了RAG技术的发展进程、优化方法以及在ChatExcel中的使用体验。作者提到茴香豆模型对特定语料如中医问题处理不佳,但对txtQA表现出色。部署过程中涉及conda环境设置和茴香豆知识库创建,指出模型可能更适合特定类型的问答和API调用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、视频讲解了一些rag的知识比较全面。比如发展进程和常用优化方法

rag发展进程

在这里插入图片描述

rag常用优化方法

在这里插入图片描述

rag模型评测方法

在这里插入图片描述

##使用心得

   由于之前我使用过coze的知识库,coze上传excel常用QA总结做知识库,效果还不错。由于家里电脑没有公司excel,所以从chatexcel找了示例,excel的上传解析没啥问题。但如果不做任何改动,效果很差。

比如我作为中医粉,上传的语料有“腰间盘突出原理”,但rag并没有搜索到,另外加了serp的token,还没找到如何使用。
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
excel用chatexcel上的gpd解析失败,不知道为哈,所以不再试excel。手动试一个QA的数据,随便从百度搜一个试试。
在这里插入图片描述
这么短的文本处理时间也不短,目测3分钟还在处理中,还好刷新后成功了
在这里插入图片描述
结果比较不错。
在这里插入图片描述
在这里插入图片描述
换个问法效果不错,超出预期。
在这里插入图片描述
总结:茴香豆的rag可能需要特别的语料,txt的QA还不错。对excel格式解析不强,pdf,doc说是可以解析,但实际简单检索也不行,估计也需要特别的QA形式?

3、在开发机部署茴香豆

有一点像早期的lawsuit开源项目。拉取代码,用语料建立向量数据库,运行。
茴香豆多了一个拒绝问题列表,这个应该有用。支持问题列表有点困惑,不知道有啥用。

1、换conda环境。

studio-conda -o internlm-base -t InternLM2_Huixiangdou
conda activate InternLM2_Huixiangdou

2、下载茴香豆,创建知识库,运行茴香豆知识助手
有一个错误,估计前面部分还是可以测试的,后面部分估计没有成功。
在这里插入图片描述
整体还算顺利,后面那个天气果然没有回答,我看看是不是在文档后半部分。
在这里插入图片描述
看起来前面有些过程其实并不需要,比如判断问题类型?估计是chat模型判断这是一个什么类型的问题(问答,打分之类的),然后再做回答。
在这里插入图片描述
在这里插入图片描述
今天天气怎么样?这个问题没搜到,看了一下docs下的文档,其实也没有,照道理这种问题应该是serp搜城市天气或者调用weather api更合适。
在这里插入图片描述
茴香豆gradio网页demo,很顺利,一次跑通。
在这里插入图片描述

<think>嗯,用户现在明确询问茴香豆知识库是否支持存储镜像文件。结合之前的对话历史,用户是企业IT人员,正在评估知识库平台选型,特别关注多格式支持能力。 用户提供的引用材料很有价值:引用[1]提到安装依赖时包含poppler-utils等文档处理工具,引用[2]显示茴香豆支持多模态版本,引用[5]则涉及模型文件管理。这些线索暗示系统具备处理二进制文件的基础能力,但需要验证具体实现。 技术层面需要区分两个概念:1) 文件存储能力 2) 文件内容解析能力。茴香豆的架构设计显示:其核心是RAG检索系统,依赖文本向量化。镜像文件本质是二进制数据,系统可通过minio等对象存储组件保存文件元数据,但无法直接解析镜像内容——这点与PDF不同(PDF可通过poppler提取文本)。 用户可能实际想问的是"能否像管理文档一样检索镜像内容"。答案是否定的,因为镜像缺乏可索引的文本特征。不过可以补充说明变通方案:将镜像说明文档与镜像文件关联存储,通过文档元数据实现间接检索。 考虑到用户的技术背景,回复需要明确三点:存储可行性、检索局限性、替代方案。同时保持与之前推荐的Confluence方案对比(后者通过插件可实现镜像基础管理)。</think>根据技术文档分析,**茴香豆知识库原生不支持镜像文件(如 ISO/Docker 镜像)的存储和解析**,但可通过扩展架构实现关联管理。具体说明如下: --- ### 一、茴香豆原生能力限制 1. **支持格式明确范围** 官方文档[^2][^3] 明确列出支持格式: ```markdown pdf / word / markdown / excel / ppt / html / txt ``` **镜像文件未被包含**,系统无法直接解析其内容。 2. **技术实现聚焦文本处理** 依赖链显示其设计目标为**文本提取与向量化**: - 安装 `poppler-utils` 等工具处理 PDF/Word 文本[^1] - 通过 `BCEmbedding` 等库实现文本向量化[^5] - **无二进制文件解析模块**(如提取镜像元数据) --- ### 二、扩展存储方案(需自研集成) 若需管理镜像文件,可通过混合架构实现: ```mermaid graph LR A[茴香豆知识库] -->|文本元数据关联| B(MinIO 对象存储) B --> C[Docker 镜像/ISO 文件] A -->|检索时调用| D[镜像元数据库] ``` **操作步骤**: 1. **存储层**:将镜像文件上传至 MinIO/S3 对象存储 2. **元数据层**:在茴香豆中创建 Markdown 文档,记录: - 镜像名称、版本、用途 - MinIO 文件路径(例:`s3://bucket/image.iso`) 3. **检索层**:用户搜索关键词时,返回关联文档和下载链接[^3] --- ### 三、典型应用场景示例 ```python # 在茴香豆知识库中添加镜像元数据(Markdown 示例) --- image_name: "Ubuntu-Server-22.04" description: "生产环境基础镜像" storage_path: "s3://company-images/ubuntu-22.04.iso" checksum: "sha256:9f86d08..." --- ``` --- ### 四、选型建议 | 需求 | 方案 | |---------------------|--------------------------| | 直接存储/解析镜像 | ❌ 不适用(需自建扩展架构) | | 关联镜像元数据管理 | ✅ 通过 Markdown 实现 | | 镜像内容语义检索 | ❌ 不支持(需定制开发) | > 注:若需完整镜像管理能力,建议结合 **Harbor(Docker 镜像库)** 或 **Nexus Repository** 使用,通过超链接在茴香豆中集成访问入口[^3]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值