利用RAGflow和LM Studio建立食品法规问答系统

前言

食品企业在管理标准、法规,特别是食品原料、特殊食品法规时,难以通过速查法规得到准确的结果。随着AI技术的发展,互联网上出现很多AI知识库的解决方案。

经过一轮测试,找到问题抓手、打通业务底层逻辑、对齐行业颗粒度、沉淀方法论、打通业务壁垒、形成业务闭环、提升用户感知度、赋能AI新赛道。

作者测试了钉钉内置AI、Defy.AI、fastGPT、FoodGPT、通义法睿、RAGflow+LM Studio、AnythingLLM,优缺点如下:

AI优点缺点
钉钉内置AI零代码部署、免费一本正经地胡说八道、不保证数据安全。知识库占用云盘空间
Defy.AI在线版零代码部署,本地版安全可控在线版收费、不保证数据安全,本地部署难度高。一本正经地胡说八道
AnythingLLM零代码本地部署一本正经地胡说八道
fastGPT在线版零代码部署,本地版安全可控。在线版收费、不保证数据安全,本地部署难度高。本地、在线版都收费。
FoodGPT回答精准,针对食品行业优化收费,不能定制
通义法睿回答精准、详实不能定制
RAGflow+LM Studio本地低代码部署,回答较为精准。自由选择模型。可定制。性能不太好

收费模式:每个问题多少钱或按照embedding和提问小号的Token数收费。

硬件、环境要求

电脑至少需要4核CPU、16GB内存、50GB硬盘

需要魔法上网,或者自己配置Docker、Git、HuggingFace国内源

Windows 推荐使用企业版或服务器版

需要基础的读Windows和Linux代码能力,解决报错的能力

部署LM Studio

  1. 在lmstudio.ai 下载LM Studio,在ModelScope或Huggingface下载大语言模型文件(文件格式必须是.gguf)
  2. 将模型导入至LM Studio后创建LocalSever,记住端口号

部署RAGflow

按照GitHub infiniflow/ragflow的步骤部署即可,注意软件不要放在C盘!注意软件不要放在C盘!注意软件不要放在C盘!

浏览器输入网址http://localhost/login,先注册账号

配置好Model Providers,Base url填写http://host.docker.internal:[LM Studio端口号]/v1/models

切换到Knowledge Base,上传文件即可,支持word、excel、pdf、txt、图片等格式;可以选择文件类型,如图书、文献、法律等;模型不要改

上传后要在Action列中点绿色开始键,开始embedding,完成后才算完成知识库导入

切换到Chat标签页,点击Create an Assisstant

Knowledgebase选中导入的知识库,切换到Model Setting中Model选择模型,Freedom选择Precise

大功告成!可以提几个问题测试模型是否正常运行

运行

与ChatGPT一样,可以直接向AI提问,见下图

img

总体效果挺好,回答基本不会胡说八道,并给出了出处。

优缺点

优点:

  1. 配置简单。

    1. 众所周知,N卡普遍显存很小,但是A卡配置ROCm很麻烦。LM Studio可以一键部署CUDA或ROCm,免除复杂的环境配置。
    2. RAGflow运行在Docker,直接免除用户配置anaconda、python、pytorch等软件。
  2. 很好地减轻了AI一本正经的胡说八道的问题。

  3. RAG Flow支持手动微调Embedding分块。

  4. 完全本地运行,数据安全可控。

缺点

  1. 既吃CPU+内存,又吃GPU+显存,需要配置很高的主机。
  2. 如果需要在企业部署还要配置域名解析,对RAGflow做二次开发,甚至要做显卡阵列。
  3. RAGflow不支持原生调用显卡加速,embedding非常耗时。
  4. RAGflow性能不太好,与在线托管的AI知识库相比响应速度有明显差距,对数据安全不敏感的,不建议使用RAGflow。

其他用法

除了做法规数据库,可以导入各类工作文件,比如公司规章制度、工作流程,沉淀的工作资料,收集的市场报告、文献、专利等。

使用数学模型甚至可能可以做数据处理和统计分析。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

### RAGFlowLM Studio连接方法 为了实现RAGFlowLM Studio之间的有效集成,需理解两者的工作原理及其交互方式。GraphRAG是一种用于增强检索生成任务的方法,在实际应用中可以显著提升基于文档查询的质量[^1]。 #### 安装配置环境准备 确保已成功安装并配置好LM Studio,这涉及从官方站点下载适合计算机系统的版本,并完成初步设置过程[^2]。 #### API接口对接 对于想要把RAGFlowLM Studio相连的情况来说,关键是通过API来调用后者所提供的服务功能。具体而言: - **获取API密钥**:登录到LM Studio平台后,按照指引创建项目并取得相应的API Key。 - **构建请求结构**:依据所使用的编程语言编写客户端代码片段,向LM Studio发送HTTP POST请求。下面给出Python示例代码: ```python import requests url = 'http://localhost:8080/api/v1/generate' headers = {'Content-Type': 'application/json'} data = { "prompt": "your input here", "max_tokens": 50, } response = requests.post(url, headers=headers, json=data).json() print(response['choices'][0]['text']) ``` 此段脚本展示了怎样利用POST方法传递参数给服务器端处理,并接收返回的结果字符串。 #### 数据流管理 当涉及到复杂的对话逻辑或者多轮次交流场景下,则可能还需要考虑更高级别的数据交换机制,比如WebSocket长链接保持实时通讯状态;不过对于简单的问答型任务而言上述方案已经足够满足需求了。 #### 测试验证效果 最后一步就是反复测试整个链路是否顺畅无阻,调整优化直至达到预期性能指标为止。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值