实战AI快速开发微信智能客服系统(四)- 系统架构

在上一篇,我们已经写出了产品需求文档PRD,里面其实已经有一些架构方面的考虑了。但是真正在让AI帮我们编程之前,我们还需要把架构梳理一遍。与一般的网站,小程序,小游戏不同,我们这样的系统很大程度上依赖第三方的API和库,第三方的API和库的选择,可以说很大程度上决定了系统的成败,因为那些底层的能力是我们自己编程所不能解决的,或者说如果需要我们自己大量编程的话,从成本和效率上来讲,对于我们很不合算。

从需求来看,我们主要要用到下面的几大API和库:

1. 微信信息发送的API

2. 能实现RAG的库

微信信息发送的API是一个敏感的话题,腾讯只开放了企业微信的API和公众号的API,没有公开的API来实现普通微信信息的提取和发送。Github上一些开源的项目很多都是通过反向工程微信的通讯协议,模拟微信客户端来收发微信信息,这些项目大多有封号的风险,或者是要付费的。我之前有一篇文章仔细讨论过这个问题。

微信自动发聊天信息接口研究-优快云博客

从安全角度来说,wxauto比较好,因为它本身不涉及对微信协议的反向工程。它有点像现在的AI大模型操作计算机,通过程序来操纵微信桌面客户端。还有一个项目是操纵网页版微信客户端,但是因为有很多微信账号是没法登录微信网页版的,所以也没法用。

智能客服里最关键的要数知识库的构建了。如果要想让机器人能专业的回答问题,需要把专业的知识和一些聊天的应答技巧等放到知识库里,然后在回答问题的时候从知识库中找到相应知识,再交给大模型来回答。这里用到的关键技术就是Retrieval-Augmented Generation(检索增强生成)技术。这种技术结合了信息检索和文本生成的能力,旨在提高生成模型回答问题的准确性、相关性和事实性。

在这个领域也已经有很多的开源项目了。我通过下面的提示词在Deepseek里搜索一下,就能搜索到很多:

我想做一个智能客服系统,里面涉及到知识问答,商家把一些产品介绍等知识文档上传,然后客户有问题的话,可以从知识库里找到相应知识,由大模型来回答。请帮忙查一下有哪些可以用的开源项目能实现这个需求。

在Claude上得到的回答如下:

我来帮您搜索一下目前可用的开源智能客服和知识问答系统项目。基于我的搜索结果,为您推荐以下几个优秀的开源项目来实现智能客服系统的需求:

推荐的开源项目

1. Dify (强烈推荐)

Dify 是一款开源的大语言模型(LLM) 应用开发平台,融合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。

主要特点:

  • 支持RAG检索增强生成
  • 内置知识库管理功能
  • 可视化应用构建界面
  • 支持创建带有业务数据的官网 AI 智能客服
  • 支持多种集成方式(微信、钉钉、Telegram等)

2. MaxKB

MaxKB 是一款强大易用的企业级 AI 助手,支持 RAG 检索增强生成、工作流编排、MCP 工具调用能力,广泛应用于智能客服、企业内部知识库问答、员工业务助手、学术研究与教育等场景。

主要特点:

  • 专门针对企业级应用
  • 内置智能客服功能
  • 支持RAG技术
  • 易于部署和使用

3. 基于阿里云OpenSearch的RAG方案

针对知识库在线问答场景,AI搜索开放平台提供完整的RAG开发链路搭建方法,整体链路包含数据预处理、检索服务以及问答总结生成三大模块。

技术架构建议

根据搜索结果,您的智能客服系统应该采用RAG(检索增强生成)技术架构

  1. 文档预处理模块:处理上传的产品介绍文档
  2. 向量化存储:将文档内容转换为向量存储在知识库中
  3. 检索模块:根据用户问题检索相关知识
  4. 生成模块:基于检索到的知识生成回答

实施建议

  1. 快速原型:推荐首先尝试Dify,因为它提供了完整的可视化界面,可以快速搭建原型系统
  2. 企业级部署:如果需要更强的定制性,可以考虑MaxKB
  3. 自研方案:如果团队有较强的开发能力,可以参考阿里云的RAG方案自行开发

这些开源项目都能很好地满足您描述的需求:商家上传产品文档→建立知识库→客户提问→智能检索→生成回答的完整流程。

对于我而言,我希望实现一个轻量级的这样的客服系统,在配置比较低的机器上就能运行的,所以我再问了一下:

请再搜索一下,哪些项目比较轻量级,在配置比较低的笔记本上也能运行的

我来搜索一下轻量级的开源智能客服项目,特别适合在配置较低的笔记本上运行。基于搜索结果,我为您推荐以下几个轻量级的开源项目,特别适合在配置较低的笔记本上运行:

推荐的轻量级开源项目

1. AnythingLLM + Ollama (强烈推荐)

这是目前最受欢迎的轻量级本地部署方案:

AnythingLLM特点:

  • AnythingLLM是高效、可定制、开源的企业级文档聊天机器人解决方案。它能够将任何文档、资源或内容片段转化为大语言模型(LLM)在聊天中可以利用的相关上下文
  • 支持 Markdown、PDF、Word 等多种常见格式,提供直观的界面,用于查看文档、进行索引、发起问答,减少命令行操作
  • 内置向量数据库,无需额外配置
  • 提供桌面版本,易于安装使用

Ollama特点:

  • ollama支持的模型都可以,比如llama,qwen以及最近大火的deepseek
  • 极其轻量,占用资源少
  • 支持多种小型语言模型

2. RAG-GPT + Ollama

使用RAG-GPT和Ollama搭建智能客服,有些场景,用户可能无法通过往外网访问OpenAI等云端LLM服务,或者由于数据隐私等安全问题,需要本地部署大模型。

优势:

  • 完全本地部署,数据隐私有保障
  • 支持多种文档格式
  • 可快速搭建智能客服系统

3. MiniRAG (超轻量级)

香港大学的研究团队发布了其最新作品——MiniRAG,这是一款面对小型语言模型(SLMs)的轻量级检索增强生成(RAG)系统。该系统的推出不仅突破了传统RAG对大型语言模型的依赖,还为边缘设备的智能应用铺平了道路。

特点:

  • 专门为小型语言模型优化
  • 资源占用极少
  • 适合边缘设备运行

4. 微语(WeiYu)

微语是基于大模型 LLM && RAG 的智能客服,更适合团队使用,一人配置,多人使用。完美权限控制,即可私用,也可公用。

配置要求对比

项目最低内存存储空间CPU要求特点
AnythingLLM + Ollama4GB5-10GB普通双核最易用,界面友好
RAG-GPT + Ollama4GB3-8GB普通双核轻量,可定制性强
MiniRAG2GB2-5GB单核即可超轻量,专为SLM设计

快速部署建议

  1. 最简单方案: 直接使用 AnythingLLM 桌面版 + Ollama

    • 打开官网地址:https://anythingllm.com/desktop,根据自己的系统选择下载的版本
    • 安装后可选择DeepSeek等轻量模型
  2. Docker部署: 在Docker上部署Ollama+AnythingLLM完成本地LLM Agent部署

    • 更稳定,易于管理
    • 需要注意Docker内存限制设置
  3. 资源优化:

    • 可以选择3B-7B参数的小模型(如DeepSeek-Coder-1.3B、Qwen2-1.5B等)
    • 启用量化模型以减少内存占用

这些方案都能在8GB内存的笔记本上良好运行,其中AnythingLLM + Ollama组合是目前最受欢迎且最易上手的选择。

 我再在ChatGPT上问了一下:

为了在配置较低的笔记本上搭建一个轻量级的智能客服系统,以下是几款适合的开源项目推荐,支持知识问答、文档上传和私有化部署:

✅ 推荐的开源智能客服系统

1. ChatWiki

  • 简介:由芝麻小客服官方推出的开源智能客服系统,基于大语言模型(LLM)和检索增强生成(RAG)技术,支持私有化部署。(ahhhhfs.com)

  • 特点

    • 支持多种文档格式(如 DOCX、PDF、Excel 等)上传,自动处理并构建知识库。

    • 支持多种大语言模型(如 OpenAI、Claude、通义千问、文心一言等)。

    • 前端使用 Vue.js,后端使用 Golang 和 Python,数据库使用 PostgreSQL,缓存使用 Redis,支持 Docker 部署。

    • 提供默认管理界面,支持模型配置、知识库管理等功能。(github.com)

  • 适用场景:适用于需要快速搭建知识库问答系统的企业,支持私有化部署,适合中小型企业使用。(github.com)

2. MaxKB4j

  • 简介:基于 Java 开发的开源知识库问答系统,支持 RAG 技术,适用于智能客服和企业内部知识库。(toutiao.com)

  • 特点

    • 支持文档上传、自动拆分、向量化和 RAG,减少模型幻觉,提高问答准确性。

    • 支持多种大语言模型,包括本地私有模型(如 DeekSeek R1、Llama 3 等)和公共模型(如 OpenAI、Claude、通义千问等)。

    • 提供强大的工作流引擎和函数库,支持复杂业务场景。

    • 支持零编码快速嵌入到第三方业务系统。(toutiao.com)

  • 适用场景:适用于 Java 开发环境的企业,特别是有 Java 技术栈的团队。

3. cskefu(春松客服)

  • 简介:由 Chatopera 提供的开源智能客服系统,支持多渠道接入(如微信、淘宝、抖店等),适用于电商和多平台客服场景。(gitee.com)

  • 特点

    • 提供坐席工作台、机器人客服、质检、报表等功能。

    • 支持 Chatopera 云服务,利用强大的聊天机器人解决方案,提升客户服务工作中的自动化、智能化。

    • 支持私有部署,提供容器化一键部署方案。(gitee.com)

  • 适用场景:适用于需要多渠道客服接入的电商平台或多平台运营的企业。

🖥️ 硬件要求建议

以下是针对上述系统的最低硬件配置建议:

系统名称CPU内存存储备注
ChatWikiIntel i5 / AMD Ryzen 58GB100GB推荐使用 Docker 部署,支持低配置运行
MaxKB4jIntel i5 / AMD Ryzen 58GB100GBJava 项目,适合低配置环境
cskefuIntel i5 / AMD Ryzen 58GB100GB支持多渠道接入,适合电商场景

上述配置适用于开发和测试环境,生产环境建议根据实际业务量适当提升配置。

🧪 部署建议

  • 操作系统:建议使用 Ubuntu 20.04 或更高版本,兼容性好,社区支持广泛。

  • 数据库:PostgreSQL 是推荐的数据库,支持向量化存储,适合知识库管理。

  • 部署方式:Docker 部署可以简化环境配置,推荐使用 Docker Compose 进行一键部署。

  • 模型选择:根据硬件性能选择合适的模型,本地部署轻量级模型(如 Llama 2、DeekSeek R1)可以减少资源消耗。(toutiao.com)

如果您需要进一步的部署指导或模型选择建议,请提供您的硬件配置和具体需求,我可以为您提供更详细的帮助。

真是不问不知道啊!原来已经有这么多现成的系统了。我相信如果再仔细搜索的话,我们可以发现更多。我的想法是千万不要重复的去造轮子 ,只有站在巨人的肩膀上,我们才能事半功倍!下一步我将对所有找到的问答系统库做分析,找出合适的一个,然后基于它来开发。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值