【完全私有的AI知识库，ChatGLM3无GPU也能跑】Docker一键部署，oneapi快速嵌入AI应用

最新推荐文章于 2025-03-14 20:41:24 发布

AI大模型学习不迷路

最新推荐文章于 2025-03-14 20:41:24 发布

阅读量938

点赞数 26

文章标签：人工智能 docker oneapi 深度学习自然语言处理大模型知识库

本文链接：https://blog.youkuaiyun.com/Z4400840/article/details/144924769

版权

前言

在前面的文章中，介绍了关于私有AI知识库和部分应用，让AI能根据企业私有的知识库去回答问题，成为真正意义的数字分身。但有一个问题一直没有解决，就是底层模型依然是基于的ChatGPT、文心等公共大模型，虽然openai等企业声明数据隐私安全，但显然大多数企业无法接受依赖外部去保障数据安全，所以私有化部署大模型是必需要做的一步。

💡本文将介绍如何在本地windows环境快速部署清华开源大模型ChatGLM3，并详细介绍如何通过one-api，将glm3接入知识库应用FastGPT，实现企业知识库私有化部署的闭环。

本文大纲：

效果演示
开源大模型评测榜单
ChatGLM3、chatglm.cpp、One-API简介
基于Docker快速部署ChatGLM3
基于Docker快速部署One-API
如何借助One-API将ChatGLM3接入FastGPT等AI应用

效果演示

开源大模型评测

除了本文写的ChatGlm系列开源模型，目前市场主流的还有Qwen、Baichuan、Llama等，其中阿里的Qwen-72B-Chat 凭借720亿参数训练量目前名列开源大模型第一。当然，考虑因为使用个人笔记本进行推理，选择了10B以下的模型，chatglm3-6b在10B以下模型能力靠前。

完整榜单查看：https://github.com/jeinlee1991/chinese-llm-benchmark

ChatGLM3-6B

ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，ChatGLM3-6B 引入了更多强大特性。

官方地址：https://github.com/THUDM/ChatGLM3

chatglm.cpp

是对 ChatGLM3 进行推理加速的开源项目，使其能在windows上基于cpu推理

官方地址：https://github.com/li-plus/chatglm.cpp

One-API

通过标准的 OpenAI API 格式聚合所有的大模型，开箱即用。

官方地址：https://github.com/songquanpeng/one-api

部署步骤

环境说明

window：win10/11,不低于 8C16GDocker：https://www.cnblogs.com/Can-daydayup/p/15468591.html

基于Docker部署ChatGLM3

获取ChatGLM3镜像并运行容器（此处可以参考https://github.com/li-plus/chatglm.cpp 说明自行打包镜像或获取镜像，如需阿里云仓库打包好的镜像，可以后台回复glm3自动获取）：

# 在本地构建 docker 镜像并启动容器以在 CPU 上运行推理：# openai api serverdocker run -it --rm -v $PWD:/opt -p 8000:8000 -e MODEL=/opt/chatglm-ggml.bin chatglm.cpp \    uvicorn chatglm_cpp.openai_api:app --host 0.0.0.0 --port 8000
# To pull from Docker Hub and run demo:docker run -it --rm -v $PWD:/opt liplusx/chatglm.cpp:main \    ./build/bin/main -m /opt/chatglm-ggml.bin -p "你好"

# 启动阿里云仓库打包好的镜像
docker run --name chatglm3 -p 8000:8000 registry.cn-hangzhou.aliyuncs.com/xx/chatglm.cpp:x

基于Docker一键部署One_API

一行代码部署one-api

docker run --name oneapi -d --restart always -p 3000:3000 -e TZ=Asia/Shanghai -v /home/ubuntu/data/one-api:/data justsong/one-api

访问ip:3000 登录系统，初次登录用户名/密码：root/123456

借助One-API将ChatGLM3接入FastGPT

1. 在one-api中添加chatglm3渠道

类型：OpenAI。
名称：chatglm3
模型名称可以自定义：ChatGLM3
密钥随便填
代理地址填入 ChatGLM3-6B 的 API 地址，此处我填的本地地址（注意：本地调试不能填127.0.0.1，需要填写ipv4地址，可以通过ipconfig查看）

点击渠道测试，看到如下报错，说明部署配置成功了

2. 在one-api中新建令牌，作为调用凭证

点击复制获取调用凭证：sk-*****

3. 修改fastgpt配置，增加chatglm3模型

修改.env(本地代码启动修改：.env.local)

修改内容如下：

# oneapi 地址ONEAPI_URL=http://localhost:3000/v1/# oneapi 令牌keyCHAT_API_KEY=sk-aOrj73NZxGNLnVXDE0928d7cC35c4f39922bD0FeCd792c5b

修改config.json(本地代码启动修改：config.local.json)

主要增加内容如下

{  "SystemParams": {    "pluginBaseUrl": "",    "openapiPrefix": "openapi",    "vectorMaxProcess": 15,    "qaMaxProcess": 15,    "pgIvfflatProbe": 10  },  "ChatModels": [    {      "model": "ChatGLM3",      "name": "ChatGLM3",      "price": 0,      "maxToken": 4000,      "quoteMaxToken": 2000,      "maxTemperature": 1.2,      "censor": false,      "defaultSystemChatPrompt": ""    }  ]  "VectorModels": [    {      "model": "m3e",      "name": "M3E（测试使用）",      "price": 0.1,      "defaultToken": 500,      "maxToken": 1800    }  ]}

测试

实测推理过程cpu使用率80%左右，每秒输出2-3个字

写在后面

数据安全永远是企业应用的第一要义，对于AI应用来说也是如此。曾经已亿计的大模型训练成本对于普通企业而言遥不可及，但得益于开源，在当下开源大模型越来越丰富且强大的背景下，任何组织或个人都能低成本的部署强大的私有大模型，而这将真正促成AI应用的快速发展。
在大模型时代，我们如何有效的去学习大模型？

现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。
在这里插入图片描述

掌握大模型技术你还能拥有更多可能性：

• 成为一名全栈大模型工程师，包括Prompt，LangChain，LoRA等技术开发、运营、产品等方向全栈工程；

• 能够拥有模型二次训练和微调能力，带领大家完成智能对话、文生图等热门应用；

• 薪资上浮10%-20%，覆盖更多高薪岗位，这是一个高需求、高待遇的热门方向和领域；

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术，也_想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。为了让大家少走弯路，少碰壁，这里我直接把都打包整理好，希望能够真正帮助到大家_。

👉[优快云大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）]()👈

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。

在这里插入图片描述

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。