闻达语言模型调用平台部署文档

原创

于 2025-05-16 16:38:48 发布 · 4.5k 阅读

·

13

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#语言模型 #人工智能 #自然语言处理

1. 闻达语言模型平台介绍

闻达模型具体介绍参阅官方github地址：

闻达github地址：https://github.com/wenda-LLM/wenda

2. 环境准备

基于chatGLM-6B、text2vec-large-chinese两种模型部署闻达平台，并实现本地知识库搭建。

2.1. 依赖环境准备

硬件：显存大于6g以上的显卡，chatGLM-6B在量化等级为INT4，最小可以在6g显存上运行

软件：

操作系统centos7.9
python 3.9.16版本（安装文档，运维提供）
pip包管理工具（安装文档，运维提供）
git（安装文档，运维提供）
显卡驱动，cuda安装包会包含显卡驱动，也可以手动安装，版本需要到官网上查（下载 NVIDIA 官方驱动 | NVIDIA）
cuda，11.8版本（CUDA Toolkit Archive | NVIDIA Developer）（安装文档，运维提供）
需要安装anaconda3

http://www.taodudu.cc/news/show-3892930.html?action=onClick

pytorch，版本需要cuda配套(Previous PyTorch Versions，该页面是官方pythorch和cuda版本对应的下载地址，根据该页面安装)（安装文档，运维提供）
一定要下载这个版本不然不能用CUDA进行加速计算（深坑）

pip install torch==2.0.0+cu118 torchvision==0.15.1+

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。