从零用Langchain RAG部署自己的GLM4大模型

yangtengze

已于 2024-11-06 19:00:11 修改

阅读量1.3k

点赞数 19

文章标签： langchain python

于 2024-10-11 18:59:52 首次发布

本文链接：https://blog.youkuaiyun.com/yangtengze/article/details/142860534

版权

我的配置（linux）

这里是在阿里云的DSW交互式建模的示例。

下载anaconda

apt-get update

apt-get install libgl1-mesa-glx libegl1-mesa libxrandr2 libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6

wget https://mirrors.ustc.edu.cn/anaconda/archive/Anaconda3-2024.06-1-Linux-x86_64.sh

bash Anaconda3-2024.02-1-Linux-x86_64.sh

随后是一群协议，一直按enter键就好了

然后让输入yes/no

输yes

后面的直接enter

source ~/.bashrc

然后重启terminal

配置anaconda镜像

查看当前库

conda config --show channels

删除原库

conda config --remove channels defaults

配置清华镜像库

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

创建新的conda虚拟环境命令(后面有创建这里就看)

conda create -n <虚拟环境名称> python=<py大版本，如3.10或3.9>

这里要输入y

conda activate <虚拟环境名称>

看一下新的python环境里的包

pip list

Lanchain-Chatchat依赖配置

Git clone https://github.com/chatchat-space/Langchain-Chatchat

Langchain-chatchat0.3版本功能:

创建conda虚拟环境

不用anaconda环境的要先具备python环境

python -m venv <虚拟环境名称>

这时会生成一个文件夹，文件夹名称就是<虚拟环境名称>，这里假设<虚拟环境名称>为venv

./venv/bin/activate

若没权限就

source ./venv/bin/activate

测试

pip list

接下来就是创两个虚拟环境（Langchain环境、Xinference环境）

后面就大差不差了。

注意建两个环境，并且要在两个命令行启动

Langchain环境

conda create -n langchain python=3.10

conda activate langchain

pip install langchain-chatchat -U

Xinference环境

conda activate xinference

conda activate xinference

pip install "xinference[all]"

启动xinference

xinference-local --host 0.0.0.0 --port 9997

注意ctrl+左键点击http://0.0.0.0:9997

Xinference使用

启动GLM4

进入http://0.0.0.0:9997页面

这是在xinference终端看到

就表示部署成功了。（如果这里不显示，终端显示一致，就刷新就好了，虽说他说不要刷新）

启动bge-large-zh-v1.5

这是看到终端有以下显示就部署成功了

xinference是这么显示的

测试GLM4

点击后跳转页面。

上面都没错误就成功了，接下来配置Langchain-chatchat的环境配置

langchain-Chatchat环境配置

注意先启动xinference和模型。

切换到Langchain环境

chatchat init

修改model settings.yaml文件

chatchat kb -r

显示如下就没问题了。

chatchat start -a

点开http://0.0.0.0:8501，最好ctrl 并点一下，没报错就好了。

启动后直接点击RAG对话进行提问就行了。

使用Langchain的API Server工具以备后续其他程序调用这里是python调用

测试API Server

进入http://0.0.0.0:7861，最好ctrl 并点一下

点击post方法的与知识库对话

然后点击execute执行就是测试了。

运用API Server 这里用python

api.py 文件（注意只取api.py文件)

git clone https://github.com/yangtengze/Langchain-RAG-GLM4.git

（小插曲）这是文件内容，也感谢大家访问我的GitHub: https://github.com/yangtengze

Langchain-RAG-GLM4/api.py at master · yangtengze/Langchain-RAG-GLM4 (github.com)https://github.com/yangtengze/Langchain-RAG-GLM4/blob/master/api.py

在Langchain环境下运行api.py 就可以用了。

streamlit run api.py

当然也可以其他方式调用。（如js、等等，这里是示例而已，后续也会更新）

这里再展示下效果：