下载 GGUF二进制文件
打开Qwen2-7B-Instruct-GGUF模型文件列表(https://modelscope.cn/models/qwen/Qwen2-7B-Instruct-GGUF/files),我们选择qwen2-7b-instruct-q5_k_m.gguf并下载:
启动Qwen2-7B-Instruct大模型
GGUF模型量化文件下载完成后,我们就可以来运行Qwen2-7B大模型了。
在启动Qwen2-7B大模型之前,我们首先需要安装Python依赖包列表:
pip install llama-cpp-python
pip install openai
pip install uvicorn
pip install starlette
pip install fastapi
pip install sse_starlette
pip install starlette_context
pip install pydantic_settings
然后打开一个Terminal终端窗口,切换到GGUF模型文件目录,启动Qwen2-7B大模型(./qwen2-7b-instruct-q5_k_m.gguf即为上一步下载的模型文件路径):
模型启动

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



