deepseek满血版加载测试


前言

关于满血版网上一找,有很多类似这种表格,但没看家有实际操作去验证,下面就用2种常用的本地大模型加载方法进行验证。
在这里插入图片描述

一、huggingface加载

1. 下模

模型来源,魔塔社区,下完后大小642G。
在这里插入图片描述

2. 小模测试

先给个deepseek蒸馏版的,qwen当学生,deepseek当老师的1.b模型,确保调用畅通。
在这里插入图片描述
调用非常迅速,秒出结果,说明环境配置上都没问题。

3. 大模来了

在这里插入图片描述
可能模型太大,不像那个小模加载出结果一气呵成。
经过长时间等待,没给来惊喜,也谈不上以外。
在这里插入图片描述
中途有查看显存占用情况,8张H100都在95%左右,可能某个点突然爆掉了。
在这里插入图片描述
经过多方咨询,普遍认为都是显存不够引起的。
切换第二种方案。

二、vllm加载

1. 包的安装

之所以vllm加载本地模型没有huggingface受欢迎,1个就是vllm挑剔,只支持cuda 11.8和12.1. 第二个就是安装包太多,不像前一个llama_index全搞定。

pip install torch torchvision transformers huggingface-hub sentencepiece jinja2 pydantic timm tiktoken accelerate sentence_transformers gradio openai einops pillow sse-starlette bitsandbytes modelscope vllm -i https://pypi.tuna.tsinghua.edu.cn/simple

装包的时候会有各种冲突,就慢慢解吧,顺利的话也许一把就好了。

WARNING: Ignoring invalid distribution ~riton (/home/defaultuser/anaconda3/lib/python3.12/site-packages)
WARNING: Ignoring invalid distribution ~orch (/home/defaultuser/anaconda3/lib/python3.12/site-packages)
Installing collected packages: triton, opencv-python, torch
WARNING: Ignoring invalid distribution ~riton (/home/defaultuser/anaconda3/lib/python3.12/site-packages)
WARNING: Ignoring invalid distribution ~riton (/home/defaultuser/anaconda3/lib/python3.12/site-packages)
ERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
vllm 0.7.3 requires torch==2.5.1, but you have torch 2.6.0 which is incompatible.
torchaudio 2.5.1 requires torch==2.5.1, but you have torch 2.6.0 which is incompatible.
torchvision 0.20.1 requires torch==2.5.1, but you have torch 2.6.0 which is incompatible.
xformers 0.0.28.post3 requires torch==2.5.1, but you have torch 2.6.0 which is incompatible.
Successfully installed opencv-python-4.11.0.86 torch-2.6.0 triton

解决方法

pip uninstall torch torchvision torchaudio
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1

2. 小模测试

先在一个没有gpu的机器测试

 ERROR 02-21 23:45:47 engine
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值