第四十三篇-Ollama-TeslaP40-Qwen2.5-Coder-32B速度

环境

系统:CentOS-7
CPU: 14C28T
内存:32G
显卡:Tesla P40 24G
驱动: 515
CUDA: 11.7
cuDNN: 8.9.2.26
Ollama: 0.4.1

下载

ollama run qwen2.5-coder:32b
10G文件需要下一点时间

运行监控速度

ollama run qwen2.5-coder:32b --verbose
CPU 
    100% 高 28T
内存
    2G+
GPU
  | N/A   34C    P0             167W / 250W |  21446MiB / 23040MiB |     96%      Default |
  GPU进行计算
速度指标
	total duration:       2m30.314195167s
	load duration:        47.770638ms
	prompt eval count:    1168 token(s)
	prompt eval duration: 388ms
	prompt eval rate:     3010.31 tokens/s
	eval count:           1241 token(s)
	eval duration:        2m29.776s
	eval rate:            8.29 tokens/s

速度还是很不错的

总结

Tesla-P40下Qwen2.5-Coder-32B还是可以用用的,目前看Qwen2.5-Coder-32B性能还要再试试。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值