环境配置
| 类别 | 详情 |
|---|---|
| CUDA | 12.4 |
| Python | 3.10 |
| 操作系统 | Ubuntu 22.04 |
| ktransformers | 0.2.2rc2 |
硬件配置
| 组件 | 型号/规格 |
|---|---|
| CPU | Intel Xeon E5-2686 v4 |
| 主板 | 劲鲨 X99 D8i |
| 内存 | 256GB |
| 显卡 | NVIDIA RTX 3080M(16GB 显存) |
运行结果
- 推理速度: 6.1 tokens/s 这套价格不到5千,速度流畅,性价比极高,搭配unsloth动态量化Q2.51效果很好,质量损失很少,对比官网效果都很不错。
步骤 1:环境准备
-
安装系统依赖
1.1 配置镜像源
#更新镜像源 sudo vim /etc/apt/sources.list #写入镜像地址 deb http://mirrors.aliyun.com/ubuntu/ jammy main restricted universe multiverse deb-src http://mirrors.aliyun.com/ubuntu/ jammy main restricted universe multiverse deb http://mirrors.
DeepSeek671B使用Ktransformers部署教程

最低0.47元/天 解锁文章
2448

被折叠的 条评论
为什么被折叠?



