DeepSeek671B使用Ktransformers 部署教程

DeepSeek671B使用Ktransformers部署教程

环境配置

类别 详情
CUDA 12.4
Python 3.10
操作系统 Ubuntu 22.04
ktransformers 0.2.2rc2

硬件配置

组件 型号/规格
CPU Intel Xeon E5-2686 v4
主板 劲鲨 X99 D8i
内存 256GB
显卡 NVIDIA RTX 3080M(16GB 显存)

运行结果

  • 推理速度: 6.1 tokens/s 这套价格不到5千,速度流畅,性价比极高,搭配unsloth动态量化Q2.51效果很好,质量损失很少,对比官网效果都很不错。

步骤 1:环境准备

  1. 安装系统依赖

    1.1 配置镜像源

    #更新镜像源
    sudo vim  /etc/apt/sources.list
    #写入镜像地址
    deb http://mirrors.aliyun.com/ubuntu/ jammy main restricted universe multiverse
    deb-src http://mirrors.aliyun.com/ubuntu/ jammy main restricted universe multiverse
    
    deb http://mirrors.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值