- 博客(8)
- 收藏
- 关注
原创 一文讲解大模型格式后缀有.safetensors /.ckpt/.gguf/.pth/.bin的含义
在深度学习语境下,它通常被 Hugging Face Transformers 库用作 PyTorch 模型权重文件的扩展名,其本质与只保存了 state dict 的 .pth文件完全相同。加载速度极快:由于张量数据在磁盘上的布局与在内存(尤其是GPU内存)中的布局非常相似,可以实现零拷贝加载,速度比 pickle 快得多(官方称可达快100倍)。在 TensorFlow 1.x 时代,它通常指代一组由 tf.train.Saver() 创建的文件(包括 .data, .index, .meta)。
2025-09-11 14:56:32
1124
原创 全流程部署Qwen3-Rerank-8B嵌入模型(dify和ragflow 都可支持添加到rerank 模型)
全流程部署Qwen3-Rerank-8B重排序模型
2025-06-19 15:52:27
4325
原创 基于昇腾910B部署Qwen3-embedding-8B模型(通过vllm 推理引擎部署)
国产卡910B基于vllm 拉起Qwen3-embedding-8B 嵌入模型
2025-06-17 21:01:25
4481
1
原创 从0到1手把手搭建dify(基于centos7.9)
手动部署dify包含docker /docker-compose/dify 三个服务部署
2025-05-15 14:50:07
1150
1
原创 centos7添加阿里镜像源CentOS-Base.repo及“Failed connect to mirrors.cloud.aliyuncs.com:80问题
使用阿里镜像源和FAIL connect to mirros.cloud.aliyuncs.com问题
2024-06-14 13:57:12
2634
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅