- 博客(19)
- 收藏
- 关注
原创 DCGM+Prometheus+Grafana监控搭建
DCGM默认开启5555和dcgm-exporter默认开启9400端口。DCGM+Prometheus+Grafana监控搭建。执行自动化脚本安装DCGM与dcgm-exporter。
2025-08-27 14:37:17
535
原创 hugging face下载模型
是 Hugging Face 官方提供的命令行工具,自带完善的下载功能。(可用conda配置python环境)建议将上面这一行写入~/.bashrc。
2024-10-31 16:29:28
1169
原创 NCCL安装测试
直接去下载安装包(要先注册NVIDIA账号,下载安装固定的nccl与cuda版本组合),历史版本点,也可以在github上获取所有版本,点击。根据对应cuda版本下载自己所需要的安装包。
2024-06-28 09:34:14
2789
原创 SXM机型机器nvidia-fabricmanager安装
SXM机器需要另外安装nvidia-fabricmanager驱动才可以完全调用显卡,否则机器显卡无法全部调用。
2024-06-26 10:37:35
2923
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅