自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

wohenibdxt的博客

原创 Tensoflow c++ so编译基于bazel

第一章 AI 后端之 tensorflow so编译

2022-04-29 17:41:47 3256 1

原创 DeepSeek从入门到精通(20250204)清华大学新闻与传播学院

DeepSeek 从入门到精通，清华团队，新鲜出炉

2025-02-08 16:29:33 1785

原创 DeepSeek-R1 本地部署文档

在docker容器中使用ollama服务本地化部署deepseek-r1模型，运行在nvdia gpu上

2025-02-07 15:03:15 2277 3

原创 nvidia-smi 查看 GPU利用率，真的是你想要的吗？

nvidia-smi 利用率 100%？？？

2024-04-29 10:47:07 1431 1

原创一些不错的博客

分享一篇关于 transformer论文的解读文章，很适合新手入门，非常nice

2023-06-29 10:04:48 126

原创 onnxruntime c++ 推理示例（tensorRT/cuda provider)

onnxruntime-gpu：在 nvidia gpu 上跑onnx模型获得与tensorRT相媲美的推理速度

2023-06-15 14:16:44 6635 9

原创 git极简指南（工作中知道这些就够了...）

工作中git的使用流程看完基本就可以进行开发了

2023-03-24 17:50:22 150

原创 docker极简指南（工作中知道这些就够了...）

privileged 特权模式，

2023-03-24 17:09:57 137

原创常用调试命令极简指南（工作中能应对百分之八十的问题...）

工作中常用的调试命令，欢迎补充

2023-03-24 15:54:44 159

原创 caffe编译与caffe源码分析

caffe框架编译caffe框架源码分析，主要介绍初始化网络流程和相关类caffe框架简单的训练流程，cpu、gpu或多gpu训练caffe框架源码主要分析类的注册机制

2023-03-15 17:11:52 704

原创高质量课程~~十分推荐

好课推荐 c++ 模型量化

2023-01-08 13:01:40 332

原创深度神经网络模型量化（1）

神经网络量化浅谈

2022-12-31 20:16:46 487

原创 Tensorflow、TF-TRT、 TensorRT那些事儿

一 TF-TRT基本概念二 TF转TF-TRT

2022-05-13 15:40:20 3802

原创 c++11 线程池实现，以及涉及到的知识点

c++11 实现的线程池，代码中有相应注释

2022-05-04 20:30:00 684

原创一个由GPU型号不同导致模型掉点问题的排查过程TF32 vs FP32

记录一个由gpu 引入的模型掉点问题TF32 vs FP32

2022-05-02 21:30:00 3017 3

原创 cuda与GPU显卡驱动版本一览

cuda版本是？？gpu 驱动？两者怎么对应

2022-05-02 15:29:28 55156 8

原创 GPU 计算能力（Compute Capability）那些事儿以及编译caffe/pytorch/tensorflow时怎样设置计算能力？

适合gpu入门同学，大牛出门左拐一、常见gpu卡计算能力查询https://developer.nvidia.com/cuda-gpus#compute部分gpu计算能力：二、计算能力是什么东东计算能力（Compute Capability）并不是指gpu的计算性能nvidia发明计算能力这个概念是为了标识设备的核心架构、gpu硬件支持的功能和指令，因此计算能力也被称为“SM version"。计算能力包括主要修订号X和次要修订号Y来表示。具有相同主版本号的设备具有相同的核心架构，例如：

2022-05-02 12:23:22 14573 7

DeepSeek从入门到精通

DeepSeek：从入门到精通团队：余梦珑博士后清华大学新闻与传播学院

2025-02-08

编译好的 tensorflow2.8.0 c++接口库，支持gpu

tensorfflow: 2.8.0 cuda: 11.4 cudnn:8.2 tensorRT: 8.2

2022-04-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除