
Cuda
文章平均质量分 84
周陽讀書
周陽也想繼往聖之絕學呀~
展开
-
Cuda环境及Pytorch环境安装
将之前写的环境配置中的cuda环境配置部分单独拆分出来。原创 2024-07-12 23:46:42 · 406 阅读 · 0 评论 -
TensorRT从了入门到了解(官方文档)-学习笔记
TensorRT阅读研究原创 2024-04-17 14:09:55 · 1232 阅读 · 0 评论 -
TensorRT从入门到了解(2)-学习笔记
tensorRT,nvidia发布的dnn推理引擎,是针对nvidia系列硬件进行优化加速,实现最大程度的利用GPU资源,提升推理性能tensorRT是业内nvidia系列产品部署落地时的最佳选择这里主要是围绕https://github.com/shouxieai/learning-cuda-trthttps://github.com/shouxieai/tensorRT_cpp提供的方案开展讨论,使得能够使用、部署起来。封装,关注业务逻辑,避免细节。原创 2024-04-16 17:30:00 · 398 阅读 · 0 评论 -
TensorRT官方示例使用研究-学习笔记(examples编译使用看这个)
研究TensorRT-8.6.1.6samples官方示例。samples文件夹下只有makefile,而没有CMake.txt文件,Clion中如何运行调试,望大佬指点。原创 2024-04-16 10:49:53 · 393 阅读 · 0 评论 -
TensorRT从入门到了解-学习笔记
用于高效实现已训练好的深度学习模型的推理过程的SDK内含推理优化器和运行时环境使DL模型能以更高吞吐量和更低的延时运行有C++ Python的API,完全等价可以混用===待续。原创 2024-04-11 17:28:40 · 1296 阅读 · 0 评论 -
TensorRT-官方例程SampleOnnxMNIST代码研读(草稿)
研究TensorRT,以期弄懂。原创 2024-04-11 13:50:07 · 936 阅读 · 0 评论 -
Cuda编程-NPP库
NVIDIA NPP是2D图像和信号处理的CUDA加速库。该库中的主要功能集侧重于图像处理,并广泛适用于这些领域的开发人员。NPP库可以在最大限度地提高灵活性,同时保持高性能。作为一个独立的库,可以最小的工作量向应用程序添加GPU加速可以添加到开发人员的GPU代码中,作为一个有效互操作的协作库这两种方法都允许开发人员利用NVIDIA gpu的大量计算资源,同时减少开发时间。本文中的例子,仅适合于 512 ∗ 512倍数的图像,因为npp处理数据时,有字节对齐这个说法。原创 2024-04-10 14:41:00 · 1455 阅读 · 0 评论