- 博客(5)
- 收藏
- 关注
原创 手把手安装Nsight system
在网上看了各种各样的安装教程之后,作为一个新手,打算自己写一个安装Nsight system教程,简单记录一下,过程十分简易其实。对照各位自己的实际情况,我是红框的这种。本地为windows,远程为linux。后面还有System Requirements,确保自己的条件符合。之后使用和其他具体分析步骤详见。先别着急打开下载,先看一下下边的支持矩阵。确定了自己要下载哪一版之后,回到最上面。,点击Get Started。进来之后可以看到一系列的选项。
2025-02-14 09:43:25
377
原创 CUDA学习(2)在CUDA核函数中使用线程索引
内核中的每个线程都有唯一的标识或索引。因为我们在执行配置>中使用了两个数字(grid size和block size),所以内核中的每个线程也应该由两个数字标识。在内核中,grid size和block size存储在内置变量gridDim.x和blockDim.x中。例如一个核函数调用的执行配置为,我们就知道grid size的gridDim.x为10000,block size的blockDim.x等于256。
2024-12-16 23:05:02
247
原创 CUDA学习(1)CUDA编程的基本知识
出于个人兴趣和需要,最近接触了GPU编程。于是想写篇文章(或者是一系列的),来总结一下学习所得,防止自己以后忘了,健忘是这样的。前置知识:在GPU中:kernel代表一个计算任务,一个计算任务可以被分成多个block (block是软件层面上的概念),一个block中包含多个thread。
2024-12-16 22:42:22
258
原创 【论文阅读】Model-Switching: Dealing with Fluctuating Workloads in Machine-Learning-asa Service Systems
基于机器学习(ML)的预测模型,尤其是深度神经网络(DNN),越来越多地在云中提供,以提供快速准确的推理。然而,现有的服务ML服务系统在处理波动的工作负载方面存在问题,要么放弃请求,要么在响应负载峰值时显著扩展硬件资源。在本文中,我们介绍了模型切换,这是一种处理DNN模型波动工作负载的新方法。由于观察到ML的最终用户主要关心在截止日期内返回的响应的准确性(我们称之为有效精度),我们建议在负载峰值存在的情况下,从复杂和高度精确的DNN模型切换到更简单但不太准确的模型。Clipper。
2024-07-16 10:45:56
615
1
原创 Dockerfile 在Ubuntu20.04构建镜像,ERROR: failed to solve: process “...“ did not complete successfully..
2. 运行docker build即可(博主自己构建了一个循环build的脚本文件,其实大差不差)重复build了好几次,都是报这个错误,考虑镜像源问题,估计是apt-get这个命令的问题。最后结果如下:镜像构建成功!
2024-07-08 15:40:10
3024
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人