
CUDA
DarrenXf
这个作者很懒,什么都没留下…
展开
-
Ubuntu 16.04 安装CUDA9.2
Verify You Have a CUDA-Capable GPU$ lspci | grep -i nvidia01:00.0 VGA compatible controller: NVIDIA Corporation Device 1b06 (rev a1)01:00.1 Audio device: NVIDIA Corporation Device 10ef (rev a1)...原创 2018-08-29 13:31:03 · 1670 阅读 · 0 评论 -
测试minpy 调用gpu 加速numpy的矩阵相乘. 小矩阵相乘 1到100万个元素
测试minpy 调用gpu 加速numpy的矩阵相乘. 小矩阵相乘小矩阵相乘,行数在1-1000.测试用的都是方阵.所以元素数木在1到一百万.测试元素数目一到100万的矩阵相乘.上一篇中可以看到在行数超过1000的时候,gpu相对于cpu就会有绝对的加速效果.但是在行数1000以前会看到,gpu并不一定能够起到加速计算的效果.这里我们针对1-1000来看下.main.py#!/usr/...原创 2019-01-09 12:50:49 · 1997 阅读 · 0 评论 -
测试pytorch 调用gpu 加速矩阵相乘. accelerate matrix multiplication
下面是我机器中的cpu和gpu型号31.4 GiBIntel® Core™ i7-8700K CPU @ 3.70GHz × 12 GeForce GTX 1080 Ti/PCIe/SSE264-bit代码会在下面给出先看下整体的输出效果 对比了float32 float64 分别用numpy,torch cpu 以及torch gpu 运算矩阵相乘运行1000次 方阵大小1-50...原创 2019-01-24 16:38:52 · 6617 阅读 · 5 评论 -
测试 minpy gpu加速 numpy 矩阵相乘 matmul matrix multiplication
测试minpy 调用gpu 加速numpy的矩阵相乘.main.py#!/usr/bin/python# -*- coding: utf-8 -*-###################################### File name : main.py# Create date : 2019-01-05 17:11# Modified date : 2019-01-08 ...原创 2019-01-08 21:58:11 · 1914 阅读 · 0 评论 -
Install mxnet and install minpy
make sure the things below.1.your machine has a nvidia gpu.2.installed gpu cuda and cudnn.how to install mxnet?pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade mxnet-cu90us...原创 2019-01-08 21:15:34 · 1794 阅读 · 1 评论 -
Install pycuda
Install pycudahow to installpip install pycudaTutorialhttps://documen.tician.de/pycuda/index.htmlExamplehttps://wiki.tiker.net/PyCudademoimport pycuda.autoinitimport pycuda.driver as drvi...原创 2019-01-07 13:59:25 · 432 阅读 · 0 评论 -
测试minpy 调用gpu 加速矩阵相乘. accelerate matrix multiplication
测试minpy 调用gpu加速矩阵相乘,已经写了几篇文章.前几篇文章得到的结果不太好,主要原因是跟想象中的结果并不是很相同.主要有两点,一个是前几篇测试加速的效果并不是很好,矩阵要很大的时候才能看到明显的加速.另一个是我一个先验的经验认为float32的加速效果要明显比float64的加速效果要好很多. 但是这两点在前面的测试中并没有得到.这个就能感受到理论跟实验之间差距.如果你相信理论,相信...原创 2019-01-11 16:15:41 · 1407 阅读 · 0 评论 -
测试minpy 调用gpu 加速numpy的矩阵相乘. 小矩阵相乘 1到100万个元 多次
测试minpy 调用gpu加速numpy的矩阵相乘.小矩阵相乘,前面的文章中已经看到行数超过1000的方阵,基本上gpu就能起到加速效果.我们现在想知道的是具体的minpy 和numpy 性能的拐点.以此帮助我们决定使用cpu还是gpu. 具体结果测试应该是根据机器所不同的,我们这里的结果只是我们测试机的的结果.上一篇测试的时候只是测试了运行一次的时间,矩阵比较小时,测试到的运行时间误差比较大,...原创 2019-01-10 13:56:43 · 1819 阅读 · 0 评论 -
Ubuntu 16.04 安装 CUDA 9.0 cuDNN 7.0 tensorflow-gpu 1.8.0
默认系统装的是Ubuntu 16.04,并且安装了显卡驱动。走过很多坑,这些软件之间是互相依赖的,所以我们只安装这些固定的版本。CUDA 9.0 cuDNN 7.0 tensorflow-gpu 1.8.0 希望以后会更容易安装些。如果不是这篇文章写了很久,就照着这篇文章做,不要试图去安装这里涉及软件的最新版本。第一步先安装 CUDA 9.0。这个并不是官方默认最新的。下载地址...原创 2018-08-29 18:27:34 · 1926 阅读 · 0 评论 -
pytorch gpu 显存 内存 管理 调试 监控 日志
pytorch gpu 显存调试如何运行 gpu_memory_logimport torchfrom gpu_memory_log import gpu_memory_logdtype = torch.floatN, D_in, H, D_out = 64, 1000, 100, 10device = torch.device("cuda")x = torch.randn(N,...原创 2019-06-02 17:38:31 · 7059 阅读 · 0 评论