- 博客(21)
- 收藏
- 关注

原创 NVIDIA CUDA初级教程视频--目录
写在开始本系列博客根据周斌老师的视频记录笔记而成:视频地址:https://www.bilibili.com/video/av10436982/?p=3第一章CPU体系架构概述第二章并行程序设计概述第三章CUDA开发环境搭建和工具配置第四章GPU体系架构概述第五章GPU编程模型第六章CUDA编程第七章CUDA编程第八章CUDA编程第九章CUDA程序分析和调试工具第十章CUD...
2019-01-23 21:05:21
793
1
原创 JAVA课堂笔记
1.内存中分stack(栈)和heap(堆),简单类型(int等)放在stack中,new出来的东西则放在heap中:eg: A a=new A() 其中a放在stack中,指向heap中的new A()A是class,a是object,也是一个pointer,a得到的是一个地址2.变量的作用域:(生命周期)成员变量:类的内部,方法的外部,作用域整个类局部变量:方法内部或方法一个代码块...
2019-03-11 20:18:45
503
原创 NVIDIA CUDA初级教程视频--(十)
**第十章CUDA程序基本优化**1.有效的数据并行算法+针对GPU架构特性的优化=最优性能2.并行规约parallel reduction:把不相关的计算放到不同的线程3.warp分割:块内线程如何划分warp,通晓warp分割有助于:减少 分支发散,让warp尽早完工。...
2019-01-27 20:16:46
474
原创 NVIDIA CUDA初级教程视频--(七)
第七章CUDA编程(二)1.函数的声明global void KernelFunc():只能从主机端调用,在设备执行,返回值类型必须是空device float DeviceFunc():在设备和设备间使用host float HostFunc():在主机端和主机端使用global 、device :尽量少用递归(不鼓励),不要用静态变量,少用malloc(现在允许但不鼓励),小心通过指...
2019-01-27 11:15:03
391
原创 《超算竞赛导引》阅读笔记
《超算竞赛导引》阅读笔记**第一课 超算的发展与应用**超算的发展与架构分类第一代的超级计算机是单指令多数据流(SIMD)的阵列处理机第二代的超级计算机是具有流水结构的向量机(向量机系统结构按向量操作对象及结果主要存放 在寄存器中还是存储器中,可分为存储器-存储器工作方式向量机和寄存器-急促你工作方式向量机两大类。前者:向量操作的源向量都取自主存且操作生成的结果向量也存放在主存中,...
2019-01-25 12:19:28
1319
原创 NVIDIA CUDA初级教程视频--(五)
**第五章GPU编程模型**1.CPU和GPU交互:有各自的物理内存空间,通过PCIE总线互连,交互开销较大2.GPU存储器层次架构:Work item:理解为ALU,处理核,有私有的存储空间,及其对应的寄存器Compute unit:SM 会有一段共享存储空间 通带PCIE总线和计算设备进行交互访存速度:寄存器(有专门硬件支持)、共享存储单元、local memory、glob...
2019-01-23 21:10:14
201
原创 NVIDIA CUDA初级教程视频--(四)
1.FLOPS:每秒可进行的浮点数运算GFLOPS:每秒可进行的十亿浮点数运算TFLOPS:每秒可进行调度一万亿次浮点数运算2.GPU是一个 异构的多处理器芯片,为图形图像处理优化ShaderCore:渲染器,最基本的ALU计算单元,分派器等3.执行单元:取址译码,ALU,上下文执行单元附加:缓存区,乱序控制逻辑,分支预测器,存储器管理单元优化①:精简:把很复杂的CPU精简,只留下最...
2019-01-23 21:08:46
196
原创 NVIDIA CUDA初级教程视频--(二)
第二章并行程序设计概述串行计算模式:常规软件是串行的,设计运行与一个CPU 上,通过离散的指令序列完成一个问题的解决,一条一条指令的执行,同时只有一条指令在执行并行计算模式:并行计算是同时应用多个计算资源解决一个计算问题3.Flynn矩阵:根据指令和数据来进行划分MISD:一个数据的多个操作过程 MIMD:多个指令作用于多个数据4.任务:可以去完整的得到结果的一段程序,程序代码段...
2019-01-23 21:07:32
294
原创 NVIDIA CUDA初级教程视频--(一)
第一章CPU体系架构概述:CPU:执行指令(算术,访存,控制),处理数据的器件:完成基本的逻辑和算术指令现在增加了复杂功能:内存接口,外部设备接口包含大量晶体管最优化目标:CPI:每条指令的时钟数 时钟周期 要两个都比较小,但是两个指标不独立桌面应用Desktop Programs轻量级进程,少量线程 Lightly threaded大量分支和交互操作 Lots of bra...
2019-01-23 21:06:27
681
原创 信息基础
1.强化学习 定义:决策过程依赖于环境给出的反馈Agent Enviroment State Action Reward 希望Reward最大 脉冲神经网络 Spiking NN脉冲函数不可微分,无法使用梯度下降,不可使用无监督学习。正确使用SNN,需要开发一种高效的监督学习再硬件上模拟SNN需要模拟微分方程,消耗大量算力2.最新进展 GAN生成图片...
2018-12-24 11:14:54
155
原创 Deep Neural Network Training
一.Loss Function(损失函数) and Optimization(优化)1.线性分类器:损失函数是评估分类器分类效果的,针对任意样本都可行找到最小化损失函数的优化方向,找到最优参数加入约束项:防止模型在训练集上过拟合softmax 分类器:从评分–>概率问题再引入log,变成信息的相关量 KL距离 相对熵Q:KL散度的定义2.如何找到最优的W?第一种方...
2018-12-14 10:26:56
790
原创 12.10序列处理深度模型 RNN+LSTM
一:需求1.卷积网络的输入和输出多为固定尺寸(样本大小和模式)2.解决序列问题:语言问题,时间序列预测问题(和基础单位相关)需要保存上下文信息,很难/无法选择上下文窗口大小二:Recurrent Neutral Networks(RNNs)时间递归神经网络 Recurrent Neutral Network结构递归神经网络 Recursive Neutral Network1.R...
2018-12-10 10:24:31
992
原创 12.03+12.07
一:计算机视觉问题1.Segmentation 语义分割2.Classification + Localization 分类+定位:用于异常检测(Single Object)定位是回归问题3.Object Detection:目标检测4.Instance Segmentation:实体分割二:分类问题:两类问题,多类问题,多标签问题重要指标:accuracy三:回归问题:预测连...
2018-12-03 10:03:50
242
1
原创 信息基础Homework3
信息基础Homework31.实验作业:在LeNet-5网络中的C1卷积层中,尝试使用不同的卷积核。对比5✖5和3✖3的实验效果。本周实验作业实现LeNet-5的前向传播过程,不使用其他框架,从底层写起。建立自己的库。2.分享:MNIST库实现手写数字识别的可视化操作(双击666)http://scs.ryerson.ca/~aharley/vis/conv/3.在神经网络中对参数进行...
2018-11-16 15:09:50
209
原创 信息基础Homework1
**Homework1:**Q1.什么是线性赋范空间?A1: 线性空间 范数:L0(非0个数) L1(曼哈顿距离) L2(距离)有向量的加法和数乘满足:向量加法结合律/交换律/单位元/逆元素标量乘法分配于向量加法上,分配于域加法,标量乘法一致于标量的域乘法标量乘法有单位元: 1 v = v线性赋范空间就是定义了范数的线性空间,所谓范数就是线性空间到数域的一个映射,其满...
2018-11-07 16:06:54
206
翻译 pyqt快速安装教程
pyqt快速安装教程通过pip install 安装pyqt5-tools包https://pypi.org/project/pyqt5-tools/https://pypi.org/project/pyqt5-tools/2.通过该链接进行QtDesign的安装https://www.jianshu.com/p/5b063c5745d0?tdsourcetag=s_pcqq_aiom...
2018-10-24 12:07:24
205
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人