
并行编程方法与优化实践
just_sort
Acdream.
展开
-
X86 SSE/AVX指令集加速学习
使用SSE指令实现了一些简单函数,可以自定义事件函数测试加速比#include "xmmintrin.h"#include "windows.h"#include "math.h"#include "iostream"using namespace std;typedef uns原创 2018-10-03 21:02:58 · 2528 阅读 · 9 评论 -
快速exp算法
介绍在实现Sigmoid激活函数的时候,有一个exp(-x)的操作,这个函数是非常耗时的,但是在神经网络中一般权值是比较小的,那么就有了这种快速计算算法。算法原理在神经网络中,当x比较小时,exe^xex会逼近一个极限:,其中n可以取较大数,一般为2的整数幂次,比如取256,那么后面的1+xn1+\frac{x}{n}1+nx就相乘8次。如果取1024,需要乘以10次。这个极限和math....原创 2019-03-04 17:46:28 · 4257 阅读 · 0 评论 -
Intel 内部指令 --- AVX和AVX2学习笔记
AVX编程基础数据类型数据类型描述__m128包含4个float类型数字的向量__m128d包含2个double类型数字的向量__m128i包含若干个整型数字的向量__m256包含8个float类型数字的向量__m256d包含4个double类型数字的向量__m256i包含若干个整型数字的向量每一种类型,从2个下划线开头,接...原创 2019-07-01 15:42:00 · 39054 阅读 · 0 评论 -
SSE图像算法优化系列1-RGB转灰度图
前言ImageShop博主是我的Idol。我会逐渐出一些SSE优化一些图像领域的算法的文章,并且将代码开源到Github,希望可以为我多多star。算法原理RGB转灰度图没啥说的了,这里的重点在于使用SSE优化,但为了和普通以及多线程优化的程序做一个速度对比这里也提供了一下对应的程序实现,我在实现这个代码的时候主要参考了ImageShop博主的这篇文章,https://www.cnblogs...原创 2019-07-02 17:06:37 · 2908 阅读 · 3 评论