
计算加速
文章平均质量分 92
Binbin_Sun
这个作者很懒,什么都没留下…
展开
-
GPU计算加速-cublas加速
前言:因为要对一个矩阵进行优化加速,原有的openblas矩阵计算方法只是适合在做CPU端的加速,如果在线上有了GPU,这就使得使用GPU加速成为可能,并且也许会获得比较不错的性能结果。所以进行了尝试,进行矩阵的加速运算。第一部分:相关背景和硬件信息介绍;使用的GPU为1080Ti,使用的cuda版本是8.0版本;驱动版本是384.111;相较于openblas需要自...原创 2018-07-09 20:58:11 · 6340 阅读 · 0 评论 -
openblas第一弹:openblas 使用说明和常用接口介绍
openblas 使用说明openblas 是一个开源的矩阵计算库,包含了诸多的精度和形式的矩阵计算算法。就精度而言,包括float和double,两种数据类型的数据,其矩阵调用函数也是不一样。不同矩阵,其计算方式也是有所不同,(姑且认为向量也是一维矩阵),例如,向量与向量之间的计算,向量与矩阵之间的计算,矩阵与矩阵之间的计算。按照不同的计算需求openblas有如下几种1. 第一...原创 2018-03-02 23:32:07 · 21826 阅读 · 4 评论 -
openblas 第二弹: openblas Android版调用和编译
1:编译如果需要在Android下使用openblas,则需要编译Android版本的openblas.a文件进行调用。1:openblas的编译时主要参考链接:参考链接一参考链接二具体细节太久了,已经忘了,下面是编译好的时候的环境变量:export PATH=/tmp/my-android/bin:$PATHexport NDK=home/sbb/tools/androi...原创 2018-03-06 20:59:48 · 4628 阅读 · 8 评论