
【性能优化】
高性能
deepindeed
https://github.com/cwlseu
展开
-
高通SNPE开发笔记
引言从2011年甚至更早开始,智能手机,智能终端,车载芯片等等智能终端中,高通芯片无处不在。相比较Intel,高通抓住了移动处理器中续航的问题,不断推出低功耗移动处理器,从而抓住移动处理器的市场。日常工作中接触到很多冠以高通之名的产品,记录以习之。性能排行榜收集了一下2018年高通骁龙CPU处理器排行榜和各种手机品牌的处理器性能对比,从中可以看出,骁龙系列 处理器也是分为高中低端处理器...原创 2019-12-28 15:17:58 · 4737 阅读 · 0 评论 -
NCNN: 应用于手机上的卷积加速
从C++ 到android在ncnn中是用C++写的,没玩过android很是愧疚。幸好项目中有android依赖链的cmake文件。 Android CMake toolchain file, for use with the Android NDK r5-r10d Requires cmake 2.6.3 or newer (2.8.9 or newer is recommend...原创 2019-12-25 11:47:25 · 1486 阅读 · 0 评论 -
Project: Inference Framework based TensorRT
引言视觉算法经过几年高速发展,大量的算法被提出。为了能真正将算法在实际应用场景中更好地应用,高性能的 inference框架层出不穷。从手机端上的ncnn到tf-lite,NVIDIA在cudnn之后,推出专用于神经网络推理的TensorRT. 经过几轮迭代,支持的操作逐渐丰富,补充的插件已经基本满足落地的需求。笔者觉得,尤其是tensorrt 5.0之后,无论是接口还是使用samples都变...原创 2019-12-25 11:46:20 · 475 阅读 · 0 评论 -
实战算法优化
引言对于这方面的姿势,也是属于意外。在使用Caffe的过程中,需要依赖一个关于矩阵计算的库,可是使用atlas或者openblas, 当然有资金支持的话可以使用更快地MKL, 而一个穷小白就只能从开源免费的计算库中选了,就选了OpenBlas。 后来因为缘分,认识了OpenBlas的创始人,从他们公司的工作中了解到还有机器学习算法优化加速的这么个工作。其中涉及到如OpenMP, SIMD, 当...原创 2019-12-20 10:57:06 · 722 阅读 · 1 评论