
高性能
ucasliming
本人优快云博客:http://blog.youkuaiyun.com/blognkliming,欢迎来访!
平台方面:
熟悉Windows、Linux、Arm(Android)平台开发;
编程方面:
熟练使用C、C++、C#、JAVA等;
项目方面:
熟悉MapReduce架构,熟悉Hadoop平台,在分布式机器学习算法的开发方面有一定经验;
熟悉自然语言处理方面相关的开发,对Lucene、Stanford NLP、Paoding、ICTCLAS等一些常用的分词工具、检索系统、语法分析器等都有较深入的理解;
熟悉网络编程,对TCP/IP、HTTP等协议以及网络安全相关的算法应用都有较深入的理解;
熟悉图形学编程,熟练使用OpenGL中的各种着色器,熟练使用Kinect等深度感应器做虚拟现实相关的开发,对物理仿真、三维服装试穿技术等都有较深入的理解;
算法方面:
机器学习(深度学习) -- 图像和文本的检测、分类及推荐系统算法等;
图形学 -- 人体建模、骨骼动画、运动数据迁移、蒙皮、三维虚拟试穿算法等;
如果有意合作,请联系我:
QQ 1103977600
展开
-
CUDA 编程入门
1. CUDA 简介 GPU (Graphic Processing Unit) 是图形处理单元的简称,最初主要用于图形渲染。自九十年代开始,GPU 的发展产生了较大的变化,NVIDIA、AMD(ATI) 等 GPU 生产商敏锐的观察到 GPU 天生的并行性,经过他们对硬件和软件的改进,GPU 的可编程能力不断提高,GPU 通用计算应运而生。由于 GPU 具有比转载 2014-03-29 22:25:53 · 1117 阅读 · 0 评论 -
光线跟踪的 GPU 程序解读
《CUDA by example》 中的第六章讲解了在 GPU 上实现光线跟踪的一个例子,旨在介绍常量内存(constant memory)和事件,下面给出这个例子的详细解读(http://code2.us/2012/02/cuda_learning_11-constant_memory_and_events/)。 #include #include "co转载 2014-03-29 22:27:13 · 1992 阅读 · 0 评论 -
如何理解 CUDA 中的 cudaMalloc() 的参数
运行时函数的原型:cudaError_t cudaMalloc (void **devPtr, size_t size ); 此函数返回值是 CUDA 中定义的一个错误代码。主要是第一个参数。为什么是两个星星呢?用个例子来说明下。float *device_data=NULL; si转载 2014-03-29 22:26:36 · 3082 阅读 · 2 评论 -
CUDA 的硬件单元映射
CUDA计算单元示意图1、计算单元: 上图是 CUDA GPU 计算单元简图。其中,SM 代表流多处理器(Stream Multiprocessors),即 CUDA 的计算核心部件。每个 SM 又包括 8 个标量流处理器 SP(Stream Multiprocessor),以及少量的其他计算单元。在商业宣传中,GPU往往被说成拥有数百个“核”,这里的“核转载 2014-03-29 22:23:11 · 3322 阅读 · 0 评论 -
CUDA 的 Threading:Block 和 Grid 设定
硬件基本架构 实际上在 nVidia 的 GPU 里,最基本的处理单元是所谓的 SP(Streaming Processor),而一颗 nVidia 的 GPU 里,会有非常多的 SP 可以同时做计算;而数个 SP 会在附加一些其他单元,一起组成一个 SM(Streaming Multiprocessor)。几个 SM 则会在组成所谓的 TPC(Texture Processing Cl转载 2014-03-29 22:24:52 · 1969 阅读 · 0 评论