- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 TensorFlow btc allocator
主要写GPU 的bfc allocator,业务需要稍微调研了一下,写个大概,很多细节没有去看。一、源码1、BaseGPUDeviceFactory::CreateGPUDevice中使用GPUProcessState单例调用process_state->GetGPUAllocator 创建GPU allocator2、GetGPUAllocator 实例化allocator 其中sub_allocator 也就是GPUMemAllocator是通过stream去调用...
2021-06-06 15:52:41
420
原创 TensorFlow图优化(二)-Remapper,layout
上回说到CreateExecutors中有两个分支进行图优化,一个执行的是GraphOptimizer父类的优化,另一个执行的是子类的图优化。上一篇介绍了父类优化中的CSE,这篇介绍一下子类优化的流程一、优化流程 每种优化子类继承自父类GraphOptimizer,而且与父类有完全不同的执行过程。其中MetaOptimizer虽然也是优化子类,但是并没有实现一种特定的优化,而...
2020-01-02 00:10:44
1031
原创 TensorFlow图优化(一)-CSE(公共子表达式消除)
TensorFlow中有很多图优化,包括公共的优化策略和针对设备的特殊优化,有兴趣可以针对自己的网络设计专门的优化。对于大型公司来说,为了提高计算效率进行专门优化很有必要,对于个人学者来说,不如买个更牛逼的卡。一、图优化的执行时序 图优化的入口是第一次创建Session后,执行Sess Run时会创建executor,即调用CreateExecutors()。这个接口中有两个...
2019-12-31 23:04:37
2342
1
原创 3D点云图实验
视觉 3D 点云图构建与深度测量环境为linux系统,使用opencv处理图像,将五张不同角度和距离的图片和五张对应的深度图处理为点云图。关键是理解世界相机坐标系到世界坐标系的映射。相机拍出来的图片是以相机为中心的坐标系,确定一个世界坐标系,相机相对世界坐标系有一个姿态,然后可以将五张图中的像素点根据深度图可以算出各个像素点在相机坐标系中的3D位置,然后根据坐标系的转换关系,将像素点的...
2019-08-23 11:42:28
1221
原创 面试海量数据问题
在面试百度的过程中,有两轮面试都问到了海量数据的问题,对于百度这种在平时业务中就要处理海量数据的公司,问海量数据的处理也情有可原,而且考查海量数据的问题也可以考查到应聘者分析和分解问题的能力。1、面试官:在文件中每行存储一个32位的数字,文件大小有几百个G,如何找出其中前k大的数。 这种问题是比较常规的海量数据的问题,在剑指offer书中也专门有提到这个问题(专门指出百度喜欢...
2019-08-23 11:26:58
372
原创 linux设备驱动的实现与理解
linux设备驱动的实现与理解在linux中对字符设备的驱动编写,驱动插入以及使用驱动文件进行逻辑控制,其中这份代码写在嵌入式板中,通过控制io来实现灯的亮灭,但是设备驱动的实现流程与灯无关,大致的流程都体现在代码中。我感觉这份博客我自己不会看,太难看了,算是自己对设备驱动理解的记录吧。一、程序解读1、 系统调用open() 打开文件ioctl()设备驱...
2018-03-31 12:40:40
5993
4
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人