准备开一个用fpga实现整个机器学习的专栏,也正好巩固自己目前所学的东西,同时也提高自己的code能力
手撸一个cnn ip,其实目前cnn ip模式也挺固定,核心的conv计算,充分利用fpga内的DSP,怎么把ddr内的数据有效的存到片上RAM,IP的结构也比较固定,如下
目前手里有块zedboard的板卡,准备在这上面实现整个功能,fpga内有arm核,一些处理也可以在软件上操作。
大概思考了下后面的具体实现步骤:
(1)python实现某个深度学习网络,参数定点量化,楼主只会些matlab,但是目前python比较流行,决定学习下
(2)conv初级版本,先把数据运算完成, 需要比对结果
(3)load和save部分
(4)整体仿真运行
(5)上板测试
大概会分为这5部分来完成整个 cnn ip,实现过程中会把某些章节再次细分,估计python这节就够我喝一壶的,本人是rtl coder,后来rtl部分可能会轻松些,再接再厉吧