基于卷积神经网络的低级别FPGA视频恢复方案
1. 引言
目前许多系统设计方法是针对高级FPGA实现进行优化的,这类FPGA拥有丰富的处理资源。而低级别FPGA在逻辑门和内存带宽方面的计算资源非常有限。因此,提出了一种针对低级别FPGA的卷积神经网络(CNN)优化设计。该方法通过分析网络超参数与峰值信噪比(PSNR)值的变化来减少网络的模型参数,还将CNN的权重量化为4位、8位和16位定点精度,以显著减少内存带宽需求,实现低级别FPGA的运行速度提升。实验表明,该CNN在视频恢复方面能达到与普通32位浮点格式相似的PSNR客观质量,且在低级别FPGA上的功耗比CPU和GPU实现低8倍,具有实际应用价值。
2. 背景知识
2.1 卷积神经网络
典型的卷积神经网络(CNN)由多个计算层组成,包括卷积层和激活层。卷积层对上一层的输入特征图进行卷积操作,生成下一层的输出特征。一个卷积层的伪代码如下:
for(output_channel=0; output_channel<input_channels;output_channel++){
for(input_channel=0;input_channel<input_channels;input_channel++){
for(input_row=0;input_row<input_rows;input_row++){
for(input_col=0;input_col<input_cols;input_col++){
for