本人使用复值网络进行的图像识别任务,实际过程中遇到的一些问题,以及总结和反思,如有相同问题的欢迎大家探讨。
1.复值网络目前的实现,还是基于在实值卷积的基础上,尽管现在有开源的包直接能使用,其实底层逻辑还是使用实值卷积的那一套。
2.在应用到计算机视觉任务,对于输入图像进行处理时,一般来说要面临怎么将图像从实数域转换到复数域的问题,可用一些传统方法:傅里叶、Gabor等,但如果这样,需要有一定经验,提前设计好参数。这样的做法显然有一定的问题。
目前可用python代码直接转换,但是还是直接将复数域设为0, 后面在网络提取的过程当中更新虚部。这样有一定的道理,但是仍然可以深挖,究竟有没有将图像完整复数化,是否丢掉了一些信息?(本人才疏学浅,暂时未能想明白)
3.复值网络本质是加了一倍的卷积层,复杂度变高,并且一些复数计算使得训练大幅度变慢,如果可以选的话还是尽量不去碰复值网络
【复值神经网络】应用到CV实践中的一些反思
于 2025-01-07 16:52:42 首次发布