大脑反应与计算模型中RDMs的捕获内容解析
1. 图像预处理与模型训练
由于92张图像均无背景,在将图像呈现给模型之前,研究人员应用了中央凹视觉处理(Foveation)技术。这是一种根据注视点改变图像细节量的图像处理技术,图像的注视点分辨率最高。在实验中,以图像中心作为唯一注视点,并使用随着与注视点距离增加而增强的高斯模糊,以此模拟人类视网膜的工作方式。为了解中央凹视觉处理对模型与人类表征差异矩阵(RDMs)相关性的影响,研究人员向模型同时呈现了经过处理和未经过处理的图像。
为便于结果呈现,模型配置采用下标表示:
- “e” 代表早期层,“l” 代表晚期层。
- “f” 表示图像在呈现给模型前经过中央凹视觉处理,“n” 表示未处理。
- “p” 和 “q” 分别代表冻结和未冻结配置。
例如,VGG16lfp 表示 VGG16 架构,针对晚期 RDM 值(IT 区域)进行微调,图像对呈现时未应用中央凹视觉处理,且在微调过程中初始层被冻结。这样的训练设置共产生了 24 个模型用于研究。
各模型的训练参数如下:
- 除 Inception 模型训练 100 个轮次外,其他模型均训练 150 个轮次。
- 所有模型的学习率均为 0.05。
- Inception 系列模型使用 Adam 优化器,其他模型使用随机梯度下降(SGD)优化器。
- 所有模型的批量大小均为 32。
2. 最佳模型选择
表征相似性分析(RSA)在模型选择过程中起着关键作用,它有助于将模型各层的输出与不同模态的人类功能磁共振成像(fMRI)数据进行比较。在为 24 种不同模型配置的所
超级会员免费看
订阅专栏 解锁全文
27

被折叠的 条评论
为什么被折叠?



