论文信息
题目:Data Augmentation via Latent Diffusion for Saliency Prediction
通过潜在扩散进行数据增强以实现显著性预测
作者:Bahar Aydemir, Deblina Bhattacharjee, Tong Zhang, Mathieu Salzmann, and Sabine Susstrunk
源码:https://github.com/IVRL/Augsal
论文创新点
- 显著性引导的交叉注意力机制:作者引入了一种显著性引导的交叉注意力机制,该机制能够在特定图像区域内进行有针对性的光度属性编辑,从而增强该区域的显著性。
- 多级特征读出模块:作者设计了多级特征读出(LLFR和HLFR)模块,这些模块能够从预训练的Stable Diffusion模型中提取低级和高级特征,用于生成图像编辑和预测显著性。