论文笔记：利用知识蒸馏和潜在扩散模型解码脑电图的视觉脑表征

原创

已于 2025-04-07 22:37:31 修改 · 1k 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#论文阅读 #知识蒸馏 #脑电图 #扩散模型

于 2025-04-03 11:42:53 首次发布

这是2024.8月发表在Computers in biology and medicine的一篇论文。这篇论文提出了一种创新方法，利用知识蒸馏训练 EEG 分类器，结合预训练的潜在扩散模型从 EEG 数据中重建图像。

代码链接https://github.com/matteoferrante/EEG_decoding

这篇文章的作者来自意大利罗马第二大学和美国哈佛大学医学院，他们主要做医学成像、神经影像方面的研究。

一、研究背景及目的

EEG 在解码大脑视觉表征方面具有重要价值，但当前研究多关注多主体模型，且基于 EEG 信号重建视觉刺激存在挑战。本研究旨在改进现有方法，实现从 EEG 模式中翻译感知体验的实时应用。已有研究利用深度学习模型从 EEG 信号解码视觉表征，但存在不足。本文提出的方法与之不同，使用基于 CLIP 的知识蒸馏训练卷积神经网络，结合生成扩散合成，直接从 EEG 脑信号重建详细逼真的视觉刺激。

注：CLIP 即 Contrastive Language-Image Pre-Training，是一种对比语言 - 图像预训练的神经网络架构。它通过对比学习的方式，训练图像编码器和文本编码器，使二者能够将图像和文本映射到一个共同的嵌入空间中。在这个空间里，语义一致的图像和文本在距离上更为接近，从而让模型学会关联图像和文本信息。

二、实验

1、数据预处理

使用 ImageNet EEG 和 THINGSEE - G2 两个公开数据集。前者来自 6 名参与者观看 40 个 ImageNet 类别的 2000 张图片的 EEG 记录，采

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

gone_with_heart

关注关注

21
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【扩散模型/图像匹配/图像拼接】论文精读：DiffMatch: Diffusion Model for Dense Matching

01-30

1万+

建立成对图像之间的密集对应关系的目标由两个术语组成：数据项和先验项。虽然传统的技术侧重于定义难以表述的手工设计的先验项，但最近的方法侧重于使用深度神经网络学习数据项，而无需显式建模先验，假设模型本身有能力从大规模数据集中学习最优先验。然而，性能改进很明显，它们通常无法解决匹配的固有歧义，例如无纹理区域、重复模式和大位移。为了解决这个问题，我们提出了 DiffMatch，这是一个新颖的基于条件扩散的框架，旨在显式建模数据和先验术语。与以前的方法不同，这是通过利用条件去噪扩散模型来实现的。DiffMatch由两

【图像超分/扩散模型】论文精读：Exploiting Diffusion Prior for Real-World Image Super-Resolution（StableSR）

03-26

9377

我们提出了一种新的方法来利用封装在预先训练的文本到图像扩散模型中的先验知识进行盲超分辨率(SR)。具体来说，通过使用我们的时间感知编码器，我们可以在不改变预训练的合成模型的情况下实现有希望的恢复结果，从而保留生成先验并最小化训练成本。为了解决扩散模型固有随机性造成的保真度损失，我们采用了一个可控的特征包装模块，该模块允许用户在推理过程中简单地调整标量值来平衡质量和保真度。此外，我们开发了一种渐进聚合采样策略来克服预训练扩散模型的固定大小约束，从而能够适应任何大小的分辨率。

参与评论您还未登录，请先登录后发表或查看评论

重磅！发表在人工智能顶刊(TPAMI)上的一篇文章表示脑电与计算机视觉的交叉存在缺陷和盲点...

脑机接口社区

12-23

2435

2024年6月12日Arxiv人工智能相关论文

数智笔记

06-12

1656

双重思维框架考虑了快速、直觉性处理和较慢、逻辑性处理。在视觉中对双重思维的感知需要图像，其中从直觉和逻辑处理中推断出的结果不同。我们引入了一个对抗性数据集，为人类视觉中的双重思维框架提供证据，这也有助于研究深度学习模型的定性行为。我们的研究还通过使用定位对象的实例分割模型来解决使用分类模型作为人类视觉计算模型的一个主要批评。证据强调了在人类视觉中识别实例的形状的重要性，并显示出深度学习模型缺乏对子结构的理解，这表明与子组件的位置和数量相关的错误。

基于主体自适应脑电图的视觉识别的主体间对比学习（Note）

m0_65152571的博客

08-08

423

本文基于文献“基于主体自适应脑电图的视觉识别的主体间对比学习”做了一些记录（文献笔记）

论文笔记：Decoding Brain Representations by Multimodal Learning of Neural Activity and Visual Features

林小瓜0327的博客

01-22

4828

论文笔记：Decoding Brain Representations by Multimodal Learning of Neural Activity and Visual Features(通过对神经活动和视觉特征的多模态学习来解码大脑表征)

EEG图像生成知识点

m0_63855028的博客

03-02

956

只是为了学习脑电信号，也称脑电图（EEG，）是大脑神经元活动产生的电信号。神经元通过突触连接彼此，形成复杂的神经网络。当神经元激活时，会产生生物电现象，这些电信号可以通过电极放置在头皮上或直接植入大脑来捕捉。研一，老师方向是脑机接口，让自学EEG 我现在自学了eeglab的预处理，接下来应该学习什么？- 形宙数字的回答 - 知乎EEG信号的分析和处理通常会涉及以下一个或多个方面：信号的预处理（预处理也需要多个步骤）、ERP时域分析、时频分析、信号的功率谱计算、功能连接、溯源分析等等。EEGLAB。

EEG代码实践：diffusion EEG——扩散模型生成EEG信号

SashiMoore的博客

01-23

1736

在自己的原始实现结束后，尝试了使用diffuser库函数进行项目的重写，并获得了不错的成果。

论文阅读笔记：DifIISR：具有梯度引导的红外图像超分辨率扩散模型 [CVPR 2025]

m0_65551120的博客

04-16

1942

红外图像在自动驾驶和机器人操作中非常重要，但由于红外相机的限制，如低空间分辨率和复杂退化，导致图像质量差，影响后续的视觉任务。现有的超分辨率方法（如基于CNN和Transformer的方法）虽然有一定效果，但忽略了红外图像的独特模态特性（如热光谱分布）以及机器感知的需求。将两类损失的梯度直接注入扩散模型的反向过程噪声预测中，迭代优化去噪步骤，实现视觉与感知的协同优化。针对红外图像长波长、低大气散射的特点，强制模型学习其独特的频域分布，提升细节重建能力。DifIISR的创新之处在于引入了。

51-33 LDM 潜在扩散模型论文精读 + DDPM 扩散模型代码实现

AIgraphX

03-22

3712

传统扩散模型 DM 是作用在原始像素级上，Latent Diffusion Models 潜在扩散模型 LDM 则是先对图片进行压缩，将图片表示为潜在空间（Latent Space，而不是像素空间），然后输入扩散模型。LDM 模型在主干网络 UNet 中引入 Cross-Attention，可以输入多模态，实现灵活的图片生成控制。

用于建模人类视觉目标识别的大型且丰富的EEG数据集论文的笔记

MT的博客

06-24

1446

eeg-图像的一个大规模数据集

Visual Decoding and Reconstruction via EEG Embeddings with Guided Diffusion

m0_63855028的博客

04-06

2151

通过引导扩散的脑电图嵌入实现视觉解码和重构本文提出了一种新颖的基于脑电图(EEG)的视觉解码和重建框架，在图像分类、检索和重建任务中实现了最先进的性能。该框架包括一个名为自适应思维映射器(ATM)的定制大脑编码器，将神经信号投射到与图像嵌入共享的子空间中，以及一种分两个阶段的图像生成策略，分别从EEG数据中提取高级和低级视觉特征。该框架的多功能性在EEG和MEG数据上得到了证明，突出了使用低成本、便携式EEG进行广泛的脑机接口应用的潜力。

5000字！全面解读知识蒸馏技术

2301_76168381的博客

05-05

1610

知识蒸馏（Knowledge Distillation）作为一种有效的模型压缩和加速技术，应运而生。它通过将一个复杂的大模型（称为教师模型，Teacher Model）的知识转移到一个较小的模型（称为学生模型，Student Model）中，使得学生模型在保持较小规模的同时，能够尽可能地接近教师模型的性能。简单来说，知识蒸馏就像是一场 “学习传承” 的过程。教师模型就如同一位知识渊博、经验丰富的老师，经过大量数据的训练，掌握了复杂的数据模式和特征知识。

007利用癫痫脑电图数据检测癫痫发作和特征频率的深度卷积神经网络方法-2021

Crystalxxtt的博客

10-22

1614

背景：脑电(EEG)结合深度学习计算方法诊断癫痫发作近年来备受关注。然而，到目前为止，深度学习技术在癫痫发作检测中的应用还没有得到有效的利用，原因是分类器设计不够优化，以及对时域信号的表示不正确。方法：在这项研究中，我们重点设计和评估了。

[NeurIPS 2024] 视觉重建论文解读：Visual Decoding and Reconstruction via EEG Embeddings with Guided Diffusion

qq_50848391的博客

10-13

3058

视觉重建论文

DCAE: A dual conditional autoencoder framework for the reconstruction from EEG into image 文章解读

qq_50848391的博客

10-09

1504

DCAE: A dual conditional autoencoder framework for the reconstruction from EEG into image 一、研究目的设计合适的模型来提取脑电图（EEG）中包含的语义特征并将其可视化为相应的图像二、研究背景研究困境脑电信号的信噪比（SNR）较低且个体差异显着，很难有效地提取脑电信号中包含的语义特征，使得RE2I（EEG TO IMAGE）的实现仍然是一个巨大的挑战 , 目前的研究方法 GAN 需要大量的训练数据，并

EEG_Image_decode：通过EEG信号解码与重构视觉图像

gitblog_00430的博客

04-01

653

EEG_Image_decode：通过EEG信号解码与重构视觉图像项目介绍 EEG_Image_decode是一个创新的开源项目，致力于通过脑电图（EEG）信号实现视觉图像的解码与重构。该项目采用深度学习技术和指导扩散模型，将EEG信号转换为可识别的图像，为脑-机接口（BCI）技术在视觉感知领域的应用开辟了新途径。项目技术分析 EEG_Image_decode项目基于以下核心技术： EEG信...

脑机接口新范式：基于Transformer的EEG信号解码实战

datacanvas2426的博客

06-18

990

脑机接口（BCI）的核心挑战在于。传统CNN/RNN方法受限于局部感受野和时序建模能力，难以捕捉跨脑区全局关联。Transformer凭借与，正在重塑EEG解码的技术范式。

论文阅读笔记：DECODING NATURAL IMAGES FROM EEGFOR OBJECT RECOGNITION