将经颅磁刺激(TMS)与脑电图(EEG)相结合在基础和临床研究中日益受到关注,因为它能用于探测神经回路的反应性与连接性。然而,结合使用 TMS 和 EEG 会产生独特的伪迹,从而使得利用 EEG 来测量 TMS 诱发的神经反应变得具有挑战性。本文概述了 TMS-EEG 数据中存在的各种伪迹以及用于抑制这些不需要信号的离线清理方法。随后,我们描述了开放科学实践(包括专门用于 TMS-EEG 分析的开源工具箱的开发,例如 TESA——TMS-EEG 信号分析工具)如何提升 TMS-EEG 清理方法的可用性与可重复性。我们在此提供了设计 TMS-EEG 清理流程的理论与实践考量,并举例说明如何使用 TESA 比较不同的流程。结果表明,即使仅改变一项针对 TMS 衰减伪迹的清理流程,也会导致 TMS 诱发电位(TEP)在幅度和空间拓扑上出现小的差异。由于选择不同的清理流程会诱发 TEP 的差异,对于使用不同在线和离线方法的研究团队之间比较 TMS-EEG 结果而言,这种差异影响重大。最后,我们讨论了在验证清理流程时所面临的挑战,并建议研究人员在进行 TMS-EEG 实验时使用多条管线对结果进行比较,以确保发现并非取决于清理方法的选择。我们总结认为,持续改进、广泛提供并验证清理流程对于确保 TMS-EEG 充分发挥其作为研究人类神经生理学方法的潜力至关重要。本文发表在Journal of Neuroscience Methods杂志。
关键词:经颅磁刺激;脑电图;数据清理;流程;伪迹;TMS诱发电位;独立成分分析;SOUND: 基于噪声丢弃的源估计算法
可结合以下文献阅读(直接点击即可浏览):
1. 引言
经颅磁刺激(Transcranial magnetic stimulation,TMS)是一种非侵入性的大脑刺激方式,能够通过电磁感应对皮质神经元进行去极化并激活其功能(Barker et al., 1985)。在过去几十年里,不同研究团队尝试在刺激过程中记录脑电图(Electroencephalography,EEG),以刻画大脑对 TMS 的反应(Farzan et al., 2016; Ilmoniemi et al., 1997; Massimini et al., 2005; Rogasch & Fitzgerald, 2013)。EEG 使用放置于头皮表面的电极来测量源自神经活动的电位差,并具有高时间分辨率,从而能捕捉到 TMS 刺激后在大脑各区域依次发生的神经事件。结合 TMS 与 EEG 有望帮助我们更好地了解不同皮质区对 TMS 的反应方式、刺激后活动如何在大脑中扩散,以及不同大脑状态或病理状况如何影响 TMS 所诱发的脑活动(Tremblay et al., 2019)。然而,将这两种技术相结合也伴随着诸多挑战。TMS 脉冲会在 EEG 记录中产生多种记录性和生理性伪迹,掩盖了经颅刺激所诱发的真实神经活动(Ilmoniemi & Kicić, 2010; Rogasch et al., 2014)。尽管部分伪迹可以在数据采集时被避免或减小,但仍有一些伪迹无法规避。此外,某些伪迹的存在会与常规的离线 EEG 处理步骤相互影响,从而产生额外的分析相关伪迹(Rogasch et al., 2017)。综合来看,这些因素促成了针对 TMS-EEG 数据的离线伪迹抑制方法与清理流程(pipeline)的发展(Ilmoniemi et al., 2015)。
随着 TMS-EEG 专用清理方法的不断涌现,其自身也带来了新的挑战。这些新方法的代码通常是在各研究实验室内部开发的,导致其他团队难以复制分析流程或获取最新的清理技术。为满足这一需求,一些开源工具箱应运而生,提供了可半标准化应用的清理方法(Atluri et al., 2016; Rogasch et al., 2017)。然而,选择何种方法以及以何种顺序应用,都会导致可能的清理流程呈指数级增长。越来越多的研究表明,这些选择切实影响最终结果:即使在使用同一数据集的情况下,不同的分析流程也会在清理后的 TMS 诱发电位(TMS-evoked potentials, TEPs)的幅度和空间分布上产生差异(Bertazzoli et al., 2021)。更重要的是,目前尚无统一的流程标准,主要原因在于缺乏可用于对照的“真实标准”(ground truth),因此难以对清理流程进行客观基准测试。总而言之,这些挑战给 TMS-EEG 研究者带来了巨大压力:他们在分析数据时面临一系列不断增加的决策,而这些决策最终会影响研究结论。
本论文的目标是概述 TMS-EEG 记录中抑制伪迹时所面临的挑战,并就 TMS-EEG 分析流程的设计和实施提供实用建议。我们首先介绍由于伪迹导致在 TMS 脉冲后使用 EEG 记录神经活动时所遇到的问题,并讨论一些旨在减少 TMS-EEG 数据中伪迹影响的离线方法。随后,我们概述 TESA 工具箱(一个基于 MATLAB、专门清理 TMS-EEG 数据的开源函数库,作为 EEGLAB 的插件实现)的设计动机与功能,并与该领域中其他开源工具箱进行对比。接下来,我们提出在设计 TMS-EEG 清理流程时需要考虑的一些通用原则。随后,我们展示了一个使用 TESA 来实现和测试不同清理流程的实用示例,主要比较了几种消除 TMS 后衰减伪迹的方法,并证明即使仅在流程中改变一个步骤,也会导致不同的结果。最后,我们回顾了验证 TMS-EEG 清理流程所面临的挑战与未来方向,并提出了如何最大程度减少清理方法选择对 TMS-EEG 研究结果影响的建议。
2. 同步TMS-EEG:伪迹带来的挑战
在 TMS 刺激过程中记录 EEG 活动在多个层面上都具有挑战。首先,TMS 脉冲会与 EEG 记录设备相互作用,产生多种类型的伪迹。本文中,我们将“伪迹”定义为并非由 TMS 脉冲经颅直接刺激目标皮质区而生成的任何 EEG 信号。对我们而言,感兴趣的信号包括:由刺激目标区引发的活动,以及在远离目标区处由于突触传播产生的活动。TMS 脉冲产生的大幅度、随时间变化的磁场会与皮肤-电极-放大器回路相互作用,进而产生远大于 EEG 所能测量的神经活动量级的“脉冲伪迹”(图 1A 所示)。早期的 EEG 放大器常会因这类伪迹而出现饱和,并在数秒之后才能恢复到可用的记录范围,这使得同时进行 TMS-EEG 几乎不可能(Cracco et al., 1989; Izumi et al., 1997)。过去二十年来出现了更现代化的放大器,其工作范围足够大,能在不发生饱和的情况下捕捉到脉冲伪迹,并在脉冲后 1–2 毫秒内恢复(Bonato et al., 2006; Daskalakis et al., 2008; Rogasch et al., 2013; Veniero et al., 2009)。需要注意的是,在设置此类放大器的记录参数时必须谨慎,例如,如果抗混叠滤波(anti-aliasing filter)的截止频率设置不当,可能会造成次生伪迹(如脉冲伪迹周围的振铃效应)。此外,在某些放大器中还可能出现时长可变的瞬时伪迹(图 1A 所示)。另一些专门设计的放大器采用“采样保持”电路,在 TMS 脉冲期间固定放大器的记录,从而彻底规避了此伪迹(Ilmoniemi et al., 1997; Virtanen et al., 1999)。TMS 脉冲还会在皮肤/电极界面(或可能在电极导线和放大器内部)产生额外的电荷或涡流,并形成“衰减伪迹”。此伪迹通常符合幂律分布,可持续 10–100 毫秒(Freche et al., 2018; Julkunen et al., 2008; Sekiguchi et al., 2011)(图 1B 所示)。TMS 线圈与电极之间的接触还会在这些电极上引入额外的工频噪声(也称射频噪声)和运动伪迹(Ruddy et al., 2018);而 TMS 脉冲后电容的充电也会引发充电伪迹,其时序和幅度会随 TMS 强度而改变(Rogasch et al., 2013; Veniero et al., 2009)。更为复杂的是,这些伪迹的存在与幅度还取决于用于数据采集的硬件条件。虽然某些硬件系统中某些伪迹的特征似乎一致,但已有文献显示,不同 TMS 设备(Rogasch et al., 2013)、TMS 线圈(Fernandez et al., 2021)和 EEG 电极(Mancuso et al., 2021)之间的伪迹模式存在差异;在 TMS-EEG 社区中也有非正式报告指出,不同 EEG 放大器可能产生不同的伪迹特征。不同实验室使用的硬件组合极其多样,这为跨研究团队数据比较带来了真正的挑战:不同的硬件组合可能会导致不同甚至独特的伪迹模式。
图 1. TMS-EEG 记录中常见的伪迹
图 1A:一个示例显示从 0~2 毫秒的 TMS 脉冲伪迹(蓝色)以及在 ~6 毫秒前结束的、很可能与放大器有关的额外瞬时伪迹(红色)。
图 1B:一个示例显示在单个电极上出现的大幅度衰减伪迹(红色)。
图 1C:一个示例显示 TMS 引发的肌电伪迹(红色),在 ~4 毫秒和 ~8 毫秒处出现峰值。
第二大污染源是 TMS 与生理系统相互作用而在 EEG 中产生的信号。TMS 脉冲可以直接或通过激活运动神经元来去极化面部和头皮肌肉(Korhonen et al., 2011; Mutanen et al., 2013; Rogasch et al., 2013)。由此产生的复合肌肉动作电位,与经皮神经刺激后记录到的外周肌肉 M 波或 TMS 后的运动诱发电位(MEP)形状相似,通常在脉冲后 ~4–5 毫秒和 8–10 毫秒处出现双相峰值,并持续 ~10–100 毫秒(确切时长还取决于 EEG 的采样率和滤波设置)(图 1C 所示)(Mutanen et al., 2013; Rogasch et al., 2013)。TMS 引发的肌肉活动在对外侧区域进行刺激时更为明显,其峰峰值可高达 1–2 mV,远高于神经信号在 EEG 中的幅度量级(Mutanen et al., 2013; Rogasch et al., 2013)。头皮肌肉收缩产生的运动也可能导致更加持续的衰减伪迹(>50 毫秒),并常常难以与由皮肤-电极-放大器回路电荷所引起的衰减伪迹区分(Rogasch et al., 2014)。
同时,TMS 刺激引发的强烈感觉(无论是刺激面部、头皮肌肉还是其他颅神经)还可能导致躯体感觉诱发电位(Conde et al., 2019; Gordon et al., 2021)。关于这些电位是否能在头皮 EEG 中被直接观测到仍有争议(Paus et al., 2001; Rocchi et al., 2021),但也有研究显示,当向头皮施加更强的电刺激时,100–200 毫秒之间的电位会增强(Gordon et al., 2021)。TMS 引发的肌肉活动带来的不适还可能使受试者出现下颌或面部紧张,从而在 EEG 信号中(尤其是覆盖肌肉的侧部电极处)出现持续高水平的肌电活动。此外,在刺激额区时,部分被试会出现眨眼反应,通常在脉冲后 80–150 毫秒发生,导致额部电极上出现 >20–30 µV 幅度的振荡(Bruckmann et al., 2012; Rogasch et al., 2013, 2014)。
最后,TMS 脉冲会发出较大的“咔哒”声,诱发明显的听觉电位(~100 和 200 毫秒时出现峰值)(Nikouline et al., 1999)。值得注意的是,即使使用耳机噪声等在线掩蔽手段,也无法完全消除在 TMS-EEG 中出现的听觉诱发电位(Biabani et al., 2019, 2021; Conde et al., 2019; Fernandez et al., 2021; Gordon et al., 2018; Herring et al., 2015)。对于此类感觉诱发电位(例如 TMS 线圈敲击声所致),是否将其视为伪迹主要取决于研究目标。如果研究仅关注大脑整体对 TMS 的反应,那么这些感觉诱发电位是一种客观存在的神经反应;绝大多数 TMS 研究并未刻意减少感觉输入,这些电位也会普遍出现。然而,如果研究特意关注 TMS 经颅刺激目标皮质回路所产生的反应,那么此类感觉诱发电位就会成为潜在问题,因为它们会与 TMS 引发的皮质活动混叠或相互影响。总体而言,这些不同来源的伪迹在某些实验条件下(脉冲伪迹本身除外)可解释数据方差的 70% 以上(Rogasch et al., 2014),严重干扰了对经颅刺激直接引发的皮质回路神经活动模式的观测。关于 TMS-EEG 伪迹的更多讨论可见相关综述(Ilmoniemi et al., 2015; Ilmoniemi & Kicić, 2010; Rogasch et al., 2017)。
3. 在 TMS-EEG 数据中尽量减少伪迹:在线与离线方法
鉴于伪迹在 TMS-EEG 信号中可能占据相当大的比例,TMS-EEG 领域发展出了广泛的技术来尽量减少伪迹干扰。在这一技术谱系的一端,在线(online)方法尝试在数据采集过程中就避免所有伪迹;而在另一端,离线(offline)方法则并不在记录过程中避免伪迹,而是通过后续的数据清理方法来移除或抑制这些不需要的信号。实际上,大多数研究团队会结合使用在线与离线方法,以最大程度减少 TMS-EEG 数据中的伪迹。这种做法上的差异通常与各研究团队在实验设置以及研究问题上的差异有关。然而,正如多篇针对 TMS-EEG 现状的评论所指出的(Belardinelli et al., 2019; Siebner et al., 2019),这些研究间在在线和离线方法上的差异也可能是导致文献中 TMS 诱发电位(TMS-evoked potentials, TEPs)特征(例如幅度、形状、空间分布)高度可变的主要原因。或许该领域面临的最大挑战在于:如何制定统一的检测和分析流程,让不同研究团队获取的 TEP 结果能够更直接地进行比较。
在线方法
在线方法包括一系列在数据采集过程中执行的技术,例如:
-
使用对 TMS 脉冲和衰减伪迹更具鲁棒性的设备(如特定种类的 TMS 线圈、EEG 放大器、EEG 电极);
-
在皮肤-电极界面上进行充分、仔细的准备以降低阻抗并避免衰减伪迹(包括旋转电极导线以最大化共模抑制 (Sekiguchi et al., 2011),甚至使用微穿刺 (Julkunen et al., 2008));
-
推迟 TMS 设备电容的充电时间,使其避开分析窗口(Rogasch et al., 2013)(需要注意的是,像 MAGIC 这样的工具箱能对 TMS 设备的刺激参数(包括电容充电时间)进行外部控制 (Habibollahi Saatlou et al., 2018));
-
仅刺激靠近中线的皮质区域,以减少 TMS 引发的肌肉活动、眨眼以及其它强烈感觉(Ferrarelli et al., 2012; Massimini et al., 2005; Rosanova et al., 2009);
-
使用尽可能匹配 TMS 线圈敲击噪声频谱特征的噪声掩蔽技术(Massimini et al., 2005; Russo et al., 2022)。
值得注意的是,在线方法还包括在数据采集时实时查看 TEP 信号,并根据需要调整线圈的位置/朝向及刺激强度,以1)确保在前 50 毫秒内产生一个被认为源自直接刺激靶点的显著 TEP;2)降低 TMS 引发的肌电及其他伪迹(Casarotto et al., 2022)。
在线方法的主要优点在于可获得较好的信噪比,同时也显著简化了离线数据清理流程。然而,该方法只适合在特定实验设计中应用,比如要求所刺激的皮质区域位于中线附近,并且能在一定范围内灵活调整 TMS 线圈位置。此外,直到最近,市面上还缺少能够实时查看 TEP 的开源或商业化工具,不过已有一些工具箱开始出现(如 rt-TEP toolbox (Casarotto et al., 2022),BEST toolbox (Hassan et al., 2021))。
离线方法
离线方法推动了对多种 EEG 分析方法的开发或改进,专门用于应对 TMS-EEG 信号中常见的伪迹。例如,各类盲源分离算法(如独立成分分析 ICA;具体实现包括 INFOMAX、FastICA 以及增强型通胀法等)(Hamidi et al., 2010; Hernandez-Pavon et al., 2012; Korhonen et al., 2011; Metsomaa et al., 2014; Rogasch et al., 2014) 和主成分分析(PCA;方法包括数据压缩与抑制)(Hernandez-Pavon et al., 2012; ter Braack et al., 2013),都已被改进以识别并抑制 TMS 引发的肌肉伪迹。基于源空间的空间滤波方法(如信号空间投影 SSP 以及结合源信息重建的 SSP-SIR)(Mäki and Ilmoniemi, 2011; Mutanen et al., 2016) 也有类似的改进。
对于衰减伪迹的抑制,研究者开发了多种方法,包括前述的各类 ICA 变体,基于源估计和噪声丢弃(SOUND)算法(其利用迭代 Wiener 估计和 EEG 前向建模来检测并抑制单个电极的噪声)(Mutanen et al., 2018),以及通过为衰减信号拟合不同模型(如线性、指数、幂律或基于皮肤-胶体-电极界面的物理模型)并将模型估计值从数据中扣除的方法(Casula et al., 2017; Freche et al., 2018; Van Der Werf and Paus, 2006; Zanon et al., 2010)。此外,ICA 通常还用于抑制其他常见的伪迹,如眨眼/眼动及持续的肌电活动 (Rogasch et al., 2014)。而在将 TMS 引发的感觉活动与经颅刺激皮质回路所引发的活动区分这一应用中,研究者尝试了 ICA、SSP-SIR (信号空间投影源信息重建)以及模板减法(如扣除对照条件)(Bender et al., 2005; Biabani et al., 2019; Rogasch et al., 2014)。如果读者想了解不同清理方法的更多细节,可以参见其他几篇综述 (Ilmoniemi et al., 2015; Ilmoniemi and Kicić, 2010; Rogasch et al., 2017)。
离线方法的主要优点在于,刺激部位的选择不局限于避开头皮/面部肌肉的中线区域。然而,离线抑制伪迹也面临若干挑战:
1.许多用于清理 TMS-EEG 数据的新分析方法是在各自实验室内部开发的,这使大多数研究者难以复现相关代码,从而导致可重复性问题;
2.各类不同的分析方法数量庞大,导致可能的清理流程组合呈指数级增长。尤其值得注意的是,验证这些不同的分析方法及流程(即判断它们能否在尽量保留感兴趣信号的同时准确抑制伪迹)非常困难,因为我们并不知道“真实信号”(ground-truth)究竟是什么(也就是 TMS 经颅刺激所诱发的真实神经反应);
3.将多个预处理步骤组合到一个复杂的流程中,可能会对最终的清理结果产生相互影响,这些相互作用往往难以控制。
因此,研究人员在选择分析流程时会面临一系列艰难决策,同时往往无法确定最终获得的“干净”TEPs 是否真能准确反映感兴趣的神经信号。以下各节我们将对这些挑战进行更为深入的讨论。
4. TESA 工具箱
为了应对离线 TMS-EEG 分析在可重复性上所面临的挑战,过去五年间出现了数个开源的 TMS-EEG 分析工具箱。其中由我们团队开发的一个工具箱是 TESA(TMS-EEG signal analyser)(Rogasch et al., 2017)。TESA 的设计有两个主要目标:
1)提供一个在 TMS-EEG 研究中使用的离线分析方法的标准化函数库;
2)让没有脚本或编程背景的研究人员也能轻松开展 TMS-EEG 分析。
为实现这些目标,TESA 被构建为 EEGLAB(Delorme & Makeig, 2004)的一款插件(也称拓展),EEGLAB 是一个基于 MATLAB 平台的、广受欢迎的开源 EEG 分析工具箱。将 TESA 构建在 EEGLAB 框架中具有多重优势:
-
首先,EEGLAB 本身已经拥有大量的 EEG 分析函数,用户可将这些函数与 TESA 提供的功能相结合进行分析,并且许多从事 EEG 研究的学者已经十分熟悉 EEGLAB 的工作流程;
-
其次,EEGLAB 具有模块化框架,允许在设计和实现分析流程时具有很高的灵活度;
-
最后,EEGLAB 提供了一个成熟的图形用户界面(GUI),对于不熟悉编程的用户来说,使用 GUI 运行分析更为直观。对于编程水平较低的研究者,EEGLAB GUI 还能将已有的预处理操作记录转换为可执行的 MATLAB 脚本,方便后续复现。
TESA 附带了一个免费在线用户手册,详细介绍了 TESA 中各分析函数的理论基础以及如何使用该工具箱。这个用户手册也是向研究人员介绍 TMS-EEG 分析进展与潜在陷阱的重要渠道。
鉴于尚无任何“最佳”TMS-EEG 数据分析流程的共识,TESA 并不提倡任何单一处理策略。实际上,TESA 的中心理念之一就是尽可能让研究者获取更多分析功能,从而比较不同方法对 TMS-EEG 分析结果的影响。随着新的方法不断出现,TESA 也在持续发展。最近的更新中加入了基于源的伪迹清理算法(如 SSP-SIR(信号空间投影源信息重建) 和 SOUND(基于源估计的噪声丢弃算法) (Mutanen et al., 2020)),以及本篇文章发布时所附最新版本中包含的“拟合并移除(fit and remove)”函数 (Freche et al., 2018)。值得强调的是,TESA 托管在 GitHub(https://github.com/nigelrogasch/TESA/releases)上,任何用户都可从这里下载或对其进行贡献。我们希望在 TMS-EEG 社群的支持下,TESA 能继续不断壮大与完善。
除了 TESA 之外,还有其他多个开源 TMS-EEG 工具箱,其设计理念和功能各不相同。例如,在与 EEGLAB 框架相同的平台下开发的 TMSEEG 工具箱 (Atluri et al., 2016) 也具有专门的 TMS-EEG 分析功能,并配有一个更具流程化的 GUI;它提供了单次重复试验层面的通道移除与插值功能,可减少数据丢失,但缺少针对 ICA 以外的部分伪迹拒判技术。FieldTrip (Oostenveld et al., 2011) 是另一个受欢迎的、功能多样的 MATLAB 开源 EEG 工具箱,与 EEGLAB 的差别在于它没有 GUI,但提供了若干面向 TMS-EEG 分析的模块化函数(https://www.fieldtriptoolbox.org/tutorial/tms-eeg/)。ARTIST 工具箱 (Wu et al., 2018) 则是一个独立的 TMS-EEG 分析工具箱,运行于 MATLAB 环境,与其他工具箱不同之处在于其尝试构建一个高度自动化的分析流程,通过启发式规则和机器学习方法来自动执行分析中的手动操作(例如选择需要剔除的试次/通道/ICA 成分)。为实现自动化,ARTIST 的数据处理流程是固定的,并仅适用于电极布局相似的数据集,因为其分类器需基于固定电极布局来选择 ICA 成分。除此之外,已有一些研究团队开发了新的 TMS-EEG 清理功能或流程,并公开了代码,这也是确保结果可重复的极佳方式 (Cline et al., 2021; Freche et al., 2018)。可以说,随着开源代码与工具箱的发展,TMS-EEG 研究中所面临的分析可重复性问题在很大程度上已得到缓解;现有的这些工具箱都能为研究者提供先进的清理方法。然而,这些多样的开源选择还未能解决研究团队之间在预处理流程上差异巨大的问题,这依旧阻碍了对 TMS-EEG 结果的跨团队比较。
5. TMS-EEG 清理流程的设计与实施要点
开源工具箱为 TMS-EEG 数据清理提供了多种专门的分析功能。接下来的问题在于:如何将这些清理步骤整合到整体的 TMS-EEG 分析流程中?由于 TMS-EEG 数据的伪迹特征较为独特,常见的事件相关 EEG(event-related EEG)范式中分析步骤的顺序往往不适用于 TMS-EEG。尤其需要注意的是,在不当的条件下使用某些清理步骤,可能会引入更多与分析相关的伪迹 (Rogasch et al., 2017)。此外,如果预处理步骤的顺序安排不当,也可能导致分析结果出现复杂的相互作用效应。再者,EEG 领域中某些清理策略所基于的假设,在 TMS-EEG 数据中可能并不完全成立。本节我们将概述在设计与实施 TMS-EEG 清理流程时需要考虑的关键因素,并提供一些实用建议,以便在问题出现时能够及时识别。
5.1. 在数据采集过程中尽量减少伪迹
鉴于离线移除伪迹面临的诸多挑战,应尽可能在 TMS-EEG 数据采集过程中避免伪迹的产生。虽然此建议并不直接涉及清理流程本身的设计,但若原始数据中的伪迹更少,后续清理难度也会大大降低,同时对假设的依赖也更小,从而使数据分析大幅简化。最基本的做法是确保对电极-皮肤界面进行充分的准备,并在整个实验过程中保持低阻抗值(最好低于 5 kΩ),以尽量减少衰减伪迹。对于可旋转电极的 EEG 帽,通过调整电极导线朝向也可能有助于增强对衰减伪迹的抵消。应鼓励被试在实验过程中尽量放松面部肌肉,以减少持续性的肌肉伪迹;如果实验过程中观察到肌肉活动,研究者可给予简单反馈(如轻拍肩膀或视觉提示)来提醒被试放松。研究者还应确保被试的姿势尽量舒适,并避免将刺激线圈紧压在头部,以减少颈部和头部肌肉的紧张。此外,若实验设计允许,应将 TMS 电容的充电时刻推迟到不在感兴趣的时间窗口内(通常指 TMS 脉冲后 500 毫秒之内)。在实验设计允许的情况下,优先选择位于中线且不会在 TMS 后触发肌肉活动或眨眼的刺激靶点。理想情况下,应在数据采集时进行在线监控,以确保 TMS 引发的肌肉及眨眼伪迹不出现在数据中,并在必要时调整线圈位置直至这些伪迹最小化 (Mutanen et al., 2013)。最后,应采取一切必要措施以减少 TMS 脉冲后引发的听觉输入,从而避免听觉诱发电位 (Rocchi et al., 2021; Russo et al., 2022),包括在线圈与电极之间设置屏障以降低振动 (Ilmoniemi et al., 2015)。虽然这些步骤可能会延长实验时长,但能显著简化后续的清理过程,并增强对最终 TEP 结果的信心。
5.2. 设计与数据伪迹概况相适配的清理流程
或许许多人会认为,TMS-EEG 流程开发的目标应该是设计出一个可通用的“黄金流程”,可在所有研究中加以应用。然而,TMS-EEG 数据中伪迹特征的巨大差异性意味着,几乎不可能有一条单一的清理流程适用于所有情境。例如,如果实验设计能使线圈远离头皮肌肉,则有可能获得相对“干净”的信号,这种情况下只需少量清理步骤即可,甚至不必依赖某些较为“激进”的清理方法。与之相对,如果实验需要刺激位于外侧皮质(如背外侧前额叶皮质)的区域,就不可避免地会出现 TMS 引发的肌肉活动,因此必须利用专门的流程来充分抑制这类伪迹,以揭示背后的神经活动。此外,不同的 TMS-EEG 硬件搭配往往会捕捉到不同的伪迹,自然而然就需要有不同的预处理手段。由于像 ICA、SSP(信号空间投影 ) 这类信号分离方法会对数据造成明显改动,只有在万不得已时才应使用,并且在可能的情况下最好避免(参见第 5.4 节的建议)。因此,在设计 TMS-EEG 清理流程时,必须仔细评估所采数据中的伪迹特征,并仅在需要时才使用“高强度”清理步骤(如信号分离方法)。
5.3. 避免在存在大幅电位突变的数据上应用时间滤波
在设计 TMS-EEG 清理流程时,最重要的考虑因素之一是:在对数据应用时间滤波前,应最大限度地减少数据中大幅电位跳跃或陡峭的过渡。这些电位突变在 TMS-EEG 实验中可能由多重因素引起。首先,TMS 脉冲会造成一个极高幅度且高频的瞬时伪迹,虽然时间很短,但通常会从数据中剔除。除了脉冲伪迹之外,在 TMS 后信号可能由于衰减伪迹和/或 TMS 引发的肌肉活动而与刺激前信号之间存在持续性电平偏移。最后,TMS 电容的再充电也可能造成高频伪迹。
时间滤波在 EEG 分析中广泛用于抑制低频(高通滤波)或高频(低通滤波)噪声(也可同时进行,即带通滤波),以避免降采样后出现混叠伪迹(反混叠滤波),或抑制工频噪声这类带限窄带噪声(带阻或陷波滤波)(de Cheveigné & Nelken, 2019)。时间滤波还常用于优化后续处理步骤,如 ICA(它在遇到低频漂移时会更难收敛 (Winkler et al., 2015))。然而,在存在明显电位突变或陡峭过渡时应用时间滤波,可能会因滤波器与这些信号突变相互作用,而在数据中引入振铃或漂移伪迹 (de Cheveigné & Nelken, 2019)。而且,由于 EEG 分析中常用的非因果(零相位)滤波器(即滤波器会在数据前后各通过一次以最小化相位偏移),这些伪影可能出现在过渡事件的前或后,持续数百毫秒,看起来类似于振荡或事件相关电位(ERPs)。因此,当 TMS 诱发电位突变或高频事件进入信号时,务必在任何时间滤波(包括反混叠滤波、带通或带阻滤波)之前先行移除或尽可能抑制这些伪迹,从而避免振铃伪迹。具体做法包括:去除受 TMS 脉冲伪迹影响的段落,并使用三次样条或自回归函数对该段缺失数据进行插值,平滑前后信号间的过渡,从而尽量减少在降采样前应用反混叠滤波时出现的振铃 (Cline et al., 2021; Rogasch et al., 2017)。如果数据中存在 TMS 引发的肌肉或衰减伪迹,则在带通滤波前先使用 ICA、SOUND 或拟合并扣除(fit-and-subtract)方法可帮助抑制这些伪迹所致的大幅电位突变。此外,滤波器本身的设计(例如其过渡带陡峭度由滤波器阶数决定)也可能需要进行优化,尽管我们尚未发现针对 TMS-EEG 数据在滤波器设计方面进行系统比较的文献。一项最新研究提出了一种修正型高通滤波方法,用自回归模型将脉冲伪迹前后的数据向两端外推,然后分别对前后段进行滤波,以避免在 TMS 脉冲周围出现振铃或漂移伪迹 (Cline et al., 2021)。
需要强调的是,在 EEG 放大器将模拟信号数字化时,反混叠滤波是必需的。由于许多与 TMS 脉冲相关的突变在实验中无法回避,因此采样率应当设置得足够高,以免因放大器滤波导致测量信号产生振铃。例如,如果 EEG 放大器没有采样保持电路来屏蔽 TMS 脉冲伪迹,那么设置 5000 Hz 或更高的采样率(对应至少 1000 Hz 的低通滤波)能使高振幅伪迹在磁刺激后迅速恢复到正常范围。
高通滤波也常用于去除 TMS-EEG 数据中的低频漂移。但如果数据中包含大量眼动伪迹(其持续时间可达数百毫秒),那么在移除这些间歇性伪迹之前应用高通滤波,可能会引入额外的低频振铃伪迹。因此在数据采集时,推荐只使用最低限度的高通滤波,或使用直流耦合放大器(DC-coupled amplifier)而不进行高通滤波。
此外,一些必须在滤波前执行的预处理方法(如某些需要对数据分段的算法)同样值得注意。若在分段数据上滤波,则可能在分段边界引入额外伪迹,因为零填充(zero-padding)会导致边界处出现不连续。因此,需要确保分段的长度足够大,以便在丢弃受滤波伪迹影响的数据后,仍能保留感兴趣的时间窗口(例如 TMS 脉冲附近的时间段)。总之,TMS-EEG 数据具有独特的伪迹特征,分析步骤的执行顺序对最终结果影响显著。在设计分析流程时,务必仔细考虑各分析步骤之间可能的相互作用。
5.4. 谨慎使用信号分离方法
在针对 TMS-EEG 数据的清理流程中,独立成分分析(ICA)几乎已成“标配”,主要用于抑制数据中的各种伪迹源。事实上,ICA 应用于实验数据后,所得到的一些成分的空间分布和时间变化可以与在 TMS-EEG 数据中期望出现的神经或伪迹源相符合 (Rogasch et al., 2014)。然而,人们常常忽视的一个重要问题是:这些成分是否能准确反映底层信号?ICA 的核心假设在于各源信号统计独立。实际上,这意味着 EEG 信号中的每个独立源都应具有足够的时间变异性;但 TMS 会在神经信号和伪迹信号两方面都引发高度时间锁定的活动,大幅削弱了源与源之间的时间变异性,从而降低源之间的统计独立度。
Metsomaa 等人 (Metsomaa et al., 2014) 使用模拟的 TMS-EEG 数据验证了这一问题:当存在典型 TMS 伪迹(如 TMS 引发的肌肉与衰减伪迹)时,常规 FastICA 方法无法准确分解大多数底层信号的空间分布。Hernandez-Pavon、Metsomaa 等人的研究 (Hernandez-Pavon et al., 2012) 同样表明,在模拟信号与真实 TMS-EEG 数据叠加的情境下,尤其在存在大幅肌肉伪迹时,FastICA 难以正确恢复该模拟信号的时间过程和拓扑分布。换言之,对于 TMS-EEG 数据而言,ICA 算法给出的各成分虽然看起来合理,但不一定真实。
对实际操作来说,如果我们使用 ICA 来识别并移除伪迹成分,就有可能因 ICA 分解不准而扭曲底层的神经信号,特别是当数据中存在强烈的 TMS 引发肌肉活动时。为减小这一问题的影响,一种方法是在 ICA 之前先用 PCA 抑制这段受影响的信号 (Hernandez-Pavon et al., 2012),或者将最主要的肌肉活动峰(例如前 10–15 毫秒的数据)剔除 (Rogasch et al., 2014),但具体效果尚不明确。
此外,数据失真并非 ICA 所独有的问题。其他信号分离方法(如 SSP(信号空间投影 ))也会大幅改变底层信号。比如,Mäki 等人 (Mäki & Ilmoniemi, 2011) 显示通过高频(>100 Hz)部分识别与肌肉活动相关的空间分布,可以借助 SSP 来抑制 TMS 引发的肌肉活动,但也因此严重削弱了剩余的 EEG 信号,尤其是刺激位点附近的电极处。Mutanen 等人 (Mutanen et al., 2016) 进一步指出,若采用依赖于引导场协方差矩阵精确建模的源信息重建 (SSP-SIR(信号空间投影源信息重建)) 方法,可以一定程度地减轻这一过度校正,但当抑制幅度很大的伪迹时,神经信号仍然难免会被过度抑制。Biabani 等人 (Biabani et al., 2019) 也发现,SSP-SIR (信号空间投影源信息重建)方法可将 TMS 引发的感觉信号与经颅刺激皮质回路所引发的信号分离,使传感器和源空间模式更具合理性,相比线性回归和 ICA 效果更好。但此方法仍会显著降低信号幅度,且尚不清楚所得到的 TEP 能否准确反映 TMS 经颅诱发的神经活动强度。此外,SSP (信号空间投影 )方法还假设所关注的伪迹在空间上与经颅神经活动互不相关。然而对于某些实验设置(例如刺激部位与感觉输入区域重叠),这一假设未必成立。综上所述,对于使用此类信号分离方法获得的 TMS-EEG 数据,应保持谨慎态度——虽然它们可以抑制伪迹,但也可能严重扭曲感兴趣的神经信号。
5.5. 必要时对数据集进行拼接
在很多 TMS-EEG 实验中,研究者需要比较不同实验条件下采集到的 TEP(经颅磁诱发电位)(例如在干预前后对同一刺激位点进行多次刺激,或比较刺激不同皮质区域所诱发的 TEP)。有时,为了保证对比条件下的数据均接受相同的信号分离处理(如 ICA),从而避免在分别分析时不一致地移除成分带来的偏差,一些研究会在分析流程的早期(通常在分段后)就把不同条件的数据拼接(concatenate)在一起 (Chung et al., 2017; Rogasch et al., 2015)。此外,合并更多的数据点也有利于满足运行 ICA 所需的最小数据量。然而,数据拼接并不总是合适的。
例如,如果不同条件之间在脑信号和伪迹特征上存在显著差异,那么在拼接后进行 ICA 分解可能并不理想。这种情况常见于刺激不同的皮质区域时,由于伪迹概况和激活的神经群体均大不相同。若在数据采集过程中更换了电极位置(例如重新佩戴电极帽,或在实验中途重新导电胶等),那么基于对空间分布保持稳定(stationarity)的假设就被破坏了,因此也不应对这些数据进行同一次 ICA。综上,数据拼接仅适用于在信号概况基本一致的条件(如在同一实验中对同一刺激部位进行多次刺激)。
若预期相比条件之间所包含的伪迹确有差异,且无法进行拼接,那么可以采用空间滤波方法(如 SSP-SIR(信号空间投影源信息重建))在后续处理时对伪迹子空间进行投影剔除。虽然这种方法可能会对所关注的神经信号造成更强烈的整体削弱,但至少可以保证在比较的数据集中出现相同程度的“过度校正”,从而在两者之间进行公平对比。
5.6. 不要盲信默认参数
在使用开源工具箱进行分析时,另一个需要重点考虑的问题是如何选择不同清理方法的输入参数。通常,一个清理方法的效果在很大程度上取决于对该方法起调控作用的输入参数(例如,在 SOUND (基于源估计的噪声丢弃算法)算法中,lambda 参数用于控制对信号中“噪声”的抑制程度;在 TESA 的成分选择函数中,启发式的阈值会影响对成分的分类等)。在大多数工具箱中,这些参数都有默认值,往往是基于某个(通常是少数)测试数据集上效果较好的设置而定。然而,这些默认值未必适用于新的数据集:若新数据集在采样率、电极数量等指标,或伪迹特征(例如更强的衰减伪迹或 TMS 引发的肌肉活动等)上与原始测试集差异较大,那么默认设置可能就不再理想。因此,如果直接使用默认设置,研究者需仔细检查清理结果,判断是否出现了“不需要”或“效果欠佳”的现象(参见下文的建议 5.7)。此外,通过尝试一系列不同的参数值,也能帮助更好地理解某个输入参数对清理性能的实际影响。
另一方面,也不能将这些输入设置视作“自由参数”,无限调试直至得到想要的研究结果。虽然常常具有一定难度,但理想情况下,参数设置应尽量基于与当前信号处理步骤直接相关的客观标准,而不是完全依赖个人主观偏好。另外,评估清理效果时也不应使用与该清理方法同样的假设。举例来说,如果使用基于最大化源独立性的 ICA 去抑制肌肉伪迹,那么可以结合时频分析等准则来确定到底需要移除多少个独立成分才能有效压制该伪迹(详见第 7 节)(Mäki and Ilmoniemi, 2011; Mutanen et al., 2016)。再比如,如果想使用 SOUND (基于源估计的噪声丢弃算法)算法来清理噪声电极 (Mutanen et al., 2018),研究者就可以找一个在信噪比(SNR)与过度校正之间平衡较好的正则化参数(lambda 值)。由于 SOUND 的目标是通过交叉验证电极信号以最大化 SNR(信噪比),因此用于确定正则化参数的 SNR 估计可参考基于频域分析的方式 (Nikulin et al., 2011),而过度校正的程度则可参考基于正向模型(forward modelling)的方法来评估 (Salo et al., 2020)。
5.7. 经常对数据进行可视化
在设计 TMS-EEG 分析流程时,一个行之有效的技巧就是在每一步清理操作后都对数据进行可视化。这样做主要有两方面的好处:
1.研究者可以快速判断,此清理步骤针对的伪迹是否已得到充分抑制;
2.助于及时发现清理操作可能对数据带来的非预期失真。
例如,如果滤波后在刺激脉冲前出现振铃或电平偏移,可能表明数据中存在某个突变点在与零相位滤波器产生相互作用。虽然这条建议带有一定的主观性质,也要求研究者具有识别伪迹与不期望信号失真的经验,但经常对数据进行可视化的重要性不可低估。
除了在预处理阶段多次检查数据之外,还建议研究者尝试使用多种可视化方式。通道随时间的波形图(channel time course)或许能揭示滤波伪迹(如振铃),但地形图(topographical plots)在突出显示受污染的电极时更有效;另一方面,对通道信号进行时频变换可以帮助识别残余的工频噪声(在 50 Hz 或 60 Hz 附近出现尖锐峰值)或 TMS 引发的肌肉伪迹(在脉冲后立即出现较宽带的能量增强)。
6. 清理步骤的选择会带来差异:使用 TESA 工具箱的实践示例
前文给出了在设计 TMS-EEG 流程时的一些通用建议。然而,在具体操作中,研究者仍需决定究竟选用哪些清理方法,以及按照什么顺序进行。一个关键问题是:这些选择对最终的 TEP 是否会产生实质性影响?如果不同流程最终都能得到相同的 TEP,那么流程的选择就无关紧要。但越来越多的研究表明,在抑制 TMS 引发肌肉与衰减伪迹(如使用 ICA、PCA 或去趋势模型)时,不同清理方法所导致的 TEP 结果确实会不同 (Casula et al., 2017; Hernandez-Pavon et al., 2012; Korhonen et al., 2011; Rogasch et al., 2014)。此外,近期有研究对比了来自不同开源 TMS-EEG 工具箱的“默认”清理流程 (Bertazzoli et al., 2021)。其中三个流程都使用了类似的清理方法(例如 ICA),但顺序不同;而第四个流程则采用 SSP-SIR(信号空间投影源信息重建) 和 SOUND(基于源估计的噪声丢弃算法)。该研究发现,在几乎所有流程对比中,最终 TEP 均有所差异,这表明清理步骤执行顺序(以及所使用的工具箱)确实会影响 TEP,即使所采用的方法名称相同。
上述多数对比研究都基于具有复杂伪迹特征的 TMS-EEG 数据,其中常含有 TMS 引发肌肉活动、衰减伪迹以及在某些情况下出现的时间锁定眨眼。对于只存在“简单”伪迹(例如仅有衰减伪迹、没有明显的 TMS 引发肌肉活动)的数据而言,不同 TMS-EEG 清理流程会不会也产生截然不同的结果,目前尚不清楚。为考察使用不同方法抑制衰减伪迹是否也会导致不同的 TEP,并为如何利用 TESA 比较分析流程提供一个实践示例,我们选取了一个伪迹特征比较清晰的数据集,使用三种不同流程对比得到的 TEP:分别使用 FastICA、SOUND 以及去趋势模型来处理衰减伪迹。除衰减伪迹清理步骤外,其余处理过程尽量保持一致。我们推测:不同的清理方法会导致最终 TEP 在幅度和空间分布上出现差异。
6.1. 方法(Methods)
6.1.1. 数据(Data)
本分析所使用的数据来自一项尚未发表的大型研究,该研究包括磁共振成像(MRI)、静息态 EEG、基于任务的 EEG,以及针对左背外侧前额叶皮质(dorsolateral prefrontal cortex)、额上回(superior frontal gyrus)、顶叶后部(posterior parietal cortex)和肩部的 TMS-EEG 刺激。所有受试者均为健康的青年个体,无 MRI 或 TMS 禁忌,并在数据采集前签署了书面知情同意书。该研究方案经莫纳什大学人类研究伦理委员会批准。
在本分析中,我们仅使用了刺激额上回的 TMS-EEG 数据,并筛选出以下条件的受试者:
1)TMS 脉冲造成的瞬时伪迹在 10 毫秒内恢复;
2)未出现 TMS 引发的头皮肌肉活动。
最终纳入的受试者有 14 人(其中 8 名女性,平均年龄 33 岁,年龄范围 19–45 岁)。我们特意排除了 TMS 引发的肌肉伪迹,以确保任何 TMS 引发的衰减伪迹不会来自肌肉活动的尾部或运动伪迹,从而在数据集中得到一个特征清晰、相对单纯的伪迹概况。
TMS 采用双相(biphasic)脉冲,通过八字形线圈(figure-of-eight coil)施加,并连接到 MagVenture X100 MagOption 刺激仪(MagVenture)。线圈位置由立体定向导航系统(BrainSight, Rogue Resolutions)进行定位,对准左额上回(MNI 坐标:−23, 4, 63)。在放置和角度调整时,使线圈中心位于最靠近的脑回上,并确保线圈手柄与脑回的主要走向垂直(即在脑回中实现最大电流流动)。基于左侧运动皮质的静息运动阈值以及线圈到皮质的距离,按照 Stokes 等人提出的公式 (Stokes et al., 2005) 对刺激强度进行修正并计算,实际刺激强度设为修正阈值的 120%(平均占刺激器最大输出的 77.2 ± 11%),以 4–6 秒为随机间隔施加 120 个 TMS 脉冲。为掩蔽 TMS 脉冲点击声,整个刺激过程中会通过耳机播放白噪声,但大多数被试仍可听到脉冲声。
EEG 由 62 个适用于 TMS 的烧结 Ag-AgCl 电极采集,这些电极采用低剖面、C 形开口设计(EASYCAP),按照标准 10–10 系统分布于头皮。在线记录时,FPZ 电极作为参考,AFZ 电极作为地电极。电极位置使用立体定向导航系统进行数字化采集。EEG 信号由放大器进行 1000 倍放大,滤波范围为 DC-1000 Hz,并以 10 kHz 采样率记录(Synamps RT amplifier, Compumedics)。实验过程中各电极阻抗均保持在 5 kΩ 以下。
6.1.2. 清理流程(Cleaning pipelines)
我们比较了三条不同的清理流程,这三条流程仅在抑制 TMS 衰减伪迹的方法上有所差异。所有流程均基于 Matlab 平台的 EEGLAB (Delorme & Makeig, 2004) 与 TESA (Rogasch et al., 2017) 实现;拓扑图(topoplots)通过 FieldTrip (Oostenveld et al., 2011) 生成。
具体步骤如下:
-
将数据在 TMS 脉冲前后分别截取 1000 毫秒(−1000 ~ 1000 ms),并用 −500 ~ −10 ms 段的平均值进行基线校正(baseline correction)。
-
去除 TMS 脉冲附近 −2 ~ 10 ms 的数据。
-
手动识别并剔除通道或试次中出现的明显伪迹(如持续漂移、明显肌肉活动或工频噪声)。
-
对剔除的通道进行球面插值(spherical interpolation),并将数据重新参考到全电极平均值(不过,在运行 FastICA 之前会再次剔除缺失的电极,以确保数据的秩(rank)正确)。
在上述操作完成后,数据被分成三条并行的流程(pipeline),分别采用不同的方法来抑制 TMS 引发的衰减伪迹:
流程 1(Pipeline 1):FastICA
流程 2(Pipeline 2):SOUND(基于源估计的噪声丢弃算法)
流程 3(Pipeline 3):基于模型拟合(Model)
-
-
使用 FastICA (Hyvarinen, 1999) 对数据进行分解。
-
通过 tesa_compselect.m 中的启发式规则自动选择代表衰减伪迹的成分:若 11–30 ms 区间的数据功率占比超过 30–1000 ms 区间功率占比的 8 倍,即判定为衰减伪迹成分。
-
成分选择完成后进行人工检查,如有需要会额外剔除与伪迹相关的成分(n=2)。
-
使用 SOUND (Mutanen et al., 2018, 2020) 算法对数据进行处理。
-
在源估计(source estimation)时基于个体化的前导场矩阵(leadfield matrix),该矩阵由 Brainstorm 工具箱中的 3 层 OpenMEEG 边界元模型生成 (Tadel et al., 2011)。
-
参照 Freche 等人提出的模型 (Freche et al., 2018),对每个试次和电极在 11–30 ms 区间进行拟合,并将结果外推到 11–500 ms。
-
使用原文第 12 幅图中的相同设置:选择出现最大正偏移的 3 个电极与最大负偏移的 3 个电极来构建模型。
-
将最优模型的拟合结果在刺激后时段(11–500 ms)中予以扣除,然后将数据重新截取到 −500 ~ 500 ms。
-
在三个并行流程中,各自完成衰减伪迹的抑制后,我们在该“中间结果”点上对 TEP 进行比较,以评估不同方法对数据的影响。
随后,我们对缺失的 TMS 脉冲附近数据(−2 ~ 10 ms)采用三次函数(cubic function)进行插值(插值基于脉冲前后各 1 ms 的数据),并将数据降采样至 1000 Hz。接下来,对数据应用 1–80 Hz 带通滤波以及 48–52 Hz 带阻滤波(零相位有限冲激响应滤波器,pop_eegfiltnew.m)。然后再次使用 FastICA,对识别到的眼动、眨眼、持续肌肉活动等成分进行自动剔除(tesa_compselect.m 中的启发式规则:若 FP1、FP2 权重 > 其他电极 2.5 倍则判定为眨眼;F7、F8 权重分别为其他电极 ±2 倍则判定为侧向眼动;肌肉成分则参照基于对数-对数坐标 7–70 Hz [排除 48–52 Hz 区间] 的背景功率谱斜率 < −0.31 (Fitzgibbon et al., 2016))。为便于各流程间的标准化比较,我们在这一步不再对成分进行人工额外调整。最后,我们对缺失电极再次进行球面插值,并比较各流程最终得到的 TEP。
6.1.3. 分析与统计(Analysis and statistics)
在比较“中间结果”和“最终结果”时,我们首先对每个流程的数据进行试次平均,得到 TEP。为了量化各流程在幅度上的差异,我们计算了全局平均场幅度(global mean field amplitude,GMFA),即在每个时间点上对所有电极的标准差。然后,我们提取在 TMS 脉冲后 11–250 ms 段的数据,并降采样至 250 Hz(得到 60 个时间点)。使用配对样本 t 检验(paired-sample t-tests)比较不同流程在每个时间点上的 GMFA 差异。
为了评估各流程结果在拓扑分布上的相似性,我们使用皮尔逊相关(Pearson’s correlations)比较每个个体在所有时间点上的 TEP 空间分布(Topography),并将相关系数通过 Fisher’s r-to-z 转换为 z 分值,然后使用单样本 t 检验评估 z 分值是否显著偏离 0。对于这两类对比,我们均以 p < 0.05 为显著水平,并采用 Benjamini-Hochberg 方法在 60 个时间点上进行错误发现率(false discovery rate,FDR)校正。
6.2. 结果与讨论(Results and discussion)
在初步清理步骤之后,每位受试者平均剔除了 15.6 ± 9 个试次(范围:2–31)和 2.6 ± 2 个电极(范围:1–6)。图 2 展示了不同清理阶段的组平均 TEP“蝶形图”(butterfly plots):
-
左列为初步清理后的数据(分段、基线校正、试次/电极移除及重新参考);
-
中列为三种不同衰减伪迹抑制方法(顶部:FastICA,中部:SOUND,底部:模型拟合)得到的中间结果;
-
右列为各流程最终输出的 TEP。
在每张图中,都特别突出显示了线圈最近处的电极(FC1),从中可见在处理前存在明显的衰减伪迹。
图 2. 展示了在不同清理阶段、全电极合并平均后的 TEP 蝶形图。
左列为初步清理后结果(分段、基线校正、试次和电极移除、全电极平均参考),中列依次为三种不同衰减抑制方法(FastICA、SOUND、模型拟合)处理后的中间结果,右列为三条不同清理流程的最终 TEP。每张图中都突出显示了距线圈最近的电极(FC1):左列以红色曲线标示,中列与右列以黑色标示。
中间结果比较(去除衰减伪迹后)
在去除衰减伪迹后所进行的中间结果比较中,三条流程在全局平均场幅度(GMFA)及拓扑分布上均显示出差异(图 3)。FastICA 和 SOUND 流程得到的 GMFA 模式相似,但 FastICA 在几乎所有时间点上均呈更高幅度。二者的头皮地形(topographies)也表现出相似性,从 13 ms 开始相关系数 > 0.6,38 ms 后相关系数 > 0.8。相较之下,模型(model)流程在前 120 ms 幅度更低、130 ms 之后幅度更高,且其在脉冲后 45 ms 内与 FastICA 和 SOUND 流程的头皮地形相关度明显更低。综合来看,这些结果显示了三种方法在抑制 TMS 引发衰减伪迹时所采用思路的差异。
图 3 TEP 在抑制衰减伪迹步骤后的流程间比较
A) 每条流程下的 TEP 全局平均场幅度(GMFA)。实线(蓝、橙、黄)为组平均值,阴影区域为标准误。横线表示流程间存在统计学显著差异的时间点 (p < 0.05,FDR 校正):紫色 = FastICA vs SOUND(FI v S);绿色 = FastICA vs model(FI v M);浅蓝 = SOUND vs model(S v M)。虚线表示 TMS 脉冲时刻,灰色竖线表示数据中的峰值时刻。
B) 皮尔逊相关系数随时间的变化,比较的是不同流程得到的头皮图。横线表示相关系数显著大于 0 (p < 0.05,FDR 校正)。
C) 在 A、B 图中标示的时间点处,各流程在头皮上 EEG 振幅分布的拓扑图。
最终结果比较(清理流程结束后)
在清理流程结束时,FastICA 和 SOUND (基于源估计的噪声丢弃算法)流程之间的差异大部分消失,二者在 GMFA 上整体一致,仅在 27–39 ms 和 119–123 ms 出现小幅度差异(图 4),而且在几乎所有时间点上都呈现高度相似的头皮分布(12 ms 开始相关系数 > 0.6;34 ms 开始相关系数 > 0.8)。这种趋同可能反映了 SOUND 和 FastICA 流程内部处理方式上的差异:SOUND 旨在抑制从生物物理角度看不合理的噪声(包括衰减伪迹、肌肉伪迹和其它噪声源),从而在后续 FastICA 步骤需要抑制的伪迹更少;而在 FastICA 流程中,首个 FastICA 步骤只去除了衰减伪迹成分,后续再用 FastICA 抑制肌肉及其他噪声。确切地说,与 FastICA 流程相比,SOUND (基于源估计的噪声丢弃算法)流程在后续 FastICA 阶段去除的方差明显更少(平均 = 9.1 ± 7%,对比 FastICA 流程平均 = 28.1 ± 16%,p = 8.1×10^-4,配对样本 t 检验)。
与 FastICA 和 SOUND 相比,模型流程在早期(约 11–30 ms)幅度更低,中后期(约 140–190 ms)幅度更高,且在几乎所有时间点上头皮分布相关系数都较低(40 ms 前相关系数 < 0.6;160 ms 前相关系数 < 0.8)。此外,模型流程在基线期(baseline)也表现出更高的幅度,可能与带通滤波引发的额外伪迹有关。
图 4 各流程在清理结束后的 TEP 比较
A) 各流程得到的 TEP 全局平均场幅度(GMFA)。实线(蓝、橙、黄)为组平均值,阴影区域为标准误。横线表示流程间存在统计学显著差异的时间点 (p < 0.05,FDR 校正):紫色 = FastICA vs SOUND(FI v S);绿色 = FastICA vs model(FI v M);浅蓝 = SOUND vs model(S v M)。虚线表示 TMS 脉冲时刻,灰色竖线表示数据中的峰值时刻。
B) 皮尔逊相关系数随时间变化曲线,比较不同流程得到的头皮图。横线表示相关系数显著大于 0 (p < 0.05,FDR 校正)。
C) 在 A、B 图中标示的时间点处,各流程的头皮 EEG 振幅拓扑图。
为进一步探究模型(model)流程与其他流程之间的差异,我们针对一名被试看其模型拟合与原始数据进行了对比绘图(图 5A)。从图中可见,该模型似乎过度拟合了早期衰减伪迹的形状,实际上却对早期 TEP 成分进行了拟合。此外,向后外推的模型曲线与之后的时间段拟合度较差,也就解释了在图 4 中 140 ms 之后出现更大振幅的原因。为解决这些问题,我们在模型流程中采用了更简化的模型(源自原文第 10 幅图:仅选择幅度最正偏移的 1 个电极与最负偏移的 1 个电极进行建模),并将拟合时段延长至 11–70 ms。这样即可在不拟合早期 TEP 峰的前提下,更好地捕捉衰减伪迹(图 5B)。使用这一方法进行结果对比时,模型流程得到的 TEP 与 FastICA 和 SOUND 两条流程更加相似(图 6)。在 11–16 ms 的极早期时间段,模型流程与其他流程的振幅略有差异,但尚未达统计学显著水平。此外,模型流程在前 16 ms 以及 28 ms 和 66 ms 的 TEP 峰值处,与其他流程的头皮分布相关系数略低,但总体而言从 14 ms 开始在全时段的相关系数均较高(>0.6)。这些发现再次强调了:在设计流程并对结果进行可视化时,应根据具体数据集选择合适的参数,确保清理步骤不会给数据引入伪误信号。
图 5 示例被试的 TEP 与模型拟合对比
A) 两个电极(FC1 和 F3)的 TEP(黑色)及模型拟合均值(红色),使用最初的模型方案。
B) 与 A 中相同电极的 TEP 及在替代模型条件下的拟合均值。新的简化模型能更好地捕捉衰减伪迹,而不会过度拟合早期 TEP 峰值。
图 6 采用替代模型流程完成清理后,不同流程的 TEP 对比
A) 不同流程得到的 TEP 全局平均场幅度(GMFA)。实线(蓝、橙、黄)表示组平均值,阴影表示标准误。横线表示流程间在给定时间点上存在统计学显著差异(p < 0.05,FDR 校正):紫色 = FastICA vs SOUND(FI v S);绿色 = FastICA vs model(FI v M);浅蓝 = SOUND vs model(S v M)。虚线表示 TMS 脉冲时刻,灰色竖线表示数据中的峰值时刻。
B) 皮尔逊相关系数随时间的变化曲线,比较不同流程的头皮图;横线表示相关系数显著大于 0 (p < 0.05,FDR 校正)。
C) 在 A、B 中标记的峰值处,不同流程在头皮上的 EEG 振幅分布拓扑图。
另一个可能导致流程间差异的因素是 FastICA。由于 FastICA 算法的初始参数采用随机种子,多次运行可能产生轻微成分差异。此外,不同运行之间不一致的成分移除也会带来额外波动。为评估同一流程内部结果的一致性,我们对每条流程的 FastICA 步骤额外重复两次。需要注意的是,我们使用了启发式规则来标准化成分选择,以尽量减少不同运行之间的差异。结果显示,无论哪条流程,三次重复运行的 TEP 都表现出高度相似(图 7),说明图 6 中观察到的流程差异主要来自抑制衰减伪迹的方法本身,而非 FastICA 带来的随机波动。这些结果也证明了在固定的流程下 TEP 具有较高的可重复性(即使在 FastICA 分解和成分选择存在一定变动时,最终的 TEP 结果依然高度一致)。
图 7 同一流程多次重复分析后得到的 TEP 对比
左列:三次重复后全局平均场幅度(GMFA)对比,实线(蓝、橙、黄)表示组平均值,阴影为标准误。
右列:在流程内部重复分析后,不同时间点上头皮分布的皮尔逊相关系数。
最后,我们评估了不同噪声电极校正方式是否会影响 TEP 结果。SOUND 算法原本就可自动修正噪声电极,因此不需要像上述流程那样先手动移除电极再插值。为检验这一点,我们将先前分析中采用的 SOUND 流程与另一条“不手动移除噪声电极、直接使用 SOUND 算法修正”的流程进行对比。结果显示,无论是否在 SOUND 步骤之前手动移除噪声电极,得到的 TEP 都非常相似(图 8),表明对于这些流程而言,选择何种电极修正方式对 TEP 结果影响不大。
图 8 采用不同噪声电极校正方法后得到的 TEP 对比
A) 不同清理流程下的 TEP 全局平均场幅度(GMFA),实线(蓝、橙)为组平均值,阴影为标准误。灰色竖线表示 TMS 脉冲时刻及数据峰值。
B) 皮尔逊相关系数随时间变化,比较不同流程的头皮图;横线表示相关系数显著大于 0 (p < 0.05,FDR 校正)。
C) 在 A、B 中标记峰值处,不同流程在头皮上的 EEG 振幅分布拓扑图。
简要总结,我们发现仅仅改变 TMS-EEG 清理流程中的一个步骤(用于抑制衰减伪迹)就足以使得到的 TEP 出现总体相似但在幅度和拓扑分布上仍存在细微差异,尤其是在早期潜伏期。相比之下,当我们反复运行同一条清理流程,或采用不同方法处理噪声电极时,得到的 TEP 却表现出高度一致。我们的发现与近期其他研究报告的结果相符:不同 TMS-EEG 工具箱中的流程可能会得出不尽相同的 TEP (Bertazzoli et al., 2021),采用不同方式抑制衰减伪迹也会导致差异 (Casula et al., 2017)。但与之前研究不同的是,我们在本工作中精心挑选了伪迹特征相似的数据(具有衰减伪迹而无 TMS 引发的肌肉伪迹),且只在清理流程中改变了一个步骤,并对流程内部结果的一致性进行了比较,从而更好地定位了流程结果差异的原因。此外,我们的结果也再次强调了上一节的建议:衰减伪迹模型的参数设置对最终结果影响很大,而这些差异可通过数据可视化来发现。综上所述,这些发现凸显了 TMS-EEG 数据清理中所面临的内在挑战——即使对于伪迹极少的数据,选择不同的清理步骤也会产生影响
7. 我应该使用哪种分析流程?验证工作的挑战
在上述分析中,我们展示了只需改变流程中的一个步骤,就会在 TEP 上产生不同结果,特别体现在早期时段。此外,已有研究表明,不同工具箱中的相似流程也会呈现类似的差异 (Bertazzoli et al., 2021)。那么,“最佳”的分析流程究竟是哪一个?我们常看到一些论文采用某条流程或方法,并宣称该流程“已验证”,暗示经过清理的 TEP 能准确代表 TMS 所诱发的 EEG 活动。举例来说,我们团队提出的“两步 ICA”方法 (Rogasch et al., 2014) 就常常以被“验证”而被直接引用。然而,要想真正验证一条清理流程的准确性非常困难,其主要原因在于我们通常并不知道“真实信号”(ground truth)为何物;也就是说,想要提取的神经活动通常是未知的。就我们所知,目前尚无任何 TMS-EEG 流程能与已知的真实信号进行充分对照验证,从而在所有场景下都优于其他流程并可被自信推荐。事实上,要构建一个可用的“真实标准”供流程基准测试并非易事。这一难题在其他神经影像技术(如 EEG、脑磁图 MEG、功能性 MRI)中也同样存在,这些技术常常面临低信噪比的问题。
要为流程验证建立基准数据集,可以考虑多种思路。其中一种方法是在数据采集过程中尽量优化在线方法与实验设计以最小化伪迹,从而获得高信噪比并简化后续清理流程。然后再有意识地引入已知类型的伪迹,测试不同流程在恢复“干净”数据方面的能力。例如,可以取消在线噪声掩蔽,从而重新引入听觉诱发电位 (Rocchi et al., 2021)。有些非正式证据还表明,不同放大器的衰减伪迹可能相差较大;若能在同一批受试者、使用相同 EEG 帽的条件下于两种放大器上采集数据,也能为验证抑制衰减伪迹的方法提供一套基准数据。另一种可行方法则是基于生物物理模型来模拟符合生理学规律的信号 (Breakspear, 2017)。目前已经出现了部分可捕捉 EEG 信号关键特征的模型 (Cona et al., 2011; Sanz-Leon et al., 2018),但若要将 TMS 引发的肌肉和衰减伪迹等多种伪迹源也纳入进来,还需进一步的模型扩展。在这些基准数据集或流程得到充分开发和验证之前,我们很难就某一条 TMS-EEG 清理流程做出明确推荐。
8. TMS-EEG 数据清理建议
在前文各节中,我们已经展示了 TMS-EEG 数据可能对应的清理流程组合数量极其庞大;即使只是修改流程中的单一步骤,也会对最终的 TEP 产生影响。再者,目前没有任何经过全面验证的“最佳”流程可在所有场合下适用,甚至对于不同 TMS-EEG 数据集,我们可能需要采用不同的清理流程。面对这些挑战,研究人员应如何在课题内和课题间尽量减少 TMS-EEG 清理流程可能带来的结果差异呢?下文将继续探讨。
8.1. 使用多条流程分析数据
我们提出的主要策略是通过使用多条清理流程来分析 TMS-EEG 数据,以尽量减少研究内部的分析变异性。所谓的“多宇宙分析”(multiverse analysis)方法已被建议用于其他面临分析变异性的领域和方法,包括功能性 MRI(Botvinik-Nezer et al., 2020)和心理学(Silberzahn et al., 2018)。这种方法的主要目标是确认某一效应或缺失效应(例如,不同条件或组间 TEP 特征的差异)并非由于特定分析流程带来的变异性所致。虽然真正的多宇宙分析需要众多不同的分析方法和结果的元分析,但一个实用的替代方案是比较 2 至 3 条分析流程的结果。这一方法已被若干近期的 TMS-EEG 研究采用(如 Biabani et al., 2019; Rogasch et al., 2020),并在一项对比 TMS-EEG 分析工具箱的研究中得到倡导 (Bertazzoli et al., 2021)。重要的是,多条流程方法允许评估某一发现对于预处理方法变化的鲁棒性。尽管结果对某一特定流程的依赖性并不直接否定该发现,但它确实提供了关于驱动流程间 TEP 差异的潜在因素的重要见解。
TESA 专门设计用于结合和比较不同的 TMS-EEG 清理流程。为了方便比较多条分析流程,我们在当前研究中提供了所有数据和代码,作为如何使用 TESA 实现这一目标的示例。我们还在 TESA 内部创建了一个流程库(pipeline repository),其中提供了不同的已发表流程的示例脚本,这些流程可以在 TESA 和 EEGLAB 框架内完全实现。在初始版本中,我们提供了三条采用对比方法的流程:一条适用于在线避免 TMS 引发肌肉与衰减伪迹的数据的最简清理流程,以及两条设计用于含有 TMS 引发肌肉/衰减伪迹的数据的流程;一条使用两步 ICA 方法,另一条使用 SOUND 和 SSP-SIR。我们预期随着更多方法的出现,这些流程列表将不断扩展。用户可以根据自己的数据调整这些模板流程。鉴于不同 TMS-EEG 分析流程的开源可用性,我们建议在流程验证得到改善之前,多条流程方法应成为该领域的标准实践。
8.2. 分享数据和代码
我们倡导的另一个做法是,在 TMS-EEG 发表的论文中共享所使用的数据和分析代码(在伦理允许的情况下)。数据和代码共享在多个神经影像领域(尤其是 MRI,见 Poldrack 和 Gorgolewski, 2014)已变得普遍,并具有多重优势。首先,数据和代码共享通过使其他研究者能够直接复制已发表研究的结果,增强了可重复性和透明度,同时也更易于将这些分析方法和清理流程应用于新研究中。其次,开放的 TMS-EEG 数据为新分析方法和流程提供了测试平台。随着新清理和分析方法的发展,测试这些方法如何在不同实验室收集的不同数据集上泛化变得越来越重要。最后,获取 TMS-EEG 数据还允许不同团队间的 TEP 进行更直接的比较。这种比较尤其重要,特别是在当前关于 TMS-EEG 研究的可重复性和标准化的辩论中 (Belardinelli et al., 2019; Siebner et al., 2019),并将极大地帮助识别驱动研究间 TEP 差异的关键特征。
尽管理念上具有吸引力,数据共享也伴随着若干挑战。最紧迫的问题是关于潜在的个人识别风险的伦理担忧。虽然这一问题对于像 MRI 这样的方法更为突出,因为如果不进行“去面部”(defacing),可以从解剖扫描中重建个体的面部特征 (Schwarz et al., 2019),但有证据表明,TMS 引发的 TEP 也可以通过所谓的“指纹识别”(fingerprinting)方法高度特异地识别个体 (Ozdemir et al., 2021)。尽管极不可能,这确实引发了某人可能基于其 TEP 被从开放获取的数据集中识别出来的可能性。另一个重要的伦理考量是参与者是否能够同意其数据的使用方式和使用者。数据共享和所有权法律在不同司法管辖区间存在差异,可能会造成使数据公开变得困难的障碍(无论是实际的还是感知上的) (White et al., 2020)。然而,通过采用适当的同意程序,清晰说明拟议的数据共享实践,许多这些障碍是可以克服的。此外,数据可以通过多种方式共享,从公开可访问的数据仓库到更为限制性的方法,后者要求数据主机与申请者之间建立数据共享协议,从而提供更高的保护和对数据访问者的控制。最后,一个实际的考虑因素是,TMS-EEG 数据采集所使用的高采样率导致数据文件较大(每个文件 >1 GB),这使得数据存储和共享变得具有挑战性。目前已有众多用于科学数据共享的平台(如 open science framework),其中一些专为神经影像数据集设计的平台(如 OpenNeuro)能够容纳大数据文件 (Markiewicz et al., 2021)。此外,像 OpenNeuro 这样的平台要求使用标准化的数据格式,如脑成像数据结构(Brain Imaging Data Structure, BIDS) (Gorgolewski et al., 2016),这提高了数据质量和透明度。鉴于数据共享对于提高可重复性和方法开发的潜在益处,我们建议数据和代码共享应成为 TMS-EEG 领域的标准实践。
8.3. 选择合适的工具
不同的预处理步骤旨在实现特定的目的,因此基于不同的理论前提。因此,理解所应用方法的基本假设至关重要,以便批判性地评估所使用的信号处理工具是否适用于当前的数据和伪迹。如果未能做到这一点,可能会导致结果的误解。例如,本文中展示了一个极好的实践例子:在衰减伪迹移除后立即应用 SOUND(基于源估计的噪声丢弃算法)方法,SOUND 似乎最有效地削弱了 EEG 信号。然而,原因在于 SOUND 并非专为仅移除衰减伪迹设计,而是可能同时移除了其他不太可能源自颅内偶极子的信号成分。相反,我们定制了 FastICA 和基于模型拟合的方法,专门用于移除衰减伪迹。因此,当最终使用 ICA 来清理剩余伪迹时,除了衰减伪迹外,SOUND 和 ICA 流程都产生了更加相似的结果。
研究者还应始终在选择预处理流程步骤时,考虑其研究问题及其背景。当 TMS 引发的头皮肌肉活动存在于数据中时,需要复杂的预处理流程来量化 TMS 的早期反应。然而,数据分析中每增加一个复杂步骤,都会增加引入难以察觉的滤波伪迹的风险。因此,即使存在明显伪迹,如果该伪迹在时间或频率上不与感兴趣信号重叠,保留该伪迹可能更为有益。例如,即使是幅度较大的肌肉伪迹,也可能不会影响 N100 组分的分析,因为肌肉反应通常持续时间较短。对于此类研究,简单的时间段拒绝和插值可能比 ICA 更为安全,因为 ICA 假设数据由统计独立的成分组成。最终,我们建议:
1) 尽可能选择假设最少的分析方法;
2) 适当承认使用复杂流程清理高度伪迹数据所固有的局限性。
9. 结论
从 TMS 脑电数据中提取神经活动仍然面临挑战,这主要源于结合使用两种技术所带来的独特伪迹。虽然通过适当的实验设计和数据采集过程中的仔细准备来最小化这些伪迹至关重要,但在所有 TMS-EEG 实验中完全避免伪迹仍然困难。因此,使用离线清理方法抑制伪迹成为 TMS-EEG 实验的重要组成部分。得益于开源科学实践,如数据和代码共享,以及专门的开源工具箱(如 TESA)的开发,设计和实施 TMS-EEG 清理流程的方法正在不断改进。然而,方法的选择以及其实施顺序可以改变最终的 TEP,即使对于伪迹极少的数据也是如此,如我们当前的研究结果所示。清理后 TEP 结果的变异性对不同研究团队间 TMS-EEG 结果的比较具有重要影响,特别是在当前广泛使用的在线与离线伪迹抑制方法种类繁多的情况下。离线方法面临的下一个挑战是设计稳健的实验和模拟方法,以允许基于已知真实信号对 TMS-EEG 清理流程进行验证。在此之前,我们建议研究者在 TMS-EEG 研究中采用多条清理流程来比较结果,以确保发现不与清理方法的选择相关。离线清理方法的持续改进与验证将在确保 TMS-EEG 作为探索神经回路功能的基础与临床研究方法中发挥关键作用,从而充分发挥其潜力。