人工智能与卒中研究:机器学习与注册研究的应用
1. 机器学习在卒中研究中的基础
机器学习方法凭借其固有的灵活性和处理多种数据类型的能力,在卒中领域的应用近年来呈现爆发式增长。其应用范围广泛,涵盖了从临床和/或影像数据进行结局预测、病变分割以及评估治疗效果等多个方面。
1.1 输入变量与处理
在卒中研究中,需要从输入变量的值来进行相关分析,这些变量包括入院患者的年龄、性别、既往事件、发病时间和美国国立卫生研究院卒中量表(NIHSS)值等。对于分类变量,需要将其编码为整数,以便网络单元进行处理。
1.2 人工神经网络的性能
在通过这五个临床和个人属性推断改良 Rankin 量表(mRS)这一相对直接的问题上,人工神经网络(ANNs)的性能可能与其他已讨论过的方法相当。不过,人工神经网络的强大之处在于它能够处理高维数据,如图像或声音,这是其他已知机器学习方法难以做到的。深度学习方法运用具有多层(在某些情况下可达数百层)和数十万个人工神经元的人工神经网络,来完成几年前我们还无法完成的图像分类任务。
2. 深度学习在图像处理中的应用
从医学图像获取诊断信息,本质上与我们一直在讨论的从一组标记实例推断目标标签的基本问题并无不同。原则上,一幅图像可以用一组独立的属性来描述。
2.1 图像的属性表示
以一幅使用任何标准成像技术获得的灰度 100 万像素图像为例,它可以用 100 万个属性来描述,每个像素对应一个属性。对于这样的任务,相当于一个有 100 万列的表格,每列对应一个像素的值,表格中的每个条目是一个介于 0(黑色像素)和 1(白色像素)之间的数字,中间值对应不同程度的灰色。对于相同尺寸的彩色图像,表格将有 300 万个属性,因为每个像素由三个连续值描述,对应三个颜色通道。
2.2 传统机器学习方法的局限性
原则上,可以使用之前讨论过的任何技术(如决策树、逻辑回归、朴素贝叶斯、最近邻或支持向量机)从一个有 100 万列(彩色图像为 300 万列)的表格中学习分类规则。但在实践中,这种方法并不奏效,因为单个像素无法提供关于目标类别的重要信息。相关信息隐藏在涉及数千甚至数万个像素的复杂模式中,这些模式人类专家容易识别,但基本的机器学习方法却难以理解。因此,直到几年前,将机器学习技术应用于医学图像分类既不实用也不相关。
2.3 卷积神经网络的突破
过去十年中,机器学习技术在处理和分类高维数据(如磁共振成像或计算机断层扫描获得的医学图像或 3D 医学图像)方面取得了显著进展。关键的发展是能够将卷积神经网络应用于高维图像数据的处理。
卷积神经网络是一种具有特定架构的多层感知器,其第一层对图像执行卷积操作。以下是一个卷积神经网络的简单示例:
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
A(Kernel):::process --> B(Convolutional layer):::process
B --> C(Convolutional layer):::process
C --> D(Fully connected layer):::process
每个卷积层使用一个由内核指定的滤波器对图像进行处理,该滤波器在图像的行和列上反复扫描。在简化的网络中,第一层卷积层可能只使用一个内核,输出一个通道。实际上,每层会使用多个内核,从而在每个卷积层中产生多个通道。最后一层(或多层)通常是全连接层,使输出单元能够通过组合最后一个卷积层中神经元的输出来计算所需的输出。内核参数(即卷积层中神经元的输入权重)以及所有其他网络权重都使用梯度下降法计算,就像标准神经网络一样。卷积神经网络中还常用其他类型的操作,如池化(选择一个范围内的最大值)。
在过去十年中,卷积神经网络成为了许多图像处理任务以及其他众多应用中最适合的架构。尽管卷积神经网络几十年前就已提出,但直到最近,随着可用于训练网络的大型数据集的出现以及能够加速使用梯度下降法求解的更快计算机(在许多情况下使用为游戏开发的图形处理单元)的出现,它才成为首选解决方案。在有证据表明卷积神经网络在图像识别和标记问题上优于其他竞争方法后,许多越来越复杂的架构被提出并应用于不同的问题。这些架构的共同特点是包含数十万甚至数百万个人工神经元,组织在非常深的网络中,具有许多层(在某些情况下可达数百层)。
3. 机器学习在卒中研究中的具体应用
3.1 结局预测
结局预测的基本思路是根据可用的临床数据推断最可能的结局。尽管已经提出了许多评分方法,但机器学习方法有望通过更有效地利用所有可用数据来提高预测的准确性。许多作者开发了不同的方法来根据临床信息预测结局,例如:
- 使用支持向量机。
- 结合随机森林、支持向量机、逻辑回归和决策树。
- 运用决策树。
- 采用神经网络、随机森林和逻辑回归。
- 利用支持向量机、随机森林和神经网络。
3.2 公共竞赛
2015 - 2017 年间举办了一些备受瞩目的公开竞赛,旨在开发处理 MRI 卒中数据的最准确方法。例如:
| 年份 | 竞赛名称 | 任务 |
| ---- | ---- | ---- |
| 2015 | ISLES(缺血性卒中病变分割)挑战 | 亚急性缺血性卒中病变分割和急性卒中结局/半暗带估计 |
| 2016 | ISLES 挑战 | 病变结局预测和临床结局预测 |
| 2017 | ISLES 挑战 | 预测病变结局 |
在所有这些竞赛中,可用的训练数据都是急性卒中患者的多光谱 MRI 扫描。此外,许多作者还提出应用深度神经网络来处理不同类型的卒中影像数据。
随着临床和影像数据的日益丰富以及机器学习方法的不断改进,在利用现有信息进行结局预测方面有望取得重大进展。
4. 注册研究在卒中研究中的应用
4.1 临床研究的类型
临床研究通常可分为干预性研究和观察性研究。最常见的干预性研究是随机对照试验(RCT),在这种试验中,会对参与者进行某些干预,如新药物、手术方法或设备的测试。RCT 可以是单盲或双盲的,并且有严格的纳入和排除标准。随机化通常可以平衡实验组和对照组之间潜在的混杂因素。高质量的 RCT 是临床研究的黄金标准,也是国家和国际指南的基础。然而,RCT 也有其局限性。当在 RCT 中应用过于严格的实验条件并高度选择患者时,研究结果可能难以转化为常规临床实践,也难以在更广泛的患者群体中实施。因此,临床医生常常基于少数高度选择的患者的知识来治疗患者,在这种情况下,RCT 的结论可能无法推广到“真实世界”的患者。
4.2 注册研究的定义和特点
在临床研究中,大数据指的是使用电子数据库(如临床或行政注册系统)收集的信息。患者注册系统是一个有组织的数据收集系统,采用观察性研究方法。患者注册系统通常收集人口统计学、风险因素、治疗方法、结局和其他临床数据,以评估特定疾病、状况或暴露的特定人群的特征、管理、随访、基准或结局。注册系统服务于预定的科学、临床或政策目的。患者注册系统通常由研究人员、研究机构、学术临床机构或多学科临床团队创建。注册系统可能由国家、私人或其他来源资助,用于质量评估或收集可用于特定研究目的的观察性数据。注册系统可以有多种组织和运营形式。目前,针对各种急性、慢性或罕见疾病都存在研究人员创建的患者注册系统。制药公司也可能创建或赞助注册系统,用于上市后研究和识别罕见并发症。
4.3 注册研究的类型
注册研究可以包括以下几种类型:
- 风险因素评估:评估与卒中相关的各种风险因素。
- 干预效果评估:评估某种治疗干预的实际效果。
- 预测模型建立:建立能够预测卒中结局的模型。
- 流行病学研究:研究卒中的发病率和患病率等。
- 医疗政策实施和效果评估:评估医疗政策在卒中治疗中的实施情况和效果。
其中,干预效果评估需要高质量的数据和先进的统计分析来控制混杂因素,多变量模型、分层分析和倾向评分分析等是此类分析的有用工具。
4.4 数据处理
数据处理包括数据管理和统计分析两个主要部分。
-
数据管理
:这是最耗时的过程,正确的数据管理对于进行合理的统计分析和获得有效结果至关重要。数据管理可以包括以下几个步骤:
-
数据清理
:去除错误、不可能的值(如体重为 1000 公斤、年龄为 300 岁),并将不同单位的测量值转换为统一单位(如将血糖从 mmol 转换为 mg/dL 或反之)。
-
生成新变量
:例如,将连续变量收缩压(SBP)转换为分类变量(如高 SBP > 140 mmHg 与正常 SBP < 140 mmHg)。
-
变量转换
:将有序变量(如轻度卒中、中度卒中、重度卒中和极重度卒中)转换为数值变量,反之亦然。
-
合并数据集
:如果数据源不同,最好将它们合并为一个数据集进行统计分析。
-
统计分析
:正确的统计分析方法对于得出结论至关重要。最好在统计学家的帮助下制定统计分析计划,在最终确定统计分析计划之前咨询统计学家比在分析完成后再咨询更为明智。
4.5 注册研究的优势和局限性
与随机研究相比,注册研究既有优势也有局限性。
-
优势
:
-
数据来源真实
:注册数据来自日常临床实践,没有严格的纳入和排除标准,保留了真实临床实践的特点,能够在相对较短的时间内生成大量数据。
-
成本低且范围广
:注册系统为从大量人群和地理上不同的地区收集大数据提供了相对廉价和快速的选择。
-
长期数据和罕见并发症检测
:如果需要,注册系统可以提供长期数据,并且在有资金支持的情况下,有可能检测到罕见并发症。
-
涵盖更多风险因素和亚人群
:由于注册系统应记录所有患有某种疾病的连续患者,因此更多在 RCT 中经常被排除的风险因素和亚人群能够被注册和分析。
-
描述疾病和结局模式
:注册系统可以用于描述疾病和结局模式随时间的变化,如果运行时间足够长,还可以及时跟踪临床护理的变化。
-
国际比较和“真实世界”数据反映
:在新药物、手术方法或设备的注册或指南实施后,国际注册数据可以进行地区、国家、大陆和人群之间的比较,从而反映所谓的“真实世界”数据。
-
风险因素和假设生成
:注册系统可以揭示疾病结局的风险因素,并在不太了解的疾病过程中生成假设。
-
局限性
:
-
无法建立因果关系
:注册研究本质上是观察性的,在大多数情况下是回顾性的,因此无法建立因果关系。在观察性研究中,研究者不直接对研究参与者进行干预,而是观察因素和结局之间的自然关系。注册系统只能提供支持潜在因果关系的关联证据,并用于生成假设。相反,RCT 如果进行得当,可以建立因果关系。
-
存在偏倚风险
:注册研究正确推断的主要风险是偏倚,这可能影响研究的内部或外部有效性。识别和控制偏倚对于注册研究至关重要。在设计、分析和解释注册研究时,应仔细检查潜在的偏倚来源。对于使用注册系统中已收集数据的研究来说,这一点尤为重要。
-
数据完整性和可推广性问题
:特定研究所需的数据可能未被收集,组间的基线特征可能不平衡,并且如果研究仅限于特定地理人群,结论可能无法推广。使用注册系统进行可靠研究的能力也高度依赖于所收集数据的质量。
人工智能与卒中研究:机器学习与注册研究的应用
5. 机器学习与注册研究的协同作用
在卒中研究领域,机器学习和注册研究并非孤立存在,它们可以相互补充,发挥协同作用,为卒中的诊断、治疗和研究带来新的突破。
5.1 数据共享与整合
注册研究收集的大量临床和影像数据为机器学习提供了丰富的训练素材。通过将注册系统中的数据与机器学习算法相结合,可以充分挖掘数据中的潜在信息。例如,将患者的人口统计学信息、临床症状、治疗过程和结局数据与医学影像数据整合,利用机器学习算法进行分析,能够更全面地了解卒中的发病机制和治疗效果。
5.2 模型验证与优化
注册研究的数据可以用于验证和优化机器学习模型。由于注册数据来自真实世界的临床实践,能够反映更广泛的患者群体和复杂的临床情况。通过将机器学习模型应用于注册数据,可以评估模型的准确性和可靠性,并根据实际情况对模型进行调整和优化,提高模型的泛化能力。
5.3 临床决策支持
机器学习模型可以基于注册研究的数据为临床决策提供支持。例如,在患者入院时,根据患者的临床信息和影像数据,利用机器学习模型预测患者的预后情况,帮助医生制定个性化的治疗方案。同时,注册研究可以记录治疗过程和患者的反馈,进一步验证和改进机器学习模型的预测结果,形成一个良性的循环。
以下是机器学习与注册研究协同作用的流程图:
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
A(注册研究收集数据):::process --> B(数据整合):::process
B --> C(机器学习模型训练):::process
C --> D(模型验证与优化):::process
D --> E(临床决策支持):::process
E --> F(反馈至注册研究):::process
F --> A
6. 未来发展趋势
随着科技的不断进步和研究的深入,机器学习和注册研究在卒中领域的应用将呈现出以下几个发展趋势。
6.1 多模态数据融合
未来的研究将不仅仅局限于单一类型的数据,而是会整合更多模态的数据,如临床数据、影像数据、基因数据等。通过多模态数据融合,能够更全面地了解卒中的发病机制和患者的个体差异,为个性化医疗提供更有力的支持。
6.2 实时监测与预警
借助可穿戴设备和物联网技术,实现对患者的实时监测。机器学习算法可以对实时监测数据进行分析,及时发现患者的病情变化并发出预警,以便医生及时采取干预措施,提高治疗效果。
6.3 智能化医疗系统
将机器学习和注册研究的成果集成到智能化医疗系统中,实现医疗流程的自动化和智能化。例如,智能诊断系统可以根据患者的症状和检查结果自动给出诊断建议,智能治疗决策系统可以根据患者的个体情况制定最佳的治疗方案。
6.4 跨学科合作
卒中研究涉及医学、计算机科学、统计学等多个学科,未来的研究需要加强跨学科合作。医学专家提供临床知识和研究需求,计算机科学家和统计学家提供数据分析和算法开发的技术支持,共同推动卒中研究的发展。
7. 结论
机器学习和注册研究在卒中领域的应用为我们带来了新的机遇和挑战。机器学习通过处理高维数据和复杂模式,能够提高卒中的诊断准确性和治疗效果预测的精度;注册研究则通过收集大量的临床数据,为机器学习提供了丰富的训练素材,并能够反映“真实世界”的情况。两者的协同作用将进一步推动卒中研究的发展,为实现个性化医疗和改善患者的预后提供有力支持。
在未来的研究中,我们需要不断探索和创新,充分发挥机器学习和注册研究的优势,解决面临的问题和挑战。通过多模态数据融合、实时监测与预警、智能化医疗系统的建设以及跨学科合作,我们有望在卒中研究领域取得更大的突破,为患者带来更好的医疗服务和生活质量。
以下是对机器学习和注册研究在卒中研究中应用的总结表格:
| 研究方法 | 优势 | 局限性 | 发展趋势 |
| ---- | ---- | ---- | ---- |
| 机器学习 | 处理高维数据、提高诊断和预测精度 | 对数据质量要求高、解释性较差 | 多模态数据融合、实时监测与预警、智能化医疗系统 |
| 注册研究 | 收集大量临床数据、反映“真实世界”情况 | 无法建立因果关系、存在偏倚风险 | 数据共享与整合、与机器学习协同作用 |
超级会员免费看
1128

被折叠的 条评论
为什么被折叠?



