
要理解人工智能的长远未来,就不可能忽视脑机接口技术。
为什么这么说?因为在一个拥有强大人工智能的世界里,脑机接口将在定义人类智能与人工智能如何融合方面发挥核心作用。
对大多数人来说,脑机接口听起来像科幻小说。但这项技术正在快速变成现实。脑机接口在现实功能性和应用普及方面正接近一个拐点。尽管听起来遥不可及,但像心灵感应这样的能力很快就将成为可能。
脑机接口世界可以分为两大类:侵入式方法和非侵入式方法。侵入式脑机接口需要手术,要将电子设备植入颅内,直接接触大脑或放在大脑上。而非侵入式方法则依靠放置在颅外的传感器(比如耳机或帽子上)来解读和调节大脑活动。
在本文章系列的第一部分(10月发布)中,我们深入探讨了侵入式脑机接口技术和初创企业。在这篇文章中,我们将注意力转向非侵入式脑机接口。
脑机接口和人工智能将在未来几年重塑人类和文明。现在是开始认真关注这项技术的时候了。
传感器的丰富世界
在深入了解当今非侵入式脑机接口初创企业格局之前,让我们花点时间探索使非侵入式脑机接口成为可能的核心技术。
每当你使用大脑做任何事情——思考一个想法、阅读一本书、说一句话、移动手臂——你的大脑内部都会以特定模式发生可检测的物理事件。具体来说,信息通过微小的电脉冲在大脑神经元中流动:这与为灯泡、厨房电器和iPhone提供动力的基本物理力量相同。这些微小的电信号也会触发大脑中的其他物理活动,包括磁场和血流的变化。
这些物理变化最终代表信息。它们的模式编码着思想、概念、词汇和行动。而编码的信息是可以被解码的。这正是脑机接口要做的事情。
为了以不同方式解释("读取")和调节("写入")大脑的物理活动,已经开发了许多不同的非侵入式传感器。每种都有优缺点。要理解非侵入式脑机接口领域,必须了解这些不同的传感器类型(也称为"模态")及其运作机制。
世界上最古老的大脑传感器是脑电图(EEG)。1924年在德国发明,EEG至今仍是世界上使用最广泛的大脑传感器。
EEG使用放置在头皮上的小电极直接测量大脑的电活动。从时间精度角度来看,EEG非常精确:它可以以毫秒级精度测量神经元活动。它也便宜、便携、安全且易于使用。
EEG的重大弱点是在空间角度上的不精确性。大脑的电信号在通过颅骨和头皮到达EEG电极的过程中会严重失真,使得难以精确定位它们在大脑中的起源位置。这是因为颅骨和大多数骨头一样,是糟糕的电导体。
相关地,EEG测量的信噪比很差,因为大脑的微小电脉冲很容易被许多其他附近的电活动源淹没:下颚紧闭、心跳,或者仅仅是环境电磁干扰。简单地眨眼就能产生比大脑电信号强10到100倍的电活动。
因此,从EEG的噪音数据中提取足够高保真度的信号,一直是将EEG用于脑机接口技术的长期障碍。
另一种非侵入式脑机接口模态在这些方面远优于EEG:脑磁图(MEG)。
正如你可能从高中物理中记得的,电和磁是同一基本自然现象的两个统一方面:电磁学。因此,当神经元放电并产生微小电信号时,它同时也产生微小磁场。EEG测量电信号;MEG测量相关的磁场。
与电场相比,磁场的显著特点是几乎完全不受颅骨和头皮的扭曲影响。因此,MEG比EEG具有更好的空间分辨率和定位精度。
问题是什么?
当今的MEG系统是房间大小的,需要磁屏蔽室和低温冷却。它们价值数百万美元。这使得它们对于日常脑机接口应用来说完全不实用。
但是,使MEG系统更小、更便宜的有前景研究正在进行。基于光泵磁力计的新型MEG(OPM-MEG)显示出巨大前景:它在室温下工作,小到可以戴在头上,并且需要较少的密集屏蔽。
OPM-MEG技术还没有准备好投入使用。但它可能在未来几年成为重要的新脑机接口模态,在仍然避免侵入性手术的同时提供比EEG更高保真度的大脑数据。
值得一提的第三种非侵入式脑机接口模态是功能性近红外光谱(fNIRS)。
与EEG测量电活动或MEG测量磁活动不同,fNIRS测量血流。当神经元放电时血流增加,因为放电的神经元需要更多营养。通过将高波长光束通过颅骨射入大脑,fNIRS传感器可以检测血流变化并利用这些模式来解码大脑活动。
fNIRS目前是世界上第二常见的非侵入式脑机接口传感器,仅次于EEG。这在很大程度上要归功于Bryan Johnson的初创公司Kernel在过去十年中的努力。Kernel的关键成就是将fNIRS技术小型化,首次将其转变为可以大规模商业化的可穿戴设备。像EEG一样,fNIRS安全、便携且相对便宜。fNIRS在位置方面比EEG更准确,但在时间方面不如EEG准确;因此两种模态是互补的,经常联合使用。
这将我们带到当今最令人兴奋和最有前景的非侵入式脑机接口模态:聚焦超声。我们将在本文中详细讨论超声技术。请继续阅读!
了解非侵入式脑机接口最新技术水平的最佳方式——什么是可能的,什么是不可能的,最大的未来机会在哪里——是探索当今领先初创公司正在做什么。让我们深入了解。
用EEG读心术
一批隐秘的初创公司相信,普通的EEG即将从一个熟悉但有限的传感器转变为脑机接口的主导方法。
EEG有很多优点。然而,几十年来,传统观念认为EEG的信号质量太差,无法支持高级脑机接口功能。
多么方便的是,现代人工智能的一大优势就是从噪音数据中提取潜在信号的超人能力。
如果你是hardcore深度学习信徒——一个"苦涩教训"最大化主义者——EEG有充分的理由成为你的脑机接口模态选择。用一个词来说:规模。
当前AI时代的定义特征是缩放原则。OpenAI在2020年普及了"缩放定律"概念:AI系统随着训练数据、模型大小和计算资源的增加而可预测地改进。此后半个十年AI的戏剧性进步主要源于将一切都扩大规模。大语言模型如此惊人强大的原因是我们找到了在人类有史以来产生的几乎所有书面文本上训练它们的方法。
如果想将在生成式AI中如此成功的做法应用于理解人脑,关键是收集尽可能多的大脑训练数据。如果想收集尽可能多的大脑训练数据,最佳传感器选择显而易见:EEG。简单地说,EEG比任何其他脑机接口模态都更具可扩展性。
当今世界的EEG系统数量比所有其他类型的脑机接口传感器加起来多几个数量级。世界大多数医院都能找到EEG设备;相比之下,全球可能只有几千个fNIRS系统和几百个MEG系统。基本EEG系统的价格不到1000美元。
体现这种AI优先、缩放优先的非侵入式脑机接口方法的年轻初创公司之一是Conduit。由一位年轻的牛津研究员和一位年轻的剑桥研究员联合创立,Conduit正在尽可能快地收集尽可能多的数据,以训练大脑的大型基础模型。该公司表示,到年底将从数千名参与者那里收集超过10,000小时的大脑记录。
虽然Conduit主要专注于收集EEG数据,但它也补充其他非侵入式模态,因为该公司发现,当在来自每个用户的多种传感器模态而不是仅一种上训练时,其AI的性能会显著改善。
Conduit为其技术设想什么用例?
该公司的目标是——令人惊讶地——构建一个能够在用户甚至还没有将这些想法表述成文字之前就解码他们思想的脑机接口产品。换句话说,他们正在寻求构建思想到文本的AI。
根据该公司的说法,该系统已经开始工作。Conduit当前的AI模型产生的文本输出与用户思想的语义匹配度达到约45%,并且可以零样本完成(意味着AI系统没有预先在任何特定个人上进行微调)。
一些具体例子将有助于使这更具体。
在一个例子中,当人类参与者想到短语"房间似乎更冷了"时,AI生成了短语"有微风甚至轻柔的阵风"。在另一个例子中,参与者想到"你有最喜欢的应用程序或网站吗",AI生成了"你有任何最喜欢的机器人吗"。
这项技术还没有准备好投入使用。45%的准确率不足以成为大众市场产品。而且,目前这些结果只有在用户在头上放置笨重的传感器套件时才可能实现。但考虑到手头的任务是读心术,这种准确度水平仍然令人瞩目。而且公司才刚刚开始。Conduit几个月前才开始扩大其数据收集工作;该公司计划在未来将其训练数据语料库增加几个数量级。
想象一下如果能够仅仅通过思考就向其他人和计算机传达细致入微的想法,可能会发生什么——想象社会可能如何改变。
"机器学习在过去十年的最大教训是规模和数据的重要性,"Conduit联合创始人Rio Popper说。"非侵入式方法让我们能够收集比如果我们数据集中的每个人都必须先做脑手术更大、更多样化的数据集。"
她的联合创始人Clem von Stengel补充说:"我们创立Conduit是因为我们意识到,如果我们都直接用想法而不是文字来思考,人们能够更快地完成事情。我们彼此之间以及对整个世界都能有更丰富的理解。"
另一家推动EEG可能性极限的有趣年轻初创公司是Alljoined。
Alljoined像Conduit一样,正在采用AI优先的非侵入式脑机接口方法,并押注EEG作为正确的模态,因为它的可扩展性和可访问性。虽然Conduit的目标是将思想解码为语言,但Alljoined的初始重点是将思想解码为图像——即基于EEG读数忠实地重现用户"心眼"中图像的任务,这被称为图像重建。
Alljoined的CEO/联合创始人Jonathan Xu是开创性MindEye2论文的共同作者,该论文显示基于生成式AI的方法仅基于适量的fMRI数据就能实现准确的图像重建。Alljoined着手将这项工作从fMRI扩展到EEG数据——并且已经成功做到了。
下面的图形显示了Alljoined的AI系统从参与者EEG数据重建的一些图像例子。正如你所看到的,重建输出并不完全准确,但这些结果代表了当今最先进的性能。而且——正如我们在AI的许多其他领域观察到的——可以肯定地说,随着训练数据和计算的扩展,系统的性能将继续改善。
说到训练数据,去年Alljoined开源了第一个专门为EEG图像重建构建的数据集。该数据集包含来自8名不同参与者的EEG数据,每人观看10,000张图像。免费提供这些数据应该为整个领域提供有用的催化剂。
虽然Alljoined的初始重点是图像重建,但该公司也在探索其他应用领域。一个有前景的领域是情感分析——能够准确、细致地实时识别用户正在体验的情感。直接从大脑数据解码情感在商业上具有重要意义,例如在营销和消费者行为研究中,比目前要求个人自我报告情感的现状要高保真度得多。
最后值得一提的EEG初创公司是以色列的Hemispheric。
由苹果FaceID技术的联合创作者之一创立,Hemispheric全力追求EEG的缩放定律。该公司正在世界各地建立EEG数据收集设施,系统化和模块化这些设施的建立方式,以便尽快扩展。
该公司计划在未来几个月内从隐秘模式中走出来,多年来一直在开发新颖的模型架构,以训练最先进的基础EEG模型。该公司最近成功扩展并训练了其首个多十亿参数模型。
"一些公司专注于开发改进的非侵入式传感器,押注更好的硬件将解锁高精度的非侵入式脑机接口产品,"Hemispheric CEO/联合创始人Hagai Lalazar说。"我们正在做相反的押注:当前的非侵入式传感模态(EEG、MEG、fNIRS)就足够了,突破将来自于对现有信号的更好解码,而不是更好的传感。AI是算法历史上最大的革命,但到目前为止,没有人扩展过大脑活动数据收集和模型训练来解码神经数据。我们认为,在开发用于解码大脑电活动'语言'的AI方面的突破是使非侵入式脑机接口普及的缺失环节。"
放眼看,重要的是要注意,对于配对尖端AI的EEG是否能够实现这里概述的宏大愿景,仍然存在大量不确定性和怀疑。许多观察者对从EEG读数中能够提取足够高信号数据以实现高级脑机接口用例的想法持怀疑或完全否定态度。特别是那些专注于脑机接口侵入式方法的人、那些几十年来亲眼目睹并使用过EEG局限性的人,以及/或那些不来自深度学习世界的人,都存在很多怀疑。一些最近的研究也对EEG语言解码的进展提出了质疑。
怀疑者可能是对的。
现实是,没有人——不是怀疑者,不是这些AI优先的EEG初创公司,不是世界上任何脑机接口或AI专家——确定知道。世界上还没有人大规模收集EEG训练数据并在其上训练大型神经网络并评估其性能。没有人最终验证或证伪EEG基础模型存在像大语言模型那样的缩放定律的假设。
当OpenAI在2018年发布第一个GPT模型时,没有人能够设想,没有人会相信,在接下来几年中仅仅通过扩展就会产生的惊人性能提升。
只有时间才能告诉我们,扩展在脑机接口世界是否会像在大语言模型中一样富有成效。如果是这样的话,不要小看EEG。
神经调节的消费级可穿戴设备
从FitBit(被谷歌以21亿美元收购)到Oura(最近估值110亿美元)到Apple Watch(年收入超过100亿美元),近年来许多消费级可穿戴产品取得了突破性成功。
所有这些消费级可穿戴产品有什么共同点?它们测量你的个人健康指标,但无法改变它们。它们只能"读取";不能"写入"。(上面讨论的EEG用例同样都只涉及读取,不涉及写入。)
新一代消费级可穿戴公司正在构建专注于大脑的产品,这些产品不仅监测你的大脑状态,还主动调节它。如果这些产品按预期工作,不难想象其中一个可能成为下一个Oura。
一个有趣的例子是Somnee Sleep,这是一家构建头带来改善用户睡眠质量的初创公司。
Somnee由四位世界领先的睡眠科学家联合创立,包括加州大学伯克利分校教授Matthew Walker博士,他是有影响力的著作《我们为什么要睡觉》的作者。
没有哪种心理活动比睡眠更普遍或更重要。一个能够显著改善用户睡眠的消费产品可能释放巨大的市场机会:作为参考点,每年在安眠药上花费800亿美元。
Somnee是如何工作的?
Somnee的头带使用EEG和其他传感器跟踪你睡眠期间大脑的活动,使用AI学习其特定的睡眠模式和信号。然后它发出个性化的电脉冲,将你的脑波推向其最佳节律,以获得更深、更高效的睡眠。这种神经调节技术被称为经颅电刺激(tES)。
它真的有效吗?
同行评议研究表明确实如此。
一项最近的临床研究显示,Somnee的产品在改善睡眠效率方面比褪黑素有效四倍,比Ambien等安眠药有效50%。
在该公司最近完成的另一项研究中,Somnee的头带帮助用户入睡速度快一倍,睡眠时间延长30多分钟,翻身次数减少三分之一。
美国职业篮球联赛最近宣布与Somnee合作,向NBA球员提供该公司的产品。Equinox也将很快在其健身房和酒店中提供Somnee头带。
这个类别中另一家值得注意的初创公司是英国的Flow Neuroscience。类似于Somnee,Flow的产品是一个可穿戴头带,使用经颅电刺激产生温和的个性化电脉冲来调节用户的大脑活动。但是虽然Somnee专注于改善睡眠,Flow的产品是为了对抗抑郁症而设计的。
抑郁症影响大脑的一个关键区域,称为背外侧前额叶皮质。在抑郁症患者中,这个区域的脑细胞变得不太活跃。Flow的头带将精确校准的电刺激直接传递到背外侧前额叶皮质,以刺激这个区域并恢复健康的脑细胞活动模式。
Somnee和Flow都依赖经颅电刺激(tES)。但是虽然Somnee使用经颅交流电刺激(tACS),Flow使用经颅直流电刺激(tDCS)。有什么区别?简而言之,像Flow这样的直流产品向大脑提供恒定电流,使神经元通常更可能放电,而像Somnee这样的交流产品引入振荡脉冲,影响神经元放电的节律和频率。
像Somnee一样,Flow产品的功效已在同行评议研究中得到验证。去年发表在《自然医学》上的一项大型临床试验发现,Flow产品在解决抑郁症方面比抗抑郁药物有效两倍。根据研究,57%的临床抑郁患者在使用Flow产品10周后报告他们不再患有抑郁症。该公司报告,在其数万客户的总用户群中,超过75%的人在三周内看到一些临床改善。
Flow将其产品描述为"电力作为药物"。这是一个恰当的短语。
Somnee和Flow的头带都可在线向普通公众提供。
最后值得一提的初创公司是Neurode。Neurode的头带使用电刺激来改善用户的注意力和专注力。该产品既适用于ADHD患者,也适用于寻求提升整体认知功能的普通人群。
虽然Flow使用tDCS(恒定电流),Somnee使用tACS(节律振荡电流),Neurode使用经颅随机噪声刺激(tRNS),它提供在频率和振幅上都随机波动的电流。新兴研究表明,引入这种随机噪声可以促进神经回路中的信号检测,从而改善学习和注意力。
据该公司称,45%的用户在使用产品的第一周内体验到注意力的提高。
新兴的临床研究表明,用消费级硬件对大脑进行电刺激,如这些公司正在追求的,确实能够在睡眠、抑郁症和注意力等多样化领域有意义地影响大脑行为和个体体验。
"这些初创公司在合适的时机进行建设,"前FDA数字健康部门常驻企业家Andrea Coravos补充说。"监管基础设施没有在追赶。FDA的第一个AI/ML框架在2019年发布,自那以来已授权近1000个AI驱动的设备。这种监管基础使公司能够更快地从研究转向真实的人类。"
但这些产品都尚未赢得主流采用。时间将告诉这些公司是否能够制作出足够令人愉悦的产品体验和足够有效的市场推广策略,将这些设备转变为大众市场成功。
聚焦超声:下一个伟大的脑机接口范式?
如果有一种脑机接口技术提供最大的上行潜力——一种能够超越现有解决方案格局(包括本文讨论的那些)并开创神经技术新范式的方法——那就是聚焦超声。在当今脑机接口世界中,没有哪个领域产生更多的热议和兴奋。
聚焦超声到底是什么,为什么如此有前景?
在基本层面上,超声只是声音的一个子类别——即通过空气和其他材料中的粒子传播的波。人类可以听到特定频率范围内的声波。超声波只是频率高于人类用耳朵能检测到的声波(>20千赫),但在其他方面与可听声波类似。
超声技术已用于医学成像超过75年(任何怀过孕或有怀孕亲人的人都会记得)。
大脑聚焦超声是一个更新的创新——仅在2010年代才开始成形。
聚焦超声的基本概念是精确瞄准并发射许多超声波,使它们都汇聚在大脑中的一个特定点。所有单独的波在那一个焦点处相加,创造足够的能量密度和机械压力,以特定方式调节那个点的神经元,同时不影响波所穿过的其余大脑组织。(该页面上的两个简单动画图形很好地可视化了这种现象,使其直观易懂。)
聚焦超声作为脑机接口模态提供了几个独特而引人注目的优势。
首先,它比任何其他非侵入式脑机接口模态精确几个数量级。EEG、fNIRS和tES都提供几厘米的空间分辨率。相比之下,聚焦超声可以以亚毫米精度瞄准大脑中的特定点。它可以被认为是一个高精度光束,可以瞄准大脑中想要针对的确切位置。
其次,聚焦超声可以比任何其他非侵入式技术更深入地到达大脑。
因为非侵入式传感器位于颅外,它们通常只能访问和与大脑最外层(称为新皮质)交互。新皮质是高级认知和语言的所在地,所以使用只能到达新皮质的传感器可以实现许多有用的应用。但许多重要区域和功能位于大脑深处,因此EEG、fNIRS、tES和其他非侵入式传感器无法触及。
像丘脑、下丘脑、海马体、基底神经节和杏仁核等深部大脑结构调节我们的许多基本驱动和功能:情感、记忆、注意力、食欲、情绪、运动、动机、渴望。精确调节这些深部大脑区域的能力可能为多种神经精神疾病启用强大的新治疗方法,如帕金森病、强迫症、抑郁症、阿尔茨海默病、癫痫、焦虑、慢性疼痛和PTSD——更不用说为普通人群解锁认知增强。
直到现在,访问这些更深层区域只能通过需要手术的侵入式方法来实现,如深部脑刺激(DBS)。除了超声之外的所有非侵入式模态——无论是电、磁、光学还是红外——都会被人体组织衰减,这意味着它们只能走有限的距离就会消散。相比之下,聚焦超声是机械波,因此可以通过人体组织而衰减很少。这使其能够深入大脑同时保持集中聚焦。
这些可能性不仅仅是理论上的。最近的研究表明,聚焦超声可以,例如,有意义地减少患者的慢性疼痛;减少严重成瘾参与者的阿片类药物渴望;以及最小化患有特发性震颤者的震颤——所有这些都涉及访问深部大脑结构。
超声区别于所有其他非侵入式模态的最后一个优势:它可以读和写,并且两者都能高分辨率进行。没有其他单独的非侵入式模态能够执行这两种功能。EEG、fNIRS和MEG可以读取,但不能写入。经颅电刺激可以写入(尽管分辨率较低,深度较浅于聚焦超声),但不能读取。
读写能力都具备解锁了脑机接口的圣杯:闭环功能,即一个统一系统可以读取和解码正在进行的神经活动,然后基于所读取的内容以选择性和个性化方式刺激大脑,然后看到大脑如何响应并实时适应,如此循环。
与使用一个设备感测和另一个设备调节相比,一个既能读又能写的单一设备能够实现感测和刺激之间的完美对齐、低延迟、直接校准、更少的硬件复杂性、更大的空间效率、更低的成本,以及最终更可扩展的产品。
超声脑机接口的初创企业格局还处于起步阶段,但正在以极快的速度发展。
当今最引人注目的聚焦超声初创公司是Nudge,该公司最近宣布了由Thrive和Greenoaks领投的1亿美元融资。
Nudge CEO/联合创始人Fred Ehrsam此前联合创立了Coinbase和Paradigm,这是加密货币世界中最成功的两个组织。因此Nudge延续了亿万富翁推出脑机接口初创公司的血脉,继Elon Musk的Neuralink、Bryan Johnson的Kernel和Sam Altman的Merge Labs(下文更多介绍Merge)之后。Nudge的另一位联合创始人Jeremy Barenholtz此前在Neuralink领导产品和技术。
Nudge的使命是在硬件、AI和神经科学的全栈中推进聚焦超声的最新技术水平,以实现精确而强大的非侵入式神经调节。该公司的初始重点是治疗成瘾、慢性疼痛和焦虑等神经精神疾病,但其北极星雄心是为普通人群启用认知增强。Nudge旨在使任何人都能够在学习、记忆和睡眠等广泛领域精确而直接地调节他们的心理行为。
Nudge的初始形态因子是嵌入在MRI机器中的超声头盔。(MRI用于"读取"方面。虽然超声本身也可用于高分辨率读取,但Nudge的核心重点是推进聚焦超声"写入"的最新技术水平。)
该公司的产品是功能性的,几乎每天都用于人体研究。这个初始产品不可携带且不适合消费者使用,但Nudge已经在开发一个更小的架构,旨在在家中和日常生活中使用。
正如该公司所说:"想象一个未来,慢性疼痛可以不用阿片类药物缓解,PTSD患者可以实时调节创伤回忆,临床医生可以像检查患者心率一样轻松地成像和调节大脑回路。想象一个未来,可以不用咖啡因增强注意力,学习新语言或技能需要几天或几周而不是几个月或几年。这个未来不是科幻小说,它是一个工程路线图。我们现在正在建设它。"
这个类别中另一家有前景的初创公司是Sanmai,由亚利桑那大学教授和早期聚焦超声先驱Jay Sanguinetti领导。Sanmai的主要支持者是Reid Hoffman,他领投了该公司最近的1200万美元融资。
与Nudge一样,Sanmai最初专注于超声的神经调节能力(其"写入"大脑的能力)而不是其感知能力(其"读取"的能力)。与Nudge相比,Sanmai有更严格的临床重点,较少面向消费者。
Sanmai的经颅聚焦超声设备已经在进行临床研究,正有望成为世界上第一个FDA批准的经颅聚焦超声设备。
Sanmai专注治疗的第一个医学适应症是帕金森病。全球有1000万人患有帕金森病,仅在美国每年就有9万个新病例,这是一个重要的市场机会。Sanmai的联合创始人之一Taylor Kuhn发表了一些展示聚焦超声治疗帕金森病功效的最早工作。
我们还没有触及的一个话题是聚焦超声究竟如何能够解决与大脑相关的疾病如帕金森病——即技术工作的机制是什么。简短的答案是——与大脑相关的大多数事情一样——我们还不了解所有细节。但帕金森病的案例引人入胜且富有启发性。
被称为α-突触核蛋白的错折蛋白在几个深部大脑区域神经元内的积聚被认为是帕金森病的关键驱动因素。用聚焦超声的集中机械能瞄准这些深部大脑区域已被证明能减少这些α-突触核蛋白的毒性积聚,从而潜在地帮助缓解帕金森症状。
Sanmai计划在近期用聚焦超声解决的其他疾病包括临床焦虑,这将涉及瞄准患者的杏仁核。
"我近15年前首次开始研究超声神经调节,"Sanmai CEO/联合创始人Jay Sanguinetti说。"当时,大多数人怀疑低强度超声的温和机械能是否能够影响大脑活动。作为研究生,我读过早期论文——有些几乎一个世纪之久——感觉那里有真实的东西。早期我必须努力让人们看数据。今天,这个领域已经成熟得多。我们创立Sanmai是为了创造第一个专门构建的临床超声神经调节设备,统一严格的安全标准、AI辅助个体化瞄准和现实世界临床实用性,在护理点给临床医生信心。"
这个领域的另一家尖端初创公司是Forest Neurotech。
Forest Neurotech是一个非营利组织——具体来说,是一种称为聚焦研究组织(FRO)的新型非营利初创公司。FRO是一种创新的新融资结构,旨在支持追求对于典型学术实验室来说太大或太昂贵但对工业来说还不够商业成熟的特定、雄心勃勃的科学里程碑。FRO通常有类似初创公司的团队和文化,但通过慈善而不是风险资本资金获得资助。因此,Forest不追求商业化,而是专注于推进基础超声技术的最新水平。
具体来说,Forest专注于超声硬件的小型化,这是使技术广泛可访问的关键步骤。
它在这方面取得了令人印象深刻的成功。Forest最近宣布了其第一个设备Forest 1脑机接口,它比传统超声扫描仪小1000倍,比标准钥匙扣还小。
重要的是,Forest 1设备可以使用超声进行读取和写入,这使其区别于Nudge和Sanmai设备。它可以基于血流动力学生成整个大脑(深达20厘米)的高分辨率三维图像,也可以进行精确的神经调节。
Forest 1设备突出了超声的一个重要细微差别。到此为止,我们一直在讨论超声作为不需要手术的非侵入式脑机接口技术。确实,超声可以并且经常是非侵入性部署的:Nudge和Sanmai都采用非侵入式超声方法。
但Forest的设备是侵入性的:它需要手术切开患者的颅骨并将设备植入内部。
为什么这样?
颅骨对超声来说非常具有挑战性,所以将超声设备放在颅骨内部有很大优势。
虽然超声通过像大脑这样的软组织传播时衰减很少,但对颅骨来说情况并非如此,颅骨由骨头制成,不能很好地传播超声波。颅骨反射一些超声波,吸收其他的,并散射和扭曲其余的。
找出如何解释超声波与颅骨相互作用和受其影响的不可预测方式是聚焦超声领域面临的最大未解工程挑战之一。像Nudge和Sanmai这样的初创公司正在投入巨大资源来解决这个挑战。
Forest解决这个问题的方法是,简单地将其设备放在用户的颅骨内部。这种方法的优势是完全避免了超声波穿过颅骨的棘手问题。劣势是任何想要使用Forest设备的患者都必须先做脑手术。没有免费的午餐。
Forest将其植入程序称为"微创",因为虽然患者的颅骨必须打开以将设备放入内部,但设备不会穿透患者的脑组织;相反,它位于大脑保护性硬脑膜层的顶部。这使其区别于像Neuralink和Utah阵列这样穿透大脑的完全侵入式脑机接口技术。
FRO通常设计为有时间限制,想法是如果团队完成其特定的科学目标,它可以分拆出传统的营利性初创公司来商业化它。所以不要惊讶在不久的将来看到一个或多个营利性初创公司从Forest Neurotech组织中出现。
"设备小型化和计算扩展多年来为我们提供了跨医疗保健的更有能力的技术,"Forest联合创始人Will Biederman说。"现在,通过超声,我们拥有了使非侵入式脑机接口梦想成为现实所需的保真度、精度和理解。"
我们将讨论的最后一家超声脑机接口初创公司是最雄心勃勃和最前沿的:Sam Altman的Merge Labs。
Merge还没有正式推出,所以关于该公司的公开细节很少。(不过不要惊讶在未来几天看到这种情况改变!)
Sam Altman将担任该公司的联合创始人之一,据报道OpenAI以8.5亿美元的估值向该公司投资了大量资金。
Merge将建立在超声技术最近突破的基础上,读取和写入人脑。但它旨在进一步推动技术前沿:该公司的愿景是将聚焦超声与基因编辑结合起来,实现更强大的脑机接口能力。是的,你没看错:超声加基因编辑!
这是如何工作的?
大致来说,基因编辑可以使大脑中特定神经元群以特定方式对聚焦超声产生反应。这个新兴科学领域被称为声遗传学。
首先,可以通过基因工程将特殊基因插入大脑中特定神经元子集的DNA中。那个特殊基因可以编码对机械力敏感的特定蛋白质。因为聚焦超声产生微小的机械扰动,那些特定神经元中的那个特定蛋白质将对聚焦超声的应用产生反应。具体来说,蛋白质通常是一个离子通道,当被聚焦超声瞄准时按需打开或关闭。
与没有基因编辑的聚焦超声相比,声遗传学方法能够对大脑活动进行更精确和量身定制的控制。它使得可能瞄准大脑中的特定神经元和神经元类型,同时不影响其他的:例如,只有兴奋性而不是抑制性神经元,或只有表达某些受体的神经元,或只有某些大脑回路(比如与某些成瘾行为相关的特定投射途径)。
声遗传学方法还使得可能更直接地定义和控制聚焦超声作用于大脑神经元的机制,因此它具有什么效果,基于哪些新基因和蛋白质被引入神经元。
这个新兴研究领域的先驱之一是著名的加州理工学院教授Mikhail Shapiro。Merge Labs的一大胜利是,据报道Shapiro已经加入了该公司。
即使在脑机接口的前沿领域内,Merge Labs正在追求的方法也是最前沿和最"科幻"的。基本科学问题仍有待解决。这个愿景需要十年或更长时间才能实现——如果它能成功的话。
无声语音
最后值得讨论的非侵入式初创公司类别是无声语音。
无声语音是一种技术,可以感知和解码某人试图说话或正在想象说话的词语,即使该人没有大声说出这些词语。(因此它也被称为默语。)
无声语音与本文讨论的所有其他技术和初创公司在一个关键方面有所不同:它不涉及直接从大脑解码信号。相反,它专注于来自大脑下游的物理信号——特别是来自用户面部和嘴部与说话意图相关的信号。
无声语音是如何工作的?基本想法是,当一个人试图说话时,即使从未听到声音,一个人的语音系统(如舌头、嘴唇、下颌)中的各种电学和肌肉机制也会被启动。这些物理机制可以被检测和解码。
对于启用无声语音的最佳技术方法还没有明确的共识。不同公司正在追求不同的模态,一般来说,无声语音初创公司对其技术细节非常保密。我们可以说的是:从一个人的面部解码试图或想象语音的物理特征的可行方法包括基于生物磁、光学和射频数据的技术。
在思考无声语音时,有助于设想一个可能性谱:从(1)完全正常语音,到(2)窃窃私语但仍可听见的语音,到(3)不可听见但完全用嘴说的语音,到(4)部分用嘴说的语音(例如,人的嘴保持闭合但舌头在嘴内移动),到(5)几乎不涉及任何物理运动的"语音",只是形成和发出词语的心理概念化。
所有无声语音公司都在寻求开发能够解码默语的技术:即通过上述类别(3)和(4)。无声语音技术是否能够可靠地破解类别(5)——通常被称为"想象语音"——仍有待观察。
语音最近作为AI时代高效、方便和直观的界面而爆炸式流行。无声语音的承诺是能够使用语音作为界面——与他人交流、搜索互联网、做笔记、回复电子邮件等等——但能够私密和谨慎地这样做,无论你在哪里,无论是在办公室、拥挤的咖啡馆、地铁上还是走在街上。
大多数追求无声语音的公司设想将技术嵌入像耳机或蓝牙式头戴设备这样的消费产品中。在产品形态因子中包含某种耳机非常重要,因为它实现了私人默语输入与私人音频输出的闭环——例如,用户不仅可以谨慎地查询AI模型,还可以谨慎地接收响应。
虽然几家有前景的初创公司目前正在研究无声语音技术,但迄今为止只有一家从隐身模式中出现:MIT衍生公司AlterEgo。AlterEgo两个月前发布的3分钟发布视频值得观看,以获得无声语音概念的具体感受。
"当前与计算和AI交互的方式受限于你在屏幕和键盘上点击和打字的速度,"AlterEgo CEO/联合创始人Arnav Kapur说。"对于智能时代,我们需要一个从头开始构建的全新界面——感觉像人类思维的自然延伸的东西。为了实现这一点,我们必须发明全新的东西。"
预计在2026年会看到几个资金充足且血统良好的无声语音竞争对手从隐身模式中出现。
推测认为,像苹果和谷歌这样的科技巨头正在认真探索无声语音能力,作为未来消费硬件产品的基础技术。类似地,传言纷纷认为OpenAI即将推出的由传奇前苹果设计师Jony Ive牵头的AI原生消费设备将涉及无声语音。
因此,我们不会惊讶在近中期看到这个初创公司类别中的一些高调并购。
但无声语音要成为人机交互的主要新范式,必须克服一些障碍。
首先是无声语音产品的广泛采用将需要消费者行为和社会规范的重大变化。今天有多少人会在办公室或咖啡馆坐着时舒适地使用需要对自己默默说话的产品?
对无声语音更根本的风险是,更直接与大脑接口的其他脑机接口技术可能会超越它并超越其能力。如果能够直接从大脑提取高保真度语言信号——如果说,AI优先EEG或下一代超声成像实现其潜力,如上所述——为什么要费心默语?无声语音可能比可听语音更私密,比打字延迟更低,但思想比所有这些都更私密且延迟更低。
事实是,这些技术都还没有准备好投入使用。每个都在快速发展,每个都有巨大潜力,但每个都可能遇到低性能上限或证明难以产品化。时间将告诉这些技术改进得多快,足以找到进入人们使用和喜爱的产品的方式。
结论
在整个人类文明中,技术进步的定义主题之一是交流和信息传输的速度、带宽和保真度的改善。文字的发明、古腾堡的印刷机、电报、收音机、电话、互联网——所有这些技术飞跃的本质都是增强人类分享信息的能力。
一般来说,当更多人能够更有效地彼此传达更多信息时,它会导致各种积极的事情,这些事情是不可能提前预测的:科学、健康、生产力、教育的进步,以及我们对彼此和宇宙理解的增进。
脑机接口代表了这个千年技术进步长征的自然下一步。
直接往返大脑是信息在人类和机器之间移动的最有效方式。它消除了对有损中介的需要,包括语言本身这个中介。毕竟,语言是高度有损的压缩:考虑你内在精神体验的丰富性和细致入微,以及你能够用文字捕捉的内容之间的差距。
高性能脑机接口将解锁各种美好而有价值的可能性。最近期的影响将是医学的,这些好处对世界各地遭受各种神经精神或心理健康疾病的数百万人来说将是深远的。但这只是开始。想象能够仅仅通过"上传"到你的大脑就立即获得新技能——比如空手道、潜水或高尔夫——直接强化适当的神经途径。想象能够以完美的"感官保真度"回忆和重温任何记忆。想象能够重新编程你的大脑,看到或感受到当今人类大脑无法直接感知的东西:Wi-Fi信号、无线电波或"真北"方向。
更重要的是,我们还无法设想脑机接口将带来的最深刻的转变和机会——就像14世纪的人无法设想印刷书籍将如何转变社会(民主、科学方法、启蒙运动);或者1980年代的人无法设想互联网将如何转变社会(比特币、云计算、优步)一样。
在充分的时间里,脑机接口技术在整个社会的普及是不可避免的。然而,远未解决的是,脑机接口的主流方法将是非侵入性的,还是侵入性的,或者两者的某种结合。
在当今技术的少数领域中,如此多的知情观察者对该领域如何向前发展持有如此深度信念的截然相反观点。一些专家基于简单的物理定律提出令人信服的论点,认为最复杂的脑机接口能力将始终需要与大脑的直接物理接口,因此需要手术。其他人也令人信服地论证,非侵入式技术是该领域的必然终点,考虑到它们在可扩展性、安全性和易用性方面的巨大优势;仅仅是时间问题,感知、解码和调节技术将改进到甚至最先进的脑机接口应用都可以非侵入性地实现。还有其他人认为,直接关注大脑本身甚至是不必要的,像无声语音这样的代际价值产品将基于大脑下游的信号构建。
在未来几年中,这些技术将从研究实验室跳跃到我们所有人的生活中。请系好安全带。
Q&A
Q1:非侵入式脑机接口与侵入式脑机接口有什么区别?
A:非侵入式脑机接口通过放置在头皮外的传感器(如EEG、MEG、fNIRS等)来读取和调节大脑活动,不需要手术。而侵入式脑机接口需要手术将电子设备植入颅内,直接接触大脑组织。非侵入式方法更安全、成本更低,但精度和功能可能受限。
Q2:聚焦超声技术为什么被认为是最有前景的脑机接口方法?
A:聚焦超声具有三大独特优势:首先,它的空间精度可达亚毫米级,比其他非侵入式技术精确几个数量级;其次,它能深入到大脑内部结构,访问丘脑、海马体等深层区域;第三,它既能"读取"又能"写入"大脑信号,实现闭环功能。这使得它能够治疗更多疾病并实现认知增强。
Q3:当前的脑机接口技术距离实际应用还有多远?
A:部分技术已经接近应用阶段。像Somnee的睡眠改善头带、Flow的抑郁症治疗设备已经可供消费者购买,并在临床试验中显示有效性。而EEG解码思想的技术目前准确率约45%,还需要进一步改进。聚焦超声和基因编辑结合的技术仍处于早期阶段,可能需要十年或更长时间才能成熟。
1316

被折叠的 条评论
为什么被折叠?



