利用生成式人工智能加速医疗保健和生命科学创新

利用生成式人工智能加速医疗保健和生命科学创新

关键字: [Amazon Web Services re:Invent 2024, 亚马逊云科技, 生成式AI, Amazon Bedrock, Generative Ai, Healthcare Innovation, Data Access, Autonomous Agents, Clinical Documentation]

导读

医疗保健和生命科学正在利用生成式人工智能的力量,为药物研发、临床试验和患者护理开启新的可能性。在本次讨论中,我们将探讨领先的医疗保健和生命科学机构如何成功地在整个组织中整合生成式人工智能,以实现真正的商业价值。探索这些机构如何构建企业级数据战略和数据系统,打破内部数据孤岛,为其数据和生成式人工智能计划提供动力。获取从试点项目到在整个健康连续体中进行生产部署,成功运营和扩展生成式人工智能的见解和最佳实践。

演讲精华

以下是小编为您整理的本次演讲的精华。

我们今天所居住的世界是一个获取数据和获得重要问题答案的过程异常艰难和耗时的世界。想象一种情况,您缺乏解决关键问题所需的数据,不得不进行艰苦的搜索,可能需要筛选印刷材料,或者意识到所需数据根本不存在,需要手动创建。一旦您收集了数据并提出了问题,想象一下您必须排队耐心等待,将您的发现和疑问呈现给专门负责实际工作的团队,您别无选择,只能等待他们完成工作。

这就是我们目前所面临的现实,尽管确实有许多亚马逊云科技客户正在利用生成式人工智能技术取得了令人印象深刻的成就,例如开发新药物、诊断工具和临床决策支持系统,但大多数人仍在使用生成式人工智能出现之前普遍使用的相同方法和技术。这种困境是悲剧性的,因为它阻碍了我们以最佳速度开发疗法、诊断和临床决策系统的能力,让患者处于等待状态,正如Paul Jansen博士所言:“还有更多工作要做。患者正在等待。”

在亚马逊云科技,我们很幸运能与世界各地数千家医疗保健和生命科学组织合作,从初创公司到最大的生物制药公司、提供商、付费人以及为这些实体服务的无数技术公司。通过与这些众多客户的广泛合作,我们发现了三个主要挑战,阻碍了客户充分实现人工智能和生成式人工智能的潜力。

首先,很难找到和访问训练模型或利用现有模型所需的数据。其次,在必要的数据不存在的情况下,生成新数据是一个艰难且通常是手动的过程。第三,对于绝大多数人来说,人工智能仍然是一个过于技术性的领域,通常需要深入的专业知识来训练模型、构建软件管道和扩展计算基础架构,除了在自己的领域(如生物学、临床试验设计或医学)的专业知识之外。这实际上使那些没有这种技术能力的人只能扮演排队等候另一个团队代表他们工作的角色。

举个例子,AlphaFold是一个非常强大的新模型,目前大多数生命科学客户都在使用。这个模型采用了类似脚本的界面。对于不擅长在脚本环境或使用Python的人来说,他们的选择是有限的,最终会处于排队等候的位置。

对于太多的客户来说,他们使用人工智能的体验就像20世纪60年代访问主机一样。在亚马逊云科技,我们多年来一直在两个不同的方式努力工作,创建工具和系统,让客户可以利用这些工具和系统来解决所有三个挑战。

第一种方法涉及本周讨论的人工智能和数据服务,如Amazon Bedrock、Amazon SageMaker,以及一些较不为人知但同样重要的服务,它们特别适合解决这些特定问题。Amazon Data Zone和Amazon Clean Rooms就是两个这样的例子。

此外,在过去的五年左右,我们一直在构建专门为医疗保健和生命科学客户量身定制的行业特定服务,包括数据格式、元数据模式和在医疗保健和生命科学行业运营所需的监管合规性要求。我们和利用这些服务的客户多年来一直在进行的投资,正是推动客户加快利用人工智能并为其利益相关者民主化获取人工智能的催化剂。

希望利用这些服务(包括通用人工智能和机器学习服务以及我们为医疗保健和生命科学量身定制的服务)的客户必须采取一个关键步骤:将数据迁移到云端。人们常说,对大多数客户来说,最好的事情就是CIO对人工智能产生了热情,因为这促使CIO指示所有人:“你们必须尽一切努力让我们能够利用这一点”,从而为我们在数字和IT组织中的客户提供了他们长期以来所需的支持来开展这些计划。

将数据迁移到云端是第一步,因为只有数据位于云端,您才能充分利用弹性、安全性和可用性,从而实现大规模的数据科学和人工智能。

真正展示了如何正确应对这一挑战的客户之一是强生公司。早在2010年,强生就是最早采用亚马逊云科技的制药客户之一,从那时起我们一直保持着战略合作关系。如今,强生遵循云优先战略。强生的目标是到2025年将50%的应用程序迁移到云端,他们已经超过了这一目标。事实上,自2019年以来,他们的云采用率也增加了五倍。这些活动产生了重大的业务影响,如今,强生正在利用云端的生物签名平台支持小分子药物发现,在其安全平台上管理不良事件,并在物理建模和模拟中用于骨科研究。

通过迁移到云端并采用我们的生成式人工智能和机器学习服务,亚马逊云科技客户正在加速从研发到诊断和治疗的整个过程中的创新,甚至在支持患者的健康旅程中也是如此。

让我们从研发和新药发现过程开始讨论。如您所知,第一步被称为靶标识别,其中确定并验证了一种在引起疾病中发挥关键作用并可被药物靶向的生物分子或细胞过程,通常称为受体。这是一个巨大的挑战,因为它需要整合多种不同类型的数据,正如您所看到的,而且所需的数据往往分散在各种数据源中。这就产生了我之前提到的三个挑战中的两个:如何找到所有这些数据,以及一个不太技术娴熟的人如何利用这些数据进行靶标识别?

之所以如此具有挑战性,是因为在这种工作中,研究人员无法预先确定他们需要哪些数据或来自哪个来源。他们经常花费数百个小时在不同的数据存储中搜索,导致一个高度动态和多步骤的工作流程,其中每一步都取决于前一步的发现结果。

理论上,数据目录和自动化应该能够极大地缓解这个问题。但实际上,情况并非如此,我将讨论为什么会这样,以及我们一直在开发的解决方案。

让我们首先讨论数据目录。数据目录一直受到单个组织内不完整和不兼容的元数据模式的阻碍。不同的团队开发了自己的模式。自动化系统通常需要缺乏记忆保留和学习能力的严格规则。

为了解决关于数据目录的第一个问题,我们在两年前推出了Amazon Data Service,从那时起,我们看到了医疗保健和生命科学客户(如Natera、Bristol Myers Squibb和Genentech)对该服务的成功采用。由于Data Zone直接解决的问题有两个方面——首先是协调不同的元数据,为此我们在Data Zone中采用了LLM;其次是提供受管理的访问——事实上,即使在单个企业内部,也不适合让一个团队访问另一个团队的数据,除非已经设置了适当的权限。当这些权限没有建立时,流程就会变得过于手动化。Amazon Data Zone自动化了所有这些,我们正在看到它被广泛采用。这是LLM在我们许多服务中解决这一问题的一个很好的例子。

这解决了数据目录的挑战。自动化挑战是另一个我们正在应用生成式人工智能技术的实例。生成式人工智能自主代理解决了先前自动化系统的弱点,因为它们可以智能地自动化工作流程无法预先确定的任务。代理将一个复杂的任务分解为单个步骤,每个步骤不是预先确定的,而是由代理根据前一步收集的信息动态决定的。

通过将这些自主人工智能代理连接到内部数据存储和外部数据源,我们真正可以加速整个靶标识别过程。Amazon Bedrock Agents在去年的re:Invent上推出,从那时起我们就有多个客户利用它来解决这个特定问题,因为它非常适合这种工作流程无法预先确定的动态研究活动。

今天,我很高兴分享我们一直在做的工作,特别是与Genentech这样的客户合作,帮助他们在Bedrock上实施自己的研究代理,将内部和外部工具结合起来,快速识别新药物的靶标和试验的生物标记物。

患者正在等待更好的药物,更安全、副作用和不良反应更少的药物。他们在等待治疗目前无法治疗的疾病的药物。他们希望活得更长久、更美好,而阻碍患者实现这些目标的障碍是开发新药物的巨大困难。

人体内有数千种不同的细胞类型和状态。基因组中有20,000个基因。有10的60次方种具有药物相似性质的小分子。也许有20的32次方种具有治疗相似性质的抗体。我们无法一一列举所有这些可能性。你当然可以在实验室中做到这一点,你可以让地球上的整个人类参与进来,但你甚至无法在计算机上完成。由于空间如此广阔,挑战如此巨大,我们不能完全依赖于进行实验的能力。人类非常聪明,但我们并非无所不能。我们需要额外的帮助,而生成式人工智能为我们提供了这种额外帮助。

我们与亚马逊云科技建立了良好的合作关系,为Genentech和众多不同学科的科学家打造了一款真正适合目的的研究智能体。通过与Amazon Bedrock合作,我们能够建立与相关数据库的链接,以便我们可以查询它们。一个典型的科学工作流程将从检查特定数据库开始,然后是第二个和第三个,通常应用特定的计算方法来分析这些数据。原则上,当提供相对最新的工具时,智能体允许你自动化这个过程。诸如生成式人工智能之类的工具传统上一直是计算科学家的专利,他们拥有执行这些工具的专业知识。

然而,我对自主智能体等工具的发展特别感到兴奋的一件事是,它们能够使访问数据集和计算工具民主化,使那些计算背景较少的科学家也能够通过以真正迭代和连贯的方式与智能体互动,从而利用这些工具并将其用于直接加速研究。

我们正在利用亚马逊云科技在自主智能体和大型语言模型本身方面的惊人能力和知识,以及数据、云和工具的运作方式。在这种情况下,智能体真正为我们正在努力实现的工作提供了难以置信的推动力。它们能够进行推理,拥有信息,记住过去的事件,能够执行操作,并能够执行部分工作。

我们对智能体如此兴奋的一个原因是,我们实际上相信它们能帮助我们的科学家表现得更好。它们无法取代我们的科学家,但确实增强了我们科学家的能力。当你允许智能体和我们最优秀的科学家一起工作时,真正酷的部分就出现了。那时,他们的表现远远超过我们单独最优秀的科学家,这意味着我们最优秀的科学家现在变成了更好的版本。我们让我们的人看到以前看不到的东西,并让我们的人有时间利用他们独特而特殊的大脑去做只有人类才能做到的事情,那种才华、创造力和独一无二的人性极限。

当然,这一切的最终目的是我们能够确定目标并设计研究,从而使药物更快地送到患者手中,这正是我们Genentech的核心使命。

Genentech估计,这将帮助他们每年自动化43,000小时,几乎每年节省5个人年的时间,如果扩展到整个企业范围内的话。令人难以置信的令人兴奋,所以这是目标识别。

正如你们许多人所知,在药物发现和开发过程的下一步是确定将击中该目标的分子。这就是先导化合物的确定。现在,先导化合物已经显示出比任何其他领域都更能从智能体人工智能和其他形式的生成式人工智能中获益。所以我们现在将简单讨论几分钟。

生成式人工智能和人工智能对先导化合物识别的影响力是如此强大,以至于它导致了今年的诺贝尔化学奖,该奖项授予了开发最常用于识别和确认先导化合物的人工智能模型的团队和人员。这些算法可分为两大类:

1)设计新生物分子(如蛋白质)的生成模型 2)预测给定分子需要具备的关键性质(如结构或功能)的预测模型。

这些生成模型和预测模型极大加快了药物设计过程中关键步骤的能力是如此强大,以至于催生了许多额外的子类模型,研究人员一直在为不同类型的生成和预测开发新模型。这展示了其中的一些。围绕这一点有如此大的热情,以至于对于那些模型类别中的每一个,几乎每个月都会出现数十种新模型。事实上,情况已经到了你甚至无法跟上的地步,这是一种遗憾,因为这意味着可能存在一种非常出色的新模型,正是研究人员解决他们所关注的问题的正确选择,但他们没有时间去了解、测试并将其纳入工作流程。

我们将在这里讨论两种这样的新模型。简而言之,ESM3模型和AmplifyESM3来自Evolutionary Scale,可以以前所未有的控制程度生成新蛋白质。你可以在ESM3模型中输入结构、序列或功能中的任意两个,它将给出缺失的第三个。这允许你设计不存在于自然界中的新蛋白质,或者作为蛋白酶活性位点的潜在骨架。Amgen和Miela最近发布了Amplify,这是一种新的开源人工智能蛋白质语言模型。它使用小模型方法来实现更快的推理。研究人员可以在亚马逊云科技上运行推理并使用自己的数据进行微调。

现在,要设计一种具有所需所有性质的可与目标结合的分子,你实际上需要使用来自不同类别的多个模型,并需要将它们组合到一个工作流程中。因此,我将通过我们今天在客户中看到的一个更常见的工作流程,重点介绍这四个模型,其中两个是生成模型,另外两个是预测模型。

通常,这个工作流程如下:研究人员将从目标的结构开始,并希望得到一种之前已被证明接近但并非完全可以击中该目标的蛋白质。这就是两个输入。研究人员将这两个输入都输入到RFDiffusion模型中,这是Baker实验室开发的模型之一,并因此获得了诺贝尔奖。现在RFDiffusion生成了多个可能有效击中该目标的新蛋白质的高级设计。这些高级设计然后被输入到另一个来自Baker实验室的名为ProteinMPNN的模型中,该模型完成了更加详细的蛋白质设计,但在那个时候,你会有数千甚至数百万种设计。

那么,拥有数百万种设计你该怎么办呢?这就是预测模型发挥作用的地方,因为不同的模型将帮助预测不同的性质,无论是功能、结构、结合亲和力等等。因此,如何从中筛选出最佳的5个、10个或20个候选物,然后在湿实验室中合成并进行测试,这正是这些预测模型所能做到的,而使用多个预测模型的结果允许你根据各种标准对它们进行排名。

问题是这是一个非常复杂的过程,而且由于它很复杂,当我之前展示给你的那些新模型出现时,试图抓住其中一个并更新你已经花费数周时间构建的工作流程就太费力了。

这就是我们开发亚马逊云科技 Health Omics的原因。Health Omics使生物学家能够从事生物学工作,而不是编写和管理管道,我们构建它是为了构建、自动化和扩展生物学工作流程,最初是组学工作流程,在过去一年中,我们扩展了它以编排人工智能生物学工作流程。我们预先配置了最常见的工作流程和模型,如我刚才展示的那些,但你也可以使用自己的模型。例如,我知道你们许多人都在使用我们合作伙伴NVIDIA的技术,而NVIDIA如你所知,拥有他们的BioNEMO和NIMS微服务,以及他们对RFDiffusion的实现比开源版本快两倍。因此,如果你想在已有管道中使用它来代替当前的开源版本,如果你正在使用亚马逊云科技 Health Omics,那是一个非常简单的直接替换。

现在,为了让你听到我们的亚马逊云科技客户之一是如何使用亚马逊云科技 Health Omics来自动化人工智能生物学工作流程的,我很高兴在这里欢迎默克研发IT副总裁Matt Studney。

[Matt Studney] “非常感谢,Sam。很高兴在这里。我们前几天与来自亚马逊云科技的Aaron Friedman和来自默克公司的Danny Bitten进行了更详细的讨论。但最终,我们与亚马逊云科技健康组学团队合作,开发了一种前沿的人工智能蛋白质设计流程。该流程集成了RFDiffusion模型、蛋白质语言模型,并整合了AlphaFold结构预测,从而能够以前所未有的速度和规模设计新分子。应用范围涵盖疫苗开发、诊断、新药发现和生物催化等领域。实际上,这代表着医学的一个全新前沿,这些先进技术可以重新定义可能性,我们可以创造出具有理想特性的蛋白质、肽和酶,而这些在自然界中是不存在的,其中一些已经在我们的湿实验室中得到验证,这就是我们做这一切的原因。”

[Sam] “太棒了,Matt,你一直是我们的重要合作伙伴,帮助我们确保健康组学能够满足你们研究人员的需求。现在,你也知道,在将药物推向市场之前,下一步就是临床试验。对于大多数客户而言,临床试验占据了新药开发时间和成本的65%到70%,这就是为什么众多客户都专注于如何释放数据、将其迁移到云端,并利用现代分析和人工智能来加快这些过程。你能与我们分享一下默克公司在现代化数据基础设施和临床数据集方面的经历,以实现这些目标吗?”

[Matt Studney] “当然,我很乐意分享。谢谢Sam。在默克公司,我们有一个名为”零重力“的项目。这是什么?为什么会这样命名呢?这是目前默克公司最重要的转型项目,我们正在重新定义临床试验的业务流程和技术架构,这个项目就叫做”零重力"。我们正在现代化技术架构和能力,这是一个持续多年的努力,大约已经进行了两年,将影响到我们研究实验室数千名员工的工作。

我们之所以称之为“零重力”,是因为我们之前尝试过,但由于已建立系统的复杂性,我们最终崩溃了。变革的必要性是显而易见的。我们需要简化当前的架构状态。我们需要更多的敏捷性——现在,无论是遇到疫情还是新的试验设计,要改变和发展我们的系统以反映我们需要运行的临床试验类型都是非常困难的。

效率——从研究构建到启动现场,再到执行试验、收集数据、清理数据、分析数据,过程中存在很多阻力,有很大的提高效率的空间,这样我们就可以更专注于我们擅长的发现和开发药物。

这些业务驱动因素确实可以减少集成和系统复杂性。目前我们可能有200多个应用程序和系统,可以想象中间件的复杂程度。当出现故障时,想要恢复运行需要多长时间。如果一项成功的临床试验延迟一天,那就意味着推迟了一天让患者获得这种救命药物。因此,我们必须正确处理这个问题。我们必须适应临床试验创新。"

"我们有新的治疗方式,有新的患者目标群体,我们需要以更快、更高效、更高质量的方式完成所有工作。提高研发生产力、用户满意度和用户体验是一个关键因素,我已经暗示过了。

我们与合作的现场以及整个生态系统都可以从我们正在构建的高效平台中获益。最终,采用SaaS模式和云架构将使我们能够保持系统的最新状态、定期升级、解决问题,并专注于最重要的事情。

我们采取的方法首先是建立一个业务能力平台。我们选择了Veeva Vault临床套件——用于电子数据采集、临床试验管理系统、研究启动等核心能力。

第二是临床数据层。尽管我们选择了Veeva,但我们已经有了其他内部和外部的生态系统,无论是在收购公司或与其他公司合作时。因此,我们始终需要一个可以从任何来源、任何格式接收数据的地方,将其转换为我们所需的标准,然后让用户可以使用。这并非一个简单的过程。它受到严格监管,多年来遇到了许多挑战,但我们需要使其变得更加无缝和高效。

我们选择与亚马逊云科技合作,共同构建这个临床数据层,因为他们拥有技术栈、专业知识和架构,我们知道这些都可以实现我们当前的需求。我们已经推出了编码、盲法遮蔽等功能。我们非常接近拥有所需的所有数据库锁定功能,并且我们正在使用Bedrock和Anthropic模型来实现这一目标。

我们正在努力实现的一个更具挑战性的目标是SDTM引擎,其中你拥有动态标准,存在于临床试验设计和我们需要分析的标准之中,因为试验变得越来越复杂,药物变得越来越具有针对性。我们正在研究一些非常具体的突变,数据量正在爆炸式增长,图像也变得越来越大,我们将需要以更少的人工努力来实现这一点。到目前为止,在我们进行的一些试点项目中,我们已经看到准确度提高到了90%左右的最终结果水平,这是一个很好的合作伙伴关系。我们期待继续合作。我们希望这可以产品化,其他人也可以加入进来,所以在座的各位在制药行业工作的人员也应该采取这种方法。

[Sam] "非常感谢Dan,非常感谢Matt。欢迎加入。加快临床试验进程对于更快地将疗法带给患者至关重要。

我想花一点时间谈谈一个我知道对于我们的生命科学组织和客户来说是一个非常热门的话题,而且我认为在医疗服务提供商中也越来越受重视,那就是真实世界数据。真实世界数据是利用来自医疗服务提供商环境的去识别化患者数据,用于生命科学组织的各种不同目的。它是John和Avi从基因泰克公司提到的目标识别的关键部分。它在临床试验中也扮演着关键角色,例如确定哪些地点可能是进行试验的好地方,以及哪些患者可能对某种新疗法有反应。

在当今生命科学的商业部分,真实世界数据也有许多用途,包括识别、许可和使用真实世界证据。尽管真实世界数据极其重要,但获取它也极其痛苦,这主要是因为关于一个患者的所有不同类型的数据,以及你需要的该患者的纵向数据并不存在于一个地方。由于数据不存在于一个地方,因此扮演从多个提供商系统聚合数据角色的第三方通常拥有不完整的数据,这使得搜索这些数据极其困难,并且在许可这些数据之后,由于这些聚合商没有使用相同的元数据模式,因此来自不同来源的数据协调也是极其困难和耗时的手工操作。

几个月前,我们宣布与合作伙伴Datavant建立合作伙伴关系,专门解决这个问题。它使用Datavant的令牌技术和其他服务。它使用AWSClean Rooms,并使用生成式人工智能来自动化元数据清理。我们对此感到非常兴奋。我只是想让你们了解一下,我们将在2025年就此有更多内容分享。

尽管人工智能在药物发现和开发方面的进步令人兴奋,但如果我们无法准确诊断患者并将正确的疗法提供给正确的患者,它就不会对患者产生任何影响。在这方面,人工智能也在发挥巨大作用,加速解决当前临床环境中存在的挑战。主要有两个领域可以帮助解决当前存在的挑战。

第一个是产生新数据的诸多挑战。目前,在临床环境中存在大量手动数据生成,尤其是医疗服务提供商需要在电子病历中输入数据。

第二个是同样的主题,人工智能太过技术化,因此我们将讨论临床环境中两个最重要的领域,需要在这两个领域取得改进,以便人工智能发挥全部潜力。第一个是电子病历,第二个是医学影像。

现在,在使用人工智能之前,将电子病历迁移到云端有许多原因。云端更安全、更可扩展,而在勒索软件攻击时代,将数据存储在云端,您可以非常确信备份,我们在亚马逊云科技拥有所有用于数据安全和数据隐私的工具,这确实是确保数据安全的关键第一步。本周,我们很高兴宣布了一项新服务,专门用于数据安全,称为亚马逊云科技安全事件响应,它真正实现了准备、响应和从安全事件中恢复的所有活动自动化。

但这只是个开始。一旦能够将大量数据迁移到云端,您就可以利用应用高级分析的能力,从而获得患者的纵向视角。在过去一年中,我们看到医疗保健提供商,尤其是那些使用Epic Systems将其系统从本地迁移到亚马逊云科技的提供商,取得了巨大进步,我们对他们取得的成就和看到的好处感到无比兴奋,包括患者病历100%可用、性能提高25%以及与本地部署相比节省30%的成本。这就是几周前Gartner将亚马逊云科技评为云性能领导者的一些原因。亚马逊云科技的整体性能得分为94分(满分100分),这是因为技术、速度和支持的结合。受访者赞扬亚马逊云科技的高性能产品、快速部署速度以及亚马逊云科技团队出色的专业知识。

正如我之前所说,一旦数据进入云端,就可以以前所未有的规模和速度进行分析和人工智能,原因在于我今天演讲中较早描述的那些专门用途的服务之一。几年前,我们推出了亚马逊云科技 Health Lake。亚马逊云科技 Health Lake是一项符合HIPAA规范的服务,提供防火API,帮助客户在几分钟内安全地存储、转换、交易和分析医疗保健数据。它能够在患者和人群层面提供纵向视图。

正如我所说,我们在EMR方面取得了出色进展,但另一个需要迁移到云端并应用分析、机器学习和人工智能的关键数据源是医学影像。医学影像包括X射线、CT扫描、MRI、超声波等,对于诊断许多常见疾病至关重要。然而,它们比EMR数据更具挑战性,原因有二:首先,文件体积庞大;其次,文件通常被束缚在旧的本地系统中,不仅存在于一个机构内,而且由于患者不总是在同一个地点进行影像检查,因此分散在多个机构中。

好消息是,与EMR情况一样,许多医疗系统也将医学影像迁移到云端,以克服这些挑战。我们一直在与提供商所熟悉和信任的领先医学影像公司密切合作,这些公司目前掌握着他们的数据。我们一直在努力促进云端之旅,原因是我们长期投资于另一项专门用于医疗保健和生命科学的托管服务,即亚马逊云科技提供的亚马逊云科技 Health Imaging。

我将讨论两个客户及其使用亚马逊云科技 Health Imaging和其他亚马逊云科技分析、人工智能和机器学习服务的情况,因为它们可能产生变革性影响。我们与通用电气医疗系统有着长期的战略关系。今年早些时候,我们宣布扩大这一关系,通用电气正在亚马逊云科技上训练多个医学影像基础模型,特别是在SageMaker上。本周,当通用电气医疗系统宣布业界首个3D全身MR基础模型时,我们感到无比兴奋,原因是使用基础模型,您无需每次都为特定疾病和特定器官训练单独的模型,而是可以训练一个FM,用于生成无数个针对多种疾病和多个器官的离散模型,这将极大加快我们在临床环境中应用人工智能的能力。

我们与飞利浦也有着长期的战略关系。就在上周,我们宣布扩大这一关系,飞利浦将把其放射学、数字病理学和心血管系统迁移到云端,包括他们已经迁移到150个站点的现有系统和全新的云原生服务。这将实现患者的纵向视图和多模态视图,提供商可以以集成方式查看数字病理学、医学影像、电子病历,并进行高级可视化。我们对这些公告感到非常兴奋。

我谈到了临床环境中手动数据创建的诸多挑战,在临床文档方面,这种挑战尤为突出。无论是在会诊期间还是在查看扫描并创建研究后,提供商都需要将信息输入某个系统。

如今,这通常是通过键入或使用相对不太先进的语音识别系统来完成的。这正是大型语言模型和生成式人工智能可以发挥巨大影响的领域,我们必须利用这一点的原因是,当前的临床文档负担是医疗保健提供商燃耗和离职的主要驱动力,而我们实际上需要更多的医疗保健提供商。

因此,为了讨论生成式人工智能不仅可能带来的影响,而且可以解决临床文档负担的现实,我很高兴欢迎Pieces Technology的创始人兼首席执行官Rubin Amr Singham博士和克利夫兰诊所的首席医疗信息官Amy Merlino博士。

[Amy Merlino] "是的,谢谢Dan。我是Amy Merelino,正如你所说,我在克利夫兰诊所担任首席医疗信息官。我也是一名执业的母胎医学专家,因此继续从事临床工作。我将CMIO的角色描述为在技术团队和临床团队之间充当翻译的角色,真正致力于识别可以增强和改善我们的护理和服务交付方式的技术解决方案。

医疗护理的重要部分之一是临床文档,从高层次来看,这实际上是为了捕获提供商的护理和医疗决策。但我们增加了不仅仅是为了患者护理,还包括沟通、质量报告、合规性、计费,加上您刚才分享的来自我们EMR的所有这些数据,真的让浏览患者病历并创建这些文档成为提供商的负担。人们说这确实是导致临床医生燃耗的主要原因之一。在彻底性和效率之间实现平衡,并满足施加在提供商身上的所有要求,确实是一个巨大的挑战,我确实认为一些即将推出的人工智能工具将为我们提供缓解这些负担的绝佳机会。"

[Rubin Singham] "谢谢Dan,作为一家医疗保健人工智能公司,Piece的使命是帮助那些帮助他人的人。所以是医生、护士,所有这些了不起的护理专业人员。他们日复一日地照顾病人。因此,我们正在使用预测建模、生成式人工智能、对抗性人工智能,正如你之前所暗示的,越来越多地使用代理人工智能来减轻临床文档负担,Amy谈到了这一点,并改善临床沟通。

对我们而言,这涉及笔记、帮助医生撰写笔记、总结、出院总结等。例如,我们与克利夫兰诊所合作的两个用例之一就是所谓的Pieces工作总结,这是对患者在医院的整个记录进行100或200字的临床总结。所以想象一下,患者在医院住了4或5天。这可能是数百页的文档。如果是一个非常复杂的病例,可能会有数千页。人工智能的目标是每2到15分钟以临床格式总结这些信息,医生可以快速纳入。

另一个例子是出院总结,出院总结是一份非常重要的临床文档,医生必须在住院时完成,目的是总结整个住院过程,以便下一位将接手该患者的门诊医生了解情况。这对临床护理、交接和从住院到门诊的转移至关重要,但需要大量时间。因此,我们发现通过为医生起草高度准确的出院总结,可以在医院的临床轮班中为医生节省60到90分钟的时间。

为什么与Bedrock系统合作如此重要?Pieces完全部署在Bedrock上,我们发现我们正在为神经外科、心胸外科、儿科、产科/妇科等各个专科的医生提供支持,能够针对不同的临床认知任务使用不同的大型语言模型至关重要。我们发现这些大型语言模型的行为模式在不同情况下确实很适用,因此人工智能的工作之一就是帮助确定这一点,而Bedrock系统在这方面表现出色。

第二个与亚马逊云科技相关的部分是,显然在复杂环境中保持数据的安全性和隐私性非常重要。我们在此基础上叠加了对抗性系统,即对抗性人工智能,用于检查首次生成的人工智能输出中是否存在临床错误,然后将其与双重人工审查系统相结合,让临床医生在人工智能输出进入临床领域之前对其进行检查。通过这样做,您可以将错误率控制在非常低的水平。"

[Amy Merlino] "是的,令人兴奋的一件事是,我们在出院小结方面取得了早期成功。我们已在克利夫兰诊所总部和马丁分院(我们的一家区域性医疗机构)部署了第一批用户。以下是持续的叙述性总结:

[Amy Merlino] "在总部,我们将其用于教学服务,由住院医师和员工医生为复杂病例患者提供治疗,有趣的是,我们发现他们实际上每天都会查看该出院小结,也就是较长的总结,以跟进患者的最新情况,并随时间推移对出院小结进行修改。

在我们位于马丁的区域医院,我们注意到他们在出院时间附近与之互动,几乎90%的时候,出院小结都是由Pieces生成的草稿,而且完成速度大大加快,正如Rubin所提到的,这对于安全地将患者转诊到下一个地点的过渡护理至关重要。

我们听到的一些反馈是,一位医生说,以前人们花费大量时间在记录住院过程,而你让我们重新拥有了这些时间。另一位医生说,当接手一位患者或者你离开一天左右时,这份总结就显得非常有用,这就是我们发现总结最有用的时候。

另一件令人兴奋的事情是,我们以一些意料之外的方式使用Piece的总结。例如,我们有一个快速响应小组,当患者病情恶化或出现重大临床事件时,我们会召集一组专门从事急救护理的医护人员,但他们对患者一无所知。我们发现,能够为他们提供患者的实时总结,有助于让他们了解患者的情况,从而做出更明智的决策,以在这种复杂的情况下执行关键护理。所以我认为这真正突出了这些总结可以应用于我们目前还没有考虑到的各种不同工作流程。"

[Sam] "这真是太棒了。非常感谢你今天的加入。通过与领先的医疗保健组织和技术供应商合作,我们正在解决临床文档负担,我无比兴奋。

非常感谢斯坦福,这确实令人兴奋,但正如你们所知,即使我们已经为某个患者确诊了正确的治疗方案,只有当患者真正能够获得该疗法时,他们才能从中受益。为了更多地了解如何改变患者获得疗法的途径,我很高兴向大家介绍一位我们认为在解决这一问题方面处于领先地位的客户。"

[医药广告] "当你不被归咎于无法控制的病症时,你会好起来。当护理不取决于你的收入时,你会好起来。当你的痛苦不被轻视、遗忘时,你会好起来。我们将永不停止努力变得更好,因为当医学变得更好时,我们所有人都能变得更好。

如果这听起来不像一般的医药广告,那是因为它本不应该是一般的广告。我们想做些不同的事情。我是Diogo Rau,是礼来公司的首席信息和数字官员。我们是一家医药公司。

传统医药广告的问题在于,通常会有两个人在草坪上玩狗,那是一个快乐的时刻,伴随着小曲。但如果你、你的父母、孩子或伴侣被诊断出疾病,那将是一个可怕而令人困惑的时刻。那绝不是一个快乐的时刻,因为生活是艰难的。

我们给自己设置了太多障碍,我们想以一种不同的基调来表达。首先是一大堆困惑,但接着你还要面临三大障碍:第一是预约医生,第二是弄清楚你是否有能力支付费用,第三是实际获得所需药物。这三大障碍现在都存在。

第一个障碍,预约医生,是我们所有人都能体会到的。我们都曾说过“我要做点什么,我要预约医生”,结果第一个可预约时间就在六月份。

第二个问题,支付问题,是我们都知道的。我们都见过药品的离谱价格,但可能只有我们中的一些人曾为此而苦恼。对于美国其他地区的许多人来说,情况并非如此,因为在美国,我们采取了一种与世界其他地方、与加拿大、与欧洲完全不同的模式,我们决定让患者自己承担药品费用。

在医疗保健行业的其他领域并非如此,但在药品方面确实如此。如果你现在去医院,你需要自付部分费用。如果你有很好的保险,你需要自付约3%的费用。但如果你去药房购买一些药物,可能是一些救命药物,你再次需要自付费用,但这次你需要支付20%的费用。3%到20%的差距是一种扭曲的经济学。这完全没有道理。为什么你要为能够让你远离医院的药物支付更多费用呢?这就是为什么我们需要做些不同的事情。

我并非来自生命科学行业。我在这个行业工作了大约3年半。在此之前,我在苹果公司工作,负责我们零售店和在线商店的工程工作。我们在那里面临着不同的一套问题,但来到这里后,我想做些不同的事情。我想改变所有这一切的运作方式,这就是我今天来到这里的原因。

顺便说一句,我忘了回到第三个挑战了。我们的第三个挑战实际上是实际获得药物。这可能是我们大多数人无法体会的,但在这个国家却是一个巨大的问题。美国约有46%的地区是药房荒漠。4500万美国人生活在我们所谓的药房荒漠地区。药房荒漠的定义是,你需要开车15分钟才能到达最近的药房。不一定是一家好的药房,不一定是有你需要药物的药房,只是任何一家药房,而且这15分钟是假设你已经有车停在前面。如果你没有钱买自己的车,而必须乘公交或步行,或者你需要轮椅,那就需要比15分钟长得多的时间,这是一个非常现实的障碍。

所以,这三个问题加在一起——能够预约医生、找到付费方式,以及实际获得药物——这三大障碍是我们必须彻底改变的。我们在礼来公司已经迈出了第一步。我相信,我们应该将从你决定要获得药物到实际能够服用药物的整个周期,从几个月缩短到一天,甚至几个小时。

我们通过所谓的“礼来直达”(Lilly Direct)迈出了第一步,我们认为这在制药行业是首创。它是直接面向消费者的,这是这个行业所不太熟悉的。但现在,如果你正在治疗肥胖或体重管理、糖尿病或偏头痛,你可以立即搜索附近的独立医生或安排远程医疗预约。当我说独立时,我指的是不受礼来公司雇佣或支付的医生。最棒的是,尤其是远程医疗,你甚至可能当天就能预约。所以第一个问题,获得医生服务的途径,我们已经解决了。

第二个问题是医疗保险和支付能力。我希望能告诉你我们可以解决它,但我们无法自己解决,但我们绝对可以让它变得更好。事实证明,现金支付药品的费用甚至比通过保险计划支付的费用还要便宜,所以我们让人们可以现金支付,无需预先授权,从而加快了整个过程。

现在是第三个问题,获得药物。通过礼来直达,你可以在就近的药房获得药物,或者可以将药物运送到家中或任何你想要的地方。就像亚马逊不会让你只能使用一种特定的数据库或大型语言模型一样,我们也不会这样做。我们说你可以使用任何你想使用的药房,如果你想使用亚马逊药房,当然也可以。我个人就在使用它。这是一个很棒的药房,有了这一点,我们现在可以说,第三个实际获得所需药物的问题,我们已经解决了。你可以在健康方面直接节省数月时间,这是一件了不起的事情。我无法过分强调这有多么重大。

但这是一个技术讨论会,我们在这里都是技术人员。我想提一点是,我们在两个六周的冲刺周期内完成了所有这些工作。我们是通过构建在亚马逊云科技之上来实现的。如果我们试图外包给系统集成商或引入大量其他顾问,光是采购流程就需要12周时间。"

因此我想向大家展示它是如何运作的。没有架构图的技术讲座是不完整的,所以我很乐意在接下来的35分钟里带大家逐一了解这里的每个模块。如果大家都没问题的话,我当然只是在开玩笑。但我要提及的是,我们的亚马逊云科技服务正在驱动这一切。我们采用了事件驱动的架构,使用了SQS,在数据库方面,我们使用了RDS和DynamoDB。我们将所有这些集成到了由一系列亚马逊云科技服务提供支持的数据和分析平台中。我们还以Red Hat OpenShift作为基础来运行这一切,我们做出了这个和其他设计选择,以实现容器化和编排。这对于我们从一开始就能够实现扩展至关重要。

我还要说,这与制药行业一直以来的做法有些不同。我们希望能提供类似电商的体验,如果我们突然增加到100万客户,我们也能够应对。但真正最棒的是,我们在这里构建的整个架构,尽管上面写着Lilly Direct,但它并不仅仅是Lilly Direct。它是一整套可重用的基础设施,我们可以将其应用于许多其他项目。

我还要提及,我们确实以移动优先的方式设计了这个渐进式Web应用程序,另外我们从一开始就考虑了无障碍设计。在每个人都翻白眼说“当然,在制药行业和医疗保健行业,一切都是以无障碍设计的”之前,事实并非如此。你只需打开任何一种药物,就会发现一套折叠成origami风格的使用说明,任何患有运动障碍的人都无法展开。说明只有一种语言,所以如果英语不是你的母语,你也无法理解。如果你是神经多样性人群,说明又太过密集,你也无法使用。当然,字体大小又是多少?大概是6号字体,所以如果你视力较差,你也将无计可施。这个行业并非建立在无障碍性的基础之上,我们希望改变这一切。

将所有这些结合在一起,这确实是一个令人无比兴奋的时刻。你们在开始时听到Dan谈到的发现网站,我很乐意与你们进一步探讨,但如果人们无法服用挽救生命的药物,这一切都将失去意义。因此我鼓励大家,不要再拖延那个你一直推迟的医生预约。去看医生,获取你所需的药物,好好照顾自己,照顾你的家人。我们只有一次生命,只有一个身体。

[Sam]"谢谢。你只有一个身体。它可能是完美的尺寸来做这件事。你的身体可能占据很大空间或需要用手语交流,但无论你生来拥有什么样的身体,你只有一个。让我们为之而战。我无法想象有比这更好的方式来结束我们的时光。

今天,在过去的一个小时里,感谢您们抽出时间与我们在一起,我们讨论了亚马逊云科技、我们的合作伙伴以及客户如何利用云AI、生成式AI技术来改变从研发、诊断到治疗的整个过程,当然还包括Diogo刚才如此精彩地与我们分享的支持患者的旅程。我们对未来如此兴奋的原因是,我们每个月都看到了更大的影响。尽管看到对医疗服务提供者的影响很有趣,对于那些真正热衷于生物学先进技术的人来说,看到对生命科学的影响也是非常有趣的,但只有当影响到患者时,我们才真正实现了我们的使命。我知道你们当中有很多人,我在人群中看到了很多熟悉的面孔,我知道你们中的许多人选择了这个职业,是因为你们想对患者产生影响,而你们正在做到这一点。所以感谢你们今天花时间与我们在一起,祝你们在Reinvent上度过美好时光。"

总之,这个详细的叙述涵盖了由于数据访问问题、技术专业知识差距和手动流程而导致在医疗保健和生命科学领域利用生成式AI的挑战。它强调了亚马逊云科技的行业特定服务、数据协调工具(如Data Zone)以及Bedrock上的自主代理,以加速药物研发。

它介绍了Genentech利用Bedrock代理进行靶点识别的客户案例、Merck在Health Omics上的AI蛋白质设计管道、他们“Zero Gravity”项目以现代化临床数据,以及真实世界数据合作关系。

它讨论了亚马逊云科技与提供商合作进行云迁移、与GE医疗保健等合作伙伴进行医学影像处理,以及通过生成式AI笔记总结与克利夫兰诊所和Pieces Technology等合作伙伴减轻临床文档负担。

最后,它介绍了Eli Lilly的“Lilly Direct”平台,该平台建立在亚马逊云科技之上,通过简化医生预约、支付和药物递送,从而改变患者获取药物的方式。该叙述强调了亚马逊云科技的使命是加速整个医疗保健领域的创新,以改善患者的健康结果。

下面是一些演讲现场的精彩瞬间:

想象一个世界,在这个世界里,寻找回答重要问题所需的数据是一项艰巨的任务,需要手动努力来定位或甚至创建必要的信息。

d8f3037e04e7bb4f287b6a534f659324.png

由于数据源分散和缺乏标准化的metadata schemas,生命科学组织在获取和协调现实世界数据方面面临着挑战。

4bc79ad35038c622cd3feaf5e0137569.png

亚马逊云科技使医疗保健提供者能够利用高级分析,并通过将其系统迁移到云端实现患者病历100%可用性、25%更好的性能和30%的成本节省。

2e9dc23285135db80adaea9795f44e9c.png

通用电气医疗公司宣布了行业首个在亚马逊云科技上训练的3D全身MR基础模型,使AI应用能够在临床环境中快速应用。

7ceff5fcc165f4b5a151e0da08c64141.png

一款从一开始就考虑到无障碍设计的渐进式网络应用程序,解决了医疗保健行业中常见的运动障碍、语言障碍、神经多样性和视力低下等问题。

bd049a59f93a260bbd3df3155d634120.png

亚马逊云科技和合作伙伴展示了云AI和生成式AI技术在整个医疗保健领域的变革性影响,最终使患者受益。

0b9bbfce76e0d7de33fcab42b3bb2123.png

演讲者强调了珍惜并为我们所拥有的这一身体而奋斗的重要性,无论它的大小或形状如何。

24c4fcc2ef12b9dfc67bdfafc3c16871.png

总结

在一段引人入胜的叙述中,Dan Sheeran,亚马逊云科技医疗保健和生命科学总经理,揭示了生成式人工智能在加速医学突破和提高患者护理方面的变革力量。他描绘了一个数据可及性、自动化和民主化人工智能赋予研究人员、临床医生和患者权力的生动画面。

Sheeran强调了三个关键挑战,阻碍了人工智能在医疗保健领域的全面潜力:数据可及性、手动数据生成和人工智能的技术复杂性。亚马逊云科技正通过创新服务如Amazon Data Zone、亚马逊云科技 Health Omics和亚马逊云科技 Health Imaging来解决这些挑战,实现无缝数据集成、自动化生物学工作流程和基于云的医学影像分析。

与行业领导者如Genentech、Merck和GE Healthcare合作,亚马逊云科技正利用生成式人工智能来彻底改革药物发现、临床试验和真实世界数据分析。Sheeran展示了自主代理、语言模型和基础模型如何简化目标识别、先导化合物生成和医学影像分析,大大缩短时间和降低成本。

Sheeran强调人工智能在缓解临床文档负担(医疗保健提供者燃尽的主要原因)方面的关键作用。与Pieces Technology和克利夫兰诊所合作,亚马逊云科技正在部署生成式人工智能解决方案,自动化记录、总结和出院总结,为医生节省宝贵时间,提高患者护理质量。

Diogo Rau,Lilly公司信息和数字总监,分享了Lilly Direct,这是一个建立在亚马逊云科技之上的创新平台,旨在解决获取医疗保健和药物的障碍。通过利用远程医疗、透明定价和方便的送货选择,Lilly Direct使患者能够克服障碍,及时获得所需的护理。

在一个有力的结束语中,Sheeran强调了最终目标:改变患者生活。亚马逊云科技、合作伙伴和客户之间的合作努力正为一个未来铺平道路,在这个未来,云端人工智能将加速医学突破、提高诊断和治疗水平,并支持患者在医疗保健之旅中,真正体现了改善生活的使命。

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者。提供200多类广泛而深入的云服务,服务全球245个国家和地区的数百万客户。做为全球生成式AI前行者,亚马逊云科技正在携手广泛的客户和合作伙伴,缔造可见的商业价值 – 汇集全球40余款大模型,亚马逊云科技为10万家全球企业提供AI及机器学习服务,守护3/4中国企业出海。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值