临床试验操作预测建模的现代分析技术
1. 引言
多中心临床试验的统计设计和操作会受到多种不确定因素的影响,包括输入信息的不确定性、患者入组和筛选过程的随机性,以及各类事件的出现。临床试验的设计和操作包含多个相互关联的阶段,如患者入组规划与预测、选择随机化方案和统计模型以分析患者反应、监测和预测各种操作特征(包括不同层面的入组表现、各类事件的数量、检测异常数据模式等)。
当代临床试验的复杂性和操作过程的多状态层次结构,要求开发新的分析技术,以有效建模和预测不同特征。通常,样本量由需要随机分配到试验中的患者数量确定,目的是获取足够信息,以便对药物特性得出具有统计学意义的结论。因此,一项重要任务是设计试验(选择国家和国家内的中心),确保在计划时间内达到所需的患者数量。
预测患者入组是一个关键问题,因为入组的不确定性会显著影响随机化过程、试验完成时间、供应链以及相关成本。使用固定速率的泊松过程描述入组过程是一种被接受的方法,但在实际试验中,不同中心的入组速率会有所不同。为了模拟这种变化,引入了泊松 - 伽马(PG)模型,该模型使用伽马分布来模拟入组速率的变化。
除了PG模型,文献中还考虑了其他用于建模患者入组的模型,主要分为两个基本方向:一是使用混合泊松过程,对全球入组速率进行建模;另一个是使用布朗运动或分数布朗运动。然而,这些方法通常需要大量的中心和患者,并且不能应用于个体层面,在研究启动和早期阶段可能也不适用。相比之下,PG模型是在个体中心层面设计的,也可用于更高层面,具有较高的灵活性,可应用于大多数不同阶段的试验。
随机化是试验设计的重要组成部分,不同随机化方案的选择会影响统计检验的效力和满足患者需求所需的药物供应量。各种随机化方案的特性已被许多作者研究。此外,在事件驱动的临床试验中,样本量由某些临床事件的数量确定,主要任务是预测患者入组数量、事件数量以及达到该数量的时间。
2. 预测患者入组建模
大型临床试验通常涉及大量患者,这些患者需要由不同国家的多个临床中心招募。在试验设计和中期阶段,预测总入组患者数量以及达到特定患者数量(样本量)的时间至关重要。为了实现操作目的并验证特定试验目标和计划进度,预测和监测特定区域的入组情况也很重要,特别是检测入组异常低或高的中心/国家。
大多数临床试验采用竞争性入组(对特定中心/区域的入组患者数量没有限制),但有时由于地理或人口原因,可能会采用限制性入组。不过,添加限制可能会显著增加入组停止时间,并使试验截止日期目标面临风险,因此这里主要关注竞争性入组。
2.1 泊松 - 伽马入组模型
患者入组存在三个主要不确定性:每个临床中心入组过程的随机性、不同中心入组速率的变化以及中心启动延迟。在PG模型中,使用泊松过程模拟不同中心的患者入组过程,用伽马分布模拟入组速率的变化,并用概率分布(如均匀分布、伽马分布)模拟中心启动延迟。
正式构建如下:
- 设(\Pi_{\lambda}(t))为具有给定速率(\lambda)的普通齐次泊松过程,对于任何(t > 0),(\Pr(\Pi_{\lambda}(t) = k) = \frac{e^{-\lambda t}}{k!}(\lambda t)^k),(k = 0, 1, 2, \cdots)。
- 设(\Pi(a))为参数为(a)的泊松随机变量。假设中心(i)的入组速率(\lambda_i)具有参数为((\alpha, \beta))(形状和速率参数)的伽马分布,其概率密度函数为(f(x, \alpha, \beta) = \frac{e^{-\beta x}\beta^{\alpha}x^{\alpha - 1}}{\Gamma(\alpha)}),(x > 0)。
- 设中心(i)在时间(u_i)启动,(u_i)可以是随机变量。中心(i)在时间区间([0, t])内入组的患者数量(n_i(t))可表示为(n_i(t) = \Pi_{\lambda_i}([t - u_i]
+)),其中([a]
+ = \max(0, a))。因此,(n_i(t))是一个时间非齐次的双随机泊松过程(Cox过程),其累积速率为(\lambda_i[t - u_i]_+)。
当速率(\lambda)具有参数为((\alpha, \beta))的伽马分布时,过程(\Pi_{\lambda}(t))是一个参数为((t, \alpha, \beta))的泊松 - 伽马(PG)过程。设(PG(t, \alpha, \beta))为具有参数((t, \alpha, \beta))的PG随机变量,其概率质量函数为(Pg(k, t, \alpha, \beta) = \Pr(\Pi_{\lambda}(t) = k) = \frac{\Gamma(\alpha + k)}{k!\Gamma(\alpha)}\frac{t^k\beta^{\alpha}}{(\beta + t)^{\alpha + k}}),(k = 0, 1, 2, \cdots)。
对于任何区域(I)(表示具有索引(i \in I)的站点子集),该区域在时间区间([0, t])内入组的患者数量(n(I, t))是一个非齐次双随机泊松过程,其累积速率为(\Lambda(I, t) = \sum_{i \in I}\lambda_i[t - u_i]_+)。因此,任何区域(包括全球)的入组过程都可以表示为双随机泊松过程,其累积速率可以用伽马分布随机变量的加权和明确表示。
PG模型允许在试验层次结构的不同层面建模入组行为。与使用均匀分布模拟泊松过程速率的方法相比,PG模型更符合实际试验中入组速率的经验分布,后者通常远离均匀分布且具有重尾特征。
预测患者入组和各种事件主要有两个基本阶段:
1. 启动(基线)预测:在试验开始前,没有实际试验数据可用。
2. 中期预测:可以使用实际试验数据,对剩余试验期间的操作行为进行重新预测,以更新试验截止日期。
在这两个阶段,先进的预测技术都可以使用PG模型,但输入数据的格式可能不同,模型参数的评估方式也会有所不同。
2.2 试验启动阶段
此阶段可能包括试验的早期阶段,此时启动的中心和招募的患者数量较少。临床团队通常会提供以下关键信息用于入组预测:
1. 计划随机入组的患者总数(样本量)
2. 预期筛选的患者数量和筛选持续时间
3. 最初计划参与研究的区域和国家列表
4. 每个国家计划启动的中心数量以及启动时间表的相关信息
5. 中心或国家的预期入组速率(可能包括筛选/入组速率和脱落概率)
这些信息存在很多不确定性,例如在启动阶段,通常不清楚中心的确切启动时间表,筛选/入组速率和脱落概率也未知。因此,此阶段的主要问题之一是如何考虑这些不确定性,评估试验入组的可行性,并预测入组时间。
一种方法是使用在相同区域进行的类似历史研究的数据,将新试验的入组速率视为具有先验分布的随机变量,其参数可以通过历史数据和一些先验信息进行评估。由于速率为正,自然可以使用伽马分布。对于新试验,还可以假设区域内的中心根据某些分布在时间上启动,这些分布的参数可以通过历史数据进行估计。
通常,每个国家/地区的团队会提供计划启动一定数量中心的时间间隔,首先可以假设中心的启动时间在这些间隔内均匀分布。如果有关于中心启动日期的历史信息,也可以使用其他类型的分布,如伽马分布、贝塔分布或经验分布。
然而,使用历史信息时需要谨慎。实际试验分析表明,通常使用的入组速率点估计值(如(k_i / \tau_i),其中(k_i)是中心(i)入组的患者数量,(\tau_i)是入组窗口)在不同试验中可能会有很大差异。相比之下,PG模型参数的估计值表现较为稳定。因此,可以建议对历史试验和新试验都使用PG模型,通过PG模型估计入组速率的变异性,然后汇总区域或整个试验的招募情况。
在启动阶段,可能会有较长的过渡期,直到大多数中心启动。因此,在此期间,患者和中心的总数可能不会太多。所以,考虑中心启动过程很重要,基于个体中心入组建模的方法比基于全球预测的模型更可取。PG入组模型非常灵活,可以在不同层面(中心、国家、区域、试验)对入组进行建模,并具有许多附加功能,如带可信区间的预测、预测按时完成的概率、评估改变中心数量的影响等。此外,PG模型的大多数特征可以使用封闭形式的表达式计算,无需使用蒙特卡罗模拟。
如果没有类似试验的信息,可以使用临床团队提供的计划/预期速率,并结合一些专家估计值。这些数据可以用作评估PG模型先验参数(在国家或区域层面)的样本统计量。
下面是一个mermaid流程图,展示了试验启动阶段使用PG模型进行患者入组预测的流程:
graph LR
A[获取临床团队提供的信息] --> B{是否有类似历史研究数据?}
B -- 是 --> C[使用历史数据评估入组速率先验分布参数]
B -- 否 --> D[使用计划/预期速率和专家估计值评估先验参数]
C --> E[假设中心启动时间分布]
D --> E
E --> F[使用PG模型进行启动阶段预测]
以下是一个表格,总结了试验启动阶段临床团队提供的关键信息:
| 信息类型 | 详情 |
| ---- | ---- |
| 样本量 | 计划随机入组的患者总数 |
| 筛选信息 | 预期筛选的患者数量和筛选持续时间 |
| 区域和国家 | 最初计划参与研究的区域和国家列表 |
| 中心信息 | 每个国家计划启动的中心数量及启动时间表相关信息 |
| 入组速率 | 中心或国家的预期入组速率(可能包括筛选/入组速率和脱落概率) |
2.3 试验中期阶段
在试验中期阶段,已经积累了一定的实际试验数据,这为重新评估和预测试验的后续进展提供了有力支持。此时,可以利用这些实际数据对PG模型的参数进行更新,从而更准确地预测剩余试验期间的入组情况和其他操作行为。
具体操作步骤如下:
1.
收集实际数据
:收集自试验开始以来各个中心的实际入组患者数量、入组时间以及中心的启动时间等信息。
2.
更新模型参数
:使用收集到的实际数据,通过贝叶斯方法更新PG模型的参数。例如,根据Anisimov和Fedorov(2007b)描述的贝叶斯技术,计算入组速率的后验伽马分布。
3.
重新预测
:基于更新后的模型参数,对剩余试验期间的入组情况进行重新预测。可以预测达到样本量所需的时间、不同区域的入组趋势等。
4.
评估风险
:根据重新预测的结果,评估试验是否能够按时完成,以及是否存在某些中心或区域入组异常的风险。如果发现风险,可以及时采取措施进行调整,如增加中心数量、优化筛选流程等。
下面是一个列表,总结了试验中期阶段使用PG模型进行预测的优势:
1.
准确性更高
:利用实际试验数据更新模型参数,能够更准确地反映试验的实际情况,提高预测的准确性。
2.
灵活性强
:PG模型可以根据不同的输入数据和实际情况进行灵活调整,适用于各种类型的试验。
3.
实时监控
:在中期阶段可以实时监控试验的进展情况,及时发现问题并采取措施进行调整,降低试验失败的风险。
以下是一个mermaid流程图,展示了试验中期阶段使用PG模型进行患者入组预测的流程:
graph LR
A[收集实际试验数据] --> B[更新PG模型参数]
B --> C[重新预测剩余试验期间入组情况]
C --> D{是否存在风险?}
D -- 是 --> E[采取调整措施]
D -- 否 --> F[继续监测]
E --> C
3. 随机化方案与试验平衡
随机化是临床试验设计的重要组成部分,它能够确保不同治疗组之间的可比性,提高统计检验的效力。不同的随机化方案会对试验的结果产生不同的影响,因此选择合适的随机化方案至关重要。
常见的随机化方案包括:
1.
简单随机化
:将患者随机分配到不同的治疗组,每个患者被分配到每个治疗组的概率相等。
2.
分层随机化
:根据患者的某些特征(如年龄、性别、病情严重程度等)进行分层,然后在每层内进行随机化,以确保各治疗组在这些特征上的分布均衡。
3.
区组随机化
:将患者分成若干个区组,每个区组内的患者按照一定的规则进行随机分配,以保证各治疗组的患者数量在一定时间内保持平衡。
不同随机化方案的优缺点如下表所示:
| 随机化方案 | 优点 | 缺点 |
| ---- | ---- | ---- |
| 简单随机化 | 操作简单,易于实施 | 可能导致治疗组之间的不均衡 |
| 分层随机化 | 能够保证各治疗组在重要特征上的均衡 | 分层因素过多会增加设计和实施的复杂性 |
| 区组随机化 | 可以在一定时间内保持治疗组之间的平衡 | 可能会导致治疗组之间的不均衡在区组内出现 |
在使用PG入组模型的情况下,研究了置换区组随机化导致的不平衡性质。例如,Anisimov(2011c)和Anisimov等人(2017)对其进行了相关研究。另一种随机化方法是最小化,它可以在随机分配患者到不同治疗组的同时,保持治疗组之间的平衡。
4. 事件驱动的临床试验预测
在事件驱动的临床试验中,样本量由某些临床事件的数量确定,如肿瘤患者的疾病进展事件、心血管患者的心血管事件等。因此,准确预测事件的发生数量和时间对于试验的成功至关重要。
传统上,许多作者主要使用蒙特卡罗模拟技术来预测事件的发生数量和时间。然而,Anisimov(2011b)开发了一种基于封闭形式表达式的分析技术,用于对正在进行的事件驱动多中心临床试验中的事件计数过程和患者入组进行预测建模。
该分析技术的具体步骤如下:
1.
建立模型
:使用PG模型对患者入组过程进行建模,同时考虑事件发生的概率和时间分布。
2.
参数估计
:根据历史数据或实际试验数据,估计模型的参数,如入组速率、事件发生概率等。
3.
预测事件数量和时间
:基于建立的模型和估计的参数,预测在不同时间点发生的事件数量以及达到样本量所需的时间。
下面是一个列表,总结了事件驱动的临床试验预测的重要性:
1.
确定样本量
:准确预测事件数量可以帮助确定合适的样本量,确保试验具有足够的统计效力。
2.
优化试验设计
:了解事件发生的时间分布可以帮助优化试验的设计,如确定随访时间、调整入组策略等。
3.
降低试验成本
:避免因样本量过大或过小而导致的资源浪费,降低试验成本。
以下是一个mermaid流程图,展示了事件驱动的临床试验预测的流程:
graph LR
A[建立PG入组和事件发生模型] --> B[估计模型参数]
B --> C[预测事件数量和时间]
C --> D{是否满足样本量要求?}
D -- 是 --> E[结束试验]
D -- 否 --> F[调整试验策略]
F --> B
综上所述,现代分析技术如PG模型为临床试验操作的预测建模提供了有力的工具。在不同阶段,合理运用这些技术可以提高试验的效率和成功率,降低试验风险,为药物研发和临床实践提供更可靠的支持。
超级会员免费看
672

被折叠的 条评论
为什么被折叠?



