临床试验运营预测建模的现代分析技术
1. 自适应入组调整与最优入组设计基础
当中心数量 N 不是很大(如少于 20)时,我们可以对全球累积预测率进行近似处理。设时间 t 时全球累积预测率的均值和方差分别为 E(t) 和 S²(t),在时间 Tpl 时,该率可近似为一个伽马随机变量,其均值为 E(Tpl),方差为 S²(Tpl)。此时,n(Tpl) 可近似为一个参数为 (A, B) 的 PG 随机变量,其中:
[A = \frac{E^2(T_{pl})}{S^2(T_{pl})}, B = \frac{E(T_{pl})}{S^2(T_{pl})}]
在 R 语言中,计算 (8.21) 中的成功概率(PoS)可使用以下函数:
PoS <- 1 - pnbinom(n - 1, size = E^2(Tpl)/S^2(Tpl), prob = E(Tpl)/(E(Tpl) + S^2(Tpl)))
其中,
pnbinom(k, size = a, prob = p)
是 R 中计算负二项分布 Nb(a, p) 累积概率分布函数的函数。在中期时间 t1 的计算中,需考虑剩余增量过程和剩余患者数量 nR 而非 n。
2. 入组性能的中期评估与基于风险的监测
不同中心和国家初始入组率不同,表现也各异。中期分析各中心/国家的入组性能,检测异常数据模式和离群值(低入组或高入组单位)十分重要,以便做出进一步决策,如深入调查异常行为原因、派遣监测人员等。
传统检测离群值的方法是评估样本均值 E 和方差 S²,若某个变量 Xj 满足 Xj > E + ZS 或 Xj < E - ZS(Z 通常为正态分布的分位数或取值 1、2、3),则认为 Xj 是离群值。但许多与入组和事件出现相关的特征并非正态分布,如入组率和特定事件发生时间(如首位患者到达时间)。入组率的经验估计值服从泊松 - 伽马分布,首位患者到达时间服从帕累托分布,这两种分布均为厚尾分布,后者甚至可能没有理论均值或方差。因此,基于正态假设的规则可能导致有偏结果和统计上无效的结论,分析和数据监测方法应基于模型并针对数据类型进行。
3. 中心入组性能的中期评估
可采用两种不同方法检测中心异常入组性能并筛选低入组和高入组中心。
3.1 P 值法
假设在中期时间 t1 有以下数据:
- ki:中心 i 招募的患者数量
- vi:截至时间 t1 中心 i 的活跃入组持续时间
考虑假设 H0:所有中心属于具有相同 PG 入组模型参数的总体。用最大似然技术估计 PG 模型的参数 (α, β),给定 vi 时,中心 i 招募的患者数量服从参数为 (vi, α, β) 的 PG 分布。定义上下 P 值如下:
[P_{Upp}(k_i, v_i, \alpha, \beta) = Pr(PG(v_i, \alpha, \beta) \geq k_i)]
[P_{Low}(k_i, v_i, \alpha, \beta) = Pr(PG(v_i, \alpha, \beta) \leq k_i)]
通过选择不同阈值(可能取决于样本大小和数据),可筛选出 P 值小于给定值的中心集。上 P 值小的中心为高入组中心,下 P 值小的中心为低入组中心。
例如,有一项包含 50 个中心的研究,所有中心在 2 个月内按伪均匀分布确定性启动,中期入组性能评估时间为 6 个月。前 42 个中心的平均入组率 m1 = 0.05 名患者/天,接下来 4 个中心为低入组,平均率 m2 = m1/6,其余 4 个中心为高入组,平均率 m3 = 4m1。前 42 个中心的入组过程为参数相同的 PG 过程(形状 α = 2,速率 β = α/m1 = 40),异常的 8 个中心的入组过程为泊松过程。模拟得到一组数据 (ki, vi),所有 50 个中心的 PG 模型最大似然估计值为 (1.704, 24.228)。P 值的对数尺度( - log(P 值))显示,低入组中心 43 - 46 的下 P 值较小(其中三个小于 0.05),高入组中心的上 P 值小于或约为 0.05。其他中心处于典型变化范围内,中心 3 的下 P 值和中心 18 的上 P 值小于 0.1 可解释为随机波动。表现最佳的中心 50 入组窗口为 160 天,招募了 38 名患者;表现最差的中心 43 入组窗口为 177 天,未招募到患者。该方法可在 R 中使用 (8.2)、(8.24)、(8.25) 关系和负二项分布的标准公式实现。
3.2 基于 PG 分位数的二维分类法
用 Q(P, t, α, β) 表示 PG(t, α, β) 分布的 P 分位数。选择较小的临界水平 εH 和 εL 分别用于高入组和低入组中心,检测标准如下:
1. 若 ki > Q(1 - εH, α, β, vi),则中心 i 为高入组中心。
2. 若 ki < Q(εL, α, β, vi),则中心 i 为低入组中心。
在平面 (z, n) 上创建二维分类,绘制上曲线 Q(1 - εH, α, β, z) 和下曲线 Q(εL, α, β, z)(z = 1, 2, 3, …),并标注每个中心的点 (vi, ki)。上曲线以上的点对应高入组中心,下曲线以下的点对应低入组中心。上部分位数计算时 εH 取 0.02、0.05,下部分位数计算时 εL 取 0.05、0.1。使用相同概率阈值时,P 值法和二维分类法筛选出的中心相同,可根据偏好选择用于中心入组性能的基于风险的监测方法。
4. 国家入组性能的中期评估
检测国家中心入组异常性能的方法基于将国家的入组过程近似为 PG 过程,并计算这些近似的 P 值。由于一个国家通常包含的中心数量不多,采用 PG 近似而非正态近似。
假设给定中期数据 (ki, vi),用最大似然技术估计 PG 模型的参数 (α, β),令 (m = \frac{\alpha}{\beta}),(s^2 = \frac{\alpha}{\beta^2})(分别为先验伽马分布速率的均值和方差)。对于某个国家 J,定义该国的聚合均值和方差:
[E(J) = m\sum_{i \in J}v_i, S^2(J) = s^2\sum_{i \in J}v_i^2]
设 (k(J) = \sum_{i \in J}k_i) 为国家 J 招募的患者数量。k(J) 的分布可近似为参数为 (A(J), B(J)) 的 PG 分布,其中:
[A(J) = \frac{E^2(J)}{S^2(J)}, B(J) = \frac{E(J)}{S^2(J)}]
基于此结果,可计算国家 J 的上下 P 值:
[P_{Upp}(J) = Pr(PG(A(J), B(J)) \geq k(J))]
[P_{Low}(J) = Pr(PG(A(J), B(J)) \leq k(J))]
5. 最优试验设计
5.1 启动阶段的最优入组设计
最优入组设计需考虑不同国家中心的不同表现、成本和时间限制以及成功概率。一般而言,最优性标准因团队目标和各种约束而异。不同国家/地区中心的启动和监测成本不同,入组率也有差异,因此选择哪些国家以及在这些国家选择多少中心以满足试验目标是关键问题。
输入数据如下:
- 可选择的所有国家集合:{1, 2, …, J}
- 不同国家每个中心的预期平均入组率 {mj, j = 1, …, J}
- 各国入组率的方差 ({s_j^2, j = 1, …, J})(为简化,假设每个国家所有中心的平均率和方差相同,此假设可轻易放宽)
- 各国中心数量的计划限制 W,如最小或最大中心数量
- 选择国家 j 一个中心的成本 {Cj, j = 1, …, J}
- 国家 j 一个中心单位时间的运行成本 {cj, j = 1, …, J}(为简化,假设一个国家内不同中心的成本相同)
- 不同国家每个入组患者的成本 {qj, j = 1, …, J}
假设所有国家 j 的中心在时间区间 (aj, bj) 内按均匀分布启动,设 n 为需招募的患者总数,T 为预期(计划)的入组持续时间。问题是找到最优的国家/中心分配方案,在满足中心数量限制且总试验成本不超过给定阈值 Ctotal 的条件下,最大化成功概率。
假设对于所有 j,bj < T,且中心总数 N 足够大,可对全球入组过程使用正态近似。评估时间区间 [0, T] 内的试验运营成本:
- 选择国家 {1, …, J} 中的一些中心子集 {Nj, j = 1, …, J},国家 j 在区间 [0, T] 内的全球累积率的均值和方差计算如下:
[E[\Lambda(j, T)] = E(j, T) = N_jm_j(T - \frac{a_j + b_j}{2})]
[Var[\Lambda(j, T)] = S^2(j, T) = N_j\left[\frac{(m_j^2 + s_j^2)(b_j - a_j)^2}{12} + s_j^2(T - \frac{a_j + b_j}{2})^2\right]]
- 所有国家的全球累积率的均值和方差为:
[E(T, N_j, j = 1, …, J) = \sum_{j = 1}^{J}E(j, T)]
[S^2(T, N_j, j = 1, …, J) = \sum_{j = 1}^{J}S^2(j, T)]
- 国家 j 在时间区间 [0, T] 内启动和运行 Nj 个中心的平均运营成本为:
[C(j, T) = N_j\left(C_j + c_j(T - \frac{a_j + b_j}{2})\right)]
- 国家 j 在时间区间 [0, T] 内每个入组患者的平均成本为 qjE(j, T),全球平均运营成本为:
[R(T, N_j, j = 1, …, J) = \sum_{j = 1}^{J}(C(j, T) + q_jE(j, T))]
- 定义 (V^2(T, N_j, j = 1, …, J) = E(T, N_j, j = 1, …, J) + S^2(T, N_j, j = 1, …, J))。
最大化概率函数 Φ( f(x)) 等价于最大化函数 f(x),因此,在全球成本不超过一定水平且满足分配限制的条件下,最大化 PoS 的最优中心分配方案 {Nj, j = 1, …, J} 是以下优化问题的解:
- 目标:
[\max_{{N_j, j = 1, …, J} \in W}\frac{E(T, N_j, j = 1, …, J) - n}{V(T, N_j, j = 1, …, J)}]
- 约束条件:
[R(T, N_j, j = 1, …, J) \leq C_{total}]
[{N_j, j = 1, …, J} \in W]
试验最优设计还有其他形式,如对偶问题:在对 {Nj} 有一定限制且 PoS 不低于给定概率 P0 的条件下,最小化总成本 R(T, …)。也可施加一些随机限制,如考虑在总成本以给定概率不超过某个阈值的条件下最大化 PoS 的问题,这会导致以下优化问题:
- 目标:
[\max_{{N_j, j = 1, …, J}}\frac{E(T, N_j, j = 1, …, J) - n}{V(T, N_j, j = 1, …, J)}]
- 约束条件:
[Pr(R(\tau(n, N_j, j = 1, …, J), N_j, j = 1, …, J) \leq C_{total}) \geq P_0]
[{N_j, j = 1, …, J} \in W]
优化问题的选择取决于团队和试验目标,这些优化问题可使用约束非线性优化方法或离散搜索进行数值求解。中期入组设计也可制定类似的优化问题。
以下是启动阶段最优入组设计的流程图:
graph TD;
A[确定输入数据] --> B[选择中心子集];
B --> C[计算各国累积率均值和方差];
C --> D[计算全球累积率均值和方差];
D --> E[计算运营成本];
E --> F[构建优化问题];
F --> G[求解优化问题];
G --> H[得出最优分配方案];
5.2 中期阶段的最优自适应入组调整
该部分处理考虑预测研究性能的最优入组调整问题,提供解决以下问题的技术:若研究进展未达计划,如何调整中心数量,以给定概率和最小成本实现试验目标。
假设试验招募比预期慢,问题是确定需启动的最少新中心数量,使 PoS 不低于给定水平 PS。设 Nmax 为未来可能启动的最大新中心数量,这些中心可在中期时间 t1 后的给定时间区间 (ai, bi) 内启动,其速率的均值和方差为 ((m_i, s_i^2)),i = N + 1, …, N + Nmax。考虑中期时间 t1 后的剩余时间,令 t 变为 t + t1。
设 W = {i1, i2, …, iN2} 为潜在 Nmax 个中心中的 N2 个新中心子集,定义该子集的入组率均值和方差:
[E(i_1, i_2, …, i_{N_2}, t) = \sum_{i \in W}M(t, a_i, b_i, m_i)]
[S^2(i_1, i_2, …, i_{N_2}, t) = \sum_{i \in W}S^2(t, a_i, b_i, m_i, s_i^2)]
中期时间 t1 时活跃的 N 个中心的后验入组率均值和方差为:
[\tilde{E}(N, t) = \sum_{i = 1}^{N}M(t, a_i, b_i, m_i)]
[\tilde{S}^2(N, t) = \sum_{i = 1}^{N}S^2(t, a_i, b_i, m_i, s_i^2)]
注意,中期活跃中心的速率均值和方差 ((m_i, s_i^2)) 是使用中期数据和估计参数计算的后验特征。对于新的 N2 个中心,可使用研究团队的历史数据和经验评估 ((m_i, s_i^2));若无其他信息,建议假设这些中心与活跃中心具有相同的先验参数,即 (m_i = \frac{\alpha}{\beta}),(s_i^2 = \frac{\alpha}{\beta^2})。
使用给定的新中心子集 W 和 (8.20),全球速率 (\tilde{\Lambda}(N, W, t)) 的均值和方差为:
[E[\tilde{\Lambda}(N, W, t)] = \tilde{E}(N, t) + E(i_1, i_2, …, i_{N_2}, t)]
[Var[\tilde{\Lambda}(N, W, t)] = \tilde{S}^2(N, t) + S^2(i_1, i_2, …, i_{N_2}, t)]
全球入组过程的方差为:
[V^2(N, W, t) = E[\tilde{\Lambda}(N, W, t)] + Var[\tilde{\Lambda}(N, W, t)]]
设 nR 为中期剩余需招募的患者数量,TR 为计划的剩余招募时间,根据 (8.22),PoS 的形式为:
[PoS = F(W) = \Phi\left(\frac{\tilde{E}(N, T_R) + E(W, T_R) - n_R}{\sqrt{\tilde{S}^2(N, T_R) + S^2(W, T_R) + \tilde{E}(N, T_R) + E(W, T_R)}}\right)]
(8.27) 式右边是子集 W 的函数,假设与该子集相关的目标函数(成本)为 C(W)。则最小化函数 C(W) 并使 PoS 不低于 PS 的最优新中心集是以下优化问题的解:
- 目标:
[\min_{W} C(W)]
- 约束条件:
[PoS \geq P_S]
以下是中期阶段最优自适应入组调整的步骤列表:
1. 确定最大新中心数量 Nmax 和相关时间区间及速率参数。
2. 定义新中心子集 W。
3. 计算子集 W 和活跃中心的入组率均值和方差。
4. 计算全球速率的均值、方差和入组过程的方差。
5. 根据剩余患者数量和时间计算 PoS。
6. 构建并求解优化问题,确定最优新中心集。
中期阶段最优自适应入组调整的流程图如下:
graph TD;
A[确定Nmax和参数] --> B[定义新中心子集W];
B --> C[计算子集和活跃中心入组率参数];
C --> D[计算全球速率参数];
D --> E[计算PoS];
E --> F[构建优化问题];
F --> G[求解优化问题];
G --> H[得出最优新中心集];
综上所述,通过对入组过程的建模、预测和再预测,以及在不同阶段进行最优设计和调整,可有效提高临床试验的效率和成功率,降低成本和风险。在实际应用中,需根据具体情况选择合适的方法和技术,并结合专业知识和经验进行决策。
临床试验运营预测建模的现代分析技术
6. 方法总结与对比
为了更好地理解和应用上述各种方法,下面对中心入组性能评估和试验设计的相关方法进行总结和对比。
| 方法 | 适用场景 | 优点 | 缺点 |
|---|---|---|---|
| P 值法检测中心入组性能 | 中期评估中心入组情况,判断高入组和低入组中心 | 能明确量化中心入组情况与总体的差异,可根据不同阈值灵活筛选中心 | 计算相对复杂,依赖 PG 模型参数估计的准确性 |
| 基于 PG 分位数的二维分类法检测中心入组性能 | 中期评估中心入组情况,直观展示中心分类 | 直观可视化,能快速识别高入组和低入组中心 | 分位数选择需根据经验确定,可能存在一定主观性 |
| 启动阶段最优入组设计 | 试验开始前确定国家和中心的最优分配 | 综合考虑成本、入组率和成功概率等多因素,可优化资源配置 | 优化问题求解复杂,对输入数据要求较高 |
| 中期阶段最优自适应入组调整 | 试验进展未达计划时调整中心数量 | 考虑预测性能,以最小成本实现试验目标 | 需要准确的中期数据和对未来的合理预测,不确定性较大 |
7. 实际应用案例分析
假设一个临床试验计划招募 500 名患者,预期入组时间为 12 个月。有 3 个国家可供选择,相关数据如下表所示:
| 国家 | 平均入组率(患者/天) | 入组率方差 | 选择中心成本(万元) | 中心运行成本(万元/天) | 入组患者成本(万元/患者) | 最小中心数 | 最大中心数 |
|---|---|---|---|---|---|---|---|
| 国家 1 | 0.2 | 0.01 | 5 | 0.1 | 2 | 2 | 5 |
| 国家 2 | 0.3 | 0.02 | 8 | 0.15 | 3 | 1 | 4 |
| 国家 3 | 0.15 | 0.005 | 4 | 0.08 | 1.5 | 3 | 6 |
在启动阶段,根据这些数据构建优化问题。假设总预算为 200 万元,利用启动阶段最优入组设计的方法,通过约束非线性优化求解,得到最优的中心分配方案为:国家 1 选择 3 个中心,国家 2 选择 2 个中心,国家 3 选择 4 个中心。
在试验进行到第 6 个月时,发现招募进度较慢,仅招募了 150 名患者,剩余需招募 350 名患者,计划剩余招募时间为 6 个月。此时,利用中期阶段最优自适应入组调整的方法。假设未来可能启动的最大新中心数量为 5 个,根据中期数据重新估计各中心的入组率参数。经过一系列计算和优化问题求解,确定需要在国家 2 新增 2 个中心,可使成功概率达到要求且成本最小。
8. 关键技术点分析
- PG 分布的应用 :在中心入组性能评估和国家入组性能评估中,PG 分布发挥了重要作用。它能够较好地拟合入组率等相关数据的分布特征,使得基于该分布的 P 值计算和分位数分析更加准确地反映实际情况。例如,在 P 值法检测中心入组性能时,通过 PG 分布计算上下 P 值,从而判断中心是否为高入组或低入组中心。
- 优化问题的构建与求解 :在试验设计中,无论是启动阶段还是中期阶段,都涉及到优化问题的构建和求解。需要综合考虑成本、入组率、成功概率等多个因素,将实际问题转化为数学优化模型。常用的求解方法包括约束非线性优化和离散搜索,但这些方法在处理复杂问题时可能计算量较大,需要根据具体情况选择合适的算法。
- 数据的处理与参数估计 :所有方法都依赖于准确的数据和合理的参数估计。在实际应用中,需要对中期数据进行有效的收集和整理,利用最大似然技术等方法估计 PG 模型的参数。同时,对于新中心的参数评估,若缺乏历史数据,需要做出合理的假设,如假设与活跃中心具有相同的先验参数。
9. 未来发展趋势
随着科技的不断进步和临床试验需求的不断变化,临床试验运营预测建模领域也将呈现出一些新的发展趋势。
-
多模型融合
:单一的模型可能无法全面准确地描述临床试验的复杂过程。未来可能会将多种模型进行融合,如结合机器学习模型和传统的统计模型,以提高预测的准确性和可靠性。
-
实时监测与动态调整
:借助先进的信息技术,实现对临床试验入组过程的实时监测。根据实时数据及时进行动态调整,进一步优化试验设计和资源配置,提高试验效率。
-
个性化试验设计
:考虑到不同患者群体的差异,未来的临床试验设计可能会更加注重个性化。根据患者的特征和需求,制定更加精准的入组策略和试验方案。
10. 总结与建议
通过对临床试验运营预测建模的相关方法和技术的研究,我们可以看到这些方法在提高试验效率、降低成本和风险方面具有重要作用。在实际应用中,建议如下:
- 选择合适的方法:根据试验的具体情况和目标,选择合适的中心入组性能评估方法和试验设计方法。例如,对于数据可视化要求较高的情况,可以优先考虑基于 PG 分位数的二维分类法;对于需要精确量化差异的情况,P 值法可能更合适。
- 注重数据质量:准确的数据是方法有效应用的基础。加强数据的收集、整理和分析,确保参数估计的准确性。
- 持续学习与改进:随着领域的发展,不断学习新的方法和技术,结合实际经验对现有方法进行改进和优化。
总之,临床试验运营预测建模是一个不断发展和完善的领域,通过合理应用相关方法和技术,能够为临床试验的成功提供有力支持。
超级会员免费看
766

被折叠的 条评论
为什么被折叠?



