最优分配与自适应随机化在临床试验中的应用
1. 最优分配规则
在二元结局的临床试验中,我们常常需要比较实验治疗和对照治疗的效果。设实验治疗的成功概率为 $p_E$,对照治疗的成功概率为 $p_C$,试验样本量为 $n$ 且预先确定。实验治疗的分配比例为 $\pi$,即大约有 $n\pi$ 名患者被分配到实验治疗组,$n(1 - \pi)$ 名患者被分配到对照组。下面介绍几种常见的最优分配规则:
1.1 Neyman 分配
在固定样本量 $n$ 以及固定的 $p_E$、$p_C$ 等参数下,使检验功效最大化的分配规则是最小化某个值,这个最优解被称为 Neyman 分配,公式如下:
$ \pi_{Neyman} = \frac{\sqrt{p_E(1 - p_E)}}{\sqrt{p_E(1 - p_E)} + \sqrt{p_C(1 - p_C)}}$
然而,当 $p_E \neq p_C$ 时,Neyman 分配可能会偏向于成功率较低的治疗组,从个体伦理角度来看不太合适。
1.2 RSIHR 分配
Rosenberger 等人考虑在备择假设下 Wald 检验统计量方差固定的情况下,哪种分配能最小化预期治疗失败数。其优化问题的最优解是 RSIHR 分配,公式为:
$ \pi_{RSIHR} = \frac{p_E}{p_E + p_C}$
与 Neyman 分配不同,RSIHR 分配总是将更多患者分配到更成功的治疗组。
1.3 得分分配
在使用基于对数优势比的得分检验来检验治疗效果相等的假设时,Magirr 考虑在固定得分统计量方差的条件下,最小化预期治疗失败数。其最优解为得分分配,公式如下:
若 $p_E \neq p_C$,$\pi_{Score} = \frac{p_E^2}{p_E^2 + p_C^2}$;若 $p_E = p_C$,$\pi_{Score} = 0.5$
得分分配同样会将更多患者分配到更成功的治疗组。
1.4 复合最优分配
Baldi Antognini 和 Giovagnoli 提出了一个结合伦理和推断目标的复合准则:
$C(\pi) = wD(\pi) + (1 - w)F(\pi)$
其中,$w$ 是用户定义的权重,用于确定伦理和推断之间的权衡;$D(\pi)$ 是估计治疗差异的方差;$F(\pi)$ 是预期治疗失败比例。当 $w = 0.5$ 时,该分配规则被称为复合最优分配。
1.5 不同分配规则的比较
下表展示了在不同治疗成功概率下,六种分配规则(1:1 分配、2:1 分配以及上述四种最优分配规则)的 Wald 检验功效和总预期治疗失败数:
| $p_E$ | $p_C$ | 1:1 分配 | 2:1 分配 | Neyman 分配 | RSIHR 分配 | 得分分配 | 复合最优分配 |
| — | — | — | — | — | — | — | — |
| 0.2 | 0.4 | 0.61(70) | 0.53(73) | 0.61(69) | 0.61(68) | 0.61(68) | 0.61(68) |
| 0.5 | 0.4 | 0.17(55) | 0.16(53) | 0.17(55) | 0.17(55) | 0.17(55) | 0.17(55) |
| 0.6 | 0.4 | 0.53(50) | 0.49(47) | 0.53(50) | 0.53(49) | 0.53(49) | 0.53(49) |
| 0.7 | 0.4 | 0.89(45) | 0.84(40) | 0.89(46) | 0.88(43) | 0.88(43) | 0.87(42) |
| 0.8 | 0.4 | 0.99(40) | 0.98(33) | 0.99(42) | 0.99(37) | 0.99(37) | 0.99(34) |
从表中可以看出,在功效方面,四种最优分配规则与 1:1 分配几乎相同,但 2:1 分配的功效比其他规则低 1% - 8%。RSIHR、得分和复合最优分配规则相比 1:1 分配,能适度且持续地减少预期治疗失败数。
2. 实现最优分配的响应自适应随机化(RAR)
2.1 基本概念
前面讨论的最优分配规则依赖于治疗成功概率 $p_E$ 和 $p_C$,但在实际中,这些概率通常是未知的,且所有符合条件的患者也不太可能同时参与试验。此外,直接将患者“拆分”到两个治疗组可能会引入主观偏差。
响应自适应随机化(RAR)的思想是利用试验中患者的累积数据(结果)来估计 $p_E$ 和 $p_C$,并修改当前患者的治疗随机化概率,使设计收敛到所需的目标分配。这意味着样本治疗分配比例会收敛到相应的目标分配比例。
2.2 RAR 的基本设置
试验开始时,使用受限随机化程序(如置换块设计)将 $m$ 名患者($m$ 为一个较小的正整数)平均分配到实验治疗和对照治疗组,以获取一些初始数据来估计 $p_E$ 和 $p_C$。假设每个患者的结果在随机化后立即可得。
当有 $k$ 名患者已经接受治疗,第 $k + 1$ 名患者准备随机化进入试验时,该患者的治疗分配将取决于到目前为止积累的数据。
2.3 不同的 RAR 程序
2.3.1 顺序最大似然估计设计(SMLE)
在 SMLE 设计中,治疗随机化概率被设置为当前目标分配比例的估计值。Rosenberger 等人提出了针对 RSIHR 分配的 SMLE 程序:
$P(T_{k + 1} = E) = \frac{\hat{p}_E(k)}{\hat{p}_E(k) + \hat{p}_C(k)}$
其中,$\hat{p}_E(k)$ 和 $\hat{p}_C(k)$ 分别是第 $k$ 个患者时实验治疗和对照治疗的成功概率估计值。
该程序能证明最大似然估计量和样本分配比例的强一致性和渐近正态性,但可能具有较大的变异性,对功效有负面影响。
2.3.2 双重自适应偏置硬币设计(DBCD)
DBCD 是一类可以针对任何分配比例的 RAR 程序。关键是分配函数 $\phi(\pi, \alpha)$,Hu 和 Zhang 提出的分配函数为:
$\phi(\pi, \alpha) = \frac{1}{1 + (\frac{1 - \pi}{\pi})^{\alpha}}$
其中,$\alpha$ 是用户定义的参数,控制随机性程度($\alpha = 0$ 最随机,$\alpha \to \infty$ 几乎是确定性程序)。
在 DBCD 中,第 $k + 1$ 名患者被分配到实验治疗组的概率为:
$P(T_{k + 1} = E) = \phi(\hat{\pi}_{target}(k), \alpha)$
当 $\alpha = 0$ 时,DBCD 等价于 SMLE 设计。
2.3.3 高效随机自适应设计(ERADE)
Hu 等人提出了 ERADE 程序,第 $k + 1$ 名患者被随机分配到实验治疗组的概率为:
$P(T_{k + 1} = E) = \frac{1}{1 + (\frac{1 - \hat{\pi}
{target}(k)}{\hat{\pi}
{target}(k)})^{\beta}}$
其中,$\beta$ 是用户定义的参数,控制随机性程度($\beta = 0$ 最确定,$\beta = 1$ 最随机),建议设置 $\beta$ 在 0.4 到 0.7 之间。
ERADE 是偏置硬币设计的扩展,其分配函数是离散的,比 DBCD 变异性更小,是渐近最优的 RAR 程序。
2.4 不同 RAR 设计的理论比较
Hu 和 Rosenberger 得出了最优性、变异性和功效之间的关系,表明影响检验功效的三个重要因素是固定设计的分配目标、收敛到目标的速度以及样本分配比例的变异性。对于具有相同分配目标的 RAR 程序,我们可以比较样本比例的变异性,变异性小的程序更优。
以下是三种针对 RSIHR 分配的 RAR 设计(SMLE、DBCD 和 ERADE)在不同场景下的渐近方差比较:
| 设计 | 渐近方差范围($p_E$ 从 0.2 到 0.9) |
| — | — |
| SMLE | 从 0.6 到 0.38 |
| DBCD | 从 0.26 到 0.12 |
| ERADE | 从 0.18 到 0.06 |
对于完全随机设计(CRD),其方差恒定为 0.25。可以看出,在考虑的场景中,DBCD 和 ERADE 的变异性总体上小于 CRD。
下面是一个简单的流程图,展示了 RAR 的基本流程:
graph LR;
A[试验开始] --> B[用受限随机化分配 m 名患者];
B --> C[积累 k 名患者的数据];
C --> D[估计 p_E 和 p_C];
D --> E[计算目标分配比例];
E --> F[确定第 k + 1 名患者的随机化概率];
F --> G[随机分配第 k + 1 名患者];
G --> H[记录患者结果];
H --> C;
综上所述,在临床试验中,选择合适的最优分配规则和 RAR 程序对于提高试验效率和减少治疗失败数至关重要。不同的规则和程序各有优缺点,需要根据具体情况进行选择。
3. 最优响应自适应随机化程序的模拟
3.1 模拟单个 RAR 序列
与目标分配比预先确定(如 1:1 或 2:1)的情况不同,RAR 序列无法预先生成,因为治疗随机化概率会在整个试验过程中根据累积的患者结果数据进行自适应修改。
可以使用标准计算机软件包(如 SAS 和 R)中的随机数生成器,在对患者结果的某些假设下模拟 RAR 设计。以下是使用 DBCD 程序针对 RSIHR 分配模拟单个随机化序列的步骤:
-
初始随机化
:假设试验有 $n$ 名患者,真实治疗成功概率为 $p_E$ 和 $p_C$。首先,使用等随机化方法将前 $m$ 名患者(这里设 $m = 10$)随机分配到 $E$ 和 $C$ 组。对于前 10 名患者,分配到 $E$ 的随机化概率为:
- $P(T_i = E)=\frac{n_E(i - 1)+1}{n_E(i - 1)+n_C(i - 1)+2}$,其中 $n_E(i - 1)$ 是前 $i - 1$ 名患者中分配到 $E$ 的数量。 -
响应自适应随机化
:从第 11 名患者开始,进入响应自适应部分。对于第 $k$ 名患者,随机化概率确定步骤如下:
- 假设前 $k - 1$ 名患者的所有结果数据都可用,计算 $n_E(k - 1)$、$n_C(k - 1)$、$s_E(k - 1)$、$s_C(k - 1)$(分别为前 $k - 1$ 名患者中分配到 $E$ 和 $C$ 的数量以及 $E$ 和 $C$ 的成功数量)。
- 估计治疗成功概率:$\hat{p} E=\frac{s_E(k - 1)+1}{n_E(k - 1)+2}$,$\hat{p}_C=\frac{s_C(k - 1)+1}{n_C(k - 1)+2}$(这是在非信息先验下的贝叶斯估计,避免估计的成功概率为 0 或 1)。
- 更新估计的目标分配:$\hat{\pi} {target}=\frac{\hat{p} E}{\hat{p}_E+\hat{p}_C}$。
- 第 $k$ 名患者分配到 $E$ 的随机化概率:$P(T_k = E)=\phi(\hat{\pi} {target},\alpha)$,其中 $\phi$ 是 DBCD 的分配函数。 - 治疗分配 :为第 $k$ 名患者生成一个均匀随机数 $U$,若 $U\leq P(T_k = E)$,则分配治疗 $E$;否则,分配治疗 $C$。
以下是模拟过程中随机化概率变化的示例表:
| 患者编号 | $n_E$ | $n_C$ | $s_E$ | $s_C$ | $\hat{p}
E$ | $\hat{p}_C$ | $\hat{\pi}
{target}$ | 随机化概率 | 治疗分配 | 患者结果 |
| — | — | — | — | — | — | — | — | — | — | — |
| 1 | 0 | 0 | NA | NA | NA | NA | NA | 0.50 | | |
| 2 | 0 | 1 | NA | NA | NA | NA | NA | 0.56 | | |
| 3 | 1 | 1 | NA | NA | NA | NA | NA | 0.50 | | |
|… |… |… |… |… |… |… |… |… |… |… |
| 20 | 12 | 7 | 8 | 1 | 0.65 | 0.19 | 0.65 | 0.74 | $E$ | 0 |
|… |… |… |… |… |… |… |… |… |… |… |
| 40 | 23 | 17 | 13 | 6 | 0.64 | 0.43 | 0.54 | 0.47 | $C$ | 0 |
对于这个生成的序列,40 名患者后 $E$ 的分配比例为 $\frac{23}{40}=0.575$,接近目标分配的 0.57。
3.2 通过蒙特卡罗模拟评估 RAR 设计的操作特性
通过多次模拟 RAR 试验(例如 10,000 次),可以生成重要设计特征(如治疗分配比例、治疗失败数等)的经验分布,从而比较不同随机化设计在不同实验场景下的表现。
可以使用补充程序 ch10.4.2.sas 模拟以下五种随机化程序的操作特性:
- 完全随机设计(CRD) :每个患者以 0.5 的概率随机分配到 $E$ 和 $C$ 组。
- 置换块设计(PBD) :治疗分配在大小为 $b$($b$ 为预先指定的正整数)的块中随机进行,以确保每 $b$ 名患者后治疗达到平衡。
- SMLE 程序 :首先使用置换块随机化将前 $m$ 名患者分配到 $E$ 和 $C$ 组,其余患者根据 RAR 算法以 RSIHR 为目标分配。
- DBCD 程序 :同 SMLE 程序的初始分配,后续使用 DBCD 算法。
- ERADE 程序 :同 SMLE 程序的初始分配,后续使用 ERADE 算法。
模拟的设计特征包括:
-
分配比例
:$\pi_E=\frac{n_E}{n}$。
-
分配到优效治疗的试验对象数量
:$n_E$。
-
试验中的总失败数
:$F = F_E+F_C$,其中 $F_E$ 和 $F_C$ 分别是 $E$ 和 $C$ 组的失败数。
-
估计的治疗差异
:$\hat{\Delta}=\hat{p}_E-\hat{p}_C$。
-
Wald 检验的经验(平均)功效
(双侧 $\alpha = 0.05$)。
以下是在 $p_E = 0.6$,$p_C = 0.4$,$n = 100$(对应于等分配设计下 Wald 检验约 92% 的功效)的场景下,基于 10,000 次模拟的结果总结表:
| 设计 | 目标分配比例 | $n_E$ - 均值(标准差) | $n_E$ - 最小值 - 最大值 | 治疗失败数 - 均值(标准差) | 治疗失败数 - 最小值 - 最大值 | 估计治疗差异 - 均值(标准差) | 估计治疗差异 - MSE | Wald 检验经验功效 |
| — | — | — | — | — | — | — | — | — |
| PBD | 0.50 | 60.0(0) | 60 - 60 | 54.0(5) | 33 - 72 | 0.30(0) | 0.0074 | 0.93 |
| CRD | 0.50 | 60.1(6) | 36 - 78 | 53.9(5) | 33 - 75 | 0.30(0) | 0.0077 | 0.92 |
| SMLE | 0.57 | 65.6(5) | 46 - 83 | 52.3(5) | 33 - 73 | 0.30(0) | 0.0078 | 0.92 |
| DBCD | 0.57 | 68.1(4) | 56 - 88 | 51.5(5) | 32 - 71 | 0.30(0) | 0.0078 | 0.92 |
| ERADE | 0.57 | 68.3(3) | 57 - 87 | 51.5(5) | 33 - 70 | 0.30(0) | 0.0079 | 0.92 |
从表中可以看出,RAR 设计相比平衡设计(PBD 和 CRD)平均能减少 2 - 3 次治疗失败。所有五种设计的估计都是无偏的,且治疗差异的均方误差(MSE)相似,Wald 检验的经验功效在 0.92 - 0.93 之间。
下面是一个简单的流程图,展示蒙特卡罗模拟评估 RAR 设计操作特性的流程:
graph LR;
A[开始模拟] --> B[选择随机化程序];
B --> C[模拟单个试验];
C --> D[记录设计特征];
D --> E{是否完成 10000 次模拟};
E -- 否 --> C;
E -- 是 --> F[生成经验分布];
F --> G[比较不同设计];
综上所述,在临床试验中,最优分配规则和响应自适应随机化程序为提高试验效率和减少治疗失败数提供了有效的方法。通过模拟可以更好地了解不同设计的性能,从而根据具体情况选择最合适的设计。
超级会员免费看
55

被折叠的 条评论
为什么被折叠?



