23、自适应随机化在临床试验中的应用与优化

自适应随机化在临床试验中的应用与优化

1. 响应自适应随机化的功效与样本量

在随机设计中,若采用固定的预先分配比例,总样本量和各治疗组样本量都是固定的,可据此实现所需的检验功效。而在响应自适应随机化(RAR)试验中,总样本量固定,但各治疗组样本量是随机的,因此在规划RAR试验时,需要对样本量和功效进行特殊考虑。

有三种类型的样本量:
1. I型样本量 :用于固定分配设计达到指定功效的样本量。对于固定分配,治疗组样本量为特定值,通过求解相应方程得到达到功效所需的样本量。
2. II型样本量 :平均达到指定功效的样本量。需考虑平均功效函数,找到使平均功效达到指定值的最小正整数样本量。
3. III型样本量 :以一定概率达到固定功效的样本量。是满足特定条件的最小正整数样本量。

以下是不同实验场景下两种随机化设计的三种样本量情况:
|设计|目标分配|I型样本量|II型样本量|III型样本量|
| ---- | ---- | ---- | ---- | ---- |
|CRD|(0.5, 0.4)|1030|1031|1035|
|ERADE|(0.5, 0.4)|1032|1033|1037|
|CRD|(0.6, 0.4)|253|254|257|
|ERADE|(0.6, 0.4)|255|256|260|
|CRD|(0.7, 0.4)|106|107|111|
|ERADE|(0.7, 0.4)|109|109|113|
|CRD|(0.8, 0.4)|53|54|60|
|ERADE|(0.8, 0.4)|56|57|61|

从表中可以看出,对于每种样本量类型,ERADE设计比CRD设计通常需要多2 - 3名患者才能达到相同的功效水平。II型样本量通常比I型样本量多1名患者,这表明平均而言,RAR设计与固定分配设计的功效相近。III型样本量通常比I型样本量多4 - 7名患者。总体而言,与相应的固定分配设计相比,CRD和ERADE因随机化而损失的功效并不多。

2. 额外考虑因素
2.1 两种以上治疗和非二元结局

许多随机对照试验(RCT)涉及两种以上的治疗组。在多臂试验中,最优分配比例通常是不等的。Tymofyeyev等人提出了在多臂二元结局试验中寻找最优分配设计的通用框架,随后该方法被扩展到具有正态和事件时间结局的多臂、多目标临床试验。对于涉及多个治疗对比估计的试验,可以使用 - 最优分配。在多臂试验中实施最优分配,可以使用DBCD程序或移民瓮模型,这两种都是RAR设计,在广泛满足的条件下能产生一致且渐近正态的估计量和样本分配比例。

2.2 延迟响应

RAR理论的一个假设是每个患者的结局是即时的,但实际中患者结局在治疗后特定时间点测量。如果招募期足够长且随机化后能较快观察到结局,RAR仍可成功应用。当约60%或更多的患者结局数据在招募阶段被观察到并用于调整时,RAR设计的大样本性质不受延迟响应的影响。但如果响应观察延迟显著,会减慢向目标分配的收敛速度,削弱RAR的优势。

2.3 误分类响应

RAR需要获取试验中患者累积的主要结局数据,这些数据质量必须很高,以确保整个试验过程中的准确估计和调整。在一些试验中,二元响应可能被误分类,从而给设计引入偏差。有研究考虑了在响应可能被误分类的RAR设计中寻找最优分配的问题,虽然其方法有助于减轻某些偏差,但仍需努力确保RAR试验中数据的高质量评估。

2.4 时间趋势

在一些临床试验中,未知预后因素可能随时间呈现系统性趋势。RAR的一个主要批评是在存在时间趋势时,可能导致有偏估计和I型错误概率增加。为缓解这些问题,有以下几种方法:
- 分块应用RAR :随机化概率在每个患者块内保持不变,但在块间自适应变化,后续数据分析通过回归模型也应调整分块因素。
- 使用随机化检验 :确保在存在时间趋势时控制I型错误率。
- 应用加权似然技术 :减少时间趋势引入的偏差和均方误差。
- 使用协变量调整的响应自适应随机化设计 :如果导致异质性的协变量事先已知。

3. 示例
3.1 重新设计真实临床试验

以一项关于齐多夫定(AZT)降低母婴HIV - 1传播风险的随机、双盲、安慰剂对照试验为例。原试验中477名孕妇被随机平均分配到AZT组和安慰剂组。估计18个月时未感染婴儿的比例,AZT组为0.917,安慰剂组为0.745,即AZT治疗方案相比安慰剂将母婴HIV传播风险降低了约三分之二。最优RAR设计会更频繁地分配AZT治疗,实现更符合伦理的试验设计。

通过模拟比较四种随机化程序:
1. 完全随机设计(CRD) :每个患者以1/2的概率随机分配到治疗组。
2. 置换区组设计(PBD) :以4为块大小进行随机化,每4名患者后治疗人数均衡。
3. RSIHR设计 :使用ERADE程序实现目标分配。
4. 复合最优设计 :使用ERADE程序实现目标分配。

以下是四种设计的模拟操作特征:
|设计|分配比例均值(标准差)|AZT组患者数均值(标准差)|AZT组患者数范围|治疗失败数均值(标准差)|治疗失败数范围|参数估计均值(标准差)|参数估计均方误差|估计治疗差异均值(标准差)|估计治疗差异均方误差|
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
|PBD|0.500(0.001)|238.49(0.50)|238 - 239|80.66(8.01)|51 - 115|0.9168(0.0177)|0.0003|0.1719(0.0334)|0.0011|
|CRD|0.500(0.023)|238.46(11.05)|199 - 279|80.75(8.22)|52 - 114|0.9170(0.0179)|0.0003|0.1725(0.0334)|0.0011|
|RSIHR|0.526(0.006)|250.89(2.65)|241 - 261|78.53(7.67)|52 - 109|0.9170(0.0174)|0.0003|0.1726(0.0335)|0.0011|
|复合最优设计|0.610(0.033)|291.16(15.72)|245 - 348|71.62(8.09)|45 - 101|0.9164(0.0162)|0.0003|0.1735(0.0363)|0.0013|

从结果来看,所有四种设计都实现了目标分配,在估计质量方面非常相似。RSIHR设计的变异性较小,复合最优设计的变异性比CRD大。平均而言,RSIHR设计比平衡随机化设计多分配12名患者到AZT治疗组,复合最优设计多分配53名患者。同时,RSIHR设计平均减少2次治疗失败,复合最优设计平均减少8次治疗失败。因此,在这个例子中,RSIHR设计的伦理收益相对较小,而复合最优设计在个体和集体伦理之间提供了最佳平衡。

3.2 实施DBCD
  • 三队列设计 :60名患者参与试验。第一队列20名患者使用PBD以4为块大小随机分配到治疗组,响应从伯努利分布生成;第二队列20名患者根据第一队列数据使用DBCD分配;第三队列根据前两队列数据使用DBCD分配。
  • 两队列顺序设计 :60名患者参与试验。第一队列20名患者使用PBD以4为块大小随机分配,响应从伯努利分布生成;该队列完成后,后续患者根据之前所有患者数据使用DBCD顺序分配。
4. 总结

最优RAR设计利用试验中患者的累积数据修改治疗随机化概率,以实现针对特定实验目标的最优分配,常见目标是在满足统计检验功效约束的前提下,最小化治疗失败的数量。这种设计能在保持重要统计性质(如功效和估计效率)的同时,适度减少试验中的治疗失败。在结局严重的临床试验中,即使是适度减少治疗失败,从个体伦理角度来看也是非常可取的。当治疗差异较大时,最优RAR设计相对于平衡随机化设计的优势更明显;而当治疗效果相同时,RAR退化为等分配随机化。最优RAR设计具有良好的渐近性质,在广泛满足的条件下,估计量和样本分配比例都具有强一致性,并遵循渐近正态分布,因此可应用标准渐近推断程序进行RAR试验后的数据分析。

不过,RAR设计在操作上比固定随机化设计更复杂,需要更多的前期规划。它适用于招募期相对较长且能快速观察到结局的试验,并且数据质量必须很高以减轻偏差。在实践中,虽然有观点认为在某些情况下RAR不如1:1随机化,但在更一般的情况下,RAR在统计效率和伦理方面都能提供更显著的改进。此外,RAR与组序贯设计的结合也是一个重要的研究方向,一些研究已从理论上证明了组序贯RAR设计的优势。

自适应随机化在临床试验中的应用与优化

5. 操作步骤与注意事项

在实际应用中,实施RAR设计需要遵循一定的操作步骤,同时也有一些注意事项。

5.1 样本量确定步骤
  1. 确定目标 :明确试验的目标,如达到特定的功效、平均功效或特定概率下的功效。
  2. 选择类型 :根据目标选择样本量类型,如I型、II型或III型样本量。
  3. 计算样本量
    • I型样本量 :对于固定分配,通过求解相应方程得到达到功效所需的样本量,必要时将结果向上取整。
    • II型样本量 :考虑平均功效函数,找到使平均功效达到指定值的最小正整数样本量。
    • III型样本量 :找到满足特定条件的最小正整数样本量。
5.2 多臂试验最优分配实施步骤
  1. 选择方法 :根据试验情况选择合适的方法,如 - 最优分配、DBCD程序或移民瓮模型。
  2. 数据收集 :收集试验中患者的累积数据。
  3. 分配调整 :根据数据调整样本分配比例,确保达到最优分配。
5.3 注意事项
  • 数据质量 :确保试验中患者累积的主要结局数据质量高,避免误分类响应引入偏差。
  • 响应延迟 :考虑响应观察延迟的影响,当延迟显著时,要谨慎使用RAR设计。
  • 时间趋势 :在存在时间趋势时,可采用分块应用RAR、使用随机化检验、应用加权似然技术或使用协变量调整的响应自适应随机化设计等方法缓解问题。
6. 技术点分析
6.1 RAR设计的渐近性质

在广泛满足的条件下,RAR设计的估计量和样本分配比例具有强一致性,并遵循渐近正态分布。这使得标准渐近推断程序可用于RAR试验后的数据分析,为试验结果的可靠性提供了保障。

6.2 不同设计的变异性

从模拟结果来看,不同的RAR设计变异性不同。如RSIHR设计变异性较小,复合最优设计变异性比CRD大。变异性的大小会影响试验结果的稳定性和可靠性,在选择设计时需要综合考虑。

6.3 伦理收益

最优RAR设计能在一定程度上减少治疗失败的数量,体现了伦理收益。如在AZT试验的模拟中,复合最优设计比平衡随机化设计多分配更多患者到有效治疗组,平均减少更多治疗失败,在个体和集体伦理之间提供了更好的平衡。

7. 流程图展示
graph TD
    A[开始试验] --> B[确定样本量类型]
    B --> C{I型样本量}
    C -- 是 --> D[求解方程计算样本量]
    C -- 否 --> E{II型样本量}
    E -- 是 --> F[考虑平均功效函数计算样本量]
    E -- 否 --> G{III型样本量}
    G -- 是 --> H[满足特定条件计算样本量]
    D --> I[招募患者]
    F --> I
    H --> I
    I --> J[随机分配治疗组]
    J --> K[收集患者结局数据]
    K --> L{数据质量高?}
    L -- 是 --> M[进行数据分析]
    L -- 否 --> N[检查误分类情况并调整]
    N --> M
    M --> O{响应延迟显著?}
    O -- 是 --> P[谨慎使用RAR设计或调整方案]
    O -- 否 --> Q[继续试验]
    Q --> R{存在时间趋势?}
    R -- 是 --> S[采用相应方法缓解问题]
    R -- 否 --> T[试验结束]
    P --> T
    S --> T
8. 总结与展望

最优RAR设计在临床试验中具有重要的应用价值,它能在保持重要统计性质的同时,适度减少治疗失败,体现了一定的伦理优势。然而,RAR设计在操作上更为复杂,需要更多的前期规划和数据质量保障。在实际应用中,需要根据试验的具体情况选择合适的设计,并充分考虑各种因素的影响。

未来,随着研究的深入,RAR设计可能会在更多领域得到应用,如与组序贯设计的结合,有望进一步提高试验的效率和伦理水平。同时,对于RAR设计的优化和改进也是一个值得探索的方向,以更好地满足临床试验的需求。

总之,自适应随机化在临床试验中的应用前景广阔,但也面临着一些挑战,需要研究者不断探索和创新,以推动该领域的发展。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值