36、化学剂量响应模型与乳腺癌自然史估计研究

化学剂量响应模型与乳腺癌自然史估计研究

1. 化学剂量响应模型

1.1 剂量加成模型

剂量加成模型通常假设两种化学物质之间存在恒定的相对效力。但如果化学物质 1 和化学物质 2 之间的相对效力因子随响应水平不同而变化,那么暴露于化学物质 1 的剂量 (d_1) 和化学物质 2 的剂量 (d_2) 时,以化学物质 1 表示的联合响应为:
(F(d_1, d_2) = \beta_1 + \alpha_1 \log(d_1 + \theta_{12} d_2^{w_{12}}))
其中 (w_{12} = \frac{\alpha_2}{\alpha_1}),(\theta_{12} = \exp[(\beta_2 - \beta_1) / \alpha_1])。对于 (m) 种化学物质,以化学物质 (s) 表示的组合响应可以推导为:
(F(d_1, \ldots, d_m) = F_s \left( d_s + \sum_{t \neq s} \theta_{st} d_t^{w_{st}} \right) = \beta_s + \alpha_s \log \left( d_s + \sum_{t \neq s} \theta_{st} d_t^{w_{st}} \right))
其中 (\theta_{st} = \exp[(\beta_t - \beta_s) / \alpha_s]) 是化学物质 (t) 相对于指标化学物质 (s) 的效力比,(w_{st} = \frac{\alpha_t}{\alpha_s}) 是斜率比。预测值将取决于指标化学物质类别。

1.2 有效剂量与剂量响应模型

之前讨论的剂量单位 (d) 通常是指施用剂量。理想情况下,风险评估需要了解生物有效靶组织剂量与毒性响应概率之间的剂量 - 响应关系,以及施用剂量与有效剂量之间的关系。剂量 - 响应模型应基于“转化后的”靶剂量而非“施用的”剂量。一般假设有效剂量与施用剂量成正比,但由于非线性药代动力学转化,二者之间的关系可能是非线性的。

Van Ryzin 和 Rai 提出了一个动力学剂量 - 响应模型,其中施用剂量根据 Michaelis - Menten 非线性动力学方程转化为靶器官的生物“有效”毒性剂量浓度。在稳态下,有效剂量 (D) 与施用剂量 (d) 的函数关系为:
(D = g(d) = \frac{r_1d}{1 + r_2d})
化学物质在有效剂量 (D = g(d)) 下的剂量 - 响应函数为:
(P(g(d)) = P(D) = F(\beta + \alpha D))

1.3 剂量对数变换

在毒理学中,剂量的对数常用于建模剂量 - 响应关系。对数变换可以被视为施用剂量与有效剂量之间的一种函数关系。

2. 乳腺癌自然史估计

2.1 癌症自然史与传统建模方法

癌症的自然史由肿瘤发展的起始、促进和进展阶段的一组生物学上有意义的定量特征表示。传统的致癌作用和癌症检测建模方法倾向于仅在时间维度上描述肿瘤发展过程。肿瘤潜伏期通常可分为三个阶段:
- 起始细胞的形成;
- 起始细胞的促进,导致第一个恶性克隆形成细胞;
- 随后的肿瘤生长和进展,直到检测事件发生。

2.2 可识别性问题

在随机致癌模型中,可识别性是一个重要问题。设 (g(t, z)) 是具有未知参数向量 (z) 的概率密度函数,如果对于所有 (t) 都有 (g(t, z_1) = g(t, z_2)) 意味着 (z_1 = z_2),则称由 (g(t, z)) 表示的模型是可识别的。在致癌模型中,设 (T) 是从个体出生开始到第一个恶性细胞出现的时间,(W) 是从肿瘤起始到检测事件发生的时间。即使假设 (T) 和 (W) 独立,找到一个实用且现实的模型来包含疾病自然史的两个阶段仍然是一个严重的问题。

2.3 双变量数据与癌症自然史估计

为了克服模型的不可识别性问题,可以引入与癌症自然史相关的额外数据。肿瘤进展过程本质上是多维的,因此可以从诊断时记录的临床协变量向量中更有效地提取癌症自然史的信息。本文主要关注肿瘤大小和患者诊断时年龄这两个重要变量。在所谓的量子响应模型框架内,可以推导出这两个随机变量的联合分布的解析表达式。

2.4 模型设定

设 (T) 是个体肿瘤起始时的年龄,(W) 是从起始时间 (T) 开始的肿瘤检测时间。使用具有恒定参数的 MVK 模型来指定随机变量 (T) 的概率密度函数 (p_T(t)),其生存函数为:
(\overline{P}_T(t) := Pr(T > t) = \frac{(A + B)e^{At}}{B + Ae^{(A + B)t}}, t \geq 0)
引入随机变量 (S) 表示检测时的肿瘤大小(肿瘤中的细胞数量)。假设肿瘤生长规律由确定性函数 (f: [0, \infty) \to [1, \infty)) 描述,且满足以下条件:
- 随机变量 (T) 和 (W) 是绝对连续且随机独立的;
- 函数 (f) 可微且 (f’ > 0);
- 肿瘤检测的危险率与当前肿瘤大小成正比,系数为 (\lambda > 0)。

则 (W) 的概率密度函数为:
(p_W(w) = \lambda f(w)e^{-\lambda \int_0^w f(u)du}, w \geq 0)
(S) 的概率密度函数为:
(p_S(s) = \lambda s g’(s)e^{-\lambda \int_0^{g(s)} f(u)du}, s \geq 1)
其中 (g = f^{-1}) 是 (f) 的反函数。在确定性指数肿瘤生长的情况下((f(w) = e^{\gamma w})),有:
(p_S(s) = \frac{\lambda}{\gamma} e^{-\frac{\lambda}{\gamma}(s - 1)}, s \geq 1)
(p_W(w) = \lambda e^{\gamma w} e^{-\frac{\lambda}{\gamma}(e^{\gamma w} - 1)}, w \geq 0)

在典型的队列研究中,观察到的随机向量 (Y = (T + W, S)) 分别表示诊断时的年龄和肿瘤大小。其概率密度函数为:
(p_Y(u, s) = p_T(u - g(s))p_S(s), u \geq g(s), s \geq 1)
该分布是可识别的,并且可以证明 (U = T + W) 和 (S) 是正相关的。

2.5 模型参数估计

现有的人类癌症数据集存在大量的删失和缺失肿瘤大小信息的问题。设 (n) 是样本大小,(\delta_i) 是指示变量,(\delta_i = 0) 表示第 (i) 个观察值被删失,(\delta_i = 1) 表示第 (i) 个观察值是精确的,提供了 ((u_i, s_i)) 的信息,(\delta_i = 2) 表示记录了癌症检测年龄 (u_i) 但肿瘤大小信息缺失。基于联合分布 (19.6),样本的似然函数为:
(L(h) = \prod_{i = 1}^n p_{U,S}^{\delta_i(2 - \delta_i)}(u_i, s_i | h) p_U^{\delta_i(\delta_i - 1) / 2}(u_i | h) \overline{P}_U^{(1 - \delta_i)(2 - \delta_i) / 2}(u_i | h))
其中 (\overline{P}_U) 是年龄检测的边际概率密度 (p_U) 的生存函数,(h = (\lambda, \varphi, A, B, a, b)) 是未知参数向量。

最大化似然函数是一个具有挑战性的问题,因为涉及许多耗时的计算。因此采用模拟方法来估计删失数据的贡献。使用 Kiefer - Wolfowitz 程序和 Monte Carlo EM (MCEM) 算法来获得最大似然估计,两种方法得到的估计结果非常相似。

2.6 数据分析

数据来自犹他州人口数据库 (UPDB),该数据库包含与犹他州癌症登记处 (UCR) 提供的癌症发病率和死亡率数据相关联的家谱记录。研究人群为 1918 年至 1947 年出生且在 UCR 运营期间在犹他州的人。分析基于出生年份的队列进行,特别是关注五个连续六年的女性乳腺癌病例出生队列(B1, B2, …, B5)。

出生队列 样本大小 精确观察数 未知大小的原发性肿瘤数
B1 16677 960 368
B2 15039 804 300
B3 12884 576 185
B4 11374 410 96
B5 13437 333 79

假设生长率的倒数服从伽马分布,通过最大似然法估计了 10 个参数。估计结果表明,参数 (\varphi) 的出生队列效应相当强。由于分析仅限于已知肿瘤大小的病例,最大似然估计 (\hat{\varphi}_i) 不能用于建模总年龄特异性发病率,模型需要针对参数 (\varphi) 进行校准以考虑缺失病例。模型对肿瘤大小的概率密度函数和检测年龄的危险函数提供了很好的拟合,但缺乏理论上的统计检验来评估双变量分布的拟合优度。

2.7 模型假设验证

模型的一个关键假设是随机变量 (T) 和 (W) 是随机独立的。从非参数估计的肿瘤大小分布来看,没有明显的出生队列效应,Kruskal - Wallis 检验也不拒绝无出生队列效应的全局原假设,因此模型在这方面不需要扩展。

综上所述,本文介绍了化学剂量响应模型和乳腺癌自然史估计的相关内容,通过建立模型和数据分析,为化学物质风险评估和乳腺癌研究提供了有价值的方法和结果。

2.8 模型的优势与意义

  • 多维度视角 :模型引入肿瘤大小和年龄两个变量,突破传统仅从时间维度描述肿瘤发展的局限,更全面地反映癌症自然史。例如,在传统模型中可能只关注肿瘤从起始到被检测的时间,而本模型考虑肿瘤大小变化,能更深入了解肿瘤生长过程。
  • 解决可识别性问题 :通过引入额外数据,一定程度上克服随机致癌模型的不可识别性问题。在实际应用中,若模型参数不可识别,可能导致估计结果不稳定,而本模型利用双变量数据提高参数估计的可靠性。
  • 临床应用价值 :模型对肿瘤大小和检测年龄的拟合结果,为临床医生提供预测肿瘤发展和制定治疗方案的依据。医生可根据患者年龄和肿瘤大小,结合模型估计的参数,更准确判断病情和预后。

2.9 研究的局限性与改进方向

  • 数据局限性 :现有数据存在大量删失和缺失肿瘤大小信息的问题,影响模型估计的准确性。未来可通过改进数据收集方法,如加强随访和完善记录系统,减少数据缺失。
  • 模型假设的合理性 :模型假设随机变量 (T) 和 (W) 独立,虽经检验目前无需扩展,但在某些情况下可能不成立。后续研究可考虑放松该假设,建立更复杂但更符合实际的模型。
  • 拟合优度检验 :缺乏理论上的统计检验来评估双变量分布的拟合优度。可探索开发新的统计检验方法,或利用更先进的模拟技术评估模型拟合效果。

2.10 总结与展望

本文围绕化学剂量响应模型和乳腺癌自然史估计展开研究。化学剂量响应模型考虑有效剂量和剂量对数变换,为化学物质风险评估提供更准确的方法。乳腺癌自然史估计通过引入双变量数据,建立可识别的模型,对模型参数进行估计和数据分析,取得较好的拟合结果。

未来研究可在以下方面进一步拓展:
- 跨学科研究 :结合生物学、医学和统计学知识,深入理解癌症发生发展机制,完善模型。
- 大数据应用 :利用大规模的癌症数据,提高模型的准确性和可靠性。
- 个性化医疗 :根据患者个体特征,如基因信息、生活方式等,建立个性化的癌症自然史模型,为精准医疗提供支持。

2.11 相关流程总结

以下是乳腺癌自然史估计的主要流程:

graph LR
    A[数据收集] --> B[模型设定]
    B --> C[参数估计]
    C --> D[数据分析]
    D --> E[模型验证]
    E --> F[结果应用与改进]

2.12 关键知识点回顾

知识点 描述
化学剂量响应模型 包括剂量加成模型、有效剂量与剂量响应模型及剂量对数变换,用于化学物质风险评估
乳腺癌自然史模型 引入肿瘤大小和年龄双变量,通过 MVK 模型等设定,解决可识别性问题
参数估计方法 Kiefer - Wolfowitz 程序和 Monte Carlo EM (MCEM) 算法
数据分析 基于犹他州人口数据库,估计参数并分析出生队列效应
模型验证 验证随机变量 (T) 和 (W) 独立性假设

通过以上内容,我们对化学剂量响应模型和乳腺癌自然史估计有了更深入的了解,这些研究成果将为相关领域的进一步发展提供重要的参考和支持。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值