贝叶斯方法与R代码在医学统计中的应用
1. 贝叶斯方法概述
在医学研究中,当面对两个规模相同的头痛治疗临床试验,一个是已知止痛药与安慰剂对照,另一个是顺势疗法与安慰剂对照,且二者p值相同(< 0.05)时,传统的频率论方法无法正式纳入实验前对治疗效果的信念,而贝叶斯方法则可以做到这一点。
贝叶斯定理由来自滕布里奇韦尔斯的非国教牧师托马斯·贝叶斯于1763年在其死后发表。它在概率论中给出了一个简单且无争议的结果,将实验前事件的概率(先验概率)与实验后事件的概率(后验概率)联系起来,先验与后验之间的联系是似然性。
2. 贝叶斯定理
- 唐氏综合征示例 :母亲生育患唐氏综合征婴儿的风险,若母亲年龄小于40岁,约为1/1000;若母亲年龄大于等于40岁,约为1/100。用符号表示为(P(D|age < 40) = 0.001)和(P(D|age ≥ 40) = 0.01)。若看到一个患唐氏综合征的婴儿,想知道其母亲年龄小于40岁的概率(P(age < 40|D)),可根据贝叶斯定理计算。
已知英国约5%的母亲生育时年龄大于等于40岁,即(P(age ≥ 40)=0.05),(P(age < 40)=0.95)。
总体上母亲生育患唐氏综合征婴儿的概率(P(D))为:
[
\begin{align }
P(D)&=P(D|age < 40)×P(age < 40)+P(D|age ≥ 40)×P(age ≥ 40)\
&=0.001×0.95 + 0.01×0.05\
&=0.001