游离胎儿DNA检测(NIPT)及其与产前指标的相关性

1. 背景知识

游离胎儿 DNA(cffDNA)产前检测,又称无创产前检测(NIPT),因其高灵敏度和特异性,成为血清学筛查和侵入性检测的有吸引力的替代方法。

目前,NIPT 主要用于筛查 21 三体、18 三体和 13 三体等高危妊娠。然而,由于血浆中的 cffDNA 主要来源于胎盘滋养层细胞,其检测结果可能与超声检查和 / 或胎儿实际染色体组成不一致

此外,许多因素可能导致 NIPT 检测出现假阳性,包括母体染色体异常、母体肿瘤(霍奇金淋巴瘤和非霍奇金淋巴瘤、乳腺癌、卵巢癌和宫颈癌等)、消失的双胎、胎盘局限性胎盘嵌合体(CPM),甚至胎盘嵌合现象。到目前为止,NIPT 一直被用作筛查方法,而不是诊断测试;它不能取代绒毛膜绒毛取样和羊膜穿刺术等侵入性诊断方法。

目前应用最广泛的两种 NIPT 方法是单核苷酸多态性(SNP)检测法全基因组测序(WGS)法。这两种方法在检测常见非整倍体(T21、T18、T13 和 X 单体)方面具有相当的临床灵敏度。在本研究中,通过分析来自中国中部地区孕妇的 14316 份血浆 cffDNA WGS 筛查数据,探讨 NIPT 筛查作为一种有用的产前筛查工具,在实现高质量孕期护理方面的临床意义。论文作者研究了 NIPT 与产前检测指征的相关性,特别是其在检测 21 三体、18 三体、13 三体、性染色体非整倍体(SCA)、非 21/18/13 常染色体非整倍体和 CNV 异常方面的灵敏度和特异性。我们还分析了 NIPT 结果出现假阳性和假阴性的可能原因。

2. 方法

数据来源:2013 年 10 月至 2018 年 11 月,武汉大学人民医院共纳入 14316 名孕妇。

对 14316 名有产前检测指征的孕妇进行回顾性分析,这些指征包括高龄产妇(≥35 岁)、母体血清筛查异常、颈项透明层增厚(≥2.5mm)

NIPT(Non-invasive Prenatal Testing,无创产前检测)是一种通过采集母体外血中游离胎儿DNA片段,对胎儿染色体异常进行早期筛查侵入性检测技术。该技术主要依据不同染色体DNA片段的浓度比例来判断胎儿是否存在染色体整倍体异常,如唐氏综合征(21号染色体异常)、爱德华氏综合征(18号染色体异常)和帕陶氏综合征(13号染色体异常)。检测的准确性高度依赖于胎儿染色体浓度:男胎要求Y染色体浓度达到或超过4%,女胎要求X染色体浓度无异常。此外,检测时点的选择对结果准确性及妇的临床风险具有重要影响,过早或过晚检测均可能导致误判或延误干预时机。 妇的身体质量指数(BMI)、及其他个体差异(如年龄、身高、体重等)均可能影响胎儿DNA在母血中的比例,进而影响NIPT的准确性最佳检测时机。因此,科学合理地依据BMI等指标妇进行分组,并确定各组的最佳检测时点,对提高检测成功率、降低临床风险具有重要意义。 本文需解决的具体问题如下: 问题一:分析胎儿Y染色体浓度数、BMI等指标之间的相关性,建立反映其统计关系的数学模型,并对模型的显著性进行检验。 假设你是数学建模的初学者 现在卡在了数据预处理 告诉我预处理的思路 并告诉我绘制散点图应该采用什么模型
09-07
### 数据预处理思路 - **数据收集**:收集包含胎儿Y染色体浓度、数、BMI等指标的数据集,确保数据来源可靠。 - **数据清洗**:检查数据中的缺失值,对于少量缺失值,可以采用均值、中位数或众数填充;对于大量缺失值的样本,考虑直接删除。同时,检查并处理异常值,可使用箱线图法识别异常值,然后根据业务逻辑决定是修正还是删除。 - **数据类型转换**:确保数、BMI等指标为数值类型,若不是则进行相应的转换。 - **数据标准化**:由于数和BMI的量纲不同,为了消除量纲影响,可以使用标准化方法,如Z - score标准化,公式为 $Z=\frac{X - \mu}{\sigma}$,其中 $X$ 是原始数据,$\mu$ 是均值,$\sigma$ 是标准差。 - **数据筛选**:根据研究目的,筛选出符合条件的数据,例如排除多胎妊娠等特殊情况的数据。 ### 绘制散点图的适用模型 - **线性回归模型**:如果胎儿Y染色体浓度数、BMI等指标呈现线性关系,可以使用线性回归模型。在Python中可以使用`scikit - learn`库实现,示例代码如下: ```python import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression # 假设X是数和BMI组成的特征矩阵,y是胎儿Y染色体浓度 X = np.array([[1, 20], [2, 22], [3, 24]]) y = np.array([0.1, 0.2, 0.3]) model = LinearRegression() model.fit(X, y) # 绘制散点图 plt.scatter(X[:, 0], y) plt.xlabel('Gestational Week') plt.ylabel('Fetal Y - chromosome concentration') plt.show() ``` - **多项式回归模型**:当线性关系不明显时,可考虑多项式回归模型,它可以拟合更复杂的曲线关系。同样可以使用`scikit - learn`库,示例代码如下: ```python from sklearn.preprocessing import PolynomialFeatures poly = PolynomialFeatures(degree = 2) X_poly = poly.fit_transform(X) model_poly = LinearRegression() model_poly.fit(X_poly, y) plt.scatter(X[:, 0], y) plt.xlabel('Gestational Week') plt.ylabel('Fetal Y - chromosome concentration') plt.show() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信与基因组学

每一份鼓励是我坚持下去动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值