智能医疗与制造:乳腺癌诊断与智能实验室的创新突破
1. 乳腺癌诊断的 EPLR - R 模型
1.1 背景与问题提出
乳腺癌是一种高度复杂的疾病,其发展受多种因素调控,这些因素间可能存在非线性关系。利用 miRNA 数据诊断乳腺癌亚型可看作一个五类分类问题,诊断准确性依赖于缺失值处理和特征集选择。以往研究未考虑数据中缺失值对后续分析和决策的潜在影响,因此解决缺失数据问题并进一步研究因素间相互作用以提高诊断准确性十分关键。
1.2 模型构建
1.2.1 缺失值处理
采用用特征平均值替换缺失值的策略,原因有二:一是数据中缺失值数量相对较少,此替换方法对整体数据影响极小;二是通过对数据的描述性统计分析,发现数据呈现明显的中心趋势,多数值围绕均值聚集。
1.2.2 二阶多项式回归模型
提出二阶多项式回归模型用于诊断乳腺癌亚型:
[
\arg \max_{k = 1,2,3,4,5} f_k(x)
]
其中第 (k) 个决策函数 (f_k(x)) 定义为:
[
f_k(x) = \beta_k^{(0)} + \sum_{i = 1}^{124} \beta_k^{(i)} x^{(i)} + \sum_{i = 1}^{124} \sum_{j = i}^{124} \beta_k^{(i,j)} x^{(i)}x^{(j)}
]
令 (x^{(125)} = x^{(1)}x^{(1)}),(x^{(126)} = x^{(1)}x^{(2)}),…,(x^{(7874)} = x^{(124)}x^{(124)
EPLR-R模型与智能实验室创新
超级会员免费看
订阅专栏 解锁全文
1985

被折叠的 条评论
为什么被折叠?



