23、基于邻域粗糙集模型的基因选择方法研究

day7

于 2025-09-03 14:00:08 发布

阅读量7

点赞数

CC 4.0 BY-SA版权

分类专栏：信息学教育的现在与未来文章标签：邻域粗糙集基因选择肿瘤分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/day7/article/details/153663243

信息学教育的现在与未来专栏收录该内容

71 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于邻域粗糙集模型的基因选择方法研究

1. 肿瘤分类特征获取方法概述

在肿瘤分类中，通常有特征提取和基因选择这两种获取特征的方法。然而，肿瘤数据集具有高维度和小样本量的特点，仅通过一步操作来提取最佳特征或选择最小的信息基因子集以获得最高分类准确率是很困难的。因此，设计了一种新颖的两步法来实现这一目标。

1.1 算法模型步骤

步骤 1 ：根据使用 Kruskal - Wallis 秩和检验计算每个基因的 p 值进行基因排名，从而选择初始基因集 $G_{top}$。
步骤 2 ：采用邻域粗糙集模型选择信息基因集 $G_{o}$（它由多个基因子集组成），或者使用主成分分析（PCA）从基因集 $G_{top}$ 中提取主成分（PCs）。
步骤 3 ：使用分类器评估提取的 PCs 或从 $G_{o}$ 中选择最优基因集 $G^{ }$。通常，$G^{ }$ 中的基因子集具有近似最高的准确率。

1.2 邻域决策表相关定义

设 $NDT = $ 为邻域决策表，其中：
- $S = {s_1, s_2, \cdots, s_m}$ 是一个非空样本集，称为样本空间。
- $G = {g_1, g_2, \cdots, g_n}$ 是一个非空基因集，也称为条件属性。
- $D = {L}$ 是一个输出变量，称为决策属性。
- $V_a$ 是属性 $a \in G \cup D$ 的值域。
- $

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。