医疗管理预测分析:基于IoRT的疾病预测与分类
1. 数据挖掘中的模式挖掘
1.1 支持度与频繁模式
在数据库D的序列中,包含序列s的元组数量值被称为s的支持度,记为su(s)。用户定义一个值α,支持度大于α的挖掘模式被称为频繁1 - 长度模式。在挖掘出1 - 长度模式后,使用遗传算法(GA)来挖掘其他长度的模式。
1.2 遗传算法在模式挖掘中的应用
由于从不同时间间隔收集的数据库包含大量原始数据,这增加了模式挖掘的时间复杂度。使用遗传算法可以优化模式挖掘过程,降低时间复杂度,并找出数据库中最有用的数据。其具体步骤如下:
1. 染色体生成 :
- 染色体基于初始种群随机生成。生成的染色体在1 - 长度模式中是频繁的,染色体的每个位置表示一个基因。
- 染色体的表示形式为:$C_j = {i_1, l_i, i_x}; 0\leq j\leq n_c - 1$
- 其中,基因值$i_x$表示频繁项的1 - 长度模式值,$l_i$表示语言术语。例如,1 - 长度频繁模式为{c, d, e}时,生成的染色体如下表所示:
| 样本染色体 |
| — |
| c short d |
| c short e |
| d short e |
| c long d |
| c long e |
| d long e |
| c middle d |
| c middle e |
| d middle e |
2. 适应度函数 :
超级会员免费看
订阅专栏 解锁全文
29

被折叠的 条评论
为什么被折叠?



