不完整数据特征选择与模糊回归树森林在复杂数据集的适用性
部分不确定决策表的约简
在特征选择的领域中,使用 Johnson 算法构建约简时,是通过为给定的决策属性依次添加最具区分性的属性来实现的。而计算区分矩阵 M 是 Johnson 算法的一个初步步骤。然而,从部分不确定决策表 UDT=(U, uC ∪d) 计算区分矩阵 M 仍是一项具有挑战性的任务,目前尚未得到足够的关注。
为了解决这个问题,我们将 Johnson 启发式算法进行了改进,使其适用于不确定环境,具体是在信任函数框架下。改进后的信任 Johnson 算法主要处理仅条件属性存在不确定性且在信任函数框架内表示的问题。在这种情况下,需要使用不相似性度量来区分具有不同决策值的对象对。区分矩阵的元素设置如下:
对于所有的 i, j ∈{1, …, n} 和 k ∈{1, …, K},有
$M ′(O_i, O_j) = {c_k ∈C|dist(m_{\Theta_k}^i, m_{\Theta_k}^j) > S 且 v_d(O_i) ≠ v_d(O_j)}$
其中,S 表示容忍阈值,dist 对应两个基本信任分配(bbas)之间的距离度量。文献中研究了不同的距离度量,如 Tessems 距离、欧几里得距离、Jousselme 距离等,其中 Jousselme 距离是最常用的距离之一。
给定两个 bbas $m_1$ 和 $m_2$,Jousselme 距离度量的计算方法如下:
$dist(m_1, m_2) = \sqrt{\frac{1}{2}(m_1 - m_2)^T D(m_1 - m_2)}$
其中,D 是 Jaccard 指数矩阵,其元素的计算方法如下:
超级会员免费看
订阅专栏 解锁全文
890

被折叠的 条评论
为什么被折叠?



