基于犹豫模糊语言术语集的信任网络模型与改进的离散化特征选择方法
基于犹豫模糊语言术语集的信任网络模型
在信任网络中评估信任分数是一个重要的研究领域,而使用语言表达式来进行评估是一种更贴近人类表达习惯的方式。
实验评估
为了深入了解所提出的方法,进行了两个实验。
1.
信任路径长度对信任度和不确定性的影响
:
- 随机从信任语言术语集的语义中生成基于犹豫模糊语言术语集(HFLTS)的信任度。假设在一条有 $n$ 个代理的信任路径上,代理具有相同的信任度(信任路径长度为 $n - 1$)。
- 用原始信任度与最终信任度的比率表示信任的变化,用 HFLTS 中元素的数量表示信任度的不确定性。
- 进行 1000 次传播结果的计算。结果表明,无论原始信任度如何,随着信任路径长度的增加,最大和最小信任度都会下降。而不确定性的变化有两种不同趋势:当传播中的信任度较高时,不确定性会增加,因为信任度在传播过程中会减弱;当传播中的信任度较低时,信任度的不确定性会在传播过程中降低,并且信任度会迅速达到较低水平。
2.
信任路径数量对信任度和不确定性的影响
:
- 分别从信任语言术语集 ${s3, s4, s5}$ 和 ${s1, s2, s3}$ 中随机生成 $n$(1 到 10 之间)个基于 HFLTS 的信任度。
- 对不同路径上的 $n$ 个信任度进行聚合,并进行 1000 次计算。
- 当每个信任路径的信任度相对较高时,聚合后的信任度会增强,尤其是当聚合路径增加时,增强效果更明显;当每个信任路径的信任度相对较低时,聚合结果会随着路径数量的增加而逐渐减弱。与连接运算符不同的是,当不同信任路径上的所有信任度都相对较高或都相对较低时,聚合结果的不确定性会随着信任路径数量的增加而降低。
从上述分析可以看出,运算符在信任传播中发挥着不同的作用,并且每个运算符都满足一些直观的传播属性。因此,基于 HFLTS 的信任模型不仅在表达上更贴近人类用户,而且能够保持直观的信任传播属性。
相关工作对比
- Majd 和 Balakrishnan 的模型 :考虑了可靠性、相似性、满意度和信任传递性,使用连接运算符和聚合运算符来确定每个推荐者的信任值,重点在于如何根据确定的组件选择更可靠的推荐者。而我们的模型更注重刻画更接近人类表达的信任模型以及基于这种模型的信任传播机制。
- Wu 等人的模型 :提出了用于确定群体决策中专家重要性值的信任网络模型,研究了一致范数传播运算符来传播信任和不信任信息并防止信任信息的丢失。我们也在信任传播过程中使用了一致范数运算符,但用于聚合通过不同信任路径传递的信任分数,并且聚合运算符用于定性信任模型,其中信任分数用语言表达式表示。此外,他们的传播方法只考虑最短信任路径而忽略其他路径,而我们在聚合信任分数时考虑所有路径。
- Kant 和 Bharadwaj 的模型 :提出了基于模糊计算的信任模型,用于推荐系统以解决冷启动问题,使用语言表达式表示信任和不信任概念并提出了相关的传播和聚合运算符。但在他们的模型中,信任和不信任度只能分配一个语言表达式,而我们的模型使用犹豫模糊语言术语集来反映一个人可能在几个值中犹豫选择来评估信任。
改进的离散化特征选择方法
在数据挖掘和机器学习任务中,特征选择(FS)旨在去除数据中冗余或无关的特征,对提高模型性能至关重要。
背景与问题
当前机器学习算法常处理高维数据,大量无关和冗余特征会影响训练模型的性能,导致过拟合现象,降低测试准确性。FS 是一个组合优化问题,传统方法如顺序搜索难以解决,尤其是在高维情况下。近年来,进化计算(EC)方法被用于解决 FS,其中粒子群优化(PSO)因其简单性和快速收敛性而被广泛使用。
然而,PSO 中粒子的编码非常关键,二进制 PSO(BPSO)虽然考虑了每个特征的二进制值来表示是否选择该特征,但往往会产生许多局部最优解,导致特征集较大。尽管一些启发式搜索方法如禁忌搜索与 BPSO 结合可以有效减少特征数量,但分类性能仍然有限。
改进方法
-
特征预选择
:
- 应用 ReliefF 算法通过评估特征的重要性来预选择特征。该算法根据一个好的特征在最近邻点中与相似样本的特征值接近但与不相似样本的特征值远离的原则为每个特征分配权重,通过设置权重阈值筛选特征子集。
- 公式如下:
-
更新特征 $F$ 的权重公式:
[W(F) = W(F) - \sum_{i = 1}^{k} \frac{diff(F, R, H_j)}{mk} + \sum_{C \neq class(R)} [\frac{p(C)}{1 - p(Class(R))} \sum_{j = 1}^{k’} \frac{diff(F, R, H_j(C))}{mk}]] - 其中 $R$ 是从训练数据集中随机选择的样本,$H$ 和 $M$ 分别是与样本 $R$ 同一类和不同类的最近邻样本,$m$ 是随机选择样本的大小,$diff()$ 用于提供两个样本之间的差异并对变量进行归一化。
-
$diff(F, R_1, R_2)$ 的计算方式如下:
[diff(F, R_1, R_2) =
\begin{cases}
\frac{|R_1[F] - R_2[F]|}{max(F) - min(F)} & \text{if } F \text{ is continuous} \
0 & \text{if } F \text{ is discrete and } R_1[F] = R_2[F] \
1 & \text{if } F \text{ is discrete and } R_1[F] \neq R_2[F]
\end{cases}] - 然后,使用最小描述长度原则(MDLP)选择至少有一个基于信息增益的分割点的显著特征。最后,取相关特征和显著特征的交集作为预选择的特征子集。这样可以缩小搜索空间的维度。
-
粒子的编码和解码
:
- 对预选择特征的索引进行升序排序。对于每个粒子,存储每个预选择特征的选定分割点的数量。
- 基于 MDLP 生成的分割点是递归获得的,第一个获得的分割点在将值划分为两个单独部分时贡献最大。为了对这些分割点的关系进行建模,使用二叉树,节点存储 MDLP 生成的分割点。
-
分割点按二叉树的层次进行排序,对于同一层次的分割点,比较优先级 $P_{zs}$:
[P_{zs} = \frac{IG(z_s)}{MDLP(L_{z_s}^s)}] - 其中 $z_l$ 表示树中第 $l$ 层的分割点(根节点 $l = 1$),$z_s$ 表示特征 $s$ 在 $z_l$ 中的任何分割点,$IG(z_s)$ 是评估分割点引入的信息增益,$MDLP(L_{z_s}^s)$ 是从第 $l - 1$ 层分割点得到的分区 $L_s$ 的 MDLP。
- 优先级高的分割点排在前面,从而得到预选择特征的排序分割点表。对于每个粒子,当指定特征 $s$ 的选定特征数量 $M_s$ 时,选择排序分割点表中的前 $M_s$ 个分割点进行离散化。如果 $M_s$ 等于 0 或大于分割点的数量,则丢弃该特征。
-
基于选定分割点的离散化样本
:
- 确定每个特征的分割点后,可得到离散化的训练样本,方便进行分类任务。离散化规则如下:
- 将所有样本中特征 $s$ 的值按升序排序。
- 假设选定的 $M_s$ 个分割点将特征 $s$ 划分为 $M_s + 1$ 个段。
- 落在第一段范围内的 $s$ 的任何值记录为 1,其余段的值依此类推。
-
适应度函数
:采用考虑平衡准确率和同一类与不同类实例之间距离的适应度函数:
[fitness = (k * balanced \ accuracy + (1 - k) * distance)]
[balanced \ accuracy = \frac{1}{n} \sum_{i = 1}^{n} \frac{TP_i}{|S_i|}]
实验研究表明,所提出的方法能够有效去除无关特征,同时在分类准确率方面与一些先进方法相比具有竞争力。
下面通过一个 mermaid 流程图展示改进的离散化特征选择方法的整体流程:
graph TD;
A[开始] --> B[特征预选择];
B --> C[粒子编码和解码];
C --> D[基于选定分割点的离散化样本];
D --> E[计算适应度函数];
E --> F{是否满足终止条件};
F -- 否 --> C;
F -- 是 --> G[输出最优特征子集];
G --> H[结束];
综上所述,基于犹豫模糊语言术语集的信任网络模型为信任评估和传播提供了更贴近人类表达的方式,而改进的离散化特征选择方法在去除无关特征和提高分类准确率方面具有良好的效果。这些研究成果在相关领域具有重要的应用价值。
基于犹豫模糊语言术语集的信任网络模型与改进的离散化特征选择方法
方法优势总结
-
基于 HFLTS 的信任网络模型优势
- 表达贴近人类 :使用犹豫模糊语言术语集,能更好地反映人类在评估信任时的犹豫心理,相比只能分配一个语言表达式的模型,更符合人类的认知和表达习惯。
- 信任传播直观 :运算符在信任传播中发挥不同作用且满足直观传播属性,能够综合考虑多种情况进行信任传播,如不同信任路径长度和数量对信任度及不确定性的影响。
- 考虑全面路径 :在聚合信任分数时考虑所有路径,避免了只考虑最短信任路径而忽略其他路径导致的信息丢失。
-
改进的离散化特征选择方法优势
- 缩小搜索空间 :通过 ReliefF 算法和 MDLP 预选择特征,缩小了特征数量和搜索空间的维度,提高了搜索效率。
- 有效去除无关特征 :采用新颖的粒子编码和解码方式,能够同时确定选定特征的数量和索引,有效去除无关特征。
- 保持分类准确性 :结合适应度函数考虑平衡准确率和实例间距离,在去除无关特征的同时,保持了与一些先进方法相当的分类准确率。
实际应用场景
信任网络模型的应用
- 电子商务推荐系统 :可以利用基于 HFLTS 的信任网络模型来评估商家和商品的信任度。消费者在选择商品时,会参考其他用户的评价和推荐,而该模型能够更准确地反映用户对商家和商品的信任程度,从而提高推荐的准确性。例如,在聚合多个用户对某个商家的信任评价时,考虑不同信任路径和信任度的情况,为消费者提供更可靠的推荐。
- 社交网络中的信息传播 :在社交网络中,信息的传播往往依赖于用户之间的信任关系。该模型可以用于评估用户之间的信任度,从而预测信息在社交网络中的传播范围和可信度。例如,当一个用户发布一条信息时,通过计算该用户与其他用户之间的信任度,判断哪些用户更有可能接收和传播这条信息。
离散化特征选择方法的应用
- 医疗数据分类 :在医疗数据中,通常包含大量的特征,如患者的症状、检查结果等。使用改进的离散化特征选择方法可以去除无关和冗余的特征,提高医疗数据分类的准确性。例如,在诊断某种疾病时,通过选择与该疾病相关的特征,能够更准确地判断患者是否患有该疾病。
- 图像识别 :在图像识别任务中,图像的特征数量往往非常大。该方法可以帮助选择最具代表性的特征,减少计算量,提高图像识别的效率和准确性。例如,在识别不同类型的动物图像时,选择与动物特征相关的特征,能够更准确地进行分类。
未来发展方向
信任网络模型
- 与其他技术融合 :可以将基于 HFLTS 的信任网络模型与区块链技术相结合,提高信任评估的安全性和可信度。区块链的不可篡改和去中心化特性可以保证信任数据的真实性和完整性,为信任网络模型的应用提供更可靠的基础。
- 拓展应用领域 :进一步探索该模型在金融、物联网等领域的应用,为这些领域的信任评估和决策提供支持。例如,在金融领域,可以用于评估借款人的信用风险;在物联网领域,可以用于评估设备之间的信任关系。
离散化特征选择方法
- 优化算法性能 :继续研究和优化粒子群优化算法,提高其搜索效率和收敛速度。例如,引入自适应的参数调整策略,根据不同的数据集和问题特点自动调整算法的参数。
- 结合深度学习 :将离散化特征选择方法与深度学习模型相结合,提高深度学习模型的性能。例如,在深度学习模型的训练过程中,使用该方法选择最相关的特征,减少训练时间和计算资源的消耗。
总结与展望
本文介绍了基于犹豫模糊语言术语集的信任网络模型和改进的离散化特征选择方法。基于 HFLTS 的信任网络模型在表达上更贴近人类用户,能够保持直观的信任传播属性;改进的离散化特征选择方法能够有效去除无关特征,同时保持较高的分类准确率。这两种方法在实际应用中具有广泛的前景,未来可以通过与其他技术融合和拓展应用领域,进一步发挥其优势。
下面通过一个表格总结两种方法的关键信息:
| 方法 | 核心思想 | 优势 | 应用场景 | 未来发展方向 |
| ---- | ---- | ---- | ---- | ---- |
| 基于 HFLTS 的信任网络模型 | 使用犹豫模糊语言术语集表示信任度,通过连接和聚合运算符进行信任传播 | 表达贴近人类、信任传播直观、考虑全面路径 | 电子商务推荐系统、社交网络信息传播 | 与其他技术融合、拓展应用领域 |
| 改进的离散化特征选择方法 | 通过 ReliefF 算法和 MDLP 预选择特征,采用新颖的粒子编码和解码方式进行特征选择 | 缩小搜索空间、有效去除无关特征、保持分类准确性 | 医疗数据分类、图像识别 | 优化算法性能、结合深度学习 |
总之,这两种方法为信任评估和特征选择提供了新的思路和解决方案,有望在相关领域取得更好的应用效果。
超级会员免费看
1688

被折叠的 条评论
为什么被折叠?



