基于熵加权FCM的社交流消息情感分类算法研究
1. 加权FCM算法(wFCM)
加权FCM算法(wFCM)是FCM算法的扩展。在FCM算法中,每个数据点对最终最优聚类的贡献是相等的,而wFCM算法为每个数据点分配一个权重,这个权重会对寻找最优解产生不同的影响。
wFCM算法最小化以下目标函数:
[J_w(U; V) = \sum_{i = 1}^{C} \sum_{j = 1}^{N} w(p_j) u_{ij}^m d_{ij}^2 = \sum_{i = 1}^{C} \sum_{j = 1}^{N} w(p_j) u_{ij}^m \left\lVert p_j - v_i \right\rVert^2]
通过拉格朗日乘数法,聚类中心的表达式为:
[v_i = \frac{\sum_{j = 1}^{N} w(p_j) u_{ij}^m p_j}{\sum_{j = 1}^{N} w(p_j) u_{ij}^m}, i \in {1, \cdots, C}]
其中,权重 (w(p_j)) 描述了第 (j) 个对象对寻找聚类中心的影响程度,该值在算法的每次迭代中根据 (x_j) 计算得出。
wFCM算法的伪代码如下:
Set m, ε, C
Initialize randomly the partition matrix components uij i = 1,...,C j = 1,…,N
Repeat
Calculate w(pj) j = 1,…,N
Calculate vi i = 1,...,C
超级会员免费看
订阅专栏 解锁全文
29

被折叠的 条评论
为什么被折叠?



