品牌声誉挖掘与可视化框架及语音活动检测技术综述
在当今数字化时代,品牌声誉管理和语音识别技术都具有重要的应用价值。本文将介绍品牌声誉挖掘与可视化框架,以及适用于移动设备的孤立数字识别的语音活动检测技术。
品牌声誉挖掘与可视化框架
层次聚类算法
层次聚类是品牌声誉挖掘(BRM)框架中的重要环节。其伪代码如下:
Procedure divisive cluster( M, k)
1: if (|M| < k) then
2: exit
3: end if
4: C = set of k clusters {c1,c2,..., ck}
5: if (Silhouette Coefficient(C) > σ) then
6: exit
7: end if
8: for all ci ∈C do
9:
M′ = subset of M in ci
10: divisive cluster( M′, k)
11: end for
这个过程可以看作是一个迭代的 k 均值过程。输入是提及集合 M 和每层所需的聚类数 k。该过程会递归地对每个发现的分支调用 divisive_cluster
程序,直到层次结构中某个叶节点考虑的提及数少于 k,或者达到足够凝聚的聚类配置(通过轮廓系数衡量)。实验表明,k = 3 对于 BRM 产生的结果最有效。
聚类完成后,会为每个聚类分配一个标签。具体操作是提取表示给定聚类中提及的特征向量中出现最频繁的单词,识别出现次数超过某个阈值的单词;