
事件检测
程勇uestc
电子科大
展开
-
事件检测进展(一)
一、改进方案\quad因为之前存在聚类簇中信息不够干净,有噪声的情况,为解决这个问题,尝试采取将推文中实体词,“LOC”,“PER”,"ORG"和其他单词分别提取出来单独与已有的簇进行相似度的比较。具体方案为检测每条推文各类实体词有无的情况来赋予权值,如下: def tweet_cluster_similarity_with_four_vector(self, tweet_data, cl...原创 2019-07-18 13:09:54 · 6579 阅读 · 0 评论 -
事件检测进展(二)
\quad采用最大化相似度方差的方法来设置参数权重实体权重其他权重相似度方差原始方法0.005130.10.90.004770.20.80.004120.30.70.003440.40.60.002890.50.50.002370.60.40.001950.70.30.001700.80.2..原创 2019-07-23 14:33:37 · 1274 阅读 · 0 评论