中国知网:《计算机仿真》----------山西农业大学信息科学与工程学院 林媛
非结构化网络中有价值信息数据挖掘原理
确定信息数据挖掘的历史样本(??)依据不同信息数据中各个词在网络中出现的频率和词的意思,构造文本词语的权重映射矩阵,提取语义特征,将特征定义为中心聚类的相似判断阈值。(提取那么多语义特征,那个是阈值??有选拔的条件??)
步骤:
(1)聚类中心确定
随机的选取k个文本初始信息作为分类的中心(随机化的选择通常是用来跳出局部最优的啊)使用公式(1)确定信息数据挖掘的历史样本的聚类中心
看着下面的一堆假设,我已经说不出话,心累啊
自己能力有限,读不懂
本文探讨了在非结构化网络环境中进行有价值信息的数据挖掘原理。通过构建文本词语的权重映射矩阵并提取语义特征,利用这些特征进行中心聚类判断。文中详细介绍了聚类中心确定的过程及随机选取文本作为分类中心的方法。

被折叠的 条评论
为什么被折叠?



