中国知网:《计算机仿真》----------山西农业大学信息科学与工程学院 林媛
非结构化网络中有价值信息数据挖掘原理
确定信息数据挖掘的历史样本(??)依据不同信息数据中各个词在网络中出现的频率和词的意思,构造文本词语的权重映射矩阵,提取语义特征,将特征定义为中心聚类的相似判断阈值。(提取那么多语义特征,那个是阈值??有选拔的条件??)
步骤:
(1)聚类中心确定
随机的选取k个文本初始信息作为分类的中心(随机化的选择通常是用来跳出局部最优的啊)使用公式(1)确定信息数据挖掘的历史样本的聚类中心
看着下面的一堆假设,我已经说不出话,心累啊
自己能力有限,读不懂