Web语义、知识图谱与机器学习在无线传感器网络中的应用
1. 文本挖掘与语义分析
1.1 语料库分析
在进行语料库分析时,提取的内容必须与主题相关,否则会降低分析效果。完成语料库分析后,分类学家要检查提取的概念是否与分类法相关,决定是使用这些概念还是从概念列表中删除。提取结果可根据提供的各种参数进行排序。在决定是否将概念从语料库分析添加到分类法时,有不同的评分可供参考。例如,在提取概念时,互信息得分(MIS)可作为决定因素,我们可以设置一个得分限制,只有达到该限制的概念才会被采纳。
以下是语料库分析的基本步骤:
1. 选择与主题相关的文档和文件。
2. 进行语料库分析,提取概念和相关概念。
3. 分类学家检查概念与分类法的相关性。
4. 根据参数对提取结果进行排序。
5. 依据评分决定是否添加概念到分类法。
1.2 语义文本挖掘
语义是对语言意义的研究,语义文本挖掘是从语言中以编程方式提取意义。与普通文本挖掘不同,语义文本挖掘试图模仿人类的理解策略。在推导文本意义时,语义文本挖掘面临与文本挖掘类似的挑战,主要是消除意义的歧义。同形异义词和嵌套术语借助同义词有助于提高性能。
语义文本挖掘基于上下文来确定单个术语、单词或更广泛概念的含义,其上下文可分为以下几种:
- 局部上下文 :与单词本身以及使用的单词相关。
- 全局上下文 :在全球范围内通用的单词或句子,如“太阳从东方升起”。
- 个人知识 :属于局部上下文的一种,是个人
语义与机器学习融合在WSN中的应用
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



