多领域研究成果:从文档分类到情感分析
在当今信息爆炸的时代,信息的有效管理和分析变得至关重要。本文将介绍几个不同领域的研究成果,包括文档的多分类研究、粗糙集理论在自动词库构建中的应用以及哥伦比亚在线报纸评论的情感分析。
文档多分类研究
在文档多分类的研究中,通过对用户的评估发现了一些重要结论:
- 用户能够理解多分类的概念,并基于文档特征完成简单的文档分类。
- 用户对文件管理器越熟练、对层次概念理解越深入,就越能理解和处理多分类问题。
- 用户对自定义类之间的包含关系存在理解和喜好上的差异。在Web UI应用中,由于未展示包含关系,用户能理解并对结果满意;而在桌面UI应用中,用户则难以理解结果。不过,有一位用户(用户9)理解包含关系,且不喜欢Web UI应用未展示该关系。
这表明,有必要进一步研究是否需要表示用户自定义类之间的包含关系,因为这可能是导致误解的一个因素。同时,由于多分类在概念上会形成一个图,分析这种表示对用户的影响也很有意义。
粗糙集理论在自动词库构建中的应用
词库的重要性
词库是一种轻量级本体,在信息检索系统中是重要工具,可作为索引过程的受控词汇和查询扩展的手段。
研究背景
自动构建本体的研究已开展多年,但自动构建词库的主要问题是识别语义相关的术语。词共现是一种研究方法,而粗糙集理论因其能处理模糊性且在现实应用中取得成功,受到了关注。
实验数据
实验使用了ICL语料库,包含印尼合唱爱好者雅虎群组的前1000封电子邮件,由合唱专家分配主题和确定关键词。这些关键词构成了WORDS语料
超级会员免费看
订阅专栏 解锁全文
1176

被折叠的 条评论
为什么被折叠?



