电子参与的知识提取与管理组件:技术与应用
1. 电子参与现状与挑战
社交媒体在快速众包和快速响应方面的作用日益增强,尤其在危机事件(包括政治危机)和自然灾害中表现突出。然而,当前用于电子参与的社交媒体应用,多直接使用流行的社交媒体平台,或采用通用的、非特定领域的分析方法和解决方案来处理自发的政治讨论,导致性能一般。因此,需要开发一种能全面满足电子参与特定分析需求的解决方案,比如识别社交媒体上政治内容的有效方法,以及上下文信息聚类和链接方法。
2. 关键技术基础
2.1 语义网
语义网(Web 3.0)提供了一个框架,允许数据在应用程序、企业和社区边界之间共享和重用,将基于网站的 Web 2.0 推进到数据网络。语义网利用本体进行信息建模和知识表示,本体提供了一组受控的术语词汇,能共同提供领域的抽象视图。语义网技术和本体用于解决数据发现、数据互操作性、知识共享和协作问题。本体可以用 RDF(资源描述框架)描述,RDF 提供了一个灵活的基于图的模型,用于描述和关联资源。语义网技术在电子政务中的应用取得了显著进展,包括使用本体对电子政务的不同方面进行正式建模、构建电子参与研究架构、实现个性化服务交付以及实现政府资源和服务的互操作性和集成。在相关工作中,利用语义网构建自然语言处理所需的工件,并将所有数据存储在图中,以明确支持下一代电子参与的更好数据发现和互操作性。
2.2 自然语言处理
- 信息提取 :信息提取(IE)的目标是直接从文本中提取信息结构,重点在于从文本内容中识别关系、自动实例化本体和构建知识库工具。常见的信息提取方法包括监督学习(SL)技术、自监督方法和规
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



