社交大数据中的语义数据发现
1. 引言
Web 技术的发展经历了多个阶段。最初是 Web 0.0,互联网在此阶段诞生。随后发展到 Web 1.0,即静态 Web 或只读 Web,信息以传统的以文档为中心的方式呈现。接着是 Web 2.0,被视为读写 Web,用户之间可以通过用户生成内容或面向社区的信息收集进行互动和贡献,社交媒体和博客在这个时代得到了广泛应用。然而,网络上产生的大量数据(即大数据)和非结构化内容给用户处理带来了巨大挑战。
为了使网络内容能够被计算机理解和处理,Web 3.0(语义执行 Web)应运而生。语义 Web 的核心概念是为数据添加语义标记以定义其含义,这使得人类用户能够与计算机应用程序进行通信。此前,网络应用程序无法为数据提供上下文,导致无法理解数据的相关性,而语义 Web 使软件代理能够理解和执行网络内容。之后是 Web 4.0(移动 Web),它能实时连接现实和虚拟世界中的所有设备。目前,情感 Web 仍在发展中,人类用户与计算机的交互将基于神经技术。
社交媒体在社会中扮演着重要角色,它重塑了媒体格局,在很大程度上改变了游戏规则,为表达和相互对话提供了充足的空间,有助于形成公共空间或公共领域。但同时,社交媒体也被部分群体过度和不负责任地使用,导致政治两极分化、意识形态一致、谣言传播以及极端主义、种族主义和恐怖主义的滋生。因此,理解社交数据的上下文内容至关重要,这有助于深入了解用户的信仰和态度。
当前面临的一个关键挑战是如何发现短文本消息(如推文)的领域。由于推文简短,机器难以准确理解其文本内容,例如“Labor”一词在政治领域和工作领域具有不同的含义。
超级会员免费看
订阅专栏 解锁全文
1461

被折叠的 条评论
为什么被折叠?



