Web数据管理与社区结构检测相关技术解析
1. Web进化管理概述
Web 为我们提供了海量的异构信息,而且这些信息随时都可能以各种方式发生演变。其演变主要有两种形式:
- 存在性演变 :网页(包括静态和动态网页)以及网站呈现出不同的寿命模式。
- 结构和内容修改 :网页通常会替换其前身,往往不会留下先前文档的任何痕迹。
这些快速且常常不可预测的信息变化,给信息的检测、监控和分析带来了难题。这是一个具有挑战性的问题,因为 Web 中的信息源是自主的,基于触发机制的典型数据库方法无法用于检测这些变化。此外,这些信息源本质上是半结构化或非结构化的,因此传统的结构化数据(关系型)进化管理技术无法有效应用。
Web 进化管理旨在解决 Web 动态性质的管理问题,它定义了一套用于检测 Web 数据变化、监控这些变化以及通过分析数据的进化特征挖掘有趣模式的技术。相关讨论主要分为三个主要部分:
- 变化/进化检测
- 进化查询
- **数据分析或挖掘数据进化
Web 进化管理系统还有着广泛的应用领域,如社交网络、博客和 Web 事件检测等。
2. Web进化管理教程内容
教程包含以下主题:
1. 引言与动机 :简要概述 Web 数据的动态性质及其对我们信息需求的影响,阐述在 Web 环境下进行进化管理的必要性。
2. 进化管理问题与特征
超级会员免费看
订阅专栏 解锁全文
1176

被折叠的 条评论
为什么被折叠?



