网络数据管理技术解析
1. 互联网信息管理现状与挑战
互联网的发展极大地改变了信息的管理和获取方式。如今,万维网(WWW)成为一个分布式的全球信息资源,涵盖了艺术、教育、旅游、科学、政治、商业等几乎所有人类活动领域的数据。然而,由于缺乏统一的组织,网络变得日益混乱,且发展速度惊人。有预测显示,未来十年,大部分人类信息将在网络上获取。
传统的信息检索技术在处理网络数据时存在诸多问题。这些技术不仅耗时费力,而且检索结果往往不尽如人意。网络数据存在以下几个主要问题:
- 缺乏可信度 :网络数据的可信度较低。例如,在查找香港九龙地区最便宜的三星级酒店时,不同网站可能提供相互矛盾的信息。这是因为网络数据缺乏时间基准,网站具有自主性,信息来源的选择存在差异,且没有共同的数据来源。
- 缺乏生产力 :在网络上搜索相关信息的效率极低。以查找新加坡租金低于1500新元/月、附近有电影院和泰国餐厅的两居室公寓为例,用户需要定位相关网站、获取数据并进行整合,这一过程繁琐且困难。
- 缺乏历史数据 :网络数据变化频繁,大多数网站没有存档功能,导致难以获取历史数据。这给分析时间相关信息带来了严重限制,例如企业难以分析竞争对手产品价格和特征的变化。
- 难以将数据转化为信息 :网络数据难以直接转化为有用的信息。在电子商务环境中,查找价格最低的掌上电脑或在医疗保健环境中查找过去六个月上市的艾滋病新药,都需要从大量数据中提取信息,这一过程十分繁琐。
2. 搜索引擎的局限性
目前,网络信息主要通过浏览
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



