
数据挖掘
iteye_578
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
用 XQuery采集数据
从 HTML 文档提取数据的方法有许多种,但是我真的很喜欢 Sam 采用的方法:既把 XQuery 当作屏幕搜集工具(从页面中提取相当的数据),又把它当作样式表工具(重新格式化数据,以便数据适应页面,不需要进行页面滚动)。只要少量基础设施和一些 非常简单的 XQuery 表达式,就可以从大量数据源提取出相关数据 —— 例如交通、天气和财务报价等,并在电话上完好地显示数据。 我过去经常处于这种情...2008-01-01 12:25:28 · 313 阅读 · 0 评论 -
数据挖掘资料汇编
1.数据挖掘技术的由来1.1网络之后的下一个技术热点我们现生活在一个网络化的时代,通信、计算机和网络技术正改变着整个人类和社会。如果用芯片集成度来衡量微电子技术,用CPU处理速度来衡量计算机 技术,用信道传输速率来衡量通信技术,那么摩尔定律告诉我们,它们都是以每18个月翻一番的速度在增长,这一势头已经维持了十多年。在美国,广播达到 5000万户用了38年;电视用了13年;Internet拨号上...2007-09-14 11:36:30 · 644 阅读 · 0 评论 -
Web数据挖掘
Web挖掘指使用数据挖掘技术在WWW数据中发现潜在的、有用的模式或信息。Web挖掘研究覆盖了多个研究领域,包括数据库技术、信息获取技术、统计学、人工智能中的机器学习和神经网络等。Web挖掘流程 与传统数据和数据仓库相比,Web上的信息是非结构化或半结构化的、动态的、并且是容易造成混淆的,所以很难直接以Web网页上的数据进行数据挖掘,而必须经过必要的数据处理。典型Web挖掘的处理流程如下[3]:...2007-09-14 11:50:11 · 531 阅读 · 0 评论 -
基于XML的Web数据挖掘在数字图书馆中的应用
1 引言 随着信息时代的到来,Internet 技术的发展,图书馆的功能变得越来越多样化。数字图书馆就是传统图书馆在信息时代的发展,它的基本目标是创造一个良好的信息环境,提供对分布式存储信息的 知识化组织、智能化访问和服务,它不但包含了传统图书馆的功能,还提供综合的信息访问服务。数字图书馆采用分布数据存储,能够把数据存储在多个站点中,读 者只须一个简单的操作就可以从这些站点中搜索信息。但是...2007-09-14 13:12:06 · 177 阅读 · 0 评论 -
XML与Web数据挖掘
面向Web的数据挖掘是一项复杂的技术,由于Web数据挖掘比单个数据仓库的挖掘要复杂的多,因而面向Web的数据挖掘成了一个难以解决的问题。而XML的出现为解决Web数据挖掘的难题带来了机会。 面向Web的数据挖掘面临的挑战 Web 上有海量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有...2007-09-14 13:36:31 · 165 阅读 · 0 评论 -
Web数据自动采集及其应用研究
1. Web数据自动采集的理论基础Web 可以说是目前最大的信息系统,其数据具有海量、多样、异构、动态变化等特性。因此给人们要准确迅速的获得自己所需要的数据越来越难,尽管目前有各种搜索引 擎,但是搜索引擎在数据的查全率考虑较多,而查准率不足,而且很难进一步挖掘深度数据。因此人们开始研究如何更进一步获取互联网上某一个特定范围的数据, 从信息搜索到知识发现。1.1相关概念Web 数据自动采...2007-09-14 13:49:46 · 305 阅读 · 0 评论 -
数据挖掘技术简介
1. 引言 数 据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知 识的过程。随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以TB计,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需 要应运而生发展起来的数据处理技术。是知识发现(Knowledge Discovery ...2007-09-14 13:57:18 · 151 阅读 · 0 评论 -
基于 Web 的数据挖掘
不可否认,万维网是到目前为止世界上最丰富和最密集的信息来源。但是,它的结构使它很难用系统的方法来利用信息。本文描述的方法和工具将使那些熟悉 Web 最常用技术的开发人员能快速而便捷地获取他们所需的以 Web 方式发 布的信息。在信息时代快速成长起来的万维网导致各种各样的公用信息被大量分发。不幸的是,尽管作为信息主要载体的 HTML 提供了一种方便地向读者呈现信息的方法,但它可能并不是一个很好的可...2007-09-14 14:46:47 · 253 阅读 · 0 评论