数据挖掘常用的数据源

本文介绍了多种数据挖掘的数据源,包括Freebase、Infochimps、Numbrary等数据市场,亚马逊公共数据集、维基百科等公开资源,以及地理、体育、全球和政府与政治领域的特定数据提供者。这些数据源涵盖了从社区贡献到专业统计的各种类型,为数据挖掘提供了丰富的素材。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

有关数据提供的综合性网络服务日益增多。有些网络应用提供了大型的数据文件,供人有偿

或无偿下载。还有一些应用则由广大开发人员创建,通过应用编程接口(Application Programming

InterfaceAPI)获得数据。这能让我们运用某些服务应用(例如Twitter)的数据,并整合进自己

的程序中去。以下是其中一些资源。

. Freebasewww.freebase.com)——一个主要致力于提供关于人物、地点和事件的数据的

社区。它在数据方面有点类似维基百科,但网站的结构更清晰。可以下载网友上传的数

据文件,或者将你自己的数据进行备份。

. Infochimpshttp://infochimps.org)——数据市场,提供免费和收费的数据下载。你也可

以通过他们的API来获得数据。

. Numbraryhttp://numbrary.com)——为网上的数据进行编目,主要为政府数据。

. AggDatahttp://aggdata.com)——提供付费的数据集,多关注于各种零售业的地区性

数据。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值