绪论

本文探讨了大数据作为21世纪重要资源的地位,介绍了其规模庞大、类型多样等特点,并阐述了从原始数据到洞察的过程及不同的处理方式。

大数据--21世纪的原油

for any collection of data sets so large and complex that it becomes difficult to process using traditional data processing applications

规模大

数据类型多样:结构化数据--先有模式后有数据、半结构化数据--先有部分模式(可扩展的标签)、非结构化数据--现有数据后有模式,非结构化数据占主体

生命周期:获取记录、抽取清洗、集成聚合、分析建模、解释展示

深度加工:raw data->information->knowledge->insight

处理方式:批量、在线、实时

质量:精确性、完整性、一致性、时效性








评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值