大数据--21世纪的原油
for any collection of data sets so large and complex that it becomes difficult to process using traditional data processing applications
规模大
数据类型多样:结构化数据--先有模式后有数据、半结构化数据--先有部分模式(可扩展的标签)、非结构化数据--现有数据后有模式,非结构化数据占主体
生命周期:获取记录、抽取清洗、集成聚合、分析建模、解释展示
深度加工:raw data->information->knowledge->insight
处理方式:批量、在线、实时
质量:精确性、完整性、一致性、时效性
本文探讨了大数据作为21世纪重要资源的地位,介绍了其规模庞大、类型多样等特点,并阐述了从原始数据到洞察的过程及不同的处理方式。
1964

被折叠的 条评论
为什么被折叠?



