1. 5个V
(1) Volume 高容量
(2)Velocity 高速度
(3)Variety 多样性
(4)Veracity 真实性
(5)Value 价值性
2. 工作
(1)存储
(2)管理
(3)分析 (这里主要讲这个)
3.大数据分析
通过对大量数据进行分析,挖掘发现其中的模式和模型。
(1)Valid:对新数据有效
(2)Useful:能在一定程度上方便对item进行决策
(3)Unexpected:模式/模型不易被观察到
(4)Understandable:人们能够对模式进行解释
4.数据分析任务
(1)描述方法
找到人类可解释的模式来描述数据,如:聚类
(2)预测方法
使用一些已知变量来预测未知的变量,如:推荐系统
本文探讨了大数据的五大核心特性:高容量、高速度、多样性、真实性和价值性,以及如何通过存储、管理和分析大数据来挖掘模式和模型,为决策提供有效且意外的洞察。文章还介绍了数据分析的任务,包括描述方法和预测方法。
9525

被折叠的 条评论
为什么被折叠?



