↑↑↑关注后"星标"Datawhale
每日干货 & 每月组队学习,不错过
Datawhale干货
作者:牧小熊,华中农业大学,Datawhale原创作者
1.什么是大数据
1.1 大数据特征
我们引用了大数据的4V特征
Volume 大数据数据量大,数据量单位为T 或者P级
Variety 数据类型多,大数据包含多种数据维度 比如 日志、视频、图片
Value 价值密度低,商业价值高 比如监控视频,其中关键1-2秒可能具有极高的价值
Velocity 要求处理速度块
本文深入探讨了大数据的定义,强调了其4V特征:Volume、Variety、Value和Velocity。介绍了大数据的关键技术,包括ETL/ELT的区别,以及大数据与数据库管理系统的关系,特别是Hive在数据仓库中的作用。文章还提到了OLTP和OLAP的概念,以及Lambda大数据框架。最后,概述了Hadoop、Spark和Flink等大数据计算技术,并提及了大数据实践的可能性,如使用Pyspark进行预测分析。
↑↑↑关注后"星标"Datawhale
每日干货 & 每月组队学习,不错过
Datawhale干货
作者:牧小熊,华中农业大学,Datawhale原创作者
我们引用了大数据的4V特征
Volume 大数据数据量大,数据量单位为T 或者P级
Variety 数据类型多,大数据包含多种数据维度 比如 日志、视频、图片
Value 价值密度低,商业价值高 比如监控视频,其中关键1-2秒可能具有极高的价值
Velocity 要求处理速度块

被折叠的 条评论
为什么被折叠?