大数据总结

本文介绍了大数据的特点和与传统数据挖掘的区别,讲解了HDFS、Hive、Spark的基本操作及其在大数据处理中的作用。同时,阐述了云计算的三种服务模式、类型和关键技术,如虚拟化、分布式存储和分布式计算。还概述了Hadoop、HBase和Hive在大数据存储和分析中的应用,以及HDFS的主要组件和MapReduce的概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

编程题:HDFS基本操作、Hive编程、spark编程

HDFS的基本操作 https://blog.youkuaiyun.com/a215012954/article/details/91448799
Hive的基本操作 https://blog.youkuaiyun.com/a215012954/article/details/91446210
spark的基本操作 https://blog.youkuaiyun.com/a215012954/article/details/91447191

大数据

  • 大数据的特点:数据量大、数据类型繁多(结构化数据、半结构化数据、非结构化数据)、处理速度快和价值密度低.。
  • 结构化数据主要是指存储在关系数据库中的数据;非结构化数据包括邮件、音频、视频、微信,微博,位置信息、链接信息、手机呼叫信息、网络日志等。
  • 大数据和传统数据挖掘区别:①秒级响应②实时分析结果
  • 批处理计算针对大规模数据的批量处理,也是我们日常数据分析工作中非常常见的一类数据处理需求。
  • 流数据(或数据流)在时间分布和数量上无限的一系列动态数据集合体,数据的价值随着时间的流逝而降低,因此必须采用实时计算的方式给出秒级响应。

云计算

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值