数据分析面试【数据库】之-----Hive、Hadoop和Spark

本文介绍了Hadoop作为大数据存储和计算的基础,Hive作为基于Hadoop的数据仓库工具,提供SQL查询功能,而Spark则在Hadoop基础上优化了计算速度,利用内存加速处理。Hadoop具有可靠、高效和可扩展性,适合大数据存储和分析。Spark的RDD特性使其在内存计算中表现优秀,适合快速迭代的计算任务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

阅读之前看这里👉:博主是正在学习数据分析的一员,博客记录的是在学习过程中一些总结,也希望和大家一起进步,在记录之时,未免存在很多疏漏和不全,如有问题,还请私聊博主指正。
博客地址:天阑之蓝的博客,学习过程中不免有困难和迷茫,希望大家都能在这学习的过程中肯定自己,超越自己,最终创造自己。

Hadoop简介

Hive是基于Hadoop的数据仓库管理工具,可以将结构化的数据文件映射为一个数据库表,并提供SQL查询功能,这种查询功能就是Hive SQL

Hadoop是现在各大公司用得比较多的一种数据存储和计算架构系统,由Apache基金会开发,它可以使用户在不了解分布式底层细节的情况下开发分布式程序,充分利用集群的威力进行高速计算和存储。

特点:Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点

Hadoop主要解决了两大问题:
大数据存储和大数据分析。这两个问题的解决分布依赖HDFS和MapReduce。
在这里插入图片描述

  • HDFS

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值