大数据基础学习路线

最新推荐文章于 2024-09-11 15:32:41 发布

～citrus～

最新推荐文章于 2024-09-11 15:32:41 发布

阅读量1.9k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_43699254/article/details/101119768

大数据专栏收录该内容

1 篇文章

订阅专栏

本文详细介绍了大数据学习的完整路线，从Java基础和Linux操作开始，深入探讨了Hadoop、Spark、NoSQL数据库等核心技术和工具，涵盖了分布式存储、计算、数据分析、实时计算等多个方面。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大数据学习路线

大数据的本质
Java和大数据的关系
学习大数据需要的基础和路线

大数据的本质

(1)数据的存储：分布式文件系统（分布式存储）
(2)数据的计算：分布式计算

Java和大数据的关系

Hadoop:基于java语言开发
Spark：基于Scala语言，Scala基于Java语言

学习大数据需要的基础和路线

java基础（javaSE) —— 类，继承，I/O，反射，泛型…
Linux基础（Linux操作）—— 创建文件，目录，vi编辑器

学习路线：

java基础和Linux基础
Hapdoop学习：体系结构，运行机制，原理，编程

第一阶段：

HDFS,MapReduce，HBase（NoSQL数据库）

第二阶段：

数据分析引擎 —— Hive，Pig
数据采集引擎 —— Sqoop，Flume

第三阶段：

         HUE：Web管理工具
         ZooKeeper：实现Hadoop的HA
         Oozie：工作流引擎

Spark的学习

第一阶段：

Scale编程语言

第二阶段：

Spark Core —— 基于内存，数据的计算

第三阶段：

Spark SQL —— 类似Oracle中的SQL语句

第四阶段：

Spark Streaming —— 实时计算(流式计算)

Apache Storm的学习

类似于Spark Streaming —— 实时计算（流式计算）
NoSQL:Redis基于内存的数据库

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。