大数据学习路线推荐

小老fu~

已于 2024-03-21 18:35:34 修改

阅读量707

点赞数 10

文章标签：大数据学习数据库 sql hadoop spark 数据仓库

于 2024-03-21 18:04:17 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_52722850/article/details/136915387

版权

文章指导大数据初学者从Java语言基础入手，强调Java的深度学习和实用性，逐步扩展至MySQL、Web开发、JavaWeb数据可视化、Hadoop框架和生态圈技术，涵盖了分布式缓存、实时计算、机器学习等多个阶段，旨在提供完整的学习路线和实战项目经验。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这只是第一天发布的内容，后续有时间都会及时补充！！！对于大数据初学者而言，先学好java比较重要，而且是有就业打算的同学，java学习的深度也应该提升，不能止步于学校所教的java基础部分！！！！大数据要学习的内容很多，Done is better than perfect ！前期很多部分课程内容都是属于基础课部分，需要自己很有执行力的看完。以练带学，希望大家都能快速过完基础进而通过经典项目更加理解大数据的工作方面的需求。需要完整的资源可以私信。也欢迎大家评论、点赞，一起探讨大数据学习！

01、第一阶段 JavaSE

01、java语言基础

任务一：初识计算机和java语言

认为二：变量和数据类型

任务三：运算符

任务四：流程控制语句

任务五：数组以及应用

02、java面向对象编程

任务一：类和对象

任务二：方法和封装

任务三：static关键字和继承

任务四：多态和特殊类

03、java核心类库

任务一：常用类的概述和使用

任务二：String类的概述和使用

任务三：可变字符串类和日期相关类

任务四：集合类库

任务五：异常机制和File类

任务六:IO流

任务七：多线程

任务八：网络编程

任务九：反射机制

02、第二阶段 Java Web数据可视化

01、MYSQL数据库

任务一：Mysqk基础，SQL入门

任务二：Mysql单表、约束和事务

任务三：Mysql夺标、外键和数据库设计

任务四：Mysql索引、存储过程和触发器

任务五：JDBC

任务六：数据库连接池和DBUtils

任务七：XML

任务八：MYSQL高级

02、前端可视化技术

任务一：HTML

任务二：CSS

任务三：JavaScript

任务四：前端进阶之jQuery+Ajax+Vue

任务五：Highcharts+Echarts数据可视化

03、java后端技术

任务一：Tomcat服务器软件

任务二：HTTP协议解析

任务三：Servlet

任务四：Cookie及Session

任务五：Filter过滤器及Listener监视器

任务六：MVC模式及三层架构

任务七：Maven

任务八：MyBaits之Mybatis基本应用

任务九：Mybatis之复杂映射&配置深入

任务十：MyBatis之缓存&延迟加载&注解应用

任务十一：Spring之Spring IOC

任务十二：Spring之Spring AOP

任务十三：Spring之JdbcTemplate&事务&Web集成

任务十四：SpringMVC之SpringMVC入门

任务十五：SpringMVC之SpringMVC进阶

任务十六：SpringMVC之SSM框架整合

任务十七：项目管理工具Maven高级

任务十八：Spring Boot

04、做一个可视化项目

05、Linux服务器

01、Linux及Shell编程

03、第三阶段 Hadoop核心及生态圈技术栈

01、Hadoop框架核心（HDFS、MapReduce、YARN）

任务一：Hadoop简介及Apache Hadoop完全分布式集群搭建

在学习Hadoop过程中，很多教程都是通过一个一个组件的学习，一个一个组件部署在虚拟机平台上，也是比较推荐这样的学习过程，等到熟练度上来以后就可以直接用集成的CDH大数据平台去开启各个服务，安装部署了CDH进而就可以开始自己的第一个离线数仓项目，正式开启大数据之旅。

Hadoop 是一个适合大数据的分布式存储和计算平台。如前所述，狭义上说Hadoop就是一个框架平台，广义上讲Hadoop代表大数据的一个技术生态圈，包括很多其他软件框架

Hadoop生态圈技术栈
Hadoop（HDFS + MapReduce + Yarn）
Hive 数据仓库工具
HBase 海量列式非关系型数据库
Flume 数据采集工具
Sqoop ETL工具
Kafka 高吞吐消息中间件
......