学习大数据需要的基础

本文深入讲解了大数据领域的核心技能,包括JavaSE、MySQL、Linux等基础,以及Hadoop、Spark、Flink等主流框架。覆盖大数据离线分析、实时分析及机器学习三大方向,为学习者提供了全面的技术路线图。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

学习大数据需要的基础
Java SE:
大数据技术框架中90%都是用Java语言写的。
MySQL:
SQL
Linux:
大数据技术框架都是部署在Linux系统上
从拉钩招聘网中看需求
语言:Java、Python、Scala
系统:Linux
框架:Hadoop、Storm、Spark、Flink、HBase、Hive、Impala、ElasticSearch、Kafka、Flume、Scribe、mahout、ElasticSearch、mysql、mongodb、redis、Zookeeper、sqoop
需要学习什么
第一方面:大数据离线分析
Hadoop 2.x(Common、HDFS、MapReduce、Yarn):存储、分析
环境搭建
处理数据思想
Hive(数据库仓库):分析
通过SQL语句对数据进行操作,SQL和MySQL的SQL基本一样
协作框架:
Sqoop:桥梁(HDFS <–> RDBMS )
Flume:通过flume采集数据
调度框架azkaban:
Crontab(Linux自带)
Zookeeper:
分布式应用程序协调服务
HBASE数据库:
NOSQL数据库
redis
扩展前沿框架
Impala
游戏公司用的多,耗内存
用来做数据分析
ElasticSearch(ES)
检索的框架
相当于数据库,即可存储数据库,也可以检索数据
第二方面:大数据实时分析
Scala:OOP+FP
Spark Core、SQL、Streaming
Kafka:消息队列
前沿框架:Flink
第三方面:机器学习
Spark MLib
环境搭建
配置虚拟机
确保虚拟机的网段59,修改vMnet8适配器网段地址192.168.59.0
虚拟机配置约束规定
普通用户:xxx
主机名:xxx

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值