
大数据
Y734493585
这个作者很懒,什么都没留下…
展开
-
大数据入门
大数据通过分布式解决的两个问题: 大量数据的存储 大量数据的计算 学习基础 java SE linux基础 学习路线( 两个重要框架) 一、hadoop 第一阶段 HDFS(分布式文件系统)——解决大量数据的存储的问题 MapReduce(java程序)——解决大量数据的计算的问题 HBase(NoSQL数据库) 第二阶段 Hive/pig(数据分析引擎) Sqoop(离线)/Flu...翻译 2019-07-01 11:24:58 · 177 阅读 · 0 评论 -
hadoop
Hadoop hdfs: 基于gfs, 解决硬盘不够用和安全性问题.2. 冗余度为三份. 特点: 水平复制,解决效率问题. 以数据块形式存在,(hadoop 1.x版本64兆。hadoop 2.x版本,128兆)。 hadoop安装模式: 本地模式:需要一台主机. 伪分布式模式:需要一台主机. 全分布模式:需要三台主机. MapReduce. 解决大量数据的计算问题。 特点:分布式,拆大为小...原创 2019-07-22 14:37:17 · 237 阅读 · 0 评论