
大数据
文章平均质量分 85
大数据相关
木鬼与槐
(小白一枚)努力努力再努力,加油加油再加油
展开
-
Sqoop基础入门
sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。导入数据:MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统;导出数据:从Hadoop的HDFS、HIVE中导出数据到关系数据库mysql等。原创 2024-10-21 17:39:09 · 961 阅读 · 0 评论 -
虚拟机的安装-详细教程
虚拟机详细安装教程,含有虚拟机安装包和镜像安装包原创 2024-09-04 19:50:35 · 767 阅读 · 0 评论 -
hadoop生态圈(四)- MapReduce
MapReduce解决的是海量数据计算。MapReduce的思想核心是“分而治之”。就是把一个复杂的问题按一定的“分解”方法分为规模较小的若干部分,然后逐个解决,分别找出各部分的解,再把把各部分的解组成整个问题的解。Map负责“分”,Reduce负责“合”。MapReduce处理的数据类型是键值对。原创 2024-08-28 20:05:56 · 1113 阅读 · 0 评论 -
Hadoop生态圈(三)- HDFS(分布式文件系统)
NameNode负责管理整个文件系统元数据;DataNode负责管理具体文件数据块存储;Secondary NameNode协助NameNode进行元数据的备份。HDFS即是一个文件系统又是分布式。主从架构(一个namenode和多个datanode),Namenode是HDFS集群主节点,Datanode是HDFS集群从节点,两种角色各司其职,共同协调完成分布式的文件存储服务。原创 2024-08-28 15:25:18 · 1108 阅读 · 0 评论 -
大数据5v特性、集群、分布式
分布式:多台服务器干不同的模块任务,组成一个统一的整体功能;集群:一台服务器处理请求个数有限,提供服务能力有限,准备多台服务器干同样的的任务。原创 2024-08-27 21:11:09 · 1216 阅读 · 0 评论