
Hadoop
文章平均质量分 90
努力Study的小陈
勇敢的人先享受世界
展开
-
Hadood之MapReduce的介绍及简单例子
1. 到底什么是Mapper与Reducer2. 为什么要用MapReduce而不是普通的代码3. 常见的MapReduce任务示例3.1 简单的单词计数任务3.1.1 自动排序功能~~~~~~~首先给出定义:Mapper与Reducer是MapReduce编程模型的两个核心组件,用于处理大规模数据集的并行计算。Mapper(映射器):Mapper的主要任务是将输入数据分割成较小的数据块,并为每个数据块生成键值对。原创 2023-06-08 18:59:00 · 630 阅读 · 0 评论 -
大数据技术(Big Date)介绍
大数据技术是指一系列用于处理大规模数据集合的技术和工具,包括数据采集、存储、处理、分析、可视化等方面的技术。大数据技术主要应用于以下几个方面:数据采集:通过各种方式收集大量的数据,包括传感器、社交媒体、物联网设备、移动应用程序、传统企业系统等。数据存储:存储大量的数据,包括传统的关系型数据库、分布式文件系统、列式存储数据库、NoSQL 数据库等。数据处理:对大数据进行加工、清洗、过滤、转换等操作,以便于后续分析和使用。常用的技术包括MapReduce、Hadoop、Spark等。原创 2023-05-08 14:31:28 · 1909 阅读 · 0 评论 -
HDFS 原理及操作
HDFS(Hadoop Distributed File System)是一个分布式文件系统。它具有高容错性并提供了高吞吐量的数据访问,非常适合大规模数据集上的应用,它提供了一个高度容错性和高吞吐量的海量数据存储解决方案。高吞吐量访问备份并行高容错性多份复制并且分布到物理位置的不同服务器上连续自检数据一致性功能线性扩展不停止服务的情况下做扩充。原创 2023-05-08 09:47:00 · 468 阅读 · 0 评论