
hadoop
村头陶员外
B站,小红书,抖音等平台搜索 “Forrest的数据科学站”
展开
-
Hadoop-->Flume原理与应用
从这篇博文开始,将介绍hadoop相关内容,下图的hadoop的六层架构,对于每一个架构组件都有专门一篇博文来进行分析总结,并且会附上关键的配置步骤和实战代码。本篇博文主要分析总结数据采集系统Flume的原理以及其应用。 Flume主要应用与对非结构化数据(如日志)的收集。分布式、可靠、高可用的海量日志采集系统;数据源可定制,可扩展;数据存储系统可定制,可扩展。中间件:屏蔽了数据源和数据存储原创 2017-07-15 15:56:43 · 790 阅读 · 0 评论 -
Hadoop-->HDFS原理总结
本篇博文主要讲讲HDFS的一些基础性的原理以及应用。 HDFS:Hadoop Distributed File SystemHDFS概述HDFS 优点:高容错性数据自动保存多个副本(不同的副本放在不同的节点上)副本丢失后,自动恢复适合批处理移动计算而非数据数据位置暴露给计算框架适合大数据处理GB、TB、甚至PB级数据百万规模以上的文件数量10K+节点规模流式文件访问一次性写入原创 2017-07-17 20:26:04 · 3474 阅读 · 0 评论