
大数据组件
杨小吴的算法博客
不定期更新机器学习、大数据、深度学习、AIGC、AGI相关思考、调研、感悟
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
kafka、zookeeper一文看懂
Yarn的重点知识:Yarn相信大家用的比较多,本文的重点不是讲yarn,因为Yarn作为hadoop集群的总统山级别的组件,不是一下子可以完全讲清楚的,暂时简单介绍下面几点:1 ResourceManager 资源管理、协调2 Standby ResourceManager RM的从节点,备用节点3 NodeManager 负责节点上任务的调配...原创 2019-12-06 09:59:22 · 380 阅读 · 0 评论 -
hadoop、hive、spark、hbase综述
hadoop综述1 namenode 一般在master节点上,用来存储文件和目录的所有元数据信息 常见面试问题:"namenode和datanode可以在同一个节点吗?" -- 原理上可以在一个节点,但是这样做有很多弊端,比如datanode是数据的实际执行节点,对资源的占用会影响namenode节点的性能;2 datanode 一般在...原创 2019-12-03 09:39:09 · 533 阅读 · 0 评论