
分布式系统相关
文章平均质量分 79
我和ye猫子
这个作者很懒,什么都没留下…
展开
-
ZooKeeper和Diamond有什么不同
Diamond的数据存储以mysql数据库为中心,所有在mysql中的数据都是最新的,客户端的所有写请求,都会首先写入数据库,同时会dump数据到Server的本地文件中,所有读请求都是直接走这个静态文件。在ZooKeeper中,则是通过客户端对相应的数据path注册Watcher,当数据有更新的时候,服务器会有事件通知,注意,这个通知仅仅是告诉客户端对应的数据有更新了,具体数据内容需要客户端根据自己的情况来决定是否需要获取最新数据。而读服务在所有使用diamond的应用场景中,占到了绝大部分。原创 2024-03-06 20:07:18 · 1191 阅读 · 0 评论 -
大数据处理框架Yarn、MapReduce、spark、storm,flink的关系
YARN并不是下一代 MapReduce (MRv2),下一代 MapReduce 与第一代 MapReduce (MRv1)在编程接口、数据处理引擎(MapTask和ReduceTask)是完全一样的, 可认为 MRv2 重用了 MRv1 的这些模块,不同的是资源管理和作业管理系统, MRv1 中资源管理和作业管理均是由 JobTracker 实现的,集两个功能于一身,而在 MRv2 中,将这两部分分开了, 其中,作业管理由 ApplicationMaster 实现,而资源管理由新增系统 YARN 完成。原创 2021-05-31 11:36:29 · 847 阅读 · 0 评论 -
java代码kafka初始化producer和consumer
序列化kafka序列化消息是在生产端,序列化后,消息才能网络传输。而构造KafkaProducer代码如下:Properties props = new Properties();props.put("bootstrap.servers", "10.0.55.229:9092");props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");props.put("value.seri原创 2021-05-17 03:07:32 · 1606 阅读 · 1 评论 -
kafka概念和面试题总结
https://www.cnblogs.com/programb/p/12906771.htmlkafka中consumer group 是什么概念?同样是逻辑上的概念,是Kafka实现单播和广播两种消息模型的手段。同一个topic的数据,会广播给不同的group;同一个group中的consumer实例,只有一个consumer实例能拿到这个数据。换句话说,对于同一个topic,每个group都可以拿到同样的所有数据,但是数据进入group后只能被其中的一个consumer实例消费。group内的原创 2021-05-16 03:18:05 · 721 阅读 · 3 评论 -
大数据基础---Map/Reduce,Yarn是什么?
转载地址https://www.cnblogs.com/shun7man/p/11576182.html简单概括:Map/Reduce是分布式离线处理的一个框架。 Yarn是Map/Reduce中的一个资源管理器。一.图形说明下Map/Reduce结构: 官方示意图: 另外还可以参考这个:流程介绍:HDFS首先会把块进行逻辑上切片处理,然后进行Map映射。一个切片对应一个Map映射。因为文件内容有可能一个单词被切到两个文件里面,这样计算就会有问题,...转载 2021-04-30 18:56:51 · 231 阅读 · 1 评论 -
在hadoop2.x中的三大核心组件之HDFS和YARN、MapReduce
Hadoop的三大核心组件之HDFS和YARNHadoop集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起。(1)HDFS集群:负责海量数据的存储,集群中的角色主要有NameNode/DataNode/SecondaryNameNode。(2)YARN集群:负责海量数据运算时的资源调度,集群中的角色主要有ResourceManager/NodeManager(3)MapReduce:分布式计算框架(它其实是一个应用程序开发包)。(MapRe...原创 2021-03-11 16:29:58 · 6067 阅读 · 0 评论 -
ZooKeeper概念详解
目录ZooKeeper是什么ZooKeeper 常用的使用场景ZooKeeper是什么官方文档上这么解释zookeeper,它是一个分布式服务框架,是Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。上面的解释有点抽象,简单来说zookeeper=文件系统+监听通知机制。ZooKeeper 是一个典型的分布式数据一致性解决方案,分布式应用程序可以基于 ZooK..原创 2021-05-16 20:48:38 · 247 阅读 · 0 评论