- 博客(4)
- 收藏
- 关注
原创 大数据职业技能大赛样题(综合分析-02)
通过 min.insync.replicas 设置,在写入视为成功前,必须有指定数量的副本同步数据。增加副本数( replication.factor ),以便在某些副本失败时仍保留数据。合理配置生产者的 retry 和 timeout 设置,以便在遇到问题时进行重试。配置生产者的确认机制( acks ),以确保数据被多个副本确认后才视为成功写入。这些类型表示计算任务相对于数据存储位置的近程度,以减少数据传输开销。数据在同一节点的不同进程中。数据在同一机架的不同节点上。数据在集群的任何地方。
2024-01-28 22:46:49
881
1
原创 大数据职业技能大赛样题(综合分析-01)
以队列为基础,各队列拥有⼀定的容量。适合多租户环境,确保资源按需分配。先进先出策略,按作业提交的顺序进⾏处理。简单但不适⽤于共享集群。确保所有作业公平地获得资源。动态调整,以满⾜不同作业的资源需求。在指定时间内允许的最大失败次数。设定固定次数和延迟时间。(指定时间间隔内的最大失败次数)、
2024-01-25 01:35:26
816
原创 大数据职业技能大赛样题(数据采集与实时计算:使用Flink处理Kafka中的数据)
另外对于数据结果展示时,不要采用例如:1.9786518E7的科学计数法)。
2024-01-25 01:19:27
2254
3
原创 大数据职业技能大赛样题(数据采集:Flume多路复用存入Kafka+HDFS)
三台服务器都配置,其中broker.id、advertised.listeners参数不一样,其它配置都一样$ZOOKEEPER/conf目录下,三台服务器的zoo.cfg配置文件都一样。
2024-01-23 21:48:13
1314
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅