2020年阿里大数据一面面经,看看你还有啥不知道的?

本文介绍了阿里大数据面试中常见的问题,涵盖了PV和UV的计算、流处理框架的区别、Spark调度执行逻辑、HashMap源码、一致性协议算法(2PC、3PC、Paxos)以及一致性哈希算法。此外,还讨论了布隆过滤器、Java内存可见性(volatile和synchronized的区别)、阻塞队列(ArrayBlockingQueue和LinkedBlockingQueue)等技术要点。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、PV和UV是怎么计算的,UV怎么进行去重的?不用ES该如何实现去重?

 

思路:首先要理解PV、UV的基本概念。去重分两种,一种是基本的数据结构(Hashset等),另外一种是借助框架去实现(bigmap、hyperloglog等)。

 

 

二、说说 flink,spark streaming,storm 的区别?

 

 

 

三、讲一讲spark的调度执行逻辑,stage,宽依赖和窄依赖,容错机制 ?

这部分由于内容太多,只提供部分重点答案。

 

1.调度执行逻辑: 

 

spark shuffle:因为具有某种共同的特征的一类数据需要最终汇聚 (aggregate)到一个计

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

文宇肃然

精神和物质鼓励你选一个吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值