2020年阿里大数据一面面经,看看你还有啥不知道的？

文宇肃然

于 2020-10-26 10:23:55 发布

阅读量1k

点赞数

CC 4.0 BY-SA版权

分类专栏：大厂面经及leetcode解题思路详细讲解

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wenyusuran/article/details/109284654

大厂面经及leetcode解题思路详细讲解专栏收录该内容

36 篇文章 ¥19.90 ¥99.00

订阅专栏

本文介绍了阿里大数据面试中常见的问题，涵盖了PV和UV的计算、流处理框架的区别、Spark调度执行逻辑、HashMap源码、一致性协议算法（2PC、3PC、Paxos）以及一致性哈希算法。此外，还讨论了布隆过滤器、Java内存可见性（volatile和synchronized的区别）、阻塞队列（ArrayBlockingQueue和LinkedBlockingQueue）等技术要点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、PV和UV是怎么计算的，UV怎么进行去重的？不用ES该如何实现去重？

思路：首先要理解PV、UV的基本概念。去重分两种，一种是基本的数据结构(Hashset等)，另外一种是借助框架去实现(bigmap、hyperloglog等)。

二、说说 flink,spark streaming,storm 的区别？

三、讲一讲spark的调度执行逻辑，stage，宽依赖和窄依赖，容错机制？

这部分由于内容太多，只提供部分重点答案。

1.调度执行逻辑：

spark shuffle：因为具有某种共同的特征的一类数据需要最终汇聚（aggregate）到一个计

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

文宇肃然 精神和物质鼓励你选一个吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。