自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_41940415的博客

原创 Spark Shuffle 原理

优点：快-不需要排序，也不需要维持hash表不需要额外空间用作排序不需要额外IO-数据写入磁盘只需一次，读取也只需一次缺点：当partitions大时，输出大量的文件（cores * R）,性能开始降低大量的文件写入，使文件系统开始变为随机写，性能比顺序写要降低100倍缓存空间占用比较大。

2023-05-06 23:01:23 301

原创 Spark RDD的基本概念

RDD的全称为Resilient Distributed Dataset，是⼀个弹性、可复原的分布式数据集，是Spark中最基本的抽象，是⼀个不可变的、有多个分区的、可以并⾏计算的集合。RDD中并不装真正要计算的数据，⽽装的是描述信息，描述以后从哪⾥读取数据，调⽤了⽤什么⽅法，传⼊了什么函数，以及依赖关系等。所以，RDD本质更像是Scala中的迭代器。

2023-04-18 16:25:54 1091 1

原创 Flink基于Zookeeper、Curator的高可用原理1

本篇是基于Flink1.16对老版本(Flink1.12以下)高可用原理、以Standalone模式下的WebMonitorEndpoint为例的一篇更新本篇聚焦于Zookeeper的高可用原理。

2023-04-06 22:00:25 560 2

原创 Flink基于Zookeeper、Curator的高可用原理2

本篇原理是对老板的Flink高可用原理的一片更新。

2023-04-04 16:48:52 768 2

原创 Analyzing Airbnb data for Boston and Seattle

Analyzing Airbnb data for Boston and SeattleAnalyzing Airbnb data for Boston and Seattle1. Business understanding2. Data understanding2.1 Load the data2.2 Preview the data3. Data preperation3.1 Merge ...

2019-10-16 03:18:29 1121

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

我不需要这个昵称

博客等级

码龄8年

5
原创

8
点赞

5
收藏

3
粉丝

关注

私信

热门文章

分类专栏

最新评论

Flink基于Zookeeper、Curator的高可用原理2
优快云-Ada助手: 非常感谢您的分享，这篇博客对于Flink高可用原理的解析非常详尽，让我获益匪浅。希望您可以继续分享您的经验和知识，让更多的人受益。另外，与Flink高可用相关的扩展知识和技能还包括分布式系统的设计和实现、容错机制的研究和应用等，希望您在以后的文章中也能够涉及这些方面的内容。期待您的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
Spark RDD的基本概念
优快云-Ada助手: 恭喜您写出了这篇关于Spark RDD基本概念的博客，对于初学者来说，这篇文章非常有价值。您的解释非常清晰，让人容易理解Spark RDD的概念。希望您能继续写出更多关于Spark的博客，并且可以涉及一些实际案例以及最佳实践，让读者更好地了解如何在实际项目中应用Spark。期待您的下一篇博客！优快云会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
Flink基于Zookeeper、Curator的高可用原理1
优快云-Ada助手: 恭喜您写了第三篇博客，这篇关于Flink基于Zookeeper、Curator的高可用原理的文章十分有价值。我希望您能继续保持创作的热情，分享更多关于大数据技术的知识和经验。下一步可以考虑写一些实践经验，让读者更好地了解如何在实际应用中使用这些技术。再次感谢您的分享。优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=ada，我们会奖励持续创作和学习的博主，请看：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148
Flink基于Zookeeper、Curator的高可用原理2
笑起来贼好看: 从此篇文章学到了flink 的高可用原理，利用zk 的零时节点单一持有能力，赞赞

提示

确定要删除当前文章？

取消删除