自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

m0_48457267的博客

原创 Spark join执行机制

确定Build Table以及Probe Table：这个概念比较重要，Build Table使用join key构建Hash Table，而Probe Table使用join key进行探测，探测成功就可以join在一起。通常情况下，小表会作为Build Table，大表作为Probe Table。此事例中item为Build Table，order为Probe Table；

2024-03-20 10:13:07 2373 1

原创 Spark数据倾斜定位及解决方案

因为自己编写的代码的bug，以及偶然出现的数据异常，也可能会导致内存溢出。此外，倒数第一列显示了每个task处理的数据量，明显可以看到，运行时间特别短的task只需要处理几百KB的数据即可，而运行时间特别长的task需要处理几千KB的数据，处理的数据量差了10倍。：该方案通常无法彻底解决数据倾斜，因为如果出现一些极端情况，比如某个key对应的数据量有100万，那么无论你的task数量增加到多少，这个对应着100万数据的key肯定还是会分配到一个task中去处理，因此注定还是会发生数据倾斜的。

2024-03-19 16:17:31 2579 3

原创 Spark 参数调优

日常spark开发参数调优

2024-03-19 16:15:24 1785 3

README.md

README.md

2023-09-08

config.yaml

config.yaml

2024-07-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

@xiaoxiaoxiaolv

博客等级

码龄6年

3
原创

134
点赞

115
收藏

80
粉丝

关注

私信

热门文章

分类专栏

Spark 3篇

最新评论

Spark数据倾斜定位及解决方案
懂大数据的java研发工程师: hive的数据倾斜和spark的数据倾斜解决方法一样吗我看到一篇文章和你的一摸一样，标题是hive数据倾斜解决方法
Spark数据倾斜定位及解决方案
不会敲代码的小垃圾: 楼主你的图都挂了能更新一下吗谢谢
Spark join执行机制
优快云-Ada助手: 恭喜您发布了关于“Spark join执行机制”的精彩博客！文章内容详实深入，对Spark中join操作的执行机制有了更深入的了解。希望您能继续坚持创作，分享更多关于Spark和大数据处理方面的知识。下一步建议可以探讨一下Spark中的优化策略，或者分享一些实际应用案例，让读者更好地理解和应用相关知识。期待您的更多精彩文章！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Spark 参数调优
优快云-Ada助手: 恭喜您开始博客创作，标题看起来很有深度！对于Spark参数调优这一主题，我想建议您可以结合具体的案例和实践经验，分享更多实用的技巧和经验，让读者能够更好地理解和应用。希望您能够继续坚持创作，不断提升自己的写作水平和分享内容的深度，期待您更多精彩的博客！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Spark数据倾斜定位及解决方案
优快云-Ada助手: 非常感谢您分享这篇关于Spark数据倾斜的博文！数据倾斜在大数据处理中是一个常见且具有挑战性的问题，您提供的定位和解决方案对于解决这个问题非常有帮助。除了您提到的方案之外，您可能还可以尝试使用一些其他技术，比如使用随机前缀或者二次划分等方法来减轻数据倾斜的影响。希望您能继续分享更多关于大数据处理方面的经验和知识，让我们一起探讨如何更好地处理数据倾斜这个难题吧！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

提示

确定要删除当前文章？

取消删除