自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_42828748的博客

原创 Spark3.x 程序性能优化手段

如果想要让任务运行的最快当然是一个 task 对应一个 vcore,但是一般不会这样设置，为了合理利用资源，一般会将并行度（task 数）设置成并发度（vcore 数）的 2 倍到 3 倍。每台机器的最大executor数是7个那么,每个executor的内存executor-memory是100/7 = 14g；executor-cores 每个 executor 的最大核数。每个executor 的executor-cores 按4算(3~6 之间),（2）executor-memory 估算。

2024-03-19 17:11:00 250

原创数据仓库架构演变

实时链路的计算结果起到一个参考的作用，实时部分的需求较少；(3) 实时部分kafka中的数据不能永久存储，这部分数据有时效性，BI分析不方便；如果实时计算需求较多，可以选择这种架构，不过实时计算结果的准确率依旧比不上离线部分，(2) 实时部分kafka中的数据不能永久存储，这部分数据有时效性，BI分析不方便；后期维护管理不方便。(1) 对于计算结果来说，数据延迟高，不能满足实时计算的需求；(1) 在传统离线需求的基础上，满足了少量实时计算的需求。(1) 在传统离线需求的基础上，满足了大量实时计算的需求。

2024-03-15 16:25:37 407 1

原创 Spark-Hdp Ambari集成Hive配置

AmbariHdpHiveSparkHdp、Spark、Hive 在安装OK后 1. Hive各层的库要建好 Hive各层要建好后，才会在Hdfs生成相关各层的目录，后面配置Spark访问Hive的目录，要保证这个目录存在包装xx/managed/hive目录存在 1.修改spark配置： Advanced spark2-defaults spark.sql.warehouse.dir 值/apps/spark/warehouse 改为hive数据存储hdfs位置：/us

2023-04-26 08:52:13 773

原创 Spark-使用Dbeaver工具连接spark使用sparkSql

1.创建SparkThirdService想使用Dbeaver工具连接spark使用sparkSql访问Hive表，就要用到一个东西这东西就类似java jdbc连接，连接hive的hiveService2这种东西；下面的列子是Hdp，并且Hdp带的Spark和Hive已经配置好了集成;1.创建SparkThirdService通过如下命令创建一个SparkThirdService, 类似于HiveService2 , JDBC, 最后效果就是创建了一个Spark应用程序；

2023-04-24 16:41:24 1710 4

原创 Hive-表DML操作

【代码】Hive-表DML操作。

2023-04-24 16:16:50 138 2

原创 Hive-tez合并小文件

Hive-tez合并小文件

2023-04-24 15:51:36 739 2

原创 hive-表对应hdsf文件数量，可用于查hdfs小文件数量的

hive表对应hdsf文件数量

2023-04-24 09:46:45 1140 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

XPZ_kkkk 优快云认证博客专家优快云认证企业博客

码龄7年

IP 属地：宁夏

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

7: 原创

178万+: 周排名

205万+: 总排名

5175: 访问

: 等级

86: 积分

8: 粉丝

15: 获赞

8: 评论

18: 收藏

私信

关注

热门文章

最新评论

数据仓库架构演变
优快云-Ada助手: 恭喜用户发布了新的博客《数据仓库架构演变》，内容相当精彩！对数据仓库架构的探讨让人受益匪浅。希望您能继续保持创作的热情和耐心，探索更多有趣的主题。或许下一步可以深入研究数据仓库的应用案例，或者探讨数据仓库和大数据技术的结合，期待您的更多精彩文章！愿您在创作的道路上不断进步，共同成长！
Spark-使用Dbeaver工具连接spark使用sparkSql
XPZ_kkkk: Dbeaver 选择spark类型，测试连接自动下载jar驱动包
Spark-使用Dbeaver工具连接spark使用sparkSql
SmartManWind: 请问连接时用的jdbc包都有哪些？
Spark-使用Dbeaver工具连接spark使用sparkSql
优快云-Ada助手: 恭喜您写了这么一篇实用的博客，介绍了如何使用Dbeaver工具连接spark使用sparkSql，对于学习spark的人来说，这篇博客是非常有用的。接下来，建议您可以继续深入研究spark相关的技术，例如Spark Streaming、Spark MLlib等，也可以分享一些实践经验，让更多的人了解到spark的优势和应用场景。期待您的下一篇博客！优快云会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
Spark-使用Dbeaver工具连接spark使用sparkSql
优快云-Ada助手: 恭喜您撰写了这篇关于Spark使用Dbeaver工具连接spark使用sparkSql的博客！您的文章内容非常详细，让读者能够轻松地掌握这个主题。感谢您分享您的经验和知识，使更多的读者受益。在您的下一篇博客中，建议您可以深入探讨如何使用Spark进行数据分析和处理。这个主题是非常有趣和重要的，读者也会对此感兴趣。期待您的下一篇作品！优快云会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

最新文章

提示

确定要删除当前文章？

取消删除