
大数据
文章平均质量分 59
小小小小小小小小小小码农
这个作者很懒,什么都没留下…
展开
-
springboot整合clickhouse
springboot查询clickhouse原创 2023-02-10 11:18:47 · 1287 阅读 · 0 评论 -
spark任务连接mysql
mysql 连接:首先确认mysql的版本:执行查询语句select version();maven中配置mysql连接: <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>8.0.21</v原创 2021-12-13 15:48:42 · 2186 阅读 · 0 评论 -
hive 常用sql语句整理
常用hive语句,以及一些简单的函数使用方法原创 2021-09-08 12:01:11 · 9355 阅读 · 0 评论 -
spark 任务调优参数及问题整理
1.数据倾斜:最简单的做法:在sql中使用随机数distribute by rand()在sql 末尾加select * from a left join b on a.xx=b.xx distribute by rand()2.spark.dynamicAllocation.enabled=true开启动态资源分配3.提高并行度spark.sql.shuffle.partitions=1000 ,调整stage的并行度,也就是每个stage的task个数,默认值...原创 2021-09-01 14:54:51 · 2264 阅读 · 0 评论