自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 数仓开发那些事(11)

YARN资源优化

2025-03-27 14:50:30 538

原创 数仓开发那些事(10)

Flink写入Iceberg一定要开ck、FlinkSql实现需求:路口通行侦测

2025-03-19 19:11:56 881 1

原创 Flink读取Kafka数据写入IceBerg(HiveCatalog)

java8 + hive3 + iceberg0.13.2 + Kafka3 写入老版本的iceberg和新版本的实现方式不太一样,ai生成的正确率堪忧

2025-03-18 19:34:41 382

原创 JAVA8-全国省市区行政区域编码获取

获取全国省市区编码

2025-02-27 15:25:58 225

原创 FlinkSql使用中rank/dense_rank函数报错空指针

flinksql空指针报错且没有报错信息无法排查的bug

2025-01-23 16:45:28 946

原创 数仓开发那些事(9)

数仓任务优化

2024-12-24 16:39:26 453

原创 数仓开发那些事(8)

Flink生产优化实战,大维表join

2024-12-23 14:02:36 336

原创 数仓开发那些事_番外(2)

一闪第一次当面试官

2024-12-17 17:32:58 903 1

原创 数仓开发那些事_番外

数仓开发那些事_番外FLINK SQL遇到的问题

2024-06-17 10:39:52 454 2

原创 SQL新老系统表数据合并

面对新老系统表数据合并问题时的处理方式

2023-03-14 17:48:05 613 1

原创 Java实现阴历日历表(附带星座)

JAVA生成阴历,附带星座字段

2023-02-24 16:46:29 1087

原创 数仓开发那些事(6)

实时数仓框架选型

2021-12-17 11:51:10 124

原创 数仓开发那些事(5)

数仓开发那些事(5)

2021-12-13 18:53:11 1631 1

原创 数仓开发那些事(4)

实时中遇到的那些事(Spark.Flink)

2021-12-11 16:25:58 1704 1

原创 数仓开发遇到的那些事(3)

数仓开发那些事(3)

2021-12-10 15:37:08 2199 3

原创 数仓开发遇到的那些事(2)

数仓开发遇到的那些事(2)

2021-12-09 12:57:32 770 3

原创 数仓开发遇到的那些事(1)

大数据数仓开发遇到的那些事

2021-12-08 12:49:44 973 1

原创 Flink实时数仓订单宽表设计思路及优化

Flink数仓建设有感

2021-12-05 00:22:31 1327 2

原创 Flink多并行度下WaterMark的设计区别

watermark在多并行度情况下的设置

2021-12-01 23:06:57 2156 1

原创 JDBC工具类(适用于Mysql.Hive.Phoenix等)

JDBC工具类,通用性强,内含命名格式转换方法

2021-11-28 17:17:29 1944 1

原创 Flink 事件时间EventTime及水印WaterMark

WaterMark的概念.书写.原理.场景

2021-11-21 20:55:04 2235 2

原创 Redis缓存穿透、缓存击穿、缓存雪崩问题

Redis缓存穿透、缓存击穿、缓存雪崩问题概念与简单处理

2021-11-18 15:25:45 761 3

原创 Flink Table API 与 Flink SQL 实现Kafka To Kafka 版本1.12

Flink Table API实现Kafka2Kafka按需可以成为实时数仓的组成部分

2021-11-18 10:57:37 2900 3

原创 Flink-Barrier理解与checkpoint检查点制作过程(图解)

理解Barrier面向官网,发现看不懂,那咱就画图

2021-11-16 08:22:30 7148 7

原创 IDEA控制台输出中文乱码解决 版本:2021.1

在网上踩了不少的坑,重启了IDEA三四次,现在写个完整版1.依次点击2.依次点击,把图中③④⑤处全部修改为UTF-83.依次点击①②,在里面都加上一行-Dfile.encoding=UTF-84.

2021-11-12 18:35:32 14952 8

原创 MapReduce全过程参数优化

最近花了点时间整理了一下,涵盖了全流程常见实用的调优参数.希望能有帮助1)Map阶段(1) 增大环形缓冲区大小(默认100M,可以提高到200M)mapreduce.take.io.sort.mb(2)增大环形缓冲区溢写的比例(默认80%,可以提高到90%)mapreduce.map.sort.spill.percent(3)减少对溢写文件的merge次数(默认10个文件,可以增大到20)mapreduce.task.io.sort.factor(4)不影响实际业务

2021-11-04 19:45:39 554

原创 Hbase工具类 V2.0.5

提供了1.创建链接2.创建命名空间3.判断表存在与否4.创建表5.修改表6.删除表7.插入数据8.查询数据9.扫描数据10.删除数据Maven添加如下依赖<dependencies> <dependency> <groupId>org.apache.hbase</groupId> <artifactId>h...

2021-10-29 20:16:40 1232 1

原创 电商离线数仓全流程思路整理

电商离线数仓设计思路加油加油私我可以要PDF或者Visio版 哪里不好的欢迎指正蛤!!!...

2021-10-22 19:31:11 113 1

原创 业务数据采集_零点漂移处理方法(Flume+Kafka+HDFS)

零点漂移

2021-10-02 07:53:44 3761 2

原创 python中使用正则表达式去除制表符\t,换行符\n

在网上踩了很多的雷,发现并没有能解决问题的办法首先 'r’一定不能忘,很多情况下都是没加r导致没有效果re.split()在PyCharm中这里就用字符串a为例:a='\\t\\n\\t\\t\\n\\n\\t'print(a)# output: \t\n\t\t\n\n\t如果需要清除多个字符,在参数内用’|'分割最后使用join进行连接,可以完美的清除制表符和换行符a='\\t\\n清除成功\\t\\t\\n\\n\\t'import rea1=re.split(r'\\t|\

2021-05-18 11:35:07 10962 1

原创 PYTHON实战:从百度资讯爬取信息作为正文,巨潮资讯网爬取有关PDF作为附件,自动发送邮件(Mysql做存储)

小小的前言:鄙人在学习过程中写的小实践.效率不高.大佬勿喷.其中的强制等待严重影响运行速度.建议使用隐式或者显示等待用Pyqt5画了个简单的GUI(xwin.ui)然后通过pyuic -o xwin.py xwin.ui 就可以转为py文件了然后通过按钮触发druging函数.因为我不会使用按钮传参数.所以def了一个中介函数哈哈哈哈哈哈.勿喷.看到代码就懂了其中try except异常处理是我对很多情况进行尝试后得出的设计.因为百度和巨潮对我这个实战不是特别友好.哈哈哈哈哈哈哈.下次设

2021-04-19 14:56:40 1673 3

全国行政区划编码 省市区 仅供学习使用 - 免费!!!

如有最新需求,可以访问高德官网申请apikey,个人是有免费额度的

2025-02-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除