徐一闪_BigData-优快云博客

最近花了点时间整理了一下,涵盖了全流程常见实用的调优参数.希望能有帮助1)Map阶段(1) 增大环形缓冲区大小(默认100M,可以提高到200M)mapreduce.take.io.sort.mb(2)增大环形缓冲区溢写的比例(默认80%,可以提高到90%)mapreduce.map.sort.spill.percent(3)减少对溢写文件的merge次数(默认10个文件,可以增大到20)mapreduce.task.io.sort.factor(4)不影响实际业务

2021-11-04 19:45:39 554

原创 Hbase工具类 V2.0.5

提供了1.创建链接2.创建命名空间3.判断表存在与否4.创建表5.修改表6.删除表7.插入数据8.查询数据9.扫描数据10.删除数据Maven添加如下依赖<dependencies> <dependency> <groupId>org.apache.hbase</groupId> <artifactId>h...

2021-10-29 20:16:40 1232 1

原创电商离线数仓全流程思路整理

电商离线数仓设计思路加油加油私我可以要PDF或者Visio版哪里不好的欢迎指正蛤!!!...

2021-10-22 19:31:11 113 1

原创业务数据采集_零点漂移处理方法(Flume+Kafka+HDFS)

零点漂移

2021-10-02 07:53:44 3761 2

原创 python中使用正则表达式去除制表符\t,换行符\n

在网上踩了很多的雷,发现并没有能解决问题的办法首先 'r’一定不能忘,很多情况下都是没加r导致没有效果re.split()在PyCharm中这里就用字符串a为例:a='\\t\\n\\t\\t\\n\\n\\t'print(a)# output: \t\n\t\t\n\n\t如果需要清除多个字符,在参数内用’|'分割最后使用join进行连接,可以完美的清除制表符和换行符a='\\t\\n清除成功\\t\\t\\n\\n\\t'import rea1=re.split(r'\\t|\

2021-05-18 11:35:07 10962 1

原创 PYTHON实战:从百度资讯爬取信息作为正文,巨潮资讯网爬取有关PDF作为附件,自动发送邮件(Mysql做存储)

小小的前言:鄙人在学习过程中写的小实践.效率不高.大佬勿喷.其中的强制等待严重影响运行速度.建议使用隐式或者显示等待用Pyqt5画了个简单的GUI(xwin.ui)然后通过pyuic -o xwin.py xwin.ui 就可以转为py文件了然后通过按钮触发druging函数.因为我不会使用按钮传参数.所以def了一个中介函数哈哈哈哈哈哈.勿喷.看到代码就懂了其中try except异常处理是我对很多情况进行尝试后得出的设计.因为百度和巨潮对我这个实战不是特别友好.哈哈哈哈哈哈哈.下次设

2021-04-19 14:56:40 1673 3

狗不理的博客

原创数仓开发那些事（11）

原创数仓开发那些事(10)

原创 Flink读取Kafka数据写入IceBerg（HiveCatalog）

原创 JAVA8-全国省市区行政区域编码获取

原创 FlinkSql使用中rank/dense_rank函数报错空指针

原创数仓开发那些事(9)

原创数仓开发那些事（8）

原创数仓开发那些事_番外（2）

原创数仓开发那些事_番外

原创 SQL新老系统表数据合并

原创 Java实现阴历日历表（附带星座）

原创数仓开发那些事(6)

原创数仓开发那些事(5)

原创数仓开发那些事(4)

原创数仓开发遇到的那些事(3)

原创数仓开发遇到的那些事(2)

原创数仓开发遇到的那些事(1)

原创 Flink实时数仓订单宽表设计思路及优化

原创 Flink多并行度下WaterMark的设计区别

原创 JDBC工具类(适用于Mysql.Hive.Phoenix等)

原创 Flink 事件时间EventTime及水印WaterMark

原创 Redis缓存穿透、缓存击穿、缓存雪崩问题

原创 Flink Table API 与 Flink SQL 实现Kafka To Kafka 版本1.12

原创 Flink-Barrier理解与checkpoint检查点制作过程(图解)

原创 IDEA控制台输出中文乱码解决版本:2021.1

原创 MapReduce全过程参数优化

原创 Hbase工具类 V2.0.5

原创电商离线数仓全流程思路整理

原创业务数据采集_零点漂移处理方法(Flume+Kafka+HDFS)

原创 python中使用正则表达式去除制表符\t,换行符\n

原创 PYTHON实战:从百度资讯爬取信息作为正文,巨潮资讯网爬取有关PDF作为附件,自动发送邮件(Mysql做存储)

全国行政区划编码省市区仅供学习使用 - 免费！！！

空空如也

全国行政区划编码 省市区 仅供学习使用 - 免费！！！

空空如也

全国行政区划编码省市区仅供学习使用 - 免费！！！