KM_锰-优快云博客

原创 futures time out

注意：这倆，下面的一定要比上面小，不然会报错。

2024-11-27 15:46:20 80

原创处理 error: ‘)‘ excepted but string literal found

在处理特殊格式的数据时像json这样的具有特殊格式的内容时，加s会导致转义字符失效。所以如果有引用的内容，最好还是提出来单独写吧。

2024-11-27 15:43:37 124

我本以为是idea爆炸了，重装后发现冤枉idea了，后来我想远程没有本地有，那么就不让他访问远程了，于是删除了所有lastUpdate和-remote.properties后，重新配置了sdk,它就好了，我知道这不是长久之计，但突然出现的飘红以及编译不了jar包实在搞人心态，希望有大神看到可以指点一二。下班后开始搞，搞到半夜，发现原因。因莫名的原因导致程序在加载本地Maven仓库时优先从远程加载jar,但问题是远程找不到也没有扫描本地的jar包，就这么华丽丽的飘红了，留下了一堆lastUpdate。

2024-11-07 10:29:59 350 2

原创 pg库 cannot delete from table because it does not have a replica identity and publishes deletes

ALTER TABLE table_name REPLICA IDENTITY DEFAULT没用。

2024-04-28 16:34:04 315

原创 es解锁只读模式

put http://xxx.xxx.xxx.xxx:9200/_settings{“index.blocks.read_only_allow_delete”:false}

2024-04-18 21:27:50 218

原创 spark字符串解码成binary数组再转string

val a = “string”val b = DatatypeConverter.parseBase64Binary(a)val str = new String(b,“UTF-8”)

2024-03-26 10:53:22 421

原创 linux查找历史操作语句

快速查找使用该文本的shell语句。

2024-03-25 10:39:56 110

原创 spark中dataframe起别名对join过程的影响

今天之前我认为这里不应该用别名，因为join进程已经结束，两个dataFrame的组合键已经对应完成，新df的schema只有一个seq1。今天实验的时候发现别名会对结果产生影响，就像schema里有两个seq1，对不同的seq1筛选范围不一样。

2024-02-29 10:35:05 298

原创 hive修改压缩格式使可以使用删除语句

【代码】hive修改压缩格式使可以使用删除语句。

2024-02-26 11:20:34 156

原创 scala字符串转日期转数字转字符串不同格式

2024-02-20 18:06:28 140

原创 hive查看表数据大小

会显示字段名，totalSize就是数据库里表数据大小，单位为B，在计算时，要除以1024。

2024-01-31 09:39:45 618

原创 spark解决scala.matchError问题

matchError

2024-01-04 15:00:26 623

原创 postgresql拆分文本

pgsql文本拆分避免多次查询

2024-01-02 16:01:41 600

原创 GaussDB增删改查操作(备忘)

加字段alter table tablename add (column1 types1,column2 types2)改字段alter table tablename alter column columnname type types。改数据update tableName set column1=value1 where column2=value2。删数据delete from …和别的一样，基本用不到。插数据insert into…和别的一样，基本用不到。查数据select * from…

2023-12-29 17:20:51 1242

原创 scala代码连接华为云dws（gaussDB 200）数据库,适用于本地jar包引入maven库（gsjdbc200.jar）

dws gauss200 本地jar引入maven

2023-10-12 18:19:20 1078

原创 java.lang.NoSuchMethodError:scala.Predef$.refArrayOps

scala新旧版本冲突导致找不到方法

2023-07-10 14:10:42 1978

原创我遇到的telnet无法打开主机连接到问题

telnet无法打开主机连接到

2023-03-10 15:00:40 3730

原创 python 字符串转dataframe

字符串转dataframe

2022-06-21 10:29:50 1313

原创 python list循环去重（比对上一行）

pthon list for循环，if...else...循环

2022-06-21 10:15:19 508

原创 python字符串截取多个指定内容，正则匹配

python 截取字符串正则匹配 findAll

2022-06-21 09:59:06 1184

原创紧急创建dataframe（spark版，非穷途陌路不可使用）

当插入少量文本数据进hive，使用load local data inpath …却因各种原因导致无法满足要求时，可以按照我下面的方法手动创建df并赋予字段名，以df插入hive表的方式填充import org.apache.spark.sql.{DataFrame,SparkSession}import ss.implicits._val a :DataFrame = ss.sparkContext.paralllelized(List("ABC,DEF","GHI,JKL",...)).ma...

2022-03-28 14:41:36 1547

原创 dolphinscheduler-2.0.3安装与测试（伪集群模式）

这次是在自己的虚拟机安装的dolphinscheduler2.0.3，为接下来集群模式打下基础。记录在单机集群模式下安装到测试成功的步骤与注意事项,后续有问题会继续修改。官网文档链接：https://dolphinscheduler.apache.org/zh-cn/docs/latest/user_doc/guide/installation/pseudo-cluster.html1.本机jdk与zookeeper版本：jdk:java version "1.8.0_201"zookeerpe

2022-02-23 17:55:32 3030 2

原创 zookeeper-3.6.3安装

zookeeper 安装1、xftp上传zookeeper压缩包并解压cd /opt/softlstar -zxvf apache-zookeeper-3.6.3-bin.tar.gzmv apache-zookeeper-3.6.3-bin soft/zookeeper3632、进入解压好的安装包在conf文件夹下配置环境cd zookeeper363/cd conflscp zoo_sample.cfg zoo.cfgvi zoo.cfg 修改存储数据路径、添加zookee

2022-02-21 17:12:50 1489

原创 dolphinscheduler-2.0.3安装与测试（单机模式）

当前是简易版安装的dolphinschedule试用，所以一切只在standalone模式下使用，不适用于集群模式，或可以当作进行集群模式使用前的参考与奠基。第一步：选用一个虚拟机，装上jdk我用的jdk版本安装包是jdk-8u201-linux-x64.tar.gz按照网上来就行。其次，我本机安装的mysql版本是5.6.1。没有达到安装ds203需求的最低5.7+标准，我自己下载了8.0.16版本mysql-connect-java驱动器。目前尚无影响，后续有影响会进行重装和修改。安装d

2022-02-21 16:41:28 2243 1

原创解决win10安装virtualBox没有host-only设置问题

在创建虚拟机时需要网络适配虚拟环境，就需要在我们的网络服务里添加能够访问虚拟机的虚拟网络如图所示（以太网2）：，这里在安装虚拟机可以在设备管理器中手动添加，打开设备管理器我们的虚拟机无法访问就是缺少了VirtualBox Host-Only Ethernet Adapter，这个设备在我我们安装好虚拟机后就存在于我们的电脑之中。路径是D:\software\VB\drivers\network\netadp6，里面有个inf文件，添加到设备中就行了。添加方法是：1.先点击网络适配器，再点击操作

2022-02-18 17:11:28 8110 1

原创 win10环境安装jdk1.8，解决javac无法运行问题

win10电脑安装jdk

2022-02-15 14:45:58 4455 4

原创统计踩坑日记（六）

leftsemi join 与 join的区别：left join 表示 " outer join " 中的左连接leftsemi join 和 left join 很像，在真实使用中也和left join 有很多相似之处leftsemi join ：左半开连接会返回左边表的记录，前提是其记录对于右边表满足 on 语句中的判定条件。大多数sql语言会使用 in...exits 结构来处理这种情况。leftsemi join 是一种存在于hive中的SQL语法，在MySQL中无法使用，所以想要尝

2020-10-14 17:55:55 144

原创统计踩坑日记（五）

统计踩坑日记（五）技术的熟练度来自于日复一日的坚持技术的提升来自于高熟练度以及偶然的灵光加油！遇到事情不能坐以待毙filter的n种写法：filter(expr("colname = '15'"))filter("COLNAME = 1")filter("A >= 1 AND B >=2 AND C>=3")filter(expr("(colname1 = '01' or colname1 = '02' or colname1 = '05') and colname2

2020-09-27 18:32:31 137

原创统计踩坑日记（四）

scala 中val, var, def做写的博客最易懂的博主val 表示不可变变量val s = 1s = 2 //错误 s不可以被重复赋值var表示可变变量var s = 1s = 2 //正确def表示定义了一个方法def s = 1def df(a:Int,b:Int)从功能上看，def 的功能更加自由val和var都是创建对象，每次使用都会创建一个实例对象，后续所有对这个实例的操作都是基于这一个实例，除非新建对象取代实例对象的功能。def拥有val的功能，但每一

2020-09-23 16:29:05 109

原创统计踩坑日记（三）

统计踩坑日记（三）细心决定一切程序员的下班时间是由他对当前手里项目有没有想法决定的，上周对三张表进行统计工作，就被细节问题折磨的欲仙欲死1.写代码的时候可以随心所欲点，但涉及到指标的生成、统计时就需要严阵以待。每个指标都建议大写，因为不是每个数据库都不区分大小写，比如kudu，他就不支持小写字母来对应指标名，所以一开始就养成指标名大写的习惯总是不会错的。如果不是在这上面耽误了几百分钟，我也不会在意。2.每条代码都事先写好所有的指标名的集合，可以省下繁复的drop(“column_name”)工作，

2020-09-21 18:12:56 140

基于改善初始种群的免疫遗传算法优化问题JSP问题

空空如也