自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(115)
  • 资源 (2)
  • 收藏
  • 关注

原创 记一次spark在docker本地启动报错

本地启动失败异常

2025-06-05 15:50:48 547

原创 记一次运行spark报错

spark和hadoop版本问题

2025-06-04 09:00:43 276

原创 impala中更改公网ip为内网ip

impala多网卡,使用内网ip不使用公网ip修改以及配置和功能解释

2025-06-03 09:58:37 275

原创 pyspark测试样例

data = [(“Alice”, 586240, 177)] # 注意这里逗号使用的是英文逗号。

2025-05-22 15:41:45 140

原创 pyspark测试样例

data = [(“Alice”, 586240, 177)] # 注意这里逗号使用的是英文逗号。

2025-05-19 14:42:45 453

原创 记一次carbondata自动删除元数据恢复方法

carbondata中误删数据恢复

2025-01-16 22:20:28 271

原创 ck集群数据迁移

特殊clickhouse数据迁移

2024-12-24 19:00:34 1010

原创 windows远程连接跳板机

windows远程连接ip

2024-11-08 10:12:13 391

原创 Intellij IDE报错:[Information:java:javacTask:源发行版8需要目标发行版1.8]

Intellij IDE报错:[Information:java:javacTask:源发行版8需要目标发行版1.8]处理方法File->Settings->Build,execution,Deployment->Compiler->Java Compiler进入该目录下,修改Per-module bytecode version,将该项目修改为8直接输入1次#,并按下space后,将生成1级标题。输入2次#,并按下space后,将生成2级标题。以此类推,我们支持6级标题。有助于使用语法后生成一个完

2024-11-05 17:06:52 1055

原创 clickhouse数据目录迁移小记

22版本以后直接更改配置文件的存储路径不行,需要将默认的/var/lib/clickhouse mv到/data/clickhouse 中然后创建软连接 ln -s /data/clickhouse /var/lib。clickhouse在22版本之前可以直接更改数据存储目录。

2024-09-27 14:09:48 224

原创 java.lang.ClassNotFoundException: org.springframework.test.context.TestContextAnnotationUtils问题处理

由于代码验收,我这边使用的是第三方提供的框架,然后将自己的依赖等加入,但是加入maven中将springtest的版本用了自己的版本和第三方的不同。这是由于 spring-boot-test 和 spring-test 的版本没有匹配上。使用@SpringBootTest进行单元测试。

2024-09-25 10:33:32 446

原创 spark之不同序列化对比

在这里插入图片描述](https://i-blog.csdnimg.cn/direct/572b925ccfab414cb9c314be329cfa5f.png。sparksql中使用序列化和不使用差别不大,英文sparksql中默认使用了encode自己实现的序列化方法,加上与不加序列化差别不大。下面是使用不同序列化后的占用资源和数据大小。一,spark的rdd的序列话不同介绍。2,sparksql中序列化的区别。

2024-09-20 22:11:56 464

原创 springboot中报错NullPointerExceptionCRit

网上找了相关方法,加了这个类的扫描路径指定。

2024-09-20 22:01:35 278

原创 mysql一主2从部署

1.编辑配置文件修改 MySQL 配置文件(/etc/my.cnf 或 /etc/mysql/my.cnf)以启用二进制日志和设置服务器 ID。4.获取主服务器状态记录主服务器的二进制日志文件名和位置,以便从服务器配置时使用。3.配置从服务器登录 MySQL 并设置主服务器信息和复制用户。3.创建复制用户登录 MySQL 并创建用于复制的用户。rpm -e --nodeps [要卸载的mysql]MASTER_LOG_FILE=‘记录的日志文件名’,4.启动复制启动从服务器的复制进程。

2024-09-13 15:59:46 1218

原创 java中jar包替换指定类的方法

目的是:要将log-retain-service-3.1.4.jar中FileUploadTimerTask修改后,再打回包log-retain-service-3.1.4.jar中。或者你有源码直接改,存在单个类编译报错,这时候可以将整个项目打包成包b,然后从包b中解压出我们要的那个类,这时候这个类就是编译后的文件,可以直接打进我们。<jar -utf log-retain-service-3.1.4.jar 编译后的类文件路径>log-retain-service-3.1.4.jar中。

2024-09-11 18:31:33 406

原创 问题归类集合

hiveserver2查询报错gc。

2024-09-11 17:26:45 121

原创 idea单元测试报错找不到主类

在下面的command line 中选择jar manifest 因为条参数过长,这里设置只使用主类。主要是单测中没有配置类。

2024-09-05 21:50:06 322

原创 Caused by: java.lang.RuntimeException: native zStandard library not available: this version of

最后排查是,集群中的配置路径和我客户端的路径不同,导致任务提交后,还是拿不到库的信息。排查本地环境 hadoop checknative 结果中是有zstd的支持的类库。背景:通过spark直接写hadoop文件,指定格式是csv。3,注意,更改客户端环境一定要注意保证和集群一致,细心细心。再提交后任务还是报一样的错。

2024-09-05 17:53:46 375

原创 kerberos部署

1,kerberos部署中,多个principal公用一个keytab文件处理。执行 kadmin -p admin/admin@EXAMPLE.COM。再一个个的将用户添加到keytab中。

2024-08-21 16:52:33 408

原创 记一个启动有ranger的hiveserver2报错

修改hadoop的etc/hadoop/hadoop-env.sh 中的export HADOOP_OPTS="$HADOOP_OPTS -Djava.security.auth.login.config配置的路径,之前配置有误。1,启动hiveserver2报错。

2024-08-21 15:26:42 384

原创 记一次hivemetastore启动报错

4,最后排查,这个节点rpm部署了hive,现在只是copy了一个hive的目录过来,导致/usr/bin/hive 这个里面和现在部署的安装包不是同一个。3,把hive-site.xml中无关的配置都删掉,重启metastore还是报错。1,启动hivemetastore后报错日志。2,排查lib下的mysql的驱动也在,这里和mysql的驱动大小一样。

2024-08-20 17:01:10 465

原创 【无标题】

kerberos启动datanode报错

2024-08-12 16:04:13 231

原创 clickhouse的依赖包

1,clickhouse的依赖包下载。

2024-08-06 13:48:22 159

原创 yum源添加

类似CentOS-7-x86_64-DVD-1810.iso切分成CentOS-7-x86_64-DVD-1810.z01 CentOS-7-x86_64-DVD-1810.z02 CentOS-7-x86_64-DVD-1810.zip 上传后,执行cat CentOS-7-x86_64-DVD-181* >CentOS-7-x86_64-DVD-1810.zip 再执行unzip CentOS-7-x86_64-DVD-1810.zip。[cdrom]: 是这个Yum源的名称,可以自定义。

2024-08-05 22:14:34 604

原创 Hadoop 3.3.2 HDFS Simple认证Standby同步格式化信息失败 Authentication required

Hadoop 3.3.2 HDFS Simple认证Standby同步格式化信息失败 Authentication required。部署hadoop3.3.2的版本的时候,格式化standby的时候报错。

2024-08-05 14:20:55 344

原创 记一次zookeeper启动问题

zookeeper启动问题

2024-08-02 14:03:06 454

原创 kerberos认证流程

2,你到了助理办公司,助理拿你的信,(对照一下信里的消息,确认是不是你这个人)确认没问题,告诉你领导位置,同时也会给你一封信(你看不懂的)1,生活场景 你进入某公司要见领导 首先第一次跟保安打交道,沟通完了,保安告诉你助理的办公室位置和一封信(你看不懂,助理看的懂)3,你找到领导,领导拿到你的信(对比一下是不是这个人),没问题了,开始沟通。kerberos 认证3步骤。

2024-08-01 10:00:28 265

原创 kerberos术语

kerberos中认证使用的用户信息也就是(principal 主体中),如果是用户的话,这里包含用户的名称,用户的角色,比如admin,普通用户,等,还有对应的域。

2024-08-01 09:49:37 150

原创 获取对象占用内存

计算大小:如果元素非空,则使用ClassLayout.parseInstance方法解析该对象,并调用instanceSize方法获取其在内存中占用的字节数。初始化:定义一个变量byteSize用于存储所有对象的总字节数,初始值为0。遍历列表:通过for循环遍历传入的dataList中的每一个元素。返回结果:遍历结束后,返回byteSize作为所有对象的总字节数。累加大小:将当前对象的字节数累加到byteSize中。检查元素:对于每个元素,首先检查它是否为非空对象。// 初始化字节大小为0。

2024-07-31 15:23:59 206

原创 clickhouse处理readonly报错

cllickhouse修复readonly遇到问题

2024-07-24 21:12:15 781

原创 部署kafkamanager

在这里插入图片描述](https://i-blog.csdnimg.cn/direct/47c5af5beaec496382162dffb0ce9e9b.png。参考:https://download.youkuaiyun.com/blog/column/12424861/132559915。例如:10.0.99.2:2181 10.0.99.7:2181 10.0.1.6:2181/kafka。这是添加对应的kafka的集群,其实本质是指定kafka在zookeeper中的注册地址。1,检查kafka的版本。

2024-07-16 21:49:16 628

原创 【无标题】

docker compose 可以给予compose文件狂苏部署分布式应用,不需要手动一个个创建和运行容器,compose文件是一个文本文件,通过指令定义及群的每个容器(镜像起来就是容器)如何运行。dockerfile是一个文本文件,包含一个个指令,用指令说明要执行什么操作来构建镜像,每一个指令执行都会形成一个layer,镜像是很多layer(层)构成。3,镜像运行起来就是容器,一个镜像可以运行多个容器,每个容器就是一个进程,容器之间相互隔离。是一个虚拟目录,指向宿主机的某个目录。什么是dockfile。

2024-07-05 09:23:52 439

原创 docker的容器操作命令

docker ps -a 查看所有的容器状态(包括未运行的)docker start 镜像名称/镜像id。docker logs 镜像名称/镜像id。docker stop 镜像名称/镜像id。docker ps 查看运行的容器状态。docker logs 查看容器的日志。docker rm 镜像名称/镜像id。docker rm 删除容器。镜像运行起来就是容器。

2024-06-26 23:02:45 241

原创 java连接mysql报错

1.背景,直接升级操作系统从centos-》国产化操作系统,mysql也升级到5.7.442,报错Caused by: com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException: Could not create connection to database server. Attempted reconnect 3 times. Giving up. at sun.reflect.NativeConstr

2024-06-21 14:51:34 498

原创 carbondata连接数优化

在Spark中,调度池(Scheduler Pool)用于为不同的作业分配资源池,以控制其执行优先级。设置调度池可以帮助管理不同作业之间的资源争用情况。要使用调度池,您需要配置Fair Scheduler并创建相应的调度池配置文件。1,通过添加spark的调度池。1-2配置调度池文件。

2024-06-13 11:04:47 410

原创 hbase安装部署

hdfs运行在本机,根据实际情况更改localhost。先要启动zk再启动hdfs,最后启动hbase。

2024-06-12 09:13:25 374

原创 hadoop和hbase对应版本关系

https://hbase.apache.org/book.html#configuration

2024-06-11 17:02:20 535

原创 carbondata入库数据查询异常排查

carbondata入库查询失败处理

2024-06-06 15:51:07 261

原创 nginx安装部署问题

借鉴了网上的[https://blog.youkuaiyun.com/gongchenyu/article/details/131810023]还是报错,报错证书问题。解决nginx: [emerg] unknown directive “stream“ in /etc/nginx/nginx.conf。内网部署nginx,开始执行make,执行不了,后面装了依赖的环境。通过配置https的认证,添加ng的CA证书。记一次nginx启动报错问题处理。问题2,启动nginx报错。

2024-05-28 16:42:54 389

原创 记一次kafkakerberos认证问题

principal文件不带kafka,去掉我自己配置的kerberos.kafka.principal重试。但是查看kafka_client_jass.conf文件,发现。排查思路:检查kerberos配置文件。报错信息是没有找到borker的映射。检查本机确实发现连接的映射没有配置。更改后的kerberos配置文件。加上主机映射测试OK了。

2024-04-17 10:41:24 473

kafka-3.5.1-src

kafka-3.5.1-src

2024-11-12

carbondata-apache-carbondata-2.3.0-rc1

carbondata-apache-carbondata-2.3.0-rc1

2024-11-12

apache-ranger-2.1.0.tar.gz

apache-ranger-2.1.0.tar.gz

2024-11-12

hbase的2.6.0的基于hadoop3的包

hbase的2.6.0的基于hadoop3的包

2024-11-12

Beyond-Compare-onlinedown.zip

Beyond_Compare_onlinedown.zip

2024-11-12

系统编译时候依赖不同的版本的glibc

系统编译时候依赖不同的版本的glibc

2024-11-12

clickhouse-client-23.3.1.2823.x86-64中的4个包,还有一个比较大,分开上传,描述中贴有地址

https://download.youkuaiyun.com/download/weixin_51473488/89961015这是需要合并的前一个包 https://download.youkuaiyun.com/download/weixin_51473488/89961096这是需要合并的第二个包 这两个由于源文件超过1000m,所以拆开,下载后,需要手动合并后解压就可以 再加上本地址的包,就完全可以

2024-11-06

clickhouse-common-static-dbg-23.3.1.2823.x86-64的第二部分,需要将两个问件合并

由于clickhouse-common-static-dbg-23.3.1.2823.x86_64文件大于1g所以将文件拆分了, 前部分的地址https://download.youkuaiyun.com/download/weixin_51473488/89961015

2024-11-06

clickhouse-common-static-dbg-23.3.1.2823.x86-64包前部分

clickhouse-common-static-dbg-23.3.1.2823.x86_64

2024-11-06

clickhouse的依赖包

clickhouse的依赖包

2024-08-06

hive权限管控jar(hiveAuth.zip)

给hive添加用户权限jar包

2023-03-20

java中守护进程小结

关于javaee中的守护进程个一些情况小结,主要分析了,在开始进程之前设置为守护进程,以及开始之后设置守护进程,以及有的是在开始之前,有的是在开始之后设置为守护进程的各种情况,总结不全,仅作为参考

2020-11-14

impala-3.4.pdf

impala-3.4.pdf

2021-02-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除