sunxunyong-优快云博客

原创 crontab 定时任务不执行问题排查

export PATH=/usr/local/spark/bin:$PATH # 手动添加路径。*/5 * * * * sh /data03/jq/sparkjob.sh 定时任务不执行！Cron 环境变量与用户Shell不同，可能导致脚本中命令找不到。source /etc/profile # 加载系统环境变量。Cron默认丢弃输出，错误信息无法查看。

2025-05-16 13:58:05 198

原创 yarn任务筛选spark任务，判断内存/CPU使用超过限制任务

yarn任务筛选spark任务，判断内存/CPU使用超过限制任务。

2025-05-15 15:58:58 354

原创 jq安装与使用

jq使用：https://www.cnblogs.com/liugp/p/17613011.html。1、https://jqlang.org/ 下载jq-linux-amd64。3、上传jq-linux-amd64至/usr/local/jq目录下。2、新建目录/usr/local/jq。

2025-05-15 15:57:26 193

原创 kafka topic 的leader为none问题处理

Kafka zookeeper.session.timeout.ms 30000 Kafka 与 ZooKeeper 会话超时时间。Kafka controlled.shutdown.enable true 确保 Broker 关闭前迁移 Controller。修改zookeeper.session.timeout.ms 为60s，重启broker后恢复。ZooKeeper maxSessionTimeout 60000 最大会话超时时间（毫秒）

2025-04-17 17:29:35 140

原创 hugegraph搭建及使用

查找子树,查找从一个节点出发，到叶子节点结束的所有路径,这些路径的集合为一颗子树(子图)#查询顶点，一般作为图查询的第1步，后面可以续接的语句种类繁多。#查询所有关联的边及相邻顶点（路径模式）查找从节点出发的所有路径（到叶子节点）#根据属性查顶点,需要建立索引。#查询所有顶点的id。

2025-04-15 15:44:10 427

原创 yarn任务临时目录暴增问题处理

tmp/hive/hive/97bed9ea-95f7-4ddd-aeed-6dda3e611684（UUID标识符，这是Hive会话或查询的唯一标识符，可用于关联日志。由于日志暴增，会导致hdfs占用暴增，可能导致集群崩溃！yarn任务临时目录暴增问题。

2025-04-15 11:17:45 155

原创 doris-streamloader 导数验证

curl --location-trusted -u admin:XXX -H “Expect:100-continue” -H “column_separator:,” -H “columns:id,domain,project_name,pn_code,wo_code,line_code,line_name,process_code,process_name,section_code,section_name,station_code,station_name,user_code,assess_r

2025-04-07 16:40:37 426

原创 hive/doris查询表的创建和更新时间

doris查询表的创建和更新时间。

2025-04-07 16:07:51 277

原创 dataX运行原理学习

求出 TaskGroup 的数量之后，就会执行公平分配策略，将 Task 平均分配个每个 TaskGroup，最后执行调度，完成整个同步作业。Task：根据不同数据源的切分策略，一个Job会切分为多个Task，Task是DataX作业的最小单元，每个Task负责一部分数据的同步工作。Framework：用于连接reader和writer，作为两者的数据传输通道，并处理缓冲，流控，并发，数据转换等核心技术问题。假设 A 库有表 0、1、2，B 库上有表 3、4，C 库上有表 5、6、7，如果此时有 4 个。

2025-04-07 11:49:21 487

原创 hive通过元数据库删除分区操作步骤

删除分区参数（PARTITION_PARAMS，如果有）– 删除分区键值（PARTITION_KEY_VALS）– 可选：删除统计信息（PART_COL_STATS）2、查询分区的PART_ID和SD_ID。– 删除存储描述（SDS，确保无其他引用）– 删除分区记录（PARTITIONS）1、查询分区的DB_ID、TBL_ID。– 根据分区键值查找PART_ID。– 获取数据库ID-26110。–第二个分区键month的值。–第一个分区键year的值。–第三个分区键type的值。

2025-04-07 11:15:01 451

原创 iptables只允许指定网段的ip访问某端口配置

yum install -y iptables-services #安装systemctl restart iptables.service #重启防火墙使配置生效systemctl enable iptables.service #设置防火墙开机启动systemctl disable iptables.service #禁止防火墙开机启动iptables -F 清除所有链的规则。

2025-04-02 15:47:57 679

原创 doris 用户连接数限制问题

通过 SHOW PROPERTY FOR ‘Billie’ LIKE ‘%max_user_connections%’;通过 SET PROPERTY FOR ‘Billie’ ‘max_user_connections’ = ‘200’;用户同一时间点可使用的 instance 个数, 默认是-1，小于等于0将会使用配置 default_max_query_instances.

2025-04-02 11:49:28 568 1

原创 hive-doris时区不一致排查

依赖系统时间： date +“%Z %z”

2025-03-19 08:35:19 303

原创 Spark任务AM复用导致任务混乱

yarn.resourcemanager.am.liveness-monitor.interval-ms =1000 --RM检查AM存活状态的时间间隔（单位为毫秒，默认1s）。yarn.am.liveness-monitor.expiry-interval-ms = 1000 --AM在无响应后判定为失效的时间阈值（单位为毫秒,m默认10分钟）。spark-submit 增加参数。

2025-03-12 11:35:56 258

原创 linux快捷使用

【代码】linux快捷使用。

2025-03-11 15:58:08 120

原创 initial executor number 10 must between min executor number 1 and max executor number 8 问题处理

1、静态 Executor 数量分配（禁用动态分配）2、动态资源分配（启用动态分配）

2025-03-10 16:30:37 116

原创进程延迟告警脚本

DATE"’&alert_host=调度任务延迟告警&alert_level=Error&alert_info=调度 {} 延迟&obj_id=assembly’

2025-03-06 20:27:50 265

原创 jvm线程状态样例

在 “Entry Set”中等待的线程状态是 “Waiting for monitor entry”，而在 “Wait Set”中等待的线程状态是 “in Object.wait()”。含义：可能是一个全局锁阻塞住了大量线程，如果短时间内多次打印的 thread dump 文件反映，随着时间流逝，waiting for monitor entry 的线程越来越多，没有减少的趋势，可能意味着某些线程在临界区里呆的时间太长了，以至于越来越多新线程迟迟无法进入临界区。那么当前谁持有这个锁呢？

2025-02-28 09:39:04 695

原创 JVM线程分析详解

【代码】JVM线程分析详解。

2025-02-27 16:41:44 351

原创 .hive-staging_hive临时文件处理

通过spark-sql、hive-sql、hue等提交select或者insert overwrite等sql到hive时，会产生该目录，用于临时存放执行结果，比如insert overwrite会将结果暂存到该目录下，待任务结束，将结果复制到hive表中。hql任务执行失败时，这些临时文件和目录不会被自动删除掉，直到有相关的hql执行成功时，才会自动删掉。

2025-02-27 15:21:47 319

原创 Deepseek 组合使用场景学习

内容生成：用自然语言向 DeepSeek 描述需求（如「生成新能源汽车行业分析 PPT 大纲」），输出结构化内容框架。动态优化：输入指令调整排版（如「将数据图表替换为动态可视化」），AI 自动优化布局。迭代优化：基于反馈意见（如「增加金属质感」），DeepSeek 自动优化生成指令。事件识别：AI 分析摄像头/传感器数据，自动分类事件（如「交通拥堵/管道泄漏」）。计划生成：定制训练方案（如「增肌阶段：每周 4 次力量训练+蛋白质摄入建议」）。

2025-02-24 18:06:48 1444

原创 hive 编译慢问题处理

修改CDH配置，打开并行编译！

2025-02-18 16:43:25 686

原创 HMS 压力分流设置

datanucleus.connectionPool.maxPoolSize=10 默认值为10，改成50。javax.jdo.option.ConnectionPoolMaxSize 最大连接数 50。javax.jdo.option.ConnectionPoolMinSize 最小空闲连接 10。hive.metastore.cache.expiry.seconds 缓存过期时间 3600。hive.metastore.cache.enabled 设置 true。HMS 压力分流设置。

2025-02-17 11:55:15 184

原创 hivemetastore 连接过多导致sql查询慢

建议值100是根据与工行规模相当集群的设置作参考，尽量大满足连接数请求的同时考虑connection占用资源(如果connection太多会占用太多的内存资源)的角度做出的一个综合评估值。metastore在当前版本未加入负载均衡机制，会默认连接配置文件中的第一个IP所在节点的metastore实例，在连接数到达一定数量后会导致metastore连接数负载过高。在Hive服务参数中适当调整maxConnectionsPerPartition，默认为10，可适当调大，建议调整至25。不推荐调整至最大值。

2025-02-13 17:52:42 535

java连接数据库万能代码

空空如也