
运维
文章平均质量分 80
goTsHgo
这个作者很懒,什么都没留下…
展开
-
Hive on Spark 的Pre-commit 测试
Pre-Commit 测试是一种提交代码到主分支或共享代码库之前运行的一系列自动化测试,用于捕获代码中的潜在问题自动运行的测试流程。其目的是确保新提交的代码不会引入错误,破坏现有功能或降低代码质量。对于大型项目如 Hive,Pre-Commit 测试通常包括单元测试、集成测试和功能测试等多个层次。Hive 的 Pre-Commit 测试通过 Maven、JUnit 和 QTest 框架实现,覆盖了从单元测试到集成测试的完整流程。通过轮换不同配置,Hive 平衡了测试覆盖率与执行效率。原创 2024-12-02 11:14:43 · 839 阅读 · 0 评论 -
性能监控框架的底层原理
本质上,这些框架通过与应用程序运行的底层系统(如CPU、内存、线程、网络等)以及语言级机制(如字节码、虚拟机、操作系统接口等)交互,来收集运行时性能指标。字节码增强允许开发者在不改变原始源代码的情况下,动态插入监控逻辑,非常适合性能监控。JVM作为应用的运行环境,跟踪了线程、堆内存、GC等关键指标,因此是获取性能数据的最佳入口。通过以上技术,性能监控框架能够从多个维度监控系统性能,为优化提供依据。性能监控框架的核心是获取应用程序的运行状态数据。包,通过该包,可以轻松访问JVM的性能数据。原创 2024-11-29 14:37:00 · 967 阅读 · 0 评论 -
区分 Hive on Spark 和 Spark on Hive
Hive on Spark 是指使用 Spark 作为 Hive 的查询执行引擎。Spark on Hive 是 Spark 的一个集成模式,在 Spark 应用中可以直接访问 Hive 的元数据和存储数据。它使得 Spark 作业能够查询和操作 Hive 中的数据,主要用来结合 Spark 的高性能计算能力和 Hive 的数据仓库管理能力。用户通过 Spark 的 SQL API 编写查询,调用 Hive 的表或元数据。最终生成 Spark 的 RDD 作业计划,提交给 Spark 执行。原创 2024-11-29 14:17:24 · 1215 阅读 · 0 评论 -
生产环境中:Flume 与 Prometheus 集成
Prometheus 不能直接抓取 JSON 数据,需要使用 HTTP Exporter 转换成 Prometheus 格式。通过上述工具,可以让 Flume 的监控数据被 Prometheus 定期抓取,从而实现可视化和报警功能。在 Prometheus 界面中搜索 flume_* ,可以看到 Flume 的 HTTP 数据。如果不想使用 JMX,Flume 自带的 HTTP 监控端口也可以用来集成 Prometheus。)中搜索 flume_*,可以看到 Flume 的监控数据。端口上暴露监控数据。原创 2024-11-29 11:53:32 · 1401 阅读 · 0 评论 -
Flume 监控配置和实践
Flume 支持自定义监控指标,开发者可以基于 Flume 的。原创 2024-11-29 09:53:41 · 1078 阅读 · 0 评论 -
性能优化经验:关闭 SWAP 分区
关闭 SWAP 的目的是为了提高系统性能稳定性,特别是在 JVM 堆内存管理场景中(如 Elasticsearch)。SWAP 导致的高延迟和不可预测性会对内存密集型应用产生灾难性影响,关闭 SWAP 后可以迫使服务更高效地使用物理内存,同时管理员需要更合理地规划内存资源。原创 2024-11-25 14:38:26 · 1739 阅读 · 0 评论 -
RAID存储技术 详解
性能提升:并行I/O操作。数据冗余:保护数据安全。灵活性:支持多种配置以适应不同需求。原创 2024-11-20 17:32:00 · 689 阅读 · 0 评论 -
Azkaban调度的所有 使用场景
Azkaban 的主要使用场景包括:大规模数据处理(Hadoop、Spark)、ETL 管道调度、机器学习任务调度、自动化报表生成、系统运维任务调度等。它的优势在于强大的依赖管理功能、自动重试机制和灵活的任务类型支持,使其在复杂的工作流管理和调度场景中表现出色。原创 2024-10-23 13:54:16 · 1109 阅读 · 0 评论 -
面试题:半年前的sql当时能正常跑,现在跑不了,有哪些原因?
一年前可以正常运行的 SQL 查询现在无法运行,可能有多种原因。数据库系统、数据表结构、索引、权限、数据库引擎版本等都可能发生变化,从而导致查询失败。原创 2024-10-10 16:55:03 · 1130 阅读 · 0 评论 -
30常用 Maven 命令
这些命令都体现了 Maven 强大的项目管理和构建能力。配置驱动:大部分命令都依赖于pom.xml中的配置,因此配置文件的管理至关重要。灵活性:通过命令行参数可以灵活定制执行行为,例如指定目标路径、依赖范围等。依赖管理:Maven 对依赖管理非常重视,许多命令涉及到依赖的检查、更新和冲突解决。原创 2024-09-09 14:40:11 · 1059 阅读 · 0 评论 -
CentOS过滤问题——唯一确定需要过滤进程号的方式
前言本文介绍了为什么可以通过 ps -ef 配置文件名 的方式来过滤出 配置文件对应的进程一、ps命令介绍 ps命令是Process Status的缩写,用于查看系统进程的状态,ps命令输出值非常多,通常会结合管道符 和grep 使用。二、使用步骤1.我们直接输入ps命令,不加任何参数。代码如下(ps示例):可以看到默认输出4列信息PID: 运行着的命令(CMD)的进程编号TTY: 命令所运行的位置(终端)TIME: 运行着的该命令所占用的...原创 2021-10-17 22:41:25 · 1408 阅读 · 0 评论 -
在操作HDFS进行文件的上传和下载时报错:Class not found: “com.lyyyktshcs.hdfs.HdfsClient“
项目场景:提示:在操作HDFS进行文件的上传和下载时报错:Class not found: "com.atguigu.hdfs.HdfsClient"问题描述:提示:在操作HDFS进行文件的上传和下载时报错>>Class not found: "com.test.hdfs.HdfsClient"原因分析:提示:项目走的maven的junit,多模块下,maven默认没有加载这个类;尝试右键maven ->t...原创 2021-09-08 10:15:57 · 381 阅读 · 0 评论 -
CentOS中的date命令详解
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言CentOS中的date命令 一、查看系统时间 二、设置指定的时间 三、按照格式查看时间前言date 命令:Display the current time in the given FORMAT, or set the system date.用法:date [选项]... [+格式] 或:date [-u|--utc|--universal...原创 2021-09-07 21:19:32 · 3045 阅读 · 0 评论 -
Hadoop启动NameNode报错ERROR: Cannot set priority of namenode process 2639
项目场景:Hadoop启动NameNode报错::ERROR: Cannot set priority of namenode process问题描述:Hadoop启动NameNode报错ERROR: Cannot set priority of namenode process2639[atguigu@localhost333logs]$ tail -100 hadoop-localhost -namenode-hadoop333.log...原创 2021-09-17 18:23:18 · 18845 阅读 · 1 评论 -
Maven工程下java:org.apache.hadoop.conf 等Hadoop包不存在的问题
问题分析:肯定是因为Maven工程中缺少了以来的Jar包,但是点击了Maven中的test 仍然没有解决问题,因此,需要手工命令的方式来让maven 来下载需要的jar包。解决方案操作步骤见下图:按照图片操作之后即可解决。...原创 2021-10-13 01:29:39 · 4515 阅读 · 7 评论 -
Hive执行 报错:FAILED: Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask
项目场景:HiveOnSpark环境下执行hive脚本,报错。问题描述:提示:这里描述项目中遇到的问题:例如:数据传输过程中数据不时出现丢失的情况,偶尔会丢失一部分数据APP 中接收数据代码:@Override public void run() { bytes = mmInStream.read(buffer); mHandler.obtainMessage(READ_DATA, bytes, -1, buffer).sendToTarget(); } 原因分析:..原创 2021-12-08 18:35:27 · 9495 阅读 · 18 评论 -
Flink报错: java.net.BindException: Could not start rest endpoint on any port in port range 10000
项目场景:Flink算子执行报错:Caused by: java.net.BindException: Could not start rest endpoint on any port in port range 10000 at org.apache.flink.runtime.rest.RestServerEndpoint.start(RestServerEndpoint.java:234) at org.apache.flink.runtime.entrypoint.com...原创 2021-12-23 16:18:57 · 3711 阅读 · 0 评论 -
聊聊分布式的可扩展性
前言团队,总会有人离开,总会有人加入。。。总会有一个leader,当服务器的数量增加的时候,业务增加的时候,总会进行相关的扩容或者缩容,那么这个团队的扩展性如何?增加了更多的事儿,leader是否能抗住?是否能分配所有的任务?是否能进行负载均衡?是否能对下属进行状态监控?在有人离职的时候,交接的任务是否很多?新来的人刚上线的时候,负载为0,大量的任务压来会不会直接把新人的IO耗尽。。。。这种团队的架构和分布式系统是一样的。分布式的扩展性说到分布式,凭什么你的扩展性就好?凭什么你就没有性能转载 2022-01-03 14:18:08 · 1186 阅读 · 0 评论 -
Docker:容器的本质是什么?容器从何而来?
本文介绍docker的原理。容器本质之进程隔离1. 容器本质容器本质上是一种进程隔离的技术。容器为进程提供了一个隔离的环境,容器内的进程无法访问容器外的进程。2. 容器及容器中的进程在主机上的呈现启动一个ubuntu的容器:docker run -it ubuntu在主机上可以看到启动了三个进程:第一个是刚刚执行的命令第二个是启动的容器,容器在系统上就是一个进程第三个是在该容器父进程下的一个子进程:/bin/bash在容器中运行top命令生成.....转载 2022-06-21 15:44:35 · 767 阅读 · 0 评论 -
Tomcat 运行报错-java.lang.IllegalArgumentException: servlet映射中的<url pattern>[mySerlvet.do]无效
25-Jun-2023 14:25:08.076 信息 [main] org.apache.catalina.startup.VersionLoggerListener.log 命令行参数: -Dcatalina.base=C:\Users\LYYYKTSHCS\AppData\Local\JetBrains\IntelliJIdea2020.3\tomcat\881509a1-4ac6-4f38-8a6e-bf2f92bb0db4。原创 2023-06-25 14:51:26 · 1139 阅读 · 0 评论 -
Linux中交换区Swap详解
Linux 的交换区(Swap)是一种虚拟内存空间,用于暂存未被使用的数据或将不活跃的进程移到磁盘上,以释放物理内存空间供其他进程使用。当系统物理内存不足时,Linux 会将部分内存数据交换到交换区中,以提供额外的内存空间,从而防止系统因内存不足而崩溃或变得极度缓慢。原创 2024-05-27 09:42:18 · 2440 阅读 · 0 评论 -
Kubernetes (K8s) 实现按需扩容
通过 Kubernetes 和 Helm,可以轻松部署和扩展 HDFS 和 OLAP 系统。使用 HPA 可以根据负载自动扩展系统的各个组件。监控工具(如 Prometheus 和 Grafana)可以帮助您实时监控系统的性能和扩展情况。原创 2024-06-21 08:36:30 · 1092 阅读 · 0 评论 -
DNS负载均衡的底层实现原理
DNS(域名系统)实现负载均衡是通过分散到不同服务器的请求来管理网络流量和优化资源使用的一种策略。下面详细介绍这种技术的实现原理、原因、以及其优缺点。原创 2024-07-11 09:35:51 · 1752 阅读 · 1 评论 -
Cron表达式
Cron表达式用于在特定时间自动执行任务,非常适合于计划备份、发送通知、自动更新等操作。了解过 crontab 的应该都知道 crontab 怎么配置定时任务,其实cron 与 crontab 差不多,但需要注意的是:cron 表达式从左往右,从秒开始;而 crontab 则是从分钟开始的。Cron表达式是一个字符串,字符串以5或6个空格隔开,分为6或7个域,每一个域代表一个含义,Cron有如下两种语法格式:秒 分 时 月中的几号 月 一周中的周几。原创 2024-07-08 16:48:45 · 906 阅读 · 0 评论