
云计算
文章平均质量分 77
LinkSLA
这个作者很懒,什么都没留下…
展开
-
云平台存储应急演练中的常见问题
基于云平台存储的业务平台,采用分布式计算机存储系统,天然形成了数据冗余存储、具有自动恢复机制,提高了存储数据抵抗外界诸如硬件故障、单台存储设备故障等不可抗风险。因此,在构建基于云架构的演练标准体系方面,缺乏了应有的关注。原创 2024-04-24 09:52:22 · 505 阅读 · 0 评论 -
有了这篇 Kubectl 命令总结,5分钟优雅入门 K8s!
如果指定了—resource-version,则更新将使用此资源版本,否则将使用现有的资源版本。资源对象中的Pod可以指定计算资源需求(CPU-单位m、内存-单位Mi),即使用的最小资源请求(Requests),限制(Limits)的最大资源需求,Pod将保证使用在设置的资源数量范围。对于每个Pod资源,如果指定了Limits(限制)值,并省略了Requests(请求),则Requests默认为Limits的值。配置应用的一些特定资源,也可以修改应用已有的资源。这个命令用于设置资源的一些范围限制。转载 2023-12-27 15:20:48 · 119 阅读 · 0 评论 -
智能运维软件,提升效率的利器
展示系统运行状态,高效应对规模庞大的基础设施,网络设备、服务器、存储、应用等,以业务视角监控系统健康度,系统视图展示各个资产运行的状态,业务拓扑图、告警列表趋势等。同时,提供设备管理、网络管理、业务管理、视频系统运维、CMDB、ITSM、运维管理、机房管理、移动运维、云运等运维功能,支持各系统间的运维数据关联共享,从全局视角把控系统运行态势。通过减少人力和物力的投入,降低企业的运营成本。整合和统一管理IT系统中的各种资源,包括服务器、网络设备、虚拟化、云平台、专线、摄像头等,以及各种软件应用和业务系统。原创 2023-11-14 17:44:22 · 258 阅读 · 0 评论 -
轻松驾驭!Prometheus 如何监控指标,快速定位故障
指标的名称(metric name)可以反映被监控样本的含义(比如,- 表示当前系统接收到的HTTP请求总量)。指标名称只能由ASCII字符、数字、下划线以及冒号组成并必须符合正则表达式。标签(label)反映了当前样本的特征维度,通过这些维度Prometheus可以对样本数据进行过滤,聚合等。标签的名称只能由ASCII字符、数字以及下划线组成并满足正则表达式。为了方便理解,这里选取了三种类型和两种业务场景的指标示例。原创 2023-10-25 14:20:47 · 494 阅读 · 0 评论 -
TCP通信过程详解以及tcp长连接和短连接
在长连接的应用场景下,client端一般不会主动关闭它们之间的连接,Client与server之间的连接如果一直不关闭的话,会存在一个问 题,随着客户端连接越来越多,server早晚有扛不住的时候,这时候server端需要采取一些策略,如关闭一些长时间没有读写事件发生的连接,这样可 以避免一些恶意连接导致server端服务受损;总之,长连接和短连接的选择要视情况而定。长连接和短连接的产生在于client和server采取的关闭策略,具体的应用场景采用具体的策略,没有十全十美的选择,只有合适的选择。转载 2023-07-21 10:29:30 · 812 阅读 · 0 评论 -
Redis 6.2&7 Rehash相关优化 | 运维进阶
随着key个数越多,rehash需要的额外内存也越大,所带来的可用性风险(大量逐出,Redis同步)和数据丢失(逐出)风险也越高。第一次灌入:67,100,000个key,观察内存第二次灌入:2,000,000个key,观察可用性和逐出。原创 2023-07-14 14:55:59 · 920 阅读 · 0 评论 -
如何应对告警风暴?
但是我们依然欣赏和鼓励有实力的选手,捧着罗曼罗兰看透生活的本质还依然热爱它的衣钵继续憧憬着美好,这是一种升华,是一种超脱,渡人精神不能少,2、告警关联:告警关联是由警报生成事件的过程,事件中所有警报都包含同一个问题的相关信息,事件内警报之间的相关关系应当能够被事件阅览者快速发现,简单易懂。根据告警信息的相似性和相关性生成告警事件,为运维人员提供更简洁的告警信息视图,更准确、快速地识别故障源,精准定位快速解决。2.相关性,则是多个应用程序均使用同一个数据库的数据发起告警,具备一定的相关性。原创 2023-05-19 15:09:54 · 647 阅读 · 0 评论 -
Nginx 高可用方案
如果一个系统能够一直提供服务,那么这个可用性则是百分之百,但是天有不测风云。所以我们只能尽可能的去减少服务的故障。原创 2023-03-09 10:00:04 · 449 阅读 · 0 评论 -
600 条最强 Linux 命令总结
find /home/user1 -name '*.txt' | xargs cp -av --target-directory=/home/backup/ --parents 从一个目录查找并复制所有以 '.txt' 结尾的文件到另一个目录。mkisofs -J -allow-leading-dots -R -V "Label CD" -iso-level 4 -o ./cd.iso data_cd 创建一个目录的iso镜像文件。原创 2023-03-01 15:30:54 · 533 阅读 · 0 评论 -
服务案例|基于IT事件管理,提升业务连续性
夜间无人值守,故障重启等问题不易察觉,LinkSLA智能运维管家不仅能够及时监测到服务器故障,第一时间进行反馈,可以根据历史运维指标数据,进行分析,协助用户查找出故障的根本原因,从根本上解决问题。另外,还可以利用系统的监控大屏功能,对系统的整体健康状况做到一目了然,做到资源、业务的可视化。即当平台监控发现异常,进行事件优先级分类,判断事件处理的紧迫性,分析事件影响造成破坏程度,然后进行事故调查与诊断,快速定位识别问题,联系现场工程师最终解决问题,事件流程结束。2、可用内存22.28G,充足。原创 2023-02-28 15:59:01 · 707 阅读 · 0 评论 -
技术更新!10个MySQL性能调优技巧
同样,对于innodb_log_file_size和innodb_log_files_in_group 来说大多数情况下,从2GB的文件开始,监测写日志操作。许多客户增加这些设置的值,以利用现代固态硬盘的优势,它可以在相对较低的延迟下提供非常高的I/O容量。然而,在数百GB的内存服务器的情况下,如果你有512GB的内存,那就会留下128GB的自由空间,而不是专门用于缓冲池,这是一种很大的浪费。在最近的MySQL版本中,就有明显变化,如新的数据字典,已经改善了性能,即使有很多表,也不会对性能产生大的影响。原创 2023-02-21 17:22:21 · 613 阅读 · 0 评论 -
10个经典的 Linux Shell 脚本面试和解答
第一行命令创建了一个目录(dir_xyz),上面的第二行命令让组(g)具有‘写’和‘执行’的权限,而上面的最后一行命令——权限位最后的‘+t’是‘粘滞位’,它用来替换‘x’,表明在这个目录中,文件只能被它们的拥有者、目录的拥有者或者是超级用户root删除。转载 2023-02-20 14:31:25 · 1470 阅读 · 0 评论 -
图解 K8S OOM 和 CPU 节流
使用 Kubernetes 时,内存不足 (OOM) 错误和 CPU 节流是云应用程序中资源处理的主要难题。这是为什么?云应用程序中的 CPU 和内存要求变得越来越重要,因为它们与您的云成本直接相关。通过 limits 和 requests ,您可以配置 pod 应如何分配内存和 CPU 资源,以防止资源匮乏并调整云成本。如果节点没有足够的资源, Pod 可能会通过抢占或节点压力被驱当一个进程运行内存不足 (OOM) 时,它会被终止,因为它没有所需的资源。转载 2023-02-17 10:37:38 · 923 阅读 · 0 评论 -
预算砍砍砍,IT运维如何降本增效
IT环境下分析定位问题往往需要多个工具配合,造成了使用不便,更重要的是造成日志数据、事件数据、指标数据、告警数据等多类运维数据分散存储,形成了数据孤岛,无法进行数据关联分析和统一展示。原创 2023-02-14 15:51:27 · 2019 阅读 · 0 评论 -
Python 的打包神器 — Nuitka
。--follow-import-to=utils,src:需要编译成C++代码的指定的2个包含源码的文件夹,这里用,来进行分隔。原创 2023-02-14 09:27:21 · 982 阅读 · 0 评论 -
7步做好云上监控
云计算环境是复杂、运动且庞大的,面对这种大型的IT环境,单靠人工去进行监管是不够的,使用高度自动化的基础设施监控更有利于解决当下的困境。原创 2023-02-10 15:06:42 · 359 阅读 · 0 评论 -
一台服务器最大能支持多少条TCP连接?
我们知道一条ESTABLISH状态的连接大约消耗【3.3KB内存】,那么通过计算得知一台4GB内存的服务器,【可以建立100w+的TCP连接】(当然这里只是计算所有的连接都只建立连接但不发送和处理数据的情况,如果真实场景中有数据往来和处理(数据接收和发送都需要申请内存,数据处理便需要CPU),那便会消耗更高的内存以及占用更多的CPU,并发不可能达到100w+)如果因为hard nofile参数值设置的低,那么soft nofile参数的值设置的再高也没有用,实际生效的值会按照二者最低的来。原创 2023-02-08 17:13:40 · 489 阅读 · 0 评论 -
理解Python中GIL锁
对于IO密集型应用,多线程的应用和多进程应用区别不大。转载 2023-01-18 11:13:54 · 192 阅读 · 0 评论 -
如何理解 logrotate 实用工具?请收下这份保姆级教程
当你想对一个应用程序跟踪使用状况或者进行故障排除的时候,日志是十分有用的。然而,随着越来越多的信息被记录,日志文件占据的硬盘空间也会越来越大。久而久之,一个日志文件能变得相当的大。一个巨大的日志文件不但会导致硬盘空间不足,还可能减慢对虚拟服务器调整大小或备份的过程。除此之外,你很难在一百万条日志中查找某个特定事件。因此,最好将日志文件的大小控制在可管理的范围内,并在日志文件过旧以致无法使用时对其进行删除。所幸,logrotate 工具让日志轮换(log rotation)变得简单。转载 2023-01-17 10:06:08 · 319 阅读 · 0 评论 -
Mysql数据库的监控
Mysql是一款开源关系型数据库,在业务系统中广泛的应用。原创 2023-01-16 11:07:11 · 1495 阅读 · 0 评论 -
0.2秒居然复制了100G文件?
用 cp 拷贝了一个 100 G的文件,竟然一秒不到就拷贝完成了转载 2023-01-13 10:25:45 · 113 阅读 · 0 评论 -
从运维角度聊下:如何维护一套 DevOps 系统
本文对于 DevOps 系统的运维做了简单的介绍,当然,运维的过程以及期间遇到的问题远远不止这些,我们需要在运维的过程中不断发现问题以及解决问题,直到把整个DevOps 系统做到尽量的完善。转载 2023-01-12 09:58:52 · 293 阅读 · 0 评论 -
服务案例|SQL Server数据库监控反复重启问题
发现问题,解决问题原创 2023-01-10 17:29:03 · 492 阅读 · 0 评论 -
MySQL 常用脚本
建议收藏原创 2023-01-09 09:56:26 · 320 阅读 · 0 评论 -
认识Linux系统结构
Linux 系统一般有 4 个主要部分:内核、shell、文件系统和应用程序。内核、shell 和文件系统一起形成了基本的操作系统结构,它们使得用户可以运行程序、管理文件并使用系统。原创 2023-01-06 11:01:31 · 461 阅读 · 0 评论 -
疯狂2023:科技迎来爆发之年,关注云计算这些方向
云计算可以有效地进行灾难恢复,后悔药常备,定心丸常在,意外停电,数据丢失或硬件故障,天灾人祸都能应对,快速恢复系统正常运行极其可贵。原创 2023-01-05 10:11:58 · 390 阅读 · 0 评论 -
Linux 上 Nginx 获得最佳性能的 8 种方法
被 VMware、IBM、Cisco、Apple、Microsoft LinkedIn、Netflix、Facebook、Twitter 等许多大公司使用,NGINX 以其一流的性能而广为人知。另一方面,工作进程的作用是处理传入的请求并在客户端和服务器之间创建连接。通过修改 NGINX 配置文件(如 nginx.conf 和虚拟主机文件)中配置的参数,您可以熟知 NGINX 以获得最佳性能。NGINX 是一种现代 Web 服务器,您可以将其用作媒体流、邮件服务器、反向代理、负载平衡器、缓存服务器等。转载 2023-01-04 11:30:56 · 387 阅读 · 0 评论 -
最简明的 Tcpdump 抓包入门指南
网络数据包截获分析工具。支持针对网络层、协议、主机、网络或端口的过滤。原创 2023-01-03 10:13:34 · 495 阅读 · 0 评论 -
Linux运维工程师 50个常见面试题
K8s是kubernetes的简称,其本质是一个开源的容器编排系统,主要用于管理容器化的应用,其目标是让部署容器化的应用简单并且高效(powerful),Kubernetes提供了应用部署,规划,更新,维护的一种机制。说简单点:k8s就是一个编排容器的系统,一个可以管理容器应用全生命周期的工具,从创建应用,应用的部署,应用提供服务,扩容缩容应用,应用更新,都非常的方便,而且还可以做到故障自愈,所以,k8s是一个非常强大的容器编排系统。原创 2022-12-30 13:28:08 · 5900 阅读 · 2 评论 -
构建 Docker 镜像的 小技巧
如果不采用分阶段构建,对于一些需要在容器内进行编译的项目,最好通过 git 或者 wegt 的方式将源码打入到镜像内,原创 2022-12-27 16:43:44 · 714 阅读 · 0 评论 -
SQL server数据库监控
数据命中率值不能低于 90%,页预期寿命是数据页在缓存中停留的时间,当数据页在缓存中低于300S就被置换出去时,需要检查分配给数据库使用的内存,是否存在内存不足问题。原创 2022-12-16 19:28:07 · 1661 阅读 · 0 评论 -
如何建立好客户信任关系?
我们将运维从技术支持领域升级服务,降低运维成本,提高运维效率,琐碎的、重复的事情由AI完成。原创 2022-12-15 10:24:03 · 804 阅读 · 1 评论 -
从 MySQL 到 ClickHouse 实时复制与实现
ClickHouse 实时复制同步 MySQL 数据是 upstream 2020 的一个 roadmap,在整体构架上比较有挑战一直无人接单,挑战主要来自两方面:对 MySQL 复制通道与协议非常熟悉对 ClickHouse 整体机制非常熟悉这样,在两个本来有点遥远的山头中间架起了一座高速,转载 2022-12-14 17:57:25 · 440 阅读 · 0 评论 -
Oracle数据库 的监控
平台目前支持对Sqlserver、Mysql、Oracle、ElasticSearch、Mongodb、Postgresql、Redis、Memcached等十多种商用和开源数据库产品的监控,今天我们先介绍对Oracle数据库的监控。原创 2022-12-08 16:48:55 · 2309 阅读 · 0 评论 -
分布式实时日志:ELK 的部署架构方案
ELK 已经成为目前最流行的集中式日志解决方案,它主要是由 Beats、Logstash、Elasticsearch、Kibana 等组件组成,来共同完成实时日志的收集,存储,展示等一站式的解决方案。转载 2022-12-08 09:51:28 · 574 阅读 · 0 评论 -
Linux Shell 脚本的10个高频面试问答
Linux 的浩瀚无垠,使人总能每次都提交与众不同的内容。这些内容不仅对他们的职业生涯在本文中我们将从面试的角度解读与 Linux Shell 相关的问题。原创 2022-12-05 10:20:07 · 512 阅读 · 0 评论 -
Linux 磁盘空间异常爆满,该怎么查?
在服务器运维过程中,我们时常会遇到这样的情况,收到服务器磁盘空间告警:登录服务器,通过df -Hl查看和告警信息一致,接着我们就是要找到导致磁盘空间满的目录或文件。原创 2022-12-02 09:36:23 · 377 阅读 · 0 评论 -
find 命令 7 种高级用法
看完 find 命令的 7 种用法后,开始提到的面试题现在好像很容易解决了。原创 2022-12-01 11:28:03 · 677 阅读 · 0 评论 -
三大实例带你搞定 Prometheus API 使用
本文仅展示了 Prometheus API 的简单应用原创 2022-11-30 10:21:49 · 3665 阅读 · 0 评论 -
弃用 ifconfig 吧,你值得收藏的 IpRoute2 简明指南
基本上,每当需要转发 IP 分组时,你的主机就会在本地网络上广播 ARP 请求,向网络中的其他主机询问谁拥有这个 IP 地址。原创 2022-11-28 12:49:01 · 985 阅读 · 0 评论