服务器物理故障,服务器故障说明

本文档介绍了在华为云中如何处理服务器故障,包括在生产站点故障时进行容灾切换,确保业务连续性。内容涵盖保护组的故障切换机制、容灾演练、资源的自动迁移和恢复,以及如何通过弹性云服务器、负载均衡和云监控来增强系统的稳定性和可用性。此外,还提到了Keepalived在检测和排除故障服务器方面的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

服务器故障说明 内容精选

换一换

c8a5a5028d2cabfeeee0907ef5119e7e.png

当保护组的生产站点发生故障时,将保护组的生产站点切到当前的容灾站点,即另一端AZ,启用当前容灾站点的云硬盘以及云服务器等资源。故障切换完成之后,保护组的当前生产站点变成故障切换发生之前的容灾站点,且生产站点和容灾站点之间的数据已停止保护,必须调用保护组开启保护/重保护接口成功后,两端的数据才会重新被保护。保护组中必须包含复制对才能故障切换

华为云帮助中心,为用户提供产品简介、价格说明、购买指南、用户指南、API参考、最佳实践、常见问题、视频帮助等技术文档,帮助您快速上手使用华为云服务。

服务器故障说明 相关内容

弹性云服务器是作为一种可随时获取、弹性可扩展的计算服务器。在各业务中,弹性云服务器作核心基础,细微的性能变化,运行异常及自动恢复,都可能会引起云服务上的业务受到大幅震荡。因此需使用弹性负载均衡将访问流量根据转发策略分发到后端多台弹性云服务器,通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使用云监控的事件

DCC是物理隔离的专属计算资源集群,集群中主机可能会因为故障而自动停机。为降低物理机故障的影响,在用户购买的专属集群内资源有冗余的情况下,在集群内的云服务器支持自动迁移能力。带有本地盘的主机不支持宕机自动迁移能力。计算资源没有冗余时,不支持云服务器自动迁移能力。发生故障后,我们会为用户更换一台健康的物理机,云服务器的ID、私有IP地址、弹

服务器故障说明 更多内容

f37b9b09b23d9b59f1b2d6c6affcfacc.png

查询单个复制对的详细信息。无URI格式GET /v1/{project_id}/replications/{replication_id}GET /v1/{project_id}/replications/{replication_id}参数说明参数名是否必选说明project_id是项目ID。获取方法请参见获取项目ID。replicat

f3b054c7f0f3a487e0ff47ff2b7b5851.png

运行在专属主机和普通ECS主机上的云服务器所支持的功能基本相同,仅表1所列功能不同。

e08a3c1d383ce0289aa478984d9adca2.png

获取裸金属服务器的详细信息。该接口支持查询裸金属服务器的计费方式,以及是否被冻结。GET 参数说明请参见表1。/v1/{project_id}/baremetalservers/{server_id}请求参数无无请求样例GET https://{BMS Endpoint}/v1/bbf1946d374b44a0a2a95533562ba9

55a2638139d68369d49b3058cd5d88e8.png

简要介绍Keepalived的作用是检测服务器的状态。假设有一台服务器出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作。当服务器工作正常后,Keepalived自动将服务器加入到服务器群中。这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的服务器。语言:C/C++一

c0e51685ecf1c455eed0daf868911dc9.png

更新复制对名称。无URI格式PUT /v1/{project_id}/replications/{replication_id}PUT /v1/{project_id}/replications/{replication_id}参数说明参数名称是否必选参数类型说明project_id是String项目ID。获取方法请参见获取项目ID。re

118fcc6f8f8a59b8317188ff10d93c94.png

根据裸金属服务器ID,查询裸金属服务器的详细信息。GET /v2.1/{project_id}/servers/{server_id}参数说明请参见表1。请求参数无无请求样例GET https://{ECS Endpoint}/v2.1/bbf1946d374b44a0a2a95533562ba954/servers/9ab74d89-6

a0c42bb47a44c6ed1cd778f97e224009.png

生命周期是指一台裸金属服务器实例从创建到删除所经历的所有状态,本章节简单描述各个状态的详情,以及状态之间的转换。

be6c0fefabcd88eafba576089843e93b.png

如果网站直接无法访问,可能是由于安全组没有放行网站或者远程连接工具使用的端口。本节操作以80端口为例介绍排查云服务器端口不通问题的操作步骤。如果实例无法对外提供HTTP服务,可以按以下思路检查Web服务相关的接口(默认为TCP 80)是否正常工作。在ECS管理控制台,确认安全组已经放行该端口。远程连接ECS实例,确认服务已经开启。确认端口

359866fbd3d89c6b4b0a93acc1fa4c87.png

修改裸金属服务器名称。裸金属服务器名称取值范围:只能由中文字符、英文字母(a~z,A~Z)、数字(0~9)、下划线(_)、中划线(-)、点(.)组成,且长度为[1-63]个字符。本接口只修改裸金属服务器的实例名称,但hostname不能同步修改。重启裸金属服务器后生效。PUT /v1/{project_id}/baremetalserve

e8856eb4a33744e9e363326f14bf7b97.png

在不影响业务的情况下,通过容灾演练,模拟真实故障恢复场景,制定应急恢复预案,检验容灾方案的适用性、有效性。当真实故障发生时,通过预案快速恢复,提高业务连续性。存储容灾服务提供的容灾演练功能,在演练VPC(该VPC不能与容灾站点服务器所属VPC相同)内执行容灾演练。当容灾演练服务器创建完成后,生产站点服务器和容灾演练服务器同时独立运行,数据

c2f51807c80a3c0a9fb1f931f2bad396.png

会。弹性云服务器运行在物理机上,虽然提供了多种机制来保证系统的可靠性、容错能力和高可用性,但是,服务器的硬件、电源等部件仍有较小概率的损坏。如果物理设备的损坏导致物理机电源无法正常工作或重启,会导致CPU和内存数据丢失,无法进行热迁移来恢复弹性云服务器。云平台默认提供了自动恢复功能,以冷迁移的方式重启弹性云服务器,使弹性云服务器具备高可靠

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值