本文将分享物理机管理使用场景和实践,分别是物理机相关背景、平台物理机管理架构的介绍,并结合实际场景,进行装机实践,演示物理机功能。
背景介绍
可以把物理机想象成机房的服务器,物理机都有较好的硬件配置,例如内存会达到上百G,还会使用英特尔至强系列等性能较好的CPU, 另外在磁盘方面,物理机上都有单独的RAID控制器。
RAID控制器上可以挂多块HDD机械硬盘或者SSD固态硬盘。
服务器上一般会有多块万兆网卡,可以把它们组成逻辑Bonding,能够实现网络的高可用。
比较关键的一点是,我们对物理机的要求是物理机要具备带外控制系统。
带外控制系统一般是指服务器主板上会有单独的BMC控制器,BMC控制器上可以支持IPMI和Redfish API等远程控制协议。
这种协议的好处是如果物理机上装的操作系统崩溃,但是仍然可以通过BMC控制器远程控制机器的开关机。
通过BMC 可以远程控制物理机的引导,例如从磁盘启动或网络启动,也可以远程控制开关机,甚至可以远程挂载ISO并进行装机。
所以说BMC对于物理机而言是非常重要的带外控制系统。
1、传统方式下物理机管理的痛点
当物理机的规模变大时,就会存在交付效率变低的问题,企业采购物理机数量较多,若有几十台物理机,需要将其放到机房中,把机器上架,同时记录每台物理机的硬件信息。并且人工安装操作系统,在操作系统上部署业务并交付。
这些重复操作如果手工去做,不仅时间会线性增长,而且其过程十分枯燥,效率低下,这个过程是可以自动化的。
另外,给物理机安装操作系统时,配置也比较繁琐, 一般来说,物理机需要去管理网络分配,在安装操作系统之前还要给磁盘做RAID分区,相对而言比较复杂。
每个物理机都有不同型号,例如戴尔和惠普的服务器的控制器都不同,这也需要大家区别对待,如果进行人工操作做完并交付给业务部门,当业务部门不再使用物理机,还要进行回收,又要涉及到物理机上的系统消除,后期又要重装系统再行交付,这些机械化劳动会导致企业效率低下。
2、云平台提供的管理功能
云联壹云平台可以提供多种物理机管理功能,首先,平台可以自动记录物理机的硬件信息,物理机注册到平台之后,平台会自动探测物理机的内存、cpu型号、硬盘、网卡等信息。
另外,平台能够自动给物理机安装操作系统。其中包括配置网络,分配IP,给网卡配置Bonding。
关于磁盘配置这一项,平台支持很多 RAID配置。例如RAID01、RAID5、RAID10等。另外适配的RAID控制器也相对较多,常规服务器的RAID卡都会支持,还涉及到磁盘的分区,另外就是安装操作系统。
平台支持物理机的生命周期管理,如远程进行开关机等操作,同时调整配置的操作,如添加内存也可以通过平台进行同步。
3、云平台物理机管理优势
首先,平台提供装机功能,装机可以自动化完成,规模较大时能够提升效率,同时缩短交付时间。
并且一个平台管理大规模的物理机也比较方便。
以交付100台物理机为例,如果使用传统方式,人工操作或者自动化程度较低,使用kickstart无人值守装机,所需时间也要一天以上。交付时间需要以天为单位进行计算, 而平台可以并行装机,只需30分钟即可完成,交付时间大大缩短。
在配置硬件方面,传统方式需要手动配置RAID、分区、网卡bonding,操作复杂。平台可以提供API自动化配置。
<