OpenStack虚拟机迁移的排错经历

一、热迁移的排错经历

先来看下cpu型号,从/proc/cpuinfo中可以看出所有cpu型号版本是一样的

wKioL1g85vriY4jFAAD7Rbyu3nk172.png

 

通过nova live-migration --debug <instance-xxx>  <node-xxxx>命令行迁移,可以看到报错信息

wKiom1g86LeDQQaNAAFwNs66wbg124.png

 

通过nova-compute log错误信息定位代码

wKiom1g86YfBVRfHAAEHYaq5nuc718.png

 

 

再下面就到libvirt.py了

wKiom1g86oKh7qLlAABbMIIgtzY794.png

通过这个api,看不出具体错误信息,可能是跟flags是0有关系。

 

 

通过debug代码,保存cpu xml信息到某个文件

wKiom1g87EPR-a5YAAHdqUXeegM282.png

 

通过virsh接口可以看到错误, 舒了一口气!

wKiom1g87Mqxo9xuAADXl8op5Xk929.png

一样的cpu不一样的cpu features,亮瞎我了!

 

对比宿主机的cpu flags,真的差了一个monitor特性,后面查到是曙光服务器的bios版本不一致,涨姿势了!

wKioL1g87ovxtUyhAAIF2kcoIz4786.png

 

kvm是支持实例以指定的cpu启动,通过在/etc/nova/nova.conf中配置cpu_mode和cpu_model

 

[libvirt]

cpu_mode=custom

cpu_model=kvm64

 

重启openstack-nova-compute服务生效,如果要对已存在的实例生效,需对其硬重启。 在cpu配置为kvm64下 window 2012R2 vm启动会有问题,症状跟在这里描述的一样:https://bugzilla.redhat.com/show_bug.cgi?id=1086319

 

对应的qemu、libvirt版本:

qemu: 1.5.3

libvirt: 1.2.17

 

 

 

二、冷迁移的排错经历

如果nova-scheduler节点nova.conf中的scheduler_default_filters配置项有AvailabilityZoneFilter这个配置,然后改了availability-zone(默认为nova),改为其它名字。 冷迁移的时候走调度,结果AvailabilityZoneFilter过滤后没有匹配的主机了。

 

 

class AvailabilityZoneFilter(filters.BaseHostFilter):
    """Filters Hosts by availability zone.
    Works with aggregate metadata availability zones, using the key
    'availability_zone'
    Note: in theory a compute node can be part of multiple availability_zones
    """
    # Availability zones do not change within a request
    run_filter_once_per_request = True
    
    def host_passes(self, host_state, filter_properties):
        spec = filter_properties.get('request_spec', {})
        props = spec.get('instance_properties', {})
        availability_zone = props.get('availability_zone')
        
        if not availability_zone:                                            #第一次创建虚拟机的时候,还有availability_zone,返回是true
            return True
        metadata = utils.aggregate_metadata_get_by_host(                     #对已创建好的虚拟机;有两种判断
                host_state, key='availability_zone')
        if 'availability_zone' in metadata:                                    #1、给主机聚合设置元数据
            hosts_passes = availability_zone in metadata['availability_zone']
            host_az = metadata['availability_zone']
        else:
            hosts_passes = availability_zone == CONF.default_availability_zone    #2、跟default_availability_zone(默认也为nova)配置项比较
            host_az = CONF.default_availability_zone
        
        if not hosts_passes:
            LOG.debug("Availability Zone '%(az)s' requested. "
                      "%(host_state)s has AZs: %(host_az)s",
                      {'host_state': host_state,
                       'az': availability_zone,
                       'host_az': host_az})
        return hosts_passes

 

### OpenStack 虚拟机迁移教程与 API 在 OpenStack 中,虚拟机迁移是一种常见的操作,用于优化资源使用或维护环境。OpenStack 提供了冷迁移和热迁移两种方式来实现虚拟机迁移[^1]。 #### 冷迁移迁移是指将处于关机状态的虚拟机从一个计算节点迁移到另一个计算节点。这种迁移不会影响存储卷的位置,但需要关闭虚拟机实例。冷迁移的命令如下: ```bash openstack server migrate --os-compute-api-version 2.30 <server-id> ``` 上述命令通过 OpenStack CLI 发起冷迁移请求,其中 `--os-compute-api-version` 参数指定了 API 版本[^1]。 #### 热迁移迁移(也称为在线迁移)允许在不停止虚拟机的情况下将其从一个计算节点迁移到另一个计算节点。这要求共享存储环境的支持,例如 NFS 或 Ceph。热迁移的命令如下: ```bash openstack server migrate --live <destination-host> <server-id> ``` 在执行热迁移时,目标主机必须具有足够的资源,并且源主机和目标主机之间的网络连接必须正常[^2]。 #### API 调用 除了通过 CLI 执行迁移外,还可以通过 OpenStack 的 Compute API 来调用迁移功能。以下是热迁移的 API 示例: ```http POST /servers/{server_id}/action HTTP/1.1 Host: compute.example.com Content-Type: application/json X-Auth-Token: {auth_token} { "os-migrateLive": { "host": "destination_host", "block_migration": false, "disk_over_commit": false } } ``` 上述 API 请求中,`os-migrateLive` 表示发起热迁移操作,`host` 参数指定目标主机名称,`block_migration` 和 `disk_over_commit` 控制迁移行为[^3]。 #### 迁移过程详解 虚拟机迁移的过程可以分为以下几个阶段: 1. **预迁移阶段**:通知目标主机准备接收虚拟机实例,并返回相关数据。 2. **实际迁移阶段**:执行虚拟机内存、磁盘等资源的迁移。 3. **后迁移阶段**:确认迁移成功后,清理源主机上的虚拟机资源。 4. **回滚阶段**:如果迁移失败,则销毁目标主机上的临时数据,并恢复源主机的状态[^3]。 #### 注意事项 - 热迁移需要共享存储支持,否则必须启用块设备迁移(`block_migration=True`)。 - 目标主机必须满足虚拟机运行所需的资源条件。 - 在大规模环境中,建议监控迁移过程中的性能指标以避免对生产环境造成影响。 ```python # 示例代码:通过 Python SDK 实现热迁移 from openstack import connection conn = connection.Connection(auth_url="http://auth.example.com/v3", project_name="demo", username="admin", password="password", user_domain_id="default", project_domain_id="default") server = conn.compute.find_server("server_id") conn.compute.live_migrate_server(server, host="destination_host", block_migration=False) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值