云数据中心网络解决方案中的华为组件解析
1. 物理CloudEngine交换机概述
华为CloudEngine数据中心(DC)交换机有物理和虚拟两种形式,负责网络流量的转发,是云数据中心网络(DCN)解决方案的基石。这些高性能交换机专为DC场景设计,可构建智能、优质、弹性、虚拟且灵活的网络,为云DCN的建设提供坚实基础。云DCN面临着诸多挑战,而CloudEngine DC交换机能够有效应对:
-
大数据需要大带宽
:随着大数据、智慧城市、移动互联网和云计算等服务的快速发展,网络流量每年显著增加,对DC交换机的容量提出了更高要求。例如,服务器的接入带宽已提升至10 Gbit/s,并朝着25 Gbit/s发展,网络的上行接口也从100GE向400GE演进。CloudEngine DC交换机支持从25 Gbit/s和100 Gbit/s平滑过渡到400 Gbit/s,以满足未来网络扩展的需求。
-
网络需要资源池化和自动化
:为满足计算和存储资源的弹性调度需求,云DCN需具备大型资源池,实现资源池化。同时,在云计算时代,服务更新迅速,需要实现网络的自动部署。
-
资源池化
:网络资源池化使云DCN从传统网络向虚拟网络演进,这要求DC交换机支持多种虚拟化技术,包括设备虚拟化和网络虚拟化。设备虚拟化可优化单节点的可靠性和网络链路的效率,如CloudEngine DC交换机支持VS、CSS、iStack和M - LAG等技术。网络虚拟化则在传统物理网络之上构建虚拟覆盖网络,实现网络资源的灵活分配和池化,例如支持VXLAN BGP EVPN和基于IPv6的VXLAN技术。
-
自动部署
:自动网络部署分为物理网络服务(如接口、IP地址和路由)的自动部署和逻辑网络服务(如VXLAN和租户VRF)的自动部署。CloudEngine DC交换机支持基于Python的ZTP,可通过调用RESTCONF接口自动配置交换机;同时,它还提供API,支持与各种SDN控制器(如华为iMaster NCE - Fabric和VMware)和第三方工具(如DevOps)连接,并支持标准NSH和段路由等标准网络模型。
-
网络需要为服务提供可靠基础
:云DCN需要在设备、网络和控制器层面提供高可靠性。CloudEngine DC交换机在设备层面支持多种高可靠性和安全特性,如CPU攻击防御、优雅重启(GR)和BFD等,还采用了传统的硬件可靠性机制,如双主处理单元(MPUs)、双电源以及转发平面和控制平面分离等。在网络层面,它支持高可靠性的交换网络设计和分布式网络解决方案,如支持多达128条ECMP路径进行负载均衡,以及支持堆栈或iStack、M - LAG和VXLAN BGP EVPN分布式网关。
-
DC运维需要智能化
:随着云DCN的规模、流量和网元数量的急剧增加,智能运维变得至关重要。CloudEngine DC交换机提供以下功能支持智能运维:
-
高精度订阅数据收集
:传统网络通常通过SNMP收集信息,效率低下。CloudEngine DC交换机支持基于Google远程过程调用(gRPC)接口的遥测技术,可将轮询周期缩短至不到一秒,并能合并多个任务进行处理,提高收集效率。
-
全路径检测和实时监控
:通过与SDN控制器协作,CloudEngine DC交换机可实现全路径检测。控制器通过模拟服务数据包并发送到交换机,检测整个网络的路径并生成网络路径热图,快速定位故障并了解网络状态。同时,可使用互联网数据包守恒算法(iPCA)基于实际服务数据包准确定位服务故障,并与控制器协作实现可视化实时监控。
2. 技术亮点:从25GE、100GE到400GE的演进
2.1 25GE标准
- 标准起源 :2014年,微软在北京的IEEE会议上首次提出25GE项目启动请求,但被拒绝。后来,微软、高通等厂商成立了25GE以太网联盟并进行研究。为避免25GE成为事实上的标准,IEEE于2014年7月通过了25GE项目。实践证明,25GE标准能经济高效地扩展网络带宽,为下一代服务器和存储解决方案提供更好支持,并涵盖更多互连场景。
-
应用场景及优势
:25GE标准主要应用于下一代DC的服务器接入,相较于40 Gbit/s,具有以下优势:
- 技术实现优势 :25GE中,串行器/解串器(SerDes)是关键技术,已广泛应用于各种电路和光纤通信技术中。25GE仅需一个25 Gbit/s的SerDes通道,而40GE接口由四个并行的10GE链路组成,需要四个SerDes通道。在聚合和骨干层,100GE接口逐渐成为主流,其基于四个25 Gbit/s通道运行,为25GE标准奠定了基础。
- 交换机性能提升 :与现有的10GE解决方案相比,单通道25GE解决方案的性能提高了2.5倍,并且25GE交换机的端口密度高于用于机架服务器连接的40GE交换机。
- 现有拓扑平滑演进,降低成本 :40GE交换机使用QSFP +光模块,成本高且与10GE接口不兼容,升级时需要更换现有光纤。而25GE交换机使用SFP28光模块,与10GE SFP光模块类似,可实现10GE到25GE的无缝升级,无需重新规划拓扑或重新部署电缆,降低了资本支出。目前,主流DCN通常采用10GE/40GE网络架构,未来将向25GE/100GE网络架构演进,一些互联网巨头已经大规模部署了25GE/100GE网络。
2.2 100GE标准
- 光模块标准化 :最初,各厂商的光模块形式和尺寸各不相同。IEEE 802.3工作组在光模块标准化方面发挥了重要作用,多源协议(MSA)根据IEEE标准定义了统一的光模块结构。2012年,IEEE发布了多个100GE标准,IEEE和MSA共定义了十多个100GE标准,涵盖了不同距离的100GE上行场景。
-
标准应用及比较
:100GBASE系列标准由IEEE 802.3制定,不同标准适用于不同的传输距离。在DC中,IEEE 100GBASE系列标准可支持长距离和短距离传输,其中100GBASE - SR4和100GBASE - LR4使用最为频繁。但在大多数DC互连场景中,100GBASE - SR4的传输距离过短,100GBASE - LR4的成本过高。对于中距离传输,MSA提出的并行单模4通道(PSM4)和粗波分复用4通道(CWDM4)标准是经济有效的选择。
- CWDM4与LR4比较 :CWDM4和LR4在通道间距、激光器和温度控制要求等方面存在差异。CWDM4的通道间距为20 nm,使用单直接调制激光器(DML),对温度控制要求较低;而LR4的通道间距为4.5 nm,使用电吸收调制激光器(EML),需要热电器冷却器(TEC)驱动芯片。因此,100GBASE - LR4光模块的成本高于100G CWDM4光模块。
- PSM4与CWDM4比较 :100G PSM4规范定义了通过八条单模光纤实现点对点100 Gbit/s链路的要求,每条光纤传输25 Gbit/s。虽然CWDM4的光模块成本高于PSM4,但它只需要两条单模光纤进行信号传输和接收,而PSM4需要八条,因此随着传输距离的增加,PSM4的光模块成本会增加。
- 光模块发展趋势 :光模块的发展趋势是高速率、高密度、低成本和低功耗。最初使用的C - 形式因子可插拔(CFP)模块逐渐演进为CFP2、CFP4,最终发展为流行的QSFP28模块。经过几代发展,100GE光模块已经成熟,新的100G MSA标准不断涌现,推动了相关产业链的可持续发展。
2.3 400GE标准
- 标准制定 :IEEE 802.3工作组负责定义400GE标准。2013年,IEEE启动了400GE标准项目,并于2018年正式发布了400GE和200GE标准(IEEE 802.3bs)。这些标准的关键方面包括分层结构、前向纠错(FEC)规范和物理光接口传输机制。
-
传输距离和编码方案
:不同的400GE标准具有不同的传输距离和编码方案,如下表所示:
| 标准 | 传输距离 | 编码模式 |
| — | — | — |
| 400GBASE - SR16 | 100 m | 16 × 25 Gbit/s NRZ |
| 400GBASE - DR4 | 500 m | 4 × 100 Gbit/s PAM4 |
| 400GBASE - FR8 | 2 km | 8 × 50 Gbit/s PAM4 |
| 400GBASE - LR8 | 10 km | 8 × 50 Gbit/s PAM4 |
采用PAM4编码的400GBASE - DR4、400GBASE - FR8和400GBASE - LR8标准成为关注焦点。PAM4信号使用四个信号电平进行传输,在相同波特率下,其传输效率是NRZ信号的两倍,因此被IEEE定义为400GE电信号标准。
-
光模块结构和类型
:400GE MAC使用400G AUI - 16接口通过物理编码子层(PCS)和物理介质附件子层(PMA)将数据传输到400GE CFP8光模块。在数据传输过程中,PMA将16个通道聚合为8个通道,并将调制码转换为PAM4。CFP8光模块功耗高、体积大,不适合DCN,因此采用了Quad Small Form Pluggable(QSFP)和QSFP - Double Density(DD)形式因子的光模块。不同光模块的比较如下表所示:
| 形式因子 | 尺寸(mm) | 功耗(W) | 电气接口通道 | 光接口通道 |
| — | — | — | — | — |
| CFP8 | 107.5 × 41.5 × 12.5 | 12 - 18 | 16 × 25 Gbit/s | 8 × 56 Gbit/s |
| QSFP | 107.8 × 22.6 × 13.0 | 12 - 15 | 8 × 56 Gbit/s | 8 × 56 Gbit/s |
| QSFP - DD | 89.4 × 18.4 × 8.5 | 7 - 10 | 8 × 56 Gbit/s | 4 × 100 Gbit/s |
综上所述,华为CloudEngine DC交换机通过支持从25GE、100GE到400GE的演进,以及提供多种虚拟化和高可靠性技术,为云DCN的发展提供了强大的支持,能够满足不断增长的网络需求。在未来的网络建设中,这些交换机将在提高网络性能、降低成本和实现智能运维等方面发挥重要作用。
3. 技术演进流程与关键技术点总结
3.1 技术演进流程
为了更清晰地展示从25GE、100GE到400GE的技术演进过程,下面通过mermaid格式流程图呈现:
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
A([开始]):::startend --> B(25GE标准提出):::process
B --> C(100GE标准制定与发展):::process
C --> D(400GE标准启动与发布):::process
D --> E([结束]):::startend
B1(解决服务器NIC过渡问题):::process --> B
B2(经济高效扩展带宽):::process --> B
C1(光模块标准化):::process --> C
C2(满足不同传输距离需求):::process --> C
D1(分层结构与FEC规范):::process --> D
D2(采用PAM4编码):::process --> D
这个流程图展示了技术演进的主要阶段,从25GE标准为解决服务器相关问题而提出,到100GE标准在光模块标准化和传输距离适配方面的发展,再到400GE标准在编码和结构上的创新。
3.2 关键技术点总结
| 技术标准 | 关键技术点 | 优势 |
|---|---|---|
| 25GE | 单SerDes通道、与10GE无缝升级 | 技术实现简单、提升交换机性能、降低成本 |
| 100GE | 多种标准适配不同距离、CWDM4和PSM4用于中距离 | 满足不同场景需求、降低中距离传输成本 |
| 400GE | PAM4编码、QSFP和QSFP - DD光模块 | 提高传输效率、适合DCN应用 |
4. 华为CloudEngine交换机在云DCN中的应用展望
4.1 对云DCN发展的推动作用
华为CloudEngine交换机凭借其对25GE、100GE和400GE标准的支持,以及丰富的虚拟化和高可靠性技术,将在云DCN的发展中发挥关键作用。随着大数据、人工智能等技术的不断发展,云DCN对网络带宽、可靠性和智能化运维的要求越来越高。CloudEngine交换机的高性能和灵活性能够满足这些需求,推动云DCN向更高水平发展。
-
带宽提升
:支持400GE标准使得云DCN能够处理更大规模的流量,满足大数据和云计算等应用对带宽的需求。
-
可靠性增强
:多种高可靠性技术,如设备级的CPU攻击防御和网络级的ECMP路径负载均衡,保障了云DCN的稳定运行。
-
智能化运维
:高精度的数据收集和全路径检测功能,有助于及时发现和解决网络故障,提高运维效率。
4.2 未来发展趋势
未来,华为CloudEngine交换机可能会在以下方面继续发展:
-
更高的带宽支持
:随着技术的进步,可能会支持更高速率的以太网标准,如800GE甚至更高。
-
更智能的网络管理
:结合人工智能和机器学习技术,实现更智能的网络资源分配和故障预测。
-
绿色节能技术
:采用更节能的硬件设计和算法,降低交换机的功耗,实现绿色数据中心的目标。
5. 总结
本文详细介绍了华为CloudEngine交换机在云DCN解决方案中的重要作用,以及从25GE、100GE到400GE的技术演进过程。通过对这些技术的分析,我们可以看到华为CloudEngine交换机在应对云DCN面临的挑战方面具有显著优势:
- 在大数据时代,能够支持网络带宽的平滑升级,满足不断增长的流量需求。
- 通过资源池化和自动化技术,实现网络的灵活配置和高效管理。
- 提供高可靠性的硬件和网络解决方案,保障服务的稳定运行。
- 借助智能运维功能,提高网络的可管理性和故障处理能力。
在未来的云DCN建设中,华为CloudEngine交换机有望继续发挥重要作用,推动网络技术的不断进步和创新。同时,随着技术的不断发展,我们也期待交换机能够在更多方面满足用户的需求,为云DCN的发展带来更多的可能性。
超级会员免费看
1万+

被折叠的 条评论
为什么被折叠?



