星融元asterfusion-优快云博客

原创动态WCMP+Flowlet ALB：双引擎驱动智算网络负载均衡

人工智能（AI），特别是大规模模型训练和推理，正以前所未有的方式重塑数据中心网络。传统的“尽力而为”网络架构，在处理海量、突发的AI数据洪流时捉襟见肘。AI模型对网络性能的严苛要求——高带宽、低延迟、零丢包——迫使网络必须进行一场深刻的智能进化，从被动的基础设施转变为理解业务、感知状态、智能决策的“AI感知网络”。

2025-06-20 14:50:57 729

原创多租户园区网络革命：云化架构+极简运维，破解千企接入难题

新一代云化园区网解决方案，创新性地将数据中心级的Spine/Leaf架构以及“全三层”、“云架构”、“超堆叠”、“云漫游”等设计理念应用于园区场景，显著提升网络服务质量和运维水平。面对多租户场景下更严苛的资源隔离、安全保障和自动化运维需求，本方案提供了系统性解决思路

2025-06-16 16:04:40 918

原创突破AI瓶颈：基于实时感知的智能选路实现智算负载均衡优化

为了从根本上优化AI流量的传输效率并最大化集群利用率，我们设计并实践了基于多维度网络状态感知的动态智能选路技术。该技术的核心创新在于，聚焦关键影响因子，摒弃单一指标，精准识别并引入在AI集群网络环境中对性能影响最为显著的动态参数作为核心计算因子…

2025-06-13 15:08:43 782

原创一机多用，解耦未来！如何一站式搞定中小企业网络、路由、安全

基于开放架构的智能业务处理平台，通过算网融合芯片与模块化设计，实现软硬件解耦，将网络、路由、安全等功能集成于单一设备，为中小企业提供高性能、易维护的一体化解决方案。

2025-06-09 14:17:36 102

原创破解空口资源困局！云园区网络如何实现无线性能倍增？

无线空口是无线通信系统中，用户设备与基站之间通过无线电波进行信息传输的接口规范的总称。你可以把它理解为移动设备（如手机、平板、物联网设备）和网络基站（如蜂窝基站、Wi-Fi路由器）之间“看不见的数据高速公路”。它定义了信号如何在空中“行走”的规则。

2025-06-03 13:35:19 540

原创算力革命：RoCE实测推理时延比InfiniBand低30%的底层逻辑

本文将深度解析 AI 智算场景打造的800G AI RoCE交换机，从外部规格的硬件创新到内部架构的芯片级设计，从企业级操作系统的功能突破到实测数据的性能验证，全方位展现其如何通过领先的技术架构破解 AI 训练与推理中的网络效率瓶颈，助力数据中心在高带宽、低延迟、高可靠性的需求下实现算力资源的最优配置。

2025-05-27 18:24:31 630

原创如何破解GPU集群集合通信路径的“黑盒”难题？

集合通信库（如NCCL、HCCL）的运行细节用户完全无感知，形成“黑盒”状态。EPS通过实时解析集合通信库的底层运行状态，将隐蔽的通信路径、GPU与网卡状态等信息可视化，并提供智能路由推荐，帮助用户快速优化集群性能。

2025-05-22 09:59:47 692

原创从被动响应到主动防御：云化重构下园区网络运维的范式突围

随着企业数字化转型加速，传统园区网络架构在运维效率、成本控制等方面面临严峻挑战。星融元基于云原生理念打造的园区网络解决方案，通过前两阶段的技术架构革新，已成功实现中大型园区基础网络的云化重构。本文将重点阐述进入运维阶段的三大核心能力体系。

2025-05-19 17:19:59 900

原创企业网络新选择：软件定义架构下的MPLS

随着现代企业园区网络和运营商级基础设施的不断发展，多协议标签交换（MPLS）已成为一项基础技术，这要归功于其高效的数据包转发、高级流量工程功能以及对多租户环境的强大支持。

2025-05-14 18:21:45 766

原创 AI驱动网络范式革新：Smart Switch与智能路由的协同进化

在GPT-4o参数规模突破10万亿、千卡集群成为AI训练标配的今天，全球互联网正经历着前所未有的流量风暴。当单次模型训练可产生相当于YouTube全球三日流量的数据洪流，当分布式推理系统要求微秒级延迟保障，传统网络架构的流量调度机制正面临系统性崩塌。路由技术如何破局AI流量洪峰？

2025-05-12 16:33:56 783

原创开放网络渗透率激增！从Gartner魔力象限看SONiC战略机遇

作为唯一获Gartner荣誉提名并专注SONiC的厂商，星融元（Asterfusion）提供“开箱即用”的企业级SONiC解决方案。场景覆盖广，持从AI智算中心到企业园区的跨场景部署，并增强VXLAN、BGP EVPN等企业级功能。兼容多风格CLI，弥补社区版短板，助力企业平滑过渡至开放网络。技术前瞻性，通过软硬一体交付，将前沿工程经验产品化，为传统厂商的“白盒化挑战”提供解题思路。

2025-05-07 15:30:14 842

原创 6GHz频段受限：WiFi 7部署的“最后一公里”难题如何破局

随着万物互联时代的加速到来，无线网络面临前所未有的挑战！高密度设备接入、低时延交互需求（如元宇宙、8K流媒体）、复杂电磁环境下的稳定性要求等，驱动着WiFi技术的持续革新。作为IEEE 802.11be标准的最新成果，WiFi 7（第七代WiFi）在WiFi 6的基础上实现了多维度的技术跃迁，旨在突破现有网络性能瓶颈，为未来智能场景提供更高效的无线连接方案。

2025-05-06 15:01:57 892

原创万亿参数大模型网络瓶颈突破：突破90%网络利用率的技术实践

近年来，随着AI大模型训练（如GPT-4、Gemini）的爆发式增长，数据中心网络的流量压力急剧上升。单次训练任务可能涉及数千张GPU卡协同工作，生成集合通信流量（All-Reduce、All-to-All等），网络面临高并发、低延迟、无损传输的严苛需求。然而，传统以太网的网络利用率长期徘徊在35%~40%，成为制约AI算力释放的关键瓶颈。

2025-04-28 13:49:05 740

原创中大型园区网络业务开通「极简流程」：从规划到上线30分钟全攻略

“30分钟内，为中大型园区开通有线无线双网并实现统一管理”——这一目标绝非纸上谈兵。依托新一代云化园区网络解决方案，企业可轻松实现“即插即用”的极简组网体验。

2025-04-24 10:45:09 582

原创开箱即见真章：RoCE交换机的硬件架构到底藏着哪些颠覆性设计？

560ns 超低转发时延、64×800G OSFP 高密度接口、TL10单芯片架构、超大片上缓存、板间无缆互联、定制级 PTP和AI 模块。

2025-04-21 17:41:14 1015

原创智算网络新标杆：全栈AI方案如何实现无损带宽与多租户隔离？

在云数据中心与智算中心场景中，多租户网络需实现物理基础设施的共享与租户间逻辑隔离的平衡。其技术实现通常依赖虚拟化技术（如VLAN、VXLAN），但随规模扩展，配置复杂度陡增。若隔离策略或地址规划不当，可能导致租户间业务冲突，甚至引发数据泄露风险。

2025-04-14 18:33:14 916

原创体验为王：云化园区网络如何重塑用户业务零卡顿时代

从企业的多分支组网，到智能园区的物联网融合，云园区控制器展现的不仅是技术迭代，更是网络建设范式的根本转变。通过将TIP开放标准与云原生架构结合，我们正在重新定义园区网络的"现代化"内涵，这不再局限于带宽升级，而是通过架构解耦让网络像云计算一样弹性伸缩，通过开源生态打破传统设备厂商的绑定困局，最终让智能园区的数字化转型驶入快车道。

2025-04-07 17:51:40 1011

原创多网卡场景智能路由新思路：批量自动配置？

当传统路由设置方法在智算环境下失效，一个可行的应对方式是提前规划GPU服务器内的路由，借助Linux的多路由表和策略机制实现更加灵活、精细的流量控制和路由管理功能，但也伴随着一定的复杂性和潜在风险。主要表现为流量路径选择错误、默认路由冲突、策略路由配置复杂等问题。

2025-03-31 14:46:42 412

近年来，千亿至万亿参数规模的大语言模型（LLM）训练已成为人工智能领域的核心战场。随着模型复杂度的指数级增长，并行计算与网络拓扑的协同设计逐渐成为突破算力瓶颈的关键挑战。在，全局梯度同步（All-Reduce）对网络带宽提出严苛要求。早期的CLOS架构凭借无阻塞特性支撑了大规模集群的扩展，但其高昂的硬件成本与能效问题催生了Dragonfly等低直径拓扑的兴起，通过自适应路由减少跨节点跳数。与此同时，中的张量切分与流水线编排，则依赖于NVLink域内直连或Torus环形网络的低延迟特性，减少通信开销。

2025-03-24 18:27:58 1086

原创 PTP协议赋能高精度时间同步网络

PTP（精确时间协议，Precision Time Protocol）是一种基于IEEE 1588标准的网络时间同步协议，旨在为分布式系统中的设备提供亚微秒级（甚至纳秒级）的高精度时钟同步。其核心目标是通过消除网络传输延迟的不确定性，确保跨设备的动作、数据采集或控制指令在严格统一的时间基准下执行。

2025-03-14 14:50:15 1184

原创从30%丢包到零延迟：DeepSeek大规模集群通信优化的关键技术解析

近年来，生成式人工智能（Generative AI）的突破性发展，将大语言模型（LLM）和深度学习系统的算力需求推向了前所未有的量级。

2025-03-10 12:03:32 994

原创尝试私有化部署DeepSeek？至少九成工程师会忽略这一点

近期，DeepSeek 已成为各行业关注的焦点。其卓越的语言理解和生成能力使其能够精准处理各种复杂的自然语言任务，无论是文本生成、语义理解还是智能对话，都能轻松应对。随着 DeepSeek 的迅速走红，众多厂商纷纷加入这一技术浪潮，积极接入这一强大的语言模型。从互联网科技巨头到传统制造业企业，从金融行业到教育领域，DeepSeek 的应用范围不断扩大，成为推动企业数字化转型和智能化升级的重要力量。在此趋势下，越来越多的企业开始选择私有化部署 DeepSeek，以更好地满足自身业务需求。

2025-03-05 17:57:59 698

原创 RDMA网络监控攻略！共享开放技术成果

RDMA技术对网络丢包非常敏感，因此，为了充分发挥RDMA的性能，需要构建一个无丢包的网络环境，即无损网络，通过PFC（优先级流量控制）和ECN（显式拥塞通知）等技术，确保网络在高负载情况下仍能保持低延迟和高吞吐量。这种技术显著降低了延迟和CPU开销，提高了数据传输的效率。SNMP监控的应用场景其实相对广泛，比如监控路由器、交换机、防火墙等网络设备的接口流量、CPU利用率、内存使用情况、服务器硬件的硬盘空间、电源状态等，但SNMP监控也存在轮询机制导致的数据收集实时性较弱、可扩展性弱、配置管理繁琐等问题。

2025-03-03 11:29:24 1056

原创园区网破局（一）：看云化路由设计如何引领网络升级

在数字化转型的浪潮中，传统园区网络面临着诸多挑战，逐渐难以满足企业日益增长的业务需求。在架构层面，传统园区网络多采用 “接入 - 汇聚 - 核心” 的三层架构，容易产生二层网络广播风暴、网络环路等问题，可靠性、易拓展性也有待提高......在运维方面，网络部署需要网络管理员手工通过命令行或 Web 管理等方式，逐台配置设备。对于规模较大的园区，手工重复工作量大，配置繁琐，新业务上线周期长。一旦网络出现故障，定位和解决问题往往依赖专业人员的运维经验，故障排查时间长，影响业务正常运行......

2025-02-21 14:08:12 1079

原创最新消息！P4 软件开发环境（Intel P4 Studio SDE）现已开源

Intel P4 Studio 软件开发环境 (SDE)是一套支持用户使用P4语言对P4可编程以太网交换机数据面进行编程的软件包，编译好的数据面程序可以运行在Tofino芯片上或是SDE中的模拟芯片上。该软件包还包含用于构建和安装 SDE 的脚本。

2025-01-24 14:15:48 531

原创浅谈VPP与DPDK技术以及产业界应用实例

与矢量包处理相对的是传统的“标量（scalar）”处理。在标量处理模式下，系统一次仅处理一个数据包，完成整个包处理流程后再处理下一个包。在这种模式下，每个数据包都需要独立分配计算资源、缓存管理、并经历上下文切换。当网络I/O速度很高时，这些额外的开销与处理单个包的时间相近，导致效率低下。批量处理多个数据包：VPP通过将一组数据包（典型为64个或更多）组合成一个“矢量”，在每个节点中一次性对这些数据包进行处理。

2025-01-21 15:48:24 1106

原创 [A-Lab]部署教程：在VM上进行Soft-RoCE的功能验证与性能测试

本文档主要讲解如何在RHEL的社区发行版Rocky8.5系统上配置部署SoftRoCE，进行TCP/IP模式和SoftRoCE模式的性能对比测试，以及是否可以正常运行MPI应用。

2025-01-17 10:10:00 492

原创 2024星融元年度盘点

更多详细信息，请前往。

2025-01-09 16:41:15 116

原创 SONiC交换机 PK IB交换机，是“越级碰瓷”还是“有点东西”？

聊起AI、HPC或其他无损传输网络场景，RoCE or IB 无疑是个老生常谈的话题了。简言之：RoCE 实际上只是将成熟的IB传输层和RDMA移植到了同样成熟的以太网和IP网络上。IB因其是最早支持RDMA的协议，起步早，技术成熟，在一整套专用软硬件体系加持下，可提供极致的低时延传输性能，但同时也因供应商唯一，导致整体TCO较高。与之相对的，RoCEv2在互操作性和成本上的显著优势被认为更适合大规模部署，例如今年xAI公司在美国孟菲斯建设的十万卡AI集群，便是使用400GbE以太网构建的无损高速网络。

2025-01-09 16:36:41 1084

星融元国产高性能DPU智能网卡，即将开源！

空空如也