随着人工智能技术的不断发展,边缘计算(Edge Computing)已成为企业创新与数字化转型的重要引擎。如何在有限的计算资源下,实现高速且精确的 AI 推理任务,是企业面临的主要挑战之一。Axelera AI 凭借其卓越的 AI 加速解决方案,致力于协助企业快速部署高性能、低功耗的边缘计算平台,广泛应用于智慧城市、智慧交通及工业检测等领域。接下来说明 Axelera AI 产品特色与技术重点(Key Features and Technologies)。
Axelera AI 提供的 AI 加速产品具有以下特色与技术优势:
- Voyager SDK 的易用性和集成性: 支持 ONNX,这是一种为机器学习设计的开放式文件格式,用于存储训练好的模型。可以让不同的人工智能框架,例如 Pytorch、MXNet,采用相同的格式存储模型数据并进行交互使用,从而实现易于集成和快速部署。
- 高性能AI模型推理加速: 通过独有的软硬件协同优化技术,大幅提升推理效率并降低功耗。Metis AIPU 支持在 INT8 精度下高达 214 TOPS,ResNet-50 推理速度可达3,200帧每秒,远超同级加速器,并且根据 Axelera 公布的基准测试结果,结合其 Voyager SDK,Metis 的平均推理速度超越主要竞品。它的速度比 Hailo-8(26 TOPs)快约10倍,比高通的骁龙X(Snapdragon X 45 TOPs)快约4倍,在某些情况下甚至可以媲美 NVIDIA Jetson Orin AGX,性价比也令人印象深刻。在 M.2规格的开发版中,竞争对手寥寥无几,主要包括 Hailo、Google Coral、Kneron、DeepX 和 Sima.ai。就原始性能而言,Metis M.2 是目前最快的选择之一。
- 软硬件协同加速: Voyager SDK 可自动处理量化、模型优化、前后处理并行执行(推理在 AIPU 上进行,其他处理可在 CPU/GPU 上并行执行),进一步缩短从图像输入到结果输出的整体延迟。
- 多核可以同时处理多个模型: Metis AIPU 可选择将四核心并发运行于单一大型模型,或独立执行多个轻量模型,支持多流、多任务 AI pipeline,用于复杂图像分析,例如多摄像头或多阶段处理。
- 功耗表现卓越: Axelera AI提供的产品,在边缘设备中实现了高性能与低功耗的理想平衡。高效能达到15 TOPS/W,其推理计算与功耗比极具竞争力,典型运行功耗仅为8–15 W。Metis PCIe 模块的实测功耗范围在8到15瓦之间,而M.2卡的功耗更低,可低至3.5 W,峰值不超过9 W,非常适合用于功耗敏感的嵌入式或无风扇系统,适用于功耗严格限制的嵌入式与边缘设备。
- 支持动态频率调整(降频): 可根据实际运行需求调整时钟,以进一步降低功耗并优化性能/能耗比。Metis AIPU内置降频功能,能够根据实际运行场景动态调整运算时钟,灵活降低功耗。同时通过Voyager SDK智能配置,保持高效的fps/W,更适合在不同使用场景下实现功耗优化与性能兼顾。
- D-IMC 架构优化能量使用: 利用数字内存计算(Digital In-Memory Computing)减少数据搬移,避免能源浪费,是高性能结合低功耗的核心。
-
完整的开发生态圈: 通过开源的GitHub平台,提供详尽的SDK安装指南、模型转换流程以及丰富的部署示例,简化开发过程。
Axelera Github: https://github.com/axelera-ai-hub/voyager-sdk/blob/release/v1.3/README.md
再来说到应用案例分析,Axelera AI 已在实际应用案例中展现了显著的性能提升,以下是几个案例分析:
-
智慧交通 - 实时 AI 推理性能:使用 Metis AIPU 配合 Voyager SDK 处理视频流的性能可超过 780 FPS,彰显其具备超高吞吐能力,非常适用于交通监控与车辆检测等实时应用场景。以交通流量为例,将获取的原始数据或采用实时的摄像头来截取车流数据,可以计算特定时段的车流量数据,用于智慧交通的规划。
-
工业自动化与质量检测:在工业制造领域,Axelera 强调 Metis AIPU 能在不损失准确度的前提下,提供GPU水平却更低功耗的机器视觉性能,说明其能够在生产线上实时完成缺陷检测与分拣,相较人工具备更高的速度与精确度。以水果工厂为例,可在流水线上实时完成缺陷检测与分拣,从而节省人工筛选的时间成本。
图片出处:Axelera
- 仓储自动化多串流实时识别:也有企业导入 Metis M.2 卡,进行仓储订单核对系统,使用四路 1080p 高清影像进行实时手部与物体检测,以高兼容性和低功耗成功取代传统工业电脑。
Axelera AI边缘计算加速方案凭借其卓越的性能、极佳的功耗效率以及简便的部署流程,能够有效帮助企业提升运营效率并降低整体成本。建议各行业的企业引入该方案,以有效增强产品和服务质量,推动企业智慧创新的发展。
►场景应用图
►产品实体图
►展示板照片
►方案方块图
►核心技术优势
1. Metis AIPU芯片:INT8量化高达214 TOPS,提供卓越的推理性能和低功耗表现。
2. 数字记忆体内运算(Digital In-Memory Computing, D-IMC):显著减少数据搬移需求,大幅提升能量效率。
3. Voyager SDK软硬协同优化技术:自动化模型量化、编译及部署,实现性能最大化和易用性提升。
4. 多核弹性运用:支持多串流推理、单一大型模型并行处理,灵活适应复杂应用场景。
5. 低功耗设计(Low-Power Design):PCIe模块功耗为8–15W,M.2模块功耗仅为3.5–9W,专为边缘部署设计。
6. Downclock技术(动态时钟调整):动态平衡功耗与性能,可根据不同实际需求灵活调整。
►方案规格
1. 推理性能:高达 214 TOPS (INT8 精度)
2. 模型支持 ONNX
3. 典型推理 FPS:ResNet-50 模型 3,200 FPS 以上
4. PCIe 版本功耗:典型 8–15W
5. M.2 版本功耗:典型 3.5–9W
6. 软硬件接口支持:PCIe Gen3 x4, M.2 接口 (2280 规格)
7. SDK:Voyager SDK (量化、优化、自动部署)
8. 支持操作系统:Linux (Ubuntu)
9. 编程语言支持:Python, C++