随着人工智能技术的不断发展,边缘计算(Edge Computing)已成为企业创新与数字化转型的重要引擎。如何在有限的计算资源下,实现高速且精确的 AI 推理任务,是企业面临的主要挑战之一。Axelera AI 凭借其卓越的 AI 加速解决方案,致力于协助企业快速部署高性能、低功耗的边缘计算平台,广泛应用于智慧城市、智慧交通及工业检测等领域。接下来说明 Axelera AI 产品特色与技术重点(Key Features and Technologies)。
Axelera AI 提供的 AI 加速产品具有以下特色与技术优势:
Voyager SDK 的易用性和集成性:支持 ONNX,这是一种为机器学习设计的开放式文件格式,用于存储训练好的模型。可以让不同的人工智能框架,例如 Pytorch、MXNet,采用相同的格式存储模型数据并进行交互使用,从而实现易于集成和快速部署。
高性能AI模型推理加速:通过独有的软硬件协同优化技术,大幅提升推理效率并降低功耗。Metis AIPU 支持在 INT8 精度下高达 214 TOPS,ResNet-50 推理速度可达3,200帧每秒,远超同级加速器,并且根据 Axelera 公布的基准测试结果,结合其 Voyager SDK,Metis 的平均推理速度超越主要竞品。它的速度比 Hailo-8(26 TOPs)快约10倍,比高通的骁龙X(Snapdragon X 45 TOPs)快约4倍,在某些情况下甚至可以媲美 NVIDIA Jetson Orin AGX,性价比也令人印象深刻。在 M.2规格的开发版中,竞争对手寥寥无几,主要包括 Hailo、Google Coral、Kneron、DeepX 和 Sima.ai。就原始性能而言,Metis M.2 是目前最快的选择之一。
软硬件协同加速:Voyager SDK 可自动处理量化、模型优化、前后处理并行执行(推理在 AIPU 上进行,其他处理可在 CPU/GPU 上并行执行),进一步缩短从图像输入到结果输出的整体延迟。
Axelera Voyager SDK
多核可以同时处理多个模型:Metis AIPU 可选择将四核心并发运行于单一大型模型,或独立执行多个轻量模型,支持多流、多任务 AI pipeline,用于复杂图像分析,例如多摄像头或多阶段处理。
功耗表现卓越:Axelera AI提供的产品,在边缘设备中实现了高性能与低功耗的理想平衡。高效能达到15 TOPS/W,其推理计算与功耗比极具竞争力,典型运行功耗仅为8–15 W。Metis PCIe 模块的实测功耗范围在8到15瓦之间,而M.2卡的功耗更低,可低至3.5 W,峰值不超过9 W,非常适合用于功耗敏感的嵌入式或无风扇系统,适用于功耗严格限制的嵌入式与边缘设备。
支持动态频率调整(降频):可根据实际运行需求调整时钟,以进一步降低功耗并优化性能/能耗比。Metis AIPU内置降频功能,能够根据实际运行场景动态调整运算时钟,灵活降低功耗。同时通过Voyager SDK智能配置,保持高效的fps/W,更适合在不同使用场景下实现功耗优化与性能兼顾。
D-IMC 架构优化能量使用:利用数字内存计算(Digital In-Memory Computing)减少数据搬移,避免能源浪费,是高性能结合低功耗的核心。
完整的开发生态圈:通过开源的GitHub平台,提供详尽的SDK安装指南、模型转换流程以及丰富的部署示例,简化开发过程。
Axelera Github:https://github.com/axelera-ai-hub/voyager-sdk/blob/release/v1.3/README.md
再来说到应用案例分析,Axelera AI 已在实际应用案例中展现了显著的性能提升,以下是几个案例分析:
1. 智慧交通 - 实时 AI 推理性能:使用 Metis AIPU 配合 Voyager SDK 处理视频流的性能可超过 780 FPS,彰显其具备超高吞吐能力,非常适用于交通监控与车辆检测等实时应用场景。以交通流量为例,将获取的原始数据或采用实时的摄像头来截取车流数据,可以计算特定时段的车流量数据,用于智慧交通的规划。

2. 工业自动化与质量检测:在工业制造领域,Axelera 强调 Metis AIPU 能在不损失准确度的前提下,提供GPU水平却更低功耗的机器视觉性能,说明其能够在生产线上实时完成缺陷检测与分拣,相较人工具备更高的速度与精确度。以水果工厂为例,可在流水线上实时完成缺陷检测与分拣,从而节省人工筛选的时间成本。

图片出处:Axelera
3. 仓储自动化多串流实时识别:也有企业导入 Metis M.2 卡,进行仓储订单核对系统,使用四路 1080p 高清影像进行实时手部与物体检测,以高兼容性和低功耗成功取代传统工业电脑。
Axelera AI边缘计算加速方案凭借其卓越的性能、极佳的功耗效率以及简便的部署流程,能够有效帮助企业提升运营效率并降低整体成本。建议各行业的企业引入该方案,以有效增强产品和服务质量,推动企业智慧创新的发展。
?场景应用图

?产品实体图

?展示板照片

?方案方块图

?核心技术优势
1. Metis AIPU芯片:INT8量化高达214 TOPS,提供卓越的推理性能和低功耗表现。
2. 数字记忆体内运算(Digital In-Memory Computing, D-IMC):显著减少数据搬移需求,大幅提升能量效率。
3. Voyager SDK软硬协同优化技术:自动化模型量化、编译及部署,实现性能最大化和易用性提升。
4. 多核弹性运用:支持多串流推理、单一大型模型并行处理,灵活适应复杂应用场景。
5. 低功耗设计(Low-Power Design):PCIe模块功耗为8–15W,M.2模块功耗仅为3.5–9W,专为边缘部署设计。
6. Downclock技术(动态时钟调整):动态平衡功耗与性能,可根据不同实际需求灵活调整。
?方案规格
1. 推理性能:高达 214 TOPS (INT8 精度)
2. 模型支持 ONNX
3. 典型推理 FPS:ResNet-50 模型 3,200 FPS 以上
4. PCIe 版本功耗:典型 8–15W
5. M.2 版本功耗:典型 3.5–9W
6. 软硬件接口支持:PCIe Gen3 x4, M.2 接口 (2280 规格)
7. SDK:Voyager SDK (量化、优化、自动部署)
登录大大通网站,查看方案原文,了解更多详情!
原文链接:https://www.wpgdadatong.com.cn/reurl/jMnMne
-
AI
+关注
关注
88文章
35315浏览量
280692 -
机器学习
+关注
关注
66文章
8507浏览量
134737 -
边缘计算
+关注
关注
22文章
3334浏览量
50985
发布评论请先 登录
索尼推出针对直播行业的创新解决方案
软通动力携手华为云推出AI知识引擎与数据工程融合创新解决方案
华为AI UBB解决方案加速网络迈向高阶智能
移远通信携手高通举办“2025 高通边缘智能创新应用大赛”,助力开发者探索AI创新潜能

英特尔借助开放生态系统,加速边缘AI创新

Banana Pi 发布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 计算与嵌入式开发
Banana Pi 与瑞萨电子携手共同推动开源创新:BPI-AI2N
MWC 2025 | 广和通AIoT创新解决方案再“爆料”,以「AI For X」定义AI加速度

FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......
是德科技亮相DesignCon 2025,展示AI创新加速解决方案
LoRaWAN网络在智慧水务中的创新解决方案

评论