ISSCC:130Top/s 机器人人工智能嵌入式加速器

时间:2024-02-27
  瑞萨电子开发了一款用于实时处理机器人轻量级算法的人工智能加速器,并在旧金山举行的国际固态电路会议上对其进行了描述。
  ISSCC2024 20.3瑞萨AI芯片积分 ISSCC瑞萨
  预见的机器人需要传统的规划和控制处理,以及基于视觉的环境识别的约 100Top/s 峰值的人工智能处理,并具有低功耗以避免需要风扇 - 14nm IC 的功耗约为 5W。
  选择了异构微处理器架构,其中包括动态可重新配置的 AI 加速器,能够以 23.9Top/s/W(从 0.8V 开始)提供 130Top/s 的 INT8(8 位整数)数据。
  该公司告诉《电子周刊》:“它是通过使用理想的 CNN 模型(而非实际模型)进行测量的,该模型由具有最大稀疏性的单个卷积层组成。” “通过实际的 AI 模型——ResNet50、YOLOV2 和 deeplabV3——我们获得了 9-11Top/s/W。”
  不同之处在于,该处理器动态地修剪掉权重矩阵中带有零的计算——它的架构允许它执行更有效的“非结构化”修剪,同时保留并行计算。瑞萨电子将其称为“N:M 剪枝”,在许多权重为零的情况下,计算量减少 80% 至 90%(“稀疏矩阵”),而对于所有权重均为非的全稠密矩阵,性能下降至约 8Top/s。零。
  其处理器有 216 个处理元件,可以在一个时钟周期内重新配置,从而允许针对多步算法的每一步优化硬件。
  该公司表示:“例如,SLAM(同时定位和建图)需要多个编程过程来进行机器人位置识别,同时通过视觉人工智能处理进行环境识别。” “瑞萨电子展示了通过动态可重新配置处理器的瞬时程序切换以及 AI 加速器和 CPU 的并行操作来操作该 SLAM,与单独的嵌入式 CPU 相比,操作速度提高了约 17 倍,运行功率效率提高了约 12 倍。”
  据该公司称,这项技术将用于其用于视觉应用的 RZ/V 系列微处理器。
  ISSCC 2024 论文 20.3:适用于实时机器人应用的 14nm 异构嵌入式 MPU 中具有 16 倍性能加速剪枝的 23.9TOPS/W @ 0.8V、130TOPS AI 加速器
  ISSCC 是在旧金山举行的一年一度的国际固态电路会议,它是全球集成电路先进电路的展示窗口 - 与会者可以真正接触到最先进的技术。
上一篇:Nordic Semiconductor推出 nRF9151 SiP扩展 nRF91系列
下一篇:英飞凌推出OPTIGA Trust M MTR,为智能家居设备轻松添加Matter标准与安全功能

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。