芯原股份(芯原,股票代码:688521.SH)今日宣布其高性能、可扩展的GPGPU-AI计算IP的最新进展,这些IP现已为新一代汽车电子和边缘服务器应用提供强劲赋能。通过将可编程并行计算能力与人工智能(AI)加速器相融合,这些IP在热和功耗受限的环境下,能够高效支持大语言模型(LLM)推理、多模态感知以及实时决策等复杂的AI工作负载。

芯原的GPGPU-AI计算IP基于高性能通用图形处理器(GPGPU)架构,并集成专用AI加速器,可为AI应用提供卓越的计算能力。其可编程AI加速器与稀疏感知计算引擎通过先进的调度技术,可加速Transformer等矩阵密集型模型的运行。此外,这些IP支持用于混合精度计算的多种数据格式,包括INT4/8、FP4/8、BF16、FP16/32/64和TF32,并支持多种高带宽接口,包括3D堆叠内存、LPDDR5X、HBM、PCIe Gen5/Gen6和CXL。该IP还支持多芯片、多卡扩展部署,具备系统级可扩展性,满足大规模AI应用的部署需求。
芯原的GPGPU-AI计算IP原生支持PyTorch、TensorFlow、ONNX和TVM等主流AI框架,覆盖训练与推理流程。此外,它还支持与主流的GPGPU编程语言兼容的通用计算语言(GPCL),以及主流的编译器。这些能力高度契合当前大语言模型在算力和可扩展性方面的需求,包括DeepSeek等代表性模型。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。