华雄集团董事长朱峻咸分析,随着人工智能、机器学习等移动应用的推动,移动计算的持续创新成为了市场的关注重点。据Arm中国区业务副总裁邹挺表示,去年,手游市场创造了超过920亿美元的收入,而移动应用创造了超过4300亿美元的营收,移动设备上出现越来越多包括生成式AI在内的智能技术,市场对更高性能、更加智能以及更多视觉和触觉交互的需求仍在持续飙升,这也带来了比以往更大、甚至更加复杂的计算需求。
据华雄集团资料显示,为了满足日益增长的移动用户体验需求,5月29日,Arm宣布推出面向智能手机的2023全面计算解决方案(TCS23)。Arm TCS23是一个移动计算平台,目的是通过CPU和GPU技术,为沉浸式游戏体验和智能AI应用提供支持。
TCS23包含基于全新第五代GPU架构、可实现视觉体验的全新Arm Immortalis? GPU,助力打造智能AI的全新Armv9 CPU集群,以及可为数百万Arm开发者提供更易访问软件的全新增强技术。
去年,Arm推出2022年全面计算解决方案(TCS22),包括首款旗舰GPU Immortalis-G715和新的Cortex-X3 CPU。从应用情况上看,基于Arm TCS22的高通第二代骁龙8移动平台,实现了高阶连接计算的新水平。通过与MediaTek的合作,MediaTek基于TCS22的天玑9200移动芯片组,已在高跑分的OPPO和vivo智能手机,以及其他即将上市的设备中搭载使用。
打造视觉体验,ArmGPU产品实现性能和能效双提升
在GPU方面, Arm Immortalis-G715是其首款移动端支持硬件光线追踪(Ray Tracing)的GPU。
此次Arm全新的Immortalis-G720采用的是全新的第五代GPU架构。据介绍,该架构专为满足多种图形用例而设计,是Arm迄今为止效的GPU架构,重新定义了部分图形管道,以优化内存带宽,从而在移动设备上支持高几何负载的下一代游戏和实时3D应用,同时带来更顺畅、并与PC端和游戏主机媲美的游戏体验。
值得一提的是,Arm全新第五代GPU架构具有延迟顶点着色(Deferred Vertex Shading, DVS)功能,有助于优化系统级缓存的使用,同时新的CPU集群提供更多的DSU电源模式,以支持更高效地使用更大的L3缓存,并减少外部DRAM流量,从而实现性能更佳、效率更高的SoC。目前,DVS的优势已经在包括《原神》和《堡垒之夜》等许多流行游戏中得到体现。
性能上,Arm Immortalis-G720是Arm目前性能和能效表现为出色的GPU,与上一代产品相比,其性能和能效分别提高了15%,系统级效率更跃升了40%。
同时,Arm还推出了新的Arm Mali?-G720和Mali-G620,该两款分别是去年Mali-G715和Mali-G615的升级产品,旨在将高端移动图形功能快速地推向更广大的消费终端市场。
助力下一代人工智能,全新Armv9 CPU集群连续三年实现两位数性能增强
自Arm推出Armv9 Cortex计算集群以来,该集群已连续三年实现两位数的性能增强,同时效率也得到了显著提升。此次Arm全新的Armv9 Cortex? CPU计算集群包括超大为Cortex-X4、大为Cortex-A720、小是Cortex-A520,DSU-120。
其中,Cortex-X4是Arm史上性能快速的CPU,与Cortex-X3相比,性能提高15%,同时基于相同工艺的全新高能效微架构可降低功耗达40%。Cortex-X4性能和效率的提升可将设备使用体验(如UI响应能力和应用程序启动时间)提升到一个新的水平,并让实现面向下一代人工智能和机器学习的应用成为可能。
Arm表示,制程工艺和计算能力的结合是实现性能和效设计的关键。在新一代CPU设计中,Arm在TSMC N3E制程工艺上顺利完成了业内Cortex-X4流片。
Cortex-A720被认为是业界主流CPU IP,可提高持续性能,是新CPU集群的主力,而Cortex-A520的主要是节省功耗和面积。
这些全新的CPU设计可用于3A级游戏、全天候生产力和后台任务等用例。同时,为了完善全新的CPU集群,Arm推出了全新DSU-120,专为满足要求苛刻的多线程使用场景而设计,支持从可穿戴设备到智能手机、笔记本电脑的众多设备。
总体而言,Arm的全面计算战略就是通过一整套针对特定工作负载而设计和优化的IP,这些IP可作为一个完整的系统,无缝地协同工作。此外,Arm为开发者提供软件和安全解决方案,其中Arm的开源软件库Arm NN和Arm Compute Library已在安卓平台上面向Google应用开放,目前已拥有超一亿的日活用户,可支持开发者优化运行在Armv9 CPU和Arm GPU的机器学习工作负载。
Arm称,所有新CPU均支持64位计算和Armv9安全创新功能,能够抵御更别的数字威胁。通过Armv9 CPU,Arm在整个移动生态系统中持续成功部署Arm内存标记扩展(MTE)功能,以消除占所有软件漏洞高达70%的内存安全漏洞。
而针对在开发过程中TCS23遇到的挑战,Arm副总裁兼终端事业部总经理Chris Bergey在接受媒体采访时表示,每一年Arm都在打磨和提升技术,TCS23是Arm连续第三年在Armv9架构上实现性能双位数的提升。此外,人们非常关注性能,无论是GPU性能,还是运行生成式AI和大型语言模型的AI性能,都需要全面的系统化以及对系统的深刻理解,这不光要单纯考虑性能上的提升,同时要以一种非常高功效的方式来实现。把这些技术挑战融合在一起并以系统级的方式解决,每个技术的模块都是独立的,但合在一起又能够实现总体性能功效的表现,这就是TCS的概念。