阿里云刘伟光:新一代大模型锁定两大技术演进方向
时间:2025-04-11
根据中国电子报报道,AI时代,伴随大模型极速迭代,推理效率突破,工具链生态愈发繁荣,一切都在以前所未有的速度进化。4月9日,在2025阿里云AI势能大会上,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,2025年AI应用爆发没有最快,只有更快,应该推动基础模型、推理服务、开发工具三要素全速演变,为AI应用提速蓄力。
根据斯坦福最新的2025年AI指数报告,中美顶级AI模型的性能差距已缩小到了 0.3%,而在2023年差距是20%,中国模型正在快速追赶美国的领先地位。从行业主导企业来看,2024年90%的知名AI模型来自企业,美国以40个模型领先,中国有15个。更明显的一个趋势是如今大模型的性能已经趋同。在2024年,TOP1和TOP10的模型的差距能有12%,如今差距已经越来越小,锐减至5%。
春节期间,DeepSeek在全世界的火爆出圈,让公众对大语言模型能力的认知水平有了显著提升。这些利好消息鼓舞着社会各界加入AI浪潮,基于基础大模型做更多的AI Agent、AI原生应用、推理应用等创新。“所以我非常有理由相信,2025年一定是中国AI应用爆发的元年。”刘伟光说道。
他表示,过去一年,很多企业都在积极拥抱大语言模型,从简单的文生图、文生视频、创作文档到数据应用等,均涌现出一批令人兴奋的应用。光是在阿里云平台上就可以看到,2024年12月与2024年1月相比,大语言模型API调用量增长接近100倍,接入大语言模型的企业数量同样是一个接近100倍的增长比例。
“这是AI应用快速落地的前奏和序曲。”刘伟光表示,“未来,AI会和很多产业进行有机融合,爆发出更多崭新商业模式和生产路径。”在他看来,从深度推理模型到多模态能力,中国基础模型能力大幅提升,让很多产业有了强化学习的想法,也让更多AI应用的落地成为可能。伴随AI发展不断提速,训练和推理所需的资源成本也在不断降低。
当前,各行各业尤其是云计算公司、AI创业公司都在加大投入。以阿里云为例,未来将投入3800亿元进行人工智能基础设施建设,这恰恰证明了其对于未来整个人工智能和云计算前景的期待与信心。模型开源生态建设也跑出了“加速度”。今天,开源模型和商业化模型已经呈现出并驾齐驱之势。经过市场的筛选,标准协议开始收敛,这将大大简化模型调用,推动AI应用的生态繁荣。
不过,AI应用爆发对模型的性能、模型之下的基础设施以及AI应用开发工具都提出更高的要求。以大语言模型为例,全世界的大语言模型几乎以每两周为一个时间单位高速演进。基础模型作为整个AI应用生态最核心的引擎,通过提供深度的推理能力、多模态理解和交互能力,支持多样化、高质量服务,基于不同类型、尺寸的模型满足复杂、轻型以及更多探索型需求。
“很多客户在探索AI应用过程中不约而同地发现,大语言模型需要支撑AI应用的基础设施能力,特别是推理服务能力,它是保障AI应用服务顺畅、平滑、稳定、高效运行的重要基础设施。”刘伟光表示,“今天我们看到云计算也在慢慢地为AI所改变,在计算、存储、网络方面围绕AI发展做了非常多的优化,让所有AI训练、推理、应用能够在云基础设施上进行更稳定、平滑、高效地运行。”
他认为,当模型能力足够强大,当AI应用呼之欲出的时候,更多客户需要更完整、更完备的工具链进行基于模型的AI应用开发。AI开发工具是连通大语言模型和真实应用最重要桥梁,用户需要更多功能齐全、生态丰富、灵活部署的工具,以加速AI应用开发。
谈及大模型未来发展趋势,刘伟光表示,新一代模型最重要的技术发展方向在于两个重要领域:Reasoning(推理)和Omin(全模态融合)。大模型会向越来越强的推理能力演化,基于强化学习不断提升思维链的能力。伴随着模型内生的任务规划、工具使用能力不断增强,大模型会越来越智慧,可以不断思考更难的问题,完成更复杂的任务。“未来会有更多的企业基于强化学习、基于更强大的基础模型开发出崭新的、更有价值的AI原生应用和AIAgent。”他说。
另一个方向是Omni,也就是音频、视频、声音和文字全模态融合。它打破了单一的文生图、文生视频单项能力,跨越模态的界限,整合不同类型的要素,为解决复杂问题提供强有力的支撑,并激发新的可能性。“Omin未来更多是让模型像人一样去识别图像、文字,实现对用户意图、视频、声音的理解,以创造更多崭新的商业模式。”刘伟光表示。
此外,刘伟光指出,在模型工程领域,MOE架构成为全球关注焦点。该架构能够降低模型推理的资源消耗,提升模型的技能表现,尤其在垂直领域的表现大大超越传统的小模型。“我们对模型的应用绝不仅仅局限在屏幕上、电脑上,而要从虚拟世界走向物理世界。小尺寸端侧模型将为手机、汽车、终端等各种交互设备带来巨大的利好。
关于产业热点Agent(智能体),刘伟光表示,今天,Agent已经从手机端、电脑端功能插件,延伸到自动驾驶等走进生活场景的大型智能体。为了让AI Agent有“更聪明的大脑”、“更丰富的交互”,阿里云百炼上线业界首个全生命周期MCP服务,未来,阿里云将通过AgentStore模式,把阿里巴巴集团和生态伙伴的Agent向外开放,让各行各业的人都可以拥有自己专属的助理。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。