算力市场:破题三大挑战

时间:2025-01-17
  随着人工智能成为新质生产力,AI将加速相关基础设施的迭代和性能需求,更强的算力和互联能力成为刚需。AI推动算力市场增长的同时,对算力提出更高利用率、更高性能的要求。算力发展面临利用率低、算力效率不高以及算力高能耗三大挑战。2025年在市场需求、技术创新驱动下,算力市场规模有望快速增长,算力与网络的融合协同加速,算力建设从建设走向调度,绿色算力也将迎来突破。
  算力联通堵点破解
  AI大模型的快速发展是算力市场增长的重要动力。2024年,我国备案的大模型产品已超过200家,行业模型占比达70%。尽管市场渗透率仍有提升空间,但智算服务市场年同比增速有望超过80%,特别是与AIGC强相关的GenAI IaaS、智算集成服务增速均超过150%。
  算力规模有望快速增长,高性能算力占比增加。未来三年,随着数字经济战略深入推进,大数据、人工智能等技术与行业深度融合,算力的支撑作用越发明显,中国算力规模将呈现爆发式增长态势。来自赛迪顾问的数据显示,预计到2026年,中国算力规模将超过360EFLOPS,三年的年复合增长率达到20%,中国智算算力和超算算力占比之和将达到40%。
  中国电信研究院战略发展研究所所长饶少阳在2024通信产业大会上表示,大模型产业价值高点将沿“AI算力→AI终端→AI平台→AI应用”推进。从产业节奏上看, AI与移动互联网同为赋能型的通用技术,需要其自身的基础设施层达到一定的普惠程度后,才能迎来应用的繁荣和广泛渗透。
  从技术演进上看,大模型发展到了新的拐点。训练算力和推理算力规模同步扩展,大模型需要更多实时多模态的数据和更大规模更高利用率的算力以及更高性能的光网络支持。
  推动算网融合,构建高速数据网+高速光网,构建大规模算力集群,为产业升级和数字经济提供坚实支撑。三大运营商以网强算的战略布局正在逐步落地。
  中国电信已在上海和北京部署了两大算力集群,并启动了十万卡集群建设的研究。通过优化机房布局、应用绿色节能技术,以及中国电信正在构建高效智能的算力基础设施。中国联通发布“算力智联网AINet”,建设智算互联新底座。中国移动则加快了“4+N+31+X”数据中心布局,构建了覆盖全国的AI推理算力网络,并在京津冀、长三角、粤港澳大湾区、成渝等区域投产了首批13个智算中心节点。
  智算中心建设中,提升算力调度和增强互联性能是智算集群规模扩展和性能提升的关键。随着GPU卡间开放互联协议OISA的提出,推动互联协议、交换芯片等核心技术攻关,满足卡间互联极致的带宽和时延要求。全调度以太网GSE,突破无损以太性能瓶颈,网络性能可比传统RoCE网络提升30%以上,大幅提升GPU节点间通信效率。我国智算中心卡间互联、机间互联等堵点难点问题持续突破,推动智算中心从“建好”到“用好”。
  算力资源按需合理调度
  目前,算力资源不均衡是我国算力发展中的一大难题,算力调度是算力资源效率最大化的路径。多家分析机构称算力调度是未来算力网络的重要拼图,是算力时代的国家电网。据测算,2025年算力调度潜在市场规模在400亿元以上。
  随着算力基础设施的不断完善,算力调度成为算力一体化进程的关键环节。赛迪顾问资深分析师袁钰在2024通信产业大会上表示,未来,中国算力一体化建设将从“建设”阶段转向“调度”阶段。算力调度中心将以算力枢纽节点为原点,在全国范围内不断铺开,并作为支点形成算力网,推动算力资源按需合理调度。
  当前,国内算力资源分布较为分散,不同地区、不同行业和不同企业之间的算力资源差距较大。这导致算力调度平台在资源整合和调度方面面临较大困难,难以实现资源的优化配置和高效利用。
  重建设轻运营、国产智算软硬件生态体系不健全,以及算力服务模式单一等制约了算力调度平台的发展。当前,国内算力调度平台的建设力度较大,但运营方面相对薄弱。许多平台在建成后缺乏有效的运营和管理机制,导致平台的使用率和效果不理想。
  国产智算软硬件生态体系的不健全是当前算力调度平台面临的另一个重要问题。由于国产智算软硬件在性能、稳定性和兼容性等方面存在不足,导致算力调度平台在选用国产软硬件时面临较大困难。这限制了算力调度平台在国产化和自主可控方面的发展。
  算力服务模式较为单一。当前,算力调度平台提供的算力服务模式较为单一,主要以算力租赁和算力市场为主。这导致用户在选择算力服务时缺乏灵活性和多样性,难以满足其多样化的算力需求。
  2025年算力调度痛点有望逐步突破。目前业内已完成了千亿参数大模型的分布式训练现网验证,性能接近集中式训练的95%。这一成果为未来分布式AI计算奠定了技术基础。同时,业内首例现网智算长距无损互联技术验证的成功,为跨地域、跨层级、跨主体的算力协同调度提供了可能。
  中国电信研究院网络技术研究所副所长雷波在2024通信产业大会上表示,随着AI/大模型等新业务的出现,云网融合迈入以AIDC为核心的云网融合3.0新阶段。云网融合3.0强调分布式智算网络的建设,通过优化IP层和光传输层,实现跨区域、跨节点的无损智算能力,为AI应用的广泛渗透提供了有力支撑。
  绿色算力多方发力
  生成式人工智能的迅猛发展推动数据中心向智算中心演进。然而,智算中心的高功耗和高散热要求推高了其运营成本,绿色发展迫在眉睫。绿色算力成为解决算力增长和电力消耗矛盾的重要途径。
  绿色算力主要从使用端和供给端发力。在使用端,通过先进制冷技术降低能耗,利用人工智能技术优化温控供电模式;在供给端,使用绿色电力实现节能降碳。通过这两方面的努力,可以有效降低智算中心的运营成本,推动其可持续发展。
  算电协同是解决算力增长和电力消耗矛盾的有效路径。然而,算电协同面临资源分配不均、技术兼容以及市场机制不完善等挑战。在双碳战略与可持续发展观的引导下,2025年技术将进一步创新发展,企业积极探索源网荷储等技术研发。同时,规划、调度、市场和产业的协同加速,算力电力双向协同机制初步形成,为绿色算力的发展提供了有力保障。
  随着AI技术的加速演进,算力领域正面临前所未有的发展机遇和挑战。通过算力、网络与数据的一体化协同,算力调度的优化升级,以及绿色算力的持续发展,2025年一个更加高效、智能、绿色的算力生态即将加速。
上一篇:继美光、三星、Kioxia后,又一存储大厂宣布减产NAND闪存10%

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。