邵广禄:面向AI大模型的智算集群及网络的实践和展望

时间:2024-08-08
  近日,高性能计算与人工智能协同创新国际论坛在深圳举办,中国电信科技委主任邵广禄应邀出席会议,分享了中国电信在智算集群和网络方面的实践与思考。
  “算力是人工智能发展的重要驱动力,影响着大模型的迭代和创新的速度,也影响着经济发展的速度。”邵广禄介绍到,在智算方面,中国电信重点推进两项工作,一是建成大规模智算集群,目前上海、北京两个万卡集群已经投产。面向AI大模型训练的智算集群,需要从IDC向AIDC升级,重点围绕模型算力利用率MFU、线性加速比、稳定性、时延、丢包率、GPU利用率等六大关键指标,持续开展智算集群的设计、建设、运营、优化等工作,提高大模型训练的效率效能。二是用智算网络和算力调度平台实现全国算力资源的互联互通,按需调用,自研“息壤”算力调度平台,已实现全国21EFlops的算力调度。中国电信积极探索“云、网、智”的融合技术,致力于打造弹性超宽、高速无损、“云、边、端”全域调度的智能算力网络,满足不同企业、不同行业对大模型训练和推理的差异化需求。
  邵广禄表示,中国电信已经从电信运营商升级到电信+云计算的运营商。在AI时代,中国电信还将升级为智算服务商和大模型服务商,提供算力服务和模型服务。
  邵广禄指出,算力的网络化成为发展方向,并倡议:一是推动算力生态的开源开放,为异构算力互通提供基础的开发环境,以统一标准对接各类异构硬件,方便大模型在异构算力间自由切换。二是推进共建共享。生成式人工智能是重大的科技创新和产业变革,需要早布局、快推进,需要学术界和产业界以战略眼光强化合作,集中力量突破底层技术,推动产业创新和产业生态建设。
上一篇:三星芯片负责人再发警告:芯片或陷入恶性循环
下一篇:龙芯中科胡伟武:龙芯将走向开放的竞争市场

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。