邵广禄：面向AI大模型的智算集群及网络的实践和展望

时间：2024-08-08

　　近日，高性能计算与人工智能协同创新国际论坛在深圳举办，中国电信科技委主任邵广禄应邀出席会议，分享了中国电信在智算集群和网络方面的实践与思考。
　　“算力是人工智能发展的重要驱动力，影响着大模型的迭代和创新的速度，也影响着经济发展的速度。”邵广禄介绍到，在智算方面，中国电信重点推进两项工作，一是建成大规模智算集群，目前上海、北京两个万卡集群已经投产。面向AI大模型训练的智算集群，需要从IDC向AIDC升级，重点围绕模型算力利用率MFU、线性加速比、稳定性、时延、丢包率、GPU利用率等六大关键指标，持续开展智算集群的设计、建设、运营、优化等工作，提高大模型训练的效率效能。二是用智算网络和算力调度平台实现全国算力资源的互联互通，按需调用，自研“息壤”算力调度平台，已实现全国21EFlops的算力调度。中国电信积极探索“云、网、智”的融合技术，致力于打造弹性超宽、高速无损、“云、边、端”全域调度的智能算力网络，满足不同企业、不同行业对大模型训练和推理的差异化需求。
　　邵广禄表示，中国电信已经从电信运营商升级到电信+云计算的运营商。在AI时代，中国电信还将升级为智算服务商和大模型服务商，提供算力服务和模型服务。
　　邵广禄指出，算力的网络化成为发展方向，并倡议：一是推动算力生态的开源开放，为异构算力互通提供基础的开发环境，以统一标准对接各类异构硬件，方便大模型在异构算力间自由切换。二是推进共建共享。生成式人工智能是重大的科技创新和产业变革，需要早布局、快推进，需要学术界和产业界以战略眼光强化合作，集中力量突破底层技术，推动产业创新和产业生态建设。

上一篇：三星芯片负责人再发警告：芯片或陷入恶性循环

下一篇：龙芯中科胡伟武：龙芯将走向开放的竞争市场

免责声明: 凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处。非本网作品均来自互联网，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。