英特尔在财务困境中缩减项目和产品,但人工智能产品正在发挥重要作用,因为该公司调整了其芯片路线图,以考虑更多专门针对人工智能的计算。
一种不会被削减的产品是 Habana Labs 的 Gaudi AI 产品线,未来版本芯片的产品开发正在如火如荼地进行。除了公司的 GPU 之外,Gaudi还可以将其用于其他英特尔芯片。
英特尔旗下 Habana Labs 首席运营官 Eitan Medina 在接受 Cambrian AI Research采访时表示,英特尔正准备在今年晚些时候分享有关人工智能 Gaudi3 的更多细节。
“你可以期待不久之后我们将为客户提供它。我们为Gaudi架构制定了强有力的路线图,”Medina说。
Medina 分享了一些关于新的 Gaudi3 芯片的信息。它将使用 5nm 工艺制造,并且是 Gaudi2 的工艺缩小版,后者是使用 7nm 工艺制造的。Gaudi3 将拥有比其前身更多的内存、计算和网络,Medina 说。
英特尔发言人表示,Gaudi3 将升级内存和连接性,以及其他新功能。该公司拒绝透露有关芯片或发货日期的更多细节。
Gartner 在本月早些时候发布的一项研究中表示,IT 市场正处于十字路口,通胀措施和 2023 年经济前景不佳将抑制 IT 支出。
处理 AI 工作负载的数据中心系统的支出预计将达到 2130 亿美元,到 2023 年仅增长 0.7%,而 2022 年与 2021 年相比增长 12%。2023 年 IT 总支出将下降 0.2% 至根据 Gartner 的预测,与 2022 年相比增长 4.5 万亿美元,而 2022 年比 2021 年增长 2.4%。
IDC 去年估计,到 2022 年全球在 AI 系统上的支出将达到 1180 亿美元,到 2026 年将超过 3000 亿美元。IDC 在一份报告中表示,公司正在寻求削减成本,而 AI 提供了简化流程和高效开展业务的技术。释放。
“人工智能系统可以支持以人为本的任务,并通过会话人工智能和图像处理等技术提高他们的能力,这些技术用于以这些人准备接受的方式与客户和潜在客户互动,”IDC高级市场研究 分析师Mike Glennon 说。
观众通过 ChatGPT 等技术接受了 AI,这些技术风靡全球并展示了 AI 的变革潜力。自去年推出 ChatGPT 以来,服务器有时会满负荷运转,用户无法访问。这凸显了对更快的 AI 芯片的需求,而 Gaudi 已经显示出处理大型语言模型的潜力,为 ChatGPT 等应用程序提供动力。
Gaudi2 在MLCommons 于 11 月发布的基准测试中表现出了处理训练模型的勇气。AI 芯片为 BERT(用于大型语言模型)发布了比 Nvidia 的 A100 芯片更好的训练时间,但落后于基于 Hopper 架构的最新 H100。Gaudi2 芯片并未针对 BERT 进行优化。
该芯片制造商还可能将其多样化的 AI 芯片产品线与 Gaudi3 的继任者进行交叉结合。
“我们也在努力寻找机会……将英特尔 GPU 架构和 Habana Gaudi 架构的两全其美结合起来。当我们考虑第四代时,如何创造最好的世界,”Medina说。
集成 Habana 的想法可能包括采用代号为 Ponte Vecchio 的 GPU 元素,该 GPU 的目标是高性能计算。
Gaudi 是该公司为不同市场的客户提供的众多英特尔 AI 芯片之一。Gaudi3 的目标是企业计算中的深度学习。Ponte Vecchio GPU 面向超级计算环境中的高性能计算和 AI 应用。该公司的 FPGA 也被用于人工智能。
但没有哪一款英特尔 AI 芯片能够与 Nvidia GPU 的巨大成功相提并论。Gaudi2 芯片被推迟了,但现在可以在英特尔的开发人员云上使用,以测试和原型应用程序。
英特尔表示,Gaudi 芯片“通过为数据中心的训练工作负载和推理部署为客户提供高性能、高效率的深度学习计算选择,同时降低各种规模的公司进入 AI 的门槛,从而填补了行业空白”在上周发布的年度报告中。
“Habana Gaudi 芯片对他们来说很重要,因为它可以以最佳的功率和成本效率进行训练。他们有客户在使用它,但尚未透露范围。我会说它是 GPU 的重要替代品,”Tirias Research 首席分析师 Kevin Krewell 说。
英特尔正在向市场投放大量 AI 芯片,并为测试新兴 AI 模型的客户提供多种选择。客户通常会选择针对其 AI 训练模型进行优化的芯片。
咨询公司麦肯锡预计,到 2030 年,人工智能市场的价值将达到 1 万亿美元,但也表示它正处于试验阶段和商业部署的早期阶段。麦肯锡表示,例如,在工业领域,实施仍侧重于该技术如何改进传统的问题解决方法。
英特尔的 AI 硬件开发以前集中在一个名为 AXG 的部门,该部门开发高性能和 AI 加速器。该部门最近进行了重组,其负责人 Raja Koduri 被重新分配到技术设计职位。位于以色列的 Habana Labs 部门作为一个独立部门运营。
英特尔还有许多其他人工智能项目正在进行中。Sapphire Rapids 芯片实现了 AI 特定加速块,包括称为 AMX(高级矩阵扩展)的技术,该技术提供片上推理并通过加速数据移动和压缩来应对 AI 和机器学习处理中的挑战。CPU 内部的加速允许高效的矩阵乘法。AMX 支持 INT8 和 Bfloat16 数据类型以及 32 位和 64 位浮点运算。该公司声称,AMX 可以帮助芯片实现高达 10 倍的 PyTorch 实时推理和训练性能。
除了 Nvidia,英特尔还必须与 AMD 等竞争对手竞争,AMD 正在将 Xilinx 产品(如 FPGA 和 ASIC)作为其产品的核心部分。AMD 开发了一种名为 XDNA 的 AI 架构,该架构首先被集成到名为 Alveo V70(更像是一种推理芯片)的 AI 加速器中。AMD 今年早些时候展示了其最新的 MI300 芯片,这是一款具有 GPU 加速功能的集成芯片,用于高性能计算和机器学习。
虽然英特尔将继续支持Gaudi,但其他项目正在中止。该公司取消了在俄勒冈州希尔斯伯勒投资 7 亿美元的数据中心研究设施的计划,作为其正在进行的成本削减计划的一部分,该计划还涉及裁员。英特尔还停止了其 RISC-V 加速器的探路者,。
英特尔还停止了网络和边缘小组开发的一些网络设备的开发,也称为 NEX。
“NEX 继续表现良好,是我们战略转型的核心部分,但我们将结束对网络交换产品线的未来投资,同时仍全面支持现有产品和客户。自从我回来后,我们已经退出了七项业务,节省了超过 15 亿美元,”英特尔首席执行官帕特·基辛格 (Pat Gelsinger) 在 1 月下旬公司最近的财报电话会议上表示。
英特尔也在削减其研发支出,自 Pat Gelsinger 于 2021 年接任首席执行官以来,该支出逐渐增加。2022 年的研发支出为 175 亿美元,高于 2021 年的 152 亿美元。该公司现在预计“减少 4 亿美元”该公司在上周第四季度财报电话会议后发布的业务展望中表示,“2023 年的研发费用”。
编译自hpcwire