全球领先系统制造商推出 NVIDIA AI 就绪型服务器,为企业大幅提升生成式 AI 性能

时间:2023-08-24
    戴尔科技、慧与和联想即将推出采用 NVIDIA L40S GPU 和 NVIDIA BlueField 的服务器,以支持 VMware Private AI Foundation with NVIDIA

  

    NVIDIA 今日宣布,全球领先的系统制造商将推出 AI 就绪型服务器,其支持同于今日发布的 VMware Private AI Foundation with NVIDIA,帮助企业使用自有业务数据来定制和部署生成式 AI 应用。
    NVIDIA AI 就绪型服务器将采用 NVIDIA? L40S GPU、NVIDIA BlueField?-3 DPU 和 NVIDIA AI Enterprise 软件使企业能够微调生成式 AI 基础模型并部署生成式 AI 应用,比如智能聊天机器人、搜索和摘要工具等。这些服务器还提供由 NVIDIA 加速的基础设施和软件,以支持 VMware Private AI Foundation with NVIDIA。
    作为全球领先的系统制造商的戴尔科技、慧与和联想,将于年底前推出搭载 NVIDIA L40S 的服务器,以加速推进企业级 AI 的发展。
    NVIDIA 创始人兼首席执行官黄仁勋表示:“全新的计算时代已经来临,各行各业的企业都在竞相采用生成式 AI。我们正在通过涵盖全球顶尖软件和系统合作伙伴的生态系统,将生成式 AI 带给全球企业。”
    对于将部署 VMware Private AI Foundation with NVIDIA 的企业来说,NVIDIA AI 就绪型服务器是一个理想的平台。
    VMware 首席执行官 Raghu Raghuram 表示:"生成式 AI 正在大力推动数字化转型进程,企业需要一种全面集成的解决方案,以更加安全地构建应用,从而推动业务发展。通过 VMware、NVIDIA、以及我们服务器制造商合作伙伴的专业知识相结合,企业将能够在确保数据隐私、安全和可控性的前提下开发和部署 AI。
    助推企业生成式 AI 转型
    各行各业正在竞相将生成式 AI 用于药物研发、零售产品描述、智能虚拟助手、制造模拟、欺诈检测等各种用途,NVIDIA AI 就绪型服务器将为这些行业提供全栈加速基础设施和软件。
    这些服务器采用 NVIDIA AI Enterprise,即 NVIDIA AI 平台的操作系统。该软件为 100 多个框架、预训练模型、工具套件和软件提供生产就绪型企业级支持和安全性,包括用于 LLM 的 NVIDIA NeMo?、用于模拟的 NVIDIA Modulus、用于数据科学的 NVIDIA RAPIDS? 和用于生产型 AI 的 NVIDIA Triton? 推理服务器。
    专为处理包含数十亿参数的复杂 AI 工作负载而打造的 L40S GPU 搭载第四代 Tensor Core 和 FP8 Transformer 引擎,可提供超 1.45 PFLOPS 的张量处理能力,其训练性能是 NVIDIA A100 Tensor Core GPU 的 1.7 倍。
    相较于 NVIDIA A100 GPU,NVIDIA L40S 可将智能聊天机器人、助手、搜索和摘要等生成式 AI 应用中的生成式 AI 推理性能提高 1.2 倍。
    通过集成 NVIDIA BlueField DPU,可加速、卸载和隔离巨大计算工作负载,其中包含虚拟化、网络、存储、安全,以及其他云原生 AI 服务,以进一步提高速度。
上一篇:RECOM - RACMxx-K/277 系列现已提供 30W版
下一篇:Microchip推出用于工业自动化的新型千兆以太网交换机LAN9662

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。