8月8日,NVIDIA宣布推出搭载全新NVIDIA®L40S GPU的NVIDIA OVX™服务器。这款功能强大的通用数据中心处理器将通过NVIDIA Omniverse™平台,加速计算密集型的复杂应用,包括AI训练与推理、3D设计与可视化、视频处理以及工业数字化等。
这款全新GPU将加速生成式AI的计算工作负载。生成式AI为各行各业的工作流和服务都带来了变革,如文本、图像和视频生成、聊天机器人、游戏开发、产品设计以及医疗等。
NVIDIA专业可视化副总裁Bob Pette表示:“生成式AI为各行各业都带来了变革,企业也更需要为数据中心寻求大规模计算资源。配备NVIDIA L40S GPU的OVX系统能够加速AI、图形和视频处理工作负载,满足不断增加的复杂且多样的应用对性能的严苛要求。”
强大的AI和图形性能
NVIDIA OVX系统的每台服务器最多支持8块NVIDIA L40S GPU,每块GPU的显存为48GB。基于NVIDIA Ada Lovelace GPU架构的L40S搭载第四代Tensor Core和FP8 Transformer Engine,可提供超过1.45 PFLOP的张量处理能力。对于拥有数十亿个参数和多种数据模式(如文本和视频)的复杂AI工作负载,与NVIDIA A100 Tensor Core GPU相比,L40S能够将生成式AI的推理性能和训练性能分别提高1.2倍和1.7倍。
为了支持实时渲染、产品设计、3D内容创建等高保真专业可视化工作流,NVIDIA L40S GPU搭载142颗第三代RT Core,可提供212 TFLOP的光线追踪性能,使专业创作者能够创建沉浸式的视觉体验和逼真的内容。
针对计算要求严苛的工作流,如工程和科学模拟等,NVIDIA L40S搭载18,176颗CUDA®Core,可提供近5倍于NVIDIA A100 GPU的单精度浮点计算(FP32)性能,以加快复杂计算和数据密集型分析的速度。
早期采用情况
专注于大规模GPU加速工作负载领域的CoreWeave是首批提供L40S实例的云服务提供商之一。
CoreWeave首席技术官Brian Venturo表示:“随着生成式AI的爆发式增长,我们各行各业的客户都在寻求性能强大的计算产品和规模上的扩展,以应对从交互式视频到AI设计和自动化等各类工作负载的复杂性。NVIDIA L40S GPU将进一步扩大我们丰富的NVIDIA解决方案阵容,使CoreWeave成为首家提供这些新资源的专业云服务提供商,为下一批生成式AI应用提供快速、高效、经济的加速计算。”
提升AI性能的软件
部署L40S GPU的企业将受益于NVIDIA AI Enterprise软件。该软件今日发布了重大更新,能够为100多个框架、预训练模型、工具套件和软件提供生产就绪型企业级支持和安全,其中包括用于模拟的NVIDIA Modulus、用于数据科学的NVIDIA RAPIDS™和用于生产型AI的NVIDIA Triton™推理服务器。
Omniverse的功能日益丰富
NVIDIA还发布了对Omniverse平台的重大更新,新推出的各种功能和平台升级将助力开发者借助生成式AI的强大功能,加速并推进OpenUSD工作流程和工业数字化应用。支持Omniverse Cloud的下一代NVIDIA OVX系统将配备L40S GPU,为大幅加速生成式AI流程和Omniverse工作负载提供所需的AI和图形性能。
供应情况
NVIDIA L40S将于今年秋季上市。包括华硕、戴尔科技、技嘉、慧与、联想、QCT、超微在内的全球系统构建商近期将提供搭载NVIDIA L40S GPU的OVX系统。该服务器将帮助全球专业人士推进AI的发展。