AI领域“奥运会”放榜 ,戴尔科技表现抢眼
全球AI领域的奥运会“奥运会”
近日放榜 !
戴尔5款服务器
分别在各自类别的领域排名中拿下
“金牌”
做到这一点尤为不容易
因为今年的参与者和提交数量
分别是上一年的2倍和6倍
恭喜戴尔!
MLPerf™
AI性能基准测试
MLPerf™是放榜由图灵奖得主大卫•帕特森于2018年联合顶尖学术机构发起成立 ,是科技目前最具权威性、影响力最广的表现国际AI性能基准测试,也是抢眼用户在采购AI系统时的重要参考依据。

MLPerf™ AI性能基准测试包含Training(训练)和Inference(推理)两大领域 ,源码库奥运会分为封闭任务(Closed)赛道和开放任务(Open)赛道。领域
开放优化能力着重考察参测厂商的放榜AI技术创新力 ,固定任务则因更公平地考察参测厂商的科技硬件系统和软件优化的能力 ,成为更具参考价值的表现AI性能基准测试。谁能够在这个测试中取得更多的抢眼领先 ,谁的奥运会AI能力就越突出。
在本轮MLPerf v2.0测试中,领域戴尔科技向各个类别提交了167份项结果,放榜是封闭式数据中心类别里排名第二多的服务器租用厂商。此外,只有戴尔提交了针对不同主机操作系统的结果 。
在这里,恭喜我们的PowerEdge XE8545 、PowerEdge R750xa、PowerEdge XE2420、PowerEdge XR12这四款服务器在MLPerf v2.0获得了优异表现 !
多个类别排名第一
每加速卡性能,排名第一与同样采用NVIDIA A100 GPU的其他系统相比 ,戴尔PowerEdge XE8545和PowerEdge R750xa在竞争中脱颖而出,测试结果涵盖图像分类、对象检测 、源码下载语音到文本、医学成像 、自然语言处理和推荐引擎等用例。
NVIDIA A100 GPU在深度学习领域广受欢迎。测试结果表明采用NVIDIA A100 GPU的戴尔PowerEdge XE8545和PowerEdge R750xa服务器在该领域的突出优势。
基于PCIe的服务器性能 ,排名第一
在基于PCIe的4-GPU服务器中,戴尔PowerEdge R750xa也在多个基准测试中(包括图像分类、对象检测 、语音到文本、自然语言处理和推荐用例)脱颖而出 ,位列第一。香港云服务器
戴尔PowerEdge R750xa是久经盛名的PowerEdge R750服务器的GPU优化版,非常适合于AI 、ML和DL工作负载。它支持4x300W双宽或6x75 W单宽加速卡 ,提供多达8个PCIe Gen4插槽 ,并支持多达8个NVMe SSD 。
最低多流延迟 ,排名第一戴尔PowerEdge XE8545服务器在图像分类和对象检测用例 ,使用NVIDIA 多实例 GPU (Multi Instance GPU, MIG)获得了最低多流(Multi-stream)延迟的第一名,显示出PowerEdge XE8545在边缘类别的强大优势。

戴尔PowerEdge XE8545是云计算人工智能工作负载的强大动力引擎 ,这是一款双插槽4U机架服务器,最多包含128个第三代AMD霄龙处理器核心、四个NVIDIA A100 GPU以及NVIDIA vGPU软件所具备的优化性能。
此外,PowerEdge XE8545在多项基准测试(包括语音到文本、对象检测、自然语言处理和医学图像分割)中 ,还获得了系统性能第二名的结果 。
T4推理结果第一与其他使用NVIDIA T4 GPU的系统相比,戴尔PowerEdge XE2420服务器在图像分类 、免费模板语音转文本和推荐用例取得了最高推理结果。

戴尔PowerEdge XE2420服务器是一款专业边缘服务器 ,专为环境要求苛刻的边缘应用如流分析 、制造物流、5G蜂窝处理而设计 。此外,该服务器支持高达2993MT/s的16x DDR4 RDIMM/LR-DIMM ,非常适合低延迟和大存储边缘应用。
每瓦性能第一在功耗方面,配备A2 GPU的戴尔PowerEdge XR12服务器的能耗数据,与同为A2 GPU的其他服务器相比,在ResNet 50、 RNNT、BERT和DLRM基准测试中的每瓦性能均排名第一。

戴尔PowerEdge XR12是一款坚固耐用、符合海事要求的2U服务器,适用于电信、军事 、零售 ,以及其他注重能耗表现的环境 。它是图像分类 、物体检测、语音到文本、自然语言处理和推荐引擎的良好选择 。
结语
感谢权威AI基准评测组织验证并确认了戴尔服务器在AI领域的出色表现。作为全球领先的IT端到端解决方案提供商 ,戴尔科技在AI领域深耕多年 ,积累了先进的技术和丰富的行业应用经验,能够与广大客户和合作伙伴一道 ,携手共进,加快AI应用落地,加速AI创新成果转化 。
附:戴尔服务器在MLPerf Inference v2.0的基准测试结果
为了更紧密地匹配实际使用情况,MLPerf推理测试对数据中心类别有两个必需的场景:离线和服务器。离线场景意味着任务所需的所有数据都在本地可用 。服务器场景在请求时以突发形式在线交付数据 。
对于服务器场景 ,性能指标是每秒查询次数 (QPS)。对于离线场景,性能指标是每秒离线样本数 。一般来说 ,吞吐量越高表示结果越好。在下图中,Y轴是指数比例轴 ,代表吞吐量 ,X轴代表被测系统 (SUT) 及其相应模型。
图1至图6分别展示各种SUT在ResNet 50 、BERT、SSD、3dUnet、RNNT和DLRM模式下 ,服务器和离线场景的单卡性能 :

图1:MLPerf Inference v2.0 ResNet
50 per card结果

图2 :MLPerf Inference v2.0 BERT
默认和高精度per card结果

图 3:MLPerf Inference v2.0 SSD-ResNet
34 per card 结果

图 4:MLPerf Inference v2.0 3D U-Net
per card结果

图 5 :MLPerf Inference v2.0 RNNT
per card结果

图 6 :MLPerf Inference v2.0 DLRM
默认和高精度per card结果