6月30日,国际权威AI性能基准评测平台MLPerf,发布了基于TrainingV1.0的最新标准测试结果。宁畅AI服务器X640G40和X660G45,分别以48.43、28.64成绩,取得固定任务(closed)赛道,单机服务器系统的MASKR-CNN、U-NET3D两项AI场景世界性能第一。
据悉,MASKR-CNN、U-NET3D是重量级图像目标检测以及图像分割模型,其应用场景包括自动驾驶、医疗图像分析、监控、工业检测等,是典型数据中心应用模型。而第一成绩背后是每秒分析5040张X光照片、57000张图片以及570余次训练迭代的,单机服务器世界极限处理速度。
新纪录诞生,8个AI场景下,产生超百项测试成绩
据宁畅方面介绍,本次MLPerfTrainingV1.0测试,共有16家国际一线厂商在固定任务(closed)赛道,提交了91个单机系统配置,并于DLRM、MASKR-CNN、Resnet50、SSD、U-NET3D等8个AI场景下,产生超百项测试成绩。
MLPerf测试的AI场景包含固定任务(Closed)和开放优化(Open)两个赛道,固定任务(Closed)更侧重公平性,参与测试的各计算系统基于同一套参数运行。
搭载英特尔第三代®至强®可扩展处理器、Optane™BPS大容量持久内存以及NVIDIA®A100TensorCoreGPU的宁畅X640G40以及X660G45,从众多机型配置中“杀出”,以48.43、28.64分钟成绩夺得MASKR-CNN、U-NET3D场景的单机世界性能第一,取得新世界性能纪录。
在MASKR-CNN、U-NET3D测试中,单机服务器系统需要运行29GB、21GB的原始图像数据,并通过分析与迭代最终完成模型训练。而完成过程所耗费时间越少,则印证系统性能越强。
除获得以上两项性能冠军外,在横向比较搭载同400W功耗GPU的单机服务器系统,宁畅X660G45在DLRM(推荐系统)、SSD(目标检测)固定任务赛道,以1.92、8.51分钟成绩取得世界性能第一。
500TB本地存储容量,极大缩短用户AI模型训练时间
X640G40支持多种GPU拓扑结构,针对不同AI场景和训练模型进行互联优化,以满足不同类型客户需求。
X660G45是专为深度学习训练开发的高性能计算平台,满配8颗GPU并采用600GB/s的NVLink总线高速互联。每个GPU还可搭配HDR200Gb/sInfiniBand网络和NVMeSSD高速缓存,助用户搭建GPU高速集群。结合近500TB本地存储容量,可极大缩短用户AI模型训练时间。
本次MLPerf测试,宁畅是唯一取得冠军成绩的初创服务器厂商。而就在6月20日,宁畅还取得了8项SPECCPU2017的同CPU配置服务器世界性能第一。2020年的MLPerf测试中,宁畅服务器更是打破了超10项世界性能纪录。
对于本次夺冠,宁畅工程师介绍MLPerf测试比拼的是厂家对服务器底层硬件与软件的理解和优化能力,而这些“能力”来源于对用户应用场景的深入理解与实践。宁畅团队专注服务器研发、生产已有15年之久,拥有近百万台服务器生产部署经验,可为用户提供全栈服务器定制化服务。
作为智能算力定制专家,宁畅创立的2020年便已有近千家企业、用户采购宁畅服务器产品,收到定制咨询350余次,累计落地服务器定制方案170项,宁畅用户已覆盖互联网、金融、电信等数十个行业,出货量数以万计。
来源: 中国科技网