北京2022年6月14日 /美通社/ -- 近日,專業(yè)媒體"架構(gòu)師技術(shù)聯(lián)盟"發(fā)布了基于浪潮GPU服務(wù)器NF5468A5的性能測評報告。報告顯示,NF5468A5搭載2顆AMD Milan-X 7773X運行常見的氣象應(yīng)用WRF和計算流體力學(xué)應(yīng)用OpenFOAM作為性能基準(zhǔn)測試,其性能相比搭載兩顆Rome 7742時的計算性能提升可高達80%。
NF5468A5是一款4U支持2顆AMD EPYC處理器和8顆雙寬GPU卡,面向AI訓(xùn)練、推理、視頻編解碼等多種應(yīng)用場景的GPU服務(wù)器。此次測試采用分別搭載2顆AMD Milan-X 7773X、Milan 7543和Rome 7742的配置組合。
AMD Milan-X處理器最大的亮點,就是采用3D堆疊技術(shù)(3D V-Cache),在不改變處理器面積的前提下,可用L3 緩存(SRAM)總數(shù)增加三倍。做個形象的比喻,這種3D堆疊技術(shù)就像將把相同面積的平房升級成三層小樓,通過縱向空間成倍擴展緩存數(shù)量。評測采用的NF5468A5平臺是浪潮信息暢銷海內(nèi)外的彈性云AI服務(wù)器NF5468系列的全新產(chǎn)品,率先支持PCIe 4.0技術(shù),4U空間內(nèi)可裝載2顆采用7nm先進制程工藝的AMD EPYC處理器和8塊PCIe Gen4接口的AI加速卡,能夠最大限度的發(fā)揮Milan-X處理器的極致性能。
WRF(The Weather Research and Forecasting Model),即天氣預(yù)報模式,被譽為是次世代的中尺度天氣預(yù)報模式,往往用于大范圍高分辨的氣候模擬,對系統(tǒng)的運算性能、內(nèi)存的要求非常高;OpenFOAM(Open Source Field Operation and Manipulation)是對連續(xù)介質(zhì)力學(xué)問題進行數(shù)值計算的軟件,經(jīng)常應(yīng)用于汽車仿真等行業(yè),進行仿真計算需要處理大量的實時數(shù)據(jù),所以對系統(tǒng)的計算能力、數(shù)據(jù)吞吐能力都有很高的要求。
基于浪潮NF5468A5評測報告顯示,Milan-X處理器通過搭載3D堆疊技術(shù)獲得更高的L3緩存,確實對計算性能有較大提升,而性能改進意味著企業(yè)可以在更少的服務(wù)器上運行相同的作業(yè),消耗的功率也能有明顯降低。如下是評測報告中的性能測試數(shù)據(jù):
在WRF測試中,使用單節(jié)點相同核心數(shù),以Rome 7742處理器運行時間為基準(zhǔn),在Milan 7543上的計算性能提升14%~27%,而在Milan-X 7773X處理器上性能提升 23%~34%。
在OpenFOAM基準(zhǔn)算例motorBike測試中,使用不可壓穩(wěn)態(tài)求解器simpleFoam計算模擬摩托車和騎手周圍空氣的運動情況。同樣以Rome 7742處理器為基準(zhǔn),OpenFOAM在Milan 7543處理器使用單節(jié)點相同核心測試性能提升23%~28%,在Milan-X 7773X處理器上性能提升34%~80%。
在本次評測中也對NF5468A5有比較細(xì)致的介紹,據(jù)浪潮官網(wǎng)顯示NF5468A5正在推出"超值機型 限免試用",對該GPU服務(wù)器感興趣的不妨一試。如下是評測中對于浪潮NF5468A5的介紹:
NF5468A5采用分區(qū)散熱設(shè)計,內(nèi)置獨立的CPU和GPU主板,且分別安裝在不同的平面。從機箱內(nèi)部結(jié)構(gòu)來看,設(shè)計者將發(fā)熱量高的的GPU放在了機箱上3U空間,CPU板處于機箱下1U,內(nèi)置6對12個6056風(fēng)扇模組配合導(dǎo)風(fēng)罩,實現(xiàn)機箱內(nèi)風(fēng)道分流,正是基于這種獨特分層散熱設(shè)計,使得送測的NF5468A5服務(wù)器可以支持280W最高功耗的Milan-X 7773X。系統(tǒng)設(shè)計支持32條DDR4 ECC內(nèi)存,支持LRDIMM/RDIMM,提供高達8T的本地內(nèi)存,實現(xiàn)與1536 MB 超大L3 cache間的高速數(shù)據(jù)交互。
NF5468A5采用了CPU直連GPU架構(gòu)設(shè)計,率先支持PCI-E 4.0技術(shù),最大限度提升CPU與GPU間的帶寬,降低通信延遲,達到最佳效能,為客戶提供極致優(yōu)化的算力。系統(tǒng)提供豐富的IO擴展能力,提供10個PCIe 4.0 X16擴展槽位,支持8個全高全長的GPU加速卡。提供靈活存儲方案,可選前置12 × 3.5英寸硬盤或24 × 2.5英寸硬盤,提供超大的本地存儲能力,同時最大可支持8個熱插拔NVMe SSD全閃配置,提供存儲到內(nèi)存到L3 cache的高速訪存,可實現(xiàn)十倍于高端企業(yè)級SATA SSD的IOPS性能,帶來極致IO存儲性能飛躍。