元腦?服務(wù)器第八代新品重磅發(fā)布！創(chuàng)新開放架構(gòu)引領(lǐng)算力生態(tài)多元共進

浪潮信息

2024-10-25 18:07 3988

北京2024年10月25日 /美通社/ -- 10月24日，元腦®服務(wù)器第八代新品發(fā)布會在京舉行。會上，浪潮信息重磅發(fā)布元腦®服務(wù)器第八代算力平臺，基于開放架構(gòu)設(shè)計，業(yè)界率先實現(xiàn)"一機多芯"，同一架構(gòu)支持英特爾®至強®6處理器及AMD EPYC? 9005系列處理器，在促進多元生態(tài)共進的同時，具備更全面的智能能力和更高能效，更好支撐AI大模型開發(fā)與應(yīng)用創(chuàng)新。實測數(shù)據(jù)表明，在LLaMA2大模型AI推理場景中，整機性能較上代最大提升3倍。

元腦服務(wù)器第八代算力平臺擁有23款新品，基于先進的計算、存儲架構(gòu)創(chuàng)新，在CPU總線互聯(lián)帶寬、內(nèi)存帶寬及容量上全面優(yōu)化，單機核心數(shù)最多到576C，主頻高達5.0GHz，內(nèi)存帶寬提升高達136%。元腦服務(wù)器第八代算力平臺一經(jīng)發(fā)布，就打破多項SPEC國際性能測試紀(jì)錄。

浪潮信息、信通院、Intel、AMD、阿里云、國家新能源汽車技術(shù)創(chuàng)新中心、金山云代表共同發(fā)布

一機多芯，開放標(biāo)準(zhǔn)促進多元算力生態(tài)進化

隨著大模型能力的持續(xù)提升，生成式人工智能在企業(yè)側(cè)、行業(yè)側(cè)的落地正在提速，智能應(yīng)用不斷涌現(xiàn)。日趨豐富的AI應(yīng)用場景也衍生出新的算力挑戰(zhàn)，不同AI應(yīng)用的典型特征及系統(tǒng)需求存在差異，需要多元的算力生態(tài)予以滿足。伴隨著通用處理器在芯片架構(gòu)、指令集等方面對AI的優(yōu)化增強，在AI推理端的巨大應(yīng)用潛力使得CPU在AI時代變得更加重要，需要系統(tǒng)創(chuàng)新釋放通用算力在AI領(lǐng)域的應(yīng)用價值。

元腦服務(wù)器第八代算力平臺成為全面且強大算力生態(tài)的載體，源于浪潮信息的諸多創(chuàng)新系統(tǒng)架構(gòu)設(shè)計，將通過共建開放標(biāo)準(zhǔn)的方式聚集更多生態(tài)力量，使能通用算力與AI算力共同支撐日益多樣的AI工作負載，加速多元算力生態(tài)進化，推動開放多元算力標(biāo)準(zhǔn)落地。

在通用算力領(lǐng)域，浪潮信息積極參與的開放計算模組規(guī)范(OCM)，正在推動建立基于處理器的標(biāo)準(zhǔn)化算力模組單元，構(gòu)建CPU的統(tǒng)一算力底座，解決多元CPU生態(tài)挑戰(zhàn)問題，推動算力產(chǎn)業(yè)快速發(fā)展。會上發(fā)布首款基于服務(wù)器計算模組設(shè)計規(guī)范OCM的NF3290G8，整機全面解耦，以CPU、內(nèi)存為核心構(gòu)建最小算力單元，標(biāo)準(zhǔn)化高速/低速互聯(lián)接口，實現(xiàn)處理器算力模組部件化，靈活支持多類型CPU，讓不同算力共享統(tǒng)一平臺，降低算力產(chǎn)業(yè)創(chuàng)新試錯成本和推廣適配成本，也讓多元化的應(yīng)用場景能夠快速找到貼合的方案。

在AI算力領(lǐng)域，浪潮信息推動開放加速規(guī)范OAM的生態(tài)繁榮，大幅縮減國內(nèi)外加速卡和服務(wù)器的適配周期，加速先進算力上線部署，支撐大模型及AI應(yīng)用迭代成熟。目前，90%高端加速卡基于OAM規(guī)范設(shè)計。會上發(fā)布基于UBB2.0規(guī)范開發(fā)的元腦服務(wù)器NF5898G8，可以兼容符合OCP開放加速規(guī)范的多款OAM 2.0模組，通過全模塊化的設(shè)計及極致的系統(tǒng)能效，滿足算力的快速迭代需求，進一步加速算力融合創(chuàng)新。

智能增強，全面加速大模型開發(fā)與AI應(yīng)用創(chuàng)新

元腦服務(wù)器第八代算力平臺實現(xiàn)了全面的智能增強，通過搭載自研服務(wù)器操作系統(tǒng)KOS、AIOps智能運維管理平臺以及AI軟件堆棧，從服務(wù)器智能，到快速構(gòu)建AI開發(fā)環(huán)境，到作業(yè)調(diào)度和資源統(tǒng)一納管，乃至智算中心智能運維，提供全面的平臺軟件與工具軟件支持。

新平臺在預(yù)警、散熱、管理等方面進行了全新的智能化升級。其中，在智能預(yù)警方面，全新升級內(nèi)存故障智能預(yù)警修復(fù)技術(shù)MUPR，基于對上萬臺服務(wù)器故障數(shù)據(jù)的建模分析和AI模型算法的訓(xùn)練，實現(xiàn)內(nèi)存故障提前預(yù)警、內(nèi)存錯誤實時隔離、內(nèi)存故障智能修復(fù)，降低內(nèi)存導(dǎo)致宕機故障率80%。在智能管理方面，通過RTOS實時操作系統(tǒng)，實現(xiàn)開機3秒內(nèi)智能管理調(diào)控風(fēng)扇轉(zhuǎn)速，降低30%的噪音，確保散熱安全。

面向大模型部署難題，新平臺與服務(wù)器操作系統(tǒng)KOS實現(xiàn)軟硬協(xié)同優(yōu)化，自研KOS AI定制版簡單2步即可實現(xiàn)大模型訓(xùn)練環(huán)境搭建，200節(jié)點訓(xùn)練集群開發(fā)環(huán)境，采用AI定制版20分鐘即可完成部署上線可用，極大提升了大模型開發(fā)部署效率。

創(chuàng)新液冷設(shè)計，讓AI更綠色更節(jié)能

隨著AI算力需求的持續(xù)攀升，AI算力的高密度部署與功耗之間的矛盾日趨突出，AI+液冷的組合已是大勢所趨。浪潮信息"All in 液冷"戰(zhàn)略已實現(xiàn)全線元腦服務(wù)器產(chǎn)品支持冷板式液冷, 面向數(shù)據(jù)中心實現(xiàn)從核心部件到整體方案的全方位覆蓋。

最新發(fā)布的兩相液冷130kW液冷整機柜，基于兩相冷板和負壓液冷的創(chuàng)新，實現(xiàn)液冷整機柜安全、解耦、高密和標(biāo)準(zhǔn)化，提供更高效的解熱能力、更靈活的節(jié)點支持、更安全的漏液防護以及標(biāo)準(zhǔn)化液冷部件，解熱能力高達每平方厘米200w以上，以先進原生液冷技術(shù)支撐超大規(guī)模智算中心建設(shè)。

浪潮信息提供液冷數(shù)據(jù)中心全生命周期整體解決方案，具有從室外一次側(cè)冷源到室內(nèi)二次側(cè)CDU、液冷連接系統(tǒng)、液冷服務(wù)器等全線布局，為用戶全方位打造綠色節(jié)能數(shù)據(jù)中心交鑰匙工程。

未來一切計算皆AI，所有計算設(shè)備都要具有AI的能力，每臺服務(wù)器都要更好支撐AI應(yīng)用。元腦服務(wù)器第八代算力平臺全面擁抱AI，以"一機多芯"領(lǐng)先架構(gòu)設(shè)計為客戶提供多元算力，滿足互聯(lián)網(wǎng)、金融、通信、能源、交通等行業(yè)用戶復(fù)雜多變的AI應(yīng)用創(chuàng)新需求，加速智能涌現(xiàn)。

消息來源：浪潮信息