北京2024年10月25日 /美通社/ -- 10月24日,元腦®服務(wù)器第八代新品發(fā)布會在京舉行。會上,浪潮信息重磅發(fā)布元腦®服務(wù)器第八代算力平臺,基于開放架構(gòu)設(shè)計,業(yè)界率先實現(xiàn)"一機多芯",同一架構(gòu)支持英特爾®至強®6處理器及AMD EPYC? 9005系列處理器,在促進多元生態(tài)共進的同時,具備更全面的智能能力和更高能效,更好支撐AI大模型開發(fā)與應(yīng)用創(chuàng)新。實測數(shù)據(jù)表明,在LLaMA2大模型AI推理場景中,整機性能較上代最大提升3倍。
元腦服務(wù)器第八代算力平臺擁有23款新品,基于先進的計算、存儲架構(gòu)創(chuàng)新,在CPU總線互聯(lián)帶寬、內(nèi)存帶寬及容量上全面優(yōu)化,單機核心數(shù)最多到576C,主頻高達5.0GHz,內(nèi)存帶寬提升高達136%。元腦服務(wù)器第八代算力平臺一經(jīng)發(fā)布,就打破多項SPEC國際性能測試紀(jì)錄。
一機多芯,開放標(biāo)準(zhǔn)促進多元算力生態(tài)進化
隨著大模型能力的持續(xù)提升,生成式人工智能在企業(yè)側(cè)、行業(yè)側(cè)的落地正在提速,智能應(yīng)用不斷涌現(xiàn)。日趨豐富的AI應(yīng)用場景也衍生出新的算力挑戰(zhàn),不同AI應(yīng)用的典型特征及系統(tǒng)需求存在差異,需要多元的算力生態(tài)予以滿足。伴隨著通用處理器在芯片架構(gòu)、指令集等方面對AI的優(yōu)化增強,在AI推理端的巨大應(yīng)用潛力使得CPU在AI時代變得更加重要,需要系統(tǒng)創(chuàng)新釋放通用算力在AI領(lǐng)域的應(yīng)用價值。
元腦服務(wù)器第八代算力平臺成為全面且強大算力生態(tài)的載體,源于浪潮信息的諸多創(chuàng)新系統(tǒng)架構(gòu)設(shè)計,將通過共建開放標(biāo)準(zhǔn)的方式聚集更多生態(tài)力量,使能通用算力與AI算力共同支撐日益多樣的AI工作負載,加速多元算力生態(tài)進化,推動開放多元算力標(biāo)準(zhǔn)落地。
在通用算力領(lǐng)域,浪潮信息積極參與的開放計算模組規(guī)范(OCM),正在推動建立基于處理器的標(biāo)準(zhǔn)化算力模組單元,構(gòu)建CPU的統(tǒng)一算力底座,解決多元CPU生態(tài)挑戰(zhàn)問題,推動算力產(chǎn)業(yè)快速發(fā)展。會上發(fā)布首款基于服務(wù)器計算模組設(shè)計規(guī)范OCM的NF3290G8,整機全面解耦,以CPU、內(nèi)存為核心構(gòu)建最小算力單元,標(biāo)準(zhǔn)化高速/低速互聯(lián)接口,實現(xiàn)處理器算力模組部件化,靈活支持多類型CPU,讓不同算力共享統(tǒng)一平臺,降低算力產(chǎn)業(yè)創(chuàng)新試錯成本和推廣適配成本,也讓多元化的應(yīng)用場景能夠快速找到貼合的方案。
在AI算力領(lǐng)域,浪潮信息推動開放加速規(guī)范OAM的生態(tài)繁榮,大幅縮減國內(nèi)外加速卡和服務(wù)器的適配周期,加速先進算力上線部署,支撐大模型及AI應(yīng)用迭代成熟。目前,90%高端加速卡基于OAM規(guī)范設(shè)計。會上發(fā)布基于UBB2.0規(guī)范開發(fā)的元腦服務(wù)器NF5898G8,可以兼容符合OCP開放加速規(guī)范的多款OAM 2.0模組,通過全模塊化的設(shè)計及極致的系統(tǒng)能效,滿足算力的快速迭代需求,進一步加速算力融合創(chuàng)新。
智能增強,全面加速大模型開發(fā)與AI應(yīng)用創(chuàng)新
元腦服務(wù)器第八代算力平臺實現(xiàn)了全面的智能增強,通過搭載自研服務(wù)器操作系統(tǒng)KOS、AIOps智能運維管理平臺以及AI軟件堆棧,從服務(wù)器智能,到快速構(gòu)建AI開發(fā)環(huán)境,到作業(yè)調(diào)度和資源統(tǒng)一納管,乃至智算中心智能運維,提供全面的平臺軟件與工具軟件支持。
新平臺在預(yù)警、散熱、管理等方面進行了全新的智能化升級。其中,在智能預(yù)警方面,全新升級內(nèi)存故障智能預(yù)警修復(fù)技術(shù)MUPR,基于對上萬臺服務(wù)器故障數(shù)據(jù)的建模分析和AI模型算法的訓(xùn)練,實現(xiàn)內(nèi)存故障提前預(yù)警、內(nèi)存錯誤實時隔離、內(nèi)存故障智能修復(fù),降低內(nèi)存導(dǎo)致宕機故障率80%。在智能管理方面,通過RTOS實時操作系統(tǒng),實現(xiàn)開機3秒內(nèi)智能管理調(diào)控風(fēng)扇轉(zhuǎn)速,降低30%的噪音,確保散熱安全。
面向大模型部署難題,新平臺與服務(wù)器操作系統(tǒng)KOS實現(xiàn)軟硬協(xié)同優(yōu)化,自研KOS AI定制版簡單2步即可實現(xiàn)大模型訓(xùn)練環(huán)境搭建,200節(jié)點訓(xùn)練集群開發(fā)環(huán)境,采用AI定制版20分鐘即可完成部署上線可用,極大提升了大模型開發(fā)部署效率。
創(chuàng)新液冷設(shè)計,讓AI更綠色更節(jié)能
隨著AI算力需求的持續(xù)攀升,AI算力的高密度部署與功耗之間的矛盾日趨突出,AI+液冷的組合已是大勢所趨。浪潮信息"All in 液冷"戰(zhàn)略已實現(xiàn)全線元腦服務(wù)器產(chǎn)品支持冷板式液冷, 面向數(shù)據(jù)中心實現(xiàn)從核心部件到整體方案的全方位覆蓋。
最新發(fā)布的兩相液冷130kW液冷整機柜,基于兩相冷板和負壓液冷的創(chuàng)新,實現(xiàn)液冷整機柜安全、解耦、高密和標(biāo)準(zhǔn)化,提供更高效的解熱能力、更靈活的節(jié)點支持、更安全的漏液防護以及標(biāo)準(zhǔn)化液冷部件,解熱能力高達每平方厘米200w以上,以先進原生液冷技術(shù)支撐超大規(guī)模智算中心建設(shè)。
浪潮信息提供液冷數(shù)據(jù)中心全生命周期整體解決方案,具有從室外一次側(cè)冷源到室內(nèi)二次側(cè)CDU、液冷連接系統(tǒng)、液冷服務(wù)器等全線布局,為用戶全方位打造綠色節(jié)能數(shù)據(jù)中心交鑰匙工程。
未來一切計算皆AI,所有計算設(shè)備都要具有AI的能力,每臺服務(wù)器都要更好支撐AI應(yīng)用。元腦服務(wù)器第八代算力平臺全面擁抱AI,以"一機多芯"領(lǐng)先架構(gòu)設(shè)計為客戶提供多元算力,滿足互聯(lián)網(wǎng)、金融、通信、能源、交通等行業(yè)用戶復(fù)雜多變的AI應(yīng)用創(chuàng)新需求,加速智能涌現(xiàn)。