北京2020年9月22日 /美通社/ -- 2020年9月4日,浪潮集團“智驅(qū)新時代-浪潮云數(shù)智中國行”長沙站活動現(xiàn)場,中南大學(xué)信息與網(wǎng)絡(luò)中心代表以“智算中南”為主題,介紹了中南大學(xué)高性能計算公共服務(wù)平臺建設(shè)有關(guān)情況。中南大學(xué)與浪潮攜手打造的國內(nèi)首個高校智算平臺即將落成,不僅將有力地支持中南大學(xué)的學(xué)科建設(shè)和人才培養(yǎng),推動高校高性能計算的發(fā)展,更是智慧時代開展科學(xué)研究強有力的基礎(chǔ)設(shè)施,“智算中南”將著力推進以算力為基礎(chǔ)、以算法為核心、以模擬和仿真為手段的科學(xué)研究數(shù)字生態(tài)體系建設(shè),賦能各行業(yè)的創(chuàng)新研究。
以下為演講現(xiàn)場實錄。
尊敬的各位領(lǐng)導(dǎo),各位來賓、IT屆的朋友們,上午好!今天非常高興,借浪潮公司巡展的機會,分享中南大學(xué)高性能計算平臺建設(shè)的一點體會。我的匯報題目是“智算中南”,實際上是借“智算中南”建設(shè)案例,向大家匯報中南大學(xué)信息與網(wǎng)絡(luò)中心在高性能計算平臺建設(shè)方面的一些做法,以期拋磚引玉。
“智算中南”建設(shè)背景
首先,從國家高等教育的宏觀視角來觀察,那就是“雙一流”建設(shè)戰(zhàn)略的大背景。2017年9月21日,教育部、財政部、國家發(fā)改委聯(lián)合發(fā)布《關(guān)于公布世界一流大學(xué)和一流學(xué)科建設(shè)高校及建設(shè)學(xué)科名單的通知》,正式公布“雙一流”建設(shè)高校及建設(shè)學(xué)科名單?!半p一流”建設(shè)主要圍繞五個方面開展,包括一流師資團隊的建設(shè)、拔尖創(chuàng)新人才的培養(yǎng)、科學(xué)研究水平的提升、優(yōu)秀文化的傳承創(chuàng)新以及科研成果的轉(zhuǎn)化推進?!半p一流”建設(shè)和人們熟知的“211工程”、“985工程”比較,有一點顯著的不同,“雙一流”建設(shè)引入了優(yōu)勝劣汰的動態(tài)競爭機制,這種動態(tài)競爭的制度安排,使得各個高校面臨新的機遇和挑戰(zhàn)。
其次,從學(xué)校當(dāng)前的需求來分析,中南大學(xué)是教育部直屬全國重點大學(xué)、國家“211工程”和“985工程”高校,是世界一流大學(xué)A類建設(shè)高校。“雙一流”建設(shè)的內(nèi)容就包括科學(xué)研究、人才培養(yǎng)和創(chuàng)新驅(qū)動,在“雙一流”建設(shè)的大背景下,學(xué)校的科學(xué)研究水平、科研成果產(chǎn)出以及拔尖創(chuàng)新人才培養(yǎng)需要更上一層樓。我們都知道,科學(xué)研究包括理論研究和實驗研究兩個基本范式,自從計算機出現(xiàn)以后,我們又多了一種從事科學(xué)研究的手段,那就是計算,通過高性能計算系統(tǒng)的模擬和仿真,來開展科學(xué)研究。
《論語》中孔子說:“工欲善其事,必先利其器”。建設(shè)一個硬件先進、功能齊全、資源豐富,面向全校師生提供高性能計算公共服務(wù)的開放性基礎(chǔ)設(shè)施,不僅可以為學(xué)校的科學(xué)研究和工程計算提供優(yōu)質(zhì)的服務(wù),而且還是人才培養(yǎng)的重要基地,更是參與國內(nèi)外高性能計算領(lǐng)域?qū)W術(shù)交流、科研合作和創(chuàng)新的重要平臺。因此,建設(shè)智算平臺提供公共計算服務(wù)的緊迫性就顯得尤為突出,我們的理念是時不我待,只爭朝夕。
再者,從學(xué)校高性能計算應(yīng)用層面來剖析,智算平臺建設(shè)之前存在四個方面的問題:
第一是小規(guī)模計算集群,學(xué)校各科研團隊采購小規(guī)模集群,存在使用效率低、資源有限、運維困難、安全隱患大,缺乏高水平專業(yè)運維和用戶服務(wù)技術(shù)人員,以及存在分散重復(fù)建設(shè)等問題;第二是昂貴的社會計算資源,租用校外計算資源存在費用高、數(shù)據(jù)傳輸困難,難以滿足個性化需求等問題;第三是對計算資源的持續(xù)投入不足,學(xué)校2009年建設(shè)了校級高性能計算公共服務(wù)平臺,盡管在2013年和2018年分別進行過升級更新,但總體而言,缺乏持續(xù)的滾動投入,導(dǎo)致計算能力嚴重不足,而且,早年建設(shè)的高性能計算設(shè)施即將面臨淘汰;第四是調(diào)研表明學(xué)校公共計算資源不足,通過統(tǒng)計學(xué)校二級學(xué)院自建計算集群存量、梳理資產(chǎn)部門計算設(shè)備采購清單,以及調(diào)研用戶對高性能計算資源的需求,發(fā)現(xiàn)學(xué)校公共計算資源存在明顯的短板。
最后,調(diào)研國內(nèi)外高水平大學(xué)高性能計算平臺建設(shè)表明,近年來清華大學(xué)、中國科學(xué)技術(shù)大學(xué)、上海交通大學(xué)分別投入數(shù)千萬資金開展高性能計算平臺的建設(shè),滿足學(xué)校科研對算力的需求。從全球HPC TOP 500排行榜來觀察,國外高水平大學(xué)也不例外??傊?,國內(nèi)外高水平大學(xué)在高性能計算領(lǐng)域的投入日趨增大,建設(shè)規(guī)模早已進入千萬億次級別(P級別),國家層面,E級別超算已提上議事日程。
基于上述背景,針對“智算中南”解決方案,我們提出滿足用戶需求,考慮前瞻性,重點服務(wù)學(xué)?!半p一流”建設(shè)的三個建設(shè)原則,精心設(shè)計、用心打造“智算中南”高性能計算平臺。
智算平臺四大優(yōu)勢
2020年上半年,中南大學(xué)攜手浪潮開始“智算中南”的建設(shè),智算平臺共有上千臺設(shè)備,采用浪潮成熟穩(wěn)定的高性能計算和人工智能服務(wù)器以及浪潮AI微模塊數(shù)據(jù)中心解決方案,合計42個高密度IT機柜,設(shè)備布局科學(xué)合理、密度高、功耗分布均勻且無熱點。單IT機柜設(shè)計功率達到19千瓦,機房面積195平米,以前幾乎無法想象在195平米的空間內(nèi),計算集群可以達到五千多萬億次的超高算力。
中南大學(xué)智算平臺具有四大優(yōu)勢:
首先是超強算力,智算平臺由1058個浪潮高密度HPC計算節(jié)點和AI服務(wù)器節(jié)點組成,采用英特爾高性能CPU和英偉達Tesla系列GPU,合計50896個計算核心,CPU理論計算能力為4856萬億次,GPU理論計算能力為788萬億次,整個計算集群聚合計算能力達到5644萬億次,計算能力位于當(dāng)前國內(nèi)高校頂尖水平。
第二是超強作業(yè)調(diào)度和管理能力,智算平臺采用浪潮自主研發(fā)的Cluster Engine集群作業(yè)調(diào)度管理軟件和AIStation人工智能資源平臺,實現(xiàn)整個平臺計算資源的統(tǒng)一調(diào)度和管理,科學(xué)分配高性能計算和深度學(xué)習(xí)等計算資源。
第三是超高性能的并行存儲系統(tǒng),智算平臺采用國際領(lǐng)先的DDN商業(yè)版Lustre并行文件系統(tǒng)和統(tǒng)一集中式存儲架構(gòu),可用存儲容量超過2PB,最大持續(xù)讀寫帶寬達到20GB/s。
第四是超大IB高速計算網(wǎng)絡(luò),智算平臺采用Mellanox公司最新的HDR InfiniBand交換機,構(gòu)建高帶寬、低時延的計算網(wǎng)絡(luò),實現(xiàn)千余臺設(shè)備的100Gb完全無擁塞高速互聯(lián)。在成千上萬的計算機組成超大規(guī)模計算集群中,節(jié)點或服務(wù)器之間的吞吐和速度極為重要,這也是“智算中南”解決方案選擇InfiniBand實現(xiàn)集群高速互聯(lián)的原因。
“智算中南”高性能計算平臺將于今年9月底建成,目前正在按計劃開展系統(tǒng)加電測試、機房環(huán)境系統(tǒng)測試、網(wǎng)絡(luò)連通性測試、集群管理軟件測試、并行編譯環(huán)境測試、內(nèi)存帶寬測試、IB高速計算網(wǎng)絡(luò)測試、存儲系統(tǒng)測試、動環(huán)監(jiān)控系統(tǒng)測試以及HP Linpack測試等。下一步將結(jié)合具體的專業(yè)領(lǐng)域應(yīng)用,與學(xué)校不同學(xué)科的專家、教授一道,開展專業(yè)應(yīng)用軟件測試,預(yù)計10月份投入試運行。我們相信,隨著平臺的投入使用,必將有力地推動學(xué)校科學(xué)研究水平的提升,進一步促進科研成果的產(chǎn)出和拔尖創(chuàng)新人才的培養(yǎng),為學(xué)校的“雙一流”建設(shè)做出貢獻。
結(jié)束語
各位來賓,科學(xué)技術(shù)是第一生產(chǎn)力,創(chuàng)新是引領(lǐng)發(fā)展的源泉,“智算中南”高性能計算平臺不僅僅定位于服務(wù)中南大學(xué)“雙一流”建設(shè),同時,我們歡迎各高等院校、科研單位、大型企業(yè)的研發(fā)機構(gòu)和中南大學(xué)攜手,基于中南大學(xué)智算平臺強大的算力,在學(xué)術(shù)研究、科研創(chuàng)新、成果轉(zhuǎn)化、人才培養(yǎng)、產(chǎn)品開發(fā)方面開展全方位的緊密合作,引領(lǐng)創(chuàng)新潮流,探索未知世界!