omniture

浪潮信息劉軍:AI新時代,智算力就是創(chuàng)新力

2022-12-20 11:59 4402

北京2022年12月19日 /美通社/ -- 浪潮信息副總裁、浪潮AI&HPC產(chǎn)品線總經(jīng)理劉軍在近日舉行的量子位“MEET2023智能未來大會”上發(fā)表了主題演講《AI新時代,智算力就是創(chuàng)新力》。

在該大會公布的“2022人工智能年度評選”榜單上,浪潮信息獲評為“2022年度人工智能領航企業(yè)”,劉軍獲評為“2022年度人工智能領軍人物”。


以下為劉軍在MEET2023智能未來大會的演講實錄:

為什么說智算力就是創(chuàng)新力?

當今在人工智能前沿領域的大模型,就是在智算算力驅動下重大創(chuàng)新的典型,比如GPT-3,浪潮“源1.0”等等,這些大模型發(fā)展的背后是算力的極大支撐。 

我們提出用“算力當量”來對AI任務所需算力總量進行度量,單位是PetaFlops/s-day也就是PD,即用每秒千萬億次的計算機完整運行一天消耗的算力總量(PD)作為度量單位。一個任務需要多少PD的計算量,就把它視為這個任務的“算力當量”。GPT-3的算力當量是3640個PD,源1.0是2457億的參數(shù)的大模型,它的算力當量是4095個PD。

當前元宇宙非常關注的數(shù)字人的建模和渲染方面,如果要做一個栩栩如生的人物形象的創(chuàng)建和渲染,以《阿麗塔:戰(zhàn)斗天使》來舉例,它平均每一幀需要花100個小時來渲染,總共這部影片的渲染計算使用了4.32億小時的算力。

在自動駕駛領域,特斯拉創(chuàng)建了DOJO的智算系統(tǒng),用于感知模型的訓練和仿真。它的FSD全自動駕駛系統(tǒng)的融合感知模型,訓練消耗的算力當量是500個PD。

在備受關注的AI+Science領域、蛋白質的結構預測、分子動力學的模擬、流體力學的仿真,它不僅融合了傳統(tǒng)的HPC計算也融合了當今的AI計算。比如說,經(jīng)常被提及的AlphaFold2,它的訓練消耗的算力當量是300個PD。與此同時,為AlphaFold2訓練所做的數(shù)據(jù)準備,需要花費200M CPU-hours HPC算力。

我們可以確切地認識到,今天在AI領域的眾多創(chuàng)新背后離不開智算力的支撐,可以說智算力就是創(chuàng)新力。


接下來和大家來分享當前智算發(fā)展的三個重要的趨勢:算力多元化、模型巨量化以及元宇宙。

算力多元化需要軟硬一體的支撐平臺

第一,算力多元化。Henessy和Patterson在幾年前的《計算機架構的新黃金時代》中提出了特定領域的體系架構Domain Specific Architectures(DSAs)的概念,這也可以用來解釋為什么今天我們會看到這么多的多元算力芯片。

在中國,市場上有十幾種的CPU芯片,有將近一百種AI算力的芯片。為什么會有這樣的需求?今天算力的應用場景是多元化的,不同的場景需要不同的計算精度類型和計算特征。比如說,高性能計算里面可能會需要FP64雙精度計算,AI訓練需要使用數(shù)字范圍更大、精度低的16位浮點計算,AI推理可以使用INT8或者INT4格式。而為適應這些計算的特點,需要我們引入多元的芯片來進行支撐。如何從軟件和硬件上來應對這樣的挑戰(zhàn)?浪潮信息認為,重點是從系統(tǒng)的硬件平臺和軟件角度來進行相應的創(chuàng)新支撐。


首先是在硬件方面的系統(tǒng)支持,當今AI計算用的非常多的還是采用英偉達GPU的AI服務器。但是對于其他品牌的AIPU來說,要用什么樣的一個AI服務器系統(tǒng)來支撐呢?浪潮信息打造了全球首款開放加速的AI服務器,在一個系統(tǒng)里能夠支持8顆國內最高性能的AI芯片進行高速互聯(lián),從而能夠完成大規(guī)模的模型訓練所需要的算力。芯片之間使用了開放加速的接口標準,芯片間可以進行高速通信。今天,這個系統(tǒng)已經(jīng)可以支持多個品牌的國內最高端的GPU和AIPU,并且已經(jīng)在眾多的客戶場景里面實現(xiàn)了落地。同時,它還支持先進的液冷技術,使得我們構建的AI算力集群的PUE會低于1.1。

作為智算中心的核心,如何來調度多元的算力?這是一個平臺軟件方面的挑戰(zhàn),浪潮為此推出了業(yè)界首款智算中心算力調度軟件AIStation,實現(xiàn)了對異構AI芯片進行標準化與流程化管理,不僅能夠充分發(fā)揮多元異構芯片的性能潛力,并且能夠提升智算中心的整體效能。從基本的接入適配到業(yè)務應用在異構算力的使用優(yōu)化,AIStation提供了完備的工具與解決方案,與傳統(tǒng)開源方案相比,芯片接入穩(wěn)定性方面提升30%,減少接入工作量90%以上。標準化、流程化也使得AIStation在芯片管理種類上達到了業(yè)界前列,已經(jīng)支持了30多款國內外最頂尖的AI芯片,包括X86和ARM等CPU芯片、FPGA芯片,也包括今天應用非常廣泛的GPU和AIPU,例如像英偉達的GPU系列,以及各類國產(chǎn)AIPU等等。

我們做了眾多的實踐落地,位于宿州的淮海智算中心采用全球領先的“E級AI元腦”智算架構,通過開放多元的系統(tǒng)架構,在底層基礎設施層支持通用處理器、通用加速處理器、專用芯片、可編程芯片等,通過AIStation實現(xiàn)了異構算力的調度,提供FP64、FP32、FP16、INT8等多種精度的計算類型支持,并支持國內外主流的深度學習的框架、數(shù)據(jù)庫、數(shù)據(jù)集以降低用戶的學習成本。

大模型成為AIGC算法引擎

第二,大模型。大模型正在成為AIGC的算法引擎,今天大家看到的DALL?E或者Stable Diffusion的背后都是大模型在驅動。大模型使得AI從五年前的”能聽會看”,走到今天“能思考、會創(chuàng)作”,下一步甚至于到“會推理、能決策”的進步。但是我們知道大模型帶給我們的是在算力方面巨大的挑戰(zhàn)。如何能夠把大模型的能力交付到眾多的中小企業(yè)中,幫助他們實現(xiàn)智能化的轉型,是我們今天要去解決的重要課題,所以在這方面我們認為Model as a Service(MaaS)是比較好的一種方式。

今天,在大模型的能力加持下,AIGC,包括文本生成、文生圖以及虛擬數(shù)字人等應用都會快速的進入到商業(yè)化階段。

“源1.0”是浪潮去年推出的中文語言巨量模型,擁有2457億參數(shù),在眾多的評測里面表現(xiàn)出了非常優(yōu)異的成績。團隊圍繞深度學習框架、訓練集群IO、通信開展了深入優(yōu)化,構建了面向大模型的軟硬件協(xié)同體系結構,訓練平臺的算力效率達到45%,這遙遙領先于GPT-3、MT-NLG這樣的大模型。同時,通過在AI編譯器與深度學習推理框架上的優(yōu)化,“源”已經(jīng)實現(xiàn)了對多元AI芯片的支持。

下面分享幾個基于“源1.0”構建的實際應用案例:

第一個案例是AI劇本殺。劇本殺是大家比較熟悉的游戲,一位開發(fā)者基于“源1.0”構建了一個AI角色來和人類玩劇本殺,玩到最后其他人類玩家都很難察覺到自己是在和AI一起玩劇本殺,因為AI在這里面所表現(xiàn)出來的場景理解能力、目的性對話能力是我們在傳統(tǒng)的AI算法上面很難見到的。目前項目已經(jīng)在GitHub上開源,大家感興趣可以嘗試。

第二個案例,上海一個開發(fā)者群體基于“源1.0”構建了數(shù)字社區(qū)助理,類似于給我們的居委會打造了一個教練員,通過讓AI模擬來居委會咨詢的居民,提升社區(qū)工作者應對居民突發(fā)狀況服務的能力,這種將大模型反向應用于教培領域的案例給AI發(fā)展帶來了更多想象空間。


最近,大家都在討論ChatGPT,簡單來說它就是基于大模型的面向長文本、多輪對話的AIGC應用。其實我們基于“源1.0”也開發(fā)了公文寫作助手。現(xiàn)在大家希望有個助手來協(xié)助寫總結報告、學習體會,所以我們希望打造一個寫作助手來幫助大家進行長本文創(chuàng)作。其中,我們突破了可控文本內容生成技術,解決了長文本內容偏移問題,生成文本的語義一致性高達96%。這樣的優(yōu)化使得我們的中文寫作助手能夠帶來非常驚艷的效果,目前我們的產(chǎn)品處于內測階段,歡迎大家來申請使用。

我們把“源”大模型應用在浪潮自己的業(yè)務上,賦能自身業(yè)務智能化轉型。浪潮信息是中國最大、全球第二的服務器廠商。我們擁有一個覆蓋非常廣泛的客戶服務系統(tǒng),傳統(tǒng)的智能客服更多是基于規(guī)則和提煉的知識來構建的問答系統(tǒng),這樣的問答系統(tǒng)大部分情況下是不能幫客戶滿意地解決問題的。今天基于“源1.0”構建的浪潮信息智能客服可以進行長文本的內容生成,能夠持續(xù)地多輪對話,同時非常重要的是它不僅僅是基于知識規(guī)則而構建的問答系統(tǒng),它可以自己去閱讀和服務器相關的產(chǎn)品技術文檔,我們說它可謂是服務器的“服務大腦”,在它的支撐下,浪潮信息的客戶服務效率得到了大幅的提升,這個項目榮獲了《哈佛商業(yè)評論》鼎革獎,即年度新技術突破獎。

元宇宙需要強大的算力基礎設施

第三,元宇宙。大家可能會驚奇元宇宙需要算力嗎?我們告訴大家,元宇宙非常需要算力。元宇宙的構建有四個大的作業(yè)環(huán)節(jié),協(xié)同創(chuàng)建、高精仿真、實時渲染、智能交互,每一個環(huán)節(jié)上面都需要大量算力做支撐。比如說,在高精仿真的階段,要實現(xiàn)元宇宙場景中逼真的、符合物理定律的仿真,不僅需要AI計算,同時還需要HPC算力。在圖形渲染環(huán)節(jié),不僅傳統(tǒng)的光線追蹤、路徑追蹤等圖像渲染算法需要大量算力,當今基于AI的DLSS等算法也需算力支撐。到了最后的智能交互環(huán)節(jié),今天所看到的數(shù)字人、多輪的語言交互等等,它背后都是基于算力才得以實現(xiàn),這就是為什么說元宇宙需要強大的算力支持。

今年浪潮信息推出的MetaEngine元宇宙服務器就是為了應對這樣的算力挑戰(zhàn),有興趣的可以看下我們如何基于MetaEngine來創(chuàng)建虛擬數(shù)字人和數(shù)字孿生的全過程。


為了推動了元宇宙的快速落地,上個月青田人民政府和浪潮信息和我們合作伙伴谷梵科技一起,簽約建設國內首個元宇宙算力中心,用于支撐在青田、浙江乃至于長三角在元宇宙的數(shù)字空間創(chuàng)建、數(shù)字產(chǎn)業(yè)發(fā)展,支撐數(shù)字經(jīng)濟、數(shù)實融合的發(fā)展。

我的演講到此結束。謝謝大家!

消息來源:浪潮信息
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection