Supermicro 推出業(yè)界首款NVIDIA HGX H100 8和4-GPU H100液冷服務(wù)器,降低數(shù)據(jù)中心電力成本40%
液體冷卻大型AI培訓(xùn)基礎(chǔ)設(shè)施是一套整體機(jī)架集成解決方案,可以加快部署速度、提高性能,降低環(huán)境總成本
加利福尼亞州圣荷西和德國(guó)漢堡2023年5月24日 /美通社/ -- Supermicro, Inc.(納斯達(dá)克代碼:SMCI)是云計(jì)算、AI/ML、存儲(chǔ)和5G /邊緣整體IT解決方案提供商,繼續(xù)使用液冷NVIDIA HGX H100機(jī)架式解決方案擴(kuò)展其數(shù)據(jù)中心產(chǎn)品。 先進(jìn)液冷技術(shù)完全由 Supermicro開發(fā),可以縮短整個(gè)設(shè)備的交付周期,提高性能,降低運(yùn)營(yíng)費(fèi)用,同時(shí)顯著降低數(shù)據(jù)中心電源利用率。 與空氣冷卻數(shù)據(jù)中心相比,使用 Supermicro液冷解決方案的數(shù)據(jù)中心估計(jì)可節(jié)省40%的電力。 此外,與現(xiàn)有數(shù)據(jù)中心相比,直接冷卻成本可降低86%。
Supermicro 總裁兼首席執(zhí)行官 Charles Liang 表示:"Supermicro繼續(xù)引領(lǐng)行業(yè),支持全球人工智能工作負(fù)載和現(xiàn)代數(shù)據(jù)中心的苛刻需求。 我們的創(chuàng)新 GPU 服務(wù)器,采用我們的液冷技術(shù),顯著降低了數(shù)據(jù)中心的電源需求。 根據(jù)實(shí)現(xiàn)當(dāng)今快速發(fā)展的大規(guī)模 AI 模型所需的功率,優(yōu)化 TCO 和環(huán)境總成本(TCE)對(duì)數(shù)據(jù)中心運(yùn)營(yíng)商至關(guān)重要。 我們?cè)谠O(shè)計(jì)和構(gòu)建整個(gè)高性能服務(wù)器機(jī)架方面擁有經(jīng)過(guò)驗(yàn)證的專業(yè)知識(shí)。 為機(jī)架級(jí)從零開始設(shè)計(jì)這些GPU系統(tǒng),每張采用液冷方式,具有超高性能和效率,可簡(jiǎn)化部署過(guò)程,因此,我們能夠在較短交付時(shí)間內(nèi)滿足客戶要求。"
Supermicro GPU 服務(wù)器相關(guān)更多信息,請(qǐng)?jiān)L問(wèn):htt ps://www.supermicro.com/en/products/gpu
AI 優(yōu)化機(jī)架采用Supermicro最新產(chǎn)品系列,包括Intel和AMD服務(wù)器產(chǎn)品系列,可以以標(biāo)準(zhǔn)工程模板快速交付,或根據(jù)用戶獨(dú)特要求輕松定制。 Supermicro 繼續(xù)提供業(yè)界最廣泛的產(chǎn)品線,提供性能最高的服務(wù)器和存儲(chǔ)系統(tǒng),以解決復(fù)雜的計(jì)算密集型項(xiàng)目。 通過(guò)機(jī)架式集成解決方案,客戶有信心和能力將機(jī)架插入、連接至網(wǎng)絡(luò),與他們自己管理技術(shù)相比,效率提高。
這款頂級(jí)液冷 GPU 服務(wù)器包含雙 Intel 或AMD CPU以及8個(gè)或4個(gè)互連NVIDIA HGX H100 Tensor Core GPU。 使用液冷可將數(shù)據(jù)中心40%功耗,從而降低運(yùn)營(yíng)成本。 此外,這兩款系統(tǒng)都大大超過(guò)了上一代NVIDIA HGX GPU 設(shè)備系統(tǒng),與當(dāng)今大型變壓器型號(hào)相比,由于 GPU-GPU 互連速度更高和采用基于 PCIe 5.0的網(wǎng)絡(luò)和存儲(chǔ),性能和效率提高30倍。
Supermicro提供8款NVIDIA H100 SXM5 Tensor Core GPU 服務(wù)器用于當(dāng)今最大型 AI 模型,包括:
Supermicro 還設(shè)計(jì)了一系列可定制的 GPU 服務(wù)器,用于快速 AI 培訓(xùn)、大量 AI 推理或AI融合 HPC 工作負(fù)載,包括配備四個(gè)NVIDIA H100 SXM5 Tensor Core GPU 的系統(tǒng)。
Supermicro 液冷機(jī)架式解決方案包括冷卻劑分配單元(CDU),為當(dāng)今最高的TDP CPU 和 GPU 提供高達(dá)80kW的直接芯片(D2C)冷卻,適用于Supermicro 各種服務(wù)器。 電源和液冷泵冗余且可熱插拔,確保服務(wù)器在電源或液冷泵故障時(shí)仍能持續(xù)冷卻。 防漏電連接器使客戶更有信心對(duì)所有系統(tǒng)進(jìn)行不間斷液體冷卻。 如需了解 Supermicro 液冷系統(tǒng)相關(guān)更多信息,請(qǐng)?jiān)L問(wèn):https://www.supermicro.com/en/solutions/liquid-coolin
機(jī)架規(guī)模設(shè)計(jì)和集成已成為系統(tǒng)供應(yīng)商的一項(xiàng)關(guān)鍵服務(wù)。 隨著 AI 和 HPC 已成為組織內(nèi)越來(lái)越關(guān)鍵的技術(shù),必須優(yōu)化和配置從服務(wù)器級(jí)別到整個(gè)數(shù)據(jù)中心的配置,以實(shí)現(xiàn)最大性能。 Supermicro 系統(tǒng)和機(jī)架級(jí)專家與客戶密切合作,探索需求,擁有知識(shí)和制造能力,為全球客戶提供大量機(jī)架。
如需閱讀Supermicro 大型AI解決方案概要,請(qǐng)?jiān)L問(wèn)-h ttps://www.supermicro.com/solutions/Solution-Brief_Rack_Scale_AI.pdf
ISC上的Supermicro
如需探索這些技術(shù)并與我們的專家見(jiàn)面,請(qǐng)參觀2023年5月21日至25日在德國(guó)漢堡舉行的ISC高性能2023活動(dòng)的 Supermicro 展位D405。