微軟 Azure ND H100 v5 VM 虛擬機預(yù)覽發(fā)布:采用 8 至上千個 NVIDIA H100 Tensor Core GPU
IT之家 4 月 14 日消息,據(jù)微軟 Azure 官方發(fā)布,微軟將過去十年的超級計算經(jīng)驗和支持超大型 AI 訓(xùn)練工作負(fù)載的經(jīng)驗應(yīng)用于搭建具備大規(guī)模化高性能的 AI 基礎(chǔ)架構(gòu)。微軟 Azure 智能云,特別是以圖形處理單元(GPU)加速的虛擬機(VM),為微軟及其客戶的生成式 AI 發(fā)展奠定了基礎(chǔ)。
【資料圖】
微軟現(xiàn)推出 ND H100 v5 VM,是 Azure 迄今更強大和高度可伸縮的 AI 虛擬機系列。該虛擬機支持的按需配置可達 8 至上千個通過 Quantum-2 InfiniBand 網(wǎng)絡(luò)互連的 NVIDIA H100 GPU,使得 AI 模型的性能明顯提高。相較上一代 ND A100 v4 VM,本次推出的虛擬機包含以下創(chuàng)新技術(shù):
8 塊 NVIDIA H100 Tensor Core GPU,通過下一代 NV Switch 和 NV Link 4.0 互連。
在無阻塞胖樹網(wǎng)絡(luò)中,每個 GPU 搭載 400 Gb / s NVIDIA Quantum-2 CX7 InfiniBand 和每 VM 3.2Tb / s 的性能。
每個 VM 中的 8 塊本地 GPUs 之間通過 3.8Tb / s 對分割帶寬的 NV Switch 和 NV Link 4.0 互聯(lián)。
第四代英特爾至強可擴展處理器。
PCIE 第 5 代主機到 GPU 互連,每個 GPU 帶寬為 64Gb / s。
16 信道的 4800 MHz DDR5 內(nèi)存。
IT之家注:NVIDIA Quantum-2 采用第七代 NVIDIA InfiniBand 架構(gòu),可為 AI 開發(fā)者和科學(xué)研究人員提供超強網(wǎng)絡(luò)性能和豐富功能,幫助他們解決充滿挑戰(zhàn)性的問題。NVIDIA Quantum-2 通過軟件定義網(wǎng)絡(luò)、網(wǎng)絡(luò)計算、性能隔離、高級加速引擎、遠程直接內(nèi)存訪問 (RDMA) 以及高達 400 Gb / s 的超快的速度,為先進的超級計算數(shù)據(jù)中心提供助力。
微軟表示,大規(guī)模 AI 已內(nèi)置于 Azure 的 DNA 中。對大型語言模型研究(如圖靈)的初始投資,以及諸如在云中構(gòu)建第一臺 AI 超級計算機等里程碑,都為生成式 AI 的問世做好了充分準(zhǔn)備。Azure 機器學(xué)習(xí)等 Azure 服務(wù)使客戶能夠訪問 AI 超級計算機,以進行模型訓(xùn)練。Azure OpenAI 服務(wù)使客戶能夠利用大規(guī)模生成式 AI 模型的強大功能?!敢?guī)?!挂恢笔?Azure 優(yōu)化 AI 基礎(chǔ)設(shè)施的目標(biāo)之一?,F(xiàn)在,微軟正為各種規(guī)模的初創(chuàng)公司和企業(yè)帶來無需大量物理硬件或軟件投入的超級計算功能。
現(xiàn)在,ND H100 v5 預(yù)覽發(fā)布,將成為 Azure 產(chǎn)品組合中的標(biāo)準(zhǔn)服務(wù)。
標(biāo)簽: