微軟 Azure ND H100 v5 VM 虛擬機預(yù)覽發(fā)布：采用 8 至上千個 NVIDIA H100 Tensor Core GPU

2023-04-14 21:33:12|

來源：IT之家作者：

IT之家 4 月 14 日消息，據(jù)微軟 Azure 官方發(fā)布，微軟將過去十年的超級計算經(jīng)驗和支持超大型 AI 訓(xùn)練工作負(fù)載的經(jīng)驗應(yīng)用于搭建具備大規(guī)模化高性能的 AI 基礎(chǔ)架構(gòu)。微軟 Azure 智能云，特別是以圖形處理單元（GPU）加速的虛擬機（VM），為微軟及其客戶的生成式 AI 發(fā)展奠定了基礎(chǔ)。

【資料圖】

微軟現(xiàn)推出 ND H100 v5 VM，是 Azure 迄今更強大和高度可伸縮的 AI 虛擬機系列。該虛擬機支持的按需配置可達 8 至上千個通過 Quantum-2 InfiniBand 網(wǎng)絡(luò)互連的 NVIDIA H100 GPU，使得 AI 模型的性能明顯提高。相較上一代 ND A100 v4 VM，本次推出的虛擬機包含以下創(chuàng)新技術(shù)：

8 塊 NVIDIA H100 Tensor Core GPU，通過下一代 NV Switch 和 NV Link 4.0 互連。

在無阻塞胖樹網(wǎng)絡(luò)中，每個 GPU 搭載 400 Gb / s NVIDIA Quantum-2 CX7 InfiniBand 和每 VM 3.2Tb / s 的性能。

每個 VM 中的 8 塊本地 GPUs 之間通過 3.8Tb / s 對分割帶寬的 NV Switch 和 NV Link 4.0 互聯(lián)。

第四代英特爾至強可擴展處理器。

PCIE 第 5 代主機到 GPU 互連，每個 GPU 帶寬為 64Gb / s。

16 信道的 4800 MHz DDR5 內(nèi)存。

IT之家注：NVIDIA Quantum-2 采用第七代 NVIDIA InfiniBand 架構(gòu)，可為 AI 開發(fā)者和科學(xué)研究人員提供超強網(wǎng)絡(luò)性能和豐富功能，幫助他們解決充滿挑戰(zhàn)性的問題。NVIDIA Quantum-2 通過軟件定義網(wǎng)絡(luò)、網(wǎng)絡(luò)計算、性能隔離、高級加速引擎、遠程直接內(nèi)存訪問 (RDMA) 以及高達 400 Gb / s 的超快的速度，為先進的超級計算數(shù)據(jù)中心提供助力。

微軟表示，大規(guī)模 AI 已內(nèi)置于 Azure 的 DNA 中。對大型語言模型研究（如圖靈）的初始投資，以及諸如在云中構(gòu)建第一臺 AI 超級計算機等里程碑，都為生成式 AI 的問世做好了充分準(zhǔn)備。Azure 機器學(xué)習(xí)等 Azure 服務(wù)使客戶能夠訪問 AI 超級計算機，以進行模型訓(xùn)練。Azure OpenAI 服務(wù)使客戶能夠利用大規(guī)模生成式 AI 模型的強大功能?！敢?guī)?！挂恢笔?Azure 優(yōu)化 AI 基礎(chǔ)設(shè)施的目標(biāo)之一?，F(xiàn)在，微軟正為各種規(guī)模的初創(chuàng)公司和企業(yè)帶來無需大量物理硬件或軟件投入的超級計算功能。

現(xiàn)在，ND H100 v5 預(yù)覽發(fā)布，將成為 Azure 產(chǎn)品組合中的標(biāo)準(zhǔn)服務(wù)。

標(biāo)簽：