微軟希望通過推出用于AI和其他工作負(fù)載的新型專用芯片來推動(dòng)其客戶的AI和云計(jì)算雄心,。
近日舉行的Ignite 2023大會(huì)上,,微軟宣布的新芯片包括微軟在Azure上推出的首款定制型AI加速器Azure Maia,旨在支持大型語言模型和GitHub Copilot等工作負(fù)載,,以及微軟首個(gè)定制的自主開發(fā)型CPU——Azure Cobalt,該芯片是基于Arm架構(gòu)構(gòu)建的,,可為常見工作負(fù)載提供最佳性能和能源效率。
微軟Azure基礎(chǔ)設(shè)施營(yíng)銷總經(jīng)理Omar Khan在一篇博文中表示,,AI轉(zhuǎn)型是今年Ignite大會(huì)的核心主題之一,。他表示,今年人工智能發(fā)展迅速,,正在推動(dòng)著一波創(chuàng)新浪潮,,迅速改變應(yīng)用格局以及應(yīng)用構(gòu)建和交付的方式。然而,企業(yè)在努力發(fā)展這一創(chuàng)新的同時(shí),,還要應(yīng)對(duì)成本上升和可持續(xù)發(fā)展挑戰(zhàn)等優(yōu)先事項(xiàng),。
Khan表示:“如今客戶正在尋找能夠滿足他們所有需求的AI解決方案,在AI新時(shí)代,,我們正在重新定義從芯片到系統(tǒng)的云基礎(chǔ)設(shè)施,,為每個(gè)企業(yè)、每個(gè)應(yīng)用和每個(gè)人的AI做好準(zhǔn)備,?!?/p>
Azure Maia定制AI加速器
Khan解釋說,Azure Maia加速器芯片是為大型語言模型,、Bing和ChatGPT等AI工作負(fù)載定制的,,是計(jì)劃中的第一代加速器系列,,它擁有1050億個(gè)晶體管,,是有史以來基于5納米工藝制造的最強(qiáng)大的芯片之一。該芯片是微軟與OpenAI合作設(shè)計(jì)的,,OpenAI深入了解了其大型語言模型如何運(yùn)行在Azure云基礎(chǔ)設(shè)施上,,以確保其提供最佳性能,。
OpenAI首席執(zhí)行官Sam Altman表示,,OpenAI的專家和微軟在Azure AI基礎(chǔ)設(shè)施層的各個(gè)方面進(jìn)行了合作。他說:“我們共同努力,,用我們的模型來完善和測(cè)試,,Azure端到端的AI架構(gòu)現(xiàn)在已經(jīng)通過Maia優(yōu)化至芯片,為訓(xùn)練功能更強(qiáng)大的模型,、為客戶降低這些模型的成本鋪平了道路,。”
微軟技術(shù)研究員Brian Harry表示,,Maia 100 AI加速器也是專門為適應(yīng)Azure硬件堆棧的其余部分而構(gòu)建的,。他承諾,該芯片的設(shè)計(jì)與Azure更大的AI基礎(chǔ)設(shè)施的結(jié)合,,將帶來性能和效率上的巨大提升,。
Azure Cobalt CPU
Cobalt CPU是一款64位的128核芯片,據(jù)稱比當(dāng)前一代Azure Arm芯片性能提高了40%,,旨在為Teams和Azure SQL等微軟服務(wù)提供支持,。Arm芯片以其節(jié)能設(shè)計(jì)而聞名,可以幫助客戶實(shí)現(xiàn)可持續(xù)發(fā)展的目標(biāo),,同時(shí)確保云原生應(yīng)用按預(yù)期運(yùn)行,,其重點(diǎn)是優(yōu)化芯片的每瓦性能,,以便在消耗的每單位能量中榨取最大功率。
Harry表示:“架構(gòu)和實(shí)施的設(shè)計(jì)考慮了功效,,我們正在以最有效的方式利用硅上的晶體管,,將我們所有數(shù)據(jù)中心服務(wù)器的效率提升相乘,,加起來就是一個(gè)相當(dāng)大的數(shù)字,。”
Azure硬件系統(tǒng)和基礎(chǔ)設(shè)施公司副總裁Rani Borkar表示,,微軟選擇自主設(shè)計(jì)自己的芯片,,以確保芯片完美適合其云基礎(chǔ)設(shè)施及其運(yùn)行的AI工作負(fù)載。這些芯片將與定制的服務(wù)器主板集成,,并放置在定制的服務(wù)器機(jī)架內(nèi),,以便輕松安裝在微軟的數(shù)據(jù)中心內(nèi),然后將配合微軟專門設(shè)計(jì)的數(shù)據(jù)中心軟件使用,。Borkar表示,,其結(jié)果就是讓硬件系統(tǒng)提供最大的靈活性,可以針對(duì)功耗,、性能,、可持續(xù)性或成本進(jìn)行優(yōu)化。
Borkar表示:“在微軟,,我們正在共同設(shè)計(jì)和優(yōu)化硬件和軟件,,以便實(shí)現(xiàn)一加一大于二的效果。我們可以看到整個(gè)堆棧,,而硅只是其中的成分之一,。”
Khan表示,,新的芯片代表了微軟下一代云基礎(chǔ)設(shè)施的最后一塊版圖,,將于明年初開始向客戶推出,最初將支持包括Microsoft Copilot和Azure OpenAI Service在內(nèi)的服務(wù),,然后擴(kuò)展到其他類型的工作負(fù)載,。
Constellation Research分析師Holger Mueller表示,微軟針對(duì)AI開發(fā)自己的定制硬件是有意義的,,因?yàn)槲④浺呀?jīng)提供了一系列用于開發(fā)和運(yùn)行這些工作負(fù)載的最全面的軟件,。他說:“性能和功能的結(jié)合,再加上Azure的網(wǎng)絡(luò)功能,,使這些定制芯片成為企業(yè)非常感興趣的產(chǎn)品,企業(yè)將非常高興看到Azure Maia和Azure Cobalt能夠提供什么,?!?/p>
除了新硬件之外,,微軟還做出了巨大努力來改善連接硬件的網(wǎng)絡(luò)基礎(chǔ)設(shè)施。微軟表示,,憑借其中空芯光纖技術(shù)和現(xiàn)已全面推出的Azure Boost服務(wù),,將能夠大幅加速網(wǎng)絡(luò)和存儲(chǔ),兩者的結(jié)合將使客戶能夠?qū)崿F(xiàn)高達(dá)每秒12.5 GB的吞吐量,、每秒650000 IPOS的遠(yuǎn)程存儲(chǔ)性能,、以及高達(dá)每秒200 GB的網(wǎng)絡(luò)帶寬,以支持?jǐn)?shù)據(jù)最密集的工作負(fù)載,。
除了微軟的定制芯片之外,,客戶還將擁有新的硬件選擇。微軟在另一份聲明中表示,,正在與Nvidia公司合作,,提供對(duì)其最新基于H100 Tensor Core GPU的虛擬機(jī)的訪問了路徑,主要針對(duì)中型到大型的AI工作負(fù)載例如Azure Confidential虛擬機(jī),,還將于明年提供對(duì)Nvidia H200 Tensor Core GPU的訪問,,以盡可能低的延遲支持對(duì)更大型AI模型的推理。
第三個(gè)AI工作負(fù)載選擇是由AMD構(gòu)建的新型MI300加速器,。MI300于今年早些時(shí)候發(fā)布,,并將于明年初在Azure上提供。微軟表示,,這款高性能芯片的加入為客戶提供了運(yùn)行AI應(yīng)用的更多選擇,。
Borkar表示:“以客戶為中心意味著我們?yōu)榭蛻籼峁┳詈玫臇|西,意味著我們要利用生態(tài)系統(tǒng)中可用的東西以及我們開發(fā)的東西,,我們將繼續(xù)與所有合作伙伴合作,,為客戶提供他們想要的東西?!?/p>
Azure基礎(chǔ)架構(gòu)更新
微軟在Azure基礎(chǔ)設(shè)施方面還有更多內(nèi)容可以分享,,例如微軟宣布Oracle Database@Azure服務(wù)將在微軟美國(guó)東部Azure區(qū)域全面上線。該服務(wù)將于12月推出,,該地區(qū)的Azure客戶可以直接訪問Oracle自己數(shù)據(jù)中心的Oracle云基礎(chǔ)設(shè)施上的數(shù)據(jù)庫(kù)服務(wù),。微軟承諾,將與Oracle Exadata Database Service on OCI的性能,、規(guī)模和工作負(fù)載可用性相匹配,,同時(shí)添加Azure的所有優(yōu)勢(shì)包括安全性、靈活性和服務(wù),。
與此同時(shí),,VMware的客戶很快將能夠訪問VMware vSphere on Azure Arc。該服務(wù)現(xiàn)已全面推出,,融合了Azure和VMware的基礎(chǔ)設(shè)施,,為開發(fā)者提供支持讓他們可以使用Azure 的服務(wù)構(gòu)建更復(fù)雜的應(yīng)用,。此外,由Azure Arc支持的Azure IoT Operations現(xiàn)在也已經(jīng)推出預(yù)覽版,,這樣客戶就可以構(gòu)建復(fù)雜性較低的物聯(lián)網(wǎng)應(yīng)用和服務(wù),,使遠(yuǎn)程設(shè)備能夠在AI洞察的驅(qū)動(dòng)下做出實(shí)時(shí)決策。
最后,,微軟分享了Microsoft Copilot for Azure的一些簡(jiǎn)要細(xì)節(jié),,該產(chǎn)品今天推出了預(yù)覽版。Microsoft Copilot for Azure基于生成式AI技術(shù),,使客戶能夠更輕松地在Azure中執(zhí)行多種任務(wù),,將簡(jiǎn)化用戶在任何環(huán)境中設(shè)計(jì)、操作應(yīng)用和基礎(chǔ)設(shè)施以及對(duì)其進(jìn)行故障排除的方式,??蛻艨梢栽谠摲?wù)正式推出之前申請(qǐng)?jiān)L問。