Arm 的使命是助力應(yīng)對 AI 無止盡的能源需求
2024-04-23
作者:Arm 首席執(zhí)行官 Rene Haas
來源:Arm
人工智能 (AI) 具有超越過去一個(gè)世紀(jì)所發(fā)生的所有變革性創(chuàng)新的潛力,它在醫(yī)療保健、生產(chǎn)力,、教育等領(lǐng)域?yàn)樯鐣淼囊嫣帉⒊跷覀兊南胂蟆榱诉\(yùn)行這些復(fù)雜的 AI 工作負(fù)載,,全球數(shù)據(jù)中心所需的計(jì)算量需要以指數(shù)級規(guī)模進(jìn)行擴(kuò)展。然而,,這種對計(jì)算無止盡的需求也揭示了一個(gè)嚴(yán)峻的挑戰(zhàn):數(shù)據(jù)中心需要龐大的電力來驅(qū)動AI這一突破性技術(shù),。
當(dāng)今的數(shù)據(jù)中心已經(jīng)消耗了大量的電力——全球每年需要 460 太瓦時(shí) (TWh) 電力進(jìn)行支持,這個(gè)數(shù)字等同于整個(gè)德國的用電量,。而 AI 的興起預(yù)計(jì)將在 2030 年把該數(shù)字提高三倍,,意味著將超過印度這一世界上人口最多國家的總耗電量。
未來的 AI 模型將持續(xù)變得更大,、更智能,,在帶動對更多計(jì)算能力的需求的同時(shí),對電力的需求也會增加,,從而成為良性循環(huán)的一部分,。而找到降低這些大型數(shù)據(jù)中心電力需求的方法對于實(shí)現(xiàn)社會性突破和兌現(xiàn) AI 的承諾至關(guān)重要,。
換言之,沒有電力就無法實(shí)現(xiàn) AI,,企業(yè)需要重新思考如何應(yīng)對能效問題的方方面面,。
重新構(gòu)思 AI 的未來——一個(gè)由 Arm 平臺驅(qū)動的未來
Arm 最初的產(chǎn)品就是為使用電池的設(shè)備而設(shè)計(jì)的,并推動了移動電話的變革,。因此,,深植于 Arm 的能效 DNA能使業(yè)界重新思考應(yīng)如何構(gòu)建芯片來滿足 AI 日益增長的需求。
在典型的服務(wù)器機(jī)架中,,僅計(jì)算芯片就可以消耗超過 50% 的電力預(yù)算,。工程團(tuán)隊(duì)正在尋找各種可以降低該數(shù)字的方法,每一瓦特的減少都至關(guān)重要,。
正因?yàn)榇?,全球最大?AI 頭部云服務(wù)提供商們轉(zhuǎn)而采用 Arm 技術(shù)來降低功耗。與同行業(yè)中的其他產(chǎn)品相比,,Arm 最新的 Arm Neoverse CPU 是面向云數(shù)據(jù)中心,,性能最高、最節(jié)能的處理器,。Neoverse 為頭部云服務(wù)提供商提供了定制芯片的靈活性,,以優(yōu)化其苛刻的工作負(fù)載,同時(shí)提供領(lǐng)先的性能和能效,。每一瓦特的節(jié)省都可以用來實(shí)現(xiàn)更多的計(jì)算,。這也正是為什么亞馬遜云服務(wù) (AWS)、微軟,、Google 和甲骨文 (Oracle) 現(xiàn)在都通過 Neoverse 技術(shù),,處理其通用計(jì)算和基于 CPU 的 AI 推理和訓(xùn)練。Neoverse 平臺正在成為云數(shù)據(jù)中心領(lǐng)域的事實(shí)標(biāo)準(zhǔn),。
從近期的行業(yè)內(nèi)的發(fā)布來看:
· 基于 Arm 架構(gòu)的 AWS Graviton:與其他同行業(yè)產(chǎn)品相比,Amazon Sagemaker 的 AI 推理性能提高了 25%,,Web 應(yīng)用程序提高了 30%,,數(shù)據(jù)庫提高了 40%,效率則提升了 60%,。
· 基于 Arm 架構(gòu)的 Google Cloud Axion:與傳統(tǒng)架構(gòu)相比,,其性能和能效分別提高了 50% 和 60%,可為基于 CPU 的 AI 推理和訓(xùn)練,、YouTube,、Google 地球等服務(wù)提供支持。
· 基于 Arm 架構(gòu)的 Microsoft Azure Cobalt:性能高出同類產(chǎn)品 40%,,并為 Microsoft Teams 等服務(wù)提供支持,,與 Maia 加速器的耦合驅(qū)動 Azure 的端到端 AI 架構(gòu),。
· Oracle Cloud 采用基于 Arm 架構(gòu)的 Ampere Altra Max:與傳統(tǒng)同類產(chǎn)品相比,每機(jī)架服務(wù)器的性能提高 2.5 倍,,能耗降低 2.8 倍,,并用于生成式 AI 推理模型,諸如摘要,、大語言模型訓(xùn)練的數(shù)據(jù)的標(biāo)記化,,以及批量推理用例。
顯然,,Neoverse 極大地提升了云端通用計(jì)算的性能和能效,。此外,合作伙伴也發(fā)現(xiàn)在加速計(jì)算方面,,Neoverse 也能帶來同樣的益處,。大規(guī)模 AI 訓(xùn)練需要獨(dú)特的加速計(jì)算架構(gòu),例如,,NVIDIA Grace Blackwell 平臺 (GB200) 結(jié)合了 NVIDIA 的 Blackwell GPU 架構(gòu)與基于 Arm 架構(gòu)的 Grace CPU,。這種基于 Arm 技術(shù)的計(jì)算架構(gòu)可實(shí)現(xiàn)系統(tǒng)級設(shè)計(jì)優(yōu)化,與面向大語言模型的 NVIDIA H100 GPU 相比,,可帶來 25 倍的能耗降低,,并將每個(gè) GPU 的性能提高 30 倍。這些優(yōu)化能夠帶來顛覆性的性能和節(jié)能效果,,而這一切都得益于 Neoverse 所帶來的前所未有的芯片定制靈活性,。
隨著基于Arm 架構(gòu)的部署持續(xù)擴(kuò)大,這些企業(yè)將可以節(jié)省高達(dá) 15% 的數(shù)據(jù)中心總能耗,。這些巨幅的節(jié)省可以用來在相同的功率范圍內(nèi)驅(qū)動額外的 AI 運(yùn)算,,而不會增加能源負(fù)擔(dān)。換言之,,這些節(jié)能相當(dāng)于可以額外運(yùn)行 20 億次 ChatGPT 查詢,,驅(qū)動四分之一的日常網(wǎng)絡(luò)搜索流量,為 20% 的美國家庭提供照明,,或?yàn)榕c哥斯達(dá)黎加面積相仿的國家進(jìn)行供電,。這對改善能源消耗和環(huán)境可持續(xù)性產(chǎn)生了驚人的影響。
Arm CPU 正在從根本上推動 AI 變革,,并造福地球,。Arm 架構(gòu)是未來 AI 計(jì)算的基石。