歷時 5 年,,制程由 14nm 減至 7nm,,更加重視 AI 推理性能,,IBM 最新 POWER10 處理器將在商用領域打出一片天地,。
在今年的 Hot Chips 2020 會議上,,IBM 正式宣布了新一代 CPU POWER10,。作為 Power 9 的繼任者,,POWER10 的處理效率是前者的三倍,,同時又提供了更高的工作負載量和容器密度。
基于 Power 9 處理器并使用 Nvidia Tesla GPU 作為加速器的 Summit,,就是世界上最快的超級計算機之一,。目前看來,繼任者 POWER10 更加值得期待,。
POWER10 的設計歷時五年,,擁有數百項新型以及正在申請的專利。早在 2015 年,,IBM,、三星和 IBM 研究聯盟的其他成員生產了第一批測試芯片。它的獨特之處在于,,這是 IBM 的首款商用 7 nm 處理器,。
POWER10 架構師 William Starke 表示,單芯片模塊產品最多不超過 15 個 SMT8 核心,,雙芯片模塊產品最多不超過 30 個 SMT8 核心,。
IBM POWER 系列芯片的發(fā)展路線圖。
制程由 14nm 縮減至 7nm,,更加重視 AI 推理性能
吞吐量和功率效率的提升部分得益于硅制程技術,,該技術使得 POWER9 中使用的 14nm GlobalFoundries 制程縮減為三星的 7nm EUV。制程微縮使得 IBM 可以添加更多的核心和更多的緩存,。
設計方法也有重大更改,。新的設計更加模塊化,,具有新的核心核心微架構和新的 AI 指令。POWER10 還添加了更多的安全硬件,。內存受到全內存加密保護,,同時也沒有降低速度。
此外,,POWER10 還為多租戶(multi-tenant)云工作負載內置了「嘈雜的鄰居(noisy neighbor)」保護功能,。為了確保云工作負載的安全性,處理器支持安全的 container,。該架構通過其 PowerVM 虛擬機來管理程序和內存池聚合功能,,以提升靈活性,通過 PB 級系統內存支持來處理各種工作負載,。
考慮到 AI 越來越重要,,IBM 增加了對其他指令和數據類型的支持。處理器通過新的可擴展指令集支持 Power 的 3.1 版本,。POWER10 也意味著 IBM 更加重視 CPU 中的 AI 推理性能,。
IBM 表示,推理處理中使用的矩陣數學函數可將性能提升 10-20 倍,。緩存帶寬上也有改進,,以使 SIMD 單元獲得數據,。
越來越多的企業(yè)將 AI 部署到實際應用 AI 的運營工作負載中,。所以,IBM 仍將支持訓練加速器,,例如 GPU 和 FPGA,,但 AI 部署基于的推理使用的是訓練創(chuàng)建的模型。
實際上,,AI 的推理用途是能夠產生商業(yè)實效的,。IBM 將在 PCIe5.0 版本上通過 OpenCAPI 支持加速器。IBM 也放棄了英偉達的 NVLink 接口,,因為 PCIe v5 提供了足夠的帶寬,。
POWER10 的推理性能展示。
其他技術細節(jié)
IBM 在 Hot Chips 會議上展示了 POWER10 的大量技術細節(jié),。芯片面積為 600 平方毫米,,具有 180 億個晶體管。最多兩個管芯可以被放入 POWER10 服務器的包中,。
每個芯片具有 15 個活躍的 CPU 核,,其中管芯上還有一個用于提升成品率的備用核。此外,,每個 CPU 可以支持 8 個線程(虛擬 CPU),,所以每個插槽中共計有 120 個線程,。
管芯上緩存內存總量為 150MB 以上。在接口設置上,,下一代 PCI Express Gen 5 具有 64 條通路,,傳輸速度高達 32GT/s。
IBM POWER10 芯片的技術規(guī)格細節(jié),。
POWER10 將會有兩個版本,。一個版本采用雙管芯封裝,時鐘頻率達到 3.5GHz,,并且能夠連接 4 個插槽,。另一版本為單芯片插槽,有更高的時鐘頻率,,為 4GHz 或更高,,最多可連接 16 個插槽。每個插槽的 PowerAXON 接口都支持超過 TB/s 級的帶寬,,而開放式內存接口(OMI)可以支持相同的帶寬,。
POWER10 最重要的創(chuàng)新就是它能在整個 POWER 服務器機架上聚合內存。本地內存通過低延遲,、高帶寬的 OMI 進行連接,,從而提供高達 4TB 的內存以及高帶寬,而且沒有一般高帶寬內存的限制和費用,。OMI 還可被用于連接存儲類內存(SCM),。
PowerAXON 接口可用于連接其他 16 個 POWER10 插槽,但也可以通過 OpenCAPI 連接到加速器,。但它最有趣的用途是內存集群,。本地處理器可以將其本地內存映射到相鄰的處理器,因此需要更多內存的工作負載可以用相鄰處理器的內存,,而無需將頁面交換到速度較慢的存儲內存中,。這種靈活性對于管理大型數據集來說至關重要。2PB 的地址空間使之變?yōu)榱丝赡?,而且這種內存共享功能也可以擴展到企業(yè)級系統,。
從 CPU 設計到軟件堆棧,POWER10 都展示出了 IBM 一直以來的企業(yè)級計算傳統,。更重要的是,,它現在支持更多的 AI 功能、硬件輔助虛擬環(huán)境,、更具擴展性的云部署以及更大的數據集處理,,使其與現代企業(yè)和云工作負載更加相關。
與此前的 Power 系列處理器一樣,POWER10 也向 OpenPower 基金會的 250 多個成員開放許可和允許修改,,包括谷歌,、英偉達、Mellanox,、 Tyan 等企業(yè),。