通過著名媒體《連線》,,AI初創(chuàng)公司Cerebras Systems正式公布了史上最大的的單晶圓芯片——Cerebras Wafer Scale Engine,英偉達最大的GPU都不及它的“邊角”,。
簡單來說,,Cerebras 打破了傳統(tǒng)的技術限制,,將一整個300mm硅片直接做成了一顆芯片,,因此“大”是人們對它的第一印象,,但不止于大。
據(jù)悉,,這款芯片擁有40萬個核(4核處理器的10萬倍),,其處理能力能夠支持大量計算,同時它利用了硅互連的先進封裝工藝,,實現(xiàn)硅片級別的高速通信和存儲,,這在理論上讓整顆芯片能夠用最快的速度調(diào)用算力處理極為復雜的AI任務。
Cerebras Wafer Scale Engine = 整個服務器集群
目前,,官方透露出來的關鍵指標如下:
· 硅片大小42225平方毫米(邊長大約22cm)
· 1.2萬億個晶體管
· 40萬個AI內(nèi)核
· 18GB的片上內(nèi)存
· 存儲帶寬19PB/S
· 架構互聯(lián)(Fabric型)帶寬100PB/S
· 采用了臺積電16nm工藝
從透露的消息可以看出,,這顆芯片擁有史上最大的片上存儲空間(英偉達最好GPU的3000倍)、最多的AI核(每一個核相當于一個小型計算機)和最高的通信速度(最高性能GPU的10000倍內(nèi)存帶寬),。
Cerebras Systems CEO Andrew Fieldman在一份聲明中說,,“Cerebras WSE專為AI而設計,其中包含了不少基礎創(chuàng)新,,解決了限制芯片尺寸的長達數(shù)十年的技術挑戰(zhàn),,如單晶圓良率、功率輸出,、封裝等,。其中,所有架構設計都是為了優(yōu)化AI工作的性能,??偟膩碚f,WSE只需要較小功耗和空間,,就能提供數(shù)百或數(shù)千倍的現(xiàn)有解決方案的性能,。”
圖 | Hot Chips活動現(xiàn)場介紹WSE
據(jù)悉,,因具備了存儲,、計算和通信三大關鍵元素,且完全基于神經(jīng)網(wǎng)絡設計,,現(xiàn)有AI系統(tǒng)所需要處理的張量處理操作,、數(shù)據(jù)存儲和通信都能夠在WSE上完成,同時WSE將集群通信架構理念做進了這款芯片里,,突破了傳統(tǒng)帶寬的限制,,帶來了低延遲,同時避免了不必要的性能損失,。
將網(wǎng)絡通信做進芯片里,,這不僅帶來AI芯片計算能力的改善,,也讓用戶可以基于它建設更高質(zhì)量的網(wǎng)絡。所以與其說它是一臺超級計算機,,倒不如說,,WSE更像是將一個服務器集群系統(tǒng)“做”進了晶圓里。
值得一提的是,,考慮到單個晶圓在制造過程中會出現(xiàn)一些雜質(zhì),從而導致芯片故障的問題,,Cerebras Systems 的芯片設計是留有裕量的,,能夠保證一個或者少量雜質(zhì)不會使整個芯片失效,這也保證了芯片的穩(wěn)定性,。
散熱會成為大問題嗎,?
很多人初次看到這樣一種配置,不免會為Andrew擔心:這么大一塊芯片,,散熱要怎么做,?
不得不說,目前為止,,各大新聞中都未提及這款芯片的功耗問題,。但不難想象,與我們看見的傳統(tǒng)“指甲蓋”大小的芯片相比,,這款芯片的功耗一定不會低,。
對此,Andrew表示,,這款芯片不會單獨銷售,,而是將被打包到Cerebras設計的計算機“設備”中。原因是它需要一個復雜的水冷系統(tǒng)去散熱,。據(jù)悉,,這個水冷系統(tǒng)是一種灌溉網(wǎng)絡,可以抵消以15千瓦功率運行的芯片產(chǎn)生的極端熱量,。
因為散熱,,這款芯片無法作為加速卡插入現(xiàn)有的任何服務器。在這種設計下,,可以猜測它的功率一定會很高,,但與它所要替代的系統(tǒng)集群比較來看,它的功耗也算是很低了,。
不過相較于散熱,,業(yè)內(nèi)人士更為關心它是不是能夠按照預想跑起來,“目前來看,,這款芯片真正的問題是大量內(nèi)核,,如何讓40萬個核保持協(xié)同和有效,,這需要嚴格考量?!?/p>
商用之路在何方,?
對于大家對WSE商用的懷疑,在斯坦福大學的Hotchips活動上,,Cerebras已經(jīng)透露,,這款芯片并非空有其表,現(xiàn)在已經(jīng)在跑客戶的任務負載了,。
目前,,從計算角度來看,這一輪人工智能浪潮中最關鍵的算法應用是深度學習,,將深度學習算法應用到AI場景中,,需要完成兩大核心運算:訓練和推理。WSE是為AI專門設計的,,因此可以猜測它的目標市場無非訓練和推理,。
但是這樣一款在散熱上、價格上都不會“輕松”的芯片,,市場真的會買單嗎,?或者說哪部分市場可能會買單?
對此,,Micron的研究員Eugenio Culurciello表示,,Cerebras芯片的規(guī)模和雄心是瘋狂的,不過它能解決大算力需求的場景(如自動駕駛)所需,,雖然很昂貴,,但有些人可能會使用它。
事實上,,從市場需求的角度出發(fā),,WSE如果真的實測成功且能夠量產(chǎn),它將極有可能首先撼動英偉達的GPU市場,,即訓練市場,。相比于推理市場,因訓練任務重且訓練時間長,,訓練市場多以算力至上,,對芯片的價格、功耗并不敏感,,所以Cerebras芯片更有可能在訓練市場獲得成功,,這也將再次顛覆訓練市場的格局。
而推理市場呢?從目前的情況來看,,端側(cè)推理市場沒有過高算力需求,,且對低功耗的要求十分嚴苛,WSE大概率不會出現(xiàn)在這部分市場,。不過在云端和邊緣側(cè)的推理市場,,WSE如果不能很好處理功耗和散熱問題,這也都會為商用增加阻力,。
據(jù)Andrew本人自己的估計,,用WSE來部署云計算基礎設施,總體成本將會是現(xiàn)有造價的1/10,。
過于美麗,、過于超出公眾認知是這款芯片的最大特點,因此在Cerebras正式將這款芯片推出之前,,大家對它的疑慮其實難以消除:
“在我們看到Benchmark測試結(jié)果之前,,我們很難說它的AI設計有多好,?!?/p>
如Cerebras在推特上告訴大家:Stay tuned。只能靜候佳音,。
最后,,關于Cerebras Systems
Cerebras Systems成立于 2016 年,專注于為數(shù)據(jù)中心訓練提供芯片產(chǎn)品,,曾被CB Insights評為“全球最值得期待的100家芯片公司”,。
資料顯示,該公司曾于2016年完成2500萬美元A輪融資,,投資方為知名風投Benchmark,,后又獲得多輪融資,截止2017年9月共獲得1.12億美元融資,,估值8.6億美元,。
公司的創(chuàng)始團隊背景實力也十分強勁,聯(lián)合創(chuàng)始人及CEO Andrew Feldman曾經(jīng)創(chuàng)立過芯片公司SeaMicro,,后在2012年,,這家公司被AMD以3.34億美元收購。
圖 | Andrew Feldman
在Andrew創(chuàng)辦Cerebras Systems之時,,有兩大重量級人物加盟,。一位是曾在Sun擔任過高級芯片設計師、低功耗芯片設計的元老級人物Gary Lauterbach,,另一位是前 Intel 公司架構副總裁,、數(shù)據(jù)中心首席技術官Dhiraj Mallick。
因為有強大的團隊坐鎮(zhèn),,Cerebras Systems成立之時就注定不容忽視?,F(xiàn)在,,這家公司已有194名員工。