在過(guò)去的二十年中,,谷歌比其他任何公司都能證明,,數(shù)據(jù)中心是新的計(jì)算機(jī)。這家搜索引擎巨頭曾在2009年通過(guò)Urs H?lzle撰寫的論文證明了這種“”warehouse-scale machine“ ”,,現(xiàn)在這個(gè)論文的作者之一擔(dān)任Google技術(shù)基礎(chǔ)架構(gòu)的高級(jí)副總裁,。該文章的另一作者是Luiz André Barroso,他是Google核心產(chǎn)品的工程副總裁,,在此之前曾是Digital Equipment和Compaq的研究員,。
谷歌的論文及其超大規(guī)模同類產(chǎn)品的興起表明了這種想法的優(yōu)點(diǎn),這引起了很多人的關(guān)注,。有趣的是,,最近,英偉達(dá)(Nvidia)收購(gòu)了Mellanox Technology和Cumulus Networks,,以及對(duì)Arm Holdings的期望收購(gòu)都發(fā)現(xiàn)了“數(shù)據(jù)中心就是計(jì)算機(jī)”漏洞,。
在花費(fèi)了數(shù)十年的時(shí)間設(shè)計(jì)和完善其宏觀系統(tǒng)之后,Google便將重心轉(zhuǎn)移到系統(tǒng)的不同部分,,想在摩爾定律的末日下生存下來(lái),,這就需要完成很多創(chuàng)新工作,。對(duì)我們來(lái)說(shuō),將更多的晶體管塞入一塊芯片中會(huì)變得更昂貴,,而不是更便宜,。
促成這一宣布的重大新聞是,谷歌已聘請(qǐng)芯片設(shè)計(jì)師Uri Frank擔(dān)任Googleplex服務(wù)器客戶端設(shè)計(jì)工程副總裁,,該芯片設(shè)計(jì)師曾在英特爾為客戶計(jì)算機(jī)開發(fā)過(guò)多代片上系統(tǒng)設(shè)備,。Google研究員,,現(xiàn)任公司系統(tǒng)基礎(chǔ)架構(gòu)副總裁Amin Vahdat則領(lǐng)導(dǎo)開發(fā)了遍及全球網(wǎng)絡(luò)的人,,該網(wǎng)絡(luò)支撐著Google以及作為其龐大運(yùn)營(yíng)核心的數(shù)據(jù)中心級(jí)網(wǎng)絡(luò)。日前,,他花了一些時(shí)間向thenextplatform解釋了公司為何聘請(qǐng)F(tuán)rank,,以及為何認(rèn)為片上系統(tǒng)(SoC)將成為用于未來(lái)計(jì)算的、提高效率和規(guī)模的工程重點(diǎn),。
值得一提的是,,Vahdat還是Frank的老板,因此他應(yīng)該是最優(yōu)資格談?wù)撛摬呗缘娜恕?/p>
Google所做的事情有些微妙,,在談?wù)撘呀?jīng)做了什么之前,,他們正在談?wù)撍麄儜?yīng)該做什么,這對(duì)公司來(lái)說(shuō)有點(diǎn)不尋常,,Vahdat也承認(rèn)了很多,。我們指出,通常情況下,,當(dāng)Google談?wù)摗靶隆笔挛飼r(shí),,它可能已經(jīng)在5年前解決了該問題,并且直到現(xiàn)在才向世人介紹這一時(shí)間,。MapReduce就是這種情況,,它產(chǎn)生了Hadoop。然后是BigTable,,產(chǎn)生了Drill,;然后是Spanner,產(chǎn)生了CockroachDB,。谷歌剛剛用它的Borg / Omega容器控制器將“中間人”帶走,,并將其克隆以創(chuàng)建Kubernetes,并將其開源,。
我們認(rèn)為Google不會(huì)在不久的將來(lái)開放源代碼服務(wù)器SoC設(shè)計(jì),,但是如果它可以幫助推動(dòng)其Google Cloud的銷售,那么看到定制或半定制SoC被提供用于本地銷售就不會(huì)感到驚訝,。運(yùn)行Anthos Kubernetes堆棧的數(shù)據(jù)中心或主機(jī)托管設(shè)施,,它與您在內(nèi)部獲得的Google內(nèi)容幾乎一樣,。還是想假設(shè)Borg對(duì)Google特定的工作負(fù)載和基礎(chǔ)架構(gòu)進(jìn)行了高度調(diào)整。
在招攬F(tuán)rank的過(guò)程中,,谷歌一定已經(jīng)為其提供了一個(gè)頗具吸引力的offer,,因?yàn)榫驮趲字芮埃現(xiàn)rank還是英特爾以色列芯片設(shè)計(jì)團(tuán)隊(duì)的眾多高管之一,,而隨著新任首席執(zhí)行官Pat Gelsinger再次回到美國(guó)巨頭擔(dān)任CEO,,他還被提升了。在擔(dān)任核心與客戶開發(fā)部總經(jīng)理之后,,他被提升為公司副總裁,,該部在美國(guó),以色列和印度擁有由2,000多名工程師組成的團(tuán)隊(duì),。
自大學(xué)畢業(yè)以來(lái),,F(xiàn)rank一直在Intel任職。他于2000年獲得以色列MIT的Technion的電氣和電子工程學(xué)士學(xué)位,,隨后又于2004年獲得了由Intel資助完成的碩士學(xué)位,。2011年,F(xiàn)rank被任命為工程技術(shù)總監(jiān),,其團(tuán)隊(duì)超過(guò)200位工程師從事存儲(chǔ)器控制器,,PCI-Express控制器,電源管理電路以及片上環(huán)形和網(wǎng)狀結(jié)構(gòu)(on-chip ring 和mesh fabrics)的研究,。2014年2月,,F(xiàn)rank遷至英特爾在俄勒岡州Beaverton的辦公室擔(dān)任工程總監(jiān),并管理了負(fù)責(zé)Apollo Lake PC芯片的300名工程師,,并于2016年被任命為負(fù)責(zé)核心SoC設(shè)計(jì)的工程高級(jí)總監(jiān),。在2018年,F(xiàn)rank被任命為平臺(tái)工程部副總裁,,并擔(dān)任PC,,AI和IoT芯片產(chǎn)品開發(fā)總監(jiān),
在英特爾,,服務(wù)器SoC設(shè)計(jì)始終從客戶端SoC開始,,因此Frank可以利用其領(lǐng)導(dǎo)定制服務(wù)器芯片開發(fā)也就不足為奇了。核心就是核心,,這是英特爾一直以來(lái)的思考方式,,而這恰恰是Vahdat所說(shuō)的Google試圖通過(guò)“加倍”定制芯片來(lái)解決的問題。服務(wù)器有時(shí)會(huì)執(zhí)行與客戶端不同的操作,,即使客戶端和服務(wù)器都執(zhí)行這些操作,,它們的比率和處理它們所需的帶寬也不同。我們認(rèn)為,也許Google在想的是我們需要一個(gè)真正的服務(wù)器核心,,并且需要針對(duì)Google本身正在運(yùn)行的各種工作負(fù)載進(jìn)行調(diào)整的服務(wù)器核心,。
但是重要的是不要在這里迷失方向。
谷歌并未宣布將創(chuàng)建自己的指令集和定制芯片,,就像2015年使用Tensor處理單元(TPU)在其TensorFlow框架上運(yùn)行機(jī)器學(xué)習(xí)訓(xùn)練和推理算法一樣,,或者在2019年創(chuàng)建了自己的視頻處理單元(VPU),用于處理媒體服務(wù)器上的視頻轉(zhuǎn)碼一樣,。正如H?lzle多次提醒我們的那樣,,谷歌只在絕對(duì)必要時(shí)才制造定制芯片,而且它多次獲得半定制CPU并在其中進(jìn)行了一些針對(duì)特定工作負(fù)載的調(diào)整,,或者與合作伙伴一起創(chuàng)建了半定制磁盤,。驅(qū)動(dòng)器,閃存驅(qū)動(dòng)器,,網(wǎng)絡(luò)接口卡或網(wǎng)絡(luò)交換機(jī),。
“我想強(qiáng)調(diào)的一件事,這將繼續(xù)成為現(xiàn)實(shí),,我們并不想全力以赴,” Vahdat告訴The Next Platform,,“我們正在尋求與合作伙伴和生態(tài)系統(tǒng)盡可能多地合作,,坦率地說(shuō),這種情況越來(lái)越多,。十年前,,我們?cè)趦?nèi)部進(jìn)行了更多工作,并試圖將其保留在內(nèi)部,,但我們?nèi)栽诶^續(xù)與伙伴合作的趨勢(shì),。我們制造了閃存驅(qū)動(dòng)器,但從未制造過(guò)自己的NAND gates,。但是在某些情況下,,就像我們最初使用Flash一樣,我們實(shí)際上必須證明某些東西有價(jià)值,,然后其他人才能追隨,。”
Google擁有垂直集成的優(yōu)勢(shì),,它擁有從Linux內(nèi)核一直到應(yīng)用程序和數(shù)據(jù)服務(wù)再到Web瀏覽器的整個(gè)軟件堆棧,,這為自定義芯片或更高級(jí)別的自定義硬件提供了一些優(yōu)勢(shì),Vahdat承認(rèn)這一點(diǎn),。Flash是一個(gè)很好的例子,。
如果您要制造一個(gè)視頻芯片或閃存設(shè)備以供全世界使用,則它傾向于使用最低的公分母(這會(huì)限制特定的實(shí)用程序),或者傾向于使用非常廣泛的功能集,,這會(huì)使晶體管不必要地消耗功率,,從而不必要地消耗功率。
Vahdat舉例說(shuō),,在倉(cāng)庫(kù)規(guī)模的計(jì)算機(jī)上編寫數(shù)據(jù)放置或在閃存上進(jìn)行垃圾收集的方式與使用一臺(tái)筆記本電腦的方式大不相同,。TPU和VPU是非常精確的設(shè)備,分別針對(duì)TensorFlow和YouTube或環(huán)聊進(jìn)行了調(diào)整,,瓦達(dá)達(dá)說(shuō),。但是也許您只有在必要時(shí)才走那么遠(yuǎn)。
Google的工作負(fù)載規(guī)模越來(lái)越大,,工作負(fù)載也越來(lái)越多,,此外,公共云業(yè)務(wù)必須支持各種應(yīng)用程序和系統(tǒng)軟件,。在這些情況下,,最好(也是最經(jīng)濟(jì))的方法可能是找到同類最佳的組件,并將它們集成到專門針對(duì)工作負(fù)載進(jìn)行了調(diào)整的SoC中,。這就是谷歌的SoC作為新的主板創(chuàng)意出現(xiàn)的地方,。
“系統(tǒng)中的所有組件都集成在主板上,通常集成在PCI-Express總線上,,” Vahdat說(shuō),。集成和定制點(diǎn)就是主板。我們現(xiàn)在處于一個(gè)平衡應(yīng)用程序需求和效率的位置,,很難知道要在主板上放置多少特定設(shè)備,。而且實(shí)際上很難協(xié)調(diào)應(yīng)用程序代碼,以能夠管理所有用完P(guān)CI-Express總線的設(shè)備之間的數(shù)據(jù)移動(dòng)和存儲(chǔ),。
在不談?wù)摷?xì)節(jié)的情況下,,我們所談?wù)摰氖窃诨炯?jí)別上對(duì)組件進(jìn)行創(chuàng)新,并在重要的時(shí)刻和地方將它們組合在一起,,針對(duì)各個(gè)應(yīng)用程序進(jìn)行自定義(就像我們?cè)诖鎯?chǔ),,機(jī)器學(xué)習(xí)和視頻方面所做的一樣),它們都放在新主板上,。
這并不一定意味著將來(lái)自不同供應(yīng)商的芯片集成到一個(gè)封裝中,,但這可能是Frank和他的團(tuán)隊(duì)將探索的一部分。這并不意味著使用CXL這樣的協(xié)議將主板擴(kuò)展到單個(gè)機(jī)箱之外,,盡管Google顯然會(huì)使用CXL以及可能適合將計(jì)算和存儲(chǔ)元素鏈接在一起的其他協(xié)議(例如CCIX或Gen-Z,。
他的意思是,如果Google仍要繼續(xù)向其系統(tǒng)中滲透類似于摩爾定律的改進(jìn),,則需要專門化,。(正如H?lzle 在很多年前向我們指出的那樣,谷歌將竭盡所能擊敗摩爾定律,因?yàn)檫@是超大規(guī)模生產(chǎn)者必須要做的事情,,也只有這樣才能繼續(xù)保持運(yùn)營(yíng),。)
Vahdat解釋說(shuō):“在過(guò)去,當(dāng)事情以指數(shù)級(jí)速度快速增長(zhǎng)時(shí),,專門針對(duì)單個(gè)工作負(fù)載是沒有意義的,。那時(shí),在Google,,我們的工作量也減少了,。因此,專門針對(duì)其中的幾個(gè)就足夠了,。在云世界中,,考慮到我們托管的服務(wù)數(shù)量,我們不再需要一個(gè)特定的應(yīng)用程序主導(dǎo),。因此,,這種能夠集成最好IP的模型,盡可能多地購(gòu)買它并在有意義的任何地方與其他人合作,,使我們能夠快速地專門針對(duì)單個(gè)應(yīng)用程序,。”
從某種意義上說(shuō),,谷歌真正想做的就是教導(dǎo)芯片制造商以一種他們實(shí)際上沒有,,而且從沒有過(guò)的方式進(jìn)行合作。試想一下,,如果您可以采用英特爾,AMD,,IBM和Nvidia的分立技術(shù),,并制造出正確類型的特定計(jì)算設(shè)備。這就是Google夢(mèng)寐以求的事情,,如果Google在各地購(gòu)買一些IP并將其集成以證明其有效,,那么可能會(huì)發(fā)生。也許它將首先在小芯片級(jí)別上發(fā)生,。
Vahdat強(qiáng)調(diào)說(shuō):“我們只想做盡可能少的事,,專注于我們必須要做的事。這是Google數(shù)十年來(lái)始終如一的宗旨,。Google只會(huì)建立它所必須的,。”我認(rèn)為這取決于我們最終要整合的是什么以及特定的用例,。但是同樣,,我們希望盡可能少地做這種理想的領(lǐng)先行業(yè),以便隨著時(shí)間的流逝減少這種情況。從長(zhǎng)遠(yuǎn)來(lái)看,,這不是我們想要的業(yè)務(wù),。“