AI市場中現(xiàn)在仍是GPU占主導(dǎo),那么哪類公司能撼動GPU的地位呢,?在當(dāng)今的AI市場的格局中,,主要有四類:有產(chǎn)品,,有生態(tài),大批量被部署的,,是第一類,;有產(chǎn)品,有部分生態(tài),,有部分部署的,,是第二類,;有產(chǎn)品,沒有生態(tài),,沒有客戶的,,是第三類;沒有產(chǎn)品,,沒有生態(tài),,沒有客戶,有PPT的,,是第四類?,F(xiàn)在大量公司處于“PPT造芯”的階段。
一個事實(shí)是,,僅靠模仿顯然是無法打敗GPU的,,一些做與某個領(lǐng)先廠商類似產(chǎn)品的公司,不可能僅僅因?yàn)樾詢r比更好,,而獲得市場突破,,最后取得很好地位,這在全球硬科技史上基本很少看到,。一個鮮明的例子——計(jì)算平臺,,最開始是大型機(jī),然后小型機(jī),,沒有說大型機(jī)取代大型機(jī)的,,也沒有小型機(jī)取代小型機(jī),小型機(jī)最后被PC服務(wù)器給取代,,而如今PC服務(wù)器也面臨著Arm的挑戰(zhàn),。可以看到真正巨頭的涌現(xiàn)是因?yàn)樵诋a(chǎn)業(yè)大的變局,、在新浪潮革新當(dāng)中取得了自己的位置,。
“在計(jì)算機(jī)歷史上只發(fā)生過三次革命,第一次是70年代的CPU,,第二次是90年代的GPU,,而Graphcore就是第三次革命?!边@句話是英國半導(dǎo)體之父,、Arm聯(lián)合創(chuàng)始人Hermann Hauser所說。他所指的正是Graphcore率先提出的就是為AI計(jì)算而生的IPU,。
IPU為AI計(jì)算而生
隨著應(yīng)用端需求迅猛飛起,,AI模型的尺寸和復(fù)雜性正在呈指數(shù)級別增長,但是機(jī)器智能創(chuàng)新者往往不得不采用傳統(tǒng)的處理器架構(gòu)CPU和GPU,未來需要一款全新的處理器來消除創(chuàng)新的桎梏,。這就是IPU,。
Graphcore通過IPU技術(shù)正在全球和中國范圍內(nèi)掀起第三次計(jì)算機(jī)革命的浪潮,云和數(shù)據(jù)中心正在被IPU重塑,。而一開始,,Graphcore就從通用性處理器著手,如今看來,,這步棋走得很對,。AI覆蓋的領(lǐng)域非常多,包括視覺,、語言,、語音、強(qiáng)化學(xué)習(xí)等方方面面,,今天,,AI產(chǎn)業(yè)的全球頂會還是一票難求,全球頂級學(xué)術(shù)會議那么多人投稿,,這就意味著AI產(chǎn)業(yè)的多可能性,,有新的可能性才能講應(yīng)用的多樣性。正如此,,通用性是非常重要的,。這個時候如果做一個非常固化的處理器,很可能適應(yīng)不了新的算法,。
Graphcore目前處于“云,、邊、端”的云端,,大規(guī)模計(jì)算的場景里,,牽扯到算法的研發(fā),,就是所謂的訓(xùn)練,。所以IPU現(xiàn)在所處的應(yīng)用領(lǐng)域?qū)νㄓ眯砸蟾摺?/p>
就拿Graphcore第二代IPU GC200來說,它的芯片特點(diǎn)就是高性能和高通用性,。它擁有594億個晶體管,,并采用最新的臺積電7納米工藝制造,是世界上最精密的處理器,。每個第二代IPU具有1472個強(qiáng)大的處理器內(nèi)核,,可運(yùn)行近9000個獨(dú)立的并行程序線程。每個IPU在FP16.16和FP16.SR(隨機(jī)取整)上都擁有史無前例的900MB In-Processor-MemoryTM和250 teraFLOPS AI計(jì)算,。GC200支持的FP32計(jì)算比其他任何單芯片處理器都要多,。
那么,Graphcore產(chǎn)品的迭代邏輯和規(guī)律是什么?這點(diǎn)Graphcore高級副總裁兼中國區(qū)總經(jīng)理盧濤作了解釋,,他告訴半導(dǎo)體行業(yè)觀察記者,,Graphcore的第一代產(chǎn)品是PCIe形態(tài)的,這個產(chǎn)品被服務(wù)器廠商集成到服務(wù)器里面去,,變成一個IPU的服務(wù)器,。但在這一過程中Graphcore發(fā)現(xiàn)了一些技術(shù)和商業(yè)上的問題,所以Graphcore在第二代產(chǎn)品的時候,,以一個1U的形態(tài)來交付,。
Graphcore高級副總裁兼中國區(qū)總經(jīng)理 盧濤
其邏輯就是,首先,,從技術(shù)上來看,,在AI計(jì)算中,其實(shí)不僅僅要考慮一顆芯片計(jì)算能力怎么樣,,也不僅僅要考慮一臺機(jī)器計(jì)算能力怎么樣,。整個AI的發(fā)展趨勢是算法模型的參數(shù)規(guī)模會從數(shù)千萬擴(kuò)展到億,甚至到萬億,,這就需要多顆AI處理器來處理,,如果這些處理器集群之間網(wǎng)絡(luò)構(gòu)建不好,那么效果將很差,,所以Graphcore認(rèn)為通信技術(shù)是至關(guān)重要的,。Graphcore的第二代產(chǎn)品有三個重大的技術(shù)突破:計(jì)算、數(shù)據(jù),、通信,。
從商業(yè)的角度,Graphcore主要是要考慮time-to-market(市場進(jìn)入時間窗口),。做一顆芯片,,要看做什么形態(tài)的機(jī)器是最快的,stack in就可以做設(shè)計(jì)了,。Graphcore認(rèn)為這是一個把產(chǎn)品呈現(xiàn)給用戶的最快方式,。
有了產(chǎn)品,如何以IPU的身份去撬動市場和用戶呢,?
IPU如何撬動GPU的奶酪,?
在AI市場,Graphcore是以挑戰(zhàn)者身份出現(xiàn)的,,據(jù)了解,,Graphcore的AI芯片的出貨量已達(dá)到以萬為數(shù)量級?!凹纫鎏幚砥?,又要打磨產(chǎn)品,構(gòu)建生態(tài),還要尋找落地的場景,,眾所周知,,AI落地場景的碎片化和難度,所以這對于一個還不滿五年的企業(yè)來說非常不容易,,也是一個非常好的成績,。”盧濤表示,。
事實(shí)證明,,產(chǎn)品有價值,用戶看到好處,,就沒有理由不跟你合作,。在盧濤看來,用戶無外乎兩種邏輯:第一種常規(guī)邏輯是我有什么好處,,第二有什么問題是我解決不了,。而這兩類Graphcore都有一些相關(guān)進(jìn)展。
譬如說第一種場景,,用戶已經(jīng)在使用GPU服務(wù)于其業(yè)務(wù),,而且業(yè)務(wù)不管是從性能、能力上都被GPU驗(yàn)證過且已經(jīng)大量部署,,這時候用戶該開始關(guān)注怎樣能夠優(yōu)化整體的TCO,,即同樣的事情是不是能夠花同樣的錢做得更快或功耗更低,或者花更少的錢達(dá)成,。這是比較商業(yè)化的一些邏輯,。像目前非常主流的ResNet、BERT這些模型都是從GPU發(fā)明產(chǎn)生的,,應(yīng)用跑得也非常好,。但在這些應(yīng)用里面IPU比GPU表現(xiàn)得更好一點(diǎn),用戶是有一定收益的,。
第二類,,一些用戶存在沒有被滿足的需求。簡單的說就是,,如果用戶想要實(shí)現(xiàn)的某個特性無論是在CPU還是GPU都達(dá)不到上線的指標(biāo),,那么這個功能可能就實(shí)現(xiàn)不了。以時延為例,,如果一個GPU達(dá)不到所需的吞吐量,就要堆疊多個GPU,,但是這樣可能造成中間時延指標(biāo)達(dá)不到,。如果用戶上線的時延指標(biāo)是10毫秒左右,用GPU來實(shí)現(xiàn)時延是20多毫秒,且怎么優(yōu)化都達(dá)不到上線標(biāo)準(zhǔn),,如果此時在IPU上只有5毫秒的時延,,那么此時用戶的考量就是,不在乎IPU多少錢,,即使比GPU更貴,,用戶也愿意買單。
以上這兩種邏輯正體現(xiàn)了IPU的優(yōu)勢和亮點(diǎn),。IPU是很通用的處理器,,各種各樣的業(yè)務(wù)都能做。一個新事物的出現(xiàn),,新就新在其能做別人所不能做,。IPU跟GPU非常不一樣,Graphcore很有信心在GPU做不好的地方比他們做得更好,,不是說性能提升一兩倍,,是能做GPU做不了的事情。而在GPU今天很擅長做的地方,,Graphcore也在慢慢證明做得不比GPU差,,比如視覺、自然語言處理,,甚至比GPU好,。
但最后要想保持足夠的市場競爭力,還有很重要的一點(diǎn),,就是要保持足夠好的產(chǎn)品的迭代周期和執(zhí)行力,。因?yàn)檎麄€芯片行業(yè)生意模式是一場馬拉松,要不斷的迭代優(yōu)化,,最后才能樹立市場地位,。所以Graphcore在五年不到的歷史進(jìn)程中,量產(chǎn)了兩代產(chǎn)品,,某種意義上證明公司在產(chǎn)品迭代上的能力,,而且新產(chǎn)品還在努力研發(fā)中,去年臺積電在一次技術(shù)峰會上公開表示,,他們在3納米上在重點(diǎn)跟Graphcore合作,。
中國市場在Graphcore的版圖中意義重大
在生態(tài)問題上,GPU花了十幾年才構(gòu)建了如今的生態(tài),,那么IPU是不是也得花20年,?在盧濤看來,這似乎用不了,。今天的時代有所不一樣,,回顧第一個在GPU表現(xiàn)好的視覺模型MXNet,,當(dāng)時是CUDA在背后的支持。而Graphcore的IPU正在跟TensorFlow,、PyTorch,,以及百度PaddlePaddle合作,構(gòu)建這樣的框架,,這會大大加速Graphcore開拓生態(tài)的過程,。
而就在4月21日,Graphcore與神州數(shù)碼建立合作伙伴關(guān)系,,神州數(shù)碼成為Graphcore中國區(qū)總代理,。在IT產(chǎn)品分銷領(lǐng)域,神州數(shù)碼占據(jù)著首屈一指的地位,。通過此次合作,,Graphcore可以更快地滿足全國各地區(qū)的來自不同垂直市場的客戶購買需求,使客戶能夠快速獲取IPU系統(tǒng)產(chǎn)品和相關(guān)服務(wù),。
盧濤指出,,Graphcore進(jìn)入中國將近兩年的時間,組建了自己團(tuán)隊(duì),,打磨頭部應(yīng)用的落地,,Graphcore看到了市場對于IPU應(yīng)用的需求已經(jīng)到即將爆發(fā)的階段了,這個是很大的驅(qū)動力,,Graphcore要找一個非常強(qiáng)的合作伙伴,,一起來迎接這個井噴和爆發(fā)。
中國市場毫無疑問是全球領(lǐng)先的AI應(yīng)用落地的區(qū)域,,中國有大量的數(shù)據(jù),,各種各樣大型的互聯(lián)網(wǎng)公司、大型的AI公司,、大量的落地場景,。另外中國非常擅長把各種各樣創(chuàng)新的技術(shù)做成一個真正落地的大批量應(yīng)用,而且其速度也非???。中國市場對于Graphcore公司來說也有如下幾個角度的意義:
第一,中國是全球領(lǐng)先的AI應(yīng)用市場,,當(dāng)然對計(jì)算的要求會很高,,市場潛力也大。
第二,,中國更加強(qiáng)調(diào)產(chǎn)品的落地,、大批量的部署以及快速迭代、快速執(zhí)行的能力,,這對Graphcore也非常有意義,。在各種各樣場景做快速落地,,對于其本身技術(shù)棧的打磨以及團(tuán)隊(duì)執(zhí)行力的打磨都是非常有意義的,。
基于以上,,Graphcore對在中國市場的整體表現(xiàn)有非常高的期望的,這可以從Graphcore全球的生意區(qū)域劃分角度看出來,,Graphcore在全球分為三個區(qū)域市場,,一個中國、一個北美,、一個其他,。這代表了中國市場在Graphcore全公司版圖里的重大意義。
盧濤認(rèn)為整個AI產(chǎn)業(yè)已經(jīng)基本上結(jié)束了初期,,大量商業(yè)場景,、應(yīng)用邏輯已經(jīng)被證明了確實(shí)非常有價值,AI技術(shù)即將進(jìn)入產(chǎn)業(yè)大規(guī)模的蓬勃發(fā)展,,并落在各種各樣行業(yè)應(yīng)用里,。
“AI是今天的一個重磅技術(shù),這個合作是非常深遠(yuǎn)的,,未來可能是爆發(fā)式的,、戰(zhàn)略型的合作?!鄙裰輸?shù)碼企業(yè)業(yè)務(wù)集團(tuán)相關(guān)業(yè)務(wù)負(fù)責(zé)人湛羽說到,。
神州數(shù)碼企業(yè)業(yè)務(wù)集團(tuán)相關(guān)業(yè)務(wù)負(fù)責(zé)人 湛羽
結(jié)語
以上種種,并不意味著Graphcore要把GPU推翻完全取代,,Graphcore對市場未來的預(yù)期是有三個主要計(jì)算平臺并存,,CPU、GPU,、IPU,。“今天AI業(yè)務(wù)是架構(gòu)在GPU和CPU之上,,落地的場景是重疊的,,但我們IPU架構(gòu)非常不一樣,期望我們?nèi)〉藐嚨刂?,未來有一批AI業(yè)務(wù)是原生在IPU上成長起來的,,這些業(yè)務(wù)可能不適合GPU、CPU,,我們就成為了第三種計(jì)算平臺,。”盧濤講到,,“我們創(chuàng)造IPU是希望幫助AI的創(chuàng)新者獲得下一個突破,?!?/p>
行業(yè)觀察》為您分享的第2675內(nèi)容,歡迎關(guān)注,。