人們越來越看好人工智能的前景及其潛在的爆發(fā)力,,而能否發(fā)展出具有超高運算能力且符合市場的芯片成為人工智能平臺的關(guān)鍵一役。由此,,2016年成為芯片企業(yè)和互聯(lián)網(wǎng)巨頭們在芯片領(lǐng)域全面展開部署的一年,。而在這其中,英偉達(dá)保持著絕對的領(lǐng)先地位,。但隨著包括谷歌,、臉書、微軟,、亞馬遜以及百度在內(nèi)的巨頭相繼加入決戰(zhàn),,人工智能領(lǐng)域未來的格局如何,仍然待解,。
在2016年,,所有人都看到了人工智能的前景和其潛在的爆發(fā)力,但不管是AlphaGo還是自動駕駛汽車,,要想使得任何精妙算法得以實現(xiàn),,其基礎(chǔ)是硬件的運算能力:也就是說,,能否發(fā)展出超高運算能力又符合市場需求的芯片成為了人工智能平臺的關(guān)鍵一役。
因此,,毫無疑問,,2016年也成為了芯片企業(yè)和互聯(lián)網(wǎng)巨頭們在芯片領(lǐng)域全面展開部署的一年:先有CPU芯片巨頭因特爾年內(nèi)三次大手筆收購人工智能和GPU領(lǐng)域企業(yè);后有谷歌宣布開發(fā)自己的處理系統(tǒng),,而蘋果,、微軟、臉書和亞馬遜也都紛紛加入,。
而在這其中,,領(lǐng)跑者英偉達(dá)(Nvidia)因其在人工智能領(lǐng)域的優(yōu)勢使其成為了資本市場的絕對寵兒:在過去的一年中,曾經(jīng)以游戲芯片見長的Nvidia股價從十幾年的穩(wěn)居30美元迅速飆升至120美元,。
就當(dāng)資本市場都在猶豫是否人工智能風(fēng)口使得英偉達(dá)股價虛高時,,2月10日,英偉達(dá)發(fā)布2016年第四季度的財報顯示,,其營收同比增長55%,,凈利潤達(dá)到了6.55億美元,同比增長216%,。
“正當(dāng)Intel,、微軟等巨頭投資人工智能為基礎(chǔ)的芯片技術(shù)時,英偉達(dá)已經(jīng)以Q4財報顯示,,這家已經(jīng)在人工智能領(lǐng)域投資將近12年的芯片企業(yè)已經(jīng)開始就此收獲可觀的盈利,。”資深技術(shù)評論家Therese Poletti在其財報發(fā)布后指出,。
研究機構(gòu)Tractica LLC估計,,由于深度學(xué)習(xí)項目產(chǎn)生的硬件花費將從2015年的4360萬美元,上升到2024年的41億美元,,而企業(yè)的相關(guān)軟件花費將同期從1.09億美元上升到100億美元,。
正是這一龐大的市場吸引著谷歌、臉書,、微軟,、亞馬遜以及百度在內(nèi)的巨頭相繼宣布企業(yè)向人工智能領(lǐng)域的技術(shù)轉(zhuǎn)向?!霸谌斯ぶ悄芟嚓P(guān)技術(shù)上,,目前英偉達(dá)仍然保持著絕對的領(lǐng)先,但隨著包括谷歌在內(nèi)的TPU等技術(shù)不斷推向市場,,未來的AI硬件格局仍然待解,。”一位不便具名的歐洲資深從業(yè)人員表示,。
英偉達(dá)在GPU領(lǐng)域顯著領(lǐng)先
根據(jù)英偉達(dá)最新公布的年報,,其最主要的業(yè)務(wù)領(lǐng)域均出現(xiàn)了兩位數(shù)以上的增長,。除了其一直占有領(lǐng)先優(yōu)勢的游戲業(yè)務(wù)增長之外,其更多的漲幅事實上來自于數(shù)據(jù)中心業(yè)務(wù)和自動駕駛兩大全新業(yè)務(wù)板塊,。
年報數(shù)據(jù)顯示,數(shù)據(jù)中心業(yè)務(wù)有138%的增長,,而自動駕駛有52%的增長,。
“事實上,這是整個英偉達(dá)財報里最具有說明力的內(nèi)容,,因為數(shù)據(jù)業(yè)務(wù)和自動駕駛的增長根本上是人工智能和深度學(xué)習(xí)的發(fā)展所激發(fā)的,。”一位美國計算機硬件分析師表示,。
在目前的深度學(xué)習(xí)領(lǐng)域,,把神經(jīng)網(wǎng)絡(luò)投入實際應(yīng)用要經(jīng)歷兩個階段:首先是訓(xùn)練,其次是執(zhí)行,。從目前的環(huán)境來看,,訓(xùn)練階段非常需要處理大量數(shù)據(jù)的GPU(圖形處理器,下同),,也就是以游戲和高度圖形化的應(yīng)用做圖像渲染起家的英偉達(dá)領(lǐng)先的領(lǐng)域,;而在轉(zhuǎn)型階段則需要處理復(fù)雜程序的CPU,也就是微軟十幾年來領(lǐng)先的領(lǐng)域,。
“英偉達(dá)目前的成功事實上代表了GPU的成功,,它正是最早的GPU領(lǐng)先者之一?!鄙鲜鲂袠I(yè)分析師表示,。
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)尤其是幾百上千層的神經(jīng)網(wǎng)絡(luò),對高性能計算需求非常高,,而GPU對處理復(fù)雜運算擁有天然的優(yōu)勢:它有出色的并行矩陣計算能力,,對于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和分類都可以提供顯著的加速效果。
舉個例子,,研究員不用一開始就人工定義一個人臉,,而是可以將幾百萬個人臉的圖像展示出來,讓計算機自己定義人臉應(yīng)該是什么樣子的,。學(xué)習(xí)這樣的例子時,,GPU可以比傳統(tǒng)處理器更加快速,大大加快了訓(xùn)練過程,。
因此,,搭載GPU的超級計算機已經(jīng)成為訓(xùn)練各種深度神經(jīng)網(wǎng)絡(luò)的不二選擇,比如Google大腦早期就是使用Nvidia的GPU做深度學(xué)習(xí),?!拔覀冋诖罱ㄒ豢顜в懈櫣δ艿臄z像裝置,,因此需要找到最適合的芯片,GPU是我們的首選,?!睔W盟AR初創(chuàng)企業(yè)Quine CEO Gunleik Groven在今年一月的CES(國際消費電子展)現(xiàn)場向本報記者表示。
目前,,谷歌,、Facebook、微軟,、Twitter和百度等互聯(lián)網(wǎng)巨頭,,都在使用這種叫做GPU的芯片,讓服務(wù)器學(xué)習(xí)海量的照片,、視頻,、聲音文檔,以及社交媒體上的信息,,來改善搜索和自動化照片標(biāo)記等各種各樣的軟件功能,。一些汽車制造商也在利用這項技術(shù),開發(fā)可以感知周圍環(huán)境,、避開危險區(qū)域的無人駕駛汽車,。
除了在GPU和圖形計算領(lǐng)域長期領(lǐng)先,英偉達(dá)也是最早一批在人工智能領(lǐng)域進(jìn)行投資的科技公司,。2008年,,當(dāng)時在斯坦福做研究的吳恩達(dá)發(fā)表了一篇用GPU上的CUDA進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練的論文。2012年“深度學(xué)習(xí)三巨頭”之一Geoff Hilton的學(xué)生Alex Krizhevsky用英偉達(dá)的GeForce顯卡在ImageNet中將圖像識別準(zhǔn)確率大幅提升,,這也是英偉達(dá)CEO黃仁勛時常提到的英偉達(dá)注重深度學(xué)習(xí)的開端,。
有報告顯示,世界上目前約有3000多家AI初創(chuàng)公司,,大部分都采用了Nvidia提供的硬件平臺,。
“深度學(xué)習(xí)被證明是非常有效的?!秉S仁勛在季報2月10日的發(fā)布會中表示,。在列舉目前GPU計算平臺正在人工智能、云計算,、游戲和自動駕駛領(lǐng)域快速展開應(yīng)用的同時,,黃仁勛表示,在未來數(shù)年間,,深度學(xué)習(xí)將會成為計算機計算的一種基礎(chǔ)性的核心工具,。
AMD和Intel巨頭的AI演變
投資者和芯片制造商關(guān)注著所有互聯(lián)網(wǎng)巨頭的一舉一動。僅僅以英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)為例,,在很長一段時間以來,,該公司一直為谷歌提供數(shù)據(jù)服務(wù),。
英偉達(dá)并非GPU的唯一領(lǐng)先者,巨頭Intel和AMD都在這一領(lǐng)域有著不同的優(yōu)勢,。
2016年11月,,Intel公司發(fā)布了一個叫做Nervana的AI處理器,他們宣稱會在明年年中測試這個原型,。如果一切進(jìn)展順利,,Nervana芯片的最終形態(tài)會在2017年底面世。這個芯片名稱基于Intel早前購買的一個叫做Nervana的公司,。按照Intel的人所說,這家公司是世界上第一家專門為AI打造芯片的公司,。
Intel公司披露了一些關(guān)于這個芯片的一些細(xì)節(jié),,按照他們所說,這個項目代碼為“Lake Crest”,,將會用到Nervana Engine 和Neon DNN相關(guān)軟件,。這款芯片可以加速各類神經(jīng)網(wǎng)絡(luò),例如谷歌TensorFlow框架,。
芯片由所謂的“處理集群”陣列構(gòu)成,,處理被稱作“活動點”的簡化數(shù)學(xué)運算。相對于浮點運算,,這種方法所需的數(shù)據(jù)量更少,,因此帶來了10倍的性能提升。
Lake Crest利用私有的數(shù)據(jù)連接創(chuàng)造了規(guī)模更大,、速度更快的集群,,其拓?fù)浣Y(jié)構(gòu)為圓環(huán)形或其他形式。這幫助用戶創(chuàng)造更大,、更多元化的神經(jīng)網(wǎng)絡(luò)模型,。這一數(shù)據(jù)連接中包含12個100Gbps的雙向連接,其物理層基于28G的串并轉(zhuǎn)換,。
TPU與FPGA可能的逆襲
在上述芯片巨頭進(jìn)行GPU領(lǐng)域的提升之外,,有更多的企業(yè)在試圖引發(fā)一輪全面的顛覆。其代表為谷歌在2016年宣布將獨立開發(fā)一種名為TPU的全新的處理系統(tǒng),。
TPU是專門為機器學(xué)習(xí)應(yīng)用而設(shè)計的專用芯片,。通過降低芯片的計算精度,減少實現(xiàn)每個計算操作所需的晶體管數(shù)量,,從而能讓芯片的每秒運行的操作個數(shù)更高,,這樣經(jīng)過精細(xì)調(diào)優(yōu)的機器學(xué)習(xí)模型就能在芯片上運行得更快,進(jìn)而更快地讓用戶得到更智能的結(jié)果,。Google將TPU加速器芯片嵌入電路板中,,利用已有的硬盤PCI-E接口接入數(shù)據(jù)中心服務(wù)器中,。
據(jù)Google 資深副總裁Urs Holzle 透露,當(dāng)前Google TPU,、GPU 并用,,這種情況仍會維持一段時間,但他表示,,GPU 可執(zhí)行繪圖運算工作,,用途多元;TPU 屬于ASIC,,也就是專為特定用途設(shè)計的特殊規(guī)格邏輯IC,,由于只執(zhí)行單一工作,速度更快,,但缺點是成本較高,。
除了上述提到的谷歌,微軟也在使用一種叫做現(xiàn)場可變編程門陣列(FPGA)的新型處理器,。
據(jù)介紹,,這個FPGA 目前已支持微軟Bing,未來它們將會驅(qū)動基于深度神經(jīng)網(wǎng)絡(luò)——以人類大腦結(jié)構(gòu)為基礎(chǔ)建模的人工智能——的新搜索算法,,在執(zhí)行這個人工智能的幾個命令時,,速度比普通芯片快上幾個數(shù)量級。有了它,,你的計算機屏幕只會空屏23毫秒而不是4秒,。
在第三代原型中,芯片位于每個服務(wù)器的邊緣,,直接插入到網(wǎng)絡(luò),,但仍舊創(chuàng)造任何機器都可接入的FPGA池。這開始看起來是Office 365可用的東西了,。最終,,Project Catapult準(zhǔn)備好上線了。另外,,Catapult硬件的成本只占了服務(wù)器中所有其它的配件總成本的30%,,需要的運轉(zhuǎn)能量也只有不到10%,但其處理速度卻是原來的2倍,。
此外,,有一些公司,例如Nervada和Movidius,,模擬GPU的平行模式,,但是專注于更快速地移動數(shù)據(jù),省略圖像所需要的功能。其他公司,,包括使用了被稱為“True North”的芯片的IBM公司,,開發(fā)了由神經(jīng)元、突觸等其他大腦特征所啟發(fā)的芯片設(shè)計,。
由于深度學(xué)習(xí)和人工智能未來的巨大前景,,各大巨頭都在盡量爭取技術(shù)上的優(yōu)勢。如果這其中的某家公司,,如谷歌,,用一種新型芯片替換掉現(xiàn)有芯片,這基本上就相當(dāng)于顛覆了整個芯片行業(yè),。
“不管是英偉達(dá),、Intel還是谷歌或是百度,都在尋找一種未來人工智能能夠廣泛應(yīng)用的基礎(chǔ),?!盩herese Poletti表示。
而也有很多人持有與谷歌副總裁Urs Holzle 同樣的觀點,,認(rèn)為在人工智能的遙遠(yuǎn)未來,GPU沒有代替CPU,,而TPU也不會取代GPU,,芯片市場將出現(xiàn)更大的需求和繁榮。