在有著103年歷史的舊金山藝術(shù)宮中, 英特爾的新晉科技大會——人工智能開發(fā)者大會(簡稱“AIDC”)如期而至。這一次,英特爾聚焦于拓寬人工智能生態(tài)。
在羅馬式建筑和科技感的AI場景間之間,英特爾的AI掌舵者Naveen Rao侃侃而談英特爾的人工智能軟硬件組合,而最重磅的信息莫過于Nervana神經(jīng)網(wǎng)絡(luò)芯片的發(fā)布預(yù)告,,按照規(guī)劃,英特爾最新的AI芯片Nervana NNP L-1000,,將在2019年正式推向市場,,這也是英特爾第一個商用神經(jīng)網(wǎng)絡(luò)處理器產(chǎn)品。
兩年前,,Naveen Rao還是深度學(xué)習(xí)初創(chuàng)公司Nervana Systems的首席執(zhí)行官兼聯(lián)合創(chuàng)始人,。在公司被英特爾收購后,Nervana成為了英特爾人工智能的核心戰(zhàn)艦,,Nervana NNP系列也應(yīng)運而生,,Naveen Rao則被任命為人工智能產(chǎn)品事業(yè)部的總負(fù)責(zé)人,。
英特爾人工智能產(chǎn)品事業(yè)部副總裁、Nervana團隊成員Carey Kloss在接受21世紀(jì)經(jīng)濟報道記者專訪時談道:“我們創(chuàng)業(yè)初期就開始研發(fā)Lake Crest(Nervana NNP系列初代芯片代號),。當(dāng)時我們整個團隊大概45人,,正在構(gòu)建一個最大的Die(硅芯片),我們開發(fā)了Neon(深度學(xué)習(xí)軟件),,還構(gòu)建了云棧,,這些都是小團隊所完成的。但是這也是挑戰(zhàn)所在,,小團隊成長會有陣痛,,我們花了很長時間才把第一批產(chǎn)品拿出來,Nervana在2014年成立,,直到去年芯片才真正問世,。”
不過,,加入英特爾后,,Nervana可以使用英特爾的各類資源,“當(dāng)然,,調(diào)用資源并不是一件容易的事情,,但是英特爾在產(chǎn)品的市場化方面擁有豐富的經(jīng)驗。同時,,英特爾有迄今為止我見過的最佳的后硅培養(yǎng)(post-silicon bring-up)和架構(gòu)分析,。”Carey Kloss告訴21世紀(jì)經(jīng)濟報道記者,,“出品芯片方面,,我們有數(shù)百個系統(tǒng)同時運行,Nervana的員工和6個月前剛加入的成員也都為了新品夜以繼日地協(xié)同工作,。”在他看來,,Nervana現(xiàn)在處于合理的節(jié)奏中,,已經(jīng)具備了明年取得成功的所有要素。
除了Nervana,,英特爾收購的人工智能旗艦企業(yè)還包括專注視覺處理的Movidius,、FPGA(現(xiàn)場可編程門陣列)巨頭Altera、智能駕駛相關(guān)的Mobileye等,。事實上,,從2011年開始,英特爾就開始不斷地投資人工智能相關(guān)的公司,,其中也包括了中國的寒武紀(jì),、地平線,。
與此同時,英特爾的競爭對手也在日益壯大,。英偉達(dá)的GPU在人工智能領(lǐng)域高歌猛進(jìn),; 谷歌 前不久發(fā)布了第三代AI芯片TPU,該芯片針對谷歌的深度學(xué)習(xí)架構(gòu)TensorFlow進(jìn)行了優(yōu)化,,并且谷歌對開發(fā)者提供了TPU等底層服務(wù),;去年, 百度 聯(lián)合ARM,、紫光展銳和漢楓電子發(fā)布DuerOS智慧芯片,,主要提供語音交互解決方案; Facebook 和 阿里巴巴 也紛紛進(jìn)軍芯片領(lǐng)域,,其中,,阿里巴巴達(dá)摩院正在研發(fā)名為Ali-NPU的神經(jīng)網(wǎng)絡(luò)芯片,主要用于圖像,、視頻識別以及云計算等場景,。
在這場人工智能芯片的“遭遇戰(zhàn)”中,英特爾又將如何應(yīng)對,?
三大派系爭霸
從整體來看,,目前全球人工智能的格局尚未明朗,屬于各自做技術(shù)探索的局部戰(zhàn),,尚未進(jìn)入群雄逐鹿的總體戰(zhàn),。人工智能是一個籠統(tǒng)的概念,具體的應(yīng)用場景差異頗大,,各家公司側(cè)重點有所不同,,若根據(jù)技術(shù)和業(yè)務(wù)流派進(jìn)行分類,可以將全球公司分為三個派系,。
其一是系統(tǒng)應(yīng)用派,,最典型的代表是谷歌和Facebook。他們不僅開發(fā)人工智能的系統(tǒng)級框架,,比如谷歌出名的人工智能框架Tensorflow,、Facebook的Pytorch,而且還大規(guī)模地投入應(yīng)用,。例如,,谷歌斥重金研發(fā)自動駕駛,推出翻譯等2C業(yè)務(wù),。而Facebook也將人工智能技術(shù)廣泛應(yīng)用在社交網(wǎng)絡(luò)中的圖像處理,,自然語言處理等諸多領(lǐng)域。
第二類是芯片派,,目前主要是提供算力支持,,最大的玩家就是英特爾和英偉達(dá),。英偉達(dá)的GPU抓住了計算設(shè)備需求的關(guān)鍵時機,在圖形渲染,、人工智能和區(qū)塊鏈領(lǐng)域的計算表現(xiàn)十分突出,,在這些業(yè)務(wù)方面也給英特爾帶來壓力。同時英偉達(dá)似乎和英特爾的“Intel Inside”不同,,它更希望成為真正的算力平臺,,并且成功推出了自己的CUDA平臺。
就在5月30日,,英偉達(dá)發(fā)布了全球首個融合人工智能和高性能計算的計算平臺——HGX-2,,這也是目前最大的GPU——DGX-2背后的計算平臺。
作為傳統(tǒng)算力領(lǐng)域的老大英特爾自然不甘示弱,,50年的企業(yè)頗有老驥伏櫪的意味,,近年來在人工智能領(lǐng)域頻頻發(fā)起重磅并購:2015年167億美元收購“現(xiàn)場可編程門陣列巨頭”(Field Programmable Gate Array,F(xiàn)PGA)Altera,,為未來算力的發(fā)展趨勢奠定基礎(chǔ),,F(xiàn)PGA在云計算、物聯(lián)網(wǎng),、邊緣計算等方面有很大的潛力,;2016年英特爾收購Nervana,計劃用這家公司在深度學(xué)習(xí)方面的能力來對抗GPU,;同年還收購了視覺處理芯片初創(chuàng)公司 Movidius,;2017年英特爾以153億美元收購以色列協(xié)助駕駛公司Mobileye,旨在進(jìn)軍自動駕駛領(lǐng)域,。
在系統(tǒng)應(yīng)用派和芯片派之外,,第三類是技術(shù)應(yīng)用派,剩下的大部分公司都屬于這一類型,。雖然不同的公司都聲稱自己在深度學(xué)習(xí),、人工智能領(lǐng)域有著深厚甚至獨特的技術(shù)積累,但實際上大多是基于系統(tǒng)應(yīng)用派和芯片派的技術(shù)平臺,。只不過技術(shù)應(yīng)用派更多的面向C端用戶,,包括自動駕駛、圖像識別,、企業(yè)級應(yīng)用等??陀^上說,,技術(shù)應(yīng)用派屬于“君子善假于物也”。
從目前的競爭格局上來看,,系統(tǒng)應(yīng)用派已經(jīng)逐漸占據(jù)了整體優(yōu)勢,,在人工智能領(lǐng)域具備了最核心的競爭力,。在傳統(tǒng)的電腦和手機時代,系統(tǒng)和芯片更多是合作關(guān)系,,芯片甚至更加占據(jù)主導(dǎo)地位,。具體來看,比如在電腦市場上,,英特爾在算力領(lǐng)域完全制霸,,橫跨PC和 蘋果 的MAC機。而系統(tǒng)方面,,Windows和iOS各有千秋,,無法代替對方,但他們共同的英特爾卻無法代替,。到了手機時代,,雖然算力的主角從英特爾變?yōu)榱?高通 ,但是芯片依然處于核心的地位,,其重要性和操作系統(tǒng)平分秋色,。
而最近1-2年,形勢變化很快,,蘋果放出要自己研發(fā)和生產(chǎn)MAC芯片的口風(fēng),,英特爾股價一度聞風(fēng)下跌。在人工智能領(lǐng)域,,這樣的趨勢更加明顯,,由于計算場景的需求差異化極大,谷歌根據(jù)自己的需要研發(fā)成熟的芯片變得必要,,技術(shù)上也更可行,。英特爾如果要為不同的場景定制芯片,意味著英特爾將全面轉(zhuǎn)入2B領(lǐng)域,,和之前的2B2C模式相比,,純2B的業(yè)務(wù)顯然會更像乙方,業(yè)務(wù)線的復(fù)雜度會急劇增長,。而歷史上來看,,一家公司從2C轉(zhuǎn)向2B總體來看往往都是因為失去了在行業(yè)中的核心統(tǒng)治地位而不得不退而求次。
押寶Nervana NNP
那么,,在激烈競爭中,,英特爾又如何進(jìn)一步加碼芯片事業(yè)?
Naveen Rao加入了英特爾后,,成為英特爾副總裁,、AI事業(yè)部(AIPG)負(fù)責(zé)人,主導(dǎo)推出英特爾神經(jīng)網(wǎng)絡(luò)處理器(Nervana NNP)系列芯片。這次在AIDC大會上提出為開發(fā)者提供軟件工具,、硬件,、生態(tài)。在業(yè)內(nèi)看來,,以英特爾的技術(shù)實力,,軟件工具和硬件并不成問題,但是生態(tài)卻有待商榷,。在PC時代,,生態(tài)的核心是芯片,因此圍繞芯片構(gòu)建生態(tài)就可以令英特爾固若金湯,,但是在人工智能時代,,人工智能系統(tǒng)才是生態(tài)的核心,提供算力的芯片是生態(tài)的一部分,,CPU可以提供算力,,GPU也可以提供,英特爾可以生產(chǎn),,英偉達(dá)也可以生產(chǎn),,甚至谷歌、蘋果自己也可以生產(chǎn),。
目前在數(shù)據(jù)科學(xué)和深度學(xué)習(xí)計算領(lǐng)域,,英特爾的芯片布局主要有Xeon(至強)芯片系列、Movidius的視覺芯片VPU,、Nervana NNP系列,、以及FPGA(現(xiàn)場可編程門陣列)。這幾條產(chǎn)品線分別對應(yīng)幾個不同的細(xì)分應(yīng)用場景,。
Nervana NNP系列則是神經(jīng)網(wǎng)絡(luò)處理器,,在深度學(xué)習(xí)的訓(xùn)練和推斷階段中,Nervana NNP主要針對訓(xùn)練階段的計算,,按照英特爾的計劃,,到2020年要將深度學(xué)習(xí)訓(xùn)練(Deep Learning,簡稱“DL”)的效果提高100倍,。這款神經(jīng)網(wǎng)絡(luò)處理器由英特爾和Facebook一起合作設(shè)計,,可以預(yù)測該芯片很大程度上應(yīng)該會對Facebook的機器學(xué)習(xí)框架Pytorch有很好的支持,畢竟Facebook的Pytorch的野心肯定是要和谷歌的Tensorflow一決高下,。不過最新款芯片2019年才會正式推出商用,,屆時深度學(xué)習(xí)的格局變化如何無法預(yù)料。
Naveen Rao在其博客中寫道:“我們正在開發(fā)第一個商用神經(jīng)網(wǎng)絡(luò)處理器產(chǎn)品英特爾Nervana NNP-L1000(代號Spring Crest),,計劃在2019年發(fā)布,。與第一代Lake Crest產(chǎn)品相比,,我們預(yù)計英特爾Nervana NNP-L1000將實現(xiàn)3-4倍的訓(xùn)練性能。英特爾Nervana NNP-L1000還將支持bfloat16,,這是業(yè)內(nèi)廣泛采用的針對神經(jīng)網(wǎng)絡(luò)的一種數(shù)值型數(shù)據(jù)格式。未來,,英特爾將在人工智能產(chǎn)品線上擴大對bfloat16的支持,,包括英特爾至強處理器和英特爾FPGA?!?/p>
事實上,,Spring Crest在2018年底推出的傳言早已有之,但是目前看來,,官方公布的2019年這一時間點略有延遲,。對此,Carey Kloss向記者解釋道:“進(jìn)入更現(xiàn)代化的制程節(jié)點,,我們集成了更多的Die(硅芯片),,可以獲得更快的處理速度。但是需要一定的時間去制造硅片,,也需要時間把硅片變成新的神經(jīng)網(wǎng)絡(luò)處理器,,這是延遲的原因?!?/p>
對于兩代芯片的區(qū)別,,他分析稱:“Lake Crest作為第一代處理器,在GEMM(矩陣運算)和卷積神經(jīng)上都實現(xiàn)了非常好的計算利用率,。這不僅僅是指96%吞吐量的利用率,,而是在沒有充分定制化的情況下,我們也取得了大多數(shù)情況下實現(xiàn)GEMM高于80%的計算利用率,。當(dāng)我們開發(fā)下一代芯片時,,如果我們能夠保持高計算利用率,新的產(chǎn)品在性能上有3到4倍的性能提升,?!?/p>
談及競爭,Carey Kloss表示:“我不知道我們競爭對手的路線圖是什么,,但我們的反應(yīng)速度相對較快,,所以我認(rèn)為我們不會在神經(jīng)網(wǎng)絡(luò)處理上處于劣勢。比如bfloat16已經(jīng)有一段時間了,,它最近變得更受歡迎,,不少客戶提出支持bfloat16的要求,我們也逐步轉(zhuǎn)向支持bfloat16,?!倍鴮Ρ裙雀璧腡PU來看,,他認(rèn)為TPU二代類似于Lake Crest,TPU三代類似于Spring Crest,。
四面出擊
除了備受關(guān)注的Nervana NNP,,英特爾的Xeon芯片主要面向服務(wù)器和大型計算設(shè)備,比如我國超級計算機天河一號和二號就采用了Intel Xeon 六核處理器,。
在視覺芯片方面,,英特爾的業(yè)務(wù)量增長迅速。Movidius VPU芯片早就面向在汽車,、無人機等新興的硬件市場,,比如大疆無人機、 特斯拉 ,,以及Google Clips攝像頭中都采用了Movidius的視覺芯片,。
Movidius的市場負(fù)責(zé)人Gary Brown告訴21世紀(jì)經(jīng)濟報道記者:“在Movidius,我們研發(fā)的芯片被稱作視覺處理單元VPU,。VPU是一種兼具計算機視覺和智能攝像頭處理器的芯片,。所以我們的芯片所做的處理大概有三類: ISP處理,也就是圖像信號處理,,基于攝像頭捕捉技術(shù)的處理,,以及計算機視覺和深度學(xué)習(xí)?!?/p>
他舉例道,,具體的使用場景包括VR產(chǎn)品和機器人技術(shù)、智能家居,、工業(yè)攝像頭,、AI攝像頭,還有監(jiān)控和安保,。其中,,“監(jiān)控和安保是一個巨大的市場,尤其在中國,,監(jiān)控和安保攝像頭的市場特別大,,有一些大公司在研發(fā)監(jiān)控攝像頭,例如??低暫痛笕A,。”
Gary Brown還提到,,智能家居領(lǐng)域目前正在迅速發(fā)展,,雖然市場很小,但是發(fā)展神速,?!坝泻芏喙驹谘邪l(fā)智能裝置,,如智能家庭安防、個人家庭助手,、智能門鈴,,以及公寓和家庭的訪問控制。但是在家居領(lǐng)域,,要做到低成本,、低能耗、電池壽命長,,以及非常精準(zhǔn)是非常有挑戰(zhàn)性的。因為比如室外的樹蔭在移動,,就有可能觸發(fā)了防盜警報,,因此非常低的誤報率是非常重要的,要有良好的準(zhǔn)確性,?!?/p>
而公司的挑戰(zhàn)之一就是如何繼續(xù)創(chuàng)造高性能的芯片,“我們有一些策略,,比如,,用一個前端算法降低功耗,這樣我們就能關(guān)閉大部分芯片,,只運作小部分最優(yōu)化的面部檢測功能,。當(dāng)一張臉出現(xiàn)時,其他芯片將被啟動,。這樣就能一直保持面部監(jiān)控系統(tǒng)開啟,。我們還有很多演算節(jié)能技術(shù),使家用智能攝像頭續(xù)航時間達(dá)到大致6個月,?!?Gary Brown解釋道。
此外,,F(xiàn)PGA這條線則由Altera執(zhí)掌局面,。隨著5G浪潮的到來,IoT物聯(lián)網(wǎng)的數(shù)據(jù)分析及計算需求會暴增,,物聯(lián)網(wǎng)的接入節(jié)點至少是數(shù)百億級的規(guī)模,,比手機規(guī)模要高出1-2個數(shù)量級。物聯(lián)網(wǎng)的典型需求是需要靈活使用算法的變化,,這是FPGA的強項,,F(xiàn)PGA可以通過自身結(jié)構(gòu)的改變來適應(yīng)定制化計算場景的需求,這也使得英特爾在未來為更多不同類型的設(shè)備提供高效提供芯片變成可能,。從167億美元的收購金額就可以看出,,英特爾買的顯然不只是眼前的價值,。
速攻企業(yè)級場景
英特爾近期的一項調(diào)查顯示,在美國企業(yè)客戶中,,50%以上都正在轉(zhuǎn)向采用基于英特爾Xeon處理器的現(xiàn)有的云解決方案來滿足其對人工智能的初步需求,。而多位英特爾高管在接受采訪時都向記者表示,沒有一種解決方案適用于所有的人工智能場景,,英特爾會根據(jù)客戶需求對技術(shù)和業(yè)務(wù)進(jìn)行搭配,。比如,英特爾會將Xeon和FPGA,、或者Xeon和Movidius配置在一起,,從而實現(xiàn)更高性能的人工智能功能。
對于英特爾而言,,這些強化的人工智能功能將被廣泛地應(yīng)用于企業(yè)級場景,。Naveen Rao就表示:“在加速向人工智能驅(qū)動的未來計算過渡之時,我們需要提供全面的企業(yè)級解決方案,。這意味著我們的解決方案要提供最廣泛的計算能力,,并且能夠支持從毫瓦級到千瓦級的多種架構(gòu)?!?/p>
Carey Kloss進(jìn)一步向21世紀(jì)經(jīng)濟報道記者解釋人工智能芯片的應(yīng)用場景:“Spring Crest可以說是最高等級的Nervana神經(jīng)元處理器架構(gòu),。因此它的客戶就包括超大規(guī)模計算中心、已經(jīng)擁有相當(dāng)強大的數(shù)據(jù)科學(xué)工作的大型企業(yè),、政府等等,。如果你需求的是低延且小模型,Xeon就能幫助到你,,它可以把數(shù)據(jù)從云到端打通,。”
具體來看,,英特爾也在醫(yī)療,、無人駕駛、新零售,、物聯(lián)網(wǎng)等場景上做了探索,。比如在醫(yī)療方面,據(jù)介紹,,英特爾正在與 諾華 (Novartis)合作,,使用深度神經(jīng)網(wǎng)絡(luò)來加速高內(nèi)涵篩選——這是早期藥品研發(fā)的關(guān)鍵元素。雙方的合作把訓(xùn)練圖片分析模型的時間從11個小時縮短到了31分鐘——效率提高了20多倍,。
在無人商店方面,,英特爾為 京東 無人便利店提供“計算大腦”,目前已在多個智能門店( 中石化 易捷便利店,、京東之家)以及智能售賣機項目中部署使用,。在算法上,,京東方面表示,無人商店用到的機器學(xué)習(xí)算法主要集中在知人,、知貨,、知場3個方向,由于涉及線上線下數(shù)據(jù)打通,,將視頻等非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)數(shù)據(jù)等,,需要用到現(xiàn)在比較流行的機器視覺領(lǐng)域CNN(卷積神經(jīng)網(wǎng)絡(luò))算法,智慧供應(yīng)鏈方面用到的傳統(tǒng)機器學(xué)習(xí)算法,,如SVM,、統(tǒng)計學(xué)的線形回歸,邏輯回歸等,。在網(wǎng)絡(luò)條件比較好的情況下,,多數(shù)視頻數(shù)據(jù)可以使用較大模型在云端完成。在網(wǎng)絡(luò)不佳的情況下,,通過端計算比如移動端,邊緣計算使用小網(wǎng)絡(luò)完成,。而使用的硬件包括Intel的邊緣服務(wù)器等,。
盡管英特爾外遇強敵,轉(zhuǎn)型,、擴張的步伐十分堅定,。僅從研發(fā)數(shù)值來看,根據(jù)IC Insights的統(tǒng)計數(shù)據(jù),,2017年排名前10位的半導(dǎo)體廠商研發(fā)總支出為359億美元,,英特爾位列第一。報告顯示,,2017年英特爾的研發(fā)支出為131億美元,,占集團總支出的36%,約為英特爾2017年銷售額的五分之一,。
隨著各家的巨額投入,,AI芯片的戰(zhàn)役還將愈演愈烈。