雖然蘋果和三星都擁有自主開發(fā)的應(yīng)用處理器,,鎖定了高端智能手機市場,但是聯(lián)發(fā)科(MediaTek)正在尋求在智能手機市場的反彈,,在本周的2018世界移動通信大會上推出了Helio P60芯片組,。
聯(lián)發(fā)科的計劃是重新進入與高通競爭的中高端智能手機市場。
聯(lián)發(fā)科技將Helio P60視為“首款采用多核AI處理單元(移動APU)和聯(lián)發(fā)科NeuroPilot AI技術(shù)的SoC平臺”,。
聯(lián)發(fā)科的舉動顯示了該公司在行業(yè)智能手機大戰(zhàn)中,,策略重點轉(zhuǎn)向移動人工智能的巨大變化。目前各種芯片供應(yīng)商都在競相將神經(jīng)網(wǎng)絡(luò)引擎用于手持設(shè)備上,。目標很簡單,。他們希望開啟人工智能體驗——語音用戶界面、人臉解鎖,、AR等等——在客戶端設(shè)備上處理更快,、更好,,無論有沒有網(wǎng)絡(luò)連接。
Linley Group高級分析師Mike Demler表示:“我們在去年才看到了第一批帶有嵌入式神經(jīng)引擎的智能手機處理器,,如蘋果A11,、華為麒麟970、高通Snapdragon 835和聯(lián)發(fā)科Helio X30等旗艦處理器,?!?/p>
Demler表示:“我們對聯(lián)發(fā)科將在更低層添加神經(jīng)引擎并不感到意外,但有趣的是,,他們正在使用比其旗艦產(chǎn)品X30更強大的核心來實現(xiàn)這一點,。”
換句話說,,一個由中國手機制造商推動的,、充滿活力的中端智能手機供應(yīng)商社區(qū)正在躍躍欲試,他們希望盡快趕上移動AI這股趨勢,。
新高度
聯(lián)發(fā)科稱其為“新高級”是指“以中檔價格提供卓越性能和功能的設(shè)備”,。聯(lián)發(fā)科銷售總經(jīng)理Finbarr Moynihan解釋說,“新高度”是目前智能手機的重要動作,,像Oppo,、Vivo、聯(lián)想等中高端玩家都渴望縮小與頂級競爭對手的差距,,希望在應(yīng)用,、功能和AI方面取得重大飛躍。
聯(lián)發(fā)科告訴我們,,2017年全球智能手機出貨量的48%來自中國OEM廠商,,主要針對新興市場。聯(lián)發(fā)科援引TrendForce報告指出,,2017年中端消費者品牌出現(xiàn)大幅增長,,小米的智能手機產(chǎn)量增幅高達76%,而Transsion,、OPPO和Vivo也有大幅增長,。
Helio P60在八核CPU中配備了4個ARM A73處理器和4個ARM A53處理器?;赽ig.LITTLE的8核設(shè)計,,聯(lián)發(fā)科技宣稱與前代產(chǎn)品Helio P23和Hleio P30相比,CPU性能提升了70%,。通過使用最高800MHz的新型Mali G72 GPU,,P60還將GPU性能提高了70%。
聯(lián)發(fā)科的神經(jīng)網(wǎng)絡(luò)引擎
然而,,讓Helio P60實至名歸的是其內(nèi)置的NeuroPilot AI平臺,、橋接CPU,、GPU和板載AI加速器。聯(lián)發(fā)科的人工智能框架可以通過協(xié)調(diào)SoC內(nèi)CPU,、GPU和AI加速器計算工作負載來管理異構(gòu)AI計算架構(gòu),,最大限度地提高性能和能效。
聯(lián)發(fā)科已經(jīng)證實,,P60在其AI加速器中集成了Cadence Vision P6內(nèi)核,。
Cadence Vision P6
與聯(lián)發(fā)科技旗艦產(chǎn)品Helio X30——使用Cadence Vision P5,每秒70 GMAC(8位)——相比,, Helio P60每秒處理性能為280 GMAC,。Demler表示:“所以在處理器整體性能上降低了一層,但同時將神經(jīng)引擎性能提高了4倍,?!?/p>
當被問及對比Helio P60神經(jīng)網(wǎng)絡(luò)引擎性能時,Demler說:“華為的麒麟970可以達到?1TMAC / s(FP16),,因此在更高的分辨率下它的神經(jīng)網(wǎng)絡(luò)性能是P60的4倍。在280GMAC / s下,,P60與蘋果A11的很接近,,達到300GMAC / s?!?/p>
缺乏AI基準
然而,,我們咨詢的大多數(shù)分析師都認為,深度學習加速器基準的缺乏,,使得很難做出有任何意義的比較,。Demler稱這是“一個開放的大問題”,他說移動AI這個泥潭可能很容易導致我們陷入“GOPS / TOPS營銷炒作之戰(zhàn)”,。
Tirias Research首席分析師Jim McGregor表示贊同,。“這是一個令人困惑的話題,,因為沒有什么細節(jié)和基準,。聯(lián)發(fā)科和其他公司使其聽起來像是無所不能的人工智能解決方案,”但通常并非如此,,McGregor補充說,。
例如,聯(lián)發(fā)科的P60中使用的Cadence Vision P6內(nèi)核是針對計算機視覺應(yīng)用進行了優(yōu)化,,而非通用神經(jīng)網(wǎng)絡(luò),,Demler說。
正如McGregor所解釋的,,“首先,,你需要了解大多數(shù)AI處理器是什么,。”例如,,聯(lián)發(fā)科,、蘋果和華為稱其解決方案為“專用”,意味著使用單個IP塊進行AI加速,?!霸诖蠖鄶?shù)情況下,這意味著從其他方——如Cadence或Ceva——那里獲得的IP塊許可,。這種IP塊支持可配置的神經(jīng)網(wǎng)絡(luò),,但有一些限制??墒菦]有人能確切地說出這些限制是什么,。”
所以,,顯然地,,在應(yīng)用處理器內(nèi)部放置一個神經(jīng)網(wǎng)絡(luò)引擎并不是故事的結(jié)尾。正如McGregor指出的那樣,,新神經(jīng)網(wǎng)絡(luò)的開發(fā)和訓練仍然需要在數(shù)據(jù)中心進行,,必須依賴更多高精度、強大的訓練處理器,。
如果應(yīng)用開發(fā)人員和OEM廠商想要利用智能手機應(yīng)用處理器內(nèi)部的神經(jīng)引擎,,他們需要一個與底層硬件掛鉤的軟件框架?!八蓄I(lǐng)先的移動處理器設(shè)計公司(高通,、聯(lián)發(fā)科、華為,、蘋果)現(xiàn)在都提供神經(jīng)網(wǎng)絡(luò)SDK,,”Demler觀察到。但他們都需要支持像Caffe和Torch這樣的流行培訓框架,。
對聯(lián)發(fā)科來說,,聯(lián)發(fā)科提供了被稱為NeuroPilot AI SDK的框架,該框架可以讓應(yīng)用開發(fā)人員和OEM廠商“深入到硬件,,看AI軟件如何在CPU,、GPU和專用AI加速器上運行”,Moynihan這樣表示,。
與此同時,,應(yīng)用開發(fā)人員和OEM廠商也需要能夠“查找并查看Android網(wǎng)絡(luò)API(Android NNAPI)的內(nèi)容”,Moynihan補充道,。Google為Android機器學習開發(fā)了Android NNAPI和運行時引擎,?!奥?lián)發(fā)科的NeuroPilot SDK完全符合Android NNAPI,”Moynihan補充道,。
Android Neural Networks API的系統(tǒng)架構(gòu)
在部署能夠讓智能手機處理器運行AI應(yīng)用的方法中,,高通的方法似乎有些不同。
McGregor說,,高通的解決方案是不同的,,因為“他們已經(jīng)在芯片上使用了多種資源,包括Hexagon DSP,、Adreno GPU和Kryo CPU內(nèi)核,。”
然而他補充說:“沒有可用的基準,,不可能確定哪種方法更好,,但高通模型確實提供了更高的靈活性?!?/p>
AI軟件之戰(zhàn)
無論底層硬件如何,,畢竟最關(guān)鍵的還是能夠購在任何智能手機上體現(xiàn)AI體驗差異化的軟件。
McGregor說:“現(xiàn)在,,這些應(yīng)用正瞄準著手機上的常見功能,,例如拍照和數(shù)字助理。但是,,通常由第三方軟件開發(fā)人員來開發(fā)和訓練用于手機上的這種模型?!?/p>
他指出,,“在有限的情況下,有些模型或庫是可用的,。高通圍繞圖像識別開發(fā)了一些庫,,三星主要圍繞拍照,我相信蘋果也正在開發(fā)自己的模型,?!?/p>
在其他情況下,這取決于應(yīng)用開發(fā)人員,,這是一個很大的限制,,McGregor指出?!昂芏鄳?yīng)用開發(fā)人員并不習慣于使用深度學習,,也無法訪問深度學習所需的大型數(shù)據(jù)中心,”他說,。
Linley Group的Demler在他最近的微處理器報告中也對人工智能軟件開發(fā)提出了警告,。 “處理器架構(gòu)的多樣性給Android應(yīng)用開發(fā)人員帶來了挑戰(zhàn),,因為即使在缺乏專用深度學習加速器的設(shè)備上,這些應(yīng)用也必須能夠運行,?!倍硪环矫妫琲OS應(yīng)用開發(fā)人員只需要支持Apple設(shè)計的一些處理器就可以了,。
Tirias Research首席分析師Kevin Krewell也警告說:“我看到的最大問題是,,每個芯片和IP供應(yīng)商都在以不同的方式做機器學習。ARM可能有最佳的機會,,在一個IP上對多個廠商實施標準化,。