去年“阿爾法狗”戰(zhàn)勝韓國棋手李世石,,需要耗電數(shù)萬瓦,、依賴體積巨大的云服務(wù)器,。一年多后,,一個小小的人工智能芯片,就可讓手機,、手表甚至攝像頭都能和“阿爾法狗”一樣“聰明”,。
隨著中國企業(yè)率先推出市場化的人工智能(AI)手機芯片,這樣的手機之“芯”正掀起全球熱潮,。
智能手機需要更強芯片
2017年柏林國際消費電子展上,,華為推出麒麟970人工智能手機芯片,內(nèi)置神經(jīng)元網(wǎng)絡(luò)單元(NPU),,通過人工智能深度學(xué)習(xí),,讓手機的運行更加高效。
芯片又叫集成電路,,按照功能可分為很多種,,有的負責(zé)電源電壓輸出控制,有的負責(zé)音頻視頻處理,,還有的負責(zé)復(fù)雜運算處理。目前市場上的手機芯片有指紋識別芯片,、圖像識別芯片,、基帶芯片、射頻芯片等近百種,。
現(xiàn)有芯片種類繁多,,為何還要人工智能芯片?
隨著手機智能應(yīng)用越來越多,傳統(tǒng)芯片要么性能不夠,要么效率不足,,難以支撐人工智能所需的大規(guī)模神經(jīng)網(wǎng)絡(luò)運轉(zhuǎn),。
例如,“谷歌大腦”用了上萬個通用處理器“跑”了數(shù)天來學(xué)習(xí)如何識別貓臉;“阿爾法狗”和李世石下棋時使用了上千個中央處理器(CPU)和數(shù)百個圖形處理器(GPU),,平均每局電費近3000美元,。對于絕大多數(shù)智能需求來說,基于通用處理器的傳統(tǒng)計算機成本高,、功耗高,、體積大、速度慢,,難以接受,。
與傳統(tǒng)的4核芯片相比,在處理同樣的人工智能應(yīng)用任務(wù)時,,麒麟970擁有大約50倍能效和25倍性能優(yōu)勢,。
IT巨頭將加速研發(fā)AI芯片
目前迅猛發(fā)展的人工智能,上層的應(yīng)用都依賴于底層核心能力,,而這個核心能力就是人工智能處理器,。如果在芯片上不能突破,人工智能應(yīng)用就不可能真正成功,??梢哉f核心芯片是人工智能時代的戰(zhàn)略制高點。
人工智能目前采用的深度學(xué)習(xí)算法,,有海量的數(shù)據(jù)運算需求,,對傳統(tǒng)架構(gòu)和系統(tǒng)提出了極大挑戰(zhàn)。
深度學(xué)習(xí),,就是通過算法給機器設(shè)計一個神經(jīng)網(wǎng)絡(luò),。這個網(wǎng)絡(luò)的基本特點,是模仿大腦神經(jīng)元之間傳遞,、處理信息的模式,,從多個角度和層次來觀察、學(xué)習(xí),、判斷,、決策。近年來,,這種方法已應(yīng)用于許多領(lǐng)域,,比如人臉識別、語音識別等,,是人工智能領(lǐng)域的熱點研究方向之一,。
用于圖像處理的GPU芯片因海量數(shù)據(jù)并行運算能力,,被最先引入深度學(xué)習(xí)。2011年,,當(dāng)時在谷歌就職的吳恩達將英偉達的GPU應(yīng)用于“谷歌大腦”中,,結(jié)果表明12個GPU可達到相當(dāng)于2000個CPU的深度學(xué)習(xí)性能。之后多家研究機構(gòu)都基于GPU來加速其深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),。
然而,,隨著近兩年人工智能技術(shù)的迅速發(fā)展,GPU在三個方面顯露出局限性:無法充分發(fā)揮并行計算優(yōu)勢,,硬件結(jié)構(gòu)固定不具備可編程性,,運行深度學(xué)習(xí)算法能效不足。
全球科研界和企業(yè)于是競相開發(fā)更加適用的人工智能芯片,,尤其是適用于移動通信時代的芯片,。
華為公司與中國科學(xué)院計算技術(shù)研究所“寒武紀(jì)”項目團隊共同開發(fā)的麒麟970人工智能手機芯片,首次集成NPU,,將通常由多個芯片完成的傳統(tǒng)計算,、圖形、圖像以及數(shù)字(數(shù)位)信號處理功能集成在一塊芯片內(nèi),,節(jié)省空間,、節(jié)約能耗,同時極大提高了運算效率,。
在新的計算時代,,核心芯片將決定基礎(chǔ)架構(gòu)和未來生態(tài)。因此,,谷歌,、微軟、超威等全球信息技術(shù)和通信制造巨頭都投入巨資,,加速人工智能芯片的研發(fā),。