時下業(yè)界利用深度學(xué)習(xí)算法來訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN),,以期實(shí)現(xiàn)智能化程度更高的移動設(shè)備,這可能需要以全新方法來設(shè)計處理器架構(gòu),。但是,,巧妙地充分利用現(xiàn)有的技術(shù),,也可幫助我們進(jìn)一步走向具備真正智能認(rèn)知能力的設(shè)備,并能夠完全重新定義用戶體驗(yàn),。
Nvidia在三月的GPU技術(shù)大會上使用汽車和先進(jìn)駕駛輔助系統(tǒng)(ADAS)作為應(yīng)用重點(diǎn),,配合Elon Musk的意見和評論,希望表明自動駕駛汽車的挑戰(zhàn)幾乎已被完全克服了,。另一方面,,隨著時間的推移,加上一些著眼于降低功耗的調(diào)整與改良,,我看到無處不在的3D感知,、3D跟蹤,以及圖像搜索等許多技術(shù)和應(yīng)用正在快速進(jìn)入智能手機(jī),,以及其他以電源或電池供電的嵌入式系統(tǒng)中,。
結(jié)合用于偵測運(yùn)動和音頻信號的傳感器、快速的存儲器訪問 ,,以及高功效的數(shù)據(jù)處理方法,,這些系統(tǒng)可以擁有真正的“認(rèn)知”能力,甚至在不遠(yuǎn)的將來構(gòu)成一個用于人工智能移動設(shè)備的平臺,。同時,,重要的是優(yōu)化現(xiàn)有的架構(gòu)來實(shí)現(xiàn)“智能視覺”功能,比如3D深度圖和感知,、物體識別以及增強(qiáng)現(xiàn)實(shí),,還有一些核心的計算圖像學(xué)功能,比如圖像縮放,、HDR,、圖像再對焦,以及微光圖像增強(qiáng),。
隨著許多圖像處理與增強(qiáng)功能也都使用計算機(jī)視覺技術(shù),,計算機(jī)視覺和圖像處理技術(shù)之間的區(qū)別正在變得越來越模糊。最直接的例子就是多幀圖像增強(qiáng)功能,,比如HDR,、圖像縮放與再對焦——拍攝多個連續(xù)的圖像,然后將它們?nèi)诤显谝黄?,得到更高質(zhì)量的畫面,。
雖然我們稱之為“圖像增強(qiáng)”,但這其實(shí)涉及大量的計算機(jī)視覺處理來“register”圖像,,既完成兩幀或三幀畫面之間的匹配?,F(xiàn)在,用戶認(rèn)為這種基本功能是理所當(dāng)然的,,但其實(shí)它需要非常強(qiáng)大的處理能力,,使得對于專門的,、高性能的數(shù)字信號處理 (DSP)的需求將會增加。
高通公司(Qualcomm) 在Uplinq 2013上發(fā)布了文章,,很好地描繪出用于各種不同處理功能的像素功率和時間關(guān)系,。圖中展示了三個處理器,包括一個在1.2 GHz下運(yùn)行的單核CPU,、一個四核CPU,,以及一個在690 MHz下運(yùn)行的DSP。
圖1:描繪不同處理器在處理每個像素時需要的處理能力和時間,,表明了DSP結(jié)合CPU用于視覺處理的優(yōu)勢。為了優(yōu)化功耗和性能,,結(jié)合CPU,、DSP和GPU可能是總體來說最好的方法。
圖表表明DSP在僅略微超過CPU一半的時鐘頻率下運(yùn)行,,便能夠在圖像處理上達(dá)到相同的效果,,提供了潛在的性能增益,同時節(jié)省了更多的功耗(功率= 電容 x 電壓2 x 頻率,,或者P=CV2xF),。
然而,隨著我們轉(zhuǎn)向在移動平臺上實(shí)現(xiàn)類似人類的視覺,、人工智能和增強(qiáng)現(xiàn)實(shí)應(yīng)用,,可能需要重新思考所需的處理架構(gòu)。結(jié)合傳感器融合和先進(jìn)深度學(xué)習(xí)算法(比如CNN),,這些非常先進(jìn)的計算密集型應(yīng)用將提供更具環(huán)境感知和情境感知的用戶體驗(yàn),,但是在電池壽命方面卻要作出取舍。
設(shè)計人員面臨的挑戰(zhàn),,是一方面要實(shí)現(xiàn)具有智能感知能力的設(shè)備,,同時在另一方面維持可接受的電池壽命。有幾種方法來實(shí)現(xiàn)這一點(diǎn),。例如,,可以使用來自高通或Nvidia的GPU來支持CPU。這已經(jīng)在許多智能手機(jī)中實(shí)現(xiàn)了,。然而,,降低功耗這一持續(xù)性的強(qiáng)制需求驅(qū)使我們將特定的處理密集型功能分散給針對視覺處理進(jìn)行優(yōu)化的DSP處理器。在處理物體識別和跟蹤時,,對比當(dāng)下最先進(jìn)的GPU簇群,,使用這種方法可以節(jié)省高達(dá)9倍的功耗。
然而,,即使具備這種功耗水平,,移動設(shè)備仍然不太可能很快地使用面部識別來進(jìn)行人群搜索,,因?yàn)榇斯δ軐τ谔幚砟芰Φ囊筮€是太高了。不過,,低功耗處理器和經(jīng)過特定優(yōu)化的處理器架構(gòu)的面世帶來了希望,,使得我們在這個領(lǐng)域內(nèi)正在取得實(shí)質(zhì)的進(jìn)展。這類進(jìn)展是MIT Technology Review將深度學(xué)習(xí)稱為2013年十項技術(shù)突破之一的原因所在,。除了GTC上進(jìn)行了相關(guān)演示,,微軟、百度,,以及Cognivue也展示了一些研究成果,。此后,這個領(lǐng)域中還有其他長足發(fā)展,。
此外,,Aziana (澳大利亞)最近宣布與BrainChip(美國加州)合并,后者是專門以硬件方式實(shí)施人工智能的企業(yè),,并已經(jīng)著眼于開發(fā)用于移動平臺的人工智能,。雖然支持強(qiáng)大處理能力的架構(gòu)和超低功耗處理是至關(guān)重要的,但隨著云連接變得更普及,、更快捷,,若我們將盡可能多的處理開銷分配到云中,也是合乎情理的,。這將會走向智能的處理性能分配,。在云做最適合在云中處理的工作,在移動設(shè)備做最適合移動設(shè)備處理的工作,,盡可能高效地依據(jù)架構(gòu)分配功能,,比如使用CPU來分配GPU和DSP之間的負(fù)載。用高通公司的說法,,就是使用合適的引擎來做合適的工作,。