2018年,,AI幾乎充斥了我們的生活,如果見(jiàn)朋友不聊點(diǎn)和AI相關(guān)的話(huà)題,,似乎自己就與這個(gè)時(shí)代脫節(jié)了,,近期高通驍龍855的發(fā)布再次把AI的關(guān)注度推向了高潮,從權(quán)威統(tǒng)計(jì)機(jī)構(gòu)的預(yù)測(cè)來(lái)看,,2018年全球AI市場(chǎng)規(guī)模預(yù)計(jì)為1.2萬(wàn)億美元,,到2022年有望達(dá)到3.9萬(wàn)億美元。AI勢(shì)不可擋的發(fā)展勢(shì)頭讓各大科技公司不得不一擁而上,,不管是做芯片還是做產(chǎn)品,,統(tǒng)統(tǒng)都要和AI掛鉤,大有“得AI者得天下”之勢(shì),。AI已經(jīng)在各個(gè)領(lǐng)域開(kāi)始滲透,,光AI音箱這一種亞馬遜,、天貓、小米就打得不可開(kāi)交,,其它智能電子產(chǎn)品更是不勝枚舉,,當(dāng)然,這都不是今天的重點(diǎn),,今天我主要想談的是AI芯片,,今年推出的這些AI芯片看看哪些比較靠譜。
目前,,筆者知曉的AI芯片有驍龍855,、麒麟980、蘋(píng)果A12,、聯(lián)發(fā)科P60,、紫光展銳SC9863A和瑞芯微RK3399Pro,誰(shuí)強(qiáng)誰(shuí)弱先拉出來(lái)比一比:
1,、驍龍855:張量加速器不等于獨(dú)立NPU
驍龍855采用臺(tái)積電7nm工藝制程,,CPU為Kryo485(超級(jí)內(nèi)核基于A76定制主頻2.84GHz、性能內(nèi)核主頻2.42GHz,、效率內(nèi)核主頻1.8GHz,,1+3+4架構(gòu));GPU為Adreno640,,與前代產(chǎn)品相比,,渲染速度提升20%,支持Vulkan1.1/HDR/PBR,。
驍龍855
在AI性能方面,驍龍855加入新的張量加速器(TensorAccelerator),,專(zhuān)門(mén)負(fù)責(zé)AI,,組成第四代AI引擎??梢詫?shí)現(xiàn)每秒超過(guò)7萬(wàn)億次運(yùn)算(7TOPs),,AI性能比驍龍845提高了3倍,比蘋(píng)果A12每秒5萬(wàn)億次運(yùn)算(5TOPs)也高出不少,。
高通的DSP數(shù)字信號(hào)處理器升級(jí)為最新的Hexagon690,,具備四線(xiàn)程標(biāo)量?jī)?nèi)核,性能提升20%,,四個(gè)向量擴(kuò)展核心(HVX),,性能提升1倍,另外一個(gè)重要的改進(jìn)是引入了張量加速器(HTA),,自主設(shè)計(jì),,專(zhuān)為AI而設(shè),,支持多元數(shù)學(xué)運(yùn)算、非線(xiàn)性方程,、INT16/INT8與混合精度整數(shù)運(yùn)算,,大幅提升了機(jī)器學(xué)習(xí)算法的性能和能效。結(jié)合HexagonDSP,、新的張量加速器,,再借助更強(qiáng)的GPU和CPU完成終端側(cè)神經(jīng)網(wǎng)絡(luò)運(yùn)算,所有單元綜合實(shí)現(xiàn)了專(zhuān)有的,、可編程的AI加速,。
但是,值得注意的是,,驍龍855并沒(méi)有配置獨(dú)立NPU單元,,其AI運(yùn)算需要協(xié)調(diào)CPU、DSP,、GPU等處理器單元,,如果應(yīng)用場(chǎng)景復(fù)雜,恰巧占用了這些處理單元,,AI運(yùn)算就要排隊(duì)等候,。也就是,其他公司的芯片的人工智能算力是獨(dú)立算力,,高通的AI運(yùn)算是綜合算力,。
2、麒麟980: 配置雙NPU
麒麟980采用7nm工藝制程,,基于ARM的A76架構(gòu),,主頻是2.6GHz,八核心分別是2×A76(超大核)+2×A76(大核)+4×A55(小核),,其中A76四個(gè)核心上采用了智能調(diào)度機(jī)制,。相對(duì)于傳統(tǒng)的大小核兩檔位設(shè)計(jì),麒麟980讓CPU在重載,、中載,、輕載場(chǎng)景下靈活適配。
在AI配置上,,麒麟970搭載了一個(gè)NPU(神經(jīng)處理單元),,其專(zhuān)門(mén)負(fù)責(zé)AI運(yùn)算,在大幅提高手機(jī)AI性能的同時(shí)降低了AI任務(wù)功耗,。麒麟980則配置了兩個(gè)NPU,,因此在ResNet-50圖像識(shí)別測(cè)試中得到了4500張每分鐘的成績(jī)。整體來(lái)看,相較于麒麟970,,麒麟980的CPU性能提升75%,,能效提升58%,內(nèi)置的10核GPU Mali-G76讓性能密度號(hào)稱(chēng)提升30%,,能效提升30%,。
3、蘋(píng)果A12:搭載8核神經(jīng)網(wǎng)絡(luò)引擎
A12采用7nm技術(shù),,內(nèi)部有69億個(gè)晶體管,,采用六核CPU設(shè)計(jì),相比A11處理器,,其中兩個(gè)大核心性能提速15%,、功耗降低了40%,四個(gè)小核心功耗降低最多50%,。A12采用自研四核GPU,,性能相比A11的GPU性能提高50%,并強(qiáng)化了對(duì)AR混合現(xiàn)實(shí)的支持,,支持曲面細(xì)分,、無(wú)損內(nèi)存壓縮和實(shí)時(shí)多層渲染功能,AR性能獲得大幅度提升,。
關(guān)于AI性能,,蘋(píng)果A12還搭載了八核神經(jīng)網(wǎng)絡(luò)引擎,其運(yùn)算速度達(dá)每秒5萬(wàn)億次,,遠(yuǎn)超A11的每秒六千萬(wàn)次,,可以更獨(dú)立機(jī)器學(xué)習(xí),支持多精度,,智能計(jì)算系統(tǒng),。同時(shí),蘋(píng)果還將神經(jīng)網(wǎng)絡(luò)引擎開(kāi)放給 Core ML 平臺(tái),,開(kāi)發(fā)者可將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到自己的 app 中,,讓學(xué)習(xí)過(guò)程在用戶(hù)的 iPhone 上進(jìn)行。提升了Siri易用性,、使A12芯片的機(jī)器學(xué)習(xí)能力相比之前能夠提升9倍,,而能耗則降低到原來(lái)的十分之一,。
4,、聯(lián)發(fā)科Helio P60
聯(lián)發(fā)科Helio P60采用ARM Cortex A73和A53大小核架構(gòu),采用八核心大小核(big.LITTLE)架構(gòu),,內(nèi)建四顆ARM A73 2.0 Ghz處理器與四顆ARM A53 2.0 Ghz處理器,。相較于上一代產(chǎn)品P23與P30,CPU及GPU性能均提升70%。采用12nm FinFET制程工藝,,功耗表現(xiàn)得到很大提升,,整體效能提升12%,執(zhí)行大型游戲時(shí)的功耗降低25%,,大幅延長(zhǎng)手機(jī)電池的使用時(shí)間,。
關(guān)于AI配置,聯(lián)發(fā)科在P60中引入了AI單元APU,,在P60中采用了三核ISP+雙核APU的架構(gòu),,性能提升兩倍。ISP+APU的多核圖像處理單元除了提供硬件加速之外,,還能夠提供多線(xiàn)程的處理能力,,這使得對(duì)于圖片處理能力和速度大幅提升。包括自動(dòng)對(duì)焦,、白平衡以及高規(guī)格HDR在內(nèi)等反映的速度更快,。此外,APU的引入以及聯(lián)發(fā)科提供的平臺(tái)化的策略,,也更有利于開(kāi)放給合作伙伴以及第三方進(jìn)行拍照的后處理,,定制更多的拍照算法。應(yīng)該說(shuō)AI的引入,,使得P60的硬件性能進(jìn)一步得到釋放,。與此同時(shí),AI所帶來(lái)的軟件層面的超級(jí)算力也將帶來(lái)諸如人臉,、語(yǔ)音識(shí)別等功能的進(jìn)一步增強(qiáng),。
5、紫光展銳SC9863
紫光展銳SC9863主打AI牌,,被稱(chēng)為8核AI芯片,,支持CAT-7,采用Arm Cortex-A55處理器架構(gòu)的SoC芯片平臺(tái),,在Cortex-A55人工智能的基礎(chǔ)上,,進(jìn)行了應(yīng)用開(kāi)發(fā)。Cortex-A75與Cortex-A55均采用Arm DynamlQ技術(shù)打造,,而DynamlQ融入了AI神經(jīng)網(wǎng)絡(luò)技術(shù),。相比前代Cortex-A53,Cortex-A55 NEON進(jìn)行了流水線(xiàn)改進(jìn)與新增機(jī)器學(xué)習(xí)指令,,讓其在矩陣乘法運(yùn)算方面的機(jī)器學(xué)習(xí)性能大幅提升,,如果按照AI 8bit dot-product運(yùn)算能力,比Cortex-A53提升6倍,。
同時(shí),,得益于ARM DynamlQ單簇組合方式,,Cortex-A75與Cortex-A55可實(shí)現(xiàn)1+3、1+7或者4個(gè)大核,、8個(gè)小核的組合,,多個(gè)CPU核芯以單簇的方式一起工作,可發(fā)揮更強(qiáng)大的性能,,避免“1核有難,,7核圍觀”的狀況。紫光展銳SC9863采用的是8核Cortex-A55的組合方式,,而高通驍龍845是4核Cortex-A75與4核Cortex-A55的組合方式,。
SC9863芯片平臺(tái)的AI能力體現(xiàn)在支持基于深度神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別技術(shù),可實(shí)現(xiàn)快速精準(zhǔn)的人臉認(rèn)證,;通過(guò)智能AI算法,,實(shí)現(xiàn)實(shí)時(shí)智能場(chǎng)景檢測(cè)識(shí)別、不同場(chǎng)景智能拍照增強(qiáng),、支持手機(jī)側(cè)圖庫(kù)照片的智能識(shí)別與分類(lèi),。但是,沒(méi)有加入獨(dú)立的神經(jīng)處理單元,,計(jì)算能力是否會(huì)出現(xiàn)折扣不得而知,。
6、瑞芯微RK3399
RK3399Pro采用big.LITTLE大小核CPU架構(gòu),,雙核Cortex-A72+四核Cortex-A53+四核ARM高端GPU Mali-T860,,其集成的NPU(神經(jīng)網(wǎng)絡(luò)處理器)融合了Rockchip在機(jī)器視覺(jué)、語(yǔ)音處理,、深度學(xué)習(xí)等領(lǐng)域的多年經(jīng)驗(yàn),。相較傳統(tǒng)芯片,典型深度神經(jīng)網(wǎng)絡(luò)Inception V3,、ResNet34,、VGG16等模型在RK3399Pro芯片上的運(yùn)行效果表現(xiàn)出眾。
RK3399Pro的AI特性有三點(diǎn):
1)AI硬件性能高,,采用專(zhuān)有AI硬件設(shè)計(jì),,NPU運(yùn)算性能高達(dá)2.4TOPs,高性能與低功耗指標(biāo)均大幅領(lǐng)先:相較同類(lèi)NPU芯片性能領(lǐng)先150%,;相較GPU作為AI運(yùn)算單元的大型芯片方案,,功耗不到其所需的1%;
2)平臺(tái)兼容性,,RK3399Pro的NPU支持8bit與16bit運(yùn)算,,能夠兼容各類(lèi)AI軟件框架。現(xiàn)有AI接口支持OpenVX及TensorFlowLite/AndroidNN API,,AI軟件工具支持對(duì)Caffe/TensorFlow模型的導(dǎo)入及映射,、優(yōu)化;
3)完整方案易于開(kāi)發(fā),,Rockchip基于RK3399Pro芯片提供一站式AI解決方案,,包括硬件參考設(shè)計(jì)及軟件SDK,可大幅提高全球開(kāi)發(fā)者的AI產(chǎn)品研發(fā)速度,,并極大縮短產(chǎn)品上市時(shí)間,。
從以上六款帶有AI功能的芯片來(lái)看,在架構(gòu)上基本都是采用了多核模式,,以八核為主,;另外,關(guān)于AI運(yùn)算,,在原有CPU,、GPU的基礎(chǔ)上增加獨(dú)立神經(jīng)元計(jì)算處理單元成為主流趨勢(shì),這樣可以實(shí)現(xiàn)AI運(yùn)算加速,,從而帶來(lái)更好的用戶(hù)體驗(yàn),;在應(yīng)用方面,還是以手機(jī)的人臉識(shí)別,、圖像處理為主,,未來(lái)隨著5G的商用,在自動(dòng)駕駛汽車(chē)中的應(yīng)用也會(huì)逐漸增加,。
從對(duì)比中可以看出,,國(guó)產(chǎn)廠商和國(guó)內(nèi)廠商各占一半,從高端到低端均有覆蓋,,在獨(dú)立神經(jīng)元計(jì)算單元的集成上,,只有海思、蘋(píng)果,、聯(lián)發(fā)科的產(chǎn)品上已經(jīng)實(shí)現(xiàn),,其它幾家廠商還在追趕。由于智能手機(jī)強(qiáng)烈的市場(chǎng)需求,,因此AI普及起來(lái)更為順暢,,但是目前需要在人臉識(shí)別和圖像處理的基礎(chǔ)上探索更多可能的應(yīng)用。