驍龍855/麒麟980/蘋果A12/聯(lián)發(fā)科P60/瑞芯微RK3399，誰能領(lǐng)跑AI時(shí)代-AET-電子技術(shù)應(yīng)用

驍龍855/麒麟980/蘋果A12/聯(lián)發(fā)科P60/瑞芯微RK3399，誰能領(lǐng)跑AI時(shí)代

日期： 2018-12-17

關(guān)鍵詞： AI 芯片聯(lián)發(fā)科瑞芯微

2018年，AI幾乎充斥了我們的生活，如果見朋友不聊點(diǎn)和AI相關(guān)的話題，似乎自己就與這個時(shí)代脫節(jié)了，近期高通驍龍855的發(fā)布再次把AI的關(guān)注度推向了高潮，從權(quán)威統(tǒng)計(jì)機(jī)構(gòu)的預(yù)測來看，2018年全球AI市場規(guī)模預(yù)計(jì)為1．2萬億美元，到2022年有望達(dá)到3．9萬億美元。AI勢不可擋的發(fā)展勢頭讓各大科技公司不得不一擁而上，不管是做芯片還是做產(chǎn)品，統(tǒng)統(tǒng)都要和AI掛鉤，大有“得AI者得天下”之勢。AI已經(jīng)在各個領(lǐng)域開始滲透，光AI音箱這一種亞馬遜、天貓、小米就打得不可開交，其它智能電子產(chǎn)品更是不勝枚舉，當(dāng)然，這都不是今天的重點(diǎn)，今天我主要想談的是AI芯片，今年推出的這些AI芯片看看哪些比較靠譜。

目前，筆者知曉的AI芯片有驍龍855、麒麟980、蘋果A12、聯(lián)發(fā)科P60、紫光展銳SC9863A和瑞芯微RK3399Pro，誰強(qiáng)誰弱先拉出來比一比：

1、驍龍855：張量加速器不等于獨(dú)立NPU

驍龍855采用臺積電7nm工藝制程，CPU為Kryo485（超級內(nèi)核基于A76定制主頻2．84GHz、性能內(nèi)核主頻2．42GHz、效率內(nèi)核主頻1．8GHz，1＋3＋4架構(gòu)）；GPU為Adreno640，與前代產(chǎn)品相比，渲染速度提升20％，支持Vulkan1．1／HDR／PBR。

驍龍855

在AI性能方面，驍龍855加入新的張量加速器（TensorAccelerator），專門負(fù)責(zé)AI，組成第四代AI引擎。可以實(shí)現(xiàn)每秒超過7萬億次運(yùn)算（7TOPs），AI性能比驍龍845提高了3倍，比蘋果A12每秒5萬億次運(yùn)算（5TOPs）也高出不少。

高通的DSP數(shù)字信號處理器升級為最新的Hexagon690，具備四線程標(biāo)量內(nèi)核，性能提升20％，四個向量擴(kuò)展核心（HVX），性能提升1倍，另外一個重要的改進(jìn)是引入了張量加速器（HTA），自主設(shè)計(jì)，專為AI而設(shè)，支持多元數(shù)學(xué)運(yùn)算、非線性方程、INT16／INT8與混合精度整數(shù)運(yùn)算，大幅提升了機(jī)器學(xué)習(xí)算法的性能和能效。結(jié)合HexagonDSP、新的張量加速器，再借助更強(qiáng)的GPU和CPU完成終端側(cè)神經(jīng)網(wǎng)絡(luò)運(yùn)算，所有單元綜合實(shí)現(xiàn)了專有的、可編程的AI加速。

但是，值得注意的是，驍龍855并沒有配置獨(dú)立NPU單元，其AI運(yùn)算需要協(xié)調(diào)CPU、DSP、GPU等處理器單元，如果應(yīng)用場景復(fù)雜，恰巧占用了這些處理單元，AI運(yùn)算就要排隊(duì)等候。也就是，其他公司的芯片的人工智能算力是獨(dú)立算力，高通的AI運(yùn)算是綜合算力。

2、麒麟980：配置雙NPU

麒麟980采用7nm工藝制程，基于ARM的A76架構(gòu)，主頻是2．6GHz，八核心分別是2×A76（超大核）＋2×A76（大核）＋4×A55（小核），其中A76四個核心上采用了智能調(diào)度機(jī)制。相對于傳統(tǒng)的大小核兩檔位設(shè)計(jì)，麒麟980讓CPU在重載、中載、輕載場景下靈活適配。

在AI配置上，麒麟970搭載了一個NPU（神經(jīng)處理單元），其專門負(fù)責(zé)AI運(yùn)算，在大幅提高手機(jī)AI性能的同時(shí)降低了AI任務(wù)功耗。麒麟980則配置了兩個NPU，因此在ResNet－50圖像識別測試中得到了4500張每分鐘的成績。整體來看，相較于麒麟970，麒麟980的CPU性能提升75％，能效提升58％，內(nèi)置的10核GPU Mali－G76讓性能密度號稱提升30％，能效提升30％。

3、蘋果A12：搭載8核神經(jīng)網(wǎng)絡(luò)引擎

A12采用7nm技術(shù)，內(nèi)部有69億個晶體管，采用六核CPU設(shè)計(jì)，相比A11處理器，其中兩個大核心性能提速15％、功耗降低了40％，四個小核心功耗降低最多50％。A12采用自研四核GPU，性能相比A11的GPU性能提高50％，并強(qiáng)化了對AR混合現(xiàn)實(shí)的支持，支持曲面細(xì)分、無損內(nèi)存壓縮和實(shí)時(shí)多層渲染功能，AR性能獲得大幅度提升。

關(guān)于AI性能，蘋果A12還搭載了八核神經(jīng)網(wǎng)絡(luò)引擎，其運(yùn)算速度達(dá)每秒5萬億次，遠(yuǎn)超A11的每秒六千萬次，可以更獨(dú)立機(jī)器學(xué)習(xí)，支持多精度，智能計(jì)算系統(tǒng)。同時(shí)，蘋果還將神經(jīng)網(wǎng)絡(luò)引擎開放給 Core ML 平臺，開發(fā)者可將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到自己的 app 中，讓學(xué)習(xí)過程在用戶的 iPhone 上進(jìn)行。提升了Siri易用性、使A12芯片的機(jī)器學(xué)習(xí)能力相比之前能夠提升9倍，而能耗則降低到原來的十分之一。

4、聯(lián)發(fā)科Helio P60

聯(lián)發(fā)科Helio P60采用ARM Cortex A73和A53大小核架構(gòu)，采用八核心大小核（big．LITTLE）架構(gòu)，內(nèi)建四顆ARM A73 2．0 Ghz處理器與四顆ARM A53 2．0 Ghz處理器。相較于上一代產(chǎn)品P23與P30，CPU及GPU性能均提升70％。采用12nm FinFET制程工藝，功耗表現(xiàn)得到很大提升，整體效能提升12％，執(zhí)行大型游戲時(shí)的功耗降低25％，大幅延長手機(jī)電池的使用時(shí)間。

關(guān)于AI配置，聯(lián)發(fā)科在P60中引入了AI單元APU，在P60中采用了三核ISP＋雙核APU的架構(gòu)，性能提升兩倍。ISP＋APU的多核圖像處理單元除了提供硬件加速之外，還能夠提供多線程的處理能力，這使得對于圖片處理能力和速度大幅提升。包括自動對焦、白平衡以及高規(guī)格HDR在內(nèi)等反映的速度更快。此外，APU的引入以及聯(lián)發(fā)科提供的平臺化的策略，也更有利于開放給合作伙伴以及第三方進(jìn)行拍照的后處理，定制更多的拍照算法。應(yīng)該說AI的引入，使得P60的硬件性能進(jìn)一步得到釋放。與此同時(shí)，AI所帶來的軟件層面的超級算力也將帶來諸如人臉、語音識別等功能的進(jìn)一步增強(qiáng)。

5、紫光展銳SC9863

紫光展銳SC9863主打AI牌，被稱為8核AI芯片，支持CAT－7，采用Arm Cortex－A55處理器架構(gòu)的SoC芯片平臺，在Cortex－A55人工智能的基礎(chǔ)上，進(jìn)行了應(yīng)用開發(fā)。Cortex－A75與Cortex－A55均采用Arm DynamlQ技術(shù)打造，而DynamlQ融入了AI神經(jīng)網(wǎng)絡(luò)技術(shù)。相比前代Cortex－A53，Cortex－A55 NEON進(jìn)行了流水線改進(jìn)與新增機(jī)器學(xué)習(xí)指令，讓其在矩陣乘法運(yùn)算方面的機(jī)器學(xué)習(xí)性能大幅提升，如果按照AI 8bit dot－product運(yùn)算能力，比Cortex－A53提升6倍。

同時(shí)，得益于ARM DynamlQ單簇組合方式，Cortex－A75與Cortex－A55可實(shí)現(xiàn)1＋3、1＋7或者4個大核、8個小核的組合，多個CPU核芯以單簇的方式一起工作，可發(fā)揮更強(qiáng)大的性能，避免“1核有難，7核圍觀”的狀況。紫光展銳SC9863采用的是8核Cortex－A55的組合方式，而高通驍龍845是4核Cortex－A75與4核Cortex－A55的組合方式。

SC9863芯片平臺的AI能力體現(xiàn)在支持基于深度神經(jīng)網(wǎng)絡(luò)的人臉識別技術(shù)，可實(shí)現(xiàn)快速精準(zhǔn)的人臉認(rèn)證；通過智能AI算法，實(shí)現(xiàn)實(shí)時(shí)智能場景檢測識別、不同場景智能拍照增強(qiáng)、支持手機(jī)側(cè)圖庫照片的智能識別與分類。但是，沒有加入獨(dú)立的神經(jīng)處理單元，計(jì)算能力是否會出現(xiàn)折扣不得而知。

6、瑞芯微RK3399

RK3399Pro采用big．LITTLE大小核CPU架構(gòu)，雙核Cortex－A72＋四核Cortex－A53＋四核ARM高端GPU Mali－T860，其集成的NPU（神經(jīng)網(wǎng)絡(luò)處理器）融合了Rockchip在機(jī)器視覺、語音處理、深度學(xué)習(xí)等領(lǐng)域的多年經(jīng)驗(yàn)。相較傳統(tǒng)芯片，典型深度神經(jīng)網(wǎng)絡(luò)Inception V3、ResNet34、VGG16等模型在RK3399Pro芯片上的運(yùn)行效果表現(xiàn)出眾。

RK3399Pro的AI特性有三點(diǎn)：

1）AI硬件性能高，采用專有AI硬件設(shè)計(jì)，NPU運(yùn)算性能高達(dá)2．4TOPs，高性能與低功耗指標(biāo)均大幅領(lǐng)先：相較同類NPU芯片性能領(lǐng)先150％；相較GPU作為AI運(yùn)算單元的大型芯片方案，功耗不到其所需的1％；

2）平臺兼容性，RK3399Pro的NPU支持8bit與16bit運(yùn)算，能夠兼容各類AI軟件框架。現(xiàn)有AI接口支持OpenVX及TensorFlowLite／AndroidNN API，AI軟件工具支持對Caffe／TensorFlow模型的導(dǎo)入及映射、優(yōu)化；

3）完整方案易于開發(fā)，Rockchip基于RK3399Pro芯片提供一站式AI解決方案，包括硬件參考設(shè)計(jì)及軟件SDK，可大幅提高全球開發(fā)者的AI產(chǎn)品研發(fā)速度，并極大縮短產(chǎn)品上市時(shí)間。

從以上六款帶有AI功能的芯片來看，在架構(gòu)上基本都是采用了多核模式，以八核為主；另外，關(guān)于AI運(yùn)算，在原有CPU、GPU的基礎(chǔ)上增加獨(dú)立神經(jīng)元計(jì)算處理單元成為主流趨勢，這樣可以實(shí)現(xiàn)AI運(yùn)算加速，從而帶來更好的用戶體驗(yàn)；在應(yīng)用方面，還是以手機(jī)的人臉識別、圖像處理為主，未來隨著5G的商用，在自動駕駛汽車中的應(yīng)用也會逐漸增加。

從對比中可以看出，國產(chǎn)廠商和國內(nèi)廠商各占一半，從高端到低端均有覆蓋，在獨(dú)立神經(jīng)元計(jì)算單元的集成上，只有海思、蘋果、聯(lián)發(fā)科的產(chǎn)品上已經(jīng)實(shí)現(xiàn)，其它幾家廠商還在追趕。由于智能手機(jī)強(qiáng)烈的市場需求，因此AI普及起來更為順暢，但是目前需要在人臉識別和圖像處理的基礎(chǔ)上探索更多可能的應(yīng)用。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

驍龍855/麒麟980/蘋果A12/聯(lián)發(fā)科P60/瑞芯微RK3399，誰能領(lǐng)跑AI時(shí)代

日期： 2018-12-17

相關(guān)內(nèi)容