新SoC的發(fā)布節(jié)點(diǎn),,直接左右旗艦手機(jī)的發(fā)布周期,。剛在12月發(fā)布的驍龍888,不但打破了歷史規(guī)律,,還帶著CPU,、GPU和AI性能的顯著提升,和小米11一起拉開(kāi)了小米新十年的序幕,。
小米11首批35萬(wàn)臺(tái)之后,,已多次連續(xù)放量,不少人已經(jīng)體驗(yàn)到2021年的新旗艦,?!币蝗藘?nèi)測(cè),全民公測(cè)“的酷安上,,小米11的關(guān)鍵詞已霸榜許久,。
驍龍888注定會(huì)是2021年旗艦手機(jī)的標(biāo)配,在它的身上可以觀測(cè)到高通對(duì)未來(lái)的構(gòu)想,,也能預(yù)測(cè)未來(lái)一年移動(dòng)端的趨勢(shì),。
1
暴漲的GPU和單核性能
高通今年從臺(tái)積電7nm N7P工藝切換到三星5nm LPE工藝。對(duì)比三星上一代的7LPP,,三星承諾同性能下的功耗降低20%,,同功耗下性能提高10%,面積減少20%,。
構(gòu)架方面,,驍龍888更新到Kryo 680,超大核是2.84GHz Cortex-X1構(gòu)架,,配備了1MB的L2緩存,;大核是3個(gè)2.24GHz類A78核心,每核L2緩存翻倍到512KB,;而小核仍然是4顆1.8GHz的類A55構(gòu)架,。
Cortex-X1是安卓陣營(yíng)迎來(lái)的第一個(gè)公版超大核:6條整數(shù)流水線,,5解碼8發(fā)射的前端,有真,?PC級(jí)的四條帶FMA的NEON,,是移動(dòng)端浮點(diǎn)堆料的極致。相應(yīng)的,,X1的芯片面積是A78的2.3倍,,峰值性能是A77的1.3倍,機(jī)器學(xué)習(xí)性能提升2倍,。
和X1同代的御用搭檔A78,,IPC比A77提升7%,主要負(fù)責(zé)”提升能效比,、節(jié)省芯片面積“,,以達(dá)到更好的面積和功耗均衡。CPU集群維持4MB的L3緩存,,高通官方解釋,,這是難度和緩存配置之間的平衡。此外,,驍龍888支持最高支持4*16bit 3200MHz的滿血LPDDR5內(nèi)存,。
我們通過(guò)對(duì)比小米11(驍龍888)和小米10 Ultra(驍龍865),可以看到驍龍888在GeekBench和RAR的單核測(cè)試上,,給出了安卓陣營(yíng)多年沒(méi)出現(xiàn)過(guò)的25%單核性能提升,。高通更在乎持續(xù)輸出,所以在頻率設(shè)定上相對(duì)保守,,多核提升在11%-18%之間,。
在安卓陣營(yíng),單核性能一直沒(méi)有得到應(yīng)有的重視,。但實(shí)際上,,在當(dāng)今的情況下,提升單核性能的效果和”性價(jià)比“都明顯更高,,會(huì)更加影響應(yīng)用加載,、切換、超大型游戲的體驗(yàn),。
對(duì)比需要深度優(yōu)化的多核性能,,單核性能的影響簡(jiǎn)單直接。在應(yīng)對(duì)很多(其實(shí)是大部分)多線程優(yōu)化不佳的日常APP和游戲時(shí),,單核性能的提升效果遠(yuǎn)高于多核性能,。游戲中大量的游戲畫面元素、移動(dòng)、NPC動(dòng)作等,,都需要CPU運(yùn)算后再交給GPU,。而《原神》等跨平臺(tái)的大型游戲的出現(xiàn),讓移動(dòng)端的CPU壓力空前絕后,。
強(qiáng)大的單核性能,,除了降低開(kāi)發(fā)人員的壓力,還無(wú)需額外優(yōu)化就能直接提升大部分應(yīng)用的基礎(chǔ)使用體驗(yàn),。但在功耗敏感的移動(dòng)端,,無(wú)法像PC端那樣提升頻率,所以超大核的出現(xiàn)是必然的,。
反映到這一代旗艦手機(jī)的基礎(chǔ)體驗(yàn),,驍龍888單核25%的提升,即便是出廠MIUI 12.0系統(tǒng),,依然讓小米11的系統(tǒng)操作出奇地流暢,。監(jiān)控頻率可以看到發(fā)現(xiàn),驍龍888的X1調(diào)度比較積極,。
小米11在微博,、貼吧,、淘寶這些傳統(tǒng)”巨型“APP的流暢度都上了一個(gè)臺(tái)階,。應(yīng)用開(kāi)啟、應(yīng)用多開(kāi),、切換等多種場(chǎng)景的感知,,都出乎預(yù)料地明顯。這時(shí)候再回來(lái)看,,2.3倍的芯片面積,,仿佛又顯得有”性價(jià)比“了。
GPU方面,,高通Adreno系列在安卓陣營(yíng)獨(dú)孤求敗了很多年,,在驍龍888上又帶來(lái)了高通GPU史上最大的性能提升。840MHz的Adreno 660,,性能提升35%,,能效比提升20%,且性能和能效比的提升能同時(shí)實(shí)現(xiàn),。
同樣使用小米11(驍龍888)和小米10 Ultra(驍龍865)對(duì)比參考,,低壓力場(chǎng)景的提升在27%到35%左右,提升最大的是3D Mark的Wild Life大壓力測(cè)試,,幅度達(dá)到53%,,Vulkan模式下的GFXBench Aztec場(chǎng)景也有43%的提升。
而驍龍865的Adreno 650,就算超頻到905MHz,,GFX曼哈頓場(chǎng)景也”只有“110fps(默頻驍龍865是90fps),。但驍龍888的Adreno 660,在840MHz就已經(jīng)有118fps,,部分用戶都跑到125fps以上了,。驍龍888 GPU的同頻性能,依然比超頻到905MHz Adreno 650高15%以上,。
性能之外,,驍龍888還有隱藏技能。Adreno 660是首個(gè)在移動(dòng)端引入可變速率陰影(VRS)技術(shù)的GPU,。VRS是桌面平臺(tái)剛上的新增特性,,能在VR/XR等場(chǎng)景中,降低非注視區(qū)域的著色精度,,大大降低GPU的壓力,。在VR/AR還在構(gòu)建發(fā)展的階段,看到高通積極地提供相關(guān)特性,,無(wú)論是游戲廠商還是用戶,,大家都是非常歡迎的。
2
第六代AI引擎:60%的算力提升
和其他芯片廠商不同,,在CPU,、GPU和調(diào)制解調(diào)器之外,高通每年都會(huì)”花很多筆墨“聊Hexagon DSP,。而高通的AI構(gòu)架,,也是各個(gè)廠商中最特殊的。從AI部分的提升,,能看到高通在方向和策略上的考量,,以及未來(lái)一年移動(dòng)AI的發(fā)展趨勢(shì)。
遙想2017年,,主流旗艦只有0.6TFOPS的AI算力,,獨(dú)立的NPU也才2TFOPS不到。但后來(lái)從驍龍855的7TOPS,,到驍龍865的15TOPS,,再到驍龍888的26FTOPS,移動(dòng)端對(duì)AI算力的渴求依然見(jiàn)不到盡頭,。
和常見(jiàn)的獨(dú)立NPU不同,,高通是CPU+GPU+DSP等多部件的異構(gòu)AI,宣稱可以比獨(dú)立的DSP+機(jī)器學(xué)習(xí)推理引擎方案,,提供更高的性能和靈活性,。而當(dāng)中的Hexagon 780,其實(shí)是驍龍888上提升最大的部分。
以前Hexagon 600系列中的標(biāo)量,,張量(Hexagon Tensor Accelerator,,HTA)和向量(Hexagon Vector eXtensions,HVX)功能,,在Hexagon 780被融合在一起,,成為一個(gè)整體式IP。
融合后,,不同執(zhí)行引擎間的工作負(fù)載切換時(shí)間也更短,,性能和能效都提升巨大,標(biāo)量執(zhí)行能力提高了50%,,張量執(zhí)行吞吐量直接翻倍翻,。SRAM增加16倍后,狂漲的內(nèi)存池,,能運(yùn)行更大的機(jī)器學(xué)習(xí)推理模型,。
幾乎推倒重構(gòu)的構(gòu)架,配合X1超大核2倍的機(jī)器學(xué)習(xí)性能和暴漲的浮點(diǎn)性能,、AI性能提升43%的Adreno 660,,每瓦性能提升3倍的Hexagon 780,讓驍龍888可以提供遠(yuǎn)高于前代的26 TOPS算力,。
驍龍888官方測(cè)試成績(jī)
在機(jī)器學(xué)習(xí)基準(zhǔn)測(cè)試MLPerf中,,驍龍888的性能最高提升4倍,遠(yuǎn)超IP塊在執(zhí)行單元的理論計(jì)算吞吐量改進(jìn)(新內(nèi)存體系的優(yōu)勢(shì),?)
夸張的AI性能,,有什么用呢,?高通技術(shù)公司產(chǎn)品管理副總裁Ziad Asghar提到,,AI性能大幅提升的主要來(lái)自客戶的需求。現(xiàn)在移動(dòng)AI一大部分應(yīng)用場(chǎng)景都是圖像處理,,是近年來(lái)手機(jī)拍照水平突飛猛進(jìn)的重要原因之一,。
雖然被吹得很玄學(xué),但移動(dòng)AI可籠統(tǒng)理解為”為各種AI算法設(shè)計(jì)的硬件加速器“,。而這些AI算法,,早就應(yīng)用到拍照(成像處理、拍照輔助,、圖像識(shí)別等),、語(yǔ)音通話降噪、語(yǔ)音識(shí)別,、翻譯,、人臉解鎖、手寫識(shí)別、游戲和XR體驗(yàn)支持等大量領(lǐng)域,。
高通的異構(gòu)AI設(shè)定,,是高通移動(dòng)平臺(tái)”關(guān)注均衡和功耗的設(shè)計(jì)思路“的產(chǎn)物。在驍龍865首次集成的傳感器中樞,,也已經(jīng)升級(jí)到第二代,,并集成性能提升5倍,但功耗不到1毫安的專用低功耗AI處理器,。后者可以提供低功耗的全天候AI待命能力,,并分擔(dān)Hexagon 780 80%的工作負(fù)載。
其在”O(jiān)k,,Google“偵測(cè)算法上,,可以降低38%的負(fù)載,并為陀螺儀,、麥克風(fēng)等需要全天候?qū)崟r(shí)收集數(shù)據(jù)的傳感器,,提供更多的可能性(已被用在汽笛聲、嬰兒哭聲的低功耗監(jiān)測(cè)等場(chǎng)景上),。
3
計(jì)算攝影:AI+拍照
AI是”計(jì)算攝影“的基礎(chǔ),,小米11發(fā)布會(huì)重點(diǎn)說(shuō)的夜景視頻拍攝和眾多拍照提升,背后是驍龍888全新的三ISP和Hexagon 780,。
在小米11上,,除了驍龍865時(shí)代就有的AI換天功能,現(xiàn)在夜景模式也能用來(lái)拍攝視頻,,大幅提升夜景視頻的畫面亮度和降噪表現(xiàn),。夜景視頻可理解為每秒拍攝超過(guò)24張超級(jí)夜景照片,是ISP和AI算力暴力提升的直接效果,。
在拍照過(guò)程中,,AI也負(fù)責(zé)提供非常基礎(chǔ)的HDR+硬件加速能力,,能進(jìn)行畫面降噪,、重新著色、自動(dòng)校色(讓色彩表現(xiàn)更加真實(shí)或更加吸引眼球)等操作,。像把單攝玩出花的Google,,就已經(jīng)依靠AI,提供了背景虛化,、全景,、Motion動(dòng)圖(類似iOS平臺(tái)的Live Photo)、AR實(shí)時(shí)追蹤貼圖,、超分辨率放大,、超級(jí)夜景等多種功能,。
驍龍888融合AI 3A算法的快速對(duì)焦
虹軟”傻瓜相機(jī)“
除了效果提升,也有很多是關(guān)于拍照易用性和趣味性的提升,。例如驍龍888融合AI的3A算法,,能提高對(duì)焦速度。虹軟基于Spectra 580和第六代高通AI引擎推出”傻瓜相機(jī)“功能,,可以自動(dòng)跟蹤人物,,自動(dòng)進(jìn)行畫面縮放變焦等。
4K 30FPS的實(shí)時(shí)背景摳圖
在高通AI Engine的支持下,,驍龍888可以做到4K 30FPS的實(shí)時(shí)背景摳圖,,CV-ISP硬件計(jì)算視覺(jué)加速器也能提供60fps實(shí)時(shí)景深識(shí)別的人像、背景分割和替換,,人體追蹤,、物體識(shí)別/追蹤的效果。
一億像素樣張,,細(xì)節(jié)放大對(duì)比
夜景樣張,,細(xì)節(jié)放大對(duì)比
而相同CMOS、同樣是MIUI的小米11和小米10 Pro,,是非常適合用來(lái)對(duì)比ISP和AI對(duì)拍照影響的樣本,。得益于驍龍888的ISP和AI性能,小米11,,不論取景框預(yù)覽畫面,、1億像素模式、HDR,、夜景等多幀合成場(chǎng)景,,畫面的高光壓制、鬼影,、偽像,、顏色還原等部分,都有明顯提升,。
4
總結(jié):安卓陣營(yíng)大跨越的一年
這是小米多年來(lái),,首次在1年內(nèi)發(fā)布兩臺(tái)數(shù)字系列旗艦,驍龍888機(jī)型的量產(chǎn)時(shí)間遠(yuǎn)比以前早,,為下一代產(chǎn)品留下了充足的準(zhǔn)備時(shí)間,不禁讓人猜想,,高通是不是在憋著什么大招,。
高通做的是SoC移動(dòng)平臺(tái),在他們眼中,,除了絕對(duì)性能,,均衡也是核心指標(biāo),。驍龍888在CPU單核性能和GPU性能上的提升,直接抬升了安卓旗艦日常操作的流暢度,,以及應(yīng)對(duì)跨平臺(tái)大型游戲的能力,。而AI和DSP的倍數(shù)級(jí)提升、傳感器中樞上的低功耗AI處理器,,則成了高通新的護(hù)城河,。