越是智能化發(fā)展,,越需要調(diào)用大量數(shù)據(jù),,對(duì)算力的需求也就越大,于是,,算力提升成為云,、邊、端的共同趨勢,。一些觀點(diǎn)認(rèn)為,,在云計(jì)算占據(jù)計(jì)算主導(dǎo)地位的當(dāng)下,邊緣計(jì)算會(huì)是云計(jì)算的延伸和補(bǔ)充,。但事實(shí)上,,無論是延伸還是補(bǔ)充,都不足以反映邊緣計(jì)算的巨大潛力,。
在傳統(tǒng)產(chǎn)業(yè)如火如荼進(jìn)行數(shù)字化轉(zhuǎn)型的背后,,除了5G、IoT之外,,邊緣計(jì)算是一股不容忽視的重要力量,。在規(guī)模和增速方面,CB Insights估算,,到2023 年全球邊緣計(jì)算行業(yè),,整體市場容量有望達(dá)到340億美元。Technavio估計(jì),,從2018年到2022年,,邊緣計(jì)算技術(shù)的應(yīng)用量將以每年近20%的速度增長。Grand View Research更是預(yù)測,,2016-2025年期間,,亞太區(qū)邊緣計(jì)算市場的復(fù)合增長率將高達(dá)46.7%。
不過,,在邊緣計(jì)算受到越來越多關(guān)注的同時(shí),,我們看到,,終端設(shè)備的算力也在不斷提升,甚至一些可媲美邊緣設(shè)備,。端,、邊的界限一定程度上是否在變模糊?邊緣計(jì)算的核心能力該如何評(píng)定,?對(duì)算力經(jīng)濟(jì)“虎視眈眈”的國產(chǎn)AI芯片er們,,對(duì)這一巨大的新興領(lǐng)域,是否準(zhǔn)備好了,?
邊緣計(jì)算的“邊界”在哪里,?
時(shí)擎科技總裁于欣認(rèn)為,云,、邊,、端更多是從應(yīng)用場景來劃分的,而不僅僅是依據(jù)性能,。從這個(gè)意義來說,,云、邊,、端的場景還是比較明確的,。當(dāng)然,從任務(wù)處理的角度,,確實(shí)有把更多的推理任務(wù)下放到邊緣和終端的趨勢,,也將有更多的云邊端融合協(xié)同的場景。不過,,對(duì)于端,、邊的設(shè)備來說,會(huì)有更多的成本和功耗限制,,提高“算力的效率”是更為關(guān)鍵的指標(biāo),,包括單位算力的成本和實(shí)際可達(dá)的應(yīng)用效果。
靈汐科技副總經(jīng)理華寶洪表示,,終端側(cè)與邊緣側(cè)從誕生伊始,就各自承擔(dān)著不同的使命,。終端作為與用戶直接交互的設(shè)備,,以感知作為首要功能,低功耗,、低延時(shí)是基本要求,,也相應(yīng)地會(huì)在計(jì)算能力上進(jìn)行權(quán)衡。一般來說,,端側(cè)設(shè)備的計(jì)算能力弱于邊緣側(cè)的算力水平,。他強(qiáng)調(diào),,“對(duì)于終端廠商宣稱的算力,需要明確究竟是理論算力還是有效算力,。只有終端與邊緣側(cè)的有效算力相媲美時(shí),,才是真正達(dá)到邊緣設(shè)備的算力級(jí)別?!?/p>
上海雪湖科技有限公司副總裁趙小吾從應(yīng)用場景和未來趨勢方面給出了他的見解,。“云邊端的定義,,本身就是因?yàn)槭苤朴谛酒懔屯ㄓ崅鬏斈芰Φ木窒蕻a(chǎn)生的邊界,。一定程度上,邊,、端的界限確實(shí)變模糊,,但是針對(duì)不同應(yīng)用場景對(duì)性能的要求,邊界的定義可能不太一樣,。對(duì)算力要求不高的場景,,終端設(shè)備的性能是足夠的,可能就不需要專門的邊緣計(jì)算設(shè)備,;對(duì)算力要求高的場景,,比如車路協(xié)同、智慧交通等,,終端傳感器設(shè)備是無法滿足需求的,,就需要用邊緣計(jì)算設(shè)備來處理攝像頭、激光雷達(dá)和毫米波雷達(dá)的數(shù)據(jù),,來實(shí)現(xiàn)全息感知的功能”,,他表示,“隨著芯片和通訊傳輸技術(shù)的迭代,,相信這樣的邊界會(huì)時(shí)而模糊時(shí)而清晰,。”
“核心指標(biāo)”是什么,?
“算力”是一個(gè)廣義的詞匯,,該如何對(duì)算力設(shè)備進(jìn)行評(píng)估?比較重要的有兩個(gè):理論峰值算力和真實(shí)有效算力,。理論算力是指通過公式推導(dǎo)出的理論上的算力,;而有效算力是指設(shè)備在實(shí)際運(yùn)作過程中能真實(shí)輸出的算力,是設(shè)備實(shí)際算力效能的體現(xiàn),。靈汐科技華寶洪還給出了以下六大評(píng)估指標(biāo):
計(jì)算芯片的峰值算力
理論計(jì)算得出的,、理想狀況下的峰值算力。具體通過計(jì)算核的主頻、核數(shù)量,、單核運(yùn)算能力等來輸出理論峰值,,與實(shí)際場景中的真實(shí)有效處理能力有很大差距。
計(jì)算芯片的有效算力
設(shè)備在實(shí)際運(yùn)作過程中能真實(shí)輸出的算力,。比如ResNet50在浮點(diǎn)16位精度下,,推理一次的計(jì)算量是7.8Gflops左右,芯片每秒鐘處理的ResNet50的幀率乘以7.8G就是真實(shí)有效的輸出算力,。如果推理幀率是400fps,,真實(shí)算力是400*7.G=3Tflops。
計(jì)算芯片的有效利用率
代表了芯片真實(shí)輸出的運(yùn)算能力,。其計(jì)算方式為:真實(shí)有效的輸出算力/理論算力,。計(jì)算結(jié)果值越高,表明該芯片工作越高效,。實(shí)際應(yīng)用場景中,,多數(shù)傳統(tǒng)架構(gòu)計(jì)算芯片,有效利用率一般在30%左右,,而新型架構(gòu)的計(jì)算芯片,,芯片有效利用率可以到50%以上。領(lǐng)啟KA200異構(gòu)眾核,、存算一體芯片有效利用率可達(dá)60%以上,。
計(jì)算芯片對(duì)主流神經(jīng)網(wǎng)絡(luò)的支持程度
下一代人工智能有兩個(gè)不同的發(fā)展線路圖,一個(gè)是以深度學(xué)習(xí)算法為代表的傳統(tǒng)計(jì)算科學(xué),,一個(gè)是以生物神經(jīng)網(wǎng)絡(luò)為代表腦科學(xué),。多數(shù)計(jì)算芯片只能支持二者之一。是否能將二者兼并支持,,也是衡量計(jì)算芯片的核心指標(biāo)之一,,異構(gòu)融合是達(dá)到這一指標(biāo)的重要途徑之一。
芯片能效比
計(jì)算方式為:典型網(wǎng)絡(luò)(如ResNet50)的推理能力/芯片的功耗,,單位:推理幀率(fps/w),。
芯片的性價(jià)比
每平方毫米推理的幀率數(shù),計(jì)算方式為:典型網(wǎng)絡(luò)(如ResNet50)的推理能力/芯片的面積,。
異構(gòu)“精髓”——有的放矢
在邊緣計(jì)算領(lǐng)域,,多樣的應(yīng)用催生了多種多樣的計(jì)算需求,往往需要權(quán)衡算力,、功耗,、體積等問題,出于資源的優(yōu)化考慮,,異構(gòu)計(jì)算逐漸成為業(yè)界共識(shí),。在算力需求猛增的第一階段,以CPU,、GPU為代表的芯片率先迎來強(qiáng)勁增長,。這些由先進(jìn)半導(dǎo)體技術(shù)打造的算力設(shè)備往往具備極強(qiáng)的性能表現(xiàn)以及良好的兼容性,占據(jù)了異構(gòu)計(jì)算領(lǐng)域的主流地位,。
時(shí)擎于欣表示,,所謂異構(gòu)計(jì)算,實(shí)際上是希望有不同的處理器形態(tài)來針對(duì)不同的算法進(jìn)行更高效的處理,。相對(duì)于通用算力來說,,“異構(gòu)”的目的應(yīng)該是相對(duì)于某種或某類特定應(yīng)用來定義的,因而需要更有針對(duì)性,,更有的放矢,。他強(qiáng)調(diào),“為了異構(gòu)而異構(gòu),,意義不大,。”
從指令集架構(gòu)角度來看,,業(yè)界已形成了各自的“勢力范圍”,。于欣認(rèn)為,從技術(shù)角度來說并沒有那么絕對(duì),,它們之間也會(huì)相互滲透,,比如Arm架構(gòu)也有服務(wù)器和PC應(yīng)用,RISC-V也會(huì)越來越多向高性能方向嘗試,。未來更多的還是老生常談的“生態(tài)”問題,,恰恰因?yàn)榧夹g(shù)角度沒有那么大的差異,生態(tài)就尤為重要,,不過,,先入為主之后的替代成本和門檻很高,這個(gè)過程會(huì)比較漫長,。
Imagination計(jì)算業(yè)務(wù)產(chǎn)品管理總監(jiān)Rob Fisher表示,,隨著對(duì)性能的需求日益增加,系統(tǒng)功耗等級(jí)需要不斷降低,,這是異構(gòu)架構(gòu)真正體現(xiàn)價(jià)值的地方,。
關(guān)于未來異構(gòu)計(jì)算的發(fā)展趨勢,他認(rèn)為,,最密集的計(jì)算部分將定位在一個(gè)加速器上,,該加速器能夠高效運(yùn)行,提供性能并管理功耗,。不過,,這只有在加速器能夠擴(kuò)展、滿足應(yīng)用的性能需求時(shí)才能發(fā)揮作用,也就是說,,可擴(kuò)展性是未來架構(gòu)的重點(diǎn),。除了在單一維度上進(jìn)行擴(kuò)展之外,復(fù)雜計(jì)算工作負(fù)載還必須在多個(gè)維度上實(shí)現(xiàn)可擴(kuò)展性,,從而改變計(jì)算資源組合以適應(yīng)需求,。
雪湖科技趙小吾也認(rèn)為,異構(gòu)計(jì)算平臺(tái)主流的發(fā)展方向,,一定是能夠更有效地獲取高性能計(jì)算能力架,、構(gòu)靈活性高、可擴(kuò)展性好,、計(jì)算資源利用率更高,。由于不同的計(jì)算架構(gòu)各有優(yōu)勢,場景也在變得更加多元和復(fù)雜,,要更深入地分析不同計(jì)算架構(gòu)和不同芯片的優(yōu)勢,,設(shè)計(jì)出適合特定應(yīng)用場景下的異構(gòu)計(jì)算方案。
靈汐科技華寶洪則強(qiáng)調(diào)了對(duì)新型計(jì)算架構(gòu)進(jìn)行探索的緊迫性,。傳統(tǒng)馮·諾依曼架構(gòu)當(dāng)前正面臨諸多瓶頸,,如存儲(chǔ)墻、芯片利用率低,,由于半導(dǎo)體工藝發(fā)展帶來的摩爾定律失效,,更是給算力芯片的發(fā)展蒙上陰影。
他認(rèn)為,,這就催生了新型顛覆性計(jì)算架構(gòu)的發(fā)展,,類腦計(jì)算和量子計(jì)算就是兩個(gè)典型代表,這兩個(gè)前沿戰(zhàn)略方向已經(jīng)列入國家十四五規(guī)劃和2035年遠(yuǎn)景規(guī)劃,。類腦計(jì)算將計(jì)算機(jī)的剛性和人腦的彈性結(jié)合起來,,在取得高算力的同時(shí),也保證了低功耗和低延時(shí)等,。
隨著新型架構(gòu)的不斷出現(xiàn),,未來的異構(gòu)計(jì)算必定會(huì)出現(xiàn)CPU、GPU和新型計(jì)算架構(gòu)融合的局面,,即傳統(tǒng)馮·諾依曼架構(gòu)和非馮·諾依曼架構(gòu)的融合,,而不僅是當(dāng)前的CPU和XPU之間的融合。
寫在最后
“邊緣計(jì)算”正在成為千行百業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型,、智能升級(jí)的重要底座,,它所承載的功能、以及對(duì)行業(yè)的賦能作用越來越關(guān)鍵,。AI芯片作為核心的算力提供方之一,,也必將在當(dāng)前的技術(shù)革新和未來的商業(yè)化實(shí)踐中,,取得長足的發(fā)展。
對(duì)于正處于百花齊放階段的國產(chǎn)AI芯片來說,,這是成長的沃土,。盡管傳統(tǒng)通用處理器已占據(jù)發(fā)展先機(jī),但是也存在著高功耗,、高價(jià)格、低能效等問題,。CPU一統(tǒng)天下的計(jì)算時(shí)代一去不復(fù)返,,計(jì)算多樣性所催生的“異構(gòu)、靈活,、可擴(kuò)展”的架構(gòu)是未來計(jì)算時(shí)代的主旋律,。正如幾位受訪人一致認(rèn)同的觀點(diǎn),“提升能效比是計(jì)算架構(gòu)發(fā)展的不懈追求”,。
精彩預(yù)告
本文主要從邊緣計(jì)算不斷發(fā)展的內(nèi)涵,、技術(shù)指標(biāo)、技術(shù)路線等方向進(jìn)行了討論,,在近期的系列文章中,,還將從國產(chǎn)AI芯片在邊緣計(jì)算領(lǐng)域的機(jī)遇和挑戰(zhàn)、邊緣計(jì)算的發(fā)展格局,、通用計(jì)算與專用計(jì)算的博弈等角度,,進(jìn)行深入剖析,敬請(qǐng)關(guān)注,!