自研芯片，還能怎么玩？-AET-電子技術(shù)應(yīng)用

自研芯片，還能怎么玩？

日期： 2023-05-08

作者：李飛

來(lái)源：半導(dǎo)體行業(yè)觀察

關(guān)鍵詞： 微軟自研芯片人工智能 ChatGPT

微軟在最近的人工智能浪潮中可謂是占到了聚光燈下，從花重金完成OpenAI的交易，到把ChatGPT集成到Bing搜索引擎中，都站在了整個(gè)領(lǐng)域發(fā)展的前沿。而在幾天前，又有消息傳出微軟正在和AMD合作開(kāi)發(fā)自研的人工智能芯片。整個(gè)故事一波三折，我們?cè)谶@里把微軟自研人工智能芯片的大概脈絡(luò)梳理一下。

首先，大約在半個(gè)月前，有媒體報(bào)道微軟正在為了大語(yǔ)言模型（LLM，目前最前沿的人工智能技術(shù)，同時(shí)也是ChatGPT背后的模型技術(shù)）自研芯片，內(nèi)部代號(hào)是Athena。然后，在五月二號(hào)，在AMD發(fā)布2023年第一季度財(cái)報(bào)之后的分析師電話(huà)會(huì)議上，有分析師問(wèn)到AMD如何看待目前互聯(lián)網(wǎng)云計(jì)算公司自研芯片，是否有和相關(guān)公司合作研發(fā)半定制芯片的計(jì)劃，AMD CEO Lisa Su表示AMD目前在CPU、GPU、FPGA和DPU等領(lǐng)域擁有非常完整的IP庫(kù)，同時(shí)也有很強(qiáng)的半定制芯片團(tuán)隊(duì)，所以公司有計(jì)劃在該領(lǐng)域進(jìn)一步投入來(lái)為大客戶(hù)合作。兩天后，彭博社報(bào)道AMD正在和微軟合作人工智能芯片，一方面微軟在為AMD提供人工智能方面的研發(fā)支持，另一方面AMD正在為微軟開(kāi)發(fā)Athena芯片。在該報(bào)道發(fā)出之后，AMD的股價(jià)一度上漲6%。緊接著彭博社的報(bào)道，微軟發(fā)言人表示AMD是微軟重要的合作伙伴，但是目前微軟的Athena芯片并非由AMD開(kāi)發(fā)。但是，微軟并沒(méi)有否認(rèn)和AMD在人工智能方面合作的報(bào)道。

我們認(rèn)為，總結(jié)現(xiàn)有的報(bào)道，一方面AMD的半定制芯片領(lǐng)域?qū)?huì)是未來(lái)人工智能領(lǐng)域公司的重點(diǎn)投入方向之一，因?yàn)槿斯ぶ悄軕?yīng)用的大客戶(hù)（主要是互聯(lián)網(wǎng)科技巨頭）對(duì)于這個(gè)領(lǐng)域有非常大的興趣；另一方面微軟雖然Athena芯片未必是直接交由AMD開(kāi)發(fā)，但是微軟在人工智能硬件方面和AMD合作開(kāi)發(fā)的可能性很大。目前看來(lái)，最有可能的狀況是微軟正在和AMD合作開(kāi)發(fā)一整套用于加速人工智能大語(yǔ)言模型的硬件解決方案，該解決方案中包括了微軟自研的Athena芯片，同時(shí)也包括了AMD的CPU等芯片。在Athena芯片開(kāi)發(fā)過(guò)程中，很大可能微軟會(huì)考慮加入對(duì)于AMD芯片組相關(guān)的接口和優(yōu)化（甚至可能會(huì)用到一些AMD的IP），同時(shí)AMD在設(shè)計(jì)該合作的硬件解決方案中，有可能也會(huì)考慮加入一些由微軟定義的半定制成分（例如數(shù)據(jù)接口，存儲(chǔ)帶寬，對(duì)于微軟人工智能框架的優(yōu)化等）。

最后在芯片系統(tǒng)集成方面，如果微軟使用AMD已經(jīng)具有豐富經(jīng)驗(yàn)的高級(jí)封裝技術(shù)把Athena和AMD的芯片集成到一起也會(huì)是一個(gè)情理之中的結(jié)果，而在上層軟件整合方面，預(yù)計(jì)微軟和AMD會(huì)深度合作并且保證整個(gè)人工智能系統(tǒng)能高效地運(yùn)行在系統(tǒng)中。

看到這里的發(fā)展，不禁讓人感慨時(shí)過(guò)境遷：30年前，正是微軟和Intel深度合作的Wintel聯(lián)盟點(diǎn)燃了整個(gè)PC市場(chǎng)的高速發(fā)展，微軟和Intel都在該過(guò)程中獲得了高速增長(zhǎng)，而在那個(gè)時(shí)候AMD還是一個(gè)市場(chǎng)上可有可無(wú)的角色，甚至有說(shuō)法認(rèn)為Intel留著AMD主要是避免觸發(fā)反壟斷法被拆分；而到了今天，AMD的市值已經(jīng)超越了Intel，微軟則在最火熱的人工智能領(lǐng)域選擇了和AMD合作。另一方面，我們認(rèn)為微軟和AMD在硬件和芯片領(lǐng)域深度合作也掀開(kāi)了科技巨頭自研芯片的新篇章，即從強(qiáng)調(diào)自己造芯片到強(qiáng)調(diào)和傳統(tǒng)芯片公司合作——注意這里的合作并不只是代工或者設(shè)計(jì)服務(wù)方面的合作，而是在設(shè)計(jì)指標(biāo)、IP、軟硬件接口等領(lǐng)域的深度合作。

互聯(lián)網(wǎng)科技公司自研芯片的歷史

我們不妨回顧一下互聯(lián)網(wǎng)公司造芯的歷史。互聯(lián)網(wǎng)公司自研芯片幾乎和2016年開(kāi)始的人工智能熱潮同步。人工智能的崛起對(duì)于互聯(lián)網(wǎng)的業(yè)務(wù)起了決定性的影響，在云端，人工智能技術(shù)大大提高了推薦系統(tǒng)和廣告系統(tǒng)等互聯(lián)網(wǎng)公司的核心業(yè)務(wù)，而在終端，人工智能也為諸多重要的計(jì)算機(jī)視覺(jué)和語(yǔ)音技術(shù)賦能。為了人工智能相關(guān)業(yè)務(wù)而自研芯片的公司幾乎囊括了所有的科技巨頭，包括谷歌、微軟、亞馬遜、阿里巴巴、字節(jié)跳動(dòng)、百度等等。從自研芯片的出發(fā)點(diǎn)來(lái)看，過(guò)去互聯(lián)網(wǎng)科技公司自研芯片主要出于兩方面的考慮，即成本和功能。

從成本角度來(lái)看，由于人工智能計(jì)算需要非常大的算力，因此成本也很高。供應(yīng)鏈角度來(lái)看，Nvidia是最主流的云端人工智能芯片供應(yīng)商，而其GPU的售價(jià)一方面很高，另一方面對(duì)于科技巨頭來(lái)說(shuō)過(guò)分依賴(lài)單一供應(yīng)商也存在供應(yīng)鏈風(fēng)險(xiǎn)成本（尤其是對(duì)于中國(guó)互聯(lián)網(wǎng)巨頭來(lái)說(shuō)，依賴(lài)Nvidia的風(fēng)險(xiǎn)更是由于受到地緣政治的影響存在很高的不確定性）。而另一個(gè)角度是GPU的能效比在運(yùn)行人工智能應(yīng)用時(shí)并不完美，事實(shí)上在云端數(shù)據(jù)中心應(yīng)用中，有很大一部電費(fèi)成本是在為人工智能應(yīng)用在買(mǎi)單。因此，互聯(lián)網(wǎng)科技巨頭在云端人工智能芯片領(lǐng)域自研的主要目的是一方面減少對(duì)于Nvidia的依賴(lài)，另一方面是希望能實(shí)現(xiàn)比Nvidia更好的能效比，這樣在大規(guī)模部署的時(shí)候，從綜合成本的角度來(lái)看可以比直接購(gòu)買(mǎi)Nvidia的GPU成本更低。在這方面，谷歌的TPU是一個(gè)著名的例子，在迭代了幾代之后，我們看到目前谷歌TPU的性能和Nvidia的GPU通常相類(lèi)似，但是在能效比等影響成本的角度，可以實(shí)現(xiàn)比Nvidia更好。

另一個(gè)互聯(lián)網(wǎng)科技公司自研芯片的主要目的是為了實(shí)現(xiàn)更強(qiáng)的功能，即目前市面上并不存在能滿(mǎn)足公司需求的芯片，因此需要能自研芯片來(lái)滿(mǎn)足設(shè)計(jì)需求，同時(shí)相較于使用第三方通用芯片的其他公司創(chuàng)造了更高的產(chǎn)品競(jìng)爭(zhēng)力。這里的典型例子就是微軟在HoloLens中使用的自研HPU芯片來(lái)加速人工智能機(jī)器視覺(jué)相關(guān)的應(yīng)用，從而為HoloLens的核心功能模塊（例如室內(nèi)SLAM定位等）提供足夠的算力同時(shí)不會(huì)消耗太多電池。而谷歌用在Pixel手機(jī)上的Tensor處理器也是另一個(gè)相關(guān)的例子。

互聯(lián)網(wǎng)公司之前的自研芯片往往強(qiáng)調(diào)“自主”這個(gè)方向。自主意味著自研芯片的最關(guān)鍵模塊（IP）以及系統(tǒng)架構(gòu)是由互聯(lián)網(wǎng)公司自己設(shè)計(jì)。在實(shí)際操作層面，由于互聯(lián)網(wǎng)科技巨頭畢竟在芯片行業(yè)積累不多，因此通常會(huì)構(gòu)建一支數(shù)百人的團(tuán)隊(duì)，該團(tuán)隊(duì)主要負(fù)責(zé)芯片架構(gòu)定義和核心IP的設(shè)計(jì)驗(yàn)證；而另一方面，通用IP（例如DDR等）通常使用購(gòu)買(mǎi)的方式，同時(shí)在后端設(shè)計(jì)等可以可以外包的職責(zé)則交由外部設(shè)計(jì)服務(wù)公司完成。總而言之，互聯(lián)網(wǎng)公司造芯的通常模式是由自己的核心團(tuán)隊(duì)完成芯片架構(gòu)定義和核心模塊設(shè)計(jì)，然后和中立的第三方IP公司和設(shè)計(jì)服務(wù)公司合作以購(gòu)買(mǎi)其他的通用IP并完成整個(gè)芯片設(shè)計(jì)流程。

微軟掀開(kāi)互聯(lián)網(wǎng)造芯新篇章

微軟和AMD的合作是科技巨頭造芯的一個(gè)新里程碑：這次微軟并不是只和中立的第三方設(shè)計(jì)服務(wù)公司合作，而且同時(shí)和一個(gè)傳統(tǒng)芯片大廠合作來(lái)設(shè)計(jì)支持下一代人工智能技術(shù)的芯片和硬件系統(tǒng)。換句話(huà)說(shuō)，科技巨頭自研芯片從強(qiáng)調(diào)“自主”慢慢走到了今天開(kāi)始走向“合作”。

如果我們想要探究這個(gè)轉(zhuǎn)變的原因，我們認(rèn)為目前至少有兩個(gè)因素在驅(qū)動(dòng)這個(gè)轉(zhuǎn)變。第一個(gè)因素就是未來(lái)人工智能對(duì)于算力的需求在指數(shù)級(jí)上升，其對(duì)于芯片系統(tǒng)復(fù)雜度的要求也是和之前不可同日而語(yǔ)。

舉例來(lái)說(shuō)，2016年的時(shí)候最熱門(mén)的人工智能應(yīng)用是機(jī)器視覺(jué)（物體識(shí)別和分類(lèi)任務(wù)），主流模型參數(shù)量通常在10M-100M之間，算力需求在1-10 GFLOPs左右；而目前流行的大語(yǔ)言模型（例如ChatGPT以及其下一代GPT-4）的模型參數(shù)量在1T數(shù)量級(jí)，算力需求在1-10PTOPS左右，可以說(shuō)無(wú)論是參數(shù)量還是算力需求都比原來(lái)大了1000倍以上。在這種情況下，人工智能芯片設(shè)計(jì)已經(jīng)和2017年時(shí)候谷歌主要為了機(jī)器視覺(jué)類(lèi)人工智能任務(wù)設(shè)計(jì)的TPU完全不同——在2017年，谷歌TPU可以圍繞其基于脈動(dòng)陣列的卷積加速I(mǎi)P以及較大的片上SRAM就能完成大量的人工智能任務(wù)加速，其TPU可以說(shuō)和系統(tǒng)里的其他芯片相對(duì)而言更獨(dú)立，可以只要把那個(gè)脈動(dòng)陣列IP和片上存儲(chǔ)做好了性能就能達(dá)標(biāo)；而在2023年，由于模型的參數(shù)量和算力需求都已經(jīng)高了幾個(gè)數(shù)量級(jí)，因此在設(shè)計(jì)人工智能加速芯片時(shí)必須仔細(xì)考慮硬件系統(tǒng)里的其他芯片，包括存儲(chǔ)訪(fǎng)問(wèn)、高速數(shù)據(jù)互聯(lián)、數(shù)據(jù)和計(jì)算在CPU和人工智能芯片之間的分割和移動(dòng)等等，可以說(shuō)是一個(gè)非常復(fù)雜的系統(tǒng)，而且這個(gè)復(fù)雜系統(tǒng)里必須把每一個(gè)芯片的性能都做到合理才能保證整體系統(tǒng)的效率，否則系統(tǒng)里面的任何一塊芯片都可能成為整體效率的瓶頸——換句話(huà)說(shuō)如果只是優(yōu)化人工智能加速芯片而沒(méi)有其他芯片的搭配優(yōu)化，那么很有可能整體性能并不會(huì)很高。

顯然，科技巨頭不可能去自研系統(tǒng)里的所有這些芯片，而必須和傳統(tǒng)芯片大廠深度合作才能完成一個(gè)整體都很優(yōu)化的系統(tǒng)，尤其是AMD在整體系統(tǒng)整合（高級(jí)封裝技術(shù)和數(shù)據(jù)互聯(lián)技術(shù)）都有非常深厚的積累，而微軟則在軟件層面有更多的能力，兩者深度合作可謂是優(yōu)勢(shì)互補(bǔ)。

除了系統(tǒng)復(fù)雜度之外，另外一個(gè)驅(qū)動(dòng)因素是目前的經(jīng)濟(jì)形勢(shì)。對(duì)于科技巨頭來(lái)說(shuō)，雖然人工智能保持火熱，但是全球的整體宏觀經(jīng)濟(jì)形勢(shì)并不樂(lè)觀，因此科技巨頭都傾向于降低非核心業(yè)務(wù)擴(kuò)張和投入的程度。對(duì)于芯片業(yè)務(wù)來(lái)說(shuō)，科技巨頭都更傾向于把投入放在刀刃上，即和人工智能核心加速相關(guān)的IP上，而在其他非核心IP和系統(tǒng)里面的其他芯片來(lái)說(shuō)，科技巨頭會(huì)轉(zhuǎn)而交由合作伙伴去完成，而不是像幾年前一樣傾向于自己擴(kuò)張團(tuán)隊(duì)來(lái)做盡可能多的事情。

從未來(lái)來(lái)看，科技巨頭造芯的格局將會(huì)在某種程度上延續(xù)目前的格局，但是我們預(yù)計(jì)也會(huì)看到更多的和傳統(tǒng)芯片大廠的深度合作。如前所述，在下一代人工智能這樣的應(yīng)用中，我們可望會(huì)看到越來(lái)越多微軟和AMD這樣的合作來(lái)共同挑戰(zhàn)這樣的復(fù)雜系統(tǒng)；另一方面，由于經(jīng)濟(jì)形勢(shì)的影響，我們預(yù)計(jì)會(huì)看到互聯(lián)網(wǎng)科技巨頭造芯的時(shí)候越來(lái)越多地移向上游，即定義芯片架構(gòu)，以及交付核心IP，而這些IP在SoC里面的整合可以交由合作伙伴完成，甚至我們可能會(huì)看到更多特制版SoC，例如在公版SoC的設(shè)計(jì)基礎(chǔ)上集成了互聯(lián)網(wǎng)科技巨頭提供的核心IP這樣的方式，從而最大程度降低設(shè)計(jì)成本開(kāi)銷(xiāo)。從這個(gè)角度來(lái)看，互聯(lián)網(wǎng)科技巨頭需要的不僅僅是一個(gè)設(shè)計(jì)服務(wù)伙伴，而更需要該芯片合作公司已經(jīng)有相關(guān)的SoC設(shè)計(jì)和量產(chǎn)經(jīng)驗(yàn)。從這個(gè)角度來(lái)看，AMD、三星、MTK等都會(huì)是這類(lèi)業(yè)務(wù)的受益者，因?yàn)樗麄冇泻軓?qiáng)的設(shè)計(jì)服務(wù)/半定制芯片部門(mén)，同時(shí)也有尖端SoC設(shè)計(jì)量產(chǎn)的經(jīng)驗(yàn)。同時(shí)，從技術(shù)角度來(lái)看，高級(jí)封裝和芯片粒技術(shù)可望將在這類(lèi)芯片合作中起到核心賦能作用，因?yàn)槿绻苁褂眯酒＃敲淳涂梢园芽萍季揞^的核心IP做到芯片粒中去和其他SoC集成，而無(wú)需在專(zhuān)門(mén)設(shè)計(jì)一個(gè)專(zhuān)用的SoC光罩掩膜，這樣就可以大大降低設(shè)計(jì)成本，另一方面也大大增加設(shè)計(jì)的靈活性——這可能也是微軟和在芯片粒高級(jí)封裝領(lǐng)域有豐富經(jīng)驗(yàn)的AMD合作的另一個(gè)理由。

更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<

微信圖片_20210517164139.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà)：010-82306118；郵箱：[email protected]。

自研芯片，還能怎么玩？

日期： 2023-05-08

作者： 李飛

來(lái)源：半導(dǎo)體行業(yè)觀察

相關(guān)內(nèi)容

作者：李飛