《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > EDA與制造 > 業(yè)界動態(tài) > 深扒百度昆侖,,造芯靠什么?

深扒百度昆侖,,造芯靠什么,?

2021-03-18
來源:半導(dǎo)體行業(yè)觀察
關(guān)鍵詞: 百度昆侖 造芯

  3月15日,,據(jù)路透社報(bào)道,百度昆侖芯片業(yè)務(wù)完成獨(dú)立融資,,投后估值約130億元人民幣,,領(lǐng)投方為CPE,跟投方IDG,、君聯(lián)資本,、元禾璞華。據(jù)了解,,百度正在考慮將其人工智能芯片設(shè)計(jì)能力進(jìn)行商業(yè)化,,目的是將昆侖部門打造成一家獨(dú)立的公司。

  如今互聯(lián)網(wǎng)科技企業(yè)造芯已不是什么新鮮事,,尤其是AI領(lǐng)域已經(jīng)成為世界科技巨頭爭奪的制高點(diǎn),, IBM,微軟,,谷歌和亞馬遜正在微調(diào)其AI平臺,,以使客戶更輕松,更快捷地整合各種AI技術(shù),。

  可以說,,造芯熱幾乎與人工智能的爆發(fā)處于同一個階段,人工智能的這一輪爆發(fā)是深度學(xué)習(xí)算法的興起,,而深度學(xué)習(xí)的基礎(chǔ)就是需要更多的數(shù)據(jù)訓(xùn)練,、更高的算力支撐,。當(dāng)傳統(tǒng)芯片逐漸無法滿足互聯(lián)網(wǎng)爆發(fā)的算力需求時(shí),擁有先進(jìn)算法和強(qiáng)大計(jì)算能力的互聯(lián)網(wǎng)公司成為了芯片自研的推動者,,國內(nèi)外企業(yè)幾乎步調(diào)一致地各自開啟了這一篇章,。

  中國在進(jìn)入其市場方面的行動將在該行業(yè)的創(chuàng)新中發(fā)揮關(guān)鍵作用。根據(jù)一項(xiàng)研究,,中國現(xiàn)在占全球半導(dǎo)體消費(fèi)的60%,。根據(jù)《國際商業(yè)戰(zhàn)略》,2019年,,中國半導(dǎo)體行業(yè)銷售額為2122億美元,,北美為595億美元,世界其他地區(qū)為488億美元,,歐洲為418億美元,日本為387億美元,。

 2(1).png

  圖:2019年按地區(qū)劃分的全球半導(dǎo)體消費(fèi)(十億)

  目前,,國產(chǎn)AI芯片處于一個窗口,這個窗口有如下特征:1,、市場廣闊,,容納下許多巨頭玩家;2,、處于爆發(fā)期初期,,大規(guī)模應(yīng)用尚未到來;3,、應(yīng)用場景分散,、復(fù)雜度高,需要定制化,;4,、單獨(dú)芯片不夠,需要配套的解決方案支撐,。

  在這樣的大背景下,,對“AI第一股”百度而言,造芯能抓住其中的哪些機(jī)會,,競爭力又有多少,?

  問世2年多,昆侖幾何,?

  衡量一款芯片好不好,,成不成功,最直觀的就是看出貨量,。百度昆侖于2018年宣布,,2019年12月,,百度和三星宣布,百度首款基于云的產(chǎn)品昆侖第一代用于計(jì)算和邊緣計(jì)算的AI芯片已經(jīng)完成,。

  截至目前,,實(shí)現(xiàn)量產(chǎn)的百度昆侖1已在百度搜索引擎及云計(jì)算用戶部署2萬片。與國內(nèi)其他互聯(lián)網(wǎng)造芯玩家的產(chǎn)品相比,,百度昆侖1的出貨量可以說是不錯的,。

  從技術(shù)結(jié)合場景的經(jīng)驗(yàn)來看,新一批崛起的AI 芯片要針對不同的人工智能應(yīng)用類型和場景,,對于芯片的要求就不單單是要適合深度學(xué)習(xí),,需要兼顧計(jì)算能力、能耗和靈活性,。

 3(1).png

  云計(jì)算巨頭紛紛布局云計(jì)算+FPGA芯片,,首先因?yàn)镕PGA作為一種可編程芯片,非常適合部署于提供虛擬化服務(wù)的云計(jì)算平臺之中,。FPGA的靈活性,,可賦予云服務(wù)商根據(jù)市場需求調(diào)整FPGA加速服務(wù)供給的能力。

  運(yùn)算速度,、功耗等性能是衡量一款芯片的核心指標(biāo),。昆侖芯片定位為通用AI芯片,目標(biāo)是提供高性能,,低成本,,高度靈活的AI芯片。特別要指出的是,,昆侖芯片既能做訓(xùn)練也能做推理,,它可以滿足AI的高處理需求,用于云實(shí)例和邊緣實(shí)例,,包括數(shù)據(jù)中心,,公共云和自動駕駛汽車。據(jù)了解,,昆侖2將采用7nm工藝打造,,將于2021年實(shí)現(xiàn)量產(chǎn),其性能對1代,,將再提升3倍,。

  一份經(jīng)紀(jì)報(bào)告顯示:“這種大型的,基于云的,,具有高計(jì)算能力的AI芯片具有很高的技術(shù)門檻,。只有百度,華為和寒武紀(jì)才能生產(chǎn)這些產(chǎn)品,?!?/p>

  在昆侖芯片誕生前,,2017年百度內(nèi)部數(shù)據(jù)中心、自動駕駛系統(tǒng)等就已大規(guī)模使用部署了超過10000片F(xiàn)PGA加速器,,這對跨行業(yè)跨場景測試?yán)鲂酒蛳铝顺醪交A(chǔ),。隨后,在部署上線的微億智造工業(yè)智能質(zhì)檢設(shè)備上,,百度智能云以整機(jī)一體化方式,,向微億智造交付搭載百度昆侖芯片的百度云質(zhì)檢一體機(jī)。

  僅僅硬件遠(yuǎn)遠(yuǎn)不夠,,一個整體的解決方案對商業(yè)化落地也至關(guān)重要,。百度提出了AI-Native的云計(jì)算架構(gòu),從基礎(chǔ)設(shè)施的AI計(jì)算集群,、AI芯片,,到工程平臺的飛槳、云原生,,以及應(yīng)用開發(fā)平臺的視頻云,、區(qū)塊鏈等,通過云智一體,、端到端的方式,支持產(chǎn)業(yè)的智能應(yīng)用,。

  當(dāng)然,,無形財(cái)產(chǎn)的積累對以科技為導(dǎo)向的企業(yè)來說也是至關(guān)重要的一環(huán),手機(jī)芯片玩家高通光靠專利費(fèi)就吃透了全世界,。在AI專利申請和許可方面,,百度已連續(xù)三年位居中國第一,百度AI開放平臺也已經(jīng)匯集了265萬開發(fā)者,。

  百度在其他地區(qū)的市場份額不大,,與成熟的競爭對手競爭也將非常艱難。但盡管如此,,在當(dāng)前大環(huán)境下,,昆侖芯片如今的量產(chǎn)和交付進(jìn)展卻凸顯了AI在中國的整體發(fā)展勢頭,也代表了中國企業(yè)在這一新興領(lǐng)域確立全球領(lǐng)導(dǎo)者的決心,。

  其實(shí)在AI領(lǐng)域,,中國一直沒有落后。據(jù)斯坦福大學(xué)發(fā)布的一份222頁的《2021年度AI指數(shù)報(bào)告》指出,,2020年,,中國在世界人工智能期刊上的引用頻次首次超過美國。在刊登數(shù)量上,,早在2004年,,中國在人工智能期刊的總發(fā)表數(shù)量上短暫超過美國,,然后在2017年重新占據(jù)領(lǐng)先地位。

 4(1).png

  中國在世界人工智能期刊上的引用頻次首次超過美國

  定制,、魔改,、二次開發(fā)

  早在2011年百度啟動了FPGA AI加速器項(xiàng)目,2015年的FPGA部署已經(jīng)超過5000片,,2017年成為業(yè)界部署最多的,,超過了12000片;2018年百度發(fā)布自主研發(fā)的AI芯片——百度昆侖,;2019年流片成功,,2020年昆侖一代開始量產(chǎn)并且大規(guī)模部署。

  關(guān)于昆侖芯片的細(xì)節(jié)我們不做過多的贅述,,但是值得一提的是,,往往GPU是打造AI芯片的重要手段之一,但是我們也可以看出,,百度從一開始卻是基于FPGA打造的,,F(xiàn)PGA的特點(diǎn)就是可編程,這樣使用昆侖芯片的用戶,,就完全可以根據(jù)自己的應(yīng)用場景來進(jìn)行定制,、魔改、二次開發(fā),。

  由于AI應(yīng)用場景的分散和復(fù)雜度高,,定制化就顯得格外重要。FPGA作為一種可編程芯片,,非常適合部署于提供虛擬化服務(wù)的云計(jì)算平臺之中,。昆侖芯片配以FPGA的靈活性,可讓用戶可以按照自己的需求和應(yīng)用場景進(jìn)行專項(xiàng)定制,,魔改,,二次開發(fā),實(shí)現(xiàn)更快速的市場普及,,并能完成自身產(chǎn)品的后續(xù)迭代,。

  在性能方面,百度昆侖性能最高比英偉達(dá)T4強(qiáng)三倍,。放大到全球的AI芯片,,據(jù)麻省理工學(xué)院林肯實(shí)驗(yàn)室超級計(jì)算中心的一項(xiàng)統(tǒng)計(jì)研究《機(jī)器學(xué)習(xí)加速器的調(diào)查和基準(zhǔn)測試》,在全球公開宣布的人工智能加速器和處理器的性能與功率分散圖中,,我們也可以看出,,昆侖芯片性能也處于高位(如下圖)。下圖顯示了最近公開發(fā)布的一些AI處理器能力(截至2019年5月),,列出了芯片的峰值性能與功耗,。

 5(1).png

  公開宣布的人工智能加速器和處理器的性能與功率分散圖(圖源:MIT《機(jī)器學(xué)習(xí)加速器的調(diào)查和基準(zhǔn)測試》研究)

  注:其中x軸表示峰值功率,,y軸表示每秒千兆次操作的峰值。處理能力的計(jì)算精度由所采用的幾何形狀來描述,;計(jì)算精度范圍從單個位int1到單個字節(jié)int8,,從4字節(jié)float 32到8字節(jié)float 64。形狀因子由顏色來描述,,這對于顯示消耗了多少能量很重要,,而且對于顯示在單個芯片、單個PCI卡和整個系統(tǒng)中可以裝載多少計(jì)算量也很重要,。藍(lán)色僅是單個芯片的性能和功耗,。橙色表示芯片的性能和功率(注意,它們都在200-300W區(qū)域),。綠色表示整個系統(tǒng)的性能和能力——在這里是單節(jié)點(diǎn)桌面和服務(wù)器系統(tǒng),。

  眾所周知,“AI應(yīng)用場景碎片化,、落地難”已成行業(yè)共識,,在AI芯片前仆后繼的大軍中,泡沫過后,,許多企業(yè)已銷聲匿跡,,僅留下了為數(shù)不多的十幾家。百度又能靠什么,?

  造芯者不但需要懂硬件,,還需要懂AI算法軟件。據(jù)了解,,百度昆侖作為百度人工智能平臺的核心組件,,可以原生支持開源深度學(xué)習(xí)框架飛槳(PaddlePaddle),,百度機(jī)器學(xué)習(xí)平臺(BML)及各垂類的AI 能力引擎,。另外,昆侖不僅支持全球主流CPU,、操作系統(tǒng),,Pytorch和 TensorFlow 等深度學(xué)習(xí)框架,也和國產(chǎn)化廠商密切合作支持飛騰,、申威和海光等國產(chǎn)CPU,,麒麟、深度和統(tǒng)信等國產(chǎn)操作系統(tǒng),。

  此外,,生態(tài)能力在芯片行業(yè)中尤為關(guān)鍵,而且放在自家產(chǎn)品上可盡顯其性價(jià)比優(yōu)勢,。

  其實(shí)這點(diǎn)我們可以從華為麒麟芯片得到啟發(fā),,因?yàn)橛惺謾C(jī)終端的不斷試錯和支持,,麒麟芯片才能在迭代中不斷創(chuàng)新,二者相輔相成,,最終成就一段手機(jī)史上的佳話,。百度亦是如此,相比其他單打獨(dú)斗的AI芯片企業(yè),,它有大公司的生態(tài)優(yōu)勢,。百度完全不用有一般AI芯片廠商的擔(dān)憂:“我該做什么樣的芯片?芯片做出來能否迎合市場的需求,?又將用在什么場景,?”因?yàn)榘俣扔刑嗟膽?yīng)用場景了,智能音箱,、智能駕駛Apollo,、智能云等等,這些對百度整體業(yè)務(wù)都形成一個大循環(huán),。

  特斯拉也是一樣,。在特斯拉自研FSD芯片前,需要采用英偉達(dá)的芯片,,不僅在性能上滿足不了特斯拉的需求,,而且成本還高昂,完全不具有話語權(quán),。此后,,特斯拉自己研發(fā)芯片竟達(dá)到了與英偉達(dá)相同乃至更好的效果,成本也把控在自己手里,。

  在造芯策略上,,百度與當(dāng)下國際互聯(lián)網(wǎng)巨頭如亞馬遜、谷歌,、微軟等如出一轍,,自產(chǎn)自用為主,但同時(shí)也注意為芯片建生態(tài),,芯片又反哺生態(tài),。未來隨著智能汽車逐漸爆發(fā),云計(jì)算,、物聯(lián)網(wǎng)市場的大幅度需求,,百度或?qū)⒈煌粕蠚v史的潮頭。

 

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。