昨天,,阿里巴巴發(fā)布了第一款AI芯片——含光800。除了參數(shù)外,,還有怎樣的故事和深層次考慮,?最近一兩年,只要國內有公司發(fā)布AI芯片,,就會在各大社交圈,、媒體中炸開鍋。日子過不了多久,就會淡去,,留下三三兩兩歷史記錄中的文章,。但我們很少知道背后的故事,這并不是幾日的技術狂歡所能說清的,。昨天,,阿里巴巴發(fā)布了第一款AI芯片——含光800。合著云棲大會的熱鬧,,該芯片瞬間成為了近日最閃耀的頭條新聞,。當阿里CTO張建鋒在會議廳展示這塊芯片時,介紹很簡短,,除了參數(shù)外,,并沒有介紹背后的故事。
“前幾天,,我們都還不知道能不能完成,。只能每周干7天,每晚干到12點,。就在15號凌晨時,,我們最后一批人早上5點20離開(實驗室),終于調出來了,。當時很多人說不可能,,但我們做到了?!?阿里巴巴達摩院平頭哥AI芯片研究員焦陽(驕旸)在接受TechSugar等媒體采訪時,,說到了這款芯片背后的故事。
故事的開頭夾雜的質疑,,故事的結尾如這批研究員所愿,。
這顆芯片
7個月完成了前端設計,之后用3個月就成功流片,,速度的確驚人,。
據(jù)現(xiàn)場介紹,在業(yè)界標準的ResNet-50測試中,,含光800推理性能達到78563 IPS,,比目前業(yè)界最好的AI芯片性能高4倍;能效比500 IPS/W,,是第二名的3.3倍,。在杭州城市大腦的業(yè)務測試中,1顆含光800的算力相當于10顆GPU,。
人工智能芯片分論壇中,,焦陽介紹了更多該芯片的細節(jié),,如下兩張圖。
含光800采用四核設計,,其包含170億顆晶體管,,采用臺積電的12nm工藝。之所以采用四核架構,,焦陽表示:“在設計之后,,由于良率提升需求,四個Core任何有一個Core壞死,,都不影響芯片工作,,這是我們在架構設計時做的特別處理?!?/p>
此外,,計算單元盡量被放在了存儲邊上,這是功耗做的很低的原因,。
含光800性能的突破得益于軟硬件的協(xié)同創(chuàng)新:硬件層面采用自研芯片架構,,通過推理加速等技術有效解決芯片性能瓶頸問題;軟件層面集成了達摩院算法,,針對CNN及視覺類算法深度優(yōu)化計算、存儲密度,,可實現(xiàn)大網絡模型在一顆NPU上完成計算,。
含光800已開始應用在阿里巴巴內部核心業(yè)務中。根據(jù)云棲大會的現(xiàn)場演示,,在城市大腦中實時處理杭州主城區(qū)交通視頻,,需要40顆傳統(tǒng)GPU,延時為300ms,,使用含光800僅需4顆,,延時降至150ms。拍立淘商品庫每天新增10億商品圖片,,使用傳統(tǒng)GPU算力識別需要1小時,,使用含光800后可縮減至5分鐘。
含光800將通過阿里云對外輸出AI算力,?;诤?00的AI云服務當天正式上線,相比傳統(tǒng)GPU算力,,性價比提升100%,。
過去半年,平頭哥先后發(fā)布玄鐵910,、無劍SoC平臺,。隨著含光800的發(fā)布,平頭哥端云一體全棧產品系列初步成型,涵蓋處理器IP,、一站式芯片設計平臺和AI芯片,,實現(xiàn)了芯片設計鏈路的全覆蓋。
張建鋒說:“在全球芯片領域,,阿里巴巴是一個新人,,玄鐵和含光800是平頭哥的萬里長征第一步,我們還有很長的路要走,?!?/p>
到底怎么想的?
在發(fā)布會結束后,,筆者從分論壇中,,了解到了這款NPU更多的故事和背后的想法。首先是為什么——阿里巴巴為什么要做云上大芯片,?
從焦陽的回答中,,筆者總結為以下幾點:
1,阿里巴巴云計算是一個快速增長的業(yè)務,,在業(yè)內處于領先地位,。硬件設計可以幫助阿里巴巴快速拓展業(yè)務,降低計算成本,,提供海量的計算能力,。云計算走到今天,如果沒有硬核就很難繼續(xù)往下走,,未來很難在算力上有更多的提高,。
2,這不是為了短期商業(yè)化,,而為更遠的愿景,。以技術為本,打造過硬的技術,。
3,,為什么做推理而不是訓練?雖然在AI發(fā)展中,,第一步都是要做很多的訓練,,但隨著算法高速發(fā)展之后,將迎來推理端的發(fā)展,。阿里巴巴涉及的業(yè)務,,如城市大腦、視覺分析等,,算力大大提高其計算效率,,把真正的業(yè)務量達到突破,,從而在云計算中增加更多流量,解決未來業(yè)務發(fā)展目標,。
4,,阿里巴巴與傳統(tǒng)互聯(lián)網公司不同,除了搜索和廣告業(yè)務,,還有更豐富的視覺類業(yè)務,,如淘寶圖片、搜索,、智能城市,、智能工廠等?;谶@些業(yè)務,,CNN加速是對NPU的一個重要方向點,此外阿里還將擴展到新的模式適配,。(如下圖)
在提到未來芯片計劃時,,焦陽非常務實地說道:“第一步先把技術做深做扎實,達摩院或者其他的技術團隊,,目前都在做很多的項目,,我們需要從業(yè)務中了解業(yè)務,不能僅限于只做業(yè)務,,需要舉一反三,,來產生更有深度,更有技術水平的產品,。含光雖然已經取得了初步的結果,但這遠遠不夠,,我們要達到英偉達的水平還有很長的路要走,,有了好技術才能有章可循,沒有技術,,連推產品都推不動,。”
“AI芯片是新的領域,,新領域本身就存在很多機會,。而且人工智能算法是需要特殊架構的,對于阿里巴巴來說,,就是挑戰(zhàn)皇冠上的明珠,。”有20年GPU領域工作經驗的焦陽,,談到公司未來也是充滿信心,。
阿里芯片的邊界
前不久,,看到新聞上提到馬云在阿里巴巴卸任現(xiàn)場上演唱了《怒放的生命》時,我突然發(fā)現(xiàn),,凡人已經很難阻止阿里巴巴了,。
2017年,宣布成立達摩院,;2018年成立平頭哥,;2019年便掏出了這一款AI芯片。對2020年的大事,,目前筆者還沒嗅到什么消息,,憑借阿里的想象力,總預感會有大事發(fā)生,。
其實在芯片這塊,,阿里巴巴的所涉及的部分已經超過一般人所知。
阿里巴巴集團副總裁周明的題為《阿里巴巴基礎設施挑戰(zhàn)與芯片策略》的演講中提到,,如今阿里在技術分布有CPU,、異構計算、NPU,、FPGA,;互聯(lián)和網絡部分則有自研網絡交換機及NOS、自研400G硅光模塊,、HAIL2.0數(shù)據(jù)中心網絡架構,;存儲端集合了從SSD到DRAM到新型存儲截止愛到服務器的一體機,其中包括AliFlash V3,、AliFlash V5.0,、阿里巴巴自研云計算服務器、阿里巴巴邊緣云服務器,。
因為基礎設施的加持,,才有云棲大會第一場主論壇中,阿里巴巴董事局主席兼首席執(zhí)行官張勇對數(shù)字經濟的暢想,,他表示:“在數(shù)字經濟時代,,大數(shù)據(jù)是石油,而算力是引擎,。算力不僅代表計算的規(guī)模和計算的效率,,同時它也包括數(shù)量的要求、智慧的程度,。算力的發(fā)展,,最終一定是“數(shù)”和“智”全面結合。只有這樣,,我們才能夠在走向數(shù)字化的同時,,真正走向未來我們共同相信會全面爆發(fā)的智慧化,、數(shù)智化?!?/p>
更多信息可以來這里獲取==>>電子技術應用-AET<<