在9月25日的阿里云棲大會上,,達摩院院長、阿里巴巴CTO張建鋒現(xiàn)場發(fā)布了含光800AI芯片,這是阿里巴巴第一顆自研芯片。含光800被認為是全球最強的AI芯片,,在業(yè)界標準的ResNet-50測試中,,含光800推理性能可以達到78563 IPS,,比目前業(yè)界最好的AI芯片性能高4倍,;能效比500 IPS/W,,是第二名的3.3倍,。
2017年的阿里云棲大會上,阿里達摩院正式成立,;2018年的云棲大會上,,平頭哥半導體公司正式成立。隨后,,在2019年7月,,平頭哥正式發(fā)布首款CPU芯片玄鐵910,號稱是目前業(yè)界性能最強的一款RISC-V處理器,。玄鐵910可以用于設計制造高性能端上芯片,,應用于5G、人工智能以及自動駕駛等領域,。一個月后,,平頭哥在8月發(fā)布SoC芯片平臺“無劍”,打造面向AIoT時代的一站式芯片設計平臺,,提供集芯片架構,、基礎軟件、算法與開發(fā)工具于一體的整體解決方案,。
在含光800發(fā)布現(xiàn)場,,張建鋒說:“在全球芯片領域,阿里巴巴是一個新人,,玄鐵和含光800是平頭哥的萬里長征第一步,,我們還有很長的路要走?!?/p>
與玄鐵一樣,,含光同為上古三大神劍之一,該劍含而不露,,光而不耀,,官方稱這正如含光800帶來的無形卻強勁的算力。
根據(jù)阿里云展示的杭州城市大腦的業(yè)務測試,,1顆含光800的算力相當于10顆GPU,。實際應用上,含光800目前已開始應用在阿里巴巴內部核心業(yè)務中,。根據(jù)云棲大會的現(xiàn)場演示,,在城市大腦中實時處理杭州主城區(qū)交通視頻,需要40顆傳統(tǒng)GPU,延時為300ms,,使用含光800僅需4顆,,延時降至150ms。拍立淘商品庫每天新增10億商品圖片,,使用傳統(tǒng)GPU算力識別需要1小時,,使用含光800后可縮減至5分鐘。
而含光800性能的突破得益于軟硬件的協(xié)同創(chuàng)新,,張劍鋒表示,,盡管現(xiàn)在很多廠商都在打造芯片,但它們只是在做硬件,,而阿里則在提供一個軟硬兼?zhèn)涞膭?chuàng)新平臺,。以含光800為例,其硬件層面采用自研芯片架構,,通過推理加速等技術有效解決芯片性能瓶頸問題;軟件層面集成了達摩院先進算法,,針對CNN及視覺類算法深度優(yōu)化計算,、存儲密度,可實現(xiàn)大網絡模型在一顆NPU上完成計算,。
未來,,含光800將通過阿里云對外輸出AI算力。張劍鋒宣布,,基于含光800的AI云服務從9月25日起正式上線,,而且相比傳統(tǒng)GPU算力,起性價比將會有100%的提升,。
而隨著玄鐵910,、無劍SoC平臺、含光800的發(fā)布,,張劍鋒表示,,平頭哥端云一體全棧產品系列初步成型,已經涵蓋處理器IP,、一站式芯片設計平臺和AI芯片,,實現(xiàn)了芯片設計鏈路的全覆蓋。