華為在全聯(lián)接大會2018上,首次宣布了華為的AI戰(zhàn)略以及全棧解決方案。與此同時,,華為發(fā)布了自研云端AI芯片“昇騰(Ascend)”系列,基于達芬奇架構(gòu),,首批推出7nm的昇騰910以及12nm的昇騰310。
其中,昇騰910是目前單芯片計算密度最大的芯片,計算力遠超谷歌和英偉達,。昇騰910半精度(FP16)運算能力為256TFLOPS,,比NVIDIA的TeslaV100要高一倍,,整數(shù)精度(INT8)512TOPS,支持128通道全高清視頻解碼(H.264/265),,最大功耗350W,。
昇騰310芯片的最大功耗僅為8W,主打極致高效計算低功耗AI芯片,。半精度(FP16)運算能力8TFLOPS,,整數(shù)精度(INT8)16TOPS,支持16通道全高清視頻解碼(H.264/265),。這兩款AI芯片和大規(guī)模分布式訓練系統(tǒng)都將在明年第二季度推出,。
日前,華為終端手機產(chǎn)品線總裁何剛發(fā)布長圖,,詳細介紹了昇騰310的用途以及設計細節(jié),。
何剛表示,昇騰310作為華為全棧全場景AI解決方案的關鍵部分,是華為全面AI戰(zhàn)略的重要支撐,。在設計方面,,突破了人工智能芯片設計的功耗、算力等約束,,實現(xiàn)了能效比的大幅提升,。未來將為平安城市、自動駕駛,、云業(yè)務和IT智能,、智能制造、機器人,、便攜機,、智能手機,、智能手表等應用場景提供全新的解決方案。
昇騰310采用華為自研達芬奇架構(gòu),,使用了華為自研的高效靈活CISC指令集,,每個AI核心可以在1個周期內(nèi)完成4096次MAC計算,集成了張量,、矢量,、標量等多種運算單元,支持多種混合精度計算,,支持訓練及推理兩種場景的數(shù)據(jù)精度運算,。
統(tǒng)一架構(gòu)可以適配多種場景,功耗范圍從幾十毫瓦到幾百瓦,,彈性多核堆疊,,可在多種場景下提供最優(yōu)能耗比。