7月10日消息,,近日,,壁仞科技副總裁兼AI軟件首席架構(gòu)師丁云帆在談及計(jì)算瓶頸時(shí)表示,,解決算力瓶頸問題需要從三個(gè)維度考慮:硬件集群算力,、軟件有效算力、異構(gòu)聚合算力,。
他認(rèn)為,,做好這三個(gè)維度的工作,即使國產(chǎn)AI芯片單個(gè)算力不強(qiáng),,也能通過綜合手段提升算力,,滿足國內(nèi)大模型訓(xùn)練的需求。
“我們2020年設(shè)計(jì)的第一代產(chǎn)品里就做了chiplet架構(gòu),,國外巨頭在今年發(fā)布的產(chǎn)品如英偉達(dá)B100和英特爾Gaudi 3也采用了同樣的思路,,他們用最先進(jìn)的制程,,但也需要chiplet來突破摩爾定律限制來提升單卡算力,。”丁云帆說道,。
據(jù)他介紹,,壁仞科技用三級(jí)的異步checkpoint技術(shù),結(jié)合GPU的顯存和CPU內(nèi)存,,甚至是多節(jié)點(diǎn)內(nèi)存的備份系統(tǒng)去達(dá)到一個(gè)平衡,,目前已能夠大幅降低故障恢復(fù)成本。
之前,,壁仞科技發(fā)布首款通用GPU芯片BR100,,創(chuàng)下全球算力紀(jì)錄,16位浮點(diǎn)算力達(dá)到1000T以上,、8位定點(diǎn)算力達(dá)到2000T以上,,單芯片峰值算力達(dá)到PFLOPS級(jí)別,。
當(dāng)時(shí),壁仞科技給出的數(shù)據(jù)顯示,,其首款旗艦產(chǎn)品BR100對(duì)比英偉達(dá)在售的旗艦GPU峰值算力在Int8,、BF16、TF32/TF32+,、FP32數(shù)據(jù)格式下最少有3.3倍的峰值性能優(yōu)勢(shì),,在FP32數(shù)據(jù)格式下性能優(yōu)勢(shì)更是達(dá)到了13.1倍。