深度學(xué)習(xí)領(lǐng)域仍在不斷變化,,專(zhuān)家們認(rèn)識(shí)到,如果芯片采用低精度數(shù)學(xué)方法來(lái)估算結(jié)果,,那么神經(jīng)網(wǎng)絡(luò)可以用最少的能量實(shí)現(xiàn)最大化計(jì)算,。這在移動(dòng)設(shè)備和其他功率受限設(shè)備中特別適用。但是有些任務(wù),,如訓(xùn)練神經(jīng)網(wǎng)絡(luò),仍然需要高精度,。IBM最近在IEEE的超大規(guī)模集成電路(VLSI)研討會(huì)上展示了一個(gè)原型芯片,,它在兩個(gè)方面的表現(xiàn)都非常出色。
人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練和網(wǎng)絡(luò)功能執(zhí)行(稱(chēng)為推理)之間的需求脫節(jié),,一直是設(shè)計(jì)加速人工智能功能芯片的難點(diǎn)所在,。IBM的新型加速人工智能芯片能夠?qū)崿F(xiàn)該公司所稱(chēng)的“比例精度”。也就是說(shuō),,它可以在32位,、16位甚至1位或2位上進(jìn)行訓(xùn)練和推理。
凱拉什?古帕拉克里什南(Kailash Gopalakrishnan)是IBM位于紐約州約克鎮(zhèn)高地研究中心的項(xiàng)目負(fù)責(zé)人,,他解釋說(shuō):“你可做的最高精度訓(xùn)練為16位,,而可做的最先進(jìn)的推理是2位。該芯片涵蓋了迄今已知的最佳訓(xùn)練和最佳推理?!?/p>
該芯片的這種能力源于兩項(xiàng)創(chuàng)新,,創(chuàng)新的目標(biāo)是保持所有處理器部件都保有數(shù)據(jù)并且都在運(yùn)行。
古帕拉克里什南說(shuō)道:“傳統(tǒng)(芯片)結(jié)構(gòu)的問(wèn)題之一是執(zhí)行深度學(xué)習(xí)的利用率非常低,?!奔词剐酒哂蟹浅8叩姆逯敌阅埽ǔR仓荒芾?0%到30%的資源來(lái)解決問(wèn)題,。而IBM的目標(biāo)是始終保持在90%,,且針對(duì)所有任務(wù)。
利用率低通常是由于芯片周?chē)臄?shù)據(jù)流存在瓶頸,。古帕拉克里什南的團(tuán)隊(duì)提出一個(gè)新數(shù)據(jù)流系統(tǒng),,可加速?gòu)囊粋€(gè)處理引擎到下一個(gè)處理引擎的數(shù)據(jù)傳輸,可根據(jù)處理學(xué)習(xí)還是推理任務(wù)以及不同的精度來(lái)進(jìn)行設(shè)置,。
第二個(gè)創(chuàng)新是使用一種專(zhuān)門(mén)設(shè)計(jì)的“高速暫存”芯片存儲(chǔ),。CPU或GPU上的傳統(tǒng)緩存遵循通用計(jì)算所適用的某些規(guī)則,但會(huì)導(dǎo)致深度學(xué)習(xí)的延遲,。例如,,在某些情況下,緩存將一個(gè)數(shù)據(jù)塊推送到計(jì)算機(jī)主存,,如果神經(jīng)網(wǎng)絡(luò)推理或?qū)W習(xí)過(guò)程還需要這些數(shù)據(jù),,系統(tǒng)就必須等待數(shù)據(jù)被重新取回。
高速暫存區(qū)能夠保持?jǐn)?shù)據(jù)流經(jīng)芯片的處理引擎,,確保數(shù)據(jù)在恰當(dāng)?shù)臅r(shí)間處于正確的位置,。
由此產(chǎn)生的芯片可以執(zhí)行人工智能深度學(xué)習(xí)的3種主要方式——卷積神經(jīng)網(wǎng)絡(luò)(CNN)、多層感知器(MLP)和長(zhǎng)短期記憶(LSTM),。這些技術(shù)在語(yǔ)音,、視覺(jué)和自然語(yǔ)言處理方面占據(jù)重要地位。在典型訓(xùn)練精度16位的情況下,,IBM的新型芯片每秒鐘可進(jìn)行1.5萬(wàn)億次浮點(diǎn)運(yùn)算,;在推理最佳精度2位的情況下,每秒可進(jìn)行12萬(wàn)億次,。
古帕拉克里什南指出,,由于芯片是采用先進(jìn)的硅互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)工藝(格羅方德公司的14納米工藝)制造的,因此所有運(yùn)算都聚集在一個(gè)相當(dāng)小的區(qū)域內(nèi),。這很重要,,因?yàn)檎缢f(shuō):“在很多應(yīng)用中,成本受到尺寸的限制,?!?/p>
隨著越來(lái)越多的初創(chuàng)公司涌現(xiàn),,大公司也不斷推出新創(chuàng)意,IBM當(dāng)然是這個(gè)是日益龐大的群體中的一員,。盡管各家公司特點(diǎn)顯著,,但也有許多共同之處。深度學(xué)習(xí)初創(chuàng)公司Mythic的首席技術(shù)官戴夫?菲克(Dave Fick)表示:“這些解決方案是根據(jù)具體問(wèn)題而提出的,?!彼浴懊總€(gè)人都在尋求相似的解決方案”是有道理的。本刊采訪(fǎng)了Mythic和其他初創(chuàng)公司,,它們的目標(biāo)都是在2019年讓客戶(hù)真正滿(mǎn)意,。
至于這項(xiàng)技術(shù)何時(shí)可能在IBM沃森上或以其他形式進(jìn)行商業(yè)化,目前還沒(méi)有任何消息,,但I(xiàn)BM的半導(dǎo)體研究副總裁穆克?什哈雷(Mukesh Khare)認(rèn)為它能夠發(fā)展和改進(jìn),。他說(shuō):“這只是冰山一角?!?/p>