北京時間4月6日消息,,谷歌為了滿足自身運(yùn)算量的需求,,并沒有去建立更多的運(yùn)算中心,而是自助開發(fā)了適用于AI計算的高性能專用硬件—TPU,。谷歌在一篇博文中提到,,其自主研發(fā)的TPU在性能上一點不輸英特爾,甚至在某些性能上還有所超越,。
谷歌自主研發(fā)了TPU處理器(圖片來自kkj)
谷歌表示,,相比類似的服務(wù)器級Intel Haswell CPU和NVIDIA K80 GPU,TPU在AI運(yùn)算測試中的平均速度要快15-30倍,。更重要的是,,TPU的每瓦性能要比普通的GPU高出25-80倍。此外,,谷歌工程師還為TPU開發(fā)了名為CNN1的軟件,,其可以讓TPU的運(yùn)行速度比普通CPU高出70多倍,。
同時谷歌還表示,由于TPU專為機(jī)器學(xué)習(xí)所運(yùn)行,,得以較傳統(tǒng)CPU,、GPU降低精度,在計算所需的電晶體數(shù)量上,,自然可以減少,,也因此,可從電晶體中擠出更多效能,,每秒執(zhí)行更復(fù)雜,、強(qiáng)大的機(jī)器學(xué)習(xí)模組,并加速模組的運(yùn)用,,使得使用者更快得到答案,。谷歌
指出,團(tuán)隊已經(jīng)在數(shù)據(jù)中心執(zhí)行TPU超過一年,,且發(fā)現(xiàn)TPU能讓機(jī)器學(xué)習(xí)每瓦提高一個數(shù)量級,,粗略來說,相當(dāng)于摩爾定律中晶片效能往前推進(jìn)了七年或者三代,。據(jù)悉,,谷歌數(shù)據(jù)中心自2015年以來一直在使用TPU來加速AI服務(wù),而且收獲了理想的效果,,其能夠更快的處理用戶發(fā)送的請求,,降低結(jié)果反饋的延遲。
值得一提的是,,谷歌認(rèn)為現(xiàn)在的TPU仍在硬件和軟件方面存在很大的優(yōu)化空間,,比如假定用上了NVIDIA K80 GPU中的GDDR5內(nèi)存,那么TPU就可以發(fā)揮出更好的性能,。