人工智能(Artificial Intelligence)和深度學習(Deep Learning)有望轉(zhuǎn)變?nèi)祟惻c世界互動以及企業(yè)運作的方式,,從而使人們做出更明智的決策,而英特爾?技術(shù)正在實現(xiàn)這場變革,。今天,,英特爾將著重介紹全球最大的云服務提供商之一是如何利用英特爾人工智能技術(shù)來運行復雜的深度學習模型,,這些模型實現(xiàn)了各種應用,從智能手機上的人臉識別和語音識別再到自動駕駛等等,。
更多詳情請參考:英特爾FPGA如何在微軟Project Brainwave中加速人工智能(Dan McNamara博客)| 人工智能(新聞資料)
微軟選擇了英特爾?Stratix?10 FPGA作為其新的深度學習加速平臺(代號為Project Brainwave)的關(guān)鍵硬件加速器,。這種基于FPGA的深度學習加速平臺可以提供“實時人工智能”技術(shù),使云基礎(chǔ)設(shè)施能夠以超低延遲來盡可能快速地處理和傳輸數(shù)據(jù)。在云中,,系統(tǒng)需要處理直播數(shù)據(jù)流(包括視頻,,傳感器或搜索查詢)并快速將數(shù)據(jù)傳送回用戶,因此提供實時人工智能變得越來越重要,。
Stratix 10 FPGA和SoC FPGA使用了英特爾14nm制程工藝
在發(fā)布的博客中,,微軟詳細介紹了采用英特爾FPGA的Project Brainwave平臺如何以“前所未有”的高性能來靈活處理極具挑戰(zhàn)性的深度學習模型。微軟在2017年高效能芯片大會(Hot Chips 2017)上展示了基于FPGA的深度學習平臺,,該盛會主要展示半導體技術(shù)領(lǐng)域中的最新成就,。微軟是第一家在其公有云基礎(chǔ)設(shè)施中部署FPGA的大型云服務提供商,,而其通過英特爾Stratix 10 FPGA實現(xiàn)的技術(shù)進步加速了深度神經(jīng)網(wǎng)絡(DNN),,這種網(wǎng)絡可以通過概念類似的方式復制人類大腦的“思維”。
人工智能是一個快速發(fā)展的領(lǐng)域,,需要多種技術(shù)來有效管理各種工作負載的需求,。英特爾提供廣泛的技術(shù)以推動市場演進,包括英特爾至強?處理器,,英特爾?FPGA和英特爾Nervana? ASIC技術(shù),。與那些為運行單個工作負載而優(yōu)化的專用深度學習硬件加速器相比,英特爾FPGA的高度靈活性讓用戶可以自定義硬件以滿足特定的工作負載需求,,并可以隨著深度學習工作負載和使用模式的更改而快速地重新配置硬件,。英特爾Stratix 10 FPGA結(jié)合了硬化處理器模塊,這種模塊可提供高水平的持續(xù)性能和效率,,并可根據(jù)用戶的自定義來靈活的編程,。
許多硅人工智能加速器目前需要將多個請求分組(稱為“批處理”)以實現(xiàn)高性能。微軟的Project Brainwave平臺利用英特爾Stratix 10技術(shù),,在單個請求上展示了超過每秒39萬億次浮點運算的性能,,在云中確立了實時人工智能計算的新標準。Stratix 10 FPGA為實時人工智能計算確立了新的云性能標準,,具有創(chuàng)紀錄性的低延遲,、高性能以及無需批量處理人工智能請求的多種特點。
微軟研究院NexT的著名工程師Doug Burger說:“我們利用英特爾FPGA的高度靈活性快速整合創(chuàng)新,,同時提供與許多基于ASIC的深度學習處理單元相當或更高的性能,。微軟正努力在Azure云中部署Project Brainwave,以便客戶最終能夠以創(chuàng)紀錄式的高性能運行復雜的深度學習模型,?!?/p>
通過加速模型訓練、快速評分和高度可擴展的基礎(chǔ)設(shè)施,,基于英特爾技術(shù)的機器學習平臺將數(shù)據(jù)轉(zhuǎn)化為可操作的商業(yè)智能,。結(jié)合最新的英特爾至強可擴展處理器,英特爾FPGA可自定義和編程以提供低延遲和靈活的精度,與單獨的英特爾?至強?處理器相比,,在深度學習推理方面每瓦特功耗具有更高的性能,。