北京時(shí)間12月12日,對(duì)英特爾來說大事連連,,在北京,正舉辦20歲生日的英特爾中國研究院的隔壁樓房著了大火,,而遠(yuǎn)在大洋彼岸,,英特爾在加州Los Altos舉辦的“架構(gòu)日”上連發(fā)大招,!
英特爾高管、架構(gòu)師和院士們展示了下一代技術(shù),,并介紹了英特爾在驅(qū)動(dòng)不斷擴(kuò)展的數(shù)據(jù)密集型工作負(fù)載方面的戰(zhàn)略進(jìn)展,,從而為PC和其他智能消費(fèi)設(shè)備、高速網(wǎng)絡(luò),、人工智能(AI),、云數(shù)據(jù)中心和自動(dòng)駕駛汽車提供支持。
英特爾不僅展示了一系列處于研發(fā)中的基于10納米的系統(tǒng),,將用于PC,、數(shù)據(jù)中心和網(wǎng)絡(luò)設(shè)備,并預(yù)覽了其他針對(duì)更廣泛工作負(fù)載的技術(shù),,還一連分享了聚焦于六個(gè)工程領(lǐng)域的技術(shù)戰(zhàn)略,,包括:
1、先進(jìn)的制造工藝和封裝,。
2,、可加速人工智能(AI)和圖形等專門任務(wù)的新架構(gòu)。
3,、超高速內(nèi)存,。
4、超微互連,。
5,、嵌入式安全功能。
6,、為開發(fā)者統(tǒng)一和簡化基于英特爾計(jì)算路線圖進(jìn)行編程的通用軟件,。
英特爾表示,對(duì)這些領(lǐng)域的重大投資和技術(shù)創(chuàng)新,,將為更加多元化的計(jì)算時(shí)代奠定了基石,,到2022年,潛在市場規(guī)模將超過3000億美元,。
英特爾高級(jí)副總裁:摩爾定律將長存,!
本次架構(gòu)日的舉辦地加州Los Altos是仙童半導(dǎo)體與英特爾的聯(lián)合創(chuàng)始人Robert Noyce的故居,該活動(dòng)由英特爾公司處理器核心與視覺計(jì)算高級(jí)副總裁Raja Koduri與英特爾公司高級(jí)副總裁兼硅工程事業(yè)部總經(jīng)理Jim Keller擔(dān)任主講,。
Jim Keller一出場就懟了所謂摩爾定律大限將至的說法,,他表示,在他看完整個(gè)英特爾的技術(shù)布局之后,,深覺得他能夠發(fā)揮的空間極大,,他會(huì)讓摩爾定律在未來很長的一段時(shí)間內(nèi)持續(xù)下去,,要大跌那些評(píng)論家的眼鏡。
▲英特爾公司高級(jí)副總裁兼硅工程事業(yè)部總經(jīng)理JimKeller
Raja則認(rèn)為如今數(shù)據(jù)產(chǎn)生速度已遠(yuǎn)遠(yuǎn)超過出現(xiàn)有基礎(chǔ)設(shè)施所能處理的速度,,因此未來亟需更高效,、規(guī)模更大且更具可擴(kuò)展性的計(jì)算架構(gòu)。根據(jù)現(xiàn)場媒體的報(bào)道,,Raja預(yù)言說,,未來10年計(jì)算架構(gòu)的發(fā)展將遠(yuǎn)超過過去50年的速度,。
Raja提到,,由于計(jì)算產(chǎn)業(yè)的轉(zhuǎn)變,未來英特爾在架構(gòu)設(shè)計(jì)上也會(huì)越來越靈活,,不但核心本身的設(shè)計(jì)會(huì)更接地氣,,同時(shí)也將更強(qiáng)調(diào)不同場景的計(jì)算適配,未來將引入CPU,、GPU以外更多的計(jì)算概念,,構(gòu)成xPU生態(tài)。
基于不同時(shí)代所需要的計(jì)算架構(gòu)不同,,Raja將整個(gè)計(jì)算軌跡分為三個(gè)階段,,分別是2000年左右的GHz時(shí)鐘速度階段、2005年開始的多核階段,,以及未來的架構(gòu)階段,,未來架構(gòu)將是主導(dǎo)整個(gè)計(jì)算市場的最主要核心。Raja表示,,英特爾將針對(duì)三大計(jì)算領(lǐng)域布局更廣的計(jì)算架構(gòu),,包括CPU和GPU在內(nèi)的這些架構(gòu)都將混合更多元、更具彈性的計(jì)算能力,。
▲英特爾公司處理器核心與視覺計(jì)算高級(jí)副總裁Raja Koduri
針對(duì)AI應(yīng)用這一當(dāng)下和未來的主流計(jì)算趨勢(shì),,英特爾也會(huì)在其主力架構(gòu)中增加更多包含深度學(xué)習(xí)、訓(xùn)練以及推理計(jì)算加速的功能區(qū)塊,。
其下一代 14nm 處理器Cooper Lake將引進(jìn) AI 模型訓(xùn)練加速能力,,支持 bfloat16的數(shù)據(jù)格式,可達(dá)到比 fp32高兩倍的數(shù)據(jù)輸出能力,。
Raja還大秀英特爾在CPU以及GPU方面的最新布局,,并展示未來英特爾CPU的核心發(fā)展路線,剖析了整個(gè)計(jì)算市場的走向,。他也介紹了其最新的 Gen 11 世代繪圖核心,,并表示會(huì)將規(guī)模持續(xù)做大,設(shè)計(jì)出更符合全方位計(jì)算與繪圖應(yīng)用的獨(dú)立GPU架構(gòu),,正面迎擊AMD與英偉達(dá),。
此外,,存儲(chǔ)、封裝以及服務(wù)器的技術(shù)布局均在Raja本次全面介紹的射程之中,。
作為xPU系列中的重要角色,,Raja也不負(fù)眾望的揭曉了眾人關(guān)注的FPGA最新布局。Raja介紹道,,新款的異構(gòu)FPGA計(jì)算方案將會(huì)采用10nm制程,,且規(guī)模將覆蓋到從過去的中低端方案到高端方案,以同一架構(gòu)不同規(guī)模的設(shè)計(jì)來解決不同層次的計(jì)算問題,。而且下一代FPGA芯片會(huì)引入3D封裝技術(shù),。
重拳出擊!六大技術(shù)新動(dòng)向
值得一提的是,,在封裝領(lǐng)域,,英特爾推出的 Foveros 是業(yè)界首個(gè)真正的 3D 封裝,可以把整個(gè)系統(tǒng)封進(jìn)一顆芯片中,,達(dá)成真正的 System in Package 概念,,遠(yuǎn)比目前臺(tái)積電與三星都在發(fā)展的 2D 或 2.5D 封裝技術(shù)更為先進(jìn)。
1,、業(yè)界首創(chuàng)邏輯芯片3D堆疊
英特爾展示了Foveros全新3D封裝技術(shù),,該技術(shù)首次引入了3D堆疊的優(yōu)勢(shì),可實(shí)現(xiàn)在邏輯芯片上堆疊邏輯芯片,,比目前臺(tái)積電與三星在發(fā)展的 2D 或 2.5D 封裝技術(shù)要更先進(jìn),。英特爾預(yù)計(jì)將從2019年下半年開始推出一系列使用Foveros的產(chǎn)品。
首款Foveros產(chǎn)品將整合高性能10nm計(jì)算堆疊“芯片組合”和低功耗22FFL基礎(chǔ)晶片,。 英特爾稱,,它將在小巧的產(chǎn)品形態(tài)中實(shí)現(xiàn)世界一流的性能與功耗效率。
據(jù)稱此封裝技術(shù)可做到約1mm的超薄厚度,,Raja還在現(xiàn)場秀出僅有12mm x 12mm尺寸的量產(chǎn)芯片,。
Foveros為整合高性能、高密度和低功耗硅工藝技術(shù)的器件和系統(tǒng)鋪平了道路,,有望第一次將晶片的堆疊從傳統(tǒng)的無源中間互連層和堆疊存儲(chǔ)芯片擴(kuò)展到高性能邏輯芯片,,如CPU、圖形和AI處理器,。
因?yàn)樵O(shè)計(jì)人員可在新的產(chǎn)品形態(tài)中“混搭”不同的技術(shù)專利模塊與各種存儲(chǔ)芯片和I/O配置,,該技術(shù)提供了極大的靈活性,并使得產(chǎn)品能分解成更小的“芯片組合”,,其中I/O,、SRAM和電源傳輸電路可以集成在基礎(chǔ)晶片中,而高性能邏輯“芯片組合”則堆疊在頂部。
英特爾表示,, Foveros將成為繼2018年英特爾推出突破性的嵌入式多芯片互連橋接(EMIB)2D封裝技術(shù)之后的下一個(gè)技術(shù)飛躍,。
2、全新CPU微架構(gòu)Sunny Cove
英特爾推出了接手 Skylake 的新一代CPU微架構(gòu)Sunny Cove,,旨在提高通用計(jì)算任務(wù)下每時(shí)鐘計(jì)算性能和降低功耗,,并包含了可加速人工智能和加密等專用計(jì)算任務(wù)的新功能。
Sunny Cove將在明年晚些時(shí)候成為英特爾下一代服務(wù)器(至強(qiáng))和客戶端(酷睿)處理器的基礎(chǔ)架構(gòu),。
Sunny Cove的主要功能特性包括:
?。?)增強(qiáng)的微架構(gòu),可并行執(zhí)行更多操作,。
?。?)可降低延遲的新算法。
?。?)增加關(guān)鍵緩沖區(qū)和緩存的大小,,其一級(jí)緩存增大了50%,,內(nèi)存定址最大可定達(dá)4096TB,,可優(yōu)化以數(shù)據(jù)為中心的工作負(fù)載。
?。?)針對(duì)特定用例和算法的架構(gòu)擴(kuò)展,。例如,提升加密性能的新指令,,如矢量AES和SHA-NI,,以及壓縮/解壓縮等其它關(guān)鍵用例。
Sunny Cove不僅能夠減少延遲,、提高吞吐量,,而且提供更高的并行計(jì)算能力。英特爾表示,,它將有望改善從游戲到多媒體到以數(shù)據(jù)為中心的應(yīng)用體驗(yàn),。
緊隨Sunny Cove之后,Willow Cove和Golden Cove也將分別對(duì)緩存,、晶體管進(jìn)行更多優(yōu)化,,甚至?xí)闇?zhǔn)網(wǎng)絡(luò)設(shè)備和5G應(yīng)用等來進(jìn)一步強(qiáng)化 AI 等關(guān)鍵應(yīng)用的性能表現(xiàn)。
3,、全新第11代集成圖形卡
英特爾推出全新的第11代集成圖形卡,,配備64個(gè)增強(qiáng)型執(zhí)行單元,比此前的英特爾第9代圖形卡(24個(gè)EU)多出一倍,,旨在打破每秒1萬億浮點(diǎn)運(yùn)算次數(shù)(1 TFLOPS)的壁壘,。新的集成圖形卡將從2019年開始與10納米處理器一起交付。此外,英特爾還重申了在2020年推出獨(dú)立圖形處理器的計(jì)劃,。
英特爾此前要在去年發(fā)布第10代集成圖形卡,,但由于改善幅度過小,最終該方案被舍棄,,轉(zhuǎn)而發(fā)展 11 代圖形卡,。
與英特爾第9代圖形卡相比,新的集成圖形卡架構(gòu)有望將每時(shí)鐘計(jì)算性能提高一倍,。憑借高于每秒1萬億浮點(diǎn)運(yùn)算次數(shù)的性能,,該架構(gòu)旨在提高游戲的可玩性。
此外,,英特爾在此次活動(dòng)上展示的第11代圖形卡幾乎將一款流行的照片識(shí)別應(yīng)用程序的性能提高了一倍,。
第11代圖形卡預(yù)計(jì)還將采用業(yè)界領(lǐng)先的媒體編碼器和解碼器,在有限的功耗配額下支持4K視頻流和8K內(nèi)容創(chuàng)作,。第11代圖形卡還將采用英特爾自適應(yīng)同步技術(shù),,為游戲提供流暢的幀速率。
4,、One API軟件
英特爾還推出了新的One API項(xiàng)目,,可以在單一開發(fā)環(huán)境之下,簡化跨CPU,、GPU,、FPGA、人工智能和其它加速器的各種計(jì)算引擎的編程,。
該項(xiàng)目包括一個(gè)全面,、統(tǒng)一的開發(fā)工具組合,以將軟件匹配到能最大程度加速軟件代碼的硬件上,。其公開發(fā)行版本預(yù)計(jì)將于2019年發(fā)布,。
5、內(nèi)存和存儲(chǔ)
英特爾還公布了英特爾傲騰技術(shù)以及相關(guān)產(chǎn)品的最新情況,。作為一款新產(chǎn)品,,英特爾傲騰數(shù)據(jù)中心級(jí)持久內(nèi)存集成了內(nèi)存般的性能、數(shù)據(jù)的持久性和存儲(chǔ)的大容量,。
這項(xiàng)技術(shù)通過將更多數(shù)據(jù)放到更接近CPU的位置,,能夠提高使應(yīng)用在AI和大型數(shù)據(jù)庫中的更大量的數(shù)據(jù)集能夠的處理速度。
其大容量和數(shù)據(jù)的持久性減少了對(duì)存儲(chǔ)進(jìn)行訪問時(shí)的時(shí)延損失,,從而提高工作負(fù)載的性能,。英特爾傲騰數(shù)據(jù)中心級(jí)持久內(nèi)存為CPU提供緩存行(64B)讀取。
一般來說,,當(dāng)應(yīng)用把讀取操作定向到傲騰持久內(nèi)存或請(qǐng)求的數(shù)據(jù)不在DRAM中緩存時(shí),,傲騰持久內(nèi)存的平均空閑讀取延遲大約為350納秒,。
如果實(shí)現(xiàn)規(guī)模化,,傲騰數(shù)據(jù)中心級(jí)固態(tài)盤的平均空閑讀取延遲約為10,000納秒(10微秒),,這將是顯著的改進(jìn)2。
在一些情況下,,當(dāng)請(qǐng)求的數(shù)據(jù)在DRAM中時(shí),,不管是通過CPU的內(nèi)存控制器進(jìn)行緩存還是由應(yīng)用所引導(dǎo),內(nèi)存子系統(tǒng)的響應(yīng)速度預(yù)計(jì)與DRAM相同(小于100納秒),。
英特爾還展示了基于英特爾1 TB QLC NAND裸片的固態(tài)盤如何把更多海量數(shù)據(jù)從硬盤遷移到固態(tài)硬盤,,從而可以更快訪問這些數(shù)據(jù)。
英特爾傲騰固態(tài)盤與QLC NAND固態(tài)盤相結(jié)合,,將降低對(duì)最常用數(shù)據(jù)的訪問延遲,。總體來說,,這些對(duì)平臺(tái)和內(nèi)存的改進(jìn)重塑了內(nèi)存和存儲(chǔ)層次結(jié)構(gòu),,從而為系統(tǒng)和應(yīng)用提供了完善的選擇組合。
6,、推出深度學(xué)習(xí)參考堆棧(Deep Learning Reference Stack)英特爾宣布推出深度學(xué)習(xí)參考堆棧(Deep Learning Reference Stack),,這是一個(gè)集成、高性能的開源堆棧,,基于英特爾至強(qiáng)可擴(kuò)展平臺(tái)進(jìn)行了優(yōu)化,。
該開源社區(qū)版本旨在確保人工智能開發(fā)者可以輕松訪問英特爾平臺(tái)的所有特性和功能,。深度學(xué)習(xí)參考堆棧經(jīng)過高度調(diào)優(yōu),,專為云原生環(huán)境而構(gòu)建。該版本可以降低集成多個(gè)軟件組件所帶來的復(fù)雜性,,幫助開發(fā)人員快速進(jìn)行原型開發(fā),,同時(shí)讓用戶有足夠的靈活度打造定制化的解決方案。
?。?)操作系統(tǒng):Clear Linux 操作系統(tǒng)可根據(jù)個(gè)人開發(fā)需求進(jìn)行定制,,針對(duì)英特爾平臺(tái)以及深度學(xué)習(xí)等特定用例進(jìn)行了調(diào)優(yōu);(2)編排:Kubernetes可基于對(duì)英特爾平臺(tái)的感知,,管理和編排面向多節(jié)點(diǎn)集群的容器化應(yīng)用,;(3)容器:Docker容器和Kata容器利用英特爾虛擬化技術(shù)來幫助保護(hù)容器;(4)函數(shù)庫:英特爾深度神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)核心函數(shù)庫(MKL DNN)是英特爾高度優(yōu)化,、面向數(shù)學(xué)函數(shù)性能的數(shù)學(xué)庫,;(5)運(yùn)行時(shí):Python針對(duì)英特爾架構(gòu)進(jìn)行了高度調(diào)優(yōu)和優(yōu)化,提供應(yīng)用和服務(wù)執(zhí)行運(yùn)行時(shí)支持,;(6)框架:TensorFlow是一個(gè)領(lǐng)先的深度學(xué)習(xí)和機(jī)器學(xué)習(xí)框架,;(7)部署:KubeFlow是一個(gè)開源、行業(yè)驅(qū)動(dòng)型部署工具,在英特爾架構(gòu)上提供快速體驗(yàn),,易于安裝和使用,。
結(jié)語:踏過荊棘的英特爾或?qū)⑷娉鰮粲⑻貭柦衲昕梢哉f是歷經(jīng)風(fēng)雨,在市場上和AMD,、英偉達(dá)等競爭對(duì)手交鋒激烈,,奉為圣經(jīng)的摩爾定律又屢遭質(zhì)疑。Jim Keller直接懟回去業(yè)界的風(fēng)言風(fēng)語,、力挺摩爾定律將長存的行為,,可以說是相當(dāng)干脆和直率。
在2018年收尾之際,,英特爾這一波大秀肌肉,,可見其不但對(duì)未來產(chǎn)品架構(gòu)走向有著清晰、全面且頗為自信的布局,,而且做好了從多方面解決問題并滿足一切計(jì)算需求的準(zhǔn)備,。
英特爾能否按著他們的既定計(jì)劃順利的走下去?10納米PC芯片能否在明年如約而至,?這些答案我們并不知道,,但英特爾這次在戰(zhàn)略規(guī)劃上的全面布局,針對(duì)行業(yè)發(fā)展痛點(diǎn)各個(gè)擊破的做法,,一方面會(huì)成為芯片產(chǎn)業(yè)下一階段發(fā)展很重要的參考,,另一方面也讓我們看到作為全球芯片巨頭的英特爾發(fā)起威來,虎軀一抖也足夠讓芯片屆為之一震,。