英特爾IDF2011在風(fēng)和日麗的13日終于落下帷幕,。本屆IDF以“智無界,,芯跨越”(Compute Continuum and Beyond)為主題,將進(jìn)一步展示英特爾如何通過從硬件,、平臺(tái)到軟件和服務(wù)全面的計(jì)算解決方案,,推進(jìn)個(gè)性化互聯(lián)網(wǎng)發(fā)展;同時(shí)面向中國市場如何支持本地合作伙伴創(chuàng)新,,助力新一代信息技術(shù)等戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展,。而回顧本次IDF,依然有很多情景讓我們覺得身臨其境,,再先進(jìn)的技術(shù)最后也只有一個(gè)用處,,那就是應(yīng)用在改變大家的生活當(dāng)中。
在此次的IDF上,,借助內(nèi)容豐富的主題演講,、技術(shù)課程和技術(shù)展示將Intel在技術(shù)與研發(fā)方面的最新成果加以詮釋,推動(dòng)用戶走在科技發(fā)展的最前沿,。其中,,作為英特爾在2011年的創(chuàng)新---第二代英特爾® 酷睿™處理器,代號(hào) Sandy Bridge的相關(guān)主題講座將成為此次IDF的重頭之一。
盡管SandyBridge平臺(tái)早在年初就已發(fā)布,,但對(duì)于多數(shù)用戶而言英特爾僅提升了概念性認(rèn)識(shí),。至于在實(shí)際應(yīng)用細(xì)節(jié)方面的實(shí)現(xiàn)并沒有明確的透露。而在此次IDF 2011論款上包括Intel首席高級(jí)工程師Opher Kahn,,首席多媒體工程師Hong Jiang博士等多位資深專家在現(xiàn)為廣大的與會(huì)者就Sandy Bridge平臺(tái)的微架構(gòu),、圖形處理單元、多媒體優(yōu)化以及高清圖形處理方面的設(shè)計(jì)思路和性能體驗(yàn)進(jìn)行了全面的解讀。
英特爾繼續(xù)履行其堅(jiān)定的承諾,,籍由下一代微架構(gòu)代號(hào)Sandy Bridge 來推動(dòng)處理器能力和指令集的發(fā)展,。這一革命性的微架構(gòu)構(gòu)建于32 納米制程技術(shù)之上,在提高能效的同時(shí),,具有更卓越的性能和能力,。整合顯示核心是Sandy Bridge處理器的一大改進(jìn)。
Sandy Bridge微構(gòu)架采用了可擴(kuò)展的環(huán)形互連架構(gòu),,將內(nèi)核,、最后一集高速緩存LLC和系統(tǒng)代理互連在一起,并且通過環(huán)上的數(shù)據(jù)存取總是選擇最短路徑,,這樣可以最小化延遲,。另外,環(huán)形的互連架構(gòu)讓Sandy Bridge具有更高的可擴(kuò)展性,,可以支持大量的處理器,。Sandy Bridge架構(gòu)的優(yōu)勢集中在:能效,性能優(yōu)化,,聯(lián)合CPU進(jìn)行了優(yōu)化,,增強(qiáng)的固有優(yōu)勢和媒體性能。
其前端微架構(gòu)的處理順序?yàn)椋?2K一級(jí)緩存>預(yù)譯碼>指令隊(duì)列>譯碼器>分支預(yù)測單元,。其中一級(jí)緩存為32KB的8路相連指令高速緩存,,譯碼器部分包含4個(gè)譯碼器,每個(gè)時(shí)鐘周期可處理器4條指令,,指令隊(duì)列處理方式包括微融合和宏融合,,可將多條指令時(shí)間打包為一條“微操作”或?qū)⒍鄬?duì)指令融合為一條復(fù)雜的“位操作”,譯碼流水線支持每個(gè)時(shí)鐘周期16個(gè)字節(jié),。
此外,,在前端微架構(gòu)處理器單元中還增加了一個(gè)譯碼微操作高速緩存,稱之為0級(jí)(L0)指令高速緩存,,代替了指令字節(jié),,對(duì)于大多數(shù)應(yīng)用高達(dá)80%的命中率,此外,,新架構(gòu)還帶來了更高的指令帶寬和更低的延遲,。譯碼高速緩存可以在每個(gè)時(shí)鐘周期遞送32字節(jié),更多時(shí)鐘周期可以保持每個(gè)周期4條指令,,并能夠縫合控制流程間的分支,,從而達(dá)到更高的效能,。
整合顯示核心可說是是Sandy Bridge處理器的又一改進(jìn),。與Westmere處理器所使用的MXM技術(shù)不同,Sandy Bridge處理器率先實(shí)現(xiàn)了將顯示模塊完全集成于芯片內(nèi)部,并允許其通過Ring Bus(環(huán)形總線)與處理器模塊共享三級(jí)緩存,,以提升整體性能,。
全新的Sandy Bridge圖形核心采取了統(tǒng)一的顯卡-CPU電源管理,可在CPU和顯卡之間的資源分配上達(dá)到最優(yōu)決策,,從而提升效能,,在顯卡中使用了CPU登記的電源管理技術(shù)。獨(dú)立的顯卡和CPU電源控制允許電源按工作量需求進(jìn)行分配,其電壓和時(shí)序都是獨(dú)立于CPU的,。
固定的模塊計(jì)算能達(dá)到最優(yōu)平衡,,在3D管道中每個(gè)點(diǎn)都有外在的固定功能模塊,從而達(dá)到低延時(shí),、高吞吐量,、簡單的驅(qū)動(dòng)編程模型,同時(shí)釋放著色器,,令其專注于渲染工作,。
特別是新一代的EU擁有更大的寄存器文件以提高并行度和復(fù)雜著色器的執(zhí)行效率,對(duì)深度嵌套條件也能有效優(yōu)化,,數(shù)學(xué)計(jì)算能力提高了4~20倍,,新的指令集與API、ISA一一對(duì)應(yīng),,從而在同頻率下達(dá)到更高效率,。固定模塊的設(shè)計(jì)去掉了正交狀態(tài),與上代產(chǎn)品相比,,驅(qū)動(dòng)運(yùn)行時(shí)間大幅降低,,釋放了CPU負(fù)載,將能量更多分配到顯卡上,。
比如在高清視頻解碼方面,,英特爾所采用的支持多格式編解碼器---MFX則是一種專用并行引擎。該引擎除了支持MPEG2,、VC1以及AVC等常見編碼格式還提供了對(duì)立體3D(MVC)的支持,。而憑借MFX引擎的有力支持,CPU本身的負(fù)載也得到了進(jìn)一步優(yōu)化,。
與上一代睿頻加速1.0技術(shù)相比,,睿頻加速2.0技術(shù)的設(shè)計(jì)方向更多的針對(duì)多線程應(yīng)用,不僅能夠提供更高的多線程加速頻率,,而且調(diào)節(jié)機(jī)制更具彈性,。當(dāng)啟動(dòng)一個(gè)運(yùn)行程序后,處理器會(huì)自動(dòng)加速到合適的頻率,,而原來的運(yùn)行速度會(huì)提升 10%—20% 以保證程序流暢運(yùn)行,;應(yīng)對(duì)復(fù)雜應(yīng)用時(shí),處理器可自動(dòng)提高運(yùn)行主頻以提速,輕松進(jìn)行對(duì)性能要求更高的多任務(wù)處理,;當(dāng)進(jìn)行工作任務(wù)切換時(shí),,如果只有內(nèi)存和硬盤在進(jìn)行主要的工作,處理器會(huì)立刻處于節(jié)電狀態(tài),。這樣既保證了能源的有效利用,,又使程序速度大幅提升。
而值得注意的是,,雖然設(shè)計(jì)在同一個(gè)芯片上,,但是Sandy Bridge的CPU和GPU使用分別的電壓和頻率,共同分擔(dān)芯片的整體功耗,,通過功耗預(yù)算,,CPU和GPU之間的調(diào)整使得在不同應(yīng)用中始終保持最佳的分配,當(dāng)CPU負(fù)載重時(shí),,GPU的能耗則相應(yīng)降低,,反之亦然。
關(guān)鍵字:英特爾 IDF2011 SandyBridge平臺(tái)
在多媒體指令集方面,,Sandy Bridge增加了Intel AVX指令集,,使用了新的執(zhí)行群集、存儲(chǔ)器群集,,可以擴(kuò)展SSE浮點(diǎn)指令集到256bit的操作數(shù),,采用新的無損源語法和矢量運(yùn)算,是面向低功耗的架構(gòu),,矢量對(duì)于許多應(yīng)用語言都是自然的數(shù)據(jù)類型,,更寬的矢量和無損源語可用更少的指令詳細(xì)描述更多的工作,使得現(xiàn)有工作得到有效擴(kuò)展,。Sandy Bridge的浮點(diǎn)運(yùn)算能力大幅增加,。AVX指令集可以利用2組128bit執(zhí)行棧,令執(zhí)行群集重新使用現(xiàn)有數(shù)據(jù)路徑達(dá)到雙重使用的目的,。
在渲染的時(shí)候,,光線跟蹤也好,光能傳遞也好都需要大量的計(jì)算,,這些工作都是由CPU提供的,。而核內(nèi)顯卡在3D管道中每個(gè)點(diǎn)都有外在的固定功能模塊,從而達(dá)到低延時(shí),、高吞吐量,、簡單的驅(qū)動(dòng)編程模型,同時(shí)釋放著色器,,令其專注于渲染工作,。
高精度星球?yàn)g覽器的現(xiàn)場演示
除了核心顯示在設(shè)計(jì)上的優(yōu)勢,,英特爾的技術(shù)人員特別演示了“高精度星球?yàn)g覽器”的應(yīng)用案例。無論是在第二代英特爾酷睿i5還是i7處理器中,,其內(nèi)建的核心顯卡均可以在高負(fù)荷的應(yīng)用下完成星球整體以及地表的圖形建模與高精度實(shí)時(shí)渲染。在高符合的渲染過程中,,第二代酷睿處理器所采用雙精度英特爾 高級(jí)矢量擴(kuò)展指令集(AVX)則是憑借四線程,、64位的優(yōu)化能力大大提升了整個(gè)過程的執(zhí)行速度,而這一優(yōu)勢是上一代產(chǎn)品所不具備的,。
英特爾早在今年第一季度正式發(fā)布基于Sandy Bridge架構(gòu)設(shè)計(jì)的處理器產(chǎn)品,,事實(shí)上早在去年9月底的IDF 2009舊金山站上,英特爾的高管StephenSmith就已經(jīng)拿出了桌面和移動(dòng)版本的Sandy Bridge處理器實(shí)物,,要知道那個(gè)時(shí)候甚至就連現(xiàn)在的32nm Westmere還沒有正式發(fā)布呢,,英特爾也借此表達(dá)了充分貫徹Tick-Tock策略的決心。
而時(shí)至今日,,在新一代SNB平臺(tái)已經(jīng)全面捕貨的同時(shí)時(shí)候,,我們看到作為Nehalem的繼任者,在實(shí)際應(yīng)用方面,,代號(hào)為Sandy Bridge的處理器在硬件特性方面還有著更多成長空間,。憑借全新的處理架構(gòu),更加智能的睿頻技術(shù),,全新的AVX指令集,,SNB可在家庭娛樂、日常辦公甚至服務(wù)器市場有著更多值得驚喜的表現(xiàn),,特別是其核內(nèi)顯卡在圖形以及并行處理應(yīng)用的改善讓我們對(duì)這一架構(gòu)發(fā)展有著更多的期待,。