新架構顯著升級性能和能效,高效滿足VR/AR,、機器智能與ADAS等新一代應用需求
2017年3月9日 ─ Imagination Technologies 宣布推出新一代的 PowerVR Furian 架構,,這是專為滿足下一代消費類設備持續(xù)演進的圖形與運算需求所設計的全新 GPU 架構。
VR/AR 和 convertibles 等應用需要更高的圖形分辨率與幀率,,而 ADAS 與機器智能等新興應用則需要更高的運算效率,。專為這些應用所設計的配件通常是采用14nm以下的先進制程,。Furian 可通過多重方式來提升性能可擴展性,以滿足這些需求,,同時采用可擴展的設計,,并專注于在最后的制程階段輕松實現(xiàn)系統(tǒng)整合與布局 (layout)。憑借采用 Furian 架構,,嵌入式產品將能以移動設備的功耗預算,,在長時間內提供高分辨率、沉浸式圖形內容以及數(shù)據(jù)運算功能,。
眾所周知,, 多年來PowerVR Rogue 架構已成為業(yè)界標竿;在此基礎之上,,F(xiàn)urian 架構專為強化能源效率所設計,,并再次擴大了與競爭解決方案之間的業(yè)界領先的每微瓦性能差距。擁有 Furian 與 Rogue 兩個功能強大的架構,,Imagination 將能滿足各種性能運算需求,,提供業(yè)界最完整與高效的 GPU IP 內核組合。
ABI Research 董事總經理兼Video,、OTT 和 AR/VR 副總裁 Sam Rosen 表示:“AR/VR 及機器學習等新興應用已為 GPU 帶來了更嚴酷的新需求,。針對這些應用,GPU 必須能執(zhí)行傳統(tǒng)圖形渲染之外的更多任務,,包括大量的通用運算作業(yè),。對 GPU 微架構來說,能在單一渲染畫面內不同階段中善于混合圖形與運算工作負載是很重要的,。通過 Furian架構,,Imagination 再次以其深厚的 GPU 專業(yè)技術積淀,,打造出一個專為支持這些下一代應用的完美架構,。”
Imagination 公司 PowerVR 事業(yè)部執(zhí)行副總裁 Mark Dickinson 表示:“我們開發(fā) Furian架構 就是為了應對新型態(tài)的新興應用,,并專注于有效的可擴展性,,從而擴展至好幾代的 PowerVR IP 內核。我們非常興奮能開始推出第一款以 Furian 架構為基礎的 8XT IP 內核,。這些內核將進一步強化 PowerVR 在高端移動性能領域的領導地位,。”
Furian 架構的重要特性
Furian 架構采用了多項使 PowerVR 得以建立技術領先地位的優(yōu)異特性,,包括 Imagination 的分塊式延遲渲染 (TBDR) 技術,,它已在多款的 PowerVR GPU 上獲得證明,可提供最高效率的嵌入式圖形功能,。
Furian 是專為以下特性所設計:
·多重性能可擴展性:Furian允許多種方式來進行擴展,,是專為達成最高效率的內核利用率與性能密度所設計,,以滿足各種市場與需求。針對低級與高級IP內核的不同設計,,無需因擴展而采取設計折衷,。
·簡易SoC與系統(tǒng)級集成:Furian已針對新的14nm以下制程進行了簡易布局的最佳化設計,因此能減少布局的時間與資源,,并能更輕松地擴展至更高的性能點,。
·可延展性:Furian的設計方式能讓未來的特定功能流水線與GPU緊密集成,因而能提供那些以傳統(tǒng)CPU/GPU/DSP方式實現(xiàn)起來成本太高甚至不可行的功能,,例如光線追蹤功能,。
·GPU 運算:Furian是專為滿足多種應用與市場日益提升的運算需求所設計,能夠高效使用包括 OpenCL? 2.0,、Vulkan? 1.0 和 OpenVX 1.1* 等運算 API,。Furian 增加了雙向的 GPU/CPU 一致性接口,可有效地分享數(shù)據(jù),;并從內核模式序列轉移至使用者模式序列,,能降低延遲和 CPU 的運算執(zhí)行占用率。
重要的是,,F(xiàn)urian 采用新的32寬 (32-wide) ALU 集簇設計,,以提升性能密度與效率。在主要與次要的 ALU 流水線中的新增指令集架構 (ISA) 可實現(xiàn)更佳的資源利用率與效率,,而多線程優(yōu)化能更高效和靈活地訪問片上本地運算內存,。
Furian的性能數(shù)據(jù)
性能密度、GPU效率,、以及系統(tǒng)效率的提升可為下一代應用提供更低功耗與更佳用戶體驗,。與采用相同制程技術的 Series7XT Plus GPU 相比,具備類似芯片面積預算的內核在相同的時間效率下,,F(xiàn)urian 可達到:
·35%的GFLOPS密度提升,,提供更佳的運算與游戲性能效率
·80%的填充率密度提升,提供更佳的UI與休閑游戲 (casual gaming) 性能效率
·70-90%的游戲精度提升 ─ 真實世界應用的結果甚至比預期的更高