“英特爾中國研究院開放日”今天在北京舉行,,英特爾中國研究院院長宋繼強率領(lǐng)團隊集體亮相,,共同分享了英特爾中國研究院的整體定位、研究方向和創(chuàng)新機制,,并展示了在人工智能、機器人、5G,、虛擬現(xiàn)實等一系列前瞻科技領(lǐng)域的最新研究成果。
作為英特爾英特爾研究院在海外設(shè)立的三個“地區(qū)性的研究機構(gòu)”之一,,英特爾中國研究院(Intel Labs China, ILC)目前主要聚焦于研究與未來自主系統(tǒng)相關(guān)的關(guān)鍵技術(shù),,包括人工智能算法、自主系統(tǒng)平臺和智能基礎(chǔ)設(shè)施三大部分,。
英特爾中國研究院院長宋繼強表示:“英特爾中國研究院致力于打造世界一流的工業(yè)研究院,,通過突破性的成果打造英特爾的創(chuàng)新引擎,保持英特爾的技術(shù)領(lǐng)先性,。它不僅著眼于未來革命性的科技研究,,還承載著將研究成果轉(zhuǎn)化至全球及中國本土創(chuàng)新產(chǎn)品的使命。我們既要作務(wù)實的探險家,,又要作大膽的實踐者,。面向未來,我們將始終秉承英特爾50年來推動摩爾定律的精神來加速推動創(chuàng)新,,推動產(chǎn)業(yè)和社會向前發(fā)展,,讓科技的進步普惠每一位世界公民?!?br/>
英特爾中國研究院院長宋繼強介紹研究院定位及最新成果
英特爾中國研究院代表介紹研究院主要研究方向
與視覺理解相關(guān)的人工智能算法:
讓機器更懂你
該研究方向主要包括人臉識別技術(shù),、情緒識別、場景理解等技術(shù)以及深度神經(jīng)網(wǎng)絡(luò)壓縮技術(shù),?;谙冗M的人工智能算法,英特爾中國研究院開發(fā)了視覺內(nèi)容理解和視覺內(nèi)容創(chuàng)建能力,,能夠創(chuàng)造前所未有的體驗,。前瞻性的視覺理解、視覺認知主要涉及三個方面:人臉分析和情感識別;針對視覺識別高效的視覺壓縮,;視覺,、語言和知識融合。在此次開放日活動中,,英特爾中國研究院的專家重點介紹了三個方面的最新技術(shù)進展,。
1.人臉分析及情感識別技術(shù)
在人臉分析和情感識別方面,英特爾中國研究院很早便擁有最先進的算法,,并且在EmotiW比賽(自然環(huán)境下的情感識別比賽)中獲得冠軍,,該算法的速度是第二名團隊的200倍,可以應(yīng)用于無人駕駛的場景當中,?;谟⑻貭枌崟r人像風格遷移系統(tǒng),英特爾中國研究院將多種藝術(shù)人像風格實時遷移到靜態(tài)的目標圖像以及動態(tài)的目標視頻中,。該項技術(shù)可以廣泛地應(yīng)用于AR/VR,、在線直播、影視,、多媒體社交等領(lǐng)域,。
此外,英特爾中國研究院基于機器學習和深度學習算法開發(fā)了英特爾3D人臉面部表情捕捉技術(shù),。英特爾研究員們從數(shù)十萬人臉圖片數(shù)據(jù)中,訓練出多個人臉識別模型,,用于對視頻圖像進行智能分析與3D建模,,不僅可以檢測與識別人臉,還能精準重建3D人臉,,并實時跟蹤面部表情變化,,將預(yù)先設(shè)計好的特效素材附著在3D人臉上并疊加到視頻中,從而實現(xiàn)逼真炫酷的臉部特效,。
2.深度神經(jīng)網(wǎng)絡(luò)壓縮技術(shù)
當前,,深度學習領(lǐng)域目前面臨的一大挑戰(zhàn)是,主流DNNs都是計算和存儲密集型的,,這導致在邊緣和嵌入式設(shè)備的部署面臨巨大的挑戰(zhàn),。為此,英特爾中國研究院提出了從動態(tài)網(wǎng)絡(luò)手術(shù)DNS,、漸進網(wǎng)絡(luò)量化INQ到MLQ多尺度編碼量化的低精度深度壓縮解決方案,。通過這“三部曲”,可以獲得百倍DNN模型無損壓縮性能,。根據(jù)AlexNet測試結(jié)果,,該項簡潔的解決方案能夠超越主流深度壓縮方案至少一倍,在2/4-bit精度下達到超過100倍的網(wǎng)絡(luò)壓縮。
3.多模態(tài)圖像視頻解析
近年來,,如何自動生成視頻描述引起了研究人員的廣泛興趣,。人們希望計算機在看到一段視頻的時候,可以根據(jù)視頻的內(nèi)容“講故事”,。但是,,視頻描述模型的訓練通常需要大量復雜的并且?guī)в幸欢ㄖ饔^性的人工標注。而在目前的數(shù)據(jù)集構(gòu)建過程中,,標注人員會在看過一段視頻之后,,用一句話描述視頻的內(nèi)容。但是,,一段視頻通常會發(fā)生幾個不同的事件,,而由于標注人員具有一定主觀性,人們既不知道其描述的是哪個事件,,也不知道其所描述的事件對應(yīng)不同幀上的哪個區(qū)域,。
為此,英特爾中國研究院率先提出了弱監(jiān)督視頻密集描述生成的方法,,不需要訓練數(shù)據(jù)對視頻中的不同事件和對應(yīng)區(qū)域進行分別標注,,而僅僅使用標注員對視頻的一句話描述,就可以自動產(chǎn)生多角度的視頻描述,,并且從中挑選出最具代表性的描述語句,。這樣,計算機就不用人“手把手教”,,而是可以做到“舉一反三”,。
自主系統(tǒng):
創(chuàng)造機器人的“英雄”時代
自主系統(tǒng)是與人工智能相關(guān)的一個研究方向。英特爾中國研究院的目標是推出一套基于CPU+FPGA異構(gòu)計算的自主智能機器人開發(fā)平臺,,幫助研究人員基于此平臺進行開發(fā),。之所以引入異構(gòu)平臺,是因為機器人研究需要同時引入時間和空間計算模型,。CPU作為時間計算模型的完美代表,,指令按時間順序一條一條執(zhí)行,可以實現(xiàn)靈活多變的控制,;加速器則更像一種空間計算模型,,利用空間的并行從而一次性完成大量數(shù)據(jù)處理,使復雜的計算得到加速處理,。
基于這一目標,,HERO智能機器人開放平臺(Heterogeneous Extensible Robot Open Platform)應(yīng)運而生。它是英特爾中國研究院專為智能機器人(包括服務(wù)機器人,、醫(yī)療機器人,、自動駕駛汽車等)打造的一套低功耗,、高性能、體積小的異構(gòu)系統(tǒng)平臺方案,。在此方案中,,CPU作為控制中心,與FPGA和其它專用加速器芯片(如Movidius的VPU)搭配,,能夠提供高效的性能,。整套HERO硬件系統(tǒng)采用了英特爾酷睿?系列CPU,搭載英特爾Arria 10 GX系列1150型FPGA作為異構(gòu)加速器,,能夠?qū)崟r處理大量數(shù)據(jù)并運行多種智能算法,。
在本次開放日活動上,英特爾中國研究院宣布圍繞HERO平臺推出全新的合作伙伴計劃,。圍繞該項計劃,,英特爾中國研究院致力于攜手業(yè)界的平臺級、應(yīng)用級和生態(tài)級合作伙伴,,通過研發(fā)合作,、學術(shù)創(chuàng)新和行業(yè)示范,共同打造一套完整,、高效和開放的平臺,,不斷擴展應(yīng)用場景,加速技術(shù)和產(chǎn)品的落地,。
智能基礎(chǔ)設(shè)施:
加速通信和計算的融合
該項研究主要面向保障未來大規(guī)模智能聯(lián)網(wǎng)設(shè)備順利工作的支撐技術(shù),,包括無線通信技術(shù)和智能存儲技術(shù)。前者研究在網(wǎng)絡(luò)接入端的MIMO技術(shù)和移動邊緣計算技術(shù),;后者研究使用英特爾最新的3D存儲技術(shù)和FPGA構(gòu)建的智能化方案來提供高吞吐量,、低延遲、有增值服務(wù)潛力的技術(shù),。
在本次開放日活動中,英特爾介紹了如何面向5G下一代通信網(wǎng)絡(luò),,借助通信與計算的融合打造高質(zhì)量的VR體驗,。當前,為了滿足高質(zhì)量虛擬現(xiàn)實體驗的需求,,當下的高清體驗需要實現(xiàn)25-40倍的分辨率提升,。為此,英特爾希望通過計算和網(wǎng)絡(luò)的融合,,以端到端方式實現(xiàn)網(wǎng)絡(luò)擴容,,從而打造遠程沉浸式的互動體驗。
英特爾演示了超高分辨率全景視頻采集系統(tǒng),,它主要適用于無線VR設(shè)備,,用戶可以身臨其境地觀賞全景視頻,或者參與VR游戲互動。它使用了ISP總線同步相機快門,,通過分布式構(gòu)架處理采樣圖像,,同時利用光流法拼接全景視頻,并插值立體信息,。該系統(tǒng)同時采用英特爾核心GPU高性能壓縮圖像,,通過無線傳輸將主機渲染輸出到遠程終端,并利用OFFLOAD技術(shù)降低顯示延遲,。有了這些技術(shù),,電視觀眾即使在家里也能感受到奧運會前排座席的觀賽體驗,或者選擇場館內(nèi)不同的觀賽角度,。