人工智能作為一門新的、熱門的科學,,吸引了很多科研機構和企業(yè)的關注與研究,。近年來,人工智能產業(yè)取得了長足的進步,,很多AI相關的應用層出不窮,。但是,我們必須正視人工智能技術并不完善,,算力的不足造成了應用場景的局限,,未來幾年,,仍是企業(yè)研究的重點課題,。賽靈思作為全球領先的可編程邏輯完整解決方案的供應商,它們研發(fā),、制造并銷售范圍廣泛的高級集成電路,、軟件設計工具和作為預定義系統(tǒng)級功能的IP核,,賽靈思對AI的投入同樣備受關注。2018年7月18日,,全球最大的FPGA廠商賽靈思宣布收購中國AI芯片明星創(chuàng)業(yè)公司深鑒科技,,加速賽靈思在AI產業(yè)的布局,讓人們對AI抱有更多的關注和期待,。
2019年4月11日,,在“第八屆年度中國電子ICT媒體論壇暨2019產業(yè)核技術展望研討會”上,賽靈思人工智能市場總監(jiān)劉競秀給大家講述了人工智能計算的加速引擎以及享賽靈思對人工智能的理解,,下面是劉競秀演講的主要內容(編輯做了不改原意的改動),。
賽靈思人工智能市場總監(jiān)劉競秀
劉競秀:大家上午好,很高興與大家分享賽靈思對當今人工智能的理解和為此準備的解決方案,。在過去二十多年技術發(fā)展過程中,,我們經(jīng)歷了PC時代、互聯(lián)網(wǎng)時代,、移動互聯(lián)網(wǎng)時代,、AI時代,以及所面臨的下一個時代,,也就是AI+IoT時代,。PC時代,基本每個家庭擁有電腦,,有了互聯(lián)網(wǎng)之后,,人與人或者機器與機器間的連接慢慢賦予能力。隨著智能手機的普及,,智能終端數(shù)量超過全球人口數(shù)量,,每個人都有一個手機作為智能終端。現(xiàn)在大家都在討論AI,,講AI落地,,同時大家也在思考未來20年是什么樣,很可能是AI+IoT的時代,。
從計算的演變看高性能計算平臺的發(fā)展趨勢
AI并不是某一個行業(yè)或某個產品,,最終還是要落地在具體場景、行業(yè)和需求上,。AI最終是被所有需要做計算,、理解、感知的設備,、場景或服務提供本地計算能力和云端計算能力,,本質上AI是通用能力,就像電和內燃機,,它所賦能的并不是某一個特定行業(yè)狹窄的應用,,而是可以促進眾多行業(yè)的產業(yè)升級和產品迭代,。但不同行業(yè)對AI的需求以及理解是不同的。
AI的核心是高性能計算,,提到計算,,通常會想到CPU和GPU。CPU是用于通用計算的,,GPU用于做高性能計算從2012年開始,,人工智能快速發(fā)展,但是落地的場景比預期要差,,從我個人角度來講,,我認為有兩個剪刀差阻礙了這個時間點人工智能的落地。
第一個剪刀差是需要處理的數(shù)據(jù)和計算芯片所能夠提供的處理能力之間的剪刀差,。計算芯片工藝從過去28納米,、20納米, 16納米,,14納米,、10納米、7納米,、5納米,、3納米,摩爾定律使芯片性能增加速度越來越飽和,。大家看到技術的趨勢,,只有高端的消費類、迭代很快的產品(例如手機)才能支撐得起最先進工藝高昂的芯片迭代成本,。至于芯片的發(fā)展趨勢,,無論從CPU、GPU到FPGA,、ASIC,,對于通用芯片來講,它的好處是應用比較廣泛,、上手快,,大公司如谷歌、阿里也在做芯片,,眾多創(chuàng)業(yè)公司都在做各種各樣的ASIC,,希望在特定的定制領域提供一些場景和應用。對這些特定的場景和應用,,ASIC的性價比可能更高,,所以技術發(fā)展的趨勢一定是從CPU、GPU到FPGA,,最后到ASIC,。
所以市場上有一個重要的時間窗口,就是每個行業(yè)在需求成熟之前,,在大家有能力,、有信心去開ASIC把這個錢賺回來之前,大家不會去開ASIC,,而且這時候又需要一個平臺做初期的市場嘗試或者在激烈的市場競爭中快速將創(chuàng)意變成現(xiàn)實,, 贏得市場先機,這時候FPGA就是最好的計算平臺產品,。
第二個剪刀差就是芯片設計生產的長周期和快速迭代的市場需求之間的差距,。芯片不是那種靠錢就可以換時間的技術,最快也要一年半到兩年才有可能走完一個完整的流程,,從后端設計包括封測等,,這個一年到兩年的時間窗口是任何人做ASIC都要經(jīng)歷的。我們看現(xiàn)在的AI公司的客戶,,很多情況下需求都非常緊迫例如說我這個月有一個項目,,你能不能下一個月幫我把東西做出來,所以第二個剪刀差,,就是快速變化,、快速迭代的市場和ASIC開發(fā)周期漫長之間的差距,這也是第二個重要原因,。
AI變現(xiàn)能力迅速增強
這里跟大家分享了兩個我們認為技術發(fā)展趨勢的很關鍵的因素,,回來看這些應用場景。
如圖所示是過去這幾年各種各樣的AI相關的主流應用場景,。包括視頻和圖像相關應用,,基于語音相關的應用。跟視頻相關的,,最新的應用最多的,,還要感謝我們國家對于信息網(wǎng)絡安全的建設,中國的安防監(jiān)控系統(tǒng),。我們國家從2017,、2018到2020年,從政府層面會投三四百億來做平安城市,,做天網(wǎng)工程,,包括各種各樣的場景的視頻監(jiān)控和網(wǎng)絡的建設,這個場景本身視頻監(jiān)控的場景是很傳統(tǒng)的行業(yè),,但它對于AI的需求有個很明顯的變化,,我們發(fā)現(xiàn)布的攝像頭越多就需要越多的人來看,導致警察大量的時間花在看視頻上從而導致警力的不足,,而AI恰好可以在這一個痛點上極大的提高警察系統(tǒng)的效率,。它不需要準確地告訴你誰是壞人,,只要告訴你今天有十個嫌疑人是壞人,只要看這十個人就好了,。所以這點上AI是能夠幫助產業(yè)落地很重要的原因,,所以我們看過去這2017、2018年的行業(yè)龍頭,,股票漲得也非常好,。
除了這些行業(yè)應用的安防監(jiān)控,你會發(fā)現(xiàn)現(xiàn)在的高檔寫字樓,、高檔酒店,,跟人臉相關的也越來越多,包括機場,、火車站大量無人值守的閘機,。第二類跟網(wǎng)絡視頻相關,最近幾年有大量短視頻的網(wǎng)站興起,,對于這樣的公司,,他們有個很重要的剛需,就是內容審查機制?,F(xiàn)在都是靠大量的人力來做,,這是很有限的,而視頻審查在這方面可以極大地幫助這些公司緩解這方面的壓力?,F(xiàn)在大家都是靠花錢雇內部審查人員,,內部審查人員管理外包人員做審查。但一般的非實時短視頻業(yè)務相對比較容易做,,比如晚一兩個小時上線問題不大,,但直播類的比較難,而大量的AI公司現(xiàn)在做了基于文字,、基于人臉識別,,包括基于行為動作的審查機制的解決方案,現(xiàn)在在不同的場景,、不同的網(wǎng)絡節(jié)點都在做相應的嘗試跟大量的部署,,這是一類應用。第三類是跟消費類相關的,,例如無人值守超市.
跟汽車相關的應用是最近非常熱的話題了,,無論是自動駕駛、無人駕駛,,這些ECU ( 電子控制單元)最終都需要它具備一定的理解能力,,輔助中央控制器做相應的判斷和決策。跟語音相關的應用就非常豐富了,家里的聊天機器人,,小度,,包括手機里的siri,都是用AI做輔助的應用,,但語音相關的應用本質上來講和視覺相關應用相比還不足夠成熟,,這里面有一個很關鍵的因素,就是視覺相關的應用,,用CNA或者DNN做網(wǎng)絡檢測的應用,,能夠提供端到端解決方案的技術,,對于語音應用,,AI(例如LSTM)在語音應用里面,這樣的網(wǎng)絡模型只是不同語音模型中的一部分,,有大量的前處理跟后處理的技術,,跟AI沒有關系。所以人工智能在語音識別的技術里面只是眾多技術處理的環(huán)境中的一環(huán),,它不像視覺那樣,,比如說我把這個目標檢測出來了,這個任務就結束了,,但在語音里面,,中間這一環(huán)的效率有的時候會是瓶頸,有的不是瓶頸,,所以面對不同的場景,,人工智能能不能幫語音做更好的加速,是要看具體的客戶所選擇的方案,,這是很重要的一點,。第二點現(xiàn)在語音聊天機器人,基本上沒有能跟人一樣聊二十句,,這是能力的限制,,學術界來講,無論數(shù)字級多豐富,,訓練的網(wǎng)絡多深,,也沒辦法聊二十句,后面基本上是尬聊了,,這也是限制的另外一個很重要的因素,。
打造靈活應變萬物智能的世界
從賽靈思的角度來講,無論是萬物互聯(lián)還是大規(guī)模的超算,,我們需要做的事情是幫助客戶,、幫助市場提供快速部署的平臺,所以我們的目標就是提供靈活應變萬物互聯(lián)的高性能計算平臺。賽靈思去年換了新的CEO,,發(fā)布了新的戰(zhàn)略,,數(shù)據(jù)中心優(yōu)先,加速傳統(tǒng)的八大核心市場,,驅動自適應的計算,。我們傳統(tǒng)的市場大概分成這樣八個方向,簡單介紹一下,,第一類汽車,,在AI出來之前,賽靈思在汽車行業(yè)已經(jīng)深耕了十幾年,,有各種各樣的符合車規(guī)認證的車載芯片,。在通信領域,各種各樣的FPGA做高性能的信號處理,。包括航空航天,,傳統(tǒng)的工業(yè)控制、醫(yī)療,,包括儀器儀表,,我們過去調侃國內的AI芯片創(chuàng)業(yè)公司,我們說這幾家做AI芯片的創(chuàng)業(yè)公司自己誰都沒賺到錢,,但把賣儀器儀表的公司都支持得非常非常好,。
簡單介紹一下我們下一代的Versal計算引擎,我們首先是面對通信和人工智能高性能場景,,定義了完全不一樣的芯片架構,,我們利用3D技術提供高性能的高帶寬存儲,提供兩個能力,,一個是計算能力,,一個是存儲能力,人工智能的網(wǎng)絡都是幾十幾百層,,幾千萬上億參數(shù)的快速運算和反復的讀取,,如果每一層的數(shù)據(jù)運算的結果都需要去讀寫的話,一個是延時長,,一個是功耗大,,所以為什么現(xiàn)在主流做AI芯片慢慢會提供盡可能大的存儲空間,而3D的技術是最有效提供高性能面向存儲的技術,。同時我們充分利用硬核處理器功能,,支持AI場景的快速運算。
從人工智能的解決方案來講,,我們希望為客戶提供端到端的解決方案,,又回來講,我們在過去幾年接觸所謂的AI客戶碰到的窘境,大家做芯片本身沒有那么難,,無論是AI芯片包括其它的芯片,,包括我們國家自己做的各種CPU,把芯片本身做出來不難,,但是為了幫客戶用起來,,需要的軟件、生態(tài)環(huán)境,、工具鏈,,各種參考應用,這些需要花更長的時間,,更多的資源才需要客戶把產品用起來最關鍵最核心的因素,。所以我們希望提供整套的產品,為客戶提供不同層次的支持,,從底層的硬件,,中間各種各樣的IP以及軟件,,應用層各種各樣的神經(jīng)網(wǎng)絡模型,,都可以提供給客戶,所以理論上來講,,客戶可以選擇我們不同的神經(jīng)網(wǎng)絡,,選擇合適的芯片、合適的硬件,,這些PCB的板卡都比較成熟,,無論是賽靈思,我們的合作伙伴,、客戶都有能力做這些硬件,。結合賽靈思傳統(tǒng)的開發(fā)軟件,把這些整套的AI相應的工具用起來,,就可以快速地實現(xiàn)產品的部署,。
從行業(yè)的角度來講,我們希望提供的是一個通用的AI解決方案,,換句話來講,,我們的AI解決方案并不是只能做人臉或者只能做車輛檢測,為了實現(xiàn)這樣的目的,,我們做了兩件事情,,第一件事情是在底層定義了自己的指令級和IP,這些IP是非常高效的定制IP,,就是來專門為人工智能做不同的算子,,比如特殊編程,提供定向加速的IP,定向到相應的指令,,但這還是很底層的硬件開發(fā)能力,。我們開發(fā)了工具,通過這些工具和SDK為客戶提供了接口,。所以客戶不需要寫任何一行代碼,,只需要把我們調用起來,就可以支持不同行業(yè)不同場景的應用,。所以無論是人臉,、車輛等等都是不同的CNA,它們核心的算子都是一樣的,,就是網(wǎng)絡架構和參數(shù)配置不一樣,,然后生成不同的指令,最終運行在不同的硬件平臺上,。所以我們希望通過這樣一個通用的處理器平臺,,為客戶提供一個比較高效的開發(fā)用戶體驗。
我們都知道,,F(xiàn)PGA很多場景應用都非常高,,代價就是周期比較長,三個月六個月一年都可能,,但用我們現(xiàn)有的方案,,最快幾個小時就可以把新的網(wǎng)絡部署在硬件上,就可以把系統(tǒng)運行起來,,這對人工智能的創(chuàng)業(yè)公司和合作伙伴來講是最重要的,,可以非常快地拿到一個原型機,,用這些原型機去真正的場景做性能,、功能的迭代、數(shù)據(jù)的收集,,這樣產品才能更快地比別人推向市場,。
下面簡單跟大家分享一下我們在模型庫方面的一些積累,這些主流的模型,,我們并不是說賽靈思在這些方面做得多不一樣,,我們只是說賽靈思作為一顆傳統(tǒng)的FPGA芯片公司,現(xiàn)在已經(jīng)慢慢走向另外一個維度,,我們希望為客戶提供的不單是一顆芯片,,以及圍繞芯片的PCB層面的參考設計,現(xiàn)在幫客戶提供的是,,基于芯片,、IP加上工具,,以及客戶在真實場景中真實應用的算法,整個一套都幫客戶提供參考設計,,而參考設計的神經(jīng)網(wǎng)絡,,對我們來講通常會免費提供給客戶,目的是幫助客戶更好的使用基于賽靈思FPGA的解決方案,。所以第一類我們剛才講了,,無論是給警察用,包括重要領導人的出訪,,事前事中事后的布防,,包括追蹤等等,車輛信息的檢測,,包括車牌,、車的型號,包括行人衣服的顏色,,有沒有戴眼鏡等等信息都是最基本的,。我們想說,賽靈思現(xiàn)在有能力幫助客戶提供各種各樣的應用層面的參考設計跟行人參考的應用,,行人關鍵點的檢測,,這都是很普通的應用,我們更希望這些應用是給人和機器之間提供了另外一類人機交互的接口,。我舉個例子,,很多人都玩過無人機,,大家玩的時候要么兩個手拿手機,,要么兩個手拿控制器,但是有了人機交互新的界面之后,,有些特定的動作,,拍照、錄視頻等等,,可以極大地提升娛樂性,。
包括跟車輛相關的應用,左上角是自動駕駛最基本的功能,,做語義分割,,分配和判別這個像素是屬于哪一堆,然后再判斷這一堆是天空,、樹,、可行駛的區(qū)域道路等等,然后紅綠燈交通牌等等所有信息都是拿來做各種各樣的基本信息的提取單元,。我們在車上的應用現(xiàn)在主流的應用包括激光雷達,、攝像頭等,,各種各樣的前置后置環(huán)置,車內的監(jiān)控,,對駕駛員,、乘客的監(jiān)控,各種各樣的場景都是基于我剛才提到的各種各樣的模型,,無非就是目標檢測,、識別跟蹤。激光雷達稍微多講一點,,賽靈思現(xiàn)在市占率90%,,很重要的原因是現(xiàn)在全世界大概有大約幾十家主流的做激光雷達的公司,大家的方案和產品的技術路線差異非常非常大,。這又帶來一個問題,,沒有誰能夠做一顆計算平臺能夠覆蓋差異這么大的平臺開發(fā),這恰好是FPGA最好的市場,,未來的時間里,,F(xiàn)PGA仍然是計算平臺的提供者。
在消費者領域,,我們通常會講,,消費者領域對價格會比較敏感,但是還是會有很多高端的消費類產品,,愿意用稍微高的價格,,采用高性能的芯片。我舉個例子,,我們辦公室里面有四顆會議監(jiān)控系統(tǒng),,大概要幾十萬一套,誰講話就自動把鏡頭注目到這個人臉上,,這是最簡單的,,用人工智能提升用戶體驗的方式,包括一些高端的投影儀,,需要用一些手勢來做控制,,包括用AI來做超分,各種各樣的場景在傳統(tǒng)消費類市場里面會有不同的需求和應用,。
最后跟大家分享一下,,在過去,賽靈思為了讓客戶更好地用我們產品,,我們做的努力,。傳統(tǒng)的方式就是提供RTL full design工具,這是傳統(tǒng)領域適用的,。主流的人工智能公司都是算法公司,,他們都不知道FPGA是干什么的,,慢慢我們會提供各種各樣的工具、底層的功能模塊,,比如網(wǎng)絡接口,、物理層各種各樣的接口和計算單元,剛才我們提到的DPU也是IP的一種,,基于這種IP,,如果我沒有現(xiàn)成的IP就會提供給客戶,但客戶說我還有其它功能,,沒有IP怎么辦,,就會提供HLS,通過工具把這些代碼自動轉成底層的代碼,,再往后我們在嵌入式系統(tǒng)層面提供各種各樣的系統(tǒng),,包括車載的系統(tǒng)等等,我們會幫助客戶在嵌入式層面,,把相應的東西盡可能配置好,,減少客戶開發(fā)周期,最終在應用層面,,會提供應用層面的庫,,比如說剛才看到的人工智能的網(wǎng)絡庫。在平臺層面,,我們會把不同的應用放在AWS,、阿里云、華為云上,,這樣客戶用華為云的方式調用我們的IP,。最終我們會提供各種各樣的端到端的IP。這是我們在過去幾年賽靈思做的很大的轉變,,通過這種轉變我們也希望能夠在未來人工智能時代配合客戶和合作伙伴快速地進行產品落地,。謝謝大家!