《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業(yè)界動態(tài) > 手機也可以訓練視頻識別模型?麻省理工找到全新應用落地場景

手機也可以訓練視頻識別模型,?麻省理工找到全新應用落地場景

2019-10-16

14115158295389.jpg

近日,,麻省理工學院和IBM沃森人工智能實驗室的研究人員開發(fā)了一種新技術,可以在處理能力非常有限的手機或其他設備上訓練視頻識別模型,。用戶可以上傳任何照片,,并編輯建筑物、植物群和固定裝置外觀的工具,。視覺識別作為深度學習的最強技能,,已經(jīng)成為了計算機視覺算法可用來分析醫(yī)學圖像,使自動駕駛汽車成為可能,,并驅動人臉識別的發(fā)展,。

14115205241416.jpg

通常算法將視頻分割成圖像幀,并在每個幀上運行識別算法,。然后通過觀察對象在隨后的幀中的變化,,將視頻中顯示的動作拼接在一起。該方法要求算法“記住”它在每一幀中看到的內容,,以及它看到這些內容的順序,。新方法中,算法提取每一幀對象的基本草圖,,并將它們疊加起來,。算法可以觀察草圖中物體在空間中的移動,而不是記住什么時候發(fā)生了什么,。在測試中,,研究人員發(fā)現(xiàn),這種新方法訓練視頻識別模型的速度是現(xiàn)有方法的三倍,。它還能通過一臺小型電腦和照相機來識別手勢,,這些設備的電量僅夠給自行車燈照明用,。

這項新技術有助于減少現(xiàn)有計算機視覺商業(yè)應用中的延遲和計算成本。它可以通過加速自動駕駛汽車對傳入視覺信息的反應,,讓它們變得更安全,。還可以解鎖以前無法實現(xiàn)的新應用,比如讓手機幫助診斷病人或分析醫(yī)學圖像,。

麻省理工學院和IBM沃森人工智能實驗室的研究是這一日益增長的趨勢的一部分,,這種趨勢將最先進的模型縮小到更易于管理的規(guī)模,也為計算機視覺領域找到了更多的落地方向,。

當前計算機視覺的應用場景主要有以下幾個方向:

人臉識別

相關數(shù)據(jù)顯示人臉識別是人工智能計算機視覺領域中最熱門的應用,。人臉識別技術目前已經(jīng)廣泛應用于金融、司法,、軍隊,、公安、邊檢,、政府,、航天,、電力,、工廠、教育,、醫(yī)療等行業(yè),。據(jù)業(yè)內人士分析,我國的人臉識別產(chǎn)業(yè)的需求旺盛,,需求推動導致企業(yè)敢于投入資金,。目前,該技術已具備大規(guī)模商用的條件,,未來三到五年將高速增長,。而今年,這一技術有望在金融與安防領域迎來大爆發(fā),。

代表企業(yè):曠視科技,、依圖科技、商湯科技,、極鏈科技,、云從科技等。

視頻監(jiān)控

視頻監(jiān)控分析是人工智能計算機視覺領域中第二大熱門應用,。 人工智能技術可以對結構化的人,、車、物等視頻內容信息進行快速檢索,、查詢,。這項應用使得讓公安系統(tǒng)在繁雜的監(jiān)控視頻中搜尋到罪犯的有了可能,。在大量人群流動的交通樞紐,該技術也被廣泛用于人群分析,、防控預警等,。

視頻監(jiān)控領域盈利空間廣闊,商業(yè)模式多種多樣,,既可以提供行業(yè)整體解決方案,,也可以銷售集成硬件設備。將技術應用于視頻及監(jiān)控領域在人工智能公司中正在形成一種趨勢,,這項技術應用將率先在安防,、交通甚至零售等行業(yè)掀起應用熱潮。

代表企業(yè):商湯科技,、曠視科技,、依圖科技等。

圖片識別分析

靜態(tài)圖片識別應用熱度在視覺與圖像領域中排名第三,。將人工智能技術單純用于圖片識別分析的應用企業(yè)數(shù)量并不如預想的多,,可能有以下幾個方面原因:

1、目前視頻監(jiān)控方向的盈利空間大,,眾多企業(yè)的注意力都放在了視頻監(jiān)控領域,。

2、人臉識別屬于圖片識別的一個應用場景,,做人臉識別的大多數(shù)企業(yè)同時也在提供圖片識別服務,,但是銷售效果不佳,主要贏利點還在于人臉識別,。

3,、圖片識別大多商用場景還屬于藍海,潛力有待開發(fā),。

4,、圖片數(shù)據(jù)大多被大型互聯(lián)網(wǎng)企業(yè)所掌握,創(chuàng)業(yè)公司數(shù)據(jù)資源稀少,。

代表企業(yè):曠視科技,、極鏈科技、碼隆科技等,。

無人駕駛

隨著汽車的普及,,汽車已經(jīng)成為人工智能技術非常大的應用投放方向,但就目前來說,,想要完全實現(xiàn)自動駕駛/無人駕駛,,距離技術成熟還有一段路要走。不過利用人工智能技術,,汽車的駕駛輔助的功能及應用越來越多,,這些應用多半是基于計算機視覺和圖像處理技術來實現(xiàn),。

代表企業(yè):縱目科技、Waymo,、圖森科技,、馭勢科技、佑駕創(chuàng)新,、中天安馳等,。

工業(yè)視覺

機器視覺可以快速獲取大量信息,并進行自動處理,。在自動化生產(chǎn)過程中,,人們將機器視覺系統(tǒng)廣泛地用于工況監(jiān)視、成品檢驗和質量控制等領域,。機器視覺系統(tǒng)的特點是提高生產(chǎn)的柔性和自動化程度,。運用在一些危險工作環(huán)境或人工視覺難以滿足要求的場合;此外,,在大批量工業(yè)生產(chǎn)過程中,,機器視覺檢測可以大大提高生產(chǎn)效率和生產(chǎn)的自動化程度。

代表企業(yè):創(chuàng)想智控,、凱視佳,、拓視覺、帆聲圖像,、華??萍嫉取?/p>

隨著越來越多的人工智能研究被轉化為應用,,對更小模型的需求將會增加。國內也在計算機視覺領域加大了技術投資力度,,誕生了諸如商湯科技,、曠視科技、依圖科技,、極鏈科技等優(yōu)秀的人工智能初創(chuàng)企業(yè),。未來,這些優(yōu)秀的人工智能企業(yè)也會尋找到更多的落地場景,,繼續(xù)推動計算機視覺這一技術在應用場景快速落地,。


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點,。轉載的所有的文章、圖片,、音/視頻文件等資料的版權歸版權所有權人所有,。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者,。如涉及作品內容、版權和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]