NEC攜手東京工業(yè)大學，以AI技術(shù)視覺識別度-AET-電子技術(shù)應(yīng)用

NEC攜手東京工業(yè)大學，以AI技術(shù)視覺識別度

日期： 2017-08-11

關(guān)鍵詞： 視覺識別 NEC

　　視覺識別系統(tǒng)是指將企業(yè)的一切可視事物進行統(tǒng)一的視覺識別表現(xiàn)和標準化、專有化。通過VI，將企業(yè)形象傳達給社會公眾。視覺識別系統(tǒng)(VI)又可分為兩大主要方面：一是基礎(chǔ)系統(tǒng)，包括企業(yè)名稱、品牌標志、標準字體、印刷字體、標準圖形、標準色彩(宣傳口號、經(jīng)營報告書和產(chǎn)品說明書等八大要素;二是應(yīng)用系統(tǒng)。它至少包括十大要素，即產(chǎn)品及其包裝、生產(chǎn)環(huán)境和設(shè)備。展示場所和器具、交通運輸工具、辦公設(shè)備和用品、工作服及其飾物、廣告設(shè)施和視聽資料、公關(guān)用品和禮物、廠旗和廠徽、指示標識和路牌等等。

　　NEC與日本國立大學法人東京工業(yè)大學工學院奧富正敏教授、田中正行特定副教授的研究團隊(以下簡稱東京工業(yè)大學)共同開發(fā)了“多模(注1)圖像融合技術(shù)”，通過AI技術(shù)將一般攝像頭拍攝的可見光圖像與熱成像相機拍攝的非可見光圖像進行自動高效合成，且提高了單個圖像拍攝時的視覺識別度。

　　在需要瞬時視覺識別的各個領(lǐng)域中利用此項技術(shù)，即便在惡劣條件下也可以實現(xiàn)正確判斷。例如，夜間或濃霧等惡劣天氣條件下也可以正常進行的設(shè)施監(jiān)控;即便迎面行駛汽車的刺眼的車燈及黑暗造成視覺死角也可以使用的自動駕駛支持;不僅可以監(jiān)測建筑表面的裂縫，還可以監(jiān)測其內(nèi)部異常的基礎(chǔ)設(shè)施點檢等。

　　以往想要合成不同種類攝像頭拍攝的圖像需要專家進行復(fù)雜的手動合成作業(yè)。而此技術(shù)則將各種攝像頭采集的圖像通過AI技術(shù)自動高效合成，無需手工操作。并且充分利用可見光圖像和非可見光圖像各自的優(yōu)勢，即便是以往人眼難以看清的場景也可以獲得較高的視覺識別度。

　　NEC與東京工業(yè)大學今后也將繼續(xù)通過產(chǎn)學合作形式共同研發(fā)支撐各項社會基礎(chǔ)設(shè)施安心安全運轉(zhuǎn)的圖像處理以及AI相關(guān)技術(shù)。

　　【背景】

　　近年來，在圖像傳感器的不斷升級及成本持續(xù)下降的背景下，將熱成像攝像頭及可捕捉物體內(nèi)部構(gòu)造的X光?太赫茲波?毫米波攝像頭等非可見光攝像頭應(yīng)用到夜間、濃霧等惡劣天氣、逆光、遮蔽等不利條件下的監(jiān)控及診斷的情況越來越普及。但是這些非可見光攝像頭比可見光攝像頭的分辨率和畫質(zhì)都要低，視覺識別起來很困難，因此需要將可見光攝像頭與之配合在一起使用，通過對比雙方的圖像進行監(jiān)視和診斷。因此，想要快速精準地判斷對象物體的狀況是比較困難的。為解決這個課題，最好的辦法就是將兩種圖像合成一個圖像，但是過去的合成辦法需要精通攝像頭和攝影環(huán)境的專家親自手動調(diào)整，從各自單獨的圖像中抽取出適于合成的部分，一邊注意防止過度曝光和曝光不足以及噪點增強破壞圖像等問題，一邊進行復(fù)雜的圖像合成作業(yè)。另外，在非可見光中包含的用于判斷異常及危險物的特征很可能因為合成造成丟失，這也是一個重要課題。

　　NEC與東京工業(yè)大學通過學習了專家的變換技能的AI技術(shù)，將可見光攝像頭與非可見光攝像頭拍攝的圖像自動高效統(tǒng)合，提高對象物?狀況的視覺識別度，共同開發(fā)了即便在惡劣環(huán)境下也可以快速判斷是否存在異常或危險物的“多模圖像融合技術(shù)”。

　　圖1：本技術(shù)適用例(注2)

　　【新技術(shù)的優(yōu)點】

　　AI技術(shù)自動從多個圖像中選擇出視覺識別度高的圖像，并在強調(diào)非可見光中包含的細小特征的同時進行圖像合成，從而實現(xiàn)打破以往局限性的高度視覺識別。

　　AI技術(shù)會根據(jù)熱成像攝像頭、太赫茲攝像頭等攝像頭種類、環(huán)境特征(亮度、光線方向、有無障礙物)等不同條件，對圖像內(nèi)各部分的視覺識別度的高低進行評價，從而從各個圖像中自動抽取出最適宜的部分。

　　此外，AI技術(shù)在處理非可見光攝像頭拍攝的圖像時，會針對異常及危險物的細小特征進行解析，進行適當?shù)膹娙跽{(diào)整以避免因過度曝光及曝光不足而破壞圖像，從而自動生成以往無法實現(xiàn)的高視覺識別度的多模(可見光-非可見光)融合圖像。

　　(注1) Multimodal(多模)

　　多種模式、形態(tài)。本文中提到的多模是指可見光攝像頭拍攝的圖像和紅外線攝像頭等非可見光攝像頭拍攝的圖像。

　　(注2) 獲得創(chuàng)新研發(fā)推進項目(ImPACT)Tough Robotics Challenge關(guān)于惡劣環(huán)境模擬設(shè)備的許可并使用。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

NEC攜手東京工業(yè)大學，以AI技術(shù)視覺識別度

日期： 2017-08-11

相關(guān)內(nèi)容