科技發(fā)展日新月異,,科技結(jié)合圖像處理的應(yīng)用案例雨后春筍般地冒出,甚至融入我們的日常生活,,使生活質(zhì)量和效率大幅提升。本文就分享一些生活中的影像辨識應(yīng)用,,剖析計算機(jī)視覺與開放原始碼的運(yùn)用以及其帶來的效益,。
開源系統(tǒng)讓影像辨識成真
人腦在進(jìn)行影像辨識時,從眼睛接收圖像,,到大腦計算,,這個過程共需經(jīng)過七層關(guān)卡,其中包含影像亮度/色彩/邊界的擷取,、可識別的對象的組合,、大腦 30%~40% 的部位執(zhí)行視覺運(yùn)算與分析,最后才由大腦告訴你,,這個影像是什么,。
而關(guān)于計算機(jī)影像辨識,Intel 所發(fā)起的開源影像辨識系統(tǒng) OpenCV 便是不可或缺的主角,。這套開源系統(tǒng)讓開發(fā)人員在進(jìn)行相關(guān)辨識系統(tǒng)的開發(fā)時更加容易,,同時促進(jìn)相關(guān)技術(shù)的進(jìn)展。若計算機(jī)辨識系統(tǒng)要仿效人腦得到相近的視覺感受,,則必須經(jīng)過復(fù)雜的運(yùn)算,,以當(dāng)紅的虛擬現(xiàn)實(VR)、擴(kuò)增實境(AR)或是結(jié)合兩者的混合實境(MR)來說,,都必須計算出影像中各個對象的運(yùn)動狀況,、環(huán)境的影像復(fù)原和重建等。
計算機(jī)視覺系統(tǒng)基本架構(gòu)
OpenCV 可以在許多平臺上執(zhí)行,,以Webduino 為例,,其運(yùn)行Google Tensorflow.js后,讓硬件的開發(fā)者可以更簡單的使用網(wǎng)頁開發(fā)AI服務(wù),。這個云端平臺,,整合了從硬件到軟件,、軟件到云端、云端到行動裝置,,充分展現(xiàn) OpenCV 跨平臺的能力,!
將 OpenCV 結(jié)合攝影機(jī),擷取物體顏色,,經(jīng)過設(shè)定特定色彩范圍后,,OpenCV 也可以被來偵測熱區(qū)、對物體顏色進(jìn)行萃取,,甚至能將這項影像辨識技術(shù)結(jié)合機(jī)械手臂,,應(yīng)用在更多領(lǐng)域中。此外,,這項技術(shù)也能夠在攝影鏡頭偵測到的指定對象上畫上笑臉,,再利用 Google 大腦團(tuán)隊開發(fā)的 Tensorflow.js 進(jìn)行深度學(xué)習(xí),提升其偵測物體技術(shù)及準(zhǔn)確度,。目前 Webduino也正將這些程序信息整合成一個平臺,,在瀏覽器上就能直接進(jìn)行對象的分類及偵測。
Webduino 示意圖
另外一個應(yīng)用是農(nóng)業(yè),。在一望無際的西紅柿園里,,果實的顏色與大小總是參差不齊,通過設(shè)計蜂巢農(nóng)研影像,,利用 OpenCV 和 YOLO 進(jìn)行物體檢測,,將偵測到的西紅柿果實進(jìn)行框架并標(biāo)示,以作為自動采收系統(tǒng)中的視覺模塊核心,。經(jīng)過開發(fā)者不斷地嘗試與檢測,、調(diào)整程序,這套物體偵測系統(tǒng)能增快篩選速度并減輕人力負(fù)擔(dān),,有效提升工作效率,!
UGV 西紅柿采收項目中的物體偵測
車牌辨識知多少?
影像辨識技術(shù)日趨成熟,,應(yīng)用領(lǐng)域也更為廣泛,。在車牌辨識系統(tǒng)領(lǐng)域中,由于攝影機(jī)質(zhì)量大幅躍升,,現(xiàn)在已經(jīng)進(jìn)入車牌辨識乃至影像辨識的戰(zhàn)國時代,!傳統(tǒng) 2D 平面辨識系統(tǒng),辨識度低且分析速度慢,,而最新研發(fā)的 3D 立體辨識系統(tǒng)篩選速度快,,即使畫面中傾斜的車牌號碼也能清楚掌握。
為了追求更高的效率,設(shè)計者不斷嘗試讓系統(tǒng)能一次偵測「多車」的辨識程序,。目前 3D 立體辨識系統(tǒng)已能在相同時間內(nèi),辨識出多個車牌,,并普遍應(yīng)用在壓線拍照的停車場,、學(xué)校小區(qū)的柵欄感應(yīng)辨識、測速的高畫素多車偵測,、辨識側(cè)邊路旁車牌的車載等領(lǐng)域,。未來,若車牌辨識技術(shù)結(jié)合超高清(Ultra HD)攝影機(jī),,將賦予講究效率和質(zhì)量的「動態(tài),、多車、多車道」辨識系統(tǒng),,達(dá)到能夠運(yùn)用到更廣泛的生活層面,。
影像辨識結(jié)合醫(yī)療
為了解決偏鄉(xiāng)長者對于藥物服用、辨別較不熟悉的問題,,已經(jīng)有團(tuán)隊研發(fā)出 AI 自動給藥系統(tǒng)— UTOPIL,,設(shè)計團(tuán)隊以長者最常服用的 15 種藥物進(jìn)行辨識實驗,辨識結(jié)果正確率高達(dá)99.1%,!
起初設(shè)計團(tuán)隊利用機(jī)械手臂來旋轉(zhuǎn)藥物,,進(jìn)行多角度拍攝,擷取藥物影像,。如此作法雖然提升實驗速度,,機(jī)械手臂卻經(jīng)常捏碎藥丸,甚至有污染的風(fēng)險,,因此改以「真空吸取藥丸」的方式進(jìn)行辨識,,如此一來,藥物的形狀大小也不會受限制,,團(tuán)隊也將藥物辨識后的結(jié)果建立成數(shù)據(jù)庫,,并依照長者需求,定時發(fā)放藥物供長者服用,,以達(dá)到按時吃藥,、吃對藥物的目的。
這樣一個有系統(tǒng)性的藥物辨識技術(shù),,除了能協(xié)助居家長者服藥,,未來也盼能協(xié)助藥局快速分藥,或在鄉(xiāng)里間公共場所定期提供給藥服務(wù),,讓影像辨識技術(shù)發(fā)揮最大效益,,造福更多人群。
小結(jié)
從身邊的 iPhone X 所搭載的臉部辨識系統(tǒng),到隨處可見的車牌辨識,,影像辨識技術(shù)已融入我們的日常生活,。為了應(yīng)用在不同的場景,影像辨識所著重的技術(shù)重點也各不相同,,藉由結(jié)合特殊的算法,,或其他硬件輔助,便能快速應(yīng)用在不同領(lǐng)域,,以協(xié)助改善人類生活,,讓生活質(zhì)量大幅提升。相信未來的影像辨識應(yīng)用將會更加寬廣,,讓辨識算法更加精進(jìn),、使影像辨識技術(shù)更上一層樓。