《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > MEMS|傳感技術(shù) > 業(yè)界動(dòng)態(tài) > 2016年展望 語音 圖像識(shí)別及大數(shù)據(jù)

2016年展望 語音 圖像識(shí)別及大數(shù)據(jù)

2016-02-17

  圖像、語音成為近兩年最熱門的概念,,所謂娛樂驅(qū)動(dòng)市場,市場驅(qū)動(dòng)技術(shù)發(fā)展,。在多元化的互聯(lián)網(wǎng)圈里“好玩”才能紅,而圖像與音像也從過去的美化處理往更高深的技術(shù)領(lǐng)域前進(jìn),,在2016年,,智能的語音識(shí)別和圖像識(shí)別將走進(jìn)普通人的生活中,它們會(huì)有哪些展望和動(dòng)作呢?讓我們所見所聽的世界將變得生動(dòng)起來,。

  語音識(shí)別

  語音識(shí)別技術(shù)雖然起源于1952年,,但真正進(jìn)入消費(fèi)市場已經(jīng)是上世紀(jì)90年代的事了。目前語音識(shí)別有兩大發(fā)展方向,,一個(gè)是純機(jī)械指令,,基于產(chǎn)品定位而設(shè)計(jì)命令詞組,作為高效的輔助工具存在;一個(gè)是智能化理解語境,,與人進(jìn)行互動(dòng)交流,,并承擔(dān)部分處理工作,。后者可能是語音識(shí)別未來的發(fā)展方向,但實(shí)際應(yīng)用中兩者并不沖突,。簡單精準(zhǔn)的機(jī)械指令讓工作更為純粹,,沒必要做多余的計(jì)算動(dòng)作。而很多智能設(shè)備將語音作為“解放雙手”的第三類互動(dòng)形態(tài),,就需要對(duì)人的語境進(jìn)行“理解”,,相信很多朋友都玩過siri、GoogleNow,、Cortana,,也同時(shí)體驗(yàn)過這些語音助手“會(huì)錯(cuò)意”的賣萌行為。老羅在去年堅(jiān)果發(fā)布會(huì)上曾說所有語音助手都是“偽”智能,,雖然有點(diǎn)以偏概全,,但目前語音對(duì)語境的識(shí)別確實(shí)還不夠智能,遠(yuǎn)不如機(jī)械指令效率,。不過這些問題隨著深度學(xué)習(xí)等AI領(lǐng)域技術(shù)的崛起將逐漸克服,。

  圖像識(shí)別

  圖像識(shí)別從以圖搜圖到明星、物體識(shí)別,,再到場景識(shí)別,,甚至現(xiàn)在延伸到了視頻領(lǐng)域,給行業(yè)帶來了太多驚喜?,F(xiàn)在圖片內(nèi)容的價(jià)值已經(jīng)超越圖片本身,,并且建立了從圖片到電商的商業(yè)模式。圖像識(shí)別一般針對(duì)畫面中一個(gè)對(duì)象做識(shí)別,,比如大眾熟知的人臉、明星臉等識(shí)別技術(shù)已經(jīng)很成熟了,,基本識(shí)別率達(dá)到90%以上,。近年、服飾品牌的同款識(shí)別和風(fēng)景識(shí)別大行其道,,為旅游行業(yè)和服飾行業(yè)創(chuàng)造了商機(jī),。圖像識(shí)別在視頻領(lǐng)域涌現(xiàn)出強(qiáng)大的應(yīng)用前景,新興起的互動(dòng)視頻技術(shù)video++已經(jīng)實(shí)現(xiàn)視頻中的人臉和服飾同款的識(shí)別,,基于圖像識(shí)別技術(shù)發(fā)展視頻中的商業(yè)場景,。另外瞳孔識(shí)別的研究已經(jīng)提上日程,不久的將來,,科幻片中所見即所得的情景不再是幻想,。

  深度學(xué)習(xí)

  沒有基礎(chǔ)的技術(shù)實(shí)力,語音和圖像是好玩不起來的,,而高級(jí)和低級(jí)的門檻就在深度學(xué)習(xí)的研究上,。國內(nèi)雖然起步較晚,,好歹在去年趕上了這波風(fēng)潮,包括圖像識(shí)別和語音識(shí)別在內(nèi),,還有自動(dòng)駕駛,、無人機(jī)、環(huán)境還原,、機(jī)器人等項(xiàng)目,,前段時(shí)間很火的谷歌AlphaGo在圍棋領(lǐng)域擊敗了歐洲二段冠軍,也是歸功于深度學(xué)習(xí)的算法支持,??梢哉f跟用戶有交互行為的產(chǎn)品,都開始進(jìn)行深度學(xué)習(xí)AI的研究了,。通過神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí),,語音識(shí)別變得更聰明, 實(shí)現(xiàn)快速精準(zhǔn)的識(shí)別動(dòng)作以外,,還能對(duì)下一句的語境情緒進(jìn)行預(yù)測,,模擬真人對(duì)話。另外,,語音識(shí)別大量運(yùn)用在翻譯市場,,爭取未來十年內(nèi)在專業(yè)翻譯領(lǐng)域完全替代人類。圖像識(shí)別過去大多是建庫識(shí)別,,深度學(xué)習(xí)釋放了圖像識(shí)別的識(shí)別領(lǐng)域,,把識(shí)別對(duì)象的年齡變化記憶下來,實(shí)現(xiàn)動(dòng)態(tài),、多角度,、不同光照變化下的識(shí)別。

  應(yīng)用領(lǐng)域

  安防市場是要求語音和圖像識(shí)別技術(shù)雙高的行業(yè)之一,,未來將不局限在解鎖開門等基礎(chǔ)功能,,運(yùn)用圖像識(shí)別技術(shù),實(shí)現(xiàn)對(duì)象動(dòng)作識(shí)別,,根據(jù)威脅等級(jí)進(jìn)行危險(xiǎn)性判斷,,提前發(fā)出警報(bào)或報(bào)警。語音識(shí)別的運(yùn)用領(lǐng)域?qū)⒊叨嘶l(fā)展,,近年來語音識(shí)別速度屢創(chuàng)新高,,在翻譯市場、智能硬件助手,、AI輔助,,行車幫助等等方面實(shí)現(xiàn)價(jià)值。而娛樂領(lǐng)域的玩法變得多元化,像最近大熱的faceu,,運(yùn)用了臉部識(shí)別跟蹤技術(shù),,讓普通的自拍可以DIY。還有video++視頻開放平臺(tái),,可以對(duì)視頻中的明星,、衣服同款進(jìn)行識(shí)別搜索,打開了視頻到電商的入口,。乘著去年SaaS的風(fēng)口,,國內(nèi)外陸續(xù)出現(xiàn)了語音識(shí)別、圖像識(shí)別的技術(shù)開放平臺(tái),,從專業(yè)到普通領(lǐng)域,,語音識(shí)別和圖像識(shí)別將在2016年做到技術(shù)全覆蓋。

  大數(shù)據(jù)

  數(shù)據(jù)收集是一個(gè)從被動(dòng)到主動(dòng)的過程,,語音識(shí)別從接受指令變成了對(duì)指令使用頻率的分析,,進(jìn)而形成用戶的習(xí)慣圖表。圖像識(shí)別亦然,,針對(duì)用戶的識(shí)別頻率,,分析出用戶的興趣畫像,這將給予廣告主帶來精準(zhǔn)廣告推送的商機(jī),。

  結(jié)語

  2016年將是“最好玩”的一年,,語音識(shí)別和圖像識(shí)別讓我們跟智能設(shè)備之間的交互更自然,基于大數(shù)據(jù)的技術(shù)支持,,讓識(shí)別變得主動(dòng)而聰明,。語音識(shí)別和圖像識(shí)別將走進(jìn)普通人的世界,讓我們的生活更生動(dòng),。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected]