從語音識別到智能家居,從人機(jī)大戰(zhàn)到無人駕駛,,人工智能的“演化”給我們社會上的一些生活細(xì)節(jié),帶來了一次又一次的驚喜,,未來更多智能產(chǎn)品依托的人工智能技術(shù)會發(fā)展成什么樣呢,?讓我們來看看2018人工智能標(biāo)準(zhǔn)化白皮書里面,,對人工智能關(guān)鍵技術(shù)的定義,。
人工智能技術(shù)關(guān)系到人工智能產(chǎn)品是否可以順利應(yīng)用到我們的生活場景中。在人工智能領(lǐng)域,,它普遍包含了機(jī)器學(xué)習(xí),、知識圖譜、自然語言處理,、人機(jī)交互,、計算機(jī)視覺、生物特征識別,、AR/VR七個關(guān)鍵技術(shù),。
一、機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)(Machine Learning)是一門涉及統(tǒng)計學(xué),、系統(tǒng)辨識,、逼近理論、神經(jīng)網(wǎng)絡(luò),、優(yōu)化理論,、計算機(jī)科學(xué)、腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科,,研究計算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能,,是人工智能技術(shù)的核心,。基于數(shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方法之一,,研究從觀測數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,,利用這些規(guī)律對未來數(shù)據(jù)或無法觀測的數(shù)據(jù)進(jìn)行預(yù)測。根據(jù)學(xué)習(xí)模式,、學(xué)習(xí)方法以及算法的不同,,機(jī)器學(xué)習(xí)存在不同的分類方法。
根據(jù)學(xué)習(xí)模式將機(jī)器學(xué)習(xí)分類為監(jiān)督學(xué)習(xí),、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等,。
根據(jù)學(xué)習(xí)方法可以將機(jī)器學(xué)習(xí)分為傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。
二,、知識圖譜
知識圖譜本質(zhì)上是結(jié)構(gòu)化的語義知識庫,,是一種由節(jié)點和邊組成的圖數(shù)據(jù)結(jié)構(gòu),以符號形式描述物理世界中的概念及其相互關(guān)系,其基本組成單位是“實體-關(guān)系-實體”三元組,,以及實體及其相關(guān)“屬性-值”對,。不同實體之間通過關(guān)系相互聯(lián)結(jié),構(gòu)成網(wǎng)狀的知識結(jié)構(gòu),。在知識圖譜中,,每個節(jié)點表示現(xiàn)實世界的“實體”,每條邊為實體與實體之間的“關(guān)系”,。通俗地講,,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關(guān)系網(wǎng)絡(luò),提供了從“關(guān)系”的角度去分析問題的能力,。
知識圖譜可用于反欺詐,、不一致性驗證、組團(tuán)欺詐等公共安全保障領(lǐng)域,,需要用到異常分析,、靜態(tài)分析、動態(tài)分析等數(shù)據(jù)挖掘方法,。特別地,,知識圖譜在搜索引擎、可視化展示和精準(zhǔn)營銷方面有很大的優(yōu)勢,,已成為業(yè)界的熱門工具,。但是,知識圖譜的發(fā)展還有很大的挑戰(zhàn),,如數(shù)據(jù)的噪聲問題,,即數(shù)據(jù)本身有錯誤或者數(shù)據(jù)存在冗余。隨著知識圖譜應(yīng)用的不斷深入,,還有一系列關(guān)鍵技術(shù)需要突破,。
三、自然語言處理
自然語言處理是計算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向,,研究能實現(xiàn)人與計算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法,,涉及的領(lǐng)域較多,主要包括機(jī)器翻譯,、機(jī)器閱讀理解和問答系統(tǒng)等,。
機(jī)器翻譯
機(jī)器翻譯技術(shù)是指利用計算機(jī)技術(shù)實現(xiàn)從一種自然語言到另外一種自然語言的翻譯過程?;诮y(tǒng)計的機(jī)器翻譯方法突破了之前基于規(guī)則和實例翻譯方法的局限性,,翻譯性能取得巨大提升?;谏疃壬窠?jīng)網(wǎng)絡(luò)的機(jī)器翻譯在日??谡Z等一些場景的成功應(yīng)用已經(jīng)顯現(xiàn)出了巨大的潛力。隨著上下文的語境表征和知識邏輯推理能力的發(fā)展,自然語言知識圖譜不斷擴(kuò)充,,機(jī)器翻譯將會在多輪對話翻譯及篇章翻譯等領(lǐng)域取得更大進(jìn)展,。
語義理解
語義理解技術(shù)是指利用計算機(jī)技術(shù)實現(xiàn)對文本篇章的理解,并且回答與篇章相關(guān)問題的過程,。語義理解更注重于對上下文的理解以及對答案精準(zhǔn)程度的把控,。隨著 MCTest 數(shù)據(jù)集的發(fā)布,語義理解受到更多關(guān)注,,取得了快速發(fā)展,,相關(guān)數(shù)據(jù)集和對應(yīng)的神經(jīng)網(wǎng)絡(luò)模型層出不窮,。語義理解技術(shù)將在智能客服,、產(chǎn)品自動問答等相關(guān)領(lǐng)域發(fā)揮重要作用,進(jìn)一步提高問答與對話系統(tǒng)的精度,。
問答系統(tǒng)
問答系統(tǒng)分為開放領(lǐng)域的對話系統(tǒng)和特定領(lǐng)域的問答系統(tǒng),。問答系統(tǒng)技術(shù)是指讓計算機(jī)像人類一樣用自然語言與人交流的技術(shù)。人們可以向問答系統(tǒng)提交用自然語言表達(dá)的問題,,系統(tǒng)會返回關(guān)聯(lián)性較高的答案,。盡管問答系統(tǒng)目前已經(jīng)有了不少應(yīng)用產(chǎn)品出現(xiàn),但大多是在實際信息服務(wù)系統(tǒng)和智能手機(jī)助手等領(lǐng)域中的應(yīng)用,,在問答系統(tǒng)魯棒性方面仍然存在著問題和挑戰(zhàn),。
自然語言處理面臨四大挑戰(zhàn):
一是在詞法、句法,、語義,、語用和語音等不同層面存在不確定性;
二是新的詞匯,、術(shù)語,、語義和語法導(dǎo)致未知語言現(xiàn)象的不可預(yù)測性;
三是數(shù)據(jù)資源的不充分使其難以覆蓋復(fù)雜的語言現(xiàn)象,;
四是語義知識的模糊性和錯綜復(fù)雜的關(guān)聯(lián)性難以用簡單的數(shù)學(xué)模型描述,,語義計算需要參數(shù)龐大的非線性計算
四、人機(jī)交互
人機(jī)交互主要研究人和計算機(jī)之間的信息交換,,主要包括人到計算機(jī)和計算機(jī)到人的兩部分信息交換,,是人工智能領(lǐng)域的重要的外圍技術(shù)。人機(jī)交互是與認(rèn)知心理學(xué),、人機(jī)工程學(xué),、多媒體技術(shù)、虛擬現(xiàn)實技術(shù)等密切相關(guān)的綜合學(xué)科,。傳統(tǒng)的人與計算機(jī)之間的信息交換主要依靠交互設(shè)備進(jìn)行,,主要包括鍵盤、鼠標(biāo)、操縱桿,、數(shù)據(jù)服裝,、眼動跟蹤器、位置跟蹤器,、數(shù)據(jù)手套,、壓力筆等輸入設(shè)備,以及打印機(jī),、繪圖儀,、顯示器、頭盔式顯示器,、音箱等輸出設(shè)備,。人機(jī)交互技術(shù)除了傳統(tǒng)的基本交互和圖形交互外,還包括語音交互,、情感交互,、體感交互及腦機(jī)交互等技術(shù)。
五,、計算機(jī)視覺
計算機(jī)視覺是使用計算機(jī)模仿人類視覺系統(tǒng)的科學(xué),,讓計算機(jī)擁有類似人類提取、處理,、理解和分析圖像以及圖像序列的能力,。自動駕駛、機(jī)器人,、智能醫(yī)療等領(lǐng)域均需要通過計算機(jī)視覺技術(shù)從視覺信號中提取并處理信息,。近來隨著深度學(xué)習(xí)的發(fā)展,預(yù)處理,、特征提取與算法處理漸漸融合,,形成端到端的人工智能算法技術(shù)。根據(jù)解決的問題,,計算機(jī)視覺可分為計算成像學(xué),、圖像理解、三維視覺,、動態(tài)視覺和視頻編解碼五大類,。
目前,計算機(jī)視覺技術(shù)發(fā)展迅速,,已具備初步的產(chǎn)業(yè)規(guī)模,。未來計算機(jī)視覺技術(shù)的發(fā)展主要面臨以下挑戰(zhàn):
一是如何在不同的應(yīng)用領(lǐng)域和其他技術(shù)更好的結(jié)合,計算機(jī)視覺在解決某些問題時可以廣泛利用大數(shù)據(jù),,已經(jīng)逐漸成熟并且可以超過人類,,而在某些問題上卻無法達(dá)到很高的精度,;
二是如何降低計算機(jī)視覺算法的開發(fā)時間和人力成本,目前計算機(jī)視覺算法需要大量的數(shù)據(jù)與人工標(biāo)注,,需要較長的研發(fā)周期以達(dá)到應(yīng)用領(lǐng)域所要求的精度與耗時,;
三是如何加快新型算法的設(shè)計開發(fā),隨著新的成像硬件與人工智能芯片的出現(xiàn),,針對不同芯片與數(shù)據(jù)采集設(shè)備的計算機(jī)視覺算法的設(shè)計與開發(fā)也是挑戰(zhàn)之一,。
六、生物特征識別
生物特征識別技術(shù)是指通過個體生理特征或行為特征對個體身份進(jìn)行識別認(rèn)證的技術(shù),。從應(yīng)用流程看,,生物特征識別通常分為注冊和識別兩個階段。注冊階段通過傳感器對人體的生物表征信息進(jìn)行采集,,如利用圖像傳感器對指紋和人臉等光學(xué)信息,、麥克風(fēng)對說話聲等聲學(xué)信息進(jìn)行采集,利用數(shù)據(jù)預(yù)處理以及特征提取技術(shù)對采集的數(shù)據(jù)進(jìn)行處理,,得到相應(yīng)的特征進(jìn)行存儲,。
識別過程采用與注冊過程一致的信息采集方式對待識別人進(jìn)行信息采集,、數(shù)據(jù)預(yù)處理和特征提取,,然后將提取的特征與存儲的特征進(jìn)行比對分析,完成識別,。從應(yīng)用任務(wù)看,,生物特征識別一般分為辨認(rèn)與確認(rèn)兩種任務(wù),辨認(rèn)是指從存儲庫中確定待識別人身份的過程,,是一對多的問題,;確認(rèn)是指將待識別人信息與存儲庫中特定單人信息進(jìn)行比對,確定身份的過程,,是一對一的問題,。
生物特征識別技術(shù)涉及的內(nèi)容十分廣泛,包括指紋,、掌紋,、人臉、虹膜,、指靜脈,、聲紋、步態(tài)等多種生物特征,,其識別過程涉及到圖像處理,、計算機(jī)視覺、語音識別,、機(jī)器學(xué)習(xí)等多項技術(shù),。目前生物特征識別作為重要的智能化身份認(rèn)證技術(shù),,在金融、公共安全,、教育,、交通等領(lǐng)域得到廣泛的應(yīng)用。
七,、VR/AR
虛擬現(xiàn)實(VR)/增強(qiáng)現(xiàn)實(AR)是以計算機(jī)為核心的新型視聽技術(shù),。結(jié)合相關(guān)科學(xué)技術(shù),在一定范圍內(nèi)生成與真實環(huán)境在視覺,、聽覺,、觸感等方面高度近似的數(shù)字化環(huán)境。用戶借助必要的裝備與數(shù)字化環(huán)境中的對象進(jìn)行交互,,相互影響,,獲得近似真實環(huán)境的感受和體驗,通過顯示設(shè)備,、跟蹤定位設(shè)備,、觸力覺交互設(shè)備、數(shù)據(jù)獲取設(shè)備,、專用芯片等實現(xiàn),。
虛擬現(xiàn)實/增強(qiáng)現(xiàn)實從技術(shù)特征角度,按照不同處理階段,,可以分為獲取與建模技術(shù),、分析與利用技術(shù)、交換與分發(fā)技術(shù),、展示與交互技術(shù)以及技術(shù)標(biāo)準(zhǔn)與評價體系五個方面,。獲取與建模技術(shù)研究如何把物理世界或者人類的創(chuàng)意進(jìn)行數(shù)字化和模型化,難點是三維物理世界的數(shù)字化和模型化技術(shù),;分析與利用技術(shù)重點研究對數(shù)字內(nèi)容進(jìn)行分析,、理解、搜索和知識化方法,,其難點是在于內(nèi)容的語義表示和分析,;交換與分發(fā)技術(shù)主要強(qiáng)調(diào)各種網(wǎng)絡(luò)環(huán)境下大規(guī)模的數(shù)字化內(nèi)容流通、轉(zhuǎn)換,、集成和面向不同終端用戶的個性化服務(wù)等,,其核心是開放的內(nèi)容交換和版權(quán)管理技術(shù);展示與交換技術(shù)重點研究符合人類習(xí)慣數(shù)字內(nèi)容的各種顯示技術(shù)及交互方法,,以期提高人對復(fù)雜信息的認(rèn)知能力,,其難點在于建立自然和諧的人機(jī)交互環(huán)境;標(biāo)準(zhǔn)與評價體系重點研究虛擬現(xiàn)實/增強(qiáng)現(xiàn)實基礎(chǔ)資源,、內(nèi)容編目,、信源編碼等的規(guī)范標(biāo)準(zhǔn)以及相應(yīng)的評估技術(shù),。
目前虛擬現(xiàn)實/增強(qiáng)現(xiàn)實面臨的挑戰(zhàn)主要體現(xiàn)在智能獲取、普適設(shè)備,、自由交互和感知融合四個方面,。在硬件平臺與裝置、核心芯片與器件,、軟件平臺與工具,、相關(guān)標(biāo)準(zhǔn)與規(guī)范等方面存在一系列科學(xué)技術(shù)問題??傮w來說虛擬現(xiàn)實/增強(qiáng)現(xiàn)實呈現(xiàn)虛擬現(xiàn)實系統(tǒng)智能化,、虛實環(huán)境對象無縫融合、自然交互全方位與舒適化的發(fā)展趨勢,。