《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 業(yè)界動態(tài) > 向“溝通”AI應(yīng)用發(fā)起跨越?jīng)_刺,,這項技術(shù)有何難點,?

向“溝通”AI應(yīng)用發(fā)起跨越?jīng)_刺,這項技術(shù)有何難點,?

2019-05-16
關(guān)鍵詞: UNIT3.0 百度大腦 AI

  我們對于AI應(yīng)用的追逐過程如同跨欄,,此時此刻回頭看看,會發(fā)現(xiàn)“計算”,、“感知”和“決策”這些橫欄,,都已經(jīng)在我們身后。如今我們已經(jīng)可以熟練的用語音識別和圖像識別來感知信息,,再通過機器學(xué)習(xí)對海量數(shù)據(jù)的處理來給出結(jié)論,。

  如果問下一道橫在我們面前有待跨越的橫欄是什么,想必就是意味著“溝通”的智能對話技術(shù)了。

  橫欄在前:

  智能對話技術(shù)跨越的前一秒

  建立在語音識別和語音生成等的NLP技術(shù)上,,人機對話之間的簡單對話已經(jīng)非常普及,,像是通過語音喚醒某一項設(shè)備或功能,或是和智能助手進行一些單輪問詢,。但想要系統(tǒng)化地普及智能對話技術(shù),,實現(xiàn)人機之間流暢的理解和多輪對話,恐怕還有著不少限制,。而這種限制,,已經(jīng)到了亟待跨越的時候。

  第一,, 缺乏靈活的自然語言交互對話,,我們在進行人機操作時依然需要依賴按鍵、屏幕等等設(shè)備,,對于AI技術(shù)的應(yīng)用場景有著很多桎梏,。

  第二, 在無法進行智能對話的前提之下,,很多需要頻繁溝通的工作,,依然無法被AI代勞,即使AI已經(jīng)遠超人類的記憶存儲,、計算決策和感知能力,。

  舉例來說,在車載,、智能音箱,、客服和機器人這四大領(lǐng)域中,智能對話技術(shù)應(yīng)用的便利與否,,就與其體驗息息相關(guān),。在車載場景中,人們無暇用手與眼與AI進行交互,,必然要依賴靈活精準(zhǔn)的對話系統(tǒng),。至于智能音箱這類硬件,智能對話不僅限制其產(chǎn)品形態(tài),,也會影響其服務(wù)能力,。智能客服與機器人更不必說,對于這種以交互為主的產(chǎn)品,,能否擁有自然的智能對話技術(shù),,實則是根深立命之本。

  從市場表現(xiàn)上,,我們也能發(fā)現(xiàn)智能對話正在進入工業(yè)級應(yīng)用爆發(fā)的潛伏期,。

  目前來說,,一項技術(shù)爆發(fā)所需要的四個因素:技術(shù)高度、生態(tài)廣度,、用戶取向和企業(yè)需求,,在智能對話領(lǐng)域已經(jīng)盡數(shù)鋪墊完成。

5cdcab60755ad-thumb.jpg

  像自然語言處理,、語音技術(shù)以及知識圖譜等技術(shù)已經(jīng)儲備完善,。數(shù)據(jù)顯示,在行業(yè)應(yīng)用中38%的企業(yè)已正在應(yīng)用基于智能對話的系統(tǒng),、麥克風(fēng)陣列等上下游硬件解決方案,,也在智能硬件市場的成長中達到一定積累,行業(yè)生態(tài)覆蓋正在加速,。數(shù)據(jù)顯示,,2019年Q1中國智能音箱銷量同比增長9倍,移動終端,、車載系統(tǒng),、智能硬件等產(chǎn)品中引入對話交互的現(xiàn)象也日益普及,毫無疑問,,用戶無比渴望更便利的交互方式,。最后,在人力成本日益提高時,,企業(yè)對于智能對話的需求也越來越旺盛,,據(jù)與IDC聯(lián)合調(diào)研,有83.3%企業(yè)認為智能對話能有效降低運營成本,。

  在今天,百度舉辦了百度大腦智能對話引擎及產(chǎn)品發(fā)布會,,宣布了百度大腦智能對話定制平臺UNIT3.0的全新升級,,并展示了智能對話生態(tài)全景。

  就此,,我們或許可以確定,,人類終于向“溝通”這一AI應(yīng)用的橫欄發(fā)起了跨越?jīng)_刺。

  復(fù)合型技術(shù)的迷墻

  如果將百度大腦看做智能對話技術(shù)應(yīng)用的第一個跨越者,,我們也可以從中倒推出這項技術(shù)應(yīng)用的難點在哪里,。

  一般來說,某一項技術(shù)工業(yè)級應(yīng)用的突破要取決于成本效率比,、人才儲備,、配套服務(wù)和概念認知之上。

  智能對話的特殊之處在于,,這項技術(shù)的復(fù)合性極強,,包含了語音識別,、語音生成、語音語義一體化,、知識圖譜構(gòu)建等等一系列技術(shù),。這就意味著這項技術(shù)的成本必然相對偏高、人才儲備也多半集中在技術(shù)企業(yè)和科技巨頭之中,。

5cdcab607484f-thumb.jpg

  而智能對話技術(shù)所應(yīng)用的場景又相對復(fù)雜,,交互本身無處不在,智能對話技術(shù)既可以向智能客服這里軟件服務(wù)領(lǐng)域輸出,,又可以投入于智能耳機,、智能音箱這類硬件領(lǐng)域。更有很多全新的應(yīng)用空間亟待開發(fā),。配套服務(wù)的普及,,一定是一條相對艱難的道路。

  綜合下來,,會導(dǎo)致智能對話技術(shù)距離應(yīng)用場景間隔了一道迷墻,,注定了很多企業(yè)對這項技術(shù)的認知理解有所偏差,認為這項技術(shù)還并不適合自己的企業(yè)應(yīng)用,。

  這就是為什么,,率先動身跨越橫欄的人,會是百度,。

  發(fā)起沖刺:

  UNIT 3.0和語音技術(shù)平臺正在蓄力

  在百度大腦的智能對話生態(tài)中,,為整個產(chǎn)業(yè)開放了兩個重要產(chǎn)品平臺。

  第一是為開發(fā)者提供專業(yè)對話系統(tǒng)定制技術(shù)的UNIT 3.0,。

  基于百度多年積累的自然語言處理,、知識圖譜和語音等對話相關(guān)的AI技術(shù),百度大腦推出的UNIT3.0版本,,在搭建技能,、構(gòu)建知識和整合技能與知識三方面實現(xiàn)全面升級,其中為開發(fā)者提供了很多預(yù)置能力,,例如有關(guān)天氣,、閑聊、定會議室的對話技能,,還有大幅提升樣本生產(chǎn)和標(biāo)注效率的DataKit和一系列知識庫,。

  建立在這種模塊化的組件模式上,開發(fā)者定制對話系統(tǒng)就會變得像拼樂高一樣簡單,,而非是過去那樣,,在一團雜亂的毛線中尋找線頭。如此以來,,將極大地降低開發(fā)成本和時間成本,,極大地提升效率與性價比,。

5cdcab6018a04-thumb.jpg

  第二個產(chǎn)品平臺,是包含了領(lǐng)域語音方案和語音自訓(xùn)練平臺的語音技術(shù)平臺,。

  相比更傾向于賦能開發(fā)者的UNIT 3.0,,語音技術(shù)平臺則進一步為企業(yè)客戶提供了更易上手的工具。

  在領(lǐng)域語音方案中,,我們可以看到百度大腦推出了他們擅長的端到端一體化解決方案,。這次發(fā)布會中所展示的呼叫中心語音解決方案,就是一個很好的案例,,通過針對于呼叫中心場景優(yōu)化過專屬語音識別模型,,結(jié)合呼叫中心場景專屬8K音庫,可以在識別和生成兩端進行優(yōu)化,。對于那些適用于呼叫中心場景的企業(yè)用戶來說,,其便利程度接近于即拿即用。

  語音自訓(xùn)練平臺,,則和EasyDL等自動化機器學(xué)習(xí)平臺類似,,通過從基礎(chǔ)語音模型到行業(yè)語音模型再到個性化語音模型的層層訓(xùn)練,最終提升針對于場景業(yè)務(wù)的語音識別率,。而這一整個過程都是自助式的,,不需要代碼基礎(chǔ)。這也自然解決了企業(yè)人才匱乏的致命問題,。

  這兩項產(chǎn)品如同百度大腦智能對話生態(tài)的左右腿,,甩掉了成本、效率和人才的桎梏,,直接向智能對話的工業(yè)級應(yīng)用發(fā)起沖刺,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。