3月22日,百度舉行了首期語音搜索開放日活動,向媒體展示自己正在蓄力的最新技術(shù)應(yīng)用——語音搜索,。百度公司技術(shù)副總裁王海峰現(xiàn)場介紹了百度語音搜索的最新進展,,另有兩位 搜索技術(shù)負責(zé)人對語音搜索的實際使用問題進行了演示說明,。在活動中,,百度方面接受采訪時表示:堅信語音交互將是人機交互的趨勢所在,,這個趨勢將取代鍵盤輸入,。此外百度方面還向新浪科技透露:今年將有重磅產(chǎn)品推出,,會讓去年百度世界大會推出的度秘更加厲害,。
百度語音搜索開放日:百度大搜索總產(chǎn)品架構(gòu)師景鯤(左)、百度技術(shù)副總裁王海峰(中),,百度多模搜索部總監(jiān)孫雯玉(右)
語音搜索≠聽+說
百度技術(shù)副總裁王海峰
“語音搜索最常見的誤區(qū)是簡單以為只是聽和說的簡單串聯(lián),,其實并非如此?!蓖鹾7彘_門見山說道,。
這位百度技術(shù)副總裁緊接著對百度語音搜索的最新進展進行了介紹,表示目前的技術(shù)已經(jīng)實現(xiàn)了語音技術(shù),、自然語言處理,、智能搜索三方面的融合,以更自然的交互方式,,對用戶所說更準(zhǔn)確地識別,,對需求理解更精準(zhǔn),進而能提供更滿意的結(jié)果,。
王海峰現(xiàn)場進行了演示,,“請問三亞明天的天氣怎么樣?”他按住語音助手說,,搜索框隨機“打出”了王海峰的問題,,并跳轉(zhuǎn)到天氣頁面,還自動朗讀起來:明天三亞天氣多云,,23℃到31℃……
不過王海峰認(rèn)為詢問天氣只是最基本的語音搜索,,他緊接著演示了三個問題:“謝霆峰的兒子是誰”、“謝霆峰是誰的兒子”,,“吳奇隆比劉詩詩大多少歲”……
王海峰表示,,前兩個問題從傳統(tǒng)搜索認(rèn)知來看,文字是完全一樣的,,但問題缺截然不同,,這其中涉及到了對于語言的理解和語義分析。最后一個問題則涉及兩個結(jié)果綜合之后的計算,。
“百度語音搜索目前已通過人工智能做到了’聽’和’說’,,而且還嘗試完成人類復(fù)雜的行為——溝通。集成了語音識別,、語義理解,、深度問答、知識推 理、多輪對話,、智能摘要,、情感分析、語言生成,、語音合成等能力,,百度語音搜索已經(jīng)能夠滿足用戶的多種復(fù)雜需求?!蓖鹾7蹇偨Y(jié)說,。
此外,這位百度技術(shù)副總裁也談到了語音搜索和當(dāng)下火熱的人工智能的關(guān)系,。他表示人工智能實際上是希望讓機器可以擁有若干能力,,可以讓機器學(xué)會人的聽、說,、看,、行,進而開始有思考——即機器學(xué)習(xí),,但就人的思考而言,,和語言密切相關(guān),后者是思考必需的知識和思維的載體,。
王海峰強調(diào)說,,語音搜索可以降低用戶搜索門檻,而且在大數(shù)據(jù)的基礎(chǔ)上可以轉(zhuǎn)換為更多的互聯(lián)網(wǎng)產(chǎn)品應(yīng)用,,實現(xiàn)人與信息及服務(wù)的更廣泛連接。
鍵盤要被消滅
百度多模搜索部總監(jiān)孫雯玉
關(guān)于搜索門檻被降低的問題,,百度多模搜索部總監(jiān)孫雯玉進行了進一步演示介紹,。
她表示語音搜索的好處是比鍵盤輸入“更直接、更快捷”,。作為年輕媽媽,,孫雯玉海舉例說,女兒現(xiàn)在找動畫片會直接通過語音搜索,,“小孩基本不用教,,甚至看你做一遍她就會了,她知道按住說話,,就能找到自己想要的,。”
語音搜索的直接和快捷同樣體現(xiàn)在老人群體身上,,孫雯玉介紹說父母有山東口音,,但是搜索在語音識別上沒有問題,“以前搜索需要組織語言思路,明確自己的問題,,但是現(xiàn)在像我爸媽一樣在文字輸入上不習(xí)慣的群體,,可以直接說,所說即所得,?!?/p>
不過,這位多模搜索部總監(jiān)也表示,,針對中國方言眾多的情況,,目前的主要版本還只是針對以普通話為主的北方方言和相近方言,粵語版,、上海話版和西南官話等版本已經(jīng)在開發(fā)中,。
孫雯玉認(rèn)為語音搜索的最大意義在于:通過技術(shù)讓人獲得信息和服務(wù)的門檻更低,隨著智能語音搜索進一步向前,,可能會出現(xiàn)重大卻潤物無聲地變革—— 鍵盤交互將成為歷史,,“我們的調(diào)研顯示,90后,、00后有50%的群體的主要搜索方式已經(jīng)變成了語音,,而我女兒為代表的10后一代,基本從小的習(xí)慣就是語 音搜索,,她們這一代未來會覺得語音搜索是一件自然而然且天生如此的事情,。”
物聯(lián)網(wǎng)大趨勢
語音搜索比鍵盤輸入搜索更便捷并不令人否認(rèn),,但現(xiàn)場有記者認(rèn)為語音搜索存在“場景”問題,。
有媒體提問稱,不懷疑語音搜索的效率和便捷程度,,但目前來講,,拿著手機不斷說話搜索需要場景,特別涉及多輪交互,,可能會變得調(diào)戲Siri一樣——只是個消遣游戲,。
百度大搜索總產(chǎn)品架構(gòu)師景鯤重點解答了場景問題。他覺得之所以目前還存在“場景”上的尷尬,,主要有兩方面的原因,。
首先是當(dāng)前的用戶習(xí)慣了鍵盤輸入,對于語音搜索的轉(zhuǎn)換還需要一段時間,,但不可否認(rèn)的是隨著年輕群體進一步壯大,,語音搜索會成為潮流,“這個群體已經(jīng)被微信完成了市場教育,,現(xiàn)在在地鐵上對著手機說話’看起來傻’的問題,,估計以后大家都在做并且習(xí)慣了,,就成為潮流了?!?/p>
其次是物聯(lián)網(wǎng)的進一步發(fā)展,。景鯤表示,目前人機交互的最主要終端是手機,,不過一旦物聯(lián)網(wǎng)進一步發(fā)展,,人機交互突破了手機終端,需要在更多更廣泛的領(lǐng)域進行應(yīng)用的時候,,鍵盤輸入可能會變得很不方便,,相反,語音輸入的優(yōu)勢會不言自明,。
景鯤認(rèn)為,,大的潮流和趨勢目前是可以預(yù)見的,語音搜索的普及只是時間問題而已?,F(xiàn)在手機屏幕承載的東西特別多,,有屏幕的東西大家都愿意看,沒有屏幕的東西就只能搜了,。從潮流來看,,語音交互絕對是主流。
新浪科技也就此向百度方面提問:“在物聯(lián)網(wǎng)大趨勢下,,在硬件方面如何考慮,,是否會涉足硬件領(lǐng)域?”
百度方面給出的回答是:不會涉足硬件,。
“我們給語音搜索提供一個全方面的方案,,跟各種各樣的廠商一起來合作,我們提供的是能力,、信息和資源,。我們?nèi)ツ晖瞥隽诵C器人度秘,通過它來告訴外界我 們有什么樣的能力,,畢竟口說無憑,百度得把這個能力包裝成這樣一個產(chǎn)品,,這些能力也可以放到廠商的設(shè)備上,,我們做百度最擅長的,其他廠商做他們擅長的方 面,?!本蚌H回答說,這個回答也得到了百度技術(shù)副總裁王海峰的贊同,。
“但度秘在推出后似乎聲勢不大,?”新浪科技進一步問道。
孫雯玉回答了該問題,這位百度多模搜索部總監(jiān)解釋稱,,度秘在去年推出是一個能力的展示,,但度秘的普及應(yīng)用過程中,可能涉及最多的問題是多輪交 互,,這對目前的產(chǎn)品形態(tài)和技術(shù)應(yīng)用來說,,一旦有不足,就很容易造成糟糕的用戶體驗,,所以百度方面并沒有選擇大力推廣,,目的是讓最大程度保證用戶體驗。
“但今年會有重磅得多的產(chǎn)品發(fā)布,,會讓去年百度世界大會上推出的度秘更厲害,。”百度大搜索總產(chǎn)品架構(gòu)師景鯤補充道,。