《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 可編程邏輯 > 業(yè)界動(dòng)態(tài) > 百度大腦獲中國(guó)電子學(xué)會(huì)年度科技獎(jiǎng),王海峰詳解語(yǔ)言與智能

百度大腦獲中國(guó)電子學(xué)會(huì)年度科技獎(jiǎng),,王海峰詳解語(yǔ)言與智能

2019-04-24

4 月 20 日,,第十四屆中國(guó)電子信息技術(shù)年會(huì)在合肥開(kāi)幕。以「智聯(lián)網(wǎng)與未來(lái)」為主題,,大會(huì)開(kāi)展了學(xué)術(shù)交流,、技術(shù)研討和成果轉(zhuǎn)化、展覽展示等系列活動(dòng),。百度高級(jí)副總裁,、AI 技術(shù)平臺(tái)體系 (AIG) 和基礎(chǔ)技術(shù)體系(TG)總負(fù)責(zé)人王海峰發(fā)表題為《語(yǔ)言與智能》的演講。此外,,作為國(guó)內(nèi)最早投身人工智能的科技巨頭,,百度于 2016 年發(fā)布的 AI 核心技術(shù)引擎「百度大腦核心技術(shù)及開(kāi)放平臺(tái)」榮獲 2018 年度中國(guó)電子學(xué)會(huì)科學(xué)技術(shù)獎(jiǎng)科技進(jìn)步獎(jiǎng)一等獎(jiǎng)。


王海峰詳解語(yǔ)言與智能


百度大腦斬獲科學(xué)技術(shù)獎(jiǎng)是百度多年人工智能技術(shù)積累的成果,。在這波因深度學(xué)習(xí)崛起的 AI 浪潮中,,自然語(yǔ)言處理是核心研究領(lǐng)域。正如王海峰所說(shuō),,「理解和運(yùn)用自然語(yǔ)言是人工智能的核心問(wèn)題之一,。大數(shù)據(jù)、機(jī)器學(xué)習(xí),、深度學(xué)習(xí)和知識(shí)圖譜等技術(shù)的發(fā)展,,正在給語(yǔ)言與智能的發(fā)展帶來(lái)突破?!?/p>


在今年中國(guó)電子信息技術(shù)年會(huì)上發(fā)表的題為《語(yǔ)言與智能》的演講中,,王海峰以翻譯為例介紹了人工智能技術(shù)的演進(jìn),闡釋近期語(yǔ)言與知識(shí)技術(shù)和大數(shù)據(jù),、深度學(xué)習(xí)等技術(shù)結(jié)合帶來(lái)的突破,、行業(yè)應(yīng)用,以及技術(shù)趨勢(shì)和挑戰(zhàn),。

 

微信圖片_20190424222850.jpg


王海峰是人工智能研究及應(yīng)用,,尤其是自然語(yǔ)言處理領(lǐng)域的領(lǐng)軍者,在國(guó)內(nèi)外學(xué)界和工業(yè)界享有盛譽(yù),。他先后為百度開(kāi)創(chuàng)和發(fā)展了自然語(yǔ)言處理,、機(jī)器翻譯、語(yǔ)音,、圖像,、深度學(xué)習(xí),、數(shù)據(jù)挖掘、知識(shí)圖譜等技術(shù)方向,,帶領(lǐng)百度 AI 取得了大量領(lǐng)先業(yè)界的技術(shù)成果,,并推動(dòng)了百度大腦的對(duì)外開(kāi)放工作,被業(yè)界稱譽(yù)為少有的學(xué)術(shù)與工程并舉的科學(xué)家,。剛剛斬獲 2018 年度中國(guó)電子學(xué)會(huì)科學(xué)技術(shù)獎(jiǎng)科技進(jìn)步一等獎(jiǎng)的「百度大腦核心技術(shù)及開(kāi)放平臺(tái)」就是由王海峰主導(dǎo)研發(fā)的,。


王海峰表示,通俗來(lái)講,,人工智能是讓機(jī)器可以像人一樣,,具備聽(tīng)覺(jué)、視覺(jué),、語(yǔ)言,、行為能力,可以進(jìn)行邏輯計(jì)算和推理規(guī)劃,,并基于知識(shí)學(xué)習(xí)持續(xù)進(jìn)化,。


語(yǔ)言是人類思考的媒介,是人類特有的高級(jí)智力活動(dòng),。早期的簡(jiǎn)單符號(hào),,到甲骨文,到紙質(zhì)的書,,以及現(xiàn)代互聯(lián)網(wǎng)上的文本,,語(yǔ)言文字這一載體讓知識(shí)得以凝煉和傳承,可以說(shuō),,語(yǔ)言文字促進(jìn)了人類文明的發(fā)展,。因此,如何理解和運(yùn)用自然語(yǔ)言,,是人工智能需要解決的核心問(wèn)題之一,。


當(dāng)下,大數(shù)據(jù),、知識(shí)圖譜,、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)快速發(fā)展,,并與自然語(yǔ)言處理密切結(jié)合,,推動(dòng)語(yǔ)言智能持續(xù)發(fā)展和突破,并越來(lái)越多地應(yīng)用于各個(gè)行業(yè),。


自然語(yǔ)言處理是人工智能皇冠上的明珠,而填補(bǔ)語(yǔ)言鴻溝的機(jī)器翻譯則是自然語(yǔ)言處理最典型的應(yīng)用技術(shù)之一,。王海峰在這一領(lǐng)域深耕近 30 年,,他以親身經(jīng)驗(yàn)梳理,、介紹了人工智能技術(shù)的發(fā)展和演化歷程。


從現(xiàn)代計(jì)算機(jī)誕生之初,,就開(kāi)始有人提出用計(jì)算機(jī)來(lái)進(jìn)行語(yǔ)言翻譯的設(shè)想,。在早期發(fā)展過(guò)程中,研究者們很多采用理性主義,、規(guī)則系統(tǒng),、知識(shí)工程的方法來(lái)進(jìn)行研究。王海峰從 1993 年開(kāi)始從事機(jī)器翻譯的相關(guān)研究,,初期便采用基于規(guī)則的方法,,在國(guó)家「863」評(píng)測(cè)中獲得第一。


早在 1999 年,,王海峰在博士論文中即開(kāi)始探索神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的可能性,,但由于當(dāng)時(shí)算力和數(shù)據(jù)的制約,他轉(zhuǎn)而嘗試統(tǒng)計(jì)機(jī)器翻譯與大規(guī)模規(guī)則翻譯系統(tǒng)的結(jié)合,,并開(kāi)創(chuàng)性地提出樞軸語(yǔ)言翻譯方法以解決小語(yǔ)種翻譯語(yǔ)料稀缺的難題,。


2008 年,王海峰主持研發(fā)的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)參加了國(guó)際口語(yǔ)機(jī)器翻譯評(píng)測(cè)比賽 IWSLT,,在所參加的 5 項(xiàng)任務(wù) 15 個(gè)評(píng)測(cè)指標(biāo)中,,共取得 12 項(xiàng)第一、3 項(xiàng)第二的優(yōu)異成績(jī),。


2010 年加入百度后,,他帶領(lǐng)團(tuán)隊(duì)融合統(tǒng)計(jì)與規(guī)則、實(shí)例和神經(jīng)網(wǎng)絡(luò)等方法,,實(shí)現(xiàn)了多方面的技術(shù)創(chuàng)新,,打造出服務(wù)億萬(wàn)用戶的百度翻譯,并在 2015 年率先發(fā)布神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng),。目前,,百度翻譯可支持全球 28 種語(yǔ)言互譯,覆蓋 756 個(gè)翻譯方向,,超過(guò) 15 萬(wàn)家第三方應(yīng)用接入百度翻譯 API,,每日翻譯字符數(shù)超過(guò)千億。百度翻譯因此榮獲 2015 年國(guó)家科技進(jìn)步二等獎(jiǎng),。


2018 年的百度世界大會(huì)上,,百度又發(fā)布了世界上首個(gè)集成了預(yù)測(cè)和可控延遲的語(yǔ)音實(shí)時(shí)翻譯系統(tǒng),這是自然語(yǔ)言處理方面的重大技術(shù)突破,。


王海峰表示,,機(jī)器翻譯的發(fā)展從最初運(yùn)用規(guī)則系統(tǒng),到統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法,后又解決算法,、算力等各方面的問(wèn)題,,不斷登上新的臺(tái)階。人工智能的發(fā)展脈絡(luò)與機(jī)器翻譯也很相似,,經(jīng)歷多種方法的探索和實(shí)踐,,有過(guò)低谷和高潮,總的趨勢(shì)是在持續(xù)進(jìn)步,。


近年來(lái),,隨著深度學(xué)習(xí)的崛起,自然語(yǔ)言處理也由淺層統(tǒng)計(jì)模型步入深層神經(jīng)網(wǎng)絡(luò),。


在自然語(yǔ)言處理領(lǐng)域,,深度學(xué)習(xí)模型具有比傳統(tǒng)機(jī)器學(xué)習(xí)模型更強(qiáng)的數(shù)據(jù)學(xué)習(xí)能力,使得基于深度學(xué)習(xí)的依存句法分析等基礎(chǔ) NLP 任務(wù)得到大幅提升,。


目前,,深度學(xué)習(xí)領(lǐng)域主要有強(qiáng)化學(xué)習(xí)、監(jiān)督學(xué)習(xí),、無(wú)/自監(jiān)督學(xué)習(xí)三種學(xué)習(xí)范式,,而無(wú)/自監(jiān)督學(xué)習(xí)可以類比人類學(xué)習(xí),是重要的一種學(xué)習(xí)方式,。


自監(jiān)督學(xué)習(xí)讓基于大規(guī)模無(wú)標(biāo)記語(yǔ)料的語(yǔ)言模型得到了長(zhǎng)足的發(fā)展,。近期,Google,、百度分別提出了無(wú)監(jiān)督文本的預(yù)訓(xùn)練語(yǔ)言模型 BERT,、ERNIE,將 NLP 任務(wù)的性能提升到新高度,。


百度提出的基于知識(shí)增強(qiáng)的 ERNIE 模型,,通過(guò)建模海量數(shù)據(jù)中的實(shí)體概念等先驗(yàn)語(yǔ)義知識(shí),學(xué)習(xí)真實(shí)世界的語(yǔ)義關(guān)系,。相較于 Google BERT 基于字單元的語(yǔ)義建模,,ERNIE 直接對(duì)先驗(yàn)語(yǔ)義知識(shí)單元進(jìn)行建模,并通過(guò)海量文本數(shù)據(jù)學(xué)習(xí)實(shí)體間的語(yǔ)義關(guān)系,。這種融合知識(shí)的語(yǔ)義建模大幅增強(qiáng)了模型語(yǔ)義表示能力,,在包括語(yǔ)言推斷、語(yǔ)義相似度,、命名實(shí)體識(shí)別,、情感分析、問(wèn)答匹配等自然語(yǔ)言處理各類任務(wù)上的多個(gè)公開(kāi)中文數(shù)據(jù)集上,,ERNIE 均取得了優(yōu)于 BERT 的效果,。


依托深度學(xué)習(xí)技術(shù)的發(fā)展,,語(yǔ)音、圖像等感知技術(shù)取得了巨大進(jìn)步,,但認(rèn)知技術(shù)的突破,,會(huì)越來(lái)越依賴知識(shí),,需要提升對(duì)知識(shí)和大規(guī)模知識(shí)圖譜的運(yùn)用,。在物理世界、人類社會(huì)和網(wǎng)絡(luò)空間中,,匯聚了大量的多元,、異構(gòu)、多模態(tài)的數(shù)據(jù),,百度借助無(wú)標(biāo)簽大數(shù)據(jù)開(kāi)放域知識(shí)挖掘,、知識(shí)體系自動(dòng)擴(kuò)展、知識(shí)整合等技術(shù),,基于海量數(shù)據(jù)構(gòu)建起了超大規(guī)模知識(shí)圖譜,。


目前,百度擁有世界上最大的多元異構(gòu)知識(shí)圖譜,,除了包含數(shù)億實(shí)體,、千億級(jí)事實(shí),能夠滿足 90% 用戶需求的實(shí)體圖譜,,針對(duì)不同的應(yīng)用場(chǎng)景和知識(shí)形態(tài),,百度還建立起關(guān)注點(diǎn)圖譜、行業(yè)知識(shí)圖譜,、POI 圖譜,、事件圖譜等多種知識(shí)圖譜。比如在醫(yī)療領(lǐng)域,,能夠從病歷等原始文本中,,抽取出實(shí)體及多元關(guān)系,并進(jìn)行文本結(jié)構(gòu)化,,最終構(gòu)建起醫(yī)療圖譜,,同時(shí)結(jié)合醫(yī)療大數(shù)據(jù)、醫(yī)療認(rèn)知計(jì)算,,應(yīng)用于醫(yī)療臨床輔助決策服務(wù)中,。


多模態(tài)知識(shí)、語(yǔ)音,、視覺(jué)等技術(shù)結(jié)合,,發(fā)展進(jìn)入「多模態(tài)深度語(yǔ)義理解」階段。例如,,基于知識(shí)圖譜的視頻理解技術(shù),,能夠視頻中抽取結(jié)構(gòu)化語(yǔ)義知識(shí),,真正「看懂」視頻。


語(yǔ)言理解技術(shù)持續(xù)發(fā)展,,并通過(guò)與知識(shí)圖譜,、深度學(xué)習(xí)等技術(shù)融合,不斷提高各種應(yīng)用的智能化程度,。


王海峰在演講中介紹,,百度創(chuàng)新地融合知識(shí)圖譜、自然語(yǔ)言處理及深度學(xué)習(xí)技術(shù),,研發(fā)了能夠深刻理解用戶意圖,、精準(zhǔn)滿足搜索需求、提供更豐富知識(shí)內(nèi)容的智能搜索引擎,,并結(jié)合語(yǔ)音,、圖像、AR 等感知技術(shù)能力,,更便捷地與用戶交互,,為用戶提供更精準(zhǔn)高效的信息服務(wù)。


例如,,用戶用自然語(yǔ)言搜索「林徽因的丈夫的父親是誰(shuí)」,,智能搜索引擎能夠理解用戶的意圖,并結(jié)合知識(shí)圖譜以圖文并茂的形式把答案「梁?jiǎn)⒊咕珳?zhǔn)呈現(xiàn)給用戶,。又如,,用戶搜索「上面草字頭下面句子的句是什么字」,智能搜索引擎能夠?yàn)橛脩籼峁钙垺沟淖x音,、筆畫,、釋義等豐富的信息。


除了智能搜索方面的應(yīng)用,,百度還基于語(yǔ)言理解和生成技術(shù)提供智能寫作等能力,。智能寫作適用于財(cái)經(jīng)、體育,、天氣,、熱點(diǎn)與娛樂(lè)事件等多領(lǐng)域的輔助與自動(dòng)寫作,大幅提升創(chuàng)作效率,。比如,,基于結(jié)構(gòu)化的股票數(shù)據(jù),可以生成關(guān)于股市的快訊新聞,。結(jié)合視覺(jué)技術(shù)的智能春聯(lián),,可通過(guò)刷臉檢測(cè)出人物性別、年齡,、微笑程度,、性格特征等,,生成特征詞,然后基于神經(jīng)網(wǎng)絡(luò)生成技術(shù)創(chuàng)作出應(yīng)景的春聯(lián),,讓人工智能技術(shù)融入大眾的文化娛樂(lè)生活,。


智能客服是結(jié)合自然語(yǔ)言處理、知識(shí)圖譜和語(yǔ)音等技術(shù)打造的行業(yè)解決方案,。在智能客服場(chǎng)景中,,基于語(yǔ)音語(yǔ)義一體化技術(shù),百度大腦可以準(zhǔn)確識(shí)別出用戶的話語(yǔ),,理解用戶意圖,,進(jìn)而通過(guò)行業(yè)知識(shí)圖譜理解業(yè)務(wù)流程,為用戶提供相應(yīng)的服務(wù),。整個(gè)服務(wù)過(guò)程流暢自然,實(shí)現(xiàn)了與用戶無(wú)障礙溝通,,提升業(yè)務(wù)效率并滿足用戶需求,。


百度領(lǐng)先的語(yǔ)言與知識(shí)技術(shù),不僅廣泛應(yīng)用于智能搜索,、深度問(wèn)答,、對(duì)話系統(tǒng)、智能寫作,、機(jī)器翻譯等領(lǐng)域,,為廣大用戶提供更智能的體驗(yàn),滿足用戶對(duì)信息和服務(wù)的需求,,還通過(guò)百度大腦平臺(tái)全面開(kāi)放,,促進(jìn)行業(yè)應(yīng)用和創(chuàng)新。


當(dāng)然,,自然語(yǔ)言理解技術(shù)還面臨著眾多挑戰(zhàn),,例如大數(shù)據(jù)環(huán)境下數(shù)據(jù)稀疏、知識(shí)的有效利用,、語(yǔ)用等,。王海峰總結(jié),這些挑戰(zhàn)可通過(guò)相應(yīng)的研究來(lái)解決,,如通過(guò)基于無(wú)標(biāo)注,、弱標(biāo)注數(shù)據(jù)的學(xué)習(xí)方法來(lái)解決數(shù)據(jù)稀疏問(wèn)題;深度融合神經(jīng)網(wǎng)絡(luò)與知識(shí)來(lái)有效利用知識(shí),;語(yǔ)用研究可與應(yīng)用場(chǎng)景深度結(jié)合,。


王海峰表示,「隨著技術(shù)發(fā)展,,我們會(huì)越來(lái)越深入地理解自然語(yǔ)言,、掌握知識(shí),,推動(dòng)人工智能發(fā)揮更大的價(jià)值,為人類社會(huì)發(fā)展提供更大的助力,?!?/p>


中國(guó)電子學(xué)會(huì)年度科技獎(jiǎng)花落百度大腦

微信圖片_20190424222918.jpg

百度高級(jí)副總裁、AI 技術(shù)平臺(tái)體系 (AIG) 和基礎(chǔ)技術(shù)體系(TG)總負(fù)責(zé)人王海峰領(lǐng)獎(jiǎng)


科學(xué)技術(shù)獎(jiǎng)是中國(guó)電子學(xué)會(huì)經(jīng)國(guó)家科技獎(jiǎng)勵(lì)工作辦公室批準(zhǔn),,于 2003 年設(shè)立的獎(jiǎng)項(xiàng),,主要獎(jiǎng)勵(lì)在電子信息領(lǐng)域科學(xué)研究、技術(shù)創(chuàng)新與開(kāi)發(fā),、科技成果推廣應(yīng)用和實(shí)現(xiàn)產(chǎn)業(yè)化方面取得卓著成績(jī)或者做出突出貢獻(xiàn)的集體和個(gè)人,。科學(xué)技術(shù)獎(jiǎng)分為自然科學(xué)類,、技術(shù)發(fā)明類和科技進(jìn)步類 3 個(gè)類別,,分別設(shè)一等獎(jiǎng)、二等獎(jiǎng),、三等獎(jiǎng)三個(gè)獎(jiǎng)勵(lì)等級(jí),。


如今,中國(guó)電子學(xué)會(huì)科學(xué)技術(shù)獎(jiǎng)已經(jīng)成為國(guó)內(nèi)電子信息技術(shù)發(fā)展的風(fēng)向標(biāo),。


百度作為國(guó)內(nèi)最早布局人工智能的企業(yè),,近年來(lái)不斷進(jìn)行 AI 技術(shù)的研究探索和應(yīng)用落地實(shí)踐,為推動(dòng) AI 技術(shù)應(yīng)用和創(chuàng)新積極貢獻(xiàn)力量,。


科學(xué)技術(shù)獎(jiǎng)評(píng)議認(rèn)為,,百度大腦突破了聽(tīng)覺(jué)、視覺(jué)和語(yǔ)言一體化的多模態(tài)語(yǔ)義理解技術(shù)難題,,成果支持零門檻深度學(xué)習(xí)定制化訓(xùn)練和千億特征的神經(jīng)網(wǎng)絡(luò)訓(xùn)練,,打造了一個(gè)完整的人工智能技術(shù)開(kāi)放體系,并通過(guò)統(tǒng)一人工智能開(kāi)放平臺(tái)向社會(huì)共享,,帶動(dòng)了互聯(lián)網(wǎng)行業(yè)技術(shù)創(chuàng)新,,推動(dòng)了傳統(tǒng)行業(yè)的智能化轉(zhuǎn)型。


目前,,百度大腦已獲相關(guān)技術(shù)發(fā)明專利授權(quán) 200 余項(xiàng),,在頂級(jí)國(guó)際期刊和學(xué)術(shù)會(huì)議上發(fā)表相關(guān)論文 100 多篇,多次在 WebVision,、ActivityNet,、NIPS、SemEval 等國(guó)際知名人工智能競(jìng)賽或測(cè)試中奪得桂冠,。百度連續(xù)三年上榜全球知名科技媒體《麻省理工科技評(píng)論》「全球十大突破性技術(shù)」榜單,。國(guó)際頂級(jí)期刊 Nature 評(píng)價(jià)稱「百度已成長(zhǎng)為以 AI 技術(shù)為重心的科技巨頭」。


在產(chǎn)業(yè)方面,,百度大腦已對(duì)外開(kāi)放了 160 多項(xiàng)領(lǐng)先的 AI 能力,,廣泛應(yīng)用于互聯(lián)網(wǎng),、交通、工業(yè),、醫(yī)療,、零售、金融等諸多領(lǐng)域,。比如,,在電信、銀行等行業(yè),,基于百度大腦的智能客服系統(tǒng)可以精準(zhǔn)理解用戶的需求,、識(shí)別客戶情緒并推薦合理的服務(wù),既可以接聽(tīng)用戶電話,,也可以主動(dòng)外呼,,從而輔助人工客服,降低客服業(yè)務(wù)成本,,提升用戶體驗(yàn),;在醫(yī)療領(lǐng)域,基于百度大腦能力打造的百度靈醫(yī),,布局診療全流程,幫助提升診療效率,,從而惠及更多患者,;在農(nóng)業(yè)領(lǐng)域,智能搖桿拍攝光譜可以借助圖像識(shí)別技術(shù)精準(zhǔn)估算不同田地的農(nóng)藥使用量,,有針對(duì)性地施藥殺蟲,,減少了用藥浪費(fèi)的情況,也更符合環(huán)保需求,;工業(yè)應(yīng)用方面,,基于百度深度學(xué)習(xí)平臺(tái) PaddlePaddle 打造的智能零件分揀機(jī),分揀精度可達(dá)到 90%,,預(yù)測(cè)速度較同類產(chǎn)品快 20%……同時(shí),,百度大腦與政府合作,如與雄安新區(qū)管委打造智能城市,、與天津市政府打造「天津智港」等,,提升公共服務(wù)和城市管理能力,讓 AI 惠及普羅大眾,。


除了百度大腦項(xiàng)目,,其他獲得 2018 年中國(guó)電子學(xué)會(huì)科學(xué)技術(shù)獎(jiǎng)科技進(jìn)步獎(jiǎng)項(xiàng)一等獎(jiǎng)的項(xiàng)目包括北理工等完成的「基于海量知識(shí)智能理解與推理關(guān)鍵技術(shù)及智能政務(wù)應(yīng)用」,深圳大學(xué),、華為等完成的「云數(shù)據(jù)交換與服務(wù)裝備關(guān)鍵技術(shù)及產(chǎn)業(yè)化」等 7 個(gè)項(xiàng)目,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]