11月18日,京東集團(納斯達克股票代碼:JD,,港交所股票代號:9618)對外發(fā)布了2021年第三季度業(yè)績,。從2017年初全面向技術轉型以來,京東持續(xù)加大了對基礎科學與底層技術的投入力度,,推動基礎設施建設的數(shù)量與效率的雙向提升,京東體系已在技術上累計投入已近750億元,。
在第三季度,,京東探索研究院人工智能團隊憑借多模態(tài)交互數(shù)字人技術、跨模態(tài)分析技術在第29屆ACM國際多媒體頂級會議(ACM International Conference on Multimedia,,簡稱ACM Multimedia)上榮獲兩項大獎,。這些獲得國際學術界頂尖榮譽的領先技術正在通過京東云這個統(tǒng)一平臺輸出服務各行各業(yè)。其中,,基于多模態(tài)交互數(shù)字人技術研發(fā)的“虛擬數(shù)字人”能助力京東智能客服言犀提升智能接待,、服務和虛擬助手的體驗,比如與某銀行合作落地應用,,打造了全國第一個交互式數(shù)字人項目“數(shù)字柜員”,。
斬獲國際AI頂會雙項大獎 京東云推動越來越智能的數(shù)字浪潮
今年三季度以來,京東探索研究院與各大實驗室繼續(xù)在可信人工智能,、超級深度學習、量子機器學習等基礎科學領域持續(xù)推進創(chuàng)新研究,,并取得累累碩果,。
近日,京東探索研究院AI團隊憑借多模態(tài)交互數(shù)字人技術,、跨模態(tài)分析技術,,在國際AI頂會第29屆ACM Multimedia上分別斬獲2021年最佳演示獎及最佳開源項目獎,充分證明了京東在人工智能視覺與人機交互領域的全球領先性,。
ACM Multimedia是計算機科學領域中多媒體領域的首要國際會議,,1993年以來每年召開一次,已成為多媒體領域頂級盛典,,大會致力于推動多媒體的研究和應用,,京東探索研究院的兩項獲獎技術均為ACM Multimedia頒發(fā)的該技術領域唯一獎項,分量十足,。
在傳統(tǒng)的AI認知中,,視覺領域、語音領域,、自然語言領域等領域之前是獨立演進的技術和應用,,可以認為是單模態(tài)技術,而人是一個看,、聽,、說多模態(tài)共同工作的智能體,所以多模態(tài)技術是未來人工智能應用發(fā)展的方向,。京東探索研究院的多模態(tài)交互數(shù)字人技術ViDA-Man致力于打造具備多感官交互能力的人機交互系統(tǒng),,深入多模態(tài)交互技術研究,專注于人機交互的消費科技產品打造,?;谠摷夹g開發(fā)的多模態(tài)交互數(shù)字人形象引擎,,能夠提供快速的形象定制能力,從外觀的數(shù)字化逐漸深入到行為的交互化,、情緒的智能化,。
近年來,數(shù)字浪潮的推動讓人工智能技術已經實現(xiàn)從不可用到可用,。AI產品化時期,,諸如智能語音識別技術、智能圖片處理技術,、基于用戶興趣的算法引擎推薦,、智能審核技術、AR/VR技術,、5G技術等成為了AI落地的抓手,,掀起了科技創(chuàng)新的新浪潮。京東探索研究院這些前沿技術的持續(xù)探索,,也正陸續(xù)通過京東云這個統(tǒng)一平臺對外輸出,,助力產業(yè)數(shù)字化。
VTM數(shù)字員工“加盟”銀行網點,,京東云助力銀行網點數(shù)智化升級
在銀行行業(yè),,傳統(tǒng)銀行服務網點存在運營成本高、網點高峰期排隊,、遠程柜員接待能力不足等痛點,,制約了業(yè)務的擴展。
基于多模態(tài)交互數(shù)字人技術,,京東智能客服言犀與某銀行合作,,推出VTM數(shù)字員工,提升智能接待,、服務和虛擬助手的體驗,。區(qū)別于過往咨詢問答式機器人,雙方共同打造的VTM數(shù)字員工可獨立閉環(huán)完成交易業(yè)務全流程,,在交互方式上,,采用擬人化的對話方式與親和的形象,為用戶提供了良好的服務體驗,,在交易場景中邁出了重大的一步,。該數(shù)字人通過與VTM機、助農設備打通,,形成了多渠道,、全場景、端到端的VTM數(shù)字人解決方案,。在傳統(tǒng)渠道升級方面,,該數(shù)字人解決方案用智能化技術幫助傳統(tǒng)服務渠道,,為傳統(tǒng)服務網點和無人網點建立了人資調配的通道,很好的提升了銀行的服務體驗和效率,。在場景支持方面,,拓展了數(shù)字人在銀行場景中的應用邊界,從傳統(tǒng)的咨詢,、查詢,、導覽拓展到了取款、開戶,、密碼重置等交易場景中,;在區(qū)域客戶的滲透方面,將通過便捷易操作的服務及與助農設備的互通,,為適老化能力的建設和鄉(xiāng)村金融服務的街鄉(xiāng)級滲透提供新路徑,。
京東智能客服言犀將數(shù)字人技術一方面融合了前沿的AI技術,包含NLP,、TTS,、ASR、虛擬形象,、圖像識別等多項技術,,具備感知,、認知,、交流、服務的能力,,同時,,還打通了VTM機系統(tǒng),使得該項目可勝任各類金融服務場景,;生動的3D形象配以親和的面部表情和肢體動作,,充分模擬人與人之間真實的對話方式,打造的可媲美真人的VTM數(shù)字員工,,為用戶提供接近于真人體驗的可視化服務,。目前該項目已在銀行多個網點部署,并取得了良好的效果,。
隨著人工智能的深入發(fā)展,,像虛擬數(shù)字人這樣的AI技術早已走出了實驗室,與現(xiàn)實的產業(yè)場景不斷融合,。京東AI技術之所以能取得如此優(yōu)異的成績,,是其在真實復雜場景的有效實踐和千錘百煉。作為整個京東集團對外提供技術服務的核心平臺,,京東云不僅是政府,、企業(yè),、家庭數(shù)字化轉型全生命周期合伙人,并基于人工智能,、大數(shù)據(jù),、云計算、物聯(lián)網,、區(qū)塊鏈,、隱私計算等技術,通過數(shù)智化全鏈條技術服務,,助力千行百業(yè)數(shù)字化轉型,,激發(fā)產業(yè)無限可能。