5月17日,2021搜狐科技5G&AI峰會在北京隆重召開。阿里巴巴集團副總裁,、達摩院城市大腦實驗室主任華先勝作為嘉賓,,發(fā)表了題為《人工智能技術(shù)規(guī)模化應(yīng)用的探索與實踐》的主題演講,。在他看來,,AI平臺化是AI未來發(fā)展趨勢,未來將“無行業(yè),,不AI”,。(詳見文章《阿里巴巴華先勝:AI平臺化是AI未來發(fā)展趨勢 | 搜狐科技5G&AI峰會 》)
演講后,他接受了搜狐科技的專訪,,針對技術(shù)在真實世界的通用性,、智慧城市的切入點和難點、國內(nèi)人工智能的優(yōu)勢和薄弱點以及圖片搜索于電商的意義等多個問題進行了一一解答,。
在他看來,,中國在人工智能領(lǐng)域的發(fā)展既存在優(yōu)勢,也有薄弱點,?!霸谥袊绕涫窃趹?yīng)用技術(shù)創(chuàng)新應(yīng)用方面,,做得既深入又廣泛,。這跟社會對新技術(shù)的接納態(tài)度很有關(guān)系,不論是政府還是企業(yè),,都很愿意嘗試用新的技術(shù)解決行業(yè)的問題和推動行業(yè)的變革。另外,,中國的人才也比較豐富,,各個層級的人才都有,各個方面的人才都有,,這也是非常好的優(yōu)勢,。”
不過,,華先勝表示,,國內(nèi)在通用的原創(chuàng)技術(shù)上可能會稍弱一些,但也有不少人在為此努力,。
衡量人工智能價值,,可以從其“通用性”來判斷。這里的通用性并非是指AI跨行業(yè)的通用性,,而是指AI從實驗室環(huán)境遷移到現(xiàn)實世界的能力,。“通用性是我們做技術(shù)研發(fā)時一開始就會考慮的問題?!?/p>
華先勝解釋稱,,在人工智能落地的過程中,每個階段都有不同的關(guān)注重點,。首先是算法的準確率,,然后逐漸過渡到計算效率和普適性提升?!拔覀儠谡鎸嵉拇髷?shù)據(jù)場景下不斷地對算法進行打磨和迭代,,但如果只是做基礎(chǔ)科研的話,就不見得會關(guān)心這個問題,。因為把技術(shù)遷移到真實環(huán)境下,,問題往往會變得更深,更復(fù)雜,,更有挑戰(zhàn),。”
華先勝所專注的智慧城市領(lǐng)域,,就是人工智能最重要的落地場景之一,,也是一個眾多公司都在參與競爭的火熱賽道?!巴袀冇袕亩耍▊鞲衅鳎┣腥氲?,有從應(yīng)用層切入的,有從算法角度切入的,,還有從AI能力平臺角度切入的,;當然,也有從AI技術(shù)研發(fā)平臺角度切入的,?!?/p>
盡管業(yè)內(nèi)做法不一,但華先勝表示,,憑一家之力,,很難從底層到應(yīng)用層全部做到盡善盡美。更好的方式是,,每一部分都有更專長的人做,。“這也同時會帶來一個問題,,就是行業(yè)內(nèi)需要一份標準和規(guī)范,,能夠讓不同的團隊、不同的公司,、不同的服務(wù)的提供方形成合力,。不至于在每個城市里,,一部分是這家公司做的,另外一個部分那家公司做的,,最后各自為政,。”
除了上述談到的國內(nèi)人工智能的優(yōu)勢和薄弱點,、技術(shù)通用性等問題外,,普通大眾可能對“買買買”更為熟悉。值得一提的是,,“搜同款神器”——手機淘寶中 “拍立淘”,,其背后的技術(shù)就是由華先勝首創(chuàng)和實現(xiàn)的。
當談及圖片搜索對于電商生態(tài)的意義時,,華先勝表示:“通過圖片來搜索商品是圖像搜索絕佳的應(yīng)有場景,,這是一個剛性的需求,解決的是文本搜索和瀏覽無法解決的問題,?!边@也是圖片搜索永遠在電商搜索中占據(jù)一席之地的原因。
嘉賓簡介:
華先勝,,現(xiàn)任阿里巴巴集團副總裁,、高級研究員、達摩院城市大腦實驗室主任,。
華先勝是國際電氣與電子工程師協(xié)會會士(IEEE Fellow),,美國計算機協(xié)會杰出科學(xué)家(ACM Distinguished Scientist);2008年獲MIT技術(shù)評論“全球35個35歲以下杰出青年創(chuàng)新者”稱號(TR35),。
華先勝1996年和2001年畢業(yè)于北京大學(xué)數(shù)學(xué)學(xué)院,,分別獲學(xué)士和博士學(xué)位;之后分別工作于微軟亞洲研究院,,微軟美國必應(yīng)搜索引擎,,以及微軟美國研究院,從事多媒體,、計算機視覺和機器學(xué)習(xí)方面的研發(fā)工作,。2015年4月加入阿里巴巴,,任搜索事業(yè)部資深總監(jiān)/研究員,;2016年加入阿里云iDST,負責(zé)云上視覺智能計算的技術(shù)研發(fā),;現(xiàn)任阿里達摩院城市大腦實驗室主任,。他的研發(fā)興趣在大規(guī)模視覺人工智能領(lǐng)域,包括視覺分析,、識別,、搜索和挖掘等,。華先勝在國際主流會議和期刊上發(fā)表論文200余篇,擁有專利90余項,。曾擔任多個學(xué)術(shù)期刊的副主編以及ACM Multimedia等頂級學(xué)術(shù)會議的程序委員會主席,,并獲得多個國際會議及期刊的最佳論文獎。華先勝曾擔任ACM Multimedia 2020年大會主席,。
以下為專訪實錄精編:
搜狐科技:感謝阿里集團副總裁,、達摩院城市大腦實驗室主任華先勝參加搜狐科技的專訪。華老師您好,,首先請您跟大家介紹一下達摩院和您的研究方向,?
華先勝:達摩院是阿里巴巴的基礎(chǔ)科研和基礎(chǔ)創(chuàng)新研發(fā)的核心機構(gòu)。目前實驗室有5個方向,,包括機器智能,、數(shù)據(jù)計算、機器人,、金融科技和X實驗室,。我自己所在的實驗室是人工智能方向,是人工智能從基礎(chǔ)的技術(shù)研發(fā),,到形成產(chǎn)品,,再到到產(chǎn)品落地應(yīng)用場景的一條龍的團隊建制。
搜狐科技:就像您介紹的,,達摩院是研究基礎(chǔ)科學(xué)的創(chuàng)新技術(shù)研究的機構(gòu),,實驗室的環(huán)境和真實世界還是有一定的不同的,想問問您,,為了讓技術(shù)在現(xiàn)實世界中取得更好的效果,,目前是否有哪些難點和技術(shù)解決方案呢?
華先勝:通用性是我們做技術(shù)研發(fā)一開始就會考慮的問題,,這個通用性不是指行業(yè)通用性,,而是指在真實世界的復(fù)雜場景下有沒有通用性,除了通用性之外,,計算的效率有多高,,也是我們會考慮的問題。
當然最初的時候,,算法的準確率上是技術(shù)研究人員們更關(guān)注的方向,,但是我們逐步會把它的效率和普適性提升放在更重要的位置。其實,,一開始我們就關(guān)注這個最終的目標,。
我們會在真實的大數(shù)據(jù)場景下做不斷的打磨和迭代,如果是做基礎(chǔ)科研的話可能會更關(guān)注基礎(chǔ)算法的創(chuàng)新,。
在應(yīng)用場景下能夠取得突破,,其實相對于在封閉數(shù)據(jù)集上做科研,,是一件更難的事情。問題會變得更深,,變得更復(fù)雜,,更有挑戰(zhàn),我們花費了很大的精力,,讓技術(shù)在規(guī)模上,、在真實場景中應(yīng)用中去實驗,在實踐中檢驗,,在實踐中去磨煉,。
搜狐科技:您目前的研究方向是城市大腦,智慧城市領(lǐng)域越來越多受到業(yè)內(nèi)的關(guān)注,,很多的同行們都在跟進這個方向,,在您的觀察里面,大家的切入點都有哪些不同,?
華先勝:切入點都沒有什么太大問題,,可以從傳感器端上切入,AI放在端上做也是可以的,;也可以從服務(wù)器端的算法切入,,解決一些核心問題;還可以從AI平臺切入,,提供平臺層的能力,,賦能其他開發(fā)者;從應(yīng)用層切入也是常見的方式,,能夠基于其他的團隊提供的AI平臺,,去做智慧城市的各個領(lǐng)域,比如說各委辦局等等具體部門的業(yè)務(wù)所需要的能力,;當然,,從AI技術(shù)研發(fā)平臺這個角度切入也是可以的。
實際上也是智慧城市也是需要大家一起來繁榮的,。很難說誰的切入點一定是對或者一定是錯,。
一般來說,一家公司很難從底層到上面最后的應(yīng)用層全部都做了,。更多的是每一部分都有更專長的人做,,專業(yè)的人做專業(yè)的事情,這個才是最好的,。
當然這里面也帶來一個問題,,就是怎樣能夠形成一個規(guī)范,,能夠不同的團隊,、不同的公司,、不同的服務(wù)的提供方能夠形成合力,這個標準和規(guī)范是急需解決的一個問題,,這樣才能真正形成合力,,不至于說每個城市里面,這個是他做的,,另一個地方是另外一家做的,,最后各自為政,這就不太好了,。
搜狐科技:那現(xiàn)在的情況是否就像您剛剛提到的呢,?
華先勝:應(yīng)該會慢慢變化,我們也在推動規(guī)范和標準的建立,。
搜狐科技:您先后有國外和國內(nèi)兩段研究的經(jīng)歷,,想問您一下,國內(nèi)相對于國外來說,,在人工智能上的優(yōu)勢和發(fā)力點有什么不一樣嗎,?
華先勝:在中國,尤其應(yīng)用技術(shù)創(chuàng)新應(yīng)用方面,,做得既深入又廣泛,,這跟社會對新技術(shù)的接納態(tài)度很有關(guān)系。不論是政府還是企業(yè),,都很愿意嘗試用新的技術(shù)解決行業(yè)的問題和推動行業(yè)的變革,,中國是一個非常好的環(huán)境。另外,,中國的人才也比較豐富,,各個層級的人才都有,各個方面的人才都有,。所以,,在解決行業(yè)的問題上的這些創(chuàng)新,中國是非常占有優(yōu)勢的,,在世界上也是走在前沿的,。
至于也有人認為,中國原創(chuàng)的技術(shù)要稍弱一點,,其實中國也有不少原創(chuàng)的東西,,但相對來說,通用的原創(chuàng)技術(shù)可能會稍微少一點,,比如說一些基礎(chǔ)模型,,可能會比應(yīng)用技術(shù)的研發(fā)相比稍微弱一點,現(xiàn)在也看到很多人做這方面的事情,。
搜狐科技:您介紹了很多技術(shù)相關(guān)的內(nèi)容,,但普通大眾對“買買買”更感興趣,,手機淘寶里面的“拍立淘”背后的技術(shù)就是由您開創(chuàng)的,請您簡單介紹一下,,圖片搜索對于電商生態(tài)有什么重要性,?
華先勝:圖像搜索并不是阿里巴巴原創(chuàng),上世紀90年代就有很多人做這方面的研究,,那時候叫做圖像檢索,,有很多人因為這方面的研究而獲得了博士學(xué)位的。
但是那個時候的技術(shù)跟今天還是有很大差別的,,深度學(xué)習(xí)技術(shù)和索引技術(shù)起來了以后,,才使得這項技術(shù)真正能夠應(yīng)用起來。
之前很多人,,包括我在微軟的時候,,也做過這樣的工作,大多是通用的場景,,但通用的場景目前來看不是一個特別剛性的需求,。
但是電商的場景不一樣,通過圖片來搜索商品是圖像搜索絕佳的應(yīng)用場景,,也是剛性的需求,,解決的是文本的搜索和瀏覽無法解決的問題。因為很多場景只有通過這種方式才能搜索:你看中了這個商品,,但是你沒辦法準確知道商品名字,,這時候你只能通過拍照來進行搜索。
當然,,這個功能還可以搜索同款,、相似款,比如“神似”的東西,,兩者很像,,但其實并不是一個商品,這些通過文字都無法實現(xiàn),。 圖片搜索目前在電商搜索中里面占了一定的量,,主流還是在文字和瀏覽,但是它切實解決了一個過去解決不了的問題,,所以用戶量也不少,。