這個冬天,ChatGPT火爆全球。作為AIGC的重要落地應用,,ChatGPT到底是什么?帶來什么影響,?中國版ChatGPT如何發(fā)展?通信產(chǎn)業(yè)如何著力,?對此,,《通信產(chǎn)業(yè)報》全媒體專訪聯(lián)通數(shù)科首席AI科學家廉士國博士(專家介紹請戳:喜報),作為2022年度“全球前2%頂尖科學家榜單”入選者,,他如何看待ChatGPT概念,、影響和未來發(fā)展呢,一起來看:
ChatGPT是什么,?
廉士國:ChatGPT是一個面向?qū)υ拡鼍暗拇笳Z言模型,,是在2020年發(fā)布的語言生成模型GPT-3版本基礎上的改進版,又稱為GPT-3.5版,。它能通過與人類做文字對話的方式,,針對人類輸入的提示文字,提供相應的文字回答,,且回答的內(nèi)容“形式上合理”,。
因為采用了自監(jiān)督學習技術,而無需人工做數(shù)據(jù)標注,,就可以用網(wǎng)絡上大量公開文本數(shù)據(jù)來做模型訓練,以形成沉淀了大量知識的模型,。依賴于訓練庫中的文本數(shù)據(jù)涉及的領域,,原則上只要是自然語言能夠表述出的領域都可用來訓練并能具備該領域的智能問答功能,例如歷史,、地理,、數(shù)學、詩歌,、編程等,。目前大家在線體驗的ChatGPT服務,是基于ChatGPT模型包裝成的問答SaaS服務,。
ChatGPT有什么影響,?
廉士國:ChatGPT給人們帶來新穎的體驗,主要體現(xiàn)在其支持自然問答交互方式,、能創(chuàng)作性組織文字內(nèi)容,、可記憶強大知識庫,、具備“多才多藝”能力等方面,在交互方式和能力上更“像”人,。因為是基于自然語言數(shù)據(jù)訓練的,,其在自然語言或文字相關的功能上更成熟,例如百科知識查詢,、問題探討或觀點獲取,、文字創(chuàng)作等。
首先,,會對搜索體驗帶來提升,,包括更自然地輸入內(nèi)容、更豐富的輸出結(jié)果呈現(xiàn),、更準確的內(nèi)容組織梳理等,,可在自然對話中完成更精準的搜索,或者說讓搜索從關鍵詞匹配逐漸過渡到語義匹配,。其次,,為文字創(chuàng)作提供便捷的輔助工具,例如寫論文,、編程序,、回復郵件等,先為人工生成草稿以提升效率,。另外,,會提升對話閑聊的水平,包括對長句的理解能力,、多輪對話能力,、針對問題的內(nèi)容組織能力等的提升,將革新智能音箱的體驗,??傊贑hatGPT基礎模型,,可以對例如搜索引擎類的信息查詢工具做升級改造,,可以制作文字創(chuàng)作工具作為人類的助手來提升工作效率,可以為人類提供專家級咨詢參考和輔導等,。
ChatGPT會如何影響AI產(chǎn)業(yè)格局和發(fā)展走勢,?
廉士國:ChatGPT目前在免費試用階段,上線僅兩個月已突破1億用戶數(shù),。據(jù)說后續(xù)會推出按月收費的商用版本,,同時微軟已正式推出基于ChatGPT的Bing搜索產(chǎn)品并正將其嵌入Office和Azure等產(chǎn)品中。
目前看,,ChatGPT在B端產(chǎn)品中的定位相對明確,,可作為輔助工具來改進已有產(chǎn)品或為人工提供助手功能,。例如,雖然大模型里沉淀了大量知識,,但它很難完全替代搜索引擎,,因為其不能提供原始內(nèi)容鏈接、不能做即時信息查詢等,,可作為使能工具來升級搜索引擎產(chǎn)品,;它可為銷售人員提供回復郵件自動生成工具,以降低人工工作量并提升效率等,。
而作為C端產(chǎn)品,,相對還不夠明確,類似寫論文,、編程序,、咨詢顧問等的個人助手,是否存在合規(guī)性風險,、商業(yè)模式問題等,,有待探索,但同時也有較大可想像空間,。但對算力基礎設施的帶動作用是明確的,,無論是ChatGPT的研發(fā)(訓練)和基于ChatGPT的應用(推理)都需要大量智能計算資源和數(shù)據(jù)存儲及傳輸資源,因此具備智能算力中心的云計算企業(yè)將是受益者,。從技術分層角度看,,從底往上:智能算力平臺、ChatGPT基礎大模型,、基于ChatGPT基礎模型的AI應用或插件,、行業(yè)應用系統(tǒng)。
可以預見:以智能算力平臺為基礎,,會有少量公司做類似ChatGPT基礎大模型,,其他大量公司和開發(fā)者會基于ChatGPT基礎模型做AI應用或插件,包括To B和To C類的,,這些AI應用或插件可被集成到行業(yè)應用系統(tǒng)中。這種分層模式跟非大模型時代相似,,只是現(xiàn)在大模型可能開始不再免費了,,這是否說明會出現(xiàn)以ChatGPT基礎大模型擁有者為中心的“寡頭”?對標OpenAI的ChatGPT,,谷歌剛剛發(fā)布了以其LaMDA大模型為基礎的Bard對話服務,。是否要出現(xiàn)類似iOS和Android兩強對立的局面?
我們認為,,目前階段的基礎大模型性能上還需完善,,其門檻也沒有高到只能出現(xiàn)兩個“寡頭”,,更多玩家的局面將會出現(xiàn)。試用階段的用戶熱度是否會延續(xù),,有賴于后續(xù)“爆款”AI應用的出現(xiàn),,但其對已有行業(yè)應用系統(tǒng)的升級輔助作用會持續(xù)體現(xiàn)出價值。
ChatGPT發(fā)展存在哪些挑戰(zhàn),?它會對AI倫理,、數(shù)字治理有什么影響?
廉士國:ChatGPT基礎模型是基于文字間上下文關聯(lián)關系做自監(jiān)督訓練的,,以數(shù)據(jù)驅(qū)動為主,、外加少量人工介入,其功能依賴于訓練數(shù)據(jù)的數(shù)量和質(zhì)量,。從近期的大眾試用反映來看,,如果通過百科知識問答、寫詩,、做數(shù)學題和查詢天氣等測試來分別評估當前基礎模型的記憶,、創(chuàng)作、推理,、查詢能力,,其相對從強到弱的排序是:記憶能力、創(chuàng)作能力,、推理能力,、查詢能力。其推理能力相對較弱,,這印證了國外部分專家的評價:當前版本模型對自然語言文本規(guī)則和模式知識學得較好,,但對抽象知識和邏輯推理還沒有學到位。其信息查詢能力依賴于其訓練數(shù)據(jù)的截止搜集時間,,例如問“北京明天的天氣是,?”其回答“北京明天25度,天氣晴朗”,,因為其訓練數(shù)據(jù)截止到2021年春夏之交,,僅能查詢2021年之前的信息。即使其創(chuàng)作能力較強,,寫出的詩,、論文和問題建議在形式結(jié)構(gòu)上看很合理,但細究其內(nèi)部邏輯仍有不合理的拼湊感,。
盡管ChatGPT本身還存在一些技術挑戰(zhàn),,但大家已經(jīng)看到了其威力,甚至已對現(xiàn)行制度帶來了不利影響,,例如有國外學生用它來代寫課題論文并獲得了高分,,這給其他同學帶來了不公平,。的確,ChatGPT的出現(xiàn)超出了大家的預期,,但我們的數(shù)字治理還沒有跟上,。像這樣具備文字創(chuàng)作等能力的超級助手,人人都可以平等獲得嗎,?其創(chuàng)作的內(nèi)容存在版權(quán)問題嗎,、是否可以自由使用而不受限?其創(chuàng)作的內(nèi)容如果存在編造事實,、民族歧視,、侵犯隱私等問題應由誰來擔責?等等問題是需要大家共同來面對的,。而人工智能領域的專家們已經(jīng)開始考慮用技術手段來鑒別AI生成的內(nèi)容了,,例如通過人工規(guī)則來判斷內(nèi)容合法性、通過文本內(nèi)容統(tǒng)計分析及添加文本水印等方法來鑒權(quán)等,。我們相信,,除了技術手段之外,相關的數(shù)字治理制度也將啟動建立,。
中國版ChatGPT如何發(fā)展,?
廉士國:類似ChatGPT的大模型可通過基于自然語言的自監(jiān)督學習技術實現(xiàn)對知識的沉淀,可作為公共的基礎模型,,支撐多種上層應用,。因此,構(gòu)建中文版的ChatGPT形成具備中文知識的公共基礎模型,,也尤為重要,。
研發(fā)類似ChatGPT的大模型,其基礎主要包括智能算力,、大量數(shù)據(jù),、自監(jiān)督學習算法等。對于這些基礎,,國內(nèi)相關企業(yè)和機構(gòu)是擁有的或可以聯(lián)合構(gòu)建,。之前,已有國內(nèi)企業(yè)和機構(gòu)發(fā)布了大模型,,包括語言大模型,、基于語言大模型的多模態(tài)模型等,只是其語言大模型還沒達到ChatGPT的能力,。剛剛已有幾家國內(nèi)企業(yè)宣布在ChatGPT上做布局,相信國內(nèi)很快會出現(xiàn)類似ChatGPT的語言大模型,,并且對中文效果更好,。
另外,,國內(nèi)的應用場景豐富、開發(fā)者眾多,,以ChatGPT類大模型為基礎,,面向垂直應用場景的再開發(fā),可能出現(xiàn)“爆款”智能應用,。而且,,考慮到國內(nèi)千行百業(yè)數(shù)字化轉(zhuǎn)型的趨勢,會產(chǎn)生豐富的行業(yè)場景數(shù)據(jù),,可能推進行業(yè)大模型的快速發(fā)展,,包括語言類、多模類等,,不限于對話場景,,可在基礎模型上做微調(diào)或重訓練。
最后,,ChatGPT的研發(fā)模式和歷程值得我們借鑒,。一方面,ChatGPT的研發(fā)要以巨大的算力和數(shù)據(jù)以及最前沿算法為基礎,,OpenAI公司能聚齊這些資源并具備產(chǎn)學研用融合特點,,這種以公司牽頭的產(chǎn)學研用融合研發(fā)體系值得借鑒。另一方面,,雖然ChatGPT僅僅是OpenAI追求的AGI(通用人工智能)的初級階段,,但我們已看到了其創(chuàng)新帶來的巨大影響力,這得益于OpenAI創(chuàng)始人和投資者的遠見和堅持,。大家可能還記得,,OpenAI和DeepMind的投入-產(chǎn)出問題(虧損情況),曾是大家熱議的話題,,也反應在國內(nèi)AI領域投資的波動上,。從ChatGPT基礎模型的研發(fā)歷程來看,大模型研發(fā)是中長期積累的產(chǎn)物,,如果僅追求短期回報可能反而會錯過機會,。這也給了國內(nèi)投資者和創(chuàng)始人以啟示,大的創(chuàng)新是需要中長期的堅持的,,尤其人工智能領域還有很多未知待解決,,就更需要堅定客觀正確的方向不動搖。
ChatGPT對信息通信業(yè)有什么影響與互動,?如何利用,?
廉士國:ChatGPT實現(xiàn)了人與機器之間以文本方式“communication”的功能,接近甚至超越了人與人之間以文本方式聊天的體驗,這與信息通信業(yè)要支撐的豐富人們的溝通與交流相似,。
首先,,ChatGPT大模型可作為工具用來改進信息通信服務能力,例如其在自然語言上的強大能力可用于提升智能客服,、智慧運營,、欺詐監(jiān)測等運營服務功能,通信網(wǎng)絡的巨量數(shù)據(jù)量可用來訓練通信網(wǎng)絡大模型賦能網(wǎng)絡自主運行,。其次,,ChatGPT在自然語言上的成功,啟示了在語音,、視覺等多模態(tài)數(shù)據(jù)上的擴展空間,,這將為運營商在政企業(yè)務上為千行百業(yè)數(shù)字化轉(zhuǎn)型賦能提供重要工具。而且,,ChatGPT等大模型的運行和服務離不開算力和網(wǎng)絡支撐,,運營商作為新型信息基礎設施服務運營者,可以加強算網(wǎng)融合的智能算力中心建設,,來承載ChatGPT等大模型訓練和推理服務,,真正讓大模型服務遍及無處不在的用戶。
可以預見,,ChatGPT的流行會讓人機自然對話的交互方式越來越普及,,并很可能從文本對話模式擴展到語音對話模式,以及與數(shù)字人面對面交流模式,,進而將大大提升信息通信流量和用戶黏度,,這也將推動信息通信業(yè)考慮從人與人之間的溝通交流擴展到人機之間的溝通交流。雖然傳統(tǒng)搜索引擎已經(jīng)不再是搜尋或咨詢信息的普遍方式了,,部分代之以基于知識沉淀的大模型構(gòu)建的文本/語音/數(shù)字人對話機器人,,但這對信息通信的依賴程度有過之而無不及,因而通信行業(yè)更應該擁抱大模型,。
敬請關注電子技術應用2023年2月22日==>>商業(yè)航天研討會<<