【ChatGPT專題】對話全球前2%頂尖科學(xué)家：深度解構(gòu)“殺手級應(yīng)用”ChatGPT-AET-電子技術(shù)應(yīng)用

【ChatGPT專題】對話全球前2%頂尖科學(xué)家：深度解構(gòu)“殺手級應(yīng)用”ChatGPT

日期： 2023-02-16

來源：中國聯(lián)通

關(guān)鍵詞： ChatGPT

　　這個冬天，ChatGPT火爆全球。作為AIGC的重要落地應(yīng)用，ChatGPT到底是什么？帶來什么影響？中國版ChatGPT如何發(fā)展？通信產(chǎn)業(yè)如何著力？對此，《通信產(chǎn)業(yè)報》全媒體專訪聯(lián)通數(shù)科首席AI科學(xué)家廉士國博士（專家介紹請戳：喜報），作為2022年度“全球前2%頂尖科學(xué)家榜單”入選者，他如何看待ChatGPT概念、影響和未來發(fā)展呢，一起來看：

　　ChatGPT是什么？

　　廉士國：ChatGPT是一個面向?qū)υ拡鼍暗拇笳Z言模型，是在2020年發(fā)布的語言生成模型GPT-3版本基礎(chǔ)上的改進(jìn)版，又稱為GPT-3.5版。它能通過與人類做文字對話的方式，針對人類輸入的提示文字，提供相應(yīng)的文字回答，且回答的內(nèi)容“形式上合理”。

　　因?yàn)椴捎昧俗员O(jiān)督學(xué)習(xí)技術(shù)，而無需人工做數(shù)據(jù)標(biāo)注，就可以用網(wǎng)絡(luò)上大量公開文本數(shù)據(jù)來做模型訓(xùn)練，以形成沉淀了大量知識的模型。依賴于訓(xùn)練庫中的文本數(shù)據(jù)涉及的領(lǐng)域，原則上只要是自然語言能夠表述出的領(lǐng)域都可用來訓(xùn)練并能具備該領(lǐng)域的智能問答功能，例如歷史、地理、數(shù)學(xué)、詩歌、編程等。目前大家在線體驗(yàn)的ChatGPT服務(wù)，是基于ChatGPT模型包裝成的問答SaaS服務(wù)。

　　ChatGPT有什么影響？

　　廉士國：ChatGPT給人們帶來新穎的體驗(yàn)，主要體現(xiàn)在其支持自然問答交互方式、能創(chuàng)作性組織文字內(nèi)容、可記憶強(qiáng)大知識庫、具備“多才多藝”能力等方面，在交互方式和能力上更“像”人。因?yàn)槭腔谧匀徽Z言數(shù)據(jù)訓(xùn)練的，其在自然語言或文字相關(guān)的功能上更成熟，例如百科知識查詢、問題探討或觀點(diǎn)獲取、文字創(chuàng)作等。

　　首先，會對搜索體驗(yàn)帶來提升，包括更自然地輸入內(nèi)容、更豐富的輸出結(jié)果呈現(xiàn)、更準(zhǔn)確的內(nèi)容組織梳理等，可在自然對話中完成更精準(zhǔn)的搜索，或者說讓搜索從關(guān)鍵詞匹配逐漸過渡到語義匹配。其次，為文字創(chuàng)作提供便捷的輔助工具，例如寫論文、編程序、回復(fù)郵件等，先為人工生成草稿以提升效率。另外，會提升對話閑聊的水平，包括對長句的理解能力、多輪對話能力、針對問題的內(nèi)容組織能力等的提升，將革新智能音箱的體驗(yàn)。總之，基于ChatGPT基礎(chǔ)模型，可以對例如搜索引擎類的信息查詢工具做升級改造，可以制作文字創(chuàng)作工具作為人類的助手來提升工作效率，可以為人類提供專家級咨詢參考和輔導(dǎo)等。

　　ChatGPT會如何影響AI產(chǎn)業(yè)格局和發(fā)展走勢？

　　廉士國：ChatGPT目前在免費(fèi)試用階段，上線僅兩個月已突破1億用戶數(shù)。據(jù)說后續(xù)會推出按月收費(fèi)的商用版本，同時微軟已正式推出基于ChatGPT的Bing搜索產(chǎn)品并正將其嵌入Office和Azure等產(chǎn)品中。

　　目前看，ChatGPT在B端產(chǎn)品中的定位相對明確，可作為輔助工具來改進(jìn)已有產(chǎn)品或?yàn)槿斯ぬ峁┲止δ堋＠纾m然大模型里沉淀了大量知識，但它很難完全替代搜索引擎，因?yàn)槠洳荒芴峁┰純?nèi)容鏈接、不能做即時信息查詢等，可作為使能工具來升級搜索引擎產(chǎn)品；它可為銷售人員提供回復(fù)郵件自動生成工具，以降低人工工作量并提升效率等。

　　而作為C端產(chǎn)品，相對還不夠明確，類似寫論文、編程序、咨詢顧問等的個人助手，是否存在合規(guī)性風(fēng)險、商業(yè)模式問題等，有待探索，但同時也有較大可想像空間。但對算力基礎(chǔ)設(shè)施的帶動作用是明確的，無論是ChatGPT的研發(fā)（訓(xùn)練）和基于ChatGPT的應(yīng)用（推理）都需要大量智能計算資源和數(shù)據(jù)存儲及傳輸資源，因此具備智能算力中心的云計算企業(yè)將是受益者。從技術(shù)分層角度看，從底往上：智能算力平臺、ChatGPT基礎(chǔ)大模型、基于ChatGPT基礎(chǔ)模型的AI應(yīng)用或插件、行業(yè)應(yīng)用系統(tǒng)。

　　可以預(yù)見：以智能算力平臺為基礎(chǔ)，會有少量公司做類似ChatGPT基礎(chǔ)大模型，其他大量公司和開發(fā)者會基于ChatGPT基礎(chǔ)模型做AI應(yīng)用或插件，包括To B和To C類的，這些AI應(yīng)用或插件可被集成到行業(yè)應(yīng)用系統(tǒng)中。這種分層模式跟非大模型時代相似，只是現(xiàn)在大模型可能開始不再免費(fèi)了，這是否說明會出現(xiàn)以ChatGPT基礎(chǔ)大模型擁有者為中心的“寡頭”？對標(biāo)OpenAI的ChatGPT，谷歌剛剛發(fā)布了以其LaMDA大模型為基礎(chǔ)的Bard對話服務(wù)。是否要出現(xiàn)類似iOS和Android兩強(qiáng)對立的局面？

　　我們認(rèn)為，目前階段的基礎(chǔ)大模型性能上還需完善，其門檻也沒有高到只能出現(xiàn)兩個“寡頭”，更多玩家的局面將會出現(xiàn)。試用階段的用戶熱度是否會延續(xù)，有賴于后續(xù)“爆款”AI應(yīng)用的出現(xiàn)，但其對已有行業(yè)應(yīng)用系統(tǒng)的升級輔助作用會持續(xù)體現(xiàn)出價值。

　　ChatGPT發(fā)展存在哪些挑戰(zhàn)？它會對AI倫理、數(shù)字治理有什么影響？

　　廉士國：ChatGPT基礎(chǔ)模型是基于文字間上下文關(guān)聯(lián)關(guān)系做自監(jiān)督訓(xùn)練的，以數(shù)據(jù)驅(qū)動為主、外加少量人工介入，其功能依賴于訓(xùn)練數(shù)據(jù)的數(shù)量和質(zhì)量。從近期的大眾試用反映來看，如果通過百科知識問答、寫詩、做數(shù)學(xué)題和查詢天氣等測試來分別評估當(dāng)前基礎(chǔ)模型的記憶、創(chuàng)作、推理、查詢能力，其相對從強(qiáng)到弱的排序是：記憶能力、創(chuàng)作能力、推理能力、查詢能力。其推理能力相對較弱，這印證了國外部分專家的評價：當(dāng)前版本模型對自然語言文本規(guī)則和模式知識學(xué)得較好，但對抽象知識和邏輯推理還沒有學(xué)到位。其信息查詢能力依賴于其訓(xùn)練數(shù)據(jù)的截止搜集時間，例如問“北京明天的天氣是？”其回答“北京明天25度，天氣晴朗”，因?yàn)槠溆?xùn)練數(shù)據(jù)截止到2021年春夏之交，僅能查詢2021年之前的信息。即使其創(chuàng)作能力較強(qiáng)，寫出的詩、論文和問題建議在形式結(jié)構(gòu)上看很合理，但細(xì)究其內(nèi)部邏輯仍有不合理的拼湊感。

　　盡管ChatGPT本身還存在一些技術(shù)挑戰(zhàn)，但大家已經(jīng)看到了其威力，甚至已對現(xiàn)行制度帶來了不利影響，例如有國外學(xué)生用它來代寫課題論文并獲得了高分，這給其他同學(xué)帶來了不公平。的確，ChatGPT的出現(xiàn)超出了大家的預(yù)期，但我們的數(shù)字治理還沒有跟上。像這樣具備文字創(chuàng)作等能力的超級助手，人人都可以平等獲得嗎？其創(chuàng)作的內(nèi)容存在版權(quán)問題嗎、是否可以自由使用而不受限？其創(chuàng)作的內(nèi)容如果存在編造事實(shí)、民族歧視、侵犯隱私等問題應(yīng)由誰來擔(dān)責(zé)？等等問題是需要大家共同來面對的。而人工智能領(lǐng)域的專家們已經(jīng)開始考慮用技術(shù)手段來鑒別AI生成的內(nèi)容了，例如通過人工規(guī)則來判斷內(nèi)容合法性、通過文本內(nèi)容統(tǒng)計分析及添加文本水印等方法來鑒權(quán)等。我們相信，除了技術(shù)手段之外，相關(guān)的數(shù)字治理制度也將啟動建立。

　　中國版ChatGPT如何發(fā)展？

　　廉士國：類似ChatGPT的大模型可通過基于自然語言的自監(jiān)督學(xué)習(xí)技術(shù)實(shí)現(xiàn)對知識的沉淀，可作為公共的基礎(chǔ)模型，支撐多種上層應(yīng)用。因此，構(gòu)建中文版的ChatGPT形成具備中文知識的公共基礎(chǔ)模型，也尤為重要。

　　研發(fā)類似ChatGPT的大模型，其基礎(chǔ)主要包括智能算力、大量數(shù)據(jù)、自監(jiān)督學(xué)習(xí)算法等。對于這些基礎(chǔ)，國內(nèi)相關(guān)企業(yè)和機(jī)構(gòu)是擁有的或可以聯(lián)合構(gòu)建。之前，已有國內(nèi)企業(yè)和機(jī)構(gòu)發(fā)布了大模型，包括語言大模型、基于語言大模型的多模態(tài)模型等，只是其語言大模型還沒達(dá)到ChatGPT的能力。剛剛已有幾家國內(nèi)企業(yè)宣布在ChatGPT上做布局，相信國內(nèi)很快會出現(xiàn)類似ChatGPT的語言大模型，并且對中文效果更好。

　　另外，國內(nèi)的應(yīng)用場景豐富、開發(fā)者眾多，以ChatGPT類大模型為基礎(chǔ)，面向垂直應(yīng)用場景的再開發(fā)，可能出現(xiàn)“爆款”智能應(yīng)用。而且，考慮到國內(nèi)千行百業(yè)數(shù)字化轉(zhuǎn)型的趨勢，會產(chǎn)生豐富的行業(yè)場景數(shù)據(jù)，可能推進(jìn)行業(yè)大模型的快速發(fā)展，包括語言類、多模類等，不限于對話場景，可在基礎(chǔ)模型上做微調(diào)或重訓(xùn)練。

　　最后，ChatGPT的研發(fā)模式和歷程值得我們借鑒。一方面，ChatGPT的研發(fā)要以巨大的算力和數(shù)據(jù)以及最前沿算法為基礎(chǔ)，OpenAI公司能聚齊這些資源并具備產(chǎn)學(xué)研用融合特點(diǎn)，這種以公司牽頭的產(chǎn)學(xué)研用融合研發(fā)體系值得借鑒。另一方面，雖然ChatGPT僅僅是OpenAI追求的AGI（通用人工智能）的初級階段，但我們已看到了其創(chuàng)新帶來的巨大影響力，這得益于OpenAI創(chuàng)始人和投資者的遠(yuǎn)見和堅持。大家可能還記得，OpenAI和DeepMind的投入-產(chǎn)出問題（虧損情況），曾是大家熱議的話題，也反應(yīng)在國內(nèi)AI領(lǐng)域投資的波動上。從ChatGPT基礎(chǔ)模型的研發(fā)歷程來看，大模型研發(fā)是中長期積累的產(chǎn)物，如果僅追求短期回報可能反而會錯過機(jī)會。這也給了國內(nèi)投資者和創(chuàng)始人以啟示，大的創(chuàng)新是需要中長期的堅持的，尤其人工智能領(lǐng)域還有很多未知待解決，就更需要堅定客觀正確的方向不動搖。

　　ChatGPT對信息通信業(yè)有什么影響與互動？如何利用？

　　廉士國：ChatGPT實(shí)現(xiàn)了人與機(jī)器之間以文本方式“communication”的功能，接近甚至超越了人與人之間以文本方式聊天的體驗(yàn)，這與信息通信業(yè)要支撐的豐富人們的溝通與交流相似。

　　首先，ChatGPT大模型可作為工具用來改進(jìn)信息通信服務(wù)能力，例如其在自然語言上的強(qiáng)大能力可用于提升智能客服、智慧運(yùn)營、欺詐監(jiān)測等運(yùn)營服務(wù)功能，通信網(wǎng)絡(luò)的巨量數(shù)據(jù)量可用來訓(xùn)練通信網(wǎng)絡(luò)大模型賦能網(wǎng)絡(luò)自主運(yùn)行。其次，ChatGPT在自然語言上的成功，啟示了在語音、視覺等多模態(tài)數(shù)據(jù)上的擴(kuò)展空間，這將為運(yùn)營商在政企業(yè)務(wù)上為千行百業(yè)數(shù)字化轉(zhuǎn)型賦能提供重要工具。而且，ChatGPT等大模型的運(yùn)行和服務(wù)離不開算力和網(wǎng)絡(luò)支撐，運(yùn)營商作為新型信息基礎(chǔ)設(shè)施服務(wù)運(yùn)營者，可以加強(qiáng)算網(wǎng)融合的智能算力中心建設(shè)，來承載ChatGPT等大模型訓(xùn)練和推理服務(wù)，真正讓大模型服務(wù)遍及無處不在的用戶。

　　可以預(yù)見，ChatGPT的流行會讓人機(jī)自然對話的交互方式越來越普及，并很可能從文本對話模式擴(kuò)展到語音對話模式，以及與數(shù)字人面對面交流模式，進(jìn)而將大大提升信息通信流量和用戶黏度，這也將推動信息通信業(yè)考慮從人與人之間的溝通交流擴(kuò)展到人機(jī)之間的溝通交流。雖然傳統(tǒng)搜索引擎已經(jīng)不再是搜尋或咨詢信息的普遍方式了，部分代之以基于知識沉淀的大模型構(gòu)建的文本/語音/數(shù)字人對話機(jī)器人，但這對信息通信的依賴程度有過之而無不及，因而通信行業(yè)更應(yīng)該擁抱大模型。

敬請關(guān)注電子技術(shù)應(yīng)用2023年2月22日==>>商業(yè)航天研討會<<

微信圖片_20230210170337.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

【ChatGPT專題】對話全球前2%頂尖科學(xué)家：深度解構(gòu)“殺手級應(yīng)用”ChatGPT

日期： 2023-02-16

來源：中國聯(lián)通

相關(guān)內(nèi)容