《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 【ChatGPT專題】對話全球前2%頂尖科學(xué)家:深度解構(gòu)“殺手級應(yīng)用”ChatGPT

【ChatGPT專題】對話全球前2%頂尖科學(xué)家:深度解構(gòu)“殺手級應(yīng)用”ChatGPT

2023-02-16
來源:中國聯(lián)通
關(guān)鍵詞: ChatGPT

  這個冬天,,ChatGPT火爆全球,。作為AIGC的重要落地應(yīng)用,,ChatGPT到底是什么?帶來什么影響,?中國版ChatGPT如何發(fā)展,?通信產(chǎn)業(yè)如何著力?對此,,《通信產(chǎn)業(yè)報》全媒體專訪聯(lián)通數(shù)科首席AI科學(xué)家廉士國博士(專家介紹請戳:喜報),,作為2022年度“全球前2%頂尖科學(xué)家榜單”入選者,他如何看待ChatGPT概念、影響和未來發(fā)展呢,,一起來看:

  ChatGPT是什么,?

  廉士國:ChatGPT是一個面向?qū)υ拡鼍暗拇笳Z言模型,是在2020年發(fā)布的語言生成模型GPT-3版本基礎(chǔ)上的改進(jìn)版,,又稱為GPT-3.5版,。它能通過與人類做文字對話的方式,針對人類輸入的提示文字,,提供相應(yīng)的文字回答,,且回答的內(nèi)容“形式上合理”。

  因為采用了自監(jiān)督學(xué)習(xí)技術(shù),,而無需人工做數(shù)據(jù)標(biāo)注,就可以用網(wǎng)絡(luò)上大量公開文本數(shù)據(jù)來做模型訓(xùn)練,,以形成沉淀了大量知識的模型,。依賴于訓(xùn)練庫中的文本數(shù)據(jù)涉及的領(lǐng)域,原則上只要是自然語言能夠表述出的領(lǐng)域都可用來訓(xùn)練并能具備該領(lǐng)域的智能問答功能,,例如歷史,、地理、數(shù)學(xué),、詩歌,、編程等。目前大家在線體驗的ChatGPT服務(wù),,是基于ChatGPT模型包裝成的問答SaaS服務(wù),。

  ChatGPT有什么影響?

  廉士國:ChatGPT給人們帶來新穎的體驗,,主要體現(xiàn)在其支持自然問答交互方式,、能創(chuàng)作性組織文字內(nèi)容、可記憶強(qiáng)大知識庫,、具備“多才多藝”能力等方面,,在交互方式和能力上更“像”人。因為是基于自然語言數(shù)據(jù)訓(xùn)練的,,其在自然語言或文字相關(guān)的功能上更成熟,,例如百科知識查詢、問題探討或觀點獲取,、文字創(chuàng)作等,。

  首先,會對搜索體驗帶來提升,,包括更自然地輸入內(nèi)容,、更豐富的輸出結(jié)果呈現(xiàn)、更準(zhǔn)確的內(nèi)容組織梳理等,可在自然對話中完成更精準(zhǔn)的搜索,,或者說讓搜索從關(guān)鍵詞匹配逐漸過渡到語義匹配,。其次,為文字創(chuàng)作提供便捷的輔助工具,,例如寫論文,、編程序、回復(fù)郵件等,,先為人工生成草稿以提升效率,。另外,會提升對話閑聊的水平,,包括對長句的理解能力,、多輪對話能力、針對問題的內(nèi)容組織能力等的提升,,將革新智能音箱的體驗,。總之,,基于ChatGPT基礎(chǔ)模型,,可以對例如搜索引擎類的信息查詢工具做升級改造,可以制作文字創(chuàng)作工具作為人類的助手來提升工作效率,,可以為人類提供專家級咨詢參考和輔導(dǎo)等,。

  ChatGPT會如何影響AI產(chǎn)業(yè)格局和發(fā)展走勢?

  廉士國:ChatGPT目前在免費試用階段,,上線僅兩個月已突破1億用戶數(shù),。據(jù)說后續(xù)會推出按月收費的商用版本,同時微軟已正式推出基于ChatGPT的Bing搜索產(chǎn)品并正將其嵌入Office和Azure等產(chǎn)品中,。

  目前看,,ChatGPT在B端產(chǎn)品中的定位相對明確,可作為輔助工具來改進(jìn)已有產(chǎn)品或為人工提供助手功能,。例如,,雖然大模型里沉淀了大量知識,但它很難完全替代搜索引擎,,因為其不能提供原始內(nèi)容鏈接,、不能做即時信息查詢等,可作為使能工具來升級搜索引擎產(chǎn)品,;它可為銷售人員提供回復(fù)郵件自動生成工具,,以降低人工工作量并提升效率等。

  而作為C端產(chǎn)品,,相對還不夠明確,,類似寫論文、編程序、咨詢顧問等的個人助手,,是否存在合規(guī)性風(fēng)險,、商業(yè)模式問題等,有待探索,,但同時也有較大可想像空間,。但對算力基礎(chǔ)設(shè)施的帶動作用是明確的,無論是ChatGPT的研發(fā)(訓(xùn)練)和基于ChatGPT的應(yīng)用(推理)都需要大量智能計算資源和數(shù)據(jù)存儲及傳輸資源,,因此具備智能算力中心的云計算企業(yè)將是受益者,。從技術(shù)分層角度看,從底往上:智能算力平臺,、ChatGPT基礎(chǔ)大模型,、基于ChatGPT基礎(chǔ)模型的AI應(yīng)用或插件、行業(yè)應(yīng)用系統(tǒng),。

  可以預(yù)見:以智能算力平臺為基礎(chǔ),,會有少量公司做類似ChatGPT基礎(chǔ)大模型,其他大量公司和開發(fā)者會基于ChatGPT基礎(chǔ)模型做AI應(yīng)用或插件,,包括To B和To C類的,這些AI應(yīng)用或插件可被集成到行業(yè)應(yīng)用系統(tǒng)中,。這種分層模式跟非大模型時代相似,,只是現(xiàn)在大模型可能開始不再免費了,這是否說明會出現(xiàn)以ChatGPT基礎(chǔ)大模型擁有者為中心的“寡頭”,?對標(biāo)OpenAI的ChatGPT,,谷歌剛剛發(fā)布了以其LaMDA大模型為基礎(chǔ)的Bard對話服務(wù)。是否要出現(xiàn)類似iOS和Android兩強(qiáng)對立的局面,?

  我們認(rèn)為,,目前階段的基礎(chǔ)大模型性能上還需完善,其門檻也沒有高到只能出現(xiàn)兩個“寡頭”,,更多玩家的局面將會出現(xiàn),。試用階段的用戶熱度是否會延續(xù),有賴于后續(xù)“爆款”AI應(yīng)用的出現(xiàn),,但其對已有行業(yè)應(yīng)用系統(tǒng)的升級輔助作用會持續(xù)體現(xiàn)出價值,。

  ChatGPT發(fā)展存在哪些挑戰(zhàn)?它會對AI倫理,、數(shù)字治理有什么影響,?

  廉士國:ChatGPT基礎(chǔ)模型是基于文字間上下文關(guān)聯(lián)關(guān)系做自監(jiān)督訓(xùn)練的,以數(shù)據(jù)驅(qū)動為主,、外加少量人工介入,,其功能依賴于訓(xùn)練數(shù)據(jù)的數(shù)量和質(zhì)量。從近期的大眾試用反映來看,如果通過百科知識問答,、寫詩,、做數(shù)學(xué)題和查詢天氣等測試來分別評估當(dāng)前基礎(chǔ)模型的記憶、創(chuàng)作,、推理,、查詢能力,其相對從強(qiáng)到弱的排序是:記憶能力,、創(chuàng)作能力,、推理能力、查詢能力,。其推理能力相對較弱,,這印證了國外部分專家的評價:當(dāng)前版本模型對自然語言文本規(guī)則和模式知識學(xué)得較好,但對抽象知識和邏輯推理還沒有學(xué)到位,。其信息查詢能力依賴于其訓(xùn)練數(shù)據(jù)的截止搜集時間,,例如問“北京明天的天氣是?”其回答“北京明天25度,,天氣晴朗”,,因為其訓(xùn)練數(shù)據(jù)截止到2021年春夏之交,僅能查詢2021年之前的信息,。即使其創(chuàng)作能力較強(qiáng),,寫出的詩、論文和問題建議在形式結(jié)構(gòu)上看很合理,,但細(xì)究其內(nèi)部邏輯仍有不合理的拼湊感,。

  盡管ChatGPT本身還存在一些技術(shù)挑戰(zhàn),但大家已經(jīng)看到了其威力,,甚至已對現(xiàn)行制度帶來了不利影響,,例如有國外學(xué)生用它來代寫課題論文并獲得了高分,這給其他同學(xué)帶來了不公平,。的確,,ChatGPT的出現(xiàn)超出了大家的預(yù)期,但我們的數(shù)字治理還沒有跟上,。像這樣具備文字創(chuàng)作等能力的超級助手,,人人都可以平等獲得嗎?其創(chuàng)作的內(nèi)容存在版權(quán)問題嗎,、是否可以自由使用而不受限,?其創(chuàng)作的內(nèi)容如果存在編造事實、民族歧視,、侵犯隱私等問題應(yīng)由誰來擔(dān)責(zé),?等等問題是需要大家共同來面對的,。而人工智能領(lǐng)域的專家們已經(jīng)開始考慮用技術(shù)手段來鑒別AI生成的內(nèi)容了,例如通過人工規(guī)則來判斷內(nèi)容合法性,、通過文本內(nèi)容統(tǒng)計分析及添加文本水印等方法來鑒權(quán)等,。我們相信,除了技術(shù)手段之外,,相關(guān)的數(shù)字治理制度也將啟動建立,。

  中國版ChatGPT如何發(fā)展?

  廉士國:類似ChatGPT的大模型可通過基于自然語言的自監(jiān)督學(xué)習(xí)技術(shù)實現(xiàn)對知識的沉淀,,可作為公共的基礎(chǔ)模型,,支撐多種上層應(yīng)用。因此,,構(gòu)建中文版的ChatGPT形成具備中文知識的公共基礎(chǔ)模型,,也尤為重要。

  研發(fā)類似ChatGPT的大模型,,其基礎(chǔ)主要包括智能算力,、大量數(shù)據(jù)、自監(jiān)督學(xué)習(xí)算法等,。對于這些基礎(chǔ),,國內(nèi)相關(guān)企業(yè)和機(jī)構(gòu)是擁有的或可以聯(lián)合構(gòu)建。之前,,已有國內(nèi)企業(yè)和機(jī)構(gòu)發(fā)布了大模型,,包括語言大模型、基于語言大模型的多模態(tài)模型等,,只是其語言大模型還沒達(dá)到ChatGPT的能力。剛剛已有幾家國內(nèi)企業(yè)宣布在ChatGPT上做布局,,相信國內(nèi)很快會出現(xiàn)類似ChatGPT的語言大模型,,并且對中文效果更好。

  另外,,國內(nèi)的應(yīng)用場景豐富,、開發(fā)者眾多,以ChatGPT類大模型為基礎(chǔ),,面向垂直應(yīng)用場景的再開發(fā),,可能出現(xiàn)“爆款”智能應(yīng)用。而且,,考慮到國內(nèi)千行百業(yè)數(shù)字化轉(zhuǎn)型的趨勢,,會產(chǎn)生豐富的行業(yè)場景數(shù)據(jù),可能推進(jìn)行業(yè)大模型的快速發(fā)展,,包括語言類,、多模類等,,不限于對話場景,可在基礎(chǔ)模型上做微調(diào)或重訓(xùn)練,。

  最后,,ChatGPT的研發(fā)模式和歷程值得我們借鑒。一方面,,ChatGPT的研發(fā)要以巨大的算力和數(shù)據(jù)以及最前沿算法為基礎(chǔ),,OpenAI公司能聚齊這些資源并具備產(chǎn)學(xué)研用融合特點,這種以公司牽頭的產(chǎn)學(xué)研用融合研發(fā)體系值得借鑒,。另一方面,,雖然ChatGPT僅僅是OpenAI追求的AGI(通用人工智能)的初級階段,但我們已看到了其創(chuàng)新帶來的巨大影響力,,這得益于OpenAI創(chuàng)始人和投資者的遠(yuǎn)見和堅持,。大家可能還記得,OpenAI和DeepMind的投入-產(chǎn)出問題(虧損情況),,曾是大家熱議的話題,,也反應(yīng)在國內(nèi)AI領(lǐng)域投資的波動上。從ChatGPT基礎(chǔ)模型的研發(fā)歷程來看,,大模型研發(fā)是中長期積累的產(chǎn)物,,如果僅追求短期回報可能反而會錯過機(jī)會。這也給了國內(nèi)投資者和創(chuàng)始人以啟示,,大的創(chuàng)新是需要中長期的堅持的,,尤其人工智能領(lǐng)域還有很多未知待解決,就更需要堅定客觀正確的方向不動搖,。

  ChatGPT對信息通信業(yè)有什么影響與互動,?如何利用?

  廉士國:ChatGPT實現(xiàn)了人與機(jī)器之間以文本方式“communication”的功能,,接近甚至超越了人與人之間以文本方式聊天的體驗,,這與信息通信業(yè)要支撐的豐富人們的溝通與交流相似。

  首先,,ChatGPT大模型可作為工具用來改進(jìn)信息通信服務(wù)能力,,例如其在自然語言上的強(qiáng)大能力可用于提升智能客服、智慧運營,、欺詐監(jiān)測等運營服務(wù)功能,,通信網(wǎng)絡(luò)的巨量數(shù)據(jù)量可用來訓(xùn)練通信網(wǎng)絡(luò)大模型賦能網(wǎng)絡(luò)自主運行。其次,,ChatGPT在自然語言上的成功,,啟示了在語音、視覺等多模態(tài)數(shù)據(jù)上的擴(kuò)展空間,,這將為運營商在政企業(yè)務(wù)上為千行百業(yè)數(shù)字化轉(zhuǎn)型賦能提供重要工具,。而且,,ChatGPT等大模型的運行和服務(wù)離不開算力和網(wǎng)絡(luò)支撐,運營商作為新型信息基礎(chǔ)設(shè)施服務(wù)運營者,,可以加強(qiáng)算網(wǎng)融合的智能算力中心建設(shè),,來承載ChatGPT等大模型訓(xùn)練和推理服務(wù),真正讓大模型服務(wù)遍及無處不在的用戶,。

  可以預(yù)見,,ChatGPT的流行會讓人機(jī)自然對話的交互方式越來越普及,并很可能從文本對話模式擴(kuò)展到語音對話模式,,以及與數(shù)字人面對面交流模式,,進(jìn)而將大大提升信息通信流量和用戶黏度,這也將推動信息通信業(yè)考慮從人與人之間的溝通交流擴(kuò)展到人機(jī)之間的溝通交流,。雖然傳統(tǒng)搜索引擎已經(jīng)不再是搜尋或咨詢信息的普遍方式了,,部分代之以基于知識沉淀的大模型構(gòu)建的文本/語音/數(shù)字人對話機(jī)器人,但這對信息通信的依賴程度有過之而無不及,,因而通信行業(yè)更應(yīng)該擁抱大模型,。

敬請關(guān)注電子技術(shù)應(yīng)用2023年2月22日==>>商業(yè)航天研討會<<

微信圖片_20230210170337.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。