《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 【ChatGPT專題】ChatGPT的核心本質(zhì)——“貝葉斯公式”

【ChatGPT專題】ChatGPT的核心本質(zhì)——“貝葉斯公式”

2023-02-15
作者:德不羅意
來源:量子學(xué)派
關(guān)鍵詞: ChatGPT 貝葉斯公式 AI

  2022年,,ChatGPT問世,。

  一經(jīng)出現(xiàn)便掀起滔天巨浪,。

  如果你跟ChatGPT聊過天,一定會震撼于它所涉獵極廣:

  既能創(chuàng)造詩歌,,也能修改代碼,。

  可以批改作業(yè),還能撰寫論文,。

  寫文案易如反掌,,給方案不在話下。

  ......

  有人興奮,,有人恐慌,。

  有人說,它會帶來一次新的“工業(yè)革命”,。

  有人說,,它會引發(fā)21世紀的“新盧德運動”,。

  這其實不是AI第一次向人類展示它的力量。

  自動駕駛,、MIT主導(dǎo)的人類寫字系統(tǒng),、SIRI智能語音助手、AlphaGo......

  但這一次,,ChatGPT確實驚嚇到了人類。

  我們能抵擋來勢洶洶的AIGC狂潮嗎,?

  人類是不是真的會被ChatGPT取代,?

  要回答這些問題,讓我們先回歸數(shù)學(xué),。

  因為ChatGPT背后的核心本質(zhì),,是“貝葉斯公式”。

  1

  什么是貝葉斯公式,?

  歷史有許多天才,,生前籍籍無名,死后眾人崇拜,。

  18世紀數(shù)學(xué)家托馬斯·貝葉斯也是其中一位,。

  “貝葉斯”定理源于解決“逆向概率”問題時寫的論文。

  在此之前,,人們只會計算“正向概率”,。

  什么是“正向概率”呢:

  假設(shè)袋子里面有P只紅球,Q只白球,,它們除了顏色之外,,其它性狀完全一樣。你伸手進去摸一把,,摸到紅球的概率是多少是可以推算出來的,。

  但反過來是否也可以計算,我們可以將它視為“逆向概率”:

  如果我們事先并不知道袋子里面紅球和白球的比例,,而是閉著眼睛摸出一些球,,然后根據(jù)手中紅球和白球的比例,對袋子里紅球和白球的比例作出推測,。

  這個問題就是逆向概率問題,。

  通俗地講,就像一個迷信星座的HR,,如果碰到一個處女座應(yīng)聘者,,HR會推斷那個人多半是一個追求完美的人。

  這就是說,,當(dāng)你不能準確知悉某個事物本質(zhì)時,,你可以依靠經(jīng)驗去判斷其本質(zhì)屬性,。

  這個研究看起來平淡無奇,名不見經(jīng)傳的貝葉斯也未引人注意,。

  他寫的論文直到他死后的第二年,,才由他的一位朋友在1763年發(fā)表。

  明珠蒙塵,,就像畫界的梵高,,畫稿生前無人問津,死后價值連城,。

  為什么貝葉斯定理200多年來一直被雪藏,,不受科學(xué)家待見?

  因為它與當(dāng)時的經(jīng)典統(tǒng)計學(xué)相悖,,甚至是“不科學(xué)”的,。

  經(jīng)典統(tǒng)計學(xué)中,數(shù)字規(guī)律來源于隨機取樣再行計算,。

  貝葉斯方法則建立在主觀判斷基礎(chǔ)上,,你可以先估計一個值,然后根據(jù)客觀事實不斷修正,。

  從主觀猜測出發(fā),,這顯然不符合科學(xué)精神,所以貝葉斯定理為人詬病,。

  1774年,,法國的大數(shù)學(xué)家拉普拉斯也看到貝葉斯定理的價值。

  不過他知道人類的普遍毛病,,總是用傳統(tǒng)來反對新思想,。

  他懶得與人爭論,直接給出數(shù)學(xué)表達:

  微信截圖_20230215155248.png

  2

  貝葉斯公式是怎么工作的,?

  貝葉斯定理簡單優(yōu)雅,、深刻雋永。

  貝葉斯定理并不好懂,,每一個因子背后都藏著深意,。

  它到底是如何“為人民服務(wù)”的呢?

  對于貝葉斯定理,,參照上面的公式,,首先要了解各個概率所對應(yīng)的事件。

  P(A|B)是在B發(fā)生的情況下A發(fā)生的概率,;

  P(A)是A發(fā)生的概率,;

  P(B|A)是在A發(fā)生的情況下B發(fā)生的概率;

  P(B)是B發(fā)生的概率。

  

  3

  貝葉斯公式取得人類信任

  今天的貝葉斯理論開始遍布一切,。從物理學(xué)到癌癥研究,,從生態(tài)學(xué)到心理學(xué)。

  貝葉斯定理幾乎像“熱力學(xué)第二定律”一樣放之宇宙皆準了,。

  物理學(xué)家提出了量子機器的貝葉斯解釋,,以及貝葉斯捍衛(wèi)了弦和多重宇宙理論。

  哲學(xué)家主張作為一個整體的科學(xué)可以被視為一個貝葉斯過程,。

  在IT界,,AI大腦的思考和決策過程,被更多工程師設(shè)計成一個貝葉斯程序,。

  但貝葉斯誕生以來命途多舛,,長期以來因為表面的不科學(xué),并沒有得到主流學(xué)界認可,。

  其實在日常生活中,我們也常使用貝葉斯公式進行決策,。比如我們到河邊釣魚,,根本就看不清楚河里哪里有魚或者沒魚,似乎只能隨機選擇,,但實際上我們會根據(jù)貝葉斯方法,,利用以往積累經(jīng)驗找一個回水灣區(qū)開始垂釣。

  微信截圖_20230215155437.png

  這就是我們根據(jù)先驗知識進行主觀判斷,,在釣過以后對這個地方有了更多了解,,然后再進行選擇。所以,,在我們認識事物不全面的情況下,,貝葉斯方法是一種非常理性且科學(xué)的方法。

  貝葉斯公式得到主流科學(xué)界的認可,,主要因為兩件事:

  《聯(lián)邦黨人文集》作者揭密

  1788年,,《聯(lián)邦黨人文集》匿名出版,兩位作者寫作風(fēng)格幾乎一致,。其中12篇文章作者存在爭議,,而要找出每一篇文章的作者極其困難。

  兩位統(tǒng)計學(xué)教授采用以貝葉斯公式為核心的分類算法,,10多年的時間,,他們推斷出12篇文章的作者,而他們的研究方法也在統(tǒng)計學(xué)界引發(fā)轟動,。

  美國天蝎號核潛艇搜救

  1968年5月,,美國海軍天蝎號核潛艇在大西洋亞速海海域失蹤。軍方通過各種技術(shù)手段調(diào)查無果,最后不得不求助于數(shù)學(xué)家John Craven,,John Craven提出的方案使用了貝葉斯公式,,搜索某個區(qū)域后根據(jù)搜索結(jié)果修正概率圖,再逐個排除小概率的搜索區(qū)域,,幾個月后,,潛艇果然在爆炸點西南方的海底被找到了。

  2014年初馬航MH370航班失聯(lián)后,,科學(xué)家想到第一個方法就是利用貝葉斯定理開始區(qū)域搜索,,這個時候,貝葉斯公式已經(jīng)名滿天下了,。

  4

  貝葉斯公式展示“神跡”

  當(dāng)然,,貝葉斯定理名揚天下,主要還是在人工智能領(lǐng)域的應(yīng)用,。

  特別是自然語音的技術(shù)識別,,讓人類見識了A.I.的“思考力”。

  人類語言的多義性,,可以說是信息里最復(fù)雜最動態(tài)的一部分,。

  機器怎么知道你在說什么?

  當(dāng)看到機器翻譯的準確性,,你也會感嘆這簡直就是“神跡”,,它們比大部分現(xiàn)場翻譯要強得多。

  語音識別本質(zhì)上是找到概率最大的文字序列,。

  一旦出現(xiàn)條件概率,,貝葉斯定理總能挺身而出。

  我們用P(f|e)區(qū)別于以上的P(A|B)來解釋語音識別功能,。

  統(tǒng)計機器翻譯的問題可以描述為:給定一個句子e,,它可能的外文翻譯f中哪個是最靠譜的。

  即我們需要計算:P(f|e)

  P(f|e) ∝ P(f) * P(e|f)

  這個式子的右端很容易解釋:

  那些先驗概率較高,,并且更可能生成句子e的外文句子f將會勝出,。

  我們只需簡單統(tǒng)計就可以得出任意一個外文句子f的出現(xiàn)概率。

  隨著大量數(shù)據(jù)輸入模型進行迭代,,隨著計算能力不斷提高,,隨著大數(shù)據(jù)技術(shù)的發(fā)展,貝葉斯定理威力日益凸顯,,貝葉斯公式巨大的實用價值也愈發(fā)體現(xiàn)出來,。

  語音識別僅僅只是貝葉斯公式運用的其中一個例子。

  實際上,,貝葉斯思想已經(jīng)滲透到了人工智能方方面面,。

  5

  貝葉斯網(wǎng)絡(luò),,AI智慧的拓展

  語音識別,見證了貝葉斯定理的能力,。

  貝葉斯網(wǎng)絡(luò)的拓展,,則可以看到更強大的人工智能未來。

  借助經(jīng)典統(tǒng)計學(xué),,人類已經(jīng)解決了一些相對簡單的問題,。

  然而經(jīng)典統(tǒng)計學(xué)方法卻無法解釋復(fù)雜參數(shù)所導(dǎo)致的現(xiàn)象,例如:

  龍卷風(fēng)的成因,,2的50次方種可能的最小參數(shù)值比對,;

  星系起源,2的350次方種可能的星云數(shù)據(jù)處理,;

  大腦運作機制,,2的1000次方種可能的意識量子流;

  癌癥致病基因,,2的20000次方種可能的基因圖譜,;

  ……

  面對這樣數(shù)量級的運算,經(jīng)典統(tǒng)計學(xué)顯得力不從心,。

  科學(xué)家別無選擇,,最終尋找貝葉斯定理給予幫助。

  把某種現(xiàn)象的相關(guān)參數(shù)連接起來,,再把數(shù)據(jù)代入貝葉斯公式得到概率值,公式結(jié)網(wǎng)形成一個成因網(wǎng),,即貝葉斯網(wǎng)絡(luò),,如下圖所示:

  微信截圖_20230215160110.png

  這也是貝葉斯網(wǎng)絡(luò)被稱為概率網(wǎng)絡(luò)、因果網(wǎng)絡(luò)的原因,。

  利用先驗知識和樣本數(shù)據(jù),,確立隨機變量之間的關(guān)聯(lián),然后得出結(jié)論,。

  一個又一個的節(jié)點,,一個又一個的概率,都來源于人類的先驗知識,,有效知識越多,,貝葉斯網(wǎng)絡(luò)展示的力量越讓人震撼。

  今天一場轟轟烈烈的“貝葉斯革命”正在AI界發(fā)生:

  貝葉斯公式已經(jīng)滲入到工程師的骨子里,,貝葉斯分類算法也成為主流算法,。

  在很多工程師眼中,貝葉斯定理就是AI發(fā)展的基石,。

  結(jié)

  人工智能第一課,,都是從貝葉斯定理開始。

  大數(shù)據(jù)、人工智能和自然語言處理中都大量用到貝葉斯公式,。

  CHATGPT是如何確定生成的句子是合理的,?

  背后同樣是貝葉斯公式在主導(dǎo)。

  貝葉斯公式有多厲害,?

  CHATGPT已經(jīng)向我們演示一遍了,。

  不過,貝葉斯公式與AI的結(jié)合,,

  到底是一場科學(xué)的革命,,還是一場理念的革命?

  到底是生產(chǎn)方式的革命,,還是人類在革自己的命,?

  我們無法得知。

  在與CHATGPT對話的過程中,,偶爾發(fā)現(xiàn)部分回答有些詭異,。

  甚至開始擔(dān)心,CHATGPT再這樣下去,,會不會誕生“自我意識”,?

  到那時候,人類與AI會不會真正成為對立的雙方,?

  這似乎有點杞人憂天了,。

  縱觀整個社會,倒不用太擔(dān)心AI像人一樣思考,,最應(yīng)該擔(dān)心人類已經(jīng)失去了思考,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。