《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > 人工智能專(zhuān)家:德州撲克AI與AlphaGo有啥不同

人工智能專(zhuān)家:德州撲克AI與AlphaGo有啥不同

2017-03-31

1490858008800019308.jpg

2015年創(chuàng)新工場(chǎng)CEO李開(kāi)復(fù)(微博)獲卡內(nèi)基梅隆大學(xué)頒給榮譽(yù)博士畢業(yè)演講前,,與計(jì)算機(jī)學(xué)院院長(zhǎng)Andrew Moore合影(中:李開(kāi)復(fù)/右:Andrew Moore)

近日,,一條關(guān)于“人機(jī)大戰(zhàn)”的新聞刷遍了朋友圈,。這次不是比賽圍棋,而是德州撲克,。

2017年4月6日至10日,由創(chuàng)新工場(chǎng)CEO李開(kāi)復(fù)發(fā)起,,邀請(qǐng)母校美國(guó)卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)知名的Libratus撲克機(jī)器人主創(chuàng)團(tuán)隊(duì)訪問(wèn)中國(guó),,于海南進(jìn)行一場(chǎng)“冷撲大師v.s.中國(guó)龍之隊(duì)—人工智能和頂尖牌手巔峰表演賽”,對(duì)陣由中國(guó)撲克高手杜悅帶領(lǐng)的“中國(guó)龍之隊(duì)”,,這也是亞洲首度舉辦的人工智能與真人對(duì)打的撲克賽事,。

在比賽前夕,騰訊科技也專(zhuān)訪到卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)學(xué)院院長(zhǎng)Andrew Moore,,就冷撲大師的算法,、應(yīng)對(duì)德州撲克心理戰(zhàn)、未來(lái)商業(yè)化等話題進(jìn)行了交流,。

冷撲大師的基礎(chǔ)是大量的數(shù)學(xué)計(jì)算

眾所周知,,心理戰(zhàn)是德州撲克相當(dāng)重要的一部分,除去無(wú)法控制的運(yùn)氣,,和累積經(jīng)驗(yàn)下來(lái)的技術(shù),,剩下就是心理層面的,這也是德州有趣的地方,。所以,,通過(guò)對(duì)手的動(dòng)作表情判斷對(duì)手牌的強(qiáng)弱,是德州撲克相當(dāng)重要的一種游戲技巧,,而冷撲大師作為一個(gè)冷冰冰的人工智能系統(tǒng),,是如何應(yīng)對(duì)人類(lèi)棋手復(fù)雜的心理戰(zhàn)呢,?

對(duì)于騰訊科技的這個(gè)疑問(wèn),Andrew Moore表示,,冷撲大師并沒(méi)有用到任何心理戰(zhàn)的機(jī)制,,完全用的是大量的數(shù)學(xué),實(shí)際算法并不是讓機(jī)器學(xué)習(xí)所謂“詐和”的招數(shù),,而且是算出詐和的數(shù)量要在多少才是最為優(yōu)化的,,多一點(diǎn)還是少一點(diǎn)才能產(chǎn)生最高的勝率。

和AlphaGo有哪些不同,?

作為知名的人工智能系統(tǒng),,冷撲大師免不了會(huì)與AlphaGo進(jìn)行一番比較。Andrew Moore認(rèn)為,,其實(shí)撲克比圍棋來(lái)說(shuō),,游戲規(guī)則相對(duì)簡(jiǎn)單,但具有大量的隱藏信息,。圍棋沒(méi)有隱藏信息,,但是每一步必須進(jìn)行很深、很廣的搜索,。在撲克上面,,難處在于有非常多不同的詐和招數(shù),程序必須每招去一一進(jìn)行檢查,。撲克AI并沒(méi)有用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)這兩種技術(shù),,反倒是用了一種比較古典的線性規(guī)劃。

助力談判博弈或是商業(yè)化前景

任何一種技術(shù),,最終肯定是要服務(wù)人類(lèi),、幫助企業(yè)盈利,關(guān)于冷撲大師的商業(yè)計(jì)劃,,Andrew Moore表示,,他自己最喜歡的一個(gè)商業(yè)應(yīng)用是在所謂的企業(yè)交易或者是企業(yè)談判,未來(lái)貨物的供需或者貨物的交易,,可以更快地用這種AI驅(qū)動(dòng)的商業(yè)談判算法來(lái)進(jìn)行,,甚至可以通過(guò)AI去摸清談判對(duì)象的底線和談判邏輯。

以下為騰訊科技整理的專(zhuān)訪實(shí)錄:

騰訊科技:打德州撲克很重要的一個(gè)因素是心理戰(zhàn),,我想知道在心理戰(zhàn)當(dāng)中人工智能如何發(fā)揮作用的,?

Andrew Moore:我們CMU學(xué)校所研發(fā)的人機(jī)撲克對(duì)戰(zhàn),背后并沒(méi)有用到任何心理戰(zhàn)的機(jī)制,,完全用的是大量的數(shù)學(xué),。所以舉撲克中的詐和,實(shí)際演算法里面并不是讓機(jī)器學(xué)詐和的招數(shù),,而且是算出詐和的數(shù)量要在多少才是最為優(yōu)化的,,多一點(diǎn)詐和還是少一點(diǎn)詐和才能產(chǎn)生最高的勝率,,背后還是數(shù)學(xué)。

騰訊科技:未來(lái)冷撲大師AI商業(yè)化的運(yùn)作怎么樣,?除了通過(guò)打德州撲克驗(yàn)證了它處理不完美信息的能力,,未來(lái)商業(yè)化最終的目的是什么?

Andrew Moore:我自己最喜歡的一個(gè)商業(yè)應(yīng)用是在所謂的企業(yè)交易或者是企業(yè)談判,,未來(lái)貨物的供需或者貨物的交易,,可以更快地用這種AI驅(qū)動(dòng)的商業(yè)談判算法來(lái)進(jìn)行。

騰訊科技:是指在談判過(guò)程當(dāng)中根據(jù)大數(shù)據(jù)得出對(duì)方的底價(jià),,或者推敲對(duì)方議價(jià)的邏輯嗎,?

Andrew Moore:是的,這個(gè)過(guò)程當(dāng)中的商業(yè)談判就可以被自動(dòng)化,,AI會(huì)驅(qū)動(dòng)自動(dòng)化時(shí)代的到來(lái),。

問(wèn):撲克機(jī)器人最大的亮點(diǎn)是可以處理信息,也學(xué)會(huì)隱藏信息,,是不是意味著電腦很快有一天也能夠?qū)W會(huì)主動(dòng)隱藏信息,,如果這樣的事情發(fā)生,這樣會(huì)不會(huì)讓人們覺(jué)得非常的恐懼跟擔(dān)憂,?

Andrew Moore:我分兩部分回答這個(gè)問(wèn)題,,第一部分關(guān)于現(xiàn)在我們CMU在研發(fā)的AI談判技術(shù),其中一部分是關(guān)于隱藏事實(shí),。其中一個(gè)領(lǐng)域是關(guān)于拍賣(mài)或者競(jìng)標(biāo)的形式,,現(xiàn)在競(jìng)拍的形式在很多地方都已經(jīng)被廣泛應(yīng)用了,比如說(shuō)廣告的競(jìng)價(jià)排名,,甚至一些物流運(yùn)輸業(yè)行業(yè)也用到競(jìng)拍競(jìng)標(biāo)的機(jī)制,競(jìng)拍中間的過(guò)程其實(shí)相對(duì)是復(fù)雜的,,雙方要經(jīng)過(guò)序列式的猜測(cè),,我先猜你再猜,所以有一個(gè)順序性的隱藏信息在逐步被揭露,。

現(xiàn)在有一個(gè)非常聰明的機(jī)制,,這個(gè)聰明的機(jī)制基于不同于傳統(tǒng)競(jìng)標(biāo)方式的一個(gè)演算法,叫做第二價(jià)格競(jìng)拍,,但目的是為了去贏得這個(gè)競(jìng)拍,,研究出來(lái)最好的策略是永遠(yuǎn)保持誠(chéng)實(shí)。這個(gè)機(jī)制當(dāng)中,,科學(xué)家在發(fā)明AI談判算法的時(shí)候所用的策略就是盡可能地促使每一個(gè)參與者都說(shuō)實(shí)話,,第二價(jià)格競(jìng)拍其實(shí)在傳統(tǒng)拍賣(mài)行業(yè)中不是一個(gè)新制度,但在AI領(lǐng)域反而促進(jìn)了全新發(fā)明,。

第二部分說(shuō)明,,是有關(guān)對(duì)抗所有的網(wǎng)絡(luò)攻擊或者垃圾郵件的技術(shù),。所有電子郵箱的服務(wù)供應(yīng)商過(guò)往都投注大量資源研發(fā)各種方法來(lái)阻擋垃圾郵件,但是他們絕對(duì)不能公布這些方法,,一旦公布很快就會(huì)被破解了,,被想攻擊的不法分子所用。對(duì)于所謂的“壞蛋”,,我們反而是需要一些被隱藏的演算法來(lái)欺騙他們,,不告訴他們實(shí)話。

你問(wèn)到科學(xué)家在做的算法或者所發(fā)明的程序,,會(huì)不會(huì)有一天自己有學(xué)習(xí)能力反過(guò)來(lái)欺騙了人類(lèi),?我的回答是,在現(xiàn)階段還沒(méi)有什么方式會(huì)促使電腦自己產(chǎn)生動(dòng)機(jī)去做這件事情,,現(xiàn)階段的技術(shù)領(lǐng)域,,電腦沒(méi)有辦法自行產(chǎn)生一個(gè)動(dòng)機(jī)想去欺騙人。

問(wèn):AI圍棋和AI撲克有什么不同,?AI撲克是否用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí),?

Andrew Moore:其實(shí)撲克比圍棋來(lái)說(shuō),游戲規(guī)則相對(duì)簡(jiǎn)單,,但具有大量的隱藏信息,。圍棋沒(méi)有隱藏信息,但是每一步必須進(jìn)行很深,、很廣的搜索,。在撲克上面,難處在于有非常多不同的詐和招數(shù),,程序必須每招去一一進(jìn)行檢查,。撲克AI并沒(méi)有用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)這兩種技術(shù),反倒是用了一種比較古典的線性規(guī)劃(linear programming),。

問(wèn):請(qǐng)您談?wù)剬?duì)于中國(guó)AI市場(chǎng)的看法,,以及AI技術(shù)在中國(guó)市場(chǎng)的潛力。

Andrew Moore:我對(duì)于現(xiàn)在在中國(guó)市場(chǎng)對(duì)AI領(lǐng)域有這么熱切的投資興趣非常認(rèn)同,,更重要的是,,我們看到AI能夠很實(shí)質(zhì)在不同產(chǎn)業(yè)被大量導(dǎo)入在自動(dòng)化領(lǐng)域,很多現(xiàn)在的產(chǎn)業(yè)運(yùn)作方式會(huì)被大量的自動(dòng)化,。我個(gè)人對(duì)于去發(fā)展一些平臺(tái)式技術(shù)不那么感興趣,,我更感興趣的是一些特定垂直領(lǐng)域的解決方案,特別是能在實(shí)際生活或商業(yè)上被用到的場(chǎng)景,,所以我也鼓勵(lì)中國(guó)的創(chuàng)業(yè)者,,盡量設(shè)定特定垂直領(lǐng)域的一些應(yīng)用發(fā)展。

比如說(shuō)兩個(gè)例子,,一個(gè)是某個(gè)創(chuàng)業(yè)者針對(duì)有自閉癥的孩子去研發(fā)一種新的解決方案,,這就非常棒,。但是如果只是平臺(tái)式思維想要讓機(jī)器學(xué)習(xí)更精進(jìn)那么一點(diǎn)點(diǎn),就不怎么吸引我,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]