據(jù)科技日報(bào)報(bào)道,,繼圍棋“人機(jī)大戰(zhàn)”成功擊敗人類頂尖圍棋高手后,谷歌旗下的人工智能技術(shù)公司“深層思維”的人工智能程序“阿爾法星”,,與人類職業(yè)選手在經(jīng)典即時(shí)戰(zhàn)略電腦游戲《星際爭霸2》對(duì)戰(zhàn)中,取得壓倒性勝利,。
據(jù)“深層思維”公司介紹,,自去年12月以來,該公司開發(fā)的“阿爾法星”人工智能程序與高水平人類職業(yè)選手先后舉行了11場比賽。在這一系列“人機(jī)大戰(zhàn)”中,,人工智能程序最終以10比1擊敗人類選手,。只有在1月24日舉行的現(xiàn)場比賽中,“阿爾法星”由于游戲視角受限,,人類選手才勉強(qiáng)贏下一場,。
“深層思維”公司聯(lián)合研發(fā)負(fù)責(zé)人戴維·西爾弗在比賽后指出:“盡管后續(xù)還有很多工作要做,但是我希望未來人們在回望今天時(shí),,會(huì)把這一比賽結(jié)果當(dāng)成人工智能系統(tǒng)的能力又向前邁了一步的表現(xiàn),。”
據(jù)介紹,,與圍棋棋盤上所有棋子都對(duì)雙方可見不同,,此類游戲中有“戰(zhàn)爭迷霧”,一方需要猜測和偵察對(duì)方的行動(dòng),,屬于“不完美信息博弈”,,并且要求人工智能必須實(shí)時(shí)做出反應(yīng),這對(duì)人工智能的要求更高,。
“深層思維”公司表示,,在“阿爾法星”之前,還沒有任何人工智能系統(tǒng)能夠在《星際爭霸2》中能與人類職業(yè)選手的技巧比擬,。而“阿爾法星”能夠在這場“人機(jī)大戰(zhàn)”中大比分勝出的一個(gè)重要基礎(chǔ),,就是它使用了深度神經(jīng)網(wǎng)絡(luò),研究人員通過監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的方式,,直接利用游戲的原始數(shù)據(jù)來訓(xùn)練,,以模仿學(xué)習(xí)的思路,讓模型快速學(xué)到高水平人類玩家在游戲中使用的策略和操作,。
此外,,《星際爭霸2》等游戲中有一個(gè)“手速”的概念,用APM(每分鐘操作指令數(shù))來衡量,。在基準(zhǔn)測試中,,“阿爾法星”每分鐘能夠執(zhí)行約280個(gè)操作指令,雖然遠(yuǎn)低于人類職業(yè)選手,,但是其動(dòng)作更精確,,也有助于在比賽中取得勝利。
下贏圍棋,、打贏電腦游戲,,這都能給人工智能的發(fā)展帶來什么呢?“深層思維”的研究團(tuán)隊(duì)認(rèn)為,,訓(xùn)練“阿爾法星”的先進(jìn)方法以及算法的先進(jìn)架構(gòu)未來都會(huì)有助研究人員積累更多經(jīng)驗(yàn),,最終設(shè)計(jì)出能夠應(yīng)對(duì)現(xiàn)實(shí)生活中不少復(fù)雜問題的人工智能程序,,比如天氣預(yù)測、氣候模型計(jì)算以及語言理解等,。