無敵的人工智能，新款“阿爾法”打游戲贏過人類玩家-AET-電子技術應用

無敵的人工智能，新款“阿爾法”打游戲贏過人類玩家

日期： 2019-01-28

關鍵詞： 人工智能機器人阿爾法

　　據(jù)科技日報報道，繼圍棋“人機大戰(zhàn)”成功擊敗人類頂尖圍棋高手后，谷歌旗下的人工智能技術公司“深層思維”的人工智能程序“阿爾法星”，與人類職業(yè)選手在經(jīng)典即時戰(zhàn)略電腦游戲《星際爭霸2》對戰(zhàn)中，取得壓倒性勝利。

　　據(jù)“深層思維”公司介紹，自去年12月以來，該公司開發(fā)的“阿爾法星”人工智能程序與高水平人類職業(yè)選手先后舉行了11場比賽。在這一系列“人機大戰(zhàn)”中，人工智能程序最終以10比1擊敗人類選手。只有在1月24日舉行的現(xiàn)場比賽中，“阿爾法星”由于游戲視角受限，人類選手才勉強贏下一場。

　　“深層思維”公司聯(lián)合研發(fā)負責人戴維·西爾弗在比賽后指出：“盡管后續(xù)還有很多工作要做，但是我希望未來人們在回望今天時，會把這一比賽結果當成人工智能系統(tǒng)的能力又向前邁了一步的表現(xiàn)。”

　　據(jù)介紹，與圍棋棋盤上所有棋子都對雙方可見不同，此類游戲中有“戰(zhàn)爭迷霧”，一方需要猜測和偵察對方的行動，屬于“不完美信息博弈”，并且要求人工智能必須實時做出反應，這對人工智能的要求更高。

　　“深層思維”公司表示，在“阿爾法星”之前，還沒有任何人工智能系統(tǒng)能夠在《星際爭霸2》中能與人類職業(yè)選手的技巧比擬。而“阿爾法星”能夠在這場“人機大戰(zhàn)”中大比分勝出的一個重要基礎，就是它使用了深度神經(jīng)網(wǎng)絡，研究人員通過監(jiān)督學習和強化學習的方式，直接利用游戲的原始數(shù)據(jù)來訓練，以模仿學習的思路，讓模型快速學到高水平人類玩家在游戲中使用的策略和操作。

　　此外，《星際爭霸2》等游戲中有一個“手速”的概念，用APM（每分鐘操作指令數(shù)）來衡量。在基準測試中，“阿爾法星”每分鐘能夠執(zhí)行約280個操作指令，雖然遠低于人類職業(yè)選手，但是其動作更精確，也有助于在比賽中取得勝利。

　　下贏圍棋、打贏電腦游戲，這都能給人工智能的發(fā)展帶來什么呢？“深層思維”的研究團隊認為，訓練“阿爾法星”的先進方法以及算法的先進架構未來都會有助研究人員積累更多經(jīng)驗，最終設計出能夠應對現(xiàn)實生活中不少復雜問題的人工智能程序，比如天氣預測、氣候模型計算以及語言理解等。

版權聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

無敵的人工智能，新款“阿爾法”打游戲贏過人類玩家

日期： 2019-01-28

相關內(nèi)容