台灣時間周五淩晨2點,DeepMind聯合暴雪公開在Twitch和Youtube上進行了AI打《星海爭霸2》的直播。DeepMind開發的全新AI程式AlphaStar輕鬆戰勝2018WCS Circuit排名13、神族最強10人之一的MaNa,以10-1的戰績,全面擊潰了人類職業高手。
這次的展示也是DeepMind 的《星海爭霸2》AI AlphaStar首次公開亮相。除了此前比賽影片的展示外,AlphaStar還和MaNa現場來了一局,不過,這局AlphaStar輸給了人類選手MaNa 。
MaNa獲得表演賽勝利,露出了迷之微笑
網友在微博上對比賽評論道:deepmind打星際2就營運流程上來講至少是韓服宗師往上的水準,而操作層面上則是已經超越人類了。目前來看AI已經有野建築等戰術層面上的認知了,但對於兵種相克的概念似乎AI並沒有類似人類的判斷。儘管限制了場均180的APM但影片中AI面對人類全部獲勝。直播中職業選手贏的那一場,可以看出AI在分兵調度上還有些問題。而對於A岩石這種操作則肯定是AI設計上的瑕疵了。目前deepmind的AI似乎只會打PvP,他們認為PvP的變量更少些,AI學起來更快些(pimba)。如果AI會用鏡花水月、換家之類的戰術了,那人類真得抖三抖了。
比賽前,DeepMindCEO哈薩比斯就在社交網站上說,《星海爭霸2》是一款複雜的即時戰略遊戲,對AI來說是一個長期的巨大挑戰。我們將展示我們的進步!
早在2016年,AIphago戰勝世界頂尖圍棋棋手李世石引發AI學術界和業界軒然大波後,谷歌DeepMind就將研究目標就轉向了《星海爭霸2》。次年,暴雪發佈數款API工具,使研究人員開發可與人類對手競技的機器人成為可能。暴雪還開放了過往65000場對陣遊戲的資料庫,用以訓練機器人,並表示每月將向該資料庫增加另外50萬場遊戲資料。
時隔2年,用AI人機協作打《星海爭霸》,從而幫助人工智慧開發創造基準,推進關於決策智能的研究不斷向前推進。
去年4月,36氪曾就此話題採訪過某AI智能決策公司負責人,他認為《星海爭霸》正好涵蓋了人工智慧的幾個核心問題:如何在有限的視野和不完全的資訊下做決策?如何平衡短中長期的發展策略?如何處理多智能體之間的合作和博弈……
相對於圍棋棋盤19乘19限定場景,《星海爭霸》的場景更加開放、複雜,也因此更貼近人類在現實生活中做決策的環境,更具挑戰。
事實上,網友對AI進軍遊戲界充滿期待,並表示如果這方面能跟人類對抗,最好是通過和人類響應速度差不多,甚至慢半拍的機械臂來完成,或者故意加上一些延時來模擬人類的響應速度,畢竟我們要的並不是他的反應速度,而是他的“思維”。真正讓機器人陪你打遊戲。
還有網友腦洞更大,認為星際AI的正確方向是培養出一個真正的“副官”,以後人類就能像CG動畫裡一樣,通過口頭指令完成戰略部署,將局部戰役和微操留給AI。而這一模式一旦成熟,將影響將來現實中的人類戰爭模式,一旦單兵資訊化、機械化甚至機器人化,AI將是決定戰爭勝負的關鍵因素,戰爭成為個別人的遊戲,而我們,終將成為天網的子民……
對於AI的決策智能究竟能為人類做些什麽?歡迎大家留言討論。