近日有玩家在 Reddit 論壇上聲稱在《火箭聯盟》排位比賽中遇到了作弊者。在遊戲社區中,指控他人作弊並不罕見,但是許多時候往往是玩家有技術差距導致的誤會。不過在看了帖子中的影片後,許多人指出這確實不是普通玩家能夠進行的操作,而是一個“機器人”。
證據影片:
這個被發現的作弊玩家和舉報人在同一個隊伍中,影片是作弊玩家的視角。雖然《火箭聯盟》中有非常多的高手,但是他的操作並不像那些高階玩家,利用滯空技巧將球送進球門,而是完美的避開了對手的進攻進行運球。
事實上,這種作弊方式確有其事,而且在遊戲中越來越常見:許多人已經開始線上上堆棧中使用經過機器學習訓練的《火箭聯盟》機器人。
促進此類機器人訓練的 API,RLGym 的創作者表示,他們知道自己的項目可能會被作弊者利用,但這並不是他們的本意。實際上,目前有一個並不利用該技術來作弊的《火箭聯盟》機器人開發和競賽社區,以另一個名為RLBot 的 API 為核心,創建和使用自定義機器人在離線遊戲或本地錦標賽中互相對抗。
RLGym 改變了遊戲規則,允許機器人開發者使用遊戲作為強化學習算法的環境。其核心想法是,與其手動編寫機器人的行為腳本,不如告訴系統需要的結果:例如,讓球接近對手的球門。隨後通過運行數小時的《火箭聯盟》模擬比賽,讓機器人在此期間逐漸學習以達到預期結果。
事實上該過程並沒有這麽簡單。RLGym的一位開發者 Aech 表示:“設計獎勵機制本身就是一門藝術。”上周,Aech在論壇上就作弊問題進行了問答。他表示,在《火箭聯盟》中用於作弊的機器學習機器人 Nexto“非常難以製作”,因此不可能出現大量變體。不過,現在作弊者已經越來越多,Aech此前就曾預測將有人訓練比 Nexto 更厲害的機器人。
機器人本身並不是新技術,根據 Aech 的說法,最新消息是有人使用了“他們自己的工具來對遊戲進行改動,這些工具不像 RLGym 或 RLBot 那樣線上上遊戲中有著限制。”這也是為什麽 Nexto 出現在了排位比賽中的原因。
在接受 PC Gamer 採訪時,Aech表示:“RLGym非常幸運能夠找到一個超級熱情和包容的社區,我們不會讓這些作弊者停滯我們的腳步。”
“我們正在採取措施保證我們的機器人未來不會被濫用,我們已經等不及想要想打架展示一些我們一直在開發的激動人心的項目。”
目前,如果玩家和機器人匹配到一起,除了舉報和盡力以外,沒有別的辦法。不過據稱,因為訓練中的一些缺陷,機器人在開球時並不是很強。
Aech 總結道:“我們現在已經看到了幾個機器學習項目出現的一個相當奇怪的現象,那就是機器人通常會在訓練的早期學習如何的更好開球,但隨著在比賽匯總其餘部分不斷進步,他們似乎都會失去開球的能力。”