Deepmind新AI精通複雜度高過圍棋的西洋陸軍棋Stratego嗯.........好,我現在開始擔心了
節錄一下我的觀察重點
而且因為玩家無法看到對方的旗,因此具有不完全訊息,大幅增加人工智慧遊玩的難度

過去應用在象棋和圍棋的遊戲樹搜尋技術,在Stratego已經不管用

研究人員參考博弈論演算法,使用稱為R-NaD(Regularised Nash Dynamics)的方法,使DeepNash的學習行為朝向納許均衡(Nash Equilibrium)發展
立即下載