Browsing by Author "Tseng, Yu-Hao"

Now showing 1 - 1 of 1

基於AlphaZero General與MuZero General框架實現點格棋
(2023) 曾羭豪; Tseng, Yu-Hao
點格棋（Dots and Boxes）是一款雙人、公正、零和與完全資訊的遊戲，儘管棋盤很小就有很高的複雜度。本論文以3×3盤面大小的點格棋作為課題，實現於AlphaGo Zero、MuZero架構上，並且還提出了適用於連續走步棋規的Exact-win策略實現於點格棋上，並運用於AlphaGo Zero的訓練與對弈上。在實作上，我們採用AlphaZero General與MuZero General兩個開源碼，分別是基於AlphaGo Zero與MuZero的論文實現。兩者皆是易於理解的Python開源專案，透過簡潔的架構幫助使用者輕鬆的能在AlphaGo Zero與MuZero的架構上實現遊戲並訓練，省去了從頭開始架構AlphaGo Zero與MuZero的工作，能更專注於相關研究。從實驗結果驗證，我們實現的AlphaZero General、Exact-win與MuZero General代理人，在與破解程式對手的對弈中，分別取得了98%、100%與32%的勝率。此外，還證明了Exact-win策略用於訓練階段能有效提升訓練速度與成效，以及訓練後期代理人棋力穩定度。透過一些盤面測試，證實了這些代理人在一些盤面上確實能搜索出最佳走步並且執行。