Browsing by Author "Tseng, Yu-Hao"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Item 基於AlphaZero General與MuZero General框架實現點格棋(2023) 曾羭豪; Tseng, Yu-Hao點格棋(Dots and Boxes)是一款雙人、公正、零和與完全資訊的遊戲,儘管棋盤很小就有很高的複雜度。本論文以3×3盤面大小的點格棋作為課題,實現於AlphaGo Zero、MuZero架構上,並且還提出了適用於連續走步棋規的Exact-win策略實現於點格棋上,並運用於AlphaGo Zero的訓練與對弈上。在實作上,我們採用AlphaZero General與MuZero General兩個開源碼,分別是基於AlphaGo Zero與MuZero的論文實現。兩者皆是易於理解的Python開源專案,透過簡潔的架構幫助使用者輕鬆的能在AlphaGo Zero與MuZero的架構上實現遊戲並訓練,省去了從頭開始架構AlphaGo Zero與MuZero的工作,能更專注於相關研究。從實驗結果驗證,我們實現的AlphaZero General、Exact-win與MuZero General代理人,在與破解程式對手的對弈中,分別取得了98%、100%與32%的勝率。此外,還證明了Exact-win策略用於訓練階段能有效提升訓練速度與成效,以及訓練後期代理人棋力穩定度。透過一些盤面測試,證實了這些代理人在一些盤面上確實能搜索出最佳走步並且執行。