Browsing by Author "Jao, Yung"

Now showing 1 - 1 of 1

MuZero 演算法結合連續獲勝走步改良外圍開局五子棋程式
(2022) 饒鏞; Jao, Yung
2019年，DeepMind所開發的MuZero演算法使用「零知識」學習，將人工智慧帶往更加通用的研究領域。由於以此演算法所開發的Muzero-general原始版本外五棋程式，其模型訓練時只估計遊戲的結束狀態，增添了許多訓練時的不確定性，於是本研究嘗試以連續獲勝走步改良此外五棋程式。迫著走步是外五棋遊戲當中非常重要的獲勝手段，連續獲勝走步則是在正確使用迫著走步後，所得出的獲勝走步。本研究透過連續獲勝走步原則，進一步以對局過程中是否有提供以迫著搜索得出之連續獲勝走步，以及不同的迫著搜索設計結合不同情況的連續獲勝走步獎勵，設計了三種不同的改良方法。實驗結果表明，在相同的訓練時間下，三種方法均成功對原始版本進行改良，其中採用加入主動進攻走步之迫著搜索設計為棋力最強的方法。關鍵詞 : MuZero、神經網路、迫著搜索、連續獲勝走步