Repository logo
Communities & Collections
All of DSpace
  • English
  • العربية
  • বাংলা
  • Català
  • Čeština
  • Deutsch
  • Ελληνικά
  • Español
  • Suomi
  • Français
  • Gàidhlig
  • हिंदी
  • Magyar
  • Italiano
  • Қазақ
  • Latviešu
  • Nederlands
  • Polski
  • Português
  • Português do Brasil
  • Srpski (lat)
  • Српски
  • Svenska
  • Türkçe
  • Yкраї́нська
  • Tiếng Việt
Log In
New user? Click here to register.Have you forgotten your password?
  1. Home
  2. Browse by Author

Browsing by Author "陳宥儒"

Filter results by typing the first few letters
Now showing 1 - 1 of 1
  • Results Per Page
  • Sort Options
  • No Thumbnail Available
    Item
    基於馬可夫決策過程之路徑規劃演算法用於複雜動態環境
    (2023) 陳宥儒; Chen, Yu-Ju
    本論文提出了一種基於 馬可夫決策過程 的 機器人 路徑規劃演算法 。首先, 需要將目標點設為一個正的獎勵訊號 。其次, 代理人每走一格就會有一個負的獎勵訊號 。 代理人必須最大化其長期累積的總獎勵,這也是代理人的唯一目標 。利用 根據能夠將長期獎勵最大化所得到的策略來決定機器人行走路徑 。最後,將每個位置所得到的策略串聯來,就得到一條最佳路徑 。此外,本篇論文透過設計 馬可夫決策過程中的價值函數,使得規劃出來的路徑能與牆壁與移動障礙物保持一定的安全距離。 最後,在本論文模擬中,代理人在 產生第一條路徑之後,因應環境變化產生其他路徑相當迅速,且會主動閃避移動障礙物 ;而在實驗的部分,使用了搭載機器人作業系統 (Robot Operating System,ROS)的雙輪差動機器人在 有移動的障礙物和移動的人時,皆能有效的產生閃避障礙物之路徑。此路徑規劃演算法是由馬可夫決策過程發展而成,也是現代機器學習的基石。有別於傳統的路徑規劃演算法,像是 Dijkstra、 A*、 D*之類的演算 這些演算法無法在複雜動態環境有良好表現甚至無法適用於動態環境,本篇論文所提出的基於馬可夫決策過程路徑規劃演算法 是以計算全域地圖上 各點的獎勵訊 號來決定路徑,在 每個時刻、每一個點都會有一個 預期回報的期望值 ,所以在動態變化較大的環境中可以比較即時的更改路徑因此其在動態環境的效率較佳。

DSpace software copyright © 2002-2025 LYRASIS

  • Privacy policy
  • End User Agreement
  • Send Feedback