學位論文
Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73890
Browse
2 results
Search Results
Item 基於深度強化學習之自動充電系統電腦視覺與機械手臂控制系統發展(2024) 謝俊毅; Sie, Jyun-Yi隨著科技與電動車技術的蓬勃發展,近年來電動車獲得更多關注,建設更為便利的充電設施已然是電動車主們一大需求。因此本論文提出一主僕式架構之自動充電系統,提供自動充電服務,整體架構由自主移動式充電機器人與電源拖車組成,並搭配本研究設計之充電行為流程、充電插座姿態辨識與使用深度強化學習(Deep Reinforcement Learning, RL)於機械手臂運動控制,最終實現可提供充電服務之自動充電系統。本論文於充電插座自動辨識上使用Yolo、PnP等電腦視覺技術,並搭配類神經網路進行座標補償。在機械手臂控制策略上使用深度強化學習之深度確定策略梯度(Deep Deterministic Policy Gradient, DDPG)與近端策略最佳化(Proximal Policy Optimization, PPO)進行模擬實驗,並最終使用PPO搭配PID補償器進行實作,此設計架構可有效補償PPO輸出之穩態誤差,在機械手臂運動控制方面,滿足系統執行自動充電服務的需求。Item 基於深度強化式學習之多目標人群導航機器人系統(2023) 程健倫; Cheng, Chien-Lun自主移動機器人(AMR)由於其多功能性,已成功引起了人們的關注,目前已廣泛應用於自動化工廠和人與機器人之共存環境,如機場和購物中心等。為了使機器人能夠在人群環境中進行導航,機器人必須具有社交意識並能夠預測行人的移動。然而,以往的方法,機器人都需要先預測行人未來軌跡,再規劃安全路徑,常會受到行人移動之高度隨機性的影響,導致計算成本增加和機器人凍結的問題。隨著深度學習的發展,許多與導航有關的研究都基於深度強化式學習,使機器人可以通過與環境的互動找到最佳策略。社交關注強化式學習(SARL)是一最先進的(state-of-the-art)方法,能夠提升機器人在人群環境中的導航能力。儘管SARL成功改善了人群環境下的導航效能,但它仍然存在幾項缺點。因此,本研究提出了一種基於深度強化學習的多目標人群導航機器人系統,藉由所提出之獎勵函數以實現多個導航目標,包括安全性、時間效率、避免碰撞和路徑平滑度等。為了解決人群環境中的導航延遲,我們也開發了一多目標雙重選擇注意力模組(MODSRL),使機器人能夠做出更有效的決策,同時減少在導航初始階段的徘迴問題。實驗結果表示,所提出的MODSRL方法在五個不同的指標上優於現有的研究,展現了在複雜人群環境中導航的強健性。