學位論文
Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73912
Browse
220 results
Search Results
Item 基於強化學習之Surakarta棋程式開發與研究(2019) 陳毅泰; Chen, Yi-TaiSurakarta棋是起源於印尼爪哇島的一種雙人零和遊戲,原名Permainan,在印尼文是遊戲之意,後來由法國人命名為Surakarta,取自當地地名「梭羅」。遊戲中獨一無二的吃子方法是這種棋的最大亮點,透過棋盤外圍的環狀構造,將對手的棋子一網打盡後,方可獲得最後的勝利。 除了現實的遊戲外,Surakarta棋也是Computer Olympiad定期舉辦的比賽項目之一,歷年來誕生了不少棋力高強的程式。而這兩年的AlphaGo和AlphaZero將電腦對局推向了新的里程碑,也有了新的契機,希望能夠將Surakarta棋程式的棋力向上提升。 本研究將利用AlphaZero的架構,搭配不同的參數及架構上的改良,訓練及實做Surakarta棋的AI和視覺化平台。除了單一神經網路的版本,研究中也嘗試了一種新的多神經網路架構,將遊戲的過程分成三階段並訓練三種不同的神經網路來各司其職,分別為「開局網路」、「中局網路」和「殘局網路」。其中,使用殘局網路版本的AlphaZero算法和DTC殘局庫做了交叉驗證,顯示其正確率高達99%。Item 使用強化式學習於時間序列預測之應用(2019) 楊日鳳; Yang, Jih-Feng本論文使用強化式學習的方法結合類神經網路LSTM架構於時間序列的分析與預測,然而我們想針對美國NASDAQ指數進行買點分析的研究探討,並使用強化式學習中的Policy Gradient法則,以型態學的角度處理資料,讓LSTM模型,學習歷史收盤價中上漲及下跌前會發生的預兆進而預測買點。本論文的研究目的為證明強化式學習及LSTM的模型,對於時間序列的預測是相當合適的,雖然本研究只針對一種資料做研究,但其方法與架構可以套用至其它時間序列資料。 由型態學的理論作為基礎,我們需要訓練兩種趨勢的模型,使我們可以更確定特徵出現的訊號,讓預測結果更加確定更為穩健。我們也以型態學的角度,將收盤價資料做處理,使看似雜亂無章的收盤價資料處理成趨勢資料。接著我們以Policy Gradient的方法,以獲利值引導參數學習,使得模型在訓練的過程中,會自行隨著獲利值慢慢收斂至擁有最大期望值的模式。 實際測試方面,本論文以三種趨勢的資料做測試,測驗本研究所提出的演算法架構使否能成功避險及獲得高獲利,而根據實驗結果顯示,此架構除了能夠成避開負獲利的買點以外,也能夠只挑選那些有足夠把握的買點才做購買,避開那些不必要之交易風險。 本論文也將此架構之演算法和其他現有的方法做討論,也有較好之獲利能力。Item 基於FPGA平台的家庭網路QoS系統設計(2019) 婁敦堯; Lou, Tun-Yao隨著網路的服務增加,使我們對於頻寬的要求也隨之上升,此時服務品質(QoS)管理服務演算法就顯得很重要。而以GRNN為基礎的QoS管理服務演算法,具有分類準確、訓練快速的優點,但卻會因為訓練資料的增加,使得運算成本龐大。為了負擔此龐大的運算成本,通常執行QoS管理服務演算法的實體設備為PC以上的電腦,PC以上的電腦不僅體積較大,功耗也較大,對於一般家庭而言,的確是一種很大的負擔。 本論文已嵌入式平台取代PC,嵌入式系統不僅體積較小,功耗也相對於PC較小,但嵌入式系統的CPU效能比PC的CPU相比之下,弱了許多,若直接已嵌入式系統取代PC實現QoS服務管理演算法,則很難達到即時運算的要求。而解決的方法,即是將原本以軟體執行GRNN,便成以硬體實現。此舉不僅可以改善GRNN龐大的運算成本,同時也可以彌補嵌入式系統CPU效能不足的缺點。Item 中國跳棋對弈平台與AI的實作(2019) 陳律濃; Chen, Lu-Nung近年來關於人工智慧的研究如火如荼的湧現,未來電腦的效能越高,相同時間內能處理的資訊量也會越高,人工智慧能解決的問題複雜程度亦會越來越大,例如近年來電腦對局中圍棋與人工智慧的成功結合例子AlphaGo。然而電腦對局的研究若要進展得順利,設計良善的使用者操作介面必不可少,所以本研究針對中國跳棋遊戲設計一個支援多玩家遊戲的自動對弈平台,期望在電腦對局的發展上能貢獻微薄之力。 本研究開發之電腦中國跳棋自動對弈平台利用OpenCV函式庫實作出一個直觀且方便的圖形化使用者操作介面,可以只用滑鼠點選各項功能進行設定並操作棋子。另外平台具備程式偵錯與對戰等主要功能,除了在比賽時能夠使雙方更清楚地檢視遊戲過程並減少手動操作失誤與爭議之外,偵錯時也可以藉由此平台檢視與驗證每一個走步的正確性,預設對戰對手也包含了本研究開發之AI引擎提供開發者測試強度。如此一來其他跳棋研究者只需專注於研發跳棋程式的AI引擎,以期望有更多同好加入電腦中國跳棋的研究,也有助於推廣中國跳棋這項遊戲。Item 以多目標與限制最佳化觀點求解非固定主場運動排程問題:以中華職棒大聯盟為例(2019) 陳重堯; Chen, Chung-Yao在國內外職業運動賽事中,每年都需要為比賽排出新的賽程。而賽程的安排會間接影響到進場的觀眾人數、廣告的安排、贊助商的贊助、球員的實力發揮以及休息時間;賽程的安排不當將導致職業賽事聯盟的收益降低。賽程的安排需考量隊伍的移動距離、對戰組合的話題性及公平性,所以賽程的安排是一件極為複雜的事情,運動排程也被認為是高度複雜的組合問題。在2013年,石大維的碩士論文將競賽旅程問題的單目標最佳化問題,發展為多目標最佳化問題。本論文為了更貼近真實情形,以中華職棒季賽賽程去探討最佳化旅行總距離和最長旅行距離的多目標最佳化問題。 本論文提出群體式彈性機率鄰域模擬退火法,使用彈性機率鄰域的選取方法去和隨機機率鄰域函式作比較,並且修改了群體式模擬退火法的流程,讓本論文的方法可以在一定的搜尋次數內,找到多目標最佳解。最後本論文也列出找到的多目標最佳解,並和真實的賽程去做比較,也提供決策者作參考。Item 電力調度之成本與汙染最佳化問題:模型、演算法與效能(2019) 許芳齊; Hsu, Fang-Chi本論文探討電力調度之成本與汙染最佳化問題 (Economic and Emission Dispatch, EED ) 是一個重要的多目標優化議題,由於火力發電廠在產生電能時將會排放出對環境有害的物質,使得排放調度在電力系統中佔有重要的角色。 近年來已經有許多篇解決 EED 問題的論文被提出,然而此領域的學者所使用的實驗測試資料或目標公式眾說紛紜,因此各篇文獻的結果評比會有不公平的隱憂存在,因此本論文將統整63篇年代約2003年至2017年的EED 論文,驗證其結果的正確性,提出問題模型與實驗測試資料,統整出各模型實例下已知最佳解,提供後續 EED 研究者有更好的參考方向與評估數據。探討各篇文獻在生產電能時的發電機組限制與電量守恆限制的處理方法,討論各篇演算法對於求解成本與汙染氣體排放量這兩個衝突目標的處理機制。 利用差分演化演算法搭配多目標演算法 NSGA-II 求解各問題模型的 EED問題,在實驗中利用效能指標 IGD 評估各種問題限制修復機制的優劣,試著找出最佳限制處理方法。其次也利用差分演化演算法搭配參數控制求解 EED 問題的最佳前緣,與統整的各模型實例下已知最佳解做比較。Item 分群演算法之超大型積體電路架構研究(2012) 李惠雅; Hui-Ya Li本論文對於c-平均值(c-means)、競爭式學習(competitive learning)、模糊c-平均值(fuzzy c-means),以及帶空間約束之模糊c-平均值(fuzzy c-means with spatial constraint)等多種分群演算法分別提出硬體架構。這些架構皆已在場域可程式化閘陣列(Field Programmable Gate Array,FPGA)裝置上實作建構出適用於分群(clustering)的可程式化系統晶片(System on Programmable Chip,SOPC)系統。 由於分割(partitioning)與質心計算(centroid computation)等運算全為管線化運作,故本文所提出的c-平均值架構可同時處理多筆訓練向量(training vector)。查表式除法器(lookup table based divider)則用以減少面積成本及質心計算的延遲。 文中另提出兩種針對k贏家全取(k-winners-take-all,kWTA)操作的硬體實現。第一種架構,經由在小波域(wavelet domain)中執行部分距離搜尋(partial distance search,PDS)來找出關於每一個輸入向量的k個贏家。一種單純利用查表來做計算的硬體除法器則用以構成神經元的更新程序。部分距離搜尋模組及除法器均採取有限精度計算(finite precision calculation)來降低部分距離搜尋及硬體除法器的面積成本。另採用子空間搜尋(subspace search)及多係數累積(multiple-coefficient accumulation)等技巧來降低PDS的運算延遲。第二種則是一個高效率的管線化架構,可同時進行不同訓練向量的kWTA競賽。此管線化架構使用了一個嶄新的碼字交換機制(codeword swapping scheme),使那些在競賽過程中落敗的神經元可立即投入後續訓練向量的競賽。 文中所提出的模糊c-平均值架構是個高效率的平行計算方案。此架構利用查表式除法來降低計算權重值(membership coefficient)與質心的面積成本及計算複雜度。為了避開龐大的儲存需求,權重矩陣(membership coefficient matrix)及質心的更新,從過去慣用的迭代法,改為合併成單一步驟。這樣的架構還延伸到帶空間約束之模糊c-平均值的實現。並採用查表法來處理開根號運算,以便放寬模糊度(degree of fuzziness)的限制。 實驗結果顯示文中所提出的架構具有成本效益(cost-effective),且在面對龐大的資料集合及/或眾多的群集數時,較其他軟硬體實現能有更高的加速(speedup)。Item 高斯正規基底有限場乘法器具容錯架構之電路設計(2011) 莊臺寶; Tai-Pao ChuangMiller 與 Koblitz曾提出橢圓曲線密碼系統(ECC)的使用。在相同安全等級下,ECC密碼系統的金鑰位元數要比RSA密碼系統少很多。例如:在相同安全等級下,RSA密碼系統的金鑰需使用1024個位元,但ECC密碼系統只需使用160個位元。ECC密碼系統計算速度比RSA密碼系統快。在計算資源有限的設備下,這項優點使得ECC密碼系統的選用,更具吸引力,如:行動智慧型手機。不幸的是智慧型手機上的密碼系統,對於側通道攻擊非常脆弱,包括植入錯誤式破解密碼攻擊法。 ECC密碼系統高度依賴有限場算術運算,特別是伽羅瓦有限場GF(2m)。這些算術運算包括:加法、乘法、乘法反元素與次方。使用互斥或閘,很容易達成加法運算。乘法反元素與次方,比加法與乘法需要耗用更多的時間,但是可以用迭代式乘法達成。因此一個有效率的有限場乘法器是密碼系統應用的基本工具。 近來發展的植入錯誤式破解密碼攻擊法,是針對對稱式與非對稱式加密演算法,將錯誤植入密碼系統,己經被證明是一種有效的破解密碼攻擊方法。側通道攻擊是使用特定故意植入的錯誤,加諸於加密設備中,進行錯誤分析。只要少量的側通道資訊,就能破解這種設備的安全性。加密設備的錯誤輸出,會引起主動攻擊。因此從攻擊者角度思考,最簡單的保護加/解密電路的方法,就是確定是正確的值,才由加密設備輸出。 針對對稱式與非對稱式密碼系統,很多錯誤偵測的機制被提出來,能輸出正確的值。針對有限場算術運算,也有很多錯誤偵測的機制被發展出來,如:同位元預測函數,時間冗餘方式等。然而一些單一錯誤不能被激發,以及對於現有設備已存在的錯誤無法偵測出來。 超大型積體電路(VLSI)通常不易測試,其理由之一,如:高比率的設備接點,這使得在VLSI晶片中的內部訊號線,可控制性與可觀察性非常有限。為解決此測試問題,可測試性設計是常用的方式。所以我們提出自我偵測交互邏輯位元並列輸入並列輸出高斯正規基底乘法器,來達成即時錯誤偵測、即時錯誤修正與離線測試能力。 更進一步,我們需要即時錯誤偵測與即時錯誤修正能力。針對抵抗植入錯誤式破解密碼攻擊法的有限場算術運算,有很多錯誤偵測的機制被發展出來。雖然現存的高斯正規基底乘法器,具有錯誤偵測的能力,但在同一時間,都僅能容忍一個模組發生錯誤,都無法容忍多個模組發生錯誤。 我們提出位元並列輸入並列輸出高斯正規基底容錯乘法器。其容錯機制是利用資料冗餘技術來達成CED、CEC能力,乘法器並沒有經過特殊電路設計。其容錯設計,可適用於N個模組冗餘,而且系統的穩定度能隨著t增加而增加。Item 語音文件摘要 - 特徵、模型與應用(2011) 林士翔; Shih-Hsiang Lin語音文件摘要容易受語音辨識錯誤的影響,進而導致在使用傳統文字文件 摘要方法時並無法正確地摘要出語音文件中重要文句。相對於文字文件,語音文 件在從事語音摘要時卻額外地提供了許多的資訊:諸如聲韻特徵(Prosodic Features)、聲學特徵(Acoustic Features)、語者(Speaker Roles)或情感(Emotion)資訊等,都是從事語音文件摘要時可以善加利用的額外語句特徵。本論文以特徵(Features)、模型(Models)與應用(Applications)等三個不同構面進行語音文件摘要之研究。在特徵層面,我們探討如何使用不同的詞圖結構表示語音辨識候選詞序列(Recognition Hypotheses),進而解決傳統因為只利用單一最佳辨識詞序列(1-Best)所造成的辨識錯誤影響。在模型方面,我們基於Kullback-Leibler (KL) 散度測量(Divergence Measure)方法提出了一個非監督式(Unsupervised)的摘要模型,此摘要模型允許利用文字以外的資訊線索增進散度測量正確性,進而減緩因為語音辨識錯誤所造成的問題。同時,針對監督式(Supervised)的摘要模型,我們提出了三種不同的訓練準則進行摘要模型訓練,以解決訓練資料不平衡(Imbalanced Data)所導致的負面影響。架構在此二類不同的摘要模型之上,我們進而提出了一個風險感知(Risk-Aware)的摘要架構,此架構透過監督式與非監督式摘要模型的結合,不僅能保有其各自的優點更進而克服各自方法的侷限。我們亦導入了不同的減損函式(Loss Function),以便考量語句-語句或者是文章-語句間的冗餘性與連貫性關係。對於應用層面,我們探討如何將摘要技術整合至資訊檢索技術上。本論文所提出之方法均實驗在廣播新聞語料,實驗結果亦證明本論文所提出之方法可大幅地改善現有摘要方法的效能。Item 以GHA實現快速主成分分析之硬體設計(2012) 林秀菊; Shiow-Jyu Lin本論文為實現快速主成分分析之硬體,提出三種GHA的硬體架構,分別為達成高速計算及最少的硬體資源消耗為目的。在高速計算的架構,所有主成分值計算與突觸權重值之更新,皆使用專屬的電路作並行之運算。對於高維度訓練資料之適用架構,以所有主成分值計算共用一個主成分計算電路輪流完成計算,並將訓練資料區塊化方式逐步更新每個神經元的突觸權重值。所有實現的硬體架構訓練取得之權重向量,應用在紋理的分類。