科技與工程學院

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/5

沿革

科技與工程學院（原名為科技學院）於87學年度成立，其目標除致力於科技與工程教育師資培育外，亦積極培育與科技產業有關之工程及管理專業人才。學院成立之初在原有之工業教育學系、工業科技教育學系、圖文傳播學系等三系下，自91學年度增設「機電科技研究所」，該所於93學年度起設立學士班並更名為「機電科技學系」。本學院於93學年度亦增設「應用電子科技研究所」，並於96學年度合併工教系電機電子組成立「應用電子科技學系」。此外，「工業科技教育學系」於98學年度更名為「科技應用與人力資源發展學系」朝向培育科技產業之人力資源專才。之後，本院為配合本校轉型之規劃，增加學生於科技與工程產業職場的競爭，本院之「機電科技學系」與「應用電子科技學系」逐漸朝工程技術發展，兩系並於103學年度起分別更名為「機電工程學系」及「電機工程學系」。同年，本學院名稱亦由原「科技學院」更名為「科技與工程學院」。至此，本院發展之重點涵蓋教育（技職教育/科技教育/工程教育）、科技及工程等三大領域，並定位為以技術為本位之應用型學院。

107學年度，為配合本校轉型規劃，「光電科技研究所」由原隸屬於理學院改為隸屬本（科技與工程）學院，另增設2學程，分別為「車輛與能源工程學士學位學程」及「光電工程學士學位學程」。

News

學院網址：http://www.cot.ntnu.edu.tw/

Browse

Search Results

Now showing 1 - 10 of 10

基於Faster R-CNN演算法的行人偵測應用研究與分析
(2025) 何逸凡; He, Yi-Fan
本論文的研究動機在於物件偵測與追蹤的運作探討與原理分析，研究目的主要在於行人的影像偵測與追蹤上，了解現有的物件分類的演算法及數據庫，同時改良出新演算法以達到的較高的物件匹配度。本文中所改良的物件辨識演算法主要以Faster R-CNN為主，對行人影像目標進行物件追蹤，過程中也會與現有的演算法做分析比較取得研究的可行性與可靠度。
基於圖像串接和深度學習的改良生咖啡豆分類方法
(2024) 温鑫; Wen, Xin
為了解決生咖啡豆在影像辨識上的分類困難並提升精確度，這篇論文提出了一種通過串接不同的影像增強技術來融合不同的特徵提取演算法，以提高對生咖啡豆的辨識準確率。為了從原始影像中獲得各種關鍵特徵，我們選用了自適應閾值、位元平面分割、黑帽運算、Canny邊緣偵測、灰階、直方圖等化、Laplacian濾波、頂帽運算與非銳化濾鏡九種常見的影像增強方法。我們提出先在原本九種影像增強算法中挑選出與基準真相相關性較高的方法，並且僅將原始影像的RGB影像平面替換成相關性較高的影像處理方法，藉著多種特徵提升模型辨識度。在這項研究中，我們使用MobileViT進行實驗，最後選擇相關性較高的處理方式作為特徵融合的素材，經過影像串接產生的影像資料集作為新的輸入重新訓練。我們將不進行任何影像增強的分類方法視為基準。在二分法中，位元平面分割、直方圖等化和非銳化濾鏡的組合達到了96.9%的準確率，相對於原始方法提高了約5.5%。如果使用去除背景的相同資料集，相同的組合可以達到了97.0%的準確率；當我們選擇三分法進行實驗時，同樣都是由位元平面分割、直方圖等化和非銳化濾鏡的組合，分別達到了96.8%以及97.4%的準確率，較原始方法提升6.7%與4.9%。最後我們使用MobileNetV3驗證研究結果，在二分法的情況下，相同的影像增強組合分別在未去除背景與去除背景的影像可以獲得最高的99.12%與99.21%的準確率，相較原始方法有0.39%與0.44%的提升；如果以三分法再次進行實驗，與原始方法比較，大約分別有0.92%以及0.79%的提升，取得了98.73%與99.25%的準確率。
改良深度學習的人形機器人於高動態雜訊之視覺定位
(2024) 隋嘉銘; Sue, Chia-Ming
一些基於相機或其他技術的視覺 SLAM 方法已經被提出。光學感測器來導航和了解其環境。例如， ORB-SLAM 是一個完整的 SLAM 系統，包括視覺里程計、追蹤和定位 ORB-SLAM 僅依賴使用單目視攝影機進行特徵偵測，但在與人形機器人一起工作時，會出現嚴重的問題晃動模糊問題。深度學習已被證明對於穩健且即時的單眼影像重新定位是有效的。視覺定位的深度學習是基於卷積神經網路來學習 6-DoF 姿勢。它對於複雜的照明和運動條件更加穩健。然而，深度學習的問題是視覺定位方法的一個缺點是它們需要大量的資料集和對這些資料集的準確標記。本文也提出了標記視覺定位資料和自動辨識的方法用於訓練視覺定位的資料集。我們的標籤為基於 2D 平面（ x 軸、 y 軸、方向）的姿勢。最後，就結果而言可見，深度學習方法確實可以解決運動模糊的問題。比較與我們以往的系統相比，視覺定位方法減少了最大誤差率 31.73% ，平均錯誤率減少了 55.18% 。
應用深度學習演算法之海報文字區域檢測實驗
(2022) 盧聖侃; Lu, Sheng-Kan
近年來，數位化的廣泛應用也促使了互聯網的發展。伴隨著互聯網技術日新月異，大量的社交媒體和其他應用程式不斷推陳出新，數位圖像已然成為社會中一種主要的資訊獲取來源。在當今資訊量爆炸的社會裡，海報作為生活中最常見的資訊傳達媒介，成為生活中處處可見的藝術表現方式並充斥在現代人的生活當中。若能提出一個檢測方法來辨識海報中的文字區域，不僅能提取海報文字區域作為後續分析的資訊，也能使海報在網路中的更容易被使用者檢索。隨著深度學習的興起，越來越多研究者利用深度學習來完成影像分析及物件檢測。而其中，Mask R-CNN 與 Yolov4 分別代表著 two-stage 與 one-stage 的目標檢測方法，無論是在物件的瑕疵檢測、人臉的偵測、交通路況的偵測等領域都有很好的研究結果。然而，以上大多都是檢測自然場景物件，較少應用在平面設計的領域之中。基此，為了提取海報圖像的文字區域，本研究將訓練 Mask R-CNN 與Yolov4 兩個檢測方法，分別來對海報圖像文本進行檢測。實驗結果顯示，Mask R-CNN檢測文字區域的 mAP50 可達 79.0%；Yolov4 檢測文字區域的 mAP50 也高達 85.1%。意味著兩個目標檢測方法都可在海報版面中，定位出海報中文字區域，提供未來作為文字辨識的數據。而對比 Mask R-CNN 與 Yolov4 兩種演算法的輸出結果後，發現 Yolov4 可以更準確地檢測文字區域，並且較不受海報因色彩、文字大小、文字間隔等設計因素影響到檢測結果。
基於 SwinTransformer 及深度學習網路之高光譜影像融合
(2023) 李沃晏; Li, Wo-Yen
高光譜影像(Hyperspectral Image)以及多光譜影像(Multispectral Image)融合常被用來解決高光譜影像問題，旨在融合低解析度高光譜影像(LRHSI)以及高解析度多光譜影像(HRMSI)，是目前最常見的方法之一，通常高光譜影像的空間解析度較低，且直接取得高解析度之高光譜影像具有高昂的成本，而透過融合獲取高解析度高光譜影像是一種經濟實惠的方法。在影像處理領域融合方法是一種關鍵技術，因為高解析高光譜影像很好的促進了遠程材料辨識及分類任務，從而在衛星遙感領域獲得很大的關注。在衛星遙感領域很少有人嘗試使用Transformer，而Transformer在很多高級視覺任務中表現出驚人的成果，在本文中，我們提出了處理HSI/MSI融合任務的網路模型，基於SwinTansformer以及深度卷積網路(DCNN)之融合網路，稱為SwinDFN，SwinDFN由兩個部分組成：1)傳統卷積神經網路對HSI以及MSI影像初步融合，其中引入了Depthwise卷積技術來更有效地結合 HSI 和 MSI 之間的光譜響應函數以及對網路參數量做壓縮，2)具有殘差結構的SwinTansformer特徵提取模塊，來對影像特徵做增強，所提出之方法實現了基於規模較小的網路達到較好的HSI/MSI融合性能。
人形機器人騎乘電動機車時之視覺里程計
(2023) 孫煜翔; Sun, Yu-Hsiang
none
基於非監督式跨領域深度學習之單張影像雜訊去除
(2022) 蔡洪弦; Tsai, Hong-Xian
數位多媒體資料於我們的日常生活中已無所不在，尤其以影像及視訊資料為大宗，例如：隨時隨地皆有無法計數之影像資料來自各類行動裝置及無所不在之路邊監視器。這些龐大之影像資訊可能帶來日常生活中大量的應用。然而，影像資料之來源非常廣泛且品質難以控制。影像品質過低可能會使其相關應用之效能大打折扣，甚至毫無用途。因此，數位影像品質回復或強化已為一重要之研究議題。近年基於深度學習技術的快速發展，已有許多基於深度學習網路之影像品質回復技術問世。然而，目前架構大多基於端對端之監督式學習且利用人工合成之訓練影像資料集。其主要問題為以人造訓練資料所訓練之網路未必適合於真實世界之影像品質下降問題，且真實低品質影像及其高品質版本配對之資料集卻難以取得。因此，最近基於跨領域 (cross-domain) 之深度學習已被研究來解決可能之領域間隔閡的問題。本論文提出研究基於跨領域深度學習之影像品質回復技術，並嘗試解決目前方法潛在的可能問題，例如：(1)有限的一般化特性：可能使得現有方法難以適用於不同種類的影像；(2)領域偏移問題：對於無成對訓練資料之非監督式學習，可能會因不容易學到好的影像特徵表示法及因為低品質影像之影像雜訊變異過大的關係導致領域偏移；及(3)不明確之領域邊界：當訓練影像之雜訊變異過大及影像內容過於複雜且無成對訓練資料時，低品質及高品質影像間的領域界線不明，使得不易達成良好之跨領域學習。為了解決上述問題及考慮其實際應用，本論文提出一基於跨領域非監督式深度學習之影像雜訊去除網路架構。我們的目標為根據輸入之雜訊影像資料集學習影像特徵表示法，並使得此表示法能貼近乾淨影像之特徵表示法，以期達到更佳的影像品質回復。本論文提出利用雙向生成對抗網路將非成對之訓練影像分別做雙向之影像轉換 (雜訊轉換成乾淨影像及乾淨轉換成雜訊影像)，並使用多項影像空間域及影像頻率域之損失函數以訓練一影像雜訊去除 (或噪聲去除) 深度學習網路。在實驗階段，我們使用了多個知名影像資料集 (CBSD68、SIDD及NIH-, AAPM- and Mayo Clinic-sponsored Low Dose CT Grand Challenge) 來訓練及測試所提出的深度學習模型。實驗結果已證實所提出的方法優於傳統基於非深度學習及近年具代表性之基於深度學習方法且適合用於解決實際問題。
深度學習融入有價證券之微結構真偽辨識-以振興三倍券為例
(2021) 邱曉昱; Chiu, Hsiao-Yu
身處在充滿人工智慧結晶的時代，我們視科技為理所當然，並享受著其帶來的便利與生活品質，然而在這項技術逐漸嶄露頭角之際，各類威脅也倚靠著科技滋長茁壯。政府2020年為復甦經濟所發放之「振興三倍券」於使用期限內曾傳出偽造事件，為了能精準判別整張有價證券真偽，本研究主旨為使用深度學習CNN (Convolutional Neural Network )，有效且快速辨別真偽振興三倍券微結構取樣影像組合，進而依此推測判別出整張紙券真偽，同時以減少訓練樣本數達到高辨識率為目標，取得最佳學習尺寸組合，最後歸類分析錯誤辨識微結構印刷類型並於原券定位，為此次研究目的。首先將面額200元及500元之紙本振興三倍券掃描定義為掃描真券；與之複印後再次掃描為模擬偽券，後以尺寸32×32、64×64、96×96及128×128 pixels進行隨機局部不完全重複取樣，建立訓練及測試影像資料集，分組後個別輸入CNN模型訓練測試，得出辨識正確率與錯誤辨識影像於原券上之分佈。實驗結果顯示，依照各組辨識正確率之比例及趨勢可成功推測判別整張振興三倍券真偽，且印證研究使用之CNN模型不需學習全尺寸之局部影像組合，僅訓練最大及最小尺寸之影像資料集，即可達到預期之顯著辨識成效；至於透過錯誤辨識分佈的統整，發現無論掃描真券或模擬偽券的局部取樣，所辨識的錯誤特徵皆有較高的比例集中於鈔券的凹版印刷處。本研究提出一個不需藉由專業人士判斷有價證券影像，基於CNN模型即可有效辨別鈔券局部微結構真偽的方法，並以此實驗結果為基礎，未來可結合手機拍攝取樣，推測於拍攝指定距離範圍內之鈔券影像可精確判讀，達到更加便民與實用之效果。綜合上述，此研究不論是在產業界抑或是學術界皆具有一定程度之應用價值。
以資訊植入及深度學習提升圖像化二維條碼實體輸出的辨識能力之研究
(2021) 何怡慧; Ho, Yi-Huei
QR code 是目前最普遍被採用的二維條碼，由於其為黑白模塊所組成，影響視覺美觀，且在列印輸出時，因尺寸大小、網點擴張等印刷條件因素，導致條碼資訊容易失真，影響解碼辨識。為了能夠將印刷輸出之小尺寸美化 QR code 保持視覺美觀並且穩定解碼，因此本文提出了一套系統性的圖像化 QR code 資訊植入技術，列印後掃描將辨識結果進行錯誤分析，了解 QR code 之黑點與白點資訊點模組的錯誤特性並加以改善，最後以深度學習辨識來進行錯誤分析。實驗結果顯示，本研究所發展的方法能相容於現行的列印輸出設備，在調整白色資訊點的植入訊息強度後，可有效抑制因網點擴張所造成的「偽黑」辨識錯誤的情形。且輸出的小尺寸圖像化 QR 仍有較佳視覺品質，降低錯誤發生率，並藉由深度學習辨識提升辨識能力，有效增進美化 QR 的成功讀取率。對於彩色影像在指定輸出裝置的條件下，可得到最佳化的 QR code 植入訊息方法及讀取能力，未來能夠運用於商業加值應用上，並彰顯實體輸出條件對於圖像化 QR code 整合應用的重要性。
蜂巢式網路用戶與V2X通訊共存異質性網路之功率控制與資源分配演算法
(2021) 高漢棋; Gao, Han-Chi
在現今資訊暴漲的時代，無線網路是由許多的物聯網和通訊裝置所組合起來，而對於基地台原本所服務的蜂巢式網路用戶來說，因為基地台所需要服務的用戶不斷的增加，導致了基地台之間嚴重的互相干擾，為此我們通過提出一個下行鏈路干擾緩解方案，在確保了蜂巢式網路用戶的前提下，也保障了系統內的其他次級用戶不受到干擾，本文中以V2X通訊代表次級用戶。本論文建立了一個有多個多輸入單輸出(MISO)小區的環境，並在其中設置了數台採用C-V2X通訊的無人車，並使用人工智慧中的強化式學習模型Deep Q-learing 結合波束成形技術，提出了一種功率調整與波束成形演算法，每個基地台都代表一個代理(Agent)，並擁有獨立的神經網路，能夠根據基地台目前的環境做出適當的決策，我們的研究結果表明此演算法能夠有效保障蜂巢式網路用戶的權益(Utility)，並透過波束成形技術避開無人車，從而達到降低干擾並提升系統效能的目的。

科技與工程學院

沿革

News

Browse

Filters

Settings

Sort By

Results per page

Search Results