Skip to main content
Communities & Collections
All of DSpace
Statistics
English
العربية
বাংলা
Català
Čeština
Deutsch
Ελληνικά
Español
Suomi
Français
Gàidhlig
हिंदी
Magyar
Italiano
Қазақ
Latviešu
Nederlands
Polski
Português
Português do Brasil
Srpski (lat)
Српски
Svenska
Türkçe
Yкраї́нська
Tiếng Việt
Log In
Log in
New user? Click here to register.
Have you forgotten your password?
Home
理學院
數學系
學位論文
Browse by Subject
學位論文
Permanent URI for this collection
http://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73901
Browse
Search
By Issue Date
By Author
By Title
By Subject
By Subject Category
Search
By Issue Date
By Author
By Title
By Subject
By Subject Category
Browse
Filter results by typing the first few letters
All browse results
Now showing
1 - 1 of 1
Results Per Page
1
5
10
20
40
60
80
100
Sort Options
Ascending
Descending
No Thumbnail Available
Item
用特徵選擇和數據平衡對高維且分佈不均的二元資料做類別預測
(
2022
)
蘇立鴻
;
Su, Li-Hung
Show more
近年來,機器學習 (ML) 在資料探勘和預測方面逐漸流行;與傳統的統計訓練相比,ML 有名的是在預測或分類數據方面的高準確度,但仍然存在一些限制。首先是如果資料的分布高度不平均,ML 算法會遇到準確度悖論,意思是說它只會對多數類別進行預測,我們使用採樣方法來解決這個問題。其次是面對高維資料時的計算時間,我們使用特徵選擇方法來解決這個問題。在前面的資料預處理之後,我們考慮四種 ML 算法:邏輯迴歸、K-近鄰 (KNN) 、隨機森林 (RF) 和極限梯度提升 (XGBoost) 來比較模型的性能。我們通過具有 687 個變數和 40041 個觀察值的醫療數據集急性腎損傷 (AKI) 演示了上述過程。主要結果是他們是否在 AKI 上復發。結果表明,XGBoost 在接受者操作特徵曲線下的面積 (AUC-ROC) 方面具有最佳性能。對於醫療數據集,鈉、速尿、芬太尼、布美他尼、多巴胺、胰島素、白蛋白、甘油和腎上腺素是最具影響力的藥物,CCS1581 是影響最大的疾病。
Show more