學位論文

Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73873

Browse

Search Results

Now showing 1 - 2 of 2
  • Item
    書目探勘資料之清理研究-以問卷資料為例
    (2012) 李威毅
    資料清理是書目探勘中的第一步驟,同時也影響書目探勘的結果,但資料本身常具有雜訊的存在,如此可能導致探勘過程中耗費大量時間在解決去除雜訊的問題;同時雜訊過多也會影響書目探勘的結果。在過去研究之中書目探勘的資料清理大多討論內部性資料為主,少有以外部性資料作為資料來源,而圖書館事業中大量的外部性資料可與圖書館自動化系統各個模組資料做結合提供圖書館管理者更加了解圖書館讀者的使用行為。 本研究利用外部性資料作為資料來源,利用去除雜訊、資料整合、資料轉換、資料刪減、實行概念階層等步驟進行資料清理,並透過書目探勘中的迴歸分析與群集分析評估資料清理前後的探勘結果。結果顯示,進行資料清理後迴歸分析的R2與群集分析的解釋變數機率值皆能較執行資料清理前提昇 研究結果顯示本研究中所使用之資料清理方式與步驟有助於提昇書目探勘的準確度。此外,去除雜訊的步驟能有效提昇書目探勘的結果,其後並加以實行各項分群,如:雙變項分群、多變項分群等,皆能提昇書目探勘的結果。
  • Item
    基於借閱目的之資料清理機制研究 -以興趣目的為例
    (2010) 陳建傑; Chen Chien Chieh
    研究人員經常使用現實社會中的資料進行研究分析,但這些資料通常存在些許問題,如此將可能降低資料分析的效率,甚至產生錯誤的結果。圖書館經常藉由分析讀者的歷史借閱紀錄作為提供各項服務之依據,但過去在分析前並未考量讀者的借閱目的進行清理。歷史借閱紀錄大多包含一個以上的借閱目的,若在分析前未依借閱目的進行清理,極可能產生錯誤的結果。 本研究透過考量讀者借閱目的中的興趣目的,設計啟發式清理機制,嘗試去除讀者歷史借閱紀錄中的非興趣紀錄,並透過F-Measure評估清理結果,歸納出合適的清理方法與屬性。此外,本研究透過調整各清理機制的參數,嘗試進行個人化清理,以瞭解個人化清理的步驟與流程。 由研究結果可知,讀者的歷史借閱紀錄無法輕易地依據興趣借閱目的進行清理,但可嘗試透過群集分析的E-M演算法,並使用「第三層分類號、借閱日、作者」屬性組合來進行清理。在個人化清理方面,透過調整參數可獲得更佳的清理結果。此外,若使用F-Measure評估清理結果,讀者的原始興趣比越高,其清理難度也越高。