Browsing by Author "Yuen-Hsien Tseng"
Now showing 1 - 9 of 9
- Results Per Page
- Sort Options
Item Solving Vocabulary Problems with Interactive Query Expansion(國立台灣師範大學圖書資訊研究所, 1998-04-??) Yuen-Hsien TsengOne of the major causes of search failures in information retrieval systems is vocabulary mismatch. This paper presents a solution to the vocabulary problem through two strategies known as term suggestion (TS) and term relevance feedback (TRF). In TS, collection-specific terms are extracted from the text collection. These terms and their frequencies constitute the keyword database for suggesting terms in response to users' queries. One effect of this term suggestion is that it functions as a dynamic directory if the query is a general term that contains broad meaning. In term relevance feedback, terms extracted from the top-ranked documents retrieved from the previous query are shown to users for relevance feedback. This kind of local TRF expands users' search vocabularies and guides users in search directions closer to their goals. In our experiment, interactive TS provides very high precision rate while achieving similar recall rate as n-gram matching. Local TRF achieves improvement in both precision and recall rate in full-text News database and degrades slightly in recall rate in bibliographic database due to the very limited source of information for feedback. In terms of Rijsbergen's combined measure of recall and precision, both TS and TRF achieve better performance than n-gram matching, which implies that the greater improvement in precision rate compensates the slightly degradation in recall rate for TS and TRF. We conclude that both TS and TRF provide users with richer guidance and more predictable results than n-gram matching alone.Item 取得中學教職的關鍵因素:運用決策樹探勘師資培育歷程(國立臺灣師範大學, 2017-06-??) 黃嘉莉; 葉怡芬; 許瑛玿; 曾元顯; Jia-Li Huang; Yi-Fen Yeh; Ying-Shao Hsu; Yuen-Hsien Tseng本研究旨在透過大量的教育數據,運用資料探勘技術中的決策樹演算法,分析師資生於現行的師資培育歷程中,取得中學教師資格與取得正式教職的關鍵因素,以作為改進師資培育的參考。本研究以一所傳統師範體系的綜合大學2003~2010 年入學的師資生為對象,運用開源碼軟體Weka分類演算法中的決策樹,針對每位師資生經歷5 年培育歷程中修課與培訓的數據,進行資料探勘,用以瞭解取得教師證書與正式教職的關鍵因素。本研究主要結果為:一、三個主要學院(文、理、教育學院)的師資生取得教職所需年限有別(特別是理學院差異較大);二、取得教師證書的關鍵因素是教育專業知識,而取得正式教職的關鍵因素則為專門知識與學科教學知識。此外,師資生拓展多元經驗亦有機會取得教職,且目前結果顯示教育實習成績並非是取得教師證書與教師工作的關鍵因素。本研究再以各類文獻驗證上述部分結果,提供師資培育較佳作法的參考建議。Item 大眾到政府網站找些什麼 - 政府網站搜尋引擎檢索紀錄之分析(2011) 林介棋; Chieh-Chi Lin本研究旨在觀察大眾在政府網站搜尋引擎找些什麼,並期許能以此分析提出增進使用者滿意度的建議。研究問題包括:一、使用者送出的檢索紀錄有哪些特徵?二、使用者在政府網站的檢索和在一般搜尋引擎有何不同?三、不同地區的使用者,資訊需求有何差異? 為了回答上述問題,本研究採用檢索紀錄分析方法,分析一年份的政府網站搜尋引擎檢索紀錄。首先使用Access篩選出一年份的資料,並剔除亂碼;而後以曾元顯教授撰寫的Perl程式參照MaxMind免費資料庫GeoLite City判斷IP對應的城市,擴展出「城市」與「國家」兩個欄位、依實驗決定之檢索時間(75秒)分割檢索歷程紀錄,擴展出欄位「檢索歷程起始時間」、「間隔秒數」、「檢索歷程編號」;最後,於Access以SQL查詢,統計資料。 在檢索紀錄的特徵部份,多數的使用者僅送出一個檢索、大眾常查詢稅務資訊與政府單位、星期六與星期日單日的檢索次數較少,僅為週間的一半。在和一般搜尋引擎比較的部份,政府網站搜尋引擎的檢索歷程平均長度較短,表示使用者在一個檢索歷程中的檢索次數較少,這可能是因為政府網站的資訊範疇較窄,所以使用者較少進行第二次檢索、所使用的檢索語句也有差異,政府網站搜尋引擎使用者檢索的內容以「稅務資訊、政府部門、天災、政策」為主。在不同地區的部份,香港和澳門使用者的資訊需求以來台旅遊的資訊為主、美國與加拿大的使用者的資訊需求則是辦理「健保」和「所得稅」的相關規定;北部的六個城市中,以台北市的使用者最關心納稅相關資訊、以桃園縣的使用者最關心政策訊息;中部城市以台中市的使用者最關心納稅資訊、彰化縣的使用者最關心政府的政策、南投縣的使用者最關心健康;南部城市的使用者都相當關心莫拉克颱風和住宅補貼的資訊、有很多人在我的E政府搜尋引擎檢索yahoo、而台南市和高雄縣的使用者較屏東縣的使用者關心政策訊息;東部城市的使用者和南部城市的使用者有相同的熱門檢索語句yahoo;離島的三個城市中,澎湖縣和金門縣的資訊需求較偏向公文的處理。Item 會議與期刊文獻對預測主題趨勢之比較研究—以「資訊檢索」領域為例(2009) 許育聞; Yu-Wen Shu多數進行主題趨勢探測的學者,皆採用期刊文獻作為主要的分析素材,鮮少針對其他類型的文獻進行研究,然而在學術傳播中會議論文的重要性不可小覷,因此本研究以資訊檢索(Information Retrieval)領域為範圍,針對會議文獻與期刊文獻分別進行主題趨勢預測,以觀察不同類型的文獻進行主題趨勢預測時的差異性。 本研究收集1990年至2007年資訊檢索領域具代表性的SIGIR會議文獻及五本核心期刊中收錄主題為「資訊檢索」的期刊文獻,五本核心期刊分別是:Information Processing& management、JASIST&JASIS、Journal of Information science、Journal of Documentation、Information Retrieval,主題歸類的部份是以主題整併和自動化歸類兩種方式進行。為了確保預測的準確性,本研究以相同文獻類型和相異文獻類型分別進行預測,以比較其預測上的準確性,最後分別改變預測集和驗證集之年代範圍以比較其差異性。 研究發現會議文獻和期刊文獻在主題詞彙的用法上有所差異,且各自有較關注探討的主題。會議文獻大部分比期刊文獻較早出現,然而在主題預測上,會議文獻並未佔有優勢,當預測的主題範圍較廣時,期刊文獻預測之效果較佳,且相同類型文獻預測效果優於交叉預測之效果。 最後提出之建議為:期刊文獻之控制詞彙尚未完善,許多單複數詞彙和縮寫詞彙尚需統整;主題預測的部份,若要瞭解較廣泛的領域趨勢,以期刊文獻預測的效果較佳,而要了解細部領域的趨勢則是以相同的文獻類型進行預測較佳;在後續研究的部份,可以針對像是專利或部落格等其他類型的灰色文獻進行研究,或是以文獻之作者群進行社會網絡分析也是一個可行的研究方向。Item 校務研究資料庫的建構與分析應用(教育研究與評鑑中心, 2016-03-??) 曾元顯; Yuen-Hsien Tseng本文根據教育科學、圖書館學、資訊工程等領域的知識,結合多年來處理校內外資料庫的實務經驗,以及對近年技術產品的瞭解,闡述校務研究資料庫建置的較佳實施概念,並分析比較各種建置方案的適用時機與優缺點,最後以三項代表性的具體實例說明本文提及之實施概念的綜效。具體而言,本文介紹採、編、典、藏、用五項可持久運作的資料庫建構作業流程與注意事項,說明資料正規化與反正規化的用處,透過概念驗證作業提供與國內廠商互動的經驗,並以實際校務數據的分析案例,分享應用經驗。整體而言,資料蒐整作業(即:採、編、典、藏)仍是最費時、費力的流程,一旦完成,後續的分析運用便容易進行。目前的視覺化分析工具將越來越便利,讓各類型使用者得以更有效率的從大量資料中發現特殊樣態、形成假說,進而對資料做各種查詢與探索,以獲得具體事證支持決策。展望未來,除了視覺化工具越受依賴外,事件演進模擬技術,也將扮演重要角色,其可讓使用者事先知道各種因素變化後的最終結果,讓分析平台更具價值。Item 校務研究資料庫的建構與分析應用(教育研究與評鑑中心, 2016-03-??) 曾元顯; Yuen-Hsien Tseng本文根據教育科學、圖書館學、資訊工程等領域的知識,結合多年來處理校內外資料庫的實務經驗,以及對近年技術產品的瞭解,闡述校務研究資料庫建置的較佳實施概念,並分析比較各種建置方案的適用時機與優缺點,最後以三項代表性的具體實例說明本文提及之實施概念的綜效。具體而言,本文介紹採、編、典、藏、用五項可持久運作的資料庫建構作業流程與注意事項,說明資料正規化與反正規化的用處,透過概念驗證作業提供與國內廠商互動的經驗,並以實際校務數據的分析案例,分享應用經驗。整體而言,資料蒐整作業(即:採、編、典、藏)仍是最費時、費力的流程,一旦完成,後續的分析運用便容易進行。目前的視覺化分析工具將越來越便利,讓各類型使用者得以更有效率的從大量資料中發現特殊樣態、形成假說,進而對資料做各種查詢與探索,以獲得具體事證支持決策。展望未來,除了視覺化工具越受依賴外,事件演進模擬技術,也將扮演重要角色,其可讓使用者事先知道各種因素變化後的最終結果,讓分析平台更具價值。Item 自動化主題分析於圖書資訊領域之應用(2009) 湯秋蓉; Chiu-Jung Tang本研究旨在利用資訊自動化歸類的主題萃取系統,以臺灣地區圖書資訊學領域的學位論文與期刊文獻為研究範疇,進行研究主題的自動化歸類。 研究文件收錄國家圖書館「全國博碩士論文資料庫」中9所大學院校圖書資訊學系所共912篇學位論文,以及「中文期刊篇目影像系統」中圖書資訊學期刊15種共3,128筆期刊文獻。透過主題萃取系統的文件共現字主題歸類分析,採取不限定分類架構、體系表的方式,以自由詞彙的方式取得研究主題,將學位論文歸類出 14 個研究主題,以及期刊文獻歸類出 17 個研究主題。 研究發現自動主題分析可達到與人工歸類相同的分析成效,減輕人工歸類的工作量負擔;可以讓此學門初入門的研究人員對於此領域可以迅速且透徹的瞭解;可以讓後續研究者對圖書資訊學未來研究方向、研究發展重點的有所參考;亦可以即時反應新興研究主題。Item 臺灣歷史學者研究成果與引文分析(2013) 蔡雅琳; YA-LIN TSAI學術文獻可說是傳播學術最重要的正式管道,也是催生新知、讓知識不斷進 步突破的基礎。運用書目計量研究法來掌握學術的生產成果,優點是可以避免涉 及個人主觀價值的判斷、了解學科發展現況、評鑑學術研究表現、有客觀直覺的 優點。國際上運用 SCI、SSCI 等索引資料庫評估自然科學學科的學術生產力時間 已久,在客觀性與正確性已取得共識,但在評估人文學科方面尚留有不少爭議。 因為人文學科研究與自然學科的學科特性有諸多不同。 本研究為求臺灣地區的歷史學者們的學術成果,及他們在引用行為上有何特 殊性,自國科會人才資料庫蒐集了 262 位臺灣地區位歷史學者在 2001 年至 2010 年間,共 3466 筆的學術著作書目,再以檢索出的臺灣歷史學者名單檢索 THCI 索引資料庫,下載 1015 篇論文的期刊論文,蒐集了 51577 筆引用書目。這些書 目經過分類及正規化後,進行統計分析與及運用 CATAR 軟體做書目對分析。 研究結果發現:臺灣歷史學者最常使用的語言是中文;臺灣歷史學者的著作 類型以期刊論文最多;老舊的外文圖書對歷史學者來說有保存價值;臺灣歷史學 者引用最多的是史料;近年成長速度最快的引用書目是中文的非史料的文獻;臺 灣歷史學界的三大研究主題是臺灣史、元明清史、中國近現代史。 最後提出的建議為:對歷史學的引用書目研究,應進一步加強專書的引用書目 研究,與歷史學家引用史料的研究;人文學科中應區分研究領域作小範圍深入的 分析;加強人文學科引文資料庫的品質;CATAR 軟體可應用於加強圖書館館藏 政策。Item 電腦輔助分析軟體運用於質性研究訪談稿內容分析之探討(2008) 谷佳臻; Chia-Chen Ku隨著社會思潮的湧現,質性研究在社會科學的領域裡逐漸嶄露頭角。其中,質性訪談是運用最廣泛的資料蒐集方法。研究者在質性訪談後,先建立訪談稿,再依照研究者所採用的理論架構,將問題的反應做分群,再著手進行分析。然而傳統人工分群往往耗費大量時間與精力。因此,本研究以電腦輔助分析軟體進行訪談稿分群分析,探討電腦輔助分析軟體與傳統人工分群的一致性,並說明電腦輔助分析軟體如何有助於訪談稿的分析。 本研究使用電腦輔助分析軟體ClustanGraphics8.02及主題萃取系統,針對社會科學領域畢業研究生(研究對象)之訪談稿進行實驗。研究中,先以電腦輔助分析軟體針對訪談稿進行分群分析。接著,根據電腦分析結果,對研究對象進行訪談,並利用rand index交相驗證電腦與人工分析結果之相似度,以探究電腦輔助分析軟體對質性研究訪談稿分析之幫助。 實驗與訪談結果顯示,雖然電腦輔助分析軟體與傳統人工分析結果的一致性不算高,但電腦分析之結果,在人工分析訪談稿前,可以給予初步之分群的構想;同時,電腦輔助分析軟體若運用於結構式或半結構式之訪談稿,可能得到較好的助益。此外,透過rand index計算所得之電腦與人工及綜合結果之相似度(一致性)數值,並無明顯差距;另於訪談亦發現綜合分析結果並未獲得青睞,皆顯示出使用單一或多種輔助軟體實驗,可能並不會有太大之差異。