教育心理與輔導學系
Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/16
本系設立於民國五十七年八月。民國三十五年本校成立時,即在教育系內成立心理實驗室。四十七年教育系成立心理學組,並將心理實驗室擴充為心理實驗中心。五十七年正式成立教育心理學系。六十九年在進修部成立教育心理學系,分設輔導組和特教組,為中小學教師提供進修機會。六十八年教育部鑑於各級學校輔導工作之日益重要,乃准以教育心理學系現有師資及設備為基礎,成立輔導研究所碩士班。民國七十六年更奉准成立博士班,培育高級輔導人員,同年將系(所)名稱更改為教育心理與輔導學系(所),並簡稱為心輔系(所)。民國八十三年,因應新大學法頒佈,將系所名稱合一,統稱為教育心理與輔導學系(簡稱為心輔系)。
本校校區可分為本部(包括教育學院、文學院、藝術學院)及分部(理學院)。本系位於本部教育學院大樓五、六樓。
Browse
6 results
Search Results
Item 跨向度轉換程序對多向度多階段適性測驗測量精準度的影響(2022) 吳宜玲; Wu, Yi-Ling多階段適性測驗(computerized multistage adaptive testing, MSAT)為電腦化適性測驗(computerized adaptive testing, CAT)的一種特例,它擁有CAT的優點,相較於線性測驗,可以使用較少的題數達到與CAT相近的測量精準度。本研究探討題間二向度MSAT與題內四向度MSAT,在不同跨向度轉換程序對於測量精準度的影響,分為三個子研究。研究一為提出題間二向度MSAT設計,在已知受試者樣本分佈狀態且向度能力間相關正確,分別使用單向度二參數對數模式(unidimensional two-parameter logistic model, 2PL)與多向度二參數IRT 模式(multidimensional item response model, M2PL)估計能力,研究發現M2PL模式測量精準較高。其次,在跨向度測驗的轉換程序,利用答對題數或迴歸模型進行適性,受試者的能力估計均方根差(root mean square error, RMSE)較小。研究二為提出題內四向度MSAT設計,在已知受試者樣本分佈狀態且向度能力間的相關正確,設計不同跨向度的轉換程序,研究發現利用迴歸模型進行跨向度的轉換程序時,當向度間能力相關程度越高,模板1–3–3–3的設計最佳,模板1–3–2–3的設計為其次,均優於無跨向度轉換程序的設計,受試者的能力估計RMSE較小。研究三探討當受試者樣本分佈狀態未知且不一定正確,不同能力組合之受試者進行題間二向度MSAT與題內四向度MSAT,對於測量經準度的影響。研究發現,在極端能力受試者的能力估計RMSE較大,而中等能力受試者的能力估計RMSE較小。當受試者能力越不符合向度間能力相關程度時,其能力估計RMSE越大。在進行多向度MSAT時,利用向度間能力的相關進行適性,可以有效的降低受試者的能力估計RMSE,受試者僅需作答部分的試題,就能達到良好的測量精準度,節省測驗時間。Item 摘要能力量尺之建置及摘要自動化批改系統之建置與效能評估(2021) 李奕璇; Lee, Yi-Hsuan國內近年來在十二年國民基本教育課程綱要(簡稱12年國教課綱)的推動下,更加重視素養的養成。當中受到最多關注的便是閱讀理解這項跨領域素養,隨之而起的則是關於閱讀教學、閱讀策略的討論。許多教師嘗試將閱讀理解的概念融入於教學中,亦時常要求學生進行各種閱讀任務(task),其中撰寫摘要被視為最能代表讀者是否獲知閱讀文本內容的方法,亦常被用作閱讀理解的檢核。然而,在實務上摘要評分工具的研發卻相當缺乏,且具有標準不一、測驗結果無法相互比較等問題。有鑑於此,本研究擬建構一套可應用於廣泛對象的摘要評分規準,調查學生的摘要能力發展,並透過試題反應理論(item response theory, IRT)建構摘要能力量尺,提供參照標準,使教師可有效地掌握學生的程度。更重要的是,為呼應閱讀教學之需求,本研究擬探討自動化摘要批改應用於讀後評量的可行性。本文依研究主體劃分為二,研究一的重點為,透過收集實徵資料,瞭解學生的摘要能力發展情形,並研發摘要評分規準,使教師在評估學生的摘要能力時有所依歸。而在研究過程中,專家批改摘要的結果,亦為研究二自動摘要評分的檢驗效標。研究一精選四份不同難度的文章作為測驗文本,要求受試者在進行閱讀後,透過撰寫摘要,重述文章的重要意涵。研究一的受試對象包含二至九年級學生,共2,003名。考量學生就讀年級的差異,受試者所閱讀的文章由研究者依難度進行指派,每位學生撰寫一至兩篇摘要,總計收集2,591篇摘要。所有摘要皆依本研究所建置的評分規準,透過四大向度(完整度、關鍵訊息、濃縮整合、以及遣詞用字)進行批改,綜合評估學生的摘要能力。批改者皆為本研究所招募的資深教師(本文稱專家批改者)。經由斯皮爾曼等級相關(Spearman’s rank correlation)分析每篇文本的兩個初閱分數,可發現評分者間具有高度的給分一致性,評分者間相關至少達 .85以上,評分品質穩定。除此之外,由於研究中的部分學生針對不同測驗文本,同時撰寫兩篇摘要,故所有測驗文本的批改結果可藉由共同人的設計進行等化,再藉由IRT分析,連結所有年級的能力表現,量尺化學生的摘要能力發展結果。分析結果顯示,與學生的摘要原始得分具有相同的趨勢,各年級學生的平均能力值皆隨年級遞增。相關結果不僅代表教師評分的有效性以外,亦可透過各年級的平均能力值建構摘要能力量尺,提供摘要能力定位的參考標準。而研究二著重自動化摘要批改模型的建立以及其效能之探討。本文利用機器學習(machine learning),以段落向量、潛在語意分析(Latent Semantic Analysis, LSA)、變換器之雙向編碼器表示(Bidirectional Encoder Representations from Transformers, BERT)等三種技術,結合密度尖峰分群法(density peaks clustering),生成電腦摘要。再依本研究建構的自動摘要評分模組,透過將學生摘要與電腦摘要相互比較的方式,評估學生摘要品質。為貼近教學實務需求,本研究之評分模組係依研究一之評分規準建置而成。擷取評分規準中屬於閱讀理解範疇的三大向度(完整度、關鍵訊息、濃縮整合),分別以學生摘要中納含主題的數量比率、學生摘要中關鍵詞彙的數量比率、和學生摘要與電腦摘要的語意相似性,等三個層面表徵學生摘要在完整度、關鍵訊息、濃縮整合的表現情形。在效能檢核上,本文分為兩個層面進行探討。第一部分為自動摘要生成的效果,本研究分別利用「召回率導向摘要評估」(Recall-Oriented Understudy for Gisting Evaluation, ROUGE)、概念詞重覆率、主題涵蓋率,檢核三項電腦技術所節錄的自動摘要是否足以代表原始本文。其結果發現,段落向量與LSA的自動摘要品質良好,且兩者效能在伯仲之間,BERT的成效則相對較差。而在本文的另一個探討重點,摘要自動評分的效能上,本研究藉由專家人工評分的結果與三個評分模型各別評估的摘要品質結果,進行相關性分析與準確率統計,比較三者之間哪一個模型與專家評分的相關性或是準確率最高,便代表其效能最好。經由斯皮爾曼等級相關分析顯示,三個評分模型在總分的相關係數介於 .61至 .68之間,接近高相關,在個別向度的相關上也至少有 .46以上的水準,且所有的相關係數皆達顯著水準,代表不管是哪一個評分模組的自動評分結果皆與專家評分的趨勢相近,具有良好的代表性。在準確率統計方面,三者的成效亦相當優良,鄰近準確率至少皆達8成以上,三者差異不大。而在穩定性上,則以LSA的表現最好。另一方面,本文亦導入專家評分者所整理的節錄式(extractive)摘要,同樣透過三個面向的評分模組,評估學生摘要品質並進行準確率統計。透過此方式,不僅可以得知哪一個模型的效能較好,更能進一步瞭解三個自動摘要評分模型的效能有多好。而相關結果顯示,縱使將電腦摘要替換為專家摘要作為比較基準,其自動評分的準確率並無明顯的差異,表示本研究所採用的電腦自動摘要技術良好,效能與專家摘要相近。相較於現有摘要能力評量,本文研究最大的優勢為,透過研究一蒐集跨學習階段的學生摘要,確立評分規準的有效性以外,更將學生的摘要能力表現建構於同一量尺之上,可供長期追蹤學生的摘要發展情形之用。此外,亦突破傳統做法,結合書籍難度,準確評估學生摘要能力。另一方面,在研究二的部分,以往資訊技術研發的重點大多聚焦於如何有效地生成電腦化摘要,鮮有針對中文自動摘要批改的研究。少數以電腦自動化摘要批改為號召的系統,又多僅以語意相似性評估摘要品質,忽略了摘要能力其他成分的重要性。而本文將自動化摘要技術附加電腦評分模組進行整合,可呼應摘要實務教學所重視的完整性、關鍵訊息、濃縮整合等層面的細項摘要技能;而藉由與專家人工批改結果進行跨域連結、比較,本研究進一步探究不同模型應用於自動化摘要批改的效能,此作法可望為相關領域的研發提供寶貴的實徵證據。Item 階層結構試題反應模式及其在電腦適性測驗之應用(2009) 黃宏宇; Hung-Yu Huang本研究旨在發展具有階層結構潛在變項的試題反應模式,稱之為「階層結構試題反應模式」,且將其應用在電腦適性測驗中,並檢驗其有效性。本論文共有三個模擬研究,第一個研究是透過貝氏統計中的馬可夫鍊蒙地卡羅估計法,來進行模式參數的估計與模式適配度的檢驗,結果發現本研究發展的模式適配度指標與貝氏DIC指標適合用來診斷模式與資料的適配程度,且貝氏估計法能提供良好的模式參數回復性。第二個研究則是發展階層結構試題反應模式在電腦適性測驗上的算則,結果發現透過修正題組模式的電腦適性測驗算則而發展出的選題與能力估計程序,具有最佳的能力估計效能。第三個研究則是修正傳統的最大訊息量選題法,在測驗初期加上隨機成分來控制測驗初期能力估計的誤差,結果發現新近的選題方法能提高題庫使用率,降低試題的曝光率與測驗平均重疊率,支持新的選題法可以兼顧題庫安全與測量精確度。最後,作者則針對未來研究與實務應用提供若干建議。Item 國中生數學內容知識與數學認知能力之混合Rasch模式分析研究(2006) 鄭蕙如; Huey-Ru Cheng本研究目的為了解我國國中生之數學內容知識與數學認知能力之表現:首先,建立以國中基本學力測驗為基礎之數學科評量架構;其次,了解國中生之數學內容知識及數學認知能力的表現類型及各類型表現內涵。在研究方法上,蒐集並分析國內、外各大型專業評量機構對數學內容知識及數學認知能力之定義;並且使用混合Rasch模式,針對基本學力測驗數學科之作答反應資料,進行國中生數學內容知識與數學認知能力之分析研究。本研究之結果如下:一、就評量架構部分,在基本學力測驗數學科的基礎上,本研究建立以數學內容知識與數學認知能力為主軸之評量架構,其中數學內容知識下,又細分為若干數學學習單元。二、國中生在基本學力測驗數學科之整體表現方面,在資料分析統計與機率表現較佳、幾何與空間概念表現較差;在數學認知能力部分,則以概念理解、程序知識與執行表現較好,問題解決表現較差。三、就混合Rasch模式分析結果顯示,分屬於不同組別的國中生,數學內容知識與數學認知能力之試題平均答對率高低及結構並不一致。最後,研究者針對研究所得之結論,提出未來教學與研究之建議,並提出應持續針對國內國中生數學表現繼續深入探討及研究。Item 模式錯誤假設對電腦化測驗的影響(國立臺灣師範大學教育心理學系, 2011-06-??) 盧宏益; 徐永豐; 薛國松試題反應理論被廣泛地使用在電腦化通性測驗上,其以機率的觀點,透過試題反應模式,解釋考生能力與試題間的關係。藉由所選擇的試題反應模式,施測者可以根讀不同的測驗目的編製適合的測驗。然而在實際的測驗情境中,試題反應模式通常是未知且須事先認定的﹒本研究旨在探討試題反應模式錯誤假設對測驗結果造成之影響,研究i結果顯示,在常模參照測驗中,試題反應模式錯誤假設對考生能力估計所產生的偏誤比在真實模式下來的大,並造成測驗成本的增加,尤以真實測驗模式為3PLM時最為嚴重。在效標參照測驗中,試題反應模式錯誤假設對分類結果影響不大,但會造成測驗題數的增加,浪費施測成本。Item 以試題反應理論分析CES-D 量表不同調查方式的差異效果(國立臺灣師範大學教育心理學系, 2008-02-??) 李仁豪; 謝進昌; 余民寧; Ren-Hau Li; Jin-Chang Hsieh; Min-Ning Yu本研究主要是探討網路問卷與紙本問卷這兩種調查方式是否有所差異,問卷內容是採用國際間廣泛使用的CES-D 憂鬱量表。2400 位樣本分層隨機取自台灣中小學教師,其中共有1141位教師在20 題CES-D 量表上作答,包括535 位網路組及606 位紙本組教師。本研究藉由單參數試題反應理論軟體ConQuest 開發的多向度潛在回歸模組來比較網路問卷組與紙本問卷組在問卷內容上的差異情形。研究結果顯示,儘管網路問卷回收率稍低於紙本問卷,但並未導致兩組受試者在背景變項上有所差異。在問卷內容的比較上,雖然網路問卷組在問卷內容的潛在平均數顯著地低於紙本問卷組,但是並無實質上的重要差異,亦即問卷組別變項對CES-D 量表各因素的解釋力趨近於0。本研究認為仍有必要持續進行調查方式的比較研究,以確認網路問卷是否可取代紙本問卷,以減少研究及社會成本。