Browsing by Author "Kuo, Cheng-Yang"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Item 中英文文句相似度比對效果評估–以學位論文中英文摘要為例(2025) 郭承暘; Kuo, Cheng-Yang本研究結合Sentence Transformer模型與餘弦相似度計算,探討其在中英文學術文本相似性檢測中的應用,並比較人工評分與GPT 4o-mini模型在相似度判斷中的一致性。本研究以NDLTD為語料來源,蒐集 900篇完整中英文摘要的論文,提取 7,478句中文句子與 11,047句英文句子進行分析。使用Sentence Transformer模型將句子轉換為向量表示,並計算餘弦相似度以匹配中英文句子。此外,透過人工評分與 GPT 4o-mini 模型評分進行對比分析,評估模型的準確性與一致性。研究結果顯示,未設置門檻值時,人工評分認為高相似度句子比例為 79.94%,GPT 4o-mini模型為 69.67%。設定最佳門檻值 0.75(人工評分)與 0.79(GPT 4o-mini評分)後,高相似度句子比例分別下降至 76.8% 和 63.9%。GPT 4o-mini 模型與人工評分整體相關性達到中等水準(皮爾森相關係數 0.76,斯皮爾曼相關係數 0.69),允許一定容錯性時,Custom Weighted Kappa提升至 0.62,顯示 GPT 模型具備模擬人工評分的潛力。本研究表明,Sentence Transformer模型結合餘弦相似度計算能有效檢測中英文學術文本的語義相似性,而GPT 4o-mini模型作為輔助工具,提供提高審查效率的可能性。未來研究應進一步拓展語料庫多樣性,優化模型語義提取能力,並探索人工與機器評估結合的創新方法。