Browsing by Author "Kuo, Cheng-Yang"

Now showing 1 - 1 of 1

中英文文句相似度比對效果評估–以學位論文中英文摘要為例
(2025) 郭承暘; Kuo, Cheng-Yang
本研究結合Sentence Transformer模型與餘弦相似度計算，探討其在中英文學術文本相似性檢測中的應用，並比較人工評分與GPT 4o-mini模型在相似度判斷中的一致性。本研究以NDLTD為語料來源，蒐集 900篇完整中英文摘要的論文，提取 7,478句中文句子與 11,047句英文句子進行分析。使用Sentence Transformer模型將句子轉換為向量表示，並計算餘弦相似度以匹配中英文句子。此外，透過人工評分與 GPT 4o-mini 模型評分進行對比分析，評估模型的準確性與一致性。研究結果顯示，未設置門檻值時，人工評分認為高相似度句子比例為 79.94%，GPT 4o-mini模型為 69.67%。設定最佳門檻值 0.75（人工評分）與 0.79（GPT 4o-mini評分）後，高相似度句子比例分別下降至 76.8% 和 63.9%。GPT 4o-mini 模型與人工評分整體相關性達到中等水準（皮爾森相關係數 0.76，斯皮爾曼相關係數 0.69），允許一定容錯性時，Custom Weighted Kappa提升至 0.62，顯示 GPT 模型具備模擬人工評分的潛力。本研究表明，Sentence Transformer模型結合餘弦相似度計算能有效檢測中英文學術文本的語義相似性，而GPT 4o-mini模型作為輔助工具，提供提高審查效率的可能性。未來研究應進一步拓展語料庫多樣性，優化模型語義提取能力，並探索人工與機器評估結合的創新方法。