Browsing by Author "白立亭"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Item 針對端到端語音辨識中語境偏移之適應性研究(2025) 白立亭; Pai, Li-Ting隨著後疫情時代的到來,線上會議成為主流,使得對語音轉錄技術的需求日益增加。然而,在這些會議場景中,語音辨識系統面臨專業術語、人名、關鍵詞等辨識不準確的挑戰,影響了轉錄結果的完整性和精確度。這些問題尤其常見於涉及特定行業術語或專業背景的會議,如醫療、法律、金融等領域。在此情境下,準確地轉錄關鍵詞和專有名詞不僅是為了提升會議紀錄的可讀性,也有助於在後續的資訊檢索和分析中更有效地處理和提取重要內容。針對此需求,語音辨識技術逐漸引入語境化偏移及文字提示功能,通過整合特定語境清單和專業術語庫,使系統能更精確地辨識會議中的重要內容,進一步提高會議資料的品質與實用性。本研究聚焦於增強語音辨識模型的上下文敏銳度,旨在透過引入不同類型的語義特徵以及特定的提示訊息來提升模型對領域特定詞彙的辨識能力。研究結果顯示,利用提示訓練,在AISHELL-1 資料集上的詞相對錯誤率可以達到13.8 %的相對詞錯誤率,以及7.5 %的相對實體錯誤率,研究結果表明本研究有效地喚醒模型對於專業術語或重要詞彙的敏感性,降低偏移詞錯誤率,並提升轉錄結果的精確度。透過提供了詞彙的語境線索,幫助模型在專業場景下更準確地辨識並正確轉錄相應內容,從而減少因上下文缺乏而導致的誤差。