國台英日語 攏ㄟ通

〔自由時報記者蘇孟娟/台中報導〕中興大學退休應用數學系教授黎自奮研發語音辨識系統,能把國、台語還有英、日語等語言轉成文字,即使說話者說得一口台灣國語,一樣可以成功轉成文字。

黎自奮費時廿年摸索語音辨識轉成文字的機制,他觀察到傳統語音辨識轉換文字系統頂多只能辨認單字及單音,也就是一次一字及單一種語言,沒辦法「隨講隨寫」,甚至要慢慢講外加「講清楚」才有辦法被辨識,他致力突破,終於在近日完成多音、多語辨識系統。

聲、字相符即自動搜尋

黎自奮突破的方式是設計數學運算方式,把聲音編碼,建立聲音資料庫,另再建置文字資料庫,每個音及每個字各有一組數字碼,使用者開口說話後,電腦語音辨識系統就會自動搜尋比對,一旦「聲、字相符」,就能跑出文字;除單字外,透過資料庫的建置擴充,甚至能一次秀出句子,目前發明專利申請中。

這套系統不限辨識國語,甚至可擴充到台語、英語、日語等,黎自奮說,若有人說話國、台語交雜,也照樣能秀成文字;目前他已經收集一萬一千種音調資料,再跟包括國、台、英語等文字庫比對使用。

黎自奮說,就算說話者說「台灣國語」,也照樣能轉成正確文字,只要說話者操作電腦時進行「聲音校正」,經程式運算把不正確發音重新定義新數碼,下次再開口說時,電腦就能抓到文字。黎自奮說,像他自己說一口廣東國語,一樣操作無礙;目前程式能在二到三秒左右將文字辨識出來,只不過若有同音異字時,要自行選字。

arrow
arrow
    全站熱搜

    TECH 發表在 痞客邦 留言(0) 人氣()