| ||||||||
adm | Find | login register |
剛看到一個教香港人說北京話的網站在教變調,原來國語中的三聲還有分半三聲跟完全三聲,以前都沒注意到 兩個三聲在一起,前面的唸二聲,這個應該國小學生就知道了,處理起來感覺應該不難 不過看到還有三個三聲字的情形,這就有點複雜了 希望以後可以有更智慧型的中文發音 我知道這個可能太難,有點不切實際,所以用 wish 有志之士可以挑戰一下 | |||||||||||||
| |||||||||||||
我覺得在文字檔 text-to-speech 來轉聲調比較適合。 在使用詞音時,因為使用者有輸入注音的聲調,此時轉聲可能會讓盲打的使用者認為輸入錯誤。 gtab 輸入法其實可以搭配詞音的注音資料來選擇注音。 edited: 2
| |||||||||||||
仔細想想後,有同感,理由有三: 第一點,同老大講的,輸入時唸出發音是確認輸入,若發出變調後的音可能會造成困擾 第二點,我們是一字一字輸入的,兩個、三個三聲字的變調,可能輸入第二字、第三字時,才知道第一字、第二字要變調,所以不可能輸入時就即時發出變調後的音,頂多做到從編輯區進入應用程式時發出變調後的音,即使可以做到如此,從編輯區進入應用程式時,切法不同,讀音可能也不同,譬如:「好領導者有以下特質」這句話,有興趣的不妨試著切切看變調方式有何不同。 第三點,如同前 面 hansioux 提過的,要變調效果好,可能需要大資料庫、 需要瞭解語言的 context,這應該是另一個 project 的事了,要在 gcin 裡頭實作,太複雜,也難以完善。 所以現在自己覺得我這個 gcin wish 是不太適合在 gcin 實作的,大家看了笑笑就好吧。 | |||||||||||||
劉老大,能否考慮直接開發一個全文發音的引擎呢? 雖然說已經有一個zhspeak的TTS引擎了,但是港腔跟中式發音實在令人不敢領教。至於espeak雖然有中文辭典了,發音的品質因為是純合成的,作者也說無法改善了。個人覺得能夠真正聽得順耳的,就只有GCIN了啊。 | |||||||||||||
gcin 是每個音錄一個檔,和合成的差很多啊。現在這個引擎不就可以正常發音了,若聽不慣還可以自己錄,要新引擎的需求是什麼呢?
gcin 是一面打字一面讓使用著能聽到剛剛輸入的字音。比如打「 〤ㄟˇ」電腦怎麼知道你後面是要打「娓娓道來」,所以現在這個字要發成「〤ㄟˊ」?電腦連你後面要打什麼都不知道,又怎麼能依字義判斷讀音?
如果你的需求是電腦讀一段已經打好的文字,那去用專門的 TTS 程式應該比較合適吧? |
| ||||||||
adm | Find | login register |