cht電腦資訊gcin
adm Find login register

[常識] 注音輸入法與漢字發音

caleb
joined: 2007-09-22
posted: 630
promoted: 134
bookmarked: 90
1subject: [常識] 注音輸入法與漢字發音Promote 1 Bookmark 02009-02-17quote  

中國的「普通話」,台灣的「國語」,都和古漢語發音有很大的出入。

用「普通話」或「國語」研究古文是自討苦吃,基本上是很腦殘的行為。

隨便舉個例子,「天時懟兮威靈怒嚴殺盡兮棄原野」,國文課說這個「野」字要讀破音字「ㄧㄚ」(ya) ,為什麼呢?

用「普通話」或「國語」只能死背硬記,而且根本就和古人的發音完全不相同。

 

自從「書同文」之後,漢字的變遷往往有統一的規範,和平朝代都有官方統一整理用字、釋義、切韵(發音)。

但是「書同文」卻沒有「說同語」,各地方的語言南腔北調、五花八門,就算只是極小的地域差異也會產生不同的發音、用詞語系。

舉台灣為例,光是閩南語就有多種腔調,海口腔、宜蘭腔啥的,甚至日常用品、生活常用形容詞等等,跨了一條河就會完全不一樣。

另外,台灣現存的閩南語實際上已融入大量的日語、「國語」,一般咸信也融入了平埔族語,所以和福建的閩南語也有很大差異了。

其它漢語語系也是一樣,畢竟語言文字本來就是會隨時代改變的。

 

有了基本常識打底之後,大家就知道,中國和台灣目前的官方發音,是有很多問題的。

整理注音輸入法時,像「野 = ㄧㄚ = ya」這種鳥發音,應不應該收錄呢?

像「樂」這個字,應不應該收錄「ㄧㄠˋ」「ㄌㄠˋ」等罕用發音呢?

現代的很多「破音字」,跟本就是為了配合「普通話」或「國語」而硬拗的白痴發音,這種音真的要全編進注音輸入法嗎?

如果不全編入,那取捨的標準在哪?

 

語音和讀音呢?

「滑稽」的滑要不要順便編入「ㄍㄨˇ」?

 

生活常見的錯誤發音呢?近似音呢?

哪個該編入?哪個不該編入?

 

以上還只是以單音單字的注音輸入為主,如果加入整句輸入的智慧注音,又必須另外判斷整句發音時的變音問題。

eliu

joined: 2007-08-09
posted: 11478
promoted: 617
bookmarked: 187
新竹, 台灣
2subject: Promote 0 Bookmark 02009-02-17quote  
以口語為主,gcin 是用來輸入的,不是被用來查發音的。所以一字多音的情形,如果是很少用的發音,就應該被捨棄。
本人已不在此站活動

joined: 2007-09-19
posted: 4946
promoted: 325
bookmarked: 206
歸隱山林
3subject: Promote 0 Bookmark 02009-02-17quote  

「完整支援」真的是很不切實際,不要說注音輸入法,就嘸蝦米來說,你要完整支援的話,通通一個表格,那就完全失去嘸蝦米的特點的(重選字少),使用起來也會相當的不方便。

所以,很早我就建議要分成常用及罕用兩個表格,只是界線很難分清楚而做罷。但目前的話,我是認為可以用 MS Windows 的成果,就是(舊)新細明體所收錄的字訂為常用(新一代的新細明體收錄的字可能會多了點,不過也可以考慮)。這是商業市場洗禮後的成果,我是覺得很實用。

至於破音字,沒什麼想法,目前不知道要怎麼處理比較好。


caleb
joined: 2007-09-22
posted: 630
promoted: 134
bookmarked: 90
4subject: Promote 0 Bookmark 02009-02-21quote  

順便提一個注音的超蠢設計:

「他她它牠祂」是有鼻音的,發音和「塌」(無鼻音)完全不同,但注音卻全都是「ㄊㄚ」。

本人已不在此站活動

joined: 2007-09-19
posted: 4946
promoted: 325
bookmarked: 206
歸隱山林
5subject: Promote 0 Bookmark 02009-02-21quote  

這沒辦法。目前也只能依注音。其實注音很多漢音是注不出來的。就會多出一堆長角長尾巴的注音符號,那種生魔帶角東西我是不用的啦!


eliu

joined: 2007-08-09
posted: 11478
promoted: 617
bookmarked: 187
新竹, 台灣
6subject: Promote 0 Bookmark 02009-02-21quote  

caleb
他她它牠祂」是有鼻音的,發音和「塌」(無鼻音)完全不同,但注音卻全都是「ㄊㄚ」。

我自己的發音都沒有分。 

coolcd
joined: 2008-01-21
posted: 2601
promoted: 348
bookmarked: 95
7subject: Promote 0 Bookmark 02009-02-21quote  
caleb

順便提一個注音的超蠢設計:

「他她它牠祂」是有鼻音的,發音和「塌」(無鼻音)完全不同,但注音卻全都是「ㄊㄚ」。

對耶!沒人提的話,我都沒發覺!

台灣的音標系統實在需要全面重新通盤考量,希望以後的小朋友只要學一種,就可以國、台、客、原住民、英語都可以通用。

 

caleb
尤其我對教育部的官方發音本來就很有成見

昨天整理了一些「一」開頭的詞後,我也開始對教育部重編國語辭典修訂本的網路版產生不信任感,為什麼所有的「ㄧ」都是一聲?很明顯跟我們日常的用法不同,我手邊的字典也不是這樣注的!

caleb
joined: 2007-09-22
posted: 630
promoted: 134
bookmarked: 90
8subject: Promote 0 Bookmark 02009-02-21quote  

coolcd
所有的「ㄧ」都是一聲?很明顯跟我們日常的用法不同,我手邊的字典也不是這樣注的!

中國「普通話」與台灣「國語」都有分「語音」與「讀音」。

口語變音不算正式發音。

例如「綑綁」口語是「ㄎㄨㄣˊ ㄅㄤˇ」(綑二聲),但注音時是注「ㄎㄨㄣˇ ㄅㄤˇ」(綑三聲)

一般「字典」也不會把「綑 = ㄎㄨㄣˊ」列為破音字,因為這只是因為韻律而產生的口語發音。

也就是說,綑應該是沒有「ㄎㄨㄣˊ」這個音,但 gcin 裡可以列「綑綁 = ㄎㄨㄣˊ ㄅㄤˇ」。

eliu

joined: 2007-08-09
posted: 11478
promoted: 617
bookmarked: 187
新竹, 台灣
9subject: Promote 0 Bookmark 02009-02-21quote  
ㄎㄨㄣˊ 是因為 ㄅㄤˇ 所以變成 2聲。如果每個都要這樣搞,可能詞庫變太大。注音目前是沒有ㄎㄨㄣˊ這個發音,可能會造成問題。
coolcd
joined: 2008-01-21
posted: 2601
promoted: 348
bookmarked: 95
10subject: Promote 0 Bookmark 02009-02-21quote  

本調標三聲,實際讀二聲,這個我是記得的。但我不知道,原來「一」也算是這種情形,這稱為「變調」。

剛查了家裡字典, 「一」的本調是唸第一聲,「一」字單用、用於詞尾、或句尾時,唸第一聲(陰平);「一」後面接第四聲(去聲)的字時,唸第二聲(陽平);「一」後面接第一聲(陰平)、第二聲(陽平)、第三聲(上聲)的字時,唸第四聲(去聲)。

標本調或變調,依字典而異,我家有的字典是只在「詞」標本調(變調在「字」的部分說明),有的是在「詞」直接標變調。

因為我整理詞庫的目的,是希望 gcin 有個比較符合字典的注音,所以,我都會儘量列入,效率不是我的重點。但如是 gcin 官方,我覺得維持原來的就好了,比較實際一點。

今天看了一下 sqlite 的文件,不難學,所以我應該會用 sqlite 來整理,希望未來的成品,可以讓語音、讀音透過 query 分出來。

本人已不在此站活動

joined: 2007-09-19
posted: 4946
promoted: 325
bookmarked: 206
歸隱山林
11subject: Promote 0 Bookmark 02009-02-21quote  

xcin 的詞庫在以前就曾經多人 review 過。但結果還是無法讓所有人滿意。這其中的原因,我想是因為我們到底取捨的標準在哪裡的問題。

spec 決定了,一切就好辦了。不然大家還是在重複以前 xcin 詞庫的事情,搞不好經過了五年、十年,還是一樣會又有另一堆人在做同樣的事。

所以,先把 spec 決定恐怕才是必要的。然後取捨就依這個 spec。


coolcd
joined: 2008-01-21
posted: 2601
promoted: 348
bookmarked: 95
12subject: Promote 0 Bookmark 02009-02-21quote  
LGJ

所以,先把 spec 決定恐怕才是必要的。然後取捨就依這個 spec。

先把目前想到的記下來:

  • 本調(讀音)一律列入 (即使不常用)
  • 字典查得到的變調(語音),就列入
  • 一個詞中,如果兩個字以上有變調的問題,可能有讀音、語音排列組合的問題,如字典、辭典找不到該詞注音,就依字典對該字的變調解釋,看看能不能標出來,如果還是不確定,依一般人實際唸法來標。
  • 資料庫欄位分為:phrases (詞)、pronunciation (注音)、tone_sandhi (變調字數)、status (字典有記載、依字典判斷、憑私人經驗、待處理)
edited: 2
本人已不在此站活動

joined: 2007-09-19
posted: 4946
promoted: 325
bookmarked: 206
歸隱山林
13subject: Promote 0 Bookmark 02009-02-21quote  

coolcd
字典查得到的變調(語音),就列入

這是比較有問題的地方。以前整理 xcin 詞庫時,就是沒有列出要用哪幾本的字典(當然連康熙字典也用上了),所以,一碰到兩本字典打架時,就通通列入,造成後來使用的人頻頻質疑。

雖然很不願意,但要定出具代表性的字典的話,可能還是得依從教育部字典,這樣至少學校單位裡頭不會出問題。

至於,通行的口語音,就要視情形加入了,就是說字典不是這樣注,但我們平常就是這樣讀的。


coolcd
joined: 2008-01-21
posted: 2601
promoted: 348
bookmarked: 95
14subject: Promote 0 Bookmark 02009-02-22quote  
LGJ

 

這是比較有問題的地方。以前整理 xcin 詞庫時,就是沒有列出要用哪幾本的字典(當然連康熙字典也用上了),所以,一碰到兩本字典打架時,就通通列入,造成後來使用的人頻頻質疑。

雖然很不願意,但要定出具代表性的字典的話,可能還是得依從教育部字典,這樣至少學校單位裡頭不會出問題。

 

很合理,就這麼辦,不知道常常用他們的網站會不會被 ban ……

至於,通行的口語音,就要視情形加入了,就是說字典不是這樣注,但我們平常就是這樣讀的。

這部份我會酌情加入,但會在表格中注明是私人判斷的。

本人已不在此站活動

joined: 2007-09-19
posted: 4946
promoted: 325
bookmarked: 206
歸隱山林
15subject: Promote 0 Bookmark 12009-02-22quote  
caleb
順便提一個注音的超蠢設計:

「他她它牠祂」是有鼻音的,發音和「塌」(無鼻音)完全不同,但注音卻全都是「ㄊㄚ」。

北平話是北方民族入侵中原後,學不來八聲調十五音而簡化出來的標音系統,這些當然是分不出來的,例如:「甘」 vs.「干」,你用河洛語或客家語都能分出一個是閉口,一個是開口,但用北平話發音的話(注音),兩個都開口,完全沒有分別。

像我最近在研讀的《傷寒卒病論》,這是漢代的作品,當然還是中原古音來發音,我手頭上這本台灣本的就是用八聲調十五音來精準發音的,可惜十五音的標音並非主流。


cht電腦資訊gcin
adm Find login register
views:44744