cht電腦資訊輸入法行列輸入法
adm Find login register

關於重碼字的問題

coolcd
1 關於重碼字的問題
Promote 0 Bookmark 02010-12-14quote  

原文在〈奇怪的行列拆碼〉第十七篇,因與主題無直接相關,故另闢本文以供討論。

guest

原來廖明德老師也蒞臨此地了……

在下想借此帖順道一問:為何「減」這字既無特碼,亦無簡碼呢?此字的使用頻率也不低的說!

又「嚐、寵、慣……等等」這些字使用率不低,卻排在重碼字的次選項(首選字通常都有簡特碼可用)。

是否應該考慮將這類重碼次選字挪至首選項呢?而「噹、龐、實……等等」則使用簡特碼避開重碼。

如此一來必定能夠大大強化行列的輸入速度與輸入舒適性!

「減」還是有簡碼吧?三級簡碼 XD

其他常用的次選項重碼字

我想是簡單與效率之間的兩難

如果常用字僅用簡碼,勢必會造成常用字必需背簡碼

雖然可增進效率,卻會增加學習難度

edited: 1
array30
2
Promote 1 Bookmark 12010-12-22quote  

問:為何「減」這字既無特碼,亦無簡碼呢?此字的使用頻率也不低的說!

答:特別碼的安排有其考慮因素,除了要有適合的空位、字頻高優先外,也要考慮記憶的難度,太難記憶硬安排的結果是沒人使用。
以"減"字而言,在13053字裡字頻排序為864,算是使用率不低,但以它的字根碼想安排在首首(38 38)有"沝"字,首二(38 19)有"尖"字,首三(38 10)有"江"字,首尾(38 26)有"渢"字,二三有"左"字, 二尾有"戊"字,三三有"比"字,三尾有"長"字,尾尾有"絲"字,所以幾乎是沒有可助記的空位放特別碼。現在字集加大,要安排特別碼更沒有空間了。

再說一級簡碼,"減"的第一個字根鍵位是[3v],但這個位置的一級簡碼的十個字,每個都比"減"字頻高,所以一級簡碼輪不到它。
而二級簡碼因為有很多字不可能記憶,所以只能依規則(第二個字根碼的第一個數字)來擺放,而"減"字的第二個字根碼(19)的第一個數字是1,只能擺第1個位置,但那位置已被兩根的本字"尖"字占了。所以它也沒能被擺進二級簡碼。

問:又「嚐、寵、慣……等等」這些字使用率不低,卻排在重碼字的次選項(首選字通常都有簡特碼可用)。

是否應該考慮將這類重碼次選字挪至首選項呢?而「噹、龐、實……等等」則使用簡特碼避開重碼。

答:重碼字應以正常輸入的情況來考慮,因大多數行列使用者是以正常編碼來輸入,這樣就夠用了,他們並不想去記特別碼,簡碼也是用久了自然記住的才使用,一級簡碼還可以,要記二級簡碼就比較難了。反而要記住重碼字是第幾個還比較容易。
上列這些重碼字的使用頻率在倚天時代編碼時就有依據教育部的字頻資料排序設計,昨天我特地比對新的字頻資料(中研院的平衡語料庫+網路論壇字頻,其實也不夠新),1龐2寵 及 1實2慣的排序仍是正確的,而"嚐"字字頻有比"噹"強一些,但差距不大,而「噹、龐、實」這三個被排在前面的重碼字也都有被收進二級簡碼。雖然「重碼次選字挪至首選項」我認為並不適合,但你說的也有另一種道理,也許可考慮把第二重碼字「嚐、寵、慣」放進二級簡碼。當時只想到要把字頻最高的放進簡碼。

談到重碼字也要提到歷史:在倚天時代因當時電腦記憶體非常珍貴,當時對照表必需儘量壓縮,只能用內碼排序,這樣才可以不記內碼,行列每次敲鍵都可能是30個鍵其中的一個,而每個字最多會有4鍵,又要把一二級簡碼的資訊也記進去,這樣每個字只能用3個 byte來記錄, Big5的13053字集行列對照表總共只有39K,當它被載入記憶體仍保持壓縮格式,程式是將每個敲進來的鍵先壓縮成5個bit再去和對照表進行bit比對,當時對照表不可能用字頻排序,只能在對照表的檔頭針對必需調整的96個重碼字作記錄,每當出現重碼字就拿這96個字來比對,如果該字有被包含就是最高頻字,即時將它調到第一個重碼字顯示位置。。
而這些重碼字序就這樣被定下來了,到了WINDOWS一直延用,時間往前推進,雖然人們用字習慣會隨環境改變,字頻序會跟著變,但輸入法對照表卻不能隨意跟著變動,因使用者在不同系統間或前後版本間重複字的順序如果不一致會很困擾,有些行列使用者用了十幾二十年,一切都已變成直覺,聽到要調整重碼字序,可能都要跳起來了,且不同輸入系統間很難一齊更新,像微軟系統內含的輸入法更新可不是容易的事,作輸入法就是要考慮很多。
如果要改可能來一次大改版,直接用字頻表來作對照表,輸入時一面按鍵就把最高頻的字從頭列出當作簡碼,新近推出的行列10數字輸入法 就是直接用字頻排序對照表,老刀已把它實現在LIME系統供智慧型手機使用者下載使用,我自己試用還蠻理想的。

edited: 5
guest
3
Promote 0 Bookmark 02011-02-08quote  

感謝廖老師百忙之中仍如此迅速並詳盡地答覆。及感謝板主撥冗移帖,並致上歉意。

老師所言甚是,對於老練的行列鍵友們來說:無論多寡,簡特碼的更改都是個不便之變。

但學生相信,只要是更好的革新,大家都會欣然接受的。(畢竟人類的變通力、適應力比機器強得多。)

學生也明白,面對廣大行列使用者,任何方面都需老師再三斟酌。但還是自私地希望行列能與時俱進、好上加好。

誠蒙老師無私地開放行列的授權,一直以來都有許多鍵友在各個平台維護著行列輸入法(如:老刀前輩們……)。

然最慶幸的是,老師始終運作著行列官方的窗口以提供字碼對照表,才使得行列不會有著編碼版本混亂的問題存在。

所以,老師於文末提到的「可能的」大改版,不論會在哪個平台實作,只要是行列官方釋出,都將是眾人萬分期待的。

 

謹祝 板上諸位 新年如意 喜樂安康

 

 

cht電腦資訊輸入法行列輸入法
adm Find login register
views:11551