cht電腦資訊輸入法
adm Find login register

漢字部件輸入法表格檔的從發想到擱置,過程筆記

IanHo
joined: 2010-08-28
posted: 414
promoted: 7
bookmarked: 4
Taipei
1subject: 漢字部件輸入法表格檔的從發想到擱置,過程筆記Promote 0 Bookmark 02020-10-25quote  

公家機關有這樣一個解決方案網站

中華民國行政院國家發展委員會全字庫
https://www.cns11643.gov.tw/search.jsp?ID=13
部件
https://www.cns11643.gov.tw/search.jsp?ID=14&ID2=18
另外公家機關也有將其背後資料庫內,部分的漢字屬性資料和字形檔開放給民眾免費下載打包檔。
CNS11643中文標準交換碼全字庫(簡稱全字庫)
https://data.gov.tw/dataset/5961

我嘗試摸索閱讀全字庫網站和打包檔的既有內容,產生了一個發想:
有沒有可能模仿所謂的漢字字根輸入法的概念,依據全字庫所提供的五一七個漢字部件的資料集(打包檔內所提供的既有內容),
去二創設計一個「全字庫五一七個漢字部件輸入法表格檔」 for gcin ,這樣的可能性?

有一位辦公室的前輩,號稱其摸過「中文大鍵盤」。
(我個人是從來沒有摸過中文大鍵盤,我摸過的第一把電腦鍵盤已經是大五PIN的PC101Key了。)
某日聊天時這位辦公室的前輩聽聞我的發想,提供了他的觀點:
依據目前臺灣社會民風的現實(西元201X世代後半之後),「完全不建議」肖想自行再二創設計實體的中文大鍵盤。
(拍科幻電影除外)
而是可以去嘗試另外設計一套機制,想辦法將我所謂的「全字庫五一七個漢字部件」全部塞入臺灣社會目前主流的PC104Key全尺寸鍵盤左下區塊的qwerty區域內的幾十個按鍵內。

我算了一下,有47個按鍵可以動用,於是我開始想像,有沒有辦法透過「切換鍵」之類的,
把五一七個漢字部件排入這47個按鍵位置內?
我在腦內想像了好久,都想像不出一個合理的配置機制來將就PC104Key。
於是「全字庫五一七個漢字部件輸入法表格檔」這個發想,就這樣擱置了。

----以下簽名檔------------------------------------------------------------

發表過的網路文字作品;

https://sites.google.com/site/ianho7979/home

e201302012123@gmail.com
joined: 2013-05-26
posted: 53
promoted:
bookmarked:
杭州
2subject: Promote 0 Bookmark 02021-07-08quote  

好想法,不過倉頡輸入法基本上已經完美解決了中文的檢索和輸入問題,不需要再另起爐灶了。

IanHo
joined: 2010-08-28
posted: 414
promoted: 7
bookmarked: 4
Taipei
3subject: Promote 0 Bookmark 02021-07-09quote  

e201302012123@g

好想法,不過倉頡輸入法基本上已經完美解決了中文的檢索和輸入問題,不需要再另起爐灶了。

全字庫五一七個部件可以支援到將近九萬五千個漢字,
我個人古早印象中,倉頡輸入法即便是實驗室版本都還沒有支援到將近九萬五千個漢字。

----以下簽名檔------------------------------------------------------------

發表過的網路文字作品;

https://sites.google.com/site/ianho7979/home

e201302012123@gmail.com
joined: 2013-05-26
posted: 53
promoted:
bookmarked:
杭州
4subject: Promote 0 Bookmark 02021-07-25quote  

IanHo

 

全字庫五一七個部件可以支援到將近九萬五千個漢字,
我個人古早印象中,倉頡輸入法即便是實驗室版本都還沒有支援到將近九萬五千個漢字。

倉頡可以支持到G區,你想支援到多少漢字都可以。

全字庫似乎跟unicode走了不同的兩條路。

倉頡或者一個好的中文輸入法,其實沒有必要支持到這麼多字。因為中文字是為了表意,也就是表達人的思想。超過B區的字我想幾乎都意義不大。根據說文,中文字有六書構字原理,因為六書,因此漢字都有它的意義。

我們在論壇討論或發表文章時,如果遇到一個想表達的字形,與其打出一個G區的字,不如用圖片代替。因為你家的電腦支援顯示G區,不代表別人的設備能顯示。

我自建的論壇就提供了svg直顯功能。

做輸入法的過份的把注意力放在了這些生僻字、無義字上面。以「服務大衆」為借口,實則浪費時間。

即便我的輸入法能打出一個B區以上的字,我也不願意這樣做。因為unicode或全字庫,都只是「推廌內碼」而已。像這種窮舉式鋪張的內碼,它的擴張是沒有頭的。在碼表和字型制作上都是一種人類資源的浪費。

 

一些人以拿到一個支援到G區的碼表為追求,而他本人的精神境界,思維深度,表達能力,並未得到提高。

我現在用的是雅虎奇摩倉頡,這個倉頡碼表只支援到B區,我覺得已經夠用了。

IanHo
joined: 2010-08-28
posted: 414
promoted: 7
bookmarked: 4
Taipei
5subject: Promote 0 Bookmark 02021-08-09quote  

e201302012123@g

 

倉頡可以支持到G區,你想支援到多少漢字都可以。

全字庫似乎跟unicode走了不同的兩條路。

倉頡或者一個好的中文輸入法,其實沒有必要支持到這麼多字。因為中文字是為了表意,也就是表達人的思想。超過B區的字我想幾乎都意義不大。根據說文,中文字有六書構字原理,因為六書,因此漢字都有它的意義。

我們在論壇討論或發表文章時,如果遇到一個想表達的字形,與其打出一個G區的字,不如用圖片代替。因為你家的電腦支援顯示G區,不代表別人的設備能顯示。

我自建的論壇就提供了svg直顯功能。

做輸入法的過份的把注意力放在了這些生僻字、無義字上面。以「服務大衆」為借口,實則浪費時間。

即便我的輸入法能打出一個B區以上的字,我也不願意這樣做。因為unicode或全字庫,都只是「推廌內碼」而已。像這種窮舉式鋪張的內碼,它的擴張是沒有頭的。在碼表和字型制作上都是一種人類資源的浪費。

 

一些人以拿到一個支援到G區的碼表為追求,而他本人的精神境界,思維深度,表達能力,並未得到提高。

我現在用的是雅虎奇摩倉頡,這個倉頡碼表只支援到B區,我覺得已經夠用了。

我會覺得,你用不到那麼多字,不代表別人用不到那麼多字。

別人可能在你我想像不到的某個細節,就是會用到那麼多字。

 

倉頡想支援到多少漢字都可以,是一回事。

一般終端使用者 有沒有/是否方便取得 馬上可以使用到那麼多字的、現成的倉頡輸入法軟體,又是另一回事了。

----以下簽名檔------------------------------------------------------------

發表過的網路文字作品;

https://sites.google.com/site/ianho7979/home

e201302012123@gmail.com
joined: 2013-05-26
posted: 53
promoted:
bookmarked:
杭州
6subject: Promote 0 Bookmark 02021-08-10quote  

倉頡使用者能不能取得支援到G區的倉頡碼表那是他們自己的事,如果他們有這個需求,那就自己想辦法。

我只願意談倉頡能不能為到unicode-G區的漢字,或者全字庫的所有字編碼的問題。

這在數學或邏輯上,相當於證明某個理論,但不一定有人會真的去做。

比如有人證明了用1,2,3...無窮大的邊長的正方形序列,能無縫平鋪無窮大的平面。這個目前可能沒有人去做,因為沒有意義。它只要能被證明是對的就可以了。

 

回到倉頡,你說的部件作形碼的字根,去做一個形碼,這是很多形碼輸入法的思路。比如鄭碼,徐碼等。

而倉頡是統計了康熙字典四萬漢字,分出六百多字首及九千多字身。這樣去科學統計出的一個形碼,才最終做成了倉頡。

因此我只想告訴你,你想做的事情,倉頡已經做好了。

當然,全字庫本身也是在用倉頡来編碼。但由於它錯誤的使用五代,因此我後面也就不關注它的情況了。

 

補充一點,我所用的雅虎奇摩倉頡,正是全字庫製作的。當年它是用三代倉頡来做的。三代倉頡是最好的倉頡版本。

IanHo
joined: 2010-08-28
posted: 414
promoted: 7
bookmarked: 4
Taipei
7subject: Promote 0 Bookmark 02021-08-10quote  

e201302012123@g

倉頡使用者能不能取得支援到G區的倉頡碼表那是他們自己的事,如果他們有這個需求,那就自己想辦法。

我只願意談倉頡能不能為到unicode-G區的漢字,或者全字庫的所有字編碼的問題。

這在數學或邏輯上,相當於證明某個理論,但不一定有人會真的去做。

比如有人證明了用1,2,3...無窮大的邊長的正方形序列,能無縫平鋪無窮大的平面。這個目前可能沒有人去做,因為沒有意義。它只要能被證明是對的就可以了。

 

回到倉頡,你說的部件作形碼的字根,去做一個形碼,這是很多形碼輸入法的思路。比如鄭碼,徐碼等。

而倉頡是統計了康熙字典四萬漢字,分出六百多字首及九千多字身。這樣去科學統計出的一個形碼,才最終做成了倉頡。

因此我只想告訴你,你想做的事情,倉頡已經做好了。

當然,全字庫本身也是在用倉頡来編碼。但由於它錯誤的使用五代,因此我後面也就不關注它的情況了。

 

補充一點,我所用的雅虎奇摩倉頡,正是全字庫製作的。當年它是用三代倉頡来做的。三代倉頡是最好的倉頡版本。

 

我的古早印象沒錯的話,全字庫版的倉頡是倉三+倉五混搭出來的。

 

補充一下,

要使用者端自己想辦法,而不是盡可能地在許多面向提供辦法,

這真的也難怪曾經很風光的倉頡輸入法,發展了幾十年下來,越來越只是愛好者同溫層般的存在。

----以下簽名檔------------------------------------------------------------

發表過的網路文字作品;

https://sites.google.com/site/ianho7979/home

edited: 3
gholk
joined: 2015-12-14
posted: 7
promoted:
bookmarked:
台北
8subject: Promote 0 Bookmark 02021-08-17quote  

可以用二個鍵代表一個部件,這樣 26*26 = 676 還有剩,但要想想怎麼記憶。

IanHo
joined: 2010-08-28
posted: 414
promoted: 7
bookmarked: 4
Taipei
9subject: Promote 0 Bookmark 02021-09-07quote  

gholk

可以用二個鍵代表一個部件,這樣 26*26 = 676 還有剩,但要想想怎麼記憶。

「二個鍵代表一個部件,這樣 26*26 = 676 還有剩」

我在腦海中想像了好久,都具象化不出所以然來。

----以下簽名檔------------------------------------------------------------

發表過的網路文字作品;

https://sites.google.com/site/ianho7979/home

cht電腦資訊輸入法
adm Find login register
views:1923