cht電腦資訊gcingcin分享
adm Find login register

大易輸入法表格(UTF8) 29400+字(含香港常用字、簡化字)(新修訂)

snik
1 大易輸入法表格(UTF8) 29400+字(含香港常用字、簡化字)(新修訂)
Promote 1 Bookmark 12015-09-13quote  

大易輸入法由於原廠家沒有繼續維護,到進入UTF8的年代之後,用家似被遺棄的孤兒,只好各施各法自力救濟。

網上可找到UTF8的瑲珩 29373 字的大易表格,發表時是四碼大易,相信有關的熱心人下了不少工夫,他們很忠實地按大易輸入法的法則,逐字把表格做好;其後又另有有心人,把四碼大易的「頭二三尾」減去第三碼,成為「頭二尾」的瑲珩三碼大易 29373 字表格。

本人試用瑲珩大易三碼的表格後,發現至少有以下的問題:
1  瑲珩在製作時,沒有依常用和非常用的原則排序,又加上UTF8碼很多簡化漢字,往往一個很普通的常用正體字,被排至很後的位置;
2  三碼基於四碼而來,製作時相信是使用軟件,把四個按鍵的其中第三個刪去,再和原檔合成,以致很多字重覆;
3  使用大易年代久遠的用家,相信已習慣原有的二碼字( 即二碼可打出原屬三碼或四碼的字 ),但瑲珩的大易碼沒有這種設置;
4  瑲珩 29373 字,仍有很多香港常用字和簡化字從缺。
5  大易輸入法其中一個很重要的優點,是在最初創建時,容許用家根據不同的理解和筆順輸入,而能同樣打出心目中的字,因此,同一個字兼備不同的打法;然而,瑲珩的大易碼似未向原創兼容照顧不同的打法,。

針對上述數點,本人在編製表格時,做了刪除重覆、重新排序( 按正體常用字優先原則 )、補回二碼字、另外再加上29373 字以外約70個香港常用字。
至於「兼備不同的打法」,個人能力所限,恐怕未能比瑲珩高明多少。

謹在此拋磚引玉,將製作好的 .cin 檔和 .gtab 檔傳上。

各位大易輸入法用家試用之餘,萬望留言提出改善意見。

edited: 2
snik
2
Promote 0 Bookmark 02015-04-30quote  

               ↑  ↑  ↑  ↑  ↑
檔案在箭頭指著的位置。滑鼠右鍵另存新檔即可下載。

其中 dayi320150429.gtab 是三碼大易,可用在 Gcin 的 Linux, Windows 及 Android 手機版本;

至於 dayi320150429.cin ,是未經特別處理的 .cin 三碼大易表格,可用任何 text editor( 文書軟件 )打開,修改為適用任何系統的「大易輸入法」。
毋須修改,在Android 手機的 「lime-HD 輸入法」直接滙入,立即可用。

歡迎採用。自力救濟,沒有任何權利和義務,本著取諸社會,用諸社會的原則。


snik 謹識

edited: 1
snik
3
Promote 0 Bookmark 02015-09-13quote  

自本(2015)年四月底在這裡貼上大易三碼的表格後,不覺已半年,期間抽空把表格一再校正,主要仍是:
1 排序;
2 刪去重覆;
3 補回不同的打法。
過程不免有個人主觀成份,盼識者莫見笑。
謹將新校訂三個檔放在本文後,方便下載使用。

其中:

(1)  dayi320150914.cin 是原始檔;
(2)  dayi320150914.gtab 是 gcin 表格,可用在 gcin for Linux, Windows or Android ;

(3)  FORlimeHD-dy3-20150914.cin 可在Android limeHD(萊姆輸入法)的大易輸入法滙入使用。

 

檔案在箭頭指著的位置

   ↓       ↓        ↓

edited: 1
superwhy
4
Promote 0 Bookmark 02016-02-01quote  

hi~~您好~~

小弟也是大易輸入法的使用者 ~

想請教偉大的作者~這表格是以三碼為主~

請問~不知道是不是也有保留四碼的CIN檔案呢~

snik
5
Promote 0 Bookmark 02016-02-04quote  

抱歉未有即時回應。

原裝的瑲珩 29373 字的大易表格,是以下的 .txt 檔,而 .cin 檔內的頭尾段是本人加入的,在 Linux Terminal 使用 gcin2tab,可造成 .gtab 檔。

請注意,原裝的瑲珩大易表格,沒有適當的排序,沒有二碼,沒有兼備不同的打法,很多香港常用字和簡化字從缺。

snik
6
Promote 0 Bookmark 02016-03-20quote  

承蒙網友推蔫,最近在 iOS (即 iPad / iPhone)試用 OkidoKey Lite鍵盤的大易輸入法,

滙入 dayi320150914.cin 取代原來 Apps 的 .cin , 可以打到 UTF8 所有的漢字,

當然包括了香港常用字和日造韓造漢字。

特此鳴謝各先進!

Huki
7
Promote 0 Bookmark 02016-06-27quote  

小弟從高中開始用xcin開始,就有自己自制大易三碼的字碼表

之前也有放在網路上讓人下載

不過後來有人提醒我license的問題,我就移掉了

經過多年維護字數是31209字

若有興趣的人可以拿來用

目前在android的limehd、ios的OkidoKey和chrome os的jsinput上也都能正常使用

 

Huki
8
Promote 0 Bookmark 02016-06-27quote  

另外,再share兩個perl script(年久,但一直可以用),可以大家自行修改

這兩個script餵進去的.cin都是必需只留字根的部份其他的一些設都必需拿掉

four2three.pl -> 將四碼變三碼

filter.pl -> 將兩個.cin合併成一個,重覆的不會加

snik
9
Promote 0 Bookmark 02016-06-28quote  

Huki

小弟從高中開始用xcin開始,就有自己自制大易三碼的字碼表

之前也有放在網路上讓人下載

不過後來有人提醒我license的問題,我就移掉了

經過多年維護字數是31209字

若有興趣的人可以拿來用

目前在android的limehd、ios的OkidoKey和chrome os的jsinput上也都能正常使用

謝謝 Huki 兄的貢獻,如果一年多前看到你的大易字碼表,我也不必亂踫一通,只要拿你的按自己愚見稍為修改排序即可。

大易輸入法是我所見最合乎中文字原意的輸入法,可惜的是很多人不理解,亦因原創商家疏於維護,以致在UTF8通行之後無以為繼。

有關license的問題,我看是不必顧慮,因為我們所作的增添,並無違背原作的原則,而且,最終沒有任何利益的收授。

 

Huki
10
Promote 0 Bookmark 02016-06-29quote  

snik

 

謝謝 Huki 兄的貢獻,如果一年多前看到你的大易字碼表,我也不必亂踫一通,只要拿你的按自己愚見稍為修改排序即可。

大易輸入法是我所見最合乎中文字原意的輸入法,可惜的是很多人不理解,亦因原創商家疏於維護,以致在UTF8通行之後無以為繼。

有關license的問題,我看是不必顧慮,因為我們所作的增添,並無違背原作的原則,而且,最終沒有任何利益的收授。

 

 

其實還蠻開心,還有人和我一樣用大易的

而且對於開發輸入法的作者我都希望能提供我一點點使用上的見解

像之前OkidoKey才剛出時,我有回報給作者一些有關於大易上按鍵使用或是找到的bug

目前幫我家女王匯入了我的.cin,都無痛(但還是比不上limehd來得順手)

另外,這一兩天找了網路上的別人提供的cin再和我的做合併

最後弄出來的是31225字的

有興趣可以再拿來修改

snik
11
Promote 0 Bookmark 02016-06-29quote  

謝謝 Huki。


我是在90年代初學會用大易的,當時在香港用中文電腦的人,大部份只知道倉頡,可能我對文字的意象觀念守舊,學了兩天就非常抗拒,因為輸入的模式很令人困擾,往往同樣字型,卻有不同的解法,而且拆字方式令人費解。


後來接觸大易之後,真是如獲至寶;非但很快上手,經我介紹給同事和友人使用,不下四五十人之多。


在UTF8的系統環境下,目前MS Windows的大易使用應是沒有問題的,只是仍用四碼,可能因為寫軟件的人不是大易使用者,因此亦有五碼的解法;有這種事情,主要仍因大易的原創機構沒有繼續維護。
如果大易的原創機構要告人,MS Windows應是第一被告,雖則MS Windows應獲授權,但改了大易的法則。


本人之所以要找UTF8的大易編碼,因為使用Linux,而且智能手機大行其道,對大易愛好和使用者確是有些困難,當然目前已不是問題了。
只要有機緣來到這網頁,相信會滿意而回。



snik
12
Promote 0 Bookmark 02016-07-02quote  

初步看了Huki兄貼出的.cin檔案,發現有31299行,扣除說明的行數和一些同字異碼的行數,字數應該沒有31299個,具體是多少,沒有細數,也不可能細數,反正已在三萬字上下。

此檔可能是合併而來,排序方面仍須努力。

小問題不掩大製作也。謝謝Huki兄!

在此請問Huki兄,將兩檔合併是如何做的,語法如何?

Huki
13
Promote 0 Bookmark 02016-07-04quote  

snik

初步看了Huki兄貼出的.cin檔案,發現有31299行,扣除說明的行數和一些同字異碼的行數,字數應該沒有31299個,具體是多少,沒有細數,也不可能細數,反正已在三萬字上下。

此檔可能是合併而來,排序方面仍須努力。

小問題不掩大製作也。謝謝Huki兄!

在此請問Huki兄,將兩檔合併是如何做的,語法如何?

這個容易

主要是執行filter.pl這個檔案

$ ./filter.pl compare.cin original.cin > new.cin

compare.cin -> 是指想要合併的cin

original.cin -> 你自己在用的cin

透過filter.pl他會用輸出到console,我們就把他導到new.cin

這樣就可以了

唯一要注意的是,因為我的程式想很單純處理字碼的的部份

所以.cin裡請只保留%chardef begin ~ %chardef end中間的內容

順序的部份的話,

常用的順序應該是沒什麼問題(以前還會用windows的大易三碼確定)

但有些字根本很少打到

可能就沒有辦法確定順序了

snik
14
Promote 0 Bookmark 02016-07-04quote  

謝謝Huki兄!

snik
15
Promote 0 Bookmark 02016-07-08quote  

未知何故,我執行 filter.pl 將兩個 .cin合併時,事前已經把所有%chardef begin  %chardef end等定義句刪去,但跑出來的結果沒有合併,亦會自動產生了一段 .cin 的說明文字,過程中也有不少Error。

有待Huki兄解答。

Huki
16
Promote 0 Bookmark 02016-07-12quote  

snik

未知何故,我執行 filter.pl 將兩個 .cin合併時,事前已經把所有%chardef begin  %chardef end等定義句刪去,但跑出來的結果沒有合併,亦會自動產生了一段 .cin 的說明文字,過程中也有不少Error。

有待Huki兄解答。

 

可能我說的不夠詳細

只能留字根的部份

做完會像附檔這樣

show1013
17 大易輸入法表格(UTF8) 29400+字(含香港常用字、簡化字)(新修訂)
Promote 0 Bookmark 02017-11-04quote  

Hi snik,

謝謝你的表格

可以在 openvanllia 中使用

另外我也找到網路上另一個資料

不知道是不是也是你的

http://dayi-danbo.blogspot.tw/2014/08/blog-post.html

internlin
18
Promote 0 Bookmark 02020-03-14quote  

您好,

我是台灣的朋友。

請問 snik 兄、Huki 兄還在嗎?最近剛好也想整理一下大易的碼表,可能有需要您們,與其他朋友的協助了,非常感謝!

yawnp0426
19
Promote 0 Bookmark 02020-04-07quote  

internlin

您好,
我是台灣的朋友。
請問 snik 兄、Huki 兄還在嗎?最近剛好也想整理一下大易的碼表,可能有需要您們,與其他朋友的協助了,非常感謝!

大易三碼表:ftp://ftp.kh.edu.tw/pub/odp/OXIM/cin_tables/dayi3.cin.gz
大易四碼表:ftp://ftp.kh.edu.tw/pub/odp/OXIM/cin_tables/dayi4.cin.gz

註:
①大易四碼表需要轉換成〔英文小寫〕,可利用 LibreOffice Calc 來做轉換。
②表頭也要修改:
%gen_inp
%ename dayi4
%cname 大易
%selkey 1234567890
%space_style 4
#%keep_key_case
%keyname begin

cht電腦資訊gcingcin分享
adm Find login register
views:65686