cht電腦資訊編輯器Vim
adm Find login register

Vim 計算中文字數

qtnez

joined: 2016-10-14
posted: 84
promoted:
bookmarked:
台灣‧屏東
1subject: Vim 計算中文字數Promote 0 Bookmark 02024-09-30quote  

要計算中文字數,首先要先釐清中文 Unicode 範圍。

漢字本身是在(不含標點符號) CJK Unified Ideographs 這個 block:U+4E00-U+9FFF。

標點符號會有三個部份:第一部份在 CJK Symbols and Punctuation:U+3000-U+303F。第二部份在 Halfwidth and Fullwidth Forms:U+FF00-U+FFEF。第三部份在 General Punctuation:U+2000-U+206F。

好,現在清楚範圍了,接下來是在 Vim 中命令列的操作,是利用取代的方式來計算,取代時 Vim 會顯示取代的結果,也就順便統計字數了。

:%s/[\u4e00-\u9fff\u2000-\u206f\u3000-\u303f\uff00-\uffef]//gn

這樣就會顯示字數的統計。gn 的意思就是只計算不做實際執行。當然,這個統計是不含英數字的,而且 CJK Ext B/C 以上的中文字並不包括在內。

-- 
Do not feed the troll, please.

edited: 3

cht電腦資訊編輯器Vim
adm Find login register
views:123