| adm | Find | login register |
qtnez joined: 2016-10-14 posted: 84 promoted: bookmarked: 台灣‧屏東 |
要計算中文字數,首先要先釐清中文 Unicode 範圍。 漢字本身是在(不含標點符號) CJK Unified Ideographs 這個 block:U+4E00-U+9FFF。 標點符號會有三個部份:第一部份在 CJK Symbols and Punctuation:U+3000-U+303F。第二部份在 Halfwidth and Fullwidth Forms:U+FF00-U+FFEF。第三部份在 General Punctuation:U+2000-U+206F。 好,現在清楚範圍了,接下來是在 Vim 中命令列的操作,是利用取代的方式來計算,取代時 Vim 會顯示取代的結果,也就順便統計字數了。 :%s/[\u4e00-\u9fff\u2000-\u206f\u3000-\u303f\uff00-\uffef]//gn 這樣就會顯示字數的統計。gn 的意思就是只計算不做實際執行。當然,這個統計是不含英數字的,而且 CJK Ext B/C 以上的中文字並不包括在內。 -- edited: 3
|
| adm | Find | login register |