| |||||||
adm | Find | login register |
我手邊有一個純文字檔案,裏頭有十一萬列的unicode編碼,我需要使用圖形介面的離線單機軟體, 將這十一萬列的unicode編碼,盡可能的一次性的轉換成以字元呈現,而這十一萬列的unicode編碼, | |||||||||||||
應該是說 UTF-16 → UTF-8 ? iconv -f UTF-16 -t UTF-8 inputfile -o output_file 常用可以寫成 shell script,這樣用起來比 gui 的介面更快。 edited: 1
| |||||||||||||
我嘗試用文字來描述一個例子 在全圖形介面操作模式下~ 我要將 4E09 或 \u4E09 或 U+4E09 轉換成漢字 三 然而我需要一次性轉換的那個數值不只 4E09 ,還有其他數值, 一組數值在一列, 整個純文字檔案中,有上萬列的這樣的數值,轉換完畢再開啟純文字檔案,前後排序必須不變~ 所以會變成一個漢字在一列,然後會有上萬列這樣.
edited: 1
| |||||||||||||
是有理解啦, | |||||||||||||
如果不知道如何取代的話, | |||||||||||||
注意,以上假設每行數值都是4個16進位數字。 | |||||||||||||
我手邊有一個字形檔案, 經過 U+2FA1B 鼖 CJK COMPATIBILITY IDEOGRAPH-2FA1B 這樣的資訊中有一個重點,這是一個五位數的unicode編碼數值, 再來轉換MACOSX平台,UnicodeChecker軟體中有一項子功能, 結果同樣發生了會轉換成 想要google,嘗試了一些關鍵字,卻完全沒有頭緒,到底該怎麼辦呢? 有沒有什麼圖形介面的軟體,可以辨識五位數的 \u2FA1B 或著 U+2FA1B edited: 1
| |||||||||||||
改成以下就沒有幾位數的問題了: firefox已測試無誤。 | |||||||||||||
謝謝提供資訊~我先框起來再摸索試試看~ | |||||||||||||
原本我很堅持想要尋找單機模式的圖形介面工具軟體來做\uXXXXX轉文字的作業流程~ 但是之前找到的那兩款都是有問題的無法正確轉換五位數~現在還是找不到~只好放棄了~ 不得不低頭~只好將就使用線上軟體了例如找到了這個~ http://rishida.net/tools/conversion/ 沒想到這款軟體除了有支援五位數~還能撐得住一次輸入五萬筆以上的資料~ 連Supplementary Private Use Area-A區都有轉出來~ 可惜就是得在連網狀態下使用~ | |||||||||||||
你實在有點......莫名其妙的固執。 這樣吧,在firefox裏面加入書籤應該還能接受吧? 隨便把某個網頁加入書籤, 修改書籤網址為以下字串: javascript:zz=document.getElementsByTagName("body");yy=zz[0].innerHTML;yy=yy.replace(/%5C%5Cu([0-9A-F]*)/g,"%5C%5Cu$1%20&#x$1;");zz[0].innerHTML=yy;void(0); 用firefox選單->開新分頁->開啟檔案->所有檔案 選那個文字檔(這次別改成.html了) 然後在此頁面下使用之前加入的書籤即可。 用\u2FA1B複製6萬次來測試沒問題。 | |||||||||||||
忘了說,原始資料要用\u2FA1B型式的。 | |||||||||||||
U+2FA1B型式的用: javascript:zz=document.getElementsByTagName("body");yy=zz[0].innerHTML;yy=yy.replace(/U%5C+([0-9A-F]*)/g,"U%5C+$1%20&#x$1;");zz[0].innerHTML=yy;void(0); 2FA1B型式的用: javascript:zz=document.getElementsByTagName("body");yy=zz[0].innerHTML;yy=yy.replace(/([0-9A-F]*)%5Cn/g,"$1%20&#x$1;%5Cn");zz[0].innerHTML=yy;void(0); |
| |||||||
adm | Find | login register |