IanHo
| 1
LibreOffice Calc 5.0本身能否處理 字串/格子/欄 的批次取代? |
0
0 | 2015-10-14 | quote | | |
我遇到著這個問題和我的需求,用文字描述起來可能會有些複雜,但是我也不會做動畫,截圖也不知道該從何擷取起。總之我盡量試著描述看看:
問題版本一: 設定使用環境LO Calc 5.0。試算表檔案的工作表A內,總列數為110000多筆資料,欄位A的屬性設定為"文字",但是文字內容用肉眼看像這樣 5-7A8B ,用dash符號隔開"一位數"和"四位數"這兩組"十六進位"數值,這個110000多列的欄位A,會有一定數量重複數值的列。欄位B也是屬性設定為"文字",每個格子的內容為一組"注音符號",這個110000多列的欄位B,會有一定數量重複注音符號內容的列。 工作表B內,總列數為100000多筆資料,欄位A的內容格式跟工作表A的欄位A完全相同,但是完全"不重複",且格字內的數值相同於工作表A的欄位A有出現過的。 欄位B的的屬性設定為"文字",內容則是Unicode字元碼位的十六進位數值,也是完全不重複。 接下來我需要將工作表B"整合"並"對應"到工作表A(接下來好難敘述),也就是工作表A新增"欄位C"的內容"要是"工作表A欄位A對應到工作表B欄位A,再對應到工作表B欄位B的那組Unicode字元碼位("欄位C"的屬性需設定為"文字")。 以上描述中的"需要將工作表B"整合"並"對應"到工作表A"這個動作流程,在目前的LO Calc 5.0"有沒有辦法?"在"不使用"額外的script的前提下,"只使用"LO Calc 5.0本身提供的既有的圖形介面操作功能,來完成兩個工作表的整合與對應???
問題版本二: 下載CnsPhonetic2014-04.zip,解壓縮檔案,然後用進階純文字編輯器打開文件檔,裏頭有個段落是在描述操作Windows軟體EMeditor的流程,該段落所描述的內容,現階段有沒有辦法改用"LO Calc 5.0本身的全圖形介面操作流程"來"完全替代"??? https://www.openfoundry.org/of/projects/1603/download
edited: 1
|
|
guest |
不行。去學SQL或其它「程式語言」來做。
|
請問這裡所謂的"去學SQL",我以下的解讀是否合理? 我安裝了MySQL和它的GUI fronted:mysql workbench各自的最新標準版, 然後只要我有辦法搞懂mysql workbench是在搞什麼, 我就可以把前文所述的那些試算表內的數個欄位的十幾萬筆資料分別匯入 mysql workbench,然後在mysql workbench那邊剪剪貼貼匯入匯出, 最後我需要的"欄位C"的全部內容就可以在mysql workbench裏頭被匯出成一份純文字資料??? 這樣的解讀是否合理??? 如果"是"的話, 我看了看mysql workbench的內容,全英文,對我來說"是天書"。 真的那麼慘嗎? 除了MsWindows平台的進階純文字編輯器之外, 好像非MsWindows平台的其他桌面系統,例如MacOSX、Linux GNOME, 現階段"真的都沒有""圖形介面的"進階純文字編輯器可以做這樣的大量字串批次取代的處理了嗎???
|
|
IanHo |
請問這裡所謂的"去學SQL",我以下的解讀是否合理? 我安裝了MySQL和它的GUI fronted:mysql workbench各自的最新標準版, 然後只要我有辦法搞懂mysql workbench是在搞什麼, 我就可以把前文所述的那些試算表內的數個欄位的十幾萬筆資料分別匯入 mysql workbench,然後在mysql workbench那邊剪剪貼貼匯入匯出, 最後我需要的"欄位C"的全部內容就可以在mysql workbench裏頭被匯出成一份純文字資料??? 這樣的解讀是否合理??? 如果"是"的話, 我看了看mysql workbench的內容,全英文,對我來說"是天書"。 真的那麼慘嗎? 除了MsWindows平台的進階純文字編輯器之外, 好像非MsWindows平台的其他桌面系統,例如MacOSX、Linux GNOME, 現階段"真的都沒有""圖形介面的"進階純文字編輯器可以做這樣的大量字串批次取代的處理了嗎???
|
沒有。不會有第二個人寫一個軟體來完成複雜且沒市場的工作,除了你自己。
|
企鵝狂 |
自己不想寫可找人寫啊
或是找工讀生慢慢剪貼
|
guest |
沒有。不會有第二個人寫一個軟體來完成複雜且沒市場的工作,除了你自己。
|
回憶一個好一段時間以前,我在台灣的MacOSX討論區,問MacOSX圖形介面unicode字元轉碼這類問題的一個經歷,我當時的提問是需要一個unicode"批次大量"轉碼的MacOSX原生全圖形介面操作流程工具,當時我自己怎麼下關鍵字搜尋都沒有找到符合我需求的那種功能的工具軟體,PO文發問之後,出現了一堆類似 #4企鵝狂 那類的酸文回覆,也有人回覆說MaCOSX平台"沒有人"會需要我提問所需要的那種類型的圖形介面工具軟體。 偶然的,某位網友的回覆中的某個關鍵字眼,是我以前想破頭都沒有想到的,然後我土法煉鋼的找到並試出了,原來unicodechecker.app這隻免費圖形工具的某個細節操作,其實是可以做到我提問所需求的操作流程的,於是我就靠那支程式解決了我的問題了。 原來,我的需求早就有人做出來了,還是免費圖形工具。 對於那些說"MaCOSX平台"沒有人"會需要我提問所需要的那種類型的圖形介面工具軟體。"的酸文回覆,也只好一笑置之了。
|
或者這樣問,LO 5.0 Calc的函示精靈裏頭的一拖拉庫函示,有沒有辦法組合出我需要的功能??? 我找到一個replace函式,但是這個函示的功能還不夠用。有沒有其他函示可以跟replace函式組合,然後組合出我需要的功能??? 我自己試不出所以然來。
|
guest | 8
LibreOffice Calc 5.0本身能否處理 字串/格子/欄 的批次取代? |
0
0 | 2015-10-17 | quote | | |
IanHo |
我遇到著這個問題和我的需求,用文字描述起來可能會有些複雜,但是我也不會做動畫,截圖也不知道該從何擷取起。總之我盡量試著描述看看:
問題版本一: 設定使用環境LO Calc 5.0。試算表檔案的工作表A內,總列數為110000多筆資料,欄位A的屬性設定為"文字",但是文字內容用肉眼看像這樣 5-7A8B ,用dash符號隔開"一位數"和"四位數"這兩組"十六進位"數值,這個110000多列的欄位A,會有一定數量重複數值的列。欄位B也是屬性設定為"文字",每個格子的內容為一組"注音符號",這個110000多列的欄位B,會有一定數量重複注音符號內容的列。 工作表B內,總列數為100000多筆資料,欄位A的內容格式跟工作表A的欄位A完全相同,但是完全"不重複",且格字內的數值相同於工作表A的欄位A有出現過的。 欄位B的的屬性設定為"文字",內容則是Unicode字元碼位的十六進位數值,也是完全不重複。 接下來我需要將工作表B"整合"並"對應"到工作表A(接下來好難敘述),也就是工作表A新增"欄位C"的內容"要是"工作表A欄位A對應到工作表B欄位A,再對應到工作表B欄位B的那組Unicode字元碼位("欄位C"的屬性需設定為"文字")。 以上描述中的"需要將工作表B"整合"並"對應"到工作表A"這個動作流程,在目前的LO Calc 5.0"有沒有辦法?"在"不使用"額外的script的前提下,"只使用"LO Calc 5.0本身提供的既有的圖形介面操作功能,來完成兩個工作表的整合與對應???
問題版本二: 下載CnsPhonetic2014-04.zip,解壓縮檔案,然後用進階純文字編輯器打開文件檔,裏頭有個段落是在描述操作Windows軟體EMeditor的流程,該段落所描述的內容,現階段有沒有辦法改用"LO Calc 5.0本身的全圖形介面操作流程"來"完全替代"??? https://www.openfoundry.org/of/projects/1603/download
|
恕我愚昧,非常難接受你的表達能力……看了很久才好像看懂。
你看看這張圖是不是你要的。 http://imgur.com/rPopZXU
|
IanHo
| 9
LibreOffice Calc 5.0本身能否處理 字串/格子/欄 的批次取代? |
0
0 | 2015-10-18 | quote | | |
guest |
恕我愚昧,非常難接受你的表達能力……看了很久才好像看懂。
你看看這張圖是不是你要的。 http://imgur.com/rPopZXU
|
哇~~~ 我覺得很有機會這就是我需要的emEditor替代解決方案的其中一個步驟, 不過我還需要花些時間消化一下這張截圖和LO輔助說明文件內的VLOOKUP段落, 要來交叉比對,然後套用到11萬筆資料來試試看,拜託圖先不要刪,先擺在那。
|
我摸索老半天,我設定的公式像這樣
欄位C
=VLOOKUP(A1:A114366,D1:E107174,2)
可是欄位C出來的數值,對應的結果還是有問題的。
我在想我要不要把編製一半的ODS檔案附件貼出來呢???
(我提問需求是資料處理的"正確過程",我"沒有"需要結果。)
還在想問題出在哪裡???
|
狀況二:
把公式改成
=VLOOKUP(A1:A114366,D1:E107174,2,0)
函示精靈 視窗 預覽的“結果“: 2233D
符合A1需要對應的數值,可是在執行後 滑鼠游標彩球狂轉十分鐘還是沒有回復正常,
我的筆電記憶體有16GB,應該很夠才是啊~~~
問題又出在哪裡了???
|
決定賭它一把,跟它耗時間,滑鼠游標彩球轉了半個小時之後,終於轉完了~~~
看樣子機會增大了,我期望的“只使用全圖形介面的LO CALC+進階純文字編輯器”,
有機會完成整個檔案編製過程。繼續嘗試中~~~
另外,奇怪的是,編輯檔案的軟硬體環境為 intel C2D 2.4Ghz + 16GB RAM + MacOSX 10.10 + LO 5.0 Calc + TextWrangler。明明RAM還剩一大堆,為什麼彩球還要狂轉半個小時???
同一台筆電,我也沒有同時在跑其它運算,沒有在下載檔案,也沒有在聽歌看影片。只不過一口氣轉換十一萬多個儲存格而已。
|
一些延伸的狀況~~~ 根據ID:guest網友提供的關鍵字圖文,我摸索試出了 公式 =VLOOKUP(A1:A114366,D1:E107174,2,0) 其實是有結果的。 可是這卻是我得跟電腦比耐心,讓滑鼠游標彩球狂轉40分鐘以上的成果, 也就是看似當在那邊四十分鐘後,libreoffice居然又可操作了。 而欄位也有數值出來了。我想破頭想不出耗時四十分鐘以上的癥結點在哪裡, 有什麼樣的現成的解決方法???最好是軟體設定參數改一改就解決這樣。 我在兩台主機上測試 一: MacBook intel c2d 2.4Ghz, 16GB RAM,硬碟:7200轉。 MacOSX 10.10 , LO 5.0 CALC 二: MacBook intel c2d 2.4Ghz, 6GB RAM,硬碟:7200轉。 debian 8 , LO 4.4 CALC (來自debian套件庫)
在跑公式的當下,主記憶體剩餘量都有數個GB,也"沒有"同時跑其他有的沒有的運算。 為甚麼這兩個環境在跑 公式 =VLOOKUP(A1:A114366,D1:E107174,2,0) 都會卡在那邊至少四十分鐘以上,我得跟它賭,跟它比耐心。 硬體效能應該沒這麼差吧??? 我又不是在跑3D運算和播放4K影片。 頂多就是同樣的公式(也只有"一個"主要式子),跑個十一萬多次而已。 有沒有可能??? 在LO的偏好設定裡頭調整一些什麼, 可以藉此加強 LO+硬體 的整個運算效能??? 讓LO軟體本身的效能最佳化,也榨出CPU的運算效能這樣, 在這四十分鐘內,我去查看系統資源,CPU使用率也"沒有"三不五時就90~100%啊???
句子修正,再仔細看,兩顆核心, 其中一顆核心 三不五時百分之百,另一顆則沒有(看起來很閒)。
edited: 1
|
阿~我想到一個提問內容了,LibreOffice4.4/5.0的偏好設定裡頭, 有沒有提供什麼參數設定,可以讓LibreOffice把CPU的兩個核心都拿來用???
|
十萬項找尋一項,並進行十萬次,若沒有特別的演算法硬掃當然很慢。
如果上述動作在程式裡沒有分工,CPU不管有幾核都一樣慢。
IanHo |
一些延伸的狀況~~~ 根據ID:guest網友提供的關鍵字圖文,我摸索試出了 公式 =VLOOKUP(A1:A114366,D1:E107174,2,0) 其實是有結果的。 可是這卻是我得跟電腦比耐心,讓滑鼠游標彩球狂轉40分鐘以上的成果, 也就是看似當在那邊四十分鐘後,libreoffice居然又可操作了。 而欄位也有數值出來了。我想破頭想不出耗時四十分鐘以上的癥結點在哪裡, 有什麼樣的現成的解決方法???最好是軟體設定參數改一改就解決這樣。 我在兩台主機上測試 一: MacBook intel c2d 2.4Ghz, 16GB RAM,硬碟:7200轉。 MacOSX 10.10 , LO 5.0 CALC 二: MacBook intel c2d 2.4Ghz, 6GB RAM,硬碟:7200轉。 debian 8 , LO 4.4 CALC (來自debian套件庫)
在跑公式的當下,主記憶體剩餘量都有數個GB,也"沒有"同時跑其他有的沒有的運算。 為甚麼這兩個環境在跑 公式 =VLOOKUP(A1:A114366,D1:E107174,2,0) 都會卡在那邊至少四十分鐘以上,我得跟它賭,跟它比耐心。 硬體效能應該沒這麼差吧??? 我又不是在跑3D運算和播放4K影片。 頂多就是同樣的公式(也只有"一個"主要式子),跑個十一萬多次而已。 有沒有可能??? 在LO的偏好設定裡頭調整一些什麼, 可以藉此加強 LO+硬體 的整個運算效能??? 讓LO軟體本身的效能最佳化,也榨出CPU的運算效能這樣, 在這四十分鐘內,我去查看系統資源,CPU使用率也"沒有"三不五時就90~100%啊???
句子修正,再仔細看,兩顆核心, 其中一顆核心 三不五時百分之百,另一顆則沒有(看起來很閒)。
|
|
guest |
十萬項找尋一項,並進行十萬次,若沒有特別的演算法硬掃當然很慢。
如果上述動作在程式裡沒有分工,CPU不管有幾核都一樣慢。
|
請問這樣是不是可以解讀成,這表示LO"本身"的 運算/搜尋/演算 效能,其實還可以更加強???
所以"慢"的問題,其實是出在LO"本身"???
edited: 1
|
目前的進度是: 搭配以下三個函示 VLOOKUP(A1:A114366,D1:E107174,2,0) HEX2DEC(C1:C114366) UNICHAR(D1:D114366)
甚至還挪到 linux gnome Gnumeric 來處理部分 (LO CALC會突然莫名其妙的無法顯示字元,明明再字型下拉清單中,"對應的字形檔"是安裝好且有出現的), 再搭配進階純文字編輯器(Mac環境我用的是TextWrangler.app), 交互使用。來來回回剪剪貼貼匯入匯出,我終於做出了。 十一多萬列大列表 工作表ㄧ 欄位A:全字庫原廠的注音符號列表 欄位B:對應的字元 (搭配全字庫全套字型) 欄位C:UNICHAR(儲存格格式是"文字")
目前為止的作業進度過程。 1.在"非"MsWindows平台作業。 2.全部用"現成的"免費或自由應用軟體,全圖形介面操作流程。 希望這兩個條件可以持續到真正需要的輸出的純文字表格檔做出為止。
接下來的步驟又出現問題了,MacOSX內建LastResort.ttf 這個字型檔是把每個unicode block以一個圖示來替代。 LO會抓到這個字型檔,並顯示其圖示。但是在LO字型下拉清單 卻"不會"顯示這個LastResort(我查過LastResort.ttf裏頭的檔頭資訊了) 然後MacOSX內建的字體簿裡頭,也"沒有"列出LastResort。 我找不出方法在LO和字體簿裏頭"停用"LastResort (覺得刪除檔案有些危險)。 如果可以"停用"LastResort,那就"或許"可以在LO的字形替代清單裡頭設定好 全字庫全套字型,然後 欄位B:對應的字元 (搭配全字庫全套字型) 就可以完全顯示了~~~
edited: 1
|
老梗問題再問一次。有問有機會。 我需要將十幾萬筆unicode碼位批次轉成unicode字元,我的"需求"是整個操作流程為全圖形介面(會使用到滑鼠右鍵)。MsWindow平台有Babelmap.exe+BabelPad.exe搭配使用。 MacOSX平台有UnicodeChecker.app可以使用。 在有聯網的條件下, 網頁模式有 https://r12a.github.io/apps/conversion/ 可以使用。 然後接下來在Debian 8 gnome+官方套件庫的環境條件下(這裏先加個條件,無視LibreOffice Calc和Gnumeric,因為LO Calc和Gnumeric 會有一些奇怪的狀況導致顯示不正常或著操作不順利)。「還有沒有」其他「原生的」「現成已經有的」「全圖形介面操作的(會用到滑鼠右鍵)」「gtk風格的(for gnome)」的linux應用程式,可以做到把十幾萬筆unicode碼位批次轉成unicode字元???而且要支援到 unicode 8.0 版。
|
在google關鍵字的時候,出現了自己曾經的提問貼文, 感謝當時網友提供關鍵字串"VLOOKUP", 這個函式就是我編輯文件過程中所需要的一個功能, 很可惜的是LibreOffice內建的"VLOOKUP"運算效能不彰,十一萬筆資料需要消耗十幾個小時才會算完。 運氣好的是,後來我發現"gnumeric"也有提供"VLOOKUP"函式,在同一台硬體,同樣十一萬筆資料, 而且還是在虛擬機器之中,卻不超過十分鐘就算完了。
所以不需要學程式語言和SQL,也不需要找工讀生慢慢剪貼,也早就有人寫軟體來完成複雜且沒市場的工作, "gnumeric"的"VLOOKUP"函式解決了我編輯試算表文件過程中的一個問題。
|
我又遭遇了一個類似的問題,編輯環境是在 LO Calc v7.2 for Mac, 同樣也是盡量嘗試用文字描述,編輯成果的範例檔案在這裡, https://sites.google.com/site/ianho7979/InputMethodTables 檔案編輯的過程中,在其中的 一欄11萬列 之中我有需要做類似像這樣的取代:
ㄅ|ㄆ|ㄇ|ㄈ|ㄉ|ㄊ|ㄋ|ㄌ|ˇ|ㄍ|ㄎ|ㄏ|ˋ|ㄐ|ㄑ|ㄒ|ㄓ|ㄔ|ㄕ|ㄖ|ˊ|ㄗ|ㄘ|ㄙ|˙|ㄧ|ㄨ|ㄩ|ㄚ|ㄛ|ㄜ|ㄝ|ㄞ|ㄟ|ㄠ|ㄡ|ㄢ|ㄣ|ㄤ|ㄥ|ㄦ 1|q|a|z|2|w|s|x|3|e|d|c|4|r|f|v|5|t|g|b|6|y|h|n|7|u|j|m|8|i|k|,|9|o|l|.|0|p|;|/|-
原本的每一列(每一格)內都是一組注音符號,我要把注音符號全部換成qwerty鍵位。 也就是要把ㄅ置換成1、ㄆ置換成q,以此類推。 當我選取好該欄位之後,LO Calc v7.2 for Mac的尋找和取代視窗內的選項,我可以勾選那些選項? 以及尋找和取代兩個匡,我可以填入什麼內容? 來做到把這四十一個字元做一次性的批次取代? 畢竟連續操作四十一次尋找和取代的動作,還是有些耗時。
|