| |||||||
adm | Find | login register |
如果你的字型顯示不出來,或顯示不對,請參考以下的圖檔:
圖檔上頭的是「舃」(U+8203,標題的第三字),圖檔下面的是「舄」(U+8204,標題的第一個字),請注意喲!Unicode 在自打嘴巴,因為這兩個字是同一個字,只不過一個是古體字(含康熙字典寫法),一個是今體字,算是俗寫字,但被標準化後變成正體字,反而古體字變成是異體字。請參考: http://140.111.1.40/yitib/frb/frb03741.htm
Unicode 這樣搞會造成什麼困擾呢?例如,我使用康熙字寫法的字型,本來 U+8204 就是古體字,而一般的新字型則變成不是古體字,還得 U+8203 才是古體字,這是違反 Unicode 收字原則的。 | |||||||||||||
您的這種看法並不正確。 康熙字典中的古字概念來自《說文解字》,典型的就是《康熙字典》。 說文解字中的古字,說文稱爲“古文”,指得是秦朝以前的文字,但不包括大篆(說文稱籀文)。 而“今文”,實際是指秦漢時的“篆文(小篆)”。“小篆”,在漢代一直是官方的標準的文字。隸書後來才進入官方。 但我不知道,說文有沒有“今文”這樣一個詞彙。
《康熙字典》中,《說文解字》的古文、小篆、籀文全部宋體化了。但是,這個關係沒有變。 古文、籀文、篆文,如果你是從康熙字典看到,它們都是獨立的漢字。 康熙字典中的正體、俗體、古文、籀文等等,皆是獨立漢字。
新字形,和國字標準字體,與康熙字典舊字形,屬於替換關係,不應當重復編碼。有如英文Tahoma 與 Comic Sans MS。 而簡體字和日本簡體字(日文:新字體),屬於衍生關係,理應重復編碼。
可Unicode把這些關係統統搞亂了。果正兄可以去書同文公司的網頁去下載上任IRG負責人張軸材的錄音。 他自己說,做這個工作時,他並不懂漢字,所以工作進行很不順利 。最後採用了一個以形編碼的方案。
尤其,它們不懂日文。日本也沒有個7万多字的Unicode font。 因爲,很多在中文角度是新舊字形的字,但在日文角度是繁簡衍生字。 靑=青 在中文是新舊替換關係,在日文是繁簡衍生關係。
| |||||||||||||
抱歉,我不太能抓到你的重點。 如果是說我用「古體、今體」這種詞,那我錯的可能性很大,因為我對文字學並不瞭解,我不把他當成專有名詞用,只是一般認知上的用法。我想強調的是,如你所說的「替換關係」的時候,不該重複編碼,否則如隸書的許多字,他的筆畫擺放位置和楷書並不一樣,但我們不能把他視為不同的字而重複編碼。 這兩個字如果重複編碼,那麼,是否「寫、瀉」等這類字都要重複去編碼呢?
至於角度是要從我們或者使用漢字的國家來出發,這就很有討論的空間了。我們的文化,當然是由我們自己決定的呀! | |||||||||||||
日文,繁體字是叫做正字體、舊字體、康熙字典體的,簡體字叫做新字體。 但日文的“字體”,意思不同中文“字體”,而是中文“字形”的意思。 因爲日本文字改革之前,的確和中國是書同文。印刷遵循康熙字典、手寫遵循楷書、文章寫文言。 只是後來進行了文字改革。也是文字簡化。
民國政府也是制定過簡化方案,只是因爲戰爭,沒能進行開。後來在文化政治上大陸這邊進行文化革命、臺灣這邊則進行文化復興。 文字也成了政治運動,簡化行爲也看不見聽不到了。 簡體字、繁體字、異體字,其實都是大陸這邊的新名詞。傳統的叫法,上層已提過。 “正體”也的確是受了大陸這邊“繁體”的刺激產生的新名詞。傳統上,都叫正字。
還有一個國家未提到,其實他們也進行過簡化,只是後來連漢字都不用了。
| |||||||||||||
zh67781530 全篇寫得莫名其妙,所以沒啥好討論的。 要討論字型之前,先學好中文吧。 | |||||||||||||
真的是非常不好意思,我仍然抓不到你的重點。這樣好了,你認為我哪段話是不對的,把他指明,這樣好嗎?因為我實在不知道你想表達的重點。
繁體、正體只是習慣用語,我個人會用繁體字相對於簡體字(含簡化字)是因為正體字是異體字的相對詞,不能拿來用,否則會產生誤解,這類的討論是經年累月,老實說我個人已經累了,這點請見諒,只要你知道我繁體字指的是什麼就可以了,能溝通比較重要,至於這個詞是誰創的就不重要了。就像中醫 vs. 漢醫之稱,請不要在這種地方打轉,真的很費時間又不會有結論出來。 edited: 1
| |||||||||||||
| |||||||||||||
請查一康熙字典,他用的是「舃」(中間有一橫),再請查一下目前教育部字型,他用的是「舄」(中間沒有一橫)。那麼你的意思是說這不是替換關係?而是古今文兩個獨立字。 你著重在古今文,這樣推論可能是對的。但我著重在字的寫法,他不應視為不同的字,他只是像隸書一樣的不同寫法罷了。 至於什麼「類推古字」,這個我不猜楚,我只知道「寫、瀉」的部件來源現在變成有兩種不同的變化,但卻偏偏要視為同一個字(事實上目前的字型,兩種造字都有),而來源卻又要視為兩個不同的獨立字,這在邏輯上是不通的。 我查商務版的詞源,這兩個字,其中一個只是俗寫。 edited: 3
| |||||||||||||
哈哈,如果真正懂中文的話,這個帖子就沒有存在的必要了。 我的第二篇回復,並不是回復果正兄你的,是因爲第一篇的話沒有講完,又做不了修改。 古人的思維,不是你能用Standerdization、Font、Glyph去分析的出的。Unicode也是走的這個道。這是西文的概念。 這裡面有文人的思維,也有工匠的思維。我們的傳統宋体字(舊字形),就是工匠們的傑作。文人不拿刀子,非說宋体就是楷體,不過這印刷的“楷體”和手寫的“楷體”,Glyph就是不一樣的。 文人寫小篆font,就是小篆glyph,大篆font,就是大篆glyph。匠人寫的小篆、大篆、古文都是一個font,只是glyph不一樣。 我說Unicode認同原則是錯誤的,也可以說是另一種的“文人的思維”。而IRG的以形編碼,就是工匠的思維。
| |||||||||||||
傳統的文字學: 一脈相承,篆文(小篆)——隸書——楷書 這一脈,可以說是正體。 剩下的古文(甲古文、金文)、籀文(大篆),俗字。 中國文字在秦朝斷過一次,當時很多典籍丟失。而小篆的文字可能在漢代能看到最多。並且有許慎的做說文解字一書,祥解小篆。 所以漢就以小篆為官方文字。而古文、籀文因爲資料太少,不像今天考古挖掘,挖出了很多資料。沒有作爲正體,但作爲文字的參考用。整個東漢時期,全都在做小學工作,就是文字的考古。
康熙字典文字學,是把所有,都以宋体font和宋体glyph來呈現,但是以楷書為基礎。 康熙字典中,如果按照 嚴格的standerdzition、font、glyph ,古文不應該成宋体字font,而是古文真正的font & glyph。 今文則是楷書font & glyph。
你可以這樣去想象康熙字典。所有的字,都是楷書寫的,沒有任何的宋體字。 有古文、籀文的font & glyph 作爲羅列,也有楷書形態化的字。 有些楷書寫的字,它指明是俗字。 而我們的正體字,是除去、古文、籀文、以及俗字剩下的大部分。這是從唐代一直沿用到中華民國。
| |||||||||||||
教育部是沒錯的。 俗字對應于今天的概念是異體字。 只是這個論壇不好修改發言。
| |||||||||||||
我詳細比對了新舊字型及康熙字典,沒錯「寫、瀉」用的是「舄」(沒一橫)而不是「舃」(有一橫)。
但所謂的「正體」,「繁體」的使用,習慣就成了。如果二分法「正體」以外稱為異體字,那麼在台灣的話,連大陸的繁體字有好多都會變成不是正體字。 而且這個詞是誰開始用的並不重要,因為我從小就是這樣用,學校老師也是這樣教(呃,我是反共的喔!)。
使用「繁體字」這個詞,只是在說明,我們不使用簡體(簡化)字的系統的總代稱,是相對於使用簡化字系統而言的(例如目前的大陸及日本,雖然他們的繁體字也是國家標準),這和誰在使用的名詞無關,就像我所謂的「中醫」指的是中庸醫學,而不是中國醫學一樣。這當然不是什麼學術上的用語,只是一般平常習慣上的用法。所以,我個人是不可能改用「正體字」這種名詞的,因為他不能表達我所想表達的意思。
ps. 經過別人 reply 的 post 除版主外不能更改。這是在防止討論上因修改而造成混亂,所以,只好麻煩事後補充了。 edited: 2
| |||||||||||||
果正兄提到(含康熙字典寫法),我以爲此圖,是來自康熙字典,也沒有看link。 如果是來自康熙字典,就我所解釋的概念問題。康熙字典的古文,並不等於正體。 沒有說到它是古文的字,才是正體。
剛才去看了一下鏈接,才得知此圖來自正字通。 古代的印刷體,是沒有什麽規範化的,一本書和一本書都會有差異。 而讀書人並不以印刷體為規範,以手寫的楷書為準。康熙字典的印刷体字形也不是有很重要意義。 我們教育部的國字標準字體也是以楷書為基礎,所以要查證這個問題,要查的不是異體字字典。而是楷書書法字帖。
印刷字體的正字,和楷書字體的正字,就如篆書、隸書、楷書一樣,字形是不一樣的。 比如,傳統的,正體字“爲”的康熙字典印刷體是“爲”,楷書體是“[font=DFKai-SB]為[/font]”的字形。
| |||||||||||||
至於要用文人思維還是工匠思維,這個是大難題。使用工匠思維會比較容易處理,文人思維的話,將會有文人之間的衝突,會把事情懸在那裡不動,所以,這真的是大難題,可能只好各自退讓一步吧!不然事情將會無法進行。
比較頭疼的是 Unicode 對於異體字的認定和我們的認定不太一樣,所以,收錄的時候會產生以形去辨識的規則,從這點來看的話,我個人是覺得 Unicode 對漢字的處理變得很混亂,而且幾乎不可能完全正確,日韓提出來的分類和我們的一定會有衝突在。 | |||||||||||||
這個有一橫的「舃」的確是康熙字典的正體字,不是古字,也不是俗字。而康熙字典並不收沒一橫的「舄」字。 所以,我一開始才會認為這兩個字是可以替換的,不應該重複編碼。
ps. 這篇本來是要整理在我的 blog,但因其他事擔誤了,所以,資料查詢上並沒有很精確。 | |||||||||||||
我明確的表達一下我的看法好了。我是認為像『為』這個字不應該因為 stroke 不同而重複編碼。因為他們其實是同一個字。否則會編不勝編。像目前的 Unicode 漢字區就是亂烘烘的。
需要不同寫法的字的時候,應該使用不同的字型,這本就很合理,宋體用宋體的字型,隸書用隸書的字型,他們的「造形」本來就不一樣。 | |||||||||||||
正字通和康熙字典還不能相提並論。其實是我沒搞對。
即便是舊字形的印刷體,每一本辭典要拿出來單獨討論,因爲過去沒有什麽標準。 正字通要從正字通裏去說,但如果你想考證教育部的標準國字字形是否合理。我前面貼得三本書法字帖足矣。
不管匠人的思維,還是文人的思維,其實只要不衝突就好。但Unicode沒有做好這個工作。 其實這個工作,非常的好做。漢字大可分爲,傳統漢字(康熙字典為代表、正字、俗字、古文、籀文),中國簡體字、日本簡體字、日本國字、韓國國字、越南喃字、另有少量方塊壯字。 日本僅僅特殊在,它們把簡體字不看作衍生字,而看作替代字。這點與大陸簡體字不同。不過,爲了方便日文的繁簡轉換,只要給簡體字單獨編碼就好。日本簡體字僅僅1000來字。 字形方面,大陸新字形、臺灣新字形都能直接對應于傳統的康熙字典印刷體舊字形,日韓是沿用康熙字典印刷體舊字形。 而Unicode,卻還要依形編碼。把大陸新字形、臺灣新字形、日韓康熙字典印刷體字形,放在一起。然後依據不倫不類的漢字認同原則編碼。
至於日本方面,因爲日本對於簡體字的態度。他們沒有宏觀考慮。 擧個例子,把“漢”,拷貝到notepad,然後切換至MS Mincho。顯示的是日本簡體字。但是在中文字體裏顯示的是正體字。 而對應的日本正體字,字形也與“漢”一樣,跑到CJK兼容區了。 因此一篇正體的文章,若要利用Unicode編碼,針對不同地區用戶。必須做成大陸版,港臺版、日本版、甚至韓國版。
| |||||||||||||
沒錯,基本上我的看法和你 #18 的回應是相通的。 我找到了一個特例:
[edt1023@lgj ~]$ charucs 潟 澙
Unicode 真的就幫這兩個字編了不同的編碼。 | |||||||||||||
日文中“爲”是正體,“為”是簡體。 異體字也可能有必要。
但在Unicode,“為”除了日本來源、還有大陸和臺灣的新字形來源。 Unicode似乎不願意改變他們的態度,我也跟IRG去過信。
如果你手頭有日本大漢和辭典,可以去查它。大漢和可以能說是pc font細明体的爸爸,而康熙字典是爺爺。 | |||||||||||||
| |||||||||||||
http://www.unihan.com.cn/Papers.html
| |||||||||||||
正繁之爭的問題,我之前也有思考過,也看過使用正體字說帖,但不認同。 依據說帖中的說法,中國傳下來的文字,可分為正體字、異體字,異體字又可分為俗體字與簡體字(這裡指的不是現在中國用的簡體字,而是古早就已被民間減省筆劃的繁體字)。問題是,現在我們社會上常用的文字,並不全然屬於正體字,要用正體字來代表台灣使用的文字系統,我認為是不夠有說服力的,用「繁體字」來代表,會適合得多。如果說,有人認為正體字是中華文化的精華,所以用傳統的正體字來代稱整個台灣目前使用的文字系統,我還勉強可接受這種邏輯,但,這會造成「正體字」可用來代表目前台灣使用的文字系統,也可代表傳統正字所代表的意義,會有 LGJ 前面提過的「意義上的混淆」,所以,我不認為這是合理的。而且,再質疑一下,不是正體字,屬於民間簡化過、通用於民間的字,就不是精華,上不了抬面?這也是很有討論空間的。其實,我覺得台北市政府會大動作急著宣稱自己用的是正體,是大中國文化中爭道統、正統名份的那種意識型態在作祟,配合當時的政治背景,不難想像為什麼會出現這個東西。因為以上種種原因,我不用正體字來代替繁體字。 另外,回到正題,想問一下,unicode 的收字原則是,如果某個字有古、今兩種寫法,是只收今體嗎?如果是這樣,那同一篇文章中,古、今寫法需要同時存在的時候,不就只能用不同字型? | |||||||||||||
就我目前的瞭解,大陸所謂的古籍數位化,雖然是用繁體字,但他們的繁體字的寫法和台灣這邊的繁體字的寫法是有差異的,請參考: http://hyperrate.com/thread.php?tid=2789 所以會有許多「一個XX,各自表述」的情形。而目前台灣的政治環境很複雜及敏感,所以一些主導權台灣夠不上,也鐎可奈何。 這類題目太大,不是我們升斗小民能理會得了的,就像大家講了半天,Unicode 還是我行我素一般的情況。 所以,台灣這邊能保存的就盡量保存了,只能這樣子。
| |||||||||||||
不過,只要跟文字打交道的人,還是喜歡舊字形。 因爲Unicode的漢字部門,IRG的首位負責人自己說過不懂漢字,結果Unicode在編碼的時候,字形就沒有以舊字形(康熙字典印刷體字形)為基礎。 但文字還是以康熙字典為基礎的。据倉頡的發明人朱邦復先生說,張説不上Unicode以什麽為基礎。他就較張就以康熙字典作爲回答。
臺灣保存的成果其實是日本的技術成果。日本對康熙字典整理,出版了大漢和辭典。負責文字製作工作的是寫研公司。寫研公司是個印刷向的公司。寫研公司的石井明朝体和本蘭明朝体,被臺灣印刷業使用。 臺灣代表的舊字形工具書是中文大辭典,也是很接近大漢和辭典文字的。但我不知道是用什麽明朝体編排的。
結果臺灣教育部人的思維還是和大陸一樣,都是傳統的文人思維。認爲宋体字是楷書的變體,不合楷書。把宋體字改成楷書的字形。 進入pc font時代,可以不用日本的產品了。也許是衆多pc font廠商以爲unicode有權威性,全都把文字改成半手寫半印刷的字形。比方説XP細明体下的“神”的部首。
而日本方面,雖然有了校对精良的字典。但还有个不學無術的政府。 首先JIS編碼,收字就很少,而且是簡體字(日文:新字体)优先。後來,收字多了,出現了到底應該類推部件簡化,還是限制簡化問題。 最後採用限制簡化,其他字以康熙字典為准。並且公佈了一個表,日文叫做《表外漢字字体表》。目的是爲了規範字形。但又沒有完全依照校對精良的大漢和的字形。 所以,我想,日本的pc font也看不到那麼純的了。當然比臺灣純很多。除了大漢和辭典,還可以找寫研的石井明朝和本蘭明朝。不過這兩個明朝,我沒有見到過。不敢說純還是不純。 | |||||||||||||
如果你看了前面的潑文,那麼你都白看了,不是我有意攻擊你。 1。正字通的東西要到正字通裏去講。康熙字典的東西要到康熙字典裏去講 2。康熙字典裏的古文今文unicode全都收的。今文在康熙字典裏一般不單獨提出。比如,一,古文弌。那麽“一”就是今文了。 3。unicode的字形參考,是根據大陸、臺灣、日本、韓國、香港提交的字形,沒有單單依據哪本字典。更沒有古今字形(寫法)這樣一個概念。 4。你對字型/字形,有沒有認識?
搞不懂這些名詞,也就是驢唇不對馬嘴的對話。我對正字通不了解,你所說的古體今體也是頭一次聽到的詞彙。
括號中是解釋 康熙字典的概念:正字 、俗字、古文、籀文、隸變字 大陸的概念:繁體、簡體、異體 臺灣的名詞:正體、異體 | |||||||||||||
這是一個非常不正確的說法,以訛傳訛,倒果為因。多年前就曾在 firefly 網站上就這個議題辯論過,請 google,我個人實在不願意把時間花在這裡。明體、宋體二詞自古就有。康熙字典也不是日本人編的,何苦自己降級呢? 況且,你沒搞清楚台灣教育部的標準字型裡頭的字形(請注意我寫字型和字形是不同的意義),就會知道,這些標準字型根本就不是康熙字典的寫法,但是台灣沒有法律去規定人民該用什麼樣的寫法的字型,這點和大陸是不一樣的。民主國家沒有政權會去嚴格規定字的形要怎麼寫,否則就犯法,這是不可思議的事情。
很抱歉,以下已經離題了,請另開 thread,也請把議題集中在技術上,因為一些議題我們無法決定,請洽台灣當權者,謝謝!
ps. 我個人認為「書同文」在目前的民主社會是不可能的事情,除非用極權的方式。 edited: 2
| |||||||||||||
這裡再強調一次,台灣的概念並不就是正體 vs. 異體,許多情況下是繁體 vs. 簡體。我從沒找到足夠的證據說繁體一詞是大陸用法。那是不是台灣目前許多的詞彙就是大陸用法?這不是廢話嗎?美國人講的、用的當然是英文呀!:p
OK, 這個 subject 討論的是『舄 和 舃』,需要討論其他字型相關議題請另立 thread,謝謝大家合作! edited: 1
| |||||||||||||
另外,回到正題,想問一下,unicode 的收字原則是,如果某個字有古、今兩種寫法,是只收今體嗎?如果是這樣,那同一篇文章中,古、今寫法需要同時存在的時候,不就只能用不同字型? 這個現在知道了。之前問,是因為當時討論還沒有很清楚指出來需要用不同字型,我很早就按了回覆,但一直到很晚才把文發出,沒想到發出文章後,中間已又有大量文章出現。 To zh67781530: 您的文字學知識也許很豐富,但您閱讀文章的能力實在需要加強。我正繁體字之論不是寫給你看的,古體、今體的 unicode 問題,我想一般人應該不至於看不懂,您覺得刺眼的話,就當作沒看到,跳過吧。 還有,也請您加強一下文章的邏輯,您的某些文章,我每字每句都懂,但與上下文合起來,搞不懂,不曉得你到底要表達什麼、跟之前 LGJ 所言有何關係,我想不是只有我搞不懂你想說什麼而已。要討論,我想大家絕對歡迎,但請靜下心來,把自己想講的好好整理一下再發出來,免得人家看得一頭霧水。 | |||||||||||||
最後你自己去翻閲了書籍,觀點才得到統一。難道你現在又想推翻你的結論了? 宋体和明体自古有之,要不要再查一查,“明体”這個詞語出現在哪個朝代呢? 另外一個帖子裏,我貼了文鼎科技的資料。裏面就有“明体”這個詞語是怎麽來的。
臺灣享用了日本的成果,卻要否定日本的成果嗎? 就像臺灣的網站自己批評中文大辭典一樣, “字頭、詞條全部按照漢和大辭典,但卻刪除了日本漢學家的人物”。 康熙字典、中華大字典用的都是舊字形,大陸的中華書局,就和老舊的民國書籍一樣,用的還是國產的活字字模。 至於效果和日本的照相排版機如何,你可以拿書去比較? 反而是日本沒有否認過他們的是基於康熙字典而整理的成果。 或者,你再去了解一下,印刷字體是如何從活字字模走向數碼印刷的過程的。 我倒是很羡慕臺灣能直接獲得日本的這些成果。臺灣盜版的大漢和辭典,要比日本正版便宜很多。我買不上盜版,花了大價錢買正版。 大陸的印刷厰都用官方的文字,日本的成果沒市場,我想看看日本的照相排版機,也看不到。
你怎麽知道我沒有搞清楚教育部字形?你如果有印象的話,你在你的blog中曾經疑惑unicode怎麽把手寫體和印刷體同時收錄。 這個問題,我在你的blog中提過,unicode是以大陸、臺灣、日本、韓國的標準字形為基礎。日韓的標準字形在臺灣是印刷體。 要不要你,再去看看你的blog?反而是我記得,再我們爭吵過以後,你也開始注意臺灣教育部字形了,而不再把它們稱爲“手寫體”
臺灣的概念,如果不是正體和異體,是繁體和簡體的話。 那麽臺灣有沒有教育部繁體字典和教育部簡體字典?異體字字典倒是很有名哈!
coolcd,很可惜,我不知道你不是寫給我看的! 不過,我解釋的已經很清楚。有人可能覺得我寫的不符合他們的理解。不過,別給臺灣的知識界抹黑吧。 我的很多資料都是從臺灣找來的呢。至於能不能看懂,翻翻自己手頭的工具書,查查。看我說的是不是火星語。 果正兄同樣多翻翻工具書。你對fontforge的投入,讓我受益很多。不過一些基本的東西,你也是不愛翻翻資料啦。 |
| |||||||
adm | Find | login register |