程肯指出,中文最常使用的共有3500個字,沒有人會有耐心全部寫全。於是他想到文字學的概念,將中文字拆解成一個個不能再拆的「末級部件」,例如「草」就拆解為「艸」、「日」、「十」。
如此一來,就只需要約500個「末級部件」,但程肯仍嫌太多,再進一步簡化,最終設計出只需要寫出300個指定中文字,就能模擬出3500個常用字的軟體,涵蓋日常生活95%的文字。
程肯設計的軟體之所以如此神奇,便是結合了影像辨識技術,建立一個資料庫,計算出各種「末級部件」作為完整中文字的各種組合部分時的擺放方式、大小變化、筆觸粗細等,藉此重建使用者的筆跡特徵。
程肯目前已寫出完整的電腦程式,未來將進一步推展到手機應用上,達成他最初的夢想,也就是線上即時通訊時,每一個人都能使用自己專屬的字體。 |