但是只要将基础工作做好,剩下的就可以通过计算机软件来完成了。
周至在前期已经做了一些工作,主要就是将GB2312—1980的简化字和康熙字典繁体字结合到一起,构成这个字库所需的全部汉字。
至于附加的英文字母和常用字符,已经不属于他的专业了,将来让别人补充就好。
两相结合再去除重复,冯雪珊信口说的五万字,其实和事实非常接近。
周至之所以想要插手这件事儿,是因为现在的国人对这个事情没有什么经验,因此走入了一个误区。
汉字是象形文字,和拉丁字母的区别就在于字码太多。
如今主流的做法,就是简化,只将常用字列入输入法中,以应对绝大多数时候的需要。
但是周至认为,这样的做法并不太好,因为占用存储空间的其实是五万个字的字模,而并非代表它们的编码。
因此大可以一步到位,将大中华区包括港岛、宝岛、新马、岛国、朝国等依旧在使用汉字的地方,以及使用大量汉字符号的地方,将所有字型都收集起来,先将大字库编好。
具体到再上一层的应用,则可以通过从基准字库中提取子集的方式来完成。
内容未完,下一页继续阅读