“最后我会将所有的字稿带去蜀都,带去首都,通过最原始的扫描匹配方式,生成我们需要的字库。”
“咱们这么做的目的,是设计出一个能够涵盖所有已知的繁体汉字和简化汉字的大字库出来,从而一劳永逸。”
“而今后的事情就简单了,我们可以做做减法,搞出一些删减版来,供人自由选择,以解决字库过于庞大和电脑存储资源不足的矛盾。”
“雪珊你说,将电脑字库从六千多字扩充到四万七千多字,这是不是关系我们国家国计民生的大事儿?”
“只是写字那我还行。”冯雪珊知道自己要干什么之后,倒是放松了下来:“就算五万个字,我一天写一百个,用不了两年也能够完成。”
“嗯,现在睡觉,等回去我们就开始这项工作。”
“好。”
这项工作是周至答应过辜老的,当时周至曾经跟辜老说过,如果等到他进入大学,国家依旧没有推出相应的字库的话,那这项工作便由他来完成。
当然在没有设计软件的情况下,前期的准备工作只能用手工,那注定将是繁琐的。
仅仅是将近五万个汉字复刻到十六乘十六的三十二比特信息量的栅格当中去,在没有软件辅助的情况下,会是非常耗时且枯燥的工程。
这项工作还相对简单,且只是基础。
有了基准字模之后,才谈得到利用软件和基础字型设计,通过数字化拟合,自动生成不同的字体。
但是只要将基础工作做好,剩下的就可以通过计算机软件来完成了。
周至在前期已经做了一些工作,主要就是将GB2312—1980的简化字和康熙字典繁体字结合到一起,构成这个字库所需的全部汉字。
至于附加的英文字母和常用字符,已经不属于他的专业了,将来让别人补充就好。
两相结合再去除重复,冯雪珊信口说的五万字,其实和事实非常接近。
周至之所以想要插手这件事儿,是因为现在的国人对这个事情没有什么经验,因此走入了一个误区。
汉字是象形文字,和拉丁字母的区别就在于字码太多。
如今主流的做法,就是简化,只将常用字列入输入法中,以应对绝大多数时候的需要。
但是周至认为,这样的做法并不太好,因为占用存储空间的其实是五万个字的字模,而并非代表它们的编码。
因此大可以一步到位,将大中华区包括港岛、宝岛、新马、岛国、朝国等依旧在使用汉字的地方,以及使用大量汉字符号的地方,将所有字型都收集起来,先将大字库编好。
具体到再上一层的应用,则可以通过从基准字库中提取子集的方式来完成。
“咱们这么做的目的,是设计出一个能够涵盖所有已知的繁体汉字和简化汉字的大字库出来,从而一劳永逸。”
“而今后的事情就简单了,我们可以做做减法,搞出一些删减版来,供人自由选择,以解决字库过于庞大和电脑存储资源不足的矛盾。”
“雪珊你说,将电脑字库从六千多字扩充到四万七千多字,这是不是关系我们国家国计民生的大事儿?”
“只是写字那我还行。”冯雪珊知道自己要干什么之后,倒是放松了下来:“就算五万个字,我一天写一百个,用不了两年也能够完成。”
“嗯,现在睡觉,等回去我们就开始这项工作。”
“好。”
这项工作是周至答应过辜老的,当时周至曾经跟辜老说过,如果等到他进入大学,国家依旧没有推出相应的字库的话,那这项工作便由他来完成。
当然在没有设计软件的情况下,前期的准备工作只能用手工,那注定将是繁琐的。
仅仅是将近五万个汉字复刻到十六乘十六的三十二比特信息量的栅格当中去,在没有软件辅助的情况下,会是非常耗时且枯燥的工程。
这项工作还相对简单,且只是基础。
有了基准字模之后,才谈得到利用软件和基础字型设计,通过数字化拟合,自动生成不同的字体。
但是只要将基础工作做好,剩下的就可以通过计算机软件来完成了。
周至在前期已经做了一些工作,主要就是将GB2312—1980的简化字和康熙字典繁体字结合到一起,构成这个字库所需的全部汉字。
至于附加的英文字母和常用字符,已经不属于他的专业了,将来让别人补充就好。
两相结合再去除重复,冯雪珊信口说的五万字,其实和事实非常接近。
周至之所以想要插手这件事儿,是因为现在的国人对这个事情没有什么经验,因此走入了一个误区。
汉字是象形文字,和拉丁字母的区别就在于字码太多。
如今主流的做法,就是简化,只将常用字列入输入法中,以应对绝大多数时候的需要。
但是周至认为,这样的做法并不太好,因为占用存储空间的其实是五万个字的字模,而并非代表它们的编码。
因此大可以一步到位,将大中华区包括港岛、宝岛、新马、岛国、朝国等依旧在使用汉字的地方,以及使用大量汉字符号的地方,将所有字型都收集起来,先将大字库编好。
具体到再上一层的应用,则可以通过从基准字库中提取子集的方式来完成。