文字·汉字·汉字改革

一般认为,文字是记录语言的。索德尔著作中,我们可读到:“语言和文字是两种不同的符号系统,后者唯一的存在理由是在于表现前者。”但是,萌芽状态的文字,尤其像结绳记事时代用来记数的“结”以及陶器上的刻划等,不可能是直接“表现”语言的,现代的数学符号,公式图表,也不是记录语言的。这两种符号系统应该没有从属关系,只不过出现的时间可能是语言在先而已。如果语言不狭义地理解为语音,还包括肢体语言等,则传递信息的语言当然是首先出现,或者可以说是与生俱来的。如果只指狭义的声音语言,那么在聋哑人社会中(据报道曾发现有不能发声的人类种群),以及一切不会发声的动物社会里,就没有语言只能有文字符号了。实际上,这两者的区别仅在于,语言偏重于现场交流,文字偏重于记录保存,后者是人类改造自然物的形态作为符号才得以保存的。在发明录音、录像前,无论声音语言还是肢体语言,都不能记录长存。

所以,文字必须有物质载体,和在载体上制造特有形态的工具。这个物质条件是随社会和技术进步而发展的,从开始的泥板、草纸、骨甲、竹简,直到最后全世界都统一于纸张,相应的工具也由硬棍子、刻刀,最后改为各种各样的笔。文字的形态必然也随着这些条件而变化。泥板上只能是钉头字,不可能有曲线形状,骨甲上也不可能有隶、楷、草书的汉字。偏重记录存储的文字,发达普及之后也具有了传递功能,尤其是异地传输信息。进一步的更重要的功能,是知识的传播和普及——那就是书的出现。不久手抄书被印刷品所代替。活字印刷本是我国的发明,传到了西方,用在拼音文字上,更加方便,因为它们的字模只要5060种就可以了,不象汉字字模要几千上万种。更进一步,西方的机械化发明了打字机,使得便条书信都不要手写了。比较起来,中文打字机就十分笨重,一般只由专业人员打蜡纸,用在印刷上,没有人用它来打便条的。感到方块字落后,难以机械化,要走拼音文字的道路,大概就是在20世纪初这样的社会技术条件下产生的。

在文字进化到纸和笔的阶段时,世界上只有两类文字了,一类是各种拼音文字,另一类就是中国的方块字。方块字之所以在世界技术进步中没有消失,有人认为是因为中国太大,太保守,竟被世界进步所遗忘之故。但是鸦片战争之后,国门已被打开,特别是国人自己(还都是有识之士)也在提倡推广拼音文字,经历近一个世纪,汉字仍然未能消失,足见她还有生命力,有优点。现在所谓的汉字改革,似乎就是要走所谓的“全世界共同的拼音文字道路”。许多人在这个“正确的大方向”下,大胆地设计自己的拼音文字方案,希望有朝一日,能够被推广使用。殊不知,文字这种公开性的信息交换符号,绝不是少数几个仓颉所能设计出来的。语言文字是约定俗成的东西,所谓约定俗成,我认为是像生物物种经过自然选择形成一样,不可能用克隆、拷贝或DNA设计等方法产生的,即使以后生物技术进步可以合成DNA,也要再经过长期的自然选择。一个人,一个小群体,甚至一段时间内的许多人,都难以设计出科学的新文字,因为他们不可能考虑到并适应一切客观情况。现在似乎还没有一个成功的例子,能在一个大国或在亿万人的社会内,靠行政命令推广一个全新设计的文字的。我建议现在的新文字设计者,不要单纯考虑自己方案的科学性,如果您有信心,首先要找自己的同伙来使用您的设计,只有使用者不断扩大(至少要有女书使用者那么多吧),在使用过程中不断磨练提高,才有可能有些意义。

20世纪80年代,全新的信息技术,使文字的主要载体,发生了质的跃变,一时间使汉字难以适应,几乎要遭灭顶之灾。拼音文字只有5060个字母,每个字母编码只要对应一个7×5的点阵图形就可以显示打印了,而且已有一世纪左右的西文打字机的技术基础,它们的数字化十分简单而且自然。汉字远比西文复杂。开始时,汉字字形的显示、打印都做不到。好在电脑技术进步很快,一年半即翻一翻。这帮了大忙,我们立刻把字符点阵,扩大到16×16,就可以区别成千上万个汉字了。第一个编码标准GB80产生了,共含6763个汉字,足够一般使用,成为难题的倒是所谓的“输入瓶颈”。但这个难关奇迹般地被聪明的国人攻克了。我们兴奋了,几乎得意忘形;汉字在新条件下将永葆青春。

可能是由于解决的太快太容易,我们没有把汉字与英文词彙对应,而仅据表面现象,简单地把汉字对应于英文字母。实际上英文字母很少(26×2个),有限而稳定,汉字却量大、字数无限,它们根本不可能是同一档次的事物。要让文字植根于电脑,必须数字化,即要进行编码,才能存储、传输。而编码的前提条件是,被编码的对象,即信号集,必须是有限而固定的。文字是公共的通讯信号,更必须是数量有限而且完全公开,长期稳定。按此通讯本质来看,与英文字母对应的应该是汉字笔画。可是我们过去没有突出并重视组成汉字的基本元素——笔画,更重要的是由于:字母组成英文字彙是简单的线性排列,而笔画组成汉字是复杂的平面结构。20年前的软件技术不容易解决笔画组字问题,这就造成了目前汉字植根于电脑的方法只能是大字库加编码。我这里指的是输入码。机内码是可以机械派定的,技术比较简单。虽然简易,但汉字字符集太大,标准不易统一,结果产生乱码问题,造成通讯困难。即使编码统一了,但字数多至无限,编码不能长期稳定不变,终究潜伏着“定量炸弹”。于是提出限制、固定汉字集的主张。这却使电脑不能处理古字、地方字、冷僻字、特殊名字,而西文世界就没有这类问题,不会不能处理古拉丁文。

解决这一问题的关键,就在于无字库汉字。我的“无字库汉字演示和设计”软件,一运行时显示一句话:“信息时代的汉字和中文信息处理的出路是:汉字植根于电脑的方法必须建立在笔画组字上”。文字载体的跃变及当前技术的发展,必然会在汉字的发展史上打上更深的烙印,汉字必须进行相应的改革。但汉字的改革重点已不在原来的三方面:1、表音化,2、笔画简化,3、字体规范化。 因为,在电脑普及之后,特别是将来人人都可随身带一个小电脑之后,查找汉字的读音,或给它注音是十分容易的;手写汉字的机会很小了,而屏幕显示和打印汉字,不在乎笔画多寡,只要形态易于辨认;规定了常用汉字的标准字形,应用模式识别技术,进行拼写检查,容易纠正错别字。当前的电脑汉字问题出在直接给汉字集编码产生的矛盾上:缩小、固定汉字集,不只扼杀汉字的发展和生命,也不能满足当前各方面应用的需要;开放汉字集,就不可能编出包容所有汉字又长期稳定的讯息交换码。且字符集愈大,输入就更困难,难以研制重码少而有效的输入法。只要把汉字植根于电脑的基础,由汉字本身转到大小与英文字母差不多的笔画集上来,一切问题就迎刃而解了。为此,我们要研究、编定标准的笔画库,以及由笔画组字的软件。组字软件必然涉及组字规则。为了适合电脑这一特殊载体的特点,我们有可能淘汰一些旧的习惯,引进某些新东西。这些都是在新条件下汉字改革所需要的,这一切才是当前汉字改革的内容和实质。

         陕西省气象局   张时钊   2004.2.1