三论汉字笔画
一、
引言
在计算机上,敲击26个字母键,即可组出任何英文单词。但要进行中文处理,必须另有一套编码系统,敲进特定的输入码(外码),都要由计算计转成内码。由此内码在庞大的字库内找到汉字字模,再显示方块字。只要是以这种方式使汉字植根于电脑的,该电脑就不可能是真正的汉字计算机。实际上,与英文字母相当的是汉字笔画。笔画种类也只有30种左右,让它们一一对应一个按键,只要敲击键盘,也可由笔画组出所有汉字。这样就不会有输不进去的汉字,万一遇到不认识到汉字,我们可以用键盘依样画葫芦地把它写出来。这种由笔画组字的方式,是汉字植根于电脑的唯一正确方向。
但是国家和计算机界并没有意识到这个正确方向,更没有人去研究。他们一直忙于为2万、5万、10万汉字编定内码。可惜这样做也不能安排全部汉字,反而封杀了汉字的发展。针对每一套字库编码标准,大家又忙于为它编输入码。结果是万码奔腾,可惜也不能做到不重码。全世界计算机学者,也没有找到正确的方法,解决所有语言文字的编码问题。字符的交换信息码,由一个字节到二个字节直增到四个字节。即使硬件的飞速进步允许您这么干,但也不能一劳永逸地解决问题,因为文字本身是发展的。可以说是无限的。我想总有一天,大家要扭转方向另求解决途经的。
我现在正着手解决汉字笔画组字问题。为此必须研究汉字笔画。可惜这个领域里的资料很少。我反覆呼吁国家要有一个标准笔画库,可能认为这个太简单,或者没有必要,所以至今还没有。我曾两次讨论笔画,(第一篇《论汉字笔画》,第二篇《汉字笔画统计特征》,可在我的网站上找到)本文是第三次。其目标都是为解决在计算机上由笔画组字服务的。
二、
笔画线段和方向
汉字端直方正,没有圆弧形笔画(我在网上几次提出汉字为什么没有圆圈和弧形笔画这个问题,但至今没有得到很好的答案),那就是说汉字都是由直线线段组成的。与繁多的汉字比较起来,笔画种类简单、种类少。由于过去不重视研究,资料更少。最先研究汉字笔画的,应当是书法家。但书法家主要着重于起笔、落笔的笔锋及笔画转折时的运笔方法和形态。而这一切都是随字体而变,不同字体的形态差别很大,也只是区别字体的特征,而不是区别汉字本身的特征。在汉字教学上论及的笔画,应是我们关心的主要部分。在这方面,不同的作者也有不同归属和名称,我在“论汉字笔画”中已列表举例。对我们关系更大的可能是近年来为了汉字编码需要所作的归纳,一般只分作:横、竖、点、撇、捺五种,还有一种折,包括所有转折的笔画。有人按折的方向——顺时针还是逆时针——区别为顺折、逆折。戚桐钦还把点分为纵点和横点,这样刚好凑成8种,符合他的中易八卦系统。实际上为了编码时分散码子,减少了重码,应尽量使各种笔画出现的频率均匀些。为此我曾建议把出现频率最高的横,按它与其他笔画交错否,区分为孤立横和交横。
因为没有长度宽度、近于几何意义的点是没有的,许多人把点看成是短捺和短竖(竖点),这样最简单原始的汉字笔画只有4种:横、竖、撇、捺。这4种不同方向的直线线段,正好组成练字用的“米”字格。有人就用这4种米字格小线段,生成所有方块字。确实没有一个汉字,不能套到米字格上的,意即所有笔画都是由这四种线段组成的,它们是汉字的骨骼。
写汉字先上后下,先左后右,运笔的正方向也是由上到下,由左向右。4种直线线段中,横、竖及捺的运笔方向总是正的,但成 45度角的斜线,不管是撇和挑,总有一个方向是逆向的:“撇”由右向左,“挑”从下向上。不过这两种笔画一般是不长的。其他产生逆向运笔的,都发生在笔画的最末线段中,那都是较短的钩:如横向下钩、横向上钩、竖向右钩,而在竖向左钩中,两个方向都是逆向的:由右向左、且从下向上。
三、
笔画
上面所说笔画线段,按笔顺,能够首尾相接的,就连成一个笔画。写了一个笔画线段后,下一步必须由原来的起笔处或别的地方起笔的,就只得分成两笔。一个笔画线段孤立成笔的笔画就叫竖、横、撇、捺。其他笔画都是由2个以上线段相连而成,最多可有5个线段,如“乙”以及“乃”的折笔。笔画线段相接处,在一般字体中都有特殊的形态。运笔至此,常要“顿笔”,再改变方向。个别交接处平稳过渡,形成圆弧形状,如“乙”字的第2、3个转折点。但他们不是特征所在,把它写成折线形,也不影响整个汉字的性质。所以我们一般都把笔画看作是折线。折线的角度,也不一定要是45度的倍数。
取5个线段,每个线段可任取4种中的一种,共有4^5=1024,再加上4个、3个、2个、1个线段,共有1024+256+64+16+4=1364种组合。因为我们区分4种线段,只按它的方向不同而不管其长短,所以,仅第一次有4种选择,以后就只能选择3种了。另一种与原方向相同,只使原先线段地延长而已,不能算。这样,所有可能的组合降为4*(3^4+3^3+3^2+3+1)=484种。实际上,这484种中还有许多是不成为笔画的。例如:“撇”顺接“竖”习惯上仍算作两笔,“捺”后连着短横,仍算作一笔“捺”,“捺”连着“撇”不是汉字笔画等等……。实际上不同的笔画只有40——50种,不同的人会有不同的看法。我现在则取50种笔画,如下表所示。表中每一种笔画用一个字母代表,同一字母的大、小写两种字母所代表的笔画,常常也是同一种笔画,仅在大小长短上有些差别。为了组出较好看的汉字,可能要分别选用其中的一种。但是如果互相代替,字形可能变的不美观,但一般不会变为不同的汉字。这样,实际上只能算25种笔画。(因为笔画概念,少用、少研究,也没有国家文字标准,我这里采用的和我第一篇《论汉字笔画》中列到的就有出入,以后可能还有变化。)
|
代表字母 |
形 态 |
名 称 |
字 例 |
|
代表字母 |
形 态 |
名 称 |
字 例 |
|
a |
、 |
点 |
“文”字首笔 |
|
A |
|
长点 |
“冖”之首笔 |
|
b |
一 |
横 |
一 |
|
B |
|
短横 |
“工”字首笔 |
|
c |
丨 |
竖 |
“上”字首笔 |
|
C |
|
短竖 |
“刂”之首笔 |
|
d |
|
撇 |
“义”字首笔 |
|
D |
丿 |
竖撇 |
“川”字首笔 |
|
e |
|
捺 |
“文”字末笔 |
|
E |
|
平捺 |
“辶”之末笔 |
|
f |
乛 |
横钩 |
“买”字首笔 |
|
F |
|
|
“今”字末笔 |
|
g |
亅 |
左钩 |
“刂”之末笔 |
|
G |
|
|
|
|
h |
|
右钩 |
“氏”字第二笔 |
|
H |
|
竖提 |
“以”字首笔 |
|
i |
|
斜钩 |
“弋”字第二笔 |
|
I |
|
心钩 |
“心”字第二笔 |
|
j |
|
提 |
“⺪”之末笔 |
|
J |
|
挑 |
“扌”之末笔 |
|
k |
|
言挑 |
“讠”之末笔 |
|
K |
|
凹折 |
“凹”字第二笔 |
|
l |
|
横折钩 |
“同”字第二笔 |
|
L |
|
横折 |
“夬”字首笔 |
|
m |
|
万钩 |
“万”字第二笔 |
|
M |
|
横弯 |
“书”字首笔 |
|
n |
|
马钩 |
“马”字第二笔 |
|
N |
|
鼎折 |
“鼎”左下首笔 |
|
o |
|
乃钩 |
“乃”字末笔 |
|
O |
|
凸 |
“凸”字倒二笔 |
|
p |
|
专折 |
“专”字倒二笔 |
|
P |
|
|
|
|
q |
|
竖折 |
“区”字末笔 |
|
Q |
|
竖弯 |
“疑”字首笔 |
|
r |
|
撇折 |
“矣”字首笔 |
|
R |
|
撇横 |
“糸”字第二笔 |
|
s |
|