三论汉字笔画

 

一、      引言

    在计算机上,敲击26个字母键,即可组出任何英文单词。但要进行中文处理,必须另有一套编码系统,敲进特定的输入码(外码),都要由计算计转成内码。由此内码在庞大的字库内找到汉字字模,再显示方块字。只要是以这种方式使汉字植根于电脑的,该电脑就不可能是真正的汉字计算机。实际上,与英文字母相当的是汉字笔画。笔画种类也只有30种左右,让它们一一对应一个按键,只要敲击键盘,也可由笔画组出所有汉字。这样就不会有输不进去的汉字,万一遇到不认识到汉字,我们可以用键盘依样画葫芦地把它写出来。这种由笔画组字的方式,是汉字植根于电脑的唯一正确方向。

    但是国家和计算机界并没有意识到这个正确方向,更没有人去研究。他们一直忙于为2万、5万、10万汉字编定内码。可惜这样做也不能安排全部汉字,反而封杀了汉字的发展。针对每一套字库编码标准,大家又忙于为它编输入码。结果是万码奔腾,可惜也不能做到不重码。全世界计算机学者,也没有找到正确的方法,解决所有语言文字的编码问题。字符的交换信息码,由一个字节到二个字节直增到四个字节。即使硬件的飞速进步允许您这么干,但也不能一劳永逸地解决问题,因为文字本身是发展的。可以说是无限的。我想总有一天,大家要扭转方向另求解决途经的。

    我现在正着手解决汉字笔画组字问题。为此必须研究汉字笔画。可惜这个领域里的资料很少。我反覆呼吁国家要有一个标准笔画库,可能认为这个太简单,或者没有必要,所以至今还没有。我曾两次讨论笔画,(第一篇《论汉字笔画》,第二篇《汉字笔画统计特征》,可在我的网站上找到)本文是第三次。其目标都是为解决在计算机上由笔画组字服务的。

二、      笔画线段和方向

    汉字端直方正,没有圆弧形笔画(我在网上几次提出汉字为什么没有圆圈和弧形笔画这个问题,但至今没有得到很好的答案),那就是说汉字都是由直线线段组成的。与繁多的汉字比较起来,笔画种类简单、种类少。由于过去不重视研究,资料更少。最先研究汉字笔画的,应当是书法家。但书法家主要着重于起笔、落笔的笔锋及笔画转折时的运笔方法和形态。而这一切都是随字体而变,不同字体的形态差别很大,也只是区别字体的特征,而不是区别汉字本身的特征。在汉字教学上论及的笔画,应是我们关心的主要部分。在这方面,不同的作者也有不同归属和名称,我在“论汉字笔画”中已列表举例。对我们关系更大的可能是近年来为了汉字编码需要所作的归纳,一般只分作:横、竖、点、撇、捺五种,还有一种折,包括所有转折的笔画。有人按折的方向——顺时针还是逆时针——区别为顺折、逆折。戚桐钦还把点分为纵点和横点,这样刚好凑成8种,符合他的中易八卦系统。实际上为了编码时分散码子,减少了重码,应尽量使各种笔画出现的频率均匀些。为此我曾建议把出现频率最高的横,按它与其他笔画交错否,区分为孤立横和交横。

因为没有长度宽度、近于几何意义的点是没有的,许多人把点看成是短捺和短竖(竖点),这样最简单原始的汉字笔画只有4种:横、竖、撇、捺。这4种不同方向的直线线段,正好组成练字用的“米”字格。有人就用这4种米字格小线段,生成所有方块字。确实没有一个汉字,不能套到米字格上的,意即所有笔画都是由这四种线段组成的,它们是汉字的骨骼。

写汉字先上后下,先左后右,运笔的正方向也是由上到下,由左向右。4种直线线段中,横、竖及捺的运笔方向总是正的,但成 45度角的斜线,不管是撇和挑,总有一个方向是逆向的:“撇”由右向左,“挑”从下向上。不过这两种笔画一般是不长的。其他产生逆向运笔的,都发生在笔画的最末线段中,那都是较短的钩:如横向下钩、横向上钩、竖向右钩,而在竖向左钩中,两个方向都是逆向的:由右向左、且从下向上。

三、      笔画

   上面所说笔画线段,按笔顺,能够首尾相接的,就连成一个笔画。写了一个笔画线段后,下一步必须由原来的起笔处或别的地方起笔的,就只得分成两笔。一个笔画线段孤立成笔的笔画就叫竖、横、撇、捺。其他笔画都是由2个以上线段相连而成,最多可有5个线段,如“乙”以及“乃”的折笔。笔画线段相接处,在一般字体中都有特殊的形态。运笔至此,常要“顿笔”,再改变方向。个别交接处平稳过渡,形成圆弧形状,如“乙”字的第23个转折点。但他们不是特征所在,把它写成折线形,也不影响整个汉字的性质。所以我们一般都把笔画看作是折线。折线的角度,也不一定要是45度的倍数。

5个线段,每个线段可任取4种中的一种,共有4^51024,再加上4个、3个、2个、1个线段,共有1024256641641364种组合。因为我们区分4种线段,只按它的方向不同而不管其长短,所以,仅第一次有4种选择,以后就只能选择3种了。另一种与原方向相同,只使原先线段地延长而已,不能算。这样,所有可能的组合降为4*3^43^33^2+31)=484种。实际上,这484种中还有许多是不成为笔画的。例如:“撇”顺接“竖”习惯上仍算作两笔,“捺”后连着短横,仍算作一笔“捺”,“捺”连着“撇”不是汉字笔画等等……。实际上不同的笔画只有40——50种,不同的人会有不同的看法。我现在则取50种笔画,如下表所示。表中每一种笔画用一个字母代表,同一字母的大、小写两种字母所代表的笔画,常常也是同一种笔画,仅在大小长短上有些差别。为了组出较好看的汉字,可能要分别选用其中的一种。但是如果互相代替,字形可能变的不美观,但一般不会变为不同的汉字。这样,实际上只能算25种笔画。(因为笔画概念,少用、少研究,也没有国家文字标准,我这里采用的和我第一篇《论汉字笔画》中列到的就有出入,以后可能还有变化。)

代表字母

 

代表字母

 

    a

  

“文”字首笔

 

    A

 

  长点

“冖”之首笔

    b

  

     

 

    B

 

  短横

“工”字首笔

    c

  

“上”字首笔

 

    C

 

  短竖

“刂”之首笔

    d

 

  

“义”字首笔

 

    D

丿

  竖撇

“川”字首笔

    e

 

  

“文”字末笔

 

    E

 

  平捺

“辶”之末笔

f

  横钩

“买”字首笔

 

    F

 

 

“今”字末笔

    g

  左钩

“刂”之末笔

 

    G

 

 

 

    h

 

  右钩

“氏”字第二笔

 

    H

 

  竖提

“以”字首笔

    i

 

  斜钩

“弋”字第二笔

 

    I

 

  心钩

“心”字第二笔

    j

 

  

“⺪”之末笔

 

    J

 

  

“扌”之末笔

    k

 

  言挑

“讠”之末笔

 

    K

 

  凹折

“凹”字第二笔

    l

 横折钩

“同”字第二笔

 

    L

 

  横折

“夬”字首笔

    m

 

  万钩

“万”字第二笔

 

    M

 

  横弯

“书”字首笔

    n

 

  马钩

“马”字第二笔

 

    N

 

  鼎折

“鼎”左下首笔

    o

 

  乃钩

“乃”字末笔

 

    O

 

  

“凸”字倒二笔

    p

 

  专折

“专”字倒二笔

 

    P

 

 

 

    q

 

  竖折

“区”字末笔

 

    Q

 

  竖弯

“疑”字首笔

    r

 

  撇折

“矣”字首笔

 

    R

 

撇横

“糸”字第二笔

    s