汉 字 笔 画 表 征 求 意 见 稿
无字库汉字是用笔画组成全部汉字,自然首先要有一个完整的标准笔画表。目前国家好像还没有这样的笔画表。我只搜集到2001年12月19日由教育部和语委发布的“GB13000.1字符集汉字折笔规范”。它列出了25种折笔,但不包含不转弯的所谓“平笔”。以前用笔画进行排序检索时,一般只分五种:横、竖、撇、捺(包含点)、折,前4种就是平笔了。要用它们来组字,当然不能分的那么粗,尤其不能把二十多种折笔都归并为一种,虽然他们的使用总频数比不上一个“横”笔画。也有研究者把笔画归为6类、8类的,归类不很一致。但如果要把所有不同的笔画都列出来,则基本都差不多,约30-40种。一年多前,我采用2×25=50种,分配在25个字母键上,用它们已可组出GBK 汉字21000多个。最后还有了3个大写字母对应的副笔没有用过,而GBK汉字中要用到的“撇钩”“竖折撇”(虽然都只在一个汉字中用到,我暂用其他笔画代替了),以及“扬钩”都没有列入。为了进一步研究,完善无字库系统,我急需一个完备的笔画表。现在我根据过去的经验及现在看到的资料,拟了两个方案(如图),希望大家审阅并提出意见,尽力使它更完满些,希望在新方案基础上修改笔画数据,改进组字程序,做到以后可以不翻工或少翻工。
因为现有的字库,不能显示我这里用到的全部笔画,所以只得用图形表示。图中笔画都凑成对,分别用25个字母代表。小写字母表示主笔,每个主笔配一个副笔,副笔用大字字母代表。一般情况下,主、副笔互相代替写出来的汉字虽不正确,但大致还可认出是什么字。不过有个别副笔是特别安排的,组字频率很低,也难以代替主笔。我不知道,还会不会漏掉什么特殊笔画,如有人看到过这种笔画(以宋体、楷体为准),请告诉我,可以补进去。现在图中竖钩、竖提的副笔是硬凑上去的,可能没有用。

图中两个方案各有一张对应的表。在表中,第一列字母码后列出了主、副笔的名称。我没有用它们的全称,因为全称很长,有几个弯就有几个“折”字,不好读,也不好记。我更曾用一个包含该笔画的常用字来命名较长的折笔,如“儿钩”、“乃钩”、“凸折”、“鼎折”等,不知可取否,现注在括弧中。
表 1: 方案 1
|
字 符 码 |
主 笔 名 |
不同作者的排序 |
副 笔 名 |
不同作者的排序 |
在汉字中使用频数 |
|||||||
|
① |
② |
③ |
① |
② |
③ |
主 笔 |
副 笔 |
合 计 |
百 分 |
|||
|
a |
横 |
|
(1) |
1 |
短横 |
|
|
|
34502 |
43430 |
77932 |
28.4 |
|
b |
竖 |
|
(2) |
3 |
短竖 |
|
|
|
33770 |
14060 |
47830 |
17.4 |
|
c |
撇 |
|
(3) |
5 |
竖撇 |
|
|
|
28664 |
12878 |
41542 |
15.1 |
|
d |
点 |
|
(4) |
6 |
竖点 |
|
|
|
36926 |
4213 |
41139 |
15.0 |
|
e |
捺 |
|
(5) |
7 |
平捺 |
|
|
|
9631 |
410 |
10041 |
3.7 |
|
f |
提 |
|
(6) |
2 |
点提 |
|
(6) |
|
5608 |
1346 |
6954 |
2.5 |
|
g |
竖 钩 |
|
1 6 |
4 |
|
|
|
|
3255 |
0 |
3255 |
1.2 |
|
h |
横 折 |
1 |
1 |
8 |
短横折 |
|
|
|
13868 |
|
13868 |
5.0 |
|
i |
横 撇 |
2 |
2 |
15 |
短横撇 |
|
|
|
2557 |
1414 |
3971 |
1.4 |
|
j |
横 钩 |
3 |
3 |
14 |
横折弯 |
13 |
6 |
|
2508 |
0 |
2508 |
0.9 |
|
k |
竖 折 |
4 |
1 5 |
18 |
竖弯 |
5 |
17 |
22 |
2194 |
270 |
2464 |
0.9 |
|
l |
竖 提 |
6 |
1 4 |
21 |
|
|
|
|
1490 |
0 |
1490 |
0.5 |
|
m |
撇 折 |
7 |
2 3 |
23 |
短撇折 (发折) |
|
|
|
3383 |
0 |
3383 |
1.2 |
|
n |
撇 点 |
8 |
2 2 |
24 |
撇钩 |
9 |
|
|
1099 |
0 |
1099 |
0.4 |
|
o |
弯 钩 |
1
0 |
2 5 |
25 |
直弯钩 |
|
|
|
447 |
87 |
534 |
0.2 |
|
p |
斜 钩 |
1
1 |
2 4 |
26 |
卧钩 (心钩) |
|
|
27 |
712 |
534 |
1246 |
0.5 |
|
q |
横折提 (言提) |
1
4 |
5 |
10 |
横折折 (凹折) |
12 |
7 |
10 |
163 |
184 |
347 |
0.1 |
|
r |
横折钩 (同钩) |
1
5 |
4 |
9 |
横弯钩 (力钩) |
|
|
9 |
9076 |
745 |
9821 |
3.6 |
|
s |
横斜钩 (风钩) |
1
6 |
8 |
13 |
横折弯钩 (九钩) |
22 |
9 |
13 |
274 |
288 |
562 |
0.2 |
|
t |
竖折撇 (专钩) |
1
8 |
1 9 |
20 |
竖折撇 |
18 |
|
|
7 |
0 |
7 |
0.0 |
|
u |
竖弯钩 (儿钩) |
1
9 |
1 8 |
22 |
横撇弯钩 (乙钩) |
22 |
|
13 |
2504 |
68 |
2572 |
0.9 |
|
v |
走之折 |
|
|
|
横折折撇 (建折) |
21 |
11 |
12 |
391 |
97 |
488 |
0.2 |
|
w |
横撇弯钩 (耳钩) |
2
3 |
1 0 |
17 |
横撇折折钩 (扬钩) |
|
|
16 |
461 |
0 |
461 |
0.2 |
|
x |
竖折折钩 (马钩) |
2
4 |
2 1 |
19 |
竖折折 (鼎折) |
17 |
20 |
19 |
1208 |
69 |
1277 |
0.5 |
|
y |
横三折钩 (乃钩) |
2
5 |
1 2 |
11 |
横三折 (凸折) |
20 |
13 |
11 |
51 |
1 |
52 |
0.0 |
|
合 计 |
194749 |
80094 |
274843 |
100 |
||||||||
表2: 方案 2
|
字 符 码 |
主 笔 名 |
不同作者的排序 |
副 笔 名 |
不同作者的排序 |
在汉字中使用频数 |
|||||||
|
① |
② |
③ |
① |
② |
③ |
主 笔 |
副 笔 |
合 计 |
百 分 |
|||
|
a |
点 |
|
(4) |
6 |
竖点 |
|
|
|
734 |
74 |
808 |
11.4 |
|
b |
横 |
|
(1) |
1 |
短横 |
|
|
|
940 |
1088 |
2028 |
28.5 |
|
c |
竖 |
|
(2) |
3 |
短竖 |
|
|
|
969 |
274 |
1243 |
17.5 |
|
d |
撇 |
|
(3) |
5 |
竖撇 |
|
|
|
800 |
420 |
1220 |
17.2 |
|
e |
捺 |
|
(5) |
7 |
平捺 |
|
|
|
312 |
3 |
315 |
4.4 |
|
f |
提 |
|
(6) |
2 |
点提 |
|
(6) |
|
81 |
4 |
85 |
1.2 |
|
g |
横 钩 |
3 |
3 |
14 |
横折弯 |
13 |
6 |
|
67 |
0 |
67 |
1.0 |
|
h |
横 折 |
1 |
1 |
8 |
短横折 |
|
|
|
388 |
2 |
390 |
5.5 |
|
i |
横折钩 (同钩) |
1
5 |
4 |
9 |
横弯钩 (力钩) |
|
|
9 |
222 |
22 |
244 |
3.4 |
|
j |
横折提 (言提) |
1
4 |
5 |
10 |
横折折 (凹折) |
12 |
7 |
10 |
1 |
7 |
8 |
0.1 |
|
k |
横三折钩 (乃钩) |
2
5 |
1 2 |
11 |
横三折 (凸折) |
20 |
13 |
11 |
1 |
1 |
2 |
0.0 |
|
l |
横斜钩 (风钩) |
1
6 |
8 |
13 |
横折弯钩 (九钩) |
22 |
9 |
13 |
16 |
14 |
30 |
0.4 |
|
m |
横 撇 |
2 |
2 |
15 |
短横撇 |
|
|
|
75 |
43 |
118 |
1.7 |
|
n |
走之折 |
|
|
|
横折折撇 (建折) |
21 |
11 |
12 |
1 |
4 |
5 |
0.1 |
|
o |
横撇弯钩 (耳钩) |
2
3 |
1 0 |
|
横撇折折钩 (扬钩) |
|
|
16 |
1 |
9 |
10 |
0.1 |
|
p |
竖 钩 |
|
1 6 |
4 |
|
|
|
|
81 |
0 |
81 |
1.1 |
|
q |
竖 提 |
6 |
1 4 |
21 |
|
|
|
|
50 |
11 |
61 |
0.9 |
|
r |
竖 折 |
4 |
1 5 |
18 |
竖弯 |
5 |
17 |
22 |
61 |
24 |
85 |
1.2 |
|
s |
竖弯钩 (儿钩) |
1
9 |
1 8 |
22 |
横撇弯钩 (乙钩) |
22 |
|
13 |
116 |
1 |
117 |
1.6 |
|
t |
竖折折钩 (马钩) |
2
4 |
2 1 |
19 |
竖折折 (鼎折) |
17 |
20 |
19 |
28 |
15 |
43 |
0.6 |
|
u |
竖折撇 (专钩) |
1
8 |
1 9 |
20 |
竖折撇 |
18 |
|
|
1 |
0 |
1 |
0.0 |
|
v |
撇 折 |
7 |
2 3 |
23 |
短撇折 (发折) |
|
|
|
48 |
44 |
92 |
1.3 |
|
w |
撇 点 |
8 |
2 2 |
24 |
撇钩 |
9 |
|
|
13 |
3 |
16 |
0.2 |
|
x |
斜 钩 |
1
1 |
2 4 |
26 |
卧钩 (心钩) |
|
|
27 |
27 |
8 |
35 |
0.5 |
|
y |
弯 钩 |
1
0 |
2 5 |
25 |
直弯钩 |
|
|
|
7 |
3 |
10 |
0.1 |
|
合 计 |
5040 |
2074 |
7114 |
100 |
||||||||
两个方案的唯一差别,是笔画(以主笔为准)的排序不同。笔画的排序决定着汉字在字典中的笔画排序,这是要大家提意见来决定的一个重点。在两个表的主、副笔名之后,列出了三家笔画排序作参考,他们是:
1. 教育部和语委的折笔规范。
该文献不包括平笔,又把竖钩归到竖笔中,所以在这些笔画位置上没有序数。其他25个序数次序基本同表1一致,只有副笔“横折弯”和“横折折撇”,跟着所配的主笔位置,提前了许多。这是因为:方案一的排序原则与该规范是一致的,即先按折数,没有折数的平笔在前,其次是一折、二折、三折的,最后是四折的“横三折钩”(钩也算一折),然后再按笔形次序(横、竖、撇、捺)。这一原则,与语委的“GB13000.1字符集汉字字序(笔画字序)规范”相一致:该汉字字序是先按笔画数,再按笔形次序排的。显然这不是按笔画序列形成的自然字典次序。但对于汉字排序似有两个好处:一是笔画多而复杂、一般使用频度低的汉字都排到了最后面;二是汉字笔顺习惯常有不一致处(参见高更生的“汉字研究”),如果完全按字典顺序排,可能引起位置变化大,不易找到;而笔画数歧义的可能性很小,先按笔画数分类,有笔顺歧义时,也限在同笔画数之内,容易找到。但这也带来两个缺点,一是查字前先要数笔画数;二是本来同首部可以在一起的字,反而被分散了。至少在英文字典里,是没有先按字母数排序的,可能这样做弊多于利之故。在目前的汉字字典里,因为正文都以拼音排序,笔画仅作为第二种检索,所以都先按笔数排。
2. 苏培成“现代汉字学纲要”中引用的张静贤的笔画排序。刘志成的“汉字学”也是引用张静贤的,据说是从“印刷通用汉字字形表”6196个字中总结出来的。分6种基本笔画(即平笔)25种派生笔画(即折笔)。我没有看到原作“现代汉字笔形论”,不知道他是按什么原则排序的,考察其派生笔画的次序,大致按自然字典顺序,但不知为什么把横撇和横钩排到了前面。值得注意的是:基本笔画顺序与我的方案1全部一致,尤其没有把点归到捺、把提归到横中。点中包含竖点,运笔方向与捺不一致;横的频度最高,也不该把提归并进来。当然竖钩也不应归入竖,在“干”、“于”两字中,这钩还是区别两字的唯一特征。
3. 班门斧的“班氏笔画排序法”1.2版。按他在网上的文字叙述,是要贯彻自然的字典顺序的,但却也把非折笔先放在了前面。另外,似乎“钩”也不当作一个折笔,让竖钩排到前面去了。我的方案2就是按这样的原则排的。先把横、竖、撇、捺等频度很高的笔画排在前面有好处,他们是“米”字格的四个方向,是组成其他折笔的基础。但我把特殊的“点”放在最前面,“提”则放在第6位。由于这些笔画频数高,尤其是横和竖,特地分出副笔短横、短竖,以便于组字。
另外,我加了一个这几家都没有的笔画“走之折”,而且作为主笔,其副笔是“横折折撇”。后者频率不高,但各家都作为独立的笔形。走之折按宋体的形态可能会被归到横折中,但在楷体时却近于横撇弯钩(耳钩)。因为走之和横折折撇组成的“建”字底,组字特性一样,都是左下包围,而且后写。在宋体中如把他看作横折,则走之下面的平捺开头就多出一块来,我看不如把它看作走之折的第三折。
两个表的最后4列都是笔画的频度统计数据,表1中列的是在2万多GBK汉字中的静态统计,表2中列的是在我现在用的1130个字根中的静态统计,后者因字根表还不稳定,数据可靠性差。把《现代汉字学纲要》第71页上的数据,与表1的最后一列百分数比较(点合并到捺,所有折合为一种),可见是基本一致的。按这一百分数,把25种笔画分配到键盘的字母键上,百分数高的基本笔画分配在(TY)-(GH)-(VB)的中心线上,其他折笔按百分数的降序分配在两旁。这比较容易,现在也暂时用不到,而要表达这个安排,又要用一张图,故从略。
希望大家帮助我早日把笔画表决定下来。笔画表定案后,我就要开始用贝塞尔的公式重新设计笔画数据,书写笔画的全部程序及笔画组成字根的大部程序和字根表,也要来一翻大修改。这估计不花一年也得花半年时间。除对笔画表的意见外,如果有人掌握PostStript语言或有相关资料,亦希望能无私地帮助我。
陕西省气象局 张时钊 2004 . 7 . 25
邮编:710015 电话:029-86239494
postmaster@chancezoo.net