稿

 

无字库汉字是用笔画组成全部汉字,自然首先要有一个完整的标准笔画表。目前国家好像还没有这样的笔画表。我只搜集到20011219日由教育部和语委发布的“GB13000.1字符集汉字折笔规范”。它列出了25种折笔,但不包含不转弯的所谓“平笔”。以前用笔画进行排序检索时,一般只分五种:横、竖、撇、捺(包含点)、折,前4种就是平笔了。要用它们来组字,当然不能分的那么粗,尤其不能把二十多种折笔都归并为一种,虽然他们的使用总频数比不上一个“横”笔画。也有研究者把笔画归为6类、8类的,归类不很一致。但如果要把所有不同的笔画都列出来,则基本都差不多,约3040种。一年多前,我采用2×25=50种,分配在25个字母键上,用它们已可组出GBK 汉字21000多个。最后还有了3个大写字母对应的副笔没有用过,而GBK汉字中要用到的“撇钩”“竖折撇”(虽然都只在一个汉字中用到,我暂用其他笔画代替了),以及“扬钩”都没有列入。为了进一步研究,完善无字库系统,我急需一个完备的笔画表。现在我根据过去的经验及现在看到的资料,拟了两个方案(如图),希望大家审阅并提出意见,尽力使它更完满些,希望在新方案基础上修改笔画数据,改进组字程序,做到以后可以不翻工或少翻工。

因为现有的字库,不能显示我这里用到的全部笔画,所以只得用图形表示。图中笔画都凑成对,分别用25个字母代表。小写字母表示主笔,每个主笔配一个副笔,副笔用大字字母代表。一般情况下,主、副笔互相代替写出来的汉字虽不正确,但大致还可认出是什么字。不过有个别副笔是特别安排的,组字频率很低,也难以代替主笔。我不知道,还会不会漏掉什么特殊笔画,如有人看到过这种笔画(以宋体、楷体为准),请告诉我,可以补进去。现在图中竖钩、竖提的副笔是硬凑上去的,可能没有用。

图中两个方案各有一张对应的表。在表中,第一列字母码后列出了主、副笔的名称。我没有用它们的全称,因为全称很长,有几个弯就有几个“折”字,不好读,也不好记。我更曾用一个包含该笔画的常用字来命名较长的折笔,如“儿钩”、“乃钩”、“凸折”、“鼎折”等,不知可取否,现注在括弧中。

 

1  方案 1

不同作者的排序

不同作者的排序

在汉字中使用频数

a

 

1

1

  短横

 

 

 

34502

43430

77932

284

b

 

2

3

  短竖

 

 

 

33770

14060

47830

174

c

 

3

5

  竖撇

 

 

 

28664

12878

41542

151

d

 

4

6

  竖点

 

 

 

36926

4213

41139

150

  e

 

5

7

  平捺

 

 

 

9631

410

10041

37

f

 

6

2

  点提

 

(6)

 

5608

1346

6954

25

g

 

1 6

4

 

 

 

 

3255

0

3255

12

h

1

1

8

短横折

 

 

 

13868

 

13868

50

i

2

2

15

短横撇

 

 

 

2557

1414

3971

14

j

3

3

14

横折弯

13

6

 

2508

0

2508

 09

k

4

1 5

18

  竖弯

5

17

22

2194

270

2464

 09

l

6

1 4

21

 

 

 

 

1490

0

1490

 05

m

7

2 3

23

 短撇折

(发折)

 

 

 

3383

0

3383

 12

n

8

2 2

24

   撇钩

9

 

 

1099

0

1099

 04

o

1 0

2 5

25

直弯钩

 

 

 

447

87

534

 02

p

1 1

2 4

26

   卧钩

(心钩)

 

 

27

712

534

1246

 05

q

横折提

(言提)

1 4

5

10

横折折

(凹折)

12

7

10

163

184

347

 01

r

横折钩

(同钩)

1 5

4

9

横弯钩

(力钩)

 

 

9

9076

745

9821

 36

s

横斜钩

(风钩)

1 6

8

13

横折弯钩

(九钩)

22

9

13

274

288

562

 02

t

竖折撇

(专钩)

1 8

1 9

20

竖折撇

18

 

 

7

0

7

 00

u

竖弯钩

(儿钩)

1 9

1 8

22

横撇弯钩

(乙钩)

22

 

13

2504

68

2572

 09

v

走之折

 

 

 

横折折撇

(建折)

21

11

12

391

97

488

 02

w

横撇弯钩

(耳钩)

2 3

1 0

17

横撇折折钩

(扬钩)

 

 

16

461

0

461

 02

x

竖折折钩

(马钩)

2 4

2 1

19

竖折折

(鼎折)

17

20

19

1208

69

1277

 05

y

横三折钩

(乃钩)

2 5

1 2

11

横三折

(凸折)

20

13

11

51

1

52

00

                                     

194749

80094

274843

100

 

2  方案 2

不同作者的排序

不同作者的排序

在汉字中使用频数

a

 

4

6

  竖点

 

 

 

734

74

808

114

b

 

1

1

  短横

 

 

 

940

1088

2028

285

c

 

2

3

  短竖

 

 

 

969

274

1243

175

d

 

3

5

  竖撇

 

 

 

800

420

1220

172

  e

 

5

7

  平捺

 

 

 

312

3

315

44

f

 

6

2

  点提

 

(6)

 

81

4

85

12

g

3

3

14

横折弯

13

6

 

67

0

67

 10

h

1

1

8

短横折

 

 

 

388

2

390

55

i

横折钩

(同钩)

1 5

4

9

横弯钩

(力钩)

 

 

9

222

22

244

 34

j

横折提

(言提)

1 4

5

10

横折折

(凹折)

12

7

10

1

7

8

 01

k

横三折钩

(乃钩)

2 5

1 2

11

横三折

(凸折)

20

13

11

1

1

2

00

l

横斜钩

(风钩)

1 6

8

13

横折弯钩

(九钩)

22

9

13

16

14

30

 04

m

2

2

15

短横撇

 

 

 

75

43

118

17

n

走之折

 

 

 

横折折撇

(建折)

21

11

12

1

4

5

 01

o

横撇弯钩

(耳钩)

2 3

1 0

 

横撇折折钩

(扬钩)

 

 

16

1

9

10

 01

p

 

1 6

4

 

 

 

 

81

0

81

11

q

6

1 4

21

 

 

 

 

50

11

61

 09

r

4

1 5

18

  竖弯

5

17

22

61

24

85

 12

s

竖弯钩

(儿钩)

1 9

1 8

22

横撇弯钩

(乙钩)

22

 

13

116

1

117

 16

t

竖折折钩

(马钩)

2 4

2 1

19

竖折折

(鼎折)

17

20

19

28

15

43

 06

u

竖折撇

(专钩)

1 8

1 9

20

竖折撇

18

 

 

1

0

1

 00

v

7

2 3

23

 短撇折

(发折)

 

 

 

48

44

92

 13

w

8

2 2

24

   撇钩

9

 

 

13

3

16

 02

x

1 1

2 4

26

   卧钩

(心钩)

 

 

27

27

8

35

 05

y

1 0

2 5

25

直弯钩

 

 

 

7

3

10

 01

                                     

5040

2074

7114

100

 

两个方案的唯一差别,是笔画(以主笔为准)的排序不同。笔画的排序决定着汉字在字典中的笔画排序,这是要大家提意见来决定的一个重点。在两个表的主、副笔名之后,列出了三家笔画排序作参考,他们是:

1 教育部和语委的折笔规范。

该文献不包括平笔,又把竖钩归到竖笔中,所以在这些笔画位置上没有序数。其他25个序数次序基本同表1一致,只有副笔“横折弯”和“横折折撇”,跟着所配的主笔位置,提前了许多。这是因为:方案一的排序原则与该规范是一致的,即先按折数,没有折数的平笔在前,其次是一折、二折、三折的,最后是四折的“横三折钩”(钩也算一折),然后再按笔形次序(横、竖、撇、)。这一原则,与语委的“GB13000.1字符集汉字字序(笔画字序)规范”相一致:该汉字字序是先按笔画数,再按笔形次序排的。显然这不是按笔画序列形成的自然字典次序。但对于汉字排序似有两个好处:一是笔画多而复杂、一般使用频度低的汉字都排到了最后面;二是汉字笔顺习惯常有不一致处(参见高更生的“汉字研究”),如果完全按字典顺序排,可能引起位置变化大,不易找到;而笔画数歧义的可能性很小,先按笔画数分类,有笔顺歧义时,也限在同笔画数之内,容易找到。但这也带来两个缺点,一是查字前先要数笔画数;二是本来同首部可以在一起的字,反而被分散了。至少在英文字典里,是没有先按字母数排序的,可能这样做弊多于利之故。在目前的汉字字典里,因为正文都以拼音排序,笔画仅作为第二种检索,所以都先按笔数排。

2 苏培成“现代汉字学纲要”中引用的张静贤的笔画排序。刘志成的“汉字学”也是引用张静贤的,据说是从“印刷通用汉字字形表”6196个字中总结出来的。分6种基本笔画(即平笔)25种派生笔画(即折笔)。我没有看到原作“现代汉字笔形论”,不知道他是按什么原则排序的,考察其派生笔画的次序,大致按自然字典顺序,但不知为什么把横撇和横钩排到了前面。值得注意的是:基本笔画顺序与我的方案1全部一致,尤其没有把点归到捺、把提归到横中。点中包含竖点,运笔方向与捺不一致;横的频度最高,也不该把提归并进来。当然竖钩也不应归入竖,在“干”、“于”两字中,这钩还是区别两字的唯一特征。

3 班门斧的“班氏笔画排序法”1.2版。按他在网上的文字叙述,是要贯彻自然的字典顺序的,但却也把非折笔先放在了前面。另外,似乎“钩”也不当作一个折笔,让竖钩排到前面去了。我的方案2就是按这样的原则排的。先把横、竖、撇、捺等频度很高的笔画排在前面有好处,他们是“米”字格的四个方向,是组成其他折笔的基础。但我把特殊的“点”放在最前面,“提”则放在第6位。由于这些笔画频数高,尤其是横和竖,特地分出副笔短横、短竖,以便于组字。

另外,我加了一个这几家都没有的笔画“走之折”,而且作为主笔,其副笔是“横折折撇”。后者频率不高,但各家都作为独立的笔形。走之折按宋体的形态可能会被归到横折中,但在楷体时却近于横撇弯钩(耳钩)。因为走之和横折折撇组成的“建”字底,组字特性一样,都是左下包围,而且后写。在宋体中如把他看作横折,则走之下面的平捺开头就多出一块来,我看不如把它看作走之折的第三折。

两个表的最后4列都是笔画的频度统计数据,表1中列的是在2万多GBK汉字中的静态统计,表2中列的是在我现在用的1130个字根中的静态统计,后者因字根表还不稳定,数据可靠性差。把《现代汉字学纲要》第71页上的数据,与表1的最后一列百分数比较(点合并到捺,所有折合为一种),可见是基本一致的。按这一百分数,把25种笔画分配到键盘的字母键上,百分数高的基本笔画分配在(TY)-(GH)-(VB)的中心线上,其他折笔按百分数的降序分配在两旁。这比较容易,现在也暂时用不到,而要表达这个安排,又要用一张图,故从略。

希望大家帮助我早日把笔画表决定下来。笔画表定案后,我就要开始用贝塞尔的公式重新设计笔画数据,书写笔画的全部程序及笔画组成字根的大部程序和字根表,也要来一翻大修改。这估计不花一年也得花半年时间。除对笔画表的意见外,如果有人掌握PostStript语言或有相关资料,亦希望能无私地帮助我。

 

        陕西省气象局  张时钊  2004 . 7 . 25

邮编:710015   电话:02986239494

http://www.chancezoo.net

postmaster@chancezoo.net