稿

 

无字库汉字是用笔画组成全部汉字,自然首先要有一个完整的标准笔画表。目前国家好像还没有这样的笔画表。我只搜集到20011219日由教育部和语委发布的“GB13000.1字符集汉字折笔规范”。它列出了25种折笔,但不包含不转弯的所谓“平笔”。以前用笔画进行排序检索时,一般只分五种:横、竖、撇、捺(包含点)、折,前4种就是平笔了。要用它们来组字,当然不能分的那么粗,尤其不能把二十多种折笔都归并为一种,虽然他们的使用总频数比不上一个“横”笔画。也有研究者把笔画归为6类、8类的,归类不很一致。但如果要把所有不同的笔画都列出来,则基本都差不多,约3040种。一年多前,我采用2×25=50种,分配在25个字母键上,用它们已可组出GBK 汉字21000多个。最后还有了3个大写字母对应的副笔没有用过,而GBK汉字中要用到的“撇钩”“竖折撇”(虽然都只在一个汉字中用到,我暂用其他笔画代替了),以及“扬钩”都没有列入。为了进一步研究,完善无字库系统,我急需一个完备的笔画表。现在我根据过去的经验及现在看到的资料,拟了两个方案(如图),希望大家审阅并提出意见,尽力使它更完满些,希望在新方案基础上修改笔画数据,改进组字程序,做到以后可以不翻工或少翻工。

因为现有的字库,不能显示我这里用到的全部笔画,所以只得用图形表示。图中笔画都凑成对,分别用25个字母代表。小写字母表示主笔,每个主笔配一个副笔,副笔用大字字母代表。一般情况下,主、副笔互相代替写出来的汉字虽不正确,但大致还可认出是什么字。不过有个别副笔是特别安排的,组字频率很低,也难以代替主笔。我不知道,还会不会漏掉什么特殊笔画,如有人看到过这种笔画(以宋体、楷体为准),请告诉我,可以补进去。现在图中竖钩、竖提的副笔是硬凑上去的,可能没有用。

图中两个方案各有一张对应的表。在表中,第一列字母码后列出了主、副笔的名称。我没有用它们的全称,因为全称很长,有几个弯就有几个“折”字,不好读,也不好记。我更曾用一个包含该笔画的常用字来命名较长的折笔,如“儿钩”、“乃钩”、“凸折”、“鼎折”等,不知可取否,现注在括弧中。

 

1  方案 1

不同作者的排序

不同作者的排序

在汉字中使用频数

a

 

1

1

  短横

 

 

 

34502

43430

77932

284

b

 

2

3

  短竖

 

 

 

33770

14060

47830

174

c

 

3

5

  竖撇

 

 

 

28664

12878

41542

151

d

 

4

6

  竖点

 

 

 

36926

4213

41139

150

  e

 

5

7

  平捺

 

 

 

9631

410

10041

37

f

 

6

2

  点提

 

(6)

 

5608

1346

6954

25

g

 

1 6

4

 

 

 

 

3255

0

3255

12

h

1

1

8

短横折

 

 

 

13868

 

13868

50

i

2

2

15

短横撇

 

 

 

2557

1414

3971

14

j

3

3

14

横折弯

13

6

 

2508

0

2508

 09

k

4

1 5

18

  竖弯

5

17

22

2194

270

2464

 09

l

6

1 4

21

 

 

 

 

1490

0

1490

 05

m

7

2 3

23

 短撇折

(发折)

 

 

 

3383

0

3383

 12

n

8

2 2

24

   撇钩

9

 

 

1099

0

1099

 04

o

1 0

2 5

25

直弯钩

 

 

 

447

87

534

 02

p

1 1

2 4

26

   卧钩

(心钩)

 

 

27

712

534

1246

 05

q

横折提

(言提)

1 4

5

10

横折折

(凹折)

12

7

10

163

184

347

 01

r

横折钩

(同钩)

1 5

4