Dzwebs.Net

撰写电脑技术杂文十余年

中文输入法的发展趋势上篇

Admin | 2009-2-9 18:29:03 | 被阅次数 | 7046

温馨提示!

如果未能解决您的问题,请点击搜索;登陆可复制文章,点击登陆

  一、探讨理想输入法的意义

  汉字编码的最大误区是把输入法仅仅看成是一种技术。基础知识与专业技术的区别:一是基础性即是否处于知识底层;二是应用领域,应用领域特别广的知识一定要纳入基础知识中。书写是文明的基础,而现代社会打字取代书写是必然趋势,当然应归为最基础的教学内容。既然如此,就要求输入法与现有的教学内容相兼容,即需要找一个规范的输入法,一个与文字教学相联系的输入法,并且设法不增加学习负担,甚至相反减少学习负担。显然寻找最佳输入法已超出了本身技术上的意义。

  二、理想输入法的标准

  ①编码应一开始就要站得高看得远,不能只从技术上着想,只想到快和方便。必需与文字教学有紧密地关系。但我认为不必盲目适应现有的教学状况,五笔码和二笔码是公认难学的码,为何推广力度那么大,普及程度远比其它码高呢?原因是教育界认为它们与现有的以笔划为基础的文字教学相兼容。显然要打破这种不合理的垄断,就必需强力要求文字教学以字根为基础。在贾码问答中,我已详细说了以字根为基础的教学取代以笔划为基础的教学的好处。

  ②码元最好只用字母键。码元数越少,重码率越高。码元数高于26的输入法,必然用符号键或数字键作码元,在输入汉字的同时,不但不易输入数字或标点符号,而且记忆量大又繁杂,用数字键时,手指伸缩幅度大易疲劳,又对盲打的准确性有影响。

  ③码长最好为4。五笔码的最大贡献正是在于开创了字根和四码输入法,现大多数键盘输入法都是四码输入法,这是因为以下的看法几乎已成为共识:要想输入快,则码长必需短,因此大于四码的设想常排除在外。小于四码的输入法,目前只有一个,即三码输入法。该码有深厚的理论功底,应加以研究。但三码能容纳的字词数太少(用30个码元最多二万七千个),显然这对认识到以输入词为主输入法的编码人员来说,也是排除在外的设想。再说,那么小的空间,受束缚大,很难自由编码,难以照顾其它各种因素,特别是与文字教学相结合的因素。

  ④选码原则:

  1、易辨认,即无须判断,直接输入。五笔码和二笔码等以笔划为序的码,先要判别笔划顺序才能找到码。这对初学者太难了。
  2、易输入,手感好。有些码已考虑到了利用汉字本身的对称性编码。这样的输入法,手感好,打字流畅。
  3、数量较少。这样记忆量少,也便于初期学习。
  4、码在键盘上分布均匀。这样可以降低重码率。

  ⑤规则尽可能少。有些码规则太繁,让人望而生畏。如规定了键名字、成字字根字、合体字等不同的输入方法,规定了各种拆字原则,规定了复杂的识别码取码方法,以及词组取码规则等等。让规则最少最简单是理想输入法研究课题之一。不过词组取码规则一般公认以下规则是最合理的:二字词,取每字的前两码,三字词,取前两字第一码+后一字前两码,四字和四字以上的词,取前三码的第一码+末字的第一码。其中三字词这样取是因为考虑到用户打字时,一下不能辨别词的字长。

  ⑥因为汉字输入属于基础技能,则应尽可能降低要求。降低语音要求,以便方言严重、拼音不准的人使用。另外尽可能兼顾到“音打”和“形打”的互补作用,当读不出音时“形打”,当想不出字形时“音打”。

  ⑦科学地选择和安排简码字。二级简码字(能用两个码键加空格键输入的汉字)和三级简码(能用三个码键加空格键输入的汉字)越多越好,如码元为25,则二级简码最多可达625个,三级简码可达15625个。理想输入法应尽量接近这些字数字并且让常用字分布在简码上。要做到这一点,关键是怎样选择字根以及其代码。

  ⑧词组的数量大些好。打字总是以打词为主。理想输入法应包含所有常用词、成语和常用俗语。但词组太多会增加重码,因此需要兼顾。另外应备有专业词库和实时造词功能。

  ⑨理想输入法应是易学难精的。既要让所有人都能方便地打出字来,又要让高水平的用户快速地打出各种字符。这方面,已有一些码考虑到了。如郑码和我的贾码。

  三、现有各类输入法的优缺点

  纯音码有两个优点:一是,汉字输入语音结合最佳,即使一下想不出来的字,只要会说一般就能打出。二是容易入门,最受初学者的欢迎。但不要认为纯音码本质上就容易学,纯音码易学的原因是中小学的识字基础。没有中小学的多年训练,纯音码则与形码一样难学。纯音码的缺点有以下几点:一是大部分人语音水平不高,语音不准给汉字输入带来一定的难度,但这问题不大,许多音码已考虑到这一点,设置南方音和模糊音降低语音要求;二是纯音码“看打”不方便。一个字不认识,读不出来则无法输入。不过这不是一个大问题。三是重码率高,这是来自音码自身的弱点,一个无法克服的弱点。一个汉字只有一个音节,因而不管其拼音有多长(最长的有6个字母),一般总只有两个信息即声母和韵母,因此编码工作者想到了用双拼来减少击键次数,提高效率。但这种用增加学习负担换来的效率实在有限,原因是该双码空间远小于262=676,有些如V、I、U、A、O、R代码使用频率极低,而另一些如Z、C、S、L、T、Y代码使用频率又太高,汉字分布极不均匀。因此不但单字的同码现象严重,词组的同码现象也非常多,故在各种编码中成为效率最低的一种。目前效率较高的纯音码是智能整句双拼输入,但在很多情况下输入完句子后都得回头来修改,且无法解决单字输入效率低的问题。因此纯音码不可能成为理想的汉字输入法。

  接下篇…


该杂文来自: 基础知识杂文

上一篇:俺祝福大家的新年祝福语及诸事顺利之祈祷

下一篇:中文输入法的发展趋势下篇

网站备案号:

网站备案号:滇ICP备11001339号-7

版权属性:

Copyright 2007-2021-forever Inc. all Rights Reserved.

联系方式:

Email:dzwebs@126.com QQ:83539231 访问统计