五笔字型输入法
一、认识五笔字型
五笔字型是一种形码,它是按照汉字的字形(笔划、部首)进行编码的,在国内非常普及。下面,简单介绍一下五笔字型的拆分规则。
1. 汉字的笔画
一般从书写形态上认为汉字的笔形有:点、横、竖、撇、捺、挑(提)、钩、(左右)折等八种。
在五笔字型方法中,把汉字的笔划只归结为横、竖、撇、捺(点)、折五种。把“点”归结为“捺”类,是因为两者运笔方向基本一致;把挑(提)归结于“横”类;除竖能代替左钩以外,其他带转折的笔划都归结为“折”类。
2. 笔画的书写顺序
在书写汉字时,应该按照如下规则:先左后右,先上后下,先横后竖,先撇后捺,先内后外,先中间后两边,先进门后关门等。
3. 汉字的部件结构
在五笔字型编码输入方案中,选取了大约130个部件作为组字的基本单元,并把这此部件称为基本字根。众多的汉字全部由它们组合而成。如,明字由日月组成,吕字是由两个口组成;在这些基本字根中有些字根本身就是一个完整的汉字,例如:日月人火手等。
4. 汉字的部位结构
基本字根按一定的方式组成汉字,在组字时这些字根之间的位置关系就是汉字的部位结构。
(1)单体结构 由基本字根独立组成的汉字,例如:目、日、口、田、山等。
(2)左右结构 左右结构的字由左右两部分或左中右三部分构成,例如:朋、引、彻、喉等。
(3)上下结构 上下结构的字由上下两部分或自上往下几部分构成,例如:吕、旦、党、意等。
(4)内外结构 汉字由内外部分构成,例如:国、向、句、匠、达、库、厕、问等。
5.汉字的字型信息
在五笔字型输入法中,为获取的字型信息,把汉字信息分成三类:
1型: 左右部位结构的汉字,例如:肚、拥、咽、枫等。虽然“枫”的右边是两个基本字根按内外型组合成的,但整字仍属于左右型。
2型: 部位结构是上下型的字,例如:字、节、看、意、想、花等。
3型: 称为杂合型。包括部位结构的单字和内外型的汉字,即:没有明显的上下和左右结构的汉字。
在向计算机输入汉字时,只靠告诉计算机该字是由哪几个字根组成的,往往还不够,例如:“叭”和“只”字,都是由“口”和“八”两个字根组成的,为了区别究竟是哪一个字还必须把字型信息告诉计算机。
五笔字型输入法
二、五笔编码方法
1. 五笔的字根及排列
五笔字型输入法,选取了组字能力强、出现次数多的130个左右的部件作为基本字根,其余所有的字,包括那些虽然也能作为字根,但是在五笔字型中没有被选为基本字根的部件,在输入时都要经过拆分成基本字根的组合。
对选出的130多种基本字根,按照其起笔笔划,分成五个区。以横起笔的为第一区,以竖起笔的为第二区,以撇起笔的为第三区,以捺(点)起笔的为第四区,以折起笔的为第五区。
每一区内的基本字根又分成五个位置,也以1、2、3、4、5表示。这样130多个基本字根就被分成了25类,每类平均5-6个基本字根。这25类基本字根安排在除Z键以外的A-Y的25个英文字母键上。五笔字型字根总表以及五笔字型键盘字根排列如下图所示。
在同一个键位上的几个基本字根中,选择一个具有代表性的字根,称为键名。
2. 字根键位的特征
五笔字型输入法把130多个字根分成五区五位,科学地排列在25个英文字母键上便于记忆,也便于操作,其特点如下:
(1)每键平均2-6个基本字根,有一个代表性的字根成为键名,为便于记忆起见,关于键名有一首“键名谱”:
1)(横)区:王、土、大、木、工
2)(竖) 区:目、日、口、田、山
3)(撇) 区:禾、白、月、人、金
4)(捺) 区:言、立、水、火、之
5)(折) 区:已、子、女、又、纟
(2)每一个键上的字根其形态与键名相似。
例如:“王”字键上有一、五、戋、� 、王等; “日”字键上有日、曰、早、虫等字根。
(3)单笔划基本字根的种类和数目与区位编码相对应。
例如一、二、三这三个单笔划字根,分别安排在1区的第一、二、三位置上;
丶、冫、氵、灬这四个单笔划字根,分别安排在4区的第一、二、三、四位上;
丨、刂、川这三个单笔划字根分别安排在2区的第一、二、三位上等。
3.Z键的用法
从五笔字型的字根键位图可见,26个英文字母键只用了A-Y共25个键,Z键用于辅助学习。
当对汉字的拆分一时难以确定用哪一个字根时,不管它是第几个字根都可以用Z键来代替。借助于软件,把符合条件的汉字都显示在提示行中,再键入相应的数字,则可把相应的汉字选择到当前光标位置处。在提示行中还显示了汉字的五笔字型编码,可以作为学习编码规则之用。
五笔字型输入法
三、提高输入速度的方法
五笔字型一般敲四键就能输入一个汉字。为了提高速度,设计了简码输入和词汇码输入方法。
1.简码输入
(1)一级简码字。
对一些常用的高频字,敲一键后再敲一空格键即能输入一个汉字。高频字共25个,如下图键左上角为键名字,键右下角为高频字即一级简码字。
(2)二级简码字。
由单字全码的前两个字根代码接着一空格键组成,最多能输入25×25=625个汉字。
(3)三级简码字。
由单字前三个字根接着一个空格键组成。凡前三个字根在编码中是唯一的,都选作三级简码字,约4300多个。虽敲键次数未减少。但省去了最后一码的判别工作,仍有助于提高输入速度。
2.词汇输入
汉字以字作为基本单位,由字组成词。在句子中若把词作为输入的基本单位,则速度更快。五笔字型中的词和字一样,一词仍只需四码。用每个词中汉字的前一、二个字根组成一个新的字码,与单个汉字的代码一样,来代表一条词汇。词汇代码的取码规则如下:
(1)双字词:分别取每个字的前两个字根构成词汇简码。
例如:“计算”取“言、十 、目”构成编码(YFIH);
(2)三字词:前二个字各取一个字根,第三个取前二个字根作为编码。
例如:“操作员”取“扌、亻、口、贝”构成一个编码(RWKM);“解放军”取“刀、方、冖、车”作为编码(QYPL)等等。
(3)四字词:每字取第一个字根作为编码。
例如:“程序设计”取“禾、广、言、言”(TYYY)构成词汇编码。
(4)多字词:取一、二、三、末四个字的第一个字根作为构成编码。
例如:“中华人民共和国”取“口、人、人、口”(KWWL),“电子计算机”取“日、子、言、木”(JBYS)等。
五笔字型中的字和词都是四码。因此,词语占用了同一个编码空间。之所以词字能共同容纳于一体,是由于每个字四键,共有25×25×25×25种可能的字编码,约39万个,大量的码空闲着。 对词汇编码而言,由于词和字的字根组合分布规律不同,它们在汉字编码空间中各占据着基本上互不相交的一部分。因此词和字的输入完全一样。
3.重码与容错
如果一个编码对应着几个汉字,这几个称为重码字;几个编码对应一个汉字,这几个编码称为汉字的容错码。
在五笔字型中,当输入重码时,重码字显示在提示行中,较常用的字排在第一个位置上,并用数字指出重码字的序号,如果你要的就是第一个字,可继续输入下一个字,该字自动跳到当前光标位置。其他重码字要用数字键加以选择。
例如:“嘉”字和“喜”字,都分解(FKUK),因“喜”字较常用,它排在第一位,“嘉”字排在第二位。若你需要“嘉”字则要用数字键2来选择。
为了减少重码字,把不太常用的重码字设计成容错码字即把它的最后一码修改为L,例如:把“嘉”字的码定义为FKUL,这样用FKUL输入,则获得唯一的“嘉”字。
在汉字中有些字的书写顺序往往因人而异,为了能适应这种情况,允许一个字有多种输入码,这些字就称为容错字。在五笔字型编码输入方案中,容错字有500多种。
你要的是识别码吧???那我再补充说明一下:
当一个字拆不够4个码元时,它的输入编码是:先打完码元码,再追加一个“末笔字型识别码”,简称“识别码”。
一、“识别码”的组成:它是由“末笔”代号加“字型”代号而构成的一个附加码。由于教不得法,以前许多人对“识别码”望而生畏。其实,按如下做法,你只要5分钟定能学会:“1”型(左右型)字:码元打完之后,补打1个末笔画即等同于加了“识别码”。例: 沐:氵木丶(“丶”为末笔,补1个“丶”)汀:氵丁丨(“丨”为末笔,补1个“丨”)洒:氵西一(“一”为末笔,补1个“一”)
“2”型(上下型)字:码元打完之后,补打由2个末笔画复合构成的“码元”即等同于加了“识别码”。例:华:亻匕十(末笔为“丨”,2型,补打“”作为“识别码”)字:宀子二(末笔为“一”,2型,补打“二”作为“识别码”)参:厶大彡(末笔为“丿”,2型,补打“”作为“识别码”)
“3”型(杂合型)字:码元打完之后,补打由3个末笔画复合而成的“码元”即等同于加了“识别码”。例:同:冂一口三(末笔为“一”,3型,补打“三”作为“识别码”)串:口口丨(末笔为“丨”,3型,补打“”作为“识别码”)国:囗王丶氵(末笔为“丶”,3型,补打“氵”作为“识别码”)至于为什么这些“笔画”可以起到“识别码”的作用,你只要仔细研究一下区位号的设计与“识别码”的定义便会恍然大悟。
二、关于“末笔”的几项说明:(只适用于五笔字型86版)
l、 关于“力、刀、九、匕”。鉴于这些码元的笔顺常常因人而异,“五笔字型”中特别规定,当它们参加“识别”时,一律以其“伸”得最长的“折”笔作为末笔。如:男:田力(末笔为“乙”,2型)花:艹亻匕(末笔为“乙”,2型) 。带“框框”的“国、团”与带走之的“进、远、延”等,因为是一个部分被另一个部分包围,我们规定:视被包围部分的“末笔”为“末笔”。如:进:二刂辶(末笔“丨”3型,加“”作为“识别码”)远:二儿辶巛(末笔“乙”3型,加“巛”作为“识别码”)团:囗十丿彡(末笔“丿”3型,加“彡”作为“识别码”)哉:十戈口三(末笔“一”3型,加“三”作为“识别码”)
2、 “我”“戋”“成”等字的“末笔”。由于因人而异,故遵从“从上到下”的原则,一律规定撇“丿”为其末笔。如:我:丿扌乙丿(TRNT,取一二三末,只取4码)戋:戋一一丿(GGGT,成码元,先“报户口”再取1、2、末笔)成:厂乙乙丿(DNNT,取一二三末,只取4码)
3、 单独点:对于“义、太、勺”等字中的“单独点”,离码元的距离很难确定,可远可近,我们干脆认为这种“单独点”与其附近的码元是“相连”的。既然“连”在一起,便属于杂合型(3型)。其中“义”的笔顺,还需按上述“从上到下”的原则,认为是“先点后撇”。如:义:丶 氵(末笔为“丶”3型,“氵”即为识别码)太:大丶氵(末笔为“丶”3型,“氵”即为识别码)勺:勹丶氵(末笔为“丶”3型,“氵”即为识别码)
现在学打字的话,还是学拼音吧,五笔已经在被淘汰的边缘了
字根表背熟了,就差不多了