專利名稱:字首部件拼音輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于電腦漢字編碼輸入方法,也就是計(jì)算機(jī)漢字編碼輸入法。因?yàn)楸据斎?法的形部編碼要先判定多筆畫(huà)基本部件是否位于漢字的字首,所以稱為字首部件拼音輸入 法,還涉及了為實(shí)現(xiàn)這一輸入法的鍵盤(pán)。
背景技術(shù):
鍵盤(pán)輸入法是目前漢字輸入法中技術(shù)最成熟,使用最廣泛的輸入法。鍵盤(pán)輸入的 特點(diǎn)是必須對(duì)輸入的漢字進(jìn)行編碼,漢字編碼是指用一組代碼表示一個(gè)漢字,按漢字編碼 所在鍵,通常要按1 4鍵輸入一個(gè)漢字。鍵盤(pán)輸入按編碼劃分,可分為音碼、形碼、音形碼音碼以漢語(yǔ)拼音為基礎(chǔ),利用漢字的讀音進(jìn)行編碼。音碼的優(yōu)點(diǎn)是使用方便,只要 會(huì)懂漢字拼音,就可以進(jìn)行輸入,簡(jiǎn)單易學(xué),所以使用最為廣泛。缺點(diǎn)是同音字多,導(dǎo)致單字 重碼率高,漢字輸入速度慢,采用智能拼音輸入法也只能部分提高輸入速度,無(wú)法完全避免 同音字選擇。還有對(duì)不認(rèn)識(shí)的字無(wú)法用拼音直接輸入,對(duì)發(fā)音不準(zhǔn)的字和冷僻字也不能很 快輸入。形碼利用漢字的字形特征進(jìn)行編碼,克服了音碼重碼率高、輸入速度慢等缺點(diǎn),但 往往漢字部件太多,記憶麻煩,有時(shí)拆分也麻煩。有的形碼采用將漢字五種基本筆畫(huà)二二組 合的方法,漢字部件少,記憶方便,但卻付出了不夠直觀,將漢字部件拆散了的代價(jià)。雖然形 碼雖然聲稱對(duì)不認(rèn)識(shí)的漢字也能迅速輸入,但對(duì)于一個(gè)文盲來(lái)說(shuō),他打字的速度是要受限 制的,根本原因是漢字的字與詞無(wú)明顯間隔,不知道哪個(gè)是詞組,無(wú)法利用詞組輸入,因此 形碼輸入人員也要有文化。音形碼利用漢字的語(yǔ)音特征和漢字的字形特征編碼。它利用了漢字的音碼和形碼 各自的優(yōu)點(diǎn),兼顧了漢字的音和形,往往較為簡(jiǎn)單,容易學(xué)習(xí)和記憶,有的音形碼比如三五 音碼等輸入法重碼率低,輸入速度足以與任何形碼相比,利用整個(gè)拼音參與編碼的音形碼 還有利于推廣普通話,優(yōu)點(diǎn)十分明顯。音形碼的缺點(diǎn)是打字時(shí)在音和形之間思維不斷轉(zhuǎn)換, 容易疲勞。當(dāng)然對(duì)熟練的打字者來(lái)說(shuō),往往已熟記漢字的編碼,見(jiàn)字識(shí)碼,根本不存在音和 形之間思維轉(zhuǎn)換問(wèn)題。還要指出的是,只用漢字聲母參與編碼的音形碼,由于必須舍棄韻 母,與人們的習(xí)慣思維不符,才特別存在音形思維轉(zhuǎn)換問(wèn)題。如果完整地利用了漢字的聲母 和韻母,即利用了漢字的整個(gè)拼音,并且規(guī)定音碼部分在先,形部編碼部分在后的話,則思 維不大需要在音和形之間不停轉(zhuǎn)換,基本上不會(huì)影響思維。因?yàn)樵谝话愕奈恼轮?,大多?shù) 都是詞語(yǔ),平常打字時(shí),往往盡量采用詞組輸入的方式,因此大部分內(nèi)容都可用拼音詞組輸 入。還有一些常用的字也可用拼音輸入,即便要用到形部編碼,一般也只要輸入形部編碼的 第一碼,而形部編碼的第一碼多為漢字的偏旁部首,偏旁部首數(shù)量是有限的,且常見(jiàn)偏旁部 首數(shù)量更少,一般都有固定編碼代碼,是很容易記住形部編碼的第一碼的。真正需要輸入形 部編碼第二碼的單字是很少的,只有這少部分漢字才不大容易記住形部編碼,由于輸入形 部編碼的第一碼后,第二碼會(huì)提示出來(lái),實(shí)際上沒(méi)有多大必要記住形部編碼第二碼,因此這種音形碼基本上不會(huì)影響思維,思維甚至比形碼更簡(jiǎn)單。所以如果想發(fā)明音形碼,為避免音 形轉(zhuǎn)換麻煩,要盡量利用漢字的整個(gè)拼音輸入,而不要只利用拼音的首字母或聲母。受方言 的影響,有些人讀不準(zhǔn)某些漢字的拼音,但這也可通過(guò)南方模糊音解決,而且多利用拼音輸 入漢字也有利于推廣普通話。正因?yàn)槿绱?,整個(gè)漢字拼音在先的音形碼相對(duì)與其它音碼、形 碼、只用漢字拼音首字母的音形碼來(lái)說(shuō),越來(lái)越顯示出其優(yōu)越性??梢舸a使用全拼的話,則存在著全拼的碼長(zhǎng)過(guò)長(zhǎng),輸入不便的問(wèn)題,使用雙拼則能 使碼長(zhǎng)大為縮短,可目前的大多數(shù)雙拼的韻母排列都比較難記,要記什么口訣,所幸的是本 人發(fā)明了幾種新的雙拼,由于發(fā)明人是王治陽(yáng),所以稱為王治陽(yáng)雙拼,已申請(qǐng)專利,很簡(jiǎn)單 易學(xué),不要記口訣,幾分鐘就可學(xué)會(huì),記憶雙拼已不成問(wèn)題。因此發(fā)明音形碼的關(guān)鍵是發(fā)明 出簡(jiǎn)單易學(xué)且能有效區(qū)分同音字的方法,這就要靠音形碼的形部編碼設(shè)計(jì)簡(jiǎn)單合理。有的 輸入法也稱形部編碼為輔助碼。然而目前各種利用了整個(gè)拼音的音形碼的形部編碼往往存 在漢字部件過(guò)多或部件不夠直觀規(guī)范或取碼規(guī)則不合理或重碼多等問(wèn)題。如何解決這個(gè)問(wèn) 題是一個(gè)長(zhǎng)期未能解決的大難題。針對(duì)于此,本人發(fā)明了漢字碼輸入法,它在王治陽(yáng)雙拼后,再利用27個(gè)左右的多 筆畫(huà)部件和五種基本筆畫(huà)輸入形部編碼,具有漢字部件簡(jiǎn)單、直觀、規(guī)范的優(yōu)點(diǎn),但編碼時(shí) 要判斷是否位于漢字的正左上方,適合高速輸入,但略會(huì)影響頭腦反應(yīng),因此適合專業(yè)打字 員,對(duì)普通人員沒(méi)太大必要。另外基本筆畫(huà)排列在標(biāo)點(diǎn)符號(hào)鍵上,也不太方便,因此要還需 要改進(jìn)形部編碼取碼規(guī)則。
發(fā)明內(nèi)容
這樣,目前的漢字輸入法要么漢字部件不規(guī)范或選取漢字部件過(guò)多;要么碼長(zhǎng)太 長(zhǎng);要么重碼過(guò)高,影響輸入速度;要么只利用漢字的聲母或拼音首字母;要么不夠直觀; 要么取碼規(guī)則不太合理,會(huì)影響頭腦反應(yīng),都沒(méi)能很好解決簡(jiǎn)單的不快速,快速的不簡(jiǎn)單這 一技術(shù)難題,輸入漢字不甚方便。本發(fā)明的目的是提供一種漢字部件規(guī)范直觀、簡(jiǎn)單易學(xué)、取碼規(guī)則合理、輸入漢字 簡(jiǎn)便快捷的計(jì)算機(jī)漢字編碼輸入方法,那就是字首部件拼音輸入法。為達(dá)到字首部件拼音輸入法的目的,本發(fā)明規(guī)定字首部件拼音輸入法的編碼由音 碼和形部編碼這兩個(gè)部分組成。音碼部分建議采用王治陽(yáng)雙拼,占二碼。形部編碼部分也 最多占二碼。當(dāng)然音碼也可用全拼或其它雙拼或注音字母拼音或不完整拼音。音碼部分很多人喜歡采用全拼,因?yàn)槿锤静槐貙W(xué)習(xí),但為提高輸入速度,建議 采用雙拼,最好采用王治陽(yáng)雙拼。王治陽(yáng)雙拼對(duì)那些按漢語(yǔ)聲韻互補(bǔ)規(guī)律中沒(méi)被合并的多 個(gè)字母組成的韻母按第一個(gè)字母分為a、O、e、i、u區(qū),每區(qū)又按韻母?jìng)€(gè)數(shù)多少以及a、ο、e、 士、11、114的順序排列,極具規(guī)律性,當(dāng)然也可不按韻母的個(gè)數(shù),只按3、0』」、11、114的順序 將韻母分區(qū)排列。唯一需要記憶的是雙拼韻母的合并規(guī)律。在記憶雙拼韻母合并規(guī)律時(shí), 只要記住以a、ong結(jié)尾的多個(gè)字母的韻母合并,以ang結(jié)尾的4個(gè)字母的韻母合并排列就 是,ia被ua合并,iang被uang合并,iong被ong合并,以U開(kāi)頭的多個(gè)字母的韻母均被 以u(píng)開(kāi)頭的多個(gè)字母的韻母合并,另外Ui被ν合并,UO被ο合并,讀音簡(jiǎn)記為“為余”(為 我),“我窩”。形部編碼也由兩個(gè)代碼組成,本發(fā)明優(yōu)選了五種基本筆畫(huà)和27個(gè)左右的多筆畫(huà)部件參與編碼,這五種基本筆畫(huà)和27個(gè)左右的多筆畫(huà)部件被統(tǒng)稱為基本部件,全部選自漢 字的偏旁部首,既簡(jiǎn)單常見(jiàn)又直觀,并且數(shù)量少,容易記憶。由于國(guó)家語(yǔ)委將五種基本筆畫(huà) 也稱為漢字部件,因此在本發(fā)明中稱五種基本筆畫(huà)稱為單筆畫(huà)部件,而其它27個(gè)左右的優(yōu) 選的漢字部件由多個(gè)筆畫(huà)組成,稱為多筆畫(huà)部件。在形部編碼時(shí)要優(yōu)先按筆畫(huà)多的基本部 件編碼,否則由于多筆畫(huà)部件可拆分成單筆畫(huà)部件,若按單筆畫(huà)部件編碼的話,選取多筆畫(huà) 部件就無(wú)意義。形部編碼的取碼規(guī)則是若按書(shū)寫(xiě)順序,某個(gè)漢字的第一個(gè)基本部件為多筆畫(huà)部件,則按書(shū)寫(xiě)順序取該漢 字的前二個(gè)基本部件的相應(yīng)代碼編碼;其他漢字則按書(shū)寫(xiě)順序取第一個(gè)和最末一個(gè)基本部 件的相應(yīng)代碼編碼;這就是說(shuō),若某個(gè)漢字的第一個(gè)基本部件為單筆畫(huà)部件,則按書(shū)寫(xiě)順序 取第一個(gè)和最末一個(gè)基本部件的相應(yīng)代碼編碼;只有一個(gè)基本部件的漢字就取這個(gè)基本部 件的相應(yīng)代碼編碼。還要特別指出的是之所以不規(guī)定所有的漢字都按書(shū)寫(xiě)順序取前二個(gè)基本部件的 代碼或都取首個(gè)、末個(gè)基本部件的代碼編碼,是因?yàn)檫@樣規(guī)定的話表面上會(huì)使形部編碼的 取碼規(guī)則顯得更簡(jiǎn)單易記,實(shí)際上卻會(huì)造成大量的重碼,或付出增加大量多筆畫(huà)部件的代 價(jià)。如果規(guī)定多筆畫(huà)部件處于整個(gè)漢字的字首時(shí),按書(shū)寫(xiě)順序取該漢字的第一個(gè)和最末一 個(gè)基本部件的相應(yīng)代碼編碼,而其他的漢字按書(shū)寫(xiě)順序取第一、二個(gè)基本部件的相應(yīng)代碼 編碼的話,也會(huì)付出增加大量重碼的代價(jià)??梢?jiàn)這種形部編碼的取碼規(guī)則是不能隨便改變 的。這是本人在經(jīng)歷長(zhǎng)達(dá)十六年潛心研究后終于設(shè)計(jì)出的其他任何輸入法都沒(méi)想到過(guò)的形 部編碼取碼規(guī)則。下面再解說(shuō)優(yōu)選基本部件的方法。在國(guó)標(biāo)6763個(gè)漢字中,合體字占了絕大多數(shù), 約為95%。同音又同偏旁部首的合體字?jǐn)?shù)量較多,約有五、六百對(duì)。其中?、*、口、木、 、
韋^、女、i、個(gè)、月、蟲(chóng)、土、鄉(xiāng)、火、廣、、足、山、石、日、王j、魚(yú)、禾等偏旁部首產(chǎn)生的
同音字較多,為降低重碼,這些偏旁被選了出來(lái),分別用一個(gè)字母或別的符號(hào)編碼,當(dāng)然個(gè) 別偏旁也可棄而不選。才、包括卒產(chǎn)生的同音字也較多,考慮到才、與卒屬于不同的部首,總共 只能減少五對(duì)左右的重碼,因此在字首部件拼音輸入法編碼實(shí)例中就棄而不選。而有的偏 旁部首如“田”、“目,,等雖然常用,可只有一、二對(duì)同音字,甚至沒(méi)有同音字,就棄而不選,當(dāng) 然要選的話也可選。本人研究后還發(fā)現(xiàn),同音同偏旁部首的合體字除偏旁部首以外的部分 的第一筆為同類基本筆畫(huà)的情況出乎意外的少,只有100多對(duì),這一發(fā)現(xiàn)是只選用5種基本 筆畫(huà)和二三十個(gè)基本部件參與編碼的根據(jù)所在。其中部件“十”和“ ”出現(xiàn)得比較多,有 四、五對(duì)重碼,它們也可被選出,分別用別的字母或符號(hào)編碼。考慮到漢字部件“十”往往不 出現(xiàn)在漢字的字首,而“ ”還在漢字的字首出現(xiàn)得較多,因此可以將部件“ ”用一個(gè)字母 或別的符號(hào)編碼。當(dāng)然部件“ + ”也可棄而不選,在編碼實(shí)例中就不選。這樣,25個(gè)多筆畫(huà) 部件和五種基本筆畫(huà)被優(yōu)選出來(lái),排列到鍵盤(pán)上,將這25個(gè)多筆畫(huà)部件分別用一個(gè)相應(yīng)的 字母或標(biāo)點(diǎn)符號(hào)編碼,在編碼實(shí)例中將這些多筆畫(huà)部件盡量排在不同的字母鍵上。部件1_、 ^、鳥(niǎo)慣常出現(xiàn)在漢字的字尾,其中卩已被列為基本部件;部件“鳥(niǎo)”也會(huì)產(chǎn)生幾個(gè)的重碼, 就將部件“鳥(niǎo)”列為多筆畫(huà)部件;部件的首筆為點(diǎn),由于點(diǎn)在獨(dú)體字或合體字的第二部分 的首尾位置出現(xiàn)得較多,將部件1_按點(diǎn)編碼容易造成重碼,就將它列為基本部件。為降低重 碼,將與廣合并排列,用同一個(gè)字母或其它符號(hào)編碼。這樣共優(yōu)選了 27個(gè)多筆畫(huà)部件。而五種基本筆畫(huà)則可從減少重碼角度出發(fā),可選其中的幾個(gè)筆畫(huà)與27個(gè)多筆畫(huà)部件合并排 列在同一個(gè)鍵上,用同一個(gè)字母或其他符號(hào)編碼。當(dāng)然這27個(gè)多筆畫(huà)部件不是固定的,可 少于27個(gè)多筆畫(huà)部件,也可多于27個(gè)多筆畫(huà)部件,只要27個(gè)左右即可,例如也可將漢字部 件“十”入選,用一個(gè)字母或標(biāo)點(diǎn)符號(hào)編碼。為便于記憶,在字首部件拼音輸入法中排列多筆畫(huà)部件時(shí)不按筆畫(huà)數(shù)和橫、豎、 撇、點(diǎn)、折的次序排列,而按拼音或象形排列,見(jiàn)附圖3或附圖4所示。附圖3以按基本部 件的拼音字母排列為主,對(duì)少數(shù)幾個(gè)拼音首字母或聲母相同的基本部件改按象形的方式排 列。這樣由于按基本部件的讀音編碼幾乎無(wú)需記憶,少數(shù)幾個(gè)改按象形的方式排列的基本 部件也能很快記住,記憶量很小,因此極為簡(jiǎn)單。附圖4完全按象形排列,可漢字的方塊筆 畫(huà)部件與西文字母畢竟有所區(qū)別,難以做到十分相像,需要按象形記憶的漢字基本部件就 要多上幾倍,記憶量也相應(yīng)多上幾倍,因此本發(fā)明也不太建議用這種方式排列經(jīng)過(guò)反復(fù)優(yōu) 選的基本部件。當(dāng)然有人可能更喜歡這種排列方式。二種形部編碼的取碼規(guī)則均可采用附 圖3或附圖4編碼。橫、豎、撇、點(diǎn)(捺)、折等基本筆畫(huà)在形部編碼中出現(xiàn)的頻率較高,為便于記憶,按 拼音聲母編碼,即編碼分別為H、U、P、N、V。這樣,通過(guò)優(yōu)選27個(gè)左右的多筆畫(huà)部件和五種基本筆畫(huà),創(chuàng)造性地規(guī)定取碼規(guī) 則,就做到了形部編碼既簡(jiǎn)單易記,又能有效地區(qū)分同音字,重碼率很低,輸入速度足以與 其他任何輸入法相比。這就解決了其他任何輸入法都未能解決的難題,真正做到了簡(jiǎn)單直 觀、重碼率很低、輸入速度高,是一種唯一的理想的標(biāo)準(zhǔn)的漢字輸入法。
附圖1為王治陽(yáng)雙拼鍵盤(pán)排列圖之一附圖2為王治陽(yáng)雙拼鍵盤(pán)排列圖之二附圖3為形部編碼鍵盤(pán)排列圖之一附圖4為形部編碼鍵盤(pán)排列圖之二
具體實(shí)施例方式字首部件拼音輸入法由兩部分組成,一部分是音碼,即拼音,或稱拼音碼,另一部 分是形部編碼。這兩部分組成編碼時(shí)可以是音碼在先,形部編碼在后;也可以是形部編碼在 先,音碼在后。但一經(jīng)選定,次序就不能改變。為便于想打,與思維一致,又能充分利用標(biāo)點(diǎn) 符號(hào)鍵,建議拼音在先,形部編碼在后,在編碼實(shí)例中就采用這種方法。拼音可采用全拼或 雙拼或簡(jiǎn)拼或不完整拼音,不想學(xué)習(xí)雙拼的人可采用全拼,即采用一個(gè)漢字的標(biāo)準(zhǔn)拼音。為 縮短碼長(zhǎng),提高輸入速度,建議采用雙拼,最好采用幾分鐘可學(xué)會(huì)的王治陽(yáng)雙拼。當(dāng)然也可 采用全拼,它幾乎不要記憶?,F(xiàn)在漢字輸入技術(shù)有了很大的進(jìn)步,可做到全拼、雙拼兼容,而 不需要調(diào)整輸入法狀態(tài)。在實(shí)施例中音碼選用王治陽(yáng)發(fā)明的雙拼,同時(shí)也可規(guī)定兼容全拼。王治陽(yáng)雙拼是一種聲母、韻母的鍵位配置合理,在鍵盤(pán)上排列規(guī)律性強(qiáng)的雙拼計(jì) 算機(jī)漢字輸入法??蓡为?dú)作為一種輸入法使用,也可作為字首部件拼音輸入法的音碼部分 使用。王治陽(yáng)雙拼的技術(shù)方案的特征在于
(1)單個(gè)字母的聲母與各字母鍵一致,而翹舌音ch、sh、zh按音序分別用i、u、v表 示,以便于記憶,當(dāng)然也可改而將ch用u表示,sh用i表示,zh仍用ν作代碼,單韻母U用 字母ν表示。根據(jù)韻母的語(yǔ)音互補(bǔ)關(guān)系,單個(gè)字母的韻母除了可排按聲韻合并規(guī)律,被它包 含的韻母外,不能再排其它韻母。對(duì)按聲韻互補(bǔ)規(guī)律沒(méi)被合并的多個(gè)字母組成的其它的復(fù) 韻母和鼻韻母也用單個(gè)字母表示,開(kāi)口呼韻母配置在標(biāo)準(zhǔn)鍵盤(pán)中排,并按第一個(gè)字母分為 a、0、e區(qū);齊齒呼韻母配置在鍵盤(pán)上排,稱為i區(qū),合口呼和撮口呼韻母配置在標(biāo)準(zhǔn)鍵盤(pán)下 排,稱為u區(qū),包括U區(qū);每區(qū)又按韻母字母?jìng)€(gè)數(shù)從左到右排列,字母?jìng)€(gè)數(shù)相同的韻母按a、 0、e、i、U、n、g的次序從左到右排列。見(jiàn)附圖1。當(dāng)然也可將合口呼和撮口呼韻母配置在鍵 盤(pán)上排,稱為u區(qū),齊齒呼韻母配置在鍵盤(pán)下排,稱為i區(qū)。在編碼實(shí)例中不這么排列。(2)」各韻母與字母映射關(guān)系設(shè)定為
aa b uai c un Und ai
ee f an g angh——ou ii
Jong iong k ei1——en muang iang
ηuan Uan ο ο uoPing
qie r in er s aot——iao
Uu ν Uui w iuχue iie
yian ζ ua ia ;eng
見(jiàn)附圖1所示,這里翹舌音ch、sh、zh按英文畜二序分別用i、U、V表示,也符合指法規(guī)律。本人認(rèn)為這種雙拼鍵盤(pán)排列方式是比較理想的,因此在編碼實(shí)例中采用這種雙拼。
當(dāng)然也可不考慮韻母的個(gè)數(shù),對(duì)每區(qū)按韻母字母根據(jù)a、o、e、i、u、n、g從左到右排列;
這時(shí)各韻母與字母映射關(guān)系設(shè)定為
aa b uang iang c-uan Uand ai
ee f an g-angh ou
ii j ong iong k-ei1 en
mun Un η ue iie ο οUOP mg
qiao r ie er saot iu
Uu ν Uui w-ianχ uai
yin ζ ua ia eng
在鍵盤(pán)上的排列如附圖2所示,翹舌If ch、sh、zh仍按英文 序分別用i、u、ν表
示。當(dāng)然也可將字母?jìng)€(gè)數(shù)相同的韻母按英文音序從左到右排列。還可不考慮字母?jìng)€(gè)數(shù),將 韻母按英文音序排列。(3)只有韻母沒(méi)有聲母的,取e或ο或a作聲母,還可取韻母的第一個(gè)字母作零聲 母的代碼,再補(bǔ)上韻母的代碼,在編碼實(shí)例中選用e作零聲母的代碼;選用e作零聲母的代 碼有個(gè)優(yōu)點(diǎn),那就是er排在r上的話,就能做到全拼與雙拼的拼寫(xiě)形式完全相同。(4)字首部件拼音輸入法的音碼部分的輸入步驟為按雙拼根據(jù)上述聲母或韻母 與字母鍵的映射關(guān)系依次輸入單個(gè)漢字的聲母和韻母。下面再對(duì)形部編碼作詳細(xì)說(shuō)明。許多輸入法將合體字一分為二后,再進(jìn)行編碼,多了一個(gè)思考步驟,容易造成直觀性差,影響頭腦反應(yīng)速度。本人在經(jīng)歷長(zhǎng)年累月的潛心研究和突發(fā)靈感后,終于設(shè)計(jì)出了全 新的不必將合體字一分為二的形部編碼的取碼規(guī)則若按書(shū)寫(xiě)順序,某個(gè)漢字的第一個(gè)基 本部件為多筆畫(huà)部件,則按書(shū)寫(xiě)順序取該漢字的前二個(gè)基本部件的相應(yīng)代碼編碼;其他漢 字則按書(shū)寫(xiě)順序取第一個(gè)和最末一個(gè)基本部件的相應(yīng)代碼編碼;這就是說(shuō),若某個(gè)漢字的 第一個(gè)基本部件為單筆畫(huà)部件,則按書(shū)寫(xiě)順序取第一個(gè)和最末一個(gè)基本部件的相應(yīng)代碼編 碼;只有一個(gè)基本部件的漢字就取這個(gè)基本部件的相應(yīng)代碼編碼,當(dāng)然也可重復(fù)該基本部 件的相應(yīng)代碼編碼。在漢字中,合體字占了絕大多數(shù),約為95%。同音又同偏旁部首的合體字?jǐn)?shù)量較 多,約有五、六百對(duì)。其中?、*、口、木、 、 、彳等偏旁部首產(chǎn)生的同音字最多,?約有 六十余對(duì)同音字,其它的也有三、四十對(duì)同音字,為降低重碼,這些偏旁部首必須被選出,分 別用一個(gè)字母或別的符號(hào)編碼。女、i對(duì)、月、蟲(chóng)、土、鄉(xiāng)、火、廣等偏旁部首就只有十來(lái)對(duì)同
音字,為降低重碼,這些偏旁部首也要被選出,分別用一個(gè)字母或別的符號(hào)編碼。、■^、山、
石、日、王、卩、魚(yú)、禾等偏旁部首只有五對(duì)左右的同音字,為降低重碼,這些偏旁部首也可被 選了出來(lái),分別用一個(gè)字母或別的符號(hào)編碼,當(dāng)然個(gè)別偏旁也可棄而不選。而有的偏旁部首 如“田”、“目”、“貝”、“車(chē)”、“酉”、“各”、“t”等雖然常用,可只有二、三對(duì)同音字,甚至沒(méi)有同 音字,因此棄而不選。部件“3 ”和“t”的重碼略多點(diǎn),也可將它們列入多筆畫(huà)部件,在編碼 實(shí)例中沒(méi)入選。本人研究發(fā)現(xiàn),同音同偏旁部首的漢字的除偏旁部首外部分按書(shū)寫(xiě)順序第 一筆為同類基本筆畫(huà)的情況更是出乎意外的少,只有一百多對(duì),其中部件十、+出現(xiàn)得比較 多,+還經(jīng)常出現(xiàn)在漢字的字首,+也可被選了出來(lái),在編碼實(shí)例中不選。接著將25個(gè)多筆 畫(huà)部件分別用一個(gè)字母或別的符號(hào)編碼,建議將這25個(gè)多筆畫(huà)部件分別用一個(gè)字母編碼。 、鳥(niǎo)這二個(gè)部件慣常出現(xiàn)在字尾,不將它們列為多筆畫(huà)部件的話,按第一種形部編碼的取 碼規(guī)則取碼時(shí),很多漢字要取它們的最后一個(gè)筆畫(huà)點(diǎn)、橫,由于點(diǎn)、橫在字尾的組字頻率很 高,容易造成重碼,因此也將它們列為基本部件。這樣共優(yōu)選了 27個(gè)多筆畫(huà)部件?!?_”慣 常出現(xiàn)在漢字的字尾,而廣慣常出現(xiàn)在漢字的字首,兩者位置不同,用同一個(gè)字母或別的符 號(hào)編碼,幾乎不會(huì)造成重碼,就將它們合并排列,用同一個(gè)字母或別的符號(hào)編碼。多筆畫(huà)部 件“鳥(niǎo)”慣常出現(xiàn)在字尾,首筆為撇,而撇在漢字的字尾的組字頻率很低,若與撇合并排列, 用同一個(gè)字母或別的符號(hào)編碼,也幾乎不會(huì)發(fā)生重碼,因此就將“鳥(niǎo)”與“撇”合并排列,用 同一個(gè)字母或別的符號(hào)編碼。為便于記憶和減少重碼,橫、豎、撇、點(diǎn)(捺)、折等基本筆畫(huà)按拼音聲母編碼,即編 碼分別為 H、U (sh)、P、N、V (zh)。為便于記憶,排列時(shí)主要以多筆畫(huà)部件的讀音的拼音首字母或聲母為代碼。為避 免重碼,還將若干聲母相同的部件取了出來(lái),改按象形或韻母的方式編碼。27個(gè)多筆畫(huà)部件 和五種基本筆畫(huà)在鍵盤(pán)上的優(yōu)選排列見(jiàn)附圖3所示。27個(gè)多筆畫(huà)部件、五種基本筆畫(huà)與字 母、標(biāo)點(diǎn)符號(hào)的影射關(guān)系設(shè)定為
b——廣c——* d——? f—— g——鳥(niǎo) h——火橫
j——鄉(xiāng)k——口 1——魚(yú)
η——女捺(點(diǎn)) ο——月 P——^撇
r-\s-石 t-土
9a—·
e—禾
i———蟲(chóng)
m—木
q一日
u-山豎 ν- 折w-王 χ-個(gè)y-%Z-足根據(jù)設(shè)定關(guān)系將部件分別用相應(yīng)的字母和標(biāo)點(diǎn)符號(hào)編碼。下面作具體解說(shuō)a的大寫(xiě)A與韋相似;b是廣的聲母;c是*的聲母;d是?的聲 母e是禾的韻母;f似 ;g形似鳥(niǎo);h是火的聲母;i因?yàn)閏h排在其上,而ch是蟲(chóng)的聲母; j是鄉(xiāng)的聲母;k是口的聲母;L似魚(yú)的左上角;m是木的聲母;η是女的聲母;0似月亮的外 形;P似P ;Q似日,就作為日代碼;r是彳的聲母;8是石的拼音的首字母;t是土的聲母;U 因?yàn)閟h排在u上,而sh是山的聲母;ν因?yàn)閦h排在u上,而zh是的聲母;w是王的聲母; X是個(gè)的聲母;Y是i的聲母;Z是足的聲母;這些字母就分別作為相應(yīng)的基本部件的代碼。 這種排列方式基本上是按表音排列的,往往將基本部件按其拼音首字母或聲母排列,對(duì)拼 音首字母相同的少數(shù)多筆畫(huà)部件,改按象形或韻母排列。需要指出的是,表音排列還注意要 與詞組兼容,以盡量少發(fā)生字詞重碼。漢語(yǔ)拼音中各個(gè)聲母的組字頻率各不相同,其中y、j、 1、χ的組字頻率很高,為減少字詞重碼,?、夂、口、木、 、韋、4等組字頻率很高的多筆畫(huà)部 件不宜排到y(tǒng)、j、1、X上,而要盡量將這些高頻的多筆畫(huà)部件排到組字頻率較低的a、ο、e、 r鍵上,實(shí)在無(wú)法排列的話,也要排到組字頻率中等的字母鍵上,用相應(yīng)的字母編碼。附圖3 和附圖4就充分注意到了這點(diǎn)。當(dāng)然也可以按漢字部件與英文的相似程度排列,即根據(jù)象形排列。一種優(yōu)選的排 列見(jiàn)附圖4。這時(shí)選用了多筆畫(huà)部件 參與編碼,舍棄了多筆畫(huà)部件“鳥(niǎo)”。27個(gè)多筆畫(huà)部 件、五種基本筆畫(huà)與字母、標(biāo)點(diǎn)符號(hào)的影射關(guān)系設(shè)定為a-^f b-日c-^ d-石e-山 f-^g-足 h-廿橫i——i j——廣k——1——個(gè)m——木 η——月捺 ο——口 ρ——^撇q——蟲(chóng)r——女s——? t——土u-魚(yú)豎 ν-韋折 w-纟 χ-火y——禾ζ——王根據(jù)設(shè)定關(guān)系將基本部件分別用相應(yīng)的字母和標(biāo)點(diǎn)符號(hào)編碼。下面作具體解說(shuō)大寫(xiě)a似彳;大寫(xiě)b似日;c似+ ;d似石,框在下部;大寫(xiě)e似 山;f似 ,特別似反 ;g似足,框在上部;大寫(xiě)h似似i ;j似廣,又似的前二筆;k 似,似半個(gè) ;1似〗卜;m似木,似樹(shù)林,木的聲母也是m;n似月;ο似口;ρ似P ;大寫(xiě)q似 蟲(chóng),都是框內(nèi)有出筆;大寫(xiě)r似女;s似?,似水流形,?聲母也是s ;t似土,土的聲母也是t; u似魚(yú),似魚(yú)泡,讀音也似;ν似韋字頭或字尾;w似鄉(xiāng);χ似火;y似禾,禾苗的形狀往往似y ; ζ似王,也與折“乙”的外形相似。有的基本部件在作為偏旁部首后,字形會(huì)有所改變,但必須視為同類基本部件,用 同一字母編碼,這類基本部件如和竹,足和足,^i和人,i和言,韋和金,?含水、氺,孑含 手對(duì)含心,鄉(xiāng)含系等,特點(diǎn)是同源。基本部件也可包含個(gè)別與它十分形似的部件,用同一字 母編碼。如部件“土”可包含“士”,由于這兩個(gè)部件僅有筆畫(huà)長(zhǎng)短之分,作為同一個(gè)部件編 碼可能更符合頭腦反應(yīng)習(xí)慣。鄉(xiāng)與么也十分形似,也可鄉(xiāng)包含么,為同一個(gè)部件編碼也符合頭腦反應(yīng)習(xí)慣,當(dāng)然也可不這么排列。在編碼實(shí)例中采用附圖1和附圖3編碼。編碼實(shí)例如“漢”的編碼,聲母是h,韻 母為皿,代碼是f,音碼部分就為hf,第一個(gè)基本部件為多筆畫(huà)部件?,位于“漢”的正左方, 就按書(shū)寫(xiě)順序取前二個(gè)基本部件編碼,?的編碼為d,筆畫(huà)“折”的編碼為z,于是“漢”的編 碼為“hfdz”。又如“字”的編碼,音碼部分按雙拼,為zi,第一個(gè)基本部件為基本筆畫(huà)點(diǎn),代 碼為“n”,按書(shū)寫(xiě)順序最末一個(gè)基本部件為橫,代碼為“h”,于是“字”的編碼為“zinh”。又 如“封”,全拼為feng,雙拼就為“f ; ”,形部編碼時(shí),第一個(gè)基本部件為多筆畫(huà)部件“土”,代 碼為“t”,形部編碼要按書(shū)寫(xiě)順序取“封”的第一個(gè)和第二個(gè)基本部件的代碼編碼,“封”的 編碼就為“f;tt”注意在形部編碼時(shí)取基本部件要遵循取大優(yōu)先的編碼原則,即要優(yōu)先取 筆畫(huà)多的基本部件編碼,例如“封”字編碼時(shí)應(yīng)取多筆畫(huà)部件“土”,而不能取第一個(gè)單筆畫(huà) 部件橫,因?yàn)椤巴痢钡墓P畫(huà)數(shù)多于“橫”,要按“土”編碼。如“這”字,全拼為zhe,雙拼就為 “ve”,形部編碼時(shí),按書(shū)寫(xiě)順序第一個(gè)基本部件為“點(diǎn)”,代碼為“n”,再按書(shū)寫(xiě)順序取最末一 個(gè)基本部件的代碼b,“這”的形部編碼就為“nb”,于是“這”的編碼為“venb”。如“事” 字,拼音為shi,sh的雙拼代碼為u,“事”的雙拼就為ui,按書(shū)寫(xiě)順序第一個(gè)基本部件為單筆 畫(huà)部件橫,代碼為“h”,根據(jù)取碼規(guī)則,形部編碼的第二碼要按書(shū)寫(xiě)順序取該漢字的最末一 個(gè)基本部件豎的代碼“η”編碼,“事”的形部編碼就為“hn”,“事”的整個(gè)編碼就為“uihn”。 又如“木”的編碼,雙拼為mu,該漢字只有一個(gè)基本部件“木”,代碼為m,“木”的形部編碼就 為“m”,于是木的編碼就為mum。為了追求碼長(zhǎng)整齊劃一,也可規(guī)定只有一個(gè)基本部件的漢 字也可取第一筆或者最末筆的代碼或者重復(fù)該基本部件的代碼作為形部編碼的第二碼。本 編碼實(shí)例不作這樣的規(guī)定。為提高輸入速度,對(duì)于使用頻繁的字,設(shè)計(jì)了簡(jiǎn)碼。簡(jiǎn)碼就是對(duì)常用的漢字只是取 其完整編碼的前編1個(gè)、2個(gè)或3個(gè)編碼,再按1個(gè)空格鍵就能輸入該漢字。由于規(guī)定音碼 在先,形部編碼在后,許多漢字的形部編碼并不需要全部輸入,只要輸入該漢字的簡(jiǎn)碼,所 以單字的編碼實(shí)際上是音碼為主,輔以形部編碼,形部編碼起到了輔助碼的作用。由于漢字的拼音只有四百來(lái)個(gè),漢字的二級(jí)簡(jiǎn)碼也就只有四百來(lái)個(gè),而本發(fā)明的 編碼空間有7 個(gè),因此,對(duì)于其余三百來(lái)個(gè)編碼空間,還可設(shè)立簡(jiǎn)碼詞,以進(jìn)一步提高打 字速度。如漢字的拼音無(wú)kian的形式,雙拼編碼也就無(wú)ky的形式,而“k”、“y”卻分別為 “可”、“以”的聲母,因此ky可以作為“可以”的編碼。由于本輸入法設(shè)有三百多個(gè)簡(jiǎn)碼詞, 從理論上說(shuō)詞組輸入速度要比單字更快,因此這會(huì)明顯提高漢字的輸入速度。在計(jì)算機(jī)上 敲擊完某個(gè)漢字或詞組的簡(jiǎn)碼所在的鍵后,再敲擊空格鍵,就可輸入相應(yīng)的漢字或詞組。詞語(yǔ)輸入是提高漢字輸入速度的最常用方法,由于規(guī)定音碼在先,形部編碼在后, 詞語(yǔ)輸入就全部利用音碼輸入,音碼選用王治陽(yáng)雙拼,詞語(yǔ)輸入的步驟是a、二字詞語(yǔ),取每個(gè)字的聲母、韻母的代碼依次輸入;如“編碼”代碼為byma。b、三字詞語(yǔ),取每個(gè)字的聲母的代碼依次輸入,再補(bǔ)空格輸入;如“計(jì)算機(jī)”的代碼 為“jsj”。當(dāng)然也可規(guī)定取第一字、第二字的前一碼即聲母的代碼,再取第三字的前二碼。 還可規(guī)定再第一字的前二碼,再取第二字、第三字的前一碼即聲母的代碼。C、四字及以上詞語(yǔ),取前三個(gè)字及最后一個(gè)字的聲母的代碼依次輸入;如“科學(xué)技 術(shù)”為四字詞,取每個(gè)字的聲母的代碼為“kxju”,U為術(shù)的聲母的代碼。又如“新疆維吾爾 自治區(qū)”,編碼取前三個(gè)字及最后一個(gè)字“新疆維區(qū)”的聲母的代碼“xjwq”。
11
詞組輸入時(shí)也會(huì)遇到重碼問(wèn)題,總的來(lái)說(shuō)按拼音輸入漢字的有效重碼率要低于拼 形碼,但也不是沒(méi)有,遇到同音詞時(shí),一個(gè)非常簡(jiǎn)便的方法是根據(jù)上下文采用智能處理。有 時(shí)無(wú)法智能處理時(shí),有個(gè)技巧可基本避免同音字選擇,那就是再輸入詞組中第一個(gè)字或最 后一個(gè)字的形部編碼的第一個(gè)代碼,一般輸入第一個(gè)字的形部編碼的第一個(gè)代碼。如輸入 “uiji”后,其中U為Sh的壓縮聲母,會(huì)出現(xiàn)“實(shí)際、事跡、試劑、世紀(jì)、史記”等詞供挑選,這 時(shí)每個(gè)詞的前面會(huì)有數(shù)字鍵供選擇,后面會(huì)有一個(gè)字母或標(biāo)點(diǎn)符號(hào)供選擇,它為第一個(gè)字 的形部編碼的第一碼,采用附圖3的話,捺(點(diǎn))、橫、i、*、口的編碼代號(hào)分別為“n”、“h”、 “y”、“c”、“k”。敲擊這幾個(gè)基本部件的相應(yīng)代碼所在鍵后,就能直接上屏,而無(wú)需再用數(shù)字 鍵選擇重碼。這一創(chuàng)新方法顯然十分簡(jiǎn)便實(shí)用,實(shí)際上能做到幾乎沒(méi)什么重碼詞。這樣,本發(fā)明對(duì)拼音輸入法遇到的重碼字和重碼詞問(wèn)題都作了成功處理,采用附 圖1和附圖3的話,十來(lái)分鐘就可學(xué)會(huì),甚至幾分鐘就可基本學(xué)會(huì),比如雙拼只要記住a、o、 e、i、u區(qū),再按字母?jìng)€(gè)數(shù)和a、0、e、i、U、n、g排列就可以了,還可結(jié)合雙拼提示行進(jìn)行輸入, 形部編碼只有27個(gè)左右的多筆畫(huà)部件和五個(gè)單筆畫(huà)部件,且大部分基本部件都用拼音的 聲母作代碼。采用附圖2和附圖4的話也只要二三十分鐘就能學(xué)會(huì),使本發(fā)明顯示出極大 的優(yōu)越性,成為唯一理想的漢字輸入法。利用字首部件拼音輸入法軟件,在計(jì)算機(jī)鍵盤(pán)上敲擊某個(gè)漢字或詞組的相應(yīng)的編 碼所在的鍵,就可完成輸入。一般規(guī)定無(wú)重碼且達(dá)到規(guī)定碼長(zhǎng)的漢字或詞組自動(dòng)上屏,不足 4碼的要按空格鍵,有重碼的單字或詞組根據(jù)提示行選擇。本發(fā)明字詞兼容,最多碼長(zhǎng)都為 4碼?!?”鍵可設(shè)為萬(wàn)能學(xué)習(xí)鍵,當(dāng)某個(gè)漢字的編碼不知道時(shí),可用“ ”代替,幫助把正確 的編碼找出來(lái),再利用提示行選擇。為了便于使用,還設(shè)置了容錯(cuò)碼,對(duì)一些編碼容易出錯(cuò)的漢字,在錯(cuò)誤輸入時(shí)也能 出現(xiàn)所要輸入的漢字。需要指出的是在本說(shuō)明書(shū)、權(quán)利要求書(shū)和說(shuō)明書(shū)附圖中的字母均不分大小寫(xiě),字 母的大小寫(xiě)是等效的。
權(quán)利要求
1. 一種計(jì)算機(jī)漢字編碼鍵盤(pán)輸入法即字首部件拼音輸入法,將漢字的各種筆畫(huà)按國(guó)家 語(yǔ)委的規(guī)定歸類為橫、豎、撇、點(diǎn)、折五種基本筆畫(huà)后,其特征是(1)、編碼由兩部分組成,一部分是音碼,即拼音,或稱拼音碼,另一部分是形部編碼,漢 字碼的兩部分可前可后,一經(jīng)選定,不能改變;O)、拼音可采用全拼或雙拼或簡(jiǎn)拼或不完整拼音;(3)、形部編碼取碼規(guī)則是若按書(shū)寫(xiě)順序,某個(gè)漢字的第一個(gè)基本部件為多筆畫(huà)部件, 則按書(shū)寫(xiě)順序取該漢字的前二個(gè)基本部件的相應(yīng)代碼編碼;其他漢字則按書(shū)寫(xiě)順序取第一 個(gè)和最末一個(gè)基本部件的相應(yīng)代碼編碼;這就是說(shuō),若某個(gè)漢字的第一個(gè)基本部件為單筆 畫(huà)部件,則按書(shū)寫(xiě)順序取第一個(gè)和最末一個(gè)基本部件的相應(yīng)代碼編碼;只有一個(gè)基本部件 的漢字就取這個(gè)基本部件的相應(yīng)代碼編碼,當(dāng)然也可規(guī)定只有一個(gè)基本部件的漢字接連兩 次取該基本部件的相應(yīng)代碼編碼;(4)優(yōu)選五種基本筆畫(huà)和27個(gè)基本部件參與編碼,27個(gè)基本部件、五種基本筆畫(huà)與字 母、標(biāo)點(diǎn)符號(hào)的一種影射關(guān)系設(shè)定為
2.根據(jù)權(quán)利要求1所述的字首部件拼音輸入法,其特征是雙拼最好選用王治陽(yáng)雙拼 ch、sh、zh按音序分別用i、U、ν表示,單韻母U用字母ν表示,各韻母與字母映射關(guān)系設(shè)定 為
3.根據(jù)權(quán)利要求1所述的字首部件拼音輸入法,其特征是?、*、口、木、 3 d等 發(fā)生的同音字很多的偏旁必須被選出,分別用一個(gè)字母或別的符號(hào)編碼,女、i、個(gè)、月、蟲(chóng)、 土、鄉(xiāng)、火、廣、等發(fā)生同音字較多的偏旁被選出,分別用一個(gè)字母或別的符號(hào)編碼,、足 、山、石、日、王j、魚(yú)、寺及冬、禾、十、 等能發(fā)生幾對(duì)同音字的偏旁也可,分別用一個(gè)字母 或別的符號(hào)編碼。
4.根據(jù)權(quán)利要求ι所述的字首部件拼音輸入法,其特征是?、*、口、木、 、韋d、 女、i、個(gè)、月、蟲(chóng)、土、鄉(xiāng)、火、廣、、足、山、石、日、王j、魚(yú)、禾、 、!_、鳥(niǎo)等基本部件全部選自漢字的偏旁部首。
5.根據(jù)權(quán)利要求ι所述的字首部件拼音輸入法,其特征是?、*、口、木、γ3 d等 組字頻率很高的多筆畫(huà)部件不宜排到y(tǒng)、j、l、x上,而要盡量將這些高頻的多筆畫(huà)部件排到 組字頻率較低的a、O、e、r鍵上。
6.根據(jù)權(quán)利要求1所述的字首部件拼音輸入法,其特征是詞語(yǔ)輸入的步驟是 二字詞語(yǔ),取每個(gè)字的聲母、韻母的代碼依次輸入;三字詞語(yǔ),取每個(gè)字的聲母的代碼依次輸入,再補(bǔ)空格輸入; 四字及以上詞語(yǔ),取前三個(gè)字及最后一個(gè)字的聲母的代碼依次輸入。
全文摘要
一種計(jì)算機(jī)漢字編碼輸入方法即字首部件拼音輸入法,它由音碼和形部編碼兩部分組成,主要編碼原理是同音同偏旁部首的合體字除偏旁部首外的部分的第一筆為同類基本筆畫(huà)的情況出乎意外的少,只需選用28個(gè)左右的多筆畫(huà)部件和五種基本筆畫(huà)就能做到既簡(jiǎn)單又快速地輸入漢字。
文檔編號(hào)G06F3/023GK102073383SQ200910154240
公開(kāi)日2011年5月25日 申請(qǐng)日期2009年11月19日 優(yōu)先權(quán)日2009年11月19日
發(fā)明者王治陽(yáng) 申請(qǐng)人:王治陽(yáng)