專(zhuān)利名稱(chēng):計(jì)算機(jī)句碼輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種中文信息處理方法,特別是一種中文的計(jì)算機(jī)輸入方法。
背景技術(shù):
迄今已有上千種關(guān)于中文的計(jì)算機(jī)輸入法,其共同的不足是1、操作不夠簡(jiǎn)捷,除少量字、詞外,通常需要按2-6次鍵才能打出一個(gè)漢字,遇同音字再用手工選擇的話,操作次數(shù)更多;2、用戶不易掌握,拼音輸入法對(duì)那些拼音基礎(chǔ)不怎么過(guò)關(guān)的人是個(gè)難題,而形碼和音形碼輸入法都需要用戶額外記憶許多人為創(chuàng)設(shè)的編碼,否則無(wú)法使用;3、字、詞庫(kù)功能單一,只能滿足字或詞的處理,不完全適應(yīng)中文整句輸入;4、中文整句輸入過(guò)于仰賴(lài)漢語(yǔ)語(yǔ)法、句法、詞法、分詞法甚至是語(yǔ)義的研究,而由于漢語(yǔ)的特殊復(fù)雜性,如規(guī)則以外無(wú)窮的例外,以及語(yǔ)法研究對(duì)語(yǔ)言現(xiàn)象的相對(duì)滯后性,難以及時(shí)涵蓋當(dāng)下流行的比較鮮活的語(yǔ)言,這種研究所涉及的問(wèn)題幾乎是無(wú)限的,也因此使得整句輸入總難盡如人意。由于以上問(wèn)題的存在,中文輸入的速度始終難有大的突破,各種輸入法在人群中的普及率受到不同程度的制約。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種計(jì)算機(jī)句碼輸入方法,要解決的技術(shù)問(wèn)題是使用戶能夠輕松快速實(shí)現(xiàn)中文整句輸入。
本發(fā)明采用以下技術(shù)方案一種計(jì)算機(jī)句碼輸入方法,使用通用鍵盤(pán)上的英文字母鍵位,包括以下步驟一、將英文字母鍵作為漢語(yǔ)拼音字母鍵,輸入句子時(shí)用戶順序輸入句子中每個(gè)字的第一個(gè)漢語(yǔ)拼音的首字母后,確認(rèn);二、計(jì)算機(jī)系統(tǒng)按首字母檢索相關(guān)漢字,找出匹配路徑;三、根據(jù)匹配路徑構(gòu)建語(yǔ)句并在顯示器上顯示,用戶進(jìn)行確認(rèn)。
本發(fā)明的匹配路徑是指每相鄰兩字所構(gòu)成的詞連接起來(lái)組成的句子。
本發(fā)明用戶確認(rèn)采用按空格鍵的方式。
本發(fā)明顯示器上顯示的句子與實(shí)際不符時(shí),則按光標(biāo)提示,按空格鍵或相應(yīng)數(shù)字鍵,逐段確認(rèn),拼接最終的成句。
本發(fā)明最終的成句獲得確認(rèn)后,計(jì)算機(jī)系統(tǒng)自動(dòng)將最終的成句記入系統(tǒng)。
本發(fā)明的匹配路徑出現(xiàn)重碼時(shí),計(jì)算機(jī)系統(tǒng)全部顯示,用戶在顯示的句子中選擇確定。
本發(fā)明的重碼每次最多顯示10個(gè)句子,超過(guò)10句的按+或-翻頁(yè),用戶在顯示的句子中按相應(yīng)的數(shù)字鍵選擇確定。
本發(fā)明匹配路徑的首、尾或者中間部分出現(xiàn)局部重碼時(shí),則計(jì)算機(jī)系統(tǒng)全部顯示重碼部分,用戶在顯示的局部重碼中按空格鍵或相應(yīng)的數(shù)字鍵選擇確定。
本發(fā)明的匹配路徑不能連成整句時(shí),計(jì)算機(jī)系統(tǒng)在中斷處自動(dòng)拼接下面的短句子,直到成句,然后顯示。
本發(fā)明顯示器上顯示的句子與實(shí)際不符時(shí),則按光標(biāo)提示,按空格鍵或相應(yīng)數(shù)字鍵,逐段確認(rèn)。
本發(fā)明與現(xiàn)有技術(shù)相比,將英文字母鍵作為漢語(yǔ)拼音字母鍵,輸入句子時(shí)用戶順序輸入句子中每個(gè)字的第一個(gè)漢語(yǔ)拼音的首字母,解決了輸入法不夠簡(jiǎn)捷、不易掌握的問(wèn)題,除少量句子需要手選外,可以基本實(shí)現(xiàn)一字一鍵,操作時(shí)思維的連續(xù)性好,使?jié)h字輸入在速度上有望達(dá)到速記水平。
圖1是本發(fā)明實(shí)施例的流程圖。
具體實(shí)施例方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
本發(fā)明的計(jì)算機(jī)句碼輸入方法解決技術(shù)問(wèn)題的前提是設(shè)定句碼,并以其作為中文整句輸入的基礎(chǔ)。句碼是句子的代碼。而本發(fā)明的句子,不但指以句號(hào)等標(biāo)點(diǎn)結(jié)尾的整句,也指以其他標(biāo)點(diǎn),如逗號(hào)結(jié)尾的短語(yǔ)。句碼就是句子中每個(gè)漢字的拼音首字母的集合。例如輸入拼音字母bfmsyjjdjswt,這個(gè)漢語(yǔ)拼音的首字母集就是“本發(fā)明所要解決的技術(shù)問(wèn)題”的中文句子的句碼。
計(jì)算機(jī)句碼輸入方法,就是將句碼作為輸入碼,又將句碼作為電腦或服務(wù)器中相關(guān)中文句庫(kù)的標(biāo)識(shí)碼,操作時(shí)用戶使用通用鍵盤(pán)上的英文字母鍵位,將英文字母鍵作為漢語(yǔ)拼音字母鍵,輸入句碼,從顯示器上得到完整的中文句子。
實(shí)現(xiàn)本發(fā)明有多種技術(shù)途徑,按句庫(kù)性質(zhì)分有如下三種圖表法,適用于單機(jī)操作;自然法,適用于聯(lián)機(jī)操作;嵌入法,適用于單機(jī)或者聯(lián)機(jī)。下面逐一說(shuō)明其技術(shù)要點(diǎn)圖表法,其實(shí)質(zhì)是幾千個(gè)常用漢字,國(guó)家標(biāo)準(zhǔn)“信息交換用漢字編碼字符集”規(guī)定有一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè),以這些漢字為結(jié)點(diǎn),以它們?cè)诂F(xiàn)實(shí)語(yǔ)句中的相互關(guān)系為連線,而形成的一張網(wǎng),一張有如城市交通圖那樣的“字句圖”。其中每一條連線都潛在地表示一個(gè)句子,而沿線的各個(gè)站點(diǎn)就是一個(gè)個(gè)獨(dú)立的漢字,每一漢字都以其拼音首字母作附加標(biāo)識(shí)。
字句圖結(jié)構(gòu)的復(fù)雜程度隨建庫(kù)時(shí)選用的語(yǔ)言資料的增加而增加,達(dá)到峰值后趨于穩(wěn)定。原因是大量重復(fù)的漢語(yǔ)表達(dá)法在圖中不重復(fù)標(biāo)注。
如圖1所示,操作時(shí)將英文字母鍵作為漢語(yǔ)拼音字母鍵,輸入句子時(shí)用戶順序輸入句子中每個(gè)字的第一個(gè)漢語(yǔ)拼音的首字母后,按空格鍵確認(rèn);計(jì)算機(jī)系統(tǒng)按首字母檢索相關(guān)漢字,從字句圖中找出可以將這串句碼連通起來(lái)的路線,找出每相鄰兩字所構(gòu)成的詞連接起來(lái)組成的句子,即匹配路徑;根據(jù)匹配路徑將沿線各點(diǎn)的漢字組織起來(lái),構(gòu)建語(yǔ)句并在顯示器上顯示,成為用戶所需的句子,用戶按空格鍵進(jìn)行確認(rèn)。當(dāng)顯示器上顯示的句子與實(shí)際不符時(shí),則按光標(biāo)提示,按空格鍵或相應(yīng)數(shù)字鍵逐段確認(rèn),拼接最終的成句。最終的成句獲得確認(rèn)后,計(jì)算機(jī)系統(tǒng)自動(dòng)將最終的成句記入系統(tǒng)。
一組句碼在字句圖中有兩條以上相對(duì)獨(dú)立的路線,說(shuō)明該句碼是若干句子共有的公碼。當(dāng)匹配路徑出現(xiàn)重碼時(shí),計(jì)算機(jī)系統(tǒng)全部顯示,用戶在顯示的句子中選擇確定,每次最多顯示10個(gè)句子,超過(guò)10句的按+或-翻頁(yè),用戶在顯示的句子中按相應(yīng)的數(shù)字鍵選擇確定;一組句碼在字句圖中的對(duì)應(yīng)連線出現(xiàn)首尾或中間部分的分岔并行,說(shuō)明有不同的字詞可以置換。當(dāng)匹配路徑的首、尾或者中間部分出現(xiàn)局部重碼時(shí),則計(jì)算機(jī)系統(tǒng)全部顯示重碼部分,用戶在顯示的局部重碼中按相應(yīng)的數(shù)字鍵選擇確定。
匹配路徑不能連成整句時(shí),計(jì)算機(jī)系統(tǒng)在中斷處自動(dòng)拼接下面的短句子,直到成句,然后顯示。顯示器上顯示的句子與實(shí)際不符時(shí),則按光標(biāo)提示,按空格鍵或相應(yīng)數(shù)字鍵逐段確認(rèn)。
在諸多可選連接短句子中,計(jì)算機(jī)系統(tǒng)按一定規(guī)則參照句中確定部分選擇未確定部分,例如句中已有“他穿著新發(fā)的”字樣,則在“的”字后面,系統(tǒng)會(huì)首選“工裝”,而不會(huì)選“工資”、“工作”、“工種”等等,因?yàn)椤肮ぱb”與句中的“穿著”另有直線相連,說(shuō)明工裝與該句中其他成分屬同一類(lèi)范疇。而如果本句中的確定成分不是“穿著”而是“帶著”,則究竟選工裝還是工資,就要有另外的方法確定,或者一并顯示,用戶手選。
計(jì)算機(jī)系統(tǒng)對(duì)用戶已經(jīng)輸入的句子有臨時(shí)記憶功能,方便系統(tǒng)在必要時(shí)按上下文關(guān)系選定連接路徑。
少數(shù)可以單獨(dú)成句的字,如“誰(shuí)?”“我?!币约俺S玫亩志洹⑷志涞?,設(shè)定為首字母加標(biāo)點(diǎn)的特殊句碼,例如“S?”“W?!?。
圖表法可以不具圖的形式而具表的形式。把兩個(gè)結(jié)點(diǎn)看作它們之間連線的坐標(biāo)點(diǎn),把所有的坐標(biāo)點(diǎn)統(tǒng)一記錄在一張表格上,就是一張表格化的字句圖,其作用完全一樣。
自然法,大型數(shù)據(jù)庫(kù)擁有上百億張中文網(wǎng)頁(yè)。計(jì)算機(jī)句碼輸入方法可以利用這一天然而又巨大的語(yǔ)言資源,無(wú)須構(gòu)建“字句圖”那樣的句庫(kù),就能方便地實(shí)現(xiàn)整句輸入。具體做法是在現(xiàn)有的中文數(shù)據(jù)庫(kù)端為每個(gè)漢字標(biāo)注首字母,此項(xiàng)工作可由自動(dòng)注音軟件完成,使其形成句碼,并增加句碼為數(shù)據(jù)庫(kù)中相應(yīng)漢語(yǔ)句子的標(biāo)識(shí)碼。
在用戶端安裝一個(gè)很小的工作軟件,操作時(shí)與數(shù)據(jù)庫(kù)保持聯(lián)機(jī)狀態(tài),用戶輸入句碼,鍵入標(biāo)點(diǎn)后開(kāi)始搜索并顯示相應(yīng)的漢語(yǔ)句子,整個(gè)搜索和顯示過(guò)程通常在不到1秒內(nèi)即可完成。一組句碼在數(shù)據(jù)庫(kù)中檢索到兩個(gè)以上完全相同的中文句子時(shí),系統(tǒng)只顯示一個(gè);有兩個(gè)以上不完全相同的中文句子時(shí),系統(tǒng)按規(guī)則顯示其一,其余待選。若數(shù)據(jù)庫(kù)中沒(méi)有與句碼完全相同的中文句子,則系統(tǒng)會(huì)自動(dòng)按片語(yǔ)方式拼接顯示,必要時(shí)由用戶手選確定。
不成句子的單獨(dú)字、詞的輸入,例如修辭時(shí),采取兩種方式切換到全拼輸入;或仍按首字母輸入,系統(tǒng)參照該字、詞與句中相鄰字、詞的關(guān)聯(lián)進(jìn)行檢索,按輸入字、詞顯示,手選確定。
嵌入法,現(xiàn)在的存儲(chǔ)技術(shù)已經(jīng)能夠?qū)⒄鶊D書(shū)館的中文資料壓入一張光盤(pán),將其作為天然句庫(kù),以句碼作其標(biāo)識(shí)碼,則本發(fā)明既可以在單機(jī)狀態(tài)下使用,也可以局部聯(lián)機(jī),支持未插入光盤(pán)或其他類(lèi)似構(gòu)件的普通計(jì)算機(jī)做輸入操作。
三種方法相比,首選嵌入法。原因是與其余兩者相比,該技術(shù)方案更為簡(jiǎn)便。圖表法做起來(lái)比較費(fèi)時(shí),自然法需要數(shù)據(jù)庫(kù)運(yùn)營(yíng)商的配合,而自己做數(shù)據(jù)庫(kù)則投入較大。惟有嵌入法,既可以獨(dú)立實(shí)施,做起來(lái)也比較容易。
本發(fā)明所具有的優(yōu)點(diǎn)和有益效果1、解決了輸入法不夠簡(jiǎn)捷的問(wèn)題。除少量句子需要手選外,可以基本實(shí)現(xiàn)一字一鍵;2、解決了輸入法不易掌握的問(wèn)題。以每一漢字發(fā)音的首字母為輸入碼,具有小學(xué)中文基礎(chǔ)的人都可以熟練掌握,無(wú)須記憶人為編制的代碼,操作時(shí)思維的連續(xù)性好;3、解決了整句輸入的問(wèn)題。本發(fā)明的著眼點(diǎn)不是單獨(dú)的字和詞,而是句子。整句輸入是句碼技術(shù)的前提和應(yīng)用保證。當(dāng)然,本發(fā)明也支持單獨(dú)的字、詞輸入,以方便用戶做文字修改;4、由于解決了以上問(wèn)題,所以一并解決了目前漢字輸入的速度極限。理論上,該輸入法在速度上有望達(dá)到速記水平;5、本發(fā)明具有比較強(qiáng)的可擴(kuò)展性。例如A)句碼技術(shù)不但適用于計(jì)算機(jī),而且適用于手機(jī)等需要中文處理的電子設(shè)備;不但適合中文,而且可以推廣至英語(yǔ)、法語(yǔ)乃至人類(lèi)所有語(yǔ)言;B)有望克服目前各大搜索網(wǎng)站的技術(shù)瓶頸。句碼的出現(xiàn)使得目前的關(guān)鍵詞搜索能方便地變成整句搜索,增加搜索目標(biāo)的針對(duì)性,減少大量似是而非的信息,從而改進(jìn)目前搜索引擎的功效;C)按相同原理開(kāi)發(fā)中外文在線翻譯,具有相當(dāng)誘人的前景;D)本發(fā)明所謂“句碼”,其實(shí)不只是句子的編碼,還可以看作中文句子的密碼,或者說(shuō)是攜帶了全句信息的漢語(yǔ)的DNA或全息碼一個(gè)句子所蘊(yùn)涵的語(yǔ)法、句法、詞法以及語(yǔ)音語(yǔ)調(diào)和特定用戶的語(yǔ)言風(fēng)格等等,都隱含其中,因此句碼本身具備在理論上做進(jìn)一步研究和開(kāi)發(fā)的價(jià)值。
實(shí)施例1,用戶輸入句碼bfmsyjjdjswt,按空格鍵確認(rèn),計(jì)算機(jī)系統(tǒng)按句碼在句庫(kù)中檢索到相關(guān)漢字,并合成相應(yīng)的中文句子。但系統(tǒng)發(fā)現(xiàn)這是一個(gè)公用碼,與之對(duì)應(yīng)的漢語(yǔ)句子除了“本發(fā)明所要解決的技術(shù)問(wèn)題”,還有“辦法沒(méi)說(shuō)已經(jīng)叫打就是問(wèn)題”,諸如此類(lèi)。計(jì)算機(jī)系統(tǒng)做進(jìn)一步檢查,決定首選前一個(gè)句子,其余備選。原因在于,在前一個(gè)句子里,技術(shù)和問(wèn)題、技術(shù)和發(fā)明、問(wèn)題和解決等等,在該句碼所標(biāo)示的線段之外,均有另外的直線相連,明顯屬于同一類(lèi)范疇。而其余句子沒(méi)有這樣明顯的特征。系統(tǒng)按巡查結(jié)果顯示之后,用戶確定,輸入完成。
實(shí)施例2,如對(duì)話場(chǎng)合出現(xiàn)的高度省略的特殊句碼“NS?”,對(duì)應(yīng)的漢語(yǔ)句子有“你是?”“那是?”“難事?”“念書(shū)?”“能手?”“納稅?”“男生?”“女生”“男聲?”“女聲?”“泥塑?”“南宋?”“內(nèi)傷?”“奶水?”“腦髓?”,在第一頁(yè)顯示的10個(gè)句子中,若有用戶選擇的句子,則按相應(yīng)的數(shù)字鍵確定,若沒(méi)有按+鍵或-鍵翻頁(yè),用戶可在每頁(yè)顯示的10個(gè)句子中按相應(yīng)的數(shù)字鍵選擇確定。
實(shí)施例3,當(dāng)輸入句碼“WMJTBUPD”,想要的漢語(yǔ)句子是“我們今天不去浦東?!钡聊伙@示有三處局部重碼在“我們”的上面并列有“外面”、“我妹”備選;在“不去”的下面也并列著“不取”、“別去”、“別取”;而句子的最后兩個(gè)字是“盆地”,其上面并列著“陪都”“配對(duì)”“浦東”。光標(biāo)首先在第一個(gè)重碼的部位閃爍,要求確認(rèn);用戶按空格鍵確認(rèn)“我們”;光標(biāo)接著在第二處閃爍,按空格鍵確認(rèn)“不去”;光標(biāo)最后閃到句末,按數(shù)字3確認(rèn)“浦東”,完成操作。
實(shí)施例4,當(dāng)輸入句碼“WSD5NJP.”,漢語(yǔ)句子為“我數(shù)到5你就跑?!庇捎诰鋷?kù)中沒(méi)有數(shù)字“5”,形成斷碼。計(jì)算機(jī)系統(tǒng)會(huì)將斷碼的兩端當(dāng)作兩個(gè)相對(duì)獨(dú)立的子句碼,拼接顯示,由用戶確認(rèn)。
權(quán)利要求
1.一種計(jì)算機(jī)句碼輸入方法,使用通用鍵盤(pán)上的英文字母鍵位,包括以下步驟一、將英文字母鍵作為漢語(yǔ)拼音字母鍵,輸入句子時(shí)用戶順序輸入句子中每個(gè)字的第一個(gè)漢語(yǔ)拼音的首字母后,確認(rèn);二、計(jì)算機(jī)系統(tǒng)按首字母檢索相關(guān)漢字,找出匹配路徑;三、根據(jù)匹配路徑構(gòu)建語(yǔ)句并在顯示器上顯示,用戶進(jìn)行確認(rèn)。
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)句碼輸入方法,其特征在于所述匹配路徑是指每相鄰兩字所構(gòu)成的詞連接起來(lái)組成的句子。
3.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)句碼輸入方法,其特征在于所述用戶確認(rèn)采用按空格鍵的方式。
4.根據(jù)權(quán)利要求3所述的計(jì)算機(jī)句碼輸入方法,其特征在于所述顯示器上顯示的句子與實(shí)際不符時(shí),則按光標(biāo)提示,按空格鍵或相應(yīng)數(shù)字鍵,逐段確認(rèn),拼接最終的成句。
5.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)句碼輸入方法,其特征在于所述最終的成句獲得確認(rèn)后,計(jì)算機(jī)系統(tǒng)自動(dòng)將最終的成句記入系統(tǒng)。
6.根據(jù)權(quán)利要求3所述的計(jì)算機(jī)句碼輸入方法,其特征在于所述匹配路徑出現(xiàn)重碼時(shí),計(jì)算機(jī)系統(tǒng)全部顯示,用戶在顯示的句子中選擇確定。
7.根據(jù)權(quán)利要求6所述的計(jì)算機(jī)句碼輸入方法,其特征在于所述重碼每次最多顯示10個(gè)句子,超過(guò)10句的按+或-翻頁(yè),用戶在顯示的句子中按相應(yīng)的數(shù)字鍵選擇確定。
8.根據(jù)權(quán)利要求7所述的計(jì)算機(jī)句碼輸入方法,其特征在于所述匹配路徑的首、尾或者中間部分出現(xiàn)局部重碼時(shí),則計(jì)算機(jī)系統(tǒng)全部顯示重碼部分,用戶在顯示的局部重碼中按空格鍵或相應(yīng)的數(shù)字鍵選擇確定。
9.根據(jù)權(quán)利要求3所述的計(jì)算機(jī)句碼輸入方法,其特征在于所述匹配路徑不能連成整句時(shí),計(jì)算機(jī)系統(tǒng)在中斷處自動(dòng)拼接下面的短句子,直到成句,然后顯示。
10.根據(jù)權(quán)利要求9所述的計(jì)算機(jī)句碼輸入方法,其特征在于所述顯示器上顯示的句子與實(shí)際不符時(shí),則按光標(biāo)提示,按空格鍵或相應(yīng)數(shù)字鍵,逐段確認(rèn)。
全文摘要
本發(fā)明公開(kāi)了一種計(jì)算機(jī)句碼輸入方法,要解決的技術(shù)問(wèn)題是使用戶能夠輕松快速實(shí)現(xiàn)中文整句輸入,本發(fā)明的計(jì)算機(jī)句碼輸入方法,使用通用鍵盤(pán)上的英文字母鍵位,包括以下步驟1.將英文字母鍵作為漢語(yǔ)拼音字母鍵,輸入句子時(shí)用戶順序輸入句子中每個(gè)字的第一個(gè)漢語(yǔ)拼音的首字母后,確認(rèn);2.計(jì)算機(jī)系統(tǒng)按首字母檢索相關(guān)漢字,找出匹配路徑;3.根據(jù)匹配路徑構(gòu)建語(yǔ)句并在顯示器上顯示,用戶進(jìn)行確認(rèn),本發(fā)明與現(xiàn)有技術(shù)相比,輸入句子時(shí)用戶順序輸入句子中每個(gè)字的第一個(gè)漢語(yǔ)拼音的首字母,解決了輸入法不夠簡(jiǎn)捷、不易掌握的問(wèn)題,除少量句子需要手選外,可以基本實(shí)現(xiàn)一字一鍵,操作時(shí)思維的連續(xù)性好,使?jié)h字輸入在速度上有望達(dá)到速記水平。
文檔編號(hào)G06F3/023GK1908862SQ20051003636
公開(kāi)日2007年2月7日 申請(qǐng)日期2005年8月1日 優(yōu)先權(quán)日2005年8月1日
發(fā)明者陳加鎖 申請(qǐng)人:陳加鎖