專利名稱:一種漢字鍵盤句輸入系統(tǒng)的制作方法
技術領域:
本發(fā)明是一種漢字鍵盤句輸入系統(tǒng),屬于計算機中文信息處理系統(tǒng)。
現(xiàn)有的句輸入系統(tǒng)中,大多數(shù)是采用拼音語句轉換方式,哈爾濱工業(yè)大學王曉龍博士的Insun(音聲)系統(tǒng),日本國際情報化協(xié)力中心的最優(yōu)評價函數(shù)法拼音漢字轉換系統(tǒng),邢偉華的邢碼句輸入以及清華大學剛推出的句輸入系統(tǒng),這種系統(tǒng)使用漢語拼音(全拼、雙拼、簡拼)連續(xù)擊鍵輸入漢語語句,智能軟件對輸入的音節(jié)序列進行分析后形成以字為單位的漢字內部碼。系統(tǒng)要解決的首要問題是通過音節(jié)分析、自動分詞、詞法分析、句法分析、語義分析、語用分析六個環(huán)節(jié)由計算機來辯識同音字、詞,即重碼的字、詞。現(xiàn)有的句輸入技術在保證易學性的前提下,在排除重碼字、詞方面,比之一般的字、詞輸入法,的確有更多的手段、更多的選擇,這是一個進步。但也存在諸多的問題,具體可以歸納為以下六個方面1、漢字鍵盤輸入法中引入漢語語法以消除重碼字、詞,其實是不得已的辦法,這是由漢語的固有特點所決定的。
2、漢語的語法尚未形成規(guī)范化,尤其是人們習慣于不斷“制造”和使用非規(guī)范化的語法,例如人們對“吃食堂”、“吃大碗”、“托兒”、“好不高興”等的理解只能靠語義來解決。
3、句輸入技術研制者首先面臨的問題是必須要先自定義相當一部分適用于電腦操作的“語法”,這就難免有偏頗,由此而衍生出下述一系列問題,導致句轉換錯誤(1)詞庫收詞不全;(2)知識庫、詞法、語義規(guī)則不全或不夠完善,例如“再精簡,再膨脹”與“在精簡,在膨脹”之間的區(qū)分;
(3)自動分詞匹配算法不夠完善;(4)語法、語義分類相同,或者語義歸類不當?shù)仍?,這類錯誤目前的漢語語法完全無能為力,例如;“權力-權利”、“形式-形勢”等;4、我們的漢語文字資料浩如繁煙,方言土語眾多,漢語語法難以準確地歸納所有的語言現(xiàn)象,而且語言文字日新月異,用戶情況更是千差萬別;5、由于機器內部的代碼是以“字”為單元的,系統(tǒng)間交換信息的交換碼也是如此,文章中單字詞更是不少,當用句、詞切分字不成功時,仍然會面臨字、詞鍵盤輸入法“好學的不好用(拼音類),好用的不好學(字根類)”的尷尬。
6、拼音類詞句轉換系統(tǒng),輸入方式為音節(jié)序列,即字的聲、韻、調信息,遇到不認識及讀不準音、韻、調的字和非字符號就不好辦(若去掉音調,而改用空格鍵符等作為隔音符,又不利于提高句轉換的正確率);本發(fā)明就是為克服現(xiàn)有的各種漢字鍵盤句輸入系統(tǒng)的上述難點和缺陷,面提供一種易學、好用和通用的漢字鍵盤句輸入系統(tǒng)(以下簡稱為BM句輸入系統(tǒng))。
本發(fā)明的漢字鍵盤句輸入系統(tǒng),包括有字輸入和句輸入方式,字的輸入以代碼的形式通過鍵盤上的字母鍵和數(shù)字鍵完成,并配置有將任意兩個漢字之間詞與非詞的組合關系盡數(shù)包容的軟詞庫,句輸入方式的輸入方法為以字母V作為句輸入的引導符,回車鍵作為該句的結束符,格式為V字編碼 字編碼……字編碼<CR>
上述字輸入的編碼規(guī)則為字的拆分部首依其首筆劃在該字中的筆順,依次定為第一、次、末部首,字按照拆分部首的數(shù)目分為單部首字、雙部首字和三部首字,其中(1)單部首字的編碼方式為字的讀音首字母+字首筆劃代碼+字次筆劃代碼+字末筆劃代碼,筆劃數(shù)不足時,先取首筆劃,次取末筆劃,不足的用字母補齊;(2)雙部首字編碼方式為第一部首代碼+末部首代碼+末部首首筆劃代碼+末部首末筆劃代碼,當末部首非字時第3碼改為末部首次筆劃代碼,其余同單部首字規(guī)定;(3)三部首字編碼方式為第一部首代碼+次部首代碼+末部首代碼+末部首末筆劃代碼。
上述句輸入方式的使用規(guī)則為(1)相鄰字的編碼之間可以用1個或多個空格符分隔,也可以不用;(2)每個句子允許為4~36個字符,即不用空格鍵符分隔時,每個句子限定為2~18個字;除空格鍵分隔符外,其余字符必須為全角字符(漢字符,包括非字符號)的編碼;(3)每個字按照上述字編碼規(guī)則固定取前3碼;一個字的三個編碼之間不準用空格符分隔,句中有疊字時,其次字的編碼可簡化為一個字母V,以縮短碼長;(4)退格鍵用于刪除最末一個字符,回車鍵和ALT+空格鍵組合用于刪除全部編碼字符;光標左右移鍵“←”、“→”與刪除鍵DEL、插入鍵INS配合,可以用于在輸入的編碼中間進行插入、更改或刪除字符操作。
此外,本發(fā)明還包括有自定義短語輸入方式,其輸入格式為V???<CR>
其中???表示屬于鍵元集(0~9和A~Z)的任意三個編碼字符。
上述三個編碼字符可用該短語的前二末一字標準拼音的首字母,也可以用任一種輸入法的字、詞編碼方法。
下面對本發(fā)明的技術方案進行詳細的描述
圖1為BM句輸入和自定義短語輸入使用流程圖;圖2為BM句輸入算法流程圖;圖3為自定義短語輸入算法示意圖。
本發(fā)明的BM句輸入系統(tǒng)可以實現(xiàn)字、詞、句和自定義短語的混合輸入,其中字、詞輸入方式時的字表、軟詞庫和程序的編制與專利申請?zhí)枮?6119064.7(BM輸入法)中對BM100字集的處理相同,且其字集、鍵元集、拆字編碼規(guī)劃和字詞使用規(guī)則也與上述專利申請?zhí)柕妮斎敕ㄏ嗤>漭斎氲姆椒橐宰帜竀作為句輸入的引導符,回車鍵作為該句的結束符,格式為V字編碼字編碼……字編碼<CR>。其使用規(guī)則為\ (1)相鄰字的編碼之間可以用1個或多個空格符分隔,也可以不用;(2)每個句子允許為4~36個字符,即不用空格鍵符分隔時,每個句子限定為2~18個字;除空格鍵分隔符外,其余字符必須為全角字符(漢字符,包括非字符號)的編碼;(3)每個字按照上述編碼規(guī)劃固定取前3碼;一個字的三個編碼之間不準用空格符分隔,句中有疊字時,其次字的編碼可簡化為一個字母V,以縮短碼長;(4)退格鍵用于刪除最末一個字符,回車鍵和ALT+空格鍵組合用于刪除全部編碼字符;光標左右移鍵“←”、“→”與刪除鍵DEL、插入鍵INS配合,可以用于在輸入的編碼中間進行插入、更改或刪除字符操作。
根據(jù)上述使用規(guī)則輸入字編碼,并鍵入回車鍵后,該句的轉換結果即在提示行編碼區(qū)顯示,至于是否直接上屏,由用戶在裝入BM句輸入系統(tǒng)的命令參數(shù)中予以指定“無條件上屏”或“有條件上屏”兩種方式,其中采用“無條件上屏”時,則無論所輸入句子的轉換結果是否可靠,均在提示行顯示的同時直接上屏;采用“有條件上屏”時,若系統(tǒng)處理程序確認本次轉換結果比較可靠,則在提行顯示的同時直接上屏,若認為不可靠,則先修正可能出錯的字,并需通過按鍵確認后才上屏。
若本次轉換結果不太可靠而用戶又指定“有條件上屏”,則提示行光標將停于可能出錯的字處,并在提示行右邊提示該字的三個編碼和1~10個可供選擇的字,用戶鍵入相應的數(shù)字鍵選擇所要的字,若可供選擇的字超出10個,可用退格鍵翻頁(若剛好只有10個可選字,則第10個字的標識序號為正常的“0”,若多于10個,則第10個字的標識序號改為“?”,不過要選擇第10個字時仍應鍵入數(shù)字鍵“0”),利用光標鍵“←”、“→”可以選擇要修改的字,提示行右邊的提示編碼和可選字將隨之而改變;修改完畢,鍵入空格鍵該句即上屏。
圖1規(guī)定了使用BM句和自定義短語輸入時的具體步驟,用戶在最初使用時,應盡量采用“有條件上屏”方式,并在提示行修正錯誤,此時,程序將自動修改軟詞庫,而且即改即用,下次就不會犯同樣的錯誤;當經過一段時間的使用,轉換錯誤已經比較少時,即可改用“無條件上屏”方式,以實現(xiàn)盲打,加快輸入速度,此時的轉換錯誤,可用字詞輸入方式修改。圖2規(guī)定了一個符合要求的句子的具體處理方法。利用這個算法,無論這個句子可能有多少種不同的組合,也無論最后結果是否正確,都只有唯一一種選擇。
句輸入處理,如圖2所示,分為三個步驟(1)根據(jù)每個字的前3碼,檢讀字表,確定重碼字,例如,編碼“MMX”對應“想、夢”兩個重碼字。若整個句子的所有字均無重碼,則結束處理,并認為本次轉換結果比較可靠。據(jù)10183字的試驗文本統(tǒng)計表明,無重碼字計6246字,約占文本總字數(shù)的61.337%。
(2)有重碼時,檢索軟詞庫,讀出相關的所有軟詞,先舍去組合路徑中無軟詞的重碼字,例如圖2中的“齲”、“鹼”和“砍”三字;再舍去軟詞數(shù)相對較少的組合路徑,例如圖2中的“夢”字;若軟詞數(shù)相同,則本步驟無法作出取舍,留待第三步處理,例如圖6中的“愛”和“受”;若經本步驟后只有唯一一種選擇,則結束處理,并認為本次轉換結果比較可靠。據(jù)10183字的試驗文本統(tǒng)計表明,利用軟詞庫可以正確分辯出3290字,約占文本總字數(shù)的32.309%。
(3)經過上一步驟的處理后的重碼字,選擇字頻較低(即更為常用)的字,并結束該句的轉換,并認為本次轉換結果不大可靠,例如圖2中的“愛”字的頻序為835,“受”字的頻序為363,故選擇了“受”字;據(jù)10183字的試驗文本統(tǒng)計表明,經過上述兩個步驟的處理后剩余的647字中,依靠頻序猜對546字,約占文本總字數(shù)的5.326%。
圖2中例句的轉換結果為“我想為親受的媽媽點一首歌”,有一個錯,由于經過了頻序選擇,故認為本次轉換結果不大可靠。據(jù)10183字的試驗文本統(tǒng)計表明,經過上述三個步驟的處理后,出錯的有101字,約占文本總字數(shù)的0.992%。其中又可以細分為三類錯誤一般錯誤42個,即軟詞詞頻相差較大,例如圖2中的“親愛”和“親受”,“親愛”顯然比“親受”常用的多,將“親受”改為非軟詞,對今后的轉換無疑是有利的;嚴重錯誤43個,即軟詞詞頻相差不大,例如“昨天”和“明天”,雖然“昨”字的頻序為1871,“明”字的頻度為201,但這兩個詞的詞頻卻差不多,無論怎樣修改軟詞庫,都會顧此失彼;永久錯誤16個,即某些未入軟詞庫的不常用字造成的錯誤。
對軟詞庫的進一步增刪優(yōu)化,即指對一般錯誤和嚴重錯誤進行有利于一個特定的用戶的修正過程。
據(jù)此,即可以編制句輸入的處理程序。
此外,本發(fā)明的BM句輸入系統(tǒng)還包括有自定義短語輸入方式,用戶可以將經常使用到的句子定義為短語使用,以降低動態(tài)碼長。也使用字母V作為引導符,回車鍵作為該自定義短語的結束符。每個自定義短語的字數(shù)允許為1~18字,編碼格式為V???<CR>
其中???表示屬于鍵元集(0~9和A~Z)的任意三個編碼字符,自定義短語中允許有ASII字符,只要該短語的半角字符總數(shù)不多于36個即可,三個編碼字符不作進一步規(guī)定,用戶可以用該短語的前二末一字標準拼音的首字母,也可以借用任一種輸入法的字、詞編碼方法,由用戶自定,只要用戶自己能記住就行了。
鍵入回車鍵后,若這個編碼有短語,則該短語上屏,提示行只顯示該短語的編碼字符及該短語的字符數(shù),鍵入ALT+空格鍵組合刪除此短語;如果這個編碼無短語,則提示行編碼之后顯示[無定義],并自動進入自定義短語增加狀態(tài),要求按字詞方式輸入,可以有半角字符,按回車鍵結束定義;若顯示[無定義]時直接回車,則不增加退出??梢?,自定義短語的編碼是不允許有重碼的。
圖3規(guī)定了一個符合要求的編碼對應的短語的查找、讀取、增刪、排序等操作的算法。
自定義短語的處理,短語庫占用64KB內存空間,如圖3所示,短語編碼計有000~ZZZ共36^3=46656種組合。采用二級索引。第一級索引給出每一個編碼的使用情況;第二級索引緊接著第一級存放,指明該短語在短語庫中的首址,排列順序同第一級索引,增加或刪除短語時,應重新排序。
在索引之后為短語區(qū);每條短語首先標明自身的長茺(占用5bit);每個字的標志為4bit,分為漢字符、ASCII(半角)字符、特殊字符(例如夾在短語中的回車符等)和結束符四大類;漢字符為0~12bit格式,只須標明字頻序即可,總計可表示8191個字,例如,“的、一、是、在、了、不、和”的字頻依次為1、2、3、4、5、6、7,則依次可表示為“0000、00010、00011、001000、001001、001010、001011”,依此類推;ASCII字符為8bit格式,只須標明該字符ASCII值即可;特殊字符為2bit格式,最多可表示4個特殊字符;最后為結束符,0bit格式。
增加短語時,按生成短語的先后順序排列;刪除短語時,將該條第一級索引的標志位清除,將第二級索引的地址信息刪除,并將短語的長度置0即可。因此,當增刪較頻繁時,會出現(xiàn)磁盤“碎片”,為了盡可能減少“碎片”,在增加短誤時,應優(yōu)先使用“碎片”,算法是從短語區(qū)開始查找短語長度為0的“碎片”,并進一步搜尋該短語的結束標志,由此計算出該“碎片”的長度,若剛好等于增加短語的長度,則予以使用,否則繼續(xù)查找,直至末尾,無合適的碎片可用時,才于末尾添加。
經測算,2~18字短語,64KB內存空間的短語庫可存放10346~2232條自定義短語。
據(jù)此,即可以編制自定義短語的處理程序。
依據(jù)字碼表、軟詞段文件、短語庫和BM輸入法使用規(guī)則即可進行程序編制、匯編、鏈接和調試,通過后掛接到漢字系統(tǒng)上即可使用。由于本輸入法數(shù)據(jù)繁多,軟件較長,為了盡可能節(jié)省內存,使得低檔機用戶可以使用,宜采用匯編語言進行程序編制。
本發(fā)明的漢字鍵盤句輸入系統(tǒng),使用了鍵盤上的下列46個鍵0~9、A~Z、Alt鍵、回車鍵、退格鍵、空格鍵、分號鍵、光標左移鍵“←”、光標右移鍵“→”、Ins鍵、Del鍵、大小寫字母轉換鍵Capslock。其中數(shù)字鍵0~9和字母鍵A~Z用于字的編碼,0~9和空格鍵還用于重碼字的選擇;Alt+數(shù)字鍵組合用于重復選字,Alt+0鍵組合還用于回存修改過的軟詞庫;分號鍵用于向軟詞庫增刪詞匯;退格鍵和回車鍵用于在提示行修正句轉換錯誤;Capslock鍵及Alt+空格鍵組合用于結束或開始一輪字、詞、句和自定文短語的混合輸入。
本發(fā)明與現(xiàn)有各種句輸入系統(tǒng)相比具有如下的優(yōu)點和有益效果1、現(xiàn)在的句輸入系統(tǒng),特別是拼音語句轉換系統(tǒng),無一不將研究工作的重點放在漢語的語法研究上,而語法只是被動地歸納語言最基本的規(guī)律,不可能充分地包容所有的語言現(xiàn)象,也必然出現(xiàn)滯后現(xiàn)象,目前甚至還未形成一個公認的比較完備的語法體系。另一方面,目前各種句輸入系統(tǒng)中,集合各種語法規(guī)則、詞匯的知識庫(或稱為“詞典”),占用電腦的內存十分龐大,或者說只能調入最常見的一部分詞匯,因而內存容量較小、處理速度較慢的低檔機用戶就無法使用,等等,給人的總體印象是“笨拙”。而本發(fā)明則以語言現(xiàn)象中最基本、最直接的元素——字與字之間的組合關系入手,摒棄盡可能多的中間環(huán)節(jié),將研究重點在軟詞庫數(shù)據(jù)壓縮上,一般地說,在占用內存不大于4MB時,可裝入不小于680萬雙字詞,是一般的字、詞、句輸入法所難以企及的(例如,InSun拼音語句轉換系統(tǒng)的詞典,一個雙字詞要占用20字節(jié)以上的存貯空間,在占用相同內存容量下,能容納的詞匯量不及本發(fā)明的3%,而且能調入內存的也只有一萬余詞條)??梢哉f,軟詞庫基本上可以容納所有的雙字詞匯和語法現(xiàn)象;更重要的是,由于用戶對軟詞庫的增刪優(yōu)化是極其方便的,在句輸入時對軟詞庫的修改還可以由程序代勞,因此具有極強的自學習和自適應能力,BM句輸入系統(tǒng)可以在較短時間內適應于每一個用戶的需要,也可以極方便地跟上語言的發(fā)展變化,基本上解決了句輸入技術方面的一系列問題。
2、本發(fā)明的句轉換正確率較高,據(jù)對1531字的離散文本(單句)和8652字的連續(xù)文本(文章)統(tǒng)計的結果,正確率達97.061~99.366%,經過對軟詞庫的增刪優(yōu)化,正確率可以進一步提高到98.040~99.660%。遠比目前的各種句輸入系統(tǒng)為高(例如InSum拼音語句轉換系統(tǒng)對10167字試驗文本的轉換正確率約為92%)。當然,這個結果是建立在調入全部56段軟詞的基礎上的,此時差不多要占用4MB內存空間;對于內存不足4MB的較低檔的電腦,當軟詞庫不能完全調入時,據(jù)測算,裝入0~56段軟詞時,句轉換的正確率在85~99.660%之間。因此,如果調入的軟詞段過少,致使轉換正確率過低時,用戶可以只用字詞和自定義短語方式輸入。
3、本發(fā)明采用BM字詞輸入法的拆字編碼方案,以成字部首標準讀音的首字母作代碼(只有16個類字部首例外),基本上合乎規(guī)范;用戶所認得的字,可以直接用之編碼,符合國民教育背景;每一個用戶只需要有識字1500個的能力,就有能力正確地輸入全部30865個漢字和非字符號。
4、本發(fā)明可以實現(xiàn)字、詞、句和自定義短語的混合輸入及快速看打、聽打和想打,可處理字集為7862字,包括了現(xiàn)代漢語通用字表的7000個漢字、GB2312-80中的6763個漢字和687個非字符號。
5、BM字詞輸入法是面向廣大的非專業(yè)打字人員的,在保證易學性和通用性的前提下以盡可能降低動態(tài)碼長為目標,不適用于專業(yè)人員的盲打。BM句輸入系統(tǒng)則主要為專業(yè)打字人員設計的,據(jù)測算,BM字詞輸入法的動態(tài)碼長在1.78~3.18之間,BM句輸入系統(tǒng)未用自定義短語時的動態(tài)碼長約為3.207,比之BM字詞輸入法要長,但比以標準拼音輸入方式的句輸入系統(tǒng)要好;充分利用字、詞、句和自定義短語混合輸入時,動態(tài)碼長可降至2.2以下,專業(yè)打字人員輸入速度可望達到150/分鐘以上。
權利要求
1.一種漢字鍵盤句輸入系統(tǒng),字輸入以代碼的形式通過鍵盤上的字母鍵和數(shù)字鍵完成,并配置有將任意兩個漢字之間詞與非詞的組合關系盡數(shù)包容的軟詞庫,其特征在于還包括有句輸入方式,其輸入方法為以字母V作為句輸入的引導符,回車鍵作為該句的結束符,格式為V字編碼 字編碼……字編碼<CR>
2.根據(jù)權利要求1所述的漢字鍵盤句輸入系統(tǒng),其特征在于上述字輸入的編碼規(guī)則為字的拆分部首依其首筆劃在該字中的筆順,依次定為第一、次、末部首,字按照拆分部首的數(shù)目分為單部首字、雙部首字和三部首字,其中(1)單部首字的編碼方式為字的讀音首字母+字首筆劃代碼+字次筆劃代碼+字末筆劃代碼,筆劃數(shù)不足時,先取首筆劃,次取末筆劃,不足的用字母補齊;(2)雙部首字編碼方式為第一部首代碼+末部首代碼+末部首首筆劃代碼+末部首末筆劃代碼,當末部首非字時第3碼改為末部首次筆劃代碼,其余同單部首字規(guī)定;(3)三部首字編碼方式為第一部首代碼+次部首代碼+末部首代碼+末部首末筆劃代碼。
3.根據(jù)權利要求2所述的漢字鍵盤句輸入系統(tǒng),其特征在于上述句輸入方式的使用規(guī)則為;(1)相鄰字的編碼之間可以用1個或多個空格符分隔,也可以不用;(2)每個句子允許為4~36個字符,即不用空格鍵符分隔時,每個句子限定為2~18個字;除空格鍵分隔符外,其余字符必須為全角字符(漢字符,包括非字符號)的編碼;(3)每個字按照上述字編碼規(guī)則固定取前3碼;一個字的三個編碼之間不準用空格符分隔,句中有疊字時,其次字的編碼可簡化為一個字母V,以縮短碼長;(4)退格鍵用于刪除最末一個字符,回車鍵和ALT+空格鍵組合用于刪除全部編碼字符;光標左右移鍵“←”、“→”與刪除鍵DEL、插入鍵INS配合,可以用于在輸入的編碼中間進行插入、更改或刪除字符操作。
4.根據(jù)權利要求3所述的漢字鍵盤句輸入系統(tǒng),其特征在于上述輸入句子的上屏可采用“無條件上屏”或“有條件上屏”兩種方式,其中采用“無條件上屏”時,則無論所輸入句子的轉換結果是否可靠,均在提示行顯示的同時直接上屏;采用“有條件上屏”時,若系統(tǒng)處理程序確認本次轉換結果比較可靠,則在提行顯示的同時直接上屏,若認為不可靠,則先修正可能出錯的字,并需通過按鍵確認后才上屏。
5.根據(jù)權利要求4所述的漢字鍵盤句輸入系統(tǒng),其特征在于上述修正出錯的方式為,提示行光標將停于可能出錯的字處,并在提示行右邊提示該字的三個編碼和1~10個可供選擇的字,用戶鍵入相應的數(shù)字鍵選擇所要的字,若可供選擇的字超出10個,可用退格鍵翻頁(若剛好只有10個可選字,則第10個字的標識序號為正常的“0”,若多于10個,則第10個字的標識序號改為“?”,不過要選擇第10個字時仍應鍵入數(shù)字鍵“0”),利用光標鍵“←”、“→”可以選擇要修改的字,提示行右邊的提示編碼和可選字將隨之而改變;修改完畢,鍵入空格鍵該句即上屏。
6.根據(jù)權利要求1所述的漢字鍵盤句輸入系統(tǒng),其特征在于還包括有自定義短語輸入方式,其輸入格式為V???<CR>其中???表示屬于鍵元集(0~9和A~Z)的任意三個編碼字符。
7.根據(jù)權利要求6所述的漢字鍵盤句輸入系統(tǒng),其特征在于上述三個編碼字符可用該短語的前二末一字標準拼音的首字母,也可以用任一種輸入法的字、詞編碼方法。
8.根據(jù)權利要求7所述的漢字鍵盤句輸入系統(tǒng),其特征在于上述編碼有短語,則該短語上屏,提示行只顯示該短語的編碼字符及該短語的字符數(shù),鍵入ALT+空格鍵組合刪除此短語;如果這個編碼無短語,則提示行編碼之后顯示[無定義],并自動進入自定義短語增加狀態(tài),要求按字詞方式輸入,可以有半角字符,按回車鍵結束定義;若顯示[無定義]時直接回車,則不增加退出。
9.根據(jù)權利要求1或2或3或4或5或6或7或8所述的漢字鍵盤句輸入系統(tǒng),其特征在于可以實現(xiàn)字、詞、句和自定義短語的混合輸入,且使用了鍵盤上的下列46個鍵0~9、A~Z、Alt鍵、回車鍵、退格鍵、空格鍵、分號鍵、光標左移鍵“←”、光標右移鍵“→”、Ins鍵、Del鍵、大小寫字母轉換鍵Capslock。其中數(shù)字鍵0~9和字母鍵A~Z用于字的編碼,0~9和空格鍵還用于重碼字的選擇;Alt+數(shù)字鍵組合用于重復選字,Alt+0鍵組合還用于回存修改過的軟詞庫;分號鍵用于向軟詞庫增刪詞匯;退格鍵和回車鍵用于在提示行修正句轉換錯誤;Capslock鍵及Alt+空格鍵組合用于結束或開始一輪字、詞、句和自定義短語的混合輸入。
全文摘要
一種計算機漢字鍵盤句輸入系統(tǒng),采用“軟詞庫”,將任意兩個漢字之間詞與非詞的組合關系(即漢語的所有詞匯和語法現(xiàn)象)盡數(shù)包容,具有極強的自學習能力,完全摒棄了通常的句輸入技術中重點考慮語法研究的模式??梢詫崿F(xiàn)字、詞、句、自定義短語的混合輸入和快速看打、聽打、想打。句轉換正確率達97~99%,經對軟詞庫的增刪優(yōu)化,正確率可以進一步提高到98~99.5%。是一種易學、好用和通用的漢字鍵盤輸入法。
文檔編號G06F3/023GK1159028SQ9611731
公開日1997年9月10日 申請日期1996年11月30日 優(yōu)先權日1996年11月30日
發(fā)明者朱亮 申請人:朱亮