一種多元編碼輸入方法
【專利摘要】本發(fā)明涉及一種多元編碼輸入方法,對每個漢字按書寫順序的首筆畫、部首、關聯(lián)體、整體的多元部件編碼取碼方式建立其相對的多元部件編碼字詞數(shù)據(jù)庫,對詞中任意一個字可以使用任意一種編碼輸入,打傳統(tǒng)輸入的局限,接收手寫系統(tǒng)產生的軌跡信息同時轉化為漢字的部件編碼并為檢索單位,再檢索出字詞編碼庫中對應的字/詞/句/段;將上述部件編碼序列順序輸入計算機完成漢字詞匯輸入,90%的詞匯均在3個部件編碼內輸出,99.9%的詞匯均在4個部件編碼披露出來,可絕對準確地找到數(shù)據(jù)庫中匹配的字詞,使手寫輸入的識別效果和輸入速度達到最高的境界。
【專利說明】
一種多兀編碼輸入方法
技術領域
[0001] 本發(fā)明涉及漢字輸入技術,更具體地說,涉及一種多元編碼輸入方法和系統(tǒng)。
【背景技術】
[0002] 觸摸式顯示屏的出現(xiàn)大大改變了移動終端的指令輸入方式,機械式硬件鍵盤從此 不再是移動終端的必須部件。隨著觸摸式顯示屏的大范圍應用,手寫式漢字輸入方法開始 在移動終端上流行開來。
[0003] 然而現(xiàn)在目前的手寫輸入都是圖形全文檢索,或單一方式輸入,不能隨心所欲地 輸入。因此,需要一種自由寫式的手寫輸入解決方案,可有效解決現(xiàn)有手寫式漢字輸入方法 輸入速度較慢識別的問題。
【發(fā)明內容】
[0004] 本發(fā)明要解決的技術問題在于,針對現(xiàn)有手寫式漢字輸入方法輸入速度較慢、識 別率低、或單一方式輸入,不能隨心所欲地輸入等缺陷,因此本發(fā)明是提供一種多元編碼輸 入方法,對詞匯中任意一個字可以使用任意一種編碼輸入,打傳統(tǒng)輸入的局限,由于人們本 身易于健忘,對許多漢字在書寫中也會有提筆忘字現(xiàn)象,還有面對繁體漢字筆畫多及復雜 的問題,而本發(fā)明可以對詞中任意一字可以用其整體、部首(關聯(lián)體)、首筆畫、特定字符 模糊匹配輸入等各種方式自由輸入檢索,在實際輸入過程中,使用部件編碼累積檢索方案, 90 %的詞匯均在3個部件編碼內輸出,99. 9 %的詞匯均在4個部件編碼披露出來,可絕對準 確地找到數(shù)據(jù)庫中匹配的字詞,使手寫輸入的識別效果和輸入速度達到最高的境界。
[0005] 本發(fā)明解決其技術問題所采用的技術方案是:對每個漢字按書寫順序的首筆畫、 部首、關聯(lián)體、整體的多元部件編碼取碼方式建立其相對的多元部件編碼字詞數(shù)據(jù)庫。在手 寫系統(tǒng)手寫輸入,利用左右文義分析關系,使用文字切割方法,采用綜合分析手寫系統(tǒng)產生 的軌跡信息同時轉化為漢字的部件編碼并為檢索單位,供程序以部件編碼累積檢索方案, 檢索出多元部件編碼字詞數(shù)據(jù)庫中對應的字/詞/句/段。
[0006] 所述的首筆畫部件編碼包括漢字書寫時起筆的第一個筆畫;
[0007] 所述的部首、關聯(lián)體部件編碼包括可組成其它漢字的漢字;
[0008] 所述的整體部件編碼包括不可組成其它漢字的完整的漢字;
[0009] 所述的接收手寫系統(tǒng)產生的軌跡信息的手寫輸入方式包括;續(xù)字書寫、續(xù)筆書寫、 連續(xù)書寫、分格書寫的任一方式獲取;
[0010] 所述的多元部件編碼字詞數(shù)據(jù)檢索出結果的特征包括:
[0011] 首筆畫、部首、關聯(lián)體的部件編碼在輸入第1個部件編碼時,檢索出的結果為本身 關聯(lián)的單一漢字排序優(yōu)先,不足再以詞匯后補;
[0012] 整體部件編碼在輸入第1個部件編碼時,檢索出的結果為本身的1個漢字并排序 在第1位,從第2位起全部為第1位漢字開頭的關聯(lián)詞;
[0013] 首筆畫、部首、關聯(lián)體、整體的部件編碼串聯(lián)或互聯(lián)在輸入第2個部件編碼起,累 積檢索出的結果均為關聯(lián)的詞匯。
[0014] 所述的多元部件編碼字詞數(shù)據(jù)庫包括:首筆畫、部首、關聯(lián)體,整體漢字的各種部 件的并聯(lián)和串聯(lián)及互聯(lián)的各組編碼,使輸入時任的編碼隨意運用,并以任意一種部件自身 獨立的編碼也能輸出所需的字/詞。
[0015] 所述的連續(xù)書寫方式包括:先在手寫程序上設置識別連續(xù)書寫方式,在手寫設備 上連續(xù)手寫若干個部件編碼,按在手寫設備上每寫完一次停頓的軌跡信息均作若干個漢字 的部件編碼來分析判斷,采用綜合分析,利用左右文義分析關系,使用文字切割方法,篩選 最近似的若干個部件編碼提交給程序進行檢索,程序接收部件編碼顯示在界面上編碼顯示 位置上,并把其相關的字/詞檢索出來:
[0016] 所述的續(xù)字書寫方式包括:先在手寫程序上設置識別續(xù)字書寫方式,按在手寫設 備上每寫完一次停頓的軌跡信息均只作為一個漢字的部件編碼的定律來進行分析判斷,篩 選最近似的一個優(yōu)先提交給程序進行檢索,程序接收部件編碼顯示在界面上編碼顯示位置 上,并把其相關的字/詞檢索出來:
[0017] 包括以下步驟:
[0018] a、在手寫設備上手寫輸入,識別分析并篩選最近似的部件編碼,程序接收的部件 編碼提取到界面上編碼顯示位置并查找部件編碼字詞數(shù)據(jù)庫,把找到的字詞顯示在輸入的 界面上候選;
[0019] 判斷輸入的界面的字/詞是否出現(xiàn),否轉f,是執(zhí)行b ;
[0020] b、若判斷所需的字/詞出現(xiàn),可指令輸入上屏執(zhí)行c,不輸入上屏轉f ;
[0021] c、指令輸入上屏并清空所有的數(shù)據(jù),并轉d ;
[0022] d、結束。
[0023] e、判斷識別的編碼是否正確部件編碼還是錯誤部件編碼,否轉g,是執(zhí)行f ;
[0024] f、繼續(xù)手寫輸入,把接收到的部件編碼,排在前面輸入的尾部累積相加進行并返 回a ;
[0025] g、退一步或刪除最后一編碼或清空返回a。
[0026] 在本發(fā)明所的一種多元編碼輸入方法中所述的部首、關聯(lián)體組成其它漢字的相關 部份包括;乂咅直尹互執(zhí)夕汸-采孚4門卜鹵%敖八分公谷白卑北貝鼻比敝辟扁丙并 不步產廠車臣辰呈齒尺赤蟲出川此次大夸奇奄歹單刀丁可東豆毒盾厄而兒耳洱番反方非 分豐風夫弗甫父干武甘告戈革工鞏公弓鼓古骨瓜關光廣鬼亥害漢禾合黑亨粦戶化火吉幾 朵己加甲尖兼角巾斤金今僅京井九臼開亢殼口 m淚里麗立力了列林六龍^盧鹿麻馬驢麥 毛矛眉每門米苗莫母木目乃南能鳥牛奴女皮片其奇氣泣七千壬舌乖前且親青丘求酋區(qū)曲 取去犬人倉從令日如汝入三殺沙山上尚少涉申身聲尸孛石矢士壹殼是氏首鼠束水絲已臺 湯天田土老屯萬王亡吉韋未尉文沃武午戊勿夕習下先閑相鄉(xiāng)小肖芯辛興玄薛穴血牙亞炎 厭彥央羊妖?業(yè)醫(yī)衣亦音尹雍永由酉又于余俞魚予雨與羽元月云曾乍斬占章兆折者正支 直執(zhí)止至舟爪茲子自走£兀廿鬲禺匕夭匚彳攸僉勹卩芻U厶壙#芘堇奪捫弋口采 今彡3夂悚4月?汶涑屮孑鄉(xiāng)絲鄉(xiāng)〈〈〈縣髟戔才、磯韋甬廣年疋耒聲缶艮豕豸隹瞿 廠后反瓜爪少尸々爾7、丨,尹主丑止宍A J狀筍主1興。
[0027] 在本發(fā)明所的一種多元編碼輸入方法中判斷識別的部件編碼是否正確部件編碼 還是錯誤部件編碼包括:若是錯誤部件編碼時,再判斷近似漢字候選區(qū)上是否有正確的漢 字部件,若有正確的漢字部件,有則選中替換在界面上顯示錯誤的部件編碼,并用正確的部 件編碼去檢索多元部件編碼字詞數(shù)據(jù)庫,刷新輸入的界面上候選區(qū)。
[0028] 在本發(fā)明所述的一種多元編碼輸入方法中還包括:輸入時判部件斷編碼對應詞匯 若是唯一,可以任意設定是否唯一碼的結果自動上屏。
[0029] 在本發(fā)明所述的一種多元編碼輸入方法中還包括:對檢索字/詞部件編碼上屏輸 入特色:編碼顯示位置上顯示的部件編碼,在當前編碼字詞候選區(qū)有相關的字/詞,或在字 詞候選區(qū)無相關的字/詞,并連續(xù)寫若干個字詞的組合句,也屬于部件編碼并支持指令上 屏輸入的連句書寫特色。
[0030] 在本發(fā)明所述的一種多元編碼輸入方法中還包括:對檢索字/詞的部件編碼設定 特定字符,代表任一部件編碼的模糊匹配檢索。
[0031] 在本發(fā)明所述的一種多元編碼輸入方法中還包括:除多元部件編碼組合外還可使 用部首的部件編碼獨立完成。
[0032] 在本發(fā)明所述的一種多元編碼輸入方法中還包括:除多元部件編碼組合外還可使 用整體的部件編碼獨立完成。
[0033] 在本發(fā)明所述的一種多元編碼輸入方法中還包括:繁體漢字根據(jù)繁體每個漢字按 書寫順序的首筆畫部首、關聯(lián)體、整體的部件編碼取碼方式建立其相對的多元部件編碼字 詞數(shù)據(jù)庫。
[0034] 在本發(fā)明所述的一種多元編碼輸入方法中還包括:程序接收部件編碼在界面中的 顯示位置上讀取部件編碼直接在字詞候選區(qū)的第1位顯示,并用第1位為檢索的單位,檢索 出其關聯(lián)的字詞,并且支持第1上屏輸入。
[0035] 實施本發(fā)明的技術方案,具有以下有益效果:本發(fā)明提供的一種多元編碼輸入方 法,允許用戶通過手寫的輸入方式,以首筆畫、部首(關聯(lián)體)、整體漢字的各種部件的并聯(lián) 和串聯(lián)及互聯(lián)的各組部件編碼,使輸入時任的部件編碼隨意運用,并以任意一種部件自身 獨立的部件編碼也能輸出所需的詞匯。先鎖定已輸入的部件編碼為前綴,指定數(shù)據(jù)通道入 口類別中檢索目標,與后面輸入部件編碼的為后綴并鏈鎖式關聯(lián),以步步相連,環(huán)環(huán)相扣的 數(shù)據(jù)鏈,順藤摸瓜方式,縮小檢索范圍,使輸入的詞匯步步提示,輕易快速準確地找到所需 詞匯的輸入。由此可見,本發(fā)明提供的技術方案對所有的詞匯輸入較少部件編碼即能準確 檢索出來,即可快速實現(xiàn)所需字/詞字的輸入,而縮短輸入的時間,并且提高了識別的準確 性和輸入速度,使手寫輸入更上一臺階。
【附圖說明】
[0036] 下面依據(jù)本發(fā)明的將結合附圖及實施示例對本發(fā)明作講一步說明,附圖中:
[0037] 圖1是流稈圖:
[0038] 圖2是輸入界面示意圖:
[0039] 圖3A~圖3C是部首和整體部件纟目合詞'匯輸入討稈中豐寫輸入界面:
[0040] 圖4A~圖4B是整體部件續(xù)個輸入詞'匯輸入討.稈中豐寫輸入界面:
[0041] 圖5A~圖5B是連續(xù)書寫方式的整體部件,先寫單一,后連寫二字的連寫詞:T輸入 討稈中豐寫輸入界面:
[0042] 圖6A~圖6B是連續(xù)書寫方式的整體部件,先連寫二字,后續(xù)一增加詞:T輸入討稈 中豐寫輸入界面:
[0043] 圖7是連續(xù)書寫方式的整體部件一次寫完三字的詞:T輸入討稈中豐寫輸入界面:
[0044] 圖8是連續(xù)書寫方式的整體部件一次寫完三字的詞:T分割式輸入討稈中豐寫輸 入界面:
【具體實施方式】
[0045] 為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對 本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。
[0046] 本發(fā)明提供的一種多元編碼輸入方法,允許用戶通過手寫的輸入方式,以首筆畫、 部首(關聯(lián)體)、整體漢字的各種部件的并聯(lián)和串聯(lián)及互聯(lián)的各組編碼,使輸入時任的編碼 隨意運用,并以任意一種部件自身獨立的編碼也能輸出所需的詞匯。先鎖定已輸入的部件 編碼為前綴,指定數(shù)據(jù)通道入口類別中檢索目標,與后面輸入部件編碼的為后綴并鏈鎖式 關聯(lián),以步步相連,環(huán)環(huán)相扣的數(shù)據(jù)鏈,順藤摸瓜方式,縮小檢索范圍,使輸入的詞匯步步提 示,輕易快速準確地找到所需詞匯的輸入。由此可見,本發(fā)明提供的技術方案對所有的詞匯 輸入較少部件編碼即能準確檢索出來,即可快速實現(xiàn)所需字/詞字的輸入,而縮短輸入的 時間,并且提高了識別的準確性和輸入速度,使手寫輸入更上一臺階。
[0047] 下面就結合附圖和具體實施例來對本發(fā)明提供的技術方案進行詳細描述:
[0048] 圖1是依據(jù)本發(fā)明一較佳實施例的一種多元編碼輸入方法的流程圖。如圖1所 示,本方法開始前準備于步驟100,預設每個漢字按書寫順序的首筆畫、部首、關聯(lián)體、整體 的部件編碼取碼方式建立其相對多元編碼字詞數(shù)據(jù)庫并建立程序供其檢索,隨后正式輸入 在步驟開始101,在手寫區(qū)手寫輸入102,在下一步驟103,接收手寫系統(tǒng)產生的軌跡信息同 時轉化為漢字的部件編碼并為檢索單位,在下一步驟104,再檢索出多元編碼字詞庫中對應 的字/詞,在字/詞候選區(qū)中顯示候選,在下一步驟105,判斷識別的編碼是否正確?若否轉 201,若是轉106,在下一步驟107,判斷所需的字/詞是否出現(xiàn)?若否轉108返回102,若是 轉301,在下一步驟302,判斷在所需的字/詞在候選區(qū)前面還是后面或再輸入或直接選中 輸入上屏?在下一步驟303,若繼續(xù)手寫輸入,把后面輸人的編碼排序在前面輸入的尾部, 相加一齊供程序檢索并返回102,若不再手寫輸入轉304,選中所需的字/詞輸入上屏,則轉 到步驟305,結果。在步驟201中,判斷識別的編碼不正確時,可以執(zhí)行兩種方法,其一是202 步驟,刪除前面錯誤的編碼或重寫并返回102,其二是203步驟,判斷近似的相關編碼在編 碼候選區(qū)上,是有正確的部件編碼,有則選中替換在界面上顯示的錯誤部件編碼并轉107。
[0049] 下面就以具體實例來說明本發(fā)明提供的一種多元編碼輸入方法,將結合圖1~圖 8對詞匯輸入的方法進行詳細的說明 :
[0050] 部件編碼規(guī)則:每個漢字的首筆畫、部首、關聯(lián)體、整體漢字均作為編碼,在編碼 數(shù)據(jù)庫對所有的詞、句、段中字均包含這上述的部件編碼,分別有并聯(lián)和串聯(lián)及互聯(lián)的各種 編碼,使輸入時任的編碼隨意運用,并以任意一種部件自身獨立的編碼也能輸出所需的詞、 句、段。
[0051] 部件編碼的長度分為兩種:1、不定長度(部件編碼不規(guī)定長度,每字均有編碼); 2、固定長度:
[0052] 由于本發(fā)明的是多元方案,而且以漢字本身的直觀體(首筆畫、部首、關聯(lián)體、整 體)的關系直接編碼和檢索,所以檢索出的結果是絕對準確,所有的詞匯用該方案用2到3 個部件編碼能披露80%,4個部件編碼達到99. 9%披露出來。因此我們用4個部件編碼的 為例:二字詞、三字詞、四字詞時,每字各取1個部件編碼,組為4碼;
[0053] 五字詞以上的多字詞、段、句時,取第一、二、三字前各1部件編碼,末字前1部件編 碼,組成4部件編碼。
[0054] 在輸入過程中的檢索顯示方法:輸入1個部件編碼為一個漢字排序在前,2個部件 編碼為二字詞,3個部件編碼為三字詞,4個部件編碼為四字詞和多字詞,任意部件編碼若 當前對應的沒有詞匯由相關的填充。
[0055] 當用戶要輸入漢字時,先在輸入界面(圖2) slOO的手寫輸入?yún)^(qū)slOl進行書寫,接 收手寫系統(tǒng)產生的軌跡信息同時轉化為漢字的部件編碼并為檢索單位,把部件編碼顯示在 編碼顯示區(qū)上sl〇2,再檢索出字詞編碼庫中對應的字/詞/句/段在字詞候選區(qū)sl03按排 序待指令輸入,把識別到的近似的漢字顯示在近似漢字區(qū)候選sl04。
[0056] 本發(fā)明的接收手寫系統(tǒng)產生的軌跡信息的方式包括:續(xù)字書寫、續(xù)筆書寫、連續(xù)書 寫、分格書寫的任一方式獲??;
[0057] 下面用續(xù)字書寫識別的方式來接收手寫系統(tǒng)產生的軌跡信息,按在手寫設備上每 寫完一次停頓的軌跡信息均只作為一個漢字的部件編碼的定律來進行分析判斷,識別到 最近似的一個顯示在編碼上,并軌跡信息自動隱退,待下個部件編碼的輸入(在特殊設置 下可以設置軌跡信息不自動隱退):
[0058] 例如:用戶想要輸入"誰言寸草心報得三春暉"多字詞的輸入,取第1、2、3字前各 一部件編碼,末字前1部件編碼,組成4部件編碼輸入,所取的詞中字是"誰言寸暉"(中間 的漢字不用管)。
[0059] 分別取對應的詞中的各個字包括部件編碼如下:
[0060] 第1個漢字"誰":、i誰
[0061] 第2個漢字"言":、i言
[0062] 第3個漢字"寸":一寸
[0063] 最后個漢字"暉":丨日暉
[0064] 從上述的可清楚地看到,每個漢字的部件編碼均包含各個部件編碼,程序自動生 成所有詞匯的各種編碼,使用時無需手工作任何的設置,直接在手寫輸入時可以任意組合, 也能檢索出所需的詞匯達到隨心所欲自由寫的方便,當然這"誰言寸草心報得三春暉"也已 包括在內。
[0065] 例如我們取這句的部件編碼如:"誰"的部首"i " + "言"的整體"言" + "寸"的整 體"寸"暉"的首筆畫"丨",部件編碼為:i言寸1
[0066] 實際輸入示例"誰言寸草心報得三春暉"的部件編碼"i言寸丨"過程如下:
[0067] 首先在手寫區(qū)中手寫區(qū)上寫"誰"字的部件編碼"i ",把識別"i "的部件編碼加 以判斷,提交到同時程序檢索數(shù)據(jù)庫中把一個部件編碼對應是一個漢字的數(shù)據(jù),篩選最近 似的一個部件編碼,顯示在編碼顯示區(qū)上(i ),同時把其它較近似的這手寫軌跡信息的部 件編碼('?公、1、丄、亡),分布在近似漢字候選區(qū)中,當編碼顯示區(qū)上的錯誤時,便于選 中其中正確的替換前面編碼顯示區(qū)錯誤的編碼,達到快速修正的作用。此時在數(shù)據(jù)庫中檢 索單一部件編碼對應的單一漢字相關漢字("i "的相關:說、請、謝、記、講、誠……)到顯示 在字詞候選區(qū)中候選輸入(圖3A所示),這時可看到手寫輸入的識別在編碼顯示為"i ",在 字詞候選區(qū)檢索出來的也是"i "相關視為正確的。屏幕上的手寫軌跡隨著隱退,隨后再手 寫輸入第二個"言"的整體漢字部件編碼"言",當手寫輸入第二個編碼時,篩選最近似的一 個部件編碼(言),排序在前面已存在的部件編碼(i )后面,組合起來(i言)去檢索數(shù) 據(jù)庫:當手寫區(qū)域重寫時近似漢字候選區(qū)自動清空,所提取的結果均為重寫后的近似結果, 是獨立結果,與前面輸入的無關。此時時把其它較近似的這手寫軌跡信息的部件編碼(言、 盲、吉、咅、音)分布在近似漢字候選區(qū)中,當編碼顯示區(qū)上的錯誤時,便于選中其中正確的 替換前面編碼顯示區(qū)錯誤的編碼,達到修正的作用。此時在數(shù)據(jù)庫中檢索兩個部件編碼對 應的兩個漢字(或兩個以上)相關漢字("i言"的相關:語言、諾言、證言、謊言、讒言、直 言、諱言……)到顯示在字詞候選區(qū)中候選輸入(圖3B所示),這時可看到手寫輸入的識別 在編碼顯示為"言",在字詞候選區(qū)檢索出來的也是"言"相關視為正確的。屏幕上的手寫軌 跡隨著隱退,隨后再手寫輸入第三個"寸"的整體漢字部件編碼"寸",
[0068] 隨后再手寫輸入第三個"寸"的整體漢字部件編碼"寸",當手寫輸入第三個編碼 時,篩選最近似的一個部件編碼(寸),排序在前面已存在的部件編碼(i言)后面,組合起 來(i言寸)去檢索數(shù)據(jù)庫:此時時把其它較近似的這手寫軌跡信息的部件編碼(#、才) 分布在近似漢字候選區(qū)中,此時在數(shù)據(jù)庫中檢索三個部件編碼對應的三個漢字(或三個以 上)相關漢字("i言寸"相關。
[0069] 由于與"i言寸"這三個部件編碼沒有三個對應的字詞,同時程序把與"i言寸"相 關多字詞顯示在候選區(qū)上填充,補上預知其后面的多字詞"誰言寸草心報得三春暉"顯示在 字詞候選區(qū)中(如:圖3C所示),此時是編碼對應是唯一詞匯,可以指令輸入上屏。實現(xiàn)該 詞的輸入整個出過來。也不用繼續(xù)手寫輸入最后一個部件編碼"丨",當然也可以輸入,在實 際的輸入過程中應免除這畫蛇添足的步驟。
[0070] 在本發(fā)明的特色當輸入時判斷是編碼對應詞匯是唯一時,可以任意設定是否唯一 碼自動上屏。在上述輸入"i言寸"這三個部件編碼時,判斷是唯一編碼可以自動上屏,無 需選擇令(誰言寸草心報得三春暉)自動輸入上屏,更有效地提高輸入的速度
[0071] 本發(fā)明中也可以用全部整體漢字的部件編碼式輸入:
[0072] 用全部整體漢字的部件編碼式輸入,把輸入的部件編碼先寄存在編碼顯示在界面 上編碼顯示位置讀取或寫入內存中隱藏部件讀取的兩種任一方式進行,再把后面輸入的部 件編碼排序在后面(按此類推),相加一齊提供給程序檢索,高速地找到所需的詞詞匯:
[0073] 如同樣也是輸入:"誰言寸草心報得三春暉"這句:如下:
[0074] 分別取對應的詞中字的各個字包括部件編碼如下:
[0075] 第1個漢字"誰":、i誰
[0076] 第2個漢字"言" :、i言
[0077] 第3個漢字"寸":一寸
[0078] 最后個漢字"暉":丨日暉
[0079] 那么該句(誰言寸草心報得三春暉)的完整部件編碼是"誰言寸暉",中間的不用 管,在實際輸入過程中,使用整體漢部件編碼累積檢索方案,可絕對準確性找到數(shù)據(jù)庫中匹 配的字詞,使手寫輸入的識別效果達到最高的境界。
[0080] 實例如下:
[0081] 首先在手寫區(qū)中手寫區(qū)上寫"誰"字的部件編碼"誰",把識別"誰"的部件編碼加 以判斷,提交到同時程序檢索數(shù)據(jù)庫中把一個部件編碼對應是一個漢字的數(shù)據(jù),篩選最近 似的一個部件編碼,顯示在編碼顯示區(qū)上(誰),同時把其它較近似的這手寫軌跡信息的部 件編碼(淮、準、唯、堆)分布在近似漢字候選區(qū)中,此時在部件編碼數(shù)據(jù)庫中檢索單一部件 編碼對應的單一漢字相關漢字優(yōu)先,然后把相關一個漢字以上的二字詞相關的顯示在字詞 候選區(qū)中候選輸入,相關的結果(誰、誰知、誰人、誰能、誰也、誰都)如:(圖4A所示),隨后 再手寫輸入第二個"言"的整體漢字部件編碼"言",當手寫輸入第二個編碼時,篩選最近似 的一個部件編碼(言),排序在前面已存在的部件編碼的(誰)后面,累積起來(誰言)去 檢索多元編碼字詞數(shù)據(jù)庫,如(圖4B所示),是(誰言寸草心報得三春暉)唯一的一個詞匯 顯示在字詞候選區(qū)上,即出可以指令輸入。
[0082] 本發(fā)明中的連續(xù)書寫方式特色:先在手寫程序上設置識別連續(xù)書寫方式,連續(xù)書 寫方式自由手寫輸入:順序式 輸入、配對式輸入、一二式輸入、二一式輸入、前三式輸 入、前三末一式輸入、綜合輸入式,在手寫設備上連續(xù)手寫若干個部件編碼,按在手寫設備 上每寫完一次停頓的軌跡信息均作若干個漢字的部件編碼來分析判斷,采用綜合分析,利 用左右文義分析關系,使用文字切割技術,篩選最近似的若干個漢字的部件編碼提交給程 序進行檢索,程序接收部件編碼顯示在界面上編碼顯示位置讀取或寫入內存中隱藏部件讀 取的兩種任一方式進行,把其部件編碼的相關的字/詞檢索出來:
[0083] 對于傳統(tǒng)的手寫輸入法,是對整字圖形軌跡識別并自身的輸出,而本發(fā)明識別信 息轉換部件編碼,并建立部件編碼字詞數(shù)據(jù)庫,檢索關聯(lián)的輸出。如下:
[0084] 例如:"建設有中國特色的社會主義",這詞用傳統(tǒng)的手寫方式要寫完整句是非常 之困難,使識別加重負擔,而導致識別率低,而本發(fā)明的部件編碼累積檢索字詞數(shù)據(jù)關聯(lián)輸 出,能高效提高識別率,輸入的準確性,快速地輸出,執(zhí)行如下步驟:
[0085] 首先觀看下面的編碼定律:也就是說明用下面的編碼在手寫設備上任意組合手寫 輸入的任意編碼也能輸出所需的詞/句段:
[0086] -)、順序一一式輸入(1+2+3累加方式):"建"一"設"一"有"
[0087] 二)、一二式輸入(1+23累加方式):"建"一"設有"
[0088] 三)、二一式輸入(12+3累加方式):"建設"一"有"
[0089] 四)、前三式輸入(123累加方式):"建設有"
[0090] 五)、前三末一式輸入(123末累加方式):"建設有義"
[0091] 六)、一二三四連續(xù)式輸入(1234累加方式):"建設有中"
[0092] 實例示例:前三式輸入(123累加方式):"建設有"
[0093] 而本發(fā)明多重方案還包括連體式和分割式,編碼累積檢索字詞數(shù)據(jù)并關聯(lián)輸出, 分割式手寫輸入,同時編碼對關聯(lián)的詞匯進行分割,把本身相對的結果直接上屏輸入,分割 后的關聯(lián)部份顯示在候選區(qū)內,待令輸入,能高效提高識別率,輸入的準確性,快速地輸出, 下面使用分割式的方案執(zhí)行如下步驟:同樣也是用一次性在手寫輸入?yún)^(qū)手寫"建設有" 3個 編碼,采用綜合分析,利用左右文義分析關系,使用文字切割技術方法,分析在分離切割的 范疇之內,所以識別為3個編碼"建設有",把編碼字詞數(shù)據(jù)庫絕對的結果已提取到要輸入 的屏幕上了,即"建設有"字已輸入到屏幕上,在多元編碼字詞數(shù)據(jù)庫中找到"建設有"的編 碼關聯(lián)的唯一的一個詞匯"建設有中國特色的社會主義"。分割其關聯(lián)的剩下部份"中國特 色的社會主義"在字詞候選區(qū)中顯示如圖8所示。即出輸入,完成輸入過程。
[0094] 以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精 神和原之內所作的任何修改、等同替換和改進等,均應包含在本發(fā)明的保護范圍之內。
【主權項】
1. 一種多元編碼輸入方法,其特征在于:對每個漢字按書寫順序的首筆畫、部首、關聯(lián) 體、整體的多元部件編碼取碼方式建立其相對的多元部件編碼字詞數(shù)據(jù)庫。在手寫系統(tǒng)手 寫輸入,利用左右文義分析關系,使用文字切割方法,采用綜合分析手寫系統(tǒng)產生的軌跡信 息同時轉化為漢字的部件編碼并為檢索單位,供程序以部件編碼累積檢索方案,檢索出多 元部件編碼字詞數(shù)據(jù)庫中對應的字/詞/句/段。 所述的首筆畫部件編碼包括漢字書寫時起筆的第一個筆畫; 所述的部首、關聯(lián)體部件編碼包括可組成其它漢字的漢字; 所述的整體部件編碼包括不可組成其它漢字的完整的漢字; 所述的接收手寫系統(tǒng)產生的軌跡信息的手寫輸入方式包括:續(xù)字書寫、續(xù)筆書寫、連續(xù) 書寫、分格書寫的任一方式獲??; 所述的多元部件編碼字詞數(shù)據(jù)檢索出結果的特征包括: 首筆畫、部首、關聯(lián)體的部件編碼在輸入第1個部件編碼時,檢索出的結果為本身關聯(lián) 的單一漢字排序優(yōu)先,不足再以詞匯后補; 整體部件編碼在輸入第1個部件編碼時,檢索出的結果為本身的1個漢字并排序在第 1位,從第2位起全部為第1位漢字開頭的關聯(lián)詞; 首筆畫、部首、關聯(lián)體、整體的部件編碼串聯(lián)或互聯(lián)在輸入第2個部件編碼起,累積檢 索出的結果均為關聯(lián)的詞匯。 所述的多元部件編碼字詞數(shù)據(jù)庫包括:首筆畫、部首、關聯(lián)體,整體漢字的各種部件的 并聯(lián)和串聯(lián)及互聯(lián)的各組編碼,使輸入時任的編碼隨意運用,并以任意一種自身獨立的部 件編碼也能輸出所需的字/詞。 所述的連續(xù)書寫方式包括:先在手寫程序上設置識別連續(xù)書寫方式,在手寫設備上連 續(xù)手寫若干個部件編碼,按在手寫設備上每寫完一次停頓的軌跡信息均作若干個漢字的部 件編碼來分析判斷,采用綜合分析,利用左右文義分析關系,使用文字切割方法,篩選最近 似的若干個部件編碼提交給程序進行檢索,程序接收部件編碼顯示在界面上編碼顯示位置 上,并把其相關的字/詞檢索出來: 所述的續(xù)字書寫方式包括:先在手寫程序上設置識別續(xù)字書寫方式,按在手寫設備上 每寫完一次停頓的軌跡信息均只作為一個漢字的部件編碼的定律來進行分析判斷,篩選最 近似的一個優(yōu)先提交給程序進行檢索,程序接收部件編碼顯示在界面上編碼顯示位置上, 并把其相關的字/詞檢索出來: 包括以下步驟: a、 在手寫設備上手寫輸入,識別分析并篩選最近似的部件編碼,程序接收的部件編碼 提取到界面上編碼顯示位置并查找部件編碼字詞數(shù)據(jù)庫,把找到的字詞顯示在輸入的界面 上候選;判斷輸入的界面的字/詞是否出現(xiàn),否轉f,是執(zhí)行b ; b、 若判斷所需的字/詞出現(xiàn),可指令輸入上屏執(zhí)行c,不輸入上屏轉f ; c、 指令輸入上屏并清空所有的數(shù)據(jù),并轉d ; d、 結束。 e、 判斷識別的部件編碼是否正確部件編碼還是錯誤部件編碼,否轉g,是執(zhí)行f ; f、 繼續(xù)手寫輸入,把接收到的部件編碼,排在前面輸入的尾部累積相加進行并返回a ; g、 退一步或刪除最后一編碼或清空返回a。2. 根據(jù)權利要求1所述的部首、關聯(lián)體組成其它漢字的相關部份包括;Z、/乂咅直尹 互執(zhí)夕汸-采孚4門卜鹵%敖八分公谷白卑北貝鼻比敝辟扁丙并不步產廠車臣辰呈齒尺 赤蟲出川此次大夸奇奄歹單刀丁可東豆毒盾厄而兒耳洱番反方非分豐風夫弗甫父干武甘 告戈革工鞏公弓鼓古骨瓜關光廣鬼亥害漢禾合黑亨粦戶化火吉幾朵己加甲尖兼角巾斤金 今僅京井九白開亢殼口?淚里麗立力了列林六龍^盧鹿麻馬驢麥毛矛眉每門米苗莫母木 目乃南能鳥牛奴女皮片其奇氣泣七千壬舌乖前且親青丘求酋區(qū)曲取去犬人倉從令日如汝 入三殺沙山上尚少涉申身聲尸孛石矢士壹殼是氏首鼠束水絲已臺湯天田土老屯萬王亡吉 韋未尉文沃武午戊勿夕習下先閑相鄉(xiāng)小肖芯辛興玄薛穴血牙亞炎厭彥央羊妖^業(yè)醫(yī)衣亦 音尹雍永由酉又于余俞魚予雨與羽元月云曾乍斬占章兆折者正支直執(zhí)止至舟爪茲子自走 足兀廿鬲禺匕夭匚4攸僉勹P芻U厶壙#芘堇奪捫弋口采4彡3夂令個悚4爿^ 汶涑&彐屮孑鄉(xiāng)絲鄉(xiāng)〈《縣髟戔才、磯韋甬廣年疋耒產缶艮豕豸隹瞿廠后反瓜爪少〃々爾73. 根據(jù)權利要求1所述的判斷識別的部件編碼是否正確部件編碼還是錯誤部件編碼 包括:若是錯誤部件編碼時,再判斷近似漢字候選區(qū)上是否有正確的漢字部件,若有正確的 漢字部件,有則選中替換在界面上顯示錯誤的部件編碼,并用正確的部件編碼去檢索多元 部件編碼字詞數(shù)據(jù)庫,刷新輸入的界面上候選區(qū)。4. 根據(jù)權利要求1所述的一種多元編碼輸入方法還包括:輸入時判部件斷編碼對應詞 匯若是唯一,可以任意設定是否唯一碼的結果自動上屏。5. 根據(jù)權利要求1所述的一種多元編碼輸入方法還包括:對檢索字/詞部件編碼上屏 輸入特色:編碼顯示位置上顯示的部件編碼,在當前編碼字詞候選區(qū)有相關的字/詞,或在 字詞候選區(qū)無相關的字/詞,并連續(xù)寫若干個字詞的組合句,也屬于部件編碼并支持指令 上屏輸入的連句書寫特色。6. 根據(jù)權利要求1所述的一種多元編碼輸入方法還包括:對檢索字/詞的部件編碼設 定特定字符,代表任一部件編碼的模糊匹配檢索。7. 根據(jù)權利要求1所述的一種多元編碼輸入方法還包括:除多元部件編碼組合外還可 使用部首的部件編碼獨立完成。8. 根據(jù)權利要求1所述的一種多元編碼輸入方法還包括:除多元部件編碼組合外還可 使用整體的部件編碼獨立完成。9. 根據(jù)權利要求1所述的一種多元編碼輸入方法還包括:繁體漢字根據(jù)繁體每個漢字 按書寫順序的首筆畫部首、關聯(lián)體、整體的部件編碼取碼方式建立其相對的多元部件編碼 字詞數(shù)據(jù)庫。10. 根據(jù)權利要求1所述的一種多元編碼輸入方法還包括:程序接收部件編碼在界面 中編碼顯示區(qū)上顯示或可去除編碼顯示區(qū),部件編碼直接在字詞候選區(qū)的第1位顯示,并 用第1位為檢索的單位,檢索出其關聯(lián)的字詞,并且支持第1上屏輸入。
【文檔編號】G06F3/023GK105892699SQ201410423943
【公開日】2016年8月24日
【申請日】2014年8月26日
【發(fā)明人】鄧桂成
【申請人】鄧桂成