亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種編碼串排序的方法、裝置和一種文字輸入方法、裝置的制作方法

文檔序號(hào):6575368閱讀:470來(lái)源:國(guó)知局
專利名稱:一種編碼串排序的方法、裝置和一種文字輸入方法、裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及輸入法技術(shù)領(lǐng)域,特別是涉及一種編碼串排序的方法、裝置和一種文字輸入方法和裝置。
背景技術(shù)
隨著手機(jī)等移動(dòng)終端設(shè)備的廣泛應(yīng)用,利用數(shù)字鍵盤(pán)進(jìn)行文字輸入的情況也越來(lái)越多。例如,手機(jī)上的中文拼音輸入法就是一個(gè)典型的應(yīng)用。在用戶連續(xù)輸入代表拼音的數(shù)字串時(shí),該輸入法的數(shù)字轉(zhuǎn)拼音功能模塊,可將其轉(zhuǎn)換為所有拼音串組合的若干可能中的 一種。
但是由于手機(jī)中通常使用包含0-9的1 0鍵位數(shù)字鍵盤(pán),并且通常采用8鍵位的字母鍵設(shè)定方案,具體的,是將a - z的2 6個(gè)字母映射到2 -9數(shù)字鍵上,每個(gè)數(shù)字鍵都對(duì)應(yīng)著3 4個(gè)字母。所以,在進(jìn)行拼音輸入時(shí),一般均會(huì)出現(xiàn)較高幾率的重碼音節(jié)。例如,在手機(jī)的數(shù)字鍵盤(pán)上輸入(4-2-6 ),相應(yīng)的會(huì)有如下的拼音供用戶進(jìn)行選擇"hao"、 "gan"、 "gao"、 "han"。假設(shè)用戶需要輸入"搞"字,則需要從"hao"、 "gan"、 "gao"、 "han"中選擇"gao",再?gòu)?搞、高、告、稿,,等候選詞中選擇"搞"上屏輸出。也就是說(shuō)在輸入拼音串的時(shí)候,現(xiàn)有的輸入法系統(tǒng)把所有在此數(shù)字串下的對(duì)應(yīng)可能拼音組合羅列出來(lái),按照字母順序來(lái)進(jìn)行排列。
公開(kāi)號(hào)為"CN101344888"的中國(guó)專利公開(kāi)文獻(xiàn),公布了一種對(duì)上述音節(jié)(字母組合)進(jìn)行排序的方法,即可以按照一定順序?qū)ι鲜鰯?shù)字鍵組合對(duì)應(yīng)的多個(gè)重碼音節(jié)(例如,"hao"、 "gan"、 "gao"、 "han")進(jìn)行優(yōu)化排序,以使適合當(dāng)前用戶需求的音節(jié)排序在前,減少用戶的選擇操作,提高用戶的輸入效率和使用體驗(yàn)。然而,由于單個(gè)字詞的輸入本身效率就比較低,所以用戶期望能夠?qū)崿F(xiàn)數(shù)字鍵盤(pán)上的短句或者詞組輸入。
但是對(duì)于數(shù)字串較長(zhǎng)的情況下,例如短句或者詞組輸入,上述現(xiàn)有技術(shù)就無(wú)法達(dá)到較佳的效果了。參照?qǐng)Dl,示出了現(xiàn)有技術(shù)的常用處理方案。
步驟IOI、接收用戶輸入的數(shù)字串。例如"934539843"
步驟102、對(duì)數(shù)字串按照拼音規(guī)則進(jìn)行切分,得出可能的拼音串;步驟103、依據(jù)切分得到的拼音串檢索詞表,取得匹配的最長(zhǎng)詞; 步驟104、顯示拼音串。
具體的,步驟104中的一種顯示方式為僅僅顯示所匹配的最長(zhǎng)詞的拼音 串,例如,對(duì)于數(shù)字串"934539843"僅僅顯示拼音串"weile"、 "weike", 后續(xù)字母不再切分顯示。步驟104的另外一種顯示方式為,顯示所匹配的最 長(zhǎng)詞的拼音串以及余下的拼音串,例如,對(duì)于數(shù)字串"934539843",顯示拼 音串"weile畫(huà)wuge"、 "weile-zuie,,、 "weike-wuge,,、 "weike-zuie,,等等;其中, 余下的拼音串可以通過(guò)字母序進(jìn)行排列輸出。
上述輸入方案在短句或者詞組輸入中,其缺點(diǎn)是非常明顯的,由于顯示 給用戶選擇的拼音串(音節(jié))都是首先按照所匹配的最長(zhǎng)詞來(lái)排序的,而用 戶短句或者詞組輸入的整體轉(zhuǎn)換方案卻并不一定會(huì)恰好對(duì)應(yīng)最長(zhǎng)詞的排序, 因此,用戶需要多次的選擇操作才能找到自己所需的短句或者詞組。例如, 對(duì)于前述的數(shù)字串"934539843",用戶是希望輸入"為了阻隔",其對(duì)應(yīng)的 拼音串為"weilezuge",在現(xiàn)有技術(shù)的實(shí)際輸入過(guò)程中,該拼音串"weilezuge" 的排序可能非??亢螅瑢?dǎo)致用戶需要作出多次的點(diǎn)擊選擇操作,大大降低用 戶在短句或者詞組輸入中的效率和體驗(yàn)。實(shí)際上,對(duì)于數(shù)字串"934539843", 其對(duì)應(yīng)的拼音串就至少有8個(gè),如果對(duì)于更長(zhǎng)的數(shù)字串,則會(huì)有更多的可能 拼音串,讓用戶從數(shù)量眾多的拼音串中選擇自己所需的,事實(shí)上是不可接受 的。
總之,需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問(wèn)題就是如何能夠在 短句或詞組輸入中,實(shí)現(xiàn)更佳的拼音串排序,以幫助用戶能夠更快的選擇所 需文字,更快的完成輸入。

發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種編碼串排序的方法、裝置,以便 在短句或者詞組輸入中,對(duì)展示給用戶的編碼串進(jìn)行優(yōu)化排序,以幫助用戶 能夠更快的選擇所需文字,更快的完成輸入。
相應(yīng)的,本發(fā)明還提供了一種文字輸入方法和裝置,通過(guò)對(duì)展示給用戶 的編碼串進(jìn)行優(yōu)化排序,可以幫助用戶能夠更快的選擇所需文字,更快的完成輸入。
為了解決上述問(wèn)題,本發(fā)明公開(kāi)了一種編碼串排序的方法,包括接收用戶輸入的按鍵組合;其中,至少有一個(gè)按鍵對(duì)應(yīng)兩個(gè)或兩個(gè)以上的編碼字符;依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞;所述N大于等于2。
優(yōu)選的,所述依據(jù)詞間的N元關(guān)系和/或詞頻進(jìn)行編碼串排序包括依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選;計(jì)算篩選后的各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;或者,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;針對(duì)篩選后的編碼串,依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;或者,依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
優(yōu)選的,所述詞頻參數(shù)包括各詞頻的加權(quán)和或者加權(quán)倒數(shù)和。
優(yōu)選的,僅針對(duì)同一切分方式下的編碼串和/或相對(duì)應(yīng)的文字串,依據(jù)詞間N元關(guān)系進(jìn)行篩選。
優(yōu)選的,所述依據(jù)詞間的N元關(guān)系和/或詞頻進(jìn)行編碼串排序包括計(jì)算各個(gè)編碼串的第一詞頻參數(shù),對(duì)編碼串進(jìn)行粗篩;依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行二次篩選;計(jì)算篩選后的各個(gè)編碼串的第二詞頻參數(shù),依據(jù)所述第二詞頻參數(shù)對(duì)所述按4建組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
優(yōu)選的,所述排序輸出包括篩選得到最佳結(jié)果進(jìn)行展示。
優(yōu)選的,所述依據(jù)詞間的N元關(guān)系和/或詞頻進(jìn)行編碼串排序包括依據(jù)詞間的N元關(guān)系和/或由詞頻得到的編碼段頻,對(duì)所述4姿4定組合對(duì)應(yīng)的編碼串進(jìn)行排序輸出;所述編碼串包括至少兩個(gè)與詞相對(duì)應(yīng)的編碼段。
優(yōu)選的,所述依據(jù)詞間的N元關(guān)系和/或詞頻進(jìn)行編碼串排序包括將^4走組合轉(zhuǎn)換為編碼串;依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)各編碼串進(jìn)行篩選排序;或者,依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)按4建組合進(jìn)行排序; 然后將^4建組合轉(zhuǎn)換為編碼串依序顯示輸出。
依據(jù)本發(fā)明的另一實(shí)施例,還公開(kāi)了一種文字輸入方法,包括接收用 戶輸入的按鍵組合;其中,至少有一個(gè)##對(duì)應(yīng)兩個(gè)或兩個(gè)以上的編碼字符; 依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排 序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞;所述N大于 等于2;接收用戶對(duì)編碼串的選擇;接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文 字。
優(yōu)選的,所述依據(jù)詞間的N元關(guān)系和/或詞頻進(jìn)行編碼串排序包括依 據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)4亍篩選;計(jì)算篩選后的各個(gè)編碼串的詞頻參 數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;或者, 依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;針 對(duì)篩選后的編碼串,依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻 參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按4建組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;或者, 依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;依據(jù)篩選后的 文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按 鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
優(yōu)選的,所述詞頻參數(shù)包括各詞頻的加權(quán)和或者加權(quán)倒數(shù)和。
優(yōu)選的,僅針對(duì)同一切分方式下的編碼串和/或相對(duì)應(yīng)的文字串,依 據(jù)詞間N元關(guān)系進(jìn)行篩選。
優(yōu)選的,所述依據(jù)詞間的N元關(guān)系和/或詞頻進(jìn)行編碼串排序包括計(jì) 算各個(gè)編碼串的第一詞頻參數(shù),對(duì)編碼串進(jìn)行粗篩;依據(jù)詞間的N元關(guān)系對(duì) 編碼串進(jìn)行二次篩選;計(jì)算各個(gè)編碼串的第二詞頻參數(shù),依據(jù)所述第二詞頻 參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
優(yōu)選的,所述依據(jù)詞間的N元關(guān)系和/或詞頻進(jìn)行編碼串排序包括依 據(jù)詞間的N元關(guān)系和/或由詞頻得到的編碼^敬頻,對(duì)所述按一建組合對(duì)應(yīng)的 編碼串進(jìn)行排序輸出;所述編碼串包括至少兩個(gè)與詞相對(duì)應(yīng)的編碼段。
優(yōu)選的,所述依據(jù)詞間的N元關(guān)系和/或詞頻進(jìn)行編碼串排序包括將按鍵組合轉(zhuǎn)換為編碼串;依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)各編碼串進(jìn)行篩選排序;或者,依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)4^t組合進(jìn)行排序;然后將^4建組合轉(zhuǎn)換為編碼串依序顯示輸出。
依據(jù)本發(fā)明的另一實(shí)施例,還公開(kāi)了一種編碼串排序的裝置,包括
接口單元,用于接收用戶輸入的按鍵組合;其中,至少有一個(gè)按鍵對(duì)應(yīng)兩個(gè)或兩個(gè)以上的編碼字符;
排序處理單元,用于依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)4亍排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞;所述N大于等于2。
優(yōu)選的,所述排序處理單元可以包括
第一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選;第二處理模塊,用于計(jì)算篩選后的各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述^4A組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;
或者,第一處理模塊,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;第二處理模塊,用于針對(duì)篩選后的編碼串,依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;
或者,第一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;第二處理模塊,用于依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
優(yōu)選的,所述第一處理模塊僅針對(duì)同一切分方式下的編碼串和/或相對(duì)應(yīng)的文字串,依據(jù)詞間N元關(guān)系進(jìn)行篩選。
優(yōu)選的,所述排序輸出包括篩選得到最佳結(jié)果進(jìn)行展示。
優(yōu)選的,所述排序處理單元,用于依據(jù)詞間的N元關(guān)系和/或由詞頻得到的編碼段頻,對(duì)所述"l^4建組合對(duì)應(yīng)的編碼串進(jìn)行排序輸出;所述編碼串包括至少兩個(gè)與詞相對(duì)應(yīng)的編碼段。
依據(jù)本發(fā)明的另一實(shí)施例,還公開(kāi)了一種文字輸入裝置,包括接口單元,用于接收用戶輸入的按4建組合;其中,至少有一個(gè)按鍵對(duì)應(yīng) 兩個(gè)或兩個(gè)以上的編碼字符;
排序處理單元,用于依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按4建組合 對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包括 至少兩個(gè)詞;所述N大于等于2;
編碼串選擇單元,用于接收用戶對(duì)編碼串的選擇;
候選項(xiàng)選擇單元,用于接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。
優(yōu)選的,所述排序處理單元可以包括
第一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選;第二處理 模塊,用于計(jì)算篩選后的各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述 按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;
或者,第一處理模塊,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換 對(duì)應(yīng)的文字串進(jìn)行篩選;第二處理模塊,用于針對(duì)篩選后的編碼串,依據(jù)篩 選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì) 所述按4建組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;
或者,第 一處理^i塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的 文字串進(jìn)行篩選;第二處理模塊,用于依據(jù)篩選后的文字串所包含的詞計(jì)算 各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按4建組合對(duì)應(yīng)的各個(gè)編碼 串進(jìn)行排序。
優(yōu)選的,所述第一處理模塊僅針對(duì)同一切分方式下的編碼串和/或相 對(duì)應(yīng)的文字串,依據(jù)詞間N元關(guān)系進(jìn)行篩選。
優(yōu)選的,所述排序處理單元,用于依據(jù)詞間的N元關(guān)系和/或由詞頻 得到的編碼段頻,對(duì)所述"^4建組合對(duì)應(yīng)的編碼串進(jìn)行排序輸出;所述編碼串 包括至少兩個(gè)與詞相對(duì)應(yīng)的編碼^歐。
依據(jù)本發(fā)明的另一實(shí)施例,還公開(kāi)了一種文字輸入方法,包括接收用 戶輸入的按^:組合;其中,至少有一個(gè)控鍵對(duì)應(yīng)兩個(gè)或兩個(gè)以上的編碼字符; 依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行篩 選排序;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞;所述N大于等于2;輸出排序靠前的一個(gè)或者多個(gè)編碼串,并展現(xiàn)編碼串的對(duì)應(yīng)文字候選項(xiàng);接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。
優(yōu)選的,所述依據(jù)詞間的N元關(guān)系和/或詞頻進(jìn)行編碼串排序包括依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選;計(jì)算篩選后的各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;或者,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;針對(duì)篩選后的編碼串,依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;或者,依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
優(yōu)選的,4又針對(duì)同一切分方式下的編碼串和/或相對(duì)應(yīng)的文字串,依據(jù)詞間N元關(guān)系進(jìn)^f亍篩選。
優(yōu)選的,所述編碼串、候選項(xiàng)的輸出展現(xiàn)步驟包括輸出排序最靠前的一編碼串,展現(xiàn)該編碼串的對(duì)應(yīng)文字候選項(xiàng);或者,輸出排序最靠前的一編碼串,展現(xiàn)針對(duì)排序靠前的多個(gè)編碼串的對(duì)應(yīng)文字候選項(xiàng);或者,輸出排序靠前的多個(gè)編碼串,展現(xiàn)排序最靠前的一編碼串的對(duì)應(yīng)文字候選項(xiàng);或者,輸出排序靠前的多個(gè)編碼串,展現(xiàn)針對(duì)所述多個(gè)編碼串的對(duì)應(yīng)文字候選項(xiàng)。
依據(jù)本發(fā)明的另一實(shí)施例,還公開(kāi)了一種文字輸入裝置,包括
接口單元,用于接收用戶輸入的按鍵組合;其中,至少有一個(gè)按鍵對(duì)應(yīng)兩個(gè)或兩個(gè)以上的編碼字符;
排序處理單元,用于依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行篩選排序;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞;所述N大于等于2;
候選項(xiàng)展現(xiàn)單元,用于輸出排序靠前的一個(gè)或者多個(gè)編碼串,并展現(xiàn)編碼串的對(duì)應(yīng)文字候選項(xiàng);
候選項(xiàng)選擇單元,用于接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。
優(yōu)選的,所述候選項(xiàng)展現(xiàn)單元具體用于輸出排序最靠前的一編碼串,展現(xiàn)該編碼串的對(duì)應(yīng)文字候選項(xiàng);或者,輸出排序最靠前的一編碼串,展現(xiàn) 針對(duì)排序靠前的多個(gè)編碼串的對(duì)應(yīng)文字候選項(xiàng);或者,輸出排序靠前的多個(gè) 編碼串,展現(xiàn)排序最靠前的一編碼串的對(duì)應(yīng)文字候選項(xiàng);或者,輸出排序靠 前的多個(gè)編碼串,展現(xiàn)針對(duì)所述多個(gè)編碼串的對(duì)應(yīng)文字候選項(xiàng)。 優(yōu)選的,所述排序處理單元可以包括
第一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選;第二處理 模塊,用于計(jì)算篩選后的各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述 按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;
或者,第一處理模塊,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換 對(duì)應(yīng)的文字串進(jìn)行篩選;第二處理模塊,用于針對(duì)篩選后的編碼串,依據(jù)篩 選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì) 所述按4建組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;
或者,第一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的 文字串進(jìn)行篩選;第二處理模塊,用于依據(jù)篩選后的文字串所包含的詞計(jì)算 各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼 串進(jìn)行排序。
優(yōu)選的,所述第一處理模塊僅針對(duì)同一切分方式下的編碼串和/或相對(duì) 應(yīng)的文字串,依據(jù)詞間N元關(guān)系進(jìn)行篩選。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)
本發(fā)明針對(duì)短句或者詞組輸入,對(duì)展示給用戶的編碼串進(jìn)行了優(yōu)化排 序,以便將當(dāng)前用戶所需的編碼串盡量靠前顯示,以減少用戶的選擇操作, 提高效率。也就是說(shuō),在本發(fā)明的優(yōu)選實(shí)施例中,可以依據(jù)較長(zhǎng)編碼串中各 個(gè)詞間的二元或多元關(guān)系,以及詞頻或者音節(jié)頻對(duì)所述短句或者詞組輸入中 較長(zhǎng)的編碼串進(jìn)行優(yōu)化排序和篩選,以從多條可能的編碼串中選出最優(yōu)結(jié)果 并實(shí)現(xiàn)最優(yōu)排序。本發(fā)明可以減少由于切分、重碼等引發(fā)的需要用戶多次手 動(dòng)選取所需編碼串而帶來(lái)的多余(不必要)操作。


圖1是現(xiàn)有技術(shù)一種數(shù)字鍵盤(pán)拼音輸入的技術(shù)方案流程圖;圖2是本發(fā)明一種編碼串排序的方法實(shí)施例的步驟流程圖;圖3是本發(fā)明以數(shù)字鍵盤(pán)的拼音輸入為例的一個(gè)優(yōu)選實(shí)施例的步驟流程
圖4是本發(fā)明的一個(gè)具體例子的步驟流程圖;圖5是本發(fā)明一種文字輸入方法的實(shí)施例的步驟流程圖;圖6是本發(fā)明一種編碼串排序的裝置實(shí)施例的結(jié)構(gòu)框圖;圖7是本發(fā)明一種文字輸入裝置的實(shí)施例的結(jié)構(gòu)框圖。
具體實(shí)施例方式
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。
本發(fā)明實(shí)施例主要應(yīng)用在鍵位少、重碼率高的輸入硬件上,比如手機(jī)小鍵盤(pán)、家用游戲機(jī)手柄、電視遙控器,或者其他可以輸入文字的非全鍵盤(pán)上。這些非全鍵盤(pán)的特征之一就是其上面存在至少一個(gè)按4建,其可能對(duì)應(yīng)兩個(gè)或者兩個(gè)以上的字符編碼,這種非全鍵盤(pán)的一個(gè)典型應(yīng)用就是數(shù)字鍵盤(pán)。
以具有數(shù)字鍵盤(pán)的手機(jī)拼音中文輸入為例,通常的數(shù)字鍵盤(pán)以2 -9的數(shù)字鍵對(duì)應(yīng)a - z的26個(gè)字母,每個(gè)數(shù)字鍵對(duì)應(yīng)3~4個(gè)字母,因此,當(dāng)用戶點(diǎn)擊一系列按4建組合時(shí),其所對(duì)應(yīng)的拼音重碼是非常多的,從而導(dǎo)致用戶按下一系列按鍵后,還需要對(duì)重碼的拼音串進(jìn)行選擇,然后再選擇該拼音串所對(duì)應(yīng)的漢字候選項(xiàng)。尤其當(dāng)用戶進(jìn)行短句或者詞組輸入時(shí),由于輸入的按鍵比較多,形成的重碼拼音串也會(huì)非常多,從而會(huì)需要用戶進(jìn)行更復(fù)雜或更多次的選擇操作,會(huì)嚴(yán)重降低用戶的輸入效率。本發(fā)明就是 望針對(duì)這種由多詞拼音串構(gòu)成的較長(zhǎng)拼音串進(jìn)行優(yōu)化排序,減少用戶的選擇操作(包括翻頁(yè)操作),提高用戶輸入效率。
需要說(shuō)明的是,為了簡(jiǎn)單起見(jiàn),上面的舉例以及后面實(shí)施例均采用拼音串作為編碼串的一個(gè)典型示例進(jìn)行說(shuō)明,但是對(duì)于輸入漢字存在重碼的五筆、自然碼、奔騰碼、雙拼等各種編碼均屬于本發(fā)明的應(yīng)用范圍。雖然各種
編碼的轉(zhuǎn)換規(guī)則不同,但是具體應(yīng)用過(guò)程是基本相似的,因此,本發(fā)明在后面的描述中僅僅以拼音編碼為例進(jìn)行說(shuō)明,其他編碼參照即可。
進(jìn)一步,對(duì)于非漢字輸入環(huán)境,只要存在重碼的編碼串需要用戶選擇, 就可以應(yīng)用本發(fā)明。例如,當(dāng)采用羅馬音標(biāo)方式輸入日文時(shí),用戶點(diǎn)擊一系 列按鍵后,需要用戶對(duì)轉(zhuǎn)換得到的編碼串進(jìn)行選擇,之后才可以從所選的編 碼串對(duì)應(yīng)日文候選項(xiàng)中選擇得到所需文字。其中應(yīng)用本發(fā)明對(duì)所展現(xiàn)的編碼 串進(jìn)行優(yōu)化排序,就可以提高用戶輸入日文的效率。
參照?qǐng)D2,示出了本發(fā)明一種編碼串排序的方法實(shí)施例,具體可以包括
步驟201、接收用戶輸入的按鍵組合;其中,至少有一個(gè)按鍵對(duì)應(yīng)兩個(gè) 或兩個(gè)以上的編碼字符;
步驟202、依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述4務(wù)睫組合對(duì)應(yīng)的各個(gè) 編碼串進(jìn)行排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞 (短句或者詞組輸入的典型特征);所述N大于等于2。
以數(shù)字鍵盤(pán)的拼音輸入為例,則步驟201中用戶輸入的就是一系列數(shù)字 按鍵,然后通過(guò)步驟202的優(yōu)化排序,將數(shù)字串所對(duì)應(yīng)的各個(gè)拼音串展現(xiàn)給 用戶。排序靠前的就是通過(guò)詞間的N元關(guān)系和/或詞頻計(jì)算得到的比較適合 用戶所需的,以減少用戶的選擇操作。需要說(shuō)明的是,本發(fā)明實(shí)施例中的詞, 包括單字的詞"我"、"打"等等,也包括多字詞"歡迎"、"誤操作"、"一模
一樣"等等。
例如,對(duì)于數(shù)字串"934539843"而言,其對(duì)應(yīng)的拼音串包括"weile-wuge,,、 "weile-zuie,, 、 "weike-wuge,, 、 "weike-zuie,, 、 "weile-zuge" 、 "weile-zuhe,,、 "weike-zuge,, 、 "weike-zuhe,,等等,可能還會(huì)包4舌"weike-zuid,,或"weike-zuif, 等其他切分轉(zhuǎn)換結(jié)果。本發(fā)明就是通過(guò)這些拼音串所對(duì)應(yīng)的詞與詞之間的N 元關(guān)系,和/或詞頻對(duì)這些拼音串排序,以便在大概率情況下,將用戶所需的 拼音串靠前排序,即從概率上提高排序在前的拼音串滿足用戶需要的可能 性,提高普通用戶的輸入效率。
具體的,例如針對(duì)拼音串"weile-zuie",依據(jù)其所對(duì)應(yīng)的詞"為了"及 "罪惡"的二元關(guān)系,和/或"為了"及"罪惡"的詞頻計(jì)算得到一個(gè)排序參 考值;然后同理針對(duì)上述其他的拼音串"weike-wuge"、 "weike-zuie"、"weile醫(yī)zuge,, 、 "weile-zuhe,, 、 "weike-zuge,, 、 "weike-zuhe,,也進(jìn)行處理,進(jìn) 而按照排序參考值進(jìn)行排序展現(xiàn)上述的6個(gè)拼音串。在本發(fā)明的一個(gè)優(yōu)選實(shí) 施例中,所述排序也可以是篩選得到了一個(gè)最佳的結(jié)果展現(xiàn)給用戶。
其中,需要說(shuō)明的是,以二元關(guān)系為例,由于拼音串"weile,,可能還對(duì) 應(yīng)"喂了"、"圍了"、"為樂(lè),,等詞,所以在二元關(guān)系中還需要考慮這些詞與
"罪惡"的二元關(guān)系,因?yàn)橛脩暨B續(xù)輸入就是希望輸入短句或者詞組,即存 在二元關(guān)系或者二元關(guān)系數(shù)值較高的結(jié)果是用戶所需的可能性較大。
對(duì)于單獨(dú)采用詞頻進(jìn)行排序的情況,可以采用拼音串"weile"對(duì)應(yīng)的"喂 了"、"圍了"、"為樂(lè)"等詞和拼音串"zuie"對(duì)應(yīng)的"罪惡"的詞頻累積計(jì) 算得到拼音串"weile-zuie"的一個(gè)排序參考值。當(dāng)然,簡(jiǎn)單的,也可以釆用 拼音串"weile"對(duì)應(yīng)的多個(gè)詞中詞頻最高的一個(gè),和拼音串"zuie"對(duì)應(yīng)的 多個(gè)詞中詞頻最高的一個(gè),累積計(jì)算得到拼音串"weile-zuie"的一個(gè)排序參 考值。
上面的示例中采用二元關(guān)系進(jìn)行了說(shuō)明,實(shí)際上對(duì)于更長(zhǎng)的拼音串,釆 用多個(gè)詞之間的多元關(guān)系也可以實(shí)現(xiàn)拼音串的篩選排序;并且有可能得到更 佳的拼音串篩選排序,使得結(jié)果更趨向于用戶所需。但是,由于三元及以上 關(guān)系的判斷,步驟復(fù)雜,對(duì)于現(xiàn)有計(jì)算資源而言成本相對(duì)較高,需要在實(shí)際 應(yīng)用中由技術(shù)人員具體確定如何應(yīng)用。例如,將本發(fā)明應(yīng)用于網(wǎng)絡(luò)輸入法, 用戶輸入數(shù)字串之后,具體的N元計(jì)算過(guò)程由服務(wù)器端完成,然后返回結(jié)果 給用戶端即可。
另外,上述的示例中采用了詞頻進(jìn)行篩選排序,在本發(fā)明的其他實(shí)施例 中,也可以采用編碼段頻(例如,拼音輸入中的音節(jié)頻)來(lái)實(shí)現(xiàn)本發(fā)明的基 本構(gòu)思,即一個(gè)編碼串可以切分為多個(gè)分別與詞相對(duì)應(yīng)的編碼,敬。實(shí)際上, 通常情況下,編碼段頻(音節(jié)頻)也是通過(guò)詞頻獲得的。例如, 一個(gè)簡(jiǎn)單實(shí) 現(xiàn),可以將詞頻作為與所述字詞對(duì)應(yīng)的編碼的^f吏用頻率,對(duì)于一個(gè)編碼對(duì)應(yīng) 多個(gè)詞的情況,則可以將相應(yīng)的多個(gè)詞的詞頻累加,以累加后的詞頻作為該 編碼^險(xiǎn)的頻率。
進(jìn)一步,對(duì)于詞之間的二元關(guān)系,在本發(fā)明的其他實(shí)施例中,也可以采 用編碼段(音節(jié))間的二元關(guān)系加以替代。例如,將編碼所對(duì)應(yīng)的詞間的二元關(guān)系或者二元關(guān)系的累加作為相應(yīng)編碼段(音節(jié))間的二元關(guān)系。
作為一種簡(jiǎn)單組合,依據(jù)詞間的N元關(guān)系和/或編碼段頻,對(duì)所述按鍵組合對(duì)應(yīng)的編碼串進(jìn)行排序輸出也完全是可行的,其中,所述編碼串包括至少兩個(gè)與詞相對(duì)應(yīng)的編碼段。其他組合方式,在此不再贅述。
事實(shí)上,通過(guò)編碼^R頻、編碼間的二元關(guān)系進(jìn)^f亍編碼串的篩選排序,也仍然是依據(jù)詞間的二元關(guān)系、詞頻進(jìn)行的,所以在步驟202中,簡(jiǎn)單概括為"依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述^fel建組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序輸出"。
參照?qǐng)D3,示出了本發(fā)明以數(shù)字鍵盤(pán)的拼音輸入為例的一個(gè)優(yōu)選實(shí)施例,具體可以包括
步驟301、接收用戶輸入的數(shù)字串;步驟302、對(duì)數(shù)字串按照拼音規(guī)則進(jìn)行切分;
具體的,可以以全拼音優(yōu)先,盡量將數(shù)字串切分到最末尾;如果無(wú)法切分至最末尾,則可以保證盡量少的音節(jié)個(gè)數(shù)。步驟303、檢索詞表,對(duì)拼音串進(jìn)行篩選;
通過(guò)檢索詞表,從步驟302所切分得到的拼音串中挑選出盡量可以組成長(zhǎng)詞的所有拼音串(音節(jié)組合);對(duì)于在同樣切分方式下不能組詞的拼音串,可以丟棄(即被篩選掉),因?yàn)闊o(wú)法組成詞語(yǔ)的切分方式通常情況下不是用戶所需的合理結(jié)果,因此,可以丟棄。
步驟304、檢索詞與詞的二元關(guān)系表,對(duì)拼音串進(jìn)行篩選;對(duì)于前述步驟得到的多個(gè)拼音串,以詞與詞的二元關(guān)系進(jìn)行篩選。具體的例如,對(duì)于拼音串對(duì)應(yīng)文字串中的詞與詞的二元關(guān)系數(shù)值較低,則可以直接舍棄該拼音串。再例如,對(duì)于轉(zhuǎn)換后具有多種組詞方式的拼音串,則可以選擇同樣切分狀態(tài)下二元關(guān)系表中數(shù)值較高的詞,舍棄同樣切分狀態(tài)下二元
關(guān)系數(shù)值較低的詞。
對(duì)同樣切分方式中二元關(guān)系相等(或同時(shí)存在或均不存在)的切分方式可以不做處理,即同時(shí)保留相應(yīng)的拼音串。步驟305、依據(jù)詞頻對(duì)步驟304所篩選出的拼音串進(jìn)行進(jìn)一步篩選,將 篩選結(jié)果排序展示給用戶,以供選擇。其中,排序的一個(gè)典型情況就是,得 到一個(gè)最優(yōu)結(jié)果進(jìn)行展示,而其他拼音串則忽略即可。
在通常的實(shí)現(xiàn)中,可以通過(guò)詞頻來(lái)計(jì)算步驟304所篩選出的各拼音串的 詞頻參數(shù),進(jìn)而依據(jù)所述詞頻參數(shù)對(duì)所述按4建組合對(duì)應(yīng)的各個(gè)拼音串進(jìn)行排 序。例如,對(duì)于一個(gè)拼音串,以其對(duì)應(yīng)文字串中各個(gè)詞的詞頻進(jìn)行計(jì)算,得 到針對(duì)該拼音串的詞頻參數(shù)。或者,針對(duì)一個(gè)拼音串,以其切分后針對(duì)詞的 各個(gè)編碼段的頻率進(jìn)行計(jì)算,得到針對(duì)該拼音串的詞頻參數(shù)。
對(duì)于詞頻參數(shù)的計(jì)算,可以通過(guò)詞頻的加4又和或者加權(quán)倒數(shù)和的方 式實(shí)現(xiàn)。對(duì)于加權(quán)倒數(shù)和而言,選擇加權(quán)倒數(shù)和最小的作為最優(yōu)結(jié)果輸出展 示,因?yàn)樵~頻越高,詞數(shù)越少,則得到的加權(quán)倒數(shù)和最小。當(dāng)然,也可以釆 用簡(jiǎn)單詞頻累加或者詞頻倒數(shù)累加的方式,本發(fā)明對(duì)此并不加以限定,只要 能夠體現(xiàn)總體的使用頻率順序即可。
從上面對(duì)本發(fā)明的實(shí)施例描述可以看出,如果用戶輸入的數(shù)字串在詞庫(kù) 中存在完全匹配的結(jié)果,則直接輸出長(zhǎng)詞即可,而當(dāng)用戶輸入的數(shù)字串在詞 庫(kù)中沒(méi)有完全匹配的結(jié)果(即用戶希望短句或者詞組輸入),則意味著用戶 輸入的該較長(zhǎng)的數(shù)字串存在可能的多個(gè)切分組合方式,而其中只有一個(gè)是用 戶希望得到的,本發(fā)明就是通過(guò)N元關(guān)系、詞頻從這些切分組合方式中獲得 最適合當(dāng)前用戶的,以減少用戶的人為選擇更改拼音串的搡作,減少不必要 的按鍵次數(shù),從而提高用戶的輸入效率。
參照?qǐng)D4,示出了本發(fā)明的一個(gè)具體例子,包括
步驟401、輸入數(shù)字串。假設(shè)用戶依次點(diǎn)擊了 "96546842692674264"。
步驟402、對(duì)上述數(shù)字串按拼音規(guī)則進(jìn)行切分。
切分規(guī)則為全拼音優(yōu)先,盡量切到最末尾。如果無(wú)法切至最末尾,則保 證盡量少的拼音音節(jié)個(gè)數(shù)。此例子中,可能的全拼形式切分結(jié)果有 "Woin丁ianWanQi肌g " 、 " WoJinTianZaoShang " 、 " WoJin丁iaoWanShang "、 "WoLinTiaoWanShang " 、 " WoJinTianYaoShang " 、 " WoJinTianWanShaMi""WoJinTianWanShang,,等。
現(xiàn)有技術(shù)一般會(huì)直接給出上面的所有拼音串作為候選,由用戶自行選 擇,或者現(xiàn)有技術(shù)僅僅能夠單個(gè)字詞的輸入,即直接給出"Wo"而不關(guān)心 后續(xù)掩建。
步驟403、通過(guò)^r索詞表,挑選盡量可以組成長(zhǎng)詞的所有拼音串組合, 并拋棄掉同樣切分方式下不能組詞的拼音串。
例如"WoJinTianWanShang"和"WoLinTiaoYaoShang,,,切分點(diǎn)一致, 但前者可在詞表分析表中檢索到兩條結(jié)果,即"今天""晚上"2個(gè)詞語(yǔ), 或"握緊"、"晚上"2個(gè)詞語(yǔ),但后者在詞表分析表中4企索不到結(jié)果,即后 者無(wú)法組成詞語(yǔ),可見(jiàn)"WoLinTiaoYaoShang"并不是我們期待的合理結(jié)果, 應(yīng)該被放棄掉。又如"WoJinTianWanShaMi",可在詞表分析中檢索到"今 天"、"沙彌"2個(gè)詞語(yǔ)或"握緊"、"沙彌",也應(yīng)該保留。
這樣,經(jīng)過(guò)本步的篩選,留下了以下5個(gè)拼音串"WoJinTianWanShang"、 "WoJinTianZaoShang"、 "WoJinTiaoWanShang" 、 "WoJinTianWanShaMi"、 "WoJinTianWanQiang,,。
步驟404、對(duì)前一步的結(jié)果,4企索詞與詞的二元關(guān)系表,對(duì)拼音串作進(jìn) 一步篩選。例如,選擇同樣切分狀態(tài)下二元關(guān)系表中數(shù)值較高的詞,舍棄同 樣切分狀態(tài)下二元關(guān)系數(shù)值較低的詞。
這里為方便說(shuō)明,二元關(guān)系使用布爾值型(真或假)。如果使用不同數(shù) 值表示二元關(guān)系的相關(guān)程度也可以。
如以上一步結(jié)果中的"WoJinTianWanShang,,和"WoJinTiaoWanShang" 對(duì)象為例
"WoJinTianWanShang " 在上 一 步中,得到 "WoJin(握 緊)Tian(天)WanShang(晚上)"或"Wo (我)JinTian(今天)WanShang(晚上)" 兩種形式的可能結(jié)果。
但根據(jù)第一種形式,符合WoJin的詞如"握緊"等與符合Tian的詞如 "天"等,及符合Tian的詞如"天"等與符合WanShang的詞如"晚上"等 詞,在二元關(guān)系表中檢索,均無(wú)二元關(guān)系;而根據(jù)第二種形式,符合Wo的詞如"我"與符合JinTian的詞如"今天,,,及符合JinTian的詞如"今天" 與符合WanShang的詞"晚上"之間均有二元聯(lián)系。如此,則保留該拼音串 "WoJinTianWanShang",并保留具有二元關(guān)系的詞"我"、"今天"、"晚上"。
對(duì)于"WoJinTiaoWanShang ", 在上 一 步中,得到 "WoJin(握 緊)Tiao(條)WanShang(晚上)"或"Wo (我)JinTiao(金條)WanShang(晚上)" 兩種形式的可能結(jié)果。
但根據(jù)第一種形式,符合WoJin的詞如"握緊"等與符合Tiao的詞如 "條,,等,及符合Tiao的詞如"條"等與符合WanShang的詞如"晚上"等 詞,在二元關(guān)系表中檢索,均無(wú)二元關(guān)系;而根據(jù)第二種形式,符合Wo的 詞如"我"等與符合JinTiao的詞如"金條"等,及符合JinTiao的詞如"金 條"等與符合WanShang的詞"晚上"等詞之間也沒(méi)有二元聯(lián)系。
通過(guò)上述的二元關(guān)系比較環(huán)節(jié)可以得出"Wo JinTian WanShang "比 "WoJinTiaoWanShang"得分更高,很可能更符合語(yǔ)言使用的習(xí)慣。因此, 可以拋棄"WoJinTiaoWanShang"這個(gè)結(jié)果。
同理拋棄"WoJinTianWanQiang"。
如果同樣切分方式中兩個(gè)拼音串的二元關(guān)系比較結(jié)果相等,如 "WoJinTianWanShang"和"WoJinTianZaoShang",屬于相鄰詞兩兩之間都 存在二元關(guān)系,則可以將相應(yīng)的兩個(gè)拼音串全部保留。二元關(guān)系比較結(jié)果相 等的情況可以包括兩個(gè)"l并音串中相鄰詞兩兩判斷后的結(jié)果相同等,例如兩 個(gè)拼音串都不存在二元關(guān)系,或者,兩個(gè)拼音串存在數(shù)量、位置相同的二元 關(guān)系。
本步驟處理后留下的拼音串為以下3個(gè)"WoJinTianWanShang"、 "WoJinTianZaoShang" 、 "WoJinTianWanShaMi"。
對(duì)于不同切分方式下的拼音串排序,采用二元關(guān)系比較得到的結(jié)果可能 不盡準(zhǔn)確,例如,對(duì)以同一拼音串, 一種切分得到兩個(gè)音節(jié),另一種切分得 到四個(gè)音節(jié),而相鄰二元關(guān)系在數(shù)量上的不一致會(huì)對(duì)比較過(guò)程造成障礙,影
響結(jié)果合理性。因此,在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,仫 f又針對(duì)同一切分方式下的各個(gè)拼音串進(jìn)行二元關(guān)系的比較。例如,"WoJinTianZaoShang"、 "WoJinTianWanShaMi"就屬于不同的切分方式,則可以通過(guò)下一步的詞頻 計(jì)算進(jìn)行篩選排序,無(wú)需對(duì)于屬于不同切分方式的拼音串進(jìn)行二元關(guān)系的比 較。
需要說(shuō)明的是,在本發(fā)明的另 一 實(shí)施例中,如果拼音串 "WoJinTianWanShaMi"不存在二元關(guān)系,則也可以在步驟404中拋棄。 而在本發(fā)明的另一實(shí)施例中,即使拼音串"WoJinTianWanShaMi"不存 在二元關(guān)系,也可以不在本步驟進(jìn)行篩選,而通過(guò)步驟405的詞頻計(jì)算進(jìn)行 篩選排序。即僅僅通過(guò)二元關(guān)系來(lái)篩選排序同 一切分方式下的不同拼音串, 而不對(duì)切分方式本身進(jìn)行篩選,因?yàn)槟承┣闆r下,雖然二元關(guān)系不強(qiáng),但是 由于新詞、口語(yǔ)等使用習(xí)慣,可能該切分方式也是用戶所需的,需要作進(jìn)一 步的判斷。
步驟405、對(duì)上一步的結(jié)果,計(jì)算并比較每一個(gè)拼音串中各詞頻的加權(quán) 倒數(shù)和,選出數(shù)值最小的拼音串進(jìn)行展示。
通過(guò)加權(quán)倒數(shù)和可以選擇出詞頻最高、詞數(shù)最少的拼音串來(lái)。如Wo(我) JinTian (今天)WanShang (晚上)的切分方式,因其詞數(shù)少,詞頻高,在同 等情況下,比Wo (我)JinTian (今天)Wan (晚)ShaMi (沙彌)這種組合 方式的加權(quán)倒凄t和更'J 、。
同樣,因?yàn)樵谠~頻表中WanShang (晚上)比ZaoShang (早上)的詞頻 更高,則經(jīng)過(guò)步驟405后得到的最優(yōu)結(jié)果為"WoJinTianWanShang"。
總之,從圖4所示例子中,可以看出,本發(fā)明通過(guò)拼音切分、詞表分析、 二元關(guān)系以及詞頻分析等技術(shù)組合,可以實(shí)現(xiàn)基于詞頻、二元關(guān)系對(duì)拼音串 的排序處理,減少用戶的手動(dòng)選擇操作。
上面給出的是本發(fā)明最優(yōu)的一個(gè)實(shí)施例,在本發(fā)明的另一個(gè)實(shí)施例中, 步驟404也可以省略,即僅僅通過(guò)計(jì)算各個(gè)拼音串的詞頻參數(shù)(例如加權(quán)倒 數(shù)和)也可以實(shí)現(xiàn)對(duì)多個(gè)拼音串的排序,雖然效果上要稍差于圖4的實(shí)施例, 但是也可以在一定程度上提升短句或詞組輸入中的數(shù)字轉(zhuǎn)拼音的效果,比簡(jiǎn)單的字母排序要好很多。
在本發(fā)明的另一個(gè)實(shí)施例中,省略步驟404,在步驟405中,計(jì)算詞頻 參數(shù)時(shí),僅僅計(jì)算具有二元關(guān)系的詞的詞頻。例如,對(duì)于拼音串 "WoJinTianWanShang",僅僅以具有二元關(guān)系的詞"我"、"今天"、"晚上" 計(jì)算該拼音串的詞頻參數(shù),而對(duì)于詞"握緊"、"天"、"晚上"不納入計(jì)算范 疇。這樣在一定程度上借鑒了二元關(guān)系,故也可以較好的提升短句或詞組輸 入中的數(shù)字轉(zhuǎn)拼音的效果。
在本發(fā)明的另一個(gè)實(shí)施例中,也可以省略詞頻參數(shù)計(jì)算的步驟405,可 以直接依據(jù)二元關(guān)系數(shù)值的大小,對(duì)多個(gè)拼音串進(jìn)行排序,這樣,雖然效果 上要稍差于圖4的實(shí)施例,但是也可以在一定程度上提升短句或詞組輸入中 的數(shù)字轉(zhuǎn)拼音的效果。
在本發(fā)明的另 一個(gè)實(shí)施例中,還可以采用二元關(guān)系和詞頻的多步混合篩 選過(guò)程,例如
首先,計(jì)算各個(gè)編碼串的第一詞頻參數(shù),對(duì)編碼串進(jìn)行粗篩;
其次,依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行二次篩選;或者,依據(jù)詞間的 N元關(guān)系對(duì)編碼串以及編碼串所對(duì)應(yīng)的詞進(jìn)行篩選;
再者,計(jì)算各個(gè)編碼串的第二詞頻參數(shù),依據(jù)所述第二詞頻參數(shù)對(duì)所述 按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
當(dāng)然,具體如何將"二元關(guān)系和詞頻"進(jìn)行一系列的混合,本發(fā)明對(duì)此 并不加以限定,本領(lǐng)域技術(shù)人員依據(jù)需要組合即可。
在圖4所示的示例中,首先將數(shù)字串轉(zhuǎn)換為編碼串,然后依據(jù)詞間的N 元關(guān)系和/或詞頻,對(duì)各編碼串進(jìn)行篩選排序。然而,在本發(fā)明的另一個(gè)實(shí)施 例中,也可以首先依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)數(shù)字串相對(duì)應(yīng)的各種 可能的切分組合進(jìn)行排序,然后再將數(shù)字串按照篩選排序后的切分組合轉(zhuǎn)換 為編碼串依序顯示輸出。上面兩種實(shí)現(xiàn)方式的核心構(gòu)思都是一樣的,只不過(guò) 是數(shù)字-編碼轉(zhuǎn)換步驟的執(zhí)行順序有所變化而已。下面給出一個(gè)簡(jiǎn)單例子, 例如,
首先,輸入數(shù)字串;其次,通過(guò)檢索數(shù)字編碼的字、詞表,挑選盡量符合"最長(zhǎng)完整匹配" 的數(shù)字串切分組合。其中,最長(zhǎng)完整匹配"是指切分出的數(shù)字編碼段均完整
對(duì)應(yīng)字詞,并且編碼盡量長(zhǎng);
然后,選出二元關(guān)系滿足一定條件的數(shù)字串切分組合和相應(yīng)字詞; 再者,計(jì)算篩選后的每一數(shù)字串切分組合中各詞頻的加權(quán)倒數(shù)和,選擇
最優(yōu)結(jié)果;
最后,將數(shù)字串按最優(yōu)結(jié)果的切分方式及拼音編碼,轉(zhuǎn)換為拼音串輸出。
參照?qǐng)D5,示出了本發(fā)明一種文字輸入方法的實(shí)施例,包括
步驟501、接收用戶輸入的按4建組合;其中,至少有一個(gè)按鍵對(duì)應(yīng)兩個(gè) 或兩個(gè)以上的編碼字符;
步驟502、依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按々建組合對(duì)應(yīng)的各個(gè) 編碼串進(jìn)行排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞; 所述N大于等于2;
步驟503、接收用戶對(duì)編碼串的選擇;
一種實(shí)現(xiàn)方式是,當(dāng)用戶選擇一編碼串后,則展現(xiàn)該編碼串的對(duì)應(yīng)文字 候選項(xiàng)。
另一種實(shí)現(xiàn)方式是,對(duì)于第一個(gè)編碼串,則在展現(xiàn)編碼串的同時(shí)展現(xiàn)其 對(duì)應(yīng)文字候選項(xiàng),無(wú)須用戶選擇。對(duì)于其他編碼串,則當(dāng)用戶選擇后,再展 現(xiàn)其對(duì)應(yīng)文字候選項(xiàng)。
步驟504、接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。
上述實(shí)施例的核心仍然是對(duì)編碼串的優(yōu)化排序或篩選,由于在前面的各 個(gè)實(shí)施例中已經(jīng)詳細(xì)介紹過(guò)程,因此,在此不再贅述,相關(guān)之處請(qǐng)參見(jiàn)即可。 圖5所示實(shí)施例的一個(gè)典型應(yīng)用就是通過(guò)手機(jī)數(shù)字鍵盤(pán)拼音輸入短句或者詞 組,從前面的描述易于看出,本發(fā)明可以顯著改善該輸入過(guò)程。
需要說(shuō)明的是,步驟503和步驟504中用戶對(duì)編碼串和候選項(xiàng)的選擇可 以集成為一個(gè)操作,例如,所展示的當(dāng)前編碼串就是用戶所需的,則用戶可 以直接選擇所需的候選項(xiàng)輸出,即用戶對(duì)候選項(xiàng)的選擇操作就包括了對(duì)當(dāng)前編碼串的選擇和所需候選項(xiàng)的選擇。
參照?qǐng)D6,示出了本發(fā)明一種編碼串排序的裝置實(shí)施例,包括
接口單元601,用于接收用戶輸入的按^:組合;其中,至少有一個(gè)按4建 對(duì)應(yīng)兩個(gè)或兩個(gè)以上的編碼字符;
排序處理單元602,用于依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按鍵組 合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包 括至少兩個(gè)詞;所述N大于等于2。優(yōu)選的,所述排序輸出的一個(gè)典型應(yīng)用 就是篩選得到 一個(gè)最佳結(jié)果進(jìn)行展示。
在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,所述排序處理單元602可以包括以下兩 個(gè)模塊第一處理模塊6021,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選; 第二處理模塊6022,用于計(jì)算篩選后的各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞 頻參數(shù)對(duì)所述^4建組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;
在本發(fā)明的另一個(gè)優(yōu)選實(shí)施例中,所述排序處理單元602所包括的兩個(gè) 模塊也可以稍有變化第一處理模塊,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編 碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;第二處理模塊,用于針對(duì)篩選后的編碼
串,依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述 詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;
在本發(fā)明的另一個(gè)優(yōu)選實(shí)施例中,所述排序處理單元602所包括的兩個(gè) 模塊還可以變化為第一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn) 換對(duì)應(yīng)的文字串進(jìn)行篩選;第二處理模塊,用于依據(jù)篩選后的文字串所包含 的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述"l^4建組合對(duì)應(yīng)的 各個(gè)編碼串進(jìn)行排序。
需要說(shuō)明的是,上面的三個(gè)實(shí)現(xiàn)方式也僅僅是對(duì)如何應(yīng)用詞間的N元關(guān)
系和/或詞頻進(jìn)行篩選排序的幾個(gè)示例,本發(fā)明無(wú)法--陳述所有組合,本領(lǐng)
域技術(shù)人員所基于上述思想進(jìn)行的變化,都屬于本發(fā)明的核心構(gòu)思。
在本發(fā)明的另一優(yōu)選實(shí)施例中,所述排序處理單元,也可以用于依據(jù)詞 間的N元關(guān)系和/或由詞頻得到的編碼段頻,對(duì)所述按鍵組合對(duì)應(yīng)的編碼串進(jìn)行排序輸出;所述編碼串包括至少兩個(gè)與詞相對(duì)應(yīng)的編碼段。 參照?qǐng)D7,示出了本發(fā)明一種文字輸入裝置的實(shí)施例,包括 接口單元701,用于接收用戶輸入的按4建組合;其中,至少有一個(gè)按4建 對(duì)應(yīng)兩個(gè)或兩個(gè)以上的編石馬字符;
排序處理單元702,用于依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述4姿4建組 合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包 括至少兩個(gè)詞;所述N大于等于2;優(yōu)選的,所述排序輸出的一個(gè)典型應(yīng)用 就是篩選得到最佳結(jié)果進(jìn)行展示;
編碼串選擇單元703,用于接收用戶對(duì)編碼串的選擇; 候選項(xiàng)選擇單元704,用于接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。 所述排序處理單元702的內(nèi)部具體模塊,第一處理模塊7021和第二處 理模塊7022,也可以采用圖6實(shí)施例中的構(gòu)成,在此不再贅述。在本發(fā)明的 另一優(yōu)選實(shí)施例中,所述排序處理單元702,也可以用于依據(jù)詞間的N元關(guān) 系和/或由詞頻得到的編碼段頻,對(duì)所述按鍵組合對(duì)應(yīng)的編碼串進(jìn)行排序輸 出;所述編碼串包括至少兩個(gè)與詞相對(duì)應(yīng)的編碼段。
前面的實(shí)施例描述指出,本發(fā)明的編碼串排序可以直接輸出最佳結(jié)果。 如果在文字輸入中應(yīng)用該方案,則在大多數(shù)情況下,可以省略用戶選擇編碼 串的步驟,因?yàn)閼?yīng)用本發(fā)明后,最佳編碼串在很大概率上就是用戶所需的, 無(wú)須用戶的編碼串選擇#:作;當(dāng)然,在某些特殊情況下,用戶也可以通過(guò)選 擇操作獲得其他編碼串進(jìn)行輸入。具體的,在本發(fā)明的另一優(yōu)選實(shí)施例中, 文字輸入過(guò)程可以包括
步驟a、接收用戶輸入的按鍵組合;其中,至少有一個(gè)按鍵對(duì)應(yīng)兩個(gè)或 兩個(gè)以上的編碼字符;
步驟b、依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按4建組合對(duì)應(yīng)的各個(gè)編 碼串進(jìn)行篩選排序;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞; 所述N大于等于2;
步驟c、輸出排序靠前的一個(gè)或者多個(gè)編碼串,并展現(xiàn)編碼串的對(duì)應(yīng)文步驟d、接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。
其中,步驟c中的所述展現(xiàn)編碼串對(duì)應(yīng)文字候選項(xiàng)的步驟的進(jìn)一步具體 實(shí)現(xiàn)可以為展現(xiàn)排序最靠前的一編碼串的對(duì)應(yīng)文字候選項(xiàng)。即在本實(shí)施例 中,由于直接給出了最佳的編碼串,并給出了該編碼串的候選項(xiàng),因此,用 戶可以直接選擇相應(yīng)的候選項(xiàng)輸出,而無(wú)須進(jìn)行編碼串的選擇操作。當(dāng)然, 如果展示的該最佳編碼串并不是用戶所需的,則用戶也可以通過(guò)前述實(shí)施例 的方式,選擇其他編碼串進(jìn)行輸入。
或者,步驟c中的所述展現(xiàn)編碼串對(duì)應(yīng)文字候選項(xiàng)的步驟的進(jìn)一步具體 實(shí)現(xiàn)可以為展現(xiàn)多個(gè)分別針對(duì)排序靠前的不同編碼串的對(duì)應(yīng)文字候選項(xiàng)。 即在本實(shí)施例中,不僅可以給出針對(duì)最佳編碼串的對(duì)應(yīng)文字候選項(xiàng),同時(shí), 還會(huì)給出針對(duì)排序比較靠前的幾個(gè)編碼串的對(duì)應(yīng)文字候選項(xiàng);從而可以進(jìn)一 步提高用戶直接選擇文字候選項(xiàng)的幾率,避免編碼串的選擇操作。例如,針 對(duì)圖4的例子,可以展示的候選項(xiàng)包括"我今天晚上"和"我今天早上", 當(dāng)編碼串"wojintianwanshang"不是用戶所需時(shí),用戶可以直接選擇另一編 碼串的候選項(xiàng)"我今天早上"進(jìn)行輸出,避免了額外的編碼串選擇操作。
即,在輸出排序最靠前的一個(gè)編碼串時(shí),可以僅僅展現(xiàn)針對(duì)該編碼串的 對(duì)應(yīng)文字候選項(xiàng),也可以展示針對(duì)排序靠前的多個(gè)編碼串的對(duì)應(yīng)文字候選 項(xiàng);當(dāng)輸出排序靠前的多個(gè)編碼串時(shí),可以展示針對(duì)排序靠前的多個(gè)編碼串 的對(duì)應(yīng)文字候選項(xiàng),也可以僅僅展現(xiàn)針對(duì)排序最靠前的一個(gè)編碼串的對(duì)應(yīng)文 字候選項(xiàng)??傊?,本發(fā)明對(duì)此并不需要加以限制。
相應(yīng)的裝置實(shí)施例可以具體包括
接口單元,用于接收用戶輸入的按鍵組合;其中,至少有一個(gè)按鍵對(duì)應(yīng) 兩個(gè)或兩個(gè)以上的編碼字符;
排序處理單元,用于依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按鍵組合 對(duì)應(yīng)的各個(gè)編碼串進(jìn)行篩選排序;其中,與所述編碼串相對(duì)應(yīng)的文字串包括 至少兩個(gè)詞;所述N大于等于2;
30候選項(xiàng)展現(xiàn)單元,用于輸出排序靠前的一個(gè)或者多個(gè)編碼串,并展現(xiàn)編 碼串的對(duì)應(yīng)文字^f夷選項(xiàng);
候選項(xiàng)選擇單元,用于接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。
本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明 的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn) 即可。對(duì)于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比 較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。
以上對(duì)本發(fā)明所提供的 一種編碼串排序的方法和裝置,以及一種文字輸 入的方法和裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理 及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法 及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,^具體實(shí)施方式
及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng) 理解為對(duì)本發(fā)明的限制。
權(quán)利要求
1、一種編碼串排序的方法,其特征在于,包括接收用戶輸入的按鍵組合;其中,至少有一個(gè)按鍵對(duì)應(yīng)兩個(gè)或兩個(gè)以上的編碼字符;依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞;所述N大于等于2。
2、 如權(quán)利要求l所述的方法,其特征在于,所述依據(jù)詞間的N元關(guān)系 和/或詞頻進(jìn)行編碼串排序包括依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選;計(jì)算篩選后的各個(gè)編碼串的詞 頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;或者,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn) 行篩選;針對(duì)篩選后的編碼串,依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編 碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述^^:組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行 排序;或者,依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;依 據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參 數(shù)對(duì)所述4務(wù)睫組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
3、 如權(quán)利要求2所述的方法,其特征在于,所述詞頻參數(shù)包括各詞頻 的加;f又和或者力口4又倒凄丈和。
4、 如權(quán)利要求2所述的方法,其特征在于,僅針對(duì)同一切分方式下的 編碼串和/或相對(duì)應(yīng)的文字串,依據(jù)詞間N元關(guān)系進(jìn)行篩選。
5、 如權(quán)利要求l所述的方法,其特征在于,所述依據(jù)詞間的N元關(guān)系和/或詞頻進(jìn)行編碼串排序包括計(jì)算各個(gè)編碼串的第一詞頻參數(shù),對(duì)編碼串進(jìn)行粗篩;依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行二次篩選;計(jì)算篩選后的各個(gè)編碼串的第二詞頻參數(shù),依據(jù)所述第二詞頻參數(shù)對(duì)所 述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
6、 如權(quán)利要求1所述的方法,其特征在于,所述排序輸出包括篩選得到最佳結(jié)果進(jìn)行展示。
7、 如權(quán)利要求l所述的方法,其特征在于,所述依據(jù)詞間的N元關(guān)系 和/或詞頻進(jìn)行編碼串排序包括依據(jù)詞間的N元關(guān)系和/或由詞頻得到的編碼段頻,對(duì)所述按4建組合 對(duì)應(yīng)的編碼串進(jìn)行排序輸出;所述編碼串包括至少兩個(gè)與詞相對(duì)應(yīng)的編碼 段。
8、 如權(quán)利要求l所述的方法,其特征在于,所述依據(jù)詞間的N元關(guān)系 和/或詞頻進(jìn)行編碼串排序包括將按4建組合轉(zhuǎn)換為編碼串;依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)各編碼 串進(jìn)行篩選排序;或者,依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)按鍵組合進(jìn)行排序;然后將 按鍵組合轉(zhuǎn)換為編碼串依序顯示輸出。
9、 一種文字輸入方法,其特征在于,包括接收用戶輸入的按鍵組合;其中,至少有一個(gè)按一建對(duì)應(yīng)兩個(gè)或兩個(gè)以上 的編碼字符;依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述4安4建組合對(duì)應(yīng)的各個(gè)編碼串進(jìn) 行排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞;所述N 大于等于2;接收用戶對(duì)編碼串的選擇;接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。
10、 如權(quán)利要求9所述的方法,其特征在于,所述依據(jù)詞間的N元關(guān)系 和/或詞頻進(jìn)行編碼串排序包括依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選;計(jì)算篩選后的各個(gè)編碼串的詞 頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;或者,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn) 行篩選;針對(duì)篩選后的編碼串,依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編 碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述^^:組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;或者,依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;依 據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參 數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
11、 如權(quán)利要求10所述的方法,其特征在于,所述詞頻參數(shù)包括各詞 頻的加權(quán)和或者加權(quán)倒凄史和。
12、 如權(quán)利要求10所述的方法,其特征在于,僅針對(duì)同一切分方式下 的編碼串和/或相對(duì)應(yīng)的文字串,依據(jù)詞間N元關(guān)系進(jìn)行篩選。
13、 如權(quán)利要求9所述的方法,其特征在于,所述依據(jù)詞間的N元關(guān)系 和/或詞頻進(jìn)行編碼串排序包括計(jì)算各個(gè)編碼串的第一詞頻參數(shù),對(duì)編碼串進(jìn)行粗篩;依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行二次篩選;計(jì)算各個(gè)編碼串的第二詞頻參數(shù),依據(jù)所述第二詞頻參數(shù)對(duì)所述按一睫組 合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
14、 如權(quán)利要求9所述的方法,其特征在于,所述依據(jù)詞間的N元關(guān)系 和/或詞頻進(jìn)行編碼串排序包括依據(jù)詞間的N元關(guān)系和/或由詞頻得到的編碼段頻,對(duì)所述按鍵組合 對(duì)應(yīng)的編碼串進(jìn)行排序輸出;所述編碼串包括至少兩個(gè)與詞相對(duì)應(yīng)的編碼 段。
15、 如權(quán)利要求9所述的方法,其特征在于,所述依據(jù)詞間的N元關(guān)系 和/或詞頻進(jìn)行編碼串排序包括將按鍵組合轉(zhuǎn)換為編碼串;依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)各編碼 串進(jìn)行篩選排序;或者,依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)按鍵組合進(jìn)行排序;然后將 按鍵組合轉(zhuǎn)換為編碼串依序顯示輸出。
16、 一種編碼串排序的裝置,其特征在于,包括接口單元,用于接收用戶輸入的按鍵組合;其中,至少有一個(gè)按鍵對(duì)應(yīng) 兩個(gè)或兩個(gè)以上的編碼字符;排序處理單元,用于依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按^;組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)^f亍排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包括 至少兩個(gè)詞;所述N大于等于2。
17、 如權(quán)利要求16所述的裝置,其特征在于,所述排序處理單元包括 第一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選; 第二處理模塊,用于計(jì)算篩選后的各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序; 或者,第一處理模塊,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換對(duì)應(yīng)的 文字串進(jìn)行篩選;第二處理模塊,用于針對(duì)篩選后的編碼串,依據(jù)篩選后的文字串所包含 的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的 各個(gè)編碼串進(jìn)行排序;或者,第 一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串 進(jìn)行篩選;第二處理模塊,用于依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的 詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
18、 如權(quán)利要求17所述的裝置,其特征在于,所述第一處理模塊僅針 對(duì)同一切分方式下的編碼串和/或相對(duì)應(yīng)的文字串,依據(jù)詞間N元關(guān)系進(jìn) 行篩選。
19、 如權(quán)利要求16所述的裝置,其特征在于,所述排序輸出包括篩選 得到最佳結(jié)果進(jìn)行展示。
20、 如權(quán)利要求17所述的裝置,其特征在于,所述排序處理單元,用 于依據(jù)詞間的N元關(guān)系和/或由詞頻得到的編碼段頻,對(duì)所述按鍵組合對(duì) 應(yīng)的編碼串進(jìn)行排序輸出;所述編碼串包括至少兩個(gè)與詞相對(duì)應(yīng)的編碼段。
21、 一種文字輸入裝置,其特征在于,包括接口單元,用于接收用戶輸入的按鍵組合;其中,至少有一個(gè)按鍵對(duì)應(yīng) 兩個(gè)或兩個(gè)以上的編碼字符;排序處理單元,用于依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按鍵組合 對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包括 至少兩個(gè)詞;所述N大于等于2;編碼串選擇單元,用于接收用戶對(duì)編碼串的選擇; 候選項(xiàng)選擇單元,用于接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。
22、 如權(quán)利要求21所述的裝置,其特征在于,所述排序處理單元包括 第一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選; 第二處理模塊,用于計(jì)算篩選后的各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述^l建組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序; 或者,第 一處理模塊,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換對(duì)應(yīng)的 文字串進(jìn)行篩選;第二處理模塊,用于針對(duì)篩選后的編碼串,依據(jù)篩選后的文字串所包含 的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的 各個(gè)編碼串進(jìn)行排序;或者,第一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串 進(jìn)行篩選;第二處理模塊,用于依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的 詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按4建組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
23、 如權(quán)利要求22所述的裝置,其特征在于,所述第一處理模塊僅針 對(duì)同一切分方式下的編碼串和/或相對(duì)應(yīng)的文字串,依據(jù)詞間N元關(guān)系進(jìn) 行篩選。
24、 如權(quán)利要求21所述的裝置,其特征在于,所述排序處理單元,用 于依據(jù)詞間的N元關(guān)系和/或由詞頻得到的編碼段頻,對(duì)所述按鍵組合對(duì) 應(yīng)的編碼串進(jìn)行排序輸出;所述編碼串包括至少兩個(gè)與詞相對(duì)應(yīng)的編碼段。
25、 一種文字輸入方法,其特征在于,包括接收用戶輸入的按4建組合;其中,至少有一個(gè)按^:對(duì)應(yīng)兩個(gè)或兩個(gè)以上的編碼字符;依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按4定組合對(duì)應(yīng)的各個(gè)編碼串進(jìn) 行篩選排序;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞;所述N 大于等于2;輸出排序靠前的一個(gè)或者多個(gè)編碼串,并展現(xiàn)編碼串的對(duì)應(yīng)文字候選項(xiàng);接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。
26、 如權(quán)利要求25所述的方法,其特征在于,所述依據(jù)詞間的N元關(guān) 系和/或詞頻進(jìn)行編碼串排序包括依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選;計(jì)算篩選后的各個(gè)編碼串的詞 頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序;或者,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn) 行篩選;針對(duì)篩選后的編碼串,依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編 碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述4^4定組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行 排序;或者,依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串進(jìn)行篩選;依 據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參 數(shù)對(duì)所述按4走組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
27、 如權(quán)利要求26所述的方法,其特征在于,僅針對(duì)同一切分方式下 的編碼串和/或相對(duì)應(yīng)的文字串,依據(jù)詞間N元關(guān)系進(jìn)4亍篩選。
28、 如權(quán)利要求25所述的方法,其特征在于,所述編碼串、候選項(xiàng)的 輸出展現(xiàn)步驟包括輸出排序最靠前的一編碼串,展現(xiàn)該編碼串的對(duì)應(yīng)文字候選項(xiàng); 或者,輸出排序最靠前的一編碼串,展現(xiàn)針對(duì)排序靠前的多個(gè)編碼串的 對(duì)應(yīng)文字候選項(xiàng);或者,輸出排序靠前的多個(gè)編碼串,展現(xiàn)排序最靠前的一編碼串的對(duì)應(yīng) 文字候選項(xiàng);或者,輸出排序靠前的多個(gè)編碼串,展現(xiàn)針對(duì)所述多個(gè)編碼串的對(duì)應(yīng)文字候選項(xiàng)。
29、 一種文字輸入裝置,其特征在于,包括接口單元,用于接收用戶輸入的按鍵組合;其中,至少有一個(gè)按鍵對(duì)應(yīng) 兩個(gè)或兩個(gè)以上的編碼字符;排序處理單元,用于依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按鍵組合 對(duì)應(yīng)的各個(gè)編碼串進(jìn)行篩選排序;其中,與所述編碼串相對(duì)應(yīng)的文字串包括 至少兩個(gè)詞;所述N大于等于2;候選項(xiàng)展現(xiàn)單元,用于輸出排序靠前的一個(gè)或者多個(gè)編碼串,并展現(xiàn)編 碼串的對(duì)應(yīng)文字候選項(xiàng);候選項(xiàng)選擇單元,用于接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。
30、 如權(quán)利要求29所述的裝置,其特征在于,所述候選項(xiàng)展現(xiàn)單元具 體用于輸出排序最靠前的一編碼串,展現(xiàn)該編碼串的對(duì)應(yīng)文字候選項(xiàng); 或者,輸出排序最靠前的一編碼串,展現(xiàn)針對(duì)排序靠前的多個(gè)編碼串的 對(duì)應(yīng)文字4芙選項(xiàng);或者,輸出排序靠前的多個(gè)編碼串,展現(xiàn)排序最靠前的一編碼串的對(duì)應(yīng) 文字候選項(xiàng);或者,輸出排序靠前的多個(gè)編碼串,展現(xiàn)針對(duì)所述多個(gè)編碼串的對(duì)應(yīng)文 字候選項(xiàng)。
31、 如權(quán)利要求29所述的裝置,其特征在于,所述排序處理單元包括 第 一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串進(jìn)行篩選; 第二處理模塊,用于計(jì)算篩選后的各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按4建組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序; 或者,第一處理模塊,依據(jù)詞間的N元關(guān)系對(duì)編碼串以及編碼串所轉(zhuǎn)換對(duì)應(yīng)的 文字串進(jìn)行篩選;第二處理模塊,用于針對(duì)篩選后的編碼串,依據(jù)篩選后的文字串所包含 的詞計(jì)算各個(gè)編碼串的詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序; 或者,第 一處理模塊,用于依據(jù)詞間的N元關(guān)系對(duì)編碼串所轉(zhuǎn)換對(duì)應(yīng)的文字串 進(jìn)行篩選;第二處理模塊,用于依據(jù)篩選后的文字串所包含的詞計(jì)算各個(gè)編碼串的 詞頻參數(shù),依據(jù)所述詞頻參數(shù)對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序。
32、如權(quán)利要求31所述的裝置,其特征在于,所述第一處理模塊僅針 對(duì)同一切分方式下的編碼串和/或相對(duì)應(yīng)的文字串,依據(jù)詞間N元關(guān)系進(jìn) 行篩選。
全文摘要
本發(fā)明提供了一種編碼串排序方法和一種文字輸入方法,所述文字輸入方法可以包括接收用戶輸入的按鍵組合;其中,至少有一個(gè)按鍵對(duì)應(yīng)兩個(gè)或兩個(gè)以上的編碼字符;依據(jù)詞間的N元關(guān)系和/或詞頻,對(duì)所述按鍵組合對(duì)應(yīng)的各個(gè)編碼串進(jìn)行排序輸出;其中,與所述編碼串相對(duì)應(yīng)的文字串包括至少兩個(gè)詞;所述N大于等于2;接收用戶對(duì)編碼串的選擇;接收用戶對(duì)候選項(xiàng)的選擇,輸出對(duì)應(yīng)文字。本發(fā)明可以依據(jù)較長(zhǎng)編碼串中各個(gè)詞間的二元或多元關(guān)系,以及詞頻或者音節(jié)頻,以從多條可能的編碼串中選出最優(yōu)結(jié)果并實(shí)現(xiàn)最優(yōu)排序;從而減少由于切分、重碼等引發(fā)的需要用戶多次手動(dòng)選取所需編碼串而帶來(lái)的多余操作。
文檔編號(hào)G06F3/023GK101644961SQ20091009121
公開(kāi)日2010年2月10日 申請(qǐng)日期2009年8月14日 優(yōu)先權(quán)日2009年8月14日
發(fā)明者包越千, 王天一 申請(qǐng)人:北京搜狗科技發(fā)展有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1