亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方法和裝置與流程

文檔序號(hào):12461719閱讀:514來(lái)源:國(guó)知局
對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方法和裝置與流程

本發(fā)明涉及輸入法技術(shù)領(lǐng)域,特別是涉及一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方法和一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的裝置。



背景技術(shù):

對(duì)于中文、日文、韓文等語(yǔ)言的用戶而言,一般都需要通過(guò)輸入法與計(jì)算機(jī)進(jìn)行交互。例如,用戶可以通過(guò)鍵盤鍵入輸入串,然后由輸入法依據(jù)其預(yù)置的標(biāo)準(zhǔn)映射規(guī)則將該輸入串轉(zhuǎn)換為相應(yīng)語(yǔ)言的候選項(xiàng)并展示,進(jìn)而將用戶選擇的候選項(xiàng)上屏。

用戶在使用輸入法的過(guò)程中,現(xiàn)有技術(shù)已經(jīng)存在多種候選項(xiàng)的排序方式,如:固定順序排序、按照候選項(xiàng)類型排序等;

其中,按固定順序排序時(shí),候選項(xiàng)的順序是固定的,能夠便于用戶對(duì)常用字的輸入,但大多應(yīng)用場(chǎng)景下,候選項(xiàng)固定順序必然會(huì)影響到用戶的輸入速度;例如,每次針對(duì)輸入串“jiji”的輸入,向用戶推送的候選項(xiàng)排序基本是一樣的,其中,排在前幾位的候選項(xiàng)依次為:“積極”、“基極”、“幾級(jí)”、“幾集”等,這樣,用戶所需的目標(biāo)候選項(xiàng)為“記記”時(shí),需要翻頁(yè)才能選擇該目標(biāo)候選項(xiàng),由于無(wú)法向用戶提供合理的候選項(xiàng)排序,因此降低了用戶的輸入速度;

按照候選項(xiàng)類型排序遵循的排序策略為:用戶使用過(guò)的詞被再次選用的概率往往更高,所以用戶詞庫(kù)中用戶詞條的優(yōu)先級(jí)高于其他詞庫(kù)中詞條的優(yōu)先級(jí),故該排序策略通常一律地將用戶詞條固定排在其他詞庫(kù)的詞條的前面,那么在用戶第一次選擇上屏“記記”這個(gè)詞條后,第二次輸入“jiji”時(shí),用戶詞條“記記”將被排在首位,即排在其他系統(tǒng)詞條(包括較高頻的“積極”)的前面;然而,對(duì)于一個(gè)用戶僅使用過(guò)1次的詞條(比如“記記”),其不一定比同音下高頻的系統(tǒng)詞條更合理、更符合用戶的輸入意圖。



技術(shù)實(shí)現(xiàn)要素:

鑒于上述問(wèn)題,提出了本發(fā)明實(shí)施例以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的,對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方法、相應(yīng)的對(duì)輸入法的候選項(xiàng)進(jìn)行排序的裝置和相應(yīng)的用于對(duì)輸入法的候選項(xiàng)進(jìn)行排序的裝置,使得排序結(jié)果隨著用戶的使用將越來(lái)越貼合于用戶的輸入習(xí)慣,且使得排序結(jié)果將越來(lái)越符合用戶的輸入意圖,從而便于用戶快速選擇其所需的候選項(xiàng),提高用戶的輸入速度。

為了解決上述問(wèn)題,本發(fā)明公開(kāi)了一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方法,包括:

獲取用戶的輸入串;

根據(jù)所述輸入串在詞庫(kù)或者詞庫(kù)和模型中進(jìn)行查詢,以得到與所述輸入串相匹配的多個(gè)候選項(xiàng);

生成所述候選項(xiàng)的排序特征向量和所述排序特征向量對(duì)應(yīng)的排序權(quán)重向量;其中,所述排序特征向量中排序特征與所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型相應(yīng),所述排序權(quán)重向量中排序權(quán)重用于表示依據(jù)用戶的歷史輸入行為數(shù)據(jù)得到的、所述排序特征對(duì)于候選項(xiàng)排序的影響權(quán)重;

依據(jù)所述排序特征向量及所述排序權(quán)重向量,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序;

根據(jù)所述排序結(jié)果將所述多個(gè)候選項(xiàng)進(jìn)行展現(xiàn)。

可選地,所述依據(jù)所述排序特征向量及所述排序權(quán)重向量,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序的步驟,包括:

依據(jù)所述排序特征的特征值和與所述排序特征相對(duì)應(yīng)的排序權(quán)重,得到所述排序特征向量對(duì)應(yīng)候選項(xiàng)的得分;

依據(jù)所述排序特征向量對(duì)應(yīng)候選項(xiàng)的得分,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序。

可選地,所述排序權(quán)重包括:

所述排序特征在用戶的歷史上屏行為數(shù)據(jù)中的上屏分布;和/或

將用戶的歷史輸入行為數(shù)據(jù)作為訓(xùn)練樣本,依據(jù)所述訓(xùn)練樣本和所述 訓(xùn)練樣本對(duì)應(yīng)的排序特征的特征值訓(xùn)練得到的排序權(quán)重。

可選地,所述排序特征的特征值包括:所述候選項(xiàng)在對(duì)應(yīng)的詞庫(kù)或模型中的詞頻,和/或,所述候選項(xiàng)在對(duì)應(yīng)的詞庫(kù)或模型中的概率,和/或,所述候選項(xiàng)在對(duì)應(yīng)的詞庫(kù)或模型中的概率的對(duì)數(shù)。

可選地,所述詞庫(kù)或者模型用于描述與所述候選項(xiàng)相關(guān)的兩個(gè)及兩個(gè)以上元素之間的轉(zhuǎn)換概率,則所述排序特征的特征值包括:所述轉(zhuǎn)換概率,和/或,所述轉(zhuǎn)換概率的對(duì)數(shù)。

可選地,所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型包括:所述候選項(xiàng)所屬的詞庫(kù)和/或模型,或者,所述候選項(xiàng)和上文所屬的詞庫(kù)和/或模型;

所述詞庫(kù)包括:系統(tǒng)詞庫(kù)、用戶詞庫(kù)和細(xì)胞詞庫(kù)中的至少一種;

所述模型包括:糾錯(cuò)模型、模糊音模型、組詞模型和上下文模型中的至少一種。

可選地,所述方法還包括:

依據(jù)用戶對(duì)于所展現(xiàn)的候選項(xiàng)的上屏行為,對(duì)所述排序特征的特征值和排序權(quán)重進(jìn)行更新。

可選地,所述對(duì)所述排序特征的特征值和排序權(quán)重進(jìn)行更新的步驟,包括:

在所述上屏行為對(duì)應(yīng)候選項(xiàng)的排序特征與用戶詞庫(kù)或用戶模型相應(yīng)時(shí),依據(jù)候選項(xiàng)及其排序特征,更新所述候選項(xiàng)在所述用戶詞庫(kù)或者用戶模型中的屬性參數(shù),并依據(jù)所述候選項(xiàng)的當(dāng)前屬性參數(shù),更新所述排序特征的特征值和排序權(quán)重;或者

在所述上屏行為對(duì)應(yīng)候選項(xiàng)的排序特征與系統(tǒng)詞庫(kù)或系統(tǒng)模型相應(yīng)時(shí),依據(jù)候選項(xiàng)及其排序特征,更新所述候選項(xiàng)在所述系統(tǒng)詞庫(kù)對(duì)應(yīng)的用戶詞庫(kù)或者所述系統(tǒng)模型對(duì)應(yīng)的用戶模型中的屬性參數(shù),并依據(jù)所述候選項(xiàng)的當(dāng)前屬性參數(shù),更新所述排序特征的特征值和排序權(quán)重;或者

依據(jù)所述上屏行為對(duì)應(yīng)的數(shù)據(jù)更新歷史輸入行為數(shù)據(jù)和排序特征的特征值,并依據(jù)當(dāng)前歷史行為數(shù)據(jù)和當(dāng)前排序特征的特征值訓(xùn)練得到當(dāng)前排序權(quán)重;或者

依據(jù)所述上屏行為對(duì)應(yīng)的數(shù)據(jù)更新歷史輸入行為數(shù)據(jù),并依據(jù)當(dāng)前歷史行為數(shù)據(jù)訓(xùn)練得到當(dāng)前排序特征和當(dāng)前排序權(quán)重。

另一方面,本發(fā)明還公開(kāi)了一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的裝置,包括:

獲取模塊,用于獲取用戶的輸入串;

查詢模塊,用于根據(jù)所述輸入串在詞庫(kù)或者詞庫(kù)和模型中進(jìn)行查詢,以得到與所述輸入串相匹配的多個(gè)候選項(xiàng);

生成模塊,用于生成所述候選項(xiàng)的排序特征向量和所述排序特征向量對(duì)應(yīng)的排序權(quán)重向量;其中,所述排序特征向量中排序特征與所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型相應(yīng),所述排序權(quán)重向量中排序權(quán)重用于表示依據(jù)用戶的歷史輸入行為數(shù)據(jù)得到的、所述排序特征對(duì)于候選項(xiàng)排序的影響權(quán)重;

排序模塊,用于依據(jù)所述排序特征向量及所述排序權(quán)重向量,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序;及

展現(xiàn)模塊,用于根據(jù)所述排序結(jié)果將所述多個(gè)候選項(xiàng)進(jìn)行展現(xiàn)。

再一方面,本發(fā)明還公開(kāi)了一種用于對(duì)輸入法的候選項(xiàng)進(jìn)行排序的裝置,包括有存儲(chǔ)器,以及一個(gè)或者一個(gè)以上的程序,其中一個(gè)或者一個(gè)以上程序存儲(chǔ)于存儲(chǔ)器中,且經(jīng)配置以由一個(gè)或者一個(gè)以上處理器執(zhí)行所述一個(gè)或者一個(gè)以上程序包含用于進(jìn)行以下操作的指令:

獲取用戶的輸入串;

根據(jù)所述輸入串在詞庫(kù)或者詞庫(kù)和模型中進(jìn)行查詢,以得到與所述輸入串相匹配的多個(gè)候選項(xiàng);

生成所述候選項(xiàng)的排序特征向量和所述排序特征向量對(duì)應(yīng)的排序權(quán)重向量;其中,所述排序特征向量中排序特征與所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型相應(yīng),所述排序權(quán)重向量中排序權(quán)重用于表示依據(jù)用戶的歷史輸入行為數(shù)據(jù)得到的、所述排序特征對(duì)于候選項(xiàng)排序的影響權(quán)重;

依據(jù)所述排序特征向量及所述排序權(quán)重向量,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序;

根據(jù)所述排序結(jié)果將所述多個(gè)候選項(xiàng)進(jìn)行展現(xiàn)。

本發(fā)明實(shí)施例包括以下優(yōu)點(diǎn):

本發(fā)明實(shí)施例依據(jù)排序特征組成的排序特征向量、及排序權(quán)重向量對(duì)多個(gè)候選項(xiàng)進(jìn)行排序;上述排序權(quán)重為依據(jù)用戶的歷史輸入行為數(shù)據(jù)得到,與上述排序特征相匹配的詞庫(kù)和/或模型也會(huì)隨著用戶累積的歷史輸入行為數(shù)據(jù)而動(dòng)態(tài)調(diào)整,也即,本發(fā)明實(shí)施例的上述排序特征及其排序權(quán)重均可以隨著用戶的歷史輸入行為而動(dòng)態(tài)調(diào)整和學(xué)習(xí)成長(zhǎng),因此,隨著歷史輸入行為的積累,本發(fā)明實(shí)施例提供的排序結(jié)果將越來(lái)越貼合于用戶的輸入習(xí)慣,且提供的排序結(jié)果將越來(lái)越符合用戶的輸入意圖,從而便于用戶快速選擇其所需的候選項(xiàng),提高用戶的輸入效率。

附圖說(shuō)明

圖1是本發(fā)明的一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方法實(shí)施例一的步驟流程圖;

圖2是本發(fā)明的一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方法實(shí)施例二的步驟流程圖;

圖3是本發(fā)明的一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的裝置實(shí)施例的結(jié)構(gòu)框圖;

圖4是本發(fā)明的一種用于對(duì)輸入法的候選項(xiàng)進(jìn)行排序的裝置800的框圖;及

圖5是本發(fā)明的一種服務(wù)器的結(jié)構(gòu)示意圖。

具體實(shí)施方式

為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。

本發(fā)明實(shí)施例提出了一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方案,該方案將可能會(huì)影響輸入行為和結(jié)果偏好的、與候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型相應(yīng)的特征作為排序特征,對(duì)上述排序特征使用排序權(quán)重,由此可以依據(jù)盡可能多的多種排序特征得到更合理的排序結(jié)果;由于上述排序權(quán)重為依據(jù)用戶的歷史輸入行為數(shù)據(jù)得到,與上述排序特征相匹配的詞庫(kù)和/或模型也會(huì)隨著用戶的歷史輸入行為而動(dòng)態(tài)調(diào)整,也即,本發(fā)明實(shí)施例的上述排序特征及其排序權(quán)重均可以隨著用戶累積的歷史輸入行為數(shù)據(jù)而動(dòng)態(tài)調(diào)整和學(xué)習(xí)成長(zhǎng),因此,隨著歷史輸入行為數(shù)據(jù)的積累,本發(fā)明實(shí)施例提供的排序結(jié)果將越來(lái)越貼合于用戶的輸入習(xí)慣,且提供的排序結(jié)果將越來(lái)越符合用戶的輸入意圖,從而便于用戶快速選擇其所需的候選項(xiàng),提高用戶的輸入效率。

方法實(shí)施例一

參照?qǐng)D1,示出了本發(fā)明的一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方法實(shí)施例一的步驟流程圖,具體可以包括如下步驟:

步驟101、獲取用戶的輸入串;

本發(fā)明可以應(yīng)用于各種輸入方式和各種語(yǔ)言的輸入法系統(tǒng),其中,上述輸入方式具體可以包括鍵盤符號(hào)、手寫信息、語(yǔ)音信號(hào)等,上述語(yǔ)言具體可以包括:中文、日文、韓文等語(yǔ)言。

在實(shí)際應(yīng)用中,用戶可通過(guò)諸如鍵盤、鼠標(biāo)、觸摸筆、遙控器、聲控設(shè)備等終端輸入用戶輸入信息。以終端為手機(jī)為例,手機(jī)可向用戶提供實(shí)體鍵盤或者虛擬鍵盤,用戶通過(guò)實(shí)體鍵盤或者虛擬鍵盤輸入上述輸入串。例如,用戶通過(guò)手機(jī)提供的虛擬鍵盤輸入“jiji”這一輸入串;相應(yīng)地,輸入法可以獲取該輸入串。

步驟102、根據(jù)所述輸入串在詞庫(kù)或者詞庫(kù)和模型中進(jìn)行查詢,以得到與所述輸入串相匹配的多個(gè)候選項(xiàng);

一、詞庫(kù)

在實(shí)際應(yīng)用中,上述詞庫(kù)具體可以包括:系統(tǒng)詞庫(kù)、用戶詞庫(kù)和細(xì)胞 詞庫(kù)中的至少一種??梢岳斫?,本發(fā)明實(shí)施例對(duì)于具體的詞庫(kù)不加以限制。

其中,上述系統(tǒng)詞庫(kù)可以為輸入法提供的詞庫(kù),其可以是終端的本地詞庫(kù),也可以是輸入法從服務(wù)器中獲取的網(wǎng)絡(luò)詞庫(kù)或者云詞庫(kù);通常,系統(tǒng)詞庫(kù)可以存儲(chǔ)有輸入串與詞條之間的映射關(guān)系;且同一輸入法系統(tǒng)向不同用戶提供的系統(tǒng)詞庫(kù)是相同的;

上述用戶詞庫(kù)是相對(duì)于系統(tǒng)詞庫(kù)而言的詞庫(kù),相對(duì)于系統(tǒng)詞庫(kù)向不同用戶提供相同的內(nèi)容,輸入法系統(tǒng)可以通過(guò)學(xué)詞,將用戶輸入的上屏詞條(通過(guò)上屏動(dòng)作后上屏的詞條)存儲(chǔ)至用戶詞庫(kù)中,通常,用戶詞庫(kù)可以存儲(chǔ)有輸入串與詞條之間的映射關(guān)系;

一個(gè)細(xì)胞詞庫(kù)就是一個(gè)細(xì)分類別的詞匯集合,細(xì)胞詞庫(kù)的類別可以是某個(gè)專業(yè)領(lǐng)域(如醫(yī)學(xué)領(lǐng)域詞庫(kù)),也可以是某個(gè)地區(qū)(如北京地名詞庫(kù)),也可以是某個(gè)游戲(如魔獸世界詞匯)等;

可以理解,上述系統(tǒng)詞庫(kù)、用戶詞庫(kù)和細(xì)胞詞庫(kù)只是作為詞庫(kù)的示例,本發(fā)明實(shí)施例對(duì)于具體的詞庫(kù)不加以限制。

二、模型

上述模型可用于表示輸入法提供的用于豐富輸入功能的智能模型,在本發(fā)明的一種可選實(shí)施例中,上述模型具體可以包括:糾錯(cuò)模型、模糊音模型、上下文模型和組詞模型中的至少一種??梢岳斫?,本發(fā)明實(shí)施例對(duì)于具體的模型不加以限制。

上述糾錯(cuò)模型用于表示具有糾錯(cuò)功能的模型,在本發(fā)明的一種可選實(shí)施例中,上述糾錯(cuò)模型可以存儲(chǔ)有一個(gè)輸入串被錯(cuò)輸為另一輸入串的概率(以下簡(jiǎn)稱糾錯(cuò)概率),例如,用戶輸入的輸入串為“anzhaung”,輸入法糾錯(cuò)得到的糾錯(cuò)候選串為“anzhuang”,則上述糾錯(cuò)概率可用于表示“anzhuang”被錯(cuò)輸成“anzhaung”的概率,在實(shí)際應(yīng)用中,通??梢垣@取用戶的輸入行為并進(jìn)行統(tǒng)計(jì)分析,以得到上述糾錯(cuò)概率??梢岳斫猓景l(fā)明實(shí)施例對(duì)于上述糾錯(cuò)概率的具體獲取方式及其上述糾錯(cuò)模型的具體存儲(chǔ)內(nèi)容不加以限制。另外,上述糾錯(cuò)模型可以進(jìn)一步包括:系統(tǒng)糾錯(cuò)模型和用戶糾錯(cuò)模型 等。

上述模糊音模型用于表示具有模糊音功能的模型,其可以將某些用戶可能混淆的音節(jié)視為等同,從而允許用戶使用更習(xí)慣的方式進(jìn)行輸入。例如,對(duì)于不習(xí)慣鼻音的用戶,在等同的情況下,只要輸入“fen”,就能同時(shí)獲得“fen”和“feng”的詞條。也即,上述模糊音模型可以存儲(chǔ)一個(gè)輸入串與模糊音輸入串之間的映射關(guān)系。可以理解,本發(fā)明實(shí)施例對(duì)于上述模糊音模型的具體存儲(chǔ)內(nèi)容不加以限制。

關(guān)于上述上下文模型,在文字輸入過(guò)程中,通常候選項(xiàng)出現(xiàn)的概率與其前X個(gè)上屏內(nèi)容有關(guān),為了提高候選項(xiàng)排序的準(zhǔn)確性,本發(fā)明實(shí)施例可以從上屏內(nèi)容中獲取上下文信息,并計(jì)算在上下文信息(上文字符串和/或下文字符串)的基礎(chǔ)上,輸入串或者輸入串對(duì)應(yīng)候選項(xiàng)出現(xiàn)的概率,例如,在“漫天”之后出現(xiàn)“daxue”或“大雪”的上下文概率,在“虎媽”之后出現(xiàn)“maoba”或“貓爸”的上下文概率。也即,上述上下文模型可以存儲(chǔ)上述上下文概率??梢岳斫猓景l(fā)明實(shí)施例對(duì)于上下文模型所存儲(chǔ)的具體內(nèi)容不加以限制。

上述組詞模型用于表示具有組詞功能的模型,其可以在連續(xù)鍵入輸入串(也即輸入串的長(zhǎng)度較長(zhǎng))的情況下,對(duì)輸入串中音節(jié)對(duì)應(yīng)的單字或者單詞進(jìn)行組詞;上述組詞模型可以提供多元詞匯之間的組詞概率。

在本發(fā)明的一種實(shí)施例中,上述組詞模型可以提供多元詞匯之間的組合信息,上述組合信息具體可以包括所述多元詞匯之間的搭配關(guān)系和連接概率等信息。上述多元詞匯具體可以包括:具有n元關(guān)系的詞匯。n元關(guān)系,又稱n-gram,可用于表示n個(gè)元素相繼出現(xiàn)的概率;

其中,二元關(guān)系,又稱2-gram,可用于表示兩個(gè)元素相繼出現(xiàn)的概率(也即連接概率),在輸入法領(lǐng)域,這里的元素可以是音素、音節(jié)、筆畫字符串、字母或詞匯等,以詞匯為例,所述二元關(guān)系具體可以用于表示兩個(gè)詞匯之間的連接概率,例如,可用二元關(guān)系表示詞匯“漫天”和“大雪”相繼出現(xiàn)的概率;

三元關(guān)系則可用于表示三個(gè)元素相繼出現(xiàn)的概率,例如,可用三元關(guān) 系表示詞匯“你是”、“我”和“兄弟”相繼出現(xiàn)的概率。其中,對(duì)于二元詞匯,組詞概率可以為兩個(gè)詞匯之間的連接概率,對(duì)于三元詞匯,組詞概率可以為兩兩詞匯之間的連接概率的乘積。

在實(shí)際應(yīng)用中,上述詞庫(kù)或者模型中通常包含多個(gè)詞條;其中的詞條可以是文字、字符、圖形等形式中的任意一種或多種形式的組合。輸入法可以根據(jù)預(yù)置的匹配算法,在上述詞庫(kù)或者模型中查找并獲取與輸入串相匹配的多個(gè)詞條作為候選項(xiàng)供用戶選取。例如,當(dāng)用戶輸入信息為“jiji”時(shí),與之匹配的m個(gè)詞條可以包括“積極”、“基極”、“幾級(jí)”、“幾集”等。

步驟103、生成所述候選項(xiàng)的排序特征向量和與所述排序特征向量對(duì)應(yīng)的排序權(quán)重向量;其中,所述排序特征向量中排序特征可以與所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型相應(yīng),所述排序權(quán)重向量中排序權(quán)重可用于表示依據(jù)用戶的歷史輸入行為數(shù)據(jù)得到的、所述排序特征對(duì)于候選項(xiàng)排序的影響權(quán)重;

本發(fā)明實(shí)施例中,上述排序特征向量具體可以包括:至少一個(gè)維度,其中,每個(gè)維度對(duì)應(yīng)一個(gè)排序特征,每個(gè)排序特征可以與所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型相應(yīng),其中,每個(gè)排序特征的特征值可以依據(jù)詞庫(kù)或模型本身的數(shù)據(jù)提供,其可用于表示當(dāng)前候選項(xiàng)在詞庫(kù)或模型中的重要度。

在本發(fā)明的一種可選實(shí)施例中,所述排序特征的特征值具體可以包括:所述候選項(xiàng)在對(duì)應(yīng)的詞庫(kù)或模型中的詞頻,和/或,所述候選項(xiàng)在對(duì)應(yīng)的詞庫(kù)或模型中的概率,和/或,所述候選項(xiàng)在對(duì)應(yīng)的詞庫(kù)或模型中的概率的對(duì)數(shù)。其中,相對(duì)于上述概率,上述概率的對(duì)數(shù)可以將可能的非線性關(guān)系轉(zhuǎn)化為線性關(guān)系,減少變量的極端值、非正態(tài)分布以及異方差性,并且也可以減少數(shù)據(jù)的波動(dòng),從而可以保證排序特征的特征值的穩(wěn)定性。

假設(shè)用戶詞庫(kù)中有三個(gè)詞條:“你”、“我”和“他”,這些詞條在用戶詞庫(kù)中的用戶詞頻分別為“3”、“2”和“5”,那么,這些詞條在用戶詞庫(kù)中的概率可以分別為“0.3”、“0.2”和“0.5”,這些詞條在用戶詞庫(kù)中的概率的對(duì)數(shù)可以分別為"log(0.3)"、"log(0.2)"和"log(0.5)"。同理,對(duì)于糾錯(cuò)模型中的詞條,該詞條的詞頻可以為該詞條以糾錯(cuò)候選類型上屏的次數(shù),對(duì)于模糊音 模型中的詞條,該詞條的詞頻可以為該詞條以模糊音候選類型上屏的次數(shù),其它詞庫(kù)或模型對(duì)應(yīng)排序特征的特征值相互參照即可,在此不作贅述。

在本發(fā)明的另一種可選實(shí)施例中,所述排序特征可以與所述候選項(xiàng)對(duì)應(yīng)的模型相應(yīng),所述模型用于描述與所述候選項(xiàng)相關(guān)的兩個(gè)及兩個(gè)以上元素之間的轉(zhuǎn)換概率,則所述排序特征的特征值具體可以包括:所述轉(zhuǎn)換概率,和/或,所述轉(zhuǎn)換概率的對(duì)數(shù)。

例如,糾錯(cuò)模型中存儲(chǔ)有一個(gè)輸入串被錯(cuò)輸為另一輸入串的概率,則糾錯(cuò)模型對(duì)應(yīng)糾錯(cuò)候選(也即糾錯(cuò)模型提供的候選項(xiàng))相關(guān)的兩個(gè)元素具體可以包括:糾錯(cuò)候選對(duì)應(yīng)輸入串和實(shí)際輸入串,上述轉(zhuǎn)換概率具體可以包括:糾錯(cuò)候選對(duì)應(yīng)輸入串被錯(cuò)輸為實(shí)際輸入串的概率。

又如,用戶多元庫(kù)中存儲(chǔ)有多元詞匯之間的連接概率,則用戶多元庫(kù)對(duì)應(yīng)候選項(xiàng)相關(guān)的兩個(gè)元素具體可以包括:對(duì)該候選項(xiàng)拆分得到的詞條,例如,輸入串為“nideyanj”對(duì)應(yīng)的候選項(xiàng)具體可以包括:“你的嚴(yán)謹(jǐn)”和“你的眼睛”等,則“你的眼睛”相關(guān)的兩個(gè)元素具體可以包括:“你的”和“眼睛”,上述轉(zhuǎn)換概率具體可以包括:“你的”和“眼睛”之間的連接概率。

可以理解,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際應(yīng)用需求,對(duì)上述排序特征的特征值進(jìn)行擇一使用或者組合使用,另外,上述排序特征的特征值只是作為可選實(shí)施例,實(shí)際上,用于表示當(dāng)前候選項(xiàng)在詞庫(kù)或模型中的重要度的所有特征值都是可行的,例如,還可以將當(dāng)前候選項(xiàng)在詞庫(kù)或模型中的得分作為排序特征的特征值等,本發(fā)明實(shí)施例對(duì)于排序特征的具體特征值不加以限制。

在本發(fā)明的一種可選實(shí)施例中,所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型具體可以包括:所述候選項(xiàng)所屬的詞庫(kù)和/或模型,或者,所述候選項(xiàng)和上文所屬的詞庫(kù)和/或模型。上述候選項(xiàng)所屬的詞庫(kù)具體指該候選項(xiàng)在詞庫(kù)中出現(xiàn),上述候選所屬的模型具體指該候選項(xiàng)在模型中出現(xiàn)。例如,對(duì)于候選項(xiàng)“大雪”而言,其所屬的詞庫(kù)具體可以包括:用戶詞庫(kù)、系統(tǒng)詞庫(kù)、細(xì) 胞詞庫(kù)等,其所屬的模型具體可以包括:糾錯(cuò)模型和模糊音模型等;而對(duì)于候選項(xiàng)“大雪”和其上文“漫天“而言,其所屬的詞庫(kù)具體可以包括:系統(tǒng)詞庫(kù)、用戶詞庫(kù),其所屬的模型具體可以包括:糾錯(cuò)模型、模糊音模型和上下文模型等。

在實(shí)際應(yīng)用中,可以依據(jù)上述候選項(xiàng)在詞庫(kù)和/或模型中進(jìn)行查找,以得到上述候選項(xiàng)所屬的詞庫(kù)和/或模型;或者,可以依據(jù)上述候選項(xiàng)及其上文在詞庫(kù)和/或模型中進(jìn)行查找,以得到上述候選項(xiàng)和上文所屬的詞庫(kù)和/或模型,假設(shè)候選項(xiàng)“大雪”的上文為“漫天”,則可以依據(jù)候選項(xiàng)“大雪”和上文“漫天”在詞庫(kù)和/或模型中進(jìn)行查找,具體地,可以將候選項(xiàng)“大雪”和上文“漫天”與詞庫(kù)和/或模型中的字段相匹配,若匹配成功,則可以得到候選項(xiàng)“大雪”和上文“漫天”所屬的詞庫(kù)和/或模型,假設(shè)候選項(xiàng)“大雪”和上文“漫天”與上下文模型中搭配關(guān)系字段“漫天-大雪”匹配成功,則可以得到候選項(xiàng)“大雪”和上文“漫天”所屬的模型為上下文模型。本發(fā)明實(shí)施例對(duì)于確定所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型的具體過(guò)程不加以限制。

本發(fā)明實(shí)施例中,所述排序權(quán)重用于表示排序特征對(duì)于候選項(xiàng)排序的影響權(quán)重,如第一排序特征為候選項(xiàng)對(duì)應(yīng)用戶詞庫(kù)的特征,則第一排序特征表示用戶詞庫(kù)對(duì)于候選項(xiàng)排序的影響權(quán)重。

本發(fā)明實(shí)施例中,由于上述排序權(quán)重是依據(jù)用戶的歷史輸入行為數(shù)據(jù)得到的,因此可以隨著用戶的歷史輸入行為而動(dòng)態(tài)調(diào)整和學(xué)習(xí)成長(zhǎng)。

在本發(fā)明的一種可選實(shí)施例中,所述排序權(quán)重具體可以包括:所述排序特征在用戶的歷史上屏行為數(shù)據(jù)中的上屏分布;和/或,將用戶的歷史輸入行為數(shù)據(jù)作為訓(xùn)練樣本,依據(jù)所述訓(xùn)練樣本和所述訓(xùn)練樣本對(duì)應(yīng)的排序特征的特征值訓(xùn)練得到的排序權(quán)重。

其中,上述上屏分布也即被上屏的某種排序特征對(duì)應(yīng)詞庫(kù)或模型的候選項(xiàng)在用戶上屏的所有上屏內(nèi)容中的上屏占比。例如,當(dāng)前的排序特征向量具體可以包括2個(gè)排序特征,其中,排序特征1與系統(tǒng)詞庫(kù)相應(yīng),排序特征2與用戶詞庫(kù)相應(yīng),用戶輸入當(dāng)前輸入串前,總共產(chǎn)生過(guò)20次上屏內(nèi) 容,該20次上屏內(nèi)容中,系統(tǒng)詞庫(kù)中詞條的上屏次數(shù)為12,用戶詞庫(kù)中詞條的上屏次數(shù)為8,則可以計(jì)算得到排序特征1的排序權(quán)重為0.6,排序特征2的排序權(quán)重為0.4。

本發(fā)明實(shí)施例的排序權(quán)重還可以為依據(jù)歷史行為數(shù)據(jù)對(duì)應(yīng)訓(xùn)練樣本訓(xùn)練得到的排序權(quán)重。在實(shí)際應(yīng)用中,可以將多種排序特征的特征值和一組訓(xùn)練樣本作為排序權(quán)重模型的輸入,將多種排序特征的排序權(quán)重作為排序權(quán)重模型的輸出;其中,訓(xùn)練樣本具體可以包括:歷史輸入串、歷史候選項(xiàng)的排序結(jié)果及歷史上屏內(nèi)容,訓(xùn)練樣本中多種排序特征的排序權(quán)重可以具有初始值,隨著歷史行為數(shù)據(jù)的增加,可以在當(dāng)前值的基礎(chǔ)上對(duì)上述排序權(quán)重進(jìn)行調(diào)整,例如,當(dāng)前訓(xùn)練樣本表明,依據(jù)當(dāng)前排序特征及其排序權(quán)重向用戶提供了排好序的候選項(xiàng),且用戶上屏了某個(gè)詞庫(kù)提供的候選項(xiàng),則上述排序權(quán)重模型可以在當(dāng)前值的基礎(chǔ)上對(duì)該詞庫(kù)對(duì)應(yīng)的排序特征的排序權(quán)重進(jìn)行加權(quán)當(dāng)前值增加預(yù)設(shè)倍數(shù)等,本發(fā)明實(shí)施例對(duì)于具體的加權(quán)過(guò)程不加以限制;從而可以最終訓(xùn)練得到符合用戶的輸入習(xí)慣的排序權(quán)重。需要說(shuō)明的是,可以采用SVM(支持向量機(jī),Support Vector Machine)、神經(jīng)網(wǎng)絡(luò)等進(jìn)行排序權(quán)重模型的訓(xùn)練,本發(fā)明實(shí)施例對(duì)于排序權(quán)重模型的具體訓(xùn)練方法不加以限制。其中,排序權(quán)重在初始時(shí)(第一次訓(xùn)練前)的當(dāng)前值可通過(guò)經(jīng)驗(yàn)方式或者預(yù)設(shè)方式確定,本發(fā)明實(shí)施例對(duì)于排序權(quán)重在初始時(shí)的當(dāng)前值不作具體限制。

步驟104、依據(jù)所述排序特征向量及所述排序權(quán)重向量,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序;

在本發(fā)明的一種可選實(shí)施例中,所述依據(jù)所述排序特征向量及所述排序權(quán)重向量,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序的步驟,具體可以包括:

步驟A1、依據(jù)所述排序特征的特征值和與所述排序特征相對(duì)應(yīng)的排序權(quán)重,得到所述排序特征向量對(duì)應(yīng)候選項(xiàng)的得分;

步驟A2、依據(jù)所述排序特征向量對(duì)應(yīng)候選項(xiàng)的得分,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序。

在本發(fā)明的一種應(yīng)用示例中,上述排序特征向量對(duì)應(yīng)候選項(xiàng)的得分 score的計(jì)算公式可以為:score=排序特征1*排序權(quán)重1+排序特征2*排序權(quán)重2+…+排序特征N*排序權(quán)重N;其中,N代表排序特征向量中排序特征的數(shù)量;在實(shí)際應(yīng)用中,N的值可以與候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型的數(shù)量相應(yīng),例如,候選項(xiàng)“大雪”對(duì)應(yīng)用戶詞庫(kù)、系統(tǒng)詞庫(kù)和上下文模型,則N的值可以為3。

需要說(shuō)明的是,上述步驟A1和步驟A2對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序的過(guò)程只是作為可選實(shí)施例,實(shí)際上本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際應(yīng)用需求,采用對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序的其它過(guò)程,例如,可以依據(jù)用戶的歷史輸入行為數(shù)據(jù)訓(xùn)練排序模型,該排序模型的輸入可以為輸入串和輸入串對(duì)應(yīng)的多個(gè)候選項(xiàng),該排序模型的模型參數(shù)具體可以包括:排序特征組成的排序特征向量、及排序特征的排序權(quán)重組成的排序權(quán)重向量,該排序模型的輸出為多個(gè)候選項(xiàng)的排序結(jié)果(在訓(xùn)練時(shí),可以依據(jù)用戶的上屏信息得到排序結(jié)果),則可以依據(jù)通過(guò)訓(xùn)練得到適配于當(dāng)前歷史輸入行為數(shù)據(jù)的模型參數(shù),并利用上述模型參數(shù)得到多個(gè)候選項(xiàng)的排序結(jié)果??梢岳斫?,本發(fā)明實(shí)施例對(duì)于對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序的具體過(guò)程不加以限制。

步驟105、根據(jù)所述排序結(jié)果將所述多個(gè)候選項(xiàng)進(jìn)行展現(xiàn)。

在實(shí)際應(yīng)用中,將所述多個(gè)候選項(xiàng)進(jìn)行展現(xiàn)的方式具體可以包括多種,例如,以橫排的方式生成展現(xiàn)信息,又如,以豎排的方式生成展現(xiàn)信息等;其中,可以根據(jù)所述排序結(jié)果選擇排序在前的預(yù)定數(shù)量的候選項(xiàng)來(lái)生成橫排或者豎排的展現(xiàn)信息;上述預(yù)定數(shù)量可以為輸入法的一個(gè)顯示頁(yè)面所能夠顯示的最大數(shù)量,如5等,本發(fā)明實(shí)施例對(duì)將所述多個(gè)候選項(xiàng)進(jìn)行展現(xiàn)的具體方式不加以限制。

方法實(shí)施例二

參照?qǐng)D2,示出了本發(fā)明的一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方法實(shí)施例二的步驟流程圖,具體可以包括如下步驟:

步驟201、獲取用戶的輸入串;

步驟202、根據(jù)所述輸入串在詞庫(kù)或者詞庫(kù)和模型中進(jìn)行查詢,以得 到與所述輸入串相匹配的多個(gè)候選項(xiàng);

步驟203、生成所述候選項(xiàng)的排序特征向量和所述排序特征向量對(duì)應(yīng)的排序權(quán)重向量;其中,所述排序特征向量中排序特征可以與所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型相應(yīng),所述排序權(quán)重向量中排序權(quán)重可用于表示依據(jù)用戶的歷史輸入行為數(shù)據(jù)得到的、所述排序特征對(duì)于候選項(xiàng)排序的影響權(quán)重;

步驟204、依據(jù)所述排序特征向量及所述排序權(quán)重向量,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序;

步驟205、根據(jù)所述排序結(jié)果將所述多個(gè)候選項(xiàng)進(jìn)行展現(xiàn);

步驟206、依據(jù)用戶對(duì)于所展現(xiàn)的候選項(xiàng)的上屏行為,對(duì)所述排序特征的特征值和排序權(quán)重進(jìn)行更新。

相對(duì)于方法實(shí)施例一,本實(shí)施例可以依據(jù)用戶的上屏行為,對(duì)所述排序特征的特征值和排序權(quán)重進(jìn)行更新,以使上述排序特征及其排序權(quán)重隨著用戶的歷史輸入行為而動(dòng)態(tài)調(diào)整和學(xué)習(xí)成長(zhǎng)。

本發(fā)明實(shí)施例可以提供對(duì)所述排序特征的特征值和排序權(quán)重進(jìn)行更新的如下更新方案:

更新方案一

更新方案1中,上述對(duì)所述排序特征的特征值和排序權(quán)重進(jìn)行更新的過(guò)程具體可以包括:在所述上屏行為對(duì)應(yīng)候選項(xiàng)的排序特征與用戶詞庫(kù)或用戶模型相應(yīng)時(shí),依據(jù)候選項(xiàng)及其排序特征,更新所述候選項(xiàng)在所述用戶詞庫(kù)或者用戶模型中的屬性參數(shù),并依據(jù)所述候選項(xiàng)的當(dāng)前屬性參數(shù),更新所述排序特征的特征值和排序權(quán)重。

上述屬性參數(shù)具體可以包括:詞頻;例如,上述上屏行為對(duì)應(yīng)的候選為用戶詞庫(kù)中詞條,則可以首先增加該詞條在用戶詞庫(kù)中的詞頻(如加1或其他預(yù)設(shè)值),以得到用戶詞庫(kù)對(duì)應(yīng)排序特征的特征值;然后,依據(jù)該詞條的當(dāng)前詞頻,計(jì)算用戶詞庫(kù)中用戶詞條在用戶的歷史上屏行為數(shù)據(jù)中的上屏分布,以得到用戶詞庫(kù)對(duì)應(yīng)排序特征的排序權(quán)重。需要說(shuō)明的是,上述屬性參數(shù)還可以包括:連接概率、轉(zhuǎn)換概率等,本發(fā)明實(shí)施例對(duì)于具體的 屬性參數(shù)不加以限制。

更新方案二

更新方案二中,在所述上屏行為對(duì)應(yīng)候選項(xiàng)的排序特征與系統(tǒng)詞庫(kù)或系統(tǒng)模型相應(yīng)時(shí),依據(jù)候選項(xiàng)及其排序特征,更新所述候選項(xiàng)在所述系統(tǒng)詞庫(kù)對(duì)應(yīng)的用戶詞庫(kù)或者所述系統(tǒng)模型對(duì)應(yīng)的用戶模型中的屬性參數(shù),并依據(jù)所述候選項(xiàng)的當(dāng)前屬性參數(shù),更新所述排序特征的特征值和排序權(quán)重。

在所述排序特征對(duì)應(yīng)詞庫(kù)或者模型屬于系統(tǒng)詞庫(kù)或者系統(tǒng)模型時(shí),可以更新所述候選項(xiàng)在對(duì)應(yīng)用戶詞庫(kù)或者用戶模型中的屬性參數(shù)。如可以將用戶剛剛上屏的、用戶詞庫(kù)中不存在的詞條更新至用戶詞庫(kù),并將該詞條在用戶詞庫(kù)中的詞頻記為1或其他預(yù)設(shè)值。上述糾錯(cuò)模型、模糊音模型、組詞模型和上下文模型均可以包括對(duì)應(yīng)的用戶模型和系統(tǒng)模型。例如,系統(tǒng)糾錯(cuò)模型和用戶糾錯(cuò)模型,系統(tǒng)模糊音模型和用戶模糊音模型、系統(tǒng)組詞模型和用戶組詞模型、系統(tǒng)上下文模型和用戶上下文模型等。

更新方案三

更新方案三中,上述對(duì)所述排序特征的特征值和排序權(quán)重進(jìn)行更新的過(guò)程具體可以包括:依據(jù)上述上屏行為對(duì)應(yīng)的數(shù)據(jù)更新歷史輸入行為數(shù)據(jù)和排序特征的特征值,并依據(jù)當(dāng)前歷史行為數(shù)據(jù)和當(dāng)前排序特征的特征值訓(xùn)練得到當(dāng)前排序權(quán)重。

更新方案四

更新方案四中,上述對(duì)所述排序特征的特征值和排序權(quán)重進(jìn)行更新的過(guò)程具體可以包括:依據(jù)上述上屏行為對(duì)應(yīng)的數(shù)據(jù)更新歷史輸入行為數(shù)據(jù),并依據(jù)當(dāng)前歷史行為數(shù)據(jù)訓(xùn)練得到當(dāng)前排序特征和當(dāng)前排序權(quán)重。

需要說(shuō)明的是,本發(fā)明實(shí)施例還可以監(jiān)測(cè)上述上屏行為之后的行為,若之后的行為為針對(duì)上屏內(nèi)容的退格行為,則可以在對(duì)應(yīng)詞庫(kù)中降低上述上屏內(nèi)容對(duì)應(yīng)詞條的詞頻(如減1或其他預(yù)設(shè)值)等;若之后的行為為繼續(xù)輸入的行為,則可以執(zhí)行上述步驟206??梢岳斫?,本發(fā)明實(shí)施例對(duì)于上述步驟206的執(zhí)行時(shí)機(jī)和執(zhí)行過(guò)程不加以限制。

為使本領(lǐng)域技術(shù)人員更好地理解本發(fā)明實(shí)施例,以下通過(guò)具體的示例來(lái)說(shuō)明本發(fā)明實(shí)施例的對(duì)輸入法的候選項(xiàng)進(jìn)行排序的過(guò)程。

該示例涉及,當(dāng)前的排序特征向量具體可以包括2個(gè)排序特征,其中,排序特征1與系統(tǒng)詞庫(kù)相應(yīng),排序特征2與用戶詞庫(kù)相應(yīng),排序特征1、排序特征2的特征值分別表示為:候選項(xiàng)在系統(tǒng)詞庫(kù)的系統(tǒng)詞頻、候選項(xiàng)在用戶詞庫(kù)中的用戶詞頻,排序特征1的排序權(quán)重1和排序特征2的排序權(quán)重2分別表示為:排序特征1對(duì)應(yīng)系統(tǒng)詞庫(kù)和排序特征2對(duì)應(yīng)用戶詞庫(kù)在用戶的歷史上屏行為數(shù)據(jù)中的上屏分布;

假設(shè)用戶輸入當(dāng)前輸入串前,總共產(chǎn)生過(guò)20次上屏內(nèi)容,該20次上屏內(nèi)容中系統(tǒng)詞庫(kù)中詞條的上屏次數(shù)為12,用戶詞庫(kù)中詞條的上屏次數(shù)為8,則可以計(jì)算得到排序特征1的排序權(quán)重1為0.6,排序特征2的排序權(quán)重2為0.4;

則在用戶第一次輸入“jiji”輸入串時(shí),假設(shè)此前沒(méi)有上屏過(guò)該輸入串對(duì)應(yīng)的詞條,即輸入法只在系統(tǒng)詞庫(kù)中匹配到了所有候選項(xiàng),這些候選項(xiàng)的得分為排序特征1*排序權(quán)重1,假設(shè)這些候選項(xiàng)從高到低的排序結(jié)果為:“積極”、“幾級(jí)”、“記記”(這三個(gè)候選的系統(tǒng)詞頻依次為“10”、“4”、“3”,利用系統(tǒng)詞頻和排序權(quán)重0.6計(jì)算得到的得分依次為“6”、“2.4”、“1.8”);假設(shè)用戶上屏了“記記”這個(gè)候選項(xiàng),則輸入法可以在接收到上屏行為后更新排序特征的特征值和排序權(quán)重,即將“記記”學(xué)到用戶詞庫(kù)中并更新其用戶詞頻為“1”,使得“記記”對(duì)應(yīng)排序特征2的特征值變?yōu)?,由于用戶此次上屏的候選為系統(tǒng)詞庫(kù)的詞條,因此,系統(tǒng)詞庫(kù)中詞條的上屏次數(shù)增加一次,為13次,并將排序權(quán)重1更新為(12+1)/21=0.62,將排序權(quán)重2更新為8/21=0.38;

在用戶第二次輸入“jiji”這個(gè)輸入串時(shí),就會(huì)匹配到系統(tǒng)詞庫(kù)中的詞條以及用戶詞庫(kù)中的詞條(“記記”),假設(shè)候選項(xiàng)的得分為排序特征1*排序權(quán)重1+排序特征2*排序權(quán)重2,假設(shè)這些候選項(xiàng)從高到低的排序結(jié)果為“積極”,“幾級(jí)”,“記記”(這三個(gè)候選項(xiàng)得分為“6.2”, “2.48”,“2.24(3*0.62+1*0.38)”);此時(shí)用戶又一次上屏了“記記”這個(gè)候選項(xiàng),則輸入法可以在接收到上屏行為后更新排序特征的特征值和排序權(quán)重,將排序權(quán)重1更新為13/22=0.59,將排序權(quán)重2更新為9/22=0.41,并將“記記”在用戶詞庫(kù)中的用戶詞頻更新為“2”;

在用戶第三次輸入“jiji”這個(gè)輸入串時(shí),將匹配到系統(tǒng)詞庫(kù)中的詞條以及用戶詞庫(kù)中的詞條,假設(shè)候選項(xiàng)的得分為排序特征1*排序權(quán)重1+排序特征2*排序權(quán)重2,假設(shè)這些候選項(xiàng)從高到低的排序結(jié)果為“積極”,“記記”,“幾級(jí)”(三個(gè)候選項(xiàng)的得分分別為“5.9”,“2.59(3*0.59+2*0.41)”,“2.36”);可以看到隨著用戶的歷史輸入行為數(shù)據(jù)的增多,原先較低頻的詞條“記記”慢慢地上升為二選,但依舊沒(méi)有越到原先較高頻的詞條“積極”的前面。

傳統(tǒng)的排序技術(shù)通常一律地將用戶詞條固定排在其他詞庫(kù)的詞條的前面,則在用戶第一次選擇上屏“記記”這個(gè)詞條后,第二次輸入“jiji”時(shí),用戶詞條“記記”就會(huì)被排在首位,即排在其他系統(tǒng)詞條(包括較高頻的“積極”)的前面;然而,對(duì)于一個(gè)用戶僅使用過(guò)1次的詞條(比如“記記”),其不一定比同音下高頻的系統(tǒng)詞條更合理、更符合用戶的輸入意圖。

而本發(fā)明實(shí)施例依據(jù)排序特征組成的排序特征向量、及排序特征向量對(duì)應(yīng)的排序權(quán)重向量對(duì)多個(gè)候選項(xiàng)進(jìn)行排序;由于上述排序權(quán)重為依據(jù)用戶的歷史輸入行為數(shù)據(jù)得到,與上述排序特征相匹配的詞庫(kù)和/或模型也會(huì)隨著用戶的歷史輸入行為而動(dòng)態(tài)調(diào)整,因此,本發(fā)明實(shí)施例能夠使得候選項(xiàng)的排序結(jié)果更加柔和地發(fā)生變化,使用戶經(jīng)常上屏的詞條隨著用戶輸入歷史慢慢地上升到首選位置,這相對(duì)于傳統(tǒng)的排序技術(shù)在一次上屏后就固定排到其他詞條之前,解決了候選項(xiàng)排序過(guò)程的自適應(yīng)調(diào)整問(wèn)題,因此,能夠使得輸入法提供的排序結(jié)果將越來(lái)越貼合于用戶的輸入習(xí)慣,且提供的排序結(jié)果將越來(lái)越符合用戶的輸入意圖,從而便于用戶快速選擇其所需的候選項(xiàng),提高用戶的輸入速度。

需要說(shuō)明的是,對(duì)于方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一 系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實(shí)施例并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明實(shí)施例,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作并不一定是本發(fā)明實(shí)施例所必須的。

裝置實(shí)施例

參照?qǐng)D3,示出了本發(fā)明的一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的裝置實(shí)施例的結(jié)構(gòu)框圖,具體可以包括如下模塊:

獲取模塊301,用于獲取用戶的輸入串;

查詢模塊302,用于根據(jù)所述輸入串在詞庫(kù)或者詞庫(kù)和模型中進(jìn)行查詢,以得到與所述輸入串相匹配的多個(gè)候選項(xiàng);

生成模塊303,用于生成所述候選項(xiàng)的排序特征向量和所述排序特征向量對(duì)應(yīng)的排序權(quán)重向量;其中,所述排序特征向量中排序特征可以與所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型相應(yīng),所述排序權(quán)重向量中排序權(quán)重可以用于表示依據(jù)用戶的歷史輸入行為數(shù)據(jù)得到的、所述排序特征對(duì)于候選項(xiàng)排序的影響權(quán)重;

排序模塊304,用于依據(jù)所述排序特征向量及所述排序權(quán)重向量,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序;及

展現(xiàn)模塊305,用于根據(jù)所述排序結(jié)果將所述多個(gè)候選項(xiàng)進(jìn)行展現(xiàn)。

在本發(fā)明的一種可選實(shí)施例中,所述排序模塊304,具體可以包括:

得分計(jì)算子模塊,用于依據(jù)所述排序特征的特征值和與所述排序特征相對(duì)應(yīng)的排序權(quán)重,得到所述排序特征向量對(duì)應(yīng)候選項(xiàng)的得分;及

排序子模塊,用于依據(jù)所述排序特征向量對(duì)應(yīng)候選項(xiàng)的得分,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序。

在本發(fā)明的另一種可選實(shí)施例中,所述排序權(quán)重具體可以包括:

所述排序特征在用戶的歷史上屏行為數(shù)據(jù)中的上屏分布;和/或

將用戶的歷史輸入行為數(shù)據(jù)作為訓(xùn)練樣本,依據(jù)所述訓(xùn)練樣本和所述 訓(xùn)練樣本對(duì)應(yīng)的排序特征的特征值訓(xùn)練得到的排序權(quán)重。

在本發(fā)明的再一種可選實(shí)施例中,所述排序特征的特征值具體可以包括:所述候選項(xiàng)在對(duì)應(yīng)的詞庫(kù)或模型中的詞頻,和/或,所述候選項(xiàng)在對(duì)應(yīng)的詞庫(kù)或模型中的概率,和/或,所述候選項(xiàng)在對(duì)應(yīng)的詞庫(kù)或模型中的概率的對(duì)數(shù)。

在本發(fā)明的又一種可選實(shí)施例中,所述詞庫(kù)或者模型用于描述與所述候選項(xiàng)相關(guān)的兩個(gè)及兩個(gè)以上元素之間的轉(zhuǎn)換概率,則所述排序特征的特征值具體可以包括:所述轉(zhuǎn)換概率,和/或,所述轉(zhuǎn)換概率的對(duì)數(shù)。

在本發(fā)明的一種可選實(shí)施例中,所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型具體可以包括:所述候選項(xiàng)所屬的詞庫(kù)和/或模型,或者,所述候選項(xiàng)和上文所屬的詞庫(kù)和/或模型;

所述詞庫(kù)具體可以包括:系統(tǒng)詞庫(kù)、用戶詞庫(kù)、細(xì)胞詞庫(kù)中的至少一種;

所述模型具體可以包括:糾錯(cuò)模型、模糊音模型、組詞模型、上下文模型中的至少一種。

在本發(fā)明的另一種可選實(shí)施例中,所述裝置還可以包括:

更新模塊,用于依據(jù)用戶對(duì)于所展現(xiàn)的候選項(xiàng)的上屏行為,對(duì)所述排序特征的特征值和排序權(quán)重進(jìn)行更新。

在本發(fā)明的再一種可選實(shí)施例中,所述更新模塊,具體可以包括:

第一更新子模塊,用于在所述上屏行為對(duì)應(yīng)候選項(xiàng)的排序特征與用戶詞庫(kù)或用戶模型相應(yīng)時(shí),依據(jù)候選項(xiàng)及其排序特征,更新所述候選項(xiàng)在所述用戶詞庫(kù)或者用戶模型中的屬性參數(shù),并依據(jù)所述候選項(xiàng)的當(dāng)前屬性參數(shù),更新所述排序特征的特征值和排序權(quán)重;或者

第二更新子模塊,用于在所述上屏行為對(duì)應(yīng)候選項(xiàng)的排序特征與系統(tǒng)詞庫(kù)或系統(tǒng)模型相應(yīng)時(shí),依據(jù)候選項(xiàng)及其排序特征,更新所述候選項(xiàng)在所述系統(tǒng)詞庫(kù)對(duì)應(yīng)的用戶詞庫(kù)或者所述系統(tǒng)模型對(duì)應(yīng)的用戶模型中的屬性參數(shù),并依據(jù)所述候選項(xiàng)的當(dāng)前屬性參數(shù),更新所述排序特征的特征值和排序權(quán)重;或者

第三更新子模塊,用于依據(jù)所述上屏行為對(duì)應(yīng)的數(shù)據(jù)更新歷史輸入行為數(shù)據(jù)和排序特征的特征值,并依據(jù)當(dāng)前歷史行為數(shù)據(jù)和當(dāng)前排序特征的特征值訓(xùn)練得到當(dāng)前排序權(quán)重;或者

第四更新子模塊,用于依據(jù)所述上屏行為對(duì)應(yīng)的數(shù)據(jù)更新歷史輸入行為數(shù)據(jù),并依據(jù)當(dāng)前歷史行為數(shù)據(jù)訓(xùn)練得到當(dāng)前排序特征和當(dāng)前排序權(quán)重。

對(duì)于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。

本說(shuō)明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可。

關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說(shuō)明。

圖4是根據(jù)一示例性實(shí)施例示出的一種用于對(duì)輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的裝置800的框圖。例如,裝置800可以是移動(dòng)電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等。

參照?qǐng)D4,裝置800可以包括以下一個(gè)或多個(gè)組件:處理組件802,存儲(chǔ)器804,電源組件806,多媒體組件808,音頻組件810,輸入/輸出(I/O)的接口812,傳感器組件814,以及通信組件816。

處理組件802通常控制裝置800的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理元件802可以包括一個(gè)或多個(gè)處理器820來(lái)執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件802可以包括一個(gè)或多個(gè)模塊,便于處理組件802和其他組件之間的交互。例如,處理部件802可以包括多媒體模塊,以方便多媒體組件808和處理組件802之間的交互。

存儲(chǔ)器804被配置為存儲(chǔ)各種類型的數(shù)據(jù)以支持在設(shè)備800的操作。這些數(shù)據(jù)的示例包括用于在裝置800上操作的任何應(yīng)用程序或方法的指令,聯(lián) 系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲(chǔ)器804可以由任何類型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),電可擦除可編程只讀存儲(chǔ)器(EEPROM),可擦除可編程只讀存儲(chǔ)器(EPROM),可編程只讀存儲(chǔ)器(PROM),只讀存儲(chǔ)器(ROM),磁存儲(chǔ)器,快閃存儲(chǔ)器,磁盤或光盤。

電力組件806為裝置800的各種組件提供電力。電力組件806可以包括電源管理系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置800生成、管理和分配電力相關(guān)聯(lián)的組件。

多媒體組件808包括在所述裝置800和用戶之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來(lái)自用戶的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測(cè)觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測(cè)觸摸或滑動(dòng)動(dòng)作的邊界,而且還檢測(cè)與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多媒體組件808包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)設(shè)備800處于操作模式,如拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。

音頻組件810被配置為輸出和/或輸入音頻信號(hào)。例如,音頻組件810包括一個(gè)麥克風(fēng)(MIC),當(dāng)裝置800處于操作模式,如呼叫模式、記錄模式和語(yǔ)音識(shí)別模式時(shí),麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器804或經(jīng)由通信組件816發(fā)送。在一些實(shí)施例中,音頻組件810還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號(hào)。

I/O接口812為處理組件802和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁(yè)按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。

傳感器組件814包括一個(gè)或多個(gè)傳感器,用于為裝置800提供各個(gè)方面的狀態(tài)評(píng)估。例如,傳感器組件814可以檢測(cè)到設(shè)備800的打開(kāi)/關(guān)閉狀態(tài),組件的相對(duì)定位,例如所述組件為裝置800的顯示器和小鍵盤,傳感器組件 814還可以檢測(cè)裝置800或裝置800一個(gè)組件的位置改變,用戶與裝置800接觸的存在或不存在,裝置800方位或加速/減速和裝置800的溫度變化。傳感器組件814可以包括接近傳感器,被配置用來(lái)在沒(méi)有任何的物理接觸時(shí)檢測(cè)附近物體的存在。傳感器組件814還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件814還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。

通信組件816被配置為便于裝置800和其他設(shè)備之間有線或無(wú)線方式的通信。裝置800可以接入基于通信標(biāo)準(zhǔn)的無(wú)線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個(gè)示例性實(shí)施例中,通信部件816經(jīng)由廣播信道接收來(lái)自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信部件816還包括近場(chǎng)通信(NFC)模塊,以促進(jìn)短程通信。例如,在NFC模塊可基于射頻識(shí)別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(huì)(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來(lái)實(shí)現(xiàn)。

在示例性實(shí)施例中,裝置800可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。

在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如包括指令的存儲(chǔ)器804,上述指令可由裝置800的處理器820執(zhí)行以完成上述方法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是ROM、隨機(jī)存取存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲(chǔ)設(shè)備等。

一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由移動(dòng)終端的處理器執(zhí)行時(shí),使得移動(dòng)終端能夠執(zhí)行一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方法,所述方法包括:獲取用戶的輸入串;根據(jù)所述輸入串在詞庫(kù)或者詞庫(kù)和模型中進(jìn)行查詢,以得到與所述輸入串相匹配的多個(gè)候選項(xiàng);生成所述候選項(xiàng)的排序特征向量和所述排序特征向量對(duì)應(yīng)的排序權(quán)重向量;其中,所述排序特征向量中排序特征與所述候選項(xiàng)對(duì)應(yīng)的詞庫(kù)和/或模型相應(yīng),所述排序權(quán)重向量中排序權(quán)重用于表示依據(jù)用戶的歷史輸入行為 數(shù)據(jù)得到的、所述排序特征對(duì)于候選項(xiàng)排序的影響權(quán)重;依據(jù)所述排序特征向量及所述排序權(quán)重向量,對(duì)所述多個(gè)候選項(xiàng)進(jìn)行排序;根據(jù)所述排序結(jié)果將所述多個(gè)候選項(xiàng)進(jìn)行展現(xiàn)。

圖5是本發(fā)明實(shí)施例中服務(wù)器的結(jié)構(gòu)示意圖。該服務(wù)器1900可因配置或性能不同而產(chǎn)生比較大的差異,可以包括一個(gè)或一個(gè)以上中央處理器(central processing units,CPU)1922(例如,一個(gè)或一個(gè)以上處理器)和存儲(chǔ)器1932,一個(gè)或一個(gè)以上存儲(chǔ)應(yīng)用程序1942或數(shù)據(jù)1944的存儲(chǔ)介質(zhì)1930(例如一個(gè)或一個(gè)以上海量存儲(chǔ)設(shè)備)。其中,存儲(chǔ)器1932和存儲(chǔ)介質(zhì)1930可以是短暫存儲(chǔ)或持久存儲(chǔ)。存儲(chǔ)在存儲(chǔ)介質(zhì)1930的程序可以包括一個(gè)或一個(gè)以上模塊(圖示沒(méi)標(biāo)出),每個(gè)模塊可以包括對(duì)服務(wù)器中的一系列指令操作。更進(jìn)一步地,中央處理器1922可以設(shè)置為與存儲(chǔ)介質(zhì)1930通信,在服務(wù)器1900上執(zhí)行存儲(chǔ)介質(zhì)1930中的一系列指令操作。

服務(wù)器1900還可以包括一個(gè)或一個(gè)以上電源1926,一個(gè)或一個(gè)以上有線或無(wú)線網(wǎng)絡(luò)接口1950,一個(gè)或一個(gè)以上輸入輸出接口1958,一個(gè)或一個(gè)以上鍵盤1956,和/或,一個(gè)或一個(gè)以上操作系統(tǒng)1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,F(xiàn)reeBSDTM等等。

本領(lǐng)域技術(shù)人員在考慮說(shuō)明書及實(shí)踐這里公開(kāi)的發(fā)明后,將容易想到本發(fā)明的其它實(shí)施方案。本發(fā)明旨在涵蓋本發(fā)明的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本發(fā)明的一般性原理并包括本公開(kāi)未公開(kāi)的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說(shuō)明書和實(shí)施例僅被視為示例性的,本發(fā)明的真正范圍和精神由下面的權(quán)利要求指出。

應(yīng)當(dāng)理解的是,本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本發(fā)明的范圍僅由所附的權(quán)利要求來(lái)限制

以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

以上對(duì)本發(fā)明所提供的一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的方法、一種對(duì)輸入法的候選項(xiàng)進(jìn)行排序的裝置和一種用于對(duì)輸入法的候選項(xiàng)進(jìn)行排序的 裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1