一種對(duì)輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置制造方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種對(duì)輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置。其中,對(duì)輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法包括:利用輸入法接收當(dāng)前用戶(hù)的當(dāng)前輸入信息;根據(jù)已經(jīng)建立的與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型,獲取當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型;按照每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與已獲得的當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)進(jìn)行排序;展示進(jìn)行排序后的候選項(xiàng)。通過(guò)上述方式,本發(fā)明能夠針對(duì)不同類(lèi)型的用戶(hù)輸入相同的字符時(shí),對(duì)不同類(lèi)型的用戶(hù)推送不同排序的候選項(xiàng),減少用戶(hù)選擇候選所花費(fèi)的時(shí)間,提升用戶(hù)體驗(yàn)。
【專(zhuān)利說(shuō)明】一種對(duì)輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及輸入法領(lǐng)域,特別是涉及一種對(duì)輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置。
【背景技術(shù)】
[0002]輸入法是指為了將各種符號(hào)輸入計(jì)算機(jī)或其他設(shè)備(如手機(jī))而采用的編碼方法。
[0003]利用輸入法進(jìn)行輸入時(shí),通常通過(guò)向設(shè)備發(fā)送各種字符以獲取字符對(duì)應(yīng)的候選項(xiàng),并選擇相應(yīng)的候選項(xiàng)來(lái)完成輸入。而對(duì)于輸入的相同讀音的字符時(shí),獲取得到的字符對(duì)應(yīng)的候選項(xiàng)的集合中各候選項(xiàng)的排序通常都是一樣的。對(duì)于假名< ”,這個(gè)讀音所對(duì)應(yīng)的日文漢字包括“価格、科學(xué)、化學(xué)、歌學(xué)、花岳”等眾多候選,向用戶(hù)推送的候選基本是一樣的,或者是只按照候選項(xiàng)在大規(guī)模語(yǔ)料中出現(xiàn)的頻次來(lái)排序。
[0004]但是,本申請(qǐng)的發(fā)明人在長(zhǎng)期的研發(fā)中發(fā)現(xiàn),不同的類(lèi)型的用戶(hù)對(duì)于同一個(gè)字符對(duì)應(yīng)的候選項(xiàng)的排序要求也是不一樣的。向所有的用戶(hù)推送相同排序的候選項(xiàng),大部分用戶(hù)通常浪費(fèi)大量的時(shí)間以選擇需要的候選項(xiàng),這樣也降低了用戶(hù)體驗(yàn)。
【發(fā)明內(nèi)容】
[0005]本發(fā)明主要解決的技術(shù)問(wèn)題是提供一種對(duì)候選項(xiàng)的排序方法及裝置,能夠針對(duì)不同類(lèi)型的用戶(hù)輸入相同的字符時(shí),對(duì)不同類(lèi)型的用戶(hù)推送不同排序的候選項(xiàng),減少用戶(hù)選擇候選所花費(fèi)的時(shí)間,提升用戶(hù)體驗(yàn)。
[0006]為解決上述技術(shù)問(wèn)題,本發(fā)明采用的一個(gè)技術(shù)方案是:提供一種對(duì)輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法,包括:利用所述輸入法接收當(dāng)前用戶(hù)的當(dāng)前輸入信息;根據(jù)已經(jīng)建立的與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型,獲取所述當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型;按照所述每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與已獲得的所述當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,對(duì)所述當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)進(jìn)行排序;展示進(jìn)行所述排序后的候選項(xiàng)。
[0007]其中,所述根據(jù)已經(jīng)建立的與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型,獲取所述當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型的步驟之前,還包括:使用文本分類(lèi)技術(shù),對(duì)多個(gè)用戶(hù)歷史輸入信息進(jìn)行分類(lèi)整理,獲得G個(gè)不同的用戶(hù)類(lèi)型和G類(lèi)不同的與用戶(hù)類(lèi)型相關(guān)的語(yǔ)料;將所述G類(lèi)不同的與所述用戶(hù)類(lèi)型相關(guān)的語(yǔ)料,分別按照各自所屬的用戶(hù)類(lèi)型訓(xùn)練得到與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型。
[0008]其中,按照所述每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與已獲得的所述當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)進(jìn)行排序的步驟之前,還包括:獲取當(dāng)前用戶(hù)的歷史輸入信息;根據(jù)所述當(dāng)前用戶(hù)的歷史輸入信息,用已經(jīng)建立的所述與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型對(duì)當(dāng)前用戶(hù)進(jìn)行分類(lèi),得到當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合。
[0009]其中,所述按照每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與已獲得的所述當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)進(jìn)行排序的步驟之前,還包括:獲取多個(gè)用戶(hù)的歷史輸入信息,所述多個(gè)用戶(hù)屬于所述G個(gè)不同的用戶(hù)類(lèi)型;從所述獲取的多個(gè)用戶(hù)的歷史輸入信息中選取部分歷史輸入信息;對(duì)所述選取的部分歷史輸入信息進(jìn)行標(biāo)注,獲得多個(gè)用戶(hù)標(biāo)注的訓(xùn)練語(yǔ)料;將所述多個(gè)用戶(hù)標(biāo)注的訓(xùn)練語(yǔ)料和所述G個(gè)不同的用戶(hù)類(lèi)型,用教師指導(dǎo)的機(jī)器學(xué)習(xí)方法分別按照各自的用戶(hù)類(lèi)型訓(xùn)練出與用戶(hù)類(lèi)型相關(guān)的用戶(hù)分類(lèi)器;根據(jù)當(dāng)前用戶(hù)的歷史輸入信息,用所述與用戶(hù)類(lèi)型相關(guān)的用戶(hù)分類(lèi)器對(duì)當(dāng)前用戶(hù)進(jìn)行分類(lèi),獲得當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合。
[0010]其中,所述歷史輸入信息包括在輸入法應(yīng)用中的歷史輸入信息、在即時(shí)通信工具中的歷史輸入信息以及在社交網(wǎng)站中的歷史輸入信息中的任意一種或兩種以上歷史輸入信息。
[0011]其中,所述按照每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與已獲得的所述當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)進(jìn)行排序的步驟包括:根據(jù)每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與所述當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,獲取當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值;根據(jù)所述候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值的大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中的候選項(xiàng)進(jìn)行排序。
[0012]其中,所述根據(jù)每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與所屬當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,獲取當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值的步驟包括:獲取m個(gè)用戶(hù)Ul、u2、…、um在輸入所述當(dāng)前用戶(hù)當(dāng)前輸入信息的情況下,對(duì)同一個(gè)候選項(xiàng)Ci的選擇次數(shù)Sl、S2,…、Sm,其中,m個(gè)用戶(hù)屬于G個(gè)不同的用戶(hù)類(lèi)型;在G個(gè)不同的用戶(hù)類(lèi)型中,獲取所述候選項(xiàng)Ci在用戶(hù)類(lèi)型g中的權(quán)值weight (Ci, g),即:
【權(quán)利要求】
1.一種對(duì)輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法,其特征在于,包括: 利用所述輸入法接收當(dāng)前用戶(hù)的當(dāng)前輸入信息; 根據(jù)已經(jīng)建立的與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型,獲取所述當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型; 按照所述每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與已獲得的所述當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,對(duì)所述當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)進(jìn)行排序; 展示進(jìn)行所述排序后的候選項(xiàng)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)已經(jīng)建立的與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型,獲取當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型的步驟之前,還包括: 使用文本分類(lèi)技術(shù),對(duì)多個(gè)用戶(hù)歷史輸入信息進(jìn)行分類(lèi)整理,獲得G個(gè)不同的用戶(hù)類(lèi)型和G類(lèi)不同的與用戶(hù)類(lèi)型相關(guān)的語(yǔ)料; 將所述G類(lèi)不同的與所述用戶(hù)類(lèi)型相關(guān)的語(yǔ)料,分別按照各自所屬的用戶(hù)類(lèi)型訓(xùn)練得到與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,按照所述每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與已獲得的所述當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)進(jìn)行排序的步驟之前,還包括: 獲取當(dāng)前用戶(hù)的歷史輸入信息; 根據(jù)所述當(dāng)前用戶(hù)的歷史輸入信息,用已經(jīng)建立的所述與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型對(duì)當(dāng)前用戶(hù)進(jìn)行分類(lèi),得到當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述按照所述每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與已獲得的所述當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)進(jìn)行排序的步驟之前,還包括: 獲取多個(gè)用戶(hù)的歷史輸入信息,所述多個(gè)用戶(hù)屬于所述G個(gè)不同的用戶(hù)類(lèi)型; 從所述獲取的多個(gè)用戶(hù)的歷史輸入信息中選取部分歷史輸入信息; 對(duì)所述選取的部分歷史輸入信息進(jìn)行標(biāo)注,獲得多個(gè)用戶(hù)標(biāo)注的訓(xùn)練語(yǔ)料; 將所述多個(gè)用戶(hù)標(biāo)注的訓(xùn)練語(yǔ)料和所述G個(gè)不同的用戶(hù)類(lèi)型,用教師指導(dǎo)的機(jī)器學(xué)習(xí)方法分別按照各自的用戶(hù)類(lèi)型訓(xùn)練出與用戶(hù)類(lèi)型相關(guān)的用戶(hù)分類(lèi)器; 根據(jù)當(dāng)前用戶(hù)的歷史輸入信息,用所述與用戶(hù)類(lèi)型相關(guān)的用戶(hù)分類(lèi)器對(duì)當(dāng)前用戶(hù)進(jìn)行分類(lèi),獲得當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合。
5.根據(jù)權(quán)利要求3-5任一項(xiàng)所述的方法,其特征在于,所述歷史輸入信息包括在輸入法應(yīng)用中的歷史輸入信息、在即時(shí)通信工具中的歷史輸入信息以及在社交網(wǎng)站中的歷史輸入信息中的任意一種或兩種以上歷史輸入信息。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照所述每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與已獲得的所述當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)進(jìn)行排序的步驟包括: 根據(jù)每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與所述當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,獲取當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值; 根據(jù)所述候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值的大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中的候選項(xiàng)進(jìn)行排序。
7.根據(jù)權(quán)利要求6所述方法,其特征在于,所述根據(jù)每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與所屬當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,獲取當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值的步驟包括: 獲取m個(gè)用戶(hù)UpU2'…、Um在輸入所述當(dāng)前用戶(hù)當(dāng)前輸入信息的情況下,對(duì)同一個(gè)候選項(xiàng)Ci的選擇次數(shù)Sl、S2,…、Sm,其中,m個(gè)用戶(hù)屬于G個(gè)不同的用戶(hù)類(lèi)型; 在G個(gè)不同的用戶(hù)類(lèi)型中,獲取所述候選項(xiàng)Ci在用戶(hù)類(lèi)型g中的權(quán)值weight (Ci, g),即:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述根據(jù)候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值的大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中的候選項(xiàng)進(jìn)行排序的步驟之后,還包括: 根據(jù)所述候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值的大小,判斷候選項(xiàng)集合中是否有高頻熱詞或新詞。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述根據(jù)候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值大小,判斷候選項(xiàng)集合中是否有高頻熱詞的步驟包括: 若候選項(xiàng)集合中候選項(xiàng)的連續(xù)預(yù)定次迭代產(chǎn)生的所述權(quán)值均大于預(yù)設(shè)的高頻熱詞的閾值,則確定所述候選項(xiàng)為高頻熱詞。
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述根據(jù)候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值大小,判斷候選項(xiàng)集合中是否有新詞的步驟包括: 若候選項(xiàng)集合中候選項(xiàng)當(dāng)前迭代所產(chǎn)生的所述權(quán)值與前一次迭代所產(chǎn)生的所述權(quán)值相比的變化量大于預(yù)設(shè)的新詞的閾值,則確定所述候選項(xiàng)為新詞。
11.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述判斷候選項(xiàng)集合是否有高頻熱詞或新詞的步驟之后,還包括: 若候選項(xiàng)集合中有高頻熱詞或新詞時(shí),向所述高頻熱詞或新詞所屬的用戶(hù)類(lèi)型的用戶(hù)推送所述高頻熱詞或新詞對(duì)應(yīng)的鏈接。
12.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述展示進(jìn)行排序后的候選項(xiàng)的步驟包括: 展示進(jìn)行排序后的候選項(xiàng)以及候選項(xiàng)的新詞或高頻熱詞的標(biāo)識(shí)。
13.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述展示進(jìn)行排序后的候選項(xiàng)的步驟之后,還包括: 根據(jù)當(dāng)前用戶(hù)的切換指令,按照所述選擇次數(shù)S1、S2,…、Sffl的求和結(jié)果對(duì)所述候選項(xiàng)進(jìn)行排序; 展示按所述求和結(jié)果進(jìn)行排序的候選項(xiàng)以及所述求和結(jié)果。
14.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,所述語(yǔ)言模型是n-Gram語(yǔ)言模型或n-Pos語(yǔ)言模型。
15.一種對(duì)輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的裝置,其特征在于,包括接收模塊、第一獲取模塊、第一排序模塊以及展示模塊,其中: 所述接收模塊用于利用所述輸入法接收當(dāng)前用戶(hù)的當(dāng)前輸入信息,并將所述當(dāng)前用戶(hù)的當(dāng)前輸入信息發(fā)送給所述第一獲取模塊; 所述第一獲取模塊用于根據(jù)已經(jīng)建立的與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型,獲取當(dāng)前用戶(hù)的當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型,并將所述當(dāng)前用戶(hù)的當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型發(fā)送給所述第一排序模塊,其中,G是自然數(shù);` 所述第一排序模塊用于按照所述每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與已獲得的當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)進(jìn)行排序,并將排序后的候選項(xiàng)發(fā)送給所述展示模塊; 所述展示模塊用于展示來(lái)自所述第一排序模塊的進(jìn)行所述排序后的候選項(xiàng)。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述裝置還包括網(wǎng)頁(yè)語(yǔ)料模塊和第一訓(xùn)練模塊,其中: 所述網(wǎng)頁(yè)語(yǔ)料模塊用于使用文本分類(lèi)技術(shù),對(duì)多個(gè)用戶(hù)歷史輸入信息進(jìn)行分類(lèi)整理,獲得G個(gè)不同的用戶(hù)類(lèi)型和G類(lèi)不同的與用戶(hù)類(lèi)型相關(guān)的語(yǔ)料,并將所述獲得的G個(gè)不同的用戶(hù)類(lèi)型和G類(lèi)不同的與用戶(hù)類(lèi)型相關(guān)的語(yǔ)料發(fā)送給所述第一訓(xùn)練模塊; 所述第一訓(xùn)練模塊用于將所述G類(lèi)不同的與用戶(hù)類(lèi)型相關(guān)的語(yǔ)料,分別按照各自所屬的用戶(hù)類(lèi)型訓(xùn)練得到與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型。
17.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述裝置還包括歷史輸入信息模塊以及第二獲取模塊,其中: 所述歷史輸入信息模塊用于獲取當(dāng)前用戶(hù)的歷史輸入信息,并將所述當(dāng)前用戶(hù)的歷史輸入信息輸出給所述第二獲取模塊; 所述第二獲取模塊用于根據(jù)所述當(dāng)前用戶(hù)的歷史輸入信息,用已經(jīng)建立的所述與用戶(hù)類(lèi)型相關(guān)的G個(gè)不同的語(yǔ)言模型對(duì)當(dāng)前用戶(hù)進(jìn)行分類(lèi),得到當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集入口 ο
18.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述裝置還包括第三獲取模塊、選取模塊、標(biāo)注模塊、第二訓(xùn)練模塊以及分類(lèi)模塊,其中:所述第三獲取模塊用于獲取多個(gè)用戶(hù)的歷史輸入信息,并將所述多個(gè)用戶(hù)的歷史輸入信息發(fā)送給所述選取模塊; 所述選取模塊用于從所述獲取的多個(gè)用戶(hù)的歷史輸入信息中選取部分歷史輸入信息,并將所述選取的部分歷史輸入信息發(fā)送給所述標(biāo)注模塊; 所述標(biāo)注模塊用于對(duì)所述選取的部分歷史輸入信息進(jìn)行標(biāo)注,獲得多個(gè)用戶(hù)標(biāo)注的訓(xùn)練語(yǔ)料,將所述獲得的多個(gè)用戶(hù)標(biāo)注的訓(xùn)練語(yǔ)料發(fā)送給所述第二訓(xùn)練模塊; 所述第二訓(xùn)練模塊用于將所述多個(gè)用戶(hù)標(biāo)注的訓(xùn)練語(yǔ)料和所述G個(gè)不同的用戶(hù)類(lèi)型,用教師指導(dǎo)的機(jī)器學(xué)習(xí)方法分別按照各自的用戶(hù)類(lèi)型訓(xùn)練出與用戶(hù)類(lèi)型相關(guān)的用戶(hù)分類(lèi)器; 所述分類(lèi)模塊用于根據(jù)當(dāng)前用戶(hù)的歷史輸入信息,用所述第二訓(xùn)練模塊得到的所述與用戶(hù)類(lèi)型相關(guān)的用戶(hù)分類(lèi)器對(duì)當(dāng)前用戶(hù)進(jìn)行分類(lèi),獲得當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合。
19.根據(jù)權(quán)利要求16-18任一項(xiàng)所述的裝置,其特征在于,所述歷史輸入信息包括在輸入法應(yīng)用中的歷史輸入信息、在即時(shí)通信工具中的歷史輸入信息以及在社交網(wǎng)站中的歷史輸入信息中的任意一種或兩種以上歷史輸入信息。
20.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述第一排序模塊包括權(quán)值獲取單元以及排序單元: 所述權(quán)值獲取單元用于根據(jù)每個(gè)候選項(xiàng)所屬的用戶(hù)類(lèi)型與所述當(dāng)前用戶(hù)所屬的用戶(hù)類(lèi)型集合中的用戶(hù)類(lèi)型的相關(guān)性大小,獲取當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值,并將所述候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值發(fā)送給排序單元; 所述排序單元用于根據(jù)來(lái)自所述權(quán)值獲取單元的所述候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值的大小,對(duì)當(dāng)前用戶(hù)當(dāng)前輸入信息的候選項(xiàng)集合中的候選項(xiàng)進(jìn)行排序。
21.根據(jù)權(quán)利要求20所述的裝置,其特征在于,所述權(quán)值獲取單元包括第一獲取子單元、第二獲取子單元、第三獲取子單元以及第四獲取子單元,其中: 所述第一獲取子單元用于獲取m個(gè)用戶(hù)u1、u2、…、um在輸入所述當(dāng)前用戶(hù)當(dāng)前輸入信息的情況下,對(duì)同一個(gè)候選項(xiàng)Ci的選擇次數(shù)Sp S2>…、Sm,其中,m個(gè)用戶(hù)屬于G個(gè)不同的用戶(hù)類(lèi)型; 所述第二獲取子單元用于在G個(gè)不同的用戶(hù)類(lèi)型中,獲取所述候選項(xiàng)Ci在用戶(hù)類(lèi)型g中的權(quán)值weight (Ci, g),即:
22.根據(jù)權(quán)利要求21所述的裝置,其特征在于,還包括判斷模塊,用于根據(jù)所述候選項(xiàng)集合中每個(gè)候選項(xiàng)的權(quán)值的大小,確定候選項(xiàng)集合中是否有高頻熱詞或新詞。
23.根據(jù)權(quán)利要求22所述的裝置,其特征在于,所述判斷模塊具體用于當(dāng)候選項(xiàng)集合中候選項(xiàng)的連續(xù)預(yù)定次迭代產(chǎn)生的所述權(quán)值均大于預(yù)設(shè)的高頻熱詞的閾值時(shí),則確定所述候選項(xiàng)為高頻熱詞;或具體用于當(dāng)候選項(xiàng)集合中候選項(xiàng)當(dāng)前迭代所產(chǎn)生的所述權(quán)值與前一次迭代所產(chǎn)生的所述權(quán)值相比的變化量大于預(yù)設(shè)的新詞的閾值時(shí),則確定所述候選項(xiàng)為新
24.根據(jù)權(quán)利要求22所述的裝置,其特征在于,所述裝置還包括推送模塊,用于向所述高頻熱詞或新詞所屬的用戶(hù)類(lèi)型的用戶(hù)推送所述高頻熱詞或新詞對(duì)應(yīng)的鏈接。
25.根據(jù)權(quán)利要求22所述的裝置,其特征在于,所述展示模塊具體用于展示進(jìn)行排序后的候選項(xiàng)以及候選項(xiàng)的新詞或高頻熱詞的標(biāo)識(shí)。
26.根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述裝置還包括第二排序模塊,用于根據(jù)當(dāng)前用戶(hù)的切換指令,按照所述選擇次數(shù)Sl、S2,…、Sffl的求和結(jié)果對(duì)所述候選項(xiàng)進(jìn)行排序,并將按所述求和結(jié)果排序后的候選項(xiàng)發(fā)送給所述展示模塊; 所述展示模塊具體用于展示按所述求和結(jié)果進(jìn)行排序的候選項(xiàng)以及所述求和結(jié)果。
27.根據(jù)權(quán)利要求15或16所述的裝置,其特征在于,所述語(yǔ)言模型是n-gram語(yǔ)言模型或n-pos語(yǔ)言模型。
【文檔編號(hào)】G06F17/30GK103870000SQ201210531929
【公開(kāi)日】2014年6月18日 申請(qǐng)日期:2012年12月11日 優(yōu)先權(quán)日:2012年12月11日
【發(fā)明者】吳先超 申請(qǐng)人:百度國(guó)際科技(深圳)有限公司