亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

對輸入法所產(chǎn)生的候選項進(jìn)行排序的方法及裝置制造方法

文檔序號:6492669閱讀:87來源:國知局
對輸入法所產(chǎn)生的候選項進(jìn)行排序的方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種對輸入法所產(chǎn)生的候選項進(jìn)行排序的方法及裝置,該方法包括:利用所述輸入法接收當(dāng)前用戶的當(dāng)前輸入信息;根據(jù)已建立的與領(lǐng)域相關(guān)的L個不同的語言模型,獲取所述當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項所屬的領(lǐng)域,其中,L是自然數(shù);按照所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序;展示進(jìn)行所述排序后的候選項。通過上述方式,本發(fā)明能夠向不同的用戶推送相應(yīng)排序的候選項。
【專利說明】對輸入法所產(chǎn)生的候選項進(jìn)行排序的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及輸入法應(yīng)用【技術(shù)領(lǐng)域】,特別是涉及一種對輸入法所產(chǎn)生的候選項進(jìn)行排序的方法及裝置。
【背景技術(shù)】
[0002]輸入法應(yīng)用是根據(jù)一定的編碼規(guī)則來輸入文字等信息的程序,用戶在使用計算機(jī)時一般需要借助特定的輸入法應(yīng)用完成文字等信息的輸入。
[0003]在輸入法應(yīng)用中,在輸入相同的讀音時,推送給用戶的對應(yīng)該讀音的候選項集合的排序通常都是一樣的。例如,對于假名“々好 < ”,這個讀音所對應(yīng)的日文漢字包括“価格、科學(xué)、化學(xué)、歌學(xué)、花岳”等眾多候選,向用戶推送的排序都是一樣的。
[0004]但是,本申請的發(fā)明人在長期的研發(fā)中發(fā)現(xiàn),不同的用戶對于候選項的排序要求也是不一樣的。向所有的用戶推送相同排序的候選項,大部分用戶通常浪費(fèi)大量的時間以選擇需要的候選項,這樣也降低了用戶體驗。

【發(fā)明內(nèi)容】

[0005]本發(fā)明主要解決的技術(shù)問題是提供一種對輸入法所產(chǎn)生的候選項進(jìn)行排序的方法及裝置,能夠向不同的用戶推送相應(yīng)排序的候選項,提升用戶體驗。
[0006]為解決上述技術(shù)問題,本發(fā)明采用的一個技術(shù)方案是:提供一種對輸入法所產(chǎn)生的候選項進(jìn)行排序的方法,包括:利用所述輸入法接收當(dāng)前用戶的當(dāng)前輸入信息;根據(jù)已建立的與領(lǐng)域相關(guān)的L個不同的語言模型,獲取所述當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項所屬的領(lǐng)域,其中,L是自然數(shù);按照所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序;展示進(jìn)行所述排序后的候選項。
[0007]其中,所述根據(jù)已建立的與領(lǐng)域相關(guān)的L個不同的語言模型,獲取所述當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項所屬的領(lǐng)域的步驟之前,包括:使用文本分類技術(shù),對網(wǎng)頁語料進(jìn)行分類整理,獲得L個不同的領(lǐng)域和L類不同的與領(lǐng)域相關(guān)的網(wǎng)頁語料;將所述L類不同的與領(lǐng)域相關(guān)的網(wǎng)頁語料,分別按照各自的領(lǐng)域訓(xùn)練出L個不同的與領(lǐng)域相關(guān)的語目模型。
[0008]其中,所述按照所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序的步驟之前,包括:獲取當(dāng)前用戶的輸入歷史信息;根據(jù)所述當(dāng)前用戶的輸入歷史信息,用所述已建立的與領(lǐng)域相關(guān)的L個不同的語言模型對當(dāng)前用戶進(jìn)行分類,獲得當(dāng)前用戶所屬的領(lǐng)域集合。
[0009]其中,所述按照所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序的步驟之前,包括:獲取多個用戶的輸入歷史信息,所述多個用戶屬于所述L個不同的領(lǐng)域;從所述獲取的多個用戶的輸入歷史信息中選取部分輸入歷史信息;對所述選取的部分輸入歷史信息進(jìn)行標(biāo)注,獲得多個用戶標(biāo)注的訓(xùn)練語料;將所述多個用戶標(biāo)注的訓(xùn)練語料和所述L類不同的與領(lǐng)域相關(guān)的網(wǎng)頁語料,用半督導(dǎo)機(jī)器學(xué)習(xí)方法分別按照各自的領(lǐng)域訓(xùn)練出與領(lǐng)域相關(guān)的用戶分類器;根據(jù)已獲得的所述當(dāng)前用戶的輸入歷史信息,用所述與領(lǐng)域相關(guān)的用戶分類器對當(dāng)前用戶進(jìn)行分類,獲得當(dāng)前用戶所屬的領(lǐng)域集合。
[0010]其中,所述輸入歷史信息包括在輸入法應(yīng)用中的輸入歷史信息、在即時通信工具中的輸入歷史信息以及在社交網(wǎng)站中的輸入歷史信息。
[0011]其中,所述按照每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序的步驟,包括:根據(jù)所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,獲得當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項的權(quán)重;根據(jù)所述候選項集合中每個候選項的權(quán)重的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序。
[0012]其中,所述根據(jù)所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,獲得當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項的權(quán)重的步驟,包括:獲取m個用戶Ul、u2、…、um在輸入所述當(dāng)前用戶當(dāng)前輸入信息的情況下,對同一個候選項Ci的選擇次數(shù)SpS2'…、Sm,其中,m個用戶屬于L個不同的領(lǐng)域;在L個不同的領(lǐng)域中,獲取所述候選項Ci在領(lǐng)域I中的權(quán)重weight (Ci, I),即
【權(quán)利要求】
1.一種對輸入法所產(chǎn)生的候選項進(jìn)行排序的方法,其特征在于,包括: 利用所述輸入法接收當(dāng)前用戶的當(dāng)前輸入信息; 根據(jù)已建立的與領(lǐng)域相關(guān)的L個不同的語言模型,獲取所述當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項所屬的領(lǐng)域,其中,L是自然數(shù); 按照所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序; 展示進(jìn)行所述排序后的候選項。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)已建立的與領(lǐng)域相關(guān)的L個不同的語言模型,獲取所述當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項所屬的領(lǐng)域的步驟之前,包括: 使用文本分類技術(shù),對網(wǎng)頁語料進(jìn)行分類整理,獲得L個不同的領(lǐng)域和L類不同的與領(lǐng)域相關(guān)的網(wǎng)頁語料; 將所述L類不同的與領(lǐng)域相關(guān)的網(wǎng)頁語料,分別按照各自的領(lǐng)域訓(xùn)練出L個不同的與領(lǐng)域相關(guān)的語言模型。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序的步驟`之前,包括: 獲取當(dāng)前用戶的輸入歷史信息; 根據(jù)所述當(dāng)前用戶的輸入歷史信息,用所述已建立的與領(lǐng)域相關(guān)的L個不同的語言模型對當(dāng)前用戶進(jìn)行分類,獲得當(dāng)前用戶所屬的領(lǐng)域集合。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述按照所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序的步驟之前,包括: 獲取多個用戶的輸入歷史信息,所述多個用戶屬于所述L個不同的領(lǐng)域; 從所述獲取的多個用戶的輸入歷史信息中選取部分輸入歷史信息; 對所述選取的部分輸入歷史信息進(jìn)行標(biāo)注,獲得多個用戶標(biāo)注的訓(xùn)練語料; 將所述多個用戶標(biāo)注的訓(xùn)練語料和所述L類不同的與領(lǐng)域相關(guān)的網(wǎng)頁語料,用半督導(dǎo)機(jī)器學(xué)習(xí)方法分別按照各自的領(lǐng)域訓(xùn)練出與領(lǐng)域相關(guān)的用戶分類器; 根據(jù)已獲得的所述當(dāng)前用戶的輸入歷史信息,用所述與領(lǐng)域相關(guān)的用戶分類器對當(dāng)前用戶進(jìn)行分類,獲得當(dāng)前用戶所屬的領(lǐng)域集合。
5.根據(jù)權(quán)利要求3或4任一項所述的方法,其特征在于,所述輸入歷史信息包括在輸入法應(yīng)用中的輸入歷史信息、在即時通信工具中的輸入歷史信息以及在社交網(wǎng)站中的輸入歷史息。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序的步驟,包括: 根據(jù)所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,獲得當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項的權(quán)重; 根據(jù)所述候選項集合中每個候選項的權(quán)重的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,獲得當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項的權(quán)重的步驟,包括: 獲取m個用戶UpU2'…、Um在輸入所述當(dāng)前用戶當(dāng)前輸入信息的情況下,對同一個候選項Ci的選擇次數(shù)Sp S2>…、Sm,其中,m個用戶屬于L個不同的領(lǐng)域; 在L個不同的領(lǐng)域中,獲取所述候選項Ci在領(lǐng)域I中的權(quán)重weight (Ci, I), BP
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,獲得當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項的權(quán)重的步驟之后,包括: 判斷所述當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項的權(quán)重是否達(dá)到預(yù)設(shè)的聞頻熱詞的閾值; 若達(dá)到所述預(yù)設(shè)的高頻熱詞的閾值,則確定所述候選項為高頻熱詞。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述若達(dá)到所述預(yù)設(shè)的高頻熱詞的閾值,則確定所述候選項為高頻熱詞的步驟之后,包括:向所述候選項所屬的領(lǐng)域的用戶推送所述高頻熱詞對應(yīng)的鏈接。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述展示進(jìn)行所述排序后的候選項的步驟,包括:展示進(jìn)行所述排序后的候選項以及所述候選項所屬的領(lǐng)域。
11.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述按照所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序的步驟,包括: 將所述當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項按照屬于同一領(lǐng)域的候選項排列在一起的條件進(jìn)行排序,獲得第一排序結(jié)果;按照所述當(dāng)前用戶屬于候選項所屬的領(lǐng)域的權(quán)重的大小,對所述第一排序結(jié)果進(jìn)行排序,獲得第二排序結(jié)果; 按照候選項在領(lǐng)域中的權(quán)重的大小,對所述第二排序結(jié)果中排列在一起的屬于同一領(lǐng)域的候選項進(jìn)行排序,獲得第三排序結(jié)果。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述展示進(jìn)行所述排序后的候選項的步驟,包括: 判斷所述當(dāng)前用戶是否點(diǎn)擊“按領(lǐng)域排序”按鈕; 若所述當(dāng)前用戶點(diǎn)擊“按領(lǐng)域排序”按鈕,則展示所述第三排序結(jié)果的候選項以及所述候選項所屬的領(lǐng)域。
13.根據(jù)權(quán)利要求1至3任一項所述的方法,其特征在于,所述語言模型是n-gram語言模型或n-pos語目模型。
14.一種對輸入法所產(chǎn)生的候選項進(jìn)行排序的裝置,其特征在于,所述裝置包括: 接收模塊,用于利用所述輸入法接收當(dāng)前用戶的當(dāng)前輸入信息; 第一獲取模塊,用于根據(jù)已建立的與領(lǐng)域相關(guān)的L個不同的語言模型,獲取所述當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項所屬的領(lǐng)域,其中,L是自然數(shù); 排序模塊,用于按照所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序;` 展示模塊,用于展示進(jìn)行所述排序后的候選項。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述裝置還包括: 第一獲得模塊,用于使用文本分類技術(shù),對網(wǎng)頁語料進(jìn)行分類整理,獲得L個不同的領(lǐng)域和L類不同的與領(lǐng)域相關(guān)的網(wǎng)頁語料; 第一訓(xùn)練模塊,用于將所述L類不同的與領(lǐng)域相關(guān)的網(wǎng)頁語料,分別按照各自的領(lǐng)域訓(xùn)練出L個不同的與領(lǐng)域相關(guān)的語言模型。
16.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述裝置包括: 第二獲取模塊,用于獲取當(dāng)前用戶的輸入歷史信息; 第二獲得模塊,用于根據(jù)所述當(dāng)前用戶的輸入歷史信息,用所述已建立的與領(lǐng)域相關(guān)的L個不同的語言模型對當(dāng)前用戶進(jìn)行分類,獲得當(dāng)前用戶所屬的領(lǐng)域集合。
17.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述裝置包括: 第三獲取模塊,用于獲取多個用戶的輸入歷史信息,所述多個用戶屬于所述L個不同的領(lǐng)域; 選取模塊,用于從所述獲取的多個用戶的輸入歷史信息中選取部分輸入歷史信息;第三獲得模塊,用于對所述選取的部分輸入歷史信息進(jìn)行標(biāo)注,獲得多個用戶標(biāo)注的訓(xùn)練語料; 第二訓(xùn)練模塊,用于將所述多個用戶標(biāo)注的訓(xùn)練語料和所述L類不同的與領(lǐng)域相關(guān)的網(wǎng)頁語料,用半督導(dǎo)機(jī)器學(xué)習(xí)方法分別按照各自的領(lǐng)域訓(xùn)練出與領(lǐng)域相關(guān)的用戶分類器;第四獲得模塊,用于根據(jù)已獲得的所述當(dāng)前用戶的輸入歷史信息,用所述與領(lǐng)域相關(guān)的用戶分類器對當(dāng)前用戶進(jìn)行分類,獲得當(dāng)前用戶所屬的領(lǐng)域集合。
18.根據(jù)權(quán)利要求16或17任一項所述的裝置,其特征在于,所述輸入歷史信息包括在輸入法應(yīng)用中的輸入歷史信息、在即時通信工具中的輸入歷史信息以及在社交網(wǎng)站中的輸入歷史信息。
19.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述排序模塊包括: 第一獲得單元,用于根據(jù)所述每個候選項所屬的領(lǐng)域與已獲得的所述當(dāng)前用戶所屬的領(lǐng)域集合中的領(lǐng)域的相關(guān)性的大小,獲得當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項的權(quán)重; 第一排序單元,用于根據(jù)所述候選項集合中每個候選項的權(quán)重的大小,對當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項進(jìn)行排序。
20.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述第一獲得單元包括: 第一獲取子單元,用于獲取m個用戶Ul、u2、…、Uffl在輸入所述當(dāng)前用戶當(dāng)前輸入信息的情況下,對同一個候選項Ci的選擇次數(shù)Sl、s2.....sm,其中,m個用戶屬于L個不同的領(lǐng)域; 第二獲取子單元,用于在L個不同的領(lǐng)域中,獲取所述候選項Ci在領(lǐng)域I中的權(quán)重weight (Ci, I),即
21.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述排序模塊包括: 第一判斷單元,用于判斷所述當(dāng)前用戶當(dāng)前輸入信息的候選項集合中每個候選項的權(quán)重是否達(dá)到預(yù)設(shè)的高頻熱詞的閾值; 確定單元,用于在達(dá)到所述預(yù)設(shè)的高頻熱詞的閾值時,確定所述候選項為高頻熱詞。
22.根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述裝置包括推送模塊,所述推送模塊用于向所述候選項所屬的領(lǐng)域的用戶推送所述高頻熱詞對應(yīng)的鏈接。
23.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述展示模塊具體用于展示進(jìn)行所述排序后的候選項以及所述候選項所屬的領(lǐng)域。
24.根據(jù)權(quán)利要求20所述的裝置,其特征在于,所述排序模塊包括: 第二排序單元,用于將所述當(dāng)前用戶當(dāng)前輸入信息的候選項集合中的候選項按照屬于同一領(lǐng)域的候選項排列在一起的條件進(jìn)行排序,獲得第一排序結(jié)果; 第三排序單元,用于按照所述當(dāng)前用戶屬于候選項所屬的領(lǐng)域的權(quán)重的大小,對所述第一排序結(jié)果進(jìn)行排序,獲得第二排序結(jié)果; 第四排序單元,用于按照候選項在領(lǐng)域中的權(quán)重的大小,對所述第二排序結(jié)果中排列在一起的屬于同一領(lǐng)域的候選項進(jìn)行排序,獲得第三排序結(jié)果。
25.根據(jù)權(quán)利要求24所述的裝置,其特征在于,所述展示模塊包括: 第二判斷單元,用于判斷所述當(dāng)前用戶是否點(diǎn)擊“按領(lǐng)域排序”按鈕; 展示單元,用于在所述當(dāng)前用戶點(diǎn)擊“按領(lǐng)域排序”按鈕時,展示所述第三排序結(jié)果的候選項以及所述候選項所屬的領(lǐng)域。
26.根據(jù)權(quán)利要求11至13任一項所述的裝置,其特征在于,所述語言模型是n-gram語言模型或n-pos語言模型。`
【文檔編號】G06F17/30GK103869999SQ201210531877
【公開日】2014年6月18日 申請日期:2012年12月11日 優(yōu)先權(quán)日:2012年12月11日
【發(fā)明者】吳先超 申請人:百度國際科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1