一種輸入方法、裝置及電子設(shè)備的制作方法
【專(zhuān)利摘要】本發(fā)明實(shí)施例提供了一種輸入方法、裝置及電子設(shè)備。該輸入方法包括:獲取輸入光標(biāo)處的文本信息,所述文本信息包括位于所述輸入光標(biāo)之前的上文文本信息和/或位于所述輸入光標(biāo)之后的下文文本信息;提取所述文本信息中的關(guān)鍵詞;查找所述關(guān)鍵詞的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上屏候選詞隊(duì)列;輸出所述上屏候選詞隊(duì)列。本發(fā)明實(shí)施例通過(guò)獲取輸入光標(biāo)處的文本信息,并基于該文本信息中的關(guān)鍵詞確定出上屏詞候選隊(duì)列,解決了現(xiàn)有技術(shù)中輸入光標(biāo)改變位置后由于無(wú)法獲取可靠上屏詞條而無(wú)法聯(lián)想給出上屏候選詞的問(wèn)題。
【專(zhuān)利說(shuō)明】一種輸入方法、裝置及電子設(shè)備
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通信【技術(shù)領(lǐng)域】,尤其涉及一種輸入方法、裝置及電子設(shè)備。
【背景技術(shù)】
[0002] 拼音輸入是一種最簡(jiǎn)單的漢字輸入方法,它的發(fā)展非常快,從第一代的以字輸入 為主,即用戶一次只能輸入一個(gè)漢字,發(fā)展到第二代以詞輸入為主并具有智能調(diào)頻功能,這 個(gè)時(shí)候主要依賴(lài)的是輸入法的詞典,發(fā)展到第三代,用戶可以進(jìn)行語(yǔ)句的輸入,輸入法詞典 中沒(méi)有的句子也可以進(jìn)行輸入,組詞功能對(duì)輸入的體驗(yàn)有著很大的影響。
[0003] 輸入法聯(lián)想功能是拼音輸入法主動(dòng)輸入的一種擴(kuò)展,它的出現(xiàn)減少了用戶主動(dòng)輸 入的次數(shù)、按鍵的次數(shù),并增加了輸入法的智能性。該輸入法的實(shí)現(xiàn)過(guò)程是首先獲取用戶上 一次上屏的詞條,并根據(jù)該詞條查詢系統(tǒng)二元庫(kù)等預(yù)建詞庫(kù)來(lái)獲取上屏候選詞隊(duì)列,然后 輸出該上屏候選詞隊(duì)列。
[0004] 然而,該輸入法中的上屏候選詞隊(duì)列由于必須依賴(lài)于上一次上屏的詞條,當(dāng)輸入 光標(biāo)改變位置時(shí),就無(wú)法獲取可靠的上屏詞條,進(jìn)而也無(wú)法聯(lián)想給出該輸入光標(biāo)處的上屏 候選詞隊(duì)列。因此,目前需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問(wèn)題就是:如何在輸入光 標(biāo)移動(dòng)時(shí)獲得可靠的上屏候選詞隊(duì)列。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實(shí)施例所要解決的技術(shù)問(wèn)題是提供一種輸入方法,能夠在輸入光標(biāo)移動(dòng)時(shí) 獲得可靠的上屏候選詞隊(duì)列。
[0006] 相應(yīng)的,本發(fā)明實(shí)施例還提供了一種輸入裝置,用以保證上述方法的實(shí)現(xiàn)及應(yīng)用。
[0007] 為了解決上述問(wèn)題,本發(fā)明公開(kāi)了一種輸入方法,包括:
[0008] 獲取輸入光標(biāo)處的文本信息,所述文本信息包括位于所述輸入光標(biāo)之前的上文文 本信息和/或位于所述輸入光標(biāo)之后的下文文本信息;
[0009] 提取所述文本信息中的關(guān)鍵詞;
[0010] 查找所述關(guān)鍵詞的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上屏候選詞隊(duì)列;
[0011] 輸出所述上屏候選詞隊(duì)列。
[0012] 進(jìn)一步,所述獲取輸入光標(biāo)處的文本信息,包括:
[0013] 當(dāng)檢測(cè)到所述輸入光標(biāo)位于文本框內(nèi),且停止文本輸入的時(shí)間超過(guò)時(shí)間閾值時(shí), 獲取所述輸入光標(biāo)處的文本信息。
[0014] 進(jìn)一步,所述獲取輸入光標(biāo)處的文本信息,包括:
[0015] 以所述輸入光標(biāo)所在的整句分割點(diǎn)或文本框邊界作為所述文本信息的長(zhǎng)度邊界, 獲取所述輸入光標(biāo)處的文本信息。
[0016] 進(jìn)一步,所述查找所述關(guān)鍵詞的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上屏候選 詞隊(duì)列,包括:
[0017] 根據(jù)所述關(guān)鍵詞與所述輸入光標(biāo)之間的距離關(guān)系和/或所述關(guān)鍵詞所屬的應(yīng)用 屬性確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型;
[0018] 查找所述語(yǔ)言模型的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上屏候選詞隊(duì)列。
[0019] 進(jìn)一步,所述根據(jù)所述關(guān)鍵詞與所述輸入光標(biāo)之間的距離關(guān)系確定所述關(guān)鍵詞對(duì) 應(yīng)的語(yǔ)目模型,包括:
[0020] 若所述關(guān)鍵詞為一個(gè),則當(dāng)所述關(guān)鍵詞與所述輸入光標(biāo)之間的距離關(guān)系為鄰接關(guān) 系時(shí),確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為鄰近二元語(yǔ)言模型;當(dāng)所述距離關(guān)系為非鄰接關(guān) 系時(shí)確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為遠(yuǎn)距離二元語(yǔ)言模型;
[0021] 當(dāng)所述關(guān)鍵詞為兩個(gè)時(shí),確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為三元語(yǔ)言模型。
[0022] 進(jìn)一步,在所述根據(jù)所述關(guān)鍵詞與所述輸入光標(biāo)之間的距離關(guān)系確定所述關(guān)鍵詞 對(duì)應(yīng)的語(yǔ)言模型之前,還包括:
[0023] 建立語(yǔ)言模型及其聯(lián)想候選詞庫(kù),所述語(yǔ)言模型包括鄰近二元語(yǔ)言模型,遠(yuǎn)距離 二元語(yǔ)言模型及三元語(yǔ)言模型;
[0024] 所述建立語(yǔ)言模型及其聯(lián)想候選詞庫(kù),包括:
[0025] 收集訓(xùn)練語(yǔ)料;
[0026] 提取所述訓(xùn)練語(yǔ)料中的訓(xùn)練候選詞及訓(xùn)練關(guān)鍵詞,所述訓(xùn)練關(guān)鍵詞與所述訓(xùn)練候 選詞之間的距離關(guān)系包括鄰接關(guān)系和非鄰接關(guān)系,所述訓(xùn)練關(guān)鍵詞至少為一個(gè);
[0027] 對(duì)所述訓(xùn)練候選詞及所述訓(xùn)練關(guān)鍵詞進(jìn)行模型訓(xùn)練,獲得所述語(yǔ)言模型及其聯(lián)想 候選詞庫(kù)。
[0028] 進(jìn)一步,所述根據(jù)所述關(guān)鍵詞所屬的應(yīng)用屬性確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型, 包括:
[0029] 根據(jù)所述關(guān)鍵詞所屬的用戶使用習(xí)慣特征確定所述關(guān)鍵詞對(duì)應(yīng)的用戶模型;或 者,
[0030] 根據(jù)所述關(guān)鍵詞所屬的應(yīng)用領(lǐng)域確定所述關(guān)鍵詞對(duì)應(yīng)的垂直模型;或者;
[0031] 根據(jù)所述關(guān)鍵詞所屬的常用詞匯確定所述關(guān)鍵詞對(duì)應(yīng)的常見(jiàn)詞語(yǔ)言模型;或者,
[0032] 根據(jù)所述關(guān)鍵詞所屬的話題情景確定所述關(guān)鍵詞對(duì)應(yīng)的情景模型。
[0033] 進(jìn)一步,所述查找所述語(yǔ)言模型的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上屏候 選詞隊(duì)列,包括:
[0034] 當(dāng)所述語(yǔ)言模型至少有兩個(gè)時(shí),分別確定各所述語(yǔ)言模型的聯(lián)想候選詞庫(kù)中的上 屏候選詞;
[0035] 根據(jù)各所述語(yǔ)言模型的預(yù)設(shè)權(quán)重,按照權(quán)重線性疊加合并所述上屏候選詞;
[0036] 對(duì)合并后的上屏候選詞按照權(quán)重由高到低進(jìn)行排序獲得所述輸入光標(biāo)處的上屏 候選詞隊(duì)列。
[0037] 進(jìn)一步,在所述輸出所述上屏候選詞隊(duì)列之前,還包括:
[0038] 根據(jù)所述輸入光標(biāo)處的話題情景對(duì)所述上屏候選詞隊(duì)列進(jìn)行調(diào)序;
[0039] 所述輸出所述上屏候選詞隊(duì)列,包括:
[0040] 輸出調(diào)序后的上屏候選詞隊(duì)列。
[0041] 進(jìn)一步,所述根據(jù)所述輸入光標(biāo)處的話題情景對(duì)所述上屏候選詞隊(duì)列進(jìn)行調(diào)序, 包括:
[0042] 根據(jù)命中各情景特征標(biāo)簽的所述關(guān)鍵詞的個(gè)數(shù)及所述關(guān)鍵詞命中所述各情景特 征標(biāo)簽的概率和,確定所述各情景特征標(biāo)簽的特征得分;
[0043] 按照所述各情景特征標(biāo)簽的特征得分,由高到底對(duì)所述情景特征標(biāo)簽進(jìn)行排序;
[0044] 按照所述情景特征標(biāo)簽的順序?qū)λ錾掀梁蜻x詞隊(duì)列進(jìn)行調(diào)序,其中,所述上屏 候選詞隊(duì)列中的上屏候選詞均具有各自的情景特征標(biāo)簽。
[0045] 本發(fā)明還公開(kāi)了一種輸入裝置,包括:
[0046] 文本獲取單兀,用于獲取輸入光標(biāo)處的文本信息,所述文本信息包括位于所述輸 入光標(biāo)之前的上文文本信息和/或位于所述輸入光標(biāo)之后的下文文本信息;
[0047] 關(guān)鍵詞提取單元,用于提取所述文本信息中的關(guān)鍵詞;
[0048] 隊(duì)列獲取單元,用于查找所述關(guān)鍵詞的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上 屏候選詞隊(duì)列;
[0049] 隊(duì)列輸出單元,用于輸出所述上屏候選詞隊(duì)列。
[0050] 進(jìn)一步,所述文本獲取單元,具體用于當(dāng)檢測(cè)到所述輸入光標(biāo)位于文本框內(nèi),且停 止文本輸入的時(shí)間超過(guò)時(shí)間閾值時(shí),獲取所述輸入光標(biāo)處的文本信息。
[0051] 進(jìn)一步,所述文本獲取單元,具體用于以所述輸入光標(biāo)所在的整句分割點(diǎn)或文本 框邊界作為所述文本信息的長(zhǎng)度邊界,獲取所述輸入光標(biāo)處的文本信息。
[0052] 進(jìn)一步,所述隊(duì)列獲取單元包括:
[0053] 模型確定子單元,用于根據(jù)所述關(guān)鍵詞與所述輸入光標(biāo)之間的距離關(guān)系和/或所 述關(guān)鍵詞所屬的應(yīng)用屬性確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型;
[0054] 隊(duì)列獲取子單元,用于查找所述語(yǔ)言模型的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處 的上屏候選詞隊(duì)列。
[0055] 進(jìn)一步,所述模型確定子單元,具體用于若所述關(guān)鍵詞為一個(gè),則當(dāng)所述關(guān)鍵詞與 所述輸入光標(biāo)之間的距離關(guān)系為鄰接關(guān)系時(shí),確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為鄰近二元 語(yǔ)言模型;當(dāng)所述距離關(guān)系為非鄰接關(guān)系時(shí)確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為遠(yuǎn)距離二元 語(yǔ)言模型;當(dāng)所述關(guān)鍵詞為兩個(gè)時(shí),確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為三元語(yǔ)言模型。
[0056] 進(jìn)一步,所述隊(duì)列獲取單元還包括:
[0057] 模型建立子單元,用于在所述模型確定子單元確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型之 前,建立語(yǔ)言模型及其聯(lián)想候選詞庫(kù),所述語(yǔ)言模型包括鄰近二元語(yǔ)言模型,遠(yuǎn)距離二元語(yǔ) 言模型及三元語(yǔ)言模型;
[0058] 所述模型建立子單元包括:
[0059] 收集子單元,用于收集訓(xùn)練語(yǔ)料;
[0060] 提取子單元,用于提取所述訓(xùn)練語(yǔ)料中的訓(xùn)練候選詞及訓(xùn)練關(guān)鍵詞,所述訓(xùn)練關(guān) 鍵詞與所述訓(xùn)練候選詞之間的距離關(guān)系包括鄰接關(guān)系和非鄰接關(guān)系,所述訓(xùn)練關(guān)鍵詞至少 為一個(gè);
[0061] 訓(xùn)練子單元,用于對(duì)所述訓(xùn)練候選詞及所述訓(xùn)練關(guān)鍵詞進(jìn)行模型訓(xùn)練,獲得所述 語(yǔ)言模型及其聯(lián)想候選詞庫(kù)。
[0062] 進(jìn)一步,所述模型確定子單元,具體用于根據(jù)所述關(guān)鍵詞所屬的用戶使用習(xí)慣特 征確定所述關(guān)鍵詞對(duì)應(yīng)的用戶模型;或者,根據(jù)所述關(guān)鍵詞所屬的應(yīng)用領(lǐng)域確定所述關(guān)鍵 詞對(duì)應(yīng)的垂直模型;或者;根據(jù)所述關(guān)鍵詞所屬的常用詞匯確定所述關(guān)鍵詞對(duì)應(yīng)的常見(jiàn)詞 語(yǔ)言模型;或者,根據(jù)所述關(guān)鍵詞所屬的話題情景確定所述關(guān)鍵詞對(duì)應(yīng)的情景模型。
[0063] 進(jìn)一步,所述隊(duì)列獲取子單元包括:
[0064] 確定子單元,用于當(dāng)所述語(yǔ)言模型至少有兩個(gè)時(shí),分別確定各所述語(yǔ)言模型的聯(lián) 想候選詞庫(kù)中的上屏候選詞;
[0065] 合并子單元,用于根據(jù)各所述語(yǔ)言模型的預(yù)設(shè)權(quán)重,按照權(quán)重線性疊加合并所述 上屏候選詞;
[0066] 排序子單元,用于對(duì)合并后的上屏候選詞按照權(quán)重由高到低進(jìn)行排序獲得所述輸 入光標(biāo)處的上屏候選詞隊(duì)列。
[0067] 進(jìn)一步,所述裝置還包括:
[0068] 隊(duì)列調(diào)序單元,用于在所述隊(duì)列輸出單元輸出所述上屏候選詞隊(duì)列之前,根據(jù)所 述輸入光標(biāo)處的話題情景對(duì)所述上屏候選詞隊(duì)列進(jìn)行調(diào)序;
[0069] 所述隊(duì)列輸出單元,用于輸出調(diào)序后的上屏候選詞隊(duì)列。
[0070] 進(jìn)一步,所述隊(duì)列調(diào)序單元包括:
[0071] 得分計(jì)算子單元,用于根據(jù)命中各情景特征標(biāo)簽的所述關(guān)鍵詞的個(gè)數(shù)及所述關(guān)鍵 詞命中所述各情景特征標(biāo)簽的概率和,確定所述各情景特征標(biāo)簽的特征得分;
[0072] 情景排序子單元,用于按照所述各情景特征標(biāo)簽的特征得分,由高到底對(duì)所述情 景特征標(biāo)簽進(jìn)行排序;
[0073] 調(diào)序子單元,用于按照所述情景特征標(biāo)簽的順序?qū)λ錾掀梁蜻x詞隊(duì)列進(jìn)行調(diào) 序,其中,所述上屏候選詞隊(duì)列中的上屏候選詞均具有各自的情景特征標(biāo)簽。
[0074] 本發(fā)明還公開(kāi)了一種電子設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器用于存儲(chǔ)計(jì)算 機(jī)指令或代碼,所述處理器和所述存儲(chǔ)器耦合,用于執(zhí)行所述存儲(chǔ)器中的計(jì)算機(jī)指令或代 碼,實(shí)現(xiàn)以下方法:
[0075] 獲取輸入光標(biāo)處的文本信息,所述文本信息包括位于所述輸入光標(biāo)之前的上文文 本信息和/或位于所述輸入光標(biāo)之后的下文文本信息;
[0076] 提取所述文本信息中的關(guān)鍵詞;
[0077] 查找所述關(guān)鍵詞的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上屏候選詞隊(duì)列;
[0078] 輸出所述上屏候選詞隊(duì)列。
[0079] 與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例至少包括以下優(yōu)點(diǎn):
[0080] 本發(fā)明實(shí)施例通過(guò)獲取輸入光標(biāo)處的文本信息,并基于該文本信息中的關(guān)鍵詞確 定出上屏詞候選隊(duì)列,解決了現(xiàn)有技術(shù)中輸入光標(biāo)改變位置后由于無(wú)法獲取可靠上屏詞條 而無(wú)法聯(lián)想給出上屏候選詞的問(wèn)題。該方法不僅能夠在輸入光標(biāo)移動(dòng)時(shí)獲得可靠的上屏候 選詞,而且,該輸入方法不單單依靠上一次的上屏詞條聯(lián)想給出上屏候選詞隊(duì)列,而是可以 利用輸入光標(biāo)前、后的文本信息,以及遠(yuǎn)距離的文本信息來(lái)聯(lián)想給出上屏候選詞隊(duì)列,該方 法可以更全面、更正確的理解用戶的輸入意圖,從而可以給出更可靠的上屏候選詞隊(duì)列。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0081] 圖1為本發(fā)明實(shí)施例一種輸入方法的流程示意圖;
[0082] 圖2是本發(fā)明實(shí)施例中一種獲得輸入光標(biāo)處的上屏候選詞隊(duì)列的方法流程圖;
[0083] 圖3是本發(fā)明實(shí)施例中一種系統(tǒng)模型及其聯(lián)想候選詞庫(kù)的建立方法流程圖;
[0084] 圖4是本發(fā)明實(shí)施例中一種根據(jù)語(yǔ)言模型對(duì)應(yīng)的聯(lián)想候選詞庫(kù)獲得輸入光標(biāo)處 的上屏候選詞隊(duì)列的方法流程圖;
[0085] 圖5是本發(fā)明實(shí)施例中一種根據(jù)輸入光標(biāo)處的話題情景對(duì)上屏候選詞隊(duì)列進(jìn)行 調(diào)序的方法流程圖;
[0086] 圖6為本發(fā)明實(shí)施例一種輸入裝置的結(jié)構(gòu)示意圖;
[0087] 圖7為本發(fā)明實(shí)施例中一種隊(duì)列獲取單元的結(jié)構(gòu)示意圖;
[0088] 圖8為本發(fā)明實(shí)施例中一種模型建立子單元的結(jié)構(gòu)示意圖;
[0089] 圖9為本發(fā)明實(shí)施例中一種隊(duì)列獲取子單元的結(jié)構(gòu)示意圖;
[0090] 圖10為本發(fā)明實(shí)施例另一種輸入裝置的結(jié)構(gòu)示意圖;
[0091] 圖11為本發(fā)明實(shí)施例中一種隊(duì)列調(diào)序單元的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0092] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。
[0093] 參照?qǐng)D1,為本發(fā)明實(shí)施例一種輸入方法的流程示意圖。
[0094] 在用戶進(jìn)行文本輸入的過(guò)程可以采用本發(fā)明實(shí)施例的方法來(lái)直接代替或結(jié)合現(xiàn) 有的根據(jù)上一次上屏詞條預(yù)測(cè)上屏候選詞的方法給出輸入光標(biāo)處的上屏候選詞隊(duì)列,也可 以是在某種條件下執(zhí)行本發(fā)明實(shí)施例的方法,具體的,當(dāng)輸入裝置檢測(cè)到輸入光標(biāo)位于文 本框內(nèi),且停止文本輸入的時(shí)間超過(guò)時(shí)間閾值時(shí),例如,當(dāng)用戶需要修改或增加文本信息而 改變輸入光標(biāo)在文本框內(nèi)的位置時(shí),可以按照本實(shí)施例方法給出輸入光標(biāo)處的上屏候選詞 隊(duì)列。該方法可以包括如下步驟:
[0095] 步驟101,獲取輸入光標(biāo)處的文本信息。
[0096] 在本步驟中,輸入裝置首先通過(guò)系統(tǒng)API接口讀取輸入光標(biāo)處的文本信息,可以 以輸入光標(biāo)所在的整句分割點(diǎn)或文本框邊界作為該文本信息的長(zhǎng)度邊界。
[0097] 其中,該文本信息可以包括位于輸入光標(biāo)之前的上文文本信息,或者位于輸入光 標(biāo)之后的下文文本信息,當(dāng)然,如果輸入光標(biāo)的前后都存在文本信息,也可以同時(shí)獲取上文 文本信息和下文文本信息。
[0098] 步驟102,提取文本信息中的關(guān)鍵詞。
[0099] 在本實(shí)施例中可以預(yù)先設(shè)置關(guān)鍵詞元詞表,該關(guān)鍵詞元詞表是一個(gè)集合,其中包 含可以作為關(guān)鍵詞的詞條??梢约s定凡是出現(xiàn)在該關(guān)鍵詞元詞表中的詞條都可以作為關(guān)鍵 詞,不在這個(gè)關(guān)鍵詞元詞表中的詞條都不作為關(guān)鍵詞。
[0100] 在本步驟中即可提取文本信息中所有屬于該關(guān)鍵詞元詞表中的詞條作為關(guān)鍵詞。 具體的,對(duì)于上文文本信息,可以從輸入光標(biāo)處開(kāi)始,向前到整句的分割點(diǎn)或者文本框邊界 結(jié)束,利用動(dòng)態(tài)規(guī)劃算法進(jìn)行遍歷得到上文文本信息中的關(guān)鍵詞,對(duì)于下文文本信息,可以 輸入光標(biāo)處開(kāi)始,向后到整句的分割點(diǎn)或者文本框邊界結(jié)束,利用動(dòng)態(tài)規(guī)劃算法進(jìn)行遍歷 得到下文文本信息中的關(guān)鍵詞。上文文本信息中的關(guān)鍵詞和下文文本信息中的關(guān)鍵詞可以 分別存入不同的集合,或者進(jìn)行區(qū)分標(biāo)注,以便于后續(xù)搜索上屏候選詞,具體請(qǐng)參見(jiàn)后續(xù)實(shí) 施例的描述。
[0101] 按照上述方法提取的文本信息中的關(guān)鍵詞可以有一個(gè)也可能有多個(gè),可能關(guān)鍵詞 均位于上文文本信息,也可能關(guān)鍵詞均位于下文文本信息,還可能上文文本信息和下文文 本信息中均存在關(guān)鍵詞。
[0102] 步驟103,查找關(guān)鍵詞的聯(lián)想候選詞庫(kù),獲得輸入光標(biāo)處的上屏候選詞隊(duì)列。
[0103] 在獲得文本信息的關(guān)鍵詞后,可以根據(jù)該關(guān)鍵詞查找對(duì)應(yīng)的聯(lián)想候選詞庫(kù),從而 獲得輸入光標(biāo)處的上屏候選詞隊(duì)列。
[0104] 其中一種方式,可以是每個(gè)關(guān)鍵詞對(duì)應(yīng)一個(gè)聯(lián)想候選詞庫(kù),該聯(lián)想候選詞庫(kù)內(nèi)的 上屏候選詞按照使用概率由大到小進(jìn)行排序,查詢多個(gè)關(guān)鍵詞的聯(lián)想候選詞庫(kù)時(shí),可以將 各詞庫(kù)中的上屏候選詞按照重復(fù)率由高到底排列,從而獲得輸入光標(biāo)處的上屏候選隊(duì)列。
[0105] 另一種方式,還可以是預(yù)先建立語(yǔ)言模型及其聯(lián)想候選詞庫(kù)。該語(yǔ)言模型可以是 基于關(guān)鍵詞與輸入光標(biāo)之間的多種距離關(guān)系建立的;也可以是基于關(guān)鍵詞所屬的應(yīng)用屬 性建立的,其中,應(yīng)用屬性可以是用戶對(duì)關(guān)鍵詞的使用習(xí)慣,也可以是關(guān)鍵詞所屬的應(yīng)用領(lǐng) 域,如時(shí)間、地理位置、節(jié)日祝福語(yǔ)等領(lǐng)域,也可以是關(guān)鍵詞所屬的常用詞匯,還可以是關(guān)鍵 詞所屬的話題情景等。在執(zhí)行本步驟時(shí),可以只確定上步驟提取的關(guān)鍵詞對(duì)應(yīng)的一種語(yǔ)言 模型,然后根據(jù)該確定出的語(yǔ)言模型的聯(lián)想候選詞庫(kù)獲得輸入光標(biāo)處的上屏候選詞隊(duì)列; 也可以確定出所提取關(guān)鍵詞對(duì)應(yīng)的多種語(yǔ)言模型,然后將多種語(yǔ)言模型的聯(lián)想候選詞庫(kù)進(jìn) 行合并,確定出最終的輸入光標(biāo)處的上屏候選詞隊(duì)列。具體請(qǐng)參見(jiàn)后續(xù)實(shí)施例的描述。
[0106] 當(dāng)然還可以存在其它方式,此處不再一一列舉。
[0107] 步驟104,輸出上屏候選詞隊(duì)列。
[0108] 在獲得上屏候選詞隊(duì)列后,可以直接輸出該上屏候選詞隊(duì)列供用戶選擇,也可以 首先對(duì)該上屏候選詞隊(duì)列進(jìn)行調(diào)序后再輸出調(diào)序后的上屏候選詞隊(duì)列,調(diào)序方法有多種。
[0109] 本發(fā)明實(shí)施例通過(guò)獲取輸入光標(biāo)處的文本信息,并基于該文本信息中的關(guān)鍵詞確 定出上屏詞候選隊(duì)列,解決了現(xiàn)有技術(shù)中輸入光標(biāo)改變位置后由于無(wú)法獲取可靠上屏詞條 而無(wú)法聯(lián)想給出上屏候選詞的問(wèn)題。該方法不僅能夠在輸入光標(biāo)移動(dòng)時(shí)獲得可靠的上屏候 選詞,而且,該輸入方法不單單依靠上一次的上屏詞條聯(lián)想給出上屏候選詞隊(duì)列,而是可以 利用輸入光標(biāo)前、后的文本信息,以及遠(yuǎn)距離的文本信息來(lái)聯(lián)想給出上屏候選詞隊(duì)列,該方 法可以更全面、更正確的理解用戶的輸入意圖,從而可以給出更可靠的上屏候選詞隊(duì)列。 [0110] 在本發(fā)明的另一實(shí)施例中,如前所述,在執(zhí)行步驟103查找關(guān)鍵詞的聯(lián)想候選詞 庫(kù),獲得輸入光標(biāo)處的上屏候選詞隊(duì)列時(shí),其中一種方式可以如圖2所示,包括以下步驟:
[0111] 步驟201,建立語(yǔ)言模型及其聯(lián)想候選詞庫(kù)。
[0112] 首先,本步驟無(wú)需在每次獲得輸入光標(biāo)處的上屏候選詞隊(duì)列時(shí)重復(fù)執(zhí)行,只在初 始狀態(tài)執(zhí)行一次即可。
[0113] 本步驟中建立的語(yǔ)言模型可以有多種,本實(shí)施例中,可以包括系統(tǒng)模型,用戶模 型,垂直模型,常見(jiàn)詞語(yǔ)言模型,情景模型。
[0114] 系統(tǒng)模型是針對(duì)關(guān)鍵詞與輸入光標(biāo)之間的距離關(guān)系建立的語(yǔ)言模型;用戶模型, 垂直模型,常見(jiàn)詞語(yǔ)言模型,情景模型均是針對(duì)關(guān)鍵詞所屬的應(yīng)用屬性建立的語(yǔ)言模型。其 中,用戶模型是針對(duì)用戶對(duì)關(guān)鍵詞的使用習(xí)慣建立的模型;垂直模型是針對(duì)關(guān)鍵詞所屬的 應(yīng)用領(lǐng)域,如時(shí)間、地理位置、節(jié)日祝福語(yǔ)等領(lǐng)域建立的模型;常見(jiàn)詞語(yǔ)言模型是針對(duì)關(guān)鍵 詞所屬的常用詞匯建立的模型;情景模型是針對(duì)關(guān)鍵詞所屬的話題情景建立的模型。下面 對(duì)各模型分別進(jìn)行介紹。
[0115] 1)系統(tǒng)模型包括鄰近二元語(yǔ)言模型,遠(yuǎn)距離二元語(yǔ)言模型及三元語(yǔ)言模型。該系 統(tǒng)模型及其聯(lián)想候選詞庫(kù)的建立過(guò)程,如圖3所示,可以包括:
[0116] 步驟301,收集訓(xùn)練語(yǔ)料。
[0117] 步驟302,提取訓(xùn)練語(yǔ)料中的訓(xùn)練候選詞及訓(xùn)練關(guān)鍵詞。
[0118] 針對(duì)每一個(gè)訓(xùn)練語(yǔ)料均按照關(guān)鍵詞元詞表來(lái)提取關(guān)鍵詞,作為訓(xùn)練關(guān)鍵詞,并設(shè) 定訓(xùn)練語(yǔ)料中的某一位置的詞條作為訓(xùn)練候選詞,其中,為了訓(xùn)練得到不同的系統(tǒng)模型,需 要訓(xùn)練關(guān)鍵詞與訓(xùn)練候選詞之間的距離關(guān)系包括鄰接關(guān)系和非鄰接關(guān)系,且訓(xùn)練關(guān)鍵詞至 少為一個(gè)。
[0119] 其中,鄰接關(guān)系是指訓(xùn)練關(guān)鍵詞語(yǔ)訓(xùn)練候選詞之間沒(méi)有間隔或者是僅間隔停用 字,非鄰接關(guān)系反之。停用字是指輔助用戶的字詞,例如語(yǔ)氣詞,"哈""了""嗯"等。
[0120] 步驟303,對(duì)訓(xùn)練候選詞及訓(xùn)練關(guān)鍵詞進(jìn)行模型訓(xùn)練,獲得語(yǔ)言模型及其對(duì)應(yīng)的聯(lián) 想候選詞庫(kù)。
[0121] 該模型訓(xùn)練的過(guò)程與現(xiàn)有技術(shù)中鄰近二元語(yǔ)言模型的訓(xùn)練過(guò)程類(lèi)似,此處不再贅 述。
[0122] 在模型訓(xùn)練后即可獲得鄰近二元語(yǔ)言模型,遠(yuǎn)距離二元語(yǔ)言模型及三元語(yǔ)言模 型,及各模型的聯(lián)想候選詞庫(kù)。
[0123] 其中,鄰近二元語(yǔ)言模型用來(lái)解決鄰接的關(guān)鍵詞與上屏候選詞的二元關(guān)系,該鄰 接關(guān)系可能是上文文本信息中的關(guān)鍵詞與上屏候選詞之間的關(guān)系,也可能是上屏候選詞與 下文文本信息中的關(guān)鍵詞之間的關(guān)系。例如,舉行?晚宴,舉行是上屏候選詞,晚宴是下文 文本信息中的關(guān)鍵詞。鄰近二元語(yǔ)言模型是確定性較高的語(yǔ)言模型,缺點(diǎn)是信息量較少,能 夠預(yù)測(cè)出的候選過(guò)多,難以從中選擇用戶想要的。
[0124] 遠(yuǎn)距離二元語(yǔ)言模型用來(lái)解決非鄰接關(guān)系的關(guān)鍵詞與上屏候選詞之間的二元關(guān) 系,該遠(yuǎn)距離關(guān)系可能是上文文本信息中的關(guān)鍵詞與上屏候選詞之間的關(guān)系,也可能是上 屏候選詞與下文文本信息中的關(guān)鍵詞之間的關(guān)系。與鄰近二元語(yǔ)言模型不同的是,遠(yuǎn)距離 二元不需要兩個(gè)元詞是相鄰的;例如,關(guān)鍵詞"蘋(píng)果"和上屏候選詞"梨"。遠(yuǎn)距離二元語(yǔ)言 模型是兩個(gè)元詞共現(xiàn)關(guān)系的一種體現(xiàn),它往往表征著兩個(gè)元詞之間的關(guān)聯(lián)度。
[0125] 三元語(yǔ)言模型用來(lái)解決兩個(gè)關(guān)鍵詞與上屏候選詞之間的三元關(guān)系,給出兩個(gè)關(guān)鍵 詞對(duì)上屏候選詞的預(yù)測(cè)。該兩個(gè)關(guān)鍵詞與上屏候選詞之間的預(yù)測(cè)關(guān)系可能是兩個(gè)上文文本 信息中的關(guān)鍵詞對(duì)上屏候選詞的預(yù)測(cè),或者,兩個(gè)下文文本信息中的關(guān)鍵詞對(duì)上屏候選詞 之間的預(yù)測(cè),還或者,上、下文文本信息中各出現(xiàn)一個(gè)關(guān)鍵詞以兩邊夾的方式對(duì)中間上屏候 選詞的預(yù)測(cè)。兩個(gè)上文文本信息中的關(guān)鍵詞對(duì)上屏候選詞的預(yù)測(cè),例如:"會(huì)議在晚上(召 開(kāi))"召開(kāi)"為上屏候選詞,"會(huì)議?召開(kāi)"是一個(gè)比較顯著的遠(yuǎn)距離二元,"召開(kāi)"作為上 屏候選詞的排位靠前;"在晚上?召開(kāi)"雖然二元關(guān)系顯著,但是排位在百位以后;如果只 根據(jù)現(xiàn)有技術(shù)中的鄰接二元關(guān)系,"召開(kāi)"這個(gè)上屏候選詞很可能被遺漏掉,而通過(guò)引進(jìn)該 三元語(yǔ)言模型"A?B?C",A表示遠(yuǎn)距離上文文本信息中的某一個(gè)關(guān)鍵詞,B表示近距離 /鄰接的關(guān)鍵詞,C則為上屏候選詞,即可獲得可靠的上屏候選詞。另外一種情況,如果輸入 光標(biāo)前后各提出關(guān)鍵詞"腳本"和"指南",那么"腳本?學(xué)習(xí)?指南"則會(huì)被利用來(lái)預(yù)測(cè)上 屏候選詞"學(xué)習(xí)"。
[0126] 2)用戶模型包括用戶二元模型,用戶三元模型,遠(yuǎn)距離用戶二元模型。其中,用戶 二元模型用于解決前一次用戶上屏與下一次用戶上屏存在的用戶二元關(guān)系;用戶三元模型 用于解決連續(xù)三次用戶上屏存在的用戶三元關(guān)系;遠(yuǎn)距離用戶二元模型用于解決一定距離 內(nèi)用戶上屏詞與本次用戶上屏詞存在的遠(yuǎn)距離二元關(guān)系。該用戶模型是基于對(duì)用戶對(duì)詞條 的使用習(xí)慣進(jìn)行統(tǒng)計(jì)所獲得的模型,每種模型對(duì)應(yīng)統(tǒng)計(jì)有各自的聯(lián)想候選詞庫(kù)。
[0127] 3)垂直模型包括諸多個(gè)垂直領(lǐng)域的語(yǔ)言模型,這些語(yǔ)言模型與詞條所屬領(lǐng)域的分 類(lèi)有關(guān),例如,時(shí)間相關(guān)的領(lǐng)域系統(tǒng)二元語(yǔ)言模型,例如,"晚上"對(duì)應(yīng)的垂直模型的聯(lián)系候 選詞庫(kù)中包含"9點(diǎn)、10點(diǎn)、11點(diǎn)","周六"對(duì)應(yīng)的垂直模型的聯(lián)系候選詞庫(kù)中包含"上午、 下午";位置相關(guān)的領(lǐng)域語(yǔ)言模型,例如,"五道口 "對(duì)應(yīng)的垂直模型的聯(lián)系候選詞庫(kù)中包含 "清華同方、日昌、華聯(lián)"等;量詞相關(guān)的領(lǐng)域語(yǔ)言模型;推薦相關(guān)的領(lǐng)域語(yǔ)言模型;輸入app 環(huán)境的領(lǐng)域語(yǔ)言模型;稱(chēng)謂、人名相關(guān)的領(lǐng)域語(yǔ)言模型;節(jié)日相關(guān)祝福語(yǔ)領(lǐng)域語(yǔ)言模型等, 各垂直模型是基于詞條所屬領(lǐng)域進(jìn)行統(tǒng)計(jì)所獲得的模型,每種模型對(duì)應(yīng)統(tǒng)計(jì)有各自的聯(lián)想 候選詞庫(kù)。
[0128] 4)常見(jiàn)詞語(yǔ)言模型(系統(tǒng)詞語(yǔ)言模型)用來(lái)覆蓋對(duì)一個(gè)實(shí)體詞不完整輸入的情 況,完成其對(duì)完整詞條后綴的預(yù)測(cè),該模型是基于對(duì)常見(jiàn)詞條進(jìn)行統(tǒng)計(jì)所獲得的模型;例 如,上文文本信息中的關(guān)鍵詞是"笑傲",則給出的上屏候選詞為"江湖"。
[0129] 5)情景模型是針對(duì)關(guān)鍵詞所屬的話題情景所建立的模型。例如,會(huì)議情景,聚餐情 景等,每個(gè)關(guān)鍵詞都具有一個(gè)或多個(gè)情景特征標(biāo)簽,每種情景特征標(biāo)簽對(duì)應(yīng)一個(gè)情景模型, 每種情景模型都具有各自的聯(lián)想候選詞庫(kù)。
[0130] 在預(yù)先建立上述語(yǔ)言模型后即可執(zhí)行步驟202。
[0131] 步驟202,根據(jù)關(guān)鍵詞與輸入光標(biāo)之間的距離關(guān)系和/或關(guān)鍵詞所屬的應(yīng)用屬性 確定關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型。
[0132] 本步驟中可以根據(jù)關(guān)鍵詞與輸入光標(biāo)之間的距離關(guān)系確定關(guān)鍵詞對(duì)應(yīng)的系統(tǒng)模 型,若提取的關(guān)鍵詞為一個(gè),則當(dāng)關(guān)鍵詞與輸入光標(biāo)之間的距尚關(guān)系為鄰接關(guān)系時(shí),確定關(guān) 鍵詞對(duì)應(yīng)的語(yǔ)言模型為近距離二元語(yǔ)言模型;當(dāng)距離關(guān)系為非鄰接關(guān)系時(shí)確定關(guān)鍵詞對(duì)應(yīng) 的語(yǔ)言模型為遠(yuǎn)距離二元語(yǔ)言模型;當(dāng)關(guān)鍵詞為兩個(gè)時(shí),確定關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為三 元語(yǔ)言模型。
[0133] 也可以根據(jù)關(guān)鍵詞所屬的某一應(yīng)用屬性確定關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型,例如,根據(jù) 關(guān)鍵詞所屬的用戶使用習(xí)慣特征確定關(guān)鍵詞對(duì)應(yīng)的用戶模型;或者,根據(jù)關(guān)鍵詞所屬的應(yīng) 用領(lǐng)域確定關(guān)鍵詞對(duì)應(yīng)的垂直領(lǐng)域;或者,根據(jù)所述關(guān)鍵詞所屬的常用詞匯確定所述關(guān)鍵 詞對(duì)應(yīng)的常見(jiàn)詞語(yǔ)言模型;或者,根據(jù)關(guān)鍵詞所屬的話題情景確定關(guān)鍵詞對(duì)應(yīng)的情景模型 等。
[0134] 還可以同時(shí)確定關(guān)鍵詞對(duì)應(yīng)的多種語(yǔ)言模型,例如遠(yuǎn)距離二元模型、鄰接二元模 型、三元模型、用戶二元模型,以及常見(jiàn)詞語(yǔ)言模型等。
[0135] 步驟203,根據(jù)語(yǔ)言模型對(duì)應(yīng)的聯(lián)想候選詞庫(kù)獲得輸入光標(biāo)處的上屏候選詞隊(duì)列。
[0136] 對(duì)于系統(tǒng)規(guī)模、用戶模型、垂直模型,為了便于查找語(yǔ)言模型的聯(lián)想候選詞庫(kù)中的 上屏候選隊(duì)列,還可以在各聯(lián)想候選詞庫(kù)中按照常規(guī)方式建立索引,例如左元索引和右元 索引。當(dāng)關(guān)鍵詞來(lái)源于上文文本信息時(shí),可以利用語(yǔ)言模型的聯(lián)想候選詞庫(kù)中的左元索引 查找輸入光標(biāo)處的上屏候選詞隊(duì)列;當(dāng)關(guān)鍵詞來(lái)源于下文文本信息時(shí),可以利用語(yǔ)言模型 的聯(lián)想候選詞庫(kù)中的右元索引查找輸入光標(biāo)處的上屏候選詞隊(duì)列;當(dāng)關(guān)鍵詞來(lái)源于上、下 文文本信息時(shí),則會(huì)兼顧兩個(gè)方向的搜索,除此之外,還會(huì)增加以中間元的為搜索目標(biāo)的查 詢,為此,三元模型的聯(lián)想候選詞庫(kù)中會(huì)建立兩個(gè)二級(jí)索引,以便在兩個(gè)方向上搜索中間 元。對(duì)于常見(jiàn)詞模型,與現(xiàn)有聯(lián)想方式類(lèi)似,可以采用匹配前綴的方式獲得輸入光標(biāo)處的上 屏候選詞隊(duì)列。
[0137] 當(dāng)上步驟確定出的語(yǔ)言模型至少有兩個(gè)時(shí),該獲得輸入光標(biāo)處的上屏候選詞隊(duì)列 的過(guò)程,如圖4所示,還可以進(jìn)一步包括以下步驟:
[0138] 步驟401,確定各語(yǔ)言模型的聯(lián)想候選詞庫(kù)中的上屏候選詞。
[0139] 步驟402,根據(jù)各語(yǔ)言模型的預(yù)設(shè)權(quán)重,按照權(quán)重線性疊加合并上屏候選詞。
[0140] 步驟403,對(duì)合并后的上屏候選詞按照權(quán)重由高到低進(jìn)行排序獲得輸入光標(biāo)處的 上屏候選詞隊(duì)列。
[0141] 通過(guò)結(jié)合關(guān)鍵詞對(duì)應(yīng)的多種語(yǔ)言模型可以獲得更理想更可靠的上屏候選詞隊(duì)列。 例如,輸入光標(biāo)處的文本信息為"明天我到大連,我想去發(fā)現(xiàn)[光標(biāo)]",用戶的輸入意圖是 他想去發(fā)現(xiàn)王國(guó)這個(gè)游樂(lè)場(chǎng)。提取上文文本信息中的關(guān)鍵詞"大連"和"發(fā)現(xiàn)",其中"大連" 提示了用戶目的地的位置,該關(guān)鍵詞屬于垂直模型,那么結(jié)合關(guān)鍵詞"發(fā)現(xiàn)",即可獲得可靠 的上屏候選詞"王國(guó)"。
[0142] 在本發(fā)明的另一實(shí)施例中,在基于上述方式獲得上屏候選隊(duì)列后可以直接輸出該 上屏候選隊(duì)列供用戶選擇,也還可以在輸出該上屏候選隊(duì)列之前,對(duì)上屏候選隊(duì)列進(jìn)行調(diào) 序,然后再輸出調(diào)序后的上屏候選詞隊(duì)列。
[0143] 調(diào)序方式有多種,其中一種可以根據(jù)輸入光標(biāo)處的話題情景對(duì)上屏候選詞隊(duì)列進(jìn) 行調(diào)序的方法,如圖5所示,可以包括:
[0144] 步驟501,根據(jù)命中各情景特征標(biāo)簽的關(guān)鍵詞的個(gè)數(shù)及關(guān)鍵詞命中各情景特征標(biāo) 簽的概率和,確定各情景特征標(biāo)簽的特征得分。
[0145] 每一關(guān)鍵詞可能命中一個(gè)或多個(gè)情景特征標(biāo)簽,每個(gè)情景特征標(biāo)簽對(duì)應(yīng)一種話題 情景,而最終上屏結(jié)果中關(guān)鍵詞命中某一情景特征標(biāo)簽的概率可以根據(jù)統(tǒng)計(jì)獲得,因此,每 個(gè)情景特征標(biāo)簽i的特征得分featurei即可表示為:=
【權(quán)利要求】
1. 一種輸入方法,其特征在于,包括: 獲取輸入光標(biāo)處的文本信息,所述文本信息包括位于所述輸入光標(biāo)之前的上文文本信 息和/或位于所述輸入光標(biāo)之后的下文文本信息; 提取所述文本信息中的關(guān)鍵詞; 查找所述關(guān)鍵詞的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上屏候選詞隊(duì)列; 輸出所述上屏候選詞隊(duì)列。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取輸入光標(biāo)處的文本信息,包括: 當(dāng)檢測(cè)到所述輸入光標(biāo)位于文本框內(nèi),且停止文本輸入的時(shí)間超過(guò)時(shí)間閾值時(shí),獲取 所述輸入光標(biāo)處的文本信息。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取輸入光標(biāo)處的文本信息,包括: 以所述輸入光標(biāo)所在的整句分割點(diǎn)或文本框邊界作為所述文本信息的長(zhǎng)度邊界,獲取 所述輸入光標(biāo)處的文本信息。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述查找所述關(guān)鍵詞的聯(lián)想候選詞庫(kù),獲 得所述輸入光標(biāo)處的上屏候選詞隊(duì)列,包括: 根據(jù)所述關(guān)鍵詞與所述輸入光標(biāo)之間的距離關(guān)系和/或所述關(guān)鍵詞所屬的應(yīng)用屬性 確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型; 查找所述語(yǔ)言模型的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上屏候選詞隊(duì)列。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述關(guān)鍵詞與所述輸入光標(biāo)之 間的距離關(guān)系確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型,包括 : 若所述關(guān)鍵詞為一個(gè),則當(dāng)所述關(guān)鍵詞與所述輸入光標(biāo)之間的距離關(guān)系為鄰接關(guān)系 時(shí),確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為鄰近二元語(yǔ)言模型;當(dāng)所述距離關(guān)系為非鄰接關(guān)系 時(shí)確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為遠(yuǎn)距離二元語(yǔ)言模型; 當(dāng)所述關(guān)鍵詞為兩個(gè)時(shí),確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為三元語(yǔ)言模型。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,在所述根據(jù)所述關(guān)鍵詞與所述輸入光標(biāo) 之間的距離關(guān)系確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型之前,還包括: 建立語(yǔ)言模型及其聯(lián)想候選詞庫(kù),所述語(yǔ)言模型包括鄰近二元語(yǔ)言模型,遠(yuǎn)距離二元 語(yǔ)言模型及三元語(yǔ)言模型; 所述建立語(yǔ)言模型及其聯(lián)想候選詞庫(kù),包括: 收集訓(xùn)練語(yǔ)料; 提取所述訓(xùn)練語(yǔ)料中的訓(xùn)練候選詞及訓(xùn)練關(guān)鍵詞,所述訓(xùn)練關(guān)鍵詞與所述訓(xùn)練候選詞 之間的距離關(guān)系包括鄰接關(guān)系和非鄰接關(guān)系,所述訓(xùn)練關(guān)鍵詞至少為一個(gè); 對(duì)所述訓(xùn)練候選詞及所述訓(xùn)練關(guān)鍵詞進(jìn)行模型訓(xùn)練,獲得所述語(yǔ)言模型及其聯(lián)想候選 詞庫(kù)。
7. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述關(guān)鍵詞所屬的應(yīng)用屬性確 定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型,包括: 根據(jù)所述關(guān)鍵詞所屬的用戶使用習(xí)慣特征確定所述關(guān)鍵詞對(duì)應(yīng)的用戶模型;或者, 根據(jù)所述關(guān)鍵詞所屬的應(yīng)用領(lǐng)域確定所述關(guān)鍵詞對(duì)應(yīng)的垂直模型;或者; 根據(jù)所述關(guān)鍵詞所屬的常用詞匯確定所述關(guān)鍵詞對(duì)應(yīng)的常見(jiàn)詞語(yǔ)言模型;或者, 根據(jù)所述關(guān)鍵詞所屬的話題情景確定所述關(guān)鍵詞對(duì)應(yīng)的情景模型。
8. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述查找所述語(yǔ)言模型的聯(lián)想候選詞庫(kù), 獲得所述輸入光標(biāo)處的上屏候選詞隊(duì)列,包括: 當(dāng)所述語(yǔ)言模型至少有兩個(gè)時(shí),分別確定各所述語(yǔ)言模型的聯(lián)想候選詞庫(kù)中的上屏候 選詞; 根據(jù)各所述語(yǔ)言模型的預(yù)設(shè)權(quán)重,按照權(quán)重線性疊加合并所述上屏候選詞; 對(duì)合并后的上屏候選詞按照權(quán)重由高到低進(jìn)行排序獲得所述輸入光標(biāo)處的上屏候選 詞隊(duì)列。
9. 根據(jù)權(quán)利要求1至8中任意一項(xiàng)所述的方法,其特征在于,在所述輸出所述上屏候選 詞隊(duì)列之前,還包括: 根據(jù)所述輸入光標(biāo)處的話題情景對(duì)所述上屏候選詞隊(duì)列進(jìn)行調(diào)序; 所述輸出所述上屏候選詞隊(duì)列,包括: 輸出調(diào)序后的上屏候選詞隊(duì)列。
10. 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述根據(jù)所述輸入光標(biāo)處的話題情景對(duì) 所述上屏候選詞隊(duì)列進(jìn)行調(diào)序,包括: 根據(jù)命中各情景特征標(biāo)簽的所述關(guān)鍵詞的個(gè)數(shù)及所述關(guān)鍵詞命中所述各情景特征標(biāo) 簽的概率和,確定所述各情景特征標(biāo)簽的特征得分; 按照所述各情景特征標(biāo)簽的特征得分,由高到底對(duì)所述情景特征標(biāo)簽進(jìn)行排序; 按照所述情景特征標(biāo)簽的順序?qū)λ錾掀梁蜻x詞隊(duì)列進(jìn)行調(diào)序,其中,所述上屏候選 詞隊(duì)列中的上屏候選詞均具有各自的情景特征標(biāo)簽。
11. 一種輸入裝置,其特征在于,包括: 文本獲取單兀,用于獲取輸入光標(biāo)處的文本信息,所述文本信息包括位于所述輸入光 標(biāo)之前的上文文本信息和/或位于所述輸入光標(biāo)之后的下文文本信息; 關(guān)鍵詞提取單元,用于提取所述文本信息中的關(guān)鍵詞; 隊(duì)列獲取單元,用于查找所述關(guān)鍵詞的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上屏候 選詞隊(duì)列; 隊(duì)列輸出單元,用于輸出所述上屏候選詞隊(duì)列。
12. 根據(jù)權(quán)利要求11所述的裝置,其特征在于, 所述文本獲取單元,具體用于當(dāng)檢測(cè)到所述輸入光標(biāo)位于文本框內(nèi),且停止文本輸入 的時(shí)間超過(guò)時(shí)間閾值時(shí),獲取所述輸入光標(biāo)處的文本信息。
13. 根據(jù)權(quán)利要求11所述的裝置,其特征在于, 所述文本獲取單元,具體用于以所述輸入光標(biāo)所在的整句分割點(diǎn)或文本框邊界作為所 述文本信息的長(zhǎng)度邊界,獲取所述輸入光標(biāo)處的文本信息。
14. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述隊(duì)列獲取單元包括: 模型確定子單元,用于根據(jù)所述關(guān)鍵詞與所述輸入光標(biāo)之間的距離關(guān)系和/或所述關(guān) 鍵詞所屬的應(yīng)用屬性確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型; 隊(duì)列獲取子單元,用于查找所述語(yǔ)言模型的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上 屏候選詞隊(duì)列。
15. 根據(jù)權(quán)利要求14所述的裝置,其特征在于, 所述模型確定子單元,具體用于若所述關(guān)鍵詞為一個(gè),則當(dāng)所述關(guān)鍵詞與所述輸入光 標(biāo)之間的距離關(guān)系為鄰接關(guān)系時(shí),確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為鄰近二元語(yǔ)言模型; 當(dāng)所述距離關(guān)系為非鄰接關(guān)系時(shí)確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為遠(yuǎn)距離二元語(yǔ)言模型; 當(dāng)所述關(guān)鍵詞為兩個(gè)時(shí),確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型為三元語(yǔ)言模型。
16. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述隊(duì)列獲取單元還包括: 模型建立子單元,用于在所述模型確定子單元確定所述關(guān)鍵詞對(duì)應(yīng)的語(yǔ)言模型之前, 建立語(yǔ)言模型及其聯(lián)想候選詞庫(kù),所述語(yǔ)言模型包括鄰近二元語(yǔ)言模型,遠(yuǎn)距離二元語(yǔ)言 模型及三元語(yǔ)言模型; 所述模型建立子單元包括: 收集子單元,用于收集訓(xùn)練語(yǔ)料; 提取子單元,用于提取所述訓(xùn)練語(yǔ)料中的訓(xùn)練候選詞及訓(xùn)練關(guān)鍵詞,所述訓(xùn)練關(guān)鍵詞 與所述訓(xùn)練候選詞之間的距離關(guān)系包括鄰接關(guān)系和非鄰接關(guān)系,所述訓(xùn)練關(guān)鍵詞至少為一 個(gè); 訓(xùn)練子單元,用于對(duì)所述訓(xùn)練候選詞及所述訓(xùn)練關(guān)鍵詞進(jìn)行模型訓(xùn)練,獲得所述語(yǔ)言 模型及其聯(lián)想候選詞庫(kù)。
17. 根據(jù)權(quán)利要求14所述的裝置,其特征在于, 所述模型確定子單元,具體用于根據(jù)所述關(guān)鍵詞所屬的用戶使用習(xí)慣特征確定所述關(guān) 鍵詞對(duì)應(yīng)的用戶模型;或者,根據(jù)所述關(guān)鍵詞所屬的應(yīng)用領(lǐng)域確定所述關(guān)鍵詞對(duì)應(yīng)的垂直 模型;或者;根據(jù)所述關(guān)鍵詞所屬的常用詞匯確定所述關(guān)鍵詞對(duì)應(yīng)的常見(jiàn)詞語(yǔ)言模型;或 者,根據(jù)所述關(guān)鍵詞所屬的話題情景確定所述關(guān)鍵詞對(duì)應(yīng)的情景模型。
18. 根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述隊(duì)列獲取子單元包括: 確定子單元,用于當(dāng)所述語(yǔ)言模型至少有兩個(gè)時(shí),分別確定各所述語(yǔ)言模型的聯(lián)想候 選詞庫(kù)中的上屏候選詞; 合并子單元,用于根據(jù)各所述語(yǔ)言模型的預(yù)設(shè)權(quán)重,按照權(quán)重線性疊加合并所述上屏 候選詞; 排序子單元,用于對(duì)合并后的上屏候選詞按照權(quán)重由高到低進(jìn)行排序獲得所述輸入光 標(biāo)處的上屏候選詞隊(duì)列。
19. 根據(jù)權(quán)利要求11至18中任意一項(xiàng)所述的裝置,其特征在于,所述裝置還包括: 隊(duì)列調(diào)序單元,用于在所述隊(duì)列輸出單元輸出所述上屏候選詞隊(duì)列之前,根據(jù)所述輸 入光標(biāo)處的話題情景對(duì)所述上屏候選詞隊(duì)列進(jìn)行調(diào)序; 所述隊(duì)列輸出單元,用于輸出調(diào)序后的上屏候選詞隊(duì)列。
20. 根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述隊(duì)列調(diào)序單元包括: 得分計(jì)算子單元,用于根據(jù)命中各情景特征標(biāo)簽的所述關(guān)鍵詞的個(gè)數(shù)及所述關(guān)鍵詞命 中所述各情景特征標(biāo)簽的概率和,確定所述各情景特征標(biāo)簽的特征得分; 情景排序子單元,用于按照所述各情景特征標(biāo)簽的特征得分,由高到底對(duì)所述情景特 征標(biāo)簽進(jìn)行排序; 調(diào)序子單元,用于按照所述情景特征標(biāo)簽的順序?qū)λ錾掀梁蜻x詞隊(duì)列進(jìn)行調(diào)序,其 中,所述上屏候選詞隊(duì)列中的上屏候選詞均具有各自的情景特征標(biāo)簽。
21. -種電子設(shè)備,其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)指 令或代碼,所述處理器和所述存儲(chǔ)器耦合,用于執(zhí)行所述存儲(chǔ)器中的計(jì)算機(jī)指令或代碼,實(shí) 現(xiàn)以下方法: 獲取輸入光標(biāo)處的文本信息,所述文本信息包括位于所述輸入光標(biāo)之前的上文文本信 息和/或位于所述輸入光標(biāo)之后的下文文本信息; 提取所述文本信息中的關(guān)鍵詞; 查找所述關(guān)鍵詞的聯(lián)想候選詞庫(kù),獲得所述輸入光標(biāo)處的上屏候選詞隊(duì)列; 輸出所述上屏候選詞隊(duì)列。
【文檔編號(hào)】G06F17/30GK104281649SQ201410455924
【公開(kāi)日】2015年1月14日 申請(qǐng)日期:2014年9月9日 優(yōu)先權(quán)日:2014年9月9日
【發(fā)明者】崔欣, 任尚昆, 唐拯, 張揚(yáng) 申請(qǐng)人:北京搜狗科技發(fā)展有限公司