亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

輸入法詞庫的創(chuàng)建及加載方法、裝置、終端及服務器的制造方法

文檔序號:9887164閱讀:487來源:國知局
輸入法詞庫的創(chuàng)建及加載方法、裝置、終端及服務器的制造方法
【技術(shù)領(lǐng)域】
[0001]本公開涉及計算機技術(shù)領(lǐng)域,特別涉及一種輸入法詞庫的創(chuàng)建及加載方法、裝置、終端及服務器。
【背景技術(shù)】
[0002]隨著科學技術(shù)的不斷發(fā)展,計算機人工智能技術(shù)變得日益完善和成熟,人工智能技術(shù)越來越廣泛的應用于人們的日常生活和工作中,使人們的生活越來越便利。目前,很多智能終端設(shè)備都安裝有輸入法程序,具有輸入文字的功能。每種輸入法都具有多個不同類別的字庫,以方便用戶輸入一些專業(yè)詞匯或者使用頻率較高的詞匯。
[0003]在相關(guān)技術(shù)中,用戶只能手動添加有限的輸入法詞庫,無法隨時獲取與指定網(wǎng)站(如,用戶當前正在瀏覽的網(wǎng)站)相關(guān)的輸入法詞庫。從而降低了用戶使用輸入法輸入文字的效率。

【發(fā)明內(nèi)容】

[0004]本公開提供一種輸入法詞庫的創(chuàng)建及加載方法、裝置、終端及服務器,以解決相關(guān)技術(shù)中用戶使用輸入法輸入文字的效率低下的問題。
[0005]根據(jù)本公開實施例的第一方面,提供一種輸入法詞庫的創(chuàng)建方法,包括:
[0006]獲取指定網(wǎng)站的網(wǎng)頁的文本信息;
[0007]基于所述文本信息提取頻繁字符串,所述頻繁字符串出現(xiàn)的頻繁程度大于等于預定的頻繁程度;
[0008]獲取所述頻繁字符串中的命名實體;
[0009 ]基于所述命名實體創(chuàng)建所述指定網(wǎng)站的輸入法關(guān)聯(lián)詞庫。
[0010]可選的,所述基于所述文本信息提取頻繁字符串,包括:
[0011]構(gòu)建對應于所述文本信息的后綴樹;
[0012]基于所述后綴樹提取詞頻大于等于預定詞頻的字符串作為頻繁字符串。
[0013]可選的,所述構(gòu)建對應于所述文本信息的后綴樹,包括:
[0014]解析出所述文本信息中的句子;
[0015]獲取每個所述句子的全部后綴,以生成后綴集合;
[0016]基于所述后綴集合構(gòu)建后綴樹。
[0017]可選的,所述獲取所述頻繁字符串中的命名實體,包括:
[0018]對所述頻繁字符串進行過濾停用詞的處理,以得到處理后的頻繁字符串;
[0019]獲取所述處理后的頻繁字符串中的命名實體。
[0020]可選的,所述獲取所述處理后的頻繁字符串中的命名實體,包括:
[0021]從所述文本信息中獲取所述處理后的頻繁字符串所屬的句子;
[0022]基于所述處理后的頻繁字符串所屬的句子,采用條件隨機場CRF算法識別出所述處理后的頻繁字符串中的命名實體。
[0023]可選的,所述基于所述命名實體創(chuàng)建所述指定網(wǎng)站的輸入法關(guān)聯(lián)詞庫,包括:
[0024]計算每個所述命名實體在所述指定網(wǎng)站中的權(quán)重值;
[0025]提取出所述權(quán)重值大于等于預定權(quán)重值的命名實體;
[0026]將提取出的所述命名實體作為元素,創(chuàng)建所述指定網(wǎng)站的輸入法關(guān)聯(lián)詞庫。
[0027]根據(jù)本公開實施例的第二方面,提供一種用于加載輸入法詞庫的方法,包括:
[0028]判斷是否加載有當前瀏覽的網(wǎng)站的輸入法關(guān)聯(lián)詞庫;
[0029]若未加載所述輸入法關(guān)聯(lián)詞庫,基于所述網(wǎng)站的網(wǎng)站標識從預存的輸入法詞庫中查找所述輸入法關(guān)聯(lián)詞庫;
[0030]若未查找出所述輸入法關(guān)聯(lián)詞庫,創(chuàng)建所述輸入法關(guān)聯(lián)詞庫;
[0031 ]將創(chuàng)建的所述輸入法關(guān)聯(lián)詞庫加載到內(nèi)存中,以供輸入法程序調(diào)用;
[0032]其中,所述輸入法關(guān)聯(lián)詞庫通過如下方法創(chuàng)建:
[0033]獲取當前瀏覽的網(wǎng)站的網(wǎng)頁的文本信息;
[0034]基于所述文本信息提取頻繁字符串,所述頻繁字符串出現(xiàn)的頻繁程度大于等于預定的頻繁程度;
[0035]獲取所述頻繁字符串中的命名實體;
[0036]基于所述命名實體創(chuàng)建所述當前瀏覽的網(wǎng)站的輸入法關(guān)聯(lián)詞庫。
[0037]可選的,所述方法還包括:
[0038]將創(chuàng)建的所述輸入法關(guān)聯(lián)詞庫與所述輸入法關(guān)聯(lián)詞庫的相關(guān)信息進行關(guān)聯(lián)地存儲,其中,所述輸入法關(guān)聯(lián)詞庫的相關(guān)信息包括所述輸入法關(guān)聯(lián)詞庫對應的網(wǎng)站的網(wǎng)站標識。
[0039]可選的,所述輸入法關(guān)聯(lián)詞庫的相關(guān)信息還包括所述輸入法關(guān)聯(lián)詞庫的創(chuàng)建時間;
[0040]所述方法還包括:
[0041]基于已存儲的所述輸入法關(guān)聯(lián)詞庫對應的創(chuàng)建時間,檢測出已過預定使用期的所述輸入法關(guān)聯(lián)詞庫;
[0042]刪除所述已過預定使用期的所述輸入法關(guān)聯(lián)詞庫。
[0043]根據(jù)本公開實施例的第三方面,提供一種用于加載輸入法詞庫的方法,包括:
[0044]接收終端發(fā)送的獲取指定網(wǎng)站的輸入法關(guān)聯(lián)詞庫的請求;
[0045]基于所述請求中包含的所述指定網(wǎng)站的網(wǎng)站標識從預存的輸入法詞庫中查找已創(chuàng)建的所述輸入法關(guān)聯(lián)詞庫;
[0046]若未查找出所述輸入法關(guān)聯(lián)詞庫,創(chuàng)建所述輸入法關(guān)聯(lián)詞庫;
[0047]向所述終端發(fā)送創(chuàng)建的所述輸入法關(guān)聯(lián)詞庫,以供所述終端加載所述輸入法關(guān)聯(lián)詞庫;
[0048]其中,所述輸入法關(guān)聯(lián)詞庫通過如下方法創(chuàng)建:
[0049]獲取所述指定網(wǎng)站的網(wǎng)頁的文本信息;
[0050]基于所述文本信息提取頻繁字符串,所述頻繁字符串出現(xiàn)的頻繁程度大于等于預定的頻繁程度;
[0051 ]獲取所述頻繁字符串中的命名實體;
[0052]基于所述命名實體創(chuàng)建所述指定網(wǎng)站的輸入法關(guān)聯(lián)詞庫。
[0053]可選的,所述方法還包括:
[0054]將創(chuàng)建的所述輸入法關(guān)聯(lián)詞庫與所述輸入法關(guān)聯(lián)詞庫的相關(guān)信息進行關(guān)聯(lián)地存儲,其中,所述輸入法關(guān)聯(lián)詞庫的相關(guān)信息包括所述輸入法關(guān)聯(lián)詞庫對應的網(wǎng)站的網(wǎng)站標識。
[0055]可選的,所述方法還包括:
[0056]所述輸入法關(guān)聯(lián)詞庫的相關(guān)信息還包括所述輸入法關(guān)聯(lián)詞庫的創(chuàng)建時間;
[0057]所述方法還包括:
[0058]基于已存儲的所述輸入法關(guān)聯(lián)詞庫對應的創(chuàng)建時間,檢測出已過預定使用期的所述輸入法關(guān)聯(lián)詞庫;
[0059]更新所述已過預定使用期的所述輸入法關(guān)聯(lián)詞庫。
[0060]根據(jù)本公開實施例的第四方面,提供一種輸入法詞庫的創(chuàng)建裝置,包括:
[0061]第一獲取模塊,被配置為獲取指定網(wǎng)站的網(wǎng)頁的文本信息;
[0062]提取模塊,被配置為基于所述文本信息提取頻繁字符串,所述頻繁字符串出現(xiàn)的頻繁程度大于等于預定的頻繁程度;
[0063]第二獲取模塊,被配置為獲取所述頻繁字符串中的命名實體;
[0064]創(chuàng)建模塊,被配置為基于所述命名實體創(chuàng)建所述指定網(wǎng)站的輸入法關(guān)聯(lián)詞庫。
[0065]可選的,所述提取模塊包括:
[0066]構(gòu)建子模塊,被配置為構(gòu)建對應于所述文本信息的后綴樹;
[0067]頻繁字符串提取子模塊,被配置為基于所述后綴樹提取詞頻大于等于預定詞頻的字符串作為頻繁字符串。
[0068]可選的,所述構(gòu)建子模塊包括:
[0069]解析子模塊,被配置為解析出所述文本信息中的句子;
[0070]生成子模塊,被配置為獲取每個所述句子的全部后綴,以生成后綴集合;
[0071 ]后綴樹構(gòu)建子模塊,被配置為基于所述后綴集合構(gòu)建后綴樹。
[0072]可選的,所述第二獲取模塊包括:
[0073]過濾子模塊,被配置為對所述頻繁字符串進行過濾停用詞的處理,以得到處理后的頻繁字符串;
[0074]命名實體獲取子模塊,被配置為獲取所述處理后的頻繁字符串中的命名實體。
[0075]可選的,所述命名實體獲取子模塊包括:
[0076]句子獲取子模塊,被配置為從所述文本信息中獲取所述處理后的頻繁字符串所屬的句子;
[0077]識別子模塊,被配置為基于所述處理后的頻繁字符串所屬的句子,采用條件隨機場CRF算法識別出所述處理后的頻繁字符串中的命名實體。
[0078]可選的,所述創(chuàng)建模塊包括:
[0079]計算子模塊,被配置為計算每個所述命名實體在所述指定網(wǎng)站中的權(quán)重值;
[0080]提取子模塊,被配置為提取出所述權(quán)重值大于等于預定權(quán)重值的命名實體;
[0081]詞庫創(chuàng)建子模塊,被配置為將提取出的所述命名實體作為元素,創(chuàng)建所述指定網(wǎng)站的輸入法關(guān)聯(lián)詞庫。
[0082]根據(jù)本公開實施例的第五方面,提供一種用于加載輸入法詞庫的裝置,包括:
[0083]判斷模塊,被配置為判斷是否加載有當前瀏覽的網(wǎng)站的輸入法關(guān)聯(lián)詞庫;
[0084]查找模塊,被配置為在未加載所述輸入法關(guān)聯(lián)詞庫時,基于所述網(wǎng)站的網(wǎng)站標識從預存的輸入法詞庫中查找所述輸入法關(guān)聯(lián)詞庫;
[0085]詞庫創(chuàng)建模塊,被配置為在未查找出所述輸入法關(guān)聯(lián)詞庫時,創(chuàng)建所述輸入法關(guān)聯(lián)詞庫;
[0086]加載模塊,被配置為將創(chuàng)建的所述輸入法關(guān)聯(lián)詞庫加載到內(nèi)存中,以供輸入法程序調(diào)用;
[0087]其中,所述詞庫創(chuàng)建模塊包括:
[0088]第一獲取模塊,被配置為獲取當前瀏覽的網(wǎng)站的網(wǎng)頁的文本信息;
[0089]提取模塊,被配置為基于所述文本信息提取頻繁字符串,所述頻繁字符串出現(xiàn)的頻繁程度大于等于預定的頻繁程度;
[0090]第二獲取模塊,被配置為獲取所述頻繁字符串中的命名實體;
[0091]創(chuàng)建模塊,被配置為基于所述命名實體創(chuàng)建所述當前瀏覽的網(wǎng)站的輸入法關(guān)聯(lián)詞庫。
[0092]可選的,所述裝置還包括:
[0093]存儲模塊,被配置為將創(chuàng)建的所述輸入法關(guān)聯(lián)詞庫與所述輸入法關(guān)聯(lián)詞庫的相關(guān)信息進行關(guān)聯(lián)地存儲,其中,所述輸入法關(guān)聯(lián)詞庫的相關(guān)信息包括所述輸入法關(guān)聯(lián)詞庫對應的網(wǎng)站的網(wǎng)站標識。
[0094]可選的,所述輸入法關(guān)聯(lián)詞庫相關(guān)信息還包括所述輸入法關(guān)聯(lián)詞庫的創(chuàng)建時間;
[0095]所述裝置還包括:
[0096]檢測模塊,被配置為基于已存儲的所述輸入法關(guān)聯(lián)詞庫對應的創(chuàng)建時間,檢測出已過預定使用期的所述輸入法關(guān)聯(lián)詞庫;
[0097]刪除模塊,被配置為刪除所述已過預定使用期的所述輸入法關(guān)聯(lián)詞庫。
[0098]根據(jù)本公開實施例的第六方面,提供一種用于加載輸入法詞庫的裝置,包括:
[0099]接收模塊,被配置為接收終端發(fā)送的獲取指定網(wǎng)站的輸入法關(guān)聯(lián)詞庫的請求;
[0100]查找模塊,被配置為基于所述請求中包含的所述指定網(wǎng)站的網(wǎng)站標識從預存的輸入法詞庫中查找已創(chuàng)建的所述輸入法關(guān)聯(lián)詞庫;
[0101]詞庫創(chuàng)建模塊,被配置為在未查找出所述輸入法關(guān)聯(lián)詞庫時,創(chuàng)建所述輸入法關(guān)聯(lián)詞庫;
[0102]發(fā)送模塊,被配置為向所述終端發(fā)送創(chuàng)建的所述輸入法關(guān)聯(lián)詞庫,以供所述終端加載所述輸入法關(guān)聯(lián)詞庫;
[0103]其中,所述詞庫創(chuàng)建模塊包括:
[0104]第一獲取模塊,被配置為獲取所述指定網(wǎng)站的網(wǎng)頁的文本信息;
[0105]提取模塊,被配置為基于所述文本信息提取頻繁字符串,所述頻繁字符串出現(xiàn)的頻繁程度大于等于預定的頻繁程度;
[0106]第二獲取模塊,被配置為獲取所述頻繁字符串中的命名實體;
[0107]創(chuàng)建模塊,被配置為基于所述命名實體創(chuàng)建所述指定網(wǎng)站的輸入法關(guān)聯(lián)詞庫。
[0108]可選的,所述裝置還包括:
[0109]存儲模塊,被配置為將創(chuàng)建的所述輸入法關(guān)聯(lián)詞庫與所述輸入法關(guān)聯(lián)詞庫的相關(guān)信息進行關(guān)聯(lián)地存儲,其中,所述輸入法關(guān)聯(lián)詞庫的相關(guān)信息包括所述輸入法關(guān)聯(lián)詞庫對應的網(wǎng)站的網(wǎng)站標識。
[0110]可選的,所述裝置還包括:
[0111]所述輸入法關(guān)聯(lián)詞庫的相關(guān)信息還包括所述輸入法關(guān)聯(lián)詞庫的創(chuàng)建時間;
[0112]所述裝置還包括:
[0113]檢測模塊,被配置為基于已存儲的所述輸入法關(guān)聯(lián)詞庫對應的創(chuàng)建時間,檢測出已過預定使用期的所述輸入法關(guān)聯(lián)詞庫;
[0114]更新模塊,被配置為更新所述已過預定使用期的所述輸入法關(guān)聯(lián)詞庫。
[0115]根據(jù)本公開實施例的第七方面,提供一種裝置,包括:
[0116]處理器;
[0117]用于存儲處理器可執(zhí)行指令的存儲器;
[0118]其中,所述處理器被配置為:
[0119]獲取
當前第1頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1