一種學(xué)詞方法和裝置的制造方法_3

文檔序號(hào)：9615973閱讀：來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>一種學(xué)詞方法和裝置的制造方法

上屏內(nèi)容與刪除后重新上屏的內(nèi)容的相關(guān)性，識(shí)別用戶刪除上屏內(nèi)容的意圖的步驟，包括:
[0082]步驟S21、在刪除的上屏內(nèi)容與刪除后重新上屏的內(nèi)容的相關(guān)性符合預(yù)置的相關(guān)性條件時(shí)，將用戶刪除上屏內(nèi)容的意圖識(shí)別為非誤操作意圖。
[0083]本發(fā)明實(shí)施例中，刪除的上屏內(nèi)容與刪除后重新上屏的內(nèi)容的相關(guān)性具體可以包括:內(nèi)容相關(guān)性、語(yǔ)義相關(guān)性等，例如，應(yīng)用示例4中上屏內(nèi)容“總而言之”與刪除后重新上屏的內(nèi)容“言而總之”的語(yǔ)義相關(guān)性較高，且符合預(yù)置的相關(guān)性條件，故可以認(rèn)為用戶刪除上屏內(nèi)容的意圖屬于表達(dá)修正意圖的概率較大，因此可以將用戶刪除上屏內(nèi)容的意圖識(shí)別為非誤操作意圖。
[0084]在實(shí)際應(yīng)用中，刪除的上屏內(nèi)容與刪除后重新上屏的內(nèi)容的相關(guān)性的計(jì)算方法可以有多種，例如，上述計(jì)算方法具體可以包括:基于詞典的方法和基于統(tǒng)計(jì)的方法。其中，基于詞典的方法主要借助結(jié)構(gòu)化的詞典來(lái)計(jì)算詞與詞之間的語(yǔ)義相關(guān)性，結(jié)構(gòu)化的詞典可以來(lái)自于預(yù)先定義好的語(yǔ)義結(jié)構(gòu)集合；基于統(tǒng)計(jì)的方法是數(shù)據(jù)驅(qū)動(dòng)(data-driven)的，其主要思想是從詞與詞的共生關(guān)系(即兩個(gè)詞出現(xiàn)在同一文檔)中挖掘詞的語(yǔ)義相關(guān)性?？梢岳斫?，本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際應(yīng)用需求采用上述計(jì)算方法，本發(fā)明實(shí)施例對(duì)于具體的計(jì)算方法不加以限制。
[0085]本發(fā)明實(shí)施例中，預(yù)置的相關(guān)性條件可用于表示刪除操作前后兩個(gè)內(nèi)容之間的相關(guān)性較高所對(duì)應(yīng)的條件。可以理解，本領(lǐng)域技術(shù)人員還可以根據(jù)實(shí)際應(yīng)用需求，預(yù)置所采用計(jì)算方法對(duì)應(yīng)的相關(guān)性條件，例如，一種相關(guān)性條件的示例可以為刪除的上屏內(nèi)容與刪除后重新上屏的內(nèi)容的語(yǔ)義相關(guān)性參數(shù)高于第一閾值，假設(shè)語(yǔ)義相關(guān)性參數(shù)為0表示完全不相關(guān)，語(yǔ)義相關(guān)性參數(shù)為1表示完全相關(guān)，則該第一閾值可以為為0-1之間的數(shù)值，例如0.8,0.85等等，本發(fā)明實(shí)施例對(duì)于具體的第一閾值和相關(guān)性條件不加以限制。
[0086]技術(shù)方案三
[0087]技術(shù)方案三可以依據(jù)刪除的上屏內(nèi)容的第一輸入串與刪除后重新上屏的內(nèi)容的第二輸入串的相關(guān)性，識(shí)別用戶刪除上屏內(nèi)容的意圖。刪除的上屏內(nèi)容的第一輸入串與刪除后重新上屏的內(nèi)容的第二輸入串的相關(guān)性可用于表示刪除操作前后兩個(gè)輸入串之間的相關(guān)性，通常該相關(guān)性越高，則可以認(rèn)為用戶刪除上屏內(nèi)容的意圖屬于誤操作意圖的概率越大，而該相關(guān)性越低，則可以認(rèn)為用戶刪除上屏內(nèi)容的意圖屬于非誤操作意圖的概率越大。
[0088]在本發(fā)明的一種可選實(shí)施例中，所述第一輸入串與所述第二輸入串的相關(guān)性具體可以包括:第一輸入串與第二輸入串的相似度，則所述依據(jù)上屏內(nèi)容的第一輸入串與刪除后重新上屏的內(nèi)容的第二輸入串的相關(guān)性，識(shí)別用戶刪除上屏內(nèi)容的意圖的步驟，具體可以包括:
[0089]步驟S31、在第一輸入串與第二輸入串的相似度超出相似度閾值時(shí)，將用戶刪除上屏內(nèi)容的意圖識(shí)別為誤操作意圖；或者
[0090]步驟S32、在第一輸入串與第二輸入串的相似度未超出相似度閾值時(shí)，將用戶刪除上屏內(nèi)容的意圖識(shí)別為非誤操作意圖。
[0091]本發(fā)明實(shí)施例中，相似度可用于表示兩個(gè)字符串之間的相似度，通常該相似度越高，則可以認(rèn)為第二輸入串是對(duì)第一輸入串的糾正，也即用戶刪除上屏內(nèi)容的意圖屬于誤操作意圖的概率越大，而該相似度越低，則可以認(rèn)為用戶刪除上屏內(nèi)容的意圖屬于非誤操作意圖的概率越大。本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際應(yīng)用需求確定上述相似度閾值的值，如其數(shù)值可以為80%、90%等，本發(fā)明實(shí)施例對(duì)于相似度閾值的具體數(shù)值不加以限制。
[0092]在實(shí)際應(yīng)用中，可以采用任意的相似度度量計(jì)算第一輸入串與第二輸入串的相似度，例如，上述相似度度量具體可以包括:編輯距離、LCS(最長(zhǎng)公共子串，Longest CommonSubsequence)、向量空間、歐式距離等。
[0093]編輯距離可用于表示兩個(gè)字符串之間，由一個(gè)轉(zhuǎn)成另一個(gè)所需的最少編輯操作次數(shù)。上述編輯操作具體可以包括將一個(gè)字符替換成另一個(gè)字符、插入一個(gè)字符、及刪除一個(gè)字符的操作等等。例如，“xingfu”和“xinfu”的編輯距離為1，應(yīng)用示例2中第二輸入串“humamaob”與第一輸入串“hubamaob”的編輯距離為1等。
[0094]其中，在第一輸入串與第二輸入串的編輯距離小于距離閾值時(shí)，可以認(rèn)為第一輸入串與第二輸入串之間的相似度較高，也即，可以認(rèn)為第一輸入串存在誤操作，而第二輸入串是與第一輸入串具有相同輸入意圖的重新輸入，因此，第一輸入串對(duì)應(yīng)上屏內(nèi)容是對(duì)用戶無(wú)價(jià)值的詞條。
[0095]可以理解，本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際需要確定上述距離閾值，如，其可以為1、2等數(shù)值，本發(fā)明實(shí)施例對(duì)具體的距離閾值不加以限制。例如，在距離閾值為2時(shí)，可以將應(yīng)用示例2中用戶刪除上屏內(nèi)容的意圖識(shí)別為誤操作意圖等。
[0096]需要說(shuō)明的是，在采用向量空間計(jì)算第一輸入串與第二輸入串的相似度時(shí)，可以首先分別依據(jù)所述第一輸入串、第二輸入串與各自的上文和/或下文，計(jì)算第一輸入串、第二輸入串對(duì)應(yīng)的第一向量和第二向量，然后，計(jì)算第一向量和第二向量的相似度；其中，第一輸入串的上文或下文可以是根據(jù)用戶的歷史輸入行為數(shù)據(jù)得到的上文或下文，該歷史輸入行為數(shù)據(jù)中可以記錄有用戶輸入過(guò)的一個(gè)輸入串與上文和/或下文的搭配關(guān)系；可以理解，本發(fā)明實(shí)施例對(duì)于計(jì)算第一輸入串與第二輸入串的相似度的具體過(guò)程不加以限制。
[0097]以上對(duì)識(shí)別用戶刪除上屏內(nèi)容的意圖的幾種技術(shù)方案進(jìn)行了詳細(xì)介紹，可以理解，本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際應(yīng)用需求，采用上述技術(shù)方案中的任一或者組合，其中，在利用技術(shù)方案的組合時(shí)，可以依據(jù)每種技術(shù)方案計(jì)算將用戶刪除上屏內(nèi)容的意圖識(shí)別為非誤操作意圖的概率得分，對(duì)多種概率得分進(jìn)行加權(quán)計(jì)算，并依據(jù)加權(quán)計(jì)算結(jié)果識(shí)別用戶刪除上屏內(nèi)容的意圖，可以理解，本發(fā)明實(shí)施例對(duì)于識(shí)別用戶刪除上屏內(nèi)容的意圖的具體技術(shù)方案不加以限制。
[0098]步驟102、在所述意圖為非誤操作意圖時(shí)，對(duì)所述上屏內(nèi)容進(jìn)行學(xué)詞。
[0099]本發(fā)明實(shí)施例中，學(xué)詞主要是指將更改后的某一上屏內(nèi)容存儲(chǔ)至目標(biāo)詞庫(kù)的過(guò)程，這里的目標(biāo)詞庫(kù)可以是系統(tǒng)詞庫(kù)，也可以是用戶詞庫(kù)，或者，還可以是人名詞庫(kù)、歷史詞庫(kù)等其它詞庫(kù)，本發(fā)明實(shí)施例對(duì)于學(xué)詞所對(duì)應(yīng)的具體詞庫(kù)不加以限制?？梢岳斫?，在所述意圖為誤操作意圖時(shí)，可以不對(duì)所述上屏內(nèi)容進(jìn)行學(xué)詞。
[0100]對(duì)于目標(biāo)詞庫(kù)中的詞條，輸入法系統(tǒng)還可以根據(jù)用戶輸入這個(gè)詞條的次數(shù)和最后一次輸入這個(gè)詞條的時(shí)間來(lái)對(duì)詞條賦予一個(gè)屬性，稱(chēng)為詞頻，且詞頻為候選項(xiàng)的主要排序因素。因此，本發(fā)明實(shí)施例針對(duì)目標(biāo)詞庫(kù)的智能學(xué)詞，能夠在第一時(shí)間保留對(duì)用戶有價(jià)值的詞條，并提高這些上屏內(nèi)容在候選項(xiàng)中的排序，這樣，在該用戶進(jìn)行之后相應(yīng)編碼字符串的輸入時(shí)，這些上屏內(nèi)容將排在候選項(xiàng)的靠前位置，從而能夠提高輸入效率。
[0101]在本發(fā)明的一種可選實(shí)施例中，本發(fā)明實(shí)施例對(duì)刪除的上屏內(nèi)容進(jìn)行學(xué)詞的過(guò)程可以區(qū)別于對(duì)未刪除的上屏內(nèi)容的學(xué)詞過(guò)程(以下簡(jiǎn)稱(chēng)正常學(xué)詞)，二者的一個(gè)區(qū)別可以體現(xiàn)在學(xué)詞對(duì)象上。
[0102]其中，正常學(xué)詞的學(xué)詞對(duì)象具體可以包括:未刪除的上屏內(nèi)容、及未刪除的上屏內(nèi)容與前文的二元關(guān)系。以應(yīng)用示例3為例，假設(shè)用戶在上屏“諸暨”前已經(jīng)上屏了一個(gè)詞“比如”，那么正常學(xué)詞的過(guò)程具體可以包括:將“諸暨”學(xué)習(xí)到用戶詞庫(kù)中，以及，將“比如諸暨”學(xué)習(xí)為用戶二元詞。
[0103]而本發(fā)明實(shí)施例對(duì)于刪除的上屏內(nèi)容的學(xué)詞對(duì)象具體可以包括:刪除的上屏內(nèi)容，以應(yīng)用示例3為例，假設(shè)用戶在上屏“諸暨”前已經(jīng)上屏了一個(gè)詞“比如”，那么，本發(fā)明實(shí)施例對(duì)于刪除的上屏內(nèi)容的學(xué)詞過(guò)程具體可以包括:將“諸暨”學(xué)習(xí)到用戶詞庫(kù)中。
[0104]在本發(fā)明的另一種可選實(shí)施例中，步驟102具體可以包括:將所述上屏內(nèi)容記錄至用戶詞庫(kù)，并更新所述上屏內(nèi)容在所述用戶詞庫(kù)中的頻率。
[0105]方法實(shí)施例二
[0106]參照?qǐng)D2，示出了本發(fā)明的一種學(xué)詞方法實(shí)施例二的步驟流程圖，具體可以包括如下步驟:
[0107]步驟201、通過(guò)緩存記錄用戶輸入的至少一次上屏內(nèi)容；
[0108]步驟202、識(shí)別用戶刪除上屏內(nèi)容的意圖；
[0109]步驟203、在所述意圖為非誤操作意圖時(shí)，對(duì)所述上屏內(nèi)容進(jìn)行學(xué)詞；
[0110]步驟204、按照設(shè)定規(guī)則刪除所述緩存中已進(jìn)行學(xué)詞的所述上屏內(nèi)容。
[0111]相對(duì)于方法實(shí)施例一，本實(shí)施例引入緩存的概念，以在

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第3頁(yè)1 2 3 4 5

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

裝置的同義詞相關(guān)技術(shù)

大科學(xué)裝置相關(guān)技術(shù)

大學(xué)生裝置藝術(shù)相關(guān)技術(shù)

化學(xué)實(shí)驗(yàn)裝置圖相關(guān)技術(shù)

高中化學(xué)實(shí)驗(yàn)裝置圖相關(guān)技術(shù)

小敏同學(xué)利用如圖裝置相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種學(xué)詞方法和裝置的制造方法_3