上屏內(nèi)容與刪除后重新上屏的內(nèi)容的相關(guān)性,識(shí)別用戶刪除上屏內(nèi)容的意圖的步驟,包括:
[0082]步驟S21、在刪除的上屏內(nèi)容與刪除后重新上屏的內(nèi)容的相關(guān)性符合預(yù)置的相關(guān)性條件時(shí),將用戶刪除上屏內(nèi)容的意圖識(shí)別為非誤操作意圖。
[0083]本發(fā)明實(shí)施例中,刪除的上屏內(nèi)容與刪除后重新上屏的內(nèi)容的相關(guān)性具體可以包括:內(nèi)容相關(guān)性、語(yǔ)義相關(guān)性等,例如,應(yīng)用示例4中上屏內(nèi)容“總而言之”與刪除后重新上屏的內(nèi)容“言而總之”的語(yǔ)義相關(guān)性較高,且符合預(yù)置的相關(guān)性條件,故可以認(rèn)為用戶刪除上屏內(nèi)容的意圖屬于表達(dá)修正意圖的概率較大,因此可以將用戶刪除上屏內(nèi)容的意圖識(shí)別為非誤操作意圖。
[0084]在實(shí)際應(yīng)用中,刪除的上屏內(nèi)容與刪除后重新上屏的內(nèi)容的相關(guān)性的計(jì)算方法可以有多種,例如,上述計(jì)算方法具體可以包括:基于詞典的方法和基于統(tǒng)計(jì)的方法。其中,基于詞典的方法主要借助結(jié)構(gòu)化的詞典來(lái)計(jì)算詞與詞之間的語(yǔ)義相關(guān)性,結(jié)構(gòu)化的詞典可以來(lái)自于預(yù)先定義好的語(yǔ)義結(jié)構(gòu)集合;基于統(tǒng)計(jì)的方法是數(shù)據(jù)驅(qū)動(dòng)(data-driven)的,其主要思想是從詞與詞的共生關(guān)系(即兩個(gè)詞出現(xiàn)在同一文檔)中挖掘詞的語(yǔ)義相關(guān)性??梢岳斫?,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際應(yīng)用需求采用上述計(jì)算方法,本發(fā)明實(shí)施例對(duì)于具體的計(jì)算方法不加以限制。
[0085]本發(fā)明實(shí)施例中,預(yù)置的相關(guān)性條件可用于表示刪除操作前后兩個(gè)內(nèi)容之間的相關(guān)性較高所對(duì)應(yīng)的條件。可以理解,本領(lǐng)域技術(shù)人員還可以根據(jù)實(shí)際應(yīng)用需求,預(yù)置所采用計(jì)算方法對(duì)應(yīng)的相關(guān)性條件,例如,一種相關(guān)性條件的示例可以為刪除的上屏內(nèi)容與刪除后重新上屏的內(nèi)容的語(yǔ)義相關(guān)性參數(shù)高于第一閾值,假設(shè)語(yǔ)義相關(guān)性參數(shù)為0表示完全不相關(guān),語(yǔ)義相關(guān)性參數(shù)為1表示完全相關(guān),則該第一閾值可以為為0-1之間的數(shù)值,例如0.8,0.85等等,本發(fā)明實(shí)施例對(duì)于具體的第一閾值和相關(guān)性條件不加以限制。
[0086]技術(shù)方案三
[0087]技術(shù)方案三可以依據(jù)刪除的上屏內(nèi)容的第一輸入串與刪除后重新上屏的內(nèi)容的第二輸入串的相關(guān)性,識(shí)別用戶刪除上屏內(nèi)容的意圖。刪除的上屏內(nèi)容的第一輸入串與刪除后重新上屏的內(nèi)容的第二輸入串的相關(guān)性可用于表示刪除操作前后兩個(gè)輸入串之間的相關(guān)性,通常該相關(guān)性越高,則可以認(rèn)為用戶刪除上屏內(nèi)容的意圖屬于誤操作意圖的概率越大,而該相關(guān)性越低,則可以認(rèn)為用戶刪除上屏內(nèi)容的意圖屬于非誤操作意圖的概率越大。
[0088]在本發(fā)明的一種可選實(shí)施例中,所述第一輸入串與所述第二輸入串的相關(guān)性具體可以包括:第一輸入串與第二輸入串的相似度,則所述依據(jù)上屏內(nèi)容的第一輸入串與刪除后重新上屏的內(nèi)容的第二輸入串的相關(guān)性,識(shí)別用戶刪除上屏內(nèi)容的意圖的步驟,具體可以包括:
[0089]步驟S31、在第一輸入串與第二輸入串的相似度超出相似度閾值時(shí),將用戶刪除上屏內(nèi)容的意圖識(shí)別為誤操作意圖;或者
[0090]步驟S32、在第一輸入串與第二輸入串的相似度未超出相似度閾值時(shí),將用戶刪除上屏內(nèi)容的意圖識(shí)別為非誤操作意圖。
[0091]本發(fā)明實(shí)施例中,相似度可用于表示兩個(gè)字符串之間的相似度,通常該相似度越高,則可以認(rèn)為第二輸入串是對(duì)第一輸入串的糾正,也即用戶刪除上屏內(nèi)容的意圖屬于誤操作意圖的概率越大,而該相似度越低,則可以認(rèn)為用戶刪除上屏內(nèi)容的意圖屬于非誤操作意圖的概率越大。本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際應(yīng)用需求確定上述相似度閾值的值,如其數(shù)值可以為80%、90%等,本發(fā)明實(shí)施例對(duì)于相似度閾值的具體數(shù)值不加以限制。
[0092]在實(shí)際應(yīng)用中,可以采用任意的相似度度量計(jì)算第一輸入串與第二輸入串的相似度,例如,上述相似度度量具體可以包括:編輯距離、LCS(最長(zhǎng)公共子串,Longest CommonSubsequence)、向量空間、歐式距離等。
[0093]編輯距離可用于表示兩個(gè)字符串之間,由一個(gè)轉(zhuǎn)成另一個(gè)所需的最少編輯操作次數(shù)。上述編輯操作具體可以包括將一個(gè)字符替換成另一個(gè)字符、插入一個(gè)字符、及刪除一個(gè)字符的操作等等。例如,“xingfu”和“xinfu”的編輯距離為1,應(yīng)用示例2中第二輸入串“humamaob”與第一輸入串“hubamaob”的編輯距離為1等。
[0094]其中,在第一輸入串與第二輸入串的編輯距離小于距離閾值時(shí),可以認(rèn)為第一輸入串與第二輸入串之間的相似度較高,也即,可以認(rèn)為第一輸入串存在誤操作,而第二輸入串是與第一輸入串具有相同輸入意圖的重新輸入,因此,第一輸入串對(duì)應(yīng)上屏內(nèi)容是對(duì)用戶無(wú)價(jià)值的詞條。
[0095]可以理解,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際需要確定上述距離閾值,如,其可以為1、2等數(shù)值,本發(fā)明實(shí)施例對(duì)具體的距離閾值不加以限制。例如,在距離閾值為2時(shí),可以將應(yīng)用示例2中用戶刪除上屏內(nèi)容的意圖識(shí)別為誤操作意圖等。
[0096]需要說(shuō)明的是,在采用向量空間計(jì)算第一輸入串與第二輸入串的相似度時(shí),可以首先分別依據(jù)所述第一輸入串、第二輸入串與各自的上文和/或下文,計(jì)算第一輸入串、第二輸入串對(duì)應(yīng)的第一向量和第二向量,然后,計(jì)算第一向量和第二向量的相似度;其中,第一輸入串的上文或下文可以是根據(jù)用戶的歷史輸入行為數(shù)據(jù)得到的上文或下文,該歷史輸入行為數(shù)據(jù)中可以記錄有用戶輸入過(guò)的一個(gè)輸入串與上文和/或下文的搭配關(guān)系;可以理解,本發(fā)明實(shí)施例對(duì)于計(jì)算第一輸入串與第二輸入串的相似度的具體過(guò)程不加以限制。
[0097]以上對(duì)識(shí)別用戶刪除上屏內(nèi)容的意圖的幾種技術(shù)方案進(jìn)行了詳細(xì)介紹,可以理解,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際應(yīng)用需求,采用上述技術(shù)方案中的任一或者組合,其中,在利用技術(shù)方案的組合時(shí),可以依據(jù)每種技術(shù)方案計(jì)算將用戶刪除上屏內(nèi)容的意圖識(shí)別為非誤操作意圖的概率得分,對(duì)多種概率得分進(jìn)行加權(quán)計(jì)算,并依據(jù)加權(quán)計(jì)算結(jié)果識(shí)別用戶刪除上屏內(nèi)容的意圖,可以理解,本發(fā)明實(shí)施例對(duì)于識(shí)別用戶刪除上屏內(nèi)容的意圖的具體技術(shù)方案不加以限制。
[0098]步驟102、在所述意圖為非誤操作意圖時(shí),對(duì)所述上屏內(nèi)容進(jìn)行學(xué)詞。
[0099]本發(fā)明實(shí)施例中,學(xué)詞主要是指將更改后的某一上屏內(nèi)容存儲(chǔ)至目標(biāo)詞庫(kù)的過(guò)程,這里的目標(biāo)詞庫(kù)可以是系統(tǒng)詞庫(kù),也可以是用戶詞庫(kù),或者,還可以是人名詞庫(kù)、歷史詞庫(kù)等其它詞庫(kù),本發(fā)明實(shí)施例對(duì)于學(xué)詞所對(duì)應(yīng)的具體詞庫(kù)不加以限制??梢岳斫?,在所述意圖為誤操作意圖時(shí),可以不對(duì)所述上屏內(nèi)容進(jìn)行學(xué)詞。
[0100]對(duì)于目標(biāo)詞庫(kù)中的詞條,輸入法系統(tǒng)還可以根據(jù)用戶輸入這個(gè)詞條的次數(shù)和最后一次輸入這個(gè)詞條的時(shí)間來(lái)對(duì)詞條賦予一個(gè)屬性,稱(chēng)為詞頻,且詞頻為候選項(xiàng)的主要排序因素。因此,本發(fā)明實(shí)施例針對(duì)目標(biāo)詞庫(kù)的智能學(xué)詞,能夠在第一時(shí)間保留對(duì)用戶有價(jià)值的詞條,并提高這些上屏內(nèi)容在候選項(xiàng)中的排序,這樣,在該用戶進(jìn)行之后相應(yīng)編碼字符串的輸入時(shí),這些上屏內(nèi)容將排在候選項(xiàng)的靠前位置,從而能夠提高輸入效率。
[0101]在本發(fā)明的一種可選實(shí)施例中,本發(fā)明實(shí)施例對(duì)刪除的上屏內(nèi)容進(jìn)行學(xué)詞的過(guò)程可以區(qū)別于對(duì)未刪除的上屏內(nèi)容的學(xué)詞過(guò)程(以下簡(jiǎn)稱(chēng)正常學(xué)詞),二者的一個(gè)區(qū)別可以體現(xiàn)在學(xué)詞對(duì)象上。
[0102]其中,正常學(xué)詞的學(xué)詞對(duì)象具體可以包括:未刪除的上屏內(nèi)容、及未刪除的上屏內(nèi)容與前文的二元關(guān)系。以應(yīng)用示例3為例,假設(shè)用戶在上屏“諸暨”前已經(jīng)上屏了一個(gè)詞“比如”,那么正常學(xué)詞的過(guò)程具體可以包括:將“諸暨”學(xué)習(xí)到用戶詞庫(kù)中,以及,將“比如諸暨”學(xué)習(xí)為用戶二元詞。
[0103]而本發(fā)明實(shí)施例對(duì)于刪除的上屏內(nèi)容的學(xué)詞對(duì)象具體可以包括:刪除的上屏內(nèi)容,以應(yīng)用示例3為例,假設(shè)用戶在上屏“諸暨”前已經(jīng)上屏了一個(gè)詞“比如”,那么,本發(fā)明實(shí)施例對(duì)于刪除的上屏內(nèi)容的學(xué)詞過(guò)程具體可以包括:將“諸暨”學(xué)習(xí)到用戶詞庫(kù)中。
[0104]在本發(fā)明的另一種可選實(shí)施例中,步驟102具體可以包括:將所述上屏內(nèi)容記錄至用戶詞庫(kù),并更新所述上屏內(nèi)容在所述用戶詞庫(kù)中的頻率。
[0105]方法實(shí)施例二
[0106]參照?qǐng)D2,示出了本發(fā)明的一種學(xué)詞方法實(shí)施例二的步驟流程圖,具體可以包括如下步驟:
[0107]步驟201、通過(guò)緩存記錄用戶輸入的至少一次上屏內(nèi)容;
[0108]步驟202、識(shí)別用戶刪除上屏內(nèi)容的意圖;
[0109]步驟203、在所述意圖為非誤操作意圖時(shí),對(duì)所述上屏內(nèi)容進(jìn)行學(xué)詞;
[0110]步驟204、按照設(shè)定規(guī)則刪除所述緩存中已進(jìn)行學(xué)詞的所述上屏內(nèi)容。
[0111]相對(duì)于方法實(shí)施例一,本實(shí)施例引入緩存的概念,以在