亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

提供新詞或熱詞的方法及系統(tǒng)的制作方法

文檔序號:6598531閱讀:378來源:國知局
專利名稱:提供新詞或熱詞的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及輸入法技術(shù)領(lǐng)域,特別是涉及提供新詞或熱詞的方法及系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)的普及、時代的進步,每個人都可以在網(wǎng)絡(luò)上發(fā)表自己的看法,輸入的文字也越來越個性化,同時,隨著互聯(lián)網(wǎng)用戶的不斷增多,個人的文章文字也不斷增多,個性化的新詞也不斷的涌現(xiàn)出來。此外,通過網(wǎng)絡(luò),不同的用戶之間還可以進行互動,例如,可以就某些共同關(guān)注的話題發(fā)起討論等等,當(dāng)然,這種討論通常是以文字為載體進行,在這一過程中,也會涌現(xiàn)出一些熱詞。其中,新詞是對新事件、新事物的高度概括,廣義來講包括新的詞條、舊詞新用、新的詞組等語言現(xiàn)象,如“悅宴”等;熱詞即熱門詞匯,作為一種詞匯現(xiàn)象,反映了一個國家、一個地區(qū)在一個時期人們普遍關(guān)注的問題或事物。輸入法系統(tǒng)作為人機對話的接口,提供了將各種符號輸入計算機或其他設(shè)備(如手機)而采用的編碼方法。對于需要編碼才能完成輸入的文字,如果想要將某些文字內(nèi)容輸入到計算機中,則需要借助于輸入法系統(tǒng),新詞、熱詞的輸入當(dāng)然也不例外。但是,新詞、 熱詞由于區(qū)域和時間上的特點,缺乏與通用詞條對等的累積統(tǒng)計信息,如果不進行特殊的處理,則在針對新詞、熱詞進行字詞轉(zhuǎn)換時,輸入法系統(tǒng)可能無法體現(xiàn)出與輸入其他普通詞條時一樣的智能性。針對上述問題,現(xiàn)有技術(shù)的方法是輸入法服務(wù)器通過搜索引擎、網(wǎng)絡(luò)爬蟲等技術(shù)從網(wǎng)絡(luò)上抓取新詞、熱詞,形成專門的新詞、熱詞詞庫,輸入法客戶端可以將服務(wù)器上的該詞庫下載到本地;當(dāng)然服務(wù)器也可以將該詞庫主動發(fā)送到輸入法客戶端,然后采用固定的更新周期更新客戶端的新詞、熱詞詞庫。例如,更新周期可以為一天,即客戶端的新詞、熱詞詞庫可以每天更新一次。但是,該現(xiàn)有技術(shù)的方法中,獲取到的新詞或熱詞無法得到實時地應(yīng)用。

發(fā)明內(nèi)容
本發(fā)明提供了提供新詞或熱詞的方法及系統(tǒng),有利于使獲取到的新詞或熱詞得到實時地應(yīng)用。本發(fā)明提供了如下方案一種提供新詞或熱詞的方法,包括對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞;通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。優(yōu)選的,所述實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶包括在用戶進行字詞輸入的過程中,實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項。優(yōu)選的,所述實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項包括
當(dāng)所述字詞候選項中包含與所述新詞或熱詞重碼的候選項時,判斷網(wǎng)絡(luò)中的用戶需要輸入所述新詞或熱詞的概率,如果所述概率滿足預(yù)置條件,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,還包括獲取所述新詞或熱詞對應(yīng)的用戶特征信息;所述判斷網(wǎng)絡(luò)中的用戶需要輸入所述新詞或熱詞的概率,如果所述概率滿足預(yù)置條件,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶包括如果所述網(wǎng)絡(luò)中的用戶具有所述新詞或熱詞對應(yīng)的用戶特征信息,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,所述用戶特征信息包括用戶的所在地信息,所述如果所述網(wǎng)絡(luò)中的用戶具有所述新詞或熱詞對應(yīng)的用戶特征信息,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶包括如果所述網(wǎng)絡(luò)中的用戶位于所述所在地信息對應(yīng)的區(qū)域,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,還包括獲取與所述新詞或熱詞具有語義搭配關(guān)系的關(guān)鍵詞;所述判斷網(wǎng)絡(luò)中的用戶需要輸入所述新詞或熱詞的概率,如果所述概率滿足預(yù)置條件,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶包括如果所述網(wǎng)絡(luò)中的用戶當(dāng)前輸入的上下文中包含所述關(guān)鍵詞,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,當(dāng)網(wǎng)絡(luò)中的用戶輸入的編碼字符串中包含至少兩個詞條時,所述實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項還包括實時應(yīng)用所述新詞或熱詞與所述關(guān)鍵詞的對應(yīng)關(guān)系,針對所述編碼字符串進行組詞,并將組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,所述實時應(yīng)用所述新詞或熱詞與所述關(guān)鍵詞的對應(yīng)關(guān)系,針對所述編碼字符串進行組詞,并將組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶包括獲取針對所述編碼字符串的組詞結(jié)果,并對各組詞結(jié)果進行打分;當(dāng)某組詞結(jié)果中包含所述新詞或熱詞,且該組詞結(jié)果中包含與該新詞或熱詞對應(yīng)的關(guān)鍵詞,則增加該組詞結(jié)果的分數(shù);根據(jù)各組詞結(jié)果最終的分數(shù),將所述組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,當(dāng)所述提供的組詞結(jié)果為至少兩個時,還包括將包含有所述新詞或熱詞的組詞結(jié)果與其他組詞結(jié)果進行區(qū)別展現(xiàn)。優(yōu)選的,當(dāng)網(wǎng)絡(luò)中的用戶輸入的編碼字符串中包含至少兩個詞條時,所述實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項還包括當(dāng)所述至少兩個詞條中包含所述新詞或熱詞時,將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶;如果所述網(wǎng)絡(luò)中的用戶接受所述新詞或熱詞,從所述新詞或熱詞處開始向前和/ 或向后進行組詞,為網(wǎng)絡(luò)中的用戶提供針對所述編碼字符串的完整的候選項。優(yōu)選的,所述實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶包括
實時為網(wǎng)絡(luò)中的用戶展現(xiàn)所述新詞或熱詞,并提供獲取所述新詞或熱詞對應(yīng)的相關(guān)信息的入口。優(yōu)選的,所述對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞包括獲取網(wǎng)絡(luò)中各用戶的用戶特征信息,基于所述用戶特征信息對網(wǎng)絡(luò)中的各用戶進行分類,得到至少兩個用戶類別;從所述用戶輸入的字詞中獲取針對各用戶類別的新詞或熱詞。優(yōu)選的,所述實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶包括判斷所述網(wǎng)絡(luò)中的用戶是否屬于所述新詞或熱詞對應(yīng)的用戶類別,如果屬于,則將所述新詞或熱詞提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的所述對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞包括收集用戶通過輸入法選擇的字詞,統(tǒng)計該字詞是否符合新詞或熱詞的預(yù)置條件,如果是,輸入法服務(wù)器將該新詞或熱詞進行記錄;所述通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶包括將所述記錄的新詞或熱詞以預(yù)置規(guī)則實時提供給輸入法用戶。優(yōu)選的,所述獲取新詞或熱詞之后還包括將所述新詞或熱詞保存在輸入法服務(wù)器端的新詞或熱詞詞庫中;所述通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶包括通過輸入法服務(wù)器,實時將所述新詞或熱詞詞庫中的新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。一種提供新詞或熱詞的系統(tǒng),包括獲取單元,用于對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞;新詞或熱詞提供單元,用于通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。優(yōu)選的,所述新詞或熱詞提供單元包括
候選項提供單元,用于在用戶進行字詞輸入的過程中,實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項。優(yōu)選的,所述候選項提供單元包括判斷單元,用于當(dāng)所述字詞候選項中包含與所述新詞或熱詞重碼的候選項時,判斷網(wǎng)絡(luò)中的用戶需要輸入所述新詞或熱詞的概率,如果所述概率滿足預(yù)置條件,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,還包括特征信息獲取單元,用于獲取所述新詞或熱詞對應(yīng)的用戶特征信息;所述判斷單元具體用于,判斷所述網(wǎng)絡(luò)中的用戶是否具有所述新詞或熱詞對應(yīng)的用戶特征信息,如果有,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,所述用戶特征信息包括用戶的所在地信息,所述判斷單元具體用于,判斷所述網(wǎng)絡(luò)中的用戶是否位于所述所在地信息對應(yīng)的區(qū)域,如果是,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。
優(yōu)選的,還包括關(guān)鍵詞獲取單元,用于獲取與所述新詞或熱詞具有語義搭配關(guān)系的關(guān)鍵詞;所述判斷單元具體用于,判斷所述網(wǎng)絡(luò)中的用戶當(dāng)前輸入的上下文中是否包含所述關(guān)鍵詞,如果包含,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,當(dāng)網(wǎng)絡(luò)中的用戶輸入的編碼字符串中包含至少兩個詞條時,所述候選項提供單元還包括組詞單元,用于實時應(yīng)用所述新詞或熱詞與所述關(guān)鍵詞的對應(yīng)關(guān)系,針對所述編碼字符串進行組詞,并將組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,所述組詞單元包括組詞結(jié)果獲取子單元,用于獲取針對所述編碼字符串的組詞結(jié)果,并對各組詞結(jié)果進行打分;分數(shù)調(diào)整子單元,用于當(dāng)某組詞結(jié)果中包含所述新詞或熱詞,且該組詞結(jié)果中包含與該新詞或熱詞對應(yīng)的關(guān)鍵詞,則增加該組詞結(jié)果的分數(shù);結(jié)果提供子單元,用于根據(jù)各組詞結(jié)果最終的分數(shù),將所述組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,當(dāng)所述提供的組詞結(jié)果為至少兩個時,還包括第一展現(xiàn)單元,用于將包含有所述新詞或熱詞的組詞結(jié)果與其他組詞結(jié)果進行區(qū)別展現(xiàn)。優(yōu)選的,當(dāng)網(wǎng)絡(luò)中的用戶輸入的編碼字符串中包含至少兩個詞條時,所述候選項提供單元還包括首次提供單元,用于當(dāng)所述至少兩個詞條中包含所述新詞或熱詞時,將所述新詞或熱詞提供給所述網(wǎng)絡(luò)中的用戶;重新組詞單元,用于判斷所述網(wǎng)絡(luò)中的用戶是否接受所述新詞或熱詞,如果接受, 則從所述新詞或熱詞處開始向前和/或向后進行組詞,為網(wǎng)絡(luò)中的用戶提供針對所述編碼字符串的完整的候選項。優(yōu)選的,所述新詞或熱詞提供單元包括相關(guān)信息展現(xiàn)單元,用于實時為網(wǎng)絡(luò)中的用戶展現(xiàn)所述新詞或熱詞,并提供獲取所述新詞或熱詞對應(yīng)的相關(guān)信息的入口。優(yōu)選的,所述獲取單元包括分類子單元,用于獲取網(wǎng)絡(luò)中各用戶的用戶特征信息,基于所述用戶特征信息對網(wǎng)絡(luò)中的各用戶進行分類,得到至少兩個用戶類別;獲取子單元,用于從所述用戶輸入的字詞中獲取針對各用戶類別的新詞或熱詞。優(yōu)選的,所述新詞或熱詞提供單元具體用于,判斷所述網(wǎng)絡(luò)中的用戶是否屬于所述新詞或熱詞對應(yīng)的用戶類別,如果屬于,則將所述新詞或熱詞提供給所述網(wǎng)絡(luò)中的用戶。優(yōu)選的,所述獲取單元具體用于收集用戶通過輸入法選擇的字詞,統(tǒng)計該字詞是否符合新詞或熱詞的預(yù)置條件,如果是,輸入法服務(wù)器將該新詞或熱詞進行記錄;所述新詞或熱詞提供單元具體用于將所述記錄的新詞或熱詞以預(yù)置規(guī)則實時提供給輸入法用戶。
優(yōu)選的,還包括保存單元,用于獲取新詞或熱詞之后,將所述新詞或熱詞保存在輸入法服務(wù)器端的新詞或熱詞詞庫中;所述新詞或熱詞提供單元具體用于,通過輸入法服務(wù)器,實時將所述新詞或熱詞詞庫中的新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。根據(jù)本發(fā)明提供的具體實施例,本發(fā)明公開了以下技術(shù)效果本發(fā)明能夠?qū)τ脩敉ㄟ^輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞, 通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶??梢?,通過本發(fā)明,使得獲取到的新詞或熱詞能夠得到實時的應(yīng)用。此外,本發(fā)明能夠從用戶輸入的字詞中獲取新詞或熱詞,因此,可以提高獲取新詞、熱詞的準(zhǔn)確度及效率。另外,由于在獲取新詞或熱詞時考慮了用戶所在地等信息,因此,可以將小范圍用戶使用的新詞或熱詞提取出來,供該小范圍內(nèi)的其他用戶使用。換言之,由于新詞或熱詞可能具有地域性等特點,如果基于網(wǎng)絡(luò)中的全部用戶進行統(tǒng)計,可能無法發(fā)現(xiàn)這些新詞或熱詞,但是本發(fā)明能夠基于某些用戶進行統(tǒng)計,可以最大限度地發(fā)現(xiàn)這些新詞或熱詞,并提供給網(wǎng)絡(luò)中其他的用戶使用。


為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實施例提供的方法的流程圖;圖2是本發(fā)明實施例提供的另一方法的流程圖;圖3是本發(fā)明實施例提供的再一方法的流程圖;圖4是本發(fā)明實施例提供的系統(tǒng)的示意圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。實施例一參見圖1,本發(fā)明實施例提供的提供新詞或熱詞的方法包括以下步驟SlOl 對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞;本發(fā)明實施例中,可以直接從用戶輸入的字詞中獲取新詞或熱詞,相對于從網(wǎng)絡(luò)上的文章中獲取新詞或熱詞,這種方法的好處在于由于用戶在進行字詞輸入的過程中,會主動對自己想要輸入的句子進行分詞,相當(dāng)于充分利用了用戶在使用輸入法進行字詞輸入時的信息,收集到的是一些以用戶認為是詞或短語的形式存在的字詞。而如果是從網(wǎng)絡(luò)上的文章中獲取新詞或熱詞,那么需要首先根據(jù)標(biāo)點符號將文章切分成一個一個的句子,然后還要對長的句子進行分詞(通過程序?qū)⑼暾木渥忧蟹殖勺只蛟~),最后才能判斷切分出來的字或詞中是否包含新詞或熱詞;但是機器分詞的過程難免會產(chǎn)生誤差,而且需要耗費較多的計算及存儲資源。因此,利用直接從用戶輸入的字詞中獲取新詞或熱詞的方法,可以提高獲取新詞的效率,而且可以避免機器分詞帶來的誤差。具體實現(xiàn)時,在用戶輸入過程中,獲取用戶選擇的字詞,其中,用戶選擇的字詞是指用戶每輸入完一串編碼字符串后、在輸入法給出的多個候選詞中選擇并確定的字詞;然后,將該用戶所選字詞與現(xiàn)有字詞進行比較,根據(jù)比對結(jié)果獲取用戶個性字詞,然后根據(jù)用戶個性字詞的時間標(biāo)簽、頻率特性等,對這些個性字詞進行篩選,便可以從中獲取新詞或熱詞。更為具體的,可以通過以下方式判斷用戶輸入的字詞是否為新詞或熱詞如果發(fā)現(xiàn)某個性字詞不屬于現(xiàn)有字詞,則可以判斷出該個性字詞是新詞;如果發(fā)現(xiàn)某個性字詞在一段時間內(nèi)的使用頻率非常高,則可以繼續(xù)判斷該個性字詞是否為現(xiàn)有字詞,如果是現(xiàn)有字詞,則該個性字詞可能是熱詞,或者是舊詞新用,如果不是現(xiàn)有字詞,則該個性字詞可能不僅是熱詞,而且還是新詞。同時,通過該方法來獲取新詞或熱詞,具有較高的靈活性,還可以允許用戶通過一些主動的操作來提高服務(wù)器獲取熱詞的效率。例如,如果某用戶希望將某詞條被服務(wù)器識別為熱詞,則該用戶可以在短時間內(nèi)反復(fù)輸入該詞條,或者,連續(xù)多次輸入該詞條;對于服務(wù)器而言,如果發(fā)現(xiàn)用戶有這種行為,則可以直接將該詞條作為熱詞添加到熱詞詞庫中。從以上描述也可以看出,新詞與熱詞之間的關(guān)系如果某個字詞是新詞,但不一定是熱詞,如果是熱詞,也不一定是新詞,但是也存在既是新詞又是熱詞的情況。S102 通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。在步驟SlOl中獲取新詞或熱詞之后,還可以將新詞或熱詞保存在輸入法服務(wù)器端的新詞或熱詞詞庫中;然后通過輸入法服務(wù)器,實時將所述新詞或熱詞詞庫中的新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。首先需要說明的是,本發(fā)明實施例提供的方法既可以適用于桌面輸入法,也可以適用于網(wǎng)絡(luò)輸入法。對于網(wǎng)絡(luò)輸入法而言,由于客戶端僅具有輸入輸出及通信功能,具體的計算由輸入法服務(wù)器完成,因此,步驟SlOl的執(zhí)行主體是輸入法服務(wù)器,即,輸入法服務(wù)器可以綜合統(tǒng)計網(wǎng)絡(luò)中各個用戶輸入的字詞,并從中判斷出新詞或熱詞,然后在步驟S102 中,直接保存在服務(wù)器的新詞或熱詞詞庫中即可。對于桌面輸入法而言,由于輸入系統(tǒng)的客戶端具有計算及存儲功能,因此,步驟 SlOl的執(zhí)行主體可以是輸入法系統(tǒng)的客戶端,即可以由客戶端對使用該客戶端的用戶輸入的字詞進行判斷,如果發(fā)現(xiàn)新詞,則在該步驟S102中,將該新詞發(fā)送到輸入法服務(wù)器即可; 當(dāng)然,步驟SlOl的執(zhí)行主體也可以是輸入法服務(wù)器,例如,客戶端可以定時或者主動地上傳用戶詞庫,由于用戶詞庫中記錄了用戶輸入的字詞及其使用頻率,因此,相當(dāng)于將用戶字詞及使用頻率等同步到輸入法服務(wù)器;然后由輸入法服務(wù)器將各個用戶的用戶字詞與現(xiàn)有字詞進行比較,獲取新詞或熱詞,并在步驟S102中直接將獲取到的新詞或熱詞保存在服務(wù)器的新詞或熱詞詞庫中即可。需要說明的是,如果是在客戶端進行新詞或熱詞的判斷,則相當(dāng)于是針對單個用戶的輸入字詞判斷新詞;而如果是由服務(wù)器進行新詞或熱詞的判斷,則可以針對網(wǎng)絡(luò)中的所有用戶輸入的字詞,判斷是否存在新詞或熱詞,這種方式對獲取熱詞而言尤為有效。因為熱詞是依據(jù)用戶字詞的使用頻率來判斷的,如果對于某個詞條,每個用戶使用這個詞條的頻率可能并不是非常高,因此,客戶端可能不會將該詞條判斷為熱詞;但是,實際上在同一時間段,有很多用戶都使用了該詞條,因此,該詞條有可能是熱詞,而只有通過服務(wù)器進行判斷時,服務(wù)器才能夠從整體上看到各個用戶的詞條使用情況,才可能將該詞條判斷為熱詞。此外,由于網(wǎng)絡(luò)輸入法實時的記錄上屏信息,可以捕獲詞條的短時輸入高峰,在實時性方面具有優(yōu)越性。總之,在獲取到新詞或熱詞之后,都能夠及時地將這些新獲取到的新詞或熱詞保存到輸入法服務(wù)器上,因此,可以通過輸入法服務(wù)器,實時將這些新獲取到的新詞或熱詞提供給網(wǎng)絡(luò)中各個用戶,而不用等到用戶本地的詞庫完成更新。綜上可見,本發(fā)明實施例在對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞時,具體可以這樣進行收集用戶通過輸入法選擇的字詞(包括用戶選擇過但是沒有上屏輸出的字詞,或者選擇了并且上屏輸出的字詞),統(tǒng)計該字詞是否符合新詞或熱詞的預(yù)置條件,如果是,輸入法服務(wù)器將該新詞或熱詞進行記錄。其中,預(yù)置條件可以根據(jù)需要進行設(shè)置,例如,如果某詞條在短時間內(nèi)(具體的時間長度也可以根據(jù)需要設(shè)定)被很多個用戶使用,則將該詞條作為熱詞進行記錄;或者,如果某詞條在之前的詞庫中沒有出現(xiàn)過,并且輸入該詞條的用戶數(shù)目超過某閾值(該閾值也可以根據(jù)需要設(shè)定),則將該詞條作為新詞記錄;當(dāng)然,還可以是前文所述的用戶干預(yù)的方式,即如果某用戶連續(xù)多次輸入某詞條,或者在短時間內(nèi),同一用戶多次輸入同一詞條,則認為該用戶可能想要使該詞條被識別為熱詞,此時,也可以將該詞條作為熱詞收錄,等等。相應(yīng)的,通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶具體可以是將所述記錄的新詞或熱詞以預(yù)置規(guī)則實時提供給輸入法用戶。這里的預(yù)置規(guī)則可以是多種,例如,可以是在用戶進行字詞輸入的過程中,實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項;即用戶在輸入編碼字符串之后,輸入法系統(tǒng)需要根據(jù)詞庫將編碼字符串對應(yīng)的字詞顯示出來供用戶選擇,在此過程中,用戶可能會需要輸入某新詞或熱詞,此時,輸入法服務(wù)器就可以直接利用收集到的新詞或熱詞向用戶提供候選項。下面針對在用戶進行字詞輸入的過程中,實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項的情況進行詳細地介紹。具體的,對于網(wǎng)絡(luò)輸入法而言,服務(wù)器在接收到用戶輸入的編碼字符串等待轉(zhuǎn)換內(nèi)容之后,可以直接按照輸入法規(guī)則匹配相應(yīng)的新詞或者熱詞,如果有匹配的新詞或熱詞, 則直接把新詞或熱詞反饋給用戶即可。對于桌面輸入法而言,由于輸入法客戶端也具有與服務(wù)器進行交互的通道,因此, 輸入法客戶端在接收到用戶輸入的編碼字符串或者其他形式的待轉(zhuǎn)換內(nèi)容之后,可以首先利用本地的數(shù)據(jù)庫進行轉(zhuǎn)換,如果本地詞庫中沒有完全匹配的詞條,則認為用戶需要的可能是本地未更新過的新詞,因此可以將用戶輸入的編碼字符串發(fā)送到服務(wù)器,服務(wù)器在接收到用戶的編碼字符串之后,可以利用新詞或熱詞詞庫進行匹配,如果有匹配的詞條,返回給相應(yīng)的客戶端即可。當(dāng)然,客戶端也可以直接將用戶輸入的編碼字符串發(fā)送給服務(wù)器,此時,相當(dāng)于在本地及服務(wù)器并行對編碼字符串進行轉(zhuǎn)換。即,由客戶端實現(xiàn)編碼字符串轉(zhuǎn)換候選項的計算,并且客戶端向服務(wù)器發(fā)送編碼字符串,如果用戶輸入的編碼字符串比較長,由服務(wù)器對編碼字符串切分,判斷其中是否含有新詞或者熱詞,如果查找到新詞或熱詞,則發(fā)送給客戶端進行展現(xiàn),或者用來影響客戶端的候選項。展現(xiàn)時可以僅展現(xiàn)新詞或熱詞,如果用戶接受該展現(xiàn)結(jié)果,則客戶端以該新詞或熱詞為基礎(chǔ)重新生成針對全部編碼字符串的候選項。同時,客戶端還可以將用戶選擇了該新詞或熱詞的信息反饋給服務(wù)器,增加該新詞或熱詞的使用頻率??梢?,通過本發(fā)明,相當(dāng)于實現(xiàn)了一個迭代的過程,S卩,從用戶輸入的字詞中獲取新詞或熱詞,同時,實時利用獲取到的新詞或熱詞為其他用戶提供輸入法服務(wù);當(dāng)用戶使用了提供了新詞或熱詞時,還可以將選擇信息反饋給服務(wù)器,以便服務(wù)器及時地優(yōu)化、更新其保存的信息,為輸入法用戶提供更優(yōu)的候選項。下面通過一個實際應(yīng)用中的例子,來體現(xiàn)該實施例的應(yīng)用。假設(shè)1月1日出了一部電視劇叫做“兵圣”,用戶A在原有的定時更新模式下更新周期為2天,則該用戶A最快在1月3日才能得到“兵圣”這一新詞,因此,該用戶A如果在 1月1日或1月2日想要輸入“兵圣”時,則只能采用逐字選擇的方式,即先選擇“兵”,然后再選擇“圣”;而使用本發(fā)明實施例一的方案,只要輸入法服務(wù)器將“兵圣”作為新詞保存到了新詞或熱詞詞庫,那么用戶輸入“兵圣”的拼音“bingsheng”時,就會立即激活客戶端對于服務(wù)器的訪問,無論用戶A使用的是網(wǎng)絡(luò)輸入法或者是本地客戶端,均可以在1月1日當(dāng)天就直接敲打出“兵圣”這個詞條。在上述實施例中,獲得新詞或熱詞之后,在應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項時,對所有用戶都是無差別的。但是在實際應(yīng)用中可能存在這樣的情況有一些新詞可能是通過取現(xiàn)有字詞的諧音得到的,一些熱詞本身可能是現(xiàn)有詞條,因此,使得有些新詞或熱詞可能與現(xiàn)有字詞重碼。例如,新詞“博斗”與現(xiàn)有字詞“搏斗”就是重碼的。 那么如果用戶輸入了拼音串“bodou”,應(yīng)該如何給出相應(yīng)的候選項是個值得考慮的問題?,F(xiàn)有技術(shù)中的方法是預(yù)先設(shè)定新詞的權(quán)重大于現(xiàn)有字詞的權(quán)重,即當(dāng)出現(xiàn)重碼時,則優(yōu)先將新詞推薦給用戶;但是,如果某用戶就是想要輸入現(xiàn)有字詞“搏斗”,則無法通過按空格鍵直接上屏,甚至可能需要增加按鍵的次數(shù);如果該用戶沒有聽說過“博斗”的寫法,還可能會感到莫名其妙。為了解決該問題,本發(fā)明實施例可以當(dāng)字詞候選項中包含與所述新詞或熱詞重碼的候選項時,判斷網(wǎng)絡(luò)中的用戶需要輸入所述新詞或熱詞的概率,如果所述概率滿足預(yù)置條件,則將所述新詞或熱詞作為首選的候選項提供給所述網(wǎng)絡(luò)中的用戶。以此來解決當(dāng)出現(xiàn)重碼時,應(yīng)如何保證首選候選項的準(zhǔn)確率的問題。其中,判斷網(wǎng)絡(luò)中的用戶需要輸入所述新詞或熱詞的概率的具體實施方式
可以有多種,下面示例性地介紹其中的幾種。
具體實施方式
一在實際應(yīng)用中,可能存在以下情況某些新詞或熱詞可能只對具有某些共同特征的用戶(如某些特殊身份、或者特殊地域的用戶等)才是需要的。例如,對于某網(wǎng)絡(luò)游戲中出現(xiàn)的新詞,可能僅僅是同樣在玩這款游戲的用戶才是需要的;對于某城市出現(xiàn)新的建筑名、飯店名等對應(yīng)的新詞,可能只有這個城市的用戶才會用到;對于某地區(qū)發(fā)生的某一新聞事件,也可能只有這個地區(qū)的用戶才會關(guān)心等等。因此,在該具體實施方式
一,在判斷出新詞或熱詞之后,可以獲取這些新詞或熱詞
13對應(yīng)的用戶特征信息,將這些新詞或熱詞對應(yīng)的用戶特征信息保存到輸入法服務(wù)器;然后, 當(dāng)向網(wǎng)絡(luò)中的各個用戶提供候選項時,實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中具有所述用戶特征的用戶提供字詞候選項。具體的,參見圖2,該具體實施方式
一提供的方法可以包括以下步驟S201 對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞;該步驟S201可以與SlOl相同,這里不再贅述。S202 獲取所述新詞或熱詞對應(yīng)的用戶特征信息;由于步驟SlOl中是從用戶輸入的字詞中來獲取新詞或熱詞的,無論是網(wǎng)絡(luò)輸入法還是桌面輸入法,都可以獲知各個新詞或熱詞是從哪個或哪些用戶輸入的字詞,進而可以通過獲知這些用戶特征信息,來獲知新詞或熱詞對應(yīng)的用戶特征信息。其中,用戶特征信息可以從用戶的注冊信息中獲取,例如,可以包括用戶的所在地、身份、年齡、興趣愛好等信息。具體的,當(dāng)獲取到某新詞或熱詞之后,可以首先該新詞或熱詞來自哪些用戶,然后從這些用戶的注冊信息中,獲取用戶的各個特征信息,并從中選擇出具有共性的特征,作為該新詞或熱詞對應(yīng)的用戶特征信息即可。當(dāng)然,用戶的特征信息也可以通過其他途徑來獲取,例如,還可以獲取用戶的IP 地址,通過IP段來判斷用戶當(dāng)前的所在地;或者,可以獲取用戶勾選的細胞詞庫,通過對細胞詞庫的選擇可以簡單判斷出用戶的興趣等等。S203:在用戶進行字詞輸入的過程中,通過輸入法服務(wù)器,實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中具有所述用戶特征的用戶提供字詞候選項。具體的,如果所述網(wǎng)絡(luò)中的用戶具有所述新詞或熱詞對應(yīng)的用戶特征信息,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。S卩,在應(yīng)用新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項之前,需要對用戶的用戶特征進行判斷。具體的,如果發(fā)現(xiàn)某用戶輸入的編碼字符串能夠命中某新詞或熱詞,則在向該用戶返回該新詞或熱詞之前,可以首先取出該用戶的注冊信息,判斷該用戶是否具有該新詞或熱詞對應(yīng)的用戶特征信息,如果有,再將該新詞或熱詞提供給用戶。其中,可以將該新詞或熱詞作為首選的候選項提供給用戶,這樣如果該用戶確實想要輸入該新詞或熱詞, 則直接按下空格鍵即可完成該詞條的上屏輸出,明顯提高了輸入效率。當(dāng)然,也可以將該新詞或熱詞顯示在候選框以外的地方,例如可以顯示在輸入框的空白部分,以此來提示該詞條相對其他詞條而言具有特殊性,當(dāng)然也可以為其提供相應(yīng)的選擇鍵,當(dāng)用戶按下該選擇鍵時,將該詞條上屏輸出。其中,用戶特征信息可以包括用戶的所在地信息,此時,可以實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中所述所在地信息對應(yīng)區(qū)域的用戶提供字詞候選項。例如,當(dāng)獲取到“大火”這一熱詞時,通過分析輸入過這一詞條的用戶的特征信息發(fā)現(xiàn),這些用戶都是位于北京市五道口附近,因此,可以確定“大火”這一熱詞對應(yīng)的用戶特征信息是用戶所在地是北京市五道口附近,并保存該信息。然后,當(dāng)有用戶輸入“dahuo”這一拼音時,可以首先判斷從該用戶的注冊信息中獲取該用戶的所在地,如果該用戶確實位于北京市五道口附近,則直接將“大火”作為首選的候選項提供給該用戶;否則,如果用戶不在該區(qū)域,則可以認為該用戶可能不是想要輸入“大火”這一熱詞,因此,按照常規(guī)的方式向用戶提供或選項即可,如,按照詞頻、用戶詞庫等對各個候選項進行排序,給出“大伙”、“大貨”、“大獲”等候選項,或者,也可以將“大火”展現(xiàn)在次選或首屏的末尾選項上,由用戶自行確認是否需要輸入“大火”。由此可見,由于在獲取新詞或熱詞時考慮了用戶所在地等信息,因此,可以將小范圍用戶使用的新詞或熱詞提取出來,供該小范圍內(nèi)的其他用戶使用。換言之,由于新詞或熱詞可能具有地域性等特點,如果基于網(wǎng)絡(luò)中的全部用戶進行統(tǒng)計,可能無法發(fā)現(xiàn)這些新詞或熱詞,但是本發(fā)明能夠基于某些用戶進行統(tǒng)計,可以最大限度地發(fā)現(xiàn)這些新詞或熱詞,并提供給網(wǎng)絡(luò)中其他的用戶使用。
具體實施方式
二在前述具體實施方式
一中,當(dāng)候選項中存在與所述新詞或熱詞重碼的候選項時, 是利用新詞或熱詞本身的一些特征,去判斷是否應(yīng)有作為首選項提供給某用戶。但是,有些新詞或熱詞可能并不具有明顯的用戶特征信息。例如,前文例子中提到的新詞“博斗”,該新詞可能無法獲得用戶特征信息,如果利用具體實施方式
一的方法,可能還是無法判斷是否應(yīng)該作為首選項將這種新詞或熱詞提供給用戶。為此,在該具體實施方式
二中提供了如下方法在獲取新詞或熱詞的同時或之后, 還可以獲取該新詞或熱詞的語言環(huán)境、前后詞條的鄰接次數(shù)等信息,通過這些信息可以獲取經(jīng)常與該新詞或熱詞同現(xiàn)的關(guān)鍵詞等信息,將這些關(guān)鍵詞與相應(yīng)的新詞或熱詞構(gòu)成語義搭配關(guān)系,并將該語義搭配關(guān)系進行保存。這樣,當(dāng)用戶輸入的編碼字符串命中某新詞或熱詞時,可以獲取該用戶當(dāng)前輸入的上下文等信息,如果這些信息中包含某個該新詞或熱詞對應(yīng)的關(guān)鍵詞,則可以將該新詞或熱詞提供給該用戶。同樣,此時也可以將該新詞或熱詞作為首選的候選項提供給該用戶,當(dāng)然也可以采用其他方式。前文所述都是假設(shè)用戶僅針對新詞或熱詞輸入編碼字符串,如,用戶想要輸入“大火”,則輸入的編碼字符串為“dahuo”。但是,在實際應(yīng)用中,還可能存在這樣的情況用戶輸入的編碼字符串可能會比較長,其中可能包含至少兩個詞條,當(dāng)然,其中也可能包含某些新詞或熱詞。針對這種情況,還可以利用上述具體實施方式
二中提供的語義搭配關(guān)系,實現(xiàn)針對包含新詞的編碼字符串的組詞。即實時應(yīng)用所述新詞或熱詞與所述關(guān)鍵詞的對應(yīng)關(guān)系, 針對所述編碼字符串進行組詞,并將組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。例如,與新詞“博斗”(指網(wǎng)民之間利用網(wǎng)絡(luò)博客進行的“吵架”或互相攻擊)構(gòu)成語義搭配關(guān)系的關(guān)鍵詞有“韓寒”、“博客”、“在網(wǎng)上”、“李承鵬”等等。如果用戶輸入的拼音串為“hanhanzaiwangshangyurenbodou(韓寒在網(wǎng)上與人(博斗或搏斗等))”時,在組詞時發(fā)現(xiàn)“在網(wǎng)上”與“博斗”之間的語義搭配關(guān)系,于是優(yōu)選給出“韓寒在網(wǎng)上與人博斗”候選項。當(dāng)然,也可以先通過上下文的語義搭配關(guān)系進行組詞,然后再判斷有沒有匹配的新詞或熱詞。由于除了需要處理針對新詞或熱詞的候選項之外,還要得到其他的候選項,為了便于處理,在本發(fā)明實施例中,可以在原有的通用模型、用戶模型的基礎(chǔ)上,加入新詞或熱詞模型。其中,通用模型為一個總體架構(gòu),可以給出常規(guī)的詞匯、語法及語義給出多個候選項及相應(yīng)的評分λ common ;用戶模型在通用模型候選項中查找包含用戶詞及用戶習(xí)慣用法,為與用戶習(xí)慣匹配的候選項加上相應(yīng)的分數(shù)λ user ;
新詞或熱詞模型則將包含新詞或熱詞及其前后環(huán)境、應(yīng)用搭配的候選項加上相應(yīng)的分數(shù)λ new。最終,將三個分數(shù)加權(quán)即可得到最好的候選項,然后按照用戶配置進行打包發(fā)送回客戶端即可。當(dāng)然,并不是說在每次轉(zhuǎn)換過程中都必須將三個模型都用到,根據(jù)實際情況使用即可。即,可以利用通用模型和/或用戶模型得到針對所述編碼字符串的組詞結(jié)果, 并對各組詞結(jié)果進行打分;然后再利用新詞模型進行判斷,當(dāng)某組詞結(jié)果中包含所述新詞或熱詞,且該組詞結(jié)果中包含與該新詞或熱詞對應(yīng)的關(guān)鍵詞,則增加該組詞結(jié)果的分數(shù);最后,根據(jù)各組詞結(jié)果最終的分數(shù),將所述組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。例如,可以按照各組詞結(jié)果最終的分數(shù),對各組詞結(jié)果進行排序,并將各組詞結(jié)果按順序提供給所述網(wǎng)絡(luò)中的用戶;或者,也可以僅將得分最高的組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶,等等。仍以用戶輸入“hanhanzaiwangshangyurenbodou”為例,首先,可以利用通用模型從通用詞庫、用戶詞庫、新詞或熱詞詞庫的所有詞匯中,按照通用模型構(gòu)建出來若干個候選項,如1. “韓寒在網(wǎng)上搏斗”;2. “韓寒在網(wǎng)上博斗”;3. “韓寒在網(wǎng)上剝豆”......而新詞或熱詞模型通過保存的語義搭配關(guān)系對各個候選項進行打分,調(diào)整候選項的綜合權(quán)值。如對于上述例子,發(fā)現(xiàn)“博斗”與其余部分關(guān)系密切,則為第二個候選項增加相應(yīng)的分數(shù),然后,將各個候選項所得的分數(shù)合并,并將最高分的組詞結(jié)果選出發(fā)送給用戶, 或者,將最高分的候選項作為首選項發(fā)送給用戶。需要說明的是,通常是在所有詞庫(包括新詞庫)中都得不到詞條時則進入組詞過程,對于桌面輸入法而言,如果組詞的新詞條不在本地,此時并行的新詞通訊已經(jīng)發(fā)出, 組詞模塊首先會自行進行常規(guī)的組詞,一旦得到與服務(wù)器端的通訊結(jié)果,則立即讀取新詞庫更新組詞結(jié)果;若等待超時則返回原先的組詞結(jié)果。服務(wù)器在向用戶提供組詞結(jié)果時,可以提供完整的組詞詞條,也可以僅將組詞詞條中包含的新詞或熱詞返回到客戶端(如對于新詞“悅宴”可能的請求為“吃過悅宴嗎”), 客戶端展現(xiàn)出該新詞之后,如果用戶接受了該新詞,則可以由服務(wù)器或客戶端從該新詞或熱詞開始向前和/或向后進行組詞,給出針對整個編碼字符串的完整的候選項。對于桌面輸入法而言,當(dāng)用戶編輯完詞條之后,則對比其編輯步驟查閱是否涉及已有的新詞,若最后上屏詞串包含已有新詞,則記錄該句子中該新詞的上下文,及時更新本地新詞的使用頻率;否則不包含已有新詞,也有可能是未被發(fā)現(xiàn)的新詞,則將其發(fā)送至新詞通訊模塊,上報服務(wù)器,即時監(jiān)控新詞。實施例二在前述實施例一中,是在假設(shè)發(fā)現(xiàn)了新詞或熱詞之后,獲取該新詞或熱詞對應(yīng)的用戶特征信息或具有語義搭配關(guān)系的關(guān)鍵詞,但是,在發(fā)現(xiàn)新詞或熱詞時,是針對網(wǎng)絡(luò)中的單個用戶或全部用戶進行統(tǒng)計的,因此可能無法獲得某些具有領(lǐng)域性、地域性的新詞或熱詞。例如,北京地區(qū)新開了一家飯店叫“悅宴”,則“悅宴”對于北京地區(qū)具有新詞的高頻及突發(fā)性的特征,但是,如果放在全體用戶集合中則其頻率特征可能很難被發(fā)現(xiàn)出來。又如, 實施例二的例子中,北京市五道口附近可能發(fā)生了一場大火,對于五道口附近的用戶來講,
16“大火”的使用頻率可能是在短時間內(nèi)突然升高,但是如果基于全體用戶來統(tǒng)計,則可能無法發(fā)現(xiàn)這一熱詞。為了解決該問題,本發(fā)明實施例二提供了相應(yīng)的方法首先,可以獲取網(wǎng)絡(luò)中各用戶的用戶特征信息,利用用戶特征信息對用戶進行分類,例如,用戶的IP段、用戶的輸入法系統(tǒng)當(dāng)前所處的應(yīng)用程序、用戶所勾選的偏好的細胞詞庫等都可以作為分類的依據(jù);顯然, 同一個用戶可以同時屬于不同的類別。然后,在判斷用戶輸入的字詞是否為新詞或熱詞時, 可以分別判斷該字詞在各種類別下是否具有新詞或熱詞的特征,如果某字詞在某類別下具有新詞或熱詞的特征,則可以將該字詞作為該類別下的新詞或熱詞,然后保存到該類別對應(yīng)的分類詞庫中,或者為該新詞或熱詞賦予該類別的標(biāo)簽。參見圖3,該實施例二提供的方法包括以下步驟S301 獲取用戶特征信息,基于用戶特征信息對用戶進行分類,得到多個用戶類別;S302 從所述用戶輸入的字詞中獲取針對各用戶類別的新詞或熱詞;S304:通過所述輸入法服務(wù)器,實時將所述針對各用戶類別的新詞或熱詞提供給網(wǎng)絡(luò)中的相應(yīng)類別的用戶??傊谠搶嵤├?,在判斷用戶輸入的字詞中是否包括新詞或熱詞的過程中, 不僅要獲知用戶選擇的字詞,還要獲知各用戶的IP段、各用戶的輸入法系統(tǒng)當(dāng)前所處的應(yīng)用程序或各用戶所勾選的偏好的細胞詞庫等信息。需要說明的是,由于有些用戶特征可能會發(fā)生變化,因此,對用戶的分類并不是一成不變的,可能會是一個動態(tài)的過程。例如,在用戶進行字詞輸入的過程中,輸入法系統(tǒng)當(dāng)前所處的應(yīng)用程序可能會發(fā)生變化,如原來用戶正在玩某網(wǎng)絡(luò)游戲,則該用戶會與其他玩該網(wǎng)絡(luò)游戲的用戶一起被分到該網(wǎng)絡(luò)游戲的類別中;但是,后來用戶退出該網(wǎng)絡(luò)游戲,并打開某即時通信軟件與好友聊天,此時,該用戶又會被分到其他與正在使用該軟件的用戶一起被分到該即時通信軟件的類別。當(dāng)然,用戶也可能在打網(wǎng)絡(luò)游戲的同時,利用即時通信軟件與好友聊天,此時,該用戶的輸入法所處的應(yīng)用程序可能會經(jīng)常發(fā)生切換,相應(yīng)的,該用戶所處的類別也可以隨時發(fā)生變化,在不同應(yīng)用程序中輸入的字詞可以單獨進行判斷。另外,可能會不斷有用戶登錄或退出輸入法服務(wù)器,因此,也使得各個類別中的用戶可能是不斷變化的,即可能不斷有新用戶加入某個類別,或者原來的用戶退出該類別,等等。另外需要說明的是,在對用戶輸入字詞按照上述類別分別進行判斷的同時,還可以基于所有用戶的所有字詞進行判斷,兩者之間并不沖突,反而互為補充,相互促進。在該實施例二的方法中,由于可以基于不同的用戶類別來發(fā)現(xiàn)新詞或熱詞,因此, 提高了新詞或熱詞能夠被發(fā)現(xiàn)的可能性。同時,如果基于某類別的用戶發(fā)現(xiàn)了某新詞或熱詞,則使得該新詞或熱詞具有了該類別的屬性。換言之,可以通過用戶的喜好標(biāo)簽、地域標(biāo)簽等統(tǒng)計該標(biāo)簽下的用戶輸入的高頻、熱點詞匯作為分類詞條。比如當(dāng)前按照I P段對所有的用戶進行分類索引,發(fā)現(xiàn)北京地區(qū)的IP段中,“悅宴”的頻率特征具有短期高頻的特點,則可以將“悅宴”作為新詞或熱詞更新至北京地區(qū)的分類詞庫中。如表1所示,在該分類詞庫中可以增加“悅宴”詞條。表 1“悅宴”ip: 3匕京地區(qū)范疇地點需要說明的是,雖然各類別中的用戶可能會不斷發(fā)生變化,但是對于某種分類詞庫中或?qū)儆谀愁悇e的已經(jīng)發(fā)現(xiàn)的新詞或熱詞而言,不會因為各類別中用戶的變化而變化。 例如,通過北京地區(qū)的用戶,發(fā)現(xiàn)了“悅宴”這一新詞,如果某個時刻,該類別下的用戶都離線了,則“悅宴”會仍然被保存,并且仍然具有“北京地區(qū)”這一類別屬性。因此,在一種優(yōu)選的實施方式中,可以利用這一特點,來解決當(dāng)候選項中存在與所述新詞或熱詞重碼的候選時,如何對各候選項進行排序的問題。具體的,在步驟S303實時應(yīng)用所述針對各用戶類別的新詞或熱詞為網(wǎng)絡(luò)中各個用戶提供字詞候選項時,可以判斷所述網(wǎng)絡(luò)中的用戶是否屬于所述新詞或熱詞對應(yīng)的用戶類別,如果屬于,則將所述新詞或熱詞提供給所述網(wǎng)絡(luò)中的用戶,同樣,此時也可以將該新詞或熱詞作為首選的候選項提供給該用戶,這樣,可以提高首選項的準(zhǔn)確率。當(dāng)然,也可以采用其他的方式提供新詞或熱詞,避免影響用戶的正常輸入。也就是說,由于有些新詞或熱詞可能是基于某種類別的用戶發(fā)現(xiàn)的,因此,說明這些新詞或熱詞可能具有某種類別屬性,并且可能該類別下的用戶才可能需要使用該新詞或熱詞,因此,當(dāng)發(fā)現(xiàn)某用戶輸入的編碼字符串能夠命中某新詞或熱詞時,可以首先判斷該新詞或熱詞是否具有類別屬性,如果具有,還可以判斷該用戶是否屬于該類別,如果屬于,則可以將該新詞或熱詞提供給該用戶,否則,按照常規(guī)的方式給出候選項,或者,也可以將該新詞或熱詞展現(xiàn)在次選或首屏的末尾選項上,由用戶自行確認是否進行新詞或熱詞的展現(xiàn)。需要說明的是,由于是由服務(wù)器將新詞或熱詞提供給網(wǎng)絡(luò)中的用戶,因此,服務(wù)器可以記錄各個新詞或熱詞相對網(wǎng)絡(luò)中所有用戶的整體詞頻,即假設(shè)用戶A輸入某新詞的次數(shù)是10次,用戶B輸入該新詞的次數(shù)的5次,用戶C輸入該新詞的次數(shù)是20次,并假設(shè)其他用戶沒有輸入過該新詞,則該新詞的整體詞頻為35 ;此時,可以將該整體詞頻作為網(wǎng)絡(luò)中各用戶的本地詞頻,這樣,即使某用戶使用該新詞的次數(shù)還比較少,也可以獲得較高的本地詞頻,下次再輸入該新詞時,該新詞在候選項中的位置可能會上升?;蛘撸部梢岳冕槍λ芯W(wǎng)絡(luò)用戶獲取新詞或熱詞的相對詞頻,來更新用戶的本地詞頻。例如,假設(shè)某新詞在規(guī)定時間內(nèi)的使用次數(shù)是50次,而新詞同音下的所有的詞條的使用次數(shù)共為100次(假設(shè)為50次的使用次數(shù)在新詞獲取的采集閾值內(nèi),可以被記錄為新詞的情況下),則該新詞在服務(wù)器端的相對詞頻是50%,也就是說,如本地新詞同音下的所有詞條的使用次數(shù)為20次,則使在詞庫中加入新詞時的詞頻設(shè)為20次,形成使新詞在本地詞庫中的使用次數(shù)占總使用次數(shù)的比為50%。此時,也可以將用戶本地詞庫中該新詞的相對詞頻修改為50%。通過前文各個實施例將本發(fā)明提供的提供字詞候選項的方法進行了詳細地介紹, 在其他實施例中,針對新詞或熱詞的特點,還可以在發(fā)現(xiàn)新詞或熱詞之后,通過搜索引擎等資源獲取關(guān)于該新詞或熱詞的一些外部資源信息,例如,如果是新詞,可以獲取該新詞的釋義,或者相關(guān)新聞?wù)?;如果是熱詞,則可以獲取與該熱詞相關(guān)的熱點新聞等。當(dāng)某用戶輸入了新詞或熱詞時,則可以將這些外部資源信息提供給用戶,使得用戶能夠通過輸入法
18獲得更多的信息。例如,在用戶點擊、鼠標(biāo)經(jīng)過等動作時展示百科解釋、事件導(dǎo)航等信息的顯示。或者,也可以將外部資源的鏈接提供給用戶,這樣,用戶能夠直接點擊鏈接進入相應(yīng)的頁面,這相當(dāng)于提供了一種獲取信息的快捷方式,例如,如果是熱詞,可在展現(xiàn)同時給出進入相關(guān)熱點新聞的快捷方式,如果是新詞,可以展現(xiàn)同時給出進入新詞百科或相關(guān)新聞的快捷方式。在具體實施時,各實施例及各種具體實施方式
可以互相結(jié)合使用,并且,可以同時獲取各種具體實現(xiàn)方式下所需的用戶信息、環(huán)境信息等,具體可以包括詞條的拼音、頻率、 前后詞條的鄰接次數(shù)、詞條適用的應(yīng)用程序環(huán)境、詞條適用的網(wǎng)頁交互環(huán)境等等,當(dāng)然還可以從外部資源獲取一些外部資源信息,包括詞條的百科釋義、相關(guān)新聞等等。在本發(fā)明實施例中,可以將這些信息稱為詞條的富信息,保存這些信息的數(shù)據(jù)庫可以稱為富信息庫。在采用具體的實施方式時,可以到該富信息庫中獲取所需的信息。另外,在本發(fā)明的各個實施例中,當(dāng)所述字詞候選項中包含與所述新詞或熱詞重碼的候選項時,在客戶端可以將新詞或熱詞與其他候選項進行區(qū)別展現(xiàn)。具體的,可以在提示位置給予特殊字體或顏色等的標(biāo)明。例如,可以將新詞或熱詞獨立展現(xiàn)在與編碼展現(xiàn)框等位置,而不是展現(xiàn)在候選展現(xiàn)框中,并且,還可以根據(jù)新詞或熱詞的應(yīng)用環(huán)境、短期輸入歷史等信息提升或者降低新詞或熱詞的展現(xiàn)位置;也可以改變新詞或熱詞的顏色,還可以為該新詞或熱詞加上特殊的標(biāo)識等等。通過這些方式,可以向用戶提供更多的信息,讓用戶獲知該詞語其他的普通詞匯相比具有特殊性。當(dāng)用戶輸入的編碼字符串包含多個詞條時,如果將多個組詞結(jié)果都提供給用戶, 則在客戶端也可以將包含有新詞或熱詞的詞條與其他詞條進行區(qū)別展現(xiàn),同樣,可以在提示位置給予特殊字體或顏色等的標(biāo)明。例如,可以將該詞條獨立展現(xiàn)在與編碼展現(xiàn)框位置, 而不是展現(xiàn)在候選展現(xiàn)框中,類似的,也可以根據(jù)新詞或熱詞的應(yīng)用環(huán)境、短期輸入歷史等信息提升或者降低新詞或熱詞的展現(xiàn)位置;也可以改變該詞條的顏色,還可以將該詞條中的新詞或熱詞突出顯示,或者為該新詞或熱詞加上特殊的標(biāo)識等等。通過這些方式,同樣可以向用戶提示該詞條中含有新詞或熱詞。以上所述介紹了新詞或熱詞在為用戶提供輸入候選項方面的應(yīng)用,在實際應(yīng)用中,還可以實時為網(wǎng)絡(luò)中的用戶展現(xiàn)所述新詞或熱詞,并提供獲取所述新詞或熱詞對應(yīng)的相關(guān)信息的入口。在這種情況下,即使用戶當(dāng)前不是正在進行字詞輸入,也可以通過輸入法系統(tǒng)將新獲取到的新詞或熱詞提示給用戶。此時,輸入法系統(tǒng)可以作為用戶獲取信息的工具,通過輸入法系統(tǒng)可以實時地將新收集到的新詞或熱詞提供給用戶,同時還可以向用戶提供獲取相關(guān)信息的入口,這樣,在用戶發(fā)現(xiàn)輸入法提供的新詞或熱詞之后,如果對其感興趣,可以通過該入口獲取與該新詞或熱詞相關(guān)的信息,例如,某熱詞可能對應(yīng)某新聞熱點事件,將該熱詞展現(xiàn)給用戶之后,用戶就可以通過相應(yīng)的入口,獲取到該新聞熱點事件的詳細內(nèi)容。其中,所述新詞或熱詞本身就可以作為獲取信息的入口,即,新詞或熱詞可以展現(xiàn)為類似鏈接的形式,用戶通過鼠標(biāo)點擊該新詞或熱詞,就可以直接獲取到相關(guān)信息。具體在向用戶提供相關(guān)信息時,可能需要使用瀏覽器,具體如何通過輸入法系統(tǒng)調(diào)用瀏覽器,則屬于現(xiàn)有技術(shù),這里不再贅述。與本發(fā)明實施例提供的提供新詞或熱詞的方法相對應(yīng),本發(fā)明實施例還提供了一種提供新詞或熱詞的系統(tǒng),參見圖4,該系統(tǒng)包括
獲取單元401,用于對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞;候選項提供單元402,用于通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。具體的,新詞或熱詞提供單元可以是在用戶進行字詞輸入的過程中,用于為用戶提供候選項;如果用戶當(dāng)前并不是在輸入與某新詞或熱詞相關(guān)的詞條,甚至可能并沒有進行字詞輸入,則也可以將新獲取到的新詞或熱詞顯示給用戶,由于該新詞或熱詞通常與某新聞事件、熱點事件等相關(guān)聯(lián),具有某些相關(guān)信息,因此,同時還可以為用戶提供顯示這些相關(guān)信息的入口。相應(yīng)的,新詞或熱詞提供單元402可以包括候選項提供單元,用于在用戶進行字詞輸入的過程中,實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項。或者,新詞或熱詞提供單元402也可以包括相關(guān)信息展現(xiàn)單元,用于實時為網(wǎng)絡(luò)中的用戶展現(xiàn)所述新詞或熱詞,并提供獲取所述新詞或熱詞對應(yīng)的相關(guān)信息的入口。其中,所述候選項提供單元可以包括判斷單元,用于當(dāng)所述字詞候選項中包含與所述新詞或熱詞重碼的候選項時,判斷網(wǎng)絡(luò)中的用戶需要輸入所述新詞或熱詞的概率,如果所述概率滿足預(yù)置條件,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。具體實現(xiàn)時,該系統(tǒng)還可以包括特征信息獲取單元,用于獲取所述新詞或熱詞對應(yīng)的用戶特征信息;所述判斷單元具體用于,判斷所述網(wǎng)絡(luò)中的用戶是否具有所述新詞或熱詞對應(yīng)的用戶特征信息,如果有,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。其中,所述用戶特征信息包括用戶的所在地信息,所述首選項確定單元具體用于, 判斷所述網(wǎng)絡(luò)中的用戶是否位于所述所在地信息對應(yīng)的區(qū)域,如果是,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶?;蛘?,該系統(tǒng)還可以包括關(guān)鍵詞獲取單元,用于獲取與所述新詞或熱詞具有語義搭配關(guān)系的關(guān)鍵詞;所述首選項確定單元具體用于,判斷所述網(wǎng)絡(luò)中的用戶當(dāng)前輸入的上下文中是否包含所述關(guān)鍵詞,如果包含,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。當(dāng)網(wǎng)絡(luò)中的用戶輸入的編碼字符串中包含至少兩個詞條時,所述候選項提供單元還包括組詞單元,用于實時應(yīng)用所述新詞或熱詞與所述關(guān)鍵詞的對應(yīng)關(guān)系,針對所述編碼字符串進行組詞,并將組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。其中,所述組詞單元包括組詞結(jié)果獲取子單元,用于獲取針對所述編碼字符串的組詞結(jié)果,并對各組詞結(jié)果進行打分;分數(shù)調(diào)整子單元,用于當(dāng)某組詞結(jié)果中包含所述新詞或熱詞,且該組詞結(jié)果中包含與該新詞或熱詞對應(yīng)的關(guān)鍵詞,則增加該組詞結(jié)果的分數(shù);結(jié)果提供子單元,用于根據(jù)各組詞結(jié)果最終的分數(shù),將所述組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。
20
相應(yīng)的,當(dāng)所述提供的組詞結(jié)果為至少兩個時,還包括第一展現(xiàn)單元,用于將包含有所述新詞或熱詞的組詞結(jié)果與其他組詞結(jié)果進行區(qū)別展現(xiàn)。或者,當(dāng)網(wǎng)絡(luò)中的用戶輸入的編碼字符串中包含至少兩個詞條時,所述候選項提供單元還包括首次提供單元,用于當(dāng)所述至少兩個詞條中包含所述新詞或熱詞時,將所述新詞或熱詞提供給所述網(wǎng)絡(luò)中的用戶;重新組詞單元,用于判斷所述網(wǎng)絡(luò)中的用戶是否接受所述新詞或熱詞,如果接受, 則從所述新詞或熱詞處開始向前和/或向后進行組詞,為網(wǎng)絡(luò)中的用戶提供針對所述編碼字符串的完整的候選項。為了能夠及時獲取到新詞或熱詞,獲取單元401可以包括分類子單元,用于獲取網(wǎng)絡(luò)中各用戶的用戶特征信息,基于所述用戶特征信息對網(wǎng)絡(luò)中的各用戶進行分類,得到至少兩個用戶類別;獲取子單元,用于從所述用戶輸入的字詞中獲取針對各用戶類別的新詞或熱詞。其中,所述新詞或熱詞提供單元具體用于,判斷所述網(wǎng)絡(luò)中的用戶是否屬于所述新詞或熱詞對應(yīng)的用戶類別,如果屬于,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。在實際應(yīng)用中,獲取單元401具體可以用于,收集用戶通過輸入法選擇的字詞,統(tǒng)計該字詞是否符合新詞或熱詞的預(yù)置條件,如果是,輸入法服務(wù)器將該新詞或熱詞進行記錄;相應(yīng)的,新詞或熱詞提供單元402具體可以用于,將所述記錄的新詞或熱詞以預(yù)置規(guī)則實時提供給輸入法用戶。其中,該裝置還可以包括保存單元,用于獲取新詞或熱詞之后,將所述新詞或熱詞保存在輸入法服務(wù)器端的新詞或熱詞詞庫中;相應(yīng)的,新詞或熱詞提供單元402具體用于,通過輸入法服務(wù)器,實時將所述新詞或熱詞詞庫中的新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。以上對本發(fā)明所提供的提供新詞或熱詞的方法及系統(tǒng),進行了詳細介紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想, 在具體實施方式
及應(yīng)用范圍上均會有改變之處。綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
1.一種提供新詞或熱詞的方法,其特征在于,包括對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞;通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶包括在用戶進行字詞輸入的過程中,實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項包括當(dāng)所述字詞候選項中包含與所述新詞或熱詞重碼的候選項時,判斷網(wǎng)絡(luò)中的用戶需要輸入所述新詞或熱詞的概率,如果所述概率滿足預(yù)置條件,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括獲取所述新詞或熱詞對應(yīng)的用戶特征信息;所述判斷網(wǎng)絡(luò)中的用戶需要輸入所述新詞或熱詞的概率,如果所述概率滿足預(yù)置條件,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶包括如果所述網(wǎng)絡(luò)中的用戶具有所述新詞或熱詞對應(yīng)的用戶特征信息,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述用戶特征信息包括用戶的所在地信息,所述如果所述網(wǎng)絡(luò)中的用戶具有所述新詞或熱詞對應(yīng)的用戶特征信息,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶包括如果所述網(wǎng)絡(luò)中的用戶位于所述所在地信息對應(yīng)的區(qū)域,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括獲取與所述新詞或熱詞具有語義搭配關(guān)系的關(guān)鍵詞;所述判斷網(wǎng)絡(luò)中的用戶需要輸入所述新詞或熱詞的概率,如果所述概率滿足預(yù)置條件,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶包括如果所述網(wǎng)絡(luò)中的用戶當(dāng)前輸入的上下文中包含所述關(guān)鍵詞,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,當(dāng)網(wǎng)絡(luò)中的用戶輸入的編碼字符串中包含至少兩個詞條時,所述實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項還包括實時應(yīng)用所述新詞或熱詞與所述關(guān)鍵詞的對應(yīng)關(guān)系,針對所述編碼字符串進行組詞, 并將組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述實時應(yīng)用所述新詞或熱詞與所述關(guān)鍵詞的對應(yīng)關(guān)系,針對所述編碼字符串進行組詞,并將組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶包括獲取針對所述編碼字符串的組詞結(jié)果,并對各組詞結(jié)果進行打分;當(dāng)某組詞結(jié)果中包含所述新詞或熱詞,且該組詞結(jié)果中包含與該新詞或熱詞對應(yīng)的關(guān)鍵詞,則增加該組詞結(jié)果的分數(shù);根據(jù)各組詞結(jié)果最終的分數(shù),將所述組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。
9.根據(jù)權(quán)利要求7或8所述的方法,其特征在于,當(dāng)所述提供的組詞結(jié)果為至少兩個時,還包括將包含有所述新詞或熱詞的組詞結(jié)果與其他組詞結(jié)果進行區(qū)別展現(xiàn)。
10.根據(jù)權(quán)利要求6所述的方法,其特征在于,當(dāng)網(wǎng)絡(luò)中的用戶輸入的編碼字符串中包含至少兩個詞條時,所述實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項還包括當(dāng)所述至少兩個詞條中包含所述新詞或熱詞時,將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶;如果所述網(wǎng)絡(luò)中的用戶接受所述新詞或熱詞,從所述新詞或熱詞處開始向前和/或向后進行組詞,為網(wǎng)絡(luò)中的用戶提供針對所述編碼字符串的完整的候選項。
11.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶包括實時為網(wǎng)絡(luò)中的用戶展現(xiàn)所述新詞或熱詞,并提供獲取所述新詞或熱詞對應(yīng)的相關(guān)信息的入口。
12.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞包括獲取網(wǎng)絡(luò)中各用戶的用戶特征信息,基于所述用戶特征信息對網(wǎng)絡(luò)中的各用戶進行分類,得到至少兩個用戶類別;從所述用戶輸入的字詞中獲取針對各用戶類別的新詞或熱詞。
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,所述實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶包括判斷所述網(wǎng)絡(luò)中的用戶是否屬于所述新詞或熱詞對應(yīng)的用戶類別,如果屬于,則將所述新詞或熱詞提供給所述網(wǎng)絡(luò)中的用戶。
14.根據(jù)權(quán)利要求1所述的方法,其特征在于所述對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞包括收集用戶通過輸入法選擇的字詞,統(tǒng)計該字詞是否符合新詞或熱詞的預(yù)置條件,如果是,輸入法服務(wù)器將該新詞或熱詞進行記錄;所述通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶包括將所述記錄的新詞或熱詞以預(yù)置規(guī)則實時提供給輸入法用戶。
15.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取新詞或熱詞之后還包括將所述新詞或熱詞保存在輸入法服務(wù)器端的新詞或熱詞詞庫中;所述通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶包括通過輸入法服務(wù)器,實時將所述新詞或熱詞詞庫中的新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。
16.一種提供新詞或熱詞的系統(tǒng),其特征在于,包括獲取單元,用于對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞;新詞或熱詞提供單元,用于通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述新詞或熱詞提供單元包括候選項提供單元,用于在用戶進行字詞輸入的過程中,實時應(yīng)用所述新詞或熱詞為網(wǎng)絡(luò)中的用戶提供字詞候選項。
18.根據(jù)權(quán)利要求17所述的系統(tǒng),其特征在于,所述候選項提供單元包括判斷單元,用于當(dāng)所述字詞候選項中包含與所述新詞或熱詞重碼的候選項時,判斷網(wǎng)絡(luò)中的用戶需要輸入所述新詞或熱詞的概率,如果所述概率滿足預(yù)置條件,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。
19.根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,還包括特征信息獲取單元,用于獲取所述新詞或熱詞對應(yīng)的用戶特征信息;所述判斷單元具體用于,判斷所述網(wǎng)絡(luò)中的用戶是否具有所述新詞或熱詞對應(yīng)的用戶特征信息,如果有,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。
20.根據(jù)權(quán)利要求19所述的系統(tǒng),其特征在于,所述用戶特征信息包括用戶的所在地信息,所述判斷單元具體用于,判斷所述網(wǎng)絡(luò)中的用戶是否位于所述所在地信息對應(yīng)的區(qū)域,如果是,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。
21.根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,還包括關(guān)鍵詞獲取單元,用于獲取與所述新詞或熱詞具有語義搭配關(guān)系的關(guān)鍵詞;所述判斷單元具體用于,判斷所述網(wǎng)絡(luò)中的用戶當(dāng)前輸入的上下文中是否包含所述關(guān)鍵詞,如果包含,則將所述新詞或熱詞作為候選項提供給所述網(wǎng)絡(luò)中的用戶。
22.根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于,當(dāng)網(wǎng)絡(luò)中的用戶輸入的編碼字符串中包含至少兩個詞條時,所述候選項提供單元還包括組詞單元,用于實時應(yīng)用所述新詞或熱詞與所述關(guān)鍵詞的對應(yīng)關(guān)系,針對所述編碼字符串進行組詞,并將組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。
23.根據(jù)權(quán)利要求22所述的系統(tǒng),其特征在于,所述組詞單元包括組詞結(jié)果獲取子單元,用于獲取針對所述編碼字符串的組詞結(jié)果,并對各組詞結(jié)果進行打分;分數(shù)調(diào)整子單元,用于當(dāng)某組詞結(jié)果中包含所述新詞或熱詞,且該組詞結(jié)果中包含與該新詞或熱詞對應(yīng)的關(guān)鍵詞,則增加該組詞結(jié)果的分數(shù);結(jié)果提供子單元,用于根據(jù)各組詞結(jié)果最終的分數(shù),將所述組詞結(jié)果提供給所述網(wǎng)絡(luò)中的用戶。
24.根據(jù)權(quán)利要求22或23所述的系統(tǒng),其特征在于,當(dāng)所述提供的組詞結(jié)果為至少兩個時,還包括第一展現(xiàn)單元,用于將包含有所述新詞或熱詞的組詞結(jié)果與其他組詞結(jié)果進行區(qū)別展現(xiàn)。
25.根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于,當(dāng)網(wǎng)絡(luò)中的用戶輸入的編碼字符串中包含至少兩個詞條時,所述候選項提供單元還包括首次提供單元,用于當(dāng)所述至少兩個詞條中包含所述新詞或熱詞時,將所述新詞或熱詞提供給所述網(wǎng)絡(luò)中的用戶;重新組詞單元,用于判斷所述網(wǎng)絡(luò)中的用戶是否接受所述新詞或熱詞,如果接受,則從所述新詞或熱詞處開始向前和/或向后進行組詞,為網(wǎng)絡(luò)中的用戶提供針對所述編碼字符串的完整的候選項。
26.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述新詞或熱詞提供單元包括相關(guān)信息展現(xiàn)單元,用于實時為網(wǎng)絡(luò)中的用戶展現(xiàn)所述新詞或熱詞,并提供獲取所述新詞或熱詞對應(yīng)的相關(guān)信息的入口。
27.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述獲取單元包括分類子單元,用于獲取網(wǎng)絡(luò)中各用戶的用戶特征信息,基于所述用戶特征信息對網(wǎng)絡(luò)中的各用戶進行分類,得到至少兩個用戶類別;獲取子單元,用于從所述用戶輸入的字詞中獲取針對各用戶類別的新詞或熱詞。
28.根據(jù)權(quán)利要求27所述的系統(tǒng),其特征在于,所述新詞或熱詞提供單元具體用于,判斷所述網(wǎng)絡(luò)中的用戶是否屬于所述新詞或熱詞對應(yīng)的用戶類別,如果屬于,則將所述新詞或熱詞提供給所述網(wǎng)絡(luò)中的用戶。
29.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述獲取單元具體用于收集用戶通過輸入法選擇的字詞,統(tǒng)計該字詞是否符合新詞或熱詞的預(yù)置條件,如果是,輸入法服務(wù)器將該新詞或熱詞進行記錄;所述新詞或熱詞提供單元具體用于將所述記錄的新詞或熱詞以預(yù)置規(guī)則實時提供給輸入法用戶。
30.根據(jù)權(quán)利要求16所述的裝置,其特征在于,還包括保存單元,用于獲取新詞或熱詞之后,將所述新詞或熱詞保存在輸入法服務(wù)器端的新詞或熱詞詞庫中;所述新詞或熱詞提供單元具體用于,通過輸入法服務(wù)器,實時將所述新詞或熱詞詞庫中的新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。
全文摘要
本發(fā)明公開了提供新詞或熱詞的方法及系統(tǒng),其中,所述方法包括對用戶通過輸入法系統(tǒng)輸入的字詞進行統(tǒng)計,從中獲取新詞或熱詞;通過輸入法服務(wù)器,實時將所述新詞或熱詞提供給網(wǎng)絡(luò)中的用戶。通過本發(fā)明,使得獲取到的新詞或熱詞能夠得到實時的應(yīng)用。
文檔編號G06F3/023GK102163198SQ20101011387
公開日2011年8月24日 申請日期2010年2月24日 優(yōu)先權(quán)日2010年2月24日
發(fā)明者張揚, 王硯峰, 賈劍峰 申請人:北京搜狗科技發(fā)展有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1