專利名稱::一種互聯(lián)網(wǎng)信息整合發(fā)布的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及互聯(lián)網(wǎng)信息傳播
技術(shù)領(lǐng)域:
,特別是涉及一種互聯(lián)網(wǎng)信息整合發(fā)布的方法和系統(tǒng)。
背景技術(shù):
:目前隨著互聯(lián)網(wǎng)技術(shù)應(yīng)用的越來越廣泛,人們很多的日常工作和娛樂都在網(wǎng)絡(luò)上進(jìn)行,人們所能夠獲取的互聯(lián)網(wǎng)信息數(shù)量也出現(xiàn)爆炸式的增長(zhǎng)。在人們的信息獲取習(xí)慣中,通常都存在對(duì)新鮮信息及時(shí)獲取的需求。其中,新鮮信息可以包括針對(duì)當(dāng)前時(shí)間點(diǎn)的各種新聞信息、觀點(diǎn)文章等信息,這些信息可以通過門戶網(wǎng)站等互聯(lián)網(wǎng)信息接入口實(shí)現(xiàn)獲取,例如,搜狐、新浪等門戶網(wǎng)站會(huì)及時(shí)更新其網(wǎng)站中的各種信息,以滿足用戶及時(shí)獲取的需求。用戶通過登陸某個(gè)門戶網(wǎng)站,可以獲取其所提供的針對(duì)當(dāng)前時(shí)間點(diǎn)的各種信息。但是,當(dāng)用戶并不是希望在信息廣度上獲取當(dāng)前時(shí)間點(diǎn)下的各種新鮮信息,而是希望在信息深度上獲取某個(gè)專題在近一段時(shí)間上的各種相關(guān)信息,或者希望了解某個(gè)對(duì)該用戶而言的新鮮事件,以及該事件在一段時(shí)間上的各種相關(guān)信息,則通過上述方式就無法實(shí)現(xiàn)了。并且,實(shí)際上,用戶對(duì)于后一類信息的獲取需求更為強(qiáng)烈一些。如,對(duì)于互聯(lián)網(wǎng)新詞就是這樣,用戶在瀏覽某些信息時(shí)或者從朋友處,得知了一個(gè)互聯(lián)網(wǎng)新詞(對(duì)于該用戶而言),但是卻不明白其具體情況,則就希望找到與該互聯(lián)網(wǎng)新詞相關(guān)的各種信息,以作進(jìn)一步了解。本發(fā)明的所述新詞可以包括人們?cè)谌粘I钪幸蚪佑|各種新生事物而總結(jié)出來的、大量使用并廣為傳播的詞條,包括新潮詞匯、新聞人物、重大事件、專為某一類人群使用的特定稱謂等。新詞一般具有被廣為使用、長(zhǎng)期流行、口語縮略化等特點(diǎn),如"八榮八恥"、"路演"、"次貨"、"轟》V,、"博斗"、"抱抱團(tuán)"等。為了滿足上述需求,用戶可以通過各種信息鏈接的方式(如,相關(guān)新聞推薦、相關(guān)文章推薦等),從一個(gè)信息鏈接到其他相關(guān)信息,獲取與該互聯(lián)網(wǎng)新詞相關(guān)的各種信息。但是,通常的信息鏈接數(shù)量有限,并且對(duì)于超過兩級(jí)的鏈接而言,其與原始信息的相關(guān)性會(huì)明顯下降,因此,在該方式下,用戶需要花費(fèi)很多的精力在信息獲取過程上,效率明顯低下。隨著互聯(lián)網(wǎng)信息搜索引擎技術(shù)的發(fā)展,人們?yōu)榱双@取與該互聯(lián)網(wǎng)新詞相關(guān)的各種信息,越來越多的通過關(guān)鍵詞搜索技術(shù)來實(shí)現(xiàn)。但是該方式也存在很多缺陷首先,用戶必須要知道該新詞的存在,才能進(jìn)行后續(xù)的搜索查詢,而在很多情況下,用戶并不知道該新詞的存在,即該方式仍然在一定程度上限制了與該新詞相關(guān)的各種新鮮信息在互聯(lián)網(wǎng)上的傳播速度;其次,雖然搜索結(jié)果與該新詞有一定的相關(guān)度,但是各條搜索結(jié)果與該新詞的相關(guān)程度不一、信息描述維度不一,所以需要用戶閱讀大量搜索結(jié)果之后,才能比較全面的了解該新詞,信息獲取效率仍然比較低下??傊惹行枰绢I(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問題就是如何能夠創(chuàng)造性的提出一種能夠增進(jìn)互聯(lián)網(wǎng)新鮮信息傳播速度的信息發(fā)布方案。
發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問題是提供一種互聯(lián)網(wǎng)信息整合發(fā)布的解決方案,通過該解決方案,挖掘出互聯(lián)網(wǎng)各種信息、服務(wù)與互聯(lián)網(wǎng)新詞的關(guān)系,以互聯(lián)網(wǎng)新詞為核心將各種相關(guān)信息整合起來集中發(fā)布,從而可以增進(jìn)以互聯(lián)網(wǎng)新詞為核心的相關(guān)新鮮信息的傳播速度,提高用戶的信息獲取效率。為了解決上述問題,本發(fā)明公開了一種互聯(lián)網(wǎng)信息整合發(fā)布的方法,包括獲取互聯(lián)網(wǎng)新詞;獲取針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息;獲取與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源;展現(xiàn)互聯(lián)網(wǎng)新詞;接收用戶針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求,發(fā)布針對(duì)該互聯(lián)網(wǎng)新詞自身屬性的描述信息,以及相關(guān)服務(wù)資源或者相關(guān)服務(wù)資源的鏈接。優(yōu)選的,可以通過以下方式獲取互聯(lián)網(wǎng)新詞獲取新詞候選;依據(jù)預(yù)置新詞特征,對(duì)所述新詞候選進(jìn)行篩選,獲耳又新詞。優(yōu)選的,所述新詞特征包括頻率特征,所述頻率特征包括該新詞候選作為查詢?cè)~在搜索引擎日志中的計(jì)數(shù)、輸入法用戶使用該新詞候選的情況統(tǒng)計(jì)、該新詞候選在網(wǎng)頁中的統(tǒng)計(jì)特征三者中的任意一個(gè)或者任意組合。優(yōu)選的,所述新詞特征也可以包括時(shí)間特征,所述時(shí)間特征包括突發(fā)出現(xiàn)特性以及^f吏用率平穩(wěn)增長(zhǎng)特性。7優(yōu)選的,可以通過以下方式獲取與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源在各種類型的服務(wù)資源集合中查詢獲取與相應(yīng)互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源;所述服務(wù)資源類型包括搜索服務(wù)、桌面產(chǎn)品、新聞、博客、游戲、關(guān)系網(wǎng)絡(luò)、標(biāo)簽、聚合內(nèi)容、在線詞典或者無線增值服務(wù)。優(yōu)選的,可以通過用戶端應(yīng)用程序或者應(yīng)用程序插件展現(xiàn)互聯(lián)網(wǎng)新詞;或者,也可以通過網(wǎng)站頁面方式展現(xiàn)互聯(lián)網(wǎng)新詞。優(yōu)選的,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括新詞定義;所述新詞定義是通過對(duì)網(wǎng)頁信息進(jìn)行挖掘而獲取的。優(yōu)選的,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息也可以包括相應(yīng)新詞在一段時(shí)間內(nèi),在一定維度上出現(xiàn)次數(shù)的統(tǒng)計(jì)趨勢(shì)圖或者評(píng)價(jià)參數(shù);所述維度包括網(wǎng)頁信息、查詢?nèi)罩?、用戶輸入或者用戶新詞點(diǎn)擊。優(yōu)選的,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息也可以包括相應(yīng)新詞針對(duì)特定輸入法的正確編碼字符串;所述正確編碼字符串通過匯總、分析用戶編碼字符串的輸入情況而獲得。依據(jù)本發(fā)明的另一優(yōu)選實(shí)施例,還公開了一種互聯(lián)網(wǎng)信息整合發(fā)布的系統(tǒng),包括用于獲取互聯(lián)網(wǎng)新詞的單元;用于獲取針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息的單元;用于獲取與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源的單元;用于展現(xiàn)互聯(lián)網(wǎng)新詞的單元;發(fā)布單元,用于接收用戶針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求,發(fā)布針對(duì)該互聯(lián)網(wǎng)新詞自身屬性的描述信息,以及相關(guān)服務(wù)資源或者相關(guān)服務(wù)資源的鏈接。優(yōu)選的,所述用于獲取互聯(lián)網(wǎng)新詞的單元可以進(jìn)一步包括新詞候選單元,用于獲取新詞候選;篩選單元,用于依據(jù)預(yù)置新詞特征,對(duì)所述新詞候選進(jìn)行篩選,獲取新詞。優(yōu)選的,所述新詞特征包括頻率特征,所述頻率特征包括該新詞候選作為查詢?cè)~在搜索引擎日志中的計(jì)數(shù)、輸入法用戶使用該新詞候選的情況統(tǒng)計(jì)、該新詞候選在網(wǎng)頁中的統(tǒng)計(jì)特征三者中的任意一個(gè)或者任意組合。優(yōu)選的,所述新詞特征也可以包括時(shí)間特征,所述時(shí)間特征包括突發(fā)出現(xiàn)特性以及使用率平穩(wěn)增長(zhǎng)特性。優(yōu)選的,所述與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源通過依據(jù)相應(yīng)新詞在各種類型的服務(wù)資源集合中進(jìn)行查詢而獲得;所述服務(wù)資源類型包括搜索服務(wù)、桌面產(chǎn)品、新聞、博客、游戲、關(guān)系網(wǎng)絡(luò)、標(biāo)簽、聚合內(nèi)容、在線詞典或者無線增值服務(wù)。優(yōu)選的,所述用于展現(xiàn)互聯(lián)網(wǎng)新詞的單元采用用戶端應(yīng)用程序或者應(yīng)用程序插件展現(xiàn)互^f關(guān)網(wǎng)新詞;或者,也可以采用網(wǎng)站頁面方式展現(xiàn)互耳關(guān)網(wǎng)新詞。優(yōu)選的,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括新詞定義;所述新詞定義是通過對(duì)網(wǎng)頁信息進(jìn)行挖掘而獲取的。優(yōu)選的,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息也可以包括相應(yīng)新詞在一段時(shí)間內(nèi),在一定維度上出現(xiàn)次數(shù)的統(tǒng)計(jì)趨勢(shì)圖或者評(píng)價(jià)參數(shù);所述維度包括網(wǎng)頁信息、查詢?nèi)罩?、用戶輸入或者用戶新詞點(diǎn)擊。優(yōu)選的,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息也可以包括相應(yīng)新詞針對(duì)特定輸入法的正確編碼字符串;所述正確編碼字符串通過匯總、分析用戶編碼字符串的輸入情況而獲得。依據(jù)本發(fā)明的另一優(yōu)選實(shí)施例,還公開了一種互聯(lián)網(wǎng)信息整合發(fā)布的裝置,包括新詞信息數(shù)據(jù)庫,用于存儲(chǔ)互聯(lián)網(wǎng)新詞、針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息、與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源信息,以及三者之間的映射關(guān)系;接口模塊,用于展現(xiàn)互聯(lián)網(wǎng)新詞,以及接收用戶針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求;發(fā)布模塊,用于當(dāng)收到針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求時(shí),從所述新詞信息數(shù)據(jù)庫獲取和發(fā)布針對(duì)該互聯(lián)網(wǎng)新詞自身屬性的描述信息,以及相關(guān)服務(wù)資源或者相關(guān)服務(wù)資源的鏈接。優(yōu)選的,所述與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源通過依據(jù)相應(yīng)新詞在各種類型的服務(wù)資源集合中進(jìn)行查詢而獲得;所述服務(wù)資源類型包括搜索服務(wù)、桌面產(chǎn)品、新聞、博客、游戲、關(guān)系網(wǎng)絡(luò)、標(biāo)簽、聚合內(nèi)容、在線詞典或者無線增值服務(wù)。優(yōu)選的,所述接口模塊采用用戶端應(yīng)用程序或者應(yīng)用程序插件展現(xiàn)互聯(lián)網(wǎng)新詞;或者,也可以采用網(wǎng)站頁面方式展現(xiàn)互耳關(guān)網(wǎng)新詞。優(yōu)選的,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括新詞定義;所述新詞定義是通過對(duì)網(wǎng)頁信息進(jìn)行挖掘而獲取的。優(yōu)選的,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息也可以包括相應(yīng)新詞在一段時(shí)間內(nèi),在一定維度上出現(xiàn)次數(shù)的統(tǒng)計(jì)趨勢(shì)圖或者評(píng)價(jià)參數(shù);所述維度包括網(wǎng)頁信息、查詢?nèi)罩?、用戶輸入或者用戶新詞點(diǎn)擊。優(yōu)選的,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息也可以包括相應(yīng)新詞針對(duì)特定輸入法的正確編碼字符串;所述正確編碼字符串通過匯總、分析用戶編碼字符串的輸入情況而獲得。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)本發(fā)明從互聯(lián)網(wǎng)的各種資源中挖掘新詞及其相關(guān)的各種信息,并采用多種方式將新詞相關(guān)的各種信息及發(fā)現(xiàn)過程展現(xiàn)給用戶;將這些新潮熱門詞匯及其相關(guān)信息及時(shí)展現(xiàn)給終端用戶,能夠幫助用戶及時(shí)獲取互聯(lián)網(wǎng)最新動(dòng)向,增進(jìn)互聯(lián)網(wǎng)新鮮信息的獲取和傳播速度。其次,本發(fā)明在相關(guān)信息的展現(xiàn)過程中,以互聯(lián)網(wǎng)新詞為核心整合了服務(wù)提供商提供的各種服務(wù),為用戶提供了一個(gè)非常貼近需求的信息綜合接口,因此本發(fā)明可以明顯改善服務(wù)質(zhì)量,提升用戶訪問量,增強(qiáng)用戶忠誠(chéng)度,加快服務(wù)推送速度以及增強(qiáng)用戶滿意度。圖1是本發(fā)明一種互聯(lián)網(wǎng)信息整合發(fā)布的方法實(shí)施例的步驟流程圖;圖2是本發(fā)明一種互聯(lián)網(wǎng)信息整合發(fā)布的系統(tǒng)實(shí)施例的結(jié)構(gòu)框圖;圖3是本發(fā)明一種互聯(lián)網(wǎng)信息整合發(fā)布系統(tǒng)的具體實(shí)現(xiàn)優(yōu)選實(shí)施例的結(jié)構(gòu)關(guān)系圖4是本發(fā)明一種新詞提示的界面示意圖5是本發(fā)明一種互聯(lián)網(wǎng)信息整合發(fā)布的裝置實(shí)施例的結(jié)構(gòu)框圖6是本發(fā)明一個(gè)針對(duì)具體新詞"王櫟鑫"發(fā)布相關(guān)信息的界面示意圖。具體實(shí)施例方式10為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明。本發(fā)明可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本發(fā)明,在這些分布式計(jì)算環(huán)境中,由通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。參照?qǐng)D1,示出了本發(fā)明一種互聯(lián)網(wǎng)信息整合發(fā)布的方法實(shí)施例,具體可以包括以下步驟步驟IOI、獲取互聯(lián)網(wǎng)新詞。步驟102、獲取針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息。步驟103、獲取與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源。具體的,可以通過以下方式獲取與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源在各種類型的服務(wù)資源集合中查詢獲取與相應(yīng)互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源;所述服務(wù)資源類型可以包括搜索服務(wù)、桌面產(chǎn)品、新聞、博客、游戲、關(guān)系網(wǎng)絡(luò)、標(biāo)簽、聚合內(nèi)容、在線詞典或者無線增值服務(wù)??傊?,通過步驟101、102和103可以建立一互聯(lián)網(wǎng)新詞、針對(duì)其自身屬性的描述信息以及與其相關(guān)的各種服務(wù)資源之間的映射關(guān)系。步驟104、展現(xiàn)互聯(lián)網(wǎng)新詞。具體的,可以通過用戶端應(yīng)用程序或者應(yīng)用程序插件展現(xiàn)互耳關(guān)網(wǎng)新詞;也可以通過網(wǎng)站頁面方式展現(xiàn)互聯(lián)網(wǎng)新詞。例如,可以建立一個(gè)新詞發(fā)布主頁,以時(shí)間、活i夭度、類別或者以拼音首字母等等為索引,展示近兩年內(nèi)的互聯(lián)網(wǎng)新詞(即PULL模式)。當(dāng)然,每個(gè)新詞后面都映射有針對(duì)其自身屬性的描述信息以及與其相關(guān)的服務(wù)資源。用戶可以通過該新詞發(fā)布主頁,瀏覽或者查詢自己所需的新詞,進(jìn)而通過步驟105獲取該新詞的各種相關(guān)信息;不需要用戶再通過手動(dòng)搜索、篩選、分析獲取該新詞的各種相關(guān)信息,提高了信息傳播的速度。再例如,還可以采用系統(tǒng)桌面彈出欄、輸入法/即時(shí)聊天/桌面搜索軟件的新詞更新提示、聚合內(nèi)容(RSS)信息推送提示等方式,展示本月內(nèi)的互聯(lián)網(wǎng)新詞(即PUSH模式)等等。由于這種方式主要用于新詞提示,無法展示大量新詞,因此,一^l殳可以用于向用戶推薦最新的新詞或者該用戶定制的新詞,該方式具有更新及時(shí)、方式簡(jiǎn)潔等特點(diǎn)。用戶可以簡(jiǎn)單瀏覽所展現(xiàn)的新詞,從而確定其是否需要進(jìn)一步了解其背后很多的相關(guān)信息;如果需要,則點(diǎn)擊鏈接,就可以進(jìn)入步驟105。當(dāng)然,步驟104除了僅僅展示新詞本身,在容量允許的情況下,還可以展現(xiàn)一些簡(jiǎn)單的描述信息,例如該新詞的標(biāo)簽、類別等等。下面對(duì)聚合內(nèi)容RSS進(jìn)行簡(jiǎn)單介紹。聚合內(nèi)容RSS(ReallySimpleSyndication)是一種描述和同步網(wǎng)站內(nèi)容的格式,是目前使用最廣泛的XML應(yīng)用。用于本發(fā)明的RSS,其實(shí)現(xiàn)大致可以分為以下兩類第一類RSS閱讀器可以為運(yùn)行在計(jì)算機(jī)桌面上的應(yīng)用程序,通過所訂閱新詞供應(yīng),可自動(dòng)、定時(shí)地更新新詞提示?,F(xiàn)有技術(shù)中已經(jīng)提出了針對(duì)新聞閱讀的RSS閱讀器,如Awasu、FeedDemon和RSSReader;以及,周博通,看天下,博閱等等多款RSS閱讀器,所以具體實(shí)現(xiàn)細(xì)節(jié)在此就不再詳述。第二類RSS閱讀器可以為內(nèi)嵌于已在計(jì)算機(jī)中運(yùn)行的應(yīng)用程序中。例如,本發(fā)明可以將RSS閱讀器的功能內(nèi)嵌在輸入法/即時(shí)聊天/桌面搜索軟件/瀏覽器中;當(dāng)后臺(tái)分析得到了用戶所定制的新詞時(shí)(如娛樂領(lǐng)域的新詞),或者缺省模式下的服務(wù)器端新詞自動(dòng)更新時(shí),則彈出浮動(dòng)窗口進(jìn)行提示。步驟105、接收用戶針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求,發(fā)布針對(duì)該互聯(lián)網(wǎng)新詞自身屬性的描述信息,以及相關(guān)服務(wù)資源或者相關(guān)服務(wù)資源的鏈接。一般的,步驟105所進(jìn)一步發(fā)布的信息可以采用獨(dú)立新窗口或者新網(wǎng)頁的方式發(fā)布。如果在該網(wǎng)頁中可以直接發(fā)布相關(guān)服務(wù)資源,則直接發(fā)布即可,例如搜索結(jié)果列表或者定制服務(wù)的定制需求輸入窗口等等;如果無法直接發(fā)布相關(guān)服務(wù)資源,則可以發(fā)布其鏈接,例如相關(guān)博客、游戲或者桌面產(chǎn)品等等。下面對(duì)步驟101如何獲取互聯(lián)網(wǎng)新詞進(jìn)行簡(jiǎn)單介紹。本發(fā)明可以采用各種方式獲取新詞,如,可以采用已公開專利文件所提及的各種獲取方式,具體情況在此不再贅述。下面給出一種本發(fā)明可能的實(shí)現(xiàn)方式A、獲取新詞候選;獲取新詞候選的方式也可以是多種多樣的。例如,可以通過收集互聯(lián)網(wǎng)語料,去除噪音后分詞;然后對(duì)各個(gè)分詞結(jié)果在標(biāo)準(zhǔn)詞典中進(jìn)4亍匹配,如果在標(biāo)準(zhǔn)詞典中不存在,則可以確定該分詞結(jié)果為一個(gè)新詞候選。再例如,可以從查詢?nèi)罩局惺占脩舻牟樵冊(cè)~,篩選得到一批查詢頻率符合要求的查詢?cè)~;然后分別對(duì)這些查詢?cè)~在標(biāo)準(zhǔn)詞典中進(jìn)行匹配,如果在標(biāo)準(zhǔn)詞典中不存在,則可以確定該查詢?cè)~為一個(gè)新詞候選。再例如,可以收集輸入法用戶詞庫中的新詞(一般而言,這些新詞都是標(biāo)準(zhǔn)詞典中沒有的)及其輸入次數(shù),如果輸入次數(shù)高于一定閾值,則可以確定該詞為一個(gè)新詞候選。B、依據(jù)預(yù)置新詞特征,對(duì)所述新詞候選進(jìn)行篩選,獲取新詞。在具體實(shí)現(xiàn)中,由于新詞篩選所考慮因素的不同,所依據(jù)的新詞特征也可能不同,下面給出本發(fā)明可能涉及的一些新詞特征。在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,所述新詞特征可以包括頻率特征,所述頻率特征包括該新詞候選作為查詢?cè)~在搜索引擎日志中的計(jì)數(shù)、輸入法用戶使用該新詞候選的情況統(tǒng)計(jì)、該新詞候選在網(wǎng)頁中的統(tǒng)計(jì)特征三者中的任意一個(gè)或者任意組合。優(yōu)選的,這三者都符合一定條件時(shí),才將該新詞候選確定為一個(gè)合格的新詞。同時(shí),可能還需要考慮時(shí)間特征,所述時(shí)間特征包括突發(fā)出現(xiàn)特性以及使用率平穩(wěn)增長(zhǎng)特性。因?yàn)樾略~一般都是突然出現(xiàn)的,并且由于其在一定范圍內(nèi)的傳播,所以在一段時(shí)間內(nèi),新詞的使用率是呈現(xiàn)平穩(wěn)增長(zhǎng)的特性的;所以本發(fā)明可以釆用上述的時(shí)間特征來篩選新詞。需要說明的是,本發(fā)明的新詞特征還可能涉及語法特征、信息學(xué)特征、新聞標(biāo)題命中或者垃圾詞命中等特征,在后面的具體例子中再詳細(xì)介紹。下面對(duì)步驟102所得到的描述信息進(jìn)行簡(jiǎn)單介紹。所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息,其目的就是幫助用戶更好的了解該新詞。由于描述角度的不同,所述描述信息可能具有多樣性,下面簡(jiǎn)單舉例說明。在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息可以包括有新詞定義;所述新詞定義是通過對(duì)網(wǎng)頁信息進(jìn)行挖掘而獲取的。例如,在該新詞前后相鄰之處包括詞匯"是指"、"來源"、"定義"、"為"字樣的,則可以將整句或者整段抽取出來,作為該新詞的定義。當(dāng)然,為了精確起見,還可以采用人工校正或者采用用戶上傳的方式獲取該新詞的定義。在本發(fā)明的另一個(gè)優(yōu)選實(shí)施例中,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息還可以包括相應(yīng)新詞在一段時(shí)間內(nèi),在一定維度上出現(xiàn)次數(shù)的統(tǒng)計(jì)趨勢(shì)圖或者評(píng)價(jià)參數(shù);所述維度包括網(wǎng)頁信息、查詢?nèi)罩?、用戶輸入或者用戶新詞點(diǎn)擊。例如,X軸為時(shí)間軸,Y軸為用戶查詢次數(shù)軸,則繪制出來的趨勢(shì)圖可以表示該新詞在一段時(shí)間內(nèi),在搜索查詢維度上的變換趨勢(shì)。用戶新詞點(diǎn)擊是本發(fā)明的一個(gè)用戶反饋維度,具體是指應(yīng)用本發(fā)明后,用戶點(diǎn)擊查看該新詞相關(guān)信息的次數(shù)或頻率,則可以在一定程度上反饋用戶對(duì)該新詞的關(guān)注度,所以可以將該反饋信息也記錄到針對(duì)該新詞的屬性描述信息中。為了更直觀展示在各個(gè)維度下的新詞屬性,也可以采用評(píng)價(jià)參數(shù)的方式實(shí)現(xiàn),如A維度(8分);B維度(9分);C維度(8.5分)等等,用戶可以一目了然,同時(shí)查看該新詞在各個(gè)維度上的情況。在本發(fā)明的另一個(gè)優(yōu)選實(shí)施例中,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息還可以包括相應(yīng)新詞針對(duì)特定輸入法的正確編碼字符串;所述正確編碼字符串可以通過匯總、分析用戶編碼字符串的輸入情況而獲得。因?yàn)橐话愕膶?duì)于樣本數(shù)量龐大的輸入法用戶群體而言,輸入正確編碼字符串的頻率會(huì)遠(yuǎn)遠(yuǎn)高于輸入錯(cuò)誤編碼字符串的頻率,因此,可以通過匯總、分析用戶編碼字符串的輸入情況而獲得該新詞的正確編碼字符串。例如,在某些情況下,用戶可能并不清楚對(duì)于某個(gè)新詞,如果通過鍵盤輸入時(shí)(如,與其他用戶的信息交互),其正確的編碼字符串應(yīng)該是怎樣的(例如,對(duì)于拼音輸入法,不知道其讀音);通過本屬性描述信息的展示,可以幫助用戶正確輸入。當(dāng)然,本例中的屬性描述信息主要針對(duì)中、日、韓等非羅馬字符;如果將本發(fā)明應(yīng)用在羅馬字符語言上,則可以不應(yīng)用本例中的屬性描述4呂息。參照?qǐng)D2,示出了本發(fā)明一種互聯(lián)網(wǎng)信息整合發(fā)布的系統(tǒng)實(shí)施例,具體可以包^"以下部件新詞獲耳又單元201,用于獲取互聯(lián)網(wǎng)新詞;描述信息獲取單元202,用于獲取針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息;服務(wù)資源獲取單元203,用于獲取與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源;所述與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源可以通過依據(jù)相應(yīng)新詞在各種類型的服務(wù)資源集合中進(jìn)行查詢而獲得;所述服務(wù)資源類型可以包括搜索服務(wù)、桌面產(chǎn)品、新聞、博客、游戲、關(guān)系網(wǎng)絡(luò)、標(biāo)簽、聚合內(nèi)容、在線詞典或者無線增值服務(wù)等;新詞展現(xiàn)單元204,用于展現(xiàn)互聯(lián)網(wǎng)新詞;可以采用用戶端應(yīng)用程序或者應(yīng)用程序插件展現(xiàn)互聯(lián)網(wǎng)新詞;或者,采用網(wǎng)站頁面方式展現(xiàn)互聯(lián)網(wǎng)新詞;即本發(fā)明即可以應(yīng)用服務(wù)器端推送(push)的方式,也可以采用用戶主動(dòng)查詢的情況(pull模式);發(fā)布單元205,用于接收用戶針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求,發(fā)布針對(duì)該互聯(lián)網(wǎng)新詞自身屬性的描述信息,以及相關(guān)服務(wù)資源或者相關(guān)服務(wù)資源的鏈接。在本發(fā)明的另一個(gè)優(yōu)選實(shí)施例中,所述用于獲取互^:網(wǎng)新詞的單元201進(jìn)一步包括新詞候選單元,用于獲取新詞候選;篩選單元,用于依據(jù)預(yù)置新詞特征,對(duì)所述新詞候選進(jìn)行篩選,獲取新詞。其中,所述新詞特征可以包括頻率特征,所述頻率特征包括該新詞候選作為查詢?cè)~在搜索引擎日志中的計(jì)數(shù)、輸入法用戶使用該新詞候選的情況統(tǒng)計(jì)、該新詞候選在網(wǎng)頁中的統(tǒng)計(jì)特征三者中的任意一個(gè)或者任意組合。優(yōu)選的是,所述新詞特征還可以包括時(shí)間特征,所述時(shí)間特征包括突發(fā)出現(xiàn)特性以及使用率平穩(wěn)增長(zhǎng)特性。在本發(fā)明的另一個(gè)優(yōu)選實(shí)施例中,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括新詞定義;所述新詞定義是通過對(duì)網(wǎng)頁信息進(jìn)行挖掘而獲取的。進(jìn)一步,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息還可以包括相應(yīng)新詞在一段時(shí)間內(nèi),在一定維度上出現(xiàn)次數(shù)的統(tǒng)計(jì)趨勢(shì)圖或者評(píng)價(jià)參數(shù);所述維度包括網(wǎng)頁信息、查詢?nèi)罩?、用戶輸入或者用戶新詞點(diǎn)擊。在一些情況下,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息還可以包括相應(yīng)新詞針對(duì)特定輸入法的正確編碼字符串;所述正確編碼字符串通過匯總、分析用戶編碼字符串的輸入情況而獲得。由于圖2所示的系統(tǒng)實(shí)施例是相應(yīng)于圖1所示的方法實(shí)施例的,本例未詳述之處請(qǐng)參見前述方法實(shí)施例相關(guān)描述即可。參照?qǐng)D3,示出了本發(fā)明一種互聯(lián)網(wǎng)信息整合發(fā)布系統(tǒng)的具體實(shí)現(xiàn)優(yōu)選實(shí)施例,具體可以包括以下部件語料定向抓取模塊301:用于從定向來源獲取文本數(shù)據(jù),例如,可能出現(xiàn)新詞的互聯(lián)網(wǎng)信息來源。具體的,可以包括網(wǎng)頁、新聞、論壇、博客等網(wǎng)頁語料;用戶查詢?nèi)罩?;輸入法用戶詞庫;用戶語音聊天樣本(需要通過語音到文本的轉(zhuǎn)換);聊天記錄語料等等。需要說明的是,涉及用戶數(shù)據(jù)的抓取過程不應(yīng)涉及具體用戶的隱私。語料定向抓取模塊301的具體獲取語料的方式可以是使用定向網(wǎng)絡(luò)蜘蛛(focusedcrawler)抓:取,或者從匿名用戶數(shù)據(jù)(如輸入法用戶詞庫、聊天記錄等)的存儲(chǔ)服務(wù)器中獲得。對(duì)于定向網(wǎng)絡(luò)蜘蛛抓取,站點(diǎn)的選取可以是指定站點(diǎn)抓取,也可以是基于抓取網(wǎng)頁內(nèi)容的分類點(diǎn)過濾。由于其并非本發(fā)明重點(diǎn),在此不再詳述。數(shù)據(jù)凈化預(yù)處理模塊302:用于去除模塊301所抓取的原始語料中的格式信息、干擾信息或其他與新詞發(fā)現(xiàn)無關(guān)的數(shù)據(jù)(即噪音信息)。例如,去除網(wǎng)頁的HTML標(biāo)簽,網(wǎng)頁無效內(nèi)容,過濾語音聊天記錄噪音等,為生成新詞候選做準(zhǔn)備。新詞候選生成模塊303:用于按照一定的規(guī)則方法生成新詞候選,便于模塊304、模塊305所執(zhí)行的驗(yàn)證過程;新詞候選生成模塊303相當(dāng)于完成了新詞的粗選。前面的實(shí)施例中已經(jīng)介紹了幾種可行的新詞候選獲取方式,在此不再贅述。新詞自動(dòng)驗(yàn)證模塊304。新詞自動(dòng)驗(yàn)證模塊304用于在新詞候選生成模塊303之后做進(jìn)一步的過濾,從新詞候選中挑選出質(zhì)量較高的詞條,作為新詞輸出。本模塊可根據(jù)實(shí)際應(yīng)用需要設(shè)定相應(yīng)判定原則對(duì)新詞加以篩選和驗(yàn)證,例如,基于規(guī)則或者基于統(tǒng)計(jì)判別進(jìn)行。新詞自動(dòng)驗(yàn)證模塊304驗(yàn)證確認(rèn)的新詞可以交由新詞數(shù)據(jù)存儲(chǔ)模塊306管理。新詞自動(dòng)驗(yàn)證模塊304所涉及的新詞特征,包括但不限于頻率、時(shí)間分布特性、語法規(guī)則、上下文關(guān)鍵字、用戶使用的廣度和頻度等,參見表l,詳述如下。表1新詞驗(yàn)證模板<table>tableseeoriginaldocumentpage17</column></row><table>具體的,對(duì)于頻率特征中的搜索引擎查詢計(jì)數(shù)維度而言,在優(yōu)選實(shí)現(xiàn)時(shí),既要考慮在查詢?nèi)罩局械某霈F(xiàn)次數(shù),同時(shí)還要考慮該新詞候選單獨(dú)作為一個(gè)查詢串的次數(shù),后者可以提高新詞成立的可能性。再例如,對(duì)于頻率特征中的(輸入法等)用戶詞庫統(tǒng)計(jì)維度而言,在優(yōu)選實(shí)現(xiàn)時(shí),既要考慮用戶輸入的次數(shù),也要考慮該新詞被用戶使用時(shí)的地域性,同時(shí)還要考慮用戶輸入的絕對(duì)頻率,以盡量的減少篩選偏差。再例如,對(duì)于頻率特征中的網(wǎng)頁統(tǒng)計(jì)特征維度而言,在優(yōu)選實(shí)現(xiàn)時(shí),需要考慮該新詞候選是更多的出現(xiàn)在論壇、博客等分類語料中,還是更多的出現(xiàn)在普通網(wǎng)頁中,不同的網(wǎng)頁分類具有不同的統(tǒng)計(jì)權(quán)重。同時(shí),還需要考慮是否需要在時(shí)間上對(duì)該新詞候選的語料來源作區(qū)別,例如,賦予近期所4爪取的網(wǎng)頁較高的新詞權(quán)重??傊?,新詞候選的驗(yàn)證是一個(gè)整合多種特征綜合考慮的過程,因?yàn)槊總€(gè)候選可能同時(shí)具有若干個(gè)對(duì)判為新詞有利和不利的特征。候選生成策略可以是規(guī)則或統(tǒng)計(jì)判別方法,確定每個(gè)新詞特征的權(quán)重。如有必要,為了l^高處理效率和質(zhì)量,-瞼證過程還可加入人工干預(yù)。人工干預(yù)驗(yàn)證模塊305(可選)。人工參與驗(yàn)證可以較大的提高新詞發(fā)現(xiàn)的精度,并能提供反饋給新詞自動(dòng)驗(yàn)證模塊304以改進(jìn)模板規(guī)則,但是在互聯(lián)網(wǎng)海量信息的情況下,主要工作還需要依靠新詞自動(dòng)驗(yàn)證模塊304。新詞數(shù)據(jù)存儲(chǔ)模塊306。按實(shí)際應(yīng)用對(duì)新詞數(shù)據(jù)加以存儲(chǔ)和組織,包括存儲(chǔ)、分發(fā)、備份等功能。具體的,新詞數(shù)據(jù)存儲(chǔ)模塊306可以將驗(yàn)證確認(rèn)的新詞加以存儲(chǔ)和組織,優(yōu)選的是,新詞數(shù)據(jù)存儲(chǔ)模塊306還可以用于存儲(chǔ)從描述信息獲取模塊307和服務(wù)資源獲取模塊308所獲取的針對(duì)新詞的屬性描述信息和相應(yīng)的服務(wù)資源信息,以便后續(xù)展現(xiàn)給用戶時(shí)的調(diào)用。描述信息獲取模塊307可以依據(jù)前述的各種實(shí)現(xiàn)方式獲取針對(duì)新詞自身屬性的各種描述信息,具體不再重復(fù)。服務(wù)資源獲取模塊308也可以依據(jù)前述的各種實(shí)現(xiàn)方式獲取針對(duì)該新詞可能提供的各種服務(wù)資源,具體不再重復(fù)。由于單獨(dú)的一個(gè)新詞,對(duì)于普通用戶而言往往是生澀難懂的,因此,需要描述信息獲取模塊307和服務(wù)資源獲取模塊308進(jìn)一步加工并整合其他一些用戶能夠理解的信息和可能需要的服務(wù)資源,如新詞的定義、來源、例句、類另'J、活躍時(shí)間、拼寫方法和該新詞曾出現(xiàn)的網(wǎng)頁列表等;從而可向用戶提供一個(gè)以新詞為核心,整合了各種相關(guān)信息的綜合服務(wù)接口,將這些信息之間的內(nèi)在聯(lián)系為用戶挖掘出來,以提高用戶的信息獲取效率。新詞內(nèi)部應(yīng)用模塊309。新詞數(shù)據(jù)存儲(chǔ)模塊306中所存儲(chǔ)的新詞數(shù)據(jù)也可以被應(yīng)用到一些內(nèi)部服務(wù)(所述內(nèi)部服務(wù)是針對(duì)直接面向用戶的外部服務(wù)而言的)上,為各種內(nèi)部應(yīng)用提供服務(wù)。如搜索引擎的分詞模塊或者新詞候選判定時(shí)的詞典資源等等,新詞的加入可以改善這些內(nèi)部應(yīng)用的效果。用戶端新詞更新提示模塊310。在本例中,從后臺(tái)收集獲取的新詞數(shù)據(jù),以定期同步的方式向用戶進(jìn)行更新提示,引起用戶點(diǎn)擊,轉(zhuǎn)到新詞相關(guān)信息的展現(xiàn)模塊311-313。優(yōu)選的是,可以將更新提示模塊310嵌入在輸入法應(yīng)用中,在將新詞更新到輸入法詞庫的時(shí)候,將更新提示顯示給用戶。新詞集中展現(xiàn)模塊311。用戶通過對(duì)更新提示模塊310的操作,觸發(fā)新詞集中展現(xiàn)模塊311,由新詞集中展現(xiàn)模塊311負(fù)責(zé)將新詞相關(guān)的詳盡信息呈現(xiàn)給用戶,該模塊主要提供針對(duì)新詞自身屬性的描述信息,并可以提供相關(guān)服務(wù)資源或者服務(wù)資源的鏈接。在線詞典/詞庫wiki模塊312。用戶通過新詞集中展現(xiàn)模塊311所展示的服務(wù)資源或者其《連接,可以觸發(fā)模塊312。在線詞典/詞庫wiki模塊312可以提供類似wiki/百科詞典的新詞展現(xiàn)功能,用戶可以及時(shí)反饋、修正詞條相關(guān)的錯(cuò)誤或疏漏,同時(shí)建立自定義標(biāo)簽(tag),方便相同喜好用戶的聯(lián)系。在本發(fā)明的一個(gè)實(shí)施例中,在線詞典/詞庫wiki模塊312的部分功能可以直接集成在新詞集中展現(xiàn)模塊311的展現(xiàn)界面中,方便用戶直接調(diào)用。專項(xiàng)服務(wù)資源展現(xiàn)模塊313。例如,新詞集中展現(xiàn)模塊311可以直接提供相關(guān)新聞、個(gè)人主頁、博客鏈接等,由專項(xiàng)服務(wù)資源展現(xiàn)模塊313向用戶提供相應(yīng)的服務(wù)即可。搜索結(jié)果頁展現(xiàn)模塊314。與專項(xiàng)服務(wù)資源展現(xiàn)模塊313的原理相同,搜索結(jié)果頁展現(xiàn)模塊314負(fù)責(zé)為從新詞集中展現(xiàn)模塊311轉(zhuǎn)來的搜索類新詞查詢提供搜索結(jié)果頁。優(yōu)選的是,搜索結(jié)果頁展現(xiàn)模塊314涉及的搜索服務(wù)可以是網(wǎng)頁搜索、音樂/圖片/視頻/地圖等專項(xiàng)搜索。比如一個(gè)新樓盤名稱,提供地圖搜索可以方便用戶便捷的找到樓盤的具體方位。用戶帳戶管理模塊315。本例中,用戶可能需要在若干個(gè)服務(wù)間切換跳轉(zhuǎn),用戶帳戶管理模塊315能夠?yàn)橛脩粼诟鱾€(gè)服務(wù)間提供唯一標(biāo)識(shí),提供一站式服務(wù),無需再次進(jìn)行身份識(shí)別。例如,用戶還可以通過本模塊在自定義設(shè)置中定制、取消新詞發(fā)現(xiàn)服務(wù),并能及時(shí)地提供服務(wù)改進(jìn)反饋,提升各項(xiàng)服務(wù)的質(zhì)量。下面給出一個(gè)本發(fā)明典型的應(yīng)用場(chǎng)景1、用戶曱打開一個(gè)聊天窗口,激活輸入法軟件,準(zhǔn)備輸入文字。該輸入法的網(wǎng)絡(luò)監(jiān)控程序(常駐后臺(tái)的一個(gè)監(jiān)控程序,常稱為daemon)通過調(diào)用系統(tǒng)接口,接收遠(yuǎn)程監(jiān)控服務(wù)器的更新信息。遠(yuǎn)程監(jiān)控服務(wù)器發(fā)送請(qǐng)求到新詞服務(wù)器,請(qǐng)求獲取固定時(shí)間段內(nèi)的新詞。新詞服務(wù)器返回的結(jié)果不為空,輸入法監(jiān)控程序由此得知有新詞更新,于是通過遠(yuǎn)程監(jiān)控服務(wù)器下載新詞列表及相關(guān)信息,組織數(shù)據(jù)展現(xiàn)內(nèi)容。2、該輸入法軟件在顯眼位置(例如,桌面右下角)彈出新詞更新提示(參見圖4),展現(xiàn)本周更新的新詞列表、所屬類別及設(shè)置,提供鏈接可供用戶點(diǎn)擊。圖4示出了本周的新詞推薦,并給出了各個(gè)新詞的標(biāo)簽等信息,以便用戶大致判斷其是否需要了解某個(gè)新詞;并且,圖4還給出了該用戶之前定制RSS服務(wù)的更新提示。用戶曱掃了一眼,對(duì)其中的新詞"轟》V,很感興趣,但卻不清楚它的具體意義,于是點(diǎn)擊。3、用戶點(diǎn)擊"轟趴",觸發(fā)打開瀏覽器,轉(zhuǎn)到一個(gè)新詞展現(xiàn)頁面。在這個(gè)頁面上,用戶可以看到這個(gè)詞條的a)定義"轟趴其實(shí)就是英語homeparty中文諧音的簡(jiǎn)稱,其真正的含義也就是私人舉辦的家庭聚會(huì)。興起于美國(guó),近年來在臺(tái)灣非常流行,并逐漸傳入大陸"。b)詞條使用情況統(tǒng)計(jì)在輸入法匿名用戶詞庫的統(tǒng)計(jì)中,最近100天有170個(gè)用戶一共輸入了295次;在搜索引擎查詢?nèi)罩窘y(tǒng)計(jì)中,有233條查詢包含了"轟隊(duì)";查詢?cè)~"轟》V,的時(shí)間屬性從3個(gè)月前開始陡增,形成一個(gè)波峰,之后變得平穩(wěn);統(tǒng)計(jì)量積累到最近幾天變得顯著,于是后臺(tái)的新詞發(fā)現(xiàn)流程識(shí)別了這個(gè)新詞。204、用戶曱意猶未盡,點(diǎn)擊新詞展現(xiàn)頁面上的"相關(guān)新聞"的鏈接,瀏覽了一遍"轟》V,相關(guān)的新聞,發(fā)現(xiàn)很多都只是給出定義便戛然而止了,沒有他想要的那些轟隊(duì)活動(dòng)如何開展、網(wǎng)友辦轟A的心得體會(huì)等。同時(shí)用戶曱發(fā)現(xiàn)新詞展現(xiàn)頁面提示在Wiki詞典上沒有收錄這個(gè)詞條,于是用戶曱按照其獲得的信息內(nèi)容創(chuàng)建了這個(gè)詞條,并加入了一個(gè)覺得有用的網(wǎng)頁鏈接。進(jìn)一步,因?yàn)閷?duì)搜索結(jié)果不滿意,用戶曱打開了新詞展現(xiàn)頁面上的反饋窗口,寫下了自己的意見。進(jìn)一步,用戶曱通過新詞展現(xiàn)頁面所提供的定制服務(wù),訂閱了查詢?cè)~"轟趴"的搜索結(jié)果的RSS:如果搜索結(jié)果有更新,可以及時(shí)通知他。優(yōu)選的是,包括輸入法、新詞展現(xiàn)頁面、搜索、wiki等服務(wù)可以都來自同一家服務(wù)提供商,用戶在使用輸入法時(shí)登錄了通行證,省去了使用每個(gè)服務(wù)都要逐個(gè)登錄的煩惱。5、搜索系統(tǒng)在獲得這個(gè)用戶的反饋后,可及時(shí)地使用自動(dòng)或人工的方法改進(jìn)搜索結(jié)果。6、過了幾天,搜索系統(tǒng)抓取了新的"轟》V,相關(guān)網(wǎng)頁。用戶管理服務(wù)器的輪詢機(jī)制發(fā)現(xiàn)查詢?cè)~"轟5八"的搜索結(jié)果頁獲得更新,及時(shí)通知訂閱查詢?cè)~更新結(jié)果的所有用戶(包括用戶曱在內(nèi)),在桌面彈出窗口提示其RSS訂閱有更新(參照?qǐng)D4)。參照?qǐng)D5,示出了本發(fā)明一種互聯(lián)網(wǎng)信息整合發(fā)布的裝置實(shí)施例,具體可以包4舌以下部件新詞信息數(shù)據(jù)庫501,用于存儲(chǔ)互聯(lián)網(wǎng)新詞、針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息、與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源信息,以及三者之間的映射關(guān)系;接口才莫塊502,用于展現(xiàn)互聯(lián)網(wǎng)新詞,以及接收用戶針對(duì)一互聯(lián)網(wǎng)新詞的信息獲:f又請(qǐng)求;所述4妄口才莫塊502可以采用用戶端應(yīng)用程序或者應(yīng)用程序插件展現(xiàn)互耳關(guān)網(wǎng)新詞;或者,也可以采用網(wǎng)站頁面方式展現(xiàn)互4關(guān)網(wǎng)新詞;發(fā)布模塊503,用于當(dāng)收到針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求時(shí),從所述新詞信息數(shù)據(jù)庫獲取和發(fā)布針對(duì)該互聯(lián)網(wǎng)新詞自身屬性的描述信息,以及相關(guān)服務(wù)資源或者相關(guān)服務(wù)資源的鏈接。所述與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源通過依據(jù)相應(yīng)新詞在各種類型的服務(wù)資源集合中進(jìn)行查詢而獲得;所述服務(wù)資源類型包括搜索服務(wù)、桌面產(chǎn)品、新聞、博客、游戲、關(guān)系網(wǎng)絡(luò)、標(biāo)簽、聚合內(nèi)容、在線詞典或者無線增值服務(wù)。所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息可以包括新詞定義;所述新詞定義是通過對(duì)網(wǎng)頁信息進(jìn)行挖掘而獲取的。優(yōu)選的是,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息還可以包括相應(yīng)新詞在一段時(shí)間內(nèi),在一定維度上出現(xiàn)次數(shù)的統(tǒng)計(jì)趨勢(shì)圖或者評(píng)價(jià)參數(shù);所述維度包括網(wǎng)頁信息、查詢?nèi)罩?、用戶輸入或者用戶新詞點(diǎn)擊。在一些情況下,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息也可以包括相應(yīng)新詞針對(duì)特定輸入法的正確編碼字符串;所述正確編碼字符串通過匯總、分析用戶編碼字符串的輸入情況而獲得。參照?qǐng)D6,示出了本發(fā)明一個(gè)具體新詞"王櫟鑾"通過發(fā)布模塊503發(fā)布相關(guān)信息的界面600的示意圖。在該界面示意中,包括以下欄目定義欄601??梢灾苯犹峁木W(wǎng)頁信息挖掘得到的關(guān)于新詞"王櫟盡,,的定義?;蛘?,也可以僅僅從wiki詞典獲取定義,即當(dāng)該新詞在wiki詞典中有相關(guān)定義時(shí),則在定義欄提供wiki鏈接,否則提示用戶可向wiki增加詞條并提供定義編輯鏈接。選取依據(jù)欄602。后臺(tái)系統(tǒng)對(duì)新詞"王櫟鑫"在各個(gè)維度方向上進(jìn)行了評(píng)價(jià),并給出了具體評(píng)分,因此,在選取依據(jù)欄中以一個(gè)用戶友好的類似打分的方式給出選擇的依據(jù)。走勢(shì)圖欄603。展現(xiàn)了新詞"王櫟鑫"作為用戶輸入/查詢/媒體報(bào)道的數(shù)目,每一個(gè)維度可以對(duì)應(yīng)一條曲線。示意圖中嵌入了一個(gè)新詞"王櫟盡"作為查詢?cè)~的走勢(shì)圖示意。4并寫欄604。展現(xiàn)王櫟鑾"wangyuexin"和"wanglixin"兩種4并法在用戶中的使用比例,一般的用戶輸入高頻的拼法就是正確的。當(dāng)然,對(duì)于例外情況需要人工介入;如,詞"張柏芝,,就是一個(gè)例外,在用戶輸入統(tǒng)計(jì)中,其錯(cuò)誤拼法(zhangbozhi)比正確拼法(zhangbaizhi)高。用戶輸入/查詢用的用法展現(xiàn)欄605。經(jīng)過統(tǒng)計(jì),新詞"王櫟盡"不存在有價(jià)值的用法展現(xiàn)信息,所以在界面展示中該欄目應(yīng)該為空;或者用于其他欄目信息的展示。但是本發(fā)明為了清楚說明,在圖6所示的界面示意圖中,該欄目采用新詞"淚奔"的用法展現(xiàn)信息替代進(jìn)行說明,給出了新詞"淚奔"各種用法情況下的頻率和使用人數(shù)等統(tǒng)計(jì)信息。上述的五個(gè)界面欄目都是針對(duì)新詞"王櫟鑫,,自身屬性的描述信息。下面幾個(gè)欄目是針對(duì)相關(guān)服務(wù)資源信息的展示。博客欄606。新詞"王櫟鑫,,屬于"明星,,標(biāo)簽,提供相關(guān)博客blog.sina.com.cn/wangyuexin911的鏈接,可展現(xiàn)該博客的最近更新。該博客可能是王櫟鑫自己的博客,也可能是王櫟鑫樂迷的博客。網(wǎng)頁搜索結(jié)果欄607。在圖6的示意圖中,該欄目給出一個(gè)縮微的返回結(jié)果(前3名),包括標(biāo)題、鏈接和摘要等。當(dāng)然,還可以依據(jù)該用戶的個(gè)性化信息提供個(gè)性化搜索結(jié)果。新詞提交接口608。提供接口讓用戶主動(dòng)提供新詞,如可提供其他快男(參加娛樂節(jié)目"快樂男聲"的歌手簡(jiǎn)稱)的姓名,如俞灝明、蘇醒、吉杰等。用戶帳號(hào)信息欄609。用于顯示用戶身份,方便收集用戶信息和實(shí)現(xiàn)統(tǒng)一服務(wù)登錄。上面僅僅是給出了本發(fā)明的一個(gè)界面示意結(jié)構(gòu),還可能包括RSS訂閱欄目、新詞信息展現(xiàn)管理欄目等等。需要說明的是,實(shí)際展現(xiàn)頁面的布局和版塊內(nèi)容是可以隨意安排的,并且可能針對(duì)不同用戶還可以實(shí)現(xiàn)個(gè)性化定制。各個(gè)模塊欄目可以拖動(dòng),縮放,甚至可以按自己喜好增刪。而且因?yàn)槊總€(gè)新詞被打上的標(biāo)簽(tag)不同,展現(xiàn)的模塊欄目類型也會(huì)有所不同,當(dāng)然,一般走勢(shì)圖、詞條定義、選取依據(jù)是必要的。例如,全是單音字的詞條就不會(huì)被打上"多音詞"tag,也就不會(huì)有"拼寫"這欄??傊?,互聯(lián)網(wǎng)信息的飛速發(fā)展,各種新概念、熱門事件或人物也層出不窮。相應(yīng)地,這些新概念、新事物也成為人們茶余飯后的談資,如"周老虎"、"次貨"、"水立方"。而它們憑借口頭傳播,往往有縮略語的種種特點(diǎn)。尤其是在一些專屬領(lǐng)域,這些術(shù)語更是讓一般人看來無法領(lǐng)會(huì),比如網(wǎng)絡(luò)游戲中"國(guó)戰(zhàn)"、"求組"、"奧法"、"回藍(lán)"等;其他如"博斗"、"棒棒堂"等新詞更像是包含有錯(cuò)別字。另一方面,互聯(lián)網(wǎng)上各種傳統(tǒng)服務(wù)不斷提升自身性能的同時(shí),各種更具人性化的新應(yīng)用也在不斷涌現(xiàn),但是如何能夠提高這些新應(yīng)用服務(wù)傳播給各個(gè)用戶的速度和力度,是需要盡快解決的問題。本發(fā)明通過新詞作為媒介,將各方面的信息都整合起來,既能夠向用戶提供針對(duì)新詞的各種描述信息,〗更于用戶了解新詞,又能夠向用戶^是供與這些新詞密切相關(guān)的新應(yīng)用,以盡可能通過一個(gè)綜合接口滿足用戶針對(duì)某個(gè)新詞的所有需求,提高用戶尋求相關(guān)信息資源和服務(wù)資源的效率。通過本發(fā)明,用戶能快速了解互聯(lián)網(wǎng)動(dòng)向,及時(shí)獲取感興趣的信息;而服務(wù)提供商能加速自身資源/服務(wù)的整合,擴(kuò)大自身產(chǎn)品對(duì)用戶的曝光程度,潛在地提升用戶黏性,獲得更多的商業(yè)機(jī)會(huì),增加收益。本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。以上對(duì)本發(fā)明所提供的一種互聯(lián)網(wǎng)信息整合發(fā)布的方法、裝置和系統(tǒng),進(jìn)述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。權(quán)利要求1、一種互聯(lián)網(wǎng)信息整合發(fā)布的方法,其特征在于,包括獲取互聯(lián)網(wǎng)新詞;獲取針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息;獲取與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源;展現(xiàn)互聯(lián)網(wǎng)新詞;接收用戶針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求,發(fā)布針對(duì)該互聯(lián)網(wǎng)新詞自身屬性的描述信息,以及相關(guān)服務(wù)資源或者相關(guān)服務(wù)資源的鏈接。2、如權(quán)利要求1所述的方法,其特征在于,通過以下方式獲取互聯(lián)網(wǎng)新詞獲取新詞候選;依據(jù)預(yù)置新詞特征,對(duì)所述新詞候選進(jìn)行篩選,獲取新詞。3、如權(quán)利要求2所述的方法,其特征在于,所述新詞特征包括頻率特征,所述頻率特征包括該新詞候選作為查詢?cè)~在搜索引擎日志中的計(jì)數(shù)、輸入法用戶使用該新詞候選的情況統(tǒng)計(jì)、該新詞候選在網(wǎng)頁中的統(tǒng)計(jì)特征三者中的任意一個(gè)或者任意組合。4、如權(quán)利要求2或3所述的方法,其特征在于,所述新詞特征包括時(shí)間特征,所述時(shí)間特征包括突發(fā)出現(xiàn)特性以及使用率平穩(wěn)增長(zhǎng)特性。5、如權(quán)利要求1所述的方法,其特征在于,通過以下方式獲取與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源在各種類型的服務(wù)資源集合中查詢獲取與相應(yīng)互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源;所述服務(wù)資源類型包括搜索服務(wù)、桌面產(chǎn)品、新聞、博客、游戲、關(guān)系網(wǎng)絡(luò)、標(biāo)簽、聚合內(nèi)容、在線詞典或者無線增值服務(wù)。6、如權(quán)利要求l所述的方法,其特征在于,通過用戶端應(yīng)用程序或者應(yīng)用程序插件展現(xiàn)互耳關(guān)網(wǎng)新詞;或者,通過網(wǎng)站頁面方式展現(xiàn)互聯(lián)網(wǎng)新詞。7、如權(quán)利要求1所述的方法,其特征在于,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括新詞定義;所述新詞定義是通過對(duì)網(wǎng)頁信息進(jìn)行挖掘而獲取的。8、如權(quán)利要求l所述的方法,其特征在于,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括相應(yīng)新詞在一段時(shí)間內(nèi),在一定維度上出現(xiàn)次數(shù)的統(tǒng)計(jì)趨勢(shì)圖或者評(píng)價(jià)參數(shù);所述維度包括網(wǎng)頁信息、查詢?nèi)罩尽⒂脩糨斎牖蛘哂脩粜略~點(diǎn)擊。9、如權(quán)利要求l所述的方法,其特征在于,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括相應(yīng)新詞針對(duì)特定輸入法的正確編碼字符串;所述正確編碼字符串通過匯總、分析用戶編碼字符串的輸入情況而獲得。10、一種互聯(lián)網(wǎng)信息整合發(fā)布的系統(tǒng),其特征在于,包括用于獲取互聯(lián)網(wǎng)新詞的單元;用于獲取針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息的單元;用于獲取與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源的單元;用于展現(xiàn)互聯(lián)網(wǎng)新詞的單元;發(fā)布單元,用于接收用戶針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求,發(fā)布針對(duì)該互聯(lián)網(wǎng)新詞自身屬性的描述信息,以及相關(guān)服務(wù)資源或者相關(guān)服務(wù)資源的鏈接。11、如權(quán)利要求10所述的系統(tǒng),其特征在于,所述用于獲取互聯(lián)網(wǎng)新詞的單元進(jìn)一步包括新詞候選單元,用于獲取新詞候選;篩選單元,用于依據(jù)預(yù)置新詞特征,對(duì)所述新詞候選進(jìn)行篩選,獲取新詞。12、如權(quán)利要求11所述的系統(tǒng),其特征在于,所述新詞特征包括頻率特征,所述頻率特征包括該新詞候選作為查詢?cè)~在搜索引擎日志中的計(jì)數(shù)、輸入法用戶使用該新詞候選的情況統(tǒng)計(jì)、該新詞候選在網(wǎng)頁中的統(tǒng)計(jì)特征三者中的任意一個(gè)或者任意組合。13、如權(quán)利要求11或12所述的系統(tǒng),其特征在于,所述新詞特征包括時(shí)間特征,所述時(shí)間特征包括突發(fā)出現(xiàn)特性以及使用率平穩(wěn)增長(zhǎng)特性。14、如權(quán)利要求10所述的系統(tǒng),其特征在于,所述與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源通過依據(jù)相應(yīng)新詞在各種類型的服務(wù)資源集合中進(jìn)行查詢而獲得;所述服務(wù)資源類型包括搜索服務(wù)、桌面產(chǎn)品、新聞、博客、游戲、關(guān)系網(wǎng)絡(luò)、標(biāo)簽、聚合內(nèi)容、在線詞典或者無線增值服務(wù)。15、如權(quán)利要求10所述的系統(tǒng),其特征在于,所述用于展現(xiàn)互聯(lián)網(wǎng)新詞的單元采用用戶端應(yīng)用程序或者應(yīng)用程序插件展現(xiàn)互聯(lián)網(wǎng)新詞;或者,采用網(wǎng)站頁面方式展現(xiàn)互聯(lián)網(wǎng)新詞。16、如權(quán)利要求10所述的系統(tǒng),其特征在于,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括新詞定義;所述新詞定義是通過對(duì)網(wǎng)頁信息進(jìn)行挖掘而獲取的。17、如權(quán)利要求IO所述的系統(tǒng),其特征在于,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括相應(yīng)新詞在一段時(shí)間內(nèi),在一定維度上出現(xiàn)次數(shù)的統(tǒng)計(jì)趨勢(shì)圖或者評(píng)價(jià)參數(shù);所述維度包括網(wǎng)頁信息、查詢?nèi)罩?、用戶輸入或者用戶新詞點(diǎn)擊。18、如權(quán)利要求10所述的系統(tǒng),其特征在于,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括相應(yīng)新詞針對(duì)特定輸入法的正確編碼字符串;所述正確編碼字符串通過匯總、分析用戶編碼字符串的輸入情況而獲得。19、一種互聯(lián)網(wǎng)信息整合發(fā)布的裝置,其特征在于,包括新詞信息數(shù)據(jù)庫,用于存儲(chǔ)互聯(lián)網(wǎng)新詞、針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息、與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源信息,以及三者之間的映射關(guān)系;接口模塊,用于展現(xiàn)互聯(lián)網(wǎng)新詞,以及接收用戶針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求;發(fā)布模塊,用于當(dāng)收到針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求時(shí),從所述新詞信息數(shù)據(jù)庫獲取和發(fā)布針對(duì)該互聯(lián)網(wǎng)新詞自身屬性的描述信息,以及相關(guān)服務(wù)資源或者相關(guān)服務(wù)資源的鏈接。20、如權(quán)利要求19所述的裝置,其特征在于,所述與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源通過依據(jù)相應(yīng)新詞在各種類型的服務(wù)資源集合中進(jìn)行查詢而獲得;所述服務(wù)資源類型包括搜索服務(wù)、桌面產(chǎn)品、新聞、博客、游戲、關(guān)系網(wǎng)絡(luò)、標(biāo)簽、聚合內(nèi)容、在線詞典或者無線增值服務(wù)。21、如權(quán)利要求19所述的裝置,其特征在于,所述接口模塊采用用戶端應(yīng)用程序或者應(yīng)用程序插件展現(xiàn)互聯(lián)網(wǎng)新詞;或者,采用網(wǎng)站頁面方式展現(xiàn)互耳關(guān)網(wǎng)新詞。22、如權(quán)利要求19所述的裝置,其特征在于,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括新詞定義;所述新詞定義是通過對(duì)網(wǎng)頁信息進(jìn)行挖掘而獲取的。23、如權(quán)利要求19所述的裝置,其特征在于,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括相應(yīng)新詞在一段時(shí)間內(nèi),在一定維度上出現(xiàn)次數(shù)的統(tǒng)計(jì)趨勢(shì)圖或者評(píng)價(jià)參數(shù);所述維度包括網(wǎng)頁信息、查詢?nèi)罩?、用戶輸入或者用戶新詞點(diǎn)擊。24、如權(quán)利要求19所述的裝置,其特征在于,所述針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息包括相應(yīng)新詞針對(duì)特定輸入法的正確編碼字符串;所述正確編碼字符串通過匯總、分析用戶編碼字符串的輸入情況而獲得。全文摘要本發(fā)明提供了一種互聯(lián)網(wǎng)信息整合發(fā)布的方法、裝置和系統(tǒng),所述方法包括以下步驟獲取互聯(lián)網(wǎng)新詞;獲取針對(duì)互聯(lián)網(wǎng)新詞自身屬性的描述信息;獲取與互聯(lián)網(wǎng)新詞相關(guān)的服務(wù)資源;展現(xiàn)互聯(lián)網(wǎng)新詞;接收用戶針對(duì)一互聯(lián)網(wǎng)新詞的信息獲取請(qǐng)求,發(fā)布針對(duì)該互聯(lián)網(wǎng)新詞自身屬性的描述信息,以及相關(guān)服務(wù)資源或者相關(guān)服務(wù)資源的鏈接。本發(fā)明可以從互聯(lián)網(wǎng)的各種資源中挖掘新詞及其相關(guān)的各種信息,并采用多種方式將新詞相關(guān)的各種信息及發(fā)現(xiàn)過程展現(xiàn)給用戶;將這些新潮熱門詞匯及其相關(guān)信息及時(shí)展現(xiàn)給終端用戶,能夠幫助用戶及時(shí)獲取互聯(lián)網(wǎng)最新動(dòng)向,增進(jìn)互聯(lián)網(wǎng)新鮮信息的獲取和傳播速度。文檔編號(hào)G06F17/30GK101566995SQ20081010506公開日2009年10月28日申請(qǐng)日期2008年4月25日優(yōu)先權(quán)日2008年4月25日發(fā)明者揚(yáng)張,凡林申請(qǐng)人:北京搜狗科技發(fā)展有限公司