移動應(yīng)用信息推送方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種移動應(yīng)用信息推送方法和裝置,其中,所述移動應(yīng)用信息推送方法包括:獲取客戶端瀏覽的網(wǎng)頁,解析所述網(wǎng)頁,得到網(wǎng)頁內(nèi)容,計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的相似度,并根據(jù)所述計(jì)算出的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息,根據(jù)選取的所述移動應(yīng)用描述信息向所述客戶端推送相應(yīng)的移動應(yīng)用信息。本發(fā)明實(shí)現(xiàn)了根據(jù)客戶端瀏覽的網(wǎng)頁,捕捉到客戶端當(dāng)前的興趣點(diǎn),從而觸發(fā)客戶端下載移動應(yīng)用的潛在需求,提高了客戶端對推送的移動應(yīng)用的使用率。
【專利說明】移動應(yīng)用信息推送方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)技術(shù),尤其涉及一種移動應(yīng)用信息推送方法和裝置。
【背景技術(shù)】
[0002]隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,現(xiàn)有的移動應(yīng)用的數(shù)量以百萬計(jì),但很多移動應(yīng)用一直沉睡在移動應(yīng)用商店中無人問津,使得這些移動應(yīng)用無法被需要它的用戶接觸到并下載。因此,移動應(yīng)用的分發(fā)機(jī)制一直是一個(gè)業(yè)界普遍關(guān)注的重要問題。
[0003]現(xiàn)有技術(shù)中,相比于移動應(yīng)用搜索和各種應(yīng)用排行榜,一般采用主動推送的方式更容易使不活躍的移動應(yīng)用接觸到用戶,吸引用戶去下載和使用,滿足用戶的潛在需求。該主動推送的過程為:根據(jù)用戶屬性給用戶推薦一個(gè)或幾個(gè)字符條,讓用戶去選擇,然后根據(jù)用戶選擇的字符條,推薦給用戶與這些文字描述相關(guān)聯(lián)的移動應(yīng)用;或者根據(jù)移動應(yīng)用的類別,用戶在移動應(yīng)用商店中查看或下載移動應(yīng)用的信息,以及用戶使用移動應(yīng)用的時(shí)長信息,來計(jì)算移動應(yīng)用之間的相似度和與用戶的推薦度。
[0004]但是,當(dāng)根據(jù)用戶屬性進(jìn)行推送時(shí),用戶需要主動選擇某一字符條,然后再展現(xiàn)相關(guān)聯(lián)的移動應(yīng)用,使得這種推送方式較為繁瑣,還有,字符條中的信息量有限,依據(jù)它推薦出來的移動應(yīng)用不一定滿足用戶的需求或興趣點(diǎn);當(dāng)根據(jù)移動應(yīng)用的類別進(jìn)行推送時(shí),該推送方法依賴于用戶查看、下載、使用移動應(yīng)用的信息,當(dāng)無法得到這些信息的時(shí)候,則無法采用該推送方法,使得該推送方法的局限性很大,而且,該推送方法的依據(jù)是用戶的歷史行為,而不能捕捉用戶當(dāng)前的興趣點(diǎn)。
【發(fā)明內(nèi)容】
[0005]有鑒于此,本發(fā)明實(shí)施例的目的在于提出一種移動應(yīng)用信息推送方法和裝置,以更加準(zhǔn)確、便捷地獲取客戶端下載移動應(yīng)用的潛在需求,提高了客戶端對推送的移動應(yīng)用的使用率。
[0006]第一方面,本發(fā)明實(shí)施例提供了一種移動應(yīng)用信息推送方法,所述方法包括:
[0007]獲取客戶端瀏覽的網(wǎng)頁;
[0008]解析所述網(wǎng)頁,得到網(wǎng)頁內(nèi)容;
[0009]計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的相似度,并根據(jù)所述計(jì)算出的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息;
[0010]根據(jù)選取的所述移動應(yīng)用描述信息向所述客戶端推送相應(yīng)的移動應(yīng)用信息。
[0011]第二方面,本發(fā)明實(shí)施例提供了 一種移動應(yīng)用信息推送裝置,所述裝置包括:
[0012]獲取模塊,用于獲取客戶端瀏覽的網(wǎng)頁;
[0013]解析模塊,用于解析所述網(wǎng)頁,得到網(wǎng)頁內(nèi)容;
[0014]處理模塊,用于計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的相似度,并根據(jù)所述計(jì)算出的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息;
[0015]推送模塊,用于根據(jù)選取的所述移動應(yīng)用描述信息向所述客戶端推送相應(yīng)的移動應(yīng)用信息。
[0016]本發(fā)明實(shí)施例獲取客戶端瀏覽的網(wǎng)頁,解析所述網(wǎng)頁,得到網(wǎng)頁內(nèi)容,計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的相似度,并根據(jù)所述計(jì)算出的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息,根據(jù)選取的所述移動應(yīng)用描述信息向所述客戶端推送相應(yīng)的移動應(yīng)用信息,以使所述客戶端下載所述移動應(yīng)用信息,實(shí)現(xiàn)了根據(jù)客戶端瀏覽的網(wǎng)頁,向客戶端推送與網(wǎng)頁相對應(yīng)的移動應(yīng)用,從而觸發(fā)客戶端下載移動應(yīng)用的潛在需求,提高了客戶端對推送的移動應(yīng)用的使用率。
【專利附圖】
【附圖說明】
[0017]圖1是本發(fā)明第一實(shí)施例的移動應(yīng)用信息推送方法的流程圖;
[0018]圖2是本發(fā)明第二實(shí)施例的移動應(yīng)用信息推送方法的流程圖;
[0019]圖3是本發(fā)明第三實(shí)施例的移動應(yīng)用信息推送方法的流程圖;
[0020]圖4是本發(fā)明第四實(shí)施例的移動應(yīng)用信息推送方法的流程圖;
[0021]圖5是本發(fā)明第五實(shí)施例的移動應(yīng)用信息推送裝置的示意圖;
[0022]圖6是本發(fā)明第六實(shí)施例的移動應(yīng)用信息推送裝置中處理模塊的示意圖;
[0023]圖7是本發(fā)明第七實(shí)施例的移動應(yīng)用信息推送裝置中處理模塊的示意圖;
[0024]圖8是本發(fā)明第八實(shí)施例的移動應(yīng)用信息推送裝置中處理模塊的示意圖。
【具體實(shí)施方式】
[0025]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖對本發(fā)明具體實(shí)施例作進(jìn)一步的詳細(xì)描述??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部內(nèi)容。
[0026]本發(fā)明實(shí)施例提供的移動應(yīng)用信息推送方法,通過獲取客戶端瀏覽的網(wǎng)頁,解析所述網(wǎng)頁,得到網(wǎng)頁內(nèi)容,計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的相似度,并根據(jù)所述計(jì)算出的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息,根據(jù)選取的所述移動應(yīng)用描述信息向所述客戶端推送相應(yīng)的移動應(yīng)用信息,以使所述客戶端下載所述移動應(yīng)用信息,實(shí)現(xiàn)了根據(jù)客戶端瀏覽的網(wǎng)頁,捕捉到客戶端當(dāng)前的興趣點(diǎn),從而觸發(fā)客戶端下載移動應(yīng)用的潛在需求,提高了客戶端對推送的移動應(yīng)用的使用率。
[0027]圖1是本發(fā)明第一實(shí)施例的移動應(yīng)用信息推送方法的流程圖。如圖1所示,所述方法包括:
[0028]步驟110、獲取客戶端瀏覽的網(wǎng)頁。
[0029]具體地,獲取客戶端瀏覽的網(wǎng)頁的方式有很多,可以從瀏覽器獲得客戶端當(dāng)前瀏覽的網(wǎng)頁,也可以從網(wǎng)頁所屬的服務(wù)器獲得客戶端當(dāng)前瀏覽的網(wǎng)頁。如,當(dāng)用戶使用百度瀏覽器訪問網(wǎng)頁時(shí),通過百度瀏覽器獲得用戶正在瀏覽的網(wǎng)頁;或者,通過與各個(gè)網(wǎng)站合作,并在網(wǎng)站上嵌入調(diào)用移動應(yīng)用推薦應(yīng)用程序編程接口(Application ProgrammingInterface, API)的代碼,從而獲得用戶正在瀏覽的網(wǎng)頁。
[0030]步驟120、解析客戶端瀏覽的網(wǎng)頁,得到該網(wǎng)頁的網(wǎng)頁內(nèi)容。
[0031]具體地,首先,對客戶端瀏覽的超文本標(biāo)記語言(Hypertext MarkupLanguage,HTML)網(wǎng)頁進(jìn)行解析,生成對應(yīng)的HTML DOM樹,其中,DOM是文檔對象化模型(DocumentObject Model)的簡稱,DOM樹是指通過DOM將HTML頁面進(jìn)行解析,并生成的HTMLtree樹狀結(jié)構(gòu)和對應(yīng)訪問方法。
[0032]然后,遍歷HTML DOM樹,并從HTML DOM樹中提取所需要的文字信息即網(wǎng)頁內(nèi)容,t匕如,標(biāo)題、正文等。其中,網(wǎng)頁上不同區(qū)域的文字可以采用不同的權(quán)重,比如,網(wǎng)頁正文文本的權(quán)重為1、網(wǎng)頁標(biāo)題文本的權(quán)重為10,該權(quán)重代表了網(wǎng)頁不同區(qū)域文本的重要性。
[0033]步驟130、計(jì)算網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的相似度,并根據(jù)計(jì)算出的相似度選取與網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息。
[0034]具體地,移動應(yīng)用數(shù)據(jù)庫中包括各個(gè)移動應(yīng)用信息,以及各個(gè)移動應(yīng)用信息對應(yīng)的移動應(yīng)用描述信息,其中,將網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息進(jìn)行相似度計(jì)算,目的是找到與網(wǎng)頁內(nèi)容相似度高的移動應(yīng)用信息,使得這些移動應(yīng)用信息更能出激發(fā)出用戶下載移動應(yīng)用的潛在需求。
[0035]步驟140、根據(jù)選取的移動應(yīng)用描述信息向客戶端推送相應(yīng)的移動應(yīng)用信息。其中,推送的移動應(yīng)用信息至少包括移動應(yīng)用的鏈接和描述,還可包括移動應(yīng)用的圖標(biāo)或封面,其中,在計(jì)算機(jī)上鏈接可以是二維碼。
[0036]具體地,向客戶端推送相應(yīng)的移動應(yīng)用信息,是以客戶端當(dāng)前瀏覽的網(wǎng)頁為依據(jù),使得這些移動應(yīng)用信息更能出激發(fā)出用戶下載移動應(yīng)用的潛在需求。
[0037]在本實(shí)施例的一個(gè)優(yōu)選實(shí)施方式中,步驟110之前還包括:建立所述移動應(yīng)用數(shù)據(jù)庫,所述移動應(yīng)用數(shù)據(jù)庫包括各個(gè)移動應(yīng)用的移動應(yīng)用描述信息、所述移動應(yīng)用描述信息中的移動應(yīng)用關(guān)鍵詞和移動應(yīng)用關(guān)鍵詞權(quán)重、以及所述移動應(yīng)用描述信息中的移動應(yīng)用主題和移動應(yīng)用主題概率。
[0038]其中,建立移動應(yīng)用數(shù)據(jù)庫的過程具體如下:`[0039](I)獲取各個(gè)移動應(yīng)用的移動應(yīng)用描述信息,比如,在移動商店中的介紹信息中獲取移動應(yīng)用描述信息,或者通過靜態(tài)解析技術(shù)從移動應(yīng)用程序中提取的描述信息。
[0040]( 2 )提取各個(gè)移動應(yīng)用的移動應(yīng)用描述信息的移動應(yīng)用關(guān)鍵詞,計(jì)算所述關(guān)鍵詞的權(quán)重,并根據(jù)所述移動應(yīng)用關(guān)鍵詞權(quán)重獲得所述移動應(yīng)用描述信息的權(quán)重向量信息。比如,對移動應(yīng)用的描述信息進(jìn)行移動應(yīng)用關(guān)鍵詞提取時(shí),保留與該移動應(yīng)用密切相關(guān)的詞語,并根據(jù)詞頻 _ 逆向文件頻率(Term Fequency -1nverse Document Frequency, TF-1DF)方法對每個(gè)關(guān)鍵詞賦予權(quán)重,并刪除權(quán)重較小的關(guān)鍵詞。其中,TF-1DF是一種用于資訊檢索與資訊探勘的常用加權(quán)技術(shù)。TF-1DF是一種統(tǒng)計(jì)方法,用以評估一字詞對于一個(gè)文件集或一個(gè)語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現(xiàn)的次數(shù)成正比增加,但同時(shí)會隨著它在語料庫中出現(xiàn)的頻率成反比下降。
[0041]若對第m個(gè)移動應(yīng)用描述信息中每一個(gè)關(guān)鍵詞給予一個(gè)編號,則第m個(gè)移動應(yīng)用描述信息可以表不成一個(gè)權(quán)重向量app文字m,如公式(I)所不。
[0042]app文字m= (b” b2,...,b”...,bn)公式(I)
[0043]其中,I3i表示第i個(gè)移動應(yīng)用關(guān)鍵詞的權(quán)重,η表示移動應(yīng)用關(guān)鍵詞的總數(shù)量。
[0044]另外,還可以對提取出的各個(gè)移動應(yīng)用的移動應(yīng)用描述信息的關(guān)鍵詞建立移動應(yīng)用關(guān)鍵詞索引,該索引可以是倒排索引,也可以正排索引。其中,建立索引的目的是用于提高網(wǎng)頁內(nèi)容與移動應(yīng)用描述信息的匹配效率。[0045](3)提取各個(gè)移動應(yīng)用的移動應(yīng)用描述信息的移動應(yīng)用主題,計(jì)算所述移動應(yīng)用主題的概率,并根據(jù)所有移動應(yīng)用主題概率獲得所述移動應(yīng)用描述信息的概率分布向量。
[0046]具體地,采用主題模型計(jì)算移動應(yīng)用主題的概率,比如,采用概率潛語義分析(probabilitistic Latent Semantic Analysis,pLSA)獲取移動應(yīng)用的描述信息的主題概率分布。其中,主題概率分布可以對一段文字的宏觀描述,從而有效地避免無關(guān)詞語偶然命中所帶來的推送錯(cuò)誤。PLSA是基于雙模式和共現(xiàn)的數(shù)據(jù)分析方法延伸的經(jīng)典的統(tǒng)計(jì)學(xué)方法。
[0047]若對第m個(gè)移動應(yīng)用描述信息中每一個(gè)移動應(yīng)用主題給予一個(gè)編號,則第m個(gè)移動應(yīng)用描述信息還可以表示成一個(gè)概率向量app±jgm,如公式(2)所示。
[0048]app主題m= (tb” tb2,...,tb”...,tbn)公式(2)
[0049]其中,tbi表示第i個(gè)移動應(yīng)用主題出現(xiàn)的概率,η表示網(wǎng)頁主題的總數(shù)量。
[0050]上述(2)和(3)可以以任意順序執(zhí)行,也可以只執(zhí)行(2)和(3)中的任意一個(gè)。
[0051]另外,上述(2)還可以對提取出的移動應(yīng)用關(guān)鍵詞建立移動應(yīng)用關(guān)鍵詞索引,該索引可以是倒排索引,也可以正排索弓丨。其中,建立索引的目的是用于提高網(wǎng)頁內(nèi)容與移動應(yīng)用描述信息的匹配效率。
[0052]圖2是本發(fā)明第二實(shí)施例的移動應(yīng)用信息推送方法的流程圖。如圖2所示,所述方法包括:
[0053]步驟210和步驟220、與步驟110和步驟120相同,在這里不再贅述。
[0054]步驟230、提取網(wǎng)頁內(nèi)容的網(wǎng)頁關(guān)鍵詞。
[0055]具體地,提取網(wǎng)頁內(nèi)容的網(wǎng)頁關(guān)鍵詞是將網(wǎng)頁內(nèi)容中反映段落語義的描述性詞語提取出來的過程。因?yàn)椋W(wǎng)頁內(nèi)容有很多文字,但并不是所有文字都是有用的,比如,一些常用的詞語“可以”、“已經(jīng)”等出現(xiàn)頻率非常高,但不反映文字段落的內(nèi)容語義,所以只提取所需的關(guān)鍵詞。
[0056]步驟240、計(jì)算網(wǎng)頁關(guān)鍵詞的權(quán)重。
[0057]具體地,根據(jù)TF-1DF計(jì)算提取出來的每個(gè)網(wǎng)頁關(guān)鍵詞的權(quán)重。
[0058]若對每一個(gè)網(wǎng)頁關(guān)鍵詞給予一個(gè)編號,則該網(wǎng)頁內(nèi)容可以表示成一個(gè)權(quán)重向量page文字,如公式(3)所示。
[0059]page文字=(a” a2,...,a”...,an)公式(3)
[0060]其中,表示第i個(gè)網(wǎng)頁關(guān)鍵詞的權(quán)重,n表示網(wǎng)頁關(guān)鍵詞的總數(shù)量。
[0061]步驟250、根據(jù)網(wǎng)頁關(guān)鍵詞的權(quán)重和移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的移動應(yīng)用關(guān)鍵詞權(quán)重,計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的文字相似度。
[0062]具體地,根據(jù)公式(I)和公式(3)計(jì)算網(wǎng)頁內(nèi)容與第m個(gè)移動應(yīng)用描述信息的文字相似度的過程如公式(4)所示。
[0063]
【權(quán)利要求】
1.一種移動應(yīng)用信息推送方法,其特征在于,所述方法包括: 獲取客戶端瀏覽的網(wǎng)頁; 解析所述網(wǎng)頁,得到網(wǎng)頁內(nèi)容; 計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的相似度,并根據(jù)所述計(jì)算出的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息; 根據(jù)選取的所述移動應(yīng)用描述信息向所述客戶端推送相應(yīng)的移動應(yīng)用信息。
2.根據(jù)權(quán)利要求1所述的移動應(yīng)用信息推送方法,其特征在于,所述獲取客戶端瀏覽的網(wǎng)頁之前,還包括: 建立所述移動應(yīng)用數(shù)據(jù)庫,所述移動應(yīng)用數(shù)據(jù)庫包括各個(gè)移動應(yīng)用的移動應(yīng)用描述信息、所述移動應(yīng)用描述信息中的移動應(yīng)用關(guān)鍵詞和移動應(yīng)用關(guān)鍵詞權(quán)重、以及所述移動應(yīng)用描述信息中的移動應(yīng)用主題和移動應(yīng)用主題概率。
3.根據(jù)權(quán)利要求2所述的移動應(yīng)用信息推送方法,其特征在于,所述計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的相似度,并根據(jù)所述計(jì)算出的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息,包括: 提取所述網(wǎng)頁內(nèi)容的網(wǎng)頁關(guān)鍵詞; 計(jì)算所述網(wǎng)頁關(guān)鍵詞的權(quán)重; 根據(jù)所述網(wǎng)頁關(guān)鍵詞的權(quán)重和所述移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的移動應(yīng)用關(guān)鍵詞權(quán)重,計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的文字相似度; 根據(jù)計(jì)算出的所述文字相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息。
4.根據(jù)權(quán)利要求2所述的移動應(yīng)用信息推送方法,其特征在于,所述計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的相似度,并根據(jù)所述計(jì)算出的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息,包括: 提取網(wǎng)頁內(nèi)容的網(wǎng)頁主題; 計(jì)算所述網(wǎng)頁主題的概率; 根據(jù)所述網(wǎng)頁主題的概率和所述移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的移動應(yīng)用主題概率,計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的主題相似度; 根據(jù)計(jì)算出的所述主題相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息。
5.根據(jù)權(quán)利要求2所述的移動應(yīng)用信息推送方法,其特征在于,所述計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的相似度,并根據(jù)所述計(jì)算出的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息,包括: 提取所述網(wǎng)頁內(nèi)容的網(wǎng)頁關(guān)鍵詞和網(wǎng)頁主題; 計(jì)算所述網(wǎng)頁關(guān)鍵詞的權(quán)重和所述網(wǎng)頁主題的概率; 根據(jù)所述網(wǎng)頁關(guān)鍵詞的權(quán)重和所述移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的移動應(yīng)用關(guān)鍵詞權(quán)重,計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的文字相似度;以及,根據(jù)所述網(wǎng)頁主題的概率和所述移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的移動應(yīng)用主題概率,計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的主題相似度;確定所述文字相似度的權(quán)重和所述主題相似度的權(quán)重; 根據(jù)所述文字相似度和主題相似度、以及所述文字相似度的權(quán)重和所述主題相似度的權(quán)重,計(jì)算所述網(wǎng)頁內(nèi)容與各個(gè)移動應(yīng)用描述信息的相似度; 根據(jù)計(jì)算出的所述網(wǎng)頁內(nèi)容與各個(gè)移動應(yīng)用描述信息的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息。
6.根據(jù)權(quán)利要求3或5所述的移動應(yīng)用信息推送方法,其特征在于,所述移動應(yīng)用數(shù)據(jù)庫還包括移動應(yīng)用關(guān)鍵詞索引,所述根據(jù)所述網(wǎng)頁關(guān)鍵詞的權(quán)重和所述移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的移動應(yīng)用關(guān)鍵詞權(quán)重,計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的文字相似度,包括: 在所述移動應(yīng)用關(guān)鍵詞索引中查詢所述網(wǎng)頁關(guān)鍵詞,獲取所述查詢到的網(wǎng)頁關(guān)鍵詞對應(yīng)的移動應(yīng)用描述信息,以及根據(jù)所述查詢到的網(wǎng)頁關(guān)鍵詞對應(yīng)的移動應(yīng)用描述信息的移動應(yīng)用關(guān)鍵詞權(quán)重與所述網(wǎng)頁關(guān)鍵詞的權(quán)重,計(jì)算所述查詢到的網(wǎng)頁關(guān)鍵詞對應(yīng)的移動應(yīng)用描述信息與所述網(wǎng)頁內(nèi)容的文字相似度。
7.根據(jù)權(quán)利要求1所述的移動應(yīng)用信息推送方法,其特征在于,所述根據(jù)所述計(jì)算出的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息,包括: 將所述計(jì)算出的相似度進(jìn)行從大到小的排序后,選取前η個(gè)相似度對應(yīng)的移動應(yīng)用描述信息,所述選取的前η個(gè)移動應(yīng)用描述信息為與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息;或者,將所述計(jì)算出的相似度進(jìn)行從小到大的排序后,選取后η個(gè)相似度對應(yīng)的移動應(yīng)用描述信息,所述選取的后η個(gè)移動應(yīng)用描述信息為與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息。`
8.一種移動應(yīng)用信息推送裝置,其特征在于,所述裝置包括: 獲取模塊,用于獲取客戶端瀏覽的網(wǎng)頁; 解析模塊,用于解析所述網(wǎng)頁,得到網(wǎng)頁內(nèi)容; 處理模塊,用于計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的相似度,并根據(jù)所述計(jì)算出的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息; 推送模塊,用于根據(jù)選取的所述移動應(yīng)用描述信息向所述客戶端推送相應(yīng)的移動應(yīng)用信息。
9.根據(jù)權(quán)利要求8所述的移動應(yīng)用信息推送裝置,其特征在于,所述裝置還包括: 建立模塊,用于建立所述移動應(yīng)用數(shù)據(jù)庫,所述移動應(yīng)用數(shù)據(jù)庫包括各個(gè)移動應(yīng)用的移動應(yīng)用描述信息、所述移動應(yīng)用描述信息中的移動應(yīng)用關(guān)鍵詞和移動應(yīng)用關(guān)鍵詞權(quán)重、以及所述移動應(yīng)用描述信息中的移動應(yīng)用主題和移動應(yīng)用主題概率。
10.根據(jù)權(quán)利要求9所述的移動應(yīng)用信息推送裝置,其特征在于,所述處理模塊包括: 第一提取單元,用于提取所述網(wǎng)頁內(nèi)容的網(wǎng)頁關(guān)鍵詞; 第一計(jì)算單元,用于計(jì)算所述網(wǎng)頁關(guān)鍵詞的權(quán)重,根據(jù)所述網(wǎng)頁關(guān)鍵詞的權(quán)重和所述移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的移動應(yīng)用關(guān)鍵詞權(quán)重,計(jì)算所述網(wǎng)頁內(nèi)容與所述移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的文字相似度; 第一選取單元,用于根據(jù)計(jì)算出的所述文字相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息。
11.根據(jù)權(quán)利要求10所述的移動應(yīng)用信息推送裝置,其特征在于,所述移動應(yīng)用數(shù)據(jù)庫還包括移動應(yīng)用關(guān)鍵詞索引,所述第一計(jì)算單元還用于在所述應(yīng)用關(guān)鍵詞索引中查詢所述網(wǎng)頁關(guān)鍵詞,獲取所述查詢到的網(wǎng)頁關(guān)鍵詞對應(yīng)的移動應(yīng)用描述信息,以及根據(jù)所述查詢到的網(wǎng)頁關(guān)鍵詞對應(yīng)的移動應(yīng)用描述信息的移動應(yīng)用關(guān)鍵詞權(quán)重與所述網(wǎng)頁關(guān)鍵詞的權(quán)重,計(jì)算所述查詢到的網(wǎng)頁關(guān)鍵詞對應(yīng)的移動應(yīng)用描述信息與所述網(wǎng)頁內(nèi)容的文字相似度。
12.根據(jù)權(quán)利要求9所述的移動應(yīng)用信息推送裝置,其特征在于,所述處理模塊包括: 第二提取單元,用于提取網(wǎng)頁內(nèi)容的網(wǎng)頁主題; 第二計(jì)算單元,用于計(jì)算所述網(wǎng)頁主題的概率;根據(jù)所述網(wǎng)頁主題的概率和所述移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的移動應(yīng)用主題概率,計(jì)算所述網(wǎng)頁內(nèi)容與所述移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的主題相似度; 第二選取單元,用于根據(jù)計(jì)算出的所述主題相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息。
13.根據(jù)權(quán)利要求9所述的移動應(yīng)用信息推送裝置,其特征在于,所述處理模塊包括: 第三提取單元,用于提取所述網(wǎng)頁內(nèi)容的網(wǎng)頁關(guān)鍵詞和網(wǎng)頁內(nèi)容的網(wǎng)頁主題; 第三計(jì)算單元,用于計(jì)算所述網(wǎng)頁主題的概率;根據(jù)所述網(wǎng)頁關(guān)鍵詞的權(quán)重和所述移 動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的移動應(yīng)用關(guān)鍵詞權(quán)重,計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的文字相似度;以及,根據(jù)所述網(wǎng)頁主題的概率和所述移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的移動應(yīng)用主題概率,計(jì)算所述網(wǎng)頁內(nèi)容與移動應(yīng)用數(shù)據(jù)庫中各個(gè)移動應(yīng)用描述信息的主題相似度; 確定單元,用于確定所述文字相似度的權(quán)重和所述主題相似度的權(quán)重; 第四計(jì)算單元,用于根據(jù)所述文字相似度和主題相似度、以及所述文字相似度的權(quán)重和所述主題相似度的權(quán)重,計(jì)算所述網(wǎng)頁內(nèi)容與各個(gè)移動應(yīng)用描述信息的相似度; 第三選取單元,用于根據(jù)計(jì)算出的所述網(wǎng)頁內(nèi)容與各個(gè)移動應(yīng)用描述信息的相似度選取與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息。
14.根據(jù)權(quán)利要求13所述的移動應(yīng)用信息推送裝置,其特征在于,所述移動應(yīng)用數(shù)據(jù)庫還包括移動應(yīng)用關(guān)鍵詞索引,所述第三計(jì)算單元還用于在所述移動應(yīng)用關(guān)鍵詞索引中查詢所述網(wǎng)頁關(guān)鍵詞,獲取所述查詢到的網(wǎng)頁關(guān)鍵詞對應(yīng)的移動應(yīng)用描述信息,以及根據(jù)所述查詢到的網(wǎng)頁關(guān)鍵詞對應(yīng)的移動應(yīng)用描述信息的應(yīng)用關(guān)鍵詞權(quán)重與所述網(wǎng)頁關(guān)鍵詞的權(quán)重,計(jì)算所述查詢到的網(wǎng)頁關(guān)鍵詞對應(yīng)的移動應(yīng)用描述信息與所述網(wǎng)頁內(nèi)容的文字相似度。
15.根據(jù)權(quán)利要求8所述的移動應(yīng)用信息推送裝置,其特征在于,所述處理模塊具體用于將所述計(jì)算出的相似度進(jìn)行從大到小的排序后,選取前η個(gè)相似度對應(yīng)的移動應(yīng)用描述信息,所述選取的前η個(gè)移動應(yīng)用描述信息為與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息;或者,將所述計(jì)算出的相似度進(jìn)行從小到大的排序后,選取后η個(gè)相似度對應(yīng)的移動應(yīng)用描述信息,所述選取的后η個(gè)移動應(yīng)用描述信息為與所述網(wǎng)頁內(nèi)容對應(yīng)的移動應(yīng)用描述信息。
【文檔編號】G06F17/30GK103530339SQ201310463741
【公開日】2014年1月22日 申請日期:2013年10月8日 優(yōu)先權(quán)日:2013年10月8日
【發(fā)明者】劉峰, 劉亦梁, 羅威, 王維煜 申請人:北京百度網(wǎng)訊科技有限公司