本發(fā)明涉及搜索技術(shù)領(lǐng)域,具體涉及一種利用二級類目下的關(guān)鍵詞庫搜索應(yīng)用程序的方法及裝置。
背景技術(shù):
隨著智能移動終端的發(fā)展,越來越多的用戶在智能移動終端中下載各種app(application,應(yīng)用程序)使用?;谠摲N情況,應(yīng)用程序分發(fā)平臺應(yīng)運而生,用戶可以通過智能移動終端訪問應(yīng)用程序分發(fā)平臺,比如通過智能移動終端中安裝的應(yīng)用程序分發(fā)應(yīng)用去訪問應(yīng)用程序分發(fā)平臺,從而可以從平臺中下載各種應(yīng)用程序。其中,應(yīng)用程序分發(fā)應(yīng)用比如各種手機(jī)助手。
而在應(yīng)用程序分發(fā)平臺中,為了能夠為有推廣需求的應(yīng)用程序擁有者,如應(yīng)用程序開發(fā)商,可以將該應(yīng)用程序擁有者的應(yīng)用程序在應(yīng)用程序搜索頁面可以靠前展示,應(yīng)用程序擁有者會為這些應(yīng)用程序購買競價詞以作為索引關(guān)鍵詞。
但是,應(yīng)用程序開發(fā)商購買的競價詞可能與應(yīng)用程序本身不匹配,使應(yīng)用分發(fā)平臺的搜索引擎在根據(jù)用戶輸入的搜索詞進(jìn)行檢索時,可能返回實際上與該搜索詞相關(guān)度很低的應(yīng)用程序的信息,導(dǎo)致用戶為了查找與其需求的應(yīng)用程序時,需要進(jìn)行更多的操作,比如翻頁等操作,影響獲取其需求的應(yīng)用程序的效率。
技術(shù)實現(xiàn)要素:
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的利用二級類目下的關(guān)鍵詞庫搜索應(yīng)用程序的方法及裝置。
一方面,本申請通過本申請的一實施例提供了一種利用二級類目下的關(guān)鍵詞庫搜索應(yīng)用程序的方法,所述方法包括:
對于各一級類目下的應(yīng)用程序,利用一級類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目;
對每個搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算搜索詞所對應(yīng)的二級類目;
針對各二級類目,根據(jù)各搜索詞所對應(yīng)的二級類目,生成二級類目下的關(guān)鍵詞庫;
當(dāng)接收到用戶輸入的搜索關(guān)鍵詞時,將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配;
若匹配成功,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
可選的,所述對每個搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算所述搜索詞所對應(yīng)的二級類目,具體包括:
對于各搜索詞中的搜索歷史記錄中的搜索下載記錄,判斷所述搜索詞的獨立訪問下載次數(shù)是否大于預(yù)設(shè)閾值;
如果所述搜索詞的獨立訪問下載次數(shù)大于所述預(yù)設(shè)閾值,則根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算所述搜索詞所對應(yīng)的二級類目。
可選的,所述將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配,具體包括:
檢測各二級類目下的關(guān)鍵詞庫中是否存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞。
可選的,所述若匹配成功,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序,具體包括:
若檢測到某二級類目下的關(guān)鍵詞庫中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞,則獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
可選的,所述采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目之后,所述方法還包括:
根據(jù)各應(yīng)用程序?qū)?yīng)的二級類目,獲取各二級類目下的應(yīng)用程序集合庫。
可選的,所述獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序,具體包括:
根據(jù)與所述搜索關(guān)鍵詞對應(yīng)的二級類目,獲取該二級類目下的應(yīng)用程序集合庫;
將該二級類目下的應(yīng)用程序集合庫中的所有應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
可選的,還包括:
若匹配失敗,計算所述搜索關(guān)鍵詞和各應(yīng)用程序的名稱之間的文本相似度;
將所述文本相似度大于預(yù)設(shè)相似度的應(yīng)用程序作為所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
另一方面,本申請通過本申請的一實施例,提供了一種利用二級類目下的關(guān)鍵詞庫搜索應(yīng)用程序的裝置,所述裝置包括:
應(yīng)用程序分類單元,對于各一級類目下的應(yīng)用程序,用于利用一級類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目;
搜索詞分類單元,對每個搜索詞,用于根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算搜索詞所對應(yīng)的二級類目;
二級類目關(guān)鍵詞庫生成單元,針對各二級類目,用于根據(jù)各搜索詞所對應(yīng)的二級類目,生成二級類目下的關(guān)鍵詞庫;
匹配單元,用于當(dāng)接收到用戶輸入的搜索關(guān)鍵詞時,將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配;
應(yīng)用程序獲取單元,用于在檢測到匹配成功時,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
可選的,所述搜索詞分類單元,具體包括:
獨立訪問下載次數(shù)判斷單元,對于各搜索詞中的搜索歷史記錄中的搜索下載記錄,用于判斷所述搜索詞的獨立訪問下載次數(shù)是否大于預(yù)設(shè)閾值;如果所述搜索詞的獨立訪問下載次數(shù)大于所述預(yù)設(shè)閾值,則根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算所述搜索詞所對應(yīng)的二級類目。
可選的,所述匹配單元,具體用于檢測各二級類目下的關(guān)鍵詞庫中是否存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞。
可選的,所述匹配單元,用于在檢測到某二級類目下的關(guān)鍵詞庫中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞時,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
可選的,所述裝置,還包括:
應(yīng)用程序集合庫生成單元,用于在采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目之后,根據(jù)各應(yīng)用程序?qū)?yīng)的二級類目,獲取各二級類目下的應(yīng)用程序集合庫。
可選的,所述應(yīng)用程序獲取單元,具體用于根據(jù)與所述搜索關(guān)鍵詞對應(yīng)的二級類目,獲取該二級類目下的應(yīng)用程序集合庫,將該二級類目下的應(yīng)用程序集合庫中的所有應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
可選的,所述裝置還包括:
文本相似度獲取單元,用于在匹配失敗時,計算所述搜索關(guān)鍵詞和各應(yīng)用程序的名稱之間的文本相似度;
所述應(yīng)用程序獲取單元,還用于將所述文本相似度大于預(yù)設(shè)相似度的應(yīng)用程序作為所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
本申請實施例中提供的一個或多個技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點:
根據(jù)本發(fā)明的利用二級類目下的關(guān)鍵詞庫搜索應(yīng)用程序的方法及裝置,將各應(yīng)用程序進(jìn)行二級類目劃分,以及根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算搜索詞所對應(yīng)的二級類目,從而生成每一個二級類目下的關(guān)鍵詞庫,然后將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配;若匹配成功,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序,如此,通過將應(yīng)用程序和搜索詞進(jìn)行類目細(xì)分,
使得二級類目下的關(guān)鍵詞庫中的關(guān)鍵詞與應(yīng)用程序的相關(guān)性得以提高,由此解決了應(yīng)用程序開發(fā)商需要通過繁瑣的操作選擇應(yīng)用程序的索引關(guān)鍵詞的問題, 以及由于選擇的索引關(guān)鍵詞不恰當(dāng),導(dǎo)致應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度很低的搜索結(jié)果中的概率較高的問題,取得了可以通過應(yīng)用程序的關(guān)鍵詞庫自動為應(yīng)用程序自動選擇索引關(guān)鍵詞,減少應(yīng)用程序開發(fā)商對應(yīng)用程序索引關(guān)鍵詞的選擇過程,有效提高應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度較高的搜索結(jié)果中的概率。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例中的利用二級類目下的關(guān)鍵詞庫搜索應(yīng)用程序的方法的流程圖;
圖2為本發(fā)明實施例中的利用二級類目下的關(guān)鍵詞庫搜索應(yīng)用程序的裝置的結(jié)構(gòu)圖。
具體實施方式
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的利用二級類目下的關(guān)鍵詞庫搜索應(yīng)用程序的方法及裝置。
為了更好的理解上述技術(shù)方案,下面將結(jié)合說明書附圖以及具體的實施方式對上述技術(shù)方案進(jìn)行詳細(xì)的說明。
首先說明,本文中出現(xiàn)的術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,a和/或b,可以表示:單獨存在a,同時存在a和b,單獨存在b這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。
參見圖1,本申請一實施例提供了一種利用二級類目下的關(guān)鍵詞庫搜索應(yīng) 用程序的方法,所述方法包括以下步驟:
s101、對于各一級類目下的應(yīng)用程序,利用一級類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目;
s102、對每個搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算搜索詞所對應(yīng)的二級類目;
s103、針對各二級類目,根據(jù)各搜索詞所對應(yīng)的二級類目,生成二級類目下的關(guān)鍵詞庫;
s104、當(dāng)接收到用戶輸入的搜索關(guān)鍵詞時,將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配;
s105、若匹配成功,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
在本發(fā)明實施例中,應(yīng)用程序的擁有者等可在應(yīng)用分發(fā)平臺中上傳應(yīng)用程序,然后向應(yīng)用分發(fā)平臺發(fā)送推廣該應(yīng)用程序的請求。
在步驟s101中,在應(yīng)用分發(fā)平臺中預(yù)設(shè)的各種分類,該分類從一級分類開始,比如游戲類、體育類。而實際上,對于一個一級類目下的應(yīng)用程序,可以根據(jù)其應(yīng)用程序的描述信息進(jìn)行更細(xì)的分類。在實際應(yīng)用中,可以利用貝葉斯分類器對描述信息進(jìn)行分類,將一級類目下的各應(yīng)用程序分到各二級類目下。
在具體實施過程中,應(yīng)用程序的描述信息包括應(yīng)用程序的應(yīng)用場景、支持的系統(tǒng)、開發(fā)者信息等,如此,可以利用貝葉斯分類器對應(yīng)用程序的描述信息進(jìn)行分類,將一級類目下的各應(yīng)用程序分到各二級類目下。
例如,以一級類目為游戲類為例,若游戲類下的應(yīng)用程序包括a1、a2、a3、b1、b2、b3、c1、c2和c3,用貝葉斯分類器對游戲類下的每一個應(yīng)用程序的描述信息進(jìn)行分類,從而游戲類目下的二級類目為手游類、端游類和頁游類,且手游類下的應(yīng)用程序為a1、a2和a3;端游類下的應(yīng)用程序為b1、b2和b3;頁游類下的應(yīng)用程序為頁游類c1、c2和c3。
接下來執(zhí)行步驟s102,在該步驟中,對每個搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算搜索詞所對應(yīng)的二級類目。
在具體實施過程中,在用戶終端啟用應(yīng)用程序分發(fā)應(yīng)用訪問應(yīng)用分發(fā)平臺。比如用戶在其手機(jī)中啟動360手機(jī)助手,360手機(jī)助手則連接到應(yīng)用分發(fā)平臺。 用戶可以在應(yīng)用程序分發(fā)應(yīng)用的搜索框中輸入搜索詞,該搜索詞上傳到應(yīng)用分發(fā)平臺,應(yīng)用分發(fā)平臺根據(jù)該搜索詞檢索應(yīng)用程序搜索結(jié)果并返回應(yīng)用程序分發(fā)應(yīng)用中,應(yīng)用程序分發(fā)應(yīng)用則展示按序展示該應(yīng)用程序搜索結(jié)果,用戶可以在搜索結(jié)果中點擊查看或者點擊下載應(yīng)用程序。那么在大量用戶的搜索過程中,應(yīng)用分發(fā)平臺可以對各個搜索詞的搜索歷史進(jìn)行記錄,得到各個搜索詞搜索歷史記錄,例如應(yīng)用分發(fā)平臺可以通過日志記錄上述搜索歷史記錄。
具體來講,根據(jù)從應(yīng)用分發(fā)平臺中存儲的搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及通過步驟s101獲取的各應(yīng)用程序所屬的二級類目,從而可以計算出搜索詞所對應(yīng)的二級類目。
具體的,在計算搜索詞所對應(yīng)的二級類目時,針對每一個搜索詞,首先可以從搜索歷史記錄中的獲取到與該搜索詞具有點擊關(guān)系的n個應(yīng)用程序,然后根據(jù)所述n個應(yīng)用程序中每一個應(yīng)用程序所屬的二級類目,查找到屬于同一二級類目下應(yīng)用程序數(shù)量最多的二級類目作為該搜索詞所對應(yīng)的二級類目,其中,n為不小于2的整數(shù);當(dāng)然,也可以根據(jù)搜索詞與各應(yīng)用程序的點擊關(guān)系,選擇與該搜索詞的點擊次數(shù)最多的應(yīng)用程序所屬的二級類目作為該搜索詞的二級類目。
例如,搜索歷史記錄中搜索詞d1與各應(yīng)用程序的點擊關(guān)系如下:d1對應(yīng)a1的點擊次數(shù)為5000次、對應(yīng)a2的點擊次數(shù)為1000次、對應(yīng)a3的點擊次數(shù)為200次、對應(yīng)b1的點擊次數(shù)為100次和對應(yīng)c2的點擊次數(shù)為50次,由于a1、a2和a3所屬的二級類目均為手游類,使得手游類下的應(yīng)用程序數(shù)量最多,由此,可以確定d1所屬的二級類目為手游類。
又例如,搜索詞1點擊二級類目1中的應(yīng)用程序的次數(shù)的占比大于占比閾值,則將該搜索詞歸到該二級類目1下。
上述搜索詞與各應(yīng)用程序的點擊關(guān)系,可以為搜索詞與各應(yīng)用程序的點擊查看之間的關(guān)系,也可以為搜索詞與各應(yīng)用程序的點擊下載之間的關(guān)系,當(dāng)然也可以為搜索詞與各應(yīng)用程序的點擊查看和點擊下載之間的總的關(guān)系。
在另一實施例中,在計算所述搜索詞所對應(yīng)的二級類目時,還可以通過以下步驟來計算:
a1、對于各搜索詞中的搜索歷史記錄中的搜索下載記錄,判斷所述搜索詞 的獨立訪問下載次數(shù)是否大于預(yù)設(shè)閾值。
a2、如果所述搜索詞的獨立訪問下載次數(shù)大于所述預(yù)設(shè)閾值,則根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算所述搜索詞所對應(yīng)的二級類目。
在實際應(yīng)用中,用戶在終端中輸入了搜索詞進(jìn)行搜索,其可能點擊下載應(yīng)用程序也可能不下載應(yīng)用程序,那么應(yīng)用分發(fā)平臺則可以記錄各個搜索詞的搜索下載情況,比如用戶a搜索“理財”,在搜索結(jié)果頁中下載了應(yīng)用程序1,而用戶b搜索“理財”,則可能在搜索結(jié)果頁中下載了應(yīng)用程序2,通過對大量用戶的搜索下載行為的記錄,則可得到對各搜索詞的搜索下載記錄。
具體實現(xiàn)中,該搜索下載記錄以搜索下載日志的形式存儲在應(yīng)用分發(fā)平臺中。
對于搜索下載日志中一個搜索詞,可能有多個用戶在終端展示的該搜索詞的搜索結(jié)果中下載應(yīng)用程序,而其存在同一個ip的終端下載了多個應(yīng)用程序或者同一個應(yīng)用程序下載了多次。而為了減少同一個ip的終端對搜索詞下載權(quán)重的影響,本發(fā)明實施例則統(tǒng)計每個搜索詞的獨立訪問下載次數(shù),即uv(uniquevisitor)下載,即即使同一個ip的終端的下載了多次,其uv下載次數(shù)也只算一次。然后對于一個搜索詞,統(tǒng)計有多少個ip的終端使用該搜索詞的搜索結(jié)果下載了應(yīng)用程序。
然后,本發(fā)明實施例設(shè)置了針對uv下載次數(shù)的預(yù)設(shè)閾值,如果判斷搜索詞的uv下載次數(shù)大于該預(yù)設(shè)閾值,則根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算所述搜索詞所對應(yīng)的二級類目。而對于一個搜索詞,其獨立訪問下載次數(shù)小于等于預(yù)設(shè)閾值,則可以忽略該搜索詞。
接下來執(zhí)行步驟s103,在該步驟中,針對各二級類目,根據(jù)各搜索詞所對應(yīng)的二級類目,生成二級類目下的關(guān)鍵詞庫。
在具體實施過程中,在通過步驟s102獲取到了各搜索詞所對應(yīng)的二級類目之后,針對各二級類目,獲取該二級類目下的所有搜索詞,并根據(jù)該二級類目下的所有搜索詞來生成該二級類目下的關(guān)鍵詞庫。
例如,手游類下的所有搜索詞為d1、d2、d3、d4和d5,則生成手游類下的關(guān)鍵詞庫,其中,手游類下的關(guān)鍵詞庫包括d1、d2、d3、d4和d5。
接下來執(zhí)行步驟s104,在該步驟中,當(dāng)接收到用戶輸入的搜索關(guān)鍵詞時,將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配。
在具體實施過程中,在步驟s103生成各二級類目下的關(guān)鍵詞庫之后,當(dāng)接收到用戶在終端中輸入的搜索關(guān)鍵詞時,通過該搜索關(guān)鍵詞查找對應(yīng)的應(yīng)用程序的時,將該搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配。
具體的,在將該搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配時,可以是檢測各二級類目下的關(guān)鍵詞庫中是否存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞,如存在,則確定匹配成功,執(zhí)行步驟s105;若不存在,則確定匹配失敗,執(zhí)行步驟s106。
若匹配成功,執(zhí)行步驟s105,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
在具體實施過程中,若通過步驟s104檢測某二級類目下的關(guān)鍵詞庫中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞,則獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
具體來講,可以將與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的所有應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序,當(dāng)然也可以是將與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的部分應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序,本申請不作具體限制。
在另一實施例中,所述采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目之后,所述方法還包括:根據(jù)各應(yīng)用程序?qū)?yīng)的二級類目,獲取各二級類目下的應(yīng)用程序集合庫。
在具體實施過程中,在通過步驟s101獲取到了各應(yīng)用程序所對應(yīng)的二級類目之后,針對各二級類目,獲取該二級類目下的所有應(yīng)用程序,并根據(jù)該二級類目下的所有應(yīng)用程序來生成該二級類目下的應(yīng)用程序集合庫。
例如,手游類下的所有應(yīng)用程序為a1、a2、a3、a4和a5,則生成手游類下的應(yīng)用程序集合庫,其中,手游類下的應(yīng)用程序集合庫包括a1、a2、a3、a4和a5。
具體的,在獲取與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序時,還可以根據(jù)與所述搜索關(guān)鍵詞對應(yīng)的二級類目,獲取該二級類目下的應(yīng)用程序集合庫;將該二級類目下的應(yīng)用程序集合庫中的所有應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng) 用程序。
例如,若所述搜索關(guān)鍵詞為d1,檢測各二級類目下的關(guān)鍵詞庫中是否存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞,由于手游類下的關(guān)鍵詞庫中存在d1,從而可以確定匹配成功,且d1對應(yīng)的二級類目為手游類,然后獲取手游類下的應(yīng)用程序集合庫中的所有應(yīng)用程序作為d1對應(yīng)的應(yīng)用程序,則確定d1對應(yīng)的應(yīng)用程序為a1、a2、a3、a4和a5。
若匹配失敗,執(zhí)行步驟s106,計算所述搜索關(guān)鍵詞和各應(yīng)用程序的名稱之間的文本相似度;將所述文本相似度大于預(yù)設(shè)相似度的應(yīng)用程序作為所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
本發(fā)明實施例在獲取到所述搜索關(guān)鍵詞之后,計算所述搜索關(guān)鍵詞與應(yīng)用程序的名稱之間的文本相似度。如計算所述搜索關(guān)鍵詞文本和應(yīng)用程序名稱文本之間的余弦距離。
本發(fā)明實施例可以針對文本相似度設(shè)置預(yù)設(shè)相似度,如果所述文本相似度大于預(yù)設(shè)相似度,則將該應(yīng)用程序作為該搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。如果所述文本相似度小于預(yù)設(shè)相似度,則忽略該應(yīng)用程序。
在本發(fā)明實施例中,在一個應(yīng)用程序需要推廣時,在應(yīng)用分發(fā)平臺中會通過廣告標(biāo)識將其標(biāo)記為推廣應(yīng)用程序,那么再檢索到應(yīng)用程序時,如果該應(yīng)用程序有廣告標(biāo)識,則可以將其提前展示。該廣告標(biāo)識如“推廣”、“薦”。此外,本發(fā)明實施例中可以設(shè)置多種廣告標(biāo)識,不同的廣告標(biāo)識具備不同的展示權(quán)重。比如“推廣”的展示權(quán)重高,“薦”展示權(quán)重低于“推廣”的展示權(quán)重。
其中,標(biāo)識“推廣”和“薦”字樣的為推廣應(yīng)用程序,那么愛前進(jìn)理財和有利網(wǎng)理財為推廣應(yīng)用程序。搜索“理財”關(guān)鍵字展現(xiàn)上述應(yīng)用程序。
綜上所述,本發(fā)明實施例將各應(yīng)用程序進(jìn)行二級類目劃分,以及根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算搜索詞所對應(yīng)的二級類目,從而生成每一個二級類目下的關(guān)鍵詞庫,然后將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配;若匹配成功,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序,如此,通過將應(yīng)用程序和搜索詞進(jìn)行類目細(xì)分,使得二級類目下的關(guān)鍵詞庫中的關(guān)鍵詞與應(yīng)用程序的相關(guān)性得以提高,由此解決了應(yīng)用程序開發(fā) 商需要通過繁瑣的操作選擇應(yīng)用程序的索引關(guān)鍵詞的問題,以及由于選擇的索引關(guān)鍵詞不恰當(dāng),導(dǎo)致應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度很低的搜索結(jié)果中的概率較高的問題,取得了可以通過應(yīng)用程序的關(guān)鍵詞庫自動為應(yīng)用程序自動選擇索引關(guān)鍵詞,減少應(yīng)用程序開發(fā)商對應(yīng)用程序索引關(guān)鍵詞的選擇過程,有效提高應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度較高的搜索結(jié)果中的概率。
基于同一發(fā)明構(gòu)思,本申請另一實施例提供一種利用應(yīng)用程序的關(guān)鍵詞庫搜索應(yīng)用程序的裝置,參見圖2,所述裝置包括:
應(yīng)用程序分類單元201,對于各一級類目下的應(yīng)用程序,用于利用一級類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目;
搜索詞分類單元202,對每個搜索詞,用于根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算搜索詞所對應(yīng)的二級類目;
二級類目關(guān)鍵詞庫生成單元203,針對各二級類目,用于根據(jù)各搜索詞所對應(yīng)的二級類目,生成二級類目下的關(guān)鍵詞庫;
匹配單元204,用于當(dāng)接收到用戶輸入的搜索關(guān)鍵詞時,將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配;
應(yīng)用程序獲取單元205,用于在檢測到匹配成功時,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
具體的,搜索詞分類單元202,具體包括:
獨立訪問下載次數(shù)判斷單元,對于各搜索詞中的搜索歷史記錄中的搜索下載記錄,用于判斷所述搜索詞的獨立訪問下載次數(shù)是否大于預(yù)設(shè)閾值;如果所述搜索詞的獨立訪問下載次數(shù)大于所述預(yù)設(shè)閾值,則根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算所述搜索詞所對應(yīng)的二級類目。
具體的,匹配單元204,具體用于檢測各二級類目下的關(guān)鍵詞庫中是否存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞。
具體的,匹配單元204,用于在檢測到某二級類目下的關(guān)鍵詞庫中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞時,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下 的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
具體的,所述裝置還包括:應(yīng)用程序集合庫生成單元,用于在采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目之后,根據(jù)各應(yīng)用程序?qū)?yīng)的二級類目,獲取各二級類目下的應(yīng)用程序集合庫。
具體的,應(yīng)用程序獲取單元205,具體用于根據(jù)與所述搜索關(guān)鍵詞對應(yīng)的二級類目,獲取該二級類目下的應(yīng)用程序集合庫,將該二級類目下的應(yīng)用程序集合庫中的所有應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
具體的,所述裝置還包括:
文本相似度獲取單元,用于在匹配失敗時,計算所述搜索關(guān)鍵詞和各應(yīng)用程序的名稱之間的文本相似度;
應(yīng)用程序獲取單元205,還用于將所述文本相似度大于預(yù)設(shè)相似度的應(yīng)用程序作為所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
上述本申請實施例中的技術(shù)方案,至少具有如下的技術(shù)效果或優(yōu)點:
本申請公開的利用二級類目下的關(guān)鍵詞庫搜索應(yīng)用程序的方法及裝置,將各應(yīng)用程序進(jìn)行二級類目劃分,以及根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算搜索詞所對應(yīng)的二級類目,從而生成每一個二級類目下的關(guān)鍵詞庫,然后將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配;若匹配成功,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序,如此,通過將應(yīng)用程序和搜索詞進(jìn)行類目細(xì)分,
使得二級類目下的關(guān)鍵詞庫中的關(guān)鍵詞與應(yīng)用程序的相關(guān)性得以提高,由此解決了應(yīng)用程序開發(fā)商需要通過繁瑣的操作選擇應(yīng)用程序的索引關(guān)鍵詞的問題,以及由于選擇的索引關(guān)鍵詞不恰當(dāng),導(dǎo)致應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度很低的搜索結(jié)果中的概率較高的問題,取得了可以通過應(yīng)用程序的關(guān)鍵詞庫自動為應(yīng)用程序自動選擇索引關(guān)鍵詞,減少應(yīng)用程序開發(fā)商對應(yīng)用程序索引關(guān)鍵詞的選擇過程,有效提高應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度較高的搜索結(jié)果中的概率。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計 算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實施的計算機(jī)程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管已描述了本發(fā)明的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
本發(fā)明公開a1、一種利用二級類目下的關(guān)鍵詞庫搜索應(yīng)用程序的方法, 其特征在于,所述方法包括:
對于各一級類目下的應(yīng)用程序,利用一級類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目;
對每個搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算搜索詞所對應(yīng)的二級類目;
針對各二級類目,根據(jù)各搜索詞所對應(yīng)的二級類目,生成二級類目下的關(guān)鍵詞庫;
當(dāng)接收到用戶輸入的搜索關(guān)鍵詞時,將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配;
若匹配成功,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
a2、如a1所述的方法,其特征在于,所述對每個搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算所述搜索詞所對應(yīng)的二級類目,具體包括:
對于各搜索詞中的搜索歷史記錄中的搜索下載記錄,判斷所述搜索詞的獨立訪問下載次數(shù)是否大于預(yù)設(shè)閾值;
如果所述搜索詞的獨立訪問下載次數(shù)大于所述預(yù)設(shè)閾值,則根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算所述搜索詞所對應(yīng)的二級類目。
a3、如a2所述的方法,其特征在于,所述將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配,具體包括:
檢測各二級類目下的關(guān)鍵詞庫中是否存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞。
a4、如a2所述的方法,其特征在于,所述若匹配成功,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序,具體包括:
若檢測到某二級類目下的關(guān)鍵詞庫中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞,則獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
a5、如a2所述的方法,其特征在于,所述采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目之后,所述方法還包括:
根據(jù)各應(yīng)用程序?qū)?yīng)的二級類目,獲取各二級類目下的應(yīng)用程序集合庫。
a6、如a5所述的方法,其特征在于,所述獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序,具體包括:
根據(jù)與所述搜索關(guān)鍵詞對應(yīng)的二級類目,獲取該二級類目下的應(yīng)用程序集合庫;
將該二級類目下的應(yīng)用程序集合庫中的所有應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
a7、如a1所述的方法,其特征在于,還包括:
若匹配失敗,計算所述搜索關(guān)鍵詞和各應(yīng)用程序的名稱之間的文本相似度;
將所述文本相似度大于預(yù)設(shè)相似度的應(yīng)用程序作為所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
b8、一種利用二級類目下的關(guān)鍵詞庫搜索應(yīng)用程序的裝置,其特征在于,所述裝置包括:
應(yīng)用程序分類單元,對于各一級類目下的應(yīng)用程序,用于利用一級類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目;
搜索詞分類單元,對每個搜索詞,用于根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算搜索詞所對應(yīng)的二級類目;
二級類目關(guān)鍵詞庫生成單元,針對各二級類目,用于根據(jù)各搜索詞所對應(yīng)的二級類目,生成二級類目下的關(guān)鍵詞庫;
匹配單元,用于當(dāng)接收到用戶輸入的搜索關(guān)鍵詞時,將所述搜索關(guān)鍵詞與各二級類目下的關(guān)鍵詞庫進(jìn)行匹配;
應(yīng)用程序獲取單元,用于在檢測到匹配成功時,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
b9、如b8所述的裝置,其特征在于,所述搜索詞分類單元,具體包括:
獨立訪問下載次數(shù)判斷單元,對于各搜索詞中的搜索歷史記錄中的搜索下載記錄,用于判斷所述搜索詞的獨立訪問下載次數(shù)是否大于預(yù)設(shè)閾值;如果所述搜索詞的獨立訪問下載次數(shù)大于所述預(yù)設(shè)閾值,則根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點擊關(guān)系,以及各應(yīng)用程序所屬的二級類目,計算所述搜索詞所對應(yīng)的二級類目。
b10、如b9所述的裝置,其特征在于,所述匹配單元,具體用于檢測各二級類目下的關(guān)鍵詞庫中是否存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞。
b11、如b9所述的裝置,其特征在于,所述匹配單元,用于在檢測到某二級類目下的關(guān)鍵詞庫中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞時,獲取與所述搜索關(guān)鍵詞對應(yīng)的二級類目下的應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
b12、如b9所述的裝置,其特征在于,所述裝置,還包括:
應(yīng)用程序集合庫生成單元,用于在采用分類器將各應(yīng)用程序分為相應(yīng)一級類目下的二級類目之后,根據(jù)各應(yīng)用程序?qū)?yīng)的二級類目,獲取各二級類目下的應(yīng)用程序集合庫。
b13、如b12所述的裝置,其特征在于,所述應(yīng)用程序獲取單元,具體用于根據(jù)與所述搜索關(guān)鍵詞對應(yīng)的二級類目,獲取該二級類目下的應(yīng)用程序集合庫,將該二級類目下的應(yīng)用程序集合庫中的所有應(yīng)用程序作為與所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。
b14、如b8所述的裝置,其特征在于,所述裝置還包括:
文本相似度獲取單元,用于在匹配失敗時,計算所述搜索關(guān)鍵詞和各應(yīng)用 程序的名稱之間的文本相似度;
所述應(yīng)用程序獲取單元,還用于將所述文本相似度大于預(yù)設(shè)相似度的應(yīng)用程序作為所述搜索關(guān)鍵詞對應(yīng)的應(yīng)用程序。