本發(fā)明涉及搜索技術(shù)領(lǐng)域,具體涉及一種應(yīng)用程序搜索系統(tǒng)及方法。
背景技術(shù):
隨著智能移動(dòng)終端的發(fā)展,越來(lái)越多的用戶在智能移動(dòng)終端中下載各種app(application,應(yīng)用程序)使用?;谠摲N情況,應(yīng)用程序分發(fā)平臺(tái)應(yīng)運(yùn)而生,用戶可以通過(guò)智能移動(dòng)終端訪問(wèn)應(yīng)用程序分發(fā)平臺(tái),比如通過(guò)智能移動(dòng)終端中安裝的應(yīng)用程序分發(fā)應(yīng)用去訪問(wèn)應(yīng)用程序分發(fā)平臺(tái),從而可以從平臺(tái)中下載各種應(yīng)用程序。其中,應(yīng)用程序分發(fā)應(yīng)用比如各種手機(jī)助手。
而在應(yīng)用程序分發(fā)平臺(tái)中,為了能夠?yàn)橛型茝V需求的應(yīng)用程序擁有者,如應(yīng)用程序開(kāi)發(fā)商,可以將該應(yīng)用程序擁有者的應(yīng)用程序在應(yīng)用程序搜索頁(yè)面可以靠前展示,應(yīng)用程序擁有者會(huì)為這些應(yīng)用程序購(gòu)買競(jìng)價(jià)詞以作為索引關(guān)鍵詞。
但是,應(yīng)用程序開(kāi)發(fā)商購(gòu)買的競(jìng)價(jià)詞可能與應(yīng)用程序本身不匹配,使應(yīng)用分發(fā)平臺(tái)的搜索引擎在根據(jù)用戶輸入的搜索詞進(jìn)行檢索時(shí),可能返回實(shí)際上與該搜索詞相關(guān)度很低的應(yīng)用程序的信息,導(dǎo)致用戶為了查找與其需求的應(yīng)用程序時(shí),需要進(jìn)行更多的操作,比如翻頁(yè)等操作,影響獲取其需求的應(yīng)用程序的效率。
技術(shù)實(shí)現(xiàn)要素:
鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的應(yīng)用程序搜索系統(tǒng)及方法。
一方面,本申請(qǐng)通過(guò)本申請(qǐng)的一實(shí)施例提供了一種應(yīng)用程序搜索系統(tǒng),所述系統(tǒng)包括:
分發(fā)服務(wù)器,用于根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞;根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞;根據(jù)所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞生成應(yīng)用程序的關(guān)鍵詞庫(kù);
用戶終端,用于獲取輸入的搜索關(guān)鍵詞,并將所述搜索關(guān)鍵詞發(fā)送給所述分發(fā)服務(wù)器;
所述分發(fā)服務(wù)器,還用于根據(jù)接收的所述搜索關(guān)鍵詞,將所述搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;并根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序并反饋給所述用戶終端,以使得在所述用戶終端上顯示與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
可選的,所述分發(fā)服務(wù)器包括:
第一匹配關(guān)鍵詞獲取單元,用于根據(jù)各搜索詞的搜索歷史記錄中的搜索下載記錄和應(yīng)用程序的基礎(chǔ)信息中的名稱和/或類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述分發(fā)服務(wù)器包括:
第二匹配關(guān)鍵詞獲取單元,用于根據(jù)應(yīng)用程序的基礎(chǔ)信息中的描述信息、和各搜索詞的搜索歷史記錄中的搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述分發(fā)服務(wù)器包括:
第三匹配關(guān)鍵詞獲取單元,用于根據(jù)應(yīng)用程序的基礎(chǔ)信息中的類目和各搜索詞對(duì)應(yīng)的類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述第一匹配關(guān)鍵詞獲取單元,具體包括:
文本相似度獲取單元,對(duì)于搜索下載記錄中的各搜索詞,用于計(jì)算搜索詞和應(yīng)用程序的基礎(chǔ)信息中的名稱之間的文本相似度;如果所述文本相似度大于第一閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述第一匹配關(guān)鍵詞獲取單元,具體包括:
獨(dú)立訪問(wèn)搜索詞提取單元,對(duì)于搜索下載記錄中的各搜索詞,用于判斷所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)是否大于第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目是否屬于同一個(gè)類目;如果所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)大于所述第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目屬于同一個(gè)類目,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述第二匹配關(guān)鍵詞獲取單元,具體包括:
應(yīng)用程序主題分布計(jì)算單元,針對(duì)各應(yīng)用程序的基礎(chǔ)信息中的描述信息,用于通過(guò)主題模型計(jì)算出應(yīng)用程序的主題分布;
搜索詞主題分布計(jì)算單元,對(duì)每個(gè)搜索詞,用于根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,計(jì)算搜索詞的主題分布;
主題相似搜索詞提取單元,對(duì)于搜索量大于第三閾值的搜索詞,用于根據(jù)所述搜索詞的主題分布和應(yīng)用程序的主題分布,計(jì)算所述搜索詞和應(yīng)用程序之間的主題相似度;如果所述搜索詞和應(yīng)用程序之間的主題相似度大于主題閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述第三匹配關(guān)鍵詞獲取單元,具體包括:
應(yīng)用程序類目細(xì)分單元,對(duì)于各一級(jí)類目下的應(yīng)用程序,用于利用一級(jí)類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級(jí)類目下的二級(jí)類目;
搜索詞分類單元,對(duì)每個(gè)搜索詞,用于根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,以及各應(yīng)用程序所屬的二級(jí)類目,計(jì)算所述搜索詞所對(duì)應(yīng)的二級(jí)類目;
類目搜索詞提取模單元,用于根據(jù)應(yīng)用程序所在的二級(jí)類目,獲取對(duì)應(yīng)該二級(jí)類目的各搜索詞則作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述分發(fā)服務(wù)器包括:
分詞關(guān)鍵詞提取單元,用于將應(yīng)用程序的基礎(chǔ)信息中的名稱進(jìn)行分詞操作,將分詞結(jié)果作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
可選的,所述分發(fā)服務(wù)器包括:
拼音關(guān)鍵詞提取單元,用于將應(yīng)用程序的基礎(chǔ)信息中的名稱轉(zhuǎn)換為拼音串和/或由所述名稱進(jìn)行分詞得到的分詞結(jié)果轉(zhuǎn)換為拼音串,將所述拼音串作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
可選的,所述分發(fā)服務(wù)器還包括:
標(biāo)簽關(guān)鍵詞提取單元,用于將應(yīng)用程序的標(biāo)簽詞作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
可選的,所述分發(fā)服務(wù)器還包括:
應(yīng)用程序獲取單元,針對(duì)每一個(gè)應(yīng)用程序,具體用于在所述匹配結(jié)果表征應(yīng)用程序的關(guān)鍵詞庫(kù)中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞時(shí),確定該應(yīng)用程序與所述搜索關(guān)鍵詞相對(duì)應(yīng),以獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
可選的,所述用戶終端包括:
搜索關(guān)鍵詞獲取單元,具體用于根據(jù)用戶的輸入信息,獲取所述搜索關(guān)鍵詞。
另一方面,本申請(qǐng)通過(guò)本申請(qǐng)的一實(shí)施例提供了一種應(yīng)用程序搜索方法,所述方法包括:
通過(guò)分發(fā)服務(wù)器根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞;根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞;根據(jù)所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞生成應(yīng)用程序的關(guān)鍵詞庫(kù);
通過(guò)用戶終端獲取輸入的搜索關(guān)鍵詞,并將所述搜索關(guān)鍵詞發(fā)送給所述分發(fā)服務(wù)器;
通過(guò)所述分發(fā)服務(wù)器接收的所述搜索關(guān)鍵詞,將所述搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;并根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序并反饋給所述用戶終端,以使得在所述用戶終端上顯示與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
可選的,所述根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
根據(jù)各搜索詞的搜索歷史記錄中的搜索下載記錄和應(yīng)用程序的基礎(chǔ)信息中的名稱和/或類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
根據(jù)應(yīng)用程序的基礎(chǔ)信息中的描述信息、和各搜索詞的搜索歷史記錄中的搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
根據(jù)應(yīng)用程序的基礎(chǔ)信息中的類目和各搜索詞對(duì)應(yīng)的類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
對(duì)于搜索下載記錄中的各搜索詞,用于計(jì)算搜索詞和應(yīng)用程序的基礎(chǔ)信息中的名稱之間的文本相似度;如果所述文本相似度大于第一閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
對(duì)于搜索下載記錄中的各搜索詞,判斷所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)是否大于第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目是否屬于同一個(gè)類目;如果所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)大于所述第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目屬于同一個(gè)類目,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
針對(duì)各應(yīng)用程序的基礎(chǔ)信息中的描述信息,通過(guò)主題模型計(jì)算出應(yīng)用程序的主題分布;
對(duì)每個(gè)搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,計(jì)算搜索詞的主題分布;
對(duì)于搜索量大于第三閾值的搜索詞,根據(jù)所述搜索詞的主題分布和應(yīng)用程序的主題分布,計(jì)算所述搜索詞和應(yīng)用程序之間的主題相似度;如果所述搜索詞和應(yīng)用程序之間的主題相似度大于主題閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
對(duì)于各一級(jí)類目下的應(yīng)用程序,利用一級(jí)類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級(jí)類目下的二級(jí)類目;
對(duì)每個(gè)搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,以及各應(yīng)用程序所屬的二級(jí)類目,計(jì)算所述搜索詞所對(duì)應(yīng)的二級(jí)類目;
根據(jù)應(yīng)用程序所在的二級(jí)類目,獲取對(duì)應(yīng)該二級(jí)類目的各搜索詞則作為應(yīng)用程序的匹配關(guān)鍵詞。
可選的,所述根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞,具體包括:
將應(yīng)用程序的基礎(chǔ)信息中的名稱進(jìn)行分詞操作,將分詞結(jié)果作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
可選的,所述根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞,具體包括:
將應(yīng)用程序的基礎(chǔ)信息中的名稱轉(zhuǎn)換為拼音串和/或由所述名稱進(jìn)行分詞得到的分詞結(jié)果轉(zhuǎn)換為拼音串,將所述拼音串作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
可選的,所述根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞,具體包括:
將應(yīng)用程序的標(biāo)簽詞作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
可選的,所述根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序,具體包括:
針對(duì)每一個(gè)應(yīng)用程序,在所述匹配結(jié)果表征應(yīng)用程序的關(guān)鍵詞庫(kù)中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞時(shí),確定該應(yīng)用程序與所述搜索關(guān)鍵詞相對(duì)應(yīng),以獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
可選的,所述獲取輸入的搜索關(guān)鍵詞,具體包括:
根據(jù)用戶的輸入信息,獲取所述搜索關(guān)鍵詞。
本申請(qǐng)實(shí)施例中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):
根據(jù)本發(fā)明的應(yīng)用程序搜索系統(tǒng)及方法,分發(fā)服務(wù)器,根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞;根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞;根據(jù)所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞生成應(yīng)用程序的關(guān)鍵詞庫(kù);用戶終端,用于獲取輸入的搜索關(guān)鍵詞,并將所述搜索關(guān)鍵詞發(fā)送給所述分發(fā)服務(wù)器;所述分發(fā)服務(wù)器,根據(jù)接收的所述搜索關(guān)鍵詞,將所述搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;并根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序并反饋給所述用戶終端,以使得在所述用戶終端上顯示與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序;由于應(yīng)用程序的關(guān)鍵詞庫(kù)是通過(guò)應(yīng)用程序的基礎(chǔ)關(guān)鍵詞和匹配關(guān)鍵詞來(lái)生成的,使得應(yīng)用程序的關(guān)鍵詞庫(kù)中的關(guān)鍵詞與應(yīng)用程序的相關(guān)性得以提高,由此解決了應(yīng)用程序開(kāi)發(fā)商需要通過(guò)繁瑣的操作選擇應(yīng)用程序的索引關(guān)鍵詞的問(wèn)題,以及由于選擇的索引關(guān)鍵詞不恰當(dāng),導(dǎo)致應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度很低的搜索結(jié)果中的概率較高的問(wèn)題,取得了可以通過(guò)應(yīng)用程序的關(guān)鍵詞庫(kù)自動(dòng)為應(yīng)用程序自動(dòng)選擇索引關(guān)鍵詞,減少應(yīng)用程序開(kāi)發(fā)商對(duì)應(yīng)用程序索引關(guān)鍵詞的選擇過(guò)程,有效提高應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度較高的搜索結(jié)果中的概率。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例中的應(yīng)用程序搜索系統(tǒng)的架構(gòu)圖;
圖2為本發(fā)明實(shí)施例中應(yīng)用程序搜索方法的流程圖。
具體實(shí)施方式
鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的應(yīng)用程序搜索系統(tǒng)及方法。
為了更好的理解上述技術(shù)方案,下面將結(jié)合說(shuō)明書(shū)附圖以及具體的實(shí)施方式對(duì)上述技術(shù)方案進(jìn)行詳細(xì)的說(shuō)明。
首先說(shuō)明,本文中出現(xiàn)的術(shù)語(yǔ)“和/或”,僅僅是一種描述關(guān)聯(lián)對(duì)象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,a和/或b,可以表示:?jiǎn)为?dú)存在a,同時(shí)存在a和b,單獨(dú)存在b這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對(duì)象是一種“或”的關(guān)系。
參見(jiàn)圖1,本申請(qǐng)一實(shí)施例提供了一種應(yīng)用程序搜索系統(tǒng),所述系統(tǒng)包括:
分發(fā)服務(wù)器10,用于根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞;根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞;根據(jù)所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞生成應(yīng)用程序的關(guān)鍵詞庫(kù);
用戶終端20,用于獲取輸入的搜索關(guān)鍵詞,并將所述搜索關(guān)鍵詞發(fā)送給分發(fā)服務(wù)器10;
分發(fā)服務(wù)器10,還用于根據(jù)接收的所述搜索關(guān)鍵詞,將所述搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;并根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序并反饋給用戶終端20,以使得在用戶終端20上顯示與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
在本發(fā)明實(shí)施例中,應(yīng)用程序的擁有者等可在分發(fā)服務(wù)器10中上傳應(yīng)用程序,然后向分發(fā)服務(wù)器10發(fā)送推廣該應(yīng)用程序的請(qǐng)求。分發(fā)服務(wù)器10在接收到該請(qǐng)求之后,生成該應(yīng)用程序的關(guān)鍵詞庫(kù),其中,上述推廣該應(yīng)用程序的請(qǐng)求可以為,應(yīng)用程序擁有者可以向分發(fā)服務(wù)器10對(duì)其上傳的某個(gè)應(yīng)用程序發(fā)送支付數(shù)據(jù)。
其中,上述應(yīng)用程序的基礎(chǔ)信息包括:應(yīng)用程序的名稱、應(yīng)用程序的標(biāo)簽、應(yīng)用程序的描述信息、應(yīng)用程序所屬的類目等。
其中,上述應(yīng)用程序的標(biāo)簽詞語(yǔ)為預(yù)先為該應(yīng)用程序打上的標(biāo)簽詞語(yǔ),比如“攜程旅行”應(yīng)用程序的具有人工運(yùn)營(yíng)標(biāo)簽:“旅游”、“火車票”、“旅游攻略”、“機(jī)票”、“出行”、“酒店”等。應(yīng)用程序的描述信息是應(yīng)用程序的詳細(xì)描述信息。并且,分發(fā)服務(wù)器10會(huì)預(yù)先設(shè)置類目,比如游戲類、體育類等類目,對(duì)于上傳的所有應(yīng)用程序,都會(huì)將其分到相應(yīng)的類目中。
那么本發(fā)明實(shí)施例中,可以從應(yīng)用程序的基礎(chǔ)信息中,直接提取對(duì)應(yīng)應(yīng)用程序的關(guān)鍵詞。比如從名稱中提取關(guān)鍵詞、從標(biāo)簽詞中提取關(guān)鍵詞等。
進(jìn)一步的,分發(fā)服務(wù)器10在生成應(yīng)用程序的關(guān)鍵詞庫(kù)時(shí),分發(fā)服務(wù)器10在根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞之后;再根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞;當(dāng)然也可以同時(shí)執(zhí)行獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞和應(yīng)用程序的匹配關(guān)鍵詞,頁(yè)可以先獲取應(yīng)用程序的匹配關(guān)鍵詞,再獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞,本申請(qǐng)不作具體限制。
在具體實(shí)施過(guò)程中,在用戶終端20啟用應(yīng)用程序分發(fā)應(yīng)用訪問(wèn)分發(fā)服務(wù)器10。比如用戶在其手機(jī)中啟動(dòng)360手機(jī)助手,360手機(jī)助手則連接到分發(fā)服務(wù)器10。用戶可以在應(yīng)用程序分發(fā)應(yīng)用的搜索框中輸入搜索詞,該搜索詞上傳到分發(fā)服務(wù)器10,分發(fā)服務(wù)器10根據(jù)該搜索詞檢索應(yīng)用程序搜索結(jié)果并返回應(yīng)用程序分發(fā)應(yīng)用中,應(yīng)用程序分發(fā)應(yīng)用則展示按序展示該應(yīng)用程序搜索結(jié)果,用戶可以在搜索結(jié)果中點(diǎn)擊查看或者點(diǎn)擊下載應(yīng)用程序。那么在大量用戶的搜索過(guò)程中,分發(fā)服務(wù)器10可以對(duì)各個(gè)搜索詞的搜索歷史進(jìn)行記錄,得到各個(gè)搜索詞搜索歷史記錄,例如分發(fā)服務(wù)器10可以通過(guò)日志記錄上述搜索歷史記錄。
而由于某些搜索詞實(shí)際上可能與應(yīng)用程序本身的基礎(chǔ)信息按照一定規(guī)則進(jìn)行相關(guān),因此,本發(fā)明實(shí)施例中分發(fā)服務(wù)器10可根據(jù)應(yīng)用程序的基礎(chǔ)信息和各搜索詞的搜索歷史記錄,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
具體的,分發(fā)服務(wù)器10在獲取所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞之后,根據(jù)所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞,生成應(yīng)用程序的關(guān)鍵詞庫(kù),使得應(yīng)用程序的關(guān)鍵詞庫(kù)中包含有該應(yīng)用程序的基礎(chǔ)關(guān)鍵詞和該應(yīng)用程序的匹配關(guān)鍵詞;然后分發(fā)服務(wù)器10則可以基于該應(yīng)用程序的關(guān)鍵詞庫(kù)構(gòu)建針對(duì)該應(yīng)用程序的索引,以便用戶在其終端中以與該應(yīng)用程序相關(guān)的搜索關(guān)鍵詞檢索時(shí),可以將其排序靠前顯示。
分發(fā)服務(wù)器10可以預(yù)先對(duì)各應(yīng)用程序執(zhí)行上述操作,使得各應(yīng)用程序均存在與其對(duì)應(yīng)的關(guān)鍵詞庫(kù)。
用戶終端20,獲取輸入的搜索關(guān)鍵詞,并將所述搜索關(guān)鍵詞發(fā)送給分發(fā)服務(wù)器10,其中,用戶終端20具體包括搜索關(guān)鍵詞獲取單元,所述搜索關(guān)鍵詞獲取單元用于根據(jù)用戶的輸入信息,獲取所述搜索關(guān)鍵詞,然后將所述搜索關(guān)鍵詞通過(guò)應(yīng)用程序分發(fā)應(yīng)用發(fā)送給分發(fā)服務(wù)器10。
在實(shí)際應(yīng)用過(guò)程中,當(dāng)用戶終端20中開(kāi)啟應(yīng)用程序分發(fā)應(yīng)用之后,獲取到用戶通過(guò)虛擬鍵盤、實(shí)體鍵盤等輸入單元輸入的輸入信息之后,根據(jù)所述輸入信息直接獲取到所述搜索關(guān)鍵詞,例如用戶的輸入信息顯示為axxx,則確定所述搜索關(guān)鍵詞為axxx。
分發(fā)服務(wù)器10在接收到用戶終端20發(fā)送的所述搜索關(guān)鍵詞之后,根據(jù)接收的所述搜索關(guān)鍵詞,將所述搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;并根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序并反饋給用戶終端20,以使得在用戶終端20上顯示與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
在具體實(shí)施過(guò)程中,分發(fā)服務(wù)器10中可以設(shè)置應(yīng)用程序獲取單元,針對(duì)每一個(gè)應(yīng)用程序,具體用于在所述匹配結(jié)果表征應(yīng)用程序的關(guān)鍵詞庫(kù)中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞時(shí),確定該應(yīng)用程序與所述搜索關(guān)鍵詞相對(duì)應(yīng),以獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序,如此,對(duì)每一個(gè)應(yīng)用程序的關(guān)鍵詞庫(kù)與所述搜索關(guān)鍵詞進(jìn)行匹配,根據(jù)所述匹配結(jié)果即可獲取與該搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序,在獲取到與該搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序的數(shù)量為多個(gè)時(shí),根據(jù)該搜索關(guān)鍵詞與應(yīng)用程序的相關(guān)度來(lái)對(duì)與該搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序進(jìn)行排序。
在本發(fā)明實(shí)施例中,對(duì)于前述索引,在分發(fā)服務(wù)器10中會(huì)通過(guò)廣告標(biāo)識(shí)將其標(biāo)記為推廣應(yīng)用程序,那么再檢索到應(yīng)用程序時(shí),如果該應(yīng)用程序有廣告標(biāo)識(shí),則可以將其提前展示。該廣告標(biāo)識(shí)如“推廣”、“薦”。此外,本發(fā)明實(shí)施例中可以設(shè)置多種廣告標(biāo)識(shí),不同的廣告標(biāo)識(shí)具備不同的展示權(quán)重。比如“推廣”的展示權(quán)重高,“薦”展示權(quán)重低于“推廣”的展示權(quán)重。
其中,標(biāo)識(shí)“推廣”和“薦”字樣的為推廣應(yīng)用程序,那么愛(ài)前進(jìn)理財(cái)和有利網(wǎng)理財(cái)為推廣應(yīng)用程序。搜索“理財(cái)”關(guān)鍵字展現(xiàn)上述應(yīng)用程序。
綜上所述,本發(fā)明實(shí)施例對(duì)于應(yīng)用程序開(kāi)發(fā)商需要推廣的應(yīng)用程序,可以由分發(fā)服務(wù)器10自動(dòng)根據(jù)應(yīng)用程序的基礎(chǔ)信息,提取應(yīng)用程序?qū)?yīng)的基礎(chǔ)關(guān)鍵詞,并根據(jù)應(yīng)用程序的基礎(chǔ)信息和各搜索詞的搜索歷史記錄,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞,然后根據(jù)所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞生成應(yīng)用程序的關(guān)鍵詞庫(kù);再將輸入的搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。首先,上述過(guò)程可以自動(dòng)為應(yīng)用程序開(kāi)發(fā)商的應(yīng)用程序自動(dòng)選擇索引關(guān)鍵詞,減少應(yīng)用程序開(kāi)發(fā)商對(duì)索引關(guān)鍵詞的選擇過(guò)程。其次,由于應(yīng)用程序的關(guān)鍵詞庫(kù)是通過(guò)應(yīng)用程序的基礎(chǔ)關(guān)鍵詞和匹配關(guān)鍵詞來(lái)生成的,使得應(yīng)用程序的關(guān)鍵詞庫(kù)中的關(guān)鍵詞與應(yīng)用程序的相關(guān)性得以提高,從而能夠有效降低應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度很低的搜索結(jié)果中的概率,有效提高應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度較高的搜索結(jié)果中的概率,提高搜索的準(zhǔn)確性。
繼續(xù)參見(jiàn)圖1,本申請(qǐng)另一實(shí)施例提供了一種應(yīng)用程序搜索系統(tǒng)及方法,優(yōu)選的,分發(fā)服務(wù)器10可以包括:
分詞關(guān)鍵詞提取單元,用于將應(yīng)用程序的基礎(chǔ)信息中的名稱進(jìn)行分詞操作,將分詞結(jié)果作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
在本發(fā)明實(shí)施例中,應(yīng)用程序的基礎(chǔ)信息包括名稱,如“攜程旅行”,那么本發(fā)明可以直接對(duì)該名稱進(jìn)行分詞操作,“攜程旅行”分詞之后,分詞結(jié)果為“攜程”和“旅行”,那么可以將“攜程”和“旅行”作為該應(yīng)用程序“攜程旅行”的基礎(chǔ)關(guān)鍵詞。
和/或,分發(fā)服務(wù)器10可以包括:
拼音關(guān)鍵詞提取單元,用于將應(yīng)用程序的基礎(chǔ)信息中的名稱轉(zhuǎn)換為拼音串和/或由所述名稱進(jìn)行分詞得到的分詞結(jié)果轉(zhuǎn)換為拼音串,將所述拼音串作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
對(duì)于應(yīng)用程序的名稱,可以將其直接轉(zhuǎn)換為拼音如“xiechenglvxing”,或者將其分詞結(jié)果轉(zhuǎn)換為拼音,如“攜程”的拼音為“xiecheng”,那么這些拼音可以作為該應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
和/或,分發(fā)服務(wù)器10還可以包括:
標(biāo)簽關(guān)鍵詞提取單元,用于將應(yīng)用程序的標(biāo)簽詞作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
對(duì)于一個(gè)應(yīng)用程序的預(yù)設(shè)的標(biāo)簽詞,如“攜程旅行”應(yīng)用程序的具有人工運(yùn)營(yíng)的標(biāo)簽詞:“旅游”、“火車票”、“旅游攻略”、“機(jī)票”、“出行”、“酒店”,那么可以將這些標(biāo)簽詞作為該應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
優(yōu)選的,分發(fā)服務(wù)器10還可以包括:
第一匹配關(guān)鍵詞獲取單元,用于根據(jù)各搜索詞的搜索歷史記錄中的搜索下載記錄和應(yīng)用程序的基礎(chǔ)信息中的名稱和/或類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
在實(shí)際應(yīng)用中,用戶在終端中輸入了搜索詞進(jìn)行搜索,其可能點(diǎn)擊下載應(yīng)用程序也可能不下載應(yīng)用程序,那么分發(fā)服務(wù)器10則可以記錄各個(gè)搜索詞的搜索下載情況,比如用戶a搜索“理財(cái)”,在搜索結(jié)果頁(yè)中下載了應(yīng)用程序1,而用戶b搜索“理財(cái)”,則可能在搜索結(jié)果頁(yè)中下載了應(yīng)用程序2,通過(guò)對(duì)大量用戶的搜索下載行為的記錄,則可得到對(duì)各搜索詞的搜索下載記錄。
具體實(shí)現(xiàn)中,該搜索下載記錄以搜索下載日志的形式存儲(chǔ)在分發(fā)服務(wù)器10中。
那么本發(fā)明實(shí)施例中,可以根據(jù)搜索下載日志中提取搜索詞,根據(jù)該搜索詞與應(yīng)用程序的名稱和/或者類目之間的關(guān)系,將相關(guān)的搜索詞作為該應(yīng)用程序的匹配關(guān)鍵詞。
優(yōu)選的,所述第一匹配關(guān)鍵詞獲取單元,具體包括:
文本相似度獲取單元,對(duì)于搜索下載記錄中的各搜索詞,用于計(jì)算搜索詞和應(yīng)用程序的基礎(chǔ)信息中的名稱之間的文本相似度;如果所述文本相似度大于第一閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
本發(fā)明實(shí)施例可以從搜索下載日志中提取各個(gè)已經(jīng)使用的搜索詞,計(jì)算該搜索詞與應(yīng)用程序的名稱之間的文本相似度。如計(jì)算搜索詞文本和應(yīng)用程序名稱文本之間的余弦距離。
本發(fā)明實(shí)施例可以針對(duì)文本相似度設(shè)置一個(gè)第一閾值,如果所述文本相似度大于第一閾值,則獲取所述搜索詞作為該應(yīng)用程序的匹配關(guān)鍵詞。如果所述文本相似度小于第一閾值,則忽略該詞。
優(yōu)選的,所述第一匹配關(guān)鍵詞獲取單元,具體包括:
獨(dú)立訪問(wèn)搜索詞提取單元,對(duì)于搜索下載記錄中的各搜索詞,用于判斷所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)是否大于第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目是否屬于同一個(gè)類目;如果所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)大于所述第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目屬于同一個(gè)類目,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
對(duì)于搜索下載日志中一個(gè)搜索詞,可能有多個(gè)用戶在終端展示的該搜索詞的搜索結(jié)果中下載應(yīng)用程序,而其存在同一個(gè)ip的終端下載了多個(gè)應(yīng)用程序或者同一個(gè)應(yīng)用程序下載了多次。而為了減少同一個(gè)ip的終端對(duì)搜索詞下載權(quán)重的影響,本發(fā)明實(shí)施例則統(tǒng)計(jì)每個(gè)搜索詞的獨(dú)立訪問(wèn)下載次數(shù),即uv(uniquevisitor)下載,即即使同一個(gè)ip的終端的下載了多次,其uv下載次數(shù)也只算一次。然后對(duì)于一個(gè)搜索詞,統(tǒng)計(jì)有多少個(gè)ip的終端使用該搜索詞的搜索結(jié)果下載了應(yīng)用程序。
然后,本發(fā)明實(shí)施例設(shè)置了針對(duì)uv下載次數(shù)的第二閾值,如果判斷搜索詞的uv下載次數(shù)大于該第二閾值,則可判斷所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目是否屬于同一個(gè)類目,如果此時(shí)搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目屬于同一個(gè)類目,則將該搜索詞作為該應(yīng)用程序的匹配關(guān)鍵字。而對(duì)于一個(gè)搜索詞,其獨(dú)立訪問(wèn)下載次數(shù)小于等于第二閾值,以及其類目與應(yīng)用程序的基礎(chǔ)信息中的類目不屬于同一個(gè)類目,可以忽略該搜索詞。
當(dāng)然,本發(fā)明實(shí)施例中對(duì)應(yīng)用程序進(jìn)行分類。對(duì)于搜索詞,也可以對(duì)其進(jìn)行分類。具體的分類過(guò)程本發(fā)明不對(duì)其加以限制。當(dāng)然分發(fā)服務(wù)器10可以采用如下步驟對(duì)應(yīng)用程序和搜索詞分類:
子步驟a11,對(duì)于各一級(jí)類目下的應(yīng)用程序,利用一級(jí)類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級(jí)類目下的二級(jí)類目;
在分發(fā)服務(wù)器10中預(yù)設(shè)的各種分類,該分類從一級(jí)分類開(kāi)始,比如游戲了類、體育類。而實(shí)際上,對(duì)于一個(gè)一級(jí)類目下的應(yīng)用程序,可以根據(jù)其應(yīng)用程序的描述信息進(jìn)行更細(xì)的分類。在實(shí)際應(yīng)用中,可以利用貝葉斯分類器對(duì)描述信息進(jìn)行分類,將一級(jí)類目下的各應(yīng)用程序分到各二級(jí)類目下。
子步驟a12,對(duì)每個(gè)搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,以及各應(yīng)用程序所屬的二級(jí)類目,計(jì)算所述搜索詞所對(duì)應(yīng)的二級(jí)類目。
在用戶的搜索過(guò)程中,可能其在搜索結(jié)果頁(yè)面中點(diǎn)擊查看應(yīng)用程序的詳細(xì)信息而未下載,也可能點(diǎn)擊下應(yīng)用程序。本發(fā)明實(shí)施例可以根據(jù)搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,結(jié)合子步驟a12的二級(jí)類目的應(yīng)用程序,將各個(gè)搜索詞也分到相應(yīng)的二級(jí)類目下。當(dāng)然應(yīng)用程序也參與分類過(guò)程。
比如搜索詞1點(diǎn)擊二級(jí)類目1中的應(yīng)用程序的次數(shù)的占比大于占比閾值,則將該搜索詞歸到該二級(jí)類目1下。
上述搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,可以為搜索詞與各應(yīng)用程序的點(diǎn)擊查看之間的關(guān)系,也可以為搜索詞與各應(yīng)用程序的點(diǎn)擊下載之間的關(guān)系,當(dāng)然也可以為搜索詞與各應(yīng)用程序的點(diǎn)擊查看和點(diǎn)擊下載之間的總的關(guān)系。
和/或,分發(fā)服務(wù)器10還可以包括:
第二匹配關(guān)鍵詞獲取單元,用于根據(jù)應(yīng)用程序的基礎(chǔ)信息中的描述信息、和各搜索詞的搜索歷史記錄中的搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
本發(fā)明實(shí)施例可以根據(jù)應(yīng)用程序的描述信息、各搜索詞的搜索歷史記錄中的搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,去計(jì)算應(yīng)用程序和搜索詞之間的主題相關(guān)性。當(dāng)主題相關(guān)性大于主題閾值時(shí),則可以將該搜索詞作為該應(yīng)用程序的匹配關(guān)鍵詞。反之則可以忽略該搜索詞。
優(yōu)選地,所述第二匹配關(guān)鍵詞獲取單元,具體包括:
應(yīng)用程序主題分布計(jì)算單元,針對(duì)各應(yīng)用程序的基礎(chǔ)信息中的描述信息,用于通過(guò)主題模型計(jì)算出應(yīng)用程序的主題分布;
本發(fā)明實(shí)施例中,可以采用所有的應(yīng)用程序的描述信息作為輸入,將其輸入主題模型,計(jì)算各個(gè)應(yīng)用程序的主題分布。
在具體實(shí)現(xiàn)中,因?yàn)閼?yīng)用程序的描述信息實(shí)際上是一個(gè)文章,上述主題模型可以為lda(latentdirichletallocation,潛在狄利克雷分配主題)模型。通過(guò)lda模型可以對(duì)各個(gè)文章進(jìn)行分析,得到對(duì)應(yīng)各個(gè)描述信息的主題分布,即每個(gè)主題的概率分布,如主題1的概率為0.6,主題2的概率為0.3,得到一個(gè)向量(0.6,,0.4)。
搜索詞主題分布計(jì)算單元,對(duì)每個(gè)搜索詞,用于根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,計(jì)算搜索詞的主題分布;
如前所述,每個(gè)搜索詞與各個(gè)應(yīng)用程序有點(diǎn)擊關(guān)系,比如一搜索詞的搜索結(jié)果中哪些應(yīng)用程序被點(diǎn)擊查看,和/或哪些應(yīng)用程序被點(diǎn)擊下載。如此,可以統(tǒng)計(jì)每個(gè)搜索詞點(diǎn)擊了哪些應(yīng)用程序,各個(gè)應(yīng)用程序的點(diǎn)擊次數(shù)等。
那么由于所述應(yīng)用程序主題分布計(jì)算單元中的應(yīng)用程序計(jì)算了主題分布,那么一個(gè)搜索詞可以根據(jù)其點(diǎn)擊的應(yīng)用程序,間接的確定該搜索詞的主題分布。比如搜索1點(diǎn)擊應(yīng)用程序1占比0.8,點(diǎn)擊應(yīng)用程序2的占比為0.2,而應(yīng)用程序1的主題分布為(0.6,,0.4),(0.7,,0.3),那么搜索詞的主題分布可以為((0.6+.07)*0.8,(0.4+0.3)*0.2)。
主題相似搜索詞提取單元,對(duì)于搜索量大于第三閾值的搜索詞,用于根據(jù)所述搜索詞的主題分布和應(yīng)用程序的主題分布,計(jì)算所述搜索詞和應(yīng)用程序之間的主題相似度;如果所述搜索詞和應(yīng)用程序之間的主題相似度大于主題閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
在實(shí)際應(yīng)用中,有些搜索詞搜索量小有些搜索詞搜索量大,對(duì)于要推廣的應(yīng)用程序來(lái)說(shuō),搜索量大的搜索詞更容易進(jìn)行推廣。因而本發(fā)明則在搜索歷史記錄中統(tǒng)計(jì)各個(gè)搜索詞的搜索量,并預(yù)設(shè)第三閾值,如果對(duì)于搜索量大于第三閾值的搜索詞,才根據(jù)搜索詞的主題分布和應(yīng)用程序的主題分布,計(jì)算所述搜索詞和應(yīng)用程序之間的主題相似度。
在本發(fā)明實(shí)施例中,對(duì)于搜索詞的主題分布和應(yīng)用程序的主題分布之間的相似度,可以采用kl距離和/或js距離計(jì)算。其中,kl距離為kullback–leiblerdivergence,又稱相對(duì)熵,他對(duì)一個(gè)離散隨機(jī)變量的兩個(gè)概率分布p和q來(lái)說(shuō),他們的kl散度定義為:d(p||q)=σp(i)log(p(i)/q(i))......公式(1)。
其中求log時(shí),以2為底。
對(duì)于js距離為jensen–shannondivergence,其為kl距離的優(yōu)化方案,其公式為:
其中
jsd取值是0到1之間。越大代表兩個(gè)主題分布越一致,相似性越高。
本發(fā)明的搜索詞的主題分布和應(yīng)用程序的主題分布分別對(duì)應(yīng)p和q,如果所述搜索詞和應(yīng)用程序之間的主題相似度大于主題閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
本發(fā)明實(shí)施例預(yù)設(shè)一個(gè)主題閾值,搜索詞和應(yīng)用程序之間的主題相似度大于該主題閾值,則獲取對(duì)應(yīng)的搜索詞作為該應(yīng)用程序的匹配關(guān)鍵詞。反之,則忽略。
和/或,分發(fā)服務(wù)器10還可以包括:
第三匹配關(guān)鍵詞獲取單元,用于根據(jù)應(yīng)用程序的基礎(chǔ)信息中的類目和各搜索詞對(duì)應(yīng)的類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
優(yōu)選的,所述第三匹配關(guān)鍵詞獲取單元具體包括:
應(yīng)用程序類目細(xì)分單元,對(duì)于各一級(jí)類目下的應(yīng)用程序,用于利用一級(jí)類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級(jí)類目下的二級(jí)類目;
搜索詞分類單元,對(duì)每個(gè)搜索詞,用于根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,以及各應(yīng)用程序所屬的二級(jí)類目,計(jì)算所述搜索詞所對(duì)應(yīng)的二級(jí)類目;
應(yīng)用程序類目細(xì)分單元與搜索詞分類單元與前述子步驟a11和a12類似。由于類似搜索詞1點(diǎn)擊二級(jí)類目1中的應(yīng)用程序的次數(shù)的占比大于占比閾值,則將該搜索詞歸到該二級(jí)類目1下的情況,存在某個(gè)二級(jí)類目下,搜索詞的點(diǎn)擊占比很小,也即該搜索詞是該二級(jí)類目的概率小,則可以將其從該二級(jí)類目中去除。
在將搜索詞對(duì)應(yīng)二級(jí)類目之后,將對(duì)應(yīng)該二級(jí)類目的概率小的搜索詞刪除,將剩余的二級(jí)類目的搜索詞生成為一個(gè)詞包,然后在類目搜索詞提取模單元中應(yīng)用。
類目搜索詞提取模單元,用于根據(jù)應(yīng)用程序所在的二級(jí)類目,獲取對(duì)應(yīng)該二級(jí)類目的各搜索詞則作為應(yīng)用程序的匹配關(guān)鍵詞。
對(duì)于應(yīng)用程序,由于應(yīng)用程序類目細(xì)分單元計(jì)算了各個(gè)應(yīng)用程序所在的二級(jí)類目,那么應(yīng)用程序的二級(jí)類目也確定,搜索詞分類單元中確定了二級(jí)類目的關(guān)鍵詞的詞包,那么可以將該詞包中的詞作為該應(yīng)用程序的匹配關(guān)鍵詞。
在本發(fā)明實(shí)施例中,所述第一匹配關(guān)鍵詞獲取單元、所述第二匹配關(guān)鍵詞獲取單元、所述第三匹配關(guān)鍵詞獲取單元各自都針對(duì)所有的搜索詞進(jìn)行計(jì)算獲取檢索詞,所述第一匹配關(guān)鍵詞獲取單元、所述第二匹配關(guān)鍵詞獲取單元和所述第三匹配關(guān)鍵詞獲取單元可以單獨(dú)使用,可以選擇其中幾個(gè)使用,也可以選擇全部使用。本發(fā)明不對(duì)其加以限定。
具體的,分發(fā)服務(wù)器10在通過(guò)上述單元獲取所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞之后,根據(jù)所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞生成應(yīng)用程序的關(guān)鍵詞庫(kù);
在本發(fā)明實(shí)施例中,對(duì)于各種組合得到的基礎(chǔ)關(guān)鍵詞和匹配關(guān)鍵詞,可以首先進(jìn)行歸一化,將相同的關(guān)鍵詞合并,得到最簡(jiǎn)的關(guān)鍵詞之后,根據(jù)最簡(jiǎn)的關(guān)鍵詞生成應(yīng)用程序的關(guān)鍵詞庫(kù)。
分發(fā)服務(wù)器10可以預(yù)先對(duì)各應(yīng)用程序執(zhí)行上述操作,使得各應(yīng)用程序均存在與其對(duì)應(yīng)的關(guān)鍵詞庫(kù)。
用戶終端20,獲取輸入的搜索關(guān)鍵詞,并將所述搜索關(guān)鍵詞發(fā)送給分發(fā)服務(wù)器10,其中,用戶終端20具體包括搜索關(guān)鍵詞獲取單元,所述搜索關(guān)鍵詞獲取單元用于根據(jù)用戶的輸入信息,獲取所述搜索關(guān)鍵詞,然后將所述搜索關(guān)鍵詞通過(guò)應(yīng)用程序分發(fā)應(yīng)用發(fā)送給分發(fā)服務(wù)器10。
在實(shí)際應(yīng)用過(guò)程中,當(dāng)用戶終端20中開(kāi)啟應(yīng)用程序分發(fā)應(yīng)用之后,獲取到用戶通過(guò)虛擬鍵盤、實(shí)體鍵盤等輸入單元輸入的輸入信息之后,根據(jù)所述輸入信息直接獲取到所述搜索關(guān)鍵詞,例如用戶的輸入信息顯示為axxx,則確定所述搜索關(guān)鍵詞為axxx。
分發(fā)服務(wù)器10在接收到用戶終端20發(fā)送的所述搜索關(guān)鍵詞之后,根據(jù)接收的所述搜索關(guān)鍵詞,將所述搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;并根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序并反饋給用戶終端20,以使得在用戶終端20上顯示與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
在具體實(shí)施過(guò)程中,分發(fā)服務(wù)器10中可以設(shè)置應(yīng)用程序獲取單元,針對(duì)每一個(gè)應(yīng)用程序,具體用于在所述匹配結(jié)果表征應(yīng)用程序的關(guān)鍵詞庫(kù)中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞時(shí),確定該應(yīng)用程序與所述搜索關(guān)鍵詞相對(duì)應(yīng),以獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序,如此,對(duì)每一個(gè)應(yīng)用程序的關(guān)鍵詞庫(kù)與所述搜索關(guān)鍵詞進(jìn)行匹配,根據(jù)所述匹配結(jié)果即可獲取與該搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序,在獲取到與該搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序的數(shù)量為多個(gè)時(shí),根據(jù)該搜索關(guān)鍵詞與應(yīng)用程序的相關(guān)度來(lái)對(duì)與該搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序進(jìn)行排序。
分發(fā)服務(wù)器10可以預(yù)先對(duì)各應(yīng)用程序執(zhí)行上述操作,使得各應(yīng)用程序均存在與其對(duì)應(yīng)的關(guān)鍵詞庫(kù)。
用戶終端20,獲取輸入的搜索關(guān)鍵詞,并將所述搜索關(guān)鍵詞發(fā)送給分發(fā)服務(wù)器10,其中,用戶終端20具體包括搜索關(guān)鍵詞獲取單元,所述搜索關(guān)鍵詞獲取單元用于根據(jù)用戶的輸入信息,獲取所述搜索關(guān)鍵詞,然后將所述搜索關(guān)鍵詞通過(guò)應(yīng)用程序分發(fā)應(yīng)用發(fā)送給分發(fā)服務(wù)器10。
在實(shí)際應(yīng)用過(guò)程中,當(dāng)用戶終端20中開(kāi)啟應(yīng)用程序分發(fā)應(yīng)用之后,獲取到用戶通過(guò)虛擬鍵盤、實(shí)體鍵盤等輸入單元輸入的輸入信息之后,根據(jù)所述輸入信息直接獲取到所述搜索關(guān)鍵詞,例如用戶的輸入信息顯示為axxx,則確定所述搜索關(guān)鍵詞為axxx。
分發(fā)服務(wù)器10在接收到用戶終端20發(fā)送的所述搜索關(guān)鍵詞之后,根據(jù)接收的所述搜索關(guān)鍵詞,將所述搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;并根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序并反饋給用戶終端20,以使得在用戶終端20上顯示與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
在具體實(shí)施過(guò)程中,分發(fā)服務(wù)器10中可以設(shè)置應(yīng)用程序獲取單元,針對(duì)每一個(gè)應(yīng)用程序,具體用于在所述匹配結(jié)果表征應(yīng)用程序的關(guān)鍵詞庫(kù)中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞時(shí),確定該應(yīng)用程序與所述搜索關(guān)鍵詞相對(duì)應(yīng),以獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序,如此,對(duì)每一個(gè)應(yīng)用程序的關(guān)鍵詞庫(kù)與所述搜索關(guān)鍵詞進(jìn)行匹配,根據(jù)所述匹配結(jié)果即可獲取與該搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序,在獲取到與該搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序的數(shù)量為多個(gè)時(shí),根據(jù)該搜索關(guān)鍵詞與應(yīng)用程序的相關(guān)度來(lái)對(duì)與該搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序進(jìn)行排序。
基于與上述系統(tǒng)相同的技術(shù)構(gòu)思,本申請(qǐng)一實(shí)施例還提供了一種應(yīng)用程序搜索方法,參見(jiàn)圖2,所述方法包括:
s201:通過(guò)分發(fā)服務(wù)器根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞;根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞;根據(jù)所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞生成應(yīng)用程序的關(guān)鍵詞庫(kù);
s202:通過(guò)用戶終端獲取輸入的搜索關(guān)鍵詞,并將所述搜索關(guān)鍵詞發(fā)送給分發(fā)服務(wù)器;
s203:通過(guò)分發(fā)服務(wù)器接收的所述搜索關(guān)鍵詞,將所述搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;并根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序并反饋給用戶終端,以使得在用戶終端上顯示與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
具體的,所述根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
根據(jù)各搜索詞的搜索歷史記錄中的搜索下載記錄和應(yīng)用程序的基礎(chǔ)信息中的名稱和/或類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
具體的,所述根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
根據(jù)應(yīng)用程序的基礎(chǔ)信息中的描述信息、和各搜索詞的搜索歷史記錄中的搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
具體的,所述根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
根據(jù)應(yīng)用程序的基礎(chǔ)信息中的類目和各搜索詞對(duì)應(yīng)的類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
具體的,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
對(duì)于搜索下載記錄中的各搜索詞,用于計(jì)算搜索詞和應(yīng)用程序的基礎(chǔ)信息中的名稱之間的文本相似度;如果所述文本相似度大于第一閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
具體的,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
對(duì)于搜索下載記錄中的各搜索詞,判斷所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)是否大于第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目是否屬于同一個(gè)類目;如果所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)大于所述第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目屬于同一個(gè)類目,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
具體的,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
針對(duì)各應(yīng)用程序的基礎(chǔ)信息中的描述信息,通過(guò)主題模型計(jì)算出應(yīng)用程序的主題分布;
對(duì)每個(gè)搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,計(jì)算搜索詞的主題分布;
對(duì)于搜索量大于第三閾值的搜索詞,根據(jù)所述搜索詞的主題分布和應(yīng)用程序的主題分布,計(jì)算所述搜索詞和應(yīng)用程序之間的主題相似度;如果所述搜索詞和應(yīng)用程序之間的主題相似度大于主題閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
具體的,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
對(duì)于各一級(jí)類目下的應(yīng)用程序,利用一級(jí)類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級(jí)類目下的二級(jí)類目;
對(duì)每個(gè)搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,以及各應(yīng)用程序所屬的二級(jí)類目,計(jì)算所述搜索詞所對(duì)應(yīng)的二級(jí)類目;
根據(jù)應(yīng)用程序所在的二級(jí)類目,獲取對(duì)應(yīng)該二級(jí)類目的各搜索詞則作為應(yīng)用程序的匹配關(guān)鍵詞。
具體的,所述根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞,具體包括:
將應(yīng)用程序的基礎(chǔ)信息中的名稱進(jìn)行分詞操作,將分詞結(jié)果作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
具體的,所述根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞,具體包括:
將應(yīng)用程序的基礎(chǔ)信息中的名稱轉(zhuǎn)換為拼音串和/或由所述名稱進(jìn)行分詞得到的分詞結(jié)果轉(zhuǎn)換為拼音串,將所述拼音串作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
具體的,所述根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞,具體包括:
將應(yīng)用程序的標(biāo)簽詞作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
具體的,所述根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序,具體包括:
針對(duì)每一個(gè)應(yīng)用程序,在所述匹配結(jié)果表征應(yīng)用程序的關(guān)鍵詞庫(kù)中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞時(shí),確定該應(yīng)用程序與所述搜索關(guān)鍵詞相對(duì)應(yīng),以獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
具體的,所述獲取輸入的搜索關(guān)鍵詞,具體包括:
根據(jù)用戶的輸入信息,獲取所述搜索關(guān)鍵詞。
上述本申請(qǐng)實(shí)施例中的技術(shù)方案,至少具有如下的技術(shù)效果或優(yōu)點(diǎn):
根據(jù)本發(fā)明的應(yīng)用程序搜索系統(tǒng)及方法,分發(fā)服務(wù)器,根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞;根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞;根據(jù)所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞生成應(yīng)用程序的關(guān)鍵詞庫(kù);用戶終端,用于獲取輸入的搜索關(guān)鍵詞,并將所述搜索關(guān)鍵詞發(fā)送給所述分發(fā)服務(wù)器;所述分發(fā)服務(wù)器,根據(jù)接收的所述搜索關(guān)鍵詞,將所述搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;并根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序并反饋給所述用戶終端,以使得在所述用戶終端上顯示與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序;由于應(yīng)用程序的關(guān)鍵詞庫(kù)是通過(guò)應(yīng)用程序的基礎(chǔ)關(guān)鍵詞和匹配關(guān)鍵詞來(lái)生成的,使得應(yīng)用程序的關(guān)鍵詞庫(kù)中的關(guān)鍵詞與應(yīng)用程序的相關(guān)性得以提高,由此解決了應(yīng)用程序開(kāi)發(fā)商需要通過(guò)繁瑣的操作選擇應(yīng)用程序的索引關(guān)鍵詞的問(wèn)題,以及由于選擇的索引關(guān)鍵詞不恰當(dāng),導(dǎo)致應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度很低的搜索結(jié)果中的概率較高的問(wèn)題,取得了可以通過(guò)應(yīng)用程序的關(guān)鍵詞庫(kù)自動(dòng)為應(yīng)用程序自動(dòng)選擇索引關(guān)鍵詞,減少應(yīng)用程序開(kāi)發(fā)商對(duì)應(yīng)用程序索引關(guān)鍵詞的選擇過(guò)程,有效提高應(yīng)用程序出現(xiàn)在與用戶輸入的搜索詞相關(guān)度較高的搜索結(jié)果中的概率。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
盡管已描述了本發(fā)明的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
本發(fā)明公開(kāi)a1、一種應(yīng)用程序搜索系統(tǒng),其特征在于,所述系統(tǒng)包括:
分發(fā)服務(wù)器,用于根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞;根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞;根據(jù)所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞生成應(yīng)用程序的關(guān)鍵詞庫(kù);
用戶終端,用于獲取輸入的搜索關(guān)鍵詞,并將所述搜索關(guān)鍵詞發(fā)送給所述分發(fā)服務(wù)器;
所述分發(fā)服務(wù)器,還用于根據(jù)接收的所述搜索關(guān)鍵詞,將所述搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;并根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序并反饋給所述用戶終端,以使得在所述用戶終端上顯示與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
a2、如a1所述的系統(tǒng),其特征在于,所述分發(fā)服務(wù)器包括:
第一匹配關(guān)鍵詞獲取單元,用于根據(jù)各搜索詞的搜索歷史記錄中的搜索下載記錄和應(yīng)用程序的基礎(chǔ)信息中的名稱和/或類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
a3、如a1所述的系統(tǒng),其特征在于,所述分發(fā)服務(wù)器包括:
第二匹配關(guān)鍵詞獲取單元,用于根據(jù)應(yīng)用程序的基礎(chǔ)信息中的描述信息、和各搜索詞的搜索歷史記錄中的搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
a4、如a1所述的系統(tǒng),其特征在于,所述分發(fā)服務(wù)器包括:
第三匹配關(guān)鍵詞獲取單元,用于根據(jù)應(yīng)用程序的基礎(chǔ)信息中的類目和各搜索詞對(duì)應(yīng)的類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
a5、如a2所述的系統(tǒng),其特征在于,所述第一匹配關(guān)鍵詞獲取單元,具體包括:
文本相似度獲取單元,對(duì)于搜索下載記錄中的各搜索詞,用于計(jì)算搜索詞和應(yīng)用程序的基礎(chǔ)信息中的名稱之間的文本相似度;如果所述文本相似度大于第一閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
a6、如a2所述的系統(tǒng),其特征在于,所述第一匹配關(guān)鍵詞獲取單元,具體包括:
獨(dú)立訪問(wèn)搜索詞提取單元,對(duì)于搜索下載記錄中的各搜索詞,用于判斷所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)是否大于第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目是否屬于同一個(gè)類目;如果所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)大于所述第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目屬于同一個(gè)類目,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
a7、如a3所述的系統(tǒng),其特征在于,所述第二匹配關(guān)鍵詞獲取單元,具體包括:
應(yīng)用程序主題分布計(jì)算單元,針對(duì)各應(yīng)用程序的基礎(chǔ)信息中的描述信息,用于通過(guò)主題模型計(jì)算出應(yīng)用程序的主題分布;
搜索詞主題分布計(jì)算單元,對(duì)每個(gè)搜索詞,用于根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,計(jì)算搜索詞的主題分布;
主題相似搜索詞提取單元,對(duì)于搜索量大于第三閾值的搜索詞,用于根據(jù)所述搜索詞的主題分布和應(yīng)用程序的主題分布,計(jì)算所述搜索詞和應(yīng)用程序之間的主題相似度;如果所述搜索詞和應(yīng)用程序之間的主題相似度大于主題閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
a8、如a4所述的系統(tǒng),其特征在于,所述第三匹配關(guān)鍵詞獲取單元,具體包括:
應(yīng)用程序類目細(xì)分單元,對(duì)于各一級(jí)類目下的應(yīng)用程序,用于利用一級(jí)類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級(jí)類目下的二級(jí)類目;
搜索詞分類單元,對(duì)每個(gè)搜索詞,用于根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,以及各應(yīng)用程序所屬的二級(jí)類目,計(jì)算所述搜索詞所對(duì)應(yīng)的二級(jí)類目;
類目搜索詞提取模單元,用于根據(jù)應(yīng)用程序所在的二級(jí)類目,獲取對(duì)應(yīng)該二級(jí)類目的各搜索詞則作為應(yīng)用程序的匹配關(guān)鍵詞。
a9、如a1所述的系統(tǒng),其特征在于,所述分發(fā)服務(wù)器包括:
分詞關(guān)鍵詞提取單元,用于將應(yīng)用程序的基礎(chǔ)信息中的名稱進(jìn)行分詞操作,將分詞結(jié)果作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
a10、如a1所述的系統(tǒng),其特征在于,所述分發(fā)服務(wù)器包括:
拼音關(guān)鍵詞提取單元,用于將應(yīng)用程序的基礎(chǔ)信息中的名稱轉(zhuǎn)換為拼音串和/或由所述名稱進(jìn)行分詞得到的分詞結(jié)果轉(zhuǎn)換為拼音串,將所述拼音串作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
a11、如a1所述的系統(tǒng),其特征在于,所述分發(fā)服務(wù)器還包括:
標(biāo)簽關(guān)鍵詞提取單元,用于將應(yīng)用程序的標(biāo)簽詞作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
a12、如a1所述的系統(tǒng),其特征在于,所述分發(fā)服務(wù)器還包括:
應(yīng)用程序獲取單元,針對(duì)每一個(gè)應(yīng)用程序,具體用于在所述匹配結(jié)果表征應(yīng)用程序的關(guān)鍵詞庫(kù)中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞時(shí),確定該應(yīng)用程序與所述搜索關(guān)鍵詞相對(duì)應(yīng),以獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
a13、如a1所述的系統(tǒng),其特征在于,所述用戶終端包括:
搜索關(guān)鍵詞獲取單元,具體用于根據(jù)用戶的輸入信息,獲取所述搜索關(guān)鍵詞。
b14、一種應(yīng)用程序搜索方法,其特征在于,所述方法包括:
通過(guò)分發(fā)服務(wù)器根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞;根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞;根據(jù)所述基礎(chǔ)關(guān)鍵詞和所述匹配關(guān)鍵詞生成應(yīng)用程序的關(guān)鍵詞庫(kù);
通過(guò)用戶終端獲取輸入的搜索關(guān)鍵詞,并將所述搜索關(guān)鍵詞發(fā)送給所述分發(fā)服務(wù)器;
通過(guò)所述分發(fā)服務(wù)器接收的所述搜索關(guān)鍵詞,將所述搜索關(guān)鍵詞與各應(yīng)用程序的關(guān)鍵詞庫(kù)進(jìn)行匹配;并根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序并反饋給所述用戶終端,以使得在所述用戶終端上顯示與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
b15、如b14所述的方法,其特征在于,所述根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
根據(jù)各搜索詞的搜索歷史記錄中的搜索下載記錄和應(yīng)用程序的基礎(chǔ)信息中的名稱和/或類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
b16、如b14所述的方法,其特征在于,所述根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
根據(jù)應(yīng)用程序的基礎(chǔ)信息中的描述信息、和各搜索詞的搜索歷史記錄中的搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
b17、如b14所述的方法,其特征在于,所述根據(jù)各搜索詞的歷史搜索記錄和應(yīng)用程序的基礎(chǔ)信息,獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
根據(jù)應(yīng)用程序的基礎(chǔ)信息中的類目和各搜索詞對(duì)應(yīng)的類目,獲取與應(yīng)用程序匹配的搜索詞以作為應(yīng)用程序的匹配關(guān)鍵詞。
b18、如b15所述的方法,其特征在于,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
對(duì)于搜索下載記錄中的各搜索詞,用于計(jì)算搜索詞和應(yīng)用程序的基礎(chǔ)信息中的名稱之間的文本相似度;如果所述文本相似度大于第一閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
b19、如b15所述的方法,其特征在于,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
對(duì)于搜索下載記錄中的各搜索詞,判斷所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)是否大于第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目是否屬于同一個(gè)類目;如果所述搜索詞的獨(dú)立訪問(wèn)下載次數(shù)大于所述第二閾值,以及所述搜索詞的類目與應(yīng)用程序的基礎(chǔ)信息中的類目屬于同一個(gè)類目,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
b20、如b16所述的方法,其特征在于,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
針對(duì)各應(yīng)用程序的基礎(chǔ)信息中的描述信息,通過(guò)主題模型計(jì)算出應(yīng)用程序的主題分布;
對(duì)每個(gè)搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,計(jì)算搜索詞的主題分布;
對(duì)于搜索量大于第三閾值的搜索詞,根據(jù)所述搜索詞的主題分布和應(yīng)用程序的主題分布,計(jì)算所述搜索詞和應(yīng)用程序之間的主題相似度;如果所述搜索詞和應(yīng)用程序之間的主題相似度大于主題閾值,則獲取所述搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞。
b21、如b17所述的方法,其特征在于,所述獲取與應(yīng)用程序匹配的搜索詞作為應(yīng)用程序的匹配關(guān)鍵詞,具體包括:
對(duì)于各一級(jí)類目下的應(yīng)用程序,利用一級(jí)類目下的各應(yīng)用程序的描述信息,采用分類器將各應(yīng)用程序分為相應(yīng)一級(jí)類目下的二級(jí)類目;
對(duì)每個(gè)搜索詞,根據(jù)搜索歷史記錄中搜索詞與各應(yīng)用程序的點(diǎn)擊關(guān)系,以及各應(yīng)用程序所屬的二級(jí)類目,計(jì)算所述搜索詞所對(duì)應(yīng)的二級(jí)類目;
根據(jù)應(yīng)用程序所在的二級(jí)類目,獲取對(duì)應(yīng)該二級(jí)類目的各搜索詞則作為應(yīng)用程序的匹配關(guān)鍵詞。
b22、如b14所述的方法,其特征在于,所述根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞,具體包括:
將應(yīng)用程序的基礎(chǔ)信息中的名稱進(jìn)行分詞操作,將分詞結(jié)果作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
b23、如b14所述的方法,其特征在于,所述根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞,具體包括:
將應(yīng)用程序的基礎(chǔ)信息中的名稱轉(zhuǎn)換為拼音串和/或由所述名稱進(jìn)行分詞得到的分詞結(jié)果轉(zhuǎn)換為拼音串,將所述拼音串作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
b24、如b14所述的方法,其特征在于,所述根據(jù)應(yīng)用程序的基礎(chǔ)信息,獲取應(yīng)用程序的基礎(chǔ)關(guān)鍵詞,具體包括:
將應(yīng)用程序的標(biāo)簽詞作為應(yīng)用程序的基礎(chǔ)關(guān)鍵詞。
b25、如b14所述的方法,其特征在于,所述根據(jù)匹配結(jié)果,獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序,具體包括:
針對(duì)每一個(gè)應(yīng)用程序,在所述匹配結(jié)果表征應(yīng)用程序的關(guān)鍵詞庫(kù)中存在與所述搜索關(guān)鍵詞相匹配的關(guān)鍵詞時(shí),確定該應(yīng)用程序與所述搜索關(guān)鍵詞相對(duì)應(yīng),以獲取與所述搜索關(guān)鍵詞對(duì)應(yīng)的應(yīng)用程序。
b26、如b14所述的方法,其特征在于,所述獲取輸入的搜索關(guān)鍵詞,具體包括:
根據(jù)用戶的輸入信息,獲取所述搜索關(guān)鍵詞。