專利名稱:基于網(wǎng)上交易平臺(tái)的檢索方法、裝置和服務(wù)器的制作方法
技術(shù)領(lǐng)域:
本申請(qǐng)涉及網(wǎng)絡(luò)數(shù)據(jù)處理領(lǐng)域,特別涉及基于網(wǎng)上交易平臺(tái)的檢索方法、裝置和服務(wù)器。
背景技術(shù):
基于網(wǎng)上交易平臺(tái)的搜索,一般都是接收用戶輸入的查詢關(guān)鍵詞之后,會(huì)將包括了查詢關(guān)鍵詞的一些產(chǎn)品顯示給用戶,這些包括了查詢關(guān)鍵詞的產(chǎn)品就是用戶可能會(huì)感興趣的產(chǎn)品。這些產(chǎn)品一般可以通過(guò)與關(guān)鍵詞相關(guān)聯(lián)的形式,使得某個(gè)輸入相關(guān)聯(lián)的關(guān)鍵詞, 就可以得到與該關(guān)鍵詞相關(guān)聯(lián)的產(chǎn)品。當(dāng)用戶搜索某一款具體的產(chǎn)品時(shí),現(xiàn)有技術(shù)一般采用如下方式根據(jù)產(chǎn)品的名稱、 類目或/和屬性進(jìn)行關(guān)鍵詞匹配,只是這種搜索方式只能適用于純產(chǎn)品類目詞或產(chǎn)品名稱和屬性等關(guān)鍵詞。當(dāng)用戶輸入的查詢?cè)~沒(méi)有包括產(chǎn)品具體名稱或者屬性等時(shí),就有可能在存在這類產(chǎn)品的情況下還是搜索不到結(jié)果。例如,對(duì)于“適合女士用的手機(jī)”的關(guān)鍵詞,由于數(shù)據(jù)庫(kù)中保存的數(shù)據(jù)一般是根據(jù)產(chǎn)品名稱、類目或?qū)傩缘汝P(guān)鍵詞建立的,并沒(méi)有保存僅僅具有描述性質(zhì)的關(guān)鍵詞的信息,因此就無(wú)法搜索到用戶需要的結(jié)果。舉例來(lái)講,“飛利浦 588”是一款普遍被認(rèn)為適合女士用的手機(jī),但是當(dāng)用戶直接在網(wǎng)上交易平臺(tái)中搜索“適合女士用的手機(jī)”是無(wú)法搜索到這款手機(jī)的。由以上對(duì)現(xiàn)有技術(shù)的分析可知,現(xiàn)有技術(shù)在實(shí)現(xiàn)網(wǎng)上交易平臺(tái)的檢索時(shí),由于不能完全和用戶的需求相匹配,所以如果出現(xiàn)搜索不到用戶感興趣的結(jié)果時(shí),就需要用戶變換查詢?cè)~繼續(xù)搜索,這樣就增加了用戶和服務(wù)器之間的交互次數(shù),在服務(wù)器端也會(huì)增加對(duì)于查詢?cè)~的匹配過(guò)程,就會(huì)增加服務(wù)器的工作量,進(jìn)一步影響網(wǎng)上交易平臺(tái)服務(wù)器的運(yùn)行速度和性能??傊壳靶枰绢I(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問(wèn)題就是如何能夠創(chuàng)新的提出一種基于網(wǎng)上交易平臺(tái)的檢索方法,以解決現(xiàn)有技術(shù)中無(wú)法搜索到用戶需求的結(jié)果, 導(dǎo)致影響網(wǎng)上交易平臺(tái)服務(wù)器運(yùn)行速度和性能的技術(shù)問(wèn)題。
發(fā)明內(nèi)容
本申請(qǐng)所要解決的技術(shù)問(wèn)題是提供一種基于網(wǎng)上交易平臺(tái)的檢索方法,用以解決現(xiàn)有技術(shù)中無(wú)法搜索到用戶需求的結(jié)果導(dǎo)致的影響網(wǎng)上交易平臺(tái)服務(wù)器運(yùn)行速度和性能的技術(shù)問(wèn)題。本申請(qǐng)還提供了一種基于網(wǎng)上交易平臺(tái)的檢索裝置和服務(wù)器,用以保證上述方法在實(shí)際中的實(shí)現(xiàn)及應(yīng)用。為了解決上述問(wèn)題,本申請(qǐng)公開(kāi)了一種網(wǎng)頁(yè)數(shù)據(jù)庫(kù)的建立方法,包括抓取網(wǎng)頁(yè);分析所述網(wǎng)頁(yè)的關(guān)鍵字,得到所述網(wǎng)頁(yè)上涉及到的產(chǎn)品關(guān)鍵詞;按照預(yù)置規(guī)則分析所述產(chǎn)品關(guān)鍵詞,以得到與所述網(wǎng)頁(yè)相關(guān)的至少一個(gè)產(chǎn)品標(biāo)識(shí);將所述網(wǎng)頁(yè)、至少一個(gè)產(chǎn)品標(biāo)識(shí),以及,網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián)保存至預(yù)置的數(shù)據(jù)庫(kù)。本申請(qǐng)公開(kāi)了一種基于網(wǎng)上交易平臺(tái)的檢索方法,包括依據(jù)瀏覽器當(dāng)前提交的查詢?cè)~,從預(yù)置的網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中查詢得到與該查詢?cè)~匹配的初始網(wǎng)頁(yè);所述預(yù)置的網(wǎng)頁(yè)數(shù)據(jù)庫(kù)用于保存網(wǎng)頁(yè)及其涉及到的至少一個(gè)產(chǎn)品標(biāo)識(shí),和,網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián);對(duì)所述初始網(wǎng)頁(yè)進(jìn)行相關(guān)性處理以得到滿足預(yù)置條件的相關(guān)網(wǎng)頁(yè);對(duì)所述相關(guān)網(wǎng)頁(yè)涉及到的產(chǎn)品標(biāo)識(shí)所對(duì)應(yīng)的至少一個(gè)產(chǎn)品進(jìn)行相關(guān)處理;將進(jìn)行過(guò)相關(guān)處理之后的至少一個(gè)產(chǎn)品按照相關(guān)性值向客戶端展示。本申請(qǐng)公開(kāi)了一種基于網(wǎng)上交易平臺(tái)的檢索裝置,包括查詢初始網(wǎng)頁(yè)模塊,用于依據(jù)查詢?cè)~,從預(yù)置的數(shù)據(jù)庫(kù)中查詢得到與該查詢?cè)~匹配的初始網(wǎng)頁(yè);所述預(yù)置的數(shù)據(jù)庫(kù)用于保存網(wǎng)頁(yè)及其涉及到的至少一個(gè)產(chǎn)品標(biāo)識(shí),和,網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián);獲取相關(guān)網(wǎng)頁(yè)模塊,用于對(duì)所述初始網(wǎng)頁(yè)進(jìn)行相關(guān)性處理以得到滿足預(yù)置條件的相關(guān)網(wǎng)頁(yè);產(chǎn)品相關(guān)處理模塊,用于對(duì)所述相關(guān)網(wǎng)頁(yè)涉及到的產(chǎn)品標(biāo)識(shí)所對(duì)應(yīng)的至少一個(gè)產(chǎn)品進(jìn)行相關(guān)處理;排序展示模塊,用于將進(jìn)行過(guò)相關(guān)處理之后的至少一個(gè)產(chǎn)品按照相關(guān)性值向客戶端展示。與現(xiàn)有技術(shù)相比,本申請(qǐng)包括以下優(yōu)點(diǎn)在本申請(qǐng)中,預(yù)先已經(jīng)將網(wǎng)頁(yè)上出現(xiàn)的產(chǎn)品信息和網(wǎng)頁(yè)做了關(guān)聯(lián),因此,依據(jù)用戶輸入的關(guān)鍵詞在網(wǎng)上交易平臺(tái)上做檢索的時(shí)候,就會(huì)考慮到產(chǎn)品的網(wǎng)頁(yè)信息,即是只要有論壇或者網(wǎng)頁(yè)討論過(guò)某個(gè)產(chǎn)品,就可以在檢索產(chǎn)品的時(shí)候依據(jù)這個(gè)產(chǎn)品和網(wǎng)頁(yè)之間的關(guān)聯(lián)檢索到相關(guān)產(chǎn)品。這避免了當(dāng)用戶輸入的查詢?cè)~沒(méi)有包括產(chǎn)品具體名稱或者屬性等時(shí),而產(chǎn)品的網(wǎng)頁(yè)信息中具備關(guān)鍵詞的相關(guān)信息,但卻出現(xiàn)搜索不到產(chǎn)品的情況的發(fā)生,提高了用戶的查詢效率。通過(guò)本申請(qǐng),用戶不需要重復(fù)搜索相關(guān)產(chǎn)品,這減少了用戶與搜索引擎服務(wù)器之間的交互次數(shù),降低了搜索引擎服務(wù)器的重復(fù)運(yùn)行次數(shù),從而提高搜索引擎服務(wù)器的運(yùn)行速度、工作效率和工作性能。當(dāng)然,實(shí)施本申請(qǐng)的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本申請(qǐng)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本申請(qǐng)實(shí)施例一中建立預(yù)置的數(shù)據(jù)庫(kù)的流程圖;圖2是本申請(qǐng)的一種基于網(wǎng)上交易平臺(tái)的檢索方法實(shí)施例一的流程圖;圖3是本申請(qǐng)的一種基于網(wǎng)上交易平臺(tái)的檢索方法實(shí)施例二的流程圖4是本申請(qǐng)方法實(shí)施例二中檢索結(jié)果的展示示意圖;圖5是本申請(qǐng)的一種基于網(wǎng)上交易平臺(tái)的檢索裝置實(shí)施例三的結(jié)構(gòu)框圖;圖6是本申請(qǐng)的一種基于網(wǎng)上交易平臺(tái)的檢索裝置實(shí)施例四的結(jié)構(gòu)框圖。
具體實(shí)施例方式下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。本申請(qǐng)可用于眾多通用或?qū)S玫挠?jì)算裝置環(huán)境或配置中。例如個(gè)人計(jì)算機(jī)、服務(wù)器、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器裝置、包括以上任何裝置或設(shè)備的分布式計(jì)算環(huán)境等等。本申請(qǐng)可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本申請(qǐng),在這些分布式計(jì)算環(huán)境中,由通過(guò)通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來(lái)執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。本申請(qǐng)的主要思想之一可以包括,在本申請(qǐng)實(shí)施例中,首先需要對(duì)于網(wǎng)絡(luò)爬蟲(chóng)抓取到的網(wǎng)頁(yè)進(jìn)行預(yù)處理,具體過(guò)程是針對(duì)抓取到的網(wǎng)頁(yè)識(shí)別出該網(wǎng)頁(yè)內(nèi)容出主要涉及到的某幾種具體的產(chǎn)品,并將這些產(chǎn)品的產(chǎn)品標(biāo)識(shí)與該網(wǎng)頁(yè)對(duì)應(yīng)關(guān)聯(lián)起來(lái),并將這種關(guān)聯(lián)關(guān)系以及關(guān)聯(lián)中涉及到的網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)都存儲(chǔ)在預(yù)先設(shè)置的一個(gè)網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中,以供后續(xù)從該網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中再調(diào)用關(guān)聯(lián)。上述預(yù)處理過(guò)程可以離線進(jìn)行,即只要爬蟲(chóng)抓取到了網(wǎng)頁(yè), 就可以進(jìn)行同樣的預(yù)處理過(guò)程,以建立網(wǎng)頁(yè)數(shù)據(jù)庫(kù)。搜索引擎服務(wù)器在接收到瀏覽器提交的查詢?cè)~時(shí),依據(jù)該查詢?cè)~可以從預(yù)置的數(shù)據(jù)庫(kù)中查詢得到與該查詢?cè)~匹配的初始網(wǎng)頁(yè), 并對(duì)得到的初始網(wǎng)頁(yè)進(jìn)行相關(guān)性處理,以得到滿足預(yù)置條件的相關(guān)網(wǎng)頁(yè),而對(duì)涉及到的產(chǎn)品標(biāo)識(shí)所對(duì)應(yīng)的至少一個(gè)產(chǎn)品所述相關(guān)網(wǎng)頁(yè),則繼續(xù)進(jìn)行相關(guān)處理;并將進(jìn)行過(guò)相關(guān)處理之后的至少一個(gè)產(chǎn)品按照相關(guān)性值進(jìn)行排序,最后將排序之后的多個(gè)產(chǎn)品向客戶端展示, 具體可以展示該產(chǎn)品的價(jià)格或者銷量等信息??梢?jiàn),采用本申請(qǐng)實(shí)施例進(jìn)行搜索,最終得到的產(chǎn)品不僅與用戶輸入的查詢?cè)~相關(guān),同時(shí)還和某個(gè)網(wǎng)頁(yè)上是否涉及到該產(chǎn)品相關(guān),這樣就可以避免當(dāng)用戶輸入描述性質(zhì)的關(guān)鍵詞時(shí)直接依據(jù)關(guān)鍵詞檢索得不到相關(guān)結(jié)果的現(xiàn)象。例如,對(duì)于查詢?cè)~“適合女士用的手機(jī)”來(lái)講,如果在某個(gè)論壇或者網(wǎng)頁(yè)上,出現(xiàn)了討論“適合女士用的手機(jī)”的內(nèi)容,而這個(gè)內(nèi)容中涉及到了很多適合女士用的手機(jī),包括“飛利浦588”,那么數(shù)據(jù)庫(kù)中就會(huì)保存這個(gè)網(wǎng)頁(yè)和“飛利浦588^t間關(guān)聯(lián),而后續(xù)搜索引擎服務(wù)器在檢索適合女士用的手機(jī)時(shí),就會(huì)出現(xiàn)銷售“飛利浦588”產(chǎn)品的相關(guān)網(wǎng)頁(yè),再把這些產(chǎn)品信息進(jìn)行展示的時(shí)候,就不需要用戶重復(fù)搜索相關(guān)產(chǎn)品,從而減少了用戶與搜索引擎服務(wù)器之間的交互次數(shù),降低了搜索引擎服務(wù)器的重復(fù)運(yùn)行次數(shù),提高了搜索引擎服務(wù)器的運(yùn)行速度、工作效率和工作性能。參考圖1,示出了本申請(qǐng)一種網(wǎng)頁(yè)數(shù)據(jù)庫(kù)的建立方法實(shí)施例的流程圖,可以包括以下步驟
步驟101 抓取網(wǎng)頁(yè)。這里的網(wǎng)頁(yè)是爬蟲(chóng)服務(wù)器抓取到的網(wǎng)頁(yè),爬蟲(chóng)服務(wù)器無(wú)需觸發(fā)條件,一旦啟動(dòng)之后便會(huì)不停地抓取網(wǎng)頁(yè)。步驟102 分析所述網(wǎng)頁(yè)的關(guān)鍵字,以得到所述網(wǎng)頁(yè)上涉及到的產(chǎn)品關(guān)鍵詞。當(dāng)爬蟲(chóng)從互聯(lián)網(wǎng)上抓取到網(wǎng)頁(yè)時(shí),對(duì)抓取到的網(wǎng)頁(yè)進(jìn)行分析,即是針對(duì)網(wǎng)頁(yè)中的內(nèi)容進(jìn)行提煉,去發(fā)現(xiàn)該網(wǎng)頁(yè)內(nèi)容中出現(xiàn)的產(chǎn)品關(guān)鍵詞,例如,在某個(gè)論壇上出現(xiàn)了討論 “適合女士用的手機(jī)”的帖子,則本步驟會(huì)將用戶討論結(jié)果中出現(xiàn)的適合女士用的手機(jī)都獲取到。所述步驟102在實(shí)際應(yīng)用中,具體可以采用如下方式實(shí)現(xiàn)步驟Al 提取所述網(wǎng)頁(yè)上的文本內(nèi)容。在爬蟲(chóng)服務(wù)器抓取到的網(wǎng)頁(yè)中,不一定只有文本信息,有時(shí)也會(huì)有圖片或者廣告視頻等其他信息,因此,本步驟需要首先提取出網(wǎng)頁(yè)的文本內(nèi)容。例如,論壇里關(guān)于某個(gè)產(chǎn)品的討論信息等。步驟A2 對(duì)所述文本內(nèi)容進(jìn)行分析,得到所述網(wǎng)頁(yè)的相關(guān)關(guān)鍵詞。在本步驟可以采用分詞器對(duì)所述文本內(nèi)容進(jìn)行分詞,實(shí)施分詞器所得到的各個(gè)關(guān)鍵詞,即為所述網(wǎng)頁(yè)的相關(guān)關(guān)鍵詞。當(dāng)然,本步驟也可以采用其他的一些工具對(duì)網(wǎng)頁(yè)的文本內(nèi)容進(jìn)行分詞處理,分詞的方式并不影響本申請(qǐng)的實(shí)現(xiàn)。步驟A3 從所述相關(guān)關(guān)鍵詞中獲取到與產(chǎn)品相關(guān)的產(chǎn)品關(guān)鍵詞。在本步驟中即是對(duì)從所述文本內(nèi)容中得到的所有相關(guān)關(guān)鍵詞進(jìn)行分析,以找到和產(chǎn)品相關(guān)的產(chǎn)品關(guān)鍵詞。例如。假設(shè)步驟A2中得到的相關(guān)關(guān)鍵詞有“的”、“因此”、“諾基亞 5530”、“聯(lián)想”等,則本步驟可以獲取到“諾基亞5530”和“聯(lián)想”作為產(chǎn)品關(guān)鍵詞。步驟103 按照預(yù)置規(guī)則分析所述產(chǎn)品關(guān)鍵詞,以得到與所述網(wǎng)頁(yè)相關(guān)的至少一個(gè)產(chǎn)品標(biāo)識(shí)。所述步驟103在實(shí)際應(yīng)用中,具體可以采用如下方式得到與所述網(wǎng)頁(yè)相關(guān)的至少一個(gè)產(chǎn)品標(biāo)識(shí)步驟Bl 檢測(cè)所述產(chǎn)品關(guān)鍵詞中出現(xiàn)概率高于一定閾值的候選關(guān)鍵詞。在本步驟中,因?yàn)橐粋€(gè)網(wǎng)頁(yè)中可能出現(xiàn)的產(chǎn)品關(guān)鍵詞有很多個(gè),例如同時(shí)出現(xiàn)了 “諾基亞5530”、“聯(lián)想”和“三星”等產(chǎn)品關(guān)鍵詞,出現(xiàn)的概率分別為10次,5次和1次。而預(yù)先設(shè)定的閾值為2,則本步驟中則會(huì)篩選出候選關(guān)鍵詞為“諾基亞5530”和“聯(lián)想”。步驟B2 判斷所述候選關(guān)鍵詞與所述網(wǎng)頁(yè)的文本內(nèi)容是否相關(guān)。在本步驟中,假設(shè)當(dāng)前網(wǎng)頁(yè)為一個(gè)討論手機(jī)性能的帖子,而“諾基亞5530”和“聯(lián)想”這兩個(gè)候選關(guān)鍵詞都和手機(jī)有關(guān),則在步驟Bl中得到的候選關(guān)鍵詞均與網(wǎng)頁(yè)相關(guān)的產(chǎn)品標(biāo)識(shí)。但是,如果出現(xiàn)了 “寶潔”的候選關(guān)鍵詞,很顯然與手機(jī)性能無(wú)關(guān),則并不會(huì)將“寶潔”作為與當(dāng)前網(wǎng)頁(yè)相關(guān)的一個(gè)產(chǎn)品標(biāo)識(shí)。步驟104 將所述網(wǎng)頁(yè)、至少一個(gè)產(chǎn)品標(biāo)識(shí)、以及網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián)保存至預(yù)置的數(shù)據(jù)庫(kù)。當(dāng)根據(jù)查詢?cè)~在該數(shù)據(jù)庫(kù)中檢索時(shí),根據(jù)檢索到的與查詢?cè)~匹配的網(wǎng)頁(yè)時(shí),根據(jù)匹配的網(wǎng)頁(yè)與產(chǎn)品標(biāo)識(shí)的關(guān)系,輸出該產(chǎn)品標(biāo)識(shí)。在本步驟中,依據(jù)獲取到的產(chǎn)品可以將對(duì)應(yīng)的產(chǎn)品標(biāo)識(shí)與其出現(xiàn)的網(wǎng)頁(yè)進(jìn)行關(guān)聯(lián)。這里的關(guān)聯(lián)可以理解為,該網(wǎng)頁(yè)和對(duì)應(yīng)的產(chǎn)品標(biāo)識(shí)之間遵循某種聯(lián)系,當(dāng)獲取到網(wǎng)頁(yè)時(shí)即可對(duì)應(yīng)獲取到產(chǎn)品標(biāo)識(shí)。當(dāng)一個(gè)網(wǎng)頁(yè)上出現(xiàn)多個(gè)產(chǎn)品時(shí),還可以依據(jù)產(chǎn)品出現(xiàn)的次數(shù),以及在網(wǎng)頁(yè)出現(xiàn)的位置信息等,設(shè)置各個(gè)產(chǎn)品與網(wǎng)頁(yè)進(jìn)行關(guān)聯(lián)時(shí)的權(quán)重。例如,當(dāng)某個(gè)產(chǎn)品在網(wǎng)頁(yè)上出現(xiàn)的次數(shù)最多,或者出現(xiàn)在網(wǎng)頁(yè)所在模板中比較重要的板塊上,就可以將該產(chǎn)品的產(chǎn)品標(biāo)識(shí)與該網(wǎng)頁(yè)的關(guān)聯(lián)設(shè)置較高的權(quán)重。因此,一個(gè)網(wǎng)頁(yè)可以關(guān)聯(lián)多個(gè)產(chǎn)品,且這多個(gè)產(chǎn)品之間按照權(quán)重關(guān)系可以進(jìn)行排序。當(dāng)對(duì)網(wǎng)頁(yè)和產(chǎn)品做好關(guān)聯(lián)之后,即可將網(wǎng)頁(yè)和至少一個(gè)的產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián)保存至數(shù)據(jù)庫(kù)中,并且在保存時(shí),將該網(wǎng)頁(yè)的相關(guān)內(nèi)容以及產(chǎn)品信息也一并保存至數(shù)據(jù)庫(kù)中, 以便于后續(xù)再調(diào)用時(shí)可以獲取到網(wǎng)頁(yè)內(nèi)容和產(chǎn)品信息,例如,價(jià)格、銷售量等。參考圖2,示出了本申請(qǐng)一種基于網(wǎng)上交易平臺(tái)的檢索方法實(shí)施例一的流程圖,可以包括以下步驟步驟201 依據(jù)瀏覽器當(dāng)前提交的查詢?cè)~,從預(yù)置的網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中查詢得到與該查詢?cè)~匹配的初始網(wǎng)頁(yè);所述預(yù)置的網(wǎng)頁(yè)數(shù)據(jù)庫(kù)用于保存網(wǎng)頁(yè)及其涉及到的至少一個(gè)產(chǎn)品標(biāo)識(shí),和,網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián)。在本實(shí)施例中,用戶在網(wǎng)上交易平臺(tái)提供的輸入框輸入查詢?cè)~之后,由瀏覽器提交至后臺(tái)搜索引擎系統(tǒng),搜索引擎系統(tǒng)從預(yù)置的數(shù)據(jù)庫(kù)中查詢得到與該查詢?cè)~匹配的初始網(wǎng)頁(yè)。這里關(guān)鍵詞和網(wǎng)頁(yè)之間的映射關(guān)系可以采用現(xiàn)有技術(shù)實(shí)現(xiàn),即是采用現(xiàn)有技術(shù)中對(duì)網(wǎng)頁(yè)和關(guān)鍵詞之間的匹配來(lái)實(shí)現(xiàn)本步驟依據(jù)查詢?cè)~對(duì)初始網(wǎng)頁(yè)的檢索。這里預(yù)置的數(shù)據(jù)庫(kù)中保存的網(wǎng)頁(yè),以及該網(wǎng)頁(yè)涉及到的至少一個(gè)產(chǎn)品標(biāo)識(shí),則是解決本申請(qǐng)所要解決的技術(shù)問(wèn)題的一個(gè)關(guān)鍵。這里的產(chǎn)品標(biāo)識(shí)(pid)是與該產(chǎn)品一一對(duì)應(yīng)的唯一數(shù)字ID。步驟202 對(duì)所述初始網(wǎng)頁(yè)進(jìn)行相關(guān)性處理以得到滿足預(yù)置條件的相關(guān)網(wǎng)頁(yè)。在本步驟中,需要對(duì)從預(yù)置的數(shù)據(jù)庫(kù)中獲取到的初始網(wǎng)頁(yè)進(jìn)行相關(guān)性處理,這里為了找出更滿足用戶需求的相關(guān)網(wǎng)頁(yè),可以采用執(zhí)行兩次相關(guān)性打分的處理過(guò)程。例如,可以首先采用BM25算法對(duì)初始網(wǎng)頁(yè)進(jìn)行第一次相關(guān)性打分,并按照分值從大到小對(duì)所述初始網(wǎng)頁(yè)進(jìn)行排序。所述第一次相關(guān)性打分的目的是減少在第二次相關(guān)性打分時(shí)的系統(tǒng)運(yùn)算量,為進(jìn)行第二次相關(guān)性打分選取數(shù)目較少且與查詢?cè)~更為相關(guān)的網(wǎng)頁(yè)。在進(jìn)行第二次相關(guān)性打分之前,為了在第二次相關(guān)性打分的時(shí)候減少計(jì)算量,可以對(duì)排序后的初始網(wǎng)頁(yè)取前若干個(gè)初始網(wǎng)頁(yè)執(zhí)行第二次相關(guān)性打分。這里取多少個(gè)初始網(wǎng)頁(yè)可以依據(jù)實(shí)際需求有所不同,例如,1000個(gè)或者800個(gè)等。取了前若干個(gè)初始網(wǎng)頁(yè)之后, 再對(duì)這若干個(gè)第一層相關(guān)性得分較高的初始網(wǎng)頁(yè)進(jìn)行第二次相關(guān)性打分處理,將采用邏輯更為復(fù)雜精細(xì)的方式進(jìn)行以得到相關(guān)網(wǎng)頁(yè)。其中一些具體的打分規(guī)則可以為當(dāng)某些關(guān)鍵詞不斷重復(fù)連續(xù)出現(xiàn)時(shí),則認(rèn)為該關(guān)鍵詞為無(wú)用信息,并將該關(guān)鍵詞所處的網(wǎng)頁(yè)得分減去一個(gè)預(yù)置的數(shù)值;或者,同時(shí)進(jìn)行關(guān)鍵詞所處的類目與網(wǎng)頁(yè)中關(guān)聯(lián)的產(chǎn)品標(biāo)識(shí)所處的類目之間的匹配程度過(guò)濾,可以包括如果關(guān)鍵詞中提及的品牌與網(wǎng)頁(yè)中關(guān)聯(lián)的產(chǎn)品標(biāo)識(shí)的品牌不相符時(shí),將該關(guān)鍵詞所處的網(wǎng)頁(yè)得分減去一個(gè)預(yù)置的數(shù)值;如果關(guān)鍵詞中提及的型號(hào)與網(wǎng)頁(yè)中關(guān)聯(lián)的產(chǎn)品標(biāo)識(shí)的型號(hào)不相符,同樣將該關(guān)鍵詞所處的網(wǎng)頁(yè)得分減去一個(gè)預(yù)置的數(shù)值。步驟203 對(duì)所述相關(guān)網(wǎng)頁(yè)涉及到的產(chǎn)品標(biāo)識(shí)所對(duì)應(yīng)的至少一個(gè)產(chǎn)品進(jìn)行相關(guān)處理。所述相關(guān)網(wǎng)頁(yè)可能有很多個(gè),那么對(duì)于每個(gè)相關(guān)網(wǎng)頁(yè)所涉及到的產(chǎn)品標(biāo)識(shí)也需要進(jìn)行打分。具體地,因?yàn)椴煌南嚓P(guān)網(wǎng)頁(yè)所涉及到的產(chǎn)品有可能相同,那么在執(zhí)行本步驟時(shí),可以首先將那些權(quán)重最大的產(chǎn)品標(biāo)識(shí)都相同的網(wǎng)頁(yè)聚合到一起,即是比較各個(gè)相關(guān)網(wǎng)頁(yè)中權(quán)重最重的產(chǎn)品標(biāo)識(shí),相同產(chǎn)品標(biāo)識(shí)的相關(guān)網(wǎng)頁(yè)則聚合到一個(gè)組中,而該組即是該相同產(chǎn)品標(biāo)識(shí)的網(wǎng)頁(yè)組,該組中包括多個(gè)相同產(chǎn)品標(biāo)識(shí)的不同相關(guān)網(wǎng)頁(yè)。得到不同的網(wǎng)頁(yè)組之后,則可對(duì)各個(gè)產(chǎn)品標(biāo)識(shí)組中的相關(guān)網(wǎng)頁(yè)打分,而打分過(guò)程中可以依據(jù)聚合到該產(chǎn)品標(biāo)識(shí)下的網(wǎng)頁(yè)數(shù)量,各個(gè)網(wǎng)頁(yè)的第二次相關(guān)性得分,以及,該產(chǎn)品標(biāo)識(shí)的某些屬性,例如價(jià)格,上市時(shí)間等,該產(chǎn)品與查詢?cè)~之間的相關(guān)性得分等因素,為產(chǎn)品標(biāo)識(shí)打分的。具體實(shí)現(xiàn)的過(guò)程可以例如,在執(zhí)行本步驟的內(nèi)容時(shí),將得到的第二次相關(guān)性得分直接相加,并從結(jié)果中選擇出若干個(gè)相關(guān)性得分高的產(chǎn)品,再按照這些產(chǎn)品的價(jià)格對(duì)網(wǎng)頁(yè)進(jìn)行排序,按照順序給涉及到的產(chǎn)品標(biāo)識(shí)進(jìn)行打分。需要說(shuō)明的是,在本步驟中,因?yàn)橐粋€(gè)網(wǎng)頁(yè)組聚合了多個(gè)網(wǎng)頁(yè),則該網(wǎng)頁(yè)組中各個(gè)網(wǎng)頁(yè)的產(chǎn)品標(biāo)識(shí)分值是相同的,這些產(chǎn)品標(biāo)識(shí)分值可以作為該各個(gè)相關(guān)網(wǎng)頁(yè)的屬性,存儲(chǔ)到各個(gè)相關(guān)網(wǎng)頁(yè)中。步驟204 將進(jìn)行過(guò)相關(guān)處理之后的至少一個(gè)產(chǎn)品按照相關(guān)性值向客戶端展示。對(duì)產(chǎn)品標(biāo)識(shí)打分之后,按照產(chǎn)品標(biāo)識(shí)得分的大小可以對(duì)各個(gè)網(wǎng)頁(yè)涉及到的產(chǎn)品從大到小進(jìn)行排序,可以取前若干個(gè)產(chǎn)品向客戶端展示其信息。這樣的話,展示的產(chǎn)品信息就和網(wǎng)頁(yè)上是否涉及到了該產(chǎn)品的相關(guān)信息有關(guān),因此,就避免了有的網(wǎng)店賣家采用購(gòu)買廣告的方式將某個(gè)關(guān)鍵詞和自己的產(chǎn)品相關(guān)聯(lián),也避免了因?yàn)橛脩糨斎氲氖敲枋鲂再|(zhì)的查詢?cè)~導(dǎo)致查詢不到相關(guān)結(jié)果的情況。因此,采用本申請(qǐng)實(shí)施例,在展示產(chǎn)品的過(guò)程中考慮了產(chǎn)品的網(wǎng)頁(yè)信息,當(dāng)用戶輸入的查詢?cè)~沒(méi)有包括產(chǎn)品具體名稱或者屬性等時(shí),而產(chǎn)品的網(wǎng)頁(yè)信息中具備關(guān)鍵詞的相關(guān)信息,但卻出現(xiàn)搜索不到產(chǎn)品的情況,提高了用戶的查詢效率。本實(shí)施例不需要用戶重復(fù)搜索相關(guān)產(chǎn)品,減少了用戶與搜索引擎服務(wù)器之間的交互次數(shù),降低了搜索引擎服務(wù)器的重復(fù)運(yùn)行次數(shù),從而提高搜索引擎服務(wù)器的運(yùn)行速度、工作效率和工作性能。參考圖3,示出了本申請(qǐng)一種基于網(wǎng)上交易平臺(tái)的檢索方法實(shí)施例二的流程圖,可以包括以下步驟步驟301 依據(jù)瀏覽器當(dāng)前提交的查詢?cè)~,從預(yù)置的數(shù)據(jù)庫(kù)中查詢得到與該查詢?cè)~匹配的初始網(wǎng)頁(yè);所述預(yù)置的數(shù)據(jù)庫(kù)用于保存網(wǎng)頁(yè),以及該網(wǎng)頁(yè)涉及到的至少一個(gè)產(chǎn)品標(biāo)識(shí),和,網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián)。在本實(shí)施例中,針對(duì)瀏覽器提交的查詢?cè)~在提取關(guān)鍵詞時(shí),可以利用現(xiàn)有的工具, 例如分詞器、詞性標(biāo)注工具等,這樣還可以降低本實(shí)施例的實(shí)施成本。本步驟在前述實(shí)施例已經(jīng)詳細(xì)介紹,在此不再贅述。在建立該預(yù)置的數(shù)據(jù)庫(kù)的過(guò)程中,很多討論“適合女士用的手機(jī)”的網(wǎng)頁(yè),并且該頁(yè)面與具體的某一個(gè)產(chǎn)品標(biāo)識(shí)(例如 “飛利浦588”)建立了對(duì)應(yīng)的關(guān)聯(lián)關(guān)系,則該出現(xiàn)“適合女士用的手機(jī)”的網(wǎng)頁(yè),以及網(wǎng)頁(yè)和具體產(chǎn)品,例如“飛利浦588”之間的關(guān)聯(lián)都保存至了該數(shù)據(jù)庫(kù)中。那么在接收到瀏覽器提交的查詢?cè)~時(shí),對(duì)于“適合女士用的手機(jī)”查詢?cè)~就會(huì)檢索到討論該關(guān)鍵詞的諸多網(wǎng)頁(yè)。步驟302 采用預(yù)定算法對(duì)所述初始網(wǎng)頁(yè)進(jìn)行第一次相關(guān)性打分,所述第一次相關(guān)性打分的分值與初始網(wǎng)頁(yè)中特定的產(chǎn)品關(guān)鍵詞的第一參數(shù)成正比,與第二參數(shù)成反比; 所述第一參數(shù)為在當(dāng)前的一個(gè)初始網(wǎng)頁(yè)中出現(xiàn)的概率,所述第二參數(shù)為在網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的所有網(wǎng)頁(yè)中出現(xiàn)的概率。在本步驟中,現(xiàn)有技術(shù)中有很多種相關(guān)性算法可以執(zhí)行,例如BM25,本步驟即是采用現(xiàn)有技術(shù)中任一種相關(guān)性算法對(duì)所有的初始網(wǎng)頁(yè)進(jìn)行相關(guān)性打分,這樣每個(gè)初始網(wǎng)頁(yè)就對(duì)應(yīng)一個(gè)相關(guān)性分值,再按照相關(guān)性分值從大到小的順序給所述初始網(wǎng)頁(yè)進(jìn)行排序。以BM25為例,對(duì)網(wǎng)頁(yè)進(jìn)行BM25算法處理之后,每一個(gè)網(wǎng)頁(yè)所得到的分值與兩個(gè)參數(shù)有關(guān),第一參數(shù)是在一個(gè)網(wǎng)頁(yè)中特定的產(chǎn)品關(guān)鍵詞出現(xiàn)的概率大小,第二參數(shù)是在網(wǎng)頁(yè)數(shù)據(jù)庫(kù)的所有網(wǎng)頁(yè)中出現(xiàn)的概率大小,且第一參數(shù)的概率越大則對(duì)應(yīng)網(wǎng)頁(yè)的第一次相關(guān)性分值就越高,并且第二參數(shù)的概率越小對(duì)應(yīng)網(wǎng)頁(yè)的第一次相關(guān)性分值就越高。舉例來(lái)講,對(duì)于關(guān)鍵詞“的”,因?yàn)槭钦Z(yǔ)氣助詞,所以在一個(gè)網(wǎng)頁(yè)中出現(xiàn)的概率會(huì)非常高,但是因?yàn)槠湓谒芯W(wǎng)頁(yè)中出現(xiàn)的概率也大,也即其出現(xiàn)的概率較大的網(wǎng)頁(yè)個(gè)數(shù)較多,所以其第一次相關(guān)性分值就相對(duì)較低。在本申請(qǐng)實(shí)施例中,第一次相關(guān)性分值的大小分別與第一參數(shù)和第二參數(shù)所成比例的具體比值,可以依據(jù)實(shí)際應(yīng)用的需求有所改變。步驟303 對(duì)進(jìn)行第一次相關(guān)打分之后的初始網(wǎng)頁(yè)按照預(yù)設(shè)閾值獲取分值較高的前若干個(gè)網(wǎng)頁(yè),并依據(jù)產(chǎn)品關(guān)鍵詞在網(wǎng)頁(yè)中出現(xiàn)的概率、所述查詢?cè)~的相鄰關(guān)鍵字在網(wǎng)頁(yè)中同時(shí)出現(xiàn)的距離和所述查詢?cè)~中的相鄰關(guān)鍵字在網(wǎng)頁(yè)中預(yù)設(shè)大小的窗口內(nèi)是否同時(shí)出現(xiàn),對(duì)所述前若干個(gè)網(wǎng)頁(yè)進(jìn)行第二次相關(guān)性打分,以得到相關(guān)網(wǎng)頁(yè)。在本步驟中,對(duì)于排序之后的初始網(wǎng)頁(yè),可以按照預(yù)設(shè)的一個(gè)閾值獲取前若干個(gè)網(wǎng)頁(yè)。例如,只獲取前1000個(gè)初始網(wǎng)頁(yè),這1000個(gè)初始網(wǎng)頁(yè)的相關(guān)性分值高于剩余的初始網(wǎng)頁(yè)。此處需要對(duì)截取得到的前若干個(gè)網(wǎng)頁(yè)進(jìn)行第二次相關(guān)性打分,以得到1000個(gè)初始網(wǎng)頁(yè)的第二次相關(guān)性分值。在本步驟中,假設(shè)查詢?cè)~為“國(guó)慶假期去哪里玩”,則所述查詢?cè)~的相鄰關(guān)鍵詞可以為“國(guó)慶”和“假期”,那么當(dāng)“國(guó)慶”和“假期”在一個(gè)網(wǎng)頁(yè)中以“國(guó)慶假期”的方式出現(xiàn)時(shí), 就認(rèn)為該查詢?cè)~的相鄰關(guān)鍵字在網(wǎng)頁(yè)中同時(shí)出現(xiàn)的距離最近,那么該網(wǎng)頁(yè)的第二次相關(guān)性打分的分值就會(huì)較高。并且,假設(shè)“國(guó)慶”和“假期”同時(shí)出現(xiàn)了,但是是以“國(guó)慶的假期”這樣的方式出現(xiàn),假設(shè)該網(wǎng)頁(yè)中預(yù)設(shè)大小的窗口為20,只要“國(guó)慶的假期”的大小不大于20, 就認(rèn)為該查詢?cè)~中相鄰的關(guān)鍵詞在網(wǎng)頁(yè)中預(yù)設(shè)大小的窗口內(nèi)同時(shí)出現(xiàn),相應(yīng)的該網(wǎng)頁(yè)的第二次相關(guān)性打分的分值也會(huì)較高。需要說(shuō)明的是,在實(shí)際應(yīng)用中有很多種情況,因此,除了這三個(gè)參數(shù)之外,本領(lǐng)域技術(shù)人員可以根據(jù)需求的不同增加其他參數(shù)的設(shè)定,均不影響本申請(qǐng)的實(shí)現(xiàn)。步驟304 對(duì)所述相關(guān)網(wǎng)頁(yè)中產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)進(jìn)行分組,得到多組產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)組。針對(duì)獲取得到的最終的1000個(gè)初始網(wǎng)頁(yè),可以比較各個(gè)初始網(wǎng)頁(yè)關(guān)聯(lián)的產(chǎn)品標(biāo)識(shí)是否相同,對(duì)于只與一個(gè)產(chǎn)品標(biāo)識(shí)關(guān)聯(lián)的初始網(wǎng)頁(yè)只需比較這一個(gè)產(chǎn)品標(biāo)識(shí),而與多個(gè)產(chǎn)品標(biāo)識(shí)關(guān)聯(lián)的初始網(wǎng)頁(yè)則可以依據(jù)產(chǎn)品標(biāo)識(shí)的出現(xiàn)次數(shù)或者出現(xiàn)的位置信息來(lái)選擇權(quán)重最大的一個(gè)產(chǎn)品標(biāo)識(shí)參與比較。最終需要將產(chǎn)品標(biāo)識(shí)都相同的網(wǎng)頁(yè)聚合到一個(gè)網(wǎng)頁(yè)組中,以產(chǎn)生多組產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)組。步驟305 對(duì)各網(wǎng)頁(yè)組中產(chǎn)品標(biāo)識(shí)對(duì)應(yīng)的產(chǎn)品依據(jù)該網(wǎng)頁(yè)組中網(wǎng)頁(yè)數(shù)量、各個(gè)網(wǎng)頁(yè)的相關(guān)性得分以及產(chǎn)品屬性進(jìn)行相關(guān)性打分。在本步驟中,需要針對(duì)每個(gè)產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)組中所涉及到的產(chǎn)品進(jìn)行相關(guān)性打分。此處進(jìn)行相關(guān)性處理時(shí)依據(jù)該網(wǎng)頁(yè)組中的網(wǎng)頁(yè)數(shù)量、各個(gè)網(wǎng)頁(yè)的第二次相關(guān)性分值, 以及產(chǎn)品本身的屬性,例如,價(jià)格信息、銷量信息等,同時(shí)還可以依據(jù)該產(chǎn)品與用戶輸入的查詢?cè)~之間的相關(guān)性分值,來(lái)對(duì)各網(wǎng)頁(yè)組中涉及到的產(chǎn)品進(jìn)行打分。需要說(shuō)明的是,在實(shí)際應(yīng)用場(chǎng)景中,因?yàn)橛脩粜枨蠡蛘呔W(wǎng)絡(luò)運(yùn)行情況等可能有所不同,那么此處各個(gè)依據(jù)在進(jìn)行相關(guān)性打分的過(guò)程中所占的比重也可以不完全相同。前述步驟即是通過(guò)獲取這個(gè)網(wǎng)頁(yè)上關(guān)聯(lián)的產(chǎn)品,將所有“適合女士用的手機(jī)”檢索出來(lái)。步驟306 將所述打分結(jié)果作為各個(gè)網(wǎng)頁(yè)組中的網(wǎng)頁(yè)屬性進(jìn)行存儲(chǔ)。在本步驟中,可以將步驟305中對(duì)各個(gè)產(chǎn)品進(jìn)行相關(guān)性打分的分值作為各個(gè)網(wǎng)頁(yè)組中的網(wǎng)頁(yè)屬性進(jìn)行存儲(chǔ)。當(dāng)然,在實(shí)際應(yīng)用中,也可以不進(jìn)行存儲(chǔ),是否在網(wǎng)頁(yè)中存儲(chǔ)其涉及到的產(chǎn)品的相關(guān)性分值并不影響本申請(qǐng)實(shí)施例的實(shí)現(xiàn),本步驟并不是實(shí)現(xiàn)本申請(qǐng)實(shí)施例的必要過(guò)程。步驟307 按照所述各個(gè)產(chǎn)品的打分結(jié)果對(duì)各個(gè)網(wǎng)頁(yè)重新排序,得到重新排序之后的網(wǎng)頁(yè)。在步驟305對(duì)各個(gè)產(chǎn)品進(jìn)行相關(guān)性打分之后,依據(jù)這個(gè)打分結(jié)果從大到小地在各個(gè)網(wǎng)頁(yè)組內(nèi)對(duì)各個(gè)網(wǎng)頁(yè)重新排序。步驟308 在產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)組中截取排序之后的前預(yù)設(shè)個(gè)數(shù)的網(wǎng)頁(yè)作為該產(chǎn)品的檢索結(jié)果。針對(duì)產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)組,可以截取排序之后前預(yù)定個(gè)數(shù)的網(wǎng)頁(yè)作為該產(chǎn)品的檢索結(jié)果,如果用戶檢索了相關(guān)的關(guān)鍵詞,后續(xù)可以通過(guò)關(guān)鍵詞檢索到相關(guān)網(wǎng)頁(yè),再由相關(guān)網(wǎng)頁(yè)和產(chǎn)品之間的關(guān)聯(lián)檢索到對(duì)應(yīng)的產(chǎn)品。步驟309 將檢索結(jié)果在瀏覽器上向用戶端展示。在本步驟中則將檢索到的對(duì)應(yīng)產(chǎn)品信息在客戶端上進(jìn)行展示。在具體應(yīng)用時(shí),例如當(dāng)關(guān)鍵詞為“適合女士用的手機(jī)”時(shí),檢索結(jié)果的產(chǎn)品展現(xiàn)形式可以參考圖4所示。對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請(qǐng)并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本申請(qǐng),某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書(shū)中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本申請(qǐng)所必須的。與上述本申請(qǐng)一種基于網(wǎng)上交易平臺(tái)的檢索方法實(shí)施例一所提供的方法相對(duì)應(yīng), 參見(jiàn)圖5,本申請(qǐng)還提供了一種基于網(wǎng)上交易平臺(tái)的檢索裝置實(shí)施例三,在本實(shí)施例中,該裝置可以包括查詢初始網(wǎng)頁(yè)模塊501,用于依據(jù)瀏覽器當(dāng)前提交的查詢?cè)~,從預(yù)置的數(shù)據(jù)庫(kù)中查詢得到與該查詢?cè)~匹配的初始網(wǎng)頁(yè);所述預(yù)置的數(shù)據(jù)庫(kù)用于保存網(wǎng)頁(yè)及其涉及到的至少一個(gè)產(chǎn)品標(biāo)識(shí),和,網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián)。獲取相關(guān)網(wǎng)頁(yè)模塊502,用于對(duì)所述初始網(wǎng)頁(yè)進(jìn)行相關(guān)性處理以得到滿足預(yù)置條件的相關(guān)網(wǎng)頁(yè)。產(chǎn)品相關(guān)處理模塊503,用于對(duì)所述相關(guān)網(wǎng)頁(yè)涉及到的產(chǎn)品標(biāo)識(shí)所對(duì)應(yīng)的至少一個(gè)產(chǎn)品進(jìn)行相關(guān)處理。展示模塊504,用于將進(jìn)行過(guò)相關(guān)處理之后的至少一個(gè)產(chǎn)品按照相關(guān)性值向客戶端展示。本實(shí)施例所述的裝置可以集成到基于網(wǎng)上交易平臺(tái)的搜索引擎服務(wù)器上,也可以單獨(dú)作為一個(gè)實(shí)體與搜索引擎服務(wù)器相連,另外,需要說(shuō)明的是,當(dāng)本申請(qǐng)所述的方法采用軟件實(shí)現(xiàn)時(shí),可以作為搜索引擎的服務(wù)器新增的一個(gè)功能,也可以單獨(dú)編寫相應(yīng)的程序,本申請(qǐng)不限定所述方法或裝置的實(shí)現(xiàn)方式。本實(shí)施例中,可以在依據(jù)用戶輸入的查詢?cè)~檢索產(chǎn)品的時(shí)候,考慮到網(wǎng)頁(yè)上曾經(jīng)出現(xiàn)該產(chǎn)品的情況,例如,在百度知道上有專門討論關(guān)于該查詢?cè)~相關(guān)的產(chǎn)品等,就可以在檢索產(chǎn)品的時(shí)候依據(jù)這個(gè)產(chǎn)品和網(wǎng)頁(yè)之間的關(guān)聯(lián)檢索到相關(guān)產(chǎn)品。這樣就會(huì)使得用戶即便只是輸入一些描述性質(zhì)的查詢?cè)~,也能檢索到滿足其描述的產(chǎn)品,提高了用戶的查詢效率。 因此采用本申請(qǐng)實(shí)施例檢索產(chǎn)品一般情況下都能檢索到用戶所需求的產(chǎn)品,也不需要用戶重復(fù)搜索相關(guān)產(chǎn)品,從而減少了用戶與搜索引擎服務(wù)器之間的交互次數(shù),降低了搜索引擎服務(wù)器的重復(fù)運(yùn)行次數(shù),從而提高搜索引擎服務(wù)器的運(yùn)行速度、工作效率和工作性能。與上述本申請(qǐng)一種基于網(wǎng)上交易平臺(tái)的檢索方法實(shí)施例二所提供的方法相對(duì)應(yīng), 參見(jiàn)圖6,本申請(qǐng)還提供了一種基于網(wǎng)上交易平臺(tái)的檢索裝置的優(yōu)選實(shí)施例四,在本實(shí)施例中,該裝置具體可以包括查詢初始網(wǎng)頁(yè)模塊501,用于依據(jù)瀏覽器當(dāng)前提交的查詢?cè)~,從預(yù)置的數(shù)據(jù)庫(kù)中查詢得到與該查詢?cè)~匹配的初始網(wǎng)頁(yè);所述預(yù)置的數(shù)據(jù)庫(kù)用于保存網(wǎng)頁(yè)及其涉及到的至少一個(gè)產(chǎn)品標(biāo)識(shí),和,網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián)。第一相關(guān)性處理子模塊601,用于采用預(yù)定算法對(duì)所述初始網(wǎng)頁(yè)進(jìn)行第一次相關(guān)性打分,所述第一次相關(guān)性打分的分值與初始網(wǎng)中特定的產(chǎn)品關(guān)鍵詞的第一參數(shù)成正比, 與第二參數(shù)成反比,所述第一參數(shù)為在當(dāng)前的一個(gè)初始網(wǎng)頁(yè)中出現(xiàn)的概率,所述第二參數(shù)為在網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的所有網(wǎng)頁(yè)中出現(xiàn)的概率。第二相關(guān)性處理子模塊602,用于對(duì)進(jìn)行第一次相關(guān)打分之后的初始網(wǎng)頁(yè)按照預(yù)設(shè)閾值獲取分值較高的前若干個(gè)網(wǎng)頁(yè),并依據(jù)產(chǎn)品關(guān)鍵詞在網(wǎng)頁(yè)中出現(xiàn)的概率、所述查詢?cè)~的相鄰關(guān)鍵字在網(wǎng)頁(yè)中同時(shí)出現(xiàn)的距離和所述查詢?cè)~中的相鄰關(guān)鍵字在網(wǎng)頁(yè)中預(yù)設(shè)大小的窗口內(nèi)是否同時(shí)出現(xiàn),對(duì)所述前若干個(gè)網(wǎng)頁(yè)進(jìn)行第二次相關(guān)性打分,以得到相關(guān)網(wǎng)頁(yè)。聚合分組子模塊603,用于對(duì)所述相關(guān)網(wǎng)頁(yè)中產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)進(jìn)行分組,得到多組產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)組。產(chǎn)品相關(guān)處理子模塊604,用于對(duì)各網(wǎng)頁(yè)組中產(chǎn)品標(biāo)識(shí)對(duì)應(yīng)的產(chǎn)品依據(jù)該網(wǎng)頁(yè)組中網(wǎng)頁(yè)數(shù)量、各個(gè)網(wǎng)頁(yè)的相關(guān)性得分以及產(chǎn)品屬性進(jìn)行相關(guān)性打分。存儲(chǔ)子模塊605,用于將所述打分結(jié)果作為各個(gè)網(wǎng)頁(yè)組中的網(wǎng)頁(yè)屬性進(jìn)行存儲(chǔ)。重新排序子模塊606,用于按照所述各個(gè)產(chǎn)品的打分結(jié)果對(duì)各個(gè)網(wǎng)頁(yè)重新排序,得到重新排序之后的網(wǎng)頁(yè)。獲取檢索結(jié)果子模塊607,用于在產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)組中截取排序之后前預(yù)設(shè)個(gè)數(shù)的網(wǎng)頁(yè)作為該產(chǎn)品的檢索結(jié)果。與上述本申請(qǐng)一種基于網(wǎng)上交易平臺(tái)的檢索方法和裝置實(shí)施例相對(duì)應(yīng),本申請(qǐng)還提供了一種基于網(wǎng)上交易平臺(tái)的搜索引擎服務(wù)器的實(shí)施例,在本實(shí)施例中,該服務(wù)器具體可以包括前述裝置實(shí)施例公開(kāi)的任一裝置。需要說(shuō)明的是,本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可。 對(duì)于裝置類實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。最后,還需要說(shuō)明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或
者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)......”限定的要素,
并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。以上對(duì)本申請(qǐng)所提供的一種基于網(wǎng)上交易平臺(tái)的檢索方法、裝置及搜索引擎服務(wù)器進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本申請(qǐng)的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本申請(qǐng)的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請(qǐng)的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本申請(qǐng)的限制。
權(quán)利要求
1.一種網(wǎng)頁(yè)數(shù)據(jù)庫(kù)的建立方法,其特征在于,包括 抓取網(wǎng)頁(yè);分析所述網(wǎng)頁(yè)的關(guān)鍵字,得到所述網(wǎng)頁(yè)上涉及到的產(chǎn)品關(guān)鍵詞; 按照預(yù)置規(guī)則分析所述產(chǎn)品關(guān)鍵詞,以得到與所述網(wǎng)頁(yè)相關(guān)的至少一個(gè)產(chǎn)品標(biāo)識(shí); 將所述網(wǎng)頁(yè)、至少一個(gè)產(chǎn)品標(biāo)識(shí),以及,網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián)保存至預(yù)置的數(shù)據(jù)庫(kù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述分析所述網(wǎng)頁(yè)的關(guān)鍵字,以得到所述網(wǎng)頁(yè)上涉及到的產(chǎn)品關(guān)鍵詞,具體包括提取所述網(wǎng)頁(yè)上的文本內(nèi)容;對(duì)所述文本內(nèi)容進(jìn)行分析以得到所述網(wǎng)頁(yè)的相關(guān)關(guān)鍵詞; 從所述相關(guān)關(guān)鍵詞中獲取到與產(chǎn)品相關(guān)的產(chǎn)品關(guān)鍵詞。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照預(yù)置規(guī)則分析所述產(chǎn)品關(guān)鍵詞, 具體包括檢測(cè)所述產(chǎn)品關(guān)鍵詞中出現(xiàn)概率高于一定閾值的候選關(guān)鍵詞; 判斷所述候選關(guān)鍵詞與所述網(wǎng)頁(yè)的文本內(nèi)容是否相關(guān)。
4.一種基于網(wǎng)上交易平臺(tái)的檢索方法,其特征在于,包括依據(jù)查詢?cè)~,從預(yù)置的網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中查詢得到與該查詢?cè)~匹配的初始網(wǎng)頁(yè);所述預(yù)置的網(wǎng)頁(yè)數(shù)據(jù)庫(kù)用于保存網(wǎng)頁(yè)及其涉及到的至少一個(gè)產(chǎn)品標(biāo)識(shí),和,網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián);對(duì)所述初始網(wǎng)頁(yè)進(jìn)行相關(guān)性處理以得到滿足預(yù)置條件的相關(guān)網(wǎng)頁(yè); 對(duì)所述相關(guān)網(wǎng)頁(yè)涉及到的產(chǎn)品標(biāo)識(shí)所對(duì)應(yīng)的至少一個(gè)產(chǎn)品進(jìn)行相關(guān)處理; 將進(jìn)行過(guò)相關(guān)處理之后的至少一個(gè)產(chǎn)品按照相關(guān)性值向客戶端展示。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述初始網(wǎng)頁(yè)進(jìn)行相關(guān)性處理以得到滿足預(yù)置條件的相關(guān)網(wǎng)頁(yè);具體包括采用預(yù)定算法對(duì)所述初始網(wǎng)頁(yè)進(jìn)行第一次相關(guān)性打分,所述第一次相關(guān)性打分的分值與初始網(wǎng)中特定的產(chǎn)品關(guān)鍵詞的第一參數(shù)成正比,與第二參數(shù)成反比,所述第一參數(shù)為在當(dāng)前的一個(gè)初始網(wǎng)頁(yè)中出現(xiàn)的概率,所述第二參數(shù)為在網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的所有網(wǎng)頁(yè)中出現(xiàn)的概率;對(duì)進(jìn)行第一次相關(guān)打分之后的初始網(wǎng)頁(yè)按照預(yù)設(shè)閾值獲取分值較高的前若干個(gè)網(wǎng)頁(yè), 并依據(jù)產(chǎn)品關(guān)鍵詞在網(wǎng)頁(yè)中出現(xiàn)的概率、所述查詢?cè)~的相鄰關(guān)鍵字在網(wǎng)頁(yè)中同時(shí)出現(xiàn)的距離和所述查詢?cè)~中的相鄰關(guān)鍵字在網(wǎng)頁(yè)中預(yù)設(shè)大小的窗口內(nèi)是否同時(shí)出現(xiàn),對(duì)所述前若干個(gè)網(wǎng)頁(yè)進(jìn)行第二次相關(guān)性打分,得到相關(guān)網(wǎng)頁(yè)。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述相關(guān)網(wǎng)頁(yè)涉及到的產(chǎn)品標(biāo)識(shí)所對(duì)應(yīng)的至少一個(gè)產(chǎn)品進(jìn)行相關(guān)處理,具體包括對(duì)所述相關(guān)網(wǎng)頁(yè)中產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)進(jìn)行分組,得到多組產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)組; 對(duì)各網(wǎng)頁(yè)組中產(chǎn)品標(biāo)識(shí)對(duì)應(yīng)的產(chǎn)品依據(jù)該網(wǎng)頁(yè)組中網(wǎng)頁(yè)數(shù)量、各個(gè)網(wǎng)頁(yè)的相關(guān)性得分以及產(chǎn)品屬性進(jìn)行相關(guān)性打分;將所述打分結(jié)果作為各個(gè)網(wǎng)頁(yè)組中的網(wǎng)頁(yè)屬性進(jìn)行存儲(chǔ)。
7.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將進(jìn)行過(guò)相關(guān)處理之后的至少一個(gè)產(chǎn)品按照相關(guān)性值進(jìn)行排序,具體包括按照所述各個(gè)產(chǎn)品的打分結(jié)果對(duì)各個(gè)網(wǎng)頁(yè)重新排序,得到重新排序之后的網(wǎng)頁(yè); 在產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)組中截取排序之后前預(yù)設(shè)個(gè)數(shù)的網(wǎng)頁(yè)作為該產(chǎn)品的檢索結(jié)果。
8.一種基于網(wǎng)上交易平臺(tái)的檢索裝置,其特征在于,包括查詢初始網(wǎng)頁(yè)模塊,用于依據(jù)查詢?cè)~,從預(yù)置的數(shù)據(jù)庫(kù)中查詢得到與該查詢?cè)~匹配的初始網(wǎng)頁(yè);所述預(yù)置的數(shù)據(jù)庫(kù)用于保存網(wǎng)頁(yè)及其涉及到的至少一個(gè)產(chǎn)品標(biāo)識(shí),和,網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián);獲取相關(guān)網(wǎng)頁(yè)模塊,用于對(duì)所述初始網(wǎng)頁(yè)進(jìn)行相關(guān)性處理以得到滿足預(yù)置條件的相關(guān)網(wǎng)頁(yè);產(chǎn)品相關(guān)處理模塊,用于對(duì)所述相關(guān)網(wǎng)頁(yè)涉及到的產(chǎn)品標(biāo)識(shí)所對(duì)應(yīng)的至少一個(gè)產(chǎn)品進(jìn)行相關(guān)處理;排序展示模塊,用于將進(jìn)行過(guò)相關(guān)處理之后的至少一個(gè)產(chǎn)品按照相關(guān)性值向客戶端展7J\ ο
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述獲取相關(guān)網(wǎng)頁(yè)模塊具體包括第一相關(guān)性處理子模塊,用于采用預(yù)定算法對(duì)所述初始網(wǎng)頁(yè)進(jìn)行第一次相關(guān)性打分, 所述第一次相關(guān)性打分的分值與初始網(wǎng)中特定的產(chǎn)品關(guān)鍵詞的第一參數(shù)成正比,與第二參數(shù)成反比,所述第一參數(shù)為在當(dāng)前的一個(gè)初始網(wǎng)頁(yè)中出現(xiàn)的概率,所述第二參數(shù)為在網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的所有網(wǎng)頁(yè)中出現(xiàn)的概率;第二相關(guān)性處理子模塊,用于對(duì)進(jìn)行第一次相關(guān)打分之后的初始網(wǎng)頁(yè)按照預(yù)設(shè)閾值獲取分值較高的前若干個(gè)網(wǎng)頁(yè),并依據(jù)產(chǎn)品關(guān)鍵詞在網(wǎng)頁(yè)中出現(xiàn)的概率、所述查詢?cè)~的相鄰關(guān)鍵字在網(wǎng)頁(yè)中同時(shí)出現(xiàn)的距離和所述查詢?cè)~中的相鄰關(guān)鍵字在網(wǎng)頁(yè)中預(yù)設(shè)大小的窗口內(nèi)是否同時(shí)出現(xiàn),對(duì)所述前若干個(gè)網(wǎng)頁(yè)進(jìn)行第二次相關(guān)性打分,以得到相關(guān)網(wǎng)頁(yè)。
10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述產(chǎn)品相關(guān)處理模塊具體包括聚合分組子模塊,用于對(duì)所述相關(guān)網(wǎng)頁(yè)中產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)進(jìn)行分組,得到多組產(chǎn)品標(biāo)識(shí)相同的網(wǎng)頁(yè)組;產(chǎn)品相關(guān)處理子模塊,用于對(duì)各網(wǎng)頁(yè)組中產(chǎn)品標(biāo)識(shí)對(duì)應(yīng)的產(chǎn)品依據(jù)該網(wǎng)頁(yè)組中網(wǎng)頁(yè)數(shù)量、各個(gè)網(wǎng)頁(yè)的相關(guān)性得分以及產(chǎn)品屬性進(jìn)行相關(guān)性打分;存儲(chǔ)子模塊,用于將所述打分結(jié)果作為各個(gè)網(wǎng)頁(yè)組中的網(wǎng)頁(yè)屬性進(jìn)行存儲(chǔ)。
全文摘要
本申請(qǐng)?zhí)峁┝艘环N基于網(wǎng)上交易平臺(tái)的檢索方法、裝置和服務(wù)器,所述方法包括依據(jù)瀏覽器當(dāng)前提交的查詢?cè)~,從預(yù)置的數(shù)據(jù)庫(kù)中查詢得到與該查詢?cè)~匹配的初始網(wǎng)頁(yè);所述預(yù)置的數(shù)據(jù)庫(kù)用于保存網(wǎng)頁(yè)及其涉及到的至少一個(gè)產(chǎn)品標(biāo)識(shí),和,網(wǎng)頁(yè)和產(chǎn)品標(biāo)識(shí)之間的關(guān)聯(lián);對(duì)所述初始網(wǎng)頁(yè)進(jìn)行相關(guān)性處理以得到滿足預(yù)置條件的相關(guān)網(wǎng)頁(yè);對(duì)所述相關(guān)網(wǎng)頁(yè)涉及到的產(chǎn)品標(biāo)識(shí)所對(duì)應(yīng)的至少一個(gè)產(chǎn)品進(jìn)行相關(guān)處理;將進(jìn)行過(guò)相關(guān)處理之后的至少一個(gè)產(chǎn)品按照相關(guān)性值向客戶端展示。采用本申請(qǐng)實(shí)施例公開(kāi)的檢索方法、裝置和服務(wù)器,可以減少用戶與搜索引擎服務(wù)器之間的交互次數(shù),降低搜索引擎服務(wù)器的重復(fù)運(yùn)行次數(shù),從而提高搜索引擎服務(wù)器的運(yùn)行速度、工作效率和工作性能。
文檔編號(hào)G06Q30/00GK102456057SQ201010529419
公開(kāi)日2012年5月16日 申請(qǐng)日期2010年11月1日 優(yōu)先權(quán)日2010年11月1日
發(fā)明者潘曉雯 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司