本發(fā)明涉及互聯(lián)網(wǎng)應(yīng)用技術(shù)領(lǐng)域,特別是一種在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的方法及裝置。
背景技術(shù):
隨著信息技術(shù)的飛速發(fā)展,當(dāng)今社會(huì)進(jìn)入了信息爆炸時(shí)代,人們?cè)絹?lái)越多地借助網(wǎng)絡(luò)來(lái)尋找自己需要的信息,因此,檢索成為人們工作、生活不可或缺的一部分。
人們通常使用搜索引擎來(lái)進(jìn)行檢索,搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對(duì)信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù),將與用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。
在分析搜索全網(wǎng)用戶session(會(huì)話)時(shí),發(fā)明人發(fā)現(xiàn)檢索餐飲類query(搜索詞)的用戶雖占小數(shù),但意向趨于大同,大多是點(diǎn)擊大眾點(diǎn)評(píng)類網(wǎng)站查看相關(guān)信息,但大眾點(diǎn)評(píng)類網(wǎng)站給出的結(jié)果往往類型繁雜,不利于快速找到信息。
技術(shù)實(shí)現(xiàn)要素:
鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的方法及相應(yīng)的裝置。
依據(jù)本發(fā)明的一方面,提供了一種在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的方法,包括:
收集針對(duì)餐飲類的多個(gè)用戶生成內(nèi)容UGC網(wǎng)站,并從所述多個(gè)UGC網(wǎng)站中抓取餐飲類資訊信息;
對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容;
當(dāng)接收到來(lái)自用戶的與餐飲類相關(guān)的目標(biāo)搜索詞時(shí),將所述目標(biāo)搜索詞與生成的所述結(jié)構(gòu)化的餐飲類資訊內(nèi)容中的屬性名稱進(jìn)行匹配,得到匹配的屬性名稱對(duì)應(yīng)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容;
在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶。
可選地,從所述多個(gè)UGC網(wǎng)站中抓取餐飲類資訊信息,包括:
從所述多個(gè)UGC網(wǎng)站中篩選出至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站;
從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
可選地,從所述多個(gè)UGC網(wǎng)站中篩選出至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站,包括:
確定一個(gè)或多個(gè)衡量因子;
根據(jù)確定的所述一個(gè)或多個(gè)衡量因子衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況,并從中篩選出質(zhì)量滿足指定質(zhì)量條件的至少一個(gè)UGC網(wǎng)站作為優(yōu)質(zhì)UGC網(wǎng)站。
可選地,當(dāng)衡量因子包括多個(gè)時(shí),根據(jù)確定的所述多個(gè)衡量因子衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況,包括:
基于權(quán)重策略確定所述多個(gè)衡量因子各自的權(quán)重;
獲取所述多個(gè)UGC網(wǎng)站的所述多個(gè)衡量因子各自的數(shù)值;
將所述多個(gè)UGC網(wǎng)站的所述多個(gè)衡量因子各自的數(shù)值與權(quán)重進(jìn)行加權(quán)求和,得到綜合數(shù)值;
根據(jù)所述多個(gè)UGC網(wǎng)站各自的綜合數(shù)值衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況。
可選地,從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息,包括:
從指定網(wǎng)站中獲取針對(duì)餐飲類的店名,并生成包含所述店名的詞表;
基于所述詞表從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
可選地,對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容,包括:
確定用于對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理的屬性名稱;
基于所述屬性名稱從抓取的所述餐飲類資訊信息中提取相應(yīng)的屬性內(nèi)容,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容。
可選地,所述屬性名稱包括下列至少之一:
店名、人均消費(fèi)、優(yōu)惠信息、打分、評(píng)價(jià)關(guān)鍵字、簡(jiǎn)介、相關(guān)菜品、同類型餐館、附近餐館。
可選地,所述結(jié)構(gòu)化的餐飲類資訊內(nèi)容中還包括餐飲類新聞內(nèi)容。
可選地,在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶,包括:
將所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容聚合至所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)的右側(cè)區(qū)域展現(xiàn)給所述用戶。
可選地,在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶之后,所述方法還包括:
統(tǒng)計(jì)用戶針對(duì)所述搜索結(jié)果頁(yè)上展現(xiàn)的所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容的觸發(fā)操作,得到統(tǒng)計(jì)結(jié)果;
根據(jù)所述統(tǒng)計(jì)結(jié)果確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中是否展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
可選地,根據(jù)所述統(tǒng)計(jì)結(jié)果確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中是否展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,包括:
若所述統(tǒng)計(jì)結(jié)果為所述觸發(fā)操作的數(shù)量小于指定閾值,則確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中不再展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
依據(jù)本發(fā)明的另一方面,還提供了一種在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的裝置,包括:
抓取模塊,適于收集針對(duì)餐飲類的多個(gè)用戶生成內(nèi)容UGC網(wǎng)站,并從所述多個(gè)UGC網(wǎng)站中抓取餐飲類資訊信息;
生成模塊,適于對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容;
匹配模塊,適于當(dāng)接收到來(lái)自用戶的與餐飲類相關(guān)的目標(biāo)搜索詞時(shí),將所述目標(biāo)搜索詞與生成的所述結(jié)構(gòu)化的餐飲類資訊內(nèi)容中的屬性名稱進(jìn)行匹配,得到匹配的屬性名稱對(duì)應(yīng)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容;
聚合模塊,適于在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶。
可選地,所述抓取模塊包括:
篩選單元,適于從所述多個(gè)UGC網(wǎng)站中篩選出至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站;
抓取單元,適于從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
可選地,所述篩選單元還適于:
確定一個(gè)或多個(gè)衡量因子;
根據(jù)確定的所述一個(gè)或多個(gè)衡量因子衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況,并從中篩選出質(zhì)量滿足指定質(zhì)量條件的至少一個(gè)UGC網(wǎng)站作為優(yōu)質(zhì)UGC網(wǎng)站。
可選地,所述篩選單元還適于:
當(dāng)衡量因子包括多個(gè)時(shí),基于權(quán)重策略確定所述多個(gè)衡量因子各自的權(quán)重;
獲取所述多個(gè)UGC網(wǎng)站的所述多個(gè)衡量因子各自的數(shù)值;
將所述多個(gè)UGC網(wǎng)站的所述多個(gè)衡量因子各自的數(shù)值與權(quán)重進(jìn)行加權(quán)求和,得到綜合數(shù)值;
根據(jù)所述多個(gè)UGC網(wǎng)站各自的綜合數(shù)值衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況。
可選地,所述抓取單元還適于:
從指定網(wǎng)站中獲取針對(duì)餐飲類的店名,并生成包含所述店名的詞表;
基于所述詞表從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
可選地,所述生成模塊還適于:
確定用于對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理的屬性名稱;
基于所述屬性名稱從抓取的所述餐飲類資訊信息中提取相應(yīng)的屬性內(nèi)容,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容。
可選地,所述屬性名稱包括下列至少之一:
店名、人均消費(fèi)、優(yōu)惠信息、打分、評(píng)價(jià)關(guān)鍵字、簡(jiǎn)介、相關(guān)菜品、同類型餐館、附近餐館。
可選地,所述結(jié)構(gòu)化的餐飲類資訊內(nèi)容中還包括餐飲類新聞內(nèi)容。
可選地,所述聚合模塊還適于:
將所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容聚合至所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)的右側(cè)區(qū)域展現(xiàn)給所述用戶。
可選地,所述裝置還包括:
統(tǒng)計(jì)模塊,適于在所述聚合模塊在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶之后,統(tǒng)計(jì)用戶針對(duì)所述搜索結(jié)果頁(yè)上展現(xiàn)的所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容的觸發(fā)操作,得到統(tǒng)計(jì)結(jié)果;
確定模塊,適于根據(jù)所述統(tǒng)計(jì)結(jié)果確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中是否展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
可選地,所述確定模塊還適于:
若所述統(tǒng)計(jì)結(jié)果為所述觸發(fā)操作的數(shù)量小于指定閾值,則確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中不再展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
在本發(fā)明實(shí)施例中,收集針對(duì)餐飲類的多個(gè)UGC網(wǎng)站,并從中抓取餐飲類資訊信息,對(duì)抓取的餐飲類資訊信息進(jìn)行處理生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容。當(dāng)接收到來(lái)自用戶的與餐飲類相關(guān)的目標(biāo)搜索詞時(shí),將目標(biāo)搜索詞與生成的結(jié)構(gòu)化的餐飲類資訊內(nèi)容中的屬性名稱進(jìn)行匹配,得到匹配的屬性名稱對(duì)應(yīng)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,從而在目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給用戶。由此可見(jiàn),本發(fā)明實(shí)施例能夠在搜索結(jié)果頁(yè)中聚合餐飲類資訊內(nèi)容,能夠提供更多的資訊信息,擴(kuò)寬內(nèi)容覆蓋面。并且,由于餐飲類資訊內(nèi)容具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化特點(diǎn),具有可讀性,能夠幫助用戶快速地找到需要的信息。進(jìn)一步地,餐飲類資訊內(nèi)容來(lái)自各個(gè)UGC網(wǎng)站,將各個(gè)UGC網(wǎng)站中的數(shù)據(jù)前置到搜索結(jié)果頁(yè)中進(jìn)行展現(xiàn),無(wú)需用戶通過(guò)多次操作去網(wǎng)站查找相關(guān)資訊信息,降低了用戶的檢索成本。
上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。
根據(jù)下文結(jié)合附圖對(duì)本發(fā)明具體實(shí)施例的詳細(xì)描述,本領(lǐng)域技術(shù)人員將會(huì)更加明了本發(fā)明的上述以及其他目的、優(yōu)點(diǎn)和特征。
附圖說(shuō)明
通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
圖1示出了根據(jù)本發(fā)明一實(shí)施例的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的方法的流程圖;
圖2示出了根據(jù)本發(fā)明另一實(shí)施例的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的方法的流程圖;
圖3示出了根據(jù)本發(fā)明一實(shí)施例的聚合有餐飲類資訊信息的搜索結(jié)果頁(yè)的示意圖;
圖4示出了根據(jù)本發(fā)明一實(shí)施例的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的裝置的結(jié)構(gòu)示意圖;以及
圖5示出了根據(jù)本發(fā)明另一實(shí)施例的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi)的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供了一種在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的方法,該方法可以應(yīng)用在個(gè)人電腦、智能手機(jī)、平板電腦等終端設(shè)備上。圖1示出了根據(jù)本發(fā)明一實(shí)施例的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的方法的流程圖。如圖1所示,該方法至少可以包括以下步驟S102至步驟S108。
步驟S102,收集針對(duì)餐飲類的多個(gè)UGC網(wǎng)站,并從多個(gè)UGC網(wǎng)站中抓取餐飲類資訊信息。
在該步驟中,UGC(User Gernerated Content,用戶生產(chǎn)內(nèi)容),其也被稱為UCC(User Created Content,用戶創(chuàng)建內(nèi)容),可以包括用戶創(chuàng)作的文字內(nèi)容,用戶拍攝的圖片以及用戶錄制的視頻、音頻等等。此外,PGC(Professional Generated Content,專業(yè)生產(chǎn)內(nèi)容),它是UGC的衍生概念,UGC的好處是用戶可以自由上傳內(nèi)容,豐富網(wǎng)站內(nèi)容,但不利的方面在于內(nèi)容的質(zhì)量良莠不齊。與UGC相比,PGC分類更專業(yè),內(nèi)容質(zhì)量也更有保證,其內(nèi)容設(shè)置及產(chǎn)品編輯均非常專業(yè)。其實(shí),UGC和PGC兩者并不矛盾,不但并行不悖,而且需要相輔相成。一個(gè)成熟的互聯(lián)網(wǎng)內(nèi)容向產(chǎn)品,不論網(wǎng)站還是社區(qū)、視頻平臺(tái)、音頻平臺(tái)、甚至新形態(tài)下的媒體,都需要深度和廣度兩個(gè)方面并行。結(jié)合自身的特點(diǎn),UGC負(fù)責(zé)內(nèi)容廣度,主要貢獻(xiàn)流量和參與度,而PGC維持內(nèi)容深度,主要樹(shù)立品牌、創(chuàng)造價(jià)值,兩者缺一不可。由于PGC是UGC的衍生概念,在本發(fā)明實(shí)施例中不妨將PGC作為UGC的一部分。
步驟S104,對(duì)抓取的餐飲類資訊信息進(jìn)行處理,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容。
步驟S106,當(dāng)接收到來(lái)自用戶的與餐飲類相關(guān)的目標(biāo)搜索詞時(shí),將目標(biāo)搜索詞與生成的結(jié)構(gòu)化的餐飲類資訊內(nèi)容中的屬性名稱進(jìn)行匹配,得到匹配的屬性名稱對(duì)應(yīng)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
步驟S108,在目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給用戶。
在本發(fā)明實(shí)施例中,收集針對(duì)餐飲類的多個(gè)UGC網(wǎng)站,并從中抓取餐飲類資訊信息,對(duì)抓取的餐飲類資訊信息進(jìn)行處理生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容。當(dāng)接收到來(lái)自用戶的與餐飲類相關(guān)的目標(biāo)搜索詞時(shí),將目標(biāo)搜索詞與生成的結(jié)構(gòu)化的餐飲類資訊內(nèi)容中的屬性名稱進(jìn)行匹配,得到匹配的屬性名稱對(duì)應(yīng)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,從而在目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給用戶。由此可見(jiàn),本發(fā)明實(shí)施例能夠在搜索結(jié)果頁(yè)中聚合餐飲類資訊內(nèi)容,能夠提供更多的資訊信息,擴(kuò)寬內(nèi)容覆蓋面。并且,由于餐飲類資訊內(nèi)容具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化特點(diǎn),具有可讀性,能夠幫助用戶快速地找到需要的信息。進(jìn)一步地,餐飲類資訊內(nèi)容來(lái)自各個(gè)UGC網(wǎng)站,將各個(gè)UGC網(wǎng)站中的數(shù)據(jù)前置到搜索結(jié)果頁(yè)中進(jìn)行展現(xiàn),無(wú)需用戶通過(guò)多次操作去網(wǎng)站查找相關(guān)資訊信息,降低了用戶的檢索成本。
如前文提到,UGC提供的內(nèi)容的質(zhì)量良莠不齊,本發(fā)明實(shí)施例為了增加餐飲類資訊內(nèi)容的可信度,在步驟S102中從多個(gè)UGC網(wǎng)站中抓取餐飲類資訊信息時(shí),可以從多個(gè)UGC網(wǎng)站中篩選出至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站,進(jìn)而從至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
進(jìn)一步地,在從多個(gè)UGC網(wǎng)站中篩選出至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站時(shí),可以通過(guò)一些衡量因子來(lái)篩選。具體地,確定一個(gè)或多個(gè)衡量因子,根據(jù)確定的一個(gè)或多個(gè)衡量因子衡量出多個(gè)UGC網(wǎng)站的質(zhì)量情況,并從中篩選出質(zhì)量滿足指定質(zhì)量條件的至少一個(gè)UGC網(wǎng)站作為優(yōu)質(zhì)UGC網(wǎng)站。這里的衡量因子可以如網(wǎng)站的可信度、網(wǎng)站上注冊(cè)的用戶數(shù)、網(wǎng)站的訪問(wèn)量等等。
當(dāng)衡量因子包括多個(gè)時(shí),在根據(jù)多個(gè)衡量因子來(lái)衡量多個(gè)UGC網(wǎng)站的質(zhì)量情況時(shí),本發(fā)明實(shí)施例提供了一種可選的方案,在該方案中,可以基于權(quán)重策略確定多個(gè)衡量因子各自的權(quán)重,獲取多個(gè)UGC網(wǎng)站的多個(gè)衡量因子各自的數(shù)值;隨后將多個(gè)UGC網(wǎng)站的多個(gè)衡量因子各自的數(shù)值與權(quán)重進(jìn)行加權(quán)求和,得到綜合數(shù)值,進(jìn)而根據(jù)多個(gè)UGC網(wǎng)站各自的綜合數(shù)值衡量出多個(gè)UGC網(wǎng)站的質(zhì)量情況。
例如,多個(gè)UGC網(wǎng)站為網(wǎng)站1、網(wǎng)站2、網(wǎng)站3、網(wǎng)站4和網(wǎng)站5,多個(gè)衡量因子為網(wǎng)站的可信度、網(wǎng)站上注冊(cè)的用戶數(shù)、網(wǎng)站的訪問(wèn)量,網(wǎng)站1的多個(gè)衡量因子各自的數(shù)值分別為p11、p12、p13,網(wǎng)站2的多個(gè)衡量因子各自的數(shù)值分別為p21、p22、p23,網(wǎng)站3的多個(gè)衡量因子各自的數(shù)值分別為p31、p32、p33,網(wǎng)站4的多個(gè)衡量因子各自的數(shù)值分別為p41、p42、p43,網(wǎng)站5的多個(gè)衡量因子各自的數(shù)值分別為p51、p52、p53。確定多個(gè)衡量因子各自的權(quán)重為w1、w2、w3,將多個(gè)UGC網(wǎng)站的多個(gè)衡量因子各自的數(shù)值與權(quán)重進(jìn)行加權(quán)求和,得到多個(gè)UGC網(wǎng)站的綜合數(shù)值。不妨以網(wǎng)站1和網(wǎng)站2為例,加權(quán)求和后網(wǎng)站1的綜合數(shù)值為p11×w1+p12×w2+p13×w3,網(wǎng)站2的綜合數(shù)值為p21×w1+p22×w2+p23×w3,網(wǎng)站3、網(wǎng)站4和網(wǎng)站5以此類推,此處不再一一贅述。
上文步驟S102中從多個(gè)UGC網(wǎng)站中抓取餐飲類資訊信息,本發(fā)明實(shí)施例提供了一種可選的方案,即,可以從指定網(wǎng)站中獲取針對(duì)餐飲類的店名,并生成包含店名的詞表,進(jìn)而基于詞表從至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。通常情況下,餐飲類資訊信息中都會(huì)包含店名,因而從指定網(wǎng)站中獲取針對(duì)餐飲類的店名后生成詞表,然后基于詞表從至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息,能夠?qū)崿F(xiàn)靈活、快速地獲取餐飲類資訊信息。在實(shí)際應(yīng)用中,指定網(wǎng)站可以如大眾點(diǎn)評(píng)網(wǎng)站、美團(tuán)網(wǎng)站等等。
上文步驟S104中對(duì)抓取的餐飲類資訊信息進(jìn)行處理,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容,本發(fā)明實(shí)施例提供了一種可選的方案,在該方案中,可以確定用于對(duì)抓取的餐飲類資訊信息進(jìn)行處理的屬性名稱,進(jìn)而基于確定的屬性名稱從抓取的餐飲類資訊信息中提取相應(yīng)的屬性內(nèi)容,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容。這里的屬性名稱可以是店名、人均消費(fèi)、優(yōu)惠信息、打分、評(píng)價(jià)關(guān)鍵字、簡(jiǎn)介、相關(guān)菜品、同類型餐館、附近餐館,等等,本發(fā)明實(shí)施例不限于此。
進(jìn)一步地,在本發(fā)明的可選實(shí)施例中,結(jié)構(gòu)化的餐飲類資訊內(nèi)容中還可以包括餐飲類新聞內(nèi)容,具體地,步驟S102中收集的針對(duì)餐飲類的多個(gè)UGC網(wǎng)站可以是包含有新聞內(nèi)容的UGC網(wǎng)站,可以從中抓取餐飲類新聞內(nèi)容。在實(shí)際應(yīng)用中,這些包含有新聞內(nèi)容的UGC網(wǎng)站可以是頭條、知乎等。
上文步驟S108中在目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,本發(fā)明實(shí)施例提供了一種可選的方案,即,可以將結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容聚合至目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)的指定區(qū)域展現(xiàn)給用戶。這里的指定區(qū)域可以如右側(cè)區(qū)域、左上角區(qū)域等,本發(fā)明實(shí)施例對(duì)此不作限制。
在步驟S108在目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給用戶之后,本發(fā)明實(shí)施例還可以按照指定時(shí)間(如1小時(shí)等)周期判斷資訊內(nèi)容的CTR(Click To Rate,點(diǎn)擊率),并根據(jù)判斷結(jié)果進(jìn)行相應(yīng)的處理。具體地,本發(fā)明實(shí)施例可以統(tǒng)計(jì)用戶針對(duì)搜索結(jié)果頁(yè)上展現(xiàn)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容的觸發(fā)操作,得到統(tǒng)計(jì)結(jié)果,進(jìn)而根據(jù)統(tǒng)計(jì)結(jié)果確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中是否展現(xiàn)結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。進(jìn)一步地,若統(tǒng)計(jì)結(jié)果為觸發(fā)操作的數(shù)量小于指定閾值,則確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中不再展現(xiàn)結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,可以等待有新的資訊內(nèi)容更新后重新進(jìn)行展現(xiàn)。若統(tǒng)計(jì)結(jié)果為觸發(fā)操作的數(shù)量大于或等于指定閾值,則確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中展現(xiàn)結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
以上介紹了圖1所示實(shí)施例的各個(gè)環(huán)節(jié)的多種實(shí)現(xiàn)方式,下面通過(guò)一具體實(shí)施例來(lái)詳細(xì)介紹本發(fā)明的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的方法的實(shí)現(xiàn)過(guò)程。
圖2示出了根據(jù)本發(fā)明另一實(shí)施例的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的方法的流程圖。如圖2所示,該方法至少可以包括以下步驟S202至步驟S214。
步驟S202,收集針對(duì)餐飲類的多個(gè)UGC網(wǎng)站。
步驟S204,從多個(gè)UGC網(wǎng)站中篩選出至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站。
在該步驟中,可以通過(guò)一些衡量因子來(lái)篩選,具體地,確定一個(gè)或多個(gè)衡量因子,根據(jù)確定的一個(gè)或多個(gè)衡量因子衡量出多個(gè)UGC網(wǎng)站的質(zhì)量情況,并從中篩選出質(zhì)量滿足指定質(zhì)量條件的至少一個(gè)UGC網(wǎng)站作為優(yōu)質(zhì)UGC網(wǎng)站。這里的衡量因子可以如網(wǎng)站的可信度、網(wǎng)站上注冊(cè)的用戶數(shù)、網(wǎng)站的訪問(wèn)量等等。當(dāng)衡量因子包括多個(gè)時(shí),可以參見(jiàn)前文介紹的方案來(lái)衡量多個(gè)UGC網(wǎng)站的質(zhì)量情況,此處不再贅述。這里,篩選出的至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站可以如大眾點(diǎn)評(píng)、美團(tuán)、頭條、知乎等網(wǎng)站。
步驟S206,從指定網(wǎng)站中獲取針對(duì)餐飲類的店名,并生成包含店名的詞表。
步驟S208,基于生成的詞表從至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
通常情況下,餐飲類資訊信息中都會(huì)包含店名,因而從指定網(wǎng)站中獲取針對(duì)餐飲類的店名后生成詞表,然后基于詞表從至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息,能夠?qū)崿F(xiàn)靈活、快速地獲取餐飲類資訊信息。在實(shí)際應(yīng)用中,指定網(wǎng)站可以如大眾點(diǎn)評(píng)網(wǎng)站、美團(tuán)網(wǎng)站等等。
在可選的實(shí)施例中,可以設(shè)定抓取頻率,如1或2小時(shí)等,可以根據(jù)實(shí)際需求進(jìn)行設(shè)置。
步驟S210,確定用于對(duì)抓取的餐飲類資訊信息進(jìn)行處理的屬性名稱,進(jìn)而基于確定的屬性名稱從抓取的餐飲類資訊信息中提取相應(yīng)的屬性內(nèi)容,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容。
在該步驟中,屬性名稱可以是店名、人均消費(fèi)、優(yōu)惠信息、打分、評(píng)價(jià)關(guān)鍵字、簡(jiǎn)介、相關(guān)菜品、同類型餐館、附近餐館,等等,本發(fā)明不限于此。
步驟S212,當(dāng)接收到來(lái)自用戶的與餐飲類相關(guān)的目標(biāo)搜索詞時(shí),將目標(biāo)搜索詞與生成的結(jié)構(gòu)化的餐飲類資訊內(nèi)容中的屬性名稱進(jìn)行匹配,得到匹配的屬性名稱對(duì)應(yīng)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
步驟S214,將結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容聚合至目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)的右側(cè)區(qū)域展現(xiàn)給用戶。
例如,用戶在搜索框輸入目標(biāo)搜索詞“那家小館”,采用本發(fā)明實(shí)施例提供的方案得到的搜索結(jié)果頁(yè)如圖3所示,在圖3中,結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容展現(xiàn)在搜索結(jié)果頁(yè)的右側(cè)區(qū)域,能夠提供更多的資訊信息,擴(kuò)寬內(nèi)容覆蓋面。并且,由于餐飲類資訊內(nèi)容具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化特點(diǎn),具有可讀性,能夠幫助用戶快速地找到需要的信息。進(jìn)一步地,餐飲類資訊內(nèi)容來(lái)自各個(gè)UGC網(wǎng)站,將各個(gè)UGC網(wǎng)站中的數(shù)據(jù)前置到搜索結(jié)果頁(yè)中進(jìn)行展現(xiàn),無(wú)需用戶通過(guò)多次操作去網(wǎng)站查找相關(guān)資訊信息,降低了用戶的檢索成本。
在本發(fā)明的可選實(shí)施例中,在上文步驟S214之后,還可以按照指定時(shí)間(如1小時(shí)等)周期判斷資訊內(nèi)容的CTR,具體地,可以統(tǒng)計(jì)用戶針對(duì)搜索結(jié)果頁(yè)上展現(xiàn)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容的觸發(fā)操作,得到統(tǒng)計(jì)結(jié)果,進(jìn)而根據(jù)統(tǒng)計(jì)結(jié)果確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中是否展現(xiàn)結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。進(jìn)一步地,若統(tǒng)計(jì)結(jié)果為觸發(fā)操作的數(shù)量小于指定閾值,則確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中不再展現(xiàn)結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,可以等待有新的資訊內(nèi)容更新后重新進(jìn)行展現(xiàn)。若統(tǒng)計(jì)結(jié)果為觸發(fā)操作的數(shù)量大于或等于指定閾值,則確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中展現(xiàn)結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
需要說(shuō)明的是,實(shí)際應(yīng)用中,上述所有可選實(shí)施方式可以采用結(jié)合的方式任意組合,形成本發(fā)明的可選實(shí)施例,在此不再一一贅述。
基于上文各個(gè)實(shí)施例提供的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的方法,基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提供了一種在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的裝置。
圖4示出了根據(jù)本發(fā)明一實(shí)施例的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的裝置的結(jié)構(gòu)示意圖。如圖4所示,該裝置至少可以包括抓取模塊410、生成模塊420、匹配模塊430以及聚合模塊440。
現(xiàn)介紹本發(fā)明實(shí)施例的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的裝置的各組成或器件的功能以及各部分間的連接關(guān)系:
抓取模塊410,適于收集針對(duì)餐飲類的多個(gè)用戶生成內(nèi)容UGC網(wǎng)站,并從所述多個(gè)UGC網(wǎng)站中抓取餐飲類資訊信息;
生成模塊420,與抓取模塊410相耦合,適于對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容;
匹配模塊430,與生成模塊420相耦合,適于當(dāng)接收到來(lái)自用戶的與餐飲類相關(guān)的目標(biāo)搜索詞時(shí),將所述目標(biāo)搜索詞與生成的所述結(jié)構(gòu)化的餐飲類資訊內(nèi)容中的屬性名稱進(jìn)行匹配,得到匹配的屬性名稱對(duì)應(yīng)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容;
聚合模塊440,與匹配模塊430相耦合,適于在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶。
在本發(fā)明一實(shí)施例中,上述抓取模塊410包括:
篩選單元411,適于從所述多個(gè)UGC網(wǎng)站中篩選出至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站;
抓取單元412,與篩選單元411相耦合,適于從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
在本發(fā)明一實(shí)施例中,上述篩選單元411還適于:
確定一個(gè)或多個(gè)衡量因子;
根據(jù)確定的所述一個(gè)或多個(gè)衡量因子衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況,并從中篩選出質(zhì)量滿足指定質(zhì)量條件的至少一個(gè)UGC網(wǎng)站作為優(yōu)質(zhì)UGC網(wǎng)站。
在本發(fā)明一實(shí)施例中,上述篩選單元411還適于:
當(dāng)衡量因子包括多個(gè)時(shí),基于權(quán)重策略確定所述多個(gè)衡量因子各自的權(quán)重;
獲取所述多個(gè)UGC網(wǎng)站的所述多個(gè)衡量因子各自的數(shù)值;
將所述多個(gè)UGC網(wǎng)站的所述多個(gè)衡量因子各自的數(shù)值與權(quán)重進(jìn)行加權(quán)求和,得到綜合數(shù)值;
根據(jù)所述多個(gè)UGC網(wǎng)站各自的綜合數(shù)值衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況。
在本發(fā)明一實(shí)施例中,上述抓取單元412還適于:
從指定網(wǎng)站中獲取針對(duì)餐飲類的店名,并生成包含所述店名的詞表;
基于所述詞表從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
在本發(fā)明一實(shí)施例中,上述生成模塊420還適于:
確定用于對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理的屬性名稱;
基于所述屬性名稱從抓取的所述餐飲類資訊信息中提取相應(yīng)的屬性內(nèi)容,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容。
在本發(fā)明一實(shí)施例中,所述屬性名稱包括下列至少之一:
店名、人均消費(fèi)、優(yōu)惠信息、打分、評(píng)價(jià)關(guān)鍵字、簡(jiǎn)介、相關(guān)菜品、同類型餐館、附近餐館。
在本發(fā)明一實(shí)施例中,所述結(jié)構(gòu)化的餐飲類資訊內(nèi)容中還包括餐飲類新聞內(nèi)容。
在本發(fā)明一實(shí)施例中,上述聚合模塊440還適于:
將所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容聚合至所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)的右側(cè)區(qū)域展現(xiàn)給所述用戶。
在本發(fā)明一實(shí)施例中,如圖5所示,上文圖4展示的裝置還可以包括:
統(tǒng)計(jì)模塊510,與聚合模塊440相耦合,適于在聚合模塊440在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶之后,統(tǒng)計(jì)用戶針對(duì)所述搜索結(jié)果頁(yè)上展現(xiàn)的所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容的觸發(fā)操作,得到統(tǒng)計(jì)結(jié)果;
確定模塊520,與統(tǒng)計(jì)模塊510相耦合,適于根據(jù)所述統(tǒng)計(jì)結(jié)果確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中是否展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
在本發(fā)明一實(shí)施例中,上述確定模塊520還適于:
若所述統(tǒng)計(jì)結(jié)果為所述觸發(fā)操作的數(shù)量小于指定閾值,則確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中不再展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
根據(jù)上述任意一個(gè)優(yōu)選實(shí)施例或多個(gè)優(yōu)選實(shí)施例的組合,本發(fā)明實(shí)施例能夠達(dá)到如下有益效果:
在本發(fā)明實(shí)施例中,收集針對(duì)餐飲類的多個(gè)UGC網(wǎng)站,并從中抓取餐飲類資訊信息,對(duì)抓取的餐飲類資訊信息進(jìn)行處理生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容。當(dāng)接收到來(lái)自用戶的與餐飲類相關(guān)的目標(biāo)搜索詞時(shí),將目標(biāo)搜索詞與生成的結(jié)構(gòu)化的餐飲類資訊內(nèi)容中的屬性名稱進(jìn)行匹配,得到匹配的屬性名稱對(duì)應(yīng)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,從而在目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給用戶。由此可見(jiàn),本發(fā)明實(shí)施例能夠在搜索結(jié)果頁(yè)中聚合餐飲類資訊內(nèi)容,能夠提供更多的資訊信息,擴(kuò)寬內(nèi)容覆蓋面。并且,由于餐飲類資訊內(nèi)容具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化特點(diǎn),具有可讀性,能夠幫助用戶快速地找到需要的信息。進(jìn)一步地,餐飲類資訊內(nèi)容來(lái)自各個(gè)UGC網(wǎng)站,將各個(gè)UGC網(wǎng)站中的數(shù)據(jù)前置到搜索結(jié)果頁(yè)中進(jìn)行展現(xiàn),無(wú)需用戶通過(guò)多次操作去網(wǎng)站查找相關(guān)資訊信息,降低了用戶的檢索成本。
在此處所提供的說(shuō)明書(shū)中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書(shū)的理解。
類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開(kāi)并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開(kāi)的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書(shū)所反映的那樣,發(fā)明方面在于少于前面公開(kāi)的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書(shū)由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在權(quán)利要求書(shū)中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
至此,本領(lǐng)域技術(shù)人員應(yīng)認(rèn)識(shí)到,雖然本文已詳盡示出和描述了本發(fā)明的多個(gè)示例性實(shí)施例,但是,在不脫離本發(fā)明精神和范圍的情況下,仍可根據(jù)本發(fā)明公開(kāi)的內(nèi)容直接確定或推導(dǎo)出符合本發(fā)明原理的許多其他變型或修改。因此,本發(fā)明的范圍應(yīng)被理解和認(rèn)定為覆蓋了所有這些其他變型或修改。
本發(fā)明實(shí)施例的一方面,提供了A1、一種在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的方法,包括:
收集針對(duì)餐飲類的多個(gè)用戶生成內(nèi)容UGC網(wǎng)站,并從所述多個(gè)UGC網(wǎng)站中抓取餐飲類資訊信息;
對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容;
當(dāng)接收到來(lái)自用戶的與餐飲類相關(guān)的目標(biāo)搜索詞時(shí),將所述目標(biāo)搜索詞與生成的所述結(jié)構(gòu)化的餐飲類資訊內(nèi)容中的屬性名稱進(jìn)行匹配,得到匹配的屬性名稱對(duì)應(yīng)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容;
在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶。
A2、根據(jù)A1所述的方法,其中,從所述多個(gè)UGC網(wǎng)站中抓取餐飲類資訊信息,包括:
從所述多個(gè)UGC網(wǎng)站中篩選出至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站;
從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
A3、根據(jù)A1或A2所述的方法,其中,從所述多個(gè)UGC網(wǎng)站中篩選出至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站,包括:
確定一個(gè)或多個(gè)衡量因子;
根據(jù)確定的所述一個(gè)或多個(gè)衡量因子衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況,并從中篩選出質(zhì)量滿足指定質(zhì)量條件的至少一個(gè)UGC網(wǎng)站作為優(yōu)質(zhì)UGC網(wǎng)站。
A4、根據(jù)A1-A3中任一項(xiàng)所述的方法,其中,當(dāng)衡量因子包括多個(gè)時(shí),根據(jù)確定的所述多個(gè)衡量因子衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況,包括:
基于權(quán)重策略確定所述多個(gè)衡量因子各自的權(quán)重;
獲取所述多個(gè)UGC網(wǎng)站的所述多個(gè)衡量因子各自的數(shù)值;
將所述多個(gè)UGC網(wǎng)站的所述多個(gè)衡量因子各自的數(shù)值與權(quán)重進(jìn)行加權(quán)求和,得到綜合數(shù)值;
根據(jù)所述多個(gè)UGC網(wǎng)站各自的綜合數(shù)值衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況。
A5、根據(jù)A1-A4中任一項(xiàng)所述的方法,其中,從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息,包括:
從指定網(wǎng)站中獲取針對(duì)餐飲類的店名,并生成包含所述店名的詞表;
基于所述詞表從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
A6、根據(jù)A1-A5中任一項(xiàng)所述的方法,其中,對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容,包括:
確定用于對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理的屬性名稱;
基于所述屬性名稱從抓取的所述餐飲類資訊信息中提取相應(yīng)的屬性內(nèi)容,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容。
A7、根據(jù)A1-A6中任一項(xiàng)所述的方法,其中,所述屬性名稱包括下列至少之一:
店名、人均消費(fèi)、優(yōu)惠信息、打分、評(píng)價(jià)關(guān)鍵字、簡(jiǎn)介、相關(guān)菜品、同類型餐館、附近餐館。
A8、根據(jù)A1-A7中任一項(xiàng)所述的方法,其中,所述結(jié)構(gòu)化的餐飲類資訊內(nèi)容中還包括餐飲類新聞內(nèi)容。
A9、根據(jù)A1-A8中任一項(xiàng)所述的方法,其中,在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶,包括:
將所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容聚合至所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)的右側(cè)區(qū)域展現(xiàn)給所述用戶。
A10、根據(jù)A1-A9中任一項(xiàng)所述的方法,其中,在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶之后,所述方法還包括:
統(tǒng)計(jì)用戶針對(duì)所述搜索結(jié)果頁(yè)上展現(xiàn)的所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容的觸發(fā)操作,得到統(tǒng)計(jì)結(jié)果;
根據(jù)所述統(tǒng)計(jì)結(jié)果確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中是否展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
A11、根據(jù)A1-A10中任一項(xiàng)所述的方法,其中,根據(jù)所述統(tǒng)計(jì)結(jié)果確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中是否展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,包括:
若所述統(tǒng)計(jì)結(jié)果為所述觸發(fā)操作的數(shù)量小于指定閾值,則確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中不再展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
本發(fā)明實(shí)施例的另一方面,還提供了B12、一種在搜索結(jié)果頁(yè)中聚合餐飲類資訊信息的裝置,包括:
抓取模塊,適于收集針對(duì)餐飲類的多個(gè)用戶生成內(nèi)容UGC網(wǎng)站,并從所述多個(gè)UGC網(wǎng)站中抓取餐飲類資訊信息;
生成模塊,適于對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容;
匹配模塊,適于當(dāng)接收到來(lái)自用戶的與餐飲類相關(guān)的目標(biāo)搜索詞時(shí),將所述目標(biāo)搜索詞與生成的所述結(jié)構(gòu)化的餐飲類資訊內(nèi)容中的屬性名稱進(jìn)行匹配,得到匹配的屬性名稱對(duì)應(yīng)的結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容;
聚合模塊,適于在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶。
B13、根據(jù)B12所述的裝置,其中,所述抓取模塊包括:
篩選單元,適于從所述多個(gè)UGC網(wǎng)站中篩選出至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站;
抓取單元,適于從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
B14、根據(jù)B12或B13所述的裝置,其中,所述篩選單元還適于:
確定一個(gè)或多個(gè)衡量因子;
根據(jù)確定的所述一個(gè)或多個(gè)衡量因子衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況,并從中篩選出質(zhì)量滿足指定質(zhì)量條件的至少一個(gè)UGC網(wǎng)站作為優(yōu)質(zhì)UGC網(wǎng)站。
B15、根據(jù)B12-B14中任一項(xiàng)所述的裝置,其中,所述篩選單元還適于:
當(dāng)衡量因子包括多個(gè)時(shí),基于權(quán)重策略確定所述多個(gè)衡量因子各自的權(quán)重;
獲取所述多個(gè)UGC網(wǎng)站的所述多個(gè)衡量因子各自的數(shù)值;
將所述多個(gè)UGC網(wǎng)站的所述多個(gè)衡量因子各自的數(shù)值與權(quán)重進(jìn)行加權(quán)求和,得到綜合數(shù)值;
根據(jù)所述多個(gè)UGC網(wǎng)站各自的綜合數(shù)值衡量出所述多個(gè)UGC網(wǎng)站的質(zhì)量情況。
B16、根據(jù)B12-B15中任一項(xiàng)所述的裝置,其中,所述抓取單元還適于:
從指定網(wǎng)站中獲取針對(duì)餐飲類的店名,并生成包含所述店名的詞表;
基于所述詞表從所述至少一個(gè)優(yōu)質(zhì)UGC網(wǎng)站中抓取餐飲類資訊信息。
B17、根據(jù)B12-B16中任一項(xiàng)所述的裝置,其中,所述生成模塊還適于:
確定用于對(duì)抓取的所述餐飲類資訊信息進(jìn)行處理的屬性名稱;
基于所述屬性名稱從抓取的所述餐飲類資訊信息中提取相應(yīng)的屬性內(nèi)容,生成具有屬性名稱和屬性內(nèi)容的結(jié)構(gòu)化的餐飲類資訊內(nèi)容。
B18、根據(jù)B12-B17中任一項(xiàng)所述的裝置,其中,所述屬性名稱包括下列至少之一:
店名、人均消費(fèi)、優(yōu)惠信息、打分、評(píng)價(jià)關(guān)鍵字、簡(jiǎn)介、相關(guān)菜品、同類型餐館、附近餐館。
B19、根據(jù)B12-B18中任一項(xiàng)所述的裝置,其中,所述結(jié)構(gòu)化的餐飲類資訊內(nèi)容中還包括餐飲類新聞內(nèi)容。
B20、根據(jù)B12-B19中任一項(xiàng)所述的裝置,其中,所述聚合模塊還適于:
將所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容聚合至所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)的右側(cè)區(qū)域展現(xiàn)給所述用戶。
B21、根據(jù)B12-B20中任一項(xiàng)所述的裝置,其中,還包括:
統(tǒng)計(jì)模塊,適于在所述聚合模塊在所述目標(biāo)搜索詞對(duì)應(yīng)的搜索結(jié)果頁(yè)中聚合所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容,并展現(xiàn)給所述用戶之后,統(tǒng)計(jì)用戶針對(duì)所述搜索結(jié)果頁(yè)上展現(xiàn)的所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容的觸發(fā)操作,得到統(tǒng)計(jì)結(jié)果;
確定模塊,適于根據(jù)所述統(tǒng)計(jì)結(jié)果確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中是否展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。
B22、根據(jù)B12-B21中任一項(xiàng)所述的裝置,其中,所述確定模塊還適于:
若所述統(tǒng)計(jì)結(jié)果為所述觸發(fā)操作的數(shù)量小于指定閾值,則確定在后續(xù)搜索請(qǐng)求對(duì)應(yīng)的頁(yè)面中不再展現(xiàn)所述結(jié)構(gòu)化的目標(biāo)餐飲類資訊內(nèi)容。