本發(fā)明涉及互聯(lián)網(wǎng)應用技術領域,特別是一種影視劇類關鍵詞搜索展現(xiàn)方法及裝置。
背景技術:
隨著信息技術的飛速發(fā)展,當今社會進入了信息爆炸時代,人們越來越多地借助網(wǎng)絡來尋找自己需要的信息,因此,檢索成為人們工作、生活不可或缺的一部分。
人們通常使用搜索引擎來進行檢索,搜索引擎是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務,將與用戶檢索相關的信息展示給用戶的系統(tǒng)。
現(xiàn)代網(wǎng)絡有大量的用戶貢獻內(nèi)容,如論壇帖,微信公眾號、頭條號以及興趣部落帖子等,這類網(wǎng)站被稱為用戶原創(chuàng)內(nèi)容(UGC,User-generated Content)或者專業(yè)生產(chǎn)內(nèi)容(PGC,Professionally-generated Content),在本申請中,這類網(wǎng)站統(tǒng)稱為UGC網(wǎng)站。目前,這些UGC網(wǎng)站中也有很多優(yōu)質資訊,但目前在各家搜索引擎產(chǎn)品中沒有充分挖掘UGC網(wǎng)站中的資訊,搜索結果并不能充分包含這些UGC網(wǎng)站中的內(nèi)容。
發(fā)明人在發(fā)現(xiàn)本發(fā)明的過程中發(fā)現(xiàn),某些優(yōu)質的UGC網(wǎng)站上的資訊在內(nèi)容上有它自己的優(yōu)勢,例如,1、數(shù)據(jù)獨家:來源于個人;2、能引起共鳴:類似貼吧,一個好的帖子會有很多人評論;3、與現(xiàn)實搜索結果互補:同一query(搜索詞),UGC數(shù)據(jù)可以補充引擎結果,同時延展閱讀性。特別是針對影視劇類的query,某些UGC網(wǎng)站的資訊信息更能滿足用戶的需求。
目前,針對如何為用戶提供包括UGC網(wǎng)站上的影視劇類資訊信息的搜索結果的問題,還沒有有效的解決方案。
技術實現(xiàn)要素:
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的影視劇類關鍵詞搜索展現(xiàn)方法及相應的裝置。
依據(jù)本發(fā)明的一方面,提供了一種影視劇類關鍵詞搜索展現(xiàn)方法,包括:確定N個影視劇關鍵詞,其中,N為整數(shù),且N大于1;從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻;將獲取的與所述各個影視劇關鍵詞相關的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中;響應用戶在搜索引擎上輸入的目標搜索詞,從互聯(lián)網(wǎng)中搜索與所述目標搜索詞匹配的結果,并在所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找與所述目標搜索詞匹配的資訊信息和/或視頻;在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找到與所述目標搜索詞匹配的資訊信息和/或視頻的情況下,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶。
可選地,將獲取的與所述各個影視劇關鍵詞相關的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中,包括:按照獲取的每條所述資訊信息和/或視頻相關的影視劇關鍵詞進行分類存儲到所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中,并根據(jù)每條資訊信息和/或視頻的內(nèi)容屬性對分類存儲的每條資訊信息和/或視頻進行排序。
可選地,所述內(nèi)容屬性包括以下至少之一:內(nèi)容的類型、內(nèi)容發(fā)布時間、內(nèi)容的評論數(shù)、以及內(nèi)容的查看數(shù)。
可選地,在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中找到到與所述目標搜索詞匹配的視頻的情況下,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶,包括:在所述搜索結果頁播放查找到的所述視頻,并在所述搜索結果頁顯示查找到的所述資訊信息和/或視頻的文字鏈接。
可選地,對于專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站,從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻,包括:在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站分別搜索所述N個影視劇關鍵詞,從搜索結果中從所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻;或者,在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站發(fā)布的資訊信息中標注影視劇類的資訊和視頻,從標注的影視劇類資訊和視頻中分別提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
可選地,對于網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站,從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻,包括:在所述網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站中分別確定與所述N個影視劇關鍵詞中的每個所述影視劇關鍵詞相關的主題社區(qū),從所述相關的主題社區(qū)中選擇最大的一個或多個主題社區(qū),在所述一個或多個主題社區(qū)發(fā)布的資訊的名稱title或正文中搜索所述N個影視劇關鍵詞,根據(jù)搜索結果,從所述一個或多個主題社區(qū)中提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
可選地,對于網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站,從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻,包括:獲取所述網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站中發(fā)表問題的類別為影視劇類相關的資訊;從所述發(fā)表問題的類別為影視劇類相關的資訊中分別查找名稱和/或正文包含有所述N個影視劇關鍵詞中一個或多個的資訊;從查找結果中提取的與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
可選地,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶,包括:在所述搜索結果頁的左側顯示從互聯(lián)網(wǎng)上搜索所述目標搜索詞的結果;判斷查找到的所述資訊信息和/或視頻中是否存在與所述搜索結果頁左側展現(xiàn)的結果中相同的資訊信息和/或視頻,如果有,則將查找到的所述資訊信息和/或視頻中的所述相同的資訊信息和/或視頻去除;將去除所述相同的資訊信息和/視頻后的所述查找到的資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁的右側區(qū)域展現(xiàn)給用戶。
可選地,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶之后,所述方法還包括:統(tǒng)計用戶針對所述搜索結果頁上展現(xiàn)的各個所述查找到的資訊信息和/或視頻的觸發(fā)操作,得到統(tǒng)計結果;根據(jù)所述統(tǒng)計結果確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)各個所述查找到的資訊信息和/或視頻。
可選地,根據(jù)所述統(tǒng)計結果確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)各個所述查找到的資訊信息和/或視頻,包括:確定在后續(xù)搜索請求對應的頁面中不再展現(xiàn)所述查找到的資訊信息和/或視頻中,所述觸發(fā)操作的數(shù)量小于指定閾值的資訊信息和/或視頻。
依據(jù)本發(fā)明另一個方面,提供了一種影視劇類關鍵詞搜索展現(xiàn)裝置,包括:確定模塊,用于確定N個影視劇關鍵詞,其中,N為整數(shù),且N大于1;獲取模塊,用于從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻;存儲模塊,用于將獲取的與所述各個影視劇關鍵詞相關的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中;搜索模塊,用于響應用戶在搜索引擎上輸入的目標搜索詞,從互聯(lián)網(wǎng)中搜索與所述目標搜索詞匹配的結果,并在所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找與所述目標搜索詞匹配的資訊信息和/或視頻;展現(xiàn)模塊,用于在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找到與所述目標搜索詞匹配的資訊信息和/或視頻的情況下,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶。
可選地,所述獲取模塊具體用于按照以下方式將獲取的與所述各個影視劇關鍵詞相關的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中:按照獲取的每條所述資訊信息和/或視頻相關的影視劇關鍵詞進行分類存儲到所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中,并根據(jù)每條資訊信息和/或視頻的內(nèi)容屬性對分類存儲的每條資訊信息和/或視頻進行排序。
可選地,在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中找到到與所述目標搜索詞匹配的視頻的情況下,所述展現(xiàn)模塊具體用于按照以下方式將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶:在所述搜索結果頁播放查找到的所述視頻,并在所述搜索結果頁顯示查找到的所述資訊信息和/或視頻的文字鏈接。
可選地,對于專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站,所述獲取模塊具體用于按照以下方式獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻:在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站分別搜索所述N個影視劇關鍵詞,從搜索結果中從所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻;或者,在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站發(fā)布的資訊信息中標注影視劇類的資訊和視頻,從標注的影視劇類資訊和視頻中分別提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
可選地,對于網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站,所述獲取模塊具體用于按照以下方式獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻:在所述網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站中分別確定與所述N個影視劇關鍵詞中的每個所述影視劇關鍵詞相關的主題社區(qū),從所述相關的主題社區(qū)中選擇最大的一個或多個主題社區(qū),在所述一個或多個主題社區(qū)發(fā)布的資訊的名稱title或正文中搜索所述N個影視劇關鍵詞,根據(jù)搜索結果,從所述一個或多個主題社區(qū)中提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
可選地,對于網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站,所述獲取模塊具體用于按照以下方式獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻:獲取所述網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站中發(fā)表問題的類別為影視劇類相關的資訊;從所述發(fā)表問題的類別為影視劇類相關的資訊中分別查找名稱和/或正文包含有所述N個影視劇關鍵詞中一個或多個的資訊;從查找結果中提取的與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
可選地,所述展現(xiàn)模塊具體用于按照以下方式將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶:在所述搜索結果頁的左側顯示從互聯(lián)網(wǎng)上搜索所述目標搜索詞的結果;判斷查找到的所述資訊信息和/或視頻中是否存在與所述搜索結果頁左側展現(xiàn)的結果中相同的資訊信息和/或視頻,如果有,則將查找到的所述資訊信息和/或視頻中的所述相同的資訊信息和/或視頻去除;將去除所述相同的資訊信息和/視頻后的所述查找到的資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁的右側區(qū)域展現(xiàn)給用戶。
可選地,還包括:統(tǒng)計模塊,用于在將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶之后,統(tǒng)計用戶針對所述搜索結果頁上展現(xiàn)的各個所述查找到的資訊信息和/或視頻的觸發(fā)操作,得到統(tǒng)計結果;判斷模塊,用于根據(jù)所述統(tǒng)計結果確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)各個所述查找到的資訊信息和/或視頻。
可選地,所述判斷模塊具體用于按照以下方式確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)各個所述查找到的資訊信息和/或視頻:確定在后續(xù)搜索請求對應的頁面中不再展現(xiàn)所述查找到的資訊信息和/或視頻中,所述觸發(fā)操作的數(shù)量小于指定閾值的資訊信息和/或視頻。
在本發(fā)明實施例中,首先從UGC網(wǎng)站中抓取影視劇類關鍵詞相關的資訊信息和/或視頻,將抓取的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中,在接收到用戶在搜索引擎上輸入的與影視劇類相關的目標搜索詞時,在從互聯(lián)網(wǎng)中搜索目標搜索詞的同時,從影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找與目標搜索詞匹配的資訊信息和/或視頻,并將從的影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找到的資訊信息和/或視頻聚合至目標搜索詞對應的搜索結果頁展現(xiàn)給用戶。由此可見,在本發(fā)明實施例提供的技術方案中,能夠在搜索結果頁中聚合UGC網(wǎng)站的影視劇類資訊信息,從而可以為用戶提供更全面的資訊信息,擴寬內(nèi)容覆蓋面。進一步地,影視劇類資訊內(nèi)容數(shù)據(jù)庫來自各個UGC網(wǎng)站,將各個UGC網(wǎng)站中的數(shù)據(jù)前置到搜索結果頁中進行展現(xiàn),無需用戶通過多次操作去網(wǎng)站查找相關資訊信息,降低了用戶的檢索成本。
上述說明僅是本發(fā)明技術方案的概述,為了能夠更清楚了解本發(fā)明的技術手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。
根據(jù)下文結合附圖對本發(fā)明具體實施例的詳細描述,本領域技術人員將會更加明了本發(fā)明的上述以及其他目的、優(yōu)點和特征。
附圖說明
通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
圖1示出了根據(jù)本發(fā)明一實施例的影視劇類關鍵詞搜索展現(xiàn)方法的流程圖;
圖2示出了根據(jù)本發(fā)明另一實施例的聚合有影視劇類資訊信息和/或視頻的搜索結果頁的示意圖;
圖3示出了根據(jù)本發(fā)明一實施例的影視劇類關鍵詞搜索展現(xiàn)裝置的結構示意圖;以及
圖4示出了根據(jù)本發(fā)明另一實施例的影視劇類關鍵詞搜索展現(xiàn)裝置的結構示意圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現(xiàn)本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。
為解決上述技術問題,本發(fā)明實施例提供了一種在搜索結果頁中聚合影視劇類資訊信息的方法,該方法可以應用在個人電腦、智能手機、平板電腦等終端設備上。圖1示出了根據(jù)本發(fā)明一實施例的在搜索結果頁中聚合影視劇類資訊信息的方法的流程圖。如圖1所示,該方法至少可以包括以下步驟S102至步驟S110。
步驟S102,確定N個影視劇關鍵詞,其中,N為整數(shù),且N大于1。
在具體應用中,N個影視劇關鍵詞可以根據(jù)預定數(shù)據(jù)庫中各個關鍵詞的點擊率和/或搜索率確定。例如,可以為360熱榜和影視站中排名或點擊率和/或搜索率最靠前的N名影視劇名組成所述N個影視劇關鍵詞,其中,N的取值可以根據(jù)具體應用確定,在本實施例中并不作限定。
步驟S104,從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻;
在該步驟中,UGC(User Gernerated Content,用戶生產(chǎn)內(nèi)容),其也被稱為UCC(User Created Content,用戶創(chuàng)建內(nèi)容),可以包括用戶創(chuàng)作的文字內(nèi)容,用戶拍攝的圖片以及用戶錄制的視頻、音頻等等。此外,PGC(Professional Generated Content,專業(yè)生產(chǎn)內(nèi)容),它是UGC的衍生概念,UGC的好處是用戶可以自由上傳內(nèi)容,豐富網(wǎng)站內(nèi)容,但不利的方面在于內(nèi)容的質量良莠不齊。與UGC相比,PGC分類更專業(yè),內(nèi)容質量也更有保證,其內(nèi)容設置及產(chǎn)品編輯均非常專業(yè)。其實,UGC和PGC兩者并不矛盾,不但并行不悖,而且需要相輔相成。一個成熟的互聯(lián)網(wǎng)內(nèi)容向產(chǎn)品,不論網(wǎng)站還是社區(qū)、視頻平臺、音頻平臺、甚至新形態(tài)下的媒體,都需要深度和廣度兩個方面并行。結合自身的特點,UGC負責內(nèi)容廣度,主要貢獻流量和參與度,而PGC維持內(nèi)容深度,主要樹立品牌、創(chuàng)造價值,兩者缺一不可。由于PGC是UGC的衍生概念,在本發(fā)明實施例中不妨將PGC作為UGC的一部分。
在具體應用中,由于UGC提供的內(nèi)容的質量良莠不齊,本發(fā)明實施例為了增加影視劇類資訊內(nèi)容的可信度,在該步驟中從多個UGC網(wǎng)站中抓取影視劇類資訊信息時,可以從多個UGC網(wǎng)站中篩選出至少一個優(yōu)質UGC網(wǎng)站,進而從至少一個優(yōu)質UGC網(wǎng)站中抓取影視劇類資訊信息。
進一步地,在從多個UGC網(wǎng)站中篩選出至少一個優(yōu)質UGC網(wǎng)站時,可以通過一些衡量因子來篩選。具體地,確定一個或多個衡量因子,根據(jù)確定的一個或多個衡量因子衡量出多個UGC網(wǎng)站的質量情況,并從中篩選出質量滿足指定質量條件的至少一個UGC網(wǎng)站作為優(yōu)質UGC網(wǎng)站。這里的衡量因子可以如網(wǎng)站的可信度、網(wǎng)站上注冊的用戶數(shù)、網(wǎng)站的訪問量等等。
當衡量因子包括多個時,在根據(jù)多個衡量因子來衡量多個UGC網(wǎng)站的質量情況時,本發(fā)明實施例提供了一種可選的方案,在該方案中,可以基于權重策略確定多個衡量因子各自的權重,獲取多個UGC網(wǎng)站的多個衡量因子各自的數(shù)值;隨后將多個UGC網(wǎng)站的多個衡量因子各自的數(shù)值與權重進行加權求和,得到綜合數(shù)值,進而根據(jù)多個UGC網(wǎng)站各自的綜合數(shù)值衡量出多個UGC網(wǎng)站的質量情況。
例如,多個UGC網(wǎng)站為網(wǎng)站1、網(wǎng)站2、網(wǎng)站3、網(wǎng)站4和網(wǎng)站5,多個衡量因子為網(wǎng)站的可信度、網(wǎng)站上注冊的用戶數(shù)、網(wǎng)站的訪問量,網(wǎng)站1的多個衡量因子各自的數(shù)值分別為p11、p12、p13,網(wǎng)站2的多個衡量因子各自的數(shù)值分別為p21、p22、p23,網(wǎng)站3的多個衡量因子各自的數(shù)值分別為p31、p32、p33,網(wǎng)站4的多個衡量因子各自的數(shù)值分別為p41、p42、p43,網(wǎng)站5的多個衡量因子各自的數(shù)值分別為p51、p52、p53。確定多個衡量因子各自的權重為w1、w2、w3,將多個UGC網(wǎng)站的多個衡量因子各自的數(shù)值與權重進行加權求和,得到多個UGC網(wǎng)站的綜合數(shù)值。不妨以網(wǎng)站1和網(wǎng)站2為例,加權求和后網(wǎng)站1的綜合數(shù)值為p11×w1+p12×w2+p13×w3,網(wǎng)站2的綜合數(shù)值為p21×w1+p22×w2+p23×w3,網(wǎng)站3、網(wǎng)站4和網(wǎng)站5以此類推,此處不再一一贅述。
另外,在本實施例中,可以針對不同類型的UGC網(wǎng)站,采用不同的抓取策略。
例如,在本發(fā)明實施例的一個可選實施方案中,對于專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站,例如,頭條號、愛奇藝、優(yōu)酷等視頻網(wǎng)站,從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻,包括:
在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站分別搜索所述N個影視劇關鍵詞,從搜索結果中從所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻;例如,可以在頭條號或愛奇藝或優(yōu)酷等網(wǎng)站的搜索框中分別輸入影視劇類預設詞表中各個影視劇類預設詞進行搜索,按發(fā)布時間抓取各個影視劇類預設詞相關的資訊信息和/或視頻;或者,
在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站發(fā)布的資訊信息中標注影視劇類的資訊和視頻,從標注的影視劇類資訊和視頻中分別提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。例如,可以在頭條號上人工標注影視劇類的頭條號,在這些頭條號里進行數(shù)據(jù)抓取,然后按照抓取的資訊信息和/或視頻的title里包含的人名進行歸類。
又例如,在本發(fā)明實施例的另一個可選實施方案中,對于網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站,例如,興趣部落或豆瓣等,從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻,包括:在所述網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站中分別確定與所述N個影視劇關鍵詞中的每個所述影視劇關鍵詞相關的主題社區(qū),從所述相關的主題社區(qū)中選擇最大的一個或多個主題社區(qū),在所述一個或多個主題社區(qū)發(fā)布的資訊的名稱title或正文中搜索所述N個影視劇關鍵詞,根據(jù)搜索結果,從所述一個或多個主題社區(qū)中提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。例如,在興趣部落中,針對影視劇類預設詞表中各個影視劇類預設詞,例如,大圣歸來,先定位目標影視劇有多少部落,例如,大圣歸來社區(qū),然后選擇最大部落進行抓取(例如,可以依據(jù)關注度),title或文章正文包含關鍵字(例如,大圣歸來)的資訊信息。
又例如,在本發(fā)明實施例的又一個可選實施方案中,對于網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站,例如,知乎網(wǎng),從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻,包括:獲取所述網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站中發(fā)表問題的類別為影視劇類相關的資訊;從所述發(fā)表問題的類別為影視劇類相關的資訊中分別查找名稱和/或正文包含有所述N個影視劇關鍵詞中一個或多個的資訊;從查找結果中提取的與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。例如,可以先判斷知乎發(fā)表問題的類別是否跟影視劇有關(例如,問題為:大圣歸來的主演是誰),如果有關,則進一步判斷該問題及答案中是否包含影視劇類預設詞表中的影視劇類預設詞(例如,大圣歸來),如果包含,則抓取該問題及答案作為對應影視劇類預設詞相關的資訊信息。
步驟S106,將獲取的與所述各個影視劇關鍵詞相關的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中。
在具體應用中,在執(zhí)行步驟S106時,優(yōu)選地,可以按照獲取的每條所述資訊信息和/或視頻相關的影視劇關鍵詞進行分類存儲到所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中,并根據(jù)每條資訊信息和/或視頻的內(nèi)容屬性對分類存儲的每條資訊信息和/或視頻進行排序。例如,將與“大圣歸來”相關的資訊信息和/或視頻聚集在一起放置。按照該方式對影視劇類資訊內(nèi)容數(shù)據(jù)庫進行排序處理,可以使用數(shù)據(jù)庫中的內(nèi)容按影視劇關鍵詞進行排序,方便后續(xù)搜索使用。
即在本實施例中,在抓取到資訊信息和/或視頻之后,先對抓取的資訊信息和/或視頻按照每條資訊信息和/或視頻相關的影視劇類預設詞進行分類,生成具有影視劇類預設詞和資訊信息和/或視頻的內(nèi)容屬性的結構化的影視劇類資訊內(nèi)容數(shù)據(jù)庫。即,該影視劇類資訊內(nèi)容數(shù)據(jù)庫可以包括三個屬性列:影視劇類預設詞、資訊信息和/或視頻的內(nèi)容屬性和資訊內(nèi)容。其中,資訊信息和/或視頻的內(nèi)容屬性可以包括多項,例如,資訊的發(fā)布時間、資訊的評論數(shù)等,而資訊內(nèi)容中可以包括資訊的標題(tittle)及資訊的鏈接地址。表1為本實施例中影視劇類資訊內(nèi)容數(shù)據(jù)庫的結構的一種示例。
表1
在本發(fā)明實施例的一個可選實施方案中,進一步,在步驟S106得到影視劇類資訊內(nèi)容數(shù)據(jù)庫進,還可以根據(jù)每條資訊信息的資訊信息和/或視頻的內(nèi)容屬性進行優(yōu)化排序。其中,資訊信息和/或視頻的內(nèi)容屬性可以包括:內(nèi)容的類型(例如,資訊信息或視頻)、發(fā)布時間、查看數(shù)和/或評論數(shù)等,即在影視劇類資訊內(nèi)容數(shù)據(jù)庫可以按照資訊的時效性和/或熱度進行排序,以提高后續(xù)的搜索效率。
本發(fā)明實施例提供了一種可選的方案,在該方案中,可以確定用于對抓取的影視劇類資訊信息進行處理的影視劇類關鍵詞,進而基于確定的影視劇類關鍵詞從抓取的影視劇類資訊信息中提取相應的屬性內(nèi)容。在本實施例中,影視劇類關鍵詞可以是影視劇名、影視劇的導演或影視劇的編劇等等,本發(fā)明實施例不限于此。
步驟S108,響應用戶在搜索引擎上輸入的目標搜索詞,從互聯(lián)網(wǎng)中搜索與所述目標搜索詞匹配的結果,并在所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找與所述目標搜索詞匹配的資訊信息和/或視頻。
在本實施例中,在接收到用戶輸入的目標搜索詞時,可以先判斷所述目標搜索詞是否命中所述N個影視劇類關鍵詞中的一個或多個,如果是,則在從互聯(lián)網(wǎng)中搜索與所述目標搜索詞匹配的結果時,同時在所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找與所述目標搜索詞匹配的資訊信息和/或視頻,否則,按照正常的搜索模式進行搜索,只從互聯(lián)網(wǎng)中搜索所述目標搜索詞。
步驟S110,在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找到與所述目標搜索詞匹配的資訊信息和/或視頻的情況下,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶。
在本實施例中,在步驟S110中,在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中找到到與所述目標搜索詞匹配的視頻的情況下,在步驟S110中,在向用戶展現(xiàn)查找到的所述資訊信息和/或視頻時,如圖2所示,可以在所述搜索結果頁播放查找到的所述視頻,并在所述搜索結果頁顯示查找到的所述資訊信息和/或視頻的文字鏈接。
在本發(fā)明實施例的一個可選實施方案中,如果在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中沒有查找到與所述目標搜索詞匹配的資訊信息和/或視頻的情況下,則在所述目標搜索詞對應的搜索結果頁展現(xiàn)從互聯(lián)網(wǎng)搜索到的結果。
在本實施例中,從影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找到的結果可以作為搜索引擎從互聯(lián)網(wǎng)上進行搜索得到搜索結果的補充,因此,在本發(fā)明實施例的一個可選實施方案中,步驟S110可以包括以下步驟:
步驟1,在所述搜索結果頁的左側顯示從互聯(lián)網(wǎng)上搜索所述目標搜索詞的結果;
步驟2,判斷查找到的所述資訊信息和/或視頻中是否存在與所述搜索結果頁左側展現(xiàn)的結果中相同的資訊信息和/或視頻,如果有,則將查找到的所述資訊信息和/或視頻中的所述相同的資訊信息和/或視頻去除;
步驟3,將去除所述相同的資訊信息和/視頻后的所述查找到的資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁的右側區(qū)域展現(xiàn)給用戶。即,在上述可選實施方式中,搜索結果頁上包括兩個區(qū)域:左側區(qū)域和右側區(qū)域,在本實施例中,左側區(qū)域用于展現(xiàn)搜索引擎在互聯(lián)網(wǎng)搜索目標搜索詞得到的結果,例如,像現(xiàn)在baidu、google等搜索引擎的搜索結果頁左側展現(xiàn)的內(nèi)容,右側區(qū)域用于展現(xiàn)在影視劇類資訊內(nèi)容數(shù)據(jù)庫搜索到的結果,從而可以擴展搜索結果頁右側區(qū)域的內(nèi)容,為用戶提供更完整的搜索結果。并且,在該可選實施方式中,左側和右側顯示的內(nèi)容沒有重合,從而可以保證檢索結果的唯一性。
在上述可選實施方式中,為了進一步使得右側展現(xiàn)的內(nèi)容能夠符合用戶的需求,在本發(fā)明實施例的一個可選實施方案中,將所述匹配的資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶之后,所述方法還包括:統(tǒng)計用戶針對所述搜索結果頁上展現(xiàn)的所述匹配的資訊信息和/或視頻的觸發(fā)操作,得到統(tǒng)計結果;根據(jù)所述統(tǒng)計結果確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)所述匹配的資訊信息和/或視頻。其中,用戶針對所述搜索結果頁上展現(xiàn)的所述匹配的資訊信息和/或視頻的觸發(fā)操作可以是展現(xiàn)的所述匹配的資訊信息和/或視頻的CTR(Click To Rate,點擊率),即根據(jù)影視劇類資訊內(nèi)容數(shù)據(jù)庫中的資訊信息和/或視頻展現(xiàn)后的點擊率確定后續(xù)在搜索到該條資訊信息和/或視頻時,是否還在搜索頁的右側展現(xiàn)該條資訊信息和/或視頻。
進一步地,在上述可選實施方式中,在根據(jù)所述統(tǒng)計結果確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)所述匹配的資訊信息和/或視頻時,可以判斷所述統(tǒng)計結果是否為所述觸發(fā)操作的數(shù)量小于指定閾值,如果是,則確定在后續(xù)搜索請求對應的頁面中不再展現(xiàn)所述匹配的資訊信息和/或視頻。
在具體應用中,可以按照指定時間(如1或2小時等)周期判斷資訊信息和/或視頻的CTR,并根據(jù)判斷結果進行相應的處理。
另外,在本實施例中,還可以定期檢測抓取的UGC網(wǎng)站中與影視劇類預設詞表中各個影視劇類預設詞相關的資訊信息和/或視頻是否為更新,如果有,則抓取新的資訊信息和/或視頻到影視劇類資訊內(nèi)容數(shù)據(jù)庫進行更新,在更新之后,將影視劇類資訊內(nèi)容數(shù)據(jù)中每條資訊信息和/或視頻的點擊率CTR進行清空,即更新之后,再命中影視劇類資訊內(nèi)容數(shù)據(jù)庫中的資訊信息和/或視頻之后,無論該條資訊信息和/或視頻之前的CTR是高還是低,本次都在搜索結果頁展現(xiàn)該條資訊信息和/或視頻,并再次統(tǒng)計各條資訊信息和/或視頻的CTR,并在指定時間周期到達之后判斷該資訊信息和/或視頻的CTR是否大于閾值,進而判斷在后續(xù)的檢測結果中是否展現(xiàn)該資訊信息和/或視頻。
在本發(fā)明實施例中,在接收到用戶在搜索引擎上輸入的與影視劇類相關的目標搜索詞時,先判斷目標搜索詞是否命中影視劇類預設詞表,如果是,則在從UGC網(wǎng)站中抓取的數(shù)據(jù)組成的結構化的影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找與目標搜索詞匹配的資訊信息和/或視頻,并將從結構化的影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找到的資訊信息和/或視頻聚合至目標搜索詞對應的搜索結果頁展現(xiàn)給用戶。由此可見,在本發(fā)明實施例提供的技術方案中,能夠在搜索結果頁中聚合UGC網(wǎng)站的影視劇類資訊信息和/或視頻,從而可以為用戶提供更全面的資訊信息和/或視頻,擴寬內(nèi)容覆蓋面。并且,由于影視劇類資訊內(nèi)容數(shù)據(jù)庫具有影視劇類預設詞和資訊信息和/或視頻的內(nèi)容屬性的結構化特點,具有可讀性,能夠幫助用戶快速地找到需要的信息。進一步地,影視劇類資訊內(nèi)容數(shù)據(jù)庫來自各個UGC網(wǎng)站,將各個UGC網(wǎng)站中的數(shù)據(jù)前置到搜索結果頁中進行展現(xiàn),無需用戶通過多次操作去網(wǎng)站查找相關資訊信息和/或視頻,降低了用戶的檢索成本。
需要說明的是,實際應用中,上述所有可選實施方式可以采用結合的方式任意組合,形成本發(fā)明的可選實施例,在此不再一一贅述。
基于上文各個實施例提供的在搜索結果頁中聚合影視劇類資訊信息的方法,基于同一發(fā)明構思,本發(fā)明實施例還提供了一種在搜索結果頁中聚合影視劇類資訊信息的裝置。
圖3示出了根據(jù)本發(fā)明一實施例的影視劇類關鍵詞搜索展現(xiàn)裝置的結構示意圖。如圖3所示,該裝置至少可以包括確定模塊310、獲取模塊320、存儲模塊330、搜索模塊340以及展現(xiàn)模塊350。
現(xiàn)介紹本發(fā)明實施例的在搜索結果頁中聚合影視劇類資訊信息的裝置的各組成或器件的功能以及各部分間的連接關系:
確定模塊310,用于確定N個影視劇關鍵詞,其中,N為整數(shù),且N大于1;
在本發(fā)明實施例的一個可選實施方案中,確定模塊310可以根據(jù)預定數(shù)據(jù)庫中影視劇的點擊率和/或搜索率確定N個影視劇類預設詞。例如,確定模塊310可以結合360熱榜和視頻網(wǎng)站獲取點擊率和/或搜索率最靠前的N名影視劇名組成所述N個影視劇類關鍵詞。
獲取模塊320,用于從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻;
存儲模塊330,用于將獲取的與所述各個影視劇關鍵詞相關的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中;
搜索模塊340,用于響應用戶在搜索引擎上輸入的目標搜索詞,從互聯(lián)網(wǎng)中搜索與所述目標搜索詞匹配的結果,并在所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找與所述目標搜索詞匹配的資訊信息和/或視頻;
展現(xiàn)模塊350,用于在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找到與所述目標搜索詞匹配的資訊信息和/或視頻的情況下,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶。
在本發(fā)明實施例的一個可選實施方案中,所述獲取模塊320具體用于按照以下方式將獲取的與所述各個影視劇關鍵詞相關的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中:按照獲取的每條所述資訊信息和/或視頻相關的影視劇關鍵詞進行分類存儲到所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中,并根據(jù)每條資訊信息和/或視頻的內(nèi)容屬性對分類存儲的每條資訊信息和/或視頻進行排序。
其中,每條資訊信息和/或視頻的內(nèi)容屬性可以包括內(nèi)容的類型、內(nèi)容發(fā)布時間、內(nèi)容的評論數(shù)、以及內(nèi)容的查看數(shù),即在影視劇類資訊內(nèi)容數(shù)據(jù)庫可以按照資訊的時效性和/或熱度進行排序,以提高搜索效率。
在本發(fā)明實施例的一個可選實施方案中,在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中找到到與所述目標搜索詞匹配的視頻的情況下,所述展現(xiàn)模塊350具體用于按照以下方式將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶:在所述搜索結果頁播放查找到的所述視頻,并在所述搜索結果頁顯示查找到的所述資訊信息和/或視頻的文字鏈接。
另外,在本實施例中,可以針對不同類型的UGC網(wǎng)站,采用不同的抓取策略。
在本發(fā)明實施例的一個可選實施方案中,
對于專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站,所述獲取模塊320具體用于按照以下方式獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻:
在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站分別搜索所述N個影視劇關鍵詞,從搜索結果中從所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻;或者,
在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站發(fā)布的資訊信息中標注影視劇類的資訊和視頻,從標注的影視劇類資訊和視頻中分別提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
在本發(fā)明實施例的一個可選實施方案中,
對于網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站,所述獲取模塊320具體用于按照以下方式獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻:在所述網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站中分別確定與所述N個影視劇關鍵詞中的每個所述影視劇關鍵詞相關的主題社區(qū),從所述相關的主題社區(qū)中選擇最大的一個或多個主題社區(qū),在所述一個或多個主題社區(qū)發(fā)布的資訊的名稱title或正文中搜索所述N個影視劇關鍵詞,根據(jù)搜索結果,從所述一個或多個主題社區(qū)中提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。例如,在興趣部落中,針對影視劇類預設詞表中各個影視劇類預設詞,例如,大圣歸來,先定位目標影視劇有多少部落(例如,大圣社區(qū)),然后選擇最大部落進行抓取(例如,可以依據(jù)關注度),title或文章正文包含關鍵字(例如,大圣歸來)的資訊信息。
在本發(fā)明實施例的一個可選實施方案中,對于網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站,所述獲取模塊320具體用于按照以下方式獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻:獲取所述網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站中發(fā)表問題的類別為影視劇類相關的資訊;從所述發(fā)表問題的類別為影視劇類相關的資訊中分別查找名稱和/或正文包含有所述N個影視劇關鍵詞中一個或多個的資訊;從查找結果中提取的與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。例如,可以先判斷知乎發(fā)表問題的類別是否跟娛樂有關,如果有關,則進一步判斷該問題及答案中是否包含影視劇類預設詞表中的影視劇類預設詞,如果包含,則抓取該問題及答案作為對應影視劇類預設詞相關的資訊信息。
在本發(fā)明實施例的一個可選實施方案中,
所述展現(xiàn)模塊350具體用于按照以下方式將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶:
在所述搜索結果頁的左側顯示從互聯(lián)網(wǎng)上搜索所述目標搜索詞的結果;
判斷查找到的所述資訊信息和/或視頻中是否存在與所述搜索結果頁左側展現(xiàn)的結果中相同的資訊信息和/或視頻,如果有,則將查找到的所述資訊信息和/或視頻中的所述相同的資訊信息和/或視頻去除;
將去除所述相同的資訊信息和/視頻后的所述查找到的資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁的右側區(qū)域展現(xiàn)給用戶。
即,在上述可選實施方式中,搜索結果頁上包括兩個區(qū)域:左側區(qū)域和右側區(qū)域,在本實施例中,左側區(qū)域用于展現(xiàn)搜索引擎在互聯(lián)網(wǎng)搜索目標搜索詞得到的結果,例如,像現(xiàn)在baidu、google等搜索引擎的搜索結果頁左側展現(xiàn)的內(nèi)容,右側區(qū)域用于展現(xiàn)在影視劇類資訊內(nèi)容數(shù)據(jù)庫搜索到的結果,從而可以擴展搜索結果頁右側區(qū)域的內(nèi)容,為用戶提供更完整的搜索結果。
在本發(fā)明實施例的一個可選實施方案中,如圖4所示,該裝置還可以包括:
統(tǒng)計模塊360,用于在將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶之后,統(tǒng)計用戶針對所述搜索結果頁上展現(xiàn)的各個所述查找到的資訊信息和/或視頻的觸發(fā)操作,得到統(tǒng)計結果;
判斷模塊370,用于根據(jù)所述統(tǒng)計結果確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)各個所述查找到的資訊信息和/或視頻。
其中,用戶針對所述搜索結果頁上展現(xiàn)的所述匹配的資訊信息和/或視頻的觸發(fā)操作可以是展現(xiàn)的所述匹配的資訊信息和/或視頻的CTR(Click To Rate,點擊率),即根據(jù)影視劇類資訊內(nèi)容數(shù)據(jù)庫中的資訊信息和/或視頻展現(xiàn)后的點擊率確定后續(xù)在搜索到該條資訊信息和/或視頻時,是否還在搜索頁的右側展現(xiàn)該條資訊信息和/或視頻。
進一步地,在上述可選實施方式中,
所述判斷模塊370具體用于按照以下方式確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)各個所述查找到的資訊信息和/或視頻:
確定在后續(xù)搜索請求對應的頁面中不再展現(xiàn)所述查找到的資訊信息和/或視頻中,所述觸發(fā)操作的數(shù)量小于指定閾值的資訊信息和/或視頻。
根據(jù)上述任意一個優(yōu)選實施例或多個優(yōu)選實施例的組合,本發(fā)明實施例能夠達到如下有益效果:
在本發(fā)明實施例中,首先從UGC網(wǎng)站中抓取影視劇類關鍵詞相關的資訊信息和/或視頻,將抓取的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中,在接收到用戶在搜索引擎上輸入的與影視劇類相關的目標搜索詞時,在從互聯(lián)網(wǎng)中搜索目標搜索詞的同時,從影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找與目標搜索詞匹配的資訊信息和/或視頻,并將從的影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找到的資訊信息和/或視頻聚合至目標搜索詞對應的搜索結果頁展現(xiàn)給用戶。由此可見,在本發(fā)明實施例提供的技術方案中,能夠在搜索結果頁中聚合UGC網(wǎng)站的影視劇類資訊信息,從而可以為用戶提供更全面的資訊信息,擴寬內(nèi)容覆蓋面。進一步地,影視劇類資訊內(nèi)容數(shù)據(jù)庫來自各個UGC網(wǎng)站,將各個UGC網(wǎng)站中的數(shù)據(jù)前置到搜索結果頁中進行展現(xiàn),無需用戶通過多次操作去網(wǎng)站查找相關資訊信息,降低了用戶的檢索成本。
在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結構和技術,以便不模糊對本說明書的理解。
類似地,應當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權利要求中所明確記載的特征更多的特征。更確切地說,如下面的權利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權利要求書由此明確地并入該具體實施方式,其中每個權利要求本身都作為本發(fā)明的單獨實施例。
本領域那些技術人員可以理解,可以對實施例中的設備中的模塊進行自適應性地改變并且把它們設置在與該實施例不同的一個或多個設備中??梢园褜嵤├械哪K或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領域的技術人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在權利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領域的技術人員應當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的在搜索結果頁中聚合影視劇類資訊信息的裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領域技術人員在不脫離所附權利要求的范圍的情況下可設計出替換實施例。在權利要求中,不應將位于括號之間的任何參考符號構造成對權利要求的限制。單詞“包含”不排除存在未列在權利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
至此,本領域技術人員應認識到,雖然本文已詳盡示出和描述了本發(fā)明的多個示例性實施例,但是,在不脫離本發(fā)明精神和范圍的情況下,仍可根據(jù)本發(fā)明公開的內(nèi)容直接確定或推導出符合本發(fā)明原理的許多其他變型或修改。因此,本發(fā)明的范圍應被理解和認定為覆蓋了所有這些其他變型或修改。
基于本發(fā)明的一個方面,提供了A1、一種影視劇類關鍵詞搜索展現(xiàn)方法,包括:
確定N個影視劇關鍵詞,其中,N為整數(shù),且N大于1;
從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻;
將獲取的與所述各個影視劇關鍵詞相關的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中;
響應用戶在搜索引擎上輸入的目標搜索詞,從互聯(lián)網(wǎng)中搜索與所述目標搜索詞匹配的結果,并在所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找與所述目標搜索詞匹配的資訊信息和/或視頻;
在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找到與所述目標搜索詞匹配的資訊信息和/或視頻的情況下,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶。
A2、根據(jù)A1所述的方法,其中,將獲取的與所述各個影視劇關鍵詞相關的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中,包括:
按照獲取的每條所述資訊信息和/或視頻相關的影視劇關鍵詞進行分類存儲到所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中,并根據(jù)每條資訊信息和/或視頻的內(nèi)容屬性對分類存儲的每條資訊信息和/或視頻進行排序。
A3、根據(jù)A2所述的方法,其中,所述內(nèi)容屬性包括以下至少之一:內(nèi)容的類型、內(nèi)容發(fā)布時間、內(nèi)容的評論數(shù)、以及內(nèi)容的查看數(shù)。
A4、根據(jù)A1所述的方法,其中,在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中找到到與所述目標搜索詞匹配的視頻的情況下,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶,包括:
在所述搜索結果頁播放查找到的所述視頻,并在所述搜索結果頁顯示查找到的所述資訊信息和/或視頻的文字鏈接。
A5、根據(jù)A1至A4任一項所述的方法,其中,對于專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站,從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻,包括:
在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站分別搜索所述N個影視劇關鍵詞,從搜索結果中從所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻;或者,
在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站發(fā)布的資訊信息中標注影視劇類的資訊和視頻,從標注的影視劇類資訊和視頻中分別提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
A6、根據(jù)A1至A4任一項所述的方法,其中,對于網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站,從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻,包括:
在所述網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站中分別確定與所述N個影視劇關鍵詞中的每個所述影視劇關鍵詞相關的主題社區(qū),從所述相關的主題社區(qū)中選擇最大的一個或多個主題社區(qū),在所述一個或多個主題社區(qū)發(fā)布的資訊的名稱title或正文中搜索所述N個影視劇關鍵詞,根據(jù)搜索結果,從所述一個或多個主題社區(qū)中提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
A7、根據(jù)A1至A4任一項所述的方法,其中,對于網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站,從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻,包括:
獲取所述網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站中發(fā)表問題的類別為影視劇類相關的資訊;
從所述發(fā)表問題的類別為影視劇類相關的資訊中分別查找名稱和/或正文包含有所述N個影視劇關鍵詞中一個或多個的資訊;
從查找結果中提取的與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
A8、根據(jù)A1至A4任一項所述的方法,其中,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶,包括:
在所述搜索結果頁的左側顯示從互聯(lián)網(wǎng)上搜索所述目標搜索詞的結果;
判斷查找到的所述資訊信息和/或視頻中是否存在與所述搜索結果頁左側展現(xiàn)的結果中相同的資訊信息和/或視頻,如果有,則將查找到的所述資訊信息和/或視頻中的所述相同的資訊信息和/或視頻去除;
將去除所述相同的資訊信息和/視頻后的所述查找到的資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁的右側區(qū)域展現(xiàn)給用戶。
A9、根據(jù)A1至A4任一項所述的方法,其中,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶之后,所述方法還包括:
統(tǒng)計用戶針對所述搜索結果頁上展現(xiàn)的各個所述查找到的資訊信息和/或視頻的觸發(fā)操作,得到統(tǒng)計結果;
根據(jù)所述統(tǒng)計結果確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)各個所述查找到的資訊信息和/或視頻。
A10、根據(jù)A9所述的方法,其中,根據(jù)所述統(tǒng)計結果確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)各個所述查找到的資訊信息和/或視頻,包括:
確定在后續(xù)搜索請求對應的頁面中不再展現(xiàn)所述查找到的資訊信息和/或視頻中,所述觸發(fā)操作的數(shù)量小于指定閾值的資訊信息和/或視頻。
基于本發(fā)明的另一個方面,提供了B11、一種影視劇類關鍵詞搜索展現(xiàn)裝置,包括:
確定模塊,用于確定N個影視劇關鍵詞,其中,N為整數(shù),且N大于1;
獲取模塊,用于從預定的一個或多個用戶生成內(nèi)容UGC網(wǎng)站中分別獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻;
存儲模塊,用于將獲取的與所述各個影視劇關鍵詞相關的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中;
搜索模塊,用于響應用戶在搜索引擎上輸入的目標搜索詞,從互聯(lián)網(wǎng)中搜索與所述目標搜索詞匹配的結果,并在所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找與所述目標搜索詞匹配的資訊信息和/或視頻;
展現(xiàn)模塊,用于在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中查找到與所述目標搜索詞匹配的資訊信息和/或視頻的情況下,將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶。
B12、根據(jù)B11所述的裝置,其中,所述獲取模塊具體用于按照以下方式將獲取的與所述各個影視劇關鍵詞相關的資訊信息和/或視頻存儲到影視劇類資訊內(nèi)容數(shù)據(jù)庫中:
按照獲取的每條所述資訊信息和/或視頻相關的影視劇關鍵詞進行分類存儲到所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中,并根據(jù)每條資訊信息和/或視頻的內(nèi)容屬性對分類存儲的每條資訊信息和/或視頻進行排序。
B13、根據(jù)B11所述的裝置,其中,在從所述影視劇類資訊內(nèi)容數(shù)據(jù)庫中找到到與所述目標搜索詞匹配的視頻的情況下,所述展現(xiàn)模塊具體用于按照以下方式將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶:
在所述搜索結果頁播放查找到的所述視頻,并在所述搜索結果頁顯示查找到的所述資訊信息和/或視頻的文字鏈接。
B14、根據(jù)B11至B13任一項所述的裝置,其中,對于專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站,所述獲取模塊具體用于按照以下方式獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻:
在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站分別搜索所述N個影視劇關鍵詞,從搜索結果中從所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻;或者,
在所述專業(yè)信息發(fā)布平臺類的UGC網(wǎng)站發(fā)布的資訊信息中標注影視劇類的資訊和視頻,從標注的影視劇類資訊和視頻中分別提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
B15、根據(jù)B11至B13任一項所述的裝置,其中,對于網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站,所述獲取模塊具體用于按照以下方式獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻:
在所述網(wǎng)絡主題社區(qū)類的UGC網(wǎng)站中分別確定與所述N個影視劇關鍵詞中的每個所述影視劇關鍵詞相關的主題社區(qū),從所述相關的主題社區(qū)中選擇最大的一個或多個主題社區(qū),在所述一個或多個主題社區(qū)發(fā)布的資訊的名稱title或正文中搜索所述N個影視劇關鍵詞,根據(jù)搜索結果,從所述一個或多個主題社區(qū)中提取與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
B16、根據(jù)B11至B13任一項所述的裝置,其中,對于網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站,所述獲取模塊具體用于按照以下方式獲取與所述N個影視劇關鍵詞中的各個影視劇關鍵詞相關的資訊信息和/或視頻:
獲取所述網(wǎng)絡問答社區(qū)類的UGC網(wǎng)站中發(fā)表問題的類別為影視劇類相關的資訊;
從所述發(fā)表問題的類別為影視劇類相關的資訊中分別查找名稱和/或正文包含有所述N個影視劇關鍵詞中一個或多個的資訊;
從查找結果中提取的與所述N個影視劇關鍵詞相關的資訊信息和/或視頻。
B17、根據(jù)B11至B13任一項所述的裝置,其中,所述展現(xiàn)模塊具體用于按照以下方式將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶:
在所述搜索結果頁的左側顯示從互聯(lián)網(wǎng)上搜索所述目標搜索詞的結果;
判斷查找到的所述資訊信息和/或視頻中是否存在與所述搜索結果頁左側展現(xiàn)的結果中相同的資訊信息和/或視頻,如果有,則將查找到的所述資訊信息和/或視頻中的所述相同的資訊信息和/或視頻去除;
將去除所述相同的資訊信息和/視頻后的所述查找到的資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁的右側區(qū)域展現(xiàn)給用戶。
B18、根據(jù)B11至B13任一項所述的裝置,其中,還包括:
統(tǒng)計模塊,用于在將查找到的所述資訊信息和/或視頻聚合至所述目標搜索詞對應的搜索結果頁展現(xiàn)給用戶之后,統(tǒng)計用戶針對所述搜索結果頁上展現(xiàn)的各個所述查找到的資訊信息和/或視頻的觸發(fā)操作,得到統(tǒng)計結果;
判斷模塊,用于根據(jù)所述統(tǒng)計結果確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)各個所述查找到的資訊信息和/或視頻。
B19、根據(jù)B18所述的裝置,其中,所述判斷模塊具體用于按照以下方式確定在后續(xù)搜索請求對應的頁面中是否展現(xiàn)各個所述查找到的資訊信息和/或視頻:
確定在后續(xù)搜索請求對應的頁面中不再展現(xiàn)所述查找到的資訊信息和/或視頻中,所述觸發(fā)操作的數(shù)量小于指定閾值的資訊信息和/或視頻。