一種搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法和裝置制造方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法,包括步驟:抓取網(wǎng)頁(yè)信息;檢測(cè)網(wǎng)頁(yè)信息是否包含預(yù)設(shè)的媒體內(nèi)容的信息的標(biāo)識(shí);在檢測(cè)到網(wǎng)頁(yè)信息中包含標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息;以及基于文字信息和媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù)。
【專(zhuān)利說(shuō)明】—種搜索弓I擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)【技術(shù)領(lǐng)域】,尤其涉及一種搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法和裝置。
【背景技術(shù)】
[0002]隨著計(jì)算機(jī)技術(shù)的發(fā)展和普及,通過(guò)搜索引擎網(wǎng)獲取各種媒體信息的需求也日益增加。目前,幾乎所有媒體內(nèi)容,例如,圖片、動(dòng)畫(huà)、音頻和視頻都是以網(wǎng)頁(yè)的形式承載。因此,主要通過(guò)輸入關(guān)鍵字來(lái)命中觸發(fā)相關(guān)網(wǎng)頁(yè),并將相關(guān)網(wǎng)頁(yè)顯示在搜索結(jié)果中來(lái)獲取相關(guān)媒體內(nèi)容信息。搜索結(jié)果主要以文字的形式來(lái)呈現(xiàn),例如以關(guān)鍵詞飄紅的形式顯示在網(wǎng)頁(yè)中,如圖1所示,而沒(méi)有給出關(guān)于網(wǎng)頁(yè)中是否包含媒體內(nèi)容信息以及媒體內(nèi)容相關(guān)信息的提示。這種方式會(huì)存在以下問(wèn)題:僅通過(guò)搜索結(jié)果中的文字信息,用戶無(wú)法了解到各網(wǎng)頁(yè)里面到底有多少自己想要的媒體內(nèi)容信息,相關(guān)度怎樣,是否有網(wǎng)頁(yè)作弊嫌疑騙取點(diǎn)擊嫌疑;用戶為了找到媒體內(nèi)容,必須通過(guò)觀察網(wǎng)頁(yè)中各搜索結(jié)果的關(guān)鍵詞飄紅情況點(diǎn)開(kāi)各個(gè)網(wǎng)頁(yè),然后再進(jìn)行篩選,效率不高;由于不知道各網(wǎng)頁(yè)背后媒體內(nèi)容的情況,導(dǎo)致很多靠前的網(wǎng)頁(yè)點(diǎn)擊量較高,但實(shí)際結(jié)果情況并不滿足用戶需求;而目前主流搜索引擎都有點(diǎn)擊反饋機(jī)制,最終使得這些并不滿足用戶需求的網(wǎng)頁(yè)排位總是很高,實(shí)際與用戶需求有偏差,導(dǎo)致信息搜索效率不高。
【發(fā)明內(nèi)容】
[0003]鑒于上述問(wèn)題,提出了本發(fā)明,以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法和裝置。
[0004]依據(jù)本發(fā)明的第一方面,提供了一種搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法,包括步驟:抓取網(wǎng)頁(yè)信息;檢測(cè)網(wǎng)頁(yè)信息是否包含預(yù)設(shè)的媒體內(nèi)容的信息的標(biāo)識(shí);在檢測(cè)到網(wǎng)頁(yè)信息中包含標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息;基于文字信息和媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù)。
[0005]可選地,在根據(jù)本發(fā)明的實(shí)施例的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法中,媒體內(nèi)容至少包括下列中的一種:圖片、動(dòng)畫(huà)、音頻和視頻。
[0006]可選地,在根據(jù)本發(fā)明的實(shí)施例的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法中,在檢測(cè)到網(wǎng)頁(yè)信息中包含標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息的步驟包括:在檢測(cè)到網(wǎng)頁(yè)信息中包含標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)的至少下列中的一種文字信息:標(biāo)題、摘要和正文;并且提取網(wǎng)頁(yè)的至少下列中的一種媒體內(nèi)容信息:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/或大小、格式和每個(gè)媒體內(nèi)容的第一 URL地址。
[0007]可選地,在根據(jù)本發(fā)明的實(shí)施例的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法中,在檢測(cè)到網(wǎng)頁(yè)信息中包含標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息的步驟還包括:為網(wǎng)頁(yè)分配第二URL地址,其中第二URL地址指向顯示網(wǎng)頁(yè)中的一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面。[0008]可選地,在根據(jù)本發(fā)明的實(shí)施例的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法中,基于文字信息和媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù)的步驟包括:使文字索引庫(kù)中的文字信息與媒體內(nèi)容索引庫(kù)中關(guān)于同一網(wǎng)頁(yè)的媒體內(nèi)容信息相關(guān)聯(lián)。
[0009]依據(jù)本發(fā)明的第二方面,提供了一種用于搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的裝置,包括:信息抓取模塊,適于抓取網(wǎng)頁(yè)信息;標(biāo)識(shí)檢測(cè)模塊,適于檢測(cè)網(wǎng)頁(yè)信息是否包含預(yù)設(shè)的媒體內(nèi)容的信息的標(biāo)識(shí);信息提取模塊適于在檢測(cè)到網(wǎng)頁(yè)信息中包含標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息;索引庫(kù)建立模塊,適于基于文字信息和媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù)。
[0010]可選地,在根據(jù)本發(fā)明的實(shí)施例的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的裝置中,媒體內(nèi)容至少包括下列中的一種:圖片、動(dòng)畫(huà)、音頻和視頻。
[0011]可選地,在根據(jù)本發(fā)明的實(shí)施例的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的裝置中,信息提取模塊適于:在檢測(cè)到網(wǎng)頁(yè)信息中包含標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)的至少下列中的一種文字信息:標(biāo)題、摘要和正文;并且提取網(wǎng)頁(yè)的至少下列中的一種媒體內(nèi)容信息:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/或大小、格式和每個(gè)媒體內(nèi)容的第一 URL地址。
[0012]可選地,在根據(jù)本發(fā)明的實(shí)施例的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的裝置中,信息提取模塊適于:為網(wǎng)頁(yè)分配第二URL地址,其中第二URL地址指向顯示網(wǎng)頁(yè)中的一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面。
[0013]可選地,在根據(jù)本發(fā)明的實(shí)施例的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的裝置中,索引庫(kù)建立模塊適于:使文字索引庫(kù)中的文字信息與媒體內(nèi)容索引庫(kù)中關(guān)于同一網(wǎng)頁(yè)的媒體內(nèi)容信息相關(guān)聯(lián)。
[0014]本發(fā)明提供了上述搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法和裝置。根據(jù)本發(fā)明的實(shí)施例,搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法和裝置為客戶提供了更直觀、更易于理解的搜索媒體內(nèi)容信息的方式,使用戶能夠大體了解網(wǎng)頁(yè)中媒體內(nèi)容的相關(guān)信息,幫助用戶確定搜索結(jié)果相關(guān)度的信息,從而提高了搜索效率。
[0015]上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0016]通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0017]圖1是現(xiàn)有技術(shù)中顯示搜索結(jié)果的網(wǎng)頁(yè)示意圖;
[0018]圖2是根據(jù)本發(fā)明的實(shí)施例的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法的流程圖;
[0019]圖3是根據(jù)本發(fā)明的實(shí)施例的搜索引擎提供的網(wǎng)頁(yè)圖片信息搜索結(jié)果的示例視圖;
[0020]圖4是根據(jù)本發(fā)明的實(shí)施例的搜索引擎提供的網(wǎng)頁(yè)音頻信息搜索結(jié)果的示例視圖;
[0021]圖5是根據(jù)本發(fā)明的實(shí)施例的搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的方法的流程圖;[0022]圖6是根據(jù)本發(fā)明的另一個(gè)實(shí)施例的搜索引擎提供的網(wǎng)頁(yè)圖片信息搜索結(jié)果的示例視圖;
[0023]圖7是根據(jù)本發(fā)明的另一個(gè)實(shí)施例的搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的方法的流程圖;
[0024]圖8是根據(jù)本發(fā)明的實(shí)施例的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的裝置的結(jié)構(gòu)示意圖;
[0025]圖9是根據(jù)本發(fā)明的實(shí)施例的搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的裝置的結(jié)構(gòu)示意圖;
[0026]圖10是根據(jù)本發(fā)明的另一個(gè)實(shí)施例的搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0027]下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi)的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0028]在本發(fā)明的實(shí)施例中,搜索引擎可以是根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對(duì)信息進(jìn)行組織和處理后,為用戶提供搜索服務(wù),將用戶搜索相關(guān)的信息展示給用戶的系統(tǒng)。
[0029]實(shí)施例一
[0030]下面首先介紹搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法,具體包括:
[0031]抓取網(wǎng)頁(yè)信息;檢測(cè)網(wǎng)頁(yè)信息是否包含預(yù)設(shè)的媒體內(nèi)容的信息的標(biāo)識(shí);在檢測(cè)到網(wǎng)頁(yè)信息中包含標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息;以及基于文字信息和媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù)。
[0032]圖2示出了根據(jù)本發(fā)明的實(shí)施例的搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法100的流程圖。在本發(fā)明的實(shí)施例中,媒體內(nèi)容可至少包括下列中的一種:圖片、動(dòng)畫(huà)、音頻和視頻。當(dāng)然可以理解,媒體內(nèi)容也可以包括其他內(nèi)容。
[0033]如圖2所示,在步驟SlOl中,抓取網(wǎng)頁(yè)信息。例如,可以從一個(gè)或者多個(gè)網(wǎng)站服務(wù)器抓取網(wǎng)頁(yè)信息。
[0034]在本發(fā)明的一個(gè)示例性實(shí)施例中,網(wǎng)頁(yè)信息可包括文字信息和媒體內(nèi)容信息??蛇x地,文字信息可包括至少下列中的一種:標(biāo)題、摘要和正文。可選地,媒體內(nèi)容信息可包括至少下列中的一種:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/或大小、格式和每個(gè)媒體內(nèi)容的第一 URL地址。
[0035]在本發(fā)明的一個(gè)示例性實(shí)施例中,對(duì)于承載有圖片的網(wǎng)頁(yè),網(wǎng)頁(yè)信息可包括文字信息和圖片信息。可選地,文字信息可包括:標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示),和/或網(wǎng)頁(yè)的URL (如箭頭3C所指示)??蛇x地,圖片信息可包括圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和/或圖片的URL地址(未示出)。當(dāng)然可以理解,文字信息和圖片信息也可以包括其他內(nèi)容。[0036]在本發(fā)明的一個(gè)示例性實(shí)施例中,對(duì)于承載有音頻的網(wǎng)頁(yè),網(wǎng)頁(yè)信息可包括文字信息和音頻信息。可選地,文字信息可包括:標(biāo)題(如箭頭4A所指示)、摘要(如箭頭4B所指示)和/或網(wǎng)頁(yè)的URL (如箭頭4C所指示)??蛇x地,音頻信息可包括音頻標(biāo)題(如箭頭4D所指示)、音頻縮略圖(如箭頭4E所指示)、音頻作者(如箭頭4F所指示)、音頻大小(如箭頭4G所指示)、音頻格式(未示出)和/或音頻的URL地址(未示出)。當(dāng)然可以理解,文字信息和音頻信息也可以包括其他內(nèi)容。
[0037]在步驟S103中,檢測(cè)網(wǎng)頁(yè)信息是否包含預(yù)設(shè)的媒體內(nèi)容的信息的標(biāo)識(shí)。
[0038]在本發(fā)明的一個(gè)示例性實(shí)施例中,通過(guò)預(yù)設(shè)的媒體內(nèi)容的信息的標(biāo)識(shí)來(lái)判斷抓取的網(wǎng)頁(yè)信息中是否包含特定的媒體內(nèi)容??蛇x地,當(dāng)用戶輸入的搜索關(guān)鍵詞能夠與該特定的媒體內(nèi)容相匹配時(shí),搜索引擎可提供并顯示包含該網(wǎng)頁(yè)的搜索結(jié)果。當(dāng)然可以理解,本發(fā)明的實(shí)施例中并不限定上述預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)的具體形式。
[0039]在步驟S105中,在檢測(cè)到網(wǎng)頁(yè)信息中包含上述標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息;
[0040]在本發(fā)明的一個(gè)示例性實(shí)施例中,步驟S105可包括:在檢測(cè)到網(wǎng)頁(yè)信息中包含上述標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)的至少下列中的一種文字信息:標(biāo)題、摘要和正文;并且提取網(wǎng)頁(yè)的至少下列中的一種媒體內(nèi)容信息:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/或大小、格式和每個(gè)媒體內(nèi)容的第一 URL地址。
[0041]在圖3所示的本發(fā)明的示例性實(shí)施例中,對(duì)于承載有圖片的網(wǎng)頁(yè),在檢測(cè)到網(wǎng)頁(yè)信息中包含預(yù)設(shè)的圖片信息的標(biāo)識(shí)的情況下,可選地,提取該網(wǎng)頁(yè)的至少下列中的一種文字信息:標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示),以及網(wǎng)頁(yè)的URL (如箭頭3C所指示)??蛇x地,提取該網(wǎng)頁(yè)的至少下列中的一種圖片信息:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未不出)、圖片格式(未不出)和圖片的URL地址(未不出)。
[0042]在圖4所示的本發(fā)明的示例性實(shí)施例中,對(duì)于承載有音頻的網(wǎng)頁(yè),在檢測(cè)到網(wǎng)頁(yè)信息中包含預(yù)設(shè)的音頻信息的標(biāo)識(shí)的情況下,可選地,提取該網(wǎng)頁(yè)的至少下列中的一種文字信息:標(biāo)題(如箭頭4A所指示)、摘要(如箭頭4B所指示)和網(wǎng)頁(yè)的URL (如箭頭4C所指示)。可選地,提取該網(wǎng)頁(yè)的至少下列中的一種音頻信息:音頻標(biāo)題(如箭頭4D所指示)、音頻縮略圖(如箭頭4E所指示)、音頻作者(如箭頭4F所指示)、音頻大小(如箭頭4G所指示)、音頻格式(未示出),以及音頻的URL地址(未示出)。
[0043]在本發(fā)明的一個(gè)示例性實(shí)施例中,步驟S105還包括:為網(wǎng)頁(yè)分配第二URL地址,其中該第二 URL地址指向顯示網(wǎng)頁(yè)中的一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面。
[0044]在圖3所示的本發(fā)明的示例性實(shí)施例中,對(duì)于承載有圖片的網(wǎng)頁(yè),在檢測(cè)到網(wǎng)頁(yè)信息中包含上述標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)中圖片的原始URL地址,并為網(wǎng)頁(yè)分配新的URL地址,其中該新的URL地址指向顯示網(wǎng)頁(yè)中的一個(gè)或多個(gè)圖片的縮略圖的頁(yè)面??蛇x地,該新的URL地址指向顯示網(wǎng)頁(yè)中全部圖片的縮略圖的頁(yè)面。可選地,當(dāng)用戶在搜索結(jié)果中選擇對(duì)應(yīng)于該新的URL地址的選項(xiàng),如圖3中的圖片標(biāo)題(如箭頭3D所指示)時(shí),跳轉(zhuǎn)至相應(yīng)于該新的URL地址的頁(yè)面(如箭頭3G所指示),以向用戶顯示該網(wǎng)頁(yè)中全部圖片的縮略圖??蛇x地,當(dāng)用戶在該頁(yè)面中選擇每一圖片的縮略圖(如箭頭3H所指示),跳轉(zhuǎn)至該圖片的原始URL,以提供該圖片的詳細(xì)信息。[0045]在步驟S107中,基于文字信息和媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù)。
[0046]在本發(fā)明的一個(gè)示例性實(shí)施例中,步驟S107包括:使文字索引庫(kù)中的文字信息與媒體內(nèi)容索引庫(kù)中關(guān)于同一網(wǎng)頁(yè)的媒體內(nèi)容信息相關(guān)聯(lián)。
[0047]在圖3所示的本發(fā)明的示例性實(shí)施例中,對(duì)于承載有圖片的網(wǎng)頁(yè),基于所提取的至少下列中的一種文字信息:標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示),以及網(wǎng)頁(yè)的URL (如箭頭3C所指示),建立文字索引庫(kù)??蛇x地,基于所提取的至少下列中的一種圖片信息:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和圖片的URL地址(未示出),建立圖片索引庫(kù)。可選地,使文字索引庫(kù)中的上述文字信息與圖片索引庫(kù)中關(guān)于同一網(wǎng)頁(yè)的上述圖片信息相關(guān)聯(lián)。
[0048]在圖4所示的本發(fā)明的示例性實(shí)施例中,對(duì)于承載有音頻的網(wǎng)頁(yè),基于所提取的至少下列中的一種文字信息:標(biāo)題(如箭頭4A所指示)、摘要(如箭頭4B所指示)和網(wǎng)頁(yè)的URL(如箭頭4C所指示),建立文字索引庫(kù)。可選地,基于所提取的至少下列中的一種音頻信息:音頻標(biāo)題(如箭頭4D所指示)、音頻縮略圖(如箭頭4E所指示)、音頻作者(如箭頭4F所指示)、音頻大小(如箭頭4G所指示)、音頻格式(未示出),以及音頻的URL地址(未示出),建立音頻索引庫(kù)??蛇x地,使文字索引庫(kù)中的上述文字信息與音頻索引庫(kù)中關(guān)于同一網(wǎng)頁(yè)的上述音頻信息相關(guān)聯(lián)。
[0049]本發(fā)明的實(shí)施例中,提取網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息,并基于文字信息和媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù),能夠?yàn)榭蛻籼峁└庇^、更易于理解的搜索媒體內(nèi)容信息的方式,使用戶能夠大體了解網(wǎng)頁(yè)中媒體內(nèi)容的相關(guān)信息,幫助用戶確定搜索結(jié)果相關(guān)度的信息,從而提高了搜索效率。
[0050]需要說(shuō)明的是,圖2所示的方法并不限定按所示的各步驟的順序進(jìn)行,可以根據(jù)需要調(diào)整各步驟的先后順序,另外,所述步驟也不限定于上述步驟劃分,上述步驟可以進(jìn)一步拆分成更多步驟也可以合并成更少步驟。
[0051]實(shí)施例二
[0052]在搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息之后,可以基于用戶的搜索請(qǐng)求,獲得搜索結(jié)果。下面介紹搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的方法,具體可包括:接收搜索請(qǐng)求;檢測(cè)所述搜索請(qǐng)求是否與媒體內(nèi)容相關(guān)聯(lián);在搜索請(qǐng)求與媒體內(nèi)容相關(guān)聯(lián)的情況下,在預(yù)先設(shè)定的文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中查找與搜索請(qǐng)求匹配的網(wǎng)頁(yè);以及分別從文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果。
[0053]圖5示出了根據(jù)本發(fā)明的實(shí)施例的搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的方法200的流程圖。在本發(fā)明的實(shí)施例中,媒體內(nèi)容可至少包括下列中的一種:圖片、動(dòng)畫(huà)、音頻和視頻。當(dāng)然可以理解,媒體內(nèi)容也可以包括其他內(nèi)容。
[0054]如圖5所示,在步驟S201中,接收搜索請(qǐng)求。例如,可以從一個(gè)或者多個(gè)用戶端設(shè)備接收搜索請(qǐng)求??蛇x地,搜索請(qǐng)求可以是用戶輸入的搜索關(guān)鍵詞。當(dāng)然可以理解,本發(fā)明的實(shí)施例中并不限定上述搜索請(qǐng)求的具體形式。
[0055]在步驟S203,檢測(cè)搜索請(qǐng)求是否與媒體內(nèi)容相關(guān)聯(lián)。可選地,當(dāng)用戶輸入搜索關(guān)鍵詞,判斷用戶的搜索請(qǐng)求是否含有媒體內(nèi)容的需求,例如是否含有圖片需求、動(dòng)畫(huà)需求、視頻需求或音頻需求。
[0056]在步驟S205中,在搜索請(qǐng)求與媒體內(nèi)容相關(guān)聯(lián)的情況下,在預(yù)先設(shè)定的文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中查找與搜索請(qǐng)求匹配的網(wǎng)頁(yè)。
[0057]在本發(fā)明的一個(gè)示例性實(shí)施例中,預(yù)先設(shè)定的文字索引庫(kù)可包括網(wǎng)頁(yè)的文字信息,例如,網(wǎng)頁(yè)的標(biāo)題、摘要和/或正文。預(yù)先設(shè)定的媒體內(nèi)容索引庫(kù)可包括媒體內(nèi)容信息,例如,媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/或大小、格式和/或每個(gè)媒體內(nèi)容的第一 URL地址。
[0058]在圖3所示的本發(fā)明的示例性實(shí)施例中,在搜索請(qǐng)求與圖片相關(guān)聯(lián)的情況下,在預(yù)先設(shè)定的文字索引庫(kù)和圖片索引庫(kù)中查找與搜索請(qǐng)求匹配的網(wǎng)頁(yè)??蛇x地,預(yù)先設(shè)定的文字索引庫(kù)可包括至少下列中的一種文字信息:網(wǎng)頁(yè)的標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示),以及網(wǎng)頁(yè)的URL (如箭頭3C所指示)。可選地,預(yù)先設(shè)定的圖片索引庫(kù)可包括至少下列中的一種圖片信息:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和圖片的URL地址(未示出)。
[0059]在圖4所示的本發(fā)明的示例性實(shí)施例中,在搜索請(qǐng)求與音頻相關(guān)聯(lián)的情況下,在預(yù)先設(shè)定的文字索引庫(kù)和音頻索引庫(kù)中查找與搜索請(qǐng)求匹配的網(wǎng)頁(yè)??蛇x地,預(yù)先設(shè)定的文字索引庫(kù)可包括至少下列中的一種文字信息:標(biāo)題(如箭頭4A所指示)、摘要(如箭頭4B所指示)和網(wǎng)頁(yè)的URL (如箭頭4C所指示)。可選地,預(yù)先設(shè)定的音頻索引庫(kù)可包括至少下列中的一種首頻?目息:首頻標(biāo)題(如箭頭4D所指示)、首頻縮略圖(如箭頭4E所指ττΟ、首頻作者(如箭頭4F所指示)、音頻大小(如箭頭4G所指示)、音頻格式(未示出),以及音頻的URL地址(未示出)。
[0060]在步驟S207中,分別從文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果??蛇x地,該搜索結(jié)果可在一個(gè)或者多個(gè)用戶端設(shè)備上顯示。
[0061]在本發(fā)明的一個(gè)示例性實(shí)施例中,步驟S207可包括:從文字索引庫(kù)中提取網(wǎng)頁(yè)的至少下列中的一種文字信息:標(biāo)題、摘要和正文,作為搜索請(qǐng)求的搜索結(jié)果。
[0062]在本發(fā)明的一個(gè)示例性實(shí)施例中,步驟S207可包括:從媒體內(nèi)容索引庫(kù)中提取網(wǎng)頁(yè)的至少下列中的一種媒體內(nèi)容信息:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/大小、格式和每個(gè)媒體內(nèi)容的第一 URL地址。
[0063]在本發(fā)明的一個(gè)示例性實(shí)施例中,步驟S207可包括:為網(wǎng)頁(yè)中的一個(gè)或多個(gè)媒體內(nèi)容分配第二 URL地址,其中第二 URL地址指向顯示一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面。
[0064]在圖3所示的本發(fā)明的示例性實(shí)施例中,在搜索請(qǐng)求與圖片相關(guān)聯(lián)的情況下,分別從文字索引庫(kù)和圖片索引庫(kù)中提取網(wǎng)頁(yè)的文字信息和圖片信息,并為網(wǎng)頁(yè)中的一個(gè)或多個(gè)圖片分配新的URL地址,其中該新的URL地址指向顯示網(wǎng)頁(yè)中的一個(gè)或多個(gè)圖片的縮略圖的頁(yè)面(如箭頭3G所指示)。可選地,為網(wǎng)頁(yè)中的全部圖片分配新的URL地址,其中該新的URL地址指向顯示網(wǎng)頁(yè)中全部圖片的縮略圖的頁(yè)面??蛇x地,當(dāng)用戶在搜索結(jié)果中選擇對(duì)應(yīng)于該新的URL地址的選項(xiàng)時(shí),如圖3中的圖片標(biāo)題(如箭頭3D所指示)時(shí),跳轉(zhuǎn)至相應(yīng)于該新的URL地址的頁(yè)面(如箭頭3G所指示),以向用戶顯示該網(wǎng)頁(yè)中全部圖片的縮略圖。[0065]在本發(fā)明的一個(gè)示例性實(shí)施例中,步驟S207可包括:分別從文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息;以及按預(yù)定方式組合網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果。
[0066]在本發(fā)明的一個(gè)示例性實(shí)施例中,按預(yù)定方式組合所述網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果的步驟包括:從網(wǎng)頁(yè)的媒體內(nèi)容信息中選擇一個(gè)媒體內(nèi)容的第一縮略圖;以及在搜索結(jié)果中顯示一個(gè)媒體內(nèi)容的第一縮略圖。
[0067]在如圖3所示的本發(fā)明的示例性實(shí)施例中,在搜索請(qǐng)求與圖片相關(guān)聯(lián)的情況下,分別從文字索引庫(kù)提取網(wǎng)頁(yè)的以下文字信息:網(wǎng)頁(yè)的標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示)和/或網(wǎng)頁(yè)的URL (如箭頭3C所指示),從圖片索引庫(kù)中提取網(wǎng)頁(yè)的以下圖片信息:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和/或圖片的URL地址(未不出)??蛇x地,在所提取的圖片的第一縮略圖中選擇一個(gè)第一縮略圖(如箭頭3F所指示),以顯示在搜索結(jié)果中。如圖3所示,每項(xiàng)搜索結(jié)果均包括網(wǎng)頁(yè)的標(biāo)題、摘要和/或URL,以及圖片標(biāo)題、圖片數(shù)量和/或圖片的一個(gè)第一縮略圖(如箭頭3F所指示)。
[0068]在本發(fā)明的一個(gè)示例性實(shí)施例中,按預(yù)定方式組合網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果的步驟包括:從網(wǎng)頁(yè)的媒體內(nèi)容信息中選擇多個(gè)媒體內(nèi)容的第一縮略圖;以及在搜索結(jié)果中顯示該多個(gè)媒體內(nèi)容的第一縮略圖。
[0069]如圖6所示的本發(fā)明的示例性實(shí)施例中,在所提取的圖片的第一縮略圖中選擇四個(gè)第一縮略圖(如箭頭6E所指示),以顯示在搜索結(jié)果中。當(dāng)然可以理解,所選擇的第一縮略圖的數(shù)量不限于本發(fā)明實(shí)施例中所描述的數(shù)量。在圖6所示的搜索結(jié)果中,每項(xiàng)搜索結(jié)果均包括網(wǎng)頁(yè)的標(biāo)題、摘要和URL,以及圖片標(biāo)題、圖片數(shù)量和圖片的四個(gè)第一縮略圖(如箭頭6E所指示)。
[0070]在本發(fā)明的一個(gè)示例性實(shí)施例中,媒體內(nèi)容信息包括文字部分和縮略圖部分,文字部分指向顯示一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面。
[0071]在如圖3所示的本發(fā)明的示例性實(shí)施例中,在搜索請(qǐng)求與圖片相關(guān)聯(lián)的情況下,圖片信息包括文字部分和縮略圖部分。在搜索結(jié)果中,文字部分可包括圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未不出)和/或圖片的URL地址(未不出);縮略圖部分可包括圖片的第一縮略圖(如箭頭3F所指示)。其中,當(dāng)用戶選擇圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)或其他文字部分時(shí),跳轉(zhuǎn)至新的頁(yè)面(如箭頭3G所指示),該頁(yè)面顯示一個(gè)或多個(gè)圖片的第二縮略圖(如箭頭3H所指示)??蛇x地,該頁(yè)面顯示網(wǎng)頁(yè)中全部圖片的第二縮略圖。
[0072]在如圖6所示的本發(fā)明的示例性實(shí)施例中,在搜索請(qǐng)求與圖片相關(guān)聯(lián)的情況下,圖片信息包括文字部分和縮略圖部分。在搜索結(jié)果中,文字部分可包括圖片標(biāo)題(未示出)、圖片數(shù)量(如箭頭6D所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)、圖片的URL地址(未示出),和/或其他文字部分(如箭頭6G所指示的“》”);縮略圖部分可包括圖片的第一縮略圖(如箭頭6E所指示)。其中,當(dāng)用戶選擇圖片數(shù)量(如箭頭6D所指示)或其他文字部分時(shí)(如箭頭6G所指示的“》”),跳轉(zhuǎn)至新的頁(yè)面(如箭頭6H所指示),該頁(yè)面顯示一個(gè)或多個(gè)圖片的第二縮略圖(如箭頭61所指示)??蛇x地,該頁(yè)面顯示網(wǎng)頁(yè)中全部圖片的第二縮略圖。[0073]本發(fā)明的實(shí)施例中,在搜索請(qǐng)求與媒體內(nèi)容相關(guān)聯(lián)的情況下,在預(yù)先設(shè)定的文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中查找與搜索請(qǐng)求匹配的網(wǎng)頁(yè);分別從文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果,能夠?yàn)榭蛻籼峁└庇^、更易于理解的搜索媒體內(nèi)容信息的方式,使用戶能夠大體了解網(wǎng)頁(yè)中媒體內(nèi)容的相關(guān)信息,幫助用戶確定搜索結(jié)果相關(guān)度的信息,從而提高了搜索效率。
[0074]需要說(shuō)明的是,圖5所示的方法并不限定按所示的各步驟的順序進(jìn)行,可以根據(jù)需要調(diào)整各步驟的先后順序,另外,所述步驟也不限定于上述步驟劃分,上述步驟可以進(jìn)一步拆分成更多步驟也可以合并成更少步驟。
[0075]實(shí)施例三
[0076]在搜索引擎獲得網(wǎng)頁(yè)媒體內(nèi)容信息之后,可以基于用戶的搜索請(qǐng)求,向用戶提供搜索結(jié)果。下面介紹搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的方法,具體可包括:在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果;以及響應(yīng)于對(duì)網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息的選擇,提供搜索結(jié)果。
[0077]圖7示出了根據(jù)本發(fā)明的實(shí)施例的搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的方法300的流程圖。在本發(fā)明的實(shí)施例中,媒體內(nèi)容可至少包括下列中的一種:圖片、動(dòng)畫(huà)、音頻和視頻。當(dāng)然可以理解,媒體內(nèi)容也可以包括其他內(nèi)容。
[0078]如圖7所示,在步驟S301中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果。例如,可以從一個(gè)或者多個(gè)用戶端設(shè)備接收搜索請(qǐng)求。可選地,搜索請(qǐng)求可以是用戶輸入的搜索關(guān)鍵詞。當(dāng)然可以理解,本發(fā)明的實(shí)施例中并不限定上述搜索請(qǐng)求的具體形式。
[0079]在本發(fā)明的一個(gè)示例性的實(shí)施例中,步驟S301可包括:在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的至少下列中的一種文字信息作為搜索請(qǐng)求的搜索結(jié)果:標(biāo)題、摘要和正文。
[0080]在本發(fā)明的一個(gè)示例性的實(shí)施例中,步驟S301可包括:在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的至少下列中的一種媒體內(nèi)容信息:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/大小、格式和每個(gè)媒體內(nèi)容的第一 URL地址。
[0081]在如圖3所示的本發(fā)明的示例性實(shí)施例中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的圖片信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的至少下列中的一種文字信息作為搜索請(qǐng)求的搜索結(jié)果:網(wǎng)頁(yè)的標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示),以及網(wǎng)頁(yè)的URL (如箭頭3C所指示)??蛇x地,可提取網(wǎng)頁(yè)的至少下列中的一種圖片信息:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未不出)、圖片格式(未不出)和圖片的URL地址(未不出)。
[0082]在圖4所示的本發(fā)明的示例性實(shí)施例中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的音頻信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的至少下列中的一種文字信息作為搜索請(qǐng)求的搜索結(jié)果:標(biāo)題(如箭頭4A所指示)、摘要(如箭頭4B所指示)和網(wǎng)頁(yè)的URL (如箭頭4C所指示)??蛇x地,可提取網(wǎng)頁(yè)的至少下列中的一種音頻信息:音頻標(biāo)題(如箭頭4D所指示)、音頻縮略圖(如箭頭4E所指示)、音頻作者(如箭頭4F所指示)、音頻大小(如箭頭4G所指示)、音頻格式(未示出),以及音頻的URL地址(未示出)。
[0083]在本發(fā)明的一個(gè)示例性的實(shí)施例中,步驟S301可包括提取為每個(gè)媒體內(nèi)容預(yù)分配的第二 URL地址,其中所述第二 URL地址指向顯示所述一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面
[0084]在如圖3所示的本發(fā)明的示例性實(shí)施例中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的圖片信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取為每個(gè)圖片預(yù)分配的第二 URL地址,其中該第二 URL地址指向顯示一個(gè)或多個(gè)圖片的第二縮略圖的頁(yè)面。可選地,可提取為網(wǎng)頁(yè)中的全部圖片分配新的URL地址,其中該新的URL地址指向顯示網(wǎng)頁(yè)中全部圖片的縮略圖的頁(yè)面(如箭頭3G所指示)??蛇x地,當(dāng)用戶在搜索結(jié)果中選擇對(duì)應(yīng)于該新的URL地址的選項(xiàng)時(shí),如圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)或其他文字部分時(shí),跳轉(zhuǎn)至相應(yīng)于該新的URL地址的頁(yè)面(如箭頭3G所指示),以向用戶顯示該網(wǎng)頁(yè)中全部圖片的縮略圖。
[0085]在本發(fā)明的一個(gè)示例性實(shí)施例中,步驟S301可包括:在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息;以及按預(yù)定方式組合網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果。
[0086]在步驟S303中,響應(yīng)于對(duì)網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息的選擇,提供搜索結(jié)果。例如,該搜索結(jié)果可以在一個(gè)或者多個(gè)用戶端設(shè)備上顯示。
[0087]在本發(fā)明的一個(gè)示例性實(shí)施例中,響應(yīng)于對(duì)網(wǎng)頁(yè)文字信息的選擇,跳轉(zhuǎn)至第一 URL地址,以提供搜索結(jié)果。例如,如圖4所示,響應(yīng)于對(duì)網(wǎng)頁(yè)文字信息(如箭頭4A所指示的網(wǎng)頁(yè)標(biāo)題)的選擇,跳轉(zhuǎn)至第一 URL地址,以提供該媒體內(nèi)容的詳細(xì)信息(如箭頭4H所指示)。
[0088]在本發(fā)明的一個(gè)示例性實(shí)施例中,在步驟S301中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息;以及按以下預(yù)定方式組合網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果:從網(wǎng)頁(yè)的媒體內(nèi)容信息中選擇一個(gè)媒體內(nèi)容的第一縮略圖,并在搜索結(jié)果中顯示一個(gè)媒體內(nèi)容的第一縮略圖??蛇x地,在步驟S303中,響應(yīng)于對(duì)一個(gè)媒體內(nèi)容的第一縮略圖的選擇,跳轉(zhuǎn)至第二URL地址,以獲得顯示一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面??蛇x地,響應(yīng)于對(duì)第二URL地址中顯示的每個(gè)媒體內(nèi)容的第二縮略圖的選擇,跳轉(zhuǎn)至該媒體內(nèi)容的第一 URL地址,以提供該媒體內(nèi)容的信息。
[0089]在如圖3所示的本發(fā)明的示例性實(shí)施例中,在步驟S301中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的圖片信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的以下文字信息:網(wǎng)頁(yè)的標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示)和/或網(wǎng)頁(yè)的URL (如箭頭3C所指示),并提取網(wǎng)頁(yè)的以下圖片信息:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和/或圖片的URL地址(未示出)??蛇x地,按以下預(yù)定方式組合網(wǎng)頁(yè)的文字信息和圖片信息,作為搜索請(qǐng)求的搜索結(jié)果:從網(wǎng)頁(yè)的圖片信息中選擇一個(gè)圖片的第一縮略圖,并在結(jié)果中顯示一個(gè)圖片的第一縮略圖(如箭頭3F所指示)??蛇x地,在步驟S303中,當(dāng)用戶選擇該一個(gè)圖片的縮略圖(如箭頭3F所指示)時(shí),跳轉(zhuǎn)至新的頁(yè)面(如箭頭3G所指示),該頁(yè)面顯示一個(gè)或多個(gè)圖片的第二縮略圖(如箭頭3H所指示)??蛇x地,該頁(yè)面顯示網(wǎng)頁(yè)中全部圖片的第二縮略圖??蛇x地,當(dāng)用戶選擇新的界面(如箭頭3G所指示)中的每個(gè)圖片的第二縮略圖(如箭頭3H所指示)時(shí),跳轉(zhuǎn)至該圖片的第一 URL地址,以提供該圖片的詳細(xì)信息。[0090]在本發(fā)明的另一個(gè)示例性實(shí)施例中,在步驟S301中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息;以及按以下預(yù)定方式組合網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果:從網(wǎng)頁(yè)的媒體內(nèi)容信息中選擇多個(gè)媒體內(nèi)容的第一縮略圖,并在搜索結(jié)果中顯示多個(gè)媒體內(nèi)容的第一縮略圖??蛇x地,在步驟S303中,響應(yīng)于對(duì)每個(gè)媒體內(nèi)容的第一縮略圖的選擇,跳轉(zhuǎn)至該媒體內(nèi)容的第一 URL地址,以提供該媒體內(nèi)容的信息。
[0091]在如圖6所示的本發(fā)明的示例性實(shí)施例中,在步驟S301中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的圖片信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的以下文字信息:標(biāo)題(如箭頭6A所指示)、摘要(如箭頭6B所指示)和/或網(wǎng)頁(yè)的URL (如箭頭6C所指示),并提取網(wǎng)頁(yè)的以下圖片信息:圖片標(biāo)題(未示出)、圖片數(shù)量(如箭頭6D所指示)、圖片的第一縮略圖(如箭頭6E所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和/或圖片的URL地址(未示出)。可選地,按以下預(yù)定方式組合網(wǎng)頁(yè)的文字信息和圖片信息,作為搜索請(qǐng)求的搜索結(jié)果:從網(wǎng)頁(yè)的圖片信息中選擇四個(gè)第一縮略圖,并在結(jié)果中顯示四個(gè)第一縮略圖。當(dāng)然可以理解,本發(fā)明實(shí)施例并不限制所選擇的和顯示的圖片數(shù)量。可選地,在步驟S303中,當(dāng)用戶選擇該四個(gè)圖片縮略圖中的每一個(gè)時(shí),跳轉(zhuǎn)至新的頁(yè)面(如箭頭6F所指示),該頁(yè)面提供該圖片的詳細(xì)信息。
[0092]在本發(fā)明的另一個(gè)示例性實(shí)施例中,在步驟S301中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,其中媒體內(nèi)容信息包括文字部分和縮略圖部分;以及按預(yù)定方式組合網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果??蛇x地,在步驟S303中,響應(yīng)于對(duì)文字部分的選擇,跳轉(zhuǎn)至第二 URL地址,以獲得顯示一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面。可選地,響應(yīng)于對(duì)第二 URL地址中顯示的每個(gè)媒體內(nèi)容的第二縮略圖的選擇,跳轉(zhuǎn)至該媒體內(nèi)容的第一 URL地址,以提供該媒體內(nèi)容的信息。
[0093]在如圖3所示的本發(fā)明的示例性實(shí)施例中,搜索結(jié)果中的圖片信息,包括文字部分和縮略圖部分。文字部分可包括圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)和/或其他文字;縮略圖部分包括圖片的第一縮略圖(如箭頭3F所指示)??蛇x地,當(dāng)用戶選擇圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)或其他文字時(shí),跳轉(zhuǎn)至新的頁(yè)面(如箭頭3G所指示),該頁(yè)面顯示一個(gè)或多個(gè)圖片的第二縮略圖(如箭頭3H所指示)??蛇x地,該頁(yè)面顯示網(wǎng)頁(yè)中全部圖片的第二縮略圖??蛇x地,響應(yīng)于對(duì)每個(gè)圖片的第二縮略圖(如箭頭3H所指示)的選擇,跳轉(zhuǎn)至該圖片的第一 URL地址,以提供該圖片的詳細(xì)信息。
[0094]在如圖6所示的本發(fā)明的示例性實(shí)施例中,搜索結(jié)果中的圖片信息,包括文字部分和縮略圖部分。文字部分可包括圖片標(biāo)題(未示出)、圖片數(shù)量(如箭頭6D所指示)和/或其他文字(如圖6中箭頭6G所指示的“》”);縮略圖部分包括圖片的第一縮略圖(如箭頭6E所指示)??蛇x地,當(dāng)用戶選擇圖片標(biāo)題(未示出)、圖片數(shù)量(如箭頭6D所指示)或其他文字(如圖6中箭頭6G所指示的“》”)時(shí),跳轉(zhuǎn)至新的頁(yè)面(如箭頭6H所指示),該頁(yè)面顯示一個(gè)或多個(gè)圖片的第二縮略圖(如箭頭61所指示)??蛇x地,該頁(yè)面顯示網(wǎng)頁(yè)中全部圖片的第二縮略圖??蛇x地,響應(yīng)于對(duì)每個(gè)圖片的第二縮略圖(如箭頭61所指示)的選擇,跳轉(zhuǎn)至該圖片的第一 URL地址,以提供該圖片的詳細(xì)信息。
[0095]本發(fā)明的實(shí)施例中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果;以及響應(yīng)于對(duì)網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息的選擇,提供搜索結(jié)果,能夠在搜索結(jié)果中提供文字信息和媒體內(nèi)容信息,從而為客戶提供了更直觀、更易于理解的搜索媒體內(nèi)容信息的方式,使用戶能夠大體了解網(wǎng)頁(yè)中媒體內(nèi)容的相關(guān)信息,幫助用戶確定搜索結(jié)果相關(guān)度的信息,從而提高了搜索效率。
[0096]需要說(shuō)明的是,圖7所示的方法并不限定按所示的各步驟的順序進(jìn)行,可以根據(jù)需要調(diào)整各步驟的先后順序,另外,所述步驟也不限定于上述步驟劃分,上述步驟可以進(jìn)一步拆分成更多步驟也可以合并成更少步驟。
[0097]實(shí)施例四
[0098]下面介紹根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的用于搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的裝置。
[0099]可選地,該裝置適于執(zhí)行前面描述的方法100。
[0100]圖8示出了根據(jù)本發(fā)明的一種用于搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的裝置400的結(jié)構(gòu)示意圖。在本發(fā)明的實(shí)施例中,該裝置400包括:信息抓取模塊401,適于抓取網(wǎng)頁(yè)信息;標(biāo)識(shí)檢測(cè)模塊403,適于檢測(cè)所述網(wǎng)頁(yè)信息是否包含預(yù)設(shè)的媒體內(nèi)容的信息的標(biāo)識(shí);信息提取模塊405,適于在檢測(cè)到網(wǎng)頁(yè)信息中包含所述標(biāo)識(shí)的情況下,提取所述網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息;索引庫(kù)建立模塊407,適于基于所述文字信息和所述媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù)。
[0101]在本發(fā)明的實(shí)施例中,媒體內(nèi)容可至少包括下列中的一種:圖片、動(dòng)畫(huà)、音頻和視頻。當(dāng)然可以理解,媒體內(nèi)容也可以包括其他內(nèi)容。
[0102]如圖8所示,裝置400包括信息抓取模塊401,適于抓取網(wǎng)頁(yè)信息。例如,如圖8所示,信息抓取模塊401可以從一個(gè)或者多個(gè)網(wǎng)站服務(wù)器抓取網(wǎng)頁(yè)信息。
[0103]在本發(fā)明的一個(gè)示例性實(shí)施例中,網(wǎng)頁(yè)信息可包括文字信息和媒體內(nèi)容信息??蛇x地,文字信息可包括至少下列中的一種:標(biāo)題、摘要和正文??蛇x地,媒體內(nèi)容信息可包括至少下列中的一種:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/或大小、格式和每個(gè)媒體內(nèi)容的第一 URL地址。
[0104]在本發(fā)明的一個(gè)示例性實(shí)施例中,對(duì)于承載有圖片的網(wǎng)頁(yè),網(wǎng)頁(yè)信息可包括文字信息和圖片信息??蛇x地,文字信息可包括:標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示)和/或網(wǎng)頁(yè)的URL (如箭頭3C所指示)??蛇x地,圖片信息可包括圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和/或圖片的URL地址(未示出)。當(dāng)然可以理解,文字信息和圖片信息也可以包括其他內(nèi)容。
[0105]在本發(fā)明的一個(gè)示例性實(shí)施例中,對(duì)于承載有音頻的網(wǎng)頁(yè),網(wǎng)頁(yè)信息可包括文字信息和音頻信息??蛇x地,文字信息可包括:標(biāo)題(如箭頭4A所指示)、摘要(如箭頭4B所指示)和/或網(wǎng)頁(yè)的URL (如箭頭4C所指示)。可選地,音頻信息可包括音頻標(biāo)題(如箭頭4D所指示)、音頻縮略圖(如箭頭4E所指示)、音頻作者(如箭頭4F所指示)、音頻大小(如箭頭4G所指示)、音頻格式(未示出),和/或音頻的URL地址(未示出)。當(dāng)然可以理解,文字信息和音頻信息也可以包括其他內(nèi)容。
[0106]如圖8所示,裝置400包括標(biāo)識(shí)檢測(cè)模塊403,適于檢測(cè)網(wǎng)頁(yè)信息是否包含預(yù)設(shè)的媒體內(nèi)容的信息的標(biāo)識(shí)。
[0107]在本發(fā)明的一個(gè)示例性實(shí)施例中,標(biāo)識(shí)檢測(cè)模塊403通過(guò)預(yù)設(shè)的媒體內(nèi)容的信息的標(biāo)識(shí)來(lái)判斷抓取的網(wǎng)頁(yè)信息中是否包含特定的媒體內(nèi)容。可選地,當(dāng)用戶輸入的搜索關(guān)鍵詞能夠與該特定的媒體內(nèi)容相匹配時(shí),搜索引擎可提供包含該網(wǎng)頁(yè)的搜索結(jié)果。當(dāng)然可以理解,本發(fā)明的實(shí)施例中并不限定上述預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)的具體形式。
[0108]如圖8所示,裝置400包括信息提取模塊405,適于在檢測(cè)到網(wǎng)頁(yè)信息中包含標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息。
[0109]在本發(fā)明的一個(gè)示例性實(shí)施例中,信息提取模塊405適于在檢測(cè)到網(wǎng)頁(yè)信息中包含標(biāo)識(shí)的情況下,提取網(wǎng)頁(yè)的至少下列中的一種文字信息:標(biāo)題、摘要和正文;并且提取網(wǎng)頁(yè)的至少下列中的一種媒體內(nèi)容信息:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/或大小、格式和每個(gè)媒體內(nèi)容的第一 URL地址。
[0110]在圖3所示的本發(fā)明的示例性實(shí)施例中,對(duì)于承載有圖片的網(wǎng)頁(yè),在標(biāo)識(shí)檢測(cè)模塊403檢測(cè)到網(wǎng)頁(yè)信息中包含預(yù)設(shè)的圖片信息的標(biāo)識(shí)的情況下,可選地,信息提取模塊405可提取該網(wǎng)頁(yè)的至少下列中的一種文字信息:標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示),以及網(wǎng)頁(yè)的URL (如箭頭3C所指示)??蛇x地,信息提取模塊405可提取該網(wǎng)頁(yè)的至少下列中的一種圖片信息:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和圖片的URL地址(未示出)。
[0111]在圖4所示的本發(fā)明的示例性實(shí)施例中,對(duì)于承載有音頻的網(wǎng)頁(yè),在標(biāo)識(shí)檢測(cè)模塊403檢測(cè)到網(wǎng)頁(yè)信息中包含預(yù)設(shè)的音頻信息的標(biāo)識(shí)的情況下,可選地,信息提取模塊405可提取該網(wǎng)頁(yè)的至少下列中的一種文字信息:標(biāo)題(如箭頭4A所指示)、摘要(如箭頭4B所指示)和網(wǎng)頁(yè)的URL (如箭頭4C所指示)。可選地,信息提取模塊405可提取該網(wǎng)頁(yè)的至少下列中的一種音頻信息:音頻標(biāo)題(如箭頭4D所指示)、音頻縮略圖(如箭頭4E所指示)、音頻作者(如箭頭4F所指示)、音頻大小(如箭頭4G所指示)、音頻格式(未示出),以及音頻的URL地址(未示出)。
[0112]在本發(fā)明的一個(gè)示例性實(shí)施例中,信息提取模塊405還適于為網(wǎng)頁(yè)分配第二 URL地址,其中該第二 URL地址指向顯示網(wǎng)頁(yè)中的一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面。
[0113]在圖3所示的本發(fā)明的示例性實(shí)施例中,對(duì)于承載有圖片的網(wǎng)頁(yè),在標(biāo)識(shí)檢測(cè)模塊403檢測(cè)到網(wǎng)頁(yè)信息中包含上述標(biāo)識(shí)的情況下,信息提取模塊405可提取網(wǎng)頁(yè)中圖片的原始URL地址,并為網(wǎng)頁(yè)分配新的URL地址,其中該新的URL地址指向顯示網(wǎng)頁(yè)中的一個(gè)或多個(gè)圖片的縮略圖的頁(yè)面??蛇x地,該新的URL地址指向顯示網(wǎng)頁(yè)中全部圖片的縮略圖的頁(yè)面??蛇x地,當(dāng)用戶在搜索結(jié)果中選擇對(duì)應(yīng)于該新的URL地址的選項(xiàng),如圖3中的圖片標(biāo)題(如箭頭3D所指示)時(shí),跳轉(zhuǎn)至相應(yīng)于該新的URL地址的頁(yè)面(如箭頭3G所指示),以向用戶顯示該網(wǎng)頁(yè)中全部圖片的縮略圖??蛇x地,當(dāng)用戶在該頁(yè)面中選擇每一圖片的縮略圖,跳轉(zhuǎn)至該圖片的原始URL,以提供該圖片的詳細(xì)信息。
[0114]如圖8所示,裝置400包括索引庫(kù)建立模塊407,適于基于文字信息和媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù)。
[0115]在本發(fā)明的一個(gè)示例性實(shí)施例中,索引庫(kù)建立模塊407適于使文字索引庫(kù)中的文字信息與媒體內(nèi)容索引庫(kù)中關(guān)于同一網(wǎng)頁(yè)的媒體內(nèi)容信息相關(guān)聯(lián)。[0116]在圖3所示的本發(fā)明的示例性實(shí)施例中,對(duì)于承載有圖片的網(wǎng)頁(yè),索引庫(kù)建立模塊407可基于信息提取模塊405所提取的至少下列中的一種文字信息:標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示),以及網(wǎng)頁(yè)的URL (如箭頭3C所指示),建立文字索引庫(kù)??蛇x地,索引庫(kù)建立模塊407可基于信息提取模塊405所提取的至少下列中的一種圖片信息:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和圖片的URL地址(未示出),建立圖片索引庫(kù)??蛇x地,索引庫(kù)建立模塊407可適于使文字索引庫(kù)中的上述文字信息與圖片索引庫(kù)中關(guān)于同一網(wǎng)頁(yè)的上述圖片信息相關(guān)聯(lián)。
[0117]在圖4所示的本發(fā)明的示例性實(shí)施例中,對(duì)于承載有音頻的網(wǎng)頁(yè),索引庫(kù)建立模塊407適于基于信息提取模塊405所提取的至少下列中的一種文字信息:標(biāo)題(如箭頭4A所指示)、摘要(如箭頭4B所指示)和網(wǎng)頁(yè)的URL (如箭頭4C所指示),建立文字索引庫(kù)??蛇x地,索引庫(kù)建立模塊407適于基于信息提取模塊405所提取的至少下列中的一種音頻信息:音頻標(biāo)題(如箭頭4D所指示)、音頻縮略圖(如箭頭4E所指示)、音頻作者(如箭頭4F所指示)、音頻大小(如箭頭4G所指示)、音頻格式(未示出),以及音頻的URL地址(未示出),建立音頻索引庫(kù)??蛇x地,索引庫(kù)建立模塊407適于使文字索引庫(kù)中的上述文字信息與音頻索引庫(kù)中關(guān)于同一網(wǎng)頁(yè)的上述音頻信息相關(guān)聯(lián)。
[0118]本發(fā)明的實(shí)施例中,搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的裝置400能夠?yàn)榭蛻籼峁└庇^、更易于理解的搜索媒體內(nèi)容信息的方式,使用戶能夠大體了解網(wǎng)頁(yè)中媒體內(nèi)容的相關(guān)信息,幫助用戶確定搜索結(jié)果相關(guān)度的信息,從而提高了搜索效率。
[0119]實(shí)施例五
[0120]下面介紹根據(jù)本發(fā)明的示例性實(shí)施例的用于搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的裝置。
[0121]可選地,該裝置適于執(zhí)行前面描述的方法200。
[0122]圖9示出了根據(jù)本發(fā)明的示例性實(shí)施例的用于搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的裝置500的結(jié)構(gòu)示意圖。在本發(fā)明的實(shí)施例中,裝置500包括:
[0123]請(qǐng)求接收模塊501,適于接收搜索請(qǐng)求;
[0124]請(qǐng)求檢測(cè)模塊503,適于檢測(cè)搜索請(qǐng)求是否與媒體內(nèi)容相關(guān)聯(lián);
[0125]網(wǎng)頁(yè)查找模塊505,適于在搜索請(qǐng)求與媒體內(nèi)容相關(guān)聯(lián)的情況下,在預(yù)先設(shè)定的文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中查找與搜索請(qǐng)求匹配的網(wǎng)頁(yè);以及
[0126]信息提取模塊507,適于分別從文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果。
[0127]在本發(fā)明的實(shí)施例中,媒體內(nèi)容可至少包括下列中的一種:圖片、動(dòng)畫(huà)、音頻和視頻。當(dāng)然可以理解,媒體內(nèi)容也可以包括其他內(nèi)容。
[0128]如圖9所示,裝置500包括請(qǐng)求接收模塊501,適于接收搜索請(qǐng)求。例如,如圖9所示,信息提取模塊507可以從一個(gè)或者多個(gè)用戶端設(shè)備接收搜索請(qǐng)求??蛇x地,搜索請(qǐng)求可以是用戶輸入的搜索關(guān)鍵詞。當(dāng)然可以理解,本發(fā)明的實(shí)施例中并不限定上述搜索請(qǐng)求的具體形式。
[0129]如圖9所示,裝置500包括請(qǐng)求檢測(cè)模塊503,適于檢測(cè)搜索請(qǐng)求是否與媒體內(nèi)容相關(guān)聯(lián)??蛇x地,當(dāng)用戶輸入搜索關(guān)鍵詞,請(qǐng)求檢測(cè)模塊503判斷用戶的搜索請(qǐng)求是否含有媒體內(nèi)容的需求,例如是否含有圖片需求、動(dòng)畫(huà)需求、視頻需求或音頻需求。
[0130]如圖9所示,裝置500包括網(wǎng)頁(yè)查找模塊505,適于在搜索請(qǐng)求與媒體內(nèi)容相關(guān)聯(lián)的情況下,在預(yù)先設(shè)定的文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中查找與搜索請(qǐng)求匹配的網(wǎng)頁(yè)。
[0131]在本發(fā)明的一個(gè)示例性實(shí)施例中,預(yù)先設(shè)定的文字索引庫(kù)可包括網(wǎng)頁(yè)的文字信息,例如,網(wǎng)頁(yè)的標(biāo)題、摘要和/或正文。預(yù)先設(shè)定的媒體內(nèi)容索引庫(kù)可包括媒體內(nèi)容信息,例如,媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/或大小、格式和/或每個(gè)媒體內(nèi)容的第一 URL地址。
[0132]在圖3所示的本發(fā)明的示例性實(shí)施例中,在請(qǐng)求檢測(cè)模塊503檢測(cè)到搜索請(qǐng)求與圖片相關(guān)聯(lián)的情況下,網(wǎng)頁(yè)查找模塊505可在預(yù)先設(shè)定的文字索引庫(kù)和圖片索引庫(kù)中查找與搜索請(qǐng)求匹配的網(wǎng)頁(yè)??蛇x地,預(yù)先設(shè)定的文字索引庫(kù)可包括至少下列中的一種文字信息:網(wǎng)頁(yè)的標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示),以及網(wǎng)頁(yè)的URL (如箭頭3C所指示)??蛇x地,預(yù)先設(shè)定的圖片索引庫(kù)可包括至少下列中的一種圖片信息:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和圖片的URL地址(未示出)。
[0133]在圖4所示的本發(fā)明的示例性實(shí)施例中,在請(qǐng)求檢測(cè)模塊503檢測(cè)到搜索請(qǐng)求與音頻相關(guān)聯(lián)的情況下,網(wǎng)頁(yè)查找模塊505可在預(yù)先設(shè)定的文字索引庫(kù)和音頻索引庫(kù)中查找與搜索請(qǐng)求匹配的網(wǎng)頁(yè)??蛇x地,預(yù)先設(shè)定的文字索引庫(kù)可包括至少下列中的一種文字信息:標(biāo)題(如箭頭4A所指示)、摘要(如箭頭4B所指示)和網(wǎng)頁(yè)的URL (如箭頭4C所指示)。可選地,預(yù)先設(shè)定的音頻索引庫(kù)可包括至少下列中的一種音頻信息:音頻標(biāo)題(如箭頭4D所指示)、音頻縮略圖(如箭頭4E所指示)、音頻作者(如箭頭4F所指示)、音頻大小(如箭頭4G所指示)、音頻格式(未示出),以及音頻的URL地址(未示出)。
[0134]如圖9所示,裝置500包括信息提取模塊507,適于分別從文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果??蛇x地,該搜索結(jié)果可在一個(gè)或者多個(gè)用戶端設(shè)備上顯示。
[0135]在本發(fā)明的一個(gè)示例性實(shí)施例中,信息提取模塊507適于從文字索引庫(kù)中提取網(wǎng)頁(yè)的至少下列中的一種文字信息:標(biāo)題、摘要和正文,作為搜索請(qǐng)求的搜索結(jié)果。
[0136]在本發(fā)明的一個(gè)不例性實(shí)施例中,信息提取模塊507適于從媒體內(nèi)容索引庫(kù)中提取網(wǎng)頁(yè)的至少下列中的一種媒體內(nèi)容信息:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/大小、格式和每個(gè)媒體內(nèi)容的第一 URL地址。
[0137]在本發(fā)明的一個(gè)不例性實(shí)施例中,信息提取模塊507適于為網(wǎng)頁(yè)中的一個(gè)或多個(gè)媒體內(nèi)容分配第二 URL地址,其中第二 URL地址指向顯示一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面。
[0138]在圖3所示的本發(fā)明的示例性實(shí)施例中,在請(qǐng)求檢測(cè)模塊503檢測(cè)到搜索請(qǐng)求與圖片相關(guān)聯(lián)的情況下,信息提取模塊507可分別從文字索引庫(kù)和圖片索引庫(kù)中提取網(wǎng)頁(yè)的文字信息和圖片信息,并可為網(wǎng)頁(yè)中的一個(gè)或多個(gè)圖片分配新的URL地址,其中該新的URL地址指向顯示網(wǎng)頁(yè)中的一個(gè)或多個(gè)圖片的縮略圖的頁(yè)面(如箭頭3G所指示)??蛇x地,信息提取模塊507可為網(wǎng)頁(yè)中的全部圖片分配新的URL地址,其中該新的URL地址指向顯示網(wǎng)頁(yè)中全部圖片的縮略圖的頁(yè)面??蛇x地,當(dāng)用戶在搜索結(jié)果中選擇對(duì)應(yīng)于該新的URL地址的選項(xiàng)時(shí),如圖3中的圖片標(biāo)題(如箭頭3D所指示)時(shí),跳轉(zhuǎn)至相應(yīng)于該新的URL地址的頁(yè)面(如箭頭3G所指示),以向用戶顯示該網(wǎng)頁(yè)中全部圖片的縮略圖。
[0139]在本發(fā)明的一個(gè)示例性實(shí)施例中,信息提取模塊507包括:文字信息提取單元和媒體內(nèi)容信息提取單元適于分別從文字索引庫(kù)和媒體內(nèi)容索引庫(kù)中提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息;以及信息組合單元,適于按預(yù)定方式組合網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果。
[0140]在本發(fā)明的一個(gè)示例性實(shí)施例中,信息組合單元適于從網(wǎng)頁(yè)的媒體內(nèi)容信息中選擇一個(gè)媒體內(nèi)容的第一縮略圖;以及在搜索結(jié)果中顯示一個(gè)媒體內(nèi)容的第一縮略圖。
[0141]在如圖3所示的本發(fā)明的示例性實(shí)施例中,在請(qǐng)求檢測(cè)模塊503檢測(cè)到搜索請(qǐng)求與圖片相關(guān)聯(lián)的情況下,文字信息提取單元和媒體內(nèi)容信息提取單元分別從文字索引庫(kù)提取網(wǎng)頁(yè)的以下文字信息:網(wǎng)頁(yè)的標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示)和/或網(wǎng)頁(yè)的URL(如箭頭3C所指示),從圖片索引庫(kù)中提取網(wǎng)頁(yè)的以下圖片信息:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未不出)、圖片大小或分辨率(未不出)、圖片格式(未不出)和/或圖片的URL地址(未不出)??蛇x地,信息組合單元在所提取的圖片的第一縮略圖中選擇一個(gè)第一縮略圖(如箭頭3F所指示),以顯示在搜索結(jié)果中。如圖3所示,每項(xiàng)搜索結(jié)果均包括網(wǎng)頁(yè)的標(biāo)題、摘要和URL,以及圖片標(biāo)題、圖片數(shù)量和圖片的一個(gè)第一縮略圖(如箭頭3F所指示)。
[0142]在本發(fā)明的一個(gè)示例性實(shí)施例中,信息組合單元適于從網(wǎng)頁(yè)的媒體內(nèi)容信息中選擇多個(gè)媒體內(nèi)容的第一縮略圖;以及在搜索結(jié)果中顯示該多個(gè)媒體內(nèi)容的第一縮略圖。
[0143]如圖6所示的本發(fā)明的示例性實(shí)施例中,信息組合單元可在圖片的第一縮略圖中選擇四個(gè)圖片的第一縮略圖(如箭頭6E所指示),以顯示在搜索結(jié)果中。當(dāng)然可以理解,信息組合單元所選擇的第一縮略圖的數(shù)量不限于本發(fā)明實(shí)施例中所描述的數(shù)量。在圖6所示的搜索結(jié)果中,每項(xiàng)搜索結(jié)果均包括網(wǎng)頁(yè)的標(biāo)題、摘要和URL,以及圖片標(biāo)題、圖片數(shù)量和圖片的四個(gè)第一縮略圖(如箭頭6E所指示)。
[0144]在本發(fā)明的一個(gè)示例性實(shí)施例中,媒體內(nèi)容信息包括文字部分和縮略圖部分,文字部分指向顯示一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面。
[0145]在如圖3所示的本發(fā)明的示例性實(shí)施例中,在請(qǐng)求檢測(cè)模塊503檢測(cè)到搜索請(qǐng)求與圖片相關(guān)聯(lián)的情況下,圖片信息包括文字部分和縮略圖部分。在搜索結(jié)果中,文字部分可包括圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片作者(未示出)、圖片大小或分辨率(未不出)、圖片格式(未不出)和/或圖片的URL地址(未不出);縮略圖部分可包括圖片的第一縮略圖(如箭頭3F所指示)。其中,當(dāng)用戶選擇圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)或其他文字部分時(shí),跳轉(zhuǎn)至新的頁(yè)面(如箭頭3G所指示),該頁(yè)面顯示一個(gè)或多個(gè)圖片的第二縮略圖(如箭頭3H所指示)??蛇x地,該頁(yè)面顯示網(wǎng)頁(yè)中全部圖片的第二縮略圖。
[0146]在如圖6所示的本發(fā)明的示例性實(shí)施例中,在請(qǐng)求檢測(cè)模塊503檢測(cè)到搜索請(qǐng)求與圖片相關(guān)聯(lián)的情況下,圖片信息包括文字部分和縮略圖部分。在搜索結(jié)果中,文字部分可包括圖片標(biāo)題(未示出)、圖片數(shù)量(如箭頭6D所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)、圖片的URL地址(未示出)和/或其他文字部分(如箭頭6G所指示的“》”);縮略圖部分可包括圖片的第一縮略圖(如箭頭6E所指示)。其中,當(dāng)用戶選擇圖片數(shù)量(如箭頭6D所指示)或其他文字部分時(shí)(如箭頭6G所指示的“》”),跳轉(zhuǎn)至新的頁(yè)面(如箭頭6H所指示),該頁(yè)面顯示一個(gè)或多個(gè)圖片的第二縮略圖(如箭頭61所指示)??蛇x地,該頁(yè)面顯示網(wǎng)頁(yè)中全部圖片的第二縮略圖。
[0147]本發(fā)明的實(shí)施例中,用于搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的裝置500能夠?yàn)榭蛻籼峁└庇^、更易于理解的搜索媒體內(nèi)容信息的方式,使用戶能夠大體了解網(wǎng)頁(yè)中媒體內(nèi)容的相關(guān)信息,幫助用戶確定搜索結(jié)果相關(guān)度的信息,從而提高了搜索效率。
[0148]實(shí)施例六
[0149]下面介紹根據(jù)本發(fā)明的示例性實(shí)施例的用于搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的裝置。
[0150]可選地,該裝置適于執(zhí)行前面描述的方法300。
[0151]圖10示出了根據(jù)本發(fā)明的示例性實(shí)施例的用于搜索引擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的裝置600的結(jié)構(gòu)示意圖。
[0152]在本發(fā)明的實(shí)施例中,裝置600包括:
[0153]信息提取模塊601,適于在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果;以及
[0154]搜索結(jié)果提供模塊603,適于響應(yīng)于對(duì)網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息的選擇,提供搜索結(jié)果。
[0155]在本發(fā)明的實(shí)施例中,媒體內(nèi)容可至少包括下列中的一種:圖片、動(dòng)畫(huà)、音頻和視頻。當(dāng)然可以理解,媒體內(nèi)容也可以包括其他內(nèi)容。
[0156]如圖10所示,裝置600包括信息提取模塊601,適于在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果。例如,如圖10所示,在從一個(gè)或者多個(gè)用戶端設(shè)備上接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),信息提取模塊601可以提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果。
[0157]可選地,搜索請(qǐng)求可以是用戶輸入的搜索關(guān)鍵詞。當(dāng)然可以理解,本發(fā)明的實(shí)施例中并不限定上述搜索請(qǐng)求的具體形式。
[0158]在本發(fā)明的一個(gè)示例性的實(shí)施例中,信息提取模塊601適于在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的至少下列中的一種文字信息作為搜索請(qǐng)求的搜索結(jié)果:標(biāo)題、摘要和正文。
[0159]在本發(fā)明的一個(gè)示例性的實(shí)施例中,信息提取模塊601適于在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的至少下列中的一種媒體內(nèi)容信息:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/大小、格式和每個(gè)媒體內(nèi)容的第一URL地址。
[0160]在如圖3所示的本發(fā)明的示例性實(shí)施例中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的圖片信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),信息提取模塊601可提取網(wǎng)頁(yè)的至少下列中的一種文字信息作為搜索請(qǐng)求的搜索結(jié)果:網(wǎng)頁(yè)的標(biāo)題(如箭頭3Α所指示)、摘要(如箭頭3Β所指示),以及網(wǎng)頁(yè)的URL (如箭頭3C所指示)。可選地,信息提取模塊601可提取網(wǎng)頁(yè)的至少下列中的一種圖片信息作為搜索請(qǐng)求的搜索結(jié)果:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3Ε所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和圖片的URL地址(未示出)。
[0161]在圖4所示的本發(fā)明的示例性實(shí)施例中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的音頻信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),信息提取模塊601可提取網(wǎng)頁(yè)的至少下列中的一種文字信息作為搜索請(qǐng)求的搜索結(jié)果:標(biāo)題(如箭頭4A所指示)、摘要(如箭頭4B所指示)和網(wǎng)頁(yè)的URL (如箭頭4C所指示)??蛇x地,信息提取模塊601可提取網(wǎng)頁(yè)的至少下列中的一種音頻信息作為搜索請(qǐng)求的搜索結(jié)果:音頻標(biāo)題(如箭頭4D所指示)、音頻縮略圖(如箭頭4E所指示)、音頻作者(如箭頭4F所指示)、音頻大小(如箭頭4G所指示)、音頻格式(未示出),以及音頻的URL地址(未示出)。
[0162]在本發(fā)明的一個(gè)示例性的實(shí)施例中,信息提取模塊601可提取為每個(gè)媒體內(nèi)容預(yù)分配的第二 URL地址,其中第二 URL地址指向顯示所述一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面
[0163]在如圖3所示的本發(fā)明的示例性實(shí)施例中,在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的圖片信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),信息提取模塊601可提取為每個(gè)圖片預(yù)分配的第二 URL地址,其中該第二 URL地址指向顯示一個(gè)或多個(gè)圖片的第二縮略圖的頁(yè)面??蛇x地,信息提取模塊601可提取為網(wǎng)頁(yè)中的全部圖片分配新的URL地址,其中該新的URL地址指向顯示網(wǎng)頁(yè)中全部圖片的縮略圖的頁(yè)面(如箭頭3G所指示)??蛇x地,當(dāng)用戶在搜索結(jié)果中選擇對(duì)應(yīng)于該新的URL地址的選項(xiàng)時(shí),如圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)或其他文字部分時(shí),跳轉(zhuǎn)至相應(yīng)于該新的URL地址的頁(yè)面(如箭頭3G所指示),以向用戶顯示該網(wǎng)頁(yè)中全部圖片的縮略圖。
[0164]在本發(fā)明的一個(gè)示例性實(shí)施例中,信息提取模塊601包括文字信息提取單元和媒體內(nèi)容信息提取單元,適于在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息;以及信息組合單元,適于按預(yù)定方式組合網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果。
[0165]如圖10所示,裝置600包括搜索結(jié)果提供模塊603,適于響應(yīng)于對(duì)網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息的選擇,提供搜索結(jié)果。例如,如圖10所示,該搜索結(jié)果可以在一個(gè)或者多個(gè)用戶端設(shè)備上顯示。
[0166]在本發(fā)明的一個(gè)示例性實(shí)施例中,搜索結(jié)果提供模塊603可響應(yīng)于對(duì)網(wǎng)頁(yè)文字信息的選擇,跳轉(zhuǎn)至第一 URL地址,以提供搜索結(jié)果。例如,如圖4所示,搜索結(jié)果提供模塊603可響應(yīng)于對(duì)網(wǎng)頁(yè)文字信息(如箭頭4A所指示的網(wǎng)頁(yè)標(biāo)題)的選擇,執(zhí)行跳轉(zhuǎn)至第一 URL地址的步驟,以提供該視頻的詳細(xì)信息(如箭頭4H所指示)。
[0167]在本發(fā)明的另一個(gè)示例性實(shí)施例中,文字信息提取單元和媒體內(nèi)容信息提取單元可在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息;且信息組合單元可按以下預(yù)定方式組合網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果:從網(wǎng)頁(yè)的媒體內(nèi)容信息中選擇一個(gè)媒體內(nèi)容的第一縮略圖,并在搜索結(jié)果中顯示一個(gè)媒體內(nèi)容的第一縮略圖??蛇x地,搜索結(jié)果提供模塊603可響應(yīng)于對(duì)一個(gè)媒體內(nèi)容的第一縮略圖的選擇,執(zhí)行跳轉(zhuǎn)至第二 URL地址的步驟,以獲得顯示一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面??蛇x地,搜索結(jié)果提供模塊603可響應(yīng)于對(duì)第二URL地址中顯示的每個(gè)媒體內(nèi)容的第二縮略圖的選擇,執(zhí)行跳轉(zhuǎn)至該媒體內(nèi)容的第一 URL地址的步驟,以提供該媒體內(nèi)容的信息。[0168]在如圖3所示的本發(fā)明的示例性實(shí)施例中,文字信息提取單元和媒體內(nèi)容信息提取單元可在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的圖片信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的以下文字信息:網(wǎng)頁(yè)的標(biāo)題(如箭頭3A所指示)、摘要(如箭頭3B所指示)和/或網(wǎng)頁(yè)的URL (如箭頭3C所指示),并提取網(wǎng)頁(yè)的以下圖片信息:圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)、圖片的第一縮略圖(如箭頭3F所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和/或圖片的URL地址(未示出)??蛇x地,信息組合單元可按以下預(yù)定方式組合網(wǎng)頁(yè)的文字信息和圖片信息,作為搜索請(qǐng)求的搜索結(jié)果:從網(wǎng)頁(yè)的圖片信息中選擇一個(gè)圖片的第一縮略圖,并在結(jié)果中顯示一個(gè)圖片的第一縮略圖(如箭頭3F所指示)??蛇x地,當(dāng)用戶選擇該一個(gè)圖片的縮略圖(如箭頭3F所指示)時(shí),搜索結(jié)果提供模塊603可執(zhí)行跳轉(zhuǎn)至新的頁(yè)面(如箭頭3G所指示)的步驟,該頁(yè)面顯示一個(gè)或多個(gè)圖片的第二縮略圖(如箭頭3H所指示)??蛇x地,該頁(yè)面顯示網(wǎng)頁(yè)中全部圖片的第二縮略圖??蛇x地,當(dāng)用戶選擇新的界面(如箭頭3G所指示)中的每個(gè)圖片的第二縮略圖(如箭頭3H所指示)時(shí),搜索結(jié)果提供模塊603可執(zhí)行跳轉(zhuǎn)至該圖片的第一 URL地址的步驟,以顯示該圖片的詳細(xì)信息。
[0169]在本發(fā)明的另一個(gè)示例性實(shí)施例中,文字信息提取單元和媒體內(nèi)容信息提取單元可在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息;以及信息組合單元可按以下預(yù)定方式組合網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果:從網(wǎng)頁(yè)的媒體內(nèi)容信息中選擇多個(gè)媒體內(nèi)容的第一縮略圖,并在搜索結(jié)果中顯示多個(gè)媒體內(nèi)容的第一縮略圖??蛇x地,搜索結(jié)果提供模塊603可響應(yīng)于對(duì)每個(gè)媒體內(nèi)容的第一縮略圖的選擇,執(zhí)行跳轉(zhuǎn)至該媒體內(nèi)容的第一 URL地址的步驟,以提供該媒體內(nèi)容的信息。
[0170]在如圖6所示的本發(fā)明的示例性實(shí)施例中,文字信息提取單元和媒體內(nèi)容信息提取單元可在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的圖片信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的以下文字信息:標(biāo)題(如箭頭6A所指示)、摘要(如箭頭6B所指示)和/或網(wǎng)頁(yè)的URL (如箭頭6C所指示),并提取網(wǎng)頁(yè)的以下圖片信息:圖片標(biāo)題(未示出)、圖片數(shù)量(如箭頭6D所指示)、圖片的第一縮略圖(如箭頭6E所指示)、圖片作者(未示出)、圖片大小或分辨率(未示出)、圖片格式(未示出)和/或圖片的URL地址(未示出)??蛇x地,信息組合單元可按以下預(yù)定方式組合網(wǎng)頁(yè)的文字信息和圖片信息,作為搜索請(qǐng)求的搜索結(jié)果:從網(wǎng)頁(yè)的圖片信息中選擇四個(gè)第一縮略圖,并在結(jié)果中顯示四個(gè)第一縮略圖。當(dāng)然可以理解,本發(fā)明實(shí)施例并不限制所選擇的和顯示的圖片數(shù)量??蛇x地,當(dāng)用戶選擇該四個(gè)圖片縮略圖中的每一個(gè)時(shí),搜索結(jié)果提供模塊603可執(zhí)行跳轉(zhuǎn)至新的頁(yè)面(如箭頭6F所指示)的步驟,該頁(yè)面顯示該圖片的詳細(xì)信息。
[0171]在本發(fā)明的另一個(gè)示例性實(shí)施例中,文字信息提取單元和媒體內(nèi)容信息提取單元可在接收到與網(wǎng)頁(yè)中預(yù)設(shè)的媒體內(nèi)容信息的標(biāo)識(shí)相匹配的搜索請(qǐng)求時(shí),提取網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,其中媒體內(nèi)容信息包括文字部分和縮略圖部分;以及信息組合單元可按預(yù)定方式組合網(wǎng)頁(yè)的文字信息和媒體內(nèi)容信息,作為搜索請(qǐng)求的搜索結(jié)果??蛇x地,搜索結(jié)果提供模塊603可響應(yīng)于對(duì)文字部分的選擇,執(zhí)行跳轉(zhuǎn)至第二 URL地址的步驟,以獲得顯示一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面??蛇x地,搜索結(jié)果提供模塊603可響應(yīng)于對(duì)第二 URL地址中顯示的每個(gè)媒體內(nèi)容的第二縮略圖的選擇,執(zhí)行跳轉(zhuǎn)至該媒體內(nèi)容的第一URL地址的步驟,以提供該媒體內(nèi)容的信息。
[0172]在如圖3所示的本發(fā)明的示例性實(shí)施例中,搜索結(jié)果中的圖片信息,包括文字部分和縮略圖部分。文字部分可包括圖片標(biāo)題(如箭頭3D所指示)、圖片數(shù)量(如箭頭3E所指示)和/或其他文字;縮略圖部分包括圖片的第一縮略圖(如箭頭3F所指示)??蛇x地,當(dāng)用戶選擇圖片標(biāo)題(如箭頭3D所指示)或圖片數(shù)量(如箭頭3E所指示)時(shí),搜索結(jié)果提供模塊603可執(zhí)行跳轉(zhuǎn)至新的頁(yè)面(如箭頭3G所指示)的步驟,該頁(yè)面顯示一個(gè)或多個(gè)圖片的第二縮略圖(如箭頭3H所指示)。可選地,該頁(yè)面顯示網(wǎng)頁(yè)中全部圖片的第二縮略圖??蛇x地,響應(yīng)于對(duì)每個(gè)圖片的第二縮略圖(如箭頭3H所指示)的選擇,搜索結(jié)果提供模塊603可執(zhí)行跳轉(zhuǎn)至該圖片的第一 URL地址的步驟,以提供該圖片的詳細(xì)信息。
[0173]在如圖3所示的本發(fā)明的示例性實(shí)施例中,搜索結(jié)果中的圖片信息,包括文字部分和縮略圖部分。文字部分可包括圖片標(biāo)題(未示出)、圖片數(shù)量(如箭頭6D所指示)和/或其他文字(如圖6中箭頭6G所指示的“》”);縮略圖部分包括圖片的第一縮略圖(如箭頭6E所指示)??蛇x地,當(dāng)用戶選擇圖片標(biāo)題(未示出)、圖片數(shù)量(如箭頭6D所指示),或其他文字(如圖6中箭頭6G所指示的“》”)時(shí),搜索結(jié)果提供模塊603可執(zhí)行跳轉(zhuǎn)至新的頁(yè)面(如箭頭6H所指示)的步驟,該頁(yè)面顯示一個(gè)或多個(gè)圖片的第二縮略圖(如箭頭61所指示)??蛇x地,該頁(yè)面顯示網(wǎng)頁(yè)中全部圖片的第二縮略圖。可選地,響應(yīng)于對(duì)每個(gè)圖片的第二縮略圖(如箭頭61所指示)的選擇,搜索結(jié)果提供模塊603可執(zhí)行跳轉(zhuǎn)至該圖片的第一 URL地址的步驟,以提供該圖片的詳細(xì)信息。
[0174]本發(fā)明的實(shí)施例中,用于搜索弓I擎提供網(wǎng)頁(yè)媒體內(nèi)容信息的裝置600能夠在搜索結(jié)果中提供文字信息和媒體內(nèi)容信息,從而為客戶提供了更直觀、更易于理解的搜索媒體內(nèi)容信息的方式,使用戶能夠大體了解網(wǎng)頁(yè)中媒體內(nèi)容的相關(guān)信息,幫助用戶確定搜索結(jié)果相關(guān)度的信息,從而提高了搜索效率。
[0175]在此提供的方法和裝置不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類(lèi)裝置所要求的結(jié)構(gòu)是顯而易見(jiàn)的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
[0176]在此處所提供的說(shuō)明書(shū)中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書(shū)的理解。
[0177]類(lèi)似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開(kāi)并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開(kāi)的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如權(quán)利要求書(shū)所反映的那樣,發(fā)明方面在于少于前面公開(kāi)的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書(shū)由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0178]本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的裝置中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)裝置中??梢园褜?shí)施例中的若干模塊組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者模塊中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的替代特征來(lái)代替。
[0179]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在權(quán)利要求書(shū)中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
[0180]本發(fā)明的各個(gè)裝置實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP )來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的裝置中的一些或者全部模塊的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
[0181]應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱(chēng)。
【權(quán)利要求】
1.一種搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的方法,包括步驟: 抓取網(wǎng)頁(yè)信息; 檢測(cè)所述網(wǎng)頁(yè)信息是否包含預(yù)設(shè)的媒體內(nèi)容的信息的標(biāo)識(shí); 在檢測(cè)到網(wǎng)頁(yè)信息中包含所述標(biāo)識(shí)的情況下,提取所述網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息;以及 基于所述文字信息和所述媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù)。
2.如權(quán)利要求1所述的方法,其中所述媒體內(nèi)容至少包括下列中的一種:圖片、動(dòng)畫(huà)、音頻和視頻。
3.如權(quán)利要求1或2所述的方法,其中在檢測(cè)到網(wǎng)頁(yè)信息中包含所述標(biāo)識(shí)的情況下,提取所述網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息的步驟包括: 在檢測(cè)到網(wǎng)頁(yè)信息中包含所述標(biāo)識(shí)的情況下,提取所述網(wǎng)頁(yè)的至少下列中的一種所述文字信息:標(biāo)題、摘要和正文;并且提取所述網(wǎng)頁(yè)的至少下列中的一種所述媒體內(nèi)容信息:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/或大小、格式和每個(gè)媒體內(nèi)容的第一URL地址。
4.如權(quán)利要求1-3任一項(xiàng)所述的方法,其中在檢測(cè)到網(wǎng)頁(yè)信息中包含所述標(biāo)識(shí)的情況下,提取所述網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息的步驟還包括: 為所述網(wǎng)頁(yè)分配第二 URL地址,其中所述第二 URL地址指向顯示所述網(wǎng)頁(yè)中的一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面。
5.如權(quán)利要求1-4任一項(xiàng)所述的方法`,其中基于所述文字信息和所述媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù)的步驟包括: 使所述文字索引庫(kù)中的文字信息與所述媒體內(nèi)容索引庫(kù)中關(guān)于同一網(wǎng)頁(yè)的媒體內(nèi)容信息相關(guān)聯(lián)。
6.一種用于搜索引擎抓取網(wǎng)頁(yè)媒體內(nèi)容信息的裝置,包括: 信息抓取模塊,適于抓取網(wǎng)頁(yè)信息; 標(biāo)識(shí)檢測(cè)模塊,適于檢測(cè)所述網(wǎng)頁(yè)信息是否包含預(yù)設(shè)的媒體內(nèi)容的信息的標(biāo)識(shí); 信息提取模塊,適于在檢測(cè)到網(wǎng)頁(yè)信息中包含所述標(biāo)識(shí)的情況下,提取所述網(wǎng)頁(yè)信息中的文字信息和媒體內(nèi)容信息; 索引庫(kù)建立模塊,適于基于所述文字信息和所述媒體內(nèi)容信息,分別建立文字索引庫(kù)和媒體內(nèi)容索引庫(kù)。
7.如權(quán)利要求6所述的裝置,其中所述媒體內(nèi)容至少包括下列中的一種:圖片、動(dòng)畫(huà)、音頻和視頻。
8.如權(quán)利要求6或7所述的裝置,其中所述信息提取模塊適于: 在檢測(cè)到網(wǎng)頁(yè)信息中包含所述標(biāo)識(shí)的情況下,提取所述網(wǎng)頁(yè)的至少下列中的一種所述文字信息:標(biāo)題、摘要和正文;并且提取所述網(wǎng)頁(yè)的至少下列中的一種所述媒體內(nèi)容信息:媒體內(nèi)容的標(biāo)題、數(shù)量、第一縮略圖、作者、長(zhǎng)度和/或大小、格式和每個(gè)媒體內(nèi)容的第一URL地址。
9.如權(quán)利要求6-8任一項(xiàng)所述的裝置,其中所述信息提取模塊適于: 為所述網(wǎng)頁(yè)分配第二 URL地址,其中所述第二 URL地址指向顯示所述網(wǎng)頁(yè)中的一個(gè)或多個(gè)媒體內(nèi)容的第二縮略圖的頁(yè)面。
10.如權(quán)利要求6-9任一項(xiàng)所述的裝置,其中所述索引庫(kù)建立模塊適于: 使所述文字索引庫(kù)中的文字信息與所述媒體內(nèi)容索引庫(kù)中關(guān)于同一網(wǎng)頁(yè)的媒體內(nèi)容信息 相關(guān)聯(lián)。
【文檔編號(hào)】G06F17/30GK103761230SQ201310487302
【公開(kāi)日】2014年4月30日 申請(qǐng)日期:2013年10月17日 優(yōu)先權(quán)日:2013年10月17日
【發(fā)明者】侯小虎 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司