專利名稱:基于權(quán)威度確定鏈接資源的可靠描述信息的方法與設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)資源搜索領(lǐng)域,尤其涉及一種用于基于權(quán)威度確定鏈接資源的可 靠描述信息的技術(shù)。
背景技術(shù):
隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)中的資源急劇增長(zhǎng),同時(shí)增長(zhǎng)的還有與這些資源相對(duì)應(yīng) 的描述信息。
在互聯(lián)網(wǎng)中,往往針對(duì)一個(gè)相同的鏈接資源,有多個(gè)描述信息。在這些描述信息 中,有些是與該鏈接資源相關(guān)的,有些卻是完全無(wú)關(guān)的。如果在抓取這些描述信息時(shí),不對(duì) 這些描述信息做預(yù)先判斷,在搜索引擎向用戶提供這些描述信息后,用戶可能會(huì)點(diǎn)擊那些 完全無(wú)關(guān)的描述信息,從而無(wú)法獲取那些用戶希望獲取的描述信息。
因此,如何有效確定鏈接資源的可靠描述信息,成為目前急需解決的問(wèn)題之一。發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于基于權(quán)威度確定鏈接資源的可靠描述信息的方法 與描述設(shè)備。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于基于權(quán)威度確定鏈接資源的可靠描述信 息的方法,該方法包括以下步驟
a獲取對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè)描述信息;
b獲取所述多個(gè)描述信息中至少一個(gè)的權(quán)威度;
c根據(jù)所述權(quán)威度,處理所述多個(gè)描述信息,以獲得一個(gè)或多個(gè)目標(biāo)描述信息。
根據(jù)本發(fā)明的另一個(gè)方面,還提供了 一種用于基于權(quán)威度確定鏈接資源的可靠描 述信息的描述設(shè)備,該描述設(shè)備包括
第一獲取裝置,用于獲取對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè)描述信息;
第二獲取裝置,用于獲取所述多個(gè)描述信息中至少一個(gè)的權(quán)威度;
處理裝置,用于根據(jù)所述權(quán)威度,處理所述多個(gè)描述信息,以獲得一個(gè)或多個(gè)目標(biāo) 描述信息。
與現(xiàn)有技術(shù)相比,本發(fā)明通過(guò)確定對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè)描述信息的權(quán)威 度,從而過(guò)濾與該鏈接資源不匹配的描述信息,使得用戶最終獲得相對(duì)可靠的描述信息,同 時(shí)提升了用戶的使用體驗(yàn)。
通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它 特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯
圖1示出根據(jù)本發(fā)明一個(gè)方面的用于基于權(quán)威度確定鏈接資源的可靠描述信息 的描述設(shè)備的設(shè)備示意圖2示出根據(jù)本發(fā)明另一個(gè)方面的用于基于權(quán)威度確定鏈接資源的可靠描述信 息的方法流程圖。
附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
具體實(shí)施方式
下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
圖1為根據(jù)本發(fā)明一個(gè)方面的設(shè)備示意圖,示出用于基于權(quán)威度確定鏈接資源的 可靠描述信息的描述設(shè)備。其中,描述設(shè)備1包括第一獲取裝置11、第二獲取裝置12和處 理裝置13。具體地,第一獲取裝置11獲取對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè)描述信息;隨后, 第二獲取裝置12獲取所述描述信息的權(quán)威度;接著,處理裝置13根據(jù)所述權(quán)威度,處理所 述多個(gè)描述信息,以獲得一個(gè)或多個(gè)目標(biāo)描述信息。
更具體地,第一獲取裝置11獲取對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè)描述信息。具體 地,第一獲取裝置11獲取與同一個(gè)鏈接資源相對(duì)應(yīng)的多個(gè)描述信息,如通過(guò)各種網(wǎng)頁(yè)抓取 工具抓取包含描述信息的網(wǎng)頁(yè),并通過(guò)匹配查詢識(shí)別出對(duì)應(yīng)同一個(gè)鏈接資源的多個(gè)描述信 息。在此,第一獲取裝置11獲取對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè)描述信息的方式包括但不限 于通過(guò)“網(wǎng)絡(luò)蜘蛛(spider)”、“網(wǎng)絡(luò)爬蟲(chóng)(crawler)”或者“機(jī)器人(robot) ”等網(wǎng)頁(yè)抓取 工具抓取對(duì)應(yīng)同一個(gè)鏈接資源的多個(gè)描述信息的網(wǎng)頁(yè);在索引信息庫(kù)中通過(guò)匹配查詢獲取 對(duì)應(yīng)同一個(gè)鏈接資源的多個(gè)描述信息;直接從第三方設(shè)備獲取對(duì)應(yīng)同一個(gè)鏈接資源的多個(gè) 描述信息。本領(lǐng)域技術(shù)人員應(yīng)能理解上述第一獲取裝置獲取對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè) 描述信息的方式以及網(wǎng)頁(yè)抓取工具僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的第一獲取裝置 獲取對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè)描述信息的方式或者網(wǎng)頁(yè)抓取工具如可適用于本發(fā)明, 也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。
隨后,第二獲取裝置12獲取所述描述信息的權(quán)威度。具體地,第二獲取裝置12根 據(jù)第一獲取裝置11獲取的對(duì)應(yīng)同一個(gè)鏈接資源的多個(gè)描述信息,通過(guò)諸如描述信息的來(lái) 源、描述信息中的描述關(guān)鍵詞的相關(guān)屬性或者描述信息的網(wǎng)頁(yè)相關(guān)特征等參數(shù),獲取這些 描述信息的權(quán)威度。例如,假設(shè)描述信息的權(quán)威度賦值表示例如表1所示,表2示出與鏈接 資源http://WWW. xxxx. com/xxxx/冰雨.mp3相對(duì)應(yīng)的多個(gè)描述信息,以及根據(jù)表1計(jì)算獲 得各描述信息的權(quán)威度。
表1 描述信息的權(quán)威度賦值表示例
權(quán)利要求
1.一種計(jì)算機(jī)實(shí)現(xiàn)的用于基于權(quán)威度確定鏈接資源的可靠描述信息的方法,其中,該 方法包括以下步驟a獲取對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè)描述信息; b獲取所述描述信息的權(quán)威度;c根據(jù)所述權(quán)威度,處理所述多個(gè)描述信息,以獲得一個(gè)或多個(gè)目標(biāo)描述信息。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟c中的處理操作包括以下至少任一項(xiàng) -選擇所述權(quán)威度最高的一個(gè)或多個(gè)描述信息;-選擇所述權(quán)威度超過(guò)預(yù)定閾值的一個(gè)或多個(gè)描述信息。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,該方法還包括步驟d -從所述一個(gè)或多個(gè)目標(biāo)描述信息中提取目標(biāo)關(guān)鍵詞;-根據(jù)所述目標(biāo)關(guān)鍵詞,生成最終描述信息。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,所述步驟b還包括 -根據(jù)所述描述信息的來(lái)源,確定所述描述信息的權(quán)威度。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其中,該方法還包括步驟e -根據(jù)預(yù)置詞表,從所述描述信息中提取描述關(guān)鍵詞;-根據(jù)所述描述關(guān)鍵詞,獲取所述描述信息的所述描述關(guān)鍵詞的相關(guān)屬性;其中,所述相關(guān)屬性包括以下至少任一項(xiàng)-所述描述信息的所述描述關(guān)鍵詞對(duì)應(yīng)的用戶需求量;-所述描述信息的所述描述關(guān)鍵詞對(duì)應(yīng)的資源數(shù)量;其中,所述步驟b還包括-根據(jù)所述相關(guān)屬性,確定所述描述信息的權(quán)威度。
6.根據(jù)權(quán)利要求5所述的方法,其中,該方法還包括f根據(jù)所述多個(gè)描述信息,建立或者更新所述預(yù)置詞表。
7.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的方法,其中,所述步驟b還包括-根據(jù)所述描述信息所在網(wǎng)頁(yè)的網(wǎng)頁(yè)相關(guān)特征,確定所述描述信息的權(quán)威度; 其中,所述網(wǎng)頁(yè)相關(guān)特征包括以下至少任一項(xiàng) -所述描述信息所在網(wǎng)頁(yè)的權(quán)威屬性; -所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的權(quán)威屬性。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述描述信息所在網(wǎng)頁(yè)的權(quán)威屬性基于以下至 少任一項(xiàng)-所述描述信息所在網(wǎng)頁(yè)的資源量; -所述描述信息所在網(wǎng)頁(yè)的資源的質(zhì)量; -所述描述信息所在網(wǎng)頁(yè)的流量。
9.根據(jù)權(quán)利要求7或8所述的方法,其中,所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的權(quán)威屬性 基于以下至少任一項(xiàng)-所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的鏈接數(shù)量; -所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的資源量; -所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的資源的質(zhì)量; -所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的流量;-所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的更新時(shí)間。
10.根據(jù)權(quán)利要求1至9中任一項(xiàng)所述的方法,其中,所述鏈接資源包括以下至少任一項(xiàng)-音樂(lè)文件鏈接資源; -圖片文件鏈接資源; -文本文件鏈接資源; -視頻文件鏈接資源。
11.一種用于基于權(quán)威度確定鏈接資源的可靠描述信息的描述設(shè)備,其中,該描述設(shè)備 包括第一獲取裝置,用于獲取對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè)描述信息; 第二獲取裝置,用于獲取所述描述信息的權(quán)威度;處理裝置,用于根據(jù)所述權(quán)威度,處理所述多個(gè)描述信息,以獲得一個(gè)或多個(gè)目標(biāo)描述信息ο
12.根據(jù)權(quán)利要求11所述的描述設(shè)備,其中,所述處理裝置中的處理操作包括以下至 少任一項(xiàng)-選擇所述權(quán)威度最高的一個(gè)或多個(gè)描述信息; -選擇所述權(quán)威度超過(guò)預(yù)定閾值的一個(gè)或多個(gè)描述信息。
13.根據(jù)權(quán)利要求11或12所述的描述設(shè)備,其中,該描述設(shè)備還包括生成裝置,所述生 成裝置用于-從所述一個(gè)或多個(gè)目標(biāo)描述信息中提取目標(biāo)關(guān)鍵詞; -根據(jù)所述目標(biāo)關(guān)鍵詞,生成最終描述信息。
14.根據(jù)權(quán)利要求11至13中任一項(xiàng)所述的描述設(shè)備,其中,所述第二獲取裝置還用于-根據(jù)所述描述信息的來(lái)源,確定所述描述信息的權(quán)威度。
15.根據(jù)權(quán)利要求11至14中任一項(xiàng)所述的描述設(shè)備,其中,該描述設(shè)備還包括提取裝 置,所述提取裝置用于-根據(jù)預(yù)置詞表,從所述描述信息中提取描述關(guān)鍵詞;-根據(jù)所述描述關(guān)鍵詞,獲取所述描述信息的所述描述關(guān)鍵詞的相關(guān)屬性;其中,所述相關(guān)屬性包括以下至少任一項(xiàng)-所述描述信息的所述描述關(guān)鍵詞對(duì)應(yīng)的用戶需求量;-所述描述信息的所述描述關(guān)鍵詞對(duì)應(yīng)的資源數(shù)量;其中,所述第二獲取裝置還用于-根據(jù)所述相關(guān)屬性,確定所述描述信息的權(quán)威度。
16.根據(jù)權(quán)利要求15所述的描述設(shè)備,其中,該描述設(shè)備還包括更新裝置,用于根據(jù)所述多個(gè)描述信息,建立或者更新所述預(yù)置詞表。
17.根據(jù)權(quán)利要求11至16中任一項(xiàng)所述的描述設(shè)備,其中,所述第二獲取裝置還用于-根據(jù)所述描述信息所在網(wǎng)頁(yè)的網(wǎng)頁(yè)相關(guān)特征,確定所述描述信息的權(quán)威度; 其中,所述網(wǎng)頁(yè)相關(guān)特征包括以下至少任一項(xiàng)-所述描述信息所在網(wǎng)頁(yè)的權(quán)威屬性; -所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的權(quán)威屬性。
18.根據(jù)權(quán)利要求17所述的描述設(shè)備,其中,所述描述信息所在網(wǎng)頁(yè)的權(quán)威屬性基于 以下至少任一項(xiàng)-所述描述信息所在網(wǎng)頁(yè)的資源量; -所述描述信息所在網(wǎng)頁(yè)的資源的質(zhì)量; -所述描述信息所在網(wǎng)頁(yè)的流量。
19.根據(jù)權(quán)利要求17或18所述的描述設(shè)備,其中,所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的 權(quán)威屬性基于以下至少任一項(xiàng)-所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的鏈接數(shù)量; -所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的資源量; -所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的資源的質(zhì)量; -所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的流量; -所述描述信息所在網(wǎng)頁(yè)所屬網(wǎng)站的更新時(shí)間。
20.根據(jù)權(quán)利要求11至19中任一項(xiàng)所述的描述設(shè)備,其中,所述鏈接資源包括以下至 少任一項(xiàng)-音樂(lè)文件鏈接資源; -圖片文件鏈接資源; -文本文件鏈接資源; -視頻文件鏈接資源。
全文摘要
本發(fā)明的目的是提供一種用于基于權(quán)威度確定鏈接資源的可靠描述信息的方法與描述設(shè)備。其中,描述設(shè)備獲取對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè)描述信息,并獲取所述多個(gè)描述信息中至少一個(gè)的權(quán)威度,再根據(jù)所述權(quán)威度,處理所述多個(gè)描述信息,以獲得一個(gè)或多個(gè)目標(biāo)描述信息。與現(xiàn)有技術(shù)相比,本發(fā)明通過(guò)確定對(duì)應(yīng)于同一個(gè)鏈接資源的多個(gè)描述信息的權(quán)威度,從而過(guò)濾與該鏈接資源不匹配的描述信息,使得用戶最終獲得相對(duì)可靠的描述信息,同時(shí)提升了用戶的使用體驗(yàn)。
文檔編號(hào)G06F17/30GK102033914SQ201010571640
公開(kāi)日2011年4月27日 申請(qǐng)日期2010年11月29日 優(yōu)先權(quán)日2010年11月29日
發(fā)明者姚遠(yuǎn) 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司