專利名稱:一種顯示網(wǎng)頁內(nèi)容相關(guān)信息的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)信息的提供,特別是涉及一種顯示與網(wǎng)頁內(nèi)容相關(guān)的信息 的方法及系統(tǒng)。
技術(shù)背景當(dāng)前,越來越多的信息通過網(wǎng)絡(luò)發(fā)布,進(jìn)行互聯(lián)網(wǎng)范圍內(nèi)的信息展示與交 流。網(wǎng)絡(luò)信息包括文字、圖片、聲音及多媒體等,以靜態(tài)、動(dòng)態(tài)或交互式的方式顯示出來。在網(wǎng)頁上顯示的網(wǎng)絡(luò)信息形式有橫幅式信息,文本鏈接式信息, 插播式信息,按鈕式信息,墻紙式信息,電子郵件式信息,等等。其中,網(wǎng)絡(luò) 廣告是最常見的 一種網(wǎng)絡(luò)信息。在指定網(wǎng)頁上顯示的網(wǎng)絡(luò)信息,通常與該網(wǎng)頁內(nèi)容有密切關(guān)系,稱為網(wǎng)頁 相關(guān)信息。 一種在指定網(wǎng)頁上顯示相關(guān)網(wǎng)絡(luò)信息的方式是網(wǎng)站制作者在制作 網(wǎng)頁時(shí),先把與網(wǎng)頁內(nèi)容相關(guān)的網(wǎng)絡(luò)信息加入到指定網(wǎng)頁中,然后將包含網(wǎng)絡(luò) 信息的網(wǎng)頁發(fā)布到網(wǎng)絡(luò)上。當(dāng)用戶訪問所述指定網(wǎng)頁時(shí),與該網(wǎng)頁內(nèi)容相關(guān)的 網(wǎng)絡(luò)信息即可顯示出來。這種方式實(shí)現(xiàn)起來十分簡(jiǎn)單方便,而且不需要額外的 軟件及硬件支持。但是,由于將網(wǎng)絡(luò)信息加入到網(wǎng)頁中發(fā)布,在網(wǎng)頁內(nèi)容不變 而網(wǎng)絡(luò)信息需要更新時(shí),需要對(duì)網(wǎng)頁文件進(jìn)行修改,因此不利于網(wǎng)絡(luò)信息的及 時(shí)更新。還有一種在指定網(wǎng)頁上顯示相關(guān)網(wǎng)絡(luò)信息的方式網(wǎng)絡(luò)信息的發(fā)布可以與 網(wǎng)頁的制作相分離,網(wǎng)絡(luò)信息制作完成后,指定要顯示的網(wǎng)頁,然后在所述指 定網(wǎng)頁的發(fā)布過程中,加入網(wǎng)絡(luò)信息的發(fā)布。這種方式在更新網(wǎng)絡(luò)信息時(shí),不 必進(jìn)行網(wǎng)頁的修改。而且,網(wǎng)站制作者還可以為網(wǎng)絡(luò)信息制作者提供網(wǎng)絡(luò)信息 發(fā)布程序,按照網(wǎng)絡(luò)信息制作者的選擇將網(wǎng)絡(luò)信息發(fā)布到指定網(wǎng)頁上。但是, 這種方式實(shí)現(xiàn)起來比較復(fù)雜,需要相應(yīng)的軟件或硬件支持。上述在網(wǎng)頁上顯示相關(guān)網(wǎng)絡(luò)信息的方式,第一種方式實(shí)現(xiàn)簡(jiǎn)便,可以用于更新周期長(zhǎng)或內(nèi)容固定的網(wǎng)絡(luò)信息顯示;第二種方式實(shí)現(xiàn)靈活,方便網(wǎng)絡(luò)信息 的及時(shí)更新。兩種方式由于指定相關(guān)網(wǎng)絡(luò)信息的內(nèi)容,因此與網(wǎng)頁的相關(guān)性較 高。但是,上述方法都是人工方式,若顯示與網(wǎng)頁內(nèi)容相關(guān)的網(wǎng)絡(luò)信息,需要 人為指定在網(wǎng)頁上發(fā)布哪些相關(guān)網(wǎng)絡(luò)信息。當(dāng)信息發(fā)布的數(shù)據(jù)量巨大或需要實(shí)時(shí)更新網(wǎng)絡(luò)信息時(shí),將耗費(fèi)大量人力,而且影響信息的快速顯示。因此,需要 一種節(jié)省人力、快速、靈活、相關(guān)性高的網(wǎng)頁相關(guān)信息的顯示方法。 發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問題是提供一種顯示與網(wǎng)頁內(nèi)容相關(guān)的信息的方 法及系統(tǒng),以解決人工方式下耗費(fèi)人力的問題,同時(shí)可以保證網(wǎng)頁相關(guān)信息的 快速顯示及與網(wǎng)頁內(nèi)容較高的相關(guān)性。為解決上述技術(shù)問題,本發(fā)明提供了一種顯示網(wǎng)頁內(nèi)容相關(guān)信息的方法,包括獲取網(wǎng)頁標(biāo)題;判斷網(wǎng)頁內(nèi)容是否已被分析,若是,則顯示與分析結(jié)果對(duì)應(yīng)的相關(guān)信息; 否則,分析所述網(wǎng)頁標(biāo)題,提取標(biāo)題核心信息; 獲取與所述標(biāo)題核心信息對(duì)應(yīng)的相關(guān)信息。還包括分析網(wǎng)頁內(nèi)容,將分析結(jié)果保存,所述分析結(jié)果為網(wǎng)頁內(nèi)容的核 心信息。其中,執(zhí)行以下判斷步驟查找數(shù)據(jù)庫中是否已保存網(wǎng)頁內(nèi)容的分析結(jié)果, 若是,則對(duì)應(yīng)網(wǎng)頁內(nèi)容已被分析。其中,執(zhí)行以下步驟分析網(wǎng)頁標(biāo)題按照預(yù)定算法,對(duì)所述網(wǎng)頁標(biāo)題進(jìn)行 分詞與權(quán)重的計(jì)算,提取出標(biāo)題核心信息。優(yōu)選的,執(zhí)行以下步驟獲取網(wǎng)頁標(biāo)題在網(wǎng)頁代碼中放入獲取網(wǎng)頁標(biāo)題的 代碼,自動(dòng)獲取所述網(wǎng)頁標(biāo)題。其中,執(zhí)行以下步驟獲取相關(guān)信息所述相關(guān)信息按照網(wǎng)頁內(nèi)容分類,查 找與所述標(biāo)題核心信息對(duì)應(yīng)的類別。還包括預(yù)設(shè)置所述相關(guān)信息的控制信息。還包括對(duì)應(yīng)所述控制信息,將獲取的部分相關(guān)信息顯示。本發(fā)明還提供了 一種顯示網(wǎng)頁內(nèi)容相關(guān)信息的系統(tǒng),包括前臺(tái)展現(xiàn)子系 統(tǒng),所述前臺(tái)展現(xiàn)子系統(tǒng)包括標(biāo)題分析單元,用于獲取網(wǎng)頁標(biāo)題;判斷網(wǎng)頁內(nèi)容是否已被分析,若未分 析,則分析所述網(wǎng)頁標(biāo)題,提取標(biāo)題核心信息;獲取單元,獲取與所述標(biāo)題核心信息對(duì)應(yīng)的相關(guān)信息;
第一存儲(chǔ)單元,用于存儲(chǔ)與標(biāo)題核心信息對(duì)應(yīng)的相關(guān)信息。 還包括后臺(tái)分析子系統(tǒng),所述后臺(tái)分析子系統(tǒng)包括網(wǎng)頁分析單元,用子分析網(wǎng)頁內(nèi)容,將分析結(jié)果保存,所速分析結(jié)杲為網(wǎng)頁核心信息;第二存儲(chǔ)單元,用于存儲(chǔ)所述網(wǎng)頁內(nèi)容的分析結(jié)果。其中,所述標(biāo)題分析單元還包括判斷單元,用于查找所述第二存儲(chǔ)單元 是否已保存網(wǎng)頁內(nèi)容的分析結(jié)果,若是,則對(duì)應(yīng)網(wǎng)頁內(nèi)容已被分析。其中,所述獲取單元還包括查找單元,所述相關(guān)信息按照網(wǎng)頁內(nèi)容分類, 用于查找與所述標(biāo)題核心信息對(duì)應(yīng)的類別。所述前臺(tái)展現(xiàn)子系統(tǒng)還包括顯示單元,用于顯示與網(wǎng)頁內(nèi)容分析結(jié)果或 標(biāo)題核心信息對(duì)應(yīng)的相關(guān)信息。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)本發(fā)明通過分析網(wǎng)頁標(biāo)題的方式獲取標(biāo)題的核心信息,再根據(jù)所述核心信 息在數(shù)據(jù)庫中查找相匹配的網(wǎng)絡(luò)信息,并將所述與網(wǎng)頁內(nèi)容相關(guān)的網(wǎng)絡(luò)信息顯 示出來。然后再迸行網(wǎng)頁內(nèi)容的分析,并將分析結(jié)果保存,下次訪問該網(wǎng)頁時(shí) 直接顯示與分析結(jié)果相關(guān)的網(wǎng)絡(luò)信息。首先,在指定網(wǎng)頁上顯示相關(guān)信息的過程由網(wǎng)站系統(tǒng)自動(dòng)執(zhí)行,不需要人 工參與,可以節(jié)省大量人力,而且便于相關(guān)信息的更新;其次,由于網(wǎng)頁標(biāo)題 的數(shù)據(jù)量很少,因此對(duì)網(wǎng)頁標(biāo)題進(jìn)行提取、分析的過程十分迅速,可以快速顯 示網(wǎng)頁相關(guān)信息,達(dá)到實(shí)時(shí)響應(yīng)的效果;再次,由于網(wǎng)頁標(biāo)題是網(wǎng)頁內(nèi)容中重 要信息的歸納,分析網(wǎng)頁標(biāo)題得到的標(biāo)題核心信息與網(wǎng)頁內(nèi)容相關(guān)性高,因此 由所述核心信息可以獲得與網(wǎng)頁內(nèi)容相關(guān)性高的網(wǎng)絡(luò)信息。本發(fā)明所述方法在 顯示與網(wǎng)頁內(nèi)容相關(guān)的信息時(shí),具有實(shí)時(shí)、準(zhǔn)確、高效的特點(diǎn)。最后,網(wǎng)頁標(biāo)題與網(wǎng)頁內(nèi)容的分析相結(jié)合的方式,網(wǎng)頁標(biāo)題的快速分析使 得在網(wǎng)頁內(nèi)容尚未分析前相關(guān)信息能夠快速顯示,滿足瀏覽者的實(shí)時(shí)瀏覽需 求;網(wǎng)頁內(nèi)容的分析可以獲取更多的網(wǎng)頁相關(guān)信息,分析結(jié)果的保存節(jié)省了網(wǎng) 頁下次被訪問時(shí)的再次分析過程。
圖2是本發(fā)明實(shí)施例中對(duì)網(wǎng)頁內(nèi)容進(jìn)行分析的步驟流程圖; 圖3是本發(fā)明實(shí)施例所述顯示網(wǎng)頁相關(guān)廣告的系統(tǒng)結(jié)構(gòu)框圖。 真體實(shí)施方式為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn) 一 步詳細(xì)的說明。本發(fā)明的核心思想是通過分析網(wǎng)頁標(biāo)題的方式獲取標(biāo)題的核心信息,再 根據(jù)所述核心信息在數(shù)據(jù)庫中查找相匹配的網(wǎng)絡(luò)信息,并將所述與網(wǎng)頁內(nèi)容相 關(guān)的網(wǎng)絡(luò)信息顯示出來。然后再進(jìn)行網(wǎng)頁內(nèi)容的分析,并將分析結(jié)果保存,下 次訪問該網(wǎng)頁時(shí)直接顯示與分析結(jié)果相關(guān)的網(wǎng)絡(luò)信息。網(wǎng)絡(luò)廣告作為網(wǎng)絡(luò)信息的一種常見形式,在用戶瀏覽網(wǎng)頁時(shí),經(jīng)常會(huì)在該 網(wǎng)頁上顯示出與網(wǎng)頁內(nèi)容相關(guān)的廣告信息。以下將以網(wǎng)絡(luò)廣告的顯示作為本發(fā) 明的實(shí)施例,闡述本發(fā)明所述與網(wǎng)頁內(nèi)容相關(guān)的信息的顯示方法。本發(fā)明由前 臺(tái)系統(tǒng)和后臺(tái)系統(tǒng)執(zhí)行實(shí)現(xiàn)。參照?qǐng)D1,是本發(fā)明實(shí)施例所述顯示與網(wǎng)頁內(nèi)容相關(guān)的廣告的步驟流程圖。步驟IOI,投放廣告代碼。網(wǎng)頁擁有者在指定網(wǎng)頁上投放廣告代碼,即在 網(wǎng)頁代碼中放入一段Javascript代碼。所述廣告代碼中設(shè)置了與網(wǎng)頁內(nèi)容相 關(guān)的廣告的顯示控制信息,包括顯示位置、顯示個(gè)數(shù)(每次顯示幾個(gè))、顯示 方式(如彈出式、橫幅式、按鈕式等等)、顯示順序(多個(gè)廣告)、有效期等。 本步驟預(yù)先設(shè)置了網(wǎng)頁相關(guān)信息的顯示控制信息,是本發(fā)明的優(yōu)選步驟,通過 預(yù)設(shè)置參數(shù)來優(yōu)化相關(guān)廣告的顯示,增強(qiáng)頁面的視覺效果,當(dāng)然也可以按照固 定模式顯示所述相關(guān)廣告信息。步驟102,用戶瀏覽。當(dāng)用戶在瀏覽器窗口輸入網(wǎng)址或點(diǎn)擊鏈接后,對(duì)網(wǎng) 頁進(jìn)4亍i方問。步驟103,廣告代碼提取網(wǎng)頁標(biāo)題。通常,在網(wǎng)頁的超文件鏈接標(biāo)記語言 (HTML)代碼中會(huì)設(shè)置一個(gè)標(biāo)識(shí),用于顯示所述網(wǎng)頁的標(biāo)題。投放廣告代碼的 網(wǎng)頁,在網(wǎng)頁中還設(shè)置了提取網(wǎng)頁標(biāo)題的代碼。當(dāng)用戶瀏覽投放廣告代碼的網(wǎng) 頁時(shí),執(zhí)行所述Javascript代碼,自動(dòng)將網(wǎng)頁標(biāo)題、網(wǎng)頁地址等信息傳送給 前臺(tái)系統(tǒng)。通過投放廣告代碼獲取網(wǎng)頁標(biāo)題,方便快速,是本發(fā)明的優(yōu)選方法。 還可以通過分析網(wǎng)頁內(nèi)容將網(wǎng)頁標(biāo)題提取出來,但需要經(jīng)過網(wǎng)頁分析的緩慢過程。步驟104,判斷網(wǎng)頁是否已被分析,若是,則繼續(xù)步驟105;否則,執(zhí)行 歩驟106。由子所有被訪問的網(wǎng)頁都要經(jīng)過網(wǎng)頁內(nèi)容的分析過程,并且在數(shù)棍 庫中保存分析結(jié)果,因此通過查找數(shù)據(jù)庫即可判斷網(wǎng)頁是否已被分析。其中, 所述分析結(jié)果指網(wǎng)頁內(nèi)容的核心信息。數(shù)據(jù)庫中保存的網(wǎng)頁分析結(jié)果與網(wǎng)頁的 統(tǒng)一資源定位符(URL)對(duì)應(yīng),當(dāng)判斷某網(wǎng)頁是否已被分析時(shí),檢查數(shù)據(jù)庫是 否保存了所述網(wǎng)頁URL對(duì)應(yīng)的分析結(jié)果。若已保存,則所述網(wǎng)頁已被分析;若 數(shù)據(jù)庫中不存在所述網(wǎng)頁的分析結(jié)果,則網(wǎng)頁還未被分析。步驟105,顯示與分析結(jié)果相關(guān)的廣告。若網(wǎng)頁已被分析,則直接將數(shù)據(jù) 庫中保存的與分析結(jié)果相關(guān)的廣告顯示。至此,與網(wǎng)頁內(nèi)容相關(guān)的廣告顯示過 程完成,用戶可以及時(shí)地瀏覽到與網(wǎng)頁內(nèi)容相關(guān)性高的廣告信息。步驟106,前臺(tái)系統(tǒng)分析網(wǎng)頁標(biāo)題。若網(wǎng)頁尚未分析,則需要對(duì)獲取的網(wǎng) 頁標(biāo)題進(jìn)行分析,提取出標(biāo)題核心信息,即網(wǎng)頁主題。分析標(biāo)題提取出主題的 總體思路是對(duì)分析內(nèi)容采用分詞與權(quán)重相結(jié)合的方式,通過分詞系統(tǒng)將分析 內(nèi)容分為具有獨(dú)立意義的詞組,再根據(jù)上下文語義環(huán)境對(duì)詞組賦予不同的權(quán) 重,權(quán)重最大的詞組即為網(wǎng)頁標(biāo)題的主題。其中,所述權(quán)重是一個(gè)相對(duì)的概念, 是針對(duì)某一指標(biāo)而言,指該指標(biāo)在整體評(píng)價(jià)中的相對(duì)重要程度。分詞技術(shù)是一 項(xiàng)對(duì)語句進(jìn)行切分識(shí)別的技術(shù),通常對(duì)中文的分詞較困難,常用的中文分詞技 術(shù)有基于字符串匹配的分詞方法、基于理解的分詞方法及基于統(tǒng)計(jì)的分詞方 法。由于分詞方法多種多樣,權(quán)重計(jì)算的方法也各不相同,因此分析網(wǎng)頁標(biāo)題 提取主題的方法也可以有多種。由于網(wǎng)頁標(biāo)題長(zhǎng)度一般小于IOO個(gè)字符(50個(gè)漢字),因此標(biāo)題分析和主 題提取均可使用分詞系統(tǒng)在毫秒級(jí)別的時(shí)間內(nèi)完成,達(dá)到網(wǎng)頁主題的快速獲取 目的。而且,無需等待后臺(tái)系統(tǒng)對(duì)網(wǎng)頁進(jìn)行全面分析,即可實(shí)時(shí)得到網(wǎng)頁主題。步驟107,根據(jù)標(biāo)題分析結(jié)果顯示相關(guān)廣告。各個(gè)廣告商在網(wǎng)頁擁有者的 網(wǎng)站投放的廣告,按照網(wǎng)頁內(nèi)容進(jìn)行分類,并為每類廣告賦予一個(gè)關(guān)鍵詞,如 新聞?lì)悺⒚廊蓊?、汽車類、商品類廣告等。當(dāng)從網(wǎng)頁標(biāo)題中提取出網(wǎng)頁主題后, 將所述網(wǎng)頁主題與廣告數(shù)據(jù)庫中的關(guān)鍵詞進(jìn)行比較,選擇最為匹配的 一類廣 告,為用戶快速地提供與網(wǎng)頁內(nèi)容最相關(guān)的廣告內(nèi)容。由于網(wǎng)頁標(biāo)題是網(wǎng)頁內(nèi)
容中重要信息的歸納,分析網(wǎng)頁標(biāo)題得到的網(wǎng)頁主題與網(wǎng)頁內(nèi)容相關(guān)性高,因根據(jù)r告代碼傳送的網(wǎng)頁地址,對(duì)應(yīng)廣告代碼中設(shè)置的顯示控制信息,將 獲取的與網(wǎng)頁內(nèi)容相關(guān)的廣告在頁面中顯示出來。優(yōu)選的,通過設(shè)置顯示個(gè)數(shù), 每次從相匹配的多個(gè)廣告中隨機(jī)顯示預(yù)定個(gè)數(shù)的廣告,或者按照時(shí)間段顯示, 保證廣告內(nèi)容的及時(shí)更新,增加了用戶的滿意度。步驟108,發(fā)送至后臺(tái)系統(tǒng)進(jìn)行網(wǎng)頁分析。上述前臺(tái)系統(tǒng)分析網(wǎng)頁標(biāo)題并及時(shí)顯示相關(guān)廣告的過程結(jié)束后,前臺(tái)系統(tǒng)將分析網(wǎng)頁內(nèi)容的請(qǐng)求發(fā)送到后臺(tái)系統(tǒng),通知后臺(tái)系統(tǒng)對(duì)所述網(wǎng)頁進(jìn)行內(nèi)容分析。網(wǎng)頁內(nèi)容的分析過程參照?qǐng)D2 所示步驟201,查找隊(duì)列中是否有需要處理的網(wǎng)頁。由于網(wǎng)站的頁面訪問量巨 大,后臺(tái)系統(tǒng)需要處理大量的網(wǎng)頁,因此前臺(tái)系統(tǒng)發(fā)送來的網(wǎng)頁分析請(qǐng)求在分 析隊(duì)列中排隊(duì)等待處理。若隊(duì)列中存在需要處理的網(wǎng)頁,則執(zhí)行步驟202;否 則,隊(duì)列為空,系統(tǒng)繼續(xù)等待處理網(wǎng)頁。步驟202,抓取網(wǎng)頁。后臺(tái)系統(tǒng)在對(duì)網(wǎng)頁內(nèi)容進(jìn)行分析前,需要抓取網(wǎng)頁 代碼。根據(jù)網(wǎng)頁地址,運(yùn)用現(xiàn)有技術(shù)的抓取工具,對(duì)網(wǎng)頁代碼進(jìn)行抓取。步驟203,分析網(wǎng)頁。對(duì)網(wǎng)頁內(nèi)容的分析,也采用分詞與權(quán)重的計(jì)算方法, 但與網(wǎng)頁標(biāo)題的分析不同,頁面分析與網(wǎng)站的頁面格式相關(guān),而且網(wǎng)頁內(nèi)容的 數(shù)據(jù)量遠(yuǎn)遠(yuǎn)大于標(biāo)題,因此分詞與權(quán)重的計(jì)算過程遠(yuǎn)遠(yuǎn)復(fù)雜于標(biāo)題分析。在分 析網(wǎng)頁內(nèi)容時(shí),需要對(duì)頁面進(jìn)行全面分析,根據(jù)網(wǎng)站的頁面格式或頁面內(nèi)容, 選擇合適的分詞方法及權(quán)重計(jì)算方法,提取出網(wǎng)頁的核心信息。步驟204,保存結(jié)果供前臺(tái)系統(tǒng)使用。將網(wǎng)頁內(nèi)容的分析結(jié)果即所述網(wǎng)頁 核心信息保存,當(dāng)該網(wǎng)頁下次被訪問時(shí),不需進(jìn)行網(wǎng)頁標(biāo)題及網(wǎng)頁內(nèi)容的分析, 直接將與所述保存結(jié)果相關(guān)的廣告顯示,提高了顯示速度,滿足用戶的實(shí)時(shí)瀏覽需求。通過上述網(wǎng)頁內(nèi)容分析過程,可以獲取比標(biāo)題分析結(jié)果更多的核心信息, 因而可以為用戶提供更豐富的相關(guān)廣告。網(wǎng)頁內(nèi)容的分析作為標(biāo)題分析的補(bǔ) 充,所述標(biāo)題分析能夠?qū)崟r(shí)、準(zhǔn)確、高效的為用戶提供與瀏覽網(wǎng)頁相關(guān)的廣告 信息,所述網(wǎng)頁分析又增加了廣告信息的豐富性。二者的結(jié)合使用,是本發(fā)明 實(shí)施例的優(yōu)選方案。本發(fā)明中,由于將網(wǎng)頁分析結(jié)果保存,因此每次只需對(duì)用戶訪問的新添加 的頁面進(jìn)行標(biāo)題分析及內(nèi)容分柝。所速新添加的網(wǎng)頁通常為訪問量較大或更新 速度較快的網(wǎng)絡(luò)內(nèi)容,如新聞?lì)悺蕵奉惖?,由于發(fā)布實(shí)時(shí)性的要求,網(wǎng)頁的 增加、更換速度極快,因此對(duì)這類新增網(wǎng)頁的標(biāo)題分析及內(nèi)容分析較多。上述顯示網(wǎng)頁內(nèi)容相關(guān)廣告的過程由前臺(tái)系統(tǒng)和后臺(tái)系統(tǒng)實(shí)現(xiàn),在指定網(wǎng) 頁上投放相關(guān)廣告的方法,不需要人工參與,可以節(jié)省大量人力,而且便于廣 告信息的更新。針對(duì)上述實(shí)施例網(wǎng)頁相關(guān)廣告的顯示,本發(fā)明還提供了 一種顯示網(wǎng)頁內(nèi)容 相關(guān)信息的系統(tǒng)。參照?qǐng)D3,是本發(fā)明實(shí)施例所述顯示網(wǎng)頁相關(guān)廣告的系統(tǒng)結(jié)構(gòu)框圖。所述系統(tǒng)包括前臺(tái)展現(xiàn)子系統(tǒng)301及后臺(tái)分析子系統(tǒng)302,其中,前 臺(tái)展現(xiàn)子系統(tǒng)301包括第一存儲(chǔ)單元303、標(biāo)題分析單元304、判斷單元305、 獲取單元306、查找單元307及顯示單元308,后臺(tái)分析子系統(tǒng)302包括第二 存儲(chǔ)單元309及網(wǎng)頁分析單元310。所述前臺(tái)展現(xiàn)子系統(tǒng)301用于網(wǎng)頁標(biāo)題的 分析及顯示,所述后臺(tái)分析子系統(tǒng)302用于網(wǎng)頁內(nèi)容的分析及保存。具體說明 如下第一存儲(chǔ)單元303,用于存儲(chǔ)與網(wǎng)頁主題相關(guān)的廣告信息。各個(gè)廣告商在 網(wǎng)頁擁有者的網(wǎng)站投放的廣告、按照網(wǎng)頁內(nèi)容進(jìn)行分類,并為每類廣告賦予一 個(gè)關(guān)鍵詞,所述廣告關(guān)鍵詞與網(wǎng)頁主題相對(duì)應(yīng)。第二存儲(chǔ)單元309,用于存儲(chǔ)網(wǎng)頁內(nèi)容的分析結(jié)果。所述分析結(jié)果即為網(wǎng) 頁內(nèi)容的核心信息,所述網(wǎng)頁分析結(jié)果與網(wǎng)頁的統(tǒng)一資源定位符(URL )對(duì)應(yīng)。標(biāo)題分析單元304,用于獲取網(wǎng)頁標(biāo)題;判斷網(wǎng)頁內(nèi)容是否已被分析,若 未分析,則分析所述網(wǎng)頁標(biāo)題,提取網(wǎng)頁主題。所述標(biāo)題分析單元還包括判 斷單元305,用于查找所述第二存儲(chǔ)單元309是否已保存網(wǎng)頁內(nèi)容的分析結(jié)果, 若是,則對(duì)應(yīng)網(wǎng)頁內(nèi)容已被分析。根據(jù)投放在網(wǎng)頁上的廣告代碼,自動(dòng)獲取網(wǎng) 頁標(biāo)題,并傳送至標(biāo)題分析單元304。判斷單元305檢查第二存儲(chǔ)單元309是 否保存了所述網(wǎng)頁URL對(duì)應(yīng)的分析結(jié)果。若已保存,則所述網(wǎng)頁已被分析;若 第二存儲(chǔ)單元309中不存在所述網(wǎng)頁的分析結(jié)果,則網(wǎng)頁還未被分析。獲取單元306,獲取與所述網(wǎng)頁主題對(duì)應(yīng)的相關(guān)廣告。所述獲取單元還包 括查找單元307,所述相關(guān)廣告信息按照網(wǎng)頁內(nèi)容分類,用于查找與所述網(wǎng) 頁主題對(duì)應(yīng)的類別。查找單元307將標(biāo)題分析單元304提取的網(wǎng)頁主題與第一 存儲(chǔ)單元303中保存的廣告關(guān)鍵詞進(jìn)行比較,選擇最為匹配的一類廣告,為用 戶快速地提供與網(wǎng)頁內(nèi)容最相關(guān)的廣告內(nèi)容。顯示單元308,用于顯示與網(wǎng)頁內(nèi)容分析結(jié)果或網(wǎng)頁標(biāo)題對(duì)應(yīng)的相關(guān)廣告。 根據(jù)廣告代碼中設(shè)置的顯示控制信息,顯示單元308將獲取單元306獲取的與 網(wǎng)頁內(nèi)容相關(guān)的廣告在頁面中顯示出來。優(yōu)選的,通過設(shè)置顯示個(gè)數(shù),每次從 相匹配的多個(gè)廣告中隨機(jī)顯示預(yù)定個(gè)數(shù)的廣告,或者按照時(shí)間段顯示,保證廣 告內(nèi)容的及時(shí)更新,增加了用戶的滿意度。網(wǎng)頁分析單元310,用于分析網(wǎng)頁內(nèi)容,將分析結(jié)果保存,所述分析結(jié)果 為網(wǎng)頁核心信息。前臺(tái)展現(xiàn)系統(tǒng)301分析網(wǎng)頁標(biāo)題并及時(shí)顯示相關(guān)廣告的過程 結(jié)束后,將分析網(wǎng)頁內(nèi)容的請(qǐng)求發(fā)送到后臺(tái)分析系統(tǒng)302,通知后臺(tái)分析系統(tǒng) 對(duì)所述網(wǎng)頁進(jìn)行內(nèi)容分析。網(wǎng)頁分析單元310判斷隊(duì)列中是否有需要處理的網(wǎng) 頁,若有則運(yùn)用網(wǎng)頁抓取工具,抓取網(wǎng)頁代碼。然后采用分詞與權(quán)重的計(jì)算方 法,對(duì)頁面進(jìn)行全面分析,根據(jù)網(wǎng)站的頁面格式或頁面內(nèi)容,選擇合適的分詞 方法及權(quán)重計(jì)算方法,提取出網(wǎng)頁的核心信息,并將網(wǎng)頁的核心信息保存到第 二存儲(chǔ)單元309。以上對(duì)本發(fā)明所提供的 一種顯示網(wǎng)頁內(nèi)容相關(guān)信息的方法及系統(tǒng),進(jìn)行了上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會(huì) 有改變之處。綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
權(quán)利要求
1、一種顯示網(wǎng)頁內(nèi)容相關(guān)信息的方法,其特征在于,包括獲取網(wǎng)頁標(biāo)題;判斷網(wǎng)頁內(nèi)容是否已被分析,若是,則顯示與分析結(jié)果對(duì)應(yīng)的相關(guān)信息;否則,分析所述網(wǎng)頁標(biāo)題,提取標(biāo)題核心信息;獲取與所述標(biāo)題核心信息對(duì)應(yīng)的相關(guān)信息。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括分析網(wǎng)頁內(nèi)容,將 分析結(jié)果保存,所述分析結(jié)果為網(wǎng)頁內(nèi)容的核心信息。
3、 根據(jù)權(quán)利要求1所述的方法,其特征在于,執(zhí)行以下判斷步驟查找 數(shù)據(jù)庫中是否已保存網(wǎng)頁內(nèi)容的分析結(jié)果,若是,則對(duì)應(yīng)網(wǎng)頁內(nèi)容已被分析。
4、 根據(jù)權(quán)利要求1所述的方法,其特征在于,執(zhí)行以下步驟分析網(wǎng)頁標(biāo) 題按照預(yù)定算法,對(duì)所述網(wǎng)頁標(biāo)題進(jìn)行分詞與權(quán)重的計(jì)算,提取出標(biāo)題核心 信息。
5、 根據(jù)權(quán)利要求1所述的方法,其特征在于,執(zhí)行以下步驟獲取網(wǎng)頁標(biāo) 題在網(wǎng)頁代碼中放入獲取網(wǎng)頁標(biāo)題的代碼,自動(dòng)獲取所述網(wǎng)頁標(biāo)題。
6、 根據(jù)權(quán)利要求1所述的方法,其特征在于,執(zhí)行以下步驟獲取相關(guān)信 息所述相關(guān)信息按照網(wǎng)頁內(nèi)容分類,查找與所述標(biāo)題核心信息對(duì)應(yīng)的類別。
7、 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括預(yù)設(shè)置所述相關(guān) 信息的控制信息。
8、 根據(jù)權(quán)利要求7所述的方法,其特征在于,還包括對(duì)應(yīng)所述控制信 息,將獲取的部分相關(guān)信息顯示。
9、 一種顯示網(wǎng)頁內(nèi)容相關(guān)信息的系統(tǒng),其特征在于,包括前臺(tái)展現(xiàn)子系 統(tǒng),所述前臺(tái)展現(xiàn)子系統(tǒng)包括標(biāo)題分析單元,用于獲取網(wǎng)頁標(biāo)題;判斷網(wǎng)頁內(nèi)容是否已被分析,若未分 析,則分析所述網(wǎng)頁標(biāo)題,提取標(biāo)題核心信息;獲取單元,獲取與所述標(biāo)題核心信息對(duì)應(yīng)的相關(guān)信息; 第一存儲(chǔ)單元,用于存儲(chǔ)與標(biāo)題核心信息對(duì)應(yīng)的相關(guān)信息。
10、 根據(jù)權(quán)利要求9所述的方法,其特征在于,還包括后臺(tái)分析子系統(tǒng),所述后臺(tái)分析子系統(tǒng)包括網(wǎng)頁分析單元,用于分析網(wǎng)頁內(nèi)容,將分析結(jié)果保存,所述分析結(jié)果為網(wǎng)頁核心信息;第二存儲(chǔ)單元,用于存儲(chǔ)所述網(wǎng)頁內(nèi)容的分析結(jié)杲。
11、 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述標(biāo)題分析單元還包括 判斷單元,用于查找所述第二存儲(chǔ)單元是否已保存網(wǎng)頁內(nèi)容的分析結(jié)果,若是, 則對(duì)應(yīng)網(wǎng)頁內(nèi)容已被分析。
12、 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述獲取單元還包括查 找單元,所述相關(guān)信息按照網(wǎng)頁內(nèi)容分類,用于查找與所述標(biāo)題核心信息對(duì)應(yīng) 的類別。
13、 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述前臺(tái)展現(xiàn)子系統(tǒng)還包 括顯示單元,用于顯示與網(wǎng)頁內(nèi)容分析結(jié)果或標(biāo)題核心信息對(duì)應(yīng)的相關(guān)信息。
全文摘要
本發(fā)明公開了一種顯示網(wǎng)頁內(nèi)容相關(guān)信息的方法及系統(tǒng),涉及網(wǎng)絡(luò)信息的提供,解決人工方式下耗費(fèi)人力的問題,同時(shí)可以保證網(wǎng)頁相關(guān)信息的快速顯示及與網(wǎng)頁內(nèi)容較高的相關(guān)性。所述方法包括獲取網(wǎng)頁標(biāo)題;判斷網(wǎng)頁內(nèi)容是否已被分析,若是,則顯示與分析結(jié)果對(duì)應(yīng)的相關(guān)信息;否則,分析所述網(wǎng)頁標(biāo)題,提取標(biāo)題核心信息;獲取與所述標(biāo)題核心信息對(duì)應(yīng)的相關(guān)信息。還包括分析網(wǎng)頁內(nèi)容,將分析結(jié)果保存,所述分析結(jié)果為網(wǎng)頁內(nèi)容的核心信息。本發(fā)明所述方法不需要人工參與,可以節(jié)省大量人力,在顯示與網(wǎng)頁內(nèi)容相關(guān)的信息時(shí),具有實(shí)時(shí)、準(zhǔn)確、高效的特點(diǎn)。
文檔編號(hào)H04L12/58GK101115024SQ20061010394
公開日2008年1月30日 申請(qǐng)日期2006年7月28日 優(yōu)先權(quán)日2006年7月28日
發(fā)明者吳泳銘, 徐冠鵬, 東 車 申請(qǐng)人:阿里巴巴公司