專利名稱:一種內(nèi)容管理集成方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別是涉及一種內(nèi)容管理集成方法及系統(tǒng)。
背景技術(shù):
隨著網(wǎng)絡(luò)應(yīng)用的豐富和發(fā)展,很多網(wǎng)站往往不能迅速跟進大量信息衍生及 業(yè)務(wù)模式變革的腳步,常常需要花費許多時間、人力和物力來處理信息更新和
維護工作;遇到網(wǎng)站擴充的時候,整合內(nèi)外網(wǎng)及分支網(wǎng)站的工作就變得更力口復(fù) 雜,甚至還需重新建設(shè)網(wǎng)站;如此下去,用戶始終在一個高成本、低效率的循
環(huán)中升級、整合。對于網(wǎng)站建設(shè)和信息發(fā)布人員來說,他們最關(guān)注系統(tǒng)的易用 性和功能的完善性,這對網(wǎng)站建設(shè)及網(wǎng)絡(luò)信息管理工具提出了很高的要求,由
j^匕, 一套專業(yè)6勺內(nèi)容管理系纟克(Content Management System, CMS)應(yīng)運而生 了 ,來有效解決用戶網(wǎng)站建設(shè)與信息發(fā)布中常見的問題和需求。
內(nèi)容管理是網(wǎng)站發(fā)布內(nèi)容的后臺統(tǒng)一管理平臺,是一種位于WEB前端 (Web服務(wù)器)和后端辦公系統(tǒng)或流程(內(nèi)容創(chuàng)作、編輯)之間的軟件系統(tǒng)。 內(nèi)容的創(chuàng)作人員、編輯人員、發(fā)布人員使用內(nèi)容管理系統(tǒng)來提交、修改、審批、 發(fā)布內(nèi)容。這里指的"內(nèi)容"包括文件、表格、圖片、數(shù)據(jù)庫中的數(shù)據(jù)甚至視 頻等一切想要發(fā)布到網(wǎng)站的信息。也就是說,網(wǎng)站發(fā)布的內(nèi)容并不是直接編輯 并上傳靜態(tài)頁面到訪問服務(wù)器上,而是在內(nèi)容管理平臺上首先進行編輯、審核 流程后再利用平臺自動發(fā)布到訪問服務(wù)器上。例如,某網(wǎng)站管理人員并不是把 逐條制作新聞的網(wǎng)頁發(fā)布到訪問服務(wù)器上,而是在內(nèi)容管理平臺上編輯審核好 新聞后,利用內(nèi)容管理平臺將新聞網(wǎng)頁發(fā)布到訪問服務(wù)器上。
例如,對于集團公司的網(wǎng)站,每天都需要錄入基層單位的網(wǎng)站新聞信息。 傳統(tǒng)方式是網(wǎng)站釆編人員每天訪問這些網(wǎng)站,然后將網(wǎng)站上的內(nèi)容進行下載, 并手工錄入到內(nèi)容管理平臺中。但是對于大量的新聞內(nèi)容,如果一條一條手工 錄入到內(nèi)容管理平臺上,對于網(wǎng)站采編人員來講,其工作量是非常巨大的。
現(xiàn)有技術(shù)解決該問題的方法是采用簡單的網(wǎng)頁裁剪技術(shù),該技術(shù)是對網(wǎng)站 指定位置的內(nèi)容進行抓取和裁剪。例如,對各基層單位的網(wǎng)站指定位置的內(nèi)容進行抓取和裁剪,將裁剪到的網(wǎng)頁內(nèi)容完整地下載到本地,然后通過內(nèi)容管理 平臺顯示在集團公司的網(wǎng)站上。
該現(xiàn)有技術(shù)的缺點在于,由于只能對指定位置的內(nèi)容進行抓取和裁剪,所
以被裁剪的網(wǎng)站內(nèi)容為靜態(tài)形式,不能隨網(wǎng)站的更新而變化;而且,當(dāng)網(wǎng)站的
頻道、樣式等調(diào)整后,裁剪功能往往不能成功,需要重新設(shè)定裁剪對象。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種內(nèi)容管理集成方法及系統(tǒng),以解決 現(xiàn)有技術(shù)中獲取的網(wǎng)站內(nèi)容無法隨網(wǎng)站的更新而變化的問題。
為實現(xiàn)上述目的,本發(fā)明提供了如下方案 一種內(nèi)容管理集成方法,包括 從信息源網(wǎng)站截取網(wǎng)頁內(nèi)容,并分析頁面結(jié)構(gòu); 保存頁面結(jié)構(gòu)的分析結(jié)果;
選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行集成;當(dāng)訪問集成的結(jié)果時,根據(jù)頁 面結(jié)構(gòu)的分析結(jié)果從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容,并進行展現(xiàn)。
其中,所述頁面結(jié)構(gòu)的分析結(jié)果包括信息源網(wǎng)站的網(wǎng)址、被截取網(wǎng)頁內(nèi)容 所在的頻道、展現(xiàn)的起始位置、結(jié)束位置,則根據(jù)頁面結(jié)構(gòu)的分析結(jié)果從相應(yīng) 的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容的具體實現(xiàn)包括根據(jù)信息源網(wǎng)站的網(wǎng)址,找到被 截取網(wǎng)頁內(nèi)容所在的網(wǎng)站;根據(jù)被截取網(wǎng)頁內(nèi)容所在的頻道、展現(xiàn)的起始位置、 結(jié)束位置,從該網(wǎng)站的相應(yīng)位置獲取網(wǎng)頁內(nèi)容。
其中,保存頁面結(jié)構(gòu)分析結(jié)果的具體實現(xiàn)包括將頁面結(jié)構(gòu)的分析結(jié)果按 條目進行存儲,并定義條目的標(biāo)識名,其中每個條目對應(yīng)一個網(wǎng)頁截取對象。
優(yōu)選的,選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行集成的具體實現(xiàn)包括讀取 存儲的條目,并根據(jù)條目的標(biāo)識名選擇需要集成的條目;對所述需要集成的條 目進行封裝,生成PortLet;將生成的PortLet進行保存。
其中,展現(xiàn)集成結(jié)果的具體實現(xiàn)包括定制要展現(xiàn)的PortLet;將選中的 PortLet發(fā)布到訪問服務(wù)器上展現(xiàn)。
一種內(nèi)容管理集成系統(tǒng),包括
網(wǎng)頁抓取分析單元,用于從信息源網(wǎng)站截取網(wǎng)頁內(nèi)容,并分析頁面結(jié)構(gòu); 存儲單元,用于保存頁面結(jié)構(gòu)的分析結(jié)果;集成展現(xiàn)單元,用于選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行集成;當(dāng)訪問集
成的結(jié)果時,根據(jù)頁面結(jié)構(gòu)的分析結(jié)果從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容,并 進行展現(xiàn)。
其中,所述頁面結(jié)構(gòu)的分析結(jié)果包括信息源網(wǎng)站的網(wǎng)址、被截取網(wǎng)頁內(nèi)容 所在的頻道、展現(xiàn)的起始位置、結(jié)束位置,則所述集成展現(xiàn)單元通過以下方式
根據(jù)頁面結(jié)構(gòu)的分析結(jié)果從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容根據(jù)信息源網(wǎng)站 的網(wǎng)址,找到被截取網(wǎng)頁內(nèi)容所在的網(wǎng)站;根據(jù)被截取網(wǎng)頁內(nèi)容所在的頻道、 展現(xiàn)的起始位置、結(jié)束位置,從該網(wǎng)站的相應(yīng)位置獲取網(wǎng)頁內(nèi)容。
其中,所述存儲單元通過以下方式保存頁面結(jié)構(gòu)的分析結(jié)果將頁面結(jié)構(gòu) 的分析結(jié)果按條目進行存儲,并定義條目的標(biāo)識名,其中每個條目對應(yīng)一個網(wǎng) 頁截取對象。
優(yōu)選的,所述集成展現(xiàn)單元采用PortLet封裝,具體包括PortLet生成 單元,用于選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行封裝,生成PortLet; PortLet 庫,用于存儲PortLet; PortLet框架,用于當(dāng)訪問定制的PortLet時,4艮據(jù) 頁面結(jié)構(gòu)的分析結(jié)果從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容,并發(fā)布到訪問服務(wù)器 上展現(xiàn)。
其中,所述PortLet生成單元采用配置方式。
根據(jù)本發(fā)明提供的具體實施例,本發(fā)明公開了以下技術(shù)效果
首先,針對抓取回來的網(wǎng)頁,通過對網(wǎng)頁結(jié)構(gòu)進行分析得到信息源網(wǎng)站的 網(wǎng)址、被截取網(wǎng)頁內(nèi)容所在的頻道、展現(xiàn)的起始位置、結(jié)束位置等信息,然后 根據(jù)所述分析結(jié)果可以實時地到信息源網(wǎng)站上獲取相關(guān)信息,從而實現(xiàn)了定制 內(nèi)容隨網(wǎng)站變化的實時更新。
其次,當(dāng)信息源網(wǎng)站的頻道、樣式等發(fā)生改變時,也能夠通過網(wǎng)頁結(jié)構(gòu)的 分析結(jié)果正確獲取所需內(nèi)容。
再次,能夠靈活地實現(xiàn)任意網(wǎng)站內(nèi)容的訂閱,通過建立各種內(nèi)容的資源庫, 可以實現(xiàn)對集成內(nèi)容的個性化定制。
最后,實現(xiàn)了統(tǒng)一的頁面抓取過程,由抓取網(wǎng)頁服務(wù)的服務(wù)器鏈接到信息 源網(wǎng)站統(tǒng)一抓取網(wǎng)頁。
圖1是本發(fā)明實施例提供的內(nèi)容管理集成方法流程圖2是圖1所述方法中選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行集成的流程
圖3是本發(fā)明優(yōu)選實施例提供的方法流程圖4是本發(fā)明實施例提供的內(nèi)容管理集成系統(tǒng)結(jié)構(gòu)圖。
具體實施例方式
本發(fā)明提供了 一種內(nèi)容管理集成方法,下面結(jié)合附圖對該方法進行詳細地 描述。
實施例、參見圖1,本發(fā)明實施例提供的內(nèi)容管理集成方法包括以下步驟
S101:從信息源網(wǎng)站截取網(wǎng)頁內(nèi)容,并分析頁面結(jié)構(gòu);
需要說明的是,本發(fā)明實施例是從實際應(yīng)用的需要出發(fā),考慮到用戶在定 制網(wǎng)頁內(nèi)容時,或集團公司在定制基層單位網(wǎng)頁內(nèi)容時,通常都是針對某個欄 目進行定制,例如,用戶定制某門戶網(wǎng)站的天氣預(yù)報欄目內(nèi)容,集團公司定制 某基層單位的政工信息欄目內(nèi)容等。對于一個成熟的門戶網(wǎng)站來講,頁面上包 括哪些欄目以及各欄目所在的位置通常是固定的,各欄目所在的頻道各不相 同,并且每個欄目各自的頻道通常不會發(fā)生變化。
因此本步驟中截取網(wǎng)頁內(nèi)容是指對信息源網(wǎng)站上的某個欄目進行截取,然 后對被截取的欄目進行頁面結(jié)構(gòu)的分析,分析出信息源網(wǎng)站的網(wǎng)址、該欄目所 在頻道以及在信息源網(wǎng)站上展現(xiàn)的起始位置、結(jié)束位置、樣式等信息。根據(jù)這 些信息,就可以根據(jù)信息源網(wǎng)站的網(wǎng)址,到被截取的欄目所在頻道的相應(yīng)位置 處實時抓取被截取欄目中的信息。
其中,截取的網(wǎng)頁內(nèi)容可以由用戶根據(jù)需要進行選擇,本發(fā)明實施例可以 利用頁面裁剪技術(shù),系統(tǒng)提供頁面裁剪工具,該工具可以集成在內(nèi)容定制網(wǎng)站 上(如集團公司的網(wǎng)站上),用戶可以在該網(wǎng)站上打開該工具,并在該工具中 輸入信息源的網(wǎng)站地址,頁面顯示出來之后,使用鼠標(biāo)選取要截取的內(nèi)容塊, 系統(tǒng)便可以對被截取的頁面結(jié)構(gòu)進行分析。S102:保存頁面結(jié)構(gòu)分析的結(jié)果;
如前文所述,頁面結(jié)構(gòu)分析的結(jié)果包括信息源網(wǎng)站的網(wǎng)址、截取的內(nèi)容才莫 塊的頻道、展現(xiàn)的起始位置、結(jié)束位置、樣式等,本發(fā)明實施例可以提供內(nèi)容 資料庫,將這些頁面結(jié)構(gòu)信息進行格式化,并按條目存儲在內(nèi)容資料庫中,每 條記錄對應(yīng)一條網(wǎng)站網(wǎng)頁抓取對象,如某一網(wǎng)站上的北京天氣、體育新聞等。
由于內(nèi)容資料庫中保存的條目很多,用戶通常不是對所有截取的內(nèi)容都進 行集成,而是從中選取一部分來集成,因此,為了便于用戶識別,按條目存儲 時允許用戶對每個條目定義標(biāo)識名。 一條記錄中的內(nèi)容包括記錄標(biāo)示名、網(wǎng) 址、所在頻道、內(nèi)容起始位置、內(nèi)容結(jié)束位置等。例如在集團公司中需要定制 基層單位的基層政工信息,則該條記錄為某基層單位網(wǎng)站的政工信息、該基 層網(wǎng)站的網(wǎng)址、政工信息的起始位置、政工信息結(jié)束位置。其中,某基層單位 網(wǎng)站的政工信息即為用戶定義的條目的標(biāo)識名。
S103:選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行集成,然后顯示到內(nèi)容定制網(wǎng) 站上;
該過程是將截取的頁面內(nèi)容重新拼裝到內(nèi)容定制網(wǎng)站上,當(dāng)然,如前文所 述,這里不一定是截取的所有內(nèi)容都重新拼裝,用戶可以根據(jù)實際情況進行選 擇需要拼裝的內(nèi)容,然后由本發(fā)明的系統(tǒng)完成拼裝。
需要說明的是,此時顯示到內(nèi)容定制網(wǎng)站上的內(nèi)容還是欄目的形式,用戶 可以通過訪問各欄目來獲取欄目中的詳細信息。
S104:當(dāng)用戶訪問集成的結(jié)果時,才艮據(jù)頁面結(jié)構(gòu)的分析結(jié)果,人相應(yīng)的信息 源網(wǎng)站獲取網(wǎng)頁內(nèi)容,并進行展現(xiàn)。
當(dāng)用戶選擇需要展現(xiàn)的定制內(nèi)容時,系統(tǒng)會根據(jù)信息源網(wǎng)站的網(wǎng)址,找到 被截取網(wǎng)頁內(nèi)容所在的網(wǎng)站;然后根據(jù)被截取網(wǎng)頁內(nèi)容所在的頻道、展現(xiàn)的起 始位置、結(jié)束位置等信息,從該網(wǎng)站的相應(yīng)位置獲取網(wǎng)頁內(nèi)容。
由上可見,本發(fā)明針對被截取的網(wǎng)頁,不僅僅是簡單地直接抓取,而是通 過對網(wǎng)頁結(jié)構(gòu)進行分析得到信息源網(wǎng)站的網(wǎng)址、被截取網(wǎng)頁內(nèi)容所在的頻道、 展現(xiàn)的起始位置、結(jié)束位置等信息,然后根據(jù)所述分析結(jié)果可以實時地到信息 源網(wǎng)站上獲取相關(guān)信息,從而實現(xiàn)了定制內(nèi)容隨網(wǎng)站變化的實時更新。并且,當(dāng)信息源網(wǎng)站的頻道、樣式(指網(wǎng)頁顏色、欄目內(nèi)相對位置等)等發(fā)生改變時, 也能夠通過網(wǎng)頁結(jié)構(gòu)的分析結(jié)果從信息源網(wǎng)站正確獲取所需內(nèi)容,從而實時更 新定制內(nèi)容。
其中,選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行集成的步驟可以采用Portlet 技術(shù)來實現(xiàn),下面對該過程進行詳細的描述。參見圖2,該方法包括以下步驟
S201:將保存的條目生成Portlet,也就是采用配置方式將內(nèi)容資料庫中 保存的條目封裝成Portlet,這些被封裝的Potrtlet能夠在內(nèi)容定制網(wǎng)站的 Portlet框架下進行展現(xiàn)。
為了可以支持個性化定制,可以在將保存的條目生成Portlet時,首先讀 取內(nèi)容資料庫中的條目,然后由用戶來選擇需要集成的條目,再將這些需要集 成的條目封裝成Portlet,生成符合Portlet規(guī)范的數(shù)據(jù),并保存到內(nèi)容定制 網(wǎng)站的Portlet數(shù)據(jù)庫中,完成對Portlet的注冊。
S202:將生成的Portlet進行保存,也就是將封裝好的Portlet存放在 Portlet數(shù)據(jù)庫中,并進行展現(xiàn),從用戶的角度看來,就是將定制的網(wǎng)頁內(nèi)容 顯示在網(wǎng)站上。當(dāng)用戶希望展現(xiàn)某頁面內(nèi)容時,則可以選擇相應(yīng)的Portlet, 選中的Portlet將在用戶定制內(nèi)容的網(wǎng)站上得到展現(xiàn)。
其中Portlet框架可以看做是存放所有Portlet的容器,負責(zé)作為頁面組 成基礎(chǔ)模塊和門戶管理核心基礎(chǔ)組件的Portlet的生成、修改、刪除、共享等, 以及對Port let屬性的管理。通俗來講,Port let是具體的功能模塊,而Port let 框架是存放這些模塊的平臺。
為更好地理解本發(fā)明的技術(shù)方案,下面結(jié)合實際應(yīng)用對本發(fā)明提供的方法 進行描述。
參見圖3,本發(fā)明優(yōu)選實施例提供的方法包括以下步驟 S301:用戶登錄門戶系統(tǒng)(即內(nèi)容定制網(wǎng)站);
S302:用戶利用剪裁工具對信息源網(wǎng)站的網(wǎng)頁內(nèi)容進行截取,系統(tǒng)輔助分 析網(wǎng)頁內(nèi)容的信息構(gòu)成形式;
S303:將分析的內(nèi)容按照條目存入內(nèi)容資料庫中;S304: Portlet生成模塊讀取內(nèi)容資料庫中的條目; S305:用戶選擇需要集成的內(nèi)容條目;
S306: Portlet生成才莫塊對內(nèi)容條目進4亍封裝,生成Portlet;
S307:將生成后的Portlet存儲到Portlet庫中;
這樣生成后的Port let將展現(xiàn)在用戶的門戶系統(tǒng)上;
S308:用戶選擇希望展現(xiàn)的^皮封裝的portlet;
S309:選中的portlet對應(yīng)的信息在門戶系統(tǒng)中得到展現(xiàn)。
用戶選中希望展現(xiàn)的被封裝的por11 et后,系統(tǒng)會根據(jù)保存的頁面結(jié)構(gòu)分 析結(jié)果,到信息源網(wǎng)站上抓取portlet對應(yīng)的信息,并在用戶的門戶系統(tǒng)中進 行展示。
綜上所述,當(dāng)用戶定制內(nèi)容后,每次訪問時系統(tǒng)實時到相應(yīng)網(wǎng)站上抓取這 些信息,因而內(nèi)容是實時更新的,本發(fā)明所述的內(nèi)容管理是動態(tài)的。而且,這 種新型的內(nèi)容管理集成方法,利用頁面裁剪技術(shù)可以在網(wǎng)絡(luò)互聯(lián)范圍內(nèi)抓取任 意網(wǎng)站的指定頻道內(nèi)容,并對抓取的內(nèi)容進行數(shù)據(jù)分析,然后與已有的門戶系 統(tǒng)集成,從而擴展內(nèi)容管理的信息獲取源,實現(xiàn)對集成內(nèi)容的個性化定制。并 且,實現(xiàn)了統(tǒng)一的頁面抓取過程,由抓取網(wǎng)頁服務(wù)的服務(wù)器鏈接到信息源網(wǎng)站 統(tǒng)一4爪取網(wǎng)頁。
針對上述方法,本發(fā)明還提供了一種內(nèi)容管理集成系統(tǒng)的實施例。參照圖 4,是實施例提供的內(nèi)容管理集成系統(tǒng)結(jié)構(gòu)圖。所述系統(tǒng)主要包括
網(wǎng)頁抓取分析單元U401,用于從信息源網(wǎng)站截取網(wǎng)頁內(nèi)容,并分析頁面 結(jié)構(gòu);
存儲單元U402,用于保存頁面結(jié)構(gòu)的分析結(jié)果;
集成展現(xiàn)單元U403,用于選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行集成;當(dāng) 訪問集成的結(jié)果時,根據(jù)頁面結(jié)構(gòu)的分析結(jié)果從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi) 容,并進行展現(xiàn)。
其中,所述頁面結(jié)構(gòu)的分析結(jié)果包括信息源網(wǎng)站的網(wǎng)址、被截取網(wǎng)頁內(nèi)容 所在的頻道、展現(xiàn)的起始位置、結(jié)束位置,則所述集成展現(xiàn)單元U403通過以下方式根據(jù)頁面結(jié)構(gòu)的分析結(jié)果從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容
根據(jù)信息源網(wǎng)站的網(wǎng)址,找到被截取網(wǎng)頁內(nèi)容所在的網(wǎng)站;
根據(jù)被截取網(wǎng)頁內(nèi)容所在的頻道、展現(xiàn)的起始位置、結(jié)束位置,從該網(wǎng)站 的相應(yīng)位置獲取網(wǎng)頁內(nèi)容。
其中,所述存儲單元U402即指前述的內(nèi)容資料庫,通過以下方式保存頁 面結(jié)構(gòu)的分析結(jié)果
將頁面結(jié)構(gòu)的分析結(jié)果按條目進行存儲,并定義條目的標(biāo)識名,其中每個 條目對應(yīng)一個網(wǎng)頁截取對象。
優(yōu)選的,所述集成展現(xiàn)單元U403采用PortLet封裝,Portlet封裝能夠 通過配置的方式將存儲單元U402中的條目封裝成Portlet,這些被封裝 Portlet能夠在門戶的Portlet框架下進行展現(xiàn)和個性化定制。
PortLet封裝具體包括
PortLet生成單元U4031,用于選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行封裝, 生成PortLet;封裝過程采用配置方式;
PortLet庫U4032,用于存寸諸PortLet;
PortLet框架U4033,用于當(dāng)用戶訪問定制的PortLet時,才艮據(jù)頁面結(jié)構(gòu) 的分析結(jié)果從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容,并發(fā)布到訪問服務(wù)器上展現(xiàn)。 其中,所述訪問服務(wù)器即對應(yīng)前述的內(nèi)容定制網(wǎng)站的服務(wù)器。PortLet框架, 作為被封裝的PortLet展現(xiàn)框架,用戶可以對符合要求的被封裝的Portlet 進行個性化定制,乂人而確定在登錄后的個人門戶上的顯示內(nèi)容。
圖4所示系統(tǒng)中未詳述的部分可以參見圖1、圖2和圖3所示方法的相關(guān) 部分,為了篇幅考慮,在此不再詳述。
以上對本發(fā)明所提供的一種內(nèi)容管理集成方法及系統(tǒng),進行了詳細介紹,
說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般 技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實施方式
及應(yīng)用范圍上均會有改變之處。 綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
1、一種內(nèi)容管理集成方法,其特征在于,包括從信息源網(wǎng)站截取網(wǎng)頁內(nèi)容,并分析頁面結(jié)構(gòu);保存頁面結(jié)構(gòu)的分析結(jié)果;選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行集成;當(dāng)訪問集成的結(jié)果時,根據(jù)頁面結(jié)構(gòu)的分析結(jié)果從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容,并進行展現(xiàn)。
2、 才艮據(jù)權(quán)利要求1所述的方法,其特征在于,所述頁面結(jié)構(gòu)的分析結(jié)果 包括信息源網(wǎng)站的網(wǎng)址、被截取網(wǎng)頁內(nèi)容所在的頻道、展現(xiàn)的起始位置、結(jié)束 位置,則才艮據(jù)頁面結(jié)構(gòu)的分析結(jié)果從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容的具體實 現(xiàn)包括根據(jù)信息源網(wǎng)站的網(wǎng)址,找到被截取網(wǎng)頁內(nèi)容所在的網(wǎng)站; 根據(jù)被截取網(wǎng)頁內(nèi)容所在的頻道、展現(xiàn)的起始位置、結(jié)束位置,從該網(wǎng)站 的相應(yīng)位置獲取網(wǎng)頁內(nèi)容。
3、 根據(jù)權(quán)利要求1所述的方法,其特征在于,保存頁面結(jié)構(gòu)分析結(jié)果的 具體實現(xiàn)包括將頁面結(jié)構(gòu)的分析結(jié)果按條目進行存儲,并定義條目的標(biāo)識名,其中每個 條目對應(yīng)一個網(wǎng)頁截取對象。
4、 根據(jù)權(quán)利要求3所述的方法,其特征在于,選取保存的頁面結(jié)構(gòu)分析 結(jié)果并進行集成的具體實現(xiàn)包括讀取存儲的條目,并根據(jù)條目的標(biāo)識名選擇需要集成的條目; 對所述需要集成的條目進行封裝,生成PortLet; 將生成的PortLet進行保存。
5、 根據(jù)權(quán)利要求4所述的方法,其特征在于,展現(xiàn)集成結(jié)果的具體實現(xiàn) 包括定制要展現(xiàn)的PortLet;將選中的PortLet發(fā)布到訪問服務(wù)器上展現(xiàn)。
6、 一種內(nèi)容管理集成系統(tǒng),其特征在于,包括網(wǎng)頁抓取分析單元,用于從信息源網(wǎng)站截取網(wǎng)頁內(nèi)容,并分析頁面結(jié)構(gòu); 存儲單元,用于保存頁面結(jié)構(gòu)的分析結(jié)果;集成展現(xiàn)單元,用于選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行集成;當(dāng)訪問集 成的結(jié)果時,根據(jù)頁面結(jié)構(gòu)的分析結(jié)果從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容,并 進行展現(xiàn)。
7、根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述頁面結(jié)構(gòu)的分析結(jié)果 包括信息源網(wǎng)站的網(wǎng)址、被截取網(wǎng)頁內(nèi)容所在的頻道、展現(xiàn)的起始位置、結(jié)束息源網(wǎng)站獲取網(wǎng)頁內(nèi)容根據(jù)信息源網(wǎng)站的網(wǎng)址,找到被截取網(wǎng)頁內(nèi)容所在的網(wǎng)站;根據(jù)被截取網(wǎng)頁內(nèi)容所在的頻道、展現(xiàn)的起始位置、結(jié)束位置,從該網(wǎng)站 的相應(yīng)位置獲取網(wǎng)頁內(nèi)容。
8 、根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述存儲單元通過以下方 式保存頁面結(jié)構(gòu)的分析結(jié)果將頁面結(jié)構(gòu)的分析結(jié)果按條目進行存儲,并定義條目的標(biāo)識名,其中每個 條目對應(yīng)一個網(wǎng)頁截取對象。
9、 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述集成展現(xiàn)單元采用 PortLet封裝,具體包括PortLet生成單元,用于選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行封裝,生成 PortLetjPortLet庫,用于存^f諸PortLet;PortLet框架,用于當(dāng)訪問定制的PortLet時,根據(jù)頁面結(jié)構(gòu)的分析結(jié)果 從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容,并發(fā)布到訪問服務(wù)器上展現(xiàn)。
10、 根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于所述PortLet生成單元采 用配置方式。
全文摘要
本發(fā)明公開了一種內(nèi)容管理集成方法及系統(tǒng),以解決現(xiàn)有技術(shù)中獲取的網(wǎng)站內(nèi)容無法隨網(wǎng)站的更新而變化的問題。所述方法包括從信息源網(wǎng)站截取網(wǎng)頁內(nèi)容,并分析頁面結(jié)構(gòu);保存頁面結(jié)構(gòu)的分析結(jié)果;選取保存的頁面結(jié)構(gòu)分析結(jié)果并進行集成;當(dāng)訪問集成的結(jié)果時,根據(jù)頁面結(jié)構(gòu)的分析結(jié)果從相應(yīng)的信息源網(wǎng)站獲取網(wǎng)頁內(nèi)容,并進行展現(xiàn)。本發(fā)明通過對網(wǎng)頁結(jié)構(gòu)進行分析得到信息源網(wǎng)站的網(wǎng)址、被截取網(wǎng)頁內(nèi)容所在的頻道、展現(xiàn)的起始位置、結(jié)束位置等信息,然后根據(jù)所述分析結(jié)果可以實時地到信息源網(wǎng)站上獲取相關(guān)信息,從而實現(xiàn)了定制內(nèi)容隨網(wǎng)站變化的實時更新。而且,當(dāng)信息源網(wǎng)站的頻道、樣式等發(fā)生改變時,也能夠通過網(wǎng)頁結(jié)構(gòu)的分析結(jié)果正確獲取所需內(nèi)容。
文檔編號G06F17/30GK101290633SQ20081011427
公開日2008年10月22日 申請日期2008年6月2日 優(yōu)先權(quán)日2008年6月2日
發(fā)明者劉建明, 崔丙鋒, 王繼業(yè), 范鵬展, 陳德勝, 魏曉菁 申請人:國網(wǎng)信息通信有限公司