專利名稱:一種網(wǎng)絡內容分類處理方法和裝置的制作方法
技術領域:
本發(fā)明涉及通信技術領域,特別是涉及一種網(wǎng)絡內容分類處理方法和裝置。
背景技術:
RSS (聚合內容,Really Simple Syndication)最早是由NetScape定義的一 套新聞頻道標準,從RSS的歷史發(fā)展來看,RSS是一種信息溝通標準,RSS 借助XML技術形式,完成互聯(lián)網(wǎng)站點間信息的自動傳送。
RSS作為站點間的信息溝通標準,有兩個特點, 一是網(wǎng)站間自動完成, 不需要人工介入;二是傳送的內容是一個分類的索引信息。從自動完成這一 點看,將對互聯(lián)網(wǎng)信息傳送的速度和廣度產(chǎn)生影響;從RSS的內容是分類的 索引信息這一點看,具有語義的含義,互聯(lián)網(wǎng)信息的定義將從純粹的文本符 號上升到有語義聯(lián)系的層面。
由此可見,看起來十分筒單的RSS技術實際上承載著格式化互聯(lián)網(wǎng)信息, 并賦予互聯(lián)網(wǎng)語義的重任。不過,RSS只是一個索引信息,并沒有完整的解 決信息溝通的問題。
RSS是在線共享內容的一種簡易方式。通常在時效性比較強的內容上使 用RSS訂閱能更快速獲取信息,RSS傳送的內容是一個分類的索引信息,如 圖1所示,廣泛用于網(wǎng)上新聞頻道,blog和wiki。
一方面,RSS可以實現(xiàn)對目標內容摘要性的內容輸出,輸出的是不完整 的內容,例如圖1中不完整的摘要內容,且未提供對諸如文本、圖片、音頻、 視頻、下載附件、評論等細分輸出。
另一方面,RSS可以對內容按數(shù)據(jù)的文件類型屬性作分類輸出,如文 字、圖片、3gp視頻、mpeg視頻、mp3音頻、wma音頻。但不能根據(jù)內容類 型屬性進行輸出,如,3gp視頻、mpeg視頻均可以作為廣告的內容文件進行發(fā)布,但RSS并不能將上述兩種文件統(tǒng)一按照"廣告"的類型屬性進行輸出, 為具體應用中的分類傳輸功能實現(xiàn)設置了局限。
因此,需要一種可以按照內容類型屬性而不是文件類型屬性作分類輸出 的方法,以便于網(wǎng)絡或中斷驚醒相應的處理,改善用戶的應用體^r。
發(fā)明內容
本發(fā)明實施例要解決的問題是提供一種網(wǎng)絡內容分類處理方法,用于實 現(xiàn)對不同的網(wǎng)絡內容進行提取、解析、并按照所定義的分類重新整合,從而 進行分類傳輸?shù)男Ч?br>
為達到上述目的,本發(fā)明實施例一方面提出 一種網(wǎng)絡內容分類處理方法, 包括以下步驟
獲取網(wǎng)絡資源;
提取所述網(wǎng)絡資源中的內容,并對所述內容進行分類; 將所述分類后的網(wǎng)絡資源中的內容進行輸出。
另一方面,本發(fā)明實施例還提出一種網(wǎng)絡內容分類處理裝置,包括 獲取模塊,用于獲取網(wǎng)絡資源;
分類模塊,用于提取所述獲取模塊獲取的網(wǎng)絡資源中的內容,并對所述 內容進行分類;
輸出模塊,用于將所述分類模塊分類后的網(wǎng)絡資源中的內容進行輸出。 本發(fā)明實施例的技術方案具有以下優(yōu)點,因為采用了對不同的網(wǎng)絡內容 進行提取、解析、并按照所定義的分類重新整合,并對整合結果進行分類傳 輸?shù)募夹g,從而,實現(xiàn)了對網(wǎng)絡內容分類和重新整合,并對相應的內容進行 分類傳輸,便于其他系統(tǒng)對數(shù)據(jù)作進一步的處理。
圖1為現(xiàn)有技術中RSS技術的傳輸效果示意圖2為本發(fā)明實施例 一 中 一種網(wǎng)絡內容分類處理方法的流程示意圖3為本發(fā)明實施例一中網(wǎng)絡資源結構示意圖;圖4為本發(fā)明實施例一中網(wǎng)絡內容分類示意圖5為本發(fā)明實施例二中一種提供分類數(shù)據(jù)傳輸?shù)木W(wǎng)絡示意圖6為本發(fā)明實施例三中 一種由服務器進行網(wǎng)絡內容分類的示意圖7為本發(fā)明實施例四中一種有終端進行網(wǎng)絡內容分類的示意圖8為本發(fā)明實施例五中一種網(wǎng)絡內容分類處理裝置的結構示意圖。
具體實施例方式
本發(fā)明實施例現(xiàn)有RSS技術只能實現(xiàn)對目標內容按照文件類型屬性輸 出,而不能按照內容屬性進行輸出,使目標內容的分類處理存在局限,本發(fā) 明針對這種情況,實現(xiàn)了將文本、圖片、音頻、視頻、下載附件、評論等任 意內容逐一進行提取、解析、以實現(xiàn)將內容按照所定義的分類,并可以進一 步對所分類的內容重新進行整合。
下面結合附圖和實施例,對本發(fā)明的具體實施方式
作進一 步詳細描述
如圖2所示,為本發(fā)明實施例一,一種網(wǎng)絡內容分類處理方法的流程示 意圖,包括以下步驟
步驟S201、獲取網(wǎng)絡資源。
本步驟所提及的獲取網(wǎng)絡資源的方法,可以是網(wǎng)絡服務器直接獲得上傳 的網(wǎng)絡資源,或中轉服務器有網(wǎng)絡獲得網(wǎng)絡資源,或終端通過服務器獲得網(wǎng) 絡資源,以上三種情況將通過后續(xù)的本發(fā)明實施例二、三、四進行詳細描述, 本實施例不再另行詳述。
需要進一步指出的是,上述情況的差別并不影響本發(fā)明的保護范圍。
步驟S202、提取網(wǎng)絡資源中的內容。
網(wǎng)絡資源中含有大量的內容,且內容種類繁多,通過提取,將網(wǎng)絡資源 中眾多的內容逐一分離,以便為后續(xù)步驟的實現(xiàn)提供內容基礎。具體的,將 文本、圖片、音頻、視頻、下載附件、評論等多種內容分別進行提取。
如圖3所示,該網(wǎng)絡資源中的內容包括圖片,文字,多個由超鏈接組成 的精彩專題,由圖片或其他多媒體文件組成的廣告,多個視頻文件組成的精 彩視頻。步驟S203、解^f內容中的標識。
對步驟S202中提取的內容進行解析,識別各內容中的標識。 標識具體指內容中包含的標記語言相關標簽、內容關鍵詞、類型信息、
文件大小和識別碼中的 一種或幾種。
如,在圖3中,根據(jù)結合類型信息、文件大小和內容關鍵詞等可以識別廣告。
步驟S204、 #4居標識,對內容進行分類。 根據(jù)預設的內容分類標準進行內容的分類。
如圖4所示,可以將相應的內容劃分為文字、圖片、精彩專題、視頻等 多個種類。
內容分類的標準可以是與用戶或服務商預設的,根據(jù)具體應用情況的變 化,分類的標準可以相應的做出調整。 步驟S205、判斷輸出模式。
如果判斷輸出模式的結果是分類輸出,則轉入步驟S206; 如果判斷輸出模式的結果是整體輸出,則轉入步驟S207。 步驟S206、對分類后的內容按照類別分別輸出。 根據(jù)分類結果,將每個種類的內容分別進行傳輸。
步驟S207、將分類后的內容進行處理后, 一并輸出,由內容的接收方做 分類處理。
根據(jù)分類結果,對每個種類的內容進行相應的處理,為每個種類的內容 添加相應的內容種類標識。標識添加完成后,將所有種類的內容一起向內容 接收方進行發(fā)送,接收方將上述各分類的內容整體接收后,根據(jù)各分類內容 的種類標識區(qū)分該內容的種類,并進行相應的處理和操作。
下面結合本發(fā)明實施例一的技術方案,進一步的根據(jù)具體實施主體的差 別提出以下三個實施例。
如圖5所示,為本發(fā)明實施例二, 一種提供分類數(shù)據(jù)傳輸?shù)木W(wǎng)絡示意圖, 包括以下步驟步驟S501、網(wǎng)絡側內部對網(wǎng)絡資源進行分類。 網(wǎng)絡根據(jù)分類標準將網(wǎng)絡資源進行分類。 步驟S502、將分類后的網(wǎng)絡內容發(fā)送給終端。
需要指出的是,本步驟可以是將分類后的內容分別發(fā)送給終端,也可以 是將分類后的內容處理,如添加內容分類標識后,將所有添加內容分類標識 的內容一起發(fā)送給終端,再由終端進行相應的操作。這樣的差別并不影響本 發(fā)明的保護范圍。
如圖6所示,為本發(fā)明實施例三, 一種由服務器進行網(wǎng)絡內容分類的示
意圖,包括以下步驟
步驟S601、服務器從互聯(lián)網(wǎng)信息源直接獲得網(wǎng)絡資源。
步驟S602、服務器根據(jù)分類標準對網(wǎng)絡資源進行提取和分類。
服務器從網(wǎng)絡資源中提取內容,并根據(jù)內容中的標識對該內容進行分類,
分類的標準預先設定。
步驟S603 、服務器將分類后的內容分類發(fā)送給終端。
需要指出的是,本步驟可以是將分類后的內容分別發(fā)送給終端,也可以
是將分類后的內容處理,如添加內容分類標識后,將所有添加內容分類標識
的內容一起發(fā)送給終端,再由終端進行相應的操作。這樣的差別并不影響本
發(fā)明的保護范圍。
如圖7所示,為本發(fā)明實施例四, 一種由終端進行網(wǎng)絡內容分類的示意 圖,包括以下步驟
步驟S701、網(wǎng)絡向終端傳送網(wǎng)絡資源。 該網(wǎng)絡資源未經(jīng)分類,只是統(tǒng)一的作為整體發(fā)送給終端。 步驟S702、終端對接收到的網(wǎng)絡資源進行分類。
終端從接收到的網(wǎng)絡資源中提取內容,并根據(jù)內容中的標識對該內容進 行分類,分類的標準預先設定。
步驟S703 、對分類后的內容進行相應操作。終端進行操作的種類包括將各分類內容分類存儲、根據(jù)分類內容對終 端接收的網(wǎng)絡內容量進行分類統(tǒng)計、對各分類內容分類展現(xiàn)等。
如圖8所示,為本發(fā)明實施例五、 一種網(wǎng)絡內容分類處理裝置的結構示 意圖,包括
獲取模塊l,用于獲取網(wǎng)絡資源;
分類模塊2,用于提取獲取模塊l獲取的網(wǎng)絡資源中的內容,并對內容進
行分類,進一步包括
提取子模塊21,用于提取網(wǎng)絡資源中的內容;
解析子模塊22,用于解析提取子模塊21所提取的內容中的標識
分類子模塊23,用于根據(jù)解析子模塊22所解析的標識,對提取子模塊
21所提取的內容進行分類。
輸出模塊3,用于將分類模塊2分類后的網(wǎng)絡資源中的內容進行輸出,進
一步包括
標識子模塊31,用于對分類模塊分類后的內容添加識別標識。
本發(fā)明實施例的技術方案具有以下優(yōu)點,因為釆用了對不同的網(wǎng)絡內容 進行提取、解析、并按照所定義的分類重新整合,并對整合結果進行分類傳 輸?shù)募夹g,從而,實現(xiàn)了對網(wǎng)絡內容分類和重新整合,并對相應的內容進行 分類傳輸,便于其他系統(tǒng)對數(shù)據(jù)作進一步的處理。
通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到本 發(fā)明可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可以通過硬 件,但很多情況下前者是更佳的實施方式?;谶@樣的理解,本發(fā)明的技 術方案本質上或者說對現(xiàn)有技術做出貢獻的部分可以以軟件產(chǎn)品的形式體
現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質中,包括若干指令用以使 得一臺終端設備(可以是手機,個人計算機,服務器,或者網(wǎng)絡設備等) 執(zhí)行本發(fā)明各個實施例所述的方法。以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本技術領域的 普通技術人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進 和潤飾,這些改進和潤飾也應視本發(fā)明的保護范圍。
權利要求
1、一種網(wǎng)絡內容分類處理方法,其特征在于,包括以下步驟獲取網(wǎng)絡資源;提取所述網(wǎng)絡資源中的內容,并對所述內容進行分類;將所述分類后的網(wǎng)絡資源中的內容進行輸出。
2、 如權利要求1所迷網(wǎng)絡內容分類處理方法,其特征在于,所述提取并 解析所述網(wǎng)絡資源中的內容,具體為提取所述網(wǎng)絡資源中的內容; 解析所述內容中的標識; 才艮據(jù)所述標識,對所述內容進行分類。
3、 如權利要求2所迷網(wǎng)絡內容分類處理方法,其特征在于,所述標識, 具體包括所述內容中包含的標記語言相關標簽、內容關鍵詞、類型信息、文件大 小和識別碼中的 一種或幾種。
4、 如權利要求2所述網(wǎng)絡內容分類處理方法,其特征在于,所述對內容 進行分類,具體為根據(jù)預設的內容分類標準進行所述內容的分類。
5、 如權利要求1所述網(wǎng)絡內容分類處理方法,其特征在于,所述將分類 后的網(wǎng)絡資源中的內容進行輸出,具體為對所述分類后的內容按照類別分別輸出;或,將所述分類后的內容進行處理后, 一并輸出,由所述內容的接收方做分 類處理。
6、 如權利要求5所述網(wǎng)絡內容分類處理方法,其特征在于,所述將分類 后的內容進行處理,具體包括對所述分類后的內容添加識別標識。
7、 一種網(wǎng)絡內容分類處理裝置,其特征在于,包括: 獲取模塊,用于獲取網(wǎng)絡資源;分類模塊,用于提取所述獲取模塊獲取的網(wǎng)絡資源中的內容,并對所述內容進行分類;輸出模塊,用于將所述分類模塊分類后的網(wǎng)絡資源中的內容進行輸出。
8、 如權利要求7所述網(wǎng)絡內容分類處理裝置,其特征在于,所述分類模 塊,包括提取子模塊,用于提取所述網(wǎng)絡資源中的內容; 解析子模塊,用于解析所述提取子模塊所提取的內容中的標識 分類子模塊,用于根據(jù)所述解析子模塊所解析的標識,對所述提取子模 塊所提取的內容進行分類。
9、 如權利要求7所述網(wǎng)絡內容分類處理裝置,其特征在于,所述輸出模 塊,包括標識子模塊,用于對所述分類模塊分類后的內容添加識別標識。
全文摘要
本發(fā)明實施例公開了一種網(wǎng)絡內容分類處理方法和裝置,所述方法包括以下步驟獲取網(wǎng)絡資源;提取所述網(wǎng)絡資源中的內容,并對所述內容進行分類;將所述分類后的網(wǎng)絡資源中的內容進行輸出。通過應用本發(fā)明,可以實現(xiàn)對不同的網(wǎng)絡內容進行提取、解析、并按照所定義的分類重新整合,從而進行分類傳輸,便于其他系統(tǒng)對數(shù)據(jù)作進一步的處理。
文檔編號H04L12/54GK101420356SQ20081009748
公開日2009年4月29日 申請日期2008年5月30日 優(yōu)先權日2008年5月30日
發(fā)明者劍 李, 潘智鵬, 紀向利, 騰 馬 申請人:北京天騰時空信息科技有限公司