專(zhuān)利名稱(chēng):一種應(yīng)用hsml解析引擎的過(guò)濾處理方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字家庭技術(shù)領(lǐng)域,具體涉及一種應(yīng)用HSML解析引擎的過(guò)濾處理方 法及系統(tǒng)。本發(fā)明屬于互動(dòng)電視頁(yè)面標(biāo)記語(yǔ)言(HSML)范疇。
背景技術(shù):
隨著社會(huì)信息化的快速發(fā)展,交互電視與多媒體技術(shù)早已經(jīng)成為了人們關(guān)注的熱 點(diǎn),我國(guó)計(jì)劃2015年全國(guó)停止模擬電視的播放,從而實(shí)現(xiàn)數(shù)字電視廣播電視有限、衛(wèi)星和 無(wú)線的全國(guó)覆蓋。有線電視數(shù)字化,可以大大增加節(jié)目容量,提供豐富多彩的專(zhuān)業(yè)化、多樣 化、對(duì)象化節(jié)目,提供更加清晰的圖像質(zhì)量和優(yōu)美的音質(zhì),使用者在享受廣播電視服務(wù)的同 時(shí),還能享受各種資訊信息的服務(wù)。各種業(yè)務(wù)的開(kāi)發(fā)與發(fā)展,需要對(duì)數(shù)字電視互動(dòng)業(yè)務(wù)服務(wù) 信息進(jìn)行規(guī)范,有助于提供商與眾多內(nèi)容服務(wù)提供商之間的信息對(duì)接。數(shù)字電視交互服務(wù)標(biāo)記語(yǔ)言(HSML)標(biāo)準(zhǔn)對(duì)XML語(yǔ)言進(jìn)行擴(kuò)展,制定針對(duì)數(shù)字電視 交互服務(wù)的標(biāo)記語(yǔ)言,實(shí)現(xiàn)對(duì)面向三網(wǎng)融合的數(shù)字電視交互服務(wù)進(jìn)行業(yè)務(wù)呈現(xiàn)及信息交互 描述,便于采用虛擬化技術(shù)對(duì)所需要的跨域共享與集成服務(wù)內(nèi)容進(jìn)行功能提取與抽象,用 以突破當(dāng)前交互服務(wù)內(nèi)容與數(shù)字電視平臺(tái)高耦合度的這一瓶頸,實(shí)現(xiàn)數(shù)字電視產(chǎn)業(yè)高端增 值業(yè)務(wù)的高速發(fā)展。為了防止不法分子散布危險(xiǎn)或不健康內(nèi)容來(lái)危害社會(huì),現(xiàn)在網(wǎng)絡(luò)上對(duì)一些敏感信 息進(jìn)行關(guān)鍵字過(guò)濾,例如google,baidU等搜索引擎都提供了敏感關(guān)鍵字的過(guò)濾功能。本發(fā) 明的作者在實(shí)踐中發(fā)現(xiàn)對(duì)于關(guān)鍵字的過(guò)濾不僅可以從網(wǎng)絡(luò)散布的環(huán)節(jié)中來(lái)控制,也可以在 對(duì)文檔解析內(nèi)容進(jìn)行控制,防止不健康內(nèi)容被解析出來(lái)。目前,數(shù)字電視交互服務(wù)標(biāo)記語(yǔ)言 (HSML)主要關(guān)注交互內(nèi)容的擴(kuò)展,還不能滿足在這方面的要求。本發(fā)明針對(duì)數(shù)字電視交互服務(wù)語(yǔ)言(HSML)解析引擎在這方面的不足,添加了數(shù) 據(jù)關(guān)鍵字過(guò)濾的功能,能夠保護(hù)用戶不會(huì)被迫接受一些不良的信息,是在信息安全方面的 一個(gè)改進(jìn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種應(yīng)用HSML解析引擎的過(guò)濾處理方法,允許用戶對(duì) HSML文檔進(jìn)行關(guān)鍵字過(guò)濾。同時(shí)本發(fā)明的另一目的在于提供一種應(yīng)用HSML解析引擎的過(guò) 濾處理系統(tǒng)。通過(guò)本發(fā)明能夠?qū)χ付ㄟM(jìn)行過(guò)濾,防止不法分子利用HSML文檔來(lái)傳危險(xiǎn)或不 健康內(nèi)容,危害社會(huì)。本發(fā)明的目的一是通過(guò)以下技術(shù)方案予以實(shí)現(xiàn)所述的一種應(yīng)用HSML解析引擎的過(guò)濾處理系統(tǒng),包括用戶交互界面、配置文件、 HSML解析單元、HSML關(guān)鍵字過(guò)濾單元。所述的用戶交互界面提供了用戶與HSML解析引擎的接口,向上接收用戶的命令, 向下能夠調(diào)用HSML引擎實(shí)現(xiàn)用戶請(qǐng)求。所述的配置文件,提供了加載HSML文檔的信息、需過(guò)濾的黑名單以及一些用戶操作信息。HSML引擎根據(jù)配置文件對(duì)文檔進(jìn)行解析以及關(guān)鍵字過(guò)濾。 所述的HSML解析單元,采用了 DOM解析方式,并且可以判斷解析成功與否,若解析
成功,則進(jìn)行下一步操作,若不成功,則重新解析,重復(fù)操作超過(guò)三次則解析失敗。所述的HSML關(guān)鍵字過(guò)濾單元,對(duì)HSML解析單元與文檔進(jìn)行初步解析后,對(duì)所得的 標(biāo)簽和內(nèi)容分別和配置文件中所保存的黑名單進(jìn)行匹配,若匹配成功,則為要進(jìn)行過(guò)濾的 關(guān)鍵字,對(duì)其進(jìn)行屏蔽或者替代。本發(fā)明的另外一個(gè)目的是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的所述的一種應(yīng)用HSML解析引擎的過(guò)濾處理方法,包括以下流程首先用戶打開(kāi) HSML文檔,開(kāi)始HSML解析流程;然后讀取配置文件,以確定需要加載的功能模塊;對(duì)文檔進(jìn) 行解析,通過(guò)DOM把HSML文檔解析成內(nèi)存中的樹(shù)形結(jié)構(gòu),然后根據(jù)Xpath解析出標(biāo)簽和內(nèi) 容,供其他單元處理;解析完文檔后判斷解析成功與否,若解析成功,則進(jìn)行下一步操作,若 不成功,則重新解析,重復(fù)操作超過(guò)三次則解析失敗,返回;HSML解析引擎對(duì)標(biāo)簽和內(nèi)容分 別進(jìn)行內(nèi)容匹配;若匹配成功,則將該部分內(nèi)容替換成“您所查看內(nèi)容已過(guò)濾”;若無(wú)匹配, 說(shuō)明該內(nèi)容健康,可直接解析重組;處理完后,再將零散的元素重新組合成HSML文檔。通過(guò)本發(fā)明能夠?qū)χ付ㄟM(jìn)行過(guò)濾,防止不法分子利用HSML文檔來(lái)傳危險(xiǎn)或不健 康內(nèi)容,危害社會(huì)。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以 根據(jù)這些附圖獲得其它的附圖。圖1是本發(fā)明一種應(yīng)用HSML解析引擎的過(guò)濾處理系統(tǒng)的結(jié)構(gòu)圖;圖2是本發(fā)明一種應(yīng)用HSML解析引擎的過(guò)濾處理方法的流程圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。如圖1所示,為本發(fā)明一種可對(duì)數(shù)據(jù)關(guān)鍵字過(guò)濾的HSML引擎的整體結(jié)構(gòu)框圖。該 系統(tǒng)包括用戶交互界面101、配置文件102、HSML解析單元103、HSML關(guān)鍵字過(guò)濾單元104。用戶交互界面101 提供了用戶與HSML解析引擎的接口,向上接收用戶的命令,向 下能夠調(diào)用HSML引擎實(shí)現(xiàn)用戶請(qǐng)求。配置文件102 提供了加載HSML文檔的信息、關(guān)鍵字黑名單,以及其他一些用戶操 作信息。HSML引擎根據(jù)配置文件的信息來(lái)確定需要加載的HSML文檔模塊,并根據(jù)配置文件 中的黑名單來(lái)進(jìn)行關(guān)鍵字匹配。同時(shí),關(guān)鍵字匹配后的替換文檔也保存在配置文件中。HSML解析單元103 通過(guò)DOM把HSML文檔解析成內(nèi)存中的樹(shù)形結(jié)構(gòu),然后根據(jù) Xpath解析出標(biāo)簽和內(nèi)容,供其他單元處理。處理完后,再將零散的元素重新組合成HSML文檔。在解析完文檔后可以判斷解析成功與否,若解析成功,則進(jìn)行下一步操作,若不成功,則 重新解析,重復(fù)操作超過(guò)三次則解析失敗。HSML關(guān)鍵字過(guò)濾104 對(duì)HSML解析單元103解析所得標(biāo)簽和內(nèi)容與配置單位中所 保存的黑名單進(jìn)行匹配。若匹配成功,組說(shuō)明該標(biāo)簽或內(nèi)容即為要過(guò)濾的內(nèi)容。對(duì)其進(jìn)行 屏蔽,并調(diào)用配置文件中的替換文檔。原內(nèi)容為“您所看內(nèi)容已過(guò)濾”。為了更進(jìn)一步的了解本發(fā)明系統(tǒng)的運(yùn)行流程,下面結(jié)合圖2的本發(fā)明可關(guān)鍵字過(guò) 濾的HSML解析引擎運(yùn)行的流程圖來(lái)進(jìn)行說(shuō)明步驟201,用戶打開(kāi)HSML文檔,開(kāi)始HSML解析流程。步驟202,讀取配置文件,以確定需要加載的功能模塊。步驟203,對(duì)文檔進(jìn)行解析,通過(guò)DOM把HSML文檔解析成內(nèi)存中的樹(shù)形結(jié)構(gòu),然后 根據(jù)Xpath解析出標(biāo)簽和內(nèi)容,供其他單元處理。步驟204,解析完文檔后判斷解析成功與否,若解析成功,則進(jìn)行下一步操作,若不 成功,則重新解析,重復(fù)操作超過(guò)三次則解析失敗,返回。步驟205,HSML解析引擎對(duì)標(biāo)簽和內(nèi)容分別進(jìn)行內(nèi)容匹配。步驟206,若匹配成功,則將該部分內(nèi)容替換成“您所查看內(nèi)容已過(guò)濾”。若無(wú)匹配, 說(shuō)明該內(nèi)容健康,可直接解析重組。步驟207,處理完后,再將零散的元素重新組合成HSML文檔。需要說(shuō)明的是,上述裝置和系統(tǒng)內(nèi)的各單元之間的信息交互、執(zhí)行過(guò)程等內(nèi)容,由 于與本發(fā)明方法實(shí)施例基于同一構(gòu)思,具體內(nèi)容可參見(jiàn)本發(fā)明方法實(shí)施例中的敘述,此處 不再贅述。本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可 以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存 儲(chǔ)介質(zhì)可以包括只讀存儲(chǔ)器(ROM,Read Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁盤(pán)或光盤(pán)等。以上對(duì)本發(fā)明實(shí)施例所提供的一種應(yīng)用HSML解析引擎的過(guò)濾處理方法及系統(tǒng), 進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí) 施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù) 人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō) 明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
權(quán)利要求
1.一種應(yīng)用HSML解析引擎的過(guò)濾處理系統(tǒng),其特征在于該系統(tǒng)包括用戶交互界面、 配置文件、HSML解析單元、HSML關(guān)鍵字過(guò)濾單元;所述的用戶交互界面,提供了用戶與HSML解析引擎的接口,向上接收用戶的命令,向 下能夠調(diào)用HSML引擎實(shí)現(xiàn)用戶請(qǐng)求;所述的配置文件,提供了加載HSML文檔的信息、需過(guò)濾的黑名單以及一些用戶操作信息;所述的HSML解析單元,采用了 DOM解析方式,并且可以判斷解析成功與否,若解析成 功,則進(jìn)行下一步操作,若不成功,則重新解析,重復(fù)操作超過(guò)三次則解析失??;所述的HSML關(guān)鍵字過(guò)濾單元,對(duì)HSML解析單元與文檔進(jìn)行初步解析后,對(duì)所得的標(biāo)簽 和內(nèi)容分別和配置文件中所保存的黑名單進(jìn)行匹配,若匹配成功,則為要進(jìn)行過(guò)濾的關(guān)鍵 字,對(duì)其進(jìn)行屏蔽或者替代。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于HSML引擎根據(jù)配置文件對(duì)文檔進(jìn)行解析 以及關(guān)鍵字過(guò)濾。
3.一種應(yīng)用HSML解析引擎的過(guò)濾處理方法,其特征在于包括以下步驟 步驟1),用戶打開(kāi)HSML文檔,開(kāi)始HSML解析流程;步驟2),讀取配置文件,以確定需要加載的功能模塊;步驟幻,對(duì)文檔進(jìn)行解析,通過(guò)DOM把HSML文檔解析成內(nèi)存中的樹(shù)形結(jié)構(gòu),然后根據(jù) Xpath解析出標(biāo)簽和內(nèi)容,供其他單元處理;步驟4),解析完文檔后判斷解析成功與否,若解析成功,則進(jìn)行下一步操作,若不成功, 則重新解析,重復(fù)操作超過(guò)三次則解析失敗,返回;步驟幻,HSML解析引擎對(duì)標(biāo)簽和內(nèi)容分別進(jìn)行內(nèi)容匹配;步驟6),若匹配成功,則將該部分內(nèi)容替換成“您所查看內(nèi)容已過(guò)濾”;若無(wú)匹配,說(shuō)明 該內(nèi)容健康,可直接解析重組;步驟7),處理完后,再將零散的元素重新組合成HSML文檔。
全文摘要
本發(fā)明提供一種應(yīng)用HSML解析引擎的過(guò)濾處理系統(tǒng),允許用戶對(duì)HSML文檔進(jìn)行關(guān)鍵字過(guò)濾。包括用戶交互界面、配置文件、HSML解析單元、HSML關(guān)鍵字過(guò)濾單元。同時(shí)本發(fā)明還公開(kāi)了一種應(yīng)用HSML解析引擎的過(guò)濾處理方法。通過(guò)本發(fā)明能夠?qū)χ付ㄟM(jìn)行過(guò)濾,防止不法分子利用HSML文檔來(lái)傳危險(xiǎn)或不健康內(nèi)容,危害社會(huì)。
文檔編號(hào)G06F17/30GK102135977SQ20101056942
公開(kāi)日2011年7月27日 申請(qǐng)日期2010年11月30日 優(yōu)先權(quán)日2010年11月30日
發(fā)明者朱建寶, 羅笑南, 陳任, 魏箏 申請(qǐng)人:廣東星海數(shù)字家庭產(chǎn)業(yè)技術(shù)研究院有限公司