專利名稱:用于在線互動(dòng)系統(tǒng)有害信息智能過濾和屏蔽方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于在線互動(dòng)系統(tǒng)(例如;網(wǎng)絡(luò)論壇(BBS系統(tǒng)))的有害信息智能過濾和屏蔽方法及其系統(tǒng)。
背景技術(shù):
目前最廣泛的網(wǎng)絡(luò)應(yīng)用有BBS論壇、電子商務(wù)、電子政務(wù)等,這些應(yīng)用的全面普及,對言論安全提出了挑戰(zhàn)。在這類系統(tǒng)中,用戶可以隨心所欲的發(fā)表自己的觀點(diǎn)、言論,根據(jù)這類系統(tǒng)交互性大、實(shí)時(shí)性強(qiáng)的特點(diǎn),這些言論會及時(shí)在網(wǎng)站上進(jìn)行顯示,若管理人員對有害的言論不進(jìn)行及時(shí)的處理,將造成嚴(yán)重的反面宣傳效果,影響惡劣。
現(xiàn)有的系統(tǒng)大致可分為三類一類是用戶發(fā)表的內(nèi)容直接上網(wǎng),無任何保護(hù)措施。目前大多數(shù)BBS系統(tǒng)、個(gè)人網(wǎng)站、企業(yè)網(wǎng)站都是這類。
第二類是用戶發(fā)表的內(nèi)容不直接顯示在網(wǎng)站上,要經(jīng)過管理員人工的判斷,認(rèn)為不包含有害信息,才能上網(wǎng)公開,這類系統(tǒng)以犧牲交互性和實(shí)時(shí)性為代價(jià)達(dá)到管理有害信息的目的。目前部分商業(yè)網(wǎng)站采用該方法。
第三類設(shè)有文章掃描系統(tǒng),會根據(jù)關(guān)鍵字對文章進(jìn)行掃描,若文章中含有關(guān)鍵字的,則不予上網(wǎng),直接刪除。這類系統(tǒng)的致命弱點(diǎn)在于,發(fā)布人發(fā)現(xiàn)文章被刪除后,會反復(fù)更換文章中的“可疑詞匯”,以繞過系統(tǒng)的掃描,達(dá)到傳播有害信息的目的。目前部分BBS和商業(yè)網(wǎng)站采用該方法。
第四類與第三類相似,只不過把含有關(guān)鍵字眼的有害信息直接刪除的作法變?yōu)榘殃P(guān)鍵字替換為其它文字。目前幾乎所有的BBS產(chǎn)品都采用這種方法。
發(fā)明內(nèi)容
本發(fā)明打破了上述四類常規(guī)的處理方法,提供了一種成熟的、安全可靠的用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法及其系統(tǒng),通過該方法或系統(tǒng)的使用,減輕管理人員的擔(dān)負(fù)。
本發(fā)明所提供的一種用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法,包括下列步驟用戶發(fā)表信息后,系統(tǒng)立即啟動(dòng)“智能文章掃描系統(tǒng)”對文章的內(nèi)容進(jìn)行智能化的掃描;在服務(wù)器接收到用戶提交的信息后,即開始掃描;若被“智能文章掃描系統(tǒng)”判為“可疑文章”的,則在顯示該文章時(shí),系統(tǒng)自動(dòng)啟動(dòng)“無關(guān)者屏蔽”,對該文章進(jìn)行保護(hù);否則,文章直接上網(wǎng)顯示;若管理員發(fā)現(xiàn)未被“智能文章掃描系統(tǒng)”判為“可疑文章”的文章含有有害信息時(shí),同樣可以手動(dòng)使用“無關(guān)者屏蔽”對文章進(jìn)行處理;管理員可以根據(jù)形勢的變化,增加或刪除關(guān)鍵字,以保證“智能掃描系統(tǒng)”的命中率達(dá)到設(shè)定的水平;同時(shí),管理人員在前臺或后臺管理系統(tǒng)中對“可疑文章”進(jìn)行集中的處理,即確定不含有害信息并釋放文章或確定其含有害信息進(jìn)行備份并刪除。
在上述的用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法中,掃描系統(tǒng)除了能根據(jù)關(guān)鍵字對文章進(jìn)行掃描,還能正確捕捉文章中經(jīng)過變化或偽裝的“動(dòng)態(tài)”關(guān)鍵字。
在上述的用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法中,“無關(guān)者屏蔽”方式,即為只有文章原作者及管理員才能看到文章的標(biāo)題及內(nèi)容。
在上述的用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法中,管理人員在前臺或后臺管理系統(tǒng)中對“可疑文章”進(jìn)行集中處理中,將可疑文章在關(guān)鍵字眼處以顯色格式進(jìn)行顯示。
本發(fā)明還提供了一種用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽系統(tǒng),其特征在于它包括智能文章掃描模塊和與之相連的無關(guān)者屏蔽模塊。
本發(fā)明不僅改進(jìn)了通用的關(guān)鍵字過濾算法,使之能捕捉到經(jīng)過偽裝的關(guān)鍵字,而且從算法上和屏蔽技巧上獨(dú)辟蹊徑,即采用“智能文章掃描”和“無關(guān)者屏蔽”方式,兩者相輔相成,形成了一套獨(dú)特的、完整的、有效的有害信息智能過濾和屏蔽體系,提供了一套成熟的、安全可靠的解決方案。
圖1是本發(fā)明用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法的流程圖。
具體實(shí)施例方式
本發(fā)明,即用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽系統(tǒng),它包括智能文章掃描模塊和與之相連的無關(guān)者屏蔽模塊。
如圖1所示,本發(fā)明用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法,步驟如下用戶發(fā)表信息后,系統(tǒng)立即啟動(dòng)“智能文章掃描系統(tǒng)”對文章的內(nèi)容進(jìn)行智能化的掃描。與其它掃描系統(tǒng)不同的是,本掃描系統(tǒng)不僅能根據(jù)關(guān)鍵字對文章進(jìn)行掃描,而且還能正確捕捉文章中經(jīng)過變化或偽裝的“動(dòng)態(tài)”關(guān)鍵字,即在文章過濾系統(tǒng)中加了關(guān)鍵字關(guān)聯(lián)的概念,可以打碎匹配關(guān)鍵字;在服務(wù)器接收到用戶提交的信息后,即開始掃描,整個(gè)掃描過程無明顯的延遲,用戶不會查覺;若被“智能文章掃描系統(tǒng)”判為“可疑文章”的,則在顯示該文章時(shí),系統(tǒng)自動(dòng)啟動(dòng)“無關(guān)者屏蔽”,對該文章進(jìn)行特殊的保護(hù);否則,文章直接上網(wǎng)顯示;“無關(guān)者屏蔽”方式特點(diǎn)是只有文章原作者及管理員才能看到文章的標(biāo)題及內(nèi)容,對其它用戶來說,一律不可見。該方式的引入,基本上杜絕了作者在發(fā)現(xiàn)文章被系統(tǒng)自動(dòng)屏蔽或刪除后,反復(fù)更改文章內(nèi)容并發(fā)表的可能性,作者認(rèn)為有害信息已經(jīng)上網(wǎng),其實(shí)不然;若管理員發(fā)現(xiàn)未被“智能文章掃描系統(tǒng)”判為“可疑文章”的文章含有有害信息時(shí),同樣可以手動(dòng)使用“無關(guān)者屏蔽”對文章進(jìn)行處理,而不是類似其它的系統(tǒng),只能刪除文章或修改文章;管理員可以根據(jù)形勢的變化,增加或刪除關(guān)鍵字,以保證“智能掃描系統(tǒng)”的命中率達(dá)到比較高的水平。同時(shí),管理人員可以在前臺或后臺管理系統(tǒng)中對“可疑文章”進(jìn)行集中的處理。
上述的智能文章掃描方式和無關(guān)者屏蔽方式說明如下1.智能文章掃描智能文章掃描的基礎(chǔ)是“關(guān)鍵字”庫。在后臺數(shù)據(jù)庫中增加該表,用于記錄“關(guān)鍵字”?!瓣P(guān)鍵字”可以是一個(gè)個(gè)詞組,或是一個(gè)能夠被打碎的詞組。
智能文章掃描能捕捉到偽裝的關(guān)鍵字,正是靠打碎的詞組的匹配來完成的。比如“共-產(chǎn)-黨”,詞組中的“-”代表前一個(gè)字與后一字之間可以打碎匹配,例如語句共123456產(chǎn)ABCD黨共+++++++產(chǎn)+++++++黨就可以被掃描程序自動(dòng)匹配。配置了該技術(shù)后,使得系統(tǒng)能對某些不良用戶存心在敏感字中夾雜各種字母、符號來繞過普通的文字掃描的捕捉成為可能,在日常使用中效果顯著。
當(dāng)BBS程序接收到用戶提交的文章后,系統(tǒng)自動(dòng)調(diào)用智能文章掃描模塊,對文章進(jìn)行徹底的掃描,把數(shù)據(jù)庫中預(yù)先定義好的“關(guān)鍵字”逐個(gè)與文章對比,在對比的過程中,還能判別偽裝的關(guān)鍵字。
若有關(guān)鍵字在文章中被智能文章掃描模塊匹配成功的,則系統(tǒng)在把文章記錄插入數(shù)據(jù)庫時(shí),在記錄上做標(biāo)記,以表示文章為“可疑”文章,等待管理人員的進(jìn)一步判斷。
2.無關(guān)者屏蔽方式在文章列表和文章顯示時(shí),若系統(tǒng)發(fā)現(xiàn)將要顯示的文章帶有“可疑”文章的標(biāo)記,則啟用無關(guān)者屏蔽方式,對該文章進(jìn)行特殊處理。
系統(tǒng)若發(fā)現(xiàn)瀏覽者就是發(fā)文者本人,表示發(fā)文者本人閱讀,則原原本本的顯示文章的原文。
系統(tǒng)若發(fā)現(xiàn)瀏覽者的權(quán)限為管理員,則在文章列表前使用紅色的“×”標(biāo)志,并在顯示文章時(shí),以醒目的紅色作為底色警示管理員,以提示管理員該文章為“可疑”文章,需要進(jìn)行進(jìn)一步的處理。
如果不是以上二種情況的,說明瀏覽者為普通用戶,則跳過該文章在列表中的顯示,用戶根本不能看到該文章出現(xiàn)在文章列表中,好像文章不存在一樣,更談不上閱讀文章的內(nèi)容了。
管理員不僅可以在前臺BBS中看到“可疑”文章,還能在后臺管理系統(tǒng)中,統(tǒng)一對“可疑”文章進(jìn)行集中的管理,并做出判斷。在管理系統(tǒng)中,系統(tǒng)會自動(dòng)把可疑之處,使用反紅的醒目方式進(jìn)行顯示,以幫助管理員快速定位文章有問題的地方,提高工作的效率。
綜上所述,本發(fā)明提出了一套使用智能文字過濾和無關(guān)者屏蔽系統(tǒng)相結(jié)合的發(fā)表文章的策略,從自動(dòng)屏蔽到人工屏蔽,提供了一套對付有害信息的完整的解決方案。此外,本發(fā)明與其它系統(tǒng)不同的是即使不是管理員,若發(fā)現(xiàn)有害信息,也可以進(jìn)行無關(guān)者屏蔽的操作,進(jìn)一步加強(qiáng)了防御有害信息的力度。本發(fā)明的提出和實(shí)施,徹底改變了遇到有害信息只能刪除或修改的現(xiàn)狀,為有害信息防治提供了新思路和新手段。
權(quán)利要求
1.一種用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法,包括下列步驟用戶發(fā)表信息后,系統(tǒng)立即啟動(dòng)“智能文章掃描系統(tǒng)”對文章的內(nèi)容進(jìn)行智能化的掃描;在服務(wù)器接收到用戶提交的信息后,即開始掃描;若被“智能文章掃描系統(tǒng)”判為“可疑文章”的,則在顯示該文章時(shí),系統(tǒng)自動(dòng)啟動(dòng)“無關(guān)者屏蔽”,對該文章進(jìn)行保護(hù);否則,文章直接上網(wǎng)顯示;若管理員發(fā)現(xiàn)未被“智能文章掃描系統(tǒng)”判為“可疑文章”的文章含有有害信息時(shí),同樣可以手動(dòng)使用“無關(guān)者屏蔽”對文章進(jìn)行處理;管理員可以根據(jù)形勢的變化,增加或刪除關(guān)鍵字,以保證“智能掃描系統(tǒng)”的命中率達(dá)到設(shè)定的水平;同時(shí),管理人員在前臺或后臺管理系統(tǒng)中對“可疑文章”進(jìn)行集中的處理,即確定不含有害信息并釋放文章或確定其含有害信息進(jìn)行備份并刪除。
2.根據(jù)權(quán)利要求1所述的用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法,其特征在于所述的掃描系統(tǒng)除了能根據(jù)關(guān)鍵字對文章進(jìn)行掃描,還能正確捕捉文章中經(jīng)過變化或偽裝的“動(dòng)態(tài)”關(guān)鍵字。
3.根據(jù)權(quán)利要求1所述的用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法,其特征在于所述的“無關(guān)者屏蔽”方式,即為只有文章原作者及管理員才能看到文章的標(biāo)題及內(nèi)容。
4.根據(jù)權(quán)利要求1所述的用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法,其特征在于所述管理人員在前臺或后臺管理系統(tǒng)中對“可疑文章”進(jìn)行集中處理中,將可疑文章在關(guān)鍵字眼處以顯色格式進(jìn)行顯示。
5.一種用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽系統(tǒng),其特征在于它包括智能文章掃描模塊和與之相連的無關(guān)者屏蔽模塊。
全文摘要
本發(fā)明涉及用于在線互動(dòng)系統(tǒng)的有害信息智能過濾和屏蔽方法及其系統(tǒng),用戶發(fā)表信息后,系統(tǒng)啟動(dòng)“智能文章掃描系統(tǒng)”對文章的內(nèi)容進(jìn)行智能化的掃描;若被判為“可疑文章”,則系統(tǒng)自動(dòng)啟動(dòng)“無關(guān)者屏蔽”,對該文章進(jìn)行保護(hù);否則,文章直接上網(wǎng)顯示;若未被判為“可疑文章”的文章含有有害信息時(shí),亦可手動(dòng)使用“無關(guān)者屏蔽”對文章進(jìn)行處理;管理員通過增加或刪除關(guān)鍵字,以保證“智能掃描系統(tǒng)”的命中率達(dá)到設(shè)定的水平;管理人員對“可疑文章”進(jìn)行集中的處理。本發(fā)明不僅改進(jìn)了通用的關(guān)鍵字過濾算法,使之能捕捉到經(jīng)過偽裝的關(guān)鍵字,并采用“智能文章掃描”和“無關(guān)者屏蔽”相結(jié)合的方式,形成一套獨(dú)特的發(fā)文審核和屏蔽體系,進(jìn)一步加強(qiáng)了防御有害信息的力度。
文檔編號G06Q50/00GK1855836SQ20051002554
公開日2006年11月1日 申請日期2005年4月29日 優(yōu)先權(quán)日2005年4月29日
發(fā)明者朱明倫 申請人:朱明倫