亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于內(nèi)容理解的不良信息過濾方法

文檔序號:6654011閱讀:317來源:國知局
專利名稱:基于內(nèi)容理解的不良信息過濾方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種信息過濾方法,尤其涉及一種基于內(nèi)容理解的不良信息過濾方法。
背景技術(shù)
近年來隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,各種良莠不齊的信息數(shù)量急劇膨脹,網(wǎng)絡(luò)信息安全問題日益突出,嚴(yán)重的敗壞了社會的風(fēng)氣,因此社會和個 人對信息的過濾需求日益強(qiáng)烈。然而結(jié)合目前正在使用的不良信息過濾軟件和系統(tǒng)來看,存在著漏報、錯報的現(xiàn)象,并且過濾速度較慢,而本發(fā)明提出的基于內(nèi)容分析的方法,不僅能夠精確有效的過濾不良信息,為用戶提供干凈的網(wǎng)絡(luò)環(huán)境,而且過濾速度較快,應(yīng)用前景非常廣闊。

發(fā)明內(nèi)容
本發(fā)明的目的就是為了解決現(xiàn)有技術(shù)中存在的上述問題,提供一種基于內(nèi)容理解的不良信息過濾方法。本發(fā)明的目的通過以下技術(shù)方案來實現(xiàn)基于內(nèi)容理解的不良信息過濾方法,其包括以下步驟步驟①,對網(wǎng)絡(luò)信息源中的內(nèi)容進(jìn)行數(shù)據(jù)預(yù)處理,從中提取出能夠反映或是有助判別內(nèi)容的顯性和隱性特征,令不良信息內(nèi)容通過特征項有效的表達(dá);步驟②,根據(jù)匹配規(guī)則和方法,將不良信息模板與待處理的不良信息內(nèi)容進(jìn)行匹配;步驟③,根據(jù)匹配結(jié)果對信息源進(jìn)行相應(yīng)的過濾處理;步驟④,將處理后的結(jié)果返回給Web頁的用戶。上述的基于內(nèi)容理解的不良信息過濾方法,其中所述的網(wǎng)絡(luò)信息源包括文本內(nèi)容信息和圖像內(nèi)容信息。進(jìn)一步地,上述的基于內(nèi)容理解的不良信息過濾方法,其中所述的文本信息的過濾是根據(jù)文本內(nèi)容的上下文語境、文本要素,通過分析和理解文本內(nèi)容的語義,發(fā)現(xiàn)不良信
肩、O更進(jìn)一步地,上述的基于內(nèi)容理解的不良信息過濾方法,其中所述圖像內(nèi)容的過濾是根據(jù)圖像的色彩、紋理、形狀、輪廓以及色彩、紋理、形狀、輪廓之間的空間關(guān)系特征和語義作為索引,通過圖像之間的相似程度的匹配而進(jìn)行過濾。更進(jìn)一步地,上述的基于內(nèi)容理解的不良信息過濾方法,其中步驟②所述的不良信息包括,淫穢色情、反動暴力以及垃圾信息。再進(jìn)一步地,上述的基于內(nèi)容理解的不良信息過濾方法,其中所述的預(yù)處理是清除網(wǎng)絡(luò)信息源中的無關(guān)信息,保留有用的信息并將其描述特征分離出來進(jìn)行量化,然后將能反映或有助于辨別內(nèi)容性質(zhì)的顯性和隱性信息提取出來,使不良信息能通過特征項有效表達(dá)。
本發(fā)明技術(shù)方案的優(yōu)點主要體現(xiàn)在能夠根據(jù)文本信息內(nèi)容的上下文語境以及圖像信息的各種特征,精確有效的過濾網(wǎng)絡(luò)信息中的不良信息,為用戶提供一個干凈的的網(wǎng)絡(luò)環(huán)境,其應(yīng)用前景非常廣闊。本發(fā)明的目的、優(yōu)點和特點,將通過下面優(yōu)選實施例的非限制性說明進(jìn)行解釋。這些實施例僅是應(yīng)用本發(fā)明技術(shù)方案的典型范例,凡采取等同替換或者等效變換而形成的技術(shù)方案,均落在本發(fā)明要求保護(hù)的范圍之內(nèi)。
具體實施例方式基于內(nèi)容理解的不良信息過濾方法,其與眾不同之處在于包括以下步驟首先,對網(wǎng)絡(luò)信息源中的內(nèi)容進(jìn)行數(shù)據(jù)預(yù)處理,從中提取出能夠反映或是有助判別內(nèi)容的顯性和隱性特征,令不良信息內(nèi)容通過特征項有效的表達(dá)。具體來說,所述的網(wǎng)絡(luò)信息源包括文本內(nèi)容信息和圖像內(nèi)容信息。之后,根據(jù)匹配規(guī)則和方法,將不良信息模板與待處理的不良信息內(nèi)容進(jìn)行匹配。 具體來說,所述的不良信息包括,淫穢色情、反動暴力以及垃圾信息。接著,根據(jù)匹配結(jié)果對信息源進(jìn)行相應(yīng)的過濾處理。最后,將處理后的結(jié)果返回給Web頁的用戶。結(jié)合本發(fā)明的實際實施過程來看,采用文本信息的過濾是根據(jù)文本內(nèi)容的上下文語境、文本要素,通過分析和理解文本內(nèi)容的語義,發(fā)現(xiàn)不良信息。同時,所述圖像內(nèi)容的過濾是根據(jù)圖像的色彩、紋理、形狀、輪廓以及色彩、紋理、形狀、輪廓之間的空間關(guān)系特征和語義作為索引,通過圖像之間的相似程度的匹配而進(jìn)行過濾。并且,為了起到較佳的過濾效果,采用的預(yù)處理是清除網(wǎng)絡(luò)信息源中的無關(guān)信息,保留有用的信息并將其描述特征分離出來進(jìn)行量化,然后將能反映或有助于辨別內(nèi)容性質(zhì)的顯性和隱性信息提取出來,使不良信息能通過特征項有效表達(dá)。通過上述的文字表述可以看出,采用本發(fā)明后,能夠根據(jù)文本信息內(nèi)容的上下文語境以及圖像信息的各種特征,精確有效的過濾網(wǎng)絡(luò)信息中的不良信息,為用戶提供一個干凈的的網(wǎng)絡(luò)環(huán)境,其應(yīng)用前景非常廣闊。
權(quán)利要求
1.基于內(nèi)容理解的不良信息過濾方法,其特征在于包括以下步驟 步驟①,對網(wǎng)絡(luò)信息源中的內(nèi)容進(jìn)行數(shù)據(jù)預(yù)處理,從中提取出能夠反映或是有助判別內(nèi)容的顯性和隱性特征,令不良信息內(nèi)容通過特征項有效的表達(dá); 步驟②,根據(jù)匹配規(guī)則和方法,將不良信息模板與待處理的不良信息內(nèi)容進(jìn)行匹配; 步驟③,根據(jù)匹配結(jié)果對信息源進(jìn)行相應(yīng)的過濾處理; 步驟④,將處理后的結(jié)果返回給Web頁的用戶。
2.根據(jù)權(quán)利要求I所述的基于內(nèi)容理解的不良信息過濾方法,其特征在于所述的網(wǎng)絡(luò)信息源包括文本內(nèi)容信息和圖像內(nèi)容信息。
3.根據(jù)權(quán)利要求2所述的基于內(nèi)容理解的不良信息過濾方法,其特征在于所述的文本信息的過濾是根據(jù)文本內(nèi)容的上下文語境、文本要素,通過分析和理解文本內(nèi)容的語義,發(fā)現(xiàn)不良信息。
4.根據(jù)權(quán)利要求2所述的基于內(nèi)容理解的不良信息過濾方法,其特征在于所述圖像內(nèi)容的過濾是根據(jù)圖像的色彩、紋理、形狀、輪廓以及色彩、紋理、形狀、輪廓之間的空間關(guān)系特征和語義作為索引,通過圖像之間的相似程度的匹配而進(jìn)行過濾。
5.根據(jù)權(quán)利要求I所述的基于內(nèi)容理解的不良信息過濾方法,其特征在于步驟②所述的不良信息包括,淫穢色情、反動暴力以及垃圾信息。
6.根據(jù)權(quán)利要求I所述的基于內(nèi)容理解的不良信息過濾方法,其特征在于所述的預(yù)處理是清除網(wǎng)絡(luò)信息源中的無關(guān)信息,保留有用的信息并將其描述特征分離出來進(jìn)行量化,然后將能反映或有助于辨別內(nèi)容性質(zhì)的顯性和隱性信息提取出來,使不良信息能通過特征項有效表達(dá)。
全文摘要
本發(fā)明涉及一種基于內(nèi)容理解的不良信息過濾方法,其包括以下步驟首先對網(wǎng)絡(luò)信息源中的內(nèi)容進(jìn)行數(shù)據(jù)預(yù)處理,從中提取出能夠反映或是有助判別內(nèi)容的顯性和隱性特征,令不良信息內(nèi)容通過特征項有效的表達(dá)。之后,根據(jù)匹配規(guī)則和方法,將不良信息模板與待處理的不良信息內(nèi)容進(jìn)行匹配。接著,根據(jù)匹配結(jié)果對信息源進(jìn)行相應(yīng)的過濾處理。最后,將處理后的結(jié)果返回給Web頁的用戶。由此,能夠根據(jù)文本信息內(nèi)容的上下文語境以及圖像信息的各種特征,精確有效的過濾網(wǎng)絡(luò)信息中的不良信息,為用戶提供一個干凈的網(wǎng)絡(luò)環(huán)境,其應(yīng)用前景非常廣闊。
文檔編號G06F17/30GK102693236SQ20111007123
公開日2012年9月26日 申請日期2011年3月24日 優(yōu)先權(quán)日2011年3月24日
發(fā)明者宦奕奕 申請人:蘇州風(fēng)采信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1