亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于信息交換場景中敏感話題過濾的解決方法與流程

文檔序號(hào):12906198閱讀:324來源:國知局
一種基于信息交換場景中敏感話題過濾的解決方法與流程

本發(fā)明涉及網(wǎng)絡(luò)信息技術(shù)領(lǐng)域,具體為一種基于信息交換場景中敏感話題過濾的解決方法。



背景技術(shù):

在社交,論壇,新聞評(píng)論等存在用戶信息交換的場景中,常會(huì)出現(xiàn)一些不適宜在公眾場合展示的信息。一些軟件或者網(wǎng)站的開發(fā)者試圖屏蔽此類消息,但還是有一些此類用戶會(huì)通過分隔符,分條發(fā)送等形式來躲避開發(fā)者的屏蔽。為了提高數(shù)據(jù)處理的效率,系統(tǒng)初始化時(shí)會(huì)將敏感詞及分隔符等存于內(nèi)存之中,如果敏感詞庫過于龐大,會(huì)對(duì)操作系統(tǒng)內(nèi)存有很大的消耗。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的在于提供一種基于信息交換場景中敏感話題過濾的解決方法,具有高效,可以有效屏蔽多種敏感話題信息,凈化軟件環(huán)境的優(yōu)點(diǎn),以解決上述背景技術(shù)中提出的問題。

為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:

一種基于信息交換場景中敏感話題過濾的解決方法,包括敏感詞過濾和相鄰文本對(duì)比兩個(gè)階段,敏感詞過濾階段包括以下過濾步驟:

第一步、字母集合,先將敏感詞首字組成集合;

第二步、敏感詞拆分,將敏感詞每個(gè)字拆分,后一個(gè)字作為前一個(gè)字的子節(jié)點(diǎn),每一個(gè)節(jié)點(diǎn)都有一個(gè)字段isend來標(biāo)志是否到此為敏感詞;

第三步、系統(tǒng)判斷以是否為特殊擾亂字符作為判斷首要判斷條件。

優(yōu)選的,相鄰文本階段為判斷敏感詞過濾階段的二次判斷。

優(yōu)選的,敏感詞過濾階段為一種用來存儲(chǔ)敏感詞庫的數(shù)組加樹型結(jié)構(gòu)。

與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:本發(fā)明的基于信息交換場景中敏感話題過濾的解決方法,開始系統(tǒng)接收消息,對(duì)消息判斷是否含有敏感話題,若有則直接攔截不進(jìn)行轉(zhuǎn)發(fā),對(duì)接收的消息的相鄰若干條消息組裝成一條消息進(jìn)行敏感話題過濾,若系統(tǒng)判斷存在敏感話題則攔截不轉(zhuǎn)發(fā),并記錄消息和消息發(fā)送人,若系統(tǒng)判斷不存在敏感話題,則消息正常發(fā)送給接受者,由于特定的數(shù)據(jù)結(jié)構(gòu),對(duì)敏感詞的判斷效率很高,有效攔截過濾各種形式組裝的帶有敏感話題的信息并且能識(shí)別相鄰幾條信息是否可組裝為帶有敏感詞的信息,高效且可以有效屏蔽多種敏感話題信息,凈化軟件環(huán)境。

附圖說明

圖1為本發(fā)明的數(shù)據(jù)結(jié)構(gòu)圖;

圖2為傳統(tǒng)的判斷流程示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行q清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

參閱圖1-2,本發(fā)明提供一種技術(shù)方案:一種基于信息交換場景中敏感話題過濾的解決方法,包括敏感詞過濾和相鄰文本對(duì)比兩個(gè)階段,敏感詞過濾階段為一種用來存儲(chǔ)敏感詞庫的數(shù)組加樹型結(jié)構(gòu),對(duì)敏感詞的判斷效率很高,大大高于一般的正則匹配,敏感詞過濾階段包括以下過濾步驟:

第一步、字母集合,先將敏感詞首字組成集合;

第二步、敏感詞拆分,將敏感詞每個(gè)字拆分,后一個(gè)字作為前一個(gè)字的子節(jié)點(diǎn),每一個(gè)節(jié)點(diǎn)都有一個(gè)字段isend來標(biāo)志是否到此為敏感詞,本系統(tǒng)可以任何im、論壇等系統(tǒng)無縫結(jié)合,消息的傳遞可以用多種協(xié)議,需要保證消息不丟失,推薦使用生產(chǎn)消費(fèi)模式的消息隊(duì)列;

第三步、系統(tǒng)判斷,系統(tǒng)判斷小妖和小妖怪不是敏感詞,而小妖精則被認(rèn)為是敏感詞,系統(tǒng)判斷以是否為特殊擾亂字符作為判斷首要判斷條件,當(dāng)對(duì)每一個(gè)字符判斷之前,會(huì)先判斷其是否是特殊擾亂字符,當(dāng)循環(huán)到特殊無意義字符時(shí),會(huì)直接略過,有效攔截過濾各種形式組裝的帶有敏感話題的信息。

其中數(shù)據(jù)表示如下:

相鄰文本階段為判斷敏感詞過濾階段的二次判斷,經(jīng)過了敏感詞過濾階段的判斷為無敏感詞的信息,系統(tǒng)會(huì)記錄下本條信息,并與相鄰幾條信息組裝再次進(jìn)行步驟一的敏感詞判斷。經(jīng)系統(tǒng)判定消息含有敏感詞則系統(tǒng)會(huì)將本條及相鄰幾條信息記錄,并將此用戶記錄,以便統(tǒng)計(jì)頻次,對(duì)相鄰信息的判斷,多一條信息,系統(tǒng)判斷時(shí)間就會(huì)大大增加,因此相鄰信息數(shù)的指定不應(yīng)太大,相鄰文本階段的判斷能識(shí)別相鄰幾條信息是否可組裝為帶有敏感詞的信息。

系統(tǒng)具體判斷時(shí),開始系統(tǒng)接收首字消息,對(duì)首字消息判斷是否在首字集合,若不是,結(jié)果錯(cuò)誤,若是,判斷結(jié)束字段是否正確,若正確,結(jié)果錯(cuò)誤,若不正確,再進(jìn)行判斷是否為最后字符,若是,結(jié)果錯(cuò)誤,若不是,獲取下一個(gè)字符,然后再進(jìn)行下一個(gè)字符首字判斷,也就是對(duì)接收的消息判斷是否含有敏感話題,若有則直接攔截不進(jìn)行轉(zhuǎn)發(fā);對(duì)首字消息的相鄰若干條消息組裝成一條消息進(jìn)行敏感話題過濾。若系統(tǒng)判斷存在敏感話題則攔截不轉(zhuǎn)發(fā),并記錄消息和消息發(fā)送人。若系統(tǒng)判斷不存在敏感話題,則消息正常發(fā)送給接受者。

對(duì)于本發(fā)明的基于信息交換場景中敏感話題過濾的解決方法,基于特定的數(shù)據(jù)結(jié)構(gòu),對(duì)敏感詞的判斷效率很高,大大高于一般的正則匹配,對(duì)相鄰信息的判斷,多一條信息,系統(tǒng)判斷時(shí)間就會(huì)大大增加,因此相鄰信息數(shù)的指定不應(yīng)太大,本系統(tǒng)可以任何im、論壇等系統(tǒng)無縫結(jié)合,消息的傳遞可以用多種協(xié)議,需要保證消息不丟失,推薦使用生產(chǎn)消費(fèi)模式的消息隊(duì)列。

綜上所述:本發(fā)明的基于信息交換場景中敏感話題過濾的解決方法,開始系統(tǒng)接收消息,對(duì)消息判斷是否含有敏感話題,若有則直接攔截不進(jìn)行轉(zhuǎn)發(fā),對(duì)接收的消息的相鄰若干條消息組裝成一條消息進(jìn)行敏感話題過濾,若系統(tǒng)判斷存在敏感話題則攔截不轉(zhuǎn)發(fā),并記錄消息和消息發(fā)送人,若系統(tǒng)判斷不存在敏感話題,則消息正常發(fā)送給接受者,由于特定的數(shù)據(jù)結(jié)構(gòu),對(duì)敏感詞的判斷效率很高,有效攔截過濾各種形式組裝的帶有敏感話題的信息并且能識(shí)別相鄰幾條信息是否可組裝為帶有敏感詞的信息,高效且可以有效屏蔽多種敏感話題信息,凈化軟件環(huán)境。

以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。



技術(shù)特征:

技術(shù)總結(jié)
本發(fā)明公開了一種基于信息交換場景中敏感話題過濾的解決方法,包括敏感詞過濾和相鄰文本對(duì)比兩個(gè)階段,敏感詞過濾階段先將敏感詞首字組成集合,然后將敏感詞每個(gè)字拆分,后一個(gè)字作為前一個(gè)字的子節(jié)點(diǎn),每一個(gè)節(jié)點(diǎn)都有一個(gè)字段isend來標(biāo)志是否到此為敏感詞,相鄰文本階段系統(tǒng)會(huì)記錄下本條信息,并與相鄰幾條信息組裝再次進(jìn)行步驟一的敏感詞判斷。本發(fā)明的基于信息交換場景中敏感話題過濾的解決方法,由于特定的數(shù)據(jù)結(jié)構(gòu),對(duì)敏感詞的判斷效率很高,有效攔截過濾各種形式組裝的帶有敏感話題的信息,并且能識(shí)別相鄰幾條信息是否可組裝為帶有敏感詞的信息,高效且可以有效屏蔽多種敏感話題信息,凈化軟件環(huán)境。

技術(shù)研發(fā)人員:周聰偉
受保護(hù)的技術(shù)使用者:深圳市樂唯科技開發(fā)有限公司
技術(shù)研發(fā)日:2017.07.12
技術(shù)公布日:2017.11.10
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1