亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種文本過(guò)濾方法及文本過(guò)濾系統(tǒng)的制作方法

文檔序號(hào):6583167閱讀:138來(lái)源:國(guó)知局
專利名稱:一種文本過(guò)濾方法及文本過(guò)濾系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本申請(qǐng)涉及互聯(lián)網(wǎng)應(yīng)用技術(shù)領(lǐng)域,特別是涉及一種文本過(guò)濾方法及文本過(guò)濾系 統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)的不斷發(fā)展,網(wǎng)絡(luò)上的信息量日益劇增,而互聯(lián)網(wǎng)的開放性也導(dǎo)致在 網(wǎng)絡(luò)中存在很多不良信息,因此在互聯(lián)網(wǎng)上,對(duì)信息進(jìn)行監(jiān)控和過(guò)濾的已經(jīng)成為普遍需求。應(yīng)用內(nèi)容過(guò)濾技術(shù),可以實(shí)現(xiàn)對(duì)網(wǎng)上不良信息的過(guò)濾,從而保障網(wǎng)絡(luò)環(huán)境的安全。 網(wǎng)絡(luò)上的信息有多種表現(xiàn)形式,其中文本形式是最為常見(jiàn)的一種。文本過(guò)濾指的是從大量 文本信息中找出特定文本的過(guò)程,目前,常見(jiàn)的文本過(guò)濾方法都是基于基本關(guān)鍵詞匹配技 術(shù)實(shí)現(xiàn)的系統(tǒng)根據(jù)預(yù)先設(shè)置的多個(gè)與不良信息相關(guān)的關(guān)鍵詞,在輸入文本中進(jìn)行查找,如 果在輸入文本中發(fā)現(xiàn)與關(guān)鍵詞相匹配的內(nèi)容,則對(duì)這部分內(nèi)容或全部的輸入文本進(jìn)行過(guò)濾 或替換處理。上述文本過(guò)濾方法,只能過(guò)濾出與關(guān)鍵詞完全匹配的文本,但是卻無(wú)法判斷整個(gè) 文本的立場(chǎng)或態(tài)度,例如,在電子商務(wù)網(wǎng)站中,將“竊聽器”定義為過(guò)濾關(guān)鍵詞,但是現(xiàn)有的 文本過(guò)濾方法會(huì)將“禁止銷售竊聽器”這樣的合法文本也視為不良信息進(jìn)行過(guò)濾??梢?jiàn),現(xiàn) 有的基于基本關(guān)鍵詞匹配技術(shù)的文本過(guò)濾方法,識(shí)別正確率較低,無(wú)法滿足信息過(guò)濾的實(shí) 際應(yīng)用需求。

發(fā)明內(nèi)容
為解決上述技術(shù)問(wèn)題,本申請(qǐng)實(shí)施例提供一種文本過(guò)濾方法及文本過(guò)濾系統(tǒng),以 提高文本過(guò)濾的正確率,技術(shù)方案如下本申請(qǐng)?zhí)峁┮环N文本過(guò)濾方法,包括預(yù)先在文本過(guò)濾系統(tǒng)中定義語(yǔ)義關(guān)鍵詞,所述語(yǔ)義關(guān)鍵詞,至少由基本關(guān)鍵詞和 邏輯關(guān)系符構(gòu)成;所述文本過(guò)濾系統(tǒng)獲得輸入文本后,根據(jù)預(yù)先定義的語(yǔ)義關(guān)鍵詞,在所述輸入文 本中查找構(gòu)成所述語(yǔ)義關(guān)鍵詞的基本關(guān)鍵詞;如果在所述輸入文本中查找到與至少一個(gè)所述基本關(guān)鍵詞相匹配的文本內(nèi)容,則 進(jìn)一步對(duì)查找到的文本內(nèi)容進(jìn)行語(yǔ)義匹配;所述語(yǔ)義匹配包括根據(jù)構(gòu)成所述語(yǔ)義關(guān)鍵詞 的邏輯關(guān)系符,將所查找到的文本內(nèi)容與所述語(yǔ)義關(guān)鍵詞進(jìn)行匹配;如果所述語(yǔ)義匹配成功,則對(duì)匹配成功的文本內(nèi)容進(jìn)行過(guò)濾處理。本申請(qǐng)還提供一種文本過(guò)濾系統(tǒng),包括關(guān)鍵詞存儲(chǔ)單元,用于存儲(chǔ)預(yù)先定義的語(yǔ)義關(guān)鍵詞,所述語(yǔ)義關(guān)鍵詞,至少由基本 關(guān)鍵詞和邏輯關(guān)系符構(gòu)成;基本查找單元,用于在所述文本過(guò)濾系統(tǒng)獲得輸入文本后,根據(jù)預(yù)先定義的語(yǔ)義 關(guān)鍵詞,在所述輸入文本中查找構(gòu)成所述語(yǔ)義關(guān)鍵詞的基本關(guān)鍵詞;
語(yǔ)義匹配單元,用于在所述基本查找單元在所述輸入文本中查找到與至少一個(gè)所 述基本關(guān)鍵詞相匹配的文本內(nèi)容時(shí),進(jìn)一步對(duì)查找到的文本內(nèi)容進(jìn)行語(yǔ)義匹配;所述語(yǔ)義 匹配單元包括用于根據(jù)構(gòu)成所述語(yǔ)義關(guān)鍵詞的邏輯關(guān)系符,將所查找到的文本內(nèi)容與所 述語(yǔ)義關(guān)鍵詞進(jìn)行匹配的邏輯匹配子單元;過(guò)濾處理單元,用于在所述語(yǔ)義匹配單元匹配成功時(shí),對(duì)匹配成功的文本內(nèi)容進(jìn) 行過(guò)濾處理。本申請(qǐng)所提供的文本過(guò)濾方法及系統(tǒng),使用基本關(guān)鍵詞和邏輯關(guān)系符結(jié)合的方式 對(duì)文本內(nèi)容進(jìn)行過(guò)濾,與現(xiàn)有技術(shù)相比,能夠有效地結(jié)合基本關(guān)鍵詞在整個(gè)文本中的語(yǔ)義 進(jìn)行過(guò)濾,提高過(guò)濾的準(zhǔn)確性。


為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本 申請(qǐng)中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下, 還可以根據(jù)這些附圖獲得其他的附圖。圖1為本申請(qǐng)實(shí)施例的文本過(guò)濾方法流程圖;圖2為本申請(qǐng)實(shí)施例的基本關(guān)鍵詞樹形存儲(chǔ)結(jié)構(gòu)示意圖;圖3為本申請(qǐng)實(shí)施例的基本關(guān)鍵詞查找方法流程圖;圖4為本申請(qǐng)實(shí)施例的文本過(guò)濾系統(tǒng)的結(jié)構(gòu)示意圖;圖5為本申請(qǐng)實(shí)施例的基本查找單元的一種結(jié)構(gòu)示意圖;圖6為本申請(qǐng)實(shí)施例的基本查找單元的另一種結(jié)構(gòu)示意圖;圖7為本申請(qǐng)實(shí)施例的語(yǔ)義匹配單元的一種結(jié)構(gòu)示意圖。
具體實(shí)施例方式現(xiàn)有的文本過(guò)濾方法,僅根據(jù)簡(jiǎn)單關(guān)鍵詞進(jìn)行過(guò)濾,并且不具備邏輯分析能力,因 此會(huì)存在很多誤報(bào)情況。例如前文提到的“禁止銷售竊聽器”文本,雖然包含關(guān)鍵詞“竊聽 器”,但是結(jié)合“禁止”這一否定詞,又使得該段文本實(shí)際上成為合法信息而不應(yīng)被過(guò)濾處 理。針對(duì)這一問(wèn)題,本申請(qǐng)實(shí)施例提供一種文本過(guò)濾方法如下預(yù)先在文本過(guò)濾系統(tǒng)中定義語(yǔ)義關(guān)鍵詞,所述語(yǔ)義關(guān)鍵詞,至少由基本關(guān)鍵詞和 邏輯關(guān)系符構(gòu)成;所述文本過(guò)濾系統(tǒng)獲得輸入文本后,根據(jù)預(yù)先定義的語(yǔ)義關(guān)鍵詞,在所述輸入文 本中查找構(gòu)成所述語(yǔ)義關(guān)鍵詞的基本關(guān)鍵詞;如果在所述輸入文本中查找到與至少一個(gè)所述基本關(guān)鍵詞相匹配的文本內(nèi)容,則 進(jìn)一步對(duì)查找到的文本內(nèi)容進(jìn)行語(yǔ)義匹配;所述語(yǔ)義匹配包括根據(jù)構(gòu)成所述語(yǔ)義關(guān)鍵詞 的邏輯關(guān)系符,將所查找到的文本內(nèi)容與所述語(yǔ)義關(guān)鍵詞進(jìn)行匹配;如果所述語(yǔ)義匹配成功,則對(duì)匹配成功的文本內(nèi)容進(jìn)行過(guò)濾處理。上述文本過(guò)濾方法,使用基本關(guān)鍵詞和邏輯關(guān)系符結(jié)合的方式對(duì)文本內(nèi)容進(jìn)行過(guò) 濾,與現(xiàn)有技術(shù)相比,能夠有效地結(jié)合基本關(guān)鍵詞在整個(gè)文本中的語(yǔ)義進(jìn)行過(guò)濾,減少誤報(bào) 的情況,提高過(guò)濾的準(zhǔn)確性。
為了使本技術(shù)領(lǐng)域的人員更好地理解本申請(qǐng)中的技術(shù)方案,下面將結(jié)合本申請(qǐng)實(shí) 施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施 例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通 技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請(qǐng)保護(hù) 的范圍。實(shí)施例一本申請(qǐng)實(shí)施例中,基于語(yǔ)義關(guān)鍵詞對(duì)文本內(nèi)容進(jìn)行過(guò)濾,語(yǔ)義關(guān)鍵詞包括兩個(gè)基 本組成部分基本關(guān)鍵詞和邏輯關(guān)系符。其中,基本關(guān)鍵詞為獨(dú)立的一個(gè)詞或短語(yǔ),即相當(dāng) 于現(xiàn)有技術(shù)中所采用的簡(jiǎn)單關(guān)鍵詞;而邏輯關(guān)系符則用于表示邏輯關(guān)系,基本的邏輯關(guān)系 包括“與”、“或”、“非”等,在語(yǔ)義關(guān)鍵詞中,可以分別用符號(hào)“&”、“I”、“ ”來(lái)表示。以下 為應(yīng)用于電子商務(wù)網(wǎng)站文本過(guò)濾的語(yǔ)義關(guān)鍵詞的幾種簡(jiǎn)單示例a)手機(jī)竊聽 反該語(yǔ)義關(guān)鍵詞表示的語(yǔ)義是如果商品的信息中包含“手機(jī)竊聽”,且不包含“反”, 則需要對(duì)該商品信息進(jìn)行過(guò)濾處理。b)監(jiān)視攝像頭I無(wú)線監(jiān)控?cái)z像頭該語(yǔ)義關(guān)鍵詞表示的語(yǔ)義是如果商品的信息中包含“監(jiān)視攝像頭”或者包含“無(wú) 線監(jiān)控?cái)z像頭”,則需要對(duì)該商品信息進(jìn)行過(guò)濾處理。c)軍用&扎帶該語(yǔ)義關(guān)鍵詞表示的語(yǔ)義是如果商品的信息中包含“軍用”且包含“扎帶”,則需 要對(duì)該商品信息進(jìn)行過(guò)濾處理。對(duì)于一個(gè)語(yǔ)義關(guān)鍵詞而言,其最簡(jiǎn)形式應(yīng)該是2個(gè)基本關(guān)鍵詞+1個(gè)邏輯關(guān)系符, 以上三個(gè)示例都屬于這種情況。對(duì)于只包括一個(gè)基本關(guān)鍵詞的情況,實(shí)際上與現(xiàn)有技術(shù)相 同,本申請(qǐng)實(shí)施例對(duì)這種情況不再進(jìn)行介紹??梢岳斫獾氖?,在一個(gè)語(yǔ)義關(guān)鍵詞中,可以包 括更多的基本關(guān)鍵詞以及邏輯關(guān)系符,以表示更為復(fù)雜的語(yǔ)義,例如d)手機(jī)竊聽 (反I防)該語(yǔ)義關(guān)鍵詞表示的語(yǔ)義是如果商品的信息中包含“手機(jī)竊聽”,且不包含“反” 或“放”,則需要對(duì)該商品信息進(jìn)行過(guò)濾處理。在本申請(qǐng)的優(yōu)選方案中,還可以對(duì)語(yǔ)義關(guān)鍵詞的內(nèi)容做進(jìn)一步的擴(kuò)展,例如可以在語(yǔ)義關(guān)鍵詞中加入過(guò)濾條件。事實(shí)上,與前面所述的基本關(guān)鍵詞和邏輯關(guān) 系符不同的是過(guò)濾條件與文本的具體內(nèi)容無(wú)關(guān),其作用是從文本的其他方面屬性對(duì)過(guò)濾 做進(jìn)一步的限定。例如,限定文本的來(lái)源、類別等等,從而實(shí)現(xiàn)更為準(zhǔn)確的過(guò)濾。在語(yǔ)義關(guān)鍵詞中,還可以進(jìn)一步加入過(guò)濾行為,以表明對(duì)于與語(yǔ)義關(guān)鍵詞文本部 分相匹配的內(nèi)容,具體做何種處理,例如內(nèi)容屏蔽、內(nèi)容替換等等。以下三個(gè)例子,分別在前述的a)、b)、c)中添加過(guò)濾條件和過(guò)濾行為,對(duì)語(yǔ)義關(guān)鍵 詞的擴(kuò)展形式進(jìn)行示意性說(shuō)明,其中,分號(hào)之前為基本關(guān)鍵詞和邏輯關(guān)系符、分號(hào)之后為擴(kuò) 展內(nèi)容,各項(xiàng)擴(kuò)展內(nèi)容之間用逗號(hào)隔開。當(dāng)然,本實(shí)施例并不對(duì)語(yǔ)義的具體格式進(jìn)行限定。al)手機(jī)竊聽 反;商品類別1002,過(guò)濾行為下架,該語(yǔ)義關(guān)鍵詞表示的語(yǔ)義是如果商品的信息中包含“手機(jī)竊聽”,且不包含“反”、 并且商品類別是1002,則需要對(duì)該商品信息進(jìn)行下架處理。
bl)監(jiān)視攝像頭I無(wú)線監(jiān)控?cái)z像頭;商品類別101,過(guò)濾行為下架,該語(yǔ)義關(guān)鍵詞表示的語(yǔ)義是如果商品的信息中包含“監(jiān)視攝像頭”或者包含“無(wú) 線監(jiān)控?cái)z像頭”、并且商品類別是101,則需要對(duì)該商品信息進(jìn)行下架處理。cl)軍用&扎帶;商品類別50001,過(guò)濾行為下架,該語(yǔ)義關(guān)鍵詞表示的語(yǔ)義是如果商品的信息中包含“軍用”且包含“扎帶”、并且 商品類別是50001,則需要對(duì)該商品信息進(jìn)行下架處理。下面進(jìn)一步結(jié)合具體的流程,對(duì)本實(shí)施例進(jìn)行說(shuō)明,圖1所示為本申請(qǐng)實(shí)施例的 文本過(guò)濾方法流程圖,包括以下步驟S101,文本過(guò)濾系統(tǒng)獲得輸入文本后,根據(jù)預(yù)先定義的語(yǔ)義關(guān)鍵詞,在輸入文本中 查找構(gòu)成所述語(yǔ)義關(guān)鍵詞的基本關(guān)鍵詞;在本步驟中,系統(tǒng)在獲得一段輸入文本后,將首先在輸入文本中對(duì)基本關(guān)鍵詞進(jìn) 行查找,并對(duì)查找結(jié)果進(jìn)行記錄。例如,對(duì)于前述的b)或bl),系統(tǒng)將首先在輸入文本中查 找“監(jiān)視攝像頭”和“無(wú)線監(jiān)控?cái)z像頭”的內(nèi)容。本步驟的具體實(shí)現(xiàn)可以與現(xiàn)有技術(shù)中基于 簡(jiǎn)單關(guān)鍵詞相匹配的方法類似,本實(shí)施例不做詳細(xì)說(shuō)明。S102,如果在輸入文本中查找到與至少一個(gè)基本關(guān)鍵詞相匹配的文本內(nèi)容,則進(jìn) 一步對(duì)查找到的文本內(nèi)容進(jìn)行語(yǔ)義匹配;在SlOl中,僅僅是根據(jù)基本關(guān)鍵詞的內(nèi)容進(jìn)行查找,如果沒(méi)有查找到與任何基本 關(guān)鍵詞相匹配的內(nèi)容,說(shuō)明不需要對(duì)輸入文本進(jìn)行過(guò)濾處理;如果查找到與至少一個(gè)基本 關(guān)鍵詞相匹配的文本內(nèi)容,則需要進(jìn)一步將所查找到的文本內(nèi)容與完整的語(yǔ)義關(guān)鍵詞進(jìn)行 比較,這一步驟稱為語(yǔ)義匹配。如果語(yǔ)義關(guān)鍵詞中只包括基本關(guān)鍵詞和邏輯關(guān)系符,那么語(yǔ)義匹配的具體內(nèi)容就 是根據(jù)預(yù)先定義的語(yǔ)義關(guān)鍵詞中的邏輯關(guān)系符,將所查找到的文本內(nèi)容與所述語(yǔ)義關(guān)鍵 詞進(jìn)行匹配。例如對(duì)于前述的a),系統(tǒng)在輸入文本中查找到了基本關(guān)鍵詞“手機(jī)竊聽”,并且沒(méi)有查 找到基本關(guān)鍵詞“反”,即兩個(gè)基本關(guān)鍵詞的實(shí)際查找結(jié)果符合在語(yǔ)義關(guān)鍵詞a)中所定義 的兩個(gè)基本關(guān)鍵詞的邏輯關(guān)系“非”,因此,所查找到的內(nèi)容與語(yǔ)義關(guān)鍵詞a)匹配成功;對(duì)于前述的C),系統(tǒng)在輸入文本中查找到了基本關(guān)鍵詞“扎帶”,并且沒(méi)有查找到 基本關(guān)鍵詞“軍用”,即兩個(gè)基本關(guān)鍵詞的實(shí)際查找結(jié)果不符合在語(yǔ)義關(guān)鍵詞c)中所定義 的兩個(gè)基本關(guān)鍵詞的邏輯關(guān)系“與”,因此,所查找到的內(nèi)容與語(yǔ)義關(guān)鍵詞a)匹配失??;如果語(yǔ)義關(guān)鍵詞中還包括擴(kuò)展內(nèi)容“過(guò)濾條件”,那么在進(jìn)行語(yǔ)義匹配時(shí),還要進(jìn) 一步考慮輸入文本的屬性與過(guò)濾條件的匹配情況。S103,如果語(yǔ)義匹配成功,則對(duì)匹配成功的文本內(nèi)容進(jìn)行過(guò)濾處理。對(duì)于在S102中與語(yǔ)義關(guān)鍵詞匹配成功的文本,系統(tǒng)將進(jìn)行過(guò)濾處理。如果在語(yǔ)義 關(guān)鍵詞中包含了 “過(guò)濾行為”,則系統(tǒng)將根據(jù)“過(guò)濾行為”的具體內(nèi)容對(duì)文本進(jìn)行過(guò)濾處理。 如果在語(yǔ)義關(guān)鍵詞中沒(méi)有包含“過(guò)濾行為”,那么系統(tǒng)將根據(jù)預(yù)置的默認(rèn)方式對(duì)文本內(nèi)容進(jìn) 行過(guò)濾處理。實(shí)施例二 現(xiàn)有技術(shù)中,需要在輸入文本中,逐個(gè)查找每個(gè)詞。本實(shí)施例針對(duì)實(shí)施例一中的步 驟S101,提出一種改進(jìn)的基本關(guān)鍵詞查找方法,以提高關(guān)鍵詞查找的處理效率。
在實(shí)際的文本過(guò)濾應(yīng)用中,很多需要過(guò)濾的詞都是具有相同部分的,例如“竊聽 器”、“竊聽設(shè)備”、“竊聽軟件”等等,對(duì)于這類詞,可以采用樹形查找的方法,提高查找效率。首先,在系統(tǒng)中以字符為單位,按照樹形結(jié)構(gòu)存儲(chǔ)每個(gè)基本關(guān)鍵詞。以基本關(guān)鍵詞 的首字符為根節(jié)點(diǎn)、末字符為葉子節(jié)點(diǎn),具有相同首字符的基本關(guān)鍵詞共用同一個(gè)根節(jié)點(diǎn)。 例如,對(duì)于“ab”、“abC”、“ade”三個(gè)基本關(guān)鍵詞,可以按照如圖2所示的結(jié)構(gòu)進(jìn)行存儲(chǔ)。在圖2中,圓形表示根節(jié)點(diǎn)或一般節(jié)點(diǎn),菱形表示葉子節(jié)點(diǎn),由于“ab”、“abC”、 “ade”三個(gè)詞具有相同的首字符“a”,因此共用同一個(gè)根節(jié)點(diǎn)1 ;三個(gè)詞的末字符分別為 “b”、“c”、“e”,因此這三個(gè)字符分別為葉子節(jié)點(diǎn)2、3、5。需要注意的是,對(duì)于字符“b”,盡管 在第二個(gè)詞中不是末字符,但是其在第一個(gè)詞中是末字符,因此仍然成為葉子節(jié)點(diǎn)。也就是 說(shuō),葉子節(jié)點(diǎn)不一定是樹形結(jié)構(gòu)的末端節(jié)點(diǎn),但是樹形結(jié)構(gòu)的末端節(jié)點(diǎn)一定是葉子節(jié)點(diǎn)。圖3所示為基于樹形結(jié)構(gòu)的基本關(guān)鍵詞查找方法流程圖,包括以下步驟S301,獲取所述輸入文本中的一個(gè)字符;設(shè)置該字符為當(dāng)前字符、并且設(shè)置樹形結(jié) 構(gòu)的根節(jié)點(diǎn)為當(dāng)前節(jié)點(diǎn)。根據(jù)實(shí)際的過(guò)濾應(yīng)用需求,所獲取的字符可以是輸入文本的首字 符,也可以是從輸入文本的任意處選取的一個(gè)字符。S302,將當(dāng)前字符與當(dāng)前節(jié)點(diǎn)進(jìn)行匹配;如果匹配成功,則執(zhí)行S303,否則,執(zhí)行 S304。S303,判斷當(dāng)前節(jié)點(diǎn)是否具有子節(jié)點(diǎn),如果否,則結(jié)束查找;如果是,則轉(zhuǎn)到當(dāng)前字 符的后一字符、當(dāng)前節(jié)點(diǎn)的子節(jié)點(diǎn),然后執(zhí)行S302。S304,判斷當(dāng)前節(jié)點(diǎn)是否具有兄弟節(jié)點(diǎn),如果否,則結(jié)束查找;如果是,則保持當(dāng)前 字符不變、轉(zhuǎn)到當(dāng)前節(jié)點(diǎn)的兄弟節(jié)點(diǎn),然后執(zhí)行S302。結(jié)束查找后,系統(tǒng)連接當(dāng)前節(jié)點(diǎn)與根節(jié)點(diǎn)得到匹配路徑,并根據(jù)匹配路徑上的匹 配成功的葉子節(jié)點(diǎn)確定所查找到的基本關(guān)鍵詞。以下結(jié)合兩個(gè)具體的例子,對(duì)基于樹形結(jié)構(gòu)的基本關(guān)鍵詞查找方法進(jìn)行說(shuō)明1)假設(shè)輸入文本為adf,系統(tǒng)獲得字符“a”后,遍歷關(guān)鍵詞庫(kù)中的根節(jié)點(diǎn),發(fā)現(xiàn)與 節(jié)點(diǎn)1匹配成功,并且節(jié)點(diǎn)1具有子節(jié)點(diǎn),則進(jìn)一步將字符“d”與節(jié)點(diǎn)1的子節(jié)點(diǎn)2、4匹配。字符“d”與節(jié)點(diǎn)4匹配成功,并且節(jié)點(diǎn)4具有子節(jié)點(diǎn),則進(jìn)一步將字符“f”與節(jié)點(diǎn) 4的子節(jié)點(diǎn)5匹配,字符“f”與節(jié)點(diǎn)5匹配失敗,并且節(jié)點(diǎn)5沒(méi)有其他的兄弟節(jié)點(diǎn),此時(shí)結(jié)束查找。當(dāng) 前的匹配路徑為1-4-5,在路徑中沒(méi)有包含匹配成功的葉子節(jié)點(diǎn),因此,可以確定在輸入文 本中沒(méi)有查到基本關(guān)鍵詞。2)假設(shè)輸入文本為abc,系統(tǒng)獲得字符“a”后,遍歷關(guān)鍵詞庫(kù)中的根節(jié)點(diǎn),發(fā)現(xiàn)與 節(jié)點(diǎn)1匹配成功,并且節(jié)點(diǎn)1具有子節(jié)點(diǎn),則進(jìn)一步將字符“b”與節(jié)點(diǎn)1的子節(jié)點(diǎn)2、4匹配。字符“b”與節(jié)點(diǎn)2匹配成功,并且節(jié)點(diǎn)2具有子節(jié)點(diǎn),則進(jìn)一步將字符“C”與節(jié)點(diǎn) 2的子節(jié)點(diǎn)3匹配,字符“C”與節(jié)點(diǎn)4匹配成功,并且節(jié)點(diǎn)3沒(méi)有子節(jié)點(diǎn),此時(shí)結(jié)束查找。當(dāng)前的匹配 路徑為1-2-3,其中,節(jié)點(diǎn)2和3均為匹配成功的葉子節(jié)點(diǎn),因此,可以根據(jù)節(jié)點(diǎn)2和3的內(nèi) 容,確定在輸入文本中查找到了基本關(guān)鍵詞“ab”和“abc”??梢?jiàn),應(yīng)用上述基于樹形結(jié)構(gòu)的基本關(guān)鍵詞查找方法,每一級(jí)的匹配操作都是僅 針對(duì)上一次匹配成功的節(jié)點(diǎn)來(lái)進(jìn)行,這樣,就不需要針對(duì)輸入文本的每個(gè)字符與全部的關(guān)鍵詞字符進(jìn)行逐一匹配,從而有效地提高關(guān)鍵詞查找的處理效率。在上述例子中,是以首字符為根節(jié)點(diǎn)進(jìn)行說(shuō)明,這種方法適用于多個(gè)基本關(guān)鍵詞 具有相同前綴的情況。可以理解的是,針對(duì)多個(gè)基本關(guān)鍵詞具有相同后綴的情況,例如“電 話竊聽”、“手機(jī)竊聽”、“手機(jī)監(jiān)聽”等,也可以以基本關(guān)鍵詞的末字符為根節(jié)點(diǎn)、首字符為葉 子節(jié)點(diǎn)的樹形結(jié)構(gòu)存儲(chǔ)關(guān)鍵詞。相應(yīng)地,在匹配過(guò)程中,應(yīng)按照從后向前的順序?qū)斎胛谋?的字符進(jìn)行匹配,具體的方法實(shí)現(xiàn)與前述類似,這里不再重復(fù)說(shuō)明。此外,為了逃避文本過(guò)濾,現(xiàn)在已經(jīng)有很多人會(huì)在發(fā)布的文本中使用特殊字符,例 如“竊-聽-器”、“竊聽器”等等,對(duì)于這種情況,可以進(jìn)一步結(jié)合字典功能來(lái)查找關(guān)鍵詞。字典定義了一組字符集合,并且定義了字符的原型,原型可以是字符本身,例如如 字符‘a(chǎn)’的原型就是‘a(chǎn)’本身,也可以是另外一個(gè)字符,例如繁體字符的原型是對(duì)應(yīng)的簡(jiǎn)體 中文。常用的字典包括簡(jiǎn)體字典、繁體字典、英文字典、數(shù)字字典等等。此外,業(yè)務(wù)人員還 可以實(shí)際的需求,自行定義字典,例如,將字符“_”的原型定義為空字符。根據(jù)前述的步驟S302,系統(tǒng)可以在將當(dāng)前字符與當(dāng)前節(jié)點(diǎn)進(jìn)行匹配之前,在字典 中查找所述當(dāng)前字符是否具有原型字符;如果是,則將其轉(zhuǎn)換為相應(yīng)的原型字符,并以所述 原型字符為當(dāng)前字符,與所述當(dāng)前節(jié)點(diǎn)進(jìn)行匹配。以本實(shí)施例前述的例2)進(jìn)行說(shuō)明,假如輸入文本為aBc,則系統(tǒng)在將字符“B”與節(jié) 點(diǎn)2進(jìn)行匹配之前,通過(guò)遍歷所有字典,發(fā)現(xiàn)字符“B”具有原型“b”,則將原輸入文本中的 “B”轉(zhuǎn)換為原型“b”,然后以“b”為當(dāng)前字符與節(jié)點(diǎn)2進(jìn)行匹配。對(duì)于“竊-聽-器”這類文本,系統(tǒng)通過(guò)查詢字典,會(huì)將字符“_”轉(zhuǎn)為空字符。在 匹配過(guò)程中,當(dāng)系統(tǒng)匹配到“竊”之后,將跳過(guò)空字符直接與“聽”進(jìn)行匹配??梢?jiàn),通過(guò)查詢字典以及轉(zhuǎn)換字符,可以讓系統(tǒng)識(shí)別出更多的不良信息,從而實(shí)現(xiàn) 更好的文本過(guò)濾效果。相應(yīng)于上面的方法實(shí)施例,本申請(qǐng)還提供一種文本過(guò)濾系統(tǒng),參見(jiàn)圖4所示,包 括關(guān)鍵詞存儲(chǔ)單元410,用于存儲(chǔ)預(yù)先定義的語(yǔ)義關(guān)鍵詞,所述語(yǔ)義關(guān)鍵詞,至少由 基本關(guān)鍵詞和邏輯關(guān)系符構(gòu)成;基本查找單元420,用于在所述文本過(guò)濾系統(tǒng)獲得輸入文本后,根據(jù)預(yù)先定義的語(yǔ) 義關(guān)鍵詞,在所述輸入文本中查找構(gòu)成所述語(yǔ)義關(guān)鍵詞的基本關(guān)鍵詞;語(yǔ)義匹配單元430,用于在所述基本查找單元420在所述輸入文本中查找到與至 少一個(gè)所述基本關(guān)鍵詞相匹配的文本內(nèi)容時(shí),進(jìn)一步對(duì)查找到的文本內(nèi)容進(jìn)行語(yǔ)義匹配; 所述語(yǔ)義匹配單元430包括用于根據(jù)構(gòu)成所述語(yǔ)義關(guān)鍵詞的邏輯關(guān)系符,將所查找到的 文本內(nèi)容與所述語(yǔ)義關(guān)鍵詞進(jìn)行匹配的邏輯匹配子單元431 ;過(guò)濾處理單元440,用于在所述語(yǔ)義匹配單元430匹配成功時(shí),對(duì)匹配成功的文本 內(nèi)容進(jìn)行過(guò)濾處理。其中,所述關(guān)鍵詞存儲(chǔ)單元,以字符為單位,按照樹形結(jié)構(gòu)存儲(chǔ)所述基本關(guān)鍵詞; 其中,基本關(guān)鍵詞的首字符為根節(jié)點(diǎn)、末字符為葉子節(jié)點(diǎn),具有相同首字符的基本關(guān)鍵詞共 用同一個(gè)根節(jié)點(diǎn);參見(jiàn)圖5所示,所述基本查找單元420,可以包括文本獲取子單元421,用于獲取所述輸入文本中的一個(gè)字符Cl ;
字符匹配子單元422,用于以Cl為當(dāng)前字符、所述樹形結(jié)構(gòu)的根節(jié)點(diǎn)為當(dāng)前節(jié)點(diǎn), 將當(dāng)前字符與當(dāng)前節(jié)點(diǎn)進(jìn)行匹配;如果當(dāng)前字符與當(dāng)前節(jié)點(diǎn)匹配成功,且當(dāng)前節(jié)點(diǎn)具有子節(jié)點(diǎn),則將當(dāng)前字符的后 一字符,與當(dāng)前節(jié)點(diǎn)的子節(jié)點(diǎn)進(jìn)行匹配;如果當(dāng)前字符與當(dāng)前節(jié)點(diǎn)匹配失敗,且當(dāng)前節(jié)點(diǎn)具 有兄弟節(jié)點(diǎn),則將當(dāng)前字符與當(dāng)前節(jié)點(diǎn)的兄弟節(jié)點(diǎn)進(jìn)行匹配;重復(fù)本步驟;確定子單元423,用于連接當(dāng)前節(jié)點(diǎn)與根節(jié)點(diǎn)得到匹配路徑,并根據(jù)所述匹配路徑 上匹配成功的葉子節(jié)點(diǎn)確定所查找到的基本關(guān)鍵詞;參見(jiàn)圖6所示,所述基本查找單元420,還可以包括字符轉(zhuǎn)換子單元424,用于在所述字符匹配子單元422進(jìn)行匹配之前,在字典中查 找所述當(dāng)前字符是否具有原型字符,如果是,則將其轉(zhuǎn)換為相應(yīng)的原型字符;則所述字符匹配子單元423,以所述原型字符為當(dāng)前字符,與所述當(dāng)前節(jié)點(diǎn)進(jìn)行匹 配。所述語(yǔ)義關(guān)鍵詞的構(gòu)成還可以包括過(guò)濾條件;則所述語(yǔ)義匹配單元430還包括用于將所述輸入文本的屬性與所述過(guò)濾條件進(jìn) 行匹配的類別匹配子單元432,如圖7所示。所述語(yǔ)義關(guān)鍵詞的構(gòu)成還可以包括過(guò)濾行為;則所述過(guò)濾處理單元,用于根據(jù)所述過(guò)濾行為,對(duì)所查找到的文本內(nèi)容進(jìn)行過(guò)濾處理。為了描述的方便,描述以上系統(tǒng)時(shí)以功能分為各種單元分別描述。當(dāng)然,在實(shí)施本 申請(qǐng)時(shí)可以把各單元的功能在同一個(gè)或多個(gè)軟件和/或硬件中實(shí)現(xiàn)。通過(guò)以上的實(shí)施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本申請(qǐng)可 借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn)?;谶@樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì) 上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品 可以存儲(chǔ)在存儲(chǔ)介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備 (可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例或者實(shí)施例的某些 部分所述的方法。本說(shuō)明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部 分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)實(shí) 施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例 的部分說(shuō)明即可。以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說(shuō)明 的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是 物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要 選擇其中的部分或者全部模塊來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出 創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。本申請(qǐng)可用于眾多通用或?qū)S玫挠?jì)算系統(tǒng)環(huán)境或配置中。例如個(gè)人計(jì)算機(jī)、服務(wù) 器計(jì)算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂 盒、可編程的消費(fèi)電子設(shè)備、網(wǎng)絡(luò)PC、小型計(jì)算機(jī)、大型計(jì)算機(jī)、包括以上任何系統(tǒng)或設(shè)備的 分布式計(jì)算環(huán)境等等。本申請(qǐng)可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組 件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本申請(qǐng),在這些分布式計(jì)算環(huán)境中,由 通過(guò)通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來(lái)執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊可以 位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。 以上所述僅是本申請(qǐng)的具體實(shí)施方式
,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人 員來(lái)說(shuō),在不脫離本申請(qǐng)?jiān)淼那疤嵯?,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng) 視為本申請(qǐng)的保護(hù)范圍。
權(quán)利要求
1.一種文本過(guò)濾方法,其特征在于,包括預(yù)先在文本過(guò)濾系統(tǒng)中定義語(yǔ)義關(guān)鍵詞,所述語(yǔ)義關(guān)鍵詞,至少由基本關(guān)鍵詞和邏輯 關(guān)系符構(gòu)成;所述文本過(guò)濾系統(tǒng)獲得輸入文本后,根據(jù)預(yù)先定義的語(yǔ)義關(guān)鍵詞,在所述輸入文本中 查找構(gòu)成所述語(yǔ)義關(guān)鍵詞的基本關(guān)鍵詞;如果在所述輸入文本中查找到與至少一個(gè)所述基本關(guān)鍵詞相匹配的文本內(nèi)容,則進(jìn)一 步對(duì)查找到的文本內(nèi)容進(jìn)行語(yǔ)義匹配;所述語(yǔ)義匹配包括根據(jù)構(gòu)成所述語(yǔ)義關(guān)鍵詞的邏 輯關(guān)系符,將所查找到的文本內(nèi)容與所述語(yǔ)義關(guān)鍵詞進(jìn)行匹配;如果所述語(yǔ)義匹配成功,則對(duì)匹配成功的文本內(nèi)容進(jìn)行過(guò)濾處理。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基本關(guān)鍵詞,以字符為單位,按照樹形結(jié)構(gòu)存儲(chǔ)于文本過(guò)濾系統(tǒng)中;其中,基本關(guān) 鍵詞的首字符為根節(jié)點(diǎn)、末字符為葉子節(jié)點(diǎn),具有相同首字符的基本關(guān)鍵詞共用同一個(gè)根 節(jié)占.I— /、、、 所述在輸入文本中查找構(gòu)成所述語(yǔ)義關(guān)鍵詞的基本關(guān)鍵詞,包括步驟 獲取所述輸入文本中的一個(gè)字符Cl ;以Cl為當(dāng)前字符、以所述樹形結(jié)構(gòu)的根節(jié)點(diǎn)為當(dāng)前節(jié)點(diǎn),將當(dāng)前字符與當(dāng)前節(jié)點(diǎn)進(jìn)行 匹配;如果當(dāng)前字符與當(dāng)前節(jié)點(diǎn)匹配成功,且當(dāng)前節(jié)點(diǎn)具有子節(jié)點(diǎn),則將當(dāng)前字符的后一字 符,與當(dāng)前節(jié)點(diǎn)的子節(jié)點(diǎn)進(jìn)行匹配;如果當(dāng)前字符與當(dāng)前節(jié)點(diǎn)匹配失敗,且當(dāng)前節(jié)點(diǎn)具有兄 弟節(jié)點(diǎn),則將當(dāng)前字符與當(dāng)前節(jié)點(diǎn)的兄弟節(jié)點(diǎn)進(jìn)行匹配;重復(fù)本步驟;連接當(dāng)前節(jié)點(diǎn)與根節(jié)點(diǎn)得到匹配路徑,并根據(jù)所述匹配路徑上匹配成功的葉子節(jié)點(diǎn)確 定所查找到的基本關(guān)鍵詞。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在將當(dāng)前字符與當(dāng)前節(jié)點(diǎn)進(jìn)行匹配之前, 還包括在字典中查找所述當(dāng)前字符是否具有原型字符;如果是,則將其轉(zhuǎn)換為相應(yīng)的原型字符,并以所述原型字符為當(dāng)前字符,與所述當(dāng)前節(jié) 點(diǎn)進(jìn)行匹配。
4.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于, 所述語(yǔ)義關(guān)鍵詞的構(gòu)成還包括過(guò)濾條件;則所述語(yǔ)義匹配還包括將所述輸入文本的屬性與所述過(guò)濾條件進(jìn)行匹配。
5.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于, 所述語(yǔ)義關(guān)鍵詞的構(gòu)成還包括過(guò)濾行為;則所述對(duì)所查找到的文本內(nèi)容進(jìn)行過(guò)濾處理,包括根據(jù)所述過(guò)濾行為,對(duì)所查找到的 文本內(nèi)容進(jìn)行過(guò)濾處理。
6.一種文本過(guò)濾系統(tǒng),其特征在于,包括關(guān)鍵詞存儲(chǔ)單元,用于存儲(chǔ)預(yù)先定義的語(yǔ)義關(guān)鍵詞,所述語(yǔ)義關(guān)鍵詞,至少由基本關(guān)鍵 詞和邏輯關(guān)系符構(gòu)成;基本查找單元,用于在所述文本過(guò)濾系統(tǒng)獲得輸入文本后,根據(jù)預(yù)先定義的語(yǔ)義關(guān)鍵 詞,在所述輸入文本中查找構(gòu)成所述語(yǔ)義關(guān)鍵詞的基本關(guān)鍵詞;語(yǔ)義匹配單元,用于在所述基本查找單元在所述輸入文本中查找到與至少一個(gè)所述基 本關(guān)鍵詞相匹配的文本內(nèi)容時(shí),進(jìn)一步對(duì)查找到的文本內(nèi)容進(jìn)行語(yǔ)義匹配;所述語(yǔ)義匹配 單元包括用于根據(jù)構(gòu)成所述語(yǔ)義關(guān)鍵詞的邏輯關(guān)系符,將所查找到的文本內(nèi)容與所述語(yǔ) 義關(guān)鍵詞進(jìn)行匹配的邏輯匹配子單元;過(guò)濾處理單元,用于在所述語(yǔ)義匹配單元匹配成功時(shí),對(duì)匹配成功的文本內(nèi)容進(jìn)行過(guò) 濾處理。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述關(guān)鍵詞存儲(chǔ)單元,以字符為單位,按照樹形結(jié)構(gòu)存儲(chǔ)所述基本關(guān)鍵詞;其中,基本 關(guān)鍵詞的首字符為根節(jié)點(diǎn)、末字符為葉子節(jié)點(diǎn),具有相同首字符的基本關(guān)鍵詞共用同一個(gè) 根節(jié)點(diǎn);所述基本查找單元,包括文本獲取子單元,用于獲取所述輸入文本中的一個(gè)字符cl ;字符匹配子單元,用于以cl為當(dāng)前字符、以所述樹形結(jié)構(gòu)的根節(jié)點(diǎn)為當(dāng)前節(jié)點(diǎn),將當(dāng) 前字符與當(dāng)前節(jié)點(diǎn)進(jìn)行匹配;如果當(dāng)前字符與當(dāng)前節(jié)點(diǎn)匹配成功,且當(dāng)前節(jié)點(diǎn)具有子節(jié)點(diǎn),則將當(dāng)前字符的后一字 符,與當(dāng)前節(jié)點(diǎn)的子節(jié)點(diǎn)進(jìn)行匹配;如果當(dāng)前字符與當(dāng)前節(jié)點(diǎn)匹配失敗,且當(dāng)前節(jié)點(diǎn)具有兄 弟節(jié)點(diǎn),則將當(dāng)前字符與當(dāng)前節(jié)點(diǎn)的兄弟節(jié)點(diǎn)進(jìn)行匹配;重復(fù)本步驟;確定子單元,用于連接當(dāng)前節(jié)點(diǎn)與根節(jié)點(diǎn)得到匹配路徑,并根據(jù)所述匹配路徑上匹配 成功的葉子節(jié)點(diǎn)確定所查找到的基本關(guān)鍵詞。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述基本查找單元,還包括字符轉(zhuǎn)換子單元,用于在所述字符匹配子單元進(jìn)行匹配之前,在字典中查找所述當(dāng)前 字符是否具有原型字符,如果是,則將其轉(zhuǎn)換為相應(yīng)的原型字符;則所述字符匹配子單元,以所述原型字符為當(dāng)前字符,與所述當(dāng)前節(jié)點(diǎn)進(jìn)行匹配。
9.根據(jù)權(quán)利要求6至8任一項(xiàng)所述的系統(tǒng),其特征在于, 所述語(yǔ)義關(guān)鍵詞的構(gòu)成還包括過(guò)濾條件;則所述語(yǔ)義匹配單元還包括用于將所述輸入文本的屬性與所述過(guò)濾條件進(jìn)行匹配的 類別匹配子單元。
10.根據(jù)權(quán)利要求6至8任一項(xiàng)所述的系統(tǒng),其特征在于, 所述語(yǔ)義關(guān)鍵詞的構(gòu)成還包括過(guò)濾行為;則所述過(guò)濾處理單元,用于根據(jù)所述過(guò)濾行為,對(duì)所查找到的文本內(nèi)容進(jìn)行過(guò)濾處理。
全文摘要
本申請(qǐng)公開了一種文本過(guò)濾方法及文本過(guò)濾系統(tǒng)。一種文本過(guò)濾方法包括預(yù)先在文本過(guò)濾系統(tǒng)中定義語(yǔ)義關(guān)鍵詞,所述語(yǔ)義關(guān)鍵詞,至少由基本關(guān)鍵詞和邏輯關(guān)系符構(gòu)成;所述文本過(guò)濾系統(tǒng)獲得輸入文本后,根據(jù)預(yù)先定義的語(yǔ)義關(guān)鍵詞,在所述輸入文本中查找構(gòu)成所述語(yǔ)義關(guān)鍵詞的基本關(guān)鍵詞;如果在所述輸入文本中查找到與至少一個(gè)所述基本關(guān)鍵詞相匹配的文本內(nèi)容,則進(jìn)一步對(duì)查找到的文本內(nèi)容進(jìn)行語(yǔ)義匹配;所述語(yǔ)義匹配包括根據(jù)構(gòu)成所述語(yǔ)義關(guān)鍵詞的邏輯關(guān)系符,將所查找到的文本內(nèi)容與所述語(yǔ)義關(guān)鍵詞進(jìn)行匹配;如果所述語(yǔ)義匹配成功,則對(duì)匹配成功的文本內(nèi)容進(jìn)行過(guò)濾處理。
文檔編號(hào)G06F17/30GK102053993SQ20091021171
公開日2011年5月11日 申請(qǐng)日期2009年11月10日 優(yōu)先權(quán)日2009年11月10日
發(fā)明者葉長(zhǎng)程, 溫新賜 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1