專利名稱:一種用于社區(qū)網(wǎng)絡(luò)中檢測垃圾帖子的方法與設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體來說,涉及一種基于計算機網(wǎng)絡(luò)的社區(qū)網(wǎng)絡(luò)中檢測垃圾帖子的方法及設(shè)備
背景技術(shù):
社區(qū)網(wǎng)絡(luò)服務(wù)是由網(wǎng)絡(luò)服務(wù)提供商建立在線社區(qū),其通常是基于互聯(lián)網(wǎng),為一群擁有相同興趣與活動的用戶提供各種基于網(wǎng)絡(luò)的交互式服務(wù),包括但不限于電子郵件、即時通信聊天、影音、文件的動態(tài)信息分享、博客、微博、貼吧、討論組群等。用戶可在社區(qū)網(wǎng)絡(luò)中進行交互,例如一名用戶在與某一主題有關(guān)的特定板塊發(fā)帖子展示給訪問該特定板塊的其他用戶,其他用戶可在訪問該社區(qū)網(wǎng)絡(luò)特定板塊時瀏覽該帖子,并在該帖子下以跟帖方式發(fā)表看法或評論。由于訪問社區(qū)網(wǎng)絡(luò)的用戶類型混雜,其所發(fā)帖子可能包含違法、不道德內(nèi)容,或者用作推銷、廣告之用影響他人瀏覽正常帖子,現(xiàn)有技術(shù)中,社區(qū)網(wǎng)絡(luò)網(wǎng)站一般通過人工或機器方式對于用戶所發(fā)帖子的內(nèi)容進行審核,其主要通過檢查其所含內(nèi)容中是否包含特定詞匯,例如違法或不道德詞匯、明顯廣告內(nèi)容。但這種審核方式對于一些不明顯包含上述特定詞匯的帖子較難奏效,以下簡稱 “隱蔽性垃圾帖子”例如,該帖子中不包含明顯廣告內(nèi)容,僅以軟文方式介紹某一產(chǎn)品;或者,該帖子中不包含違法或不道德詞匯,但在社區(qū)網(wǎng)絡(luò)的不同板塊中大量重復(fù),影響用戶的正常瀏覽,甚至占用網(wǎng)站服務(wù)器的處理容量。因此,需要提供一種技術(shù)方案來識別該類隱蔽性垃圾帖子。
發(fā)明內(nèi)容
本發(fā)明的目的是為克服現(xiàn)有技術(shù)的上述缺陷,提供一種社區(qū)網(wǎng)絡(luò)中檢測垃圾帖子的方法及設(shè)備。根據(jù)本發(fā)明的第一方面,提供了一種用于檢測社區(qū)網(wǎng)絡(luò)中垃圾帖子的方法,其中, 包括a.根據(jù)發(fā)帖用戶的發(fā)帖行為特征來判斷其所發(fā)帖子是否為垃圾帖子。在一個優(yōu)選實施例中,所述步驟a包括al.獲取該帖子的發(fā)帖用戶的發(fā)帖行為特征;a2.基于第一預(yù)定規(guī)則根據(jù)所述發(fā)帖用戶的發(fā)帖行為特征判斷該帖子是否為垃圾帖子。在另一個優(yōu)選實施例中,所述步驟a包括al’ .獲取所述帖子中的內(nèi)容關(guān)鍵信息;a2'.根據(jù)所述內(nèi)容關(guān)鍵信息來獲取該發(fā)帖用戶與該帖子有關(guān)的發(fā)帖行為特征;a3'.根據(jù)發(fā)帖用戶與該帖子有關(guān)的發(fā)帖行為特征來判斷所述帖子是否為垃圾帖子。
根據(jù)本發(fā)明的第二方面,提供了一種用于檢測社區(qū)網(wǎng)絡(luò)中垃圾帖子的設(shè)備,其中, 包括帖子檢測裝置,用于根據(jù)發(fā)帖用戶的發(fā)帖行為特征來判斷其所發(fā)帖子是否為垃圾帖子。在另一個優(yōu)選實施例中,所述帖子檢測裝置包括第一獲取裝置,用于獲取該帖子的發(fā)帖用戶的發(fā)帖行為特征;判斷裝置,用于基于第一預(yù)定規(guī)則根據(jù)所述發(fā)帖用戶的發(fā)帖行為特征判斷該帖子是否為垃圾帖子。在另一個優(yōu)選實施例中,所述帖子檢測裝置包括提取裝置,用于獲取所述帖子中的內(nèi)容關(guān)鍵信息;第一獲取裝置,用于根據(jù)所述內(nèi)容關(guān)鍵信息來獲取該發(fā)帖用戶與該帖子有關(guān)的發(fā)帖行為特征;判斷裝置,用于根據(jù)發(fā)帖用戶與該帖子有關(guān)的發(fā)帖行為特征來判斷所述帖子是否為垃圾帖子。與現(xiàn)有技術(shù)相比,本發(fā)明通過對在社區(qū)網(wǎng)絡(luò)中發(fā)帖子的用戶的發(fā)帖行為特征進行檢測,并優(yōu)選地結(jié)合帖子的外部特征和語義分析可以更準確地判斷垃圾帖子。
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯圖1為根據(jù)本發(fā)明的社區(qū)網(wǎng)絡(luò)的網(wǎng)絡(luò)拓撲圖;圖2為根據(jù)本發(fā)明一個方面的在社區(qū)網(wǎng)絡(luò)中檢測垃圾帖子的方法流程圖;圖3為根據(jù)本發(fā)明一個優(yōu)選實施例的在社區(qū)網(wǎng)絡(luò)中檢測垃圾帖子的方法流程圖;圖4為根據(jù)本發(fā)明一個方面的在社區(qū)網(wǎng)絡(luò)中檢測垃圾帖子的設(shè)備框圖;圖5為根據(jù)本發(fā)明一個優(yōu)選實施例的在社區(qū)網(wǎng)絡(luò)中檢測垃圾帖子的設(shè)備框圖。附圖中相同或相似的附圖標記代表相同或相似的部件。
具體實施例方式下面結(jié)合附圖對本發(fā)明作進一步詳細描述。圖1示出一個根據(jù)本發(fā)明的社區(qū)網(wǎng)絡(luò)的拓撲圖,其中包含一個網(wǎng)絡(luò)設(shè)備和多名用戶a_f,每名用戶通過各自的用戶終端經(jīng)由網(wǎng)絡(luò)訪問一個社區(qū)網(wǎng)絡(luò)服務(wù)網(wǎng)站(SNS),其包含一個或多個網(wǎng)絡(luò)設(shè)備,用于提供該社區(qū)網(wǎng)絡(luò)服務(wù),該網(wǎng)絡(luò)設(shè)備包括但不限于,網(wǎng)絡(luò)服務(wù)器、 網(wǎng)絡(luò)主機或者、云計算模式下的其他用戶設(shè)備等。用戶終端包括但不限于,計算機、智能手機、PDA、游戲機或IPTV等任何具有上網(wǎng)瀏覽功能的設(shè)備。而根據(jù)本發(fā)明的用于檢測垃圾帖子的設(shè)備可以是與網(wǎng)絡(luò)設(shè)備通過網(wǎng)絡(luò)進行通信連接的獨立的設(shè)備,包括但不限于普通計算機、服務(wù)器、主機等;也可以是與網(wǎng)絡(luò)設(shè)備成一體,為簡明起見,以下統(tǒng)稱網(wǎng)絡(luò)設(shè)備。
此外,用戶終端與網(wǎng)絡(luò)設(shè)備之間的通信可以是基于諸如TCP/IP協(xié)議、UDP協(xié)議等的分組數(shù)據(jù)傳輸。而網(wǎng)絡(luò)設(shè)備2與用于檢測帖子的設(shè)備之間的通信可以是基于上述TCP/IP 協(xié)議、UDP協(xié)議等的分組數(shù)據(jù)傳輸,也可是在網(wǎng)絡(luò)設(shè)備內(nèi)部基于各種計算機總線協(xié)議的信號傳輸。但本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明不限于上述通信傳輸協(xié)議,任何已有或今后可能出現(xiàn)的外部通信協(xié)議或內(nèi)部計算機總線協(xié)議均適用于本發(fā)明,從而被引用而包含于此。當其中一名用戶,例如用戶a在訪問社區(qū)網(wǎng)絡(luò)時,通過其用戶終端1發(fā)出交互請求,例如在該社區(qū)網(wǎng)絡(luò)特定板塊進行發(fā)帖,網(wǎng)絡(luò)設(shè)備2對該用戶a所發(fā)帖子審核通過后,將其保存并提供給訪問該社區(qū)網(wǎng)絡(luò)特定板塊的用戶進行展示。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明的社區(qū)網(wǎng)絡(luò)不限上述形式,可以包括諸如基于P2P 形式的用戶終端之間直接連接進行交互的其他形式。下面參照圖2-5來對根據(jù)本發(fā)明的識別垃圾帖子的技術(shù)方案進行詳細描述。圖2為根據(jù)本發(fā)明一個方面的在社區(qū)網(wǎng)絡(luò)中檢測垃圾帖子的方法流程圖。為簡明起見,圖2中僅示出一名候選用戶及其用戶終端。如圖2所示,在步驟Si,用戶a經(jīng)由用戶終端1訪問社區(qū)網(wǎng)絡(luò)網(wǎng)站并登陸其特定板塊(以下簡稱“貼吧)時,例如“軍事論壇”貼吧,通過人機交互的方式,利用用戶終端1 向網(wǎng)絡(luò)設(shè)備發(fā)送帖子。在此雖然以“網(wǎng)絡(luò)設(shè)備”為例來闡述本發(fā)明,但本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明還可適用于基于P2P模式或云計算方式的用戶終端直接互連社區(qū)網(wǎng)絡(luò)模式,其中,每一或特定的一些用戶終端可起到網(wǎng)絡(luò)設(shè)備的功能,對用戶所發(fā)帖子進行檢測,也應(yīng)包含在本發(fā)明的保護范圍以內(nèi)。具體地,用戶a可通過諸如IE、Firefox等瀏覽器訪問社區(qū)網(wǎng)絡(luò)網(wǎng)頁,也可通過安裝于用戶終端1中的客戶端軟件,諸如QQ等進入該社區(qū)網(wǎng)絡(luò)的“軍事論壇”貼吧網(wǎng)頁。在前一情形中,用戶a可以在該社區(qū)網(wǎng)絡(luò)的“軍事論壇”貼吧網(wǎng)頁上的帖子輸入欄中輸入相應(yīng)的貼子內(nèi)容,然后點擊該網(wǎng)頁上的特定功能按鈕,使得用戶終端1發(fā)送帖子;在后一情形中,用戶a可在客戶端的軟件用戶界面中輸入帖子內(nèi)容并通過點擊該客戶端軟件界面中特定功能按鈕使得用戶終端1發(fā)送該帖子。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明應(yīng)不限于上述方式,任何可適用于本發(fā)明的訪問社區(qū)網(wǎng)絡(luò)以及發(fā)帖的方式均應(yīng)在本發(fā)明的保護范圍以內(nèi), 并以引用方式包含于此。隨后,在步驟S2,網(wǎng)絡(luò)設(shè)備2基于發(fā)帖用戶的發(fā)帖行為特征對其所發(fā)帖子進行檢測,判斷該帖子是否為垃圾帖子。具體地,本發(fā)明認識到對于許多隱性垃圾帖子,雖然其并未包含明顯違法或不道德或廣告特征的垃圾內(nèi)容,但其發(fā)帖人出于其不正當?shù)陌l(fā)帖目的,會在社區(qū)網(wǎng)絡(luò)的一個或多個板塊(例如多個貼吧,為統(tǒng)一起見,以下簡稱“貼吧”)中大量發(fā)放帖子,甚至采用機器發(fā)貼方式。因此,利用發(fā)帖人的發(fā)帖頻率或其所發(fā)貼吧數(shù)目等發(fā)帖行為特征可以準確地檢測出此類隱性垃圾帖子。具體地,在步驟S21中,網(wǎng)絡(luò)設(shè)備2在接收到發(fā)帖的用戶(以下簡稱“發(fā)帖人”)所發(fā)帖子后,將提取發(fā)帖人的諸如登錄社區(qū)網(wǎng)絡(luò)的ID或其IP地址等標識信息,隨后基于發(fā)帖人的標識信息查詢該發(fā)帖用戶的與該帖子相關(guān)的發(fā)帖行為特征,該發(fā)帖行為特征包括但不限于,該發(fā)帖人的發(fā)帖頻率、發(fā)帖所在貼吧的個數(shù)。 在步驟S21中,網(wǎng)絡(luò)設(shè)備2可以通過各種方式來獲取發(fā)帖人的發(fā)帖行為特征,包括但不限于以下方式1)網(wǎng)絡(luò)設(shè)備2向發(fā)帖人的用戶終端發(fā)送請求獲取其cookie信息的請求消息,并根據(jù)該用戶終端相應(yīng)請求消息提供的cookie信息來獲得該發(fā)帖人近期的發(fā)帖歷史記錄,從而獲取其發(fā)帖行為特征;2)網(wǎng)絡(luò)設(shè)備2根據(jù)該發(fā)帖人的標識信息在整個社區(qū)網(wǎng)絡(luò)中,或在本社區(qū)網(wǎng)絡(luò)以及其他社區(qū)網(wǎng)絡(luò)中,查詢該發(fā)帖人的發(fā)帖行為特征;3)更優(yōu)選地,網(wǎng)絡(luò)設(shè)備可建立并管理一個包含大量發(fā)帖人的發(fā)帖行為特征的發(fā)帖行為特征庫中查詢該發(fā)帖人的發(fā)帖行為特征,并根據(jù)其此次發(fā)帖行為來為其在該發(fā)帖新聞表征庫中建立或更新發(fā)帖行為特征,其中該發(fā)帖行為特征庫包括各種類型的數(shù)據(jù)庫,其在硬件上可以包含在網(wǎng)絡(luò)設(shè)備中,也可是獨立于網(wǎng)絡(luò)設(shè)備并通過網(wǎng)絡(luò)鏈路與之建立通信連接。本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明并不限于上述幾種發(fā)帖行為特征獲取方式,其他的任何可適用于本發(fā)明的發(fā)帖行為特征獲取方式也均應(yīng)包含在本發(fā)明的保護范圍以內(nèi),并以引用方式包含于此。
隨后,在步驟S22中,網(wǎng)絡(luò)設(shè)備2將基于第一預(yù)定規(guī)則來對所獲取的用戶的發(fā)帖行為特征進行判斷,該第一預(yù)定規(guī)則包括但不限于1)將發(fā)帖人的發(fā)帖頻率與第一預(yù)定閾值進行比較,當發(fā)帖人的發(fā)帖頻率高于第一預(yù)定閾值,和/或;2)將發(fā)帖人發(fā)帖所在貼吧個數(shù)與第二預(yù)定閾值進行比較,當其發(fā)帖所在貼吧個數(shù)超出第二預(yù)定閾值,則可判斷其所發(fā)帖子為垃圾帖子。事實上,但發(fā)帖人的發(fā)帖頻率明顯高于人工發(fā)帖頻率,例如15-20次/分鐘, 則可判斷為機器發(fā)貼,則該發(fā)帖人所發(fā)帖子可判斷為垃圾帖子。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明不限上述幾種發(fā)帖行為特征,其他可適用于本發(fā)明的用于判斷發(fā)帖人異常發(fā)帖行為的發(fā)帖行為特征,也均應(yīng)一并包含在本發(fā)明的保護范圍中。最后,在步驟S3,網(wǎng)絡(luò)設(shè)備2將根據(jù)步驟S22中的判斷結(jié)果來對該帖子進行處理。 具體地,當判斷該帖子并非垃圾帖子時,可直接放行以在相應(yīng)貼吧上進行展示;而當判斷該帖子為垃圾帖子或疑似垃圾帖子時,處理方式包括但不限于1)通知網(wǎng)站管理人員對疑似垃圾帖子進行人工審核和人工處理;2)為垃圾帖子對應(yīng)的發(fā)帖行為特征設(shè)置較高閾值,但判斷發(fā)帖人的發(fā)帖行為特征超出該閾值,則直接刪帖;2)更優(yōu)選地,為垃圾帖子設(shè)置多個垃圾等級以及與各個垃圾等級對應(yīng)的多級閾值,以三個垃圾等級為例,當判斷發(fā)帖人的發(fā)帖行為特征超出第一級閾值,向其發(fā)送警告通知消息;當判斷發(fā)帖人的發(fā)帖行為特征超出第二級閾值,直接進行刪帖;當判斷發(fā)帖人的發(fā)帖行為特征超出第三級閾值,則不僅刪帖還對發(fā)帖用戶查封其ID或IP地址。本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明并不限于上述幾種帖子處理方式,其他的任何可適用于本發(fā)明的帖子處理方式也均應(yīng)包含在本發(fā)明的保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,在步驟S4 (未示出)中,網(wǎng)絡(luò)設(shè)備2還根據(jù)發(fā)帖人的本次發(fā)帖行為來建立或更新其在該發(fā)帖行為特征庫中的發(fā)帖行為特征。優(yōu)選地,在步驟S5(未示出)中,網(wǎng)絡(luò)設(shè)備2還根據(jù)步驟S2中的判斷結(jié)果以及社區(qū)網(wǎng)站管理員的反饋來調(diào)整上述閾值,包括但不限于1)當出現(xiàn)判斷裝置判斷為垃圾帖子但社區(qū)網(wǎng)站管理員審核后確認非垃圾帖子的情形超出預(yù)定數(shù)目,則按預(yù)定增幅調(diào)高相應(yīng)的閾值;2)當出現(xiàn)判斷裝置判斷為非垃圾帖子但社區(qū)網(wǎng)站管理員審核后確認為垃圾帖子的情形超出預(yù)定數(shù)目,則按預(yù)定增幅調(diào)低相應(yīng)的閾值。需要說明的是,圖2僅僅簡要的示出了一個用戶通過用戶終端向社區(qū)網(wǎng)絡(luò)發(fā)帖子的情形,而實際上,社區(qū)網(wǎng)絡(luò)中可能同時存在多個用戶向向社區(qū)網(wǎng)絡(luò)發(fā)帖子的情況,網(wǎng)絡(luò)設(shè)備針對每一用戶所發(fā)帖子的檢測和處理原理都是一樣的。圖3示出根據(jù)本發(fā)明一個優(yōu)選實施例的在社區(qū)網(wǎng)絡(luò)中檢測垃圾帖子的方法流程圖,其中步驟Si,與圖2中的相應(yīng)步驟Sl相同,為簡明起見,以引用方式包含在此,而不做贅述。
如圖3所示,在步驟S21’中,網(wǎng)絡(luò)設(shè)備2在接收到所發(fā)帖子后對提取其內(nèi)容的關(guān)鍵信息和發(fā)帖人的諸如登錄社區(qū)網(wǎng)絡(luò)的ID或其IP地址等標識信息,并隨后根據(jù)該內(nèi)容的關(guān)鍵信息來查詢發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征,也即,利用所提取的內(nèi)容關(guān)鍵信息來查詢該發(fā)帖人所發(fā)放的帖子中與帖子具有相同或相似關(guān)鍵信息的其他帖子(以下簡稱 “相似帖子”),隨后獲得該發(fā)帖人發(fā)放相似帖子的發(fā)帖行為特征,從而可以更準確地判斷該帖子是否為垃圾帖子,該發(fā)帖行為特征包括但不限于,發(fā)放相似帖子的發(fā)帖頻率、發(fā)放相似帖子的貼吧數(shù)目具體地,網(wǎng)絡(luò)設(shè)備2可以通過各種方式來獲取發(fā)帖人的發(fā)帖行為特征,包括但不限于以下方式1)網(wǎng)絡(luò)設(shè)備2向發(fā)帖人的用戶終端發(fā)送請求獲取其cookie信息的請求消息,并根據(jù)該用戶終端相應(yīng)請求消息提供的cookie信息來獲得該發(fā)帖人近期的發(fā)帖歷史記錄,從而獲取其發(fā)放相似帖子的發(fā)帖行為特征;2)網(wǎng)絡(luò)設(shè)備2根據(jù)該帖子的內(nèi)容關(guān)鍵信息以及發(fā)帖人的標識信息在整個社區(qū)網(wǎng)絡(luò)中,或在本社區(qū)網(wǎng)絡(luò)以及其他社區(qū)網(wǎng)絡(luò)中,查詢該發(fā)帖人與該帖子有關(guān)的的發(fā)帖行為特征;3)更優(yōu)選地,網(wǎng)絡(luò)設(shè)備可建立并管理一個包含大量發(fā)帖人的發(fā)帖行為特征的發(fā)帖行為特征庫中查詢該發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征,并根據(jù)其此次發(fā)帖行為來為其在該發(fā)帖新聞表征庫中建立或更新其與該帖子有關(guān)的發(fā)帖行為特征,其中該發(fā)帖行為特征庫包括各種類型的數(shù)據(jù)庫,其在硬件上可以包含在網(wǎng)絡(luò)設(shè)備中,也可是獨立于網(wǎng)絡(luò)設(shè)備并通過網(wǎng)絡(luò)鏈路與之建立通信連接。本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明并不限于上述幾種發(fā)帖行為特征獲取方式,其他的任何可適用于本發(fā)明的發(fā)帖行為特征獲取方式也均應(yīng)包含在本發(fā)明的保護范圍以內(nèi),并以引用方式包含于此。隨后,在步驟S22’中,網(wǎng)絡(luò)設(shè)備2將根據(jù)第一預(yù)定規(guī)則對所獲取的發(fā)帖人的與該帖子有關(guān)的發(fā)帖行為特征進行判斷。具體地,該第一預(yù)定規(guī)則包括但不限于1)將發(fā)帖人與該帖子有關(guān)的發(fā)帖頻率與第一預(yù)定閾值進行比較,當高于第一預(yù)定閾值;和/或2)將發(fā)帖人將該帖子發(fā)放的貼吧個數(shù)與第二預(yù)定閾值進行比較,當超出第二預(yù)定閾值,則可判斷其所發(fā)帖子為垃圾帖子。事實上,當發(fā)帖人發(fā)放該帖子的發(fā)帖頻率明顯高于人工發(fā)帖頻率, 例如15-20次/分鐘,則可判斷為機器發(fā)貼,則該帖子可判斷為垃圾帖子。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明的第一預(yù)定規(guī)則不限上述幾種方式,其他可適用于本發(fā)明的用于判斷發(fā)帖人異常發(fā)帖行為的判斷規(guī)則,也均應(yīng)一并包含在本發(fā)明的保護范圍中。最后,在步驟S3’,網(wǎng)絡(luò)設(shè)備2將根據(jù)步驟S22’中的判斷結(jié)果來對該帖子進行處理。具體地,當判斷該帖子并非垃圾帖子時,可直接放行以在相應(yīng)貼吧上進行展示;而當判斷該帖子為垃圾帖子或疑似垃圾帖子時,處理方式包括但不限于1)通知網(wǎng)站管理人員對疑似垃圾帖子進行人工審核和人工處理;2)為垃圾帖子對應(yīng)的發(fā)帖行為特征設(shè)置較高閾值,但判斷發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征超出該較高閾值,則直接刪帖;3)優(yōu)選地, 為垃圾帖子設(shè)置多個垃圾等級以及與各個垃圾等級對應(yīng)的多級閾值,以三個垃圾等級為例,當判斷發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征超出第一等級閾值,向其發(fā)送警告通知消息;當判斷發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征超出第二級閾值,直接進行刪帖;當判斷發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征超出第三級閾值,則不僅刪帖還對發(fā)帖用戶查封其ID 或IP地址。本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明并不限于上述幾種帖子處理方式,其他的任何可適用于本發(fā)明的帖子處理方式也均應(yīng)包含在本發(fā)明的保護范圍以內(nèi),并以引用方式包含于此。
在實際中,一些垃圾帖子或隱性垃圾帖子可能由一群用戶而非單個用戶發(fā)放,因此為更準確地檢測垃圾帖子,還有必要結(jié)合該帖子的外部特征來進行綜合判斷。 具體地,在另一優(yōu)選實施例中,在步驟S23’中,網(wǎng)絡(luò)設(shè)備2在接收到一個帖子后, 不僅基于發(fā)帖人的發(fā)帖行為特征或與該帖子有關(guān)的發(fā)帖行為特征,還進一步基于所獲取的帖子的內(nèi)容關(guān)鍵信息去查詢該帖子的外部特征。該外部特征包括但不限于以下各項中的任一項1)該帖子中的內(nèi)容重復(fù)度,或該帖子與其他相似帖子的內(nèi)容重復(fù)度;2)與所述帖子具有相同或相似內(nèi)容的其他帖子所在社區(qū)網(wǎng)絡(luò)的數(shù)目。隨后,網(wǎng)絡(luò)設(shè)備可基于第二預(yù)定規(guī)則根據(jù)該外部特征,并結(jié)合上述發(fā)帖人的發(fā)帖行為特征來判斷該帖子是否為垃圾帖子。具體地,該第二預(yù)定規(guī)則包括但不限于1)當該帖子本身的內(nèi)容重復(fù)度或該帖子與其他相似帖子的內(nèi)容重復(fù)度是否超出第三預(yù)定閾值;和/或2)與該帖子具有相同或相似內(nèi)容的其他帖子(以下簡稱“相似帖子”)所在社區(qū)網(wǎng)絡(luò)的數(shù)目是否超出第四預(yù)定閾值;和 /或3)其他相似帖子的發(fā)帖頻率是否超出第五預(yù)定閾值。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明的第二預(yù)定規(guī)則不限上述幾種方式,其他可適用于本發(fā)明的用于判斷該帖子的外部特征異常的判斷規(guī)則,也均應(yīng)一并包含在本發(fā)明的保護范圍中。另外,本發(fā)明可采用多種基于帖子外部特征與發(fā)帖人發(fā)帖行為特征來更準確地綜合判斷垃圾帖子的綜合判斷方式,其包括但不限于1)將帖子外部特征的判斷結(jié)果與上述參照圖2或3所述的對發(fā)帖人發(fā)帖行為特征的判斷結(jié)果進行邏輯與運算,也即僅當根據(jù)帖子外部特征判斷和根據(jù)發(fā)帖人發(fā)帖行為特征判斷均為垃圾帖子,才最終判斷為垃圾帖子; 2)可將帖子外部特征進行歸一化,并將此歸一化值作為權(quán)重因子與對發(fā)帖人發(fā)帖行為特征進行相乘,再基于加權(quán)后的發(fā)帖人的發(fā)帖行為特征來判斷該帖子是否為垃圾帖子。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明的基于帖子外部特征的與發(fā)帖人發(fā)帖行為特征進行綜合判斷的方式不限上述幾種方式,其他可適用于本發(fā)明的用于基于帖子外部特征與發(fā)帖人的發(fā)帖行為特征的綜合判斷方式,也均應(yīng)一并包含在本發(fā)明的保護范圍中。另外,本發(fā)明還可適用于一些包含較明顯但不嚴重的違法或不道德或廣告特征的垃圾內(nèi)容或疑似垃圾內(nèi)容的垃圾帖子的檢測,通過結(jié)合對發(fā)帖用戶的發(fā)帖行為特征的檢測,也可更準確將其進行歸類,例如,具有少量色情內(nèi)容描寫的帖子可能屬于正常的文學創(chuàng)作,但當網(wǎng)絡(luò)設(shè)備檢測出其發(fā)帖用戶的發(fā)帖行為特征異常時,則可判斷其為垃圾帖子。具體地,在另一個優(yōu)選實施例中,在步驟S24’(未示出),網(wǎng)絡(luò)設(shè)備2在接收到一個帖子后,基于預(yù)定語義規(guī)則來判斷該帖子內(nèi)容中是否包含垃圾內(nèi)容或疑似垃圾內(nèi)容。其中, 該預(yù)定語義規(guī)則包括但不限于以下至少任一項1)所述帖子內(nèi)容是否滿足語法規(guī)則;2)所述帖子內(nèi)容中是否含有垃圾詞匯;3)所述帖子內(nèi)容中是否含有地址信息,其中,地址信息包括網(wǎng)頁地址鏈接、電話號碼、或QQ號碼等。隨后,當檢測出該帖子中包含垃圾內(nèi)容或疑似垃圾內(nèi)容時,基于該垃圾內(nèi)容或疑似垃圾內(nèi)容和發(fā)帖人的標識信息來在整個社區(qū)網(wǎng)絡(luò),或在本社區(qū)網(wǎng)絡(luò)以及其他社區(qū)網(wǎng)絡(luò)中,在步驟S21’中,查詢該發(fā)帖人與該垃圾內(nèi)容或疑似垃圾內(nèi)容有關(guān)的發(fā)帖行為特征,并基于上述參照圖3所述的第一預(yù)定規(guī)則對該發(fā)帖人與該垃圾內(nèi)容或疑似垃圾內(nèi)容有關(guān)的發(fā)帖行為特征進行判斷,以最終判斷該帖子是否為垃圾帖子。其中,同樣地,在該另一個優(yōu)選實施例中,網(wǎng)絡(luò)設(shè)備2還可進一步結(jié)合該帖子的外部特征來對該帖子進行綜合判斷。具體地,網(wǎng)絡(luò)設(shè)備2在接收到一個帖子后,不僅基于預(yù)定語義規(guī)則來判斷該帖子是否包含垃圾內(nèi)容或疑似垃圾內(nèi)容,并當檢測出該帖子中包含垃圾內(nèi)容或疑似垃圾內(nèi)容時,基于該垃圾內(nèi)容或疑似垃圾內(nèi)容和發(fā)帖人的標識信息來檢測發(fā)帖人與該垃圾內(nèi)容或疑似垃圾內(nèi)容有關(guān)的發(fā)帖行為特征。網(wǎng)絡(luò)設(shè)備還進一步基于所獲取的帖子中的垃圾內(nèi)容或疑似垃圾內(nèi)容去查詢該帖子的外部特征。該外部特征包括但不限于以下各項中的任一項1)所述帖子中的垃圾內(nèi)容或疑似垃圾內(nèi)容的重復(fù)度,該帖子或在整個社區(qū)網(wǎng)絡(luò)和/或多個社區(qū)網(wǎng)絡(luò)中其他相似帖子的垃圾內(nèi)容或疑似垃圾內(nèi)容的重復(fù)度;2)與所述帖子具有相同或相似垃圾內(nèi)容或疑似垃圾內(nèi)容的其他帖子所在社區(qū)網(wǎng)絡(luò)的數(shù)目。隨后,網(wǎng)絡(luò)設(shè)備可基于上述基于預(yù)定語義規(guī)則和發(fā)帖人標識信息的垃圾帖子判斷過程并結(jié)合上述參照圖3所述的第二預(yù)定規(guī)則來對該帖子外部特征進行判斷的方式來更準確地判斷該帖子是否為垃圾帖子,為簡明起見,具體內(nèi)容以引用方式包含于此,不做贅述。 同樣地,本發(fā)明可采用將多種上述基于預(yù)定語義規(guī)則和發(fā)帖人標識信息的垃圾帖子判斷過程與基于帖子外部特征的判斷過程相結(jié)合的綜合判斷方式,其包括但不限于1) 將帖子外部特征的判斷結(jié)果與上述基于預(yù)定語義規(guī)則和發(fā)帖人標識信息的判斷結(jié)果進行邏輯與運算,也即僅當根據(jù)帖子外部特征判斷,和根據(jù)預(yù)定語義規(guī)則判斷帖子是否有垃圾內(nèi)容或疑似垃圾內(nèi)容并結(jié)合發(fā)帖人的與垃圾內(nèi)容或疑似垃圾內(nèi)容有關(guān)的發(fā)帖行為特征判斷均為垃圾帖子,才最終判斷為垃圾帖子;2)可將帖子外部特征進行歸一化,并將此歸一化值作為權(quán)重因子與上述所述發(fā)帖人的與垃圾內(nèi)容或疑似垃圾內(nèi)容有關(guān)的發(fā)帖行為特征進行相乘,再基于加權(quán)后的發(fā)帖人的發(fā)帖行為特征來判斷該帖子是否為垃圾帖子。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明的基于預(yù)定語義規(guī)則和發(fā)帖人標識信息的垃圾帖子判斷過程與基于帖子外部特征的判斷過程相結(jié)合的綜合判斷方式不限上述幾種方式,其他可適用于本發(fā)明的用于基于預(yù)定語義規(guī)則和發(fā)帖人標識信息和基于帖子外部特征的綜合判斷方式,也均應(yīng)一并包含在本發(fā)明的保護范圍中。優(yōu)選地,在步驟S4,(未示出)中,網(wǎng)絡(luò)設(shè)備2還根據(jù)發(fā)帖人的本次發(fā)帖行為來建立或更新其在該發(fā)帖行為特征庫中的與該帖子有關(guān)的發(fā)帖行為特征。優(yōu)選地,在步驟S5’ (未示出)中,網(wǎng)絡(luò)設(shè)備2還根據(jù)步驟S22’中的判斷結(jié)果以及社區(qū)網(wǎng)站管理員的反饋來調(diào)整上述閾值,包括但不限于1)當出現(xiàn)判斷裝置判斷為垃圾帖子但社區(qū)網(wǎng)站管理員審核后確認非垃圾帖子的情形超出預(yù)定數(shù)目,則按預(yù)定增幅調(diào)高相應(yīng)的閾值;2)當出現(xiàn)判斷裝置判斷為非垃圾帖子但社區(qū)網(wǎng)站管理員審核后確認為垃圾帖子的情形超出預(yù)定數(shù)目,則按預(yù)定增幅調(diào)低相應(yīng)的閾值。圖4示出根據(jù)本發(fā)明一個方面的在社區(qū)網(wǎng)絡(luò)中檢測垃圾帖子的系統(tǒng)示意圖。為簡明起見,圖4中僅示出一名候選用戶及其用戶終端1、以及網(wǎng)絡(luò)設(shè)備2。該網(wǎng)絡(luò)設(shè)備2包括但不限于,網(wǎng)絡(luò)服務(wù)器、網(wǎng)絡(luò)主機或者、云計算模式下的其他用戶設(shè)備等。用戶終端包括但不限于,計算機、智能手機、PDA、游戲機或IPTV等任何具有上網(wǎng)瀏覽功能的設(shè)備。如圖4所示,網(wǎng)絡(luò)設(shè)備2包括一個用于檢測垃圾帖子的帖子檢測裝置20,但本領(lǐng)域技術(shù)人員應(yīng)理解, 該帖子檢測裝置20也可是與網(wǎng)絡(luò)設(shè)備通過網(wǎng)絡(luò)進行通信連接的獨立設(shè)備,包括但不限于普通計算機、服務(wù)器、主機等。其中,用戶終端與網(wǎng)絡(luò)設(shè)備之間的通信可以是基于諸如TCP/IP協(xié)議、UDP協(xié)議等的分組數(shù)據(jù)傳輸。而帖子檢測裝置為獨立設(shè)備時,其與網(wǎng)絡(luò)設(shè)備2之間的通信也可是基于上述TCP/IP協(xié)議、UDP協(xié)議等的分組數(shù)據(jù)傳輸;當帖子檢測裝置20包含于網(wǎng)絡(luò)設(shè)備2中時,其與網(wǎng)絡(luò)設(shè)備其他模塊的通信是 基于各種計算機總線協(xié)議的信號傳輸。但本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明不限于上述通信傳輸協(xié)議,任何已有或今后可能出現(xiàn)的外部通信協(xié)議或內(nèi)部計算機總線協(xié)議均適用于本發(fā)明,從而被弓I用而包含于此。以下,僅以帖子檢測裝置20包含于網(wǎng)絡(luò)設(shè)備2中為例對本發(fā)明進行詳細描述。如圖4所示,用戶a經(jīng)由用戶終端1訪問社區(qū)網(wǎng)絡(luò)網(wǎng)站并登陸其特定板塊(以下簡稱“貼吧)時,例如“軍事論壇”貼吧,通過人機交互的方式,利用用戶終端1向網(wǎng)絡(luò)設(shè)備 2發(fā)送帖子。在此雖然以“網(wǎng)絡(luò)設(shè)備”為例來闡述本發(fā)明,但本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明還可適用于基于P2P模式或云計算方式的用戶終端直接互連社區(qū)網(wǎng)絡(luò)模式,其中,每一或特定的一些用戶終端可起到網(wǎng)絡(luò)設(shè)備的功能,對用戶所發(fā)帖子進行檢測,也應(yīng)包含在本發(fā)明的保護范圍以內(nèi)。具體地,用戶a可通過諸如IE、Firefox等瀏覽器訪問社區(qū)網(wǎng)絡(luò)網(wǎng)頁,也可通過安裝于用戶終端1中的客戶端軟件,諸如QQ等進入該社區(qū)網(wǎng)絡(luò)的“軍事論壇”貼吧網(wǎng)頁。在前一情形中,用戶a可以在該社區(qū)網(wǎng)絡(luò)的“軍事論壇”貼吧網(wǎng)頁上的帖子輸入欄中輸入相應(yīng)的貼子內(nèi)容,然后點擊該網(wǎng)頁上的特定功能按鈕,使得用戶終端1發(fā)送帖子;在后一情形中, 用戶a可在客戶端的軟件用戶界面中輸入帖子內(nèi)容并通過點擊該客戶端軟件界面中特定功能按鈕使得用戶終端1發(fā)送該帖子。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明應(yīng)不限于上述方式, 任何可適用于本發(fā)明的訪問社區(qū)網(wǎng)絡(luò)以及發(fā)帖的方式均應(yīng)在本發(fā)明的保護范圍以內(nèi),并以引用方式包含于此。隨后,網(wǎng)絡(luò)設(shè)備2中的帖子檢測裝置20基于發(fā)帖用戶的發(fā)帖行為特征對其所發(fā)帖子進行檢測,判斷該帖子是否為垃圾帖子。具體地,本發(fā)明認識到對于許多隱性垃圾帖子,雖然其并未包含明顯違法或不道德或廣告特征的垃圾內(nèi)容,但其發(fā)帖人出于其不正當?shù)陌l(fā)帖目的,會在社區(qū)網(wǎng)絡(luò)的一個或多個板塊(例如多個貼吧,為統(tǒng)一起見,以下簡稱“貼吧”)中大量發(fā)放帖子,甚至采用機器發(fā)貼方式。因此,利用發(fā)帖人的發(fā)帖頻率或其所發(fā)貼吧數(shù)目等發(fā)帖行為特征可以很準確地檢測出此類隱性垃圾帖子。具體地,網(wǎng)絡(luò)設(shè)備2在接收到發(fā)帖的用戶(以下簡稱“發(fā)帖人”)所發(fā)帖子后,第一獲取裝置21將提取發(fā)帖人的諸如登錄社區(qū)網(wǎng)絡(luò)的ID或其IP地址等標識信息,隨后基于發(fā)帖人的標識信息查詢該發(fā)帖用戶的與該帖子相關(guān)的發(fā)帖行為特征,該發(fā)帖行為特征包括但不限于,該發(fā)帖人的發(fā)帖頻率、發(fā)帖所在貼吧的個數(shù)。第一獲取裝置21可以通過各種方式來獲取發(fā)帖人的發(fā)帖行為特征,包括但不限于以下方式1)向發(fā)帖人的用戶終端發(fā)送請求獲取其cookie信息的請求消息,并根據(jù)該用戶終端相應(yīng)請求消息提供的cookie信息來獲得該發(fā)帖人近期的發(fā)帖歷史記錄,從而獲取其發(fā)帖行為特征;2)根據(jù)該發(fā)帖人的標識信息在整個社區(qū)網(wǎng)絡(luò)中,或在本社區(qū)網(wǎng)絡(luò)以及其他社區(qū)網(wǎng)絡(luò)中,查詢該發(fā)帖人的發(fā)帖行為特征;3)更優(yōu)選地,網(wǎng)絡(luò)設(shè)備2可建立并管理一個包含大量發(fā)帖人的發(fā)帖行為特征的發(fā)帖行為特征庫,第一獲取裝置21可在該發(fā)帖行為特征庫中查詢該發(fā)帖人的發(fā)帖行為特征,其中該發(fā)帖行為特征庫包括各種類型的數(shù)據(jù)庫,其在硬件上可以包含在網(wǎng)絡(luò)設(shè)備中,也可是獨立于網(wǎng)絡(luò)設(shè)備并通過網(wǎng)絡(luò)鏈路與之建立通信連接。本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明并不限于上述幾種發(fā)帖行為特征獲取方式,其他的任何可適用于本發(fā)明的發(fā)帖行為特征獲取方式也均應(yīng)包含在本發(fā)明的保護范圍以內(nèi),并以引用方式包含于此。隨后,判斷裝置22 將基于第一預(yù)定規(guī)則來對所獲取的用戶的發(fā)帖行為特征進行判斷,該第一預(yù)定規(guī)則包括但不限于1)將發(fā)帖人的發(fā)帖頻率與第一預(yù)定閾值進行比較, 當發(fā)帖人的發(fā)帖頻率高于第一預(yù)定閾值,和/或;2)將發(fā)帖人發(fā)帖所在貼吧個數(shù)與第二預(yù)定閾值進行比較,當其發(fā)帖所在貼吧個數(shù)超出第二預(yù)定閾值,則可判斷其所發(fā)帖子為垃圾帖子。事實上,但發(fā)帖人的發(fā)帖頻率明顯高于人工發(fā)帖頻率,例如15-20次/分鐘,則可判斷為機器發(fā)貼,則該發(fā)帖人所發(fā)帖子可判斷為垃圾帖子。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明不限上述幾種發(fā)帖行為特征,其他可適用于本發(fā)明的用于判斷發(fā)帖人異常發(fā)帖行為的發(fā)帖行為特征,也均應(yīng)一并包含在本發(fā)明的保護范圍中。最后,帖子處理裝置23將根據(jù)判斷裝置22的判斷結(jié)果來對該帖子進行處理。具體地,當判斷裝置22判斷該帖子并非垃圾帖子時,可直接放行以在相應(yīng)貼吧上進行展示; 而當判斷該帖子為垃圾帖子或疑似垃圾帖子時,處理方式包括但不限于1)通知網(wǎng)站管理人員對疑似垃圾帖子進行人工審核和人工處理;2)為垃圾帖子對應(yīng)的發(fā)帖行為特征設(shè)置較高閾值,但判斷發(fā)帖人的發(fā)帖行為特征超出該閾值,則直接刪帖;2)更優(yōu)選地,為垃圾帖子設(shè)置多個垃圾等級以及與各個垃圾等級對應(yīng)的多級閾值,以三個垃圾等級為例,當判斷發(fā)帖人的發(fā)帖行為特征超出第一級閾值,向其發(fā)送警告通知消息;當判斷發(fā)帖人的發(fā)帖行為特征超出第二級閾值,直接進行刪帖;當判斷發(fā)帖人的發(fā)帖行為特征超出第三級閾值,則不僅刪帖還對發(fā)帖用戶查封其ID或IP地址。本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明并不限于上述幾種帖子處理方式,其他的任何可適用于本發(fā)明的帖子處理方式也均應(yīng)包含在本發(fā)明的保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,網(wǎng)絡(luò)設(shè)備2還包括調(diào)整裝置(未示出),用于根據(jù)上述判斷結(jié)果以及社區(qū)網(wǎng)站管理員的反饋來調(diào)整上述閾值,包括但不限于1)當出現(xiàn)判斷裝置判斷為垃圾帖子但社區(qū)網(wǎng)站管理員審核后確認非垃圾帖子的情形超出預(yù)定數(shù)目,則按預(yù)定增幅調(diào)高相應(yīng)的閾值;2)當出現(xiàn)判斷裝置判斷為非垃圾帖子但社區(qū)網(wǎng)站管理員審核后確認為垃圾帖子的情形超出預(yù)定數(shù)目,則按預(yù)定增幅調(diào)低相應(yīng)的閾值。優(yōu)選地,網(wǎng)絡(luò)設(shè)備2還包括更新裝置(未示出),用于根據(jù)發(fā)帖人的本次發(fā)帖行為來建立或更新其在該發(fā)帖行為特征庫中的發(fā)帖行為特征。需要說明的是,圖4僅僅簡要示出了一個用戶通過用戶終端向社區(qū)網(wǎng)絡(luò)發(fā)帖子的情形,而實際上,社區(qū)網(wǎng)絡(luò)中可能同時存在多個用戶向向社區(qū)網(wǎng)絡(luò)發(fā)帖子的情況,網(wǎng)絡(luò)設(shè)備針對每一用戶所發(fā)帖子的檢測和處理原理都是一樣的。圖5示出根據(jù)本發(fā)明一個優(yōu)選實施例的在社區(qū)網(wǎng)絡(luò)中檢測垃圾帖子的系統(tǒng)示意圖,其中用戶發(fā)帖的過程與上面參照圖4所描述的發(fā)帖過程相同,為簡明起見,以引用方式包含在此,而不做贅述。如圖5所示,網(wǎng)絡(luò)設(shè)備2接收到所發(fā)帖子后,第一獲取裝置21’對提取其內(nèi)容的關(guān)鍵信息和發(fā)帖人的諸如登錄社區(qū)網(wǎng)絡(luò)的ID或其IP地址等標識信息,并隨后根據(jù)該內(nèi)容的關(guān)鍵信息來查詢發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征,也即,利用所提取的內(nèi)容關(guān)鍵信息來查詢該發(fā)帖人所發(fā)放的帖子中與帖子具有相同或相似關(guān)鍵信息的其他帖子(以下簡稱 “相似帖子”),隨后獲得該發(fā)帖人發(fā)放相似帖子的發(fā)帖行為特征,從而可以更準確地判斷該帖子是否為垃圾帖子,該發(fā)帖行為特征包括但不限于,發(fā)放相似帖子的發(fā)帖頻率、發(fā)放相似帖子的貼吧數(shù)目。具體地,第一獲取裝置21’可以通過各種方式來獲取發(fā)帖人的發(fā)帖行為特征,包括但不限于以下方式1)向發(fā)帖人的用戶終端發(fā)送請求獲取其cookie信息的請求消息,并根據(jù)該用戶終端相應(yīng)請求消息提供的cookie信息來獲得該發(fā)帖人近期的發(fā)帖歷史記錄, 從而獲取其發(fā)放相似帖子的發(fā)帖行為特征;2)根據(jù)該帖子的內(nèi)容關(guān)鍵信息以及發(fā)帖人的標識信息在整個社區(qū)網(wǎng)絡(luò)中,或在本社區(qū)網(wǎng)絡(luò)以及其他社區(qū)網(wǎng)絡(luò)中,查詢該發(fā)帖人與該帖子有關(guān)的的發(fā)帖行為特征;3)更優(yōu)選地,網(wǎng)絡(luò)設(shè)備可建立并管理一個包含大量發(fā)帖人的發(fā)帖行為特征的發(fā)帖行為特征庫,第一獲取裝置21’可在發(fā)帖行為特征庫中查詢該發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征,并根據(jù)其此次發(fā)帖行為來為其在該發(fā)帖新聞表征庫中建立或更新其與該帖子有關(guān)的發(fā)帖行為特征,其中該發(fā)帖行為特征庫包括各種類型的數(shù)據(jù)庫,其在硬件上可以包含在網(wǎng)絡(luò)設(shè)備中,也可是獨立于網(wǎng)絡(luò)設(shè)備并通過網(wǎng)絡(luò)鏈路與之建立通信連接。本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明并不限于上述幾種發(fā)帖行為特征獲取方式,其他的任何可適用于本發(fā)明的發(fā)帖行為特征獲取方式也均應(yīng)包含在本發(fā)明的保護范圍以內(nèi),并以引用方式包含于此。隨后,判斷裝置22’將根據(jù)第一預(yù)定規(guī)則對所獲取的發(fā)帖人的與該帖子有關(guān)的發(fā)帖行為特征進行判斷。具體地,該第一預(yù)定規(guī)則包括但不限于1)將發(fā)帖人與該帖子有關(guān)的發(fā)帖頻率與第一預(yù)定閾值進行比較,當高于第一預(yù)定閾值;和/或2)將發(fā)帖人將該帖子發(fā)放的貼吧個數(shù)與第二預(yù)定閾值進行比較,當超出第二預(yù)定閾值,則可判斷其所發(fā)帖子為垃圾帖子。事實上,當發(fā)帖人發(fā)放該帖子的發(fā)帖頻率明顯高于人工發(fā)帖頻率,例如15-20次 /分鐘,則可判斷為機器發(fā)貼,則該帖子可判斷為垃圾帖子。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明的第一預(yù)定規(guī)則不限上述幾種方式,其他可適用于本發(fā)明的用于判斷發(fā)帖人異常發(fā)帖行為的判斷規(guī)則,也均應(yīng)一并包含在本發(fā)明的保護范圍中。最后,帖子處理裝置23’將根據(jù)判斷裝置22’的判斷結(jié)果來對該帖子進行處理。具體地,當判斷該帖子并非垃圾帖子時,可直接放行以在相應(yīng)貼吧上進行展示;而當判斷該帖子為垃圾帖子或疑似垃圾帖子時,處理方式包括但不限于1)通知網(wǎng)站管理人員對疑似垃圾帖子進行人工審核和人工處理;2)為垃圾帖子對應(yīng)的發(fā)帖行為特征設(shè)置較高閾值,但判斷發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征超出該較高閾值,則直接刪帖;3)優(yōu)選地,為垃圾帖子設(shè)置多個垃圾等級以及與各個垃圾等級對應(yīng)的多級閾值,以三個垃圾等級為例,當判斷發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征超出第一等級閾值,向其發(fā)送警告通知消息;當判斷發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征超出第二級閾值,直接進行刪帖;當判斷發(fā)帖人與該帖子有關(guān)的發(fā)帖行為特征超出第三級閾值,則不僅刪帖還對發(fā)帖用戶查封其ID或IP地址。本領(lǐng)域技術(shù)人員應(yīng)理解本發(fā)明并不限于上述幾種帖子處理方式,其他的任何可適用于本發(fā)明的帖子處理方式也均應(yīng)包含在本發(fā)明的保護范圍以內(nèi),并以引用方式包含于此。在實際中,一些垃圾帖子或隱性垃圾帖子可能由一群用戶而非單個用戶發(fā)放,因此為更準確地檢測垃圾帖子,還有必要結(jié)合該帖子的外部特征來進行綜合判斷。具體地,在另一優(yōu)選實施例中,網(wǎng)絡(luò)設(shè)備2在接收到一個帖子后,第二獲取裝置 24’不僅基于發(fā)帖人的發(fā)帖行為特征或與該帖子有關(guān)的發(fā)帖行為特征,還進一步基于所獲取的帖子的內(nèi)容關(guān)鍵信息去查詢該帖子的外部特征。該外部特征包括但不限于以下各項中的任一項1)該帖子中的內(nèi)容重復(fù)度,或該帖子與其他相似帖子的內(nèi)容重復(fù)度;2)與所述帖子具有相同或相似內(nèi)容的其他帖子所在社區(qū)網(wǎng)絡(luò)的數(shù)目。隨后,判斷裝置22’可基于第二預(yù)定規(guī)則根據(jù)該外部特征,并結(jié)合上述發(fā)帖人的發(fā)帖行為特征來判斷該帖子是否為垃圾帖子。具體地,該第二預(yù)定規(guī)則包括但不限于1)當該帖子本身的內(nèi)容重復(fù)度或該帖子與其他相似帖子的內(nèi)容重復(fù)度是否超出第三預(yù)定閾值;和/或幻與該帖子具有相同或相似內(nèi)容的其他帖子(以下簡稱“相似帖子”)所在社區(qū)網(wǎng)絡(luò)的數(shù)目是否超出第四預(yù)定閾值;和 /或幻其他相似帖子的發(fā)帖頻率是否超出第五預(yù)定閾值。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明的第二預(yù)定規(guī)則不限上述幾種方式,其他可適用于本發(fā)明的用于判斷該帖子的外部特征異常的判斷規(guī)則,也均應(yīng)一并包含在本發(fā)明的保護范圍中。另外,本發(fā)明中判斷裝置22’可采用多種基于帖子外部特征與發(fā)帖人發(fā)帖行為特征來更準確地綜合判斷垃圾帖子的綜合判斷方式,其包括但不限于1)將帖子外部特征的判斷結(jié)果與上述參照圖2或3所述的對發(fā)帖人發(fā)帖行為特征的判斷結(jié)果進行邏輯與運算, 也即僅當根據(jù)帖子外部特征判斷和根據(jù)發(fā)帖人發(fā)帖行為特征判斷均為垃圾帖子,才最終判斷為垃圾帖子;2)可將帖子外部特征進行歸一化,并將此歸一化值作為權(quán)重因子與對發(fā)帖人發(fā)帖行為特征進行相乘,再基于加權(quán)后的發(fā)帖人的發(fā)帖行為特征來判斷該帖子是否為垃圾帖子。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明的基于帖子外部特征的與發(fā)帖人發(fā)帖行為特征進行綜合判斷的方式不限上述幾種方式,其他可適用于本發(fā)明的用于基于帖子外部特征與發(fā)帖人的發(fā)帖行為特征的綜合判斷方式,也均應(yīng)一并包含在本發(fā)明的保護范圍中。另外,本發(fā)明還可適用于一些包含較明顯但不嚴重的違法或不道德或廣告特征的垃圾內(nèi)容或疑似垃圾內(nèi)容的垃圾帖子的檢測,通過結(jié)合對發(fā)帖用戶的發(fā)帖行為特征的檢測,也可更準確將其進行歸類,例如,具有少量色情內(nèi)容描寫的帖子可能屬于正常的文學創(chuàng)作,但當網(wǎng)絡(luò)設(shè)備檢測出其發(fā)帖用戶的發(fā)帖行為特征異常時,則可判斷其為垃圾帖子。具體地,在另一個優(yōu)選實施例中,網(wǎng)絡(luò)設(shè)備22在接收到一個帖子后,判斷裝置22’ 基于預(yù)定語義規(guī)則來判斷該帖子內(nèi)容中是否包含垃圾內(nèi)容或疑似垃圾內(nèi)容。其中,該預(yù)定語義規(guī)則包括但不限于以下至少任一項1)所述帖子內(nèi)容是否滿足語法規(guī)則;2)所述帖子內(nèi)容中是否含有垃圾詞匯;3)所述帖子內(nèi)容中是否含有地址信息,其中,地址信息包括網(wǎng)頁地址鏈接、電話號碼、或QQ號碼等。隨后,當語義檢測裝置(未示出)檢測出該帖子中包含垃圾內(nèi)容或疑似垃圾內(nèi)容時,第一獲取裝置21’基于該垃圾內(nèi)容或疑似垃圾內(nèi)容和發(fā)帖人的標識信息來在整個社區(qū)網(wǎng)絡(luò),或在本社區(qū)網(wǎng)絡(luò)以及其他社區(qū)網(wǎng)絡(luò)中,查詢該發(fā)帖人與該垃圾內(nèi)容或疑似垃圾內(nèi)容有關(guān)的發(fā)帖行為特征。隨后,判斷裝置22’基于上述參照圖3所述的第一預(yù)定規(guī)則對該發(fā)帖人與該垃圾內(nèi)容或疑似垃圾內(nèi)容有關(guān)的發(fā)帖行為特征進行判斷,以最終判斷該帖子是否為垃圾帖子。 其中,同樣地,在該另一個優(yōu)選實施例中,網(wǎng)絡(luò)設(shè)備2還可進一步結(jié)合該帖子的外部特征來對該帖子進行綜合判斷。具體地,網(wǎng)絡(luò)設(shè)備2在接收到一個帖子后,語義檢測裝置(未示出)基于預(yù)定語義規(guī)則來檢測該帖子是否包含垃圾內(nèi)容或疑似垃圾內(nèi)容,并當檢測出該帖子中包含垃圾內(nèi)容或疑似垃圾內(nèi)容時,第一獲取裝置21’基于該垃圾內(nèi)容或疑似垃圾內(nèi)容和發(fā)帖人的標識信息來檢測發(fā)帖人與該垃圾內(nèi)容或疑似垃圾內(nèi)容有關(guān)的發(fā)帖行為特征;
15而第二獲取裝置對’根據(jù)所獲取的帖子中的垃圾內(nèi)容或疑似垃圾內(nèi)容去查詢該帖子的外部特征。該外部特征包括但不限于以下各項中的任一項1)所述帖子中的垃圾內(nèi)容或疑似垃圾內(nèi)容的重復(fù)度,該帖子或在整個社區(qū)網(wǎng)絡(luò)和/或多個社區(qū)網(wǎng)絡(luò)中其他相似帖子的垃圾內(nèi)容或疑似垃圾內(nèi)容的重復(fù)度;2)與所述帖子具有相同或相似垃圾內(nèi)容或疑似垃圾內(nèi)容的其他帖子所在社區(qū)網(wǎng)絡(luò)的數(shù)目。隨后,判斷裝置22’可基于上述基于預(yù)定語義規(guī)則和發(fā)帖人標識信息的垃圾帖子判斷過程并結(jié)合上述參照圖4所述的第二預(yù)定規(guī)則來對該帖子外部特征進行判斷的方式來更準確地判斷該帖子是否為垃圾帖子,為簡明起見,其具體內(nèi)容以引用方式包含于此,不做贅述。同樣地,本發(fā)明中判斷裝置22’可采用將多種上述基于預(yù)定語義規(guī)則和發(fā)帖人標識信息的垃圾帖子判斷過程與基于帖子外部特征的判斷過程相結(jié)合的綜合判斷方式,其包括但不限于1)將帖子外部特征的判斷結(jié)果與上述基于預(yù)定語義規(guī)則和發(fā)帖人標識信息的判斷結(jié)果進行邏輯與運算,也即僅當根據(jù)帖子外部特征判斷,和根據(jù)預(yù)定語義規(guī)則判斷帖子是否有垃圾內(nèi)容或疑似垃圾內(nèi)容并結(jié)合發(fā)帖人的與垃圾內(nèi)容或疑似垃圾內(nèi)容有關(guān)的發(fā)帖行為特征判斷均為垃圾帖子,才最終判斷為垃圾帖子;幻可將帖子外部特征進行歸一化,并將此歸一化值作為權(quán)重因子與上述所述發(fā)帖人的與垃圾內(nèi)容或疑似垃圾內(nèi)容有關(guān)的發(fā)帖行為特征進行相乘,再基于加權(quán)后的發(fā)帖人的發(fā)帖行為特征來判斷該帖子是否為垃圾帖子。本領(lǐng)域技術(shù)人員應(yīng)理解,本發(fā)明的基于預(yù)定語義規(guī)則和發(fā)帖人標識信息的垃圾帖子判斷過程與基于帖子外部特征的判斷過程相結(jié)合的綜合判斷方式不限上述幾種方式,其他可適用于本發(fā)明的用于基于預(yù)定語義規(guī)則和發(fā)帖人標識信息和基于帖子外部特征的綜合判斷方式,也均應(yīng)一并包含在本發(fā)明的保護范圍中。優(yōu)選地,網(wǎng)絡(luò)設(shè)備2還包括調(diào)整裝置(未示出),用于根據(jù)上述判斷結(jié)果以及社區(qū)網(wǎng)站管理員的反饋來調(diào)整上述閾值,包括但不限于1)當出現(xiàn)判斷裝置判斷為垃圾帖子但社區(qū)網(wǎng)站管理員審核后確認非垃圾帖子的情形超出預(yù)定數(shù)目,則按預(yù)定增幅調(diào)高相應(yīng)的閾值;2)當出現(xiàn)判斷裝置判斷為非垃圾帖子但社區(qū)網(wǎng)站管理員審核后確認為垃圾帖子的情形超出預(yù)定數(shù)目,則按預(yù)定增幅調(diào)低相應(yīng)的閾值。優(yōu)選地,網(wǎng)絡(luò)設(shè)備2還包括更新裝置(未示出),用于根據(jù)發(fā)帖人的本次發(fā)帖行為來建立或更新其在該發(fā)帖行為特征庫中的發(fā)帖行為特征。以上參照圖2-4對本發(fā)明的多個具體實施例詳細描述。對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,上述實施例僅為示范性的,而非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此應(yīng)將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標記視為限制所涉及的權(quán)利要求。此外,顯然“包括” 一詞不排除其他單元或步驟,單數(shù)不排除復(fù)數(shù)。 系統(tǒng)權(quán)利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟件或者硬件來實現(xiàn)。第一,第二等詞語用來表示名稱,而并不表示任何特定的順序。
權(quán)利要求
1.一種用于檢測社區(qū)網(wǎng)絡(luò)中垃圾帖子的方法,其中,包括a.根據(jù)發(fā)帖用戶的發(fā)帖行為特征來判斷其所發(fā)帖子是否為垃圾帖子。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟a包括 al.獲取該帖子的發(fā)帖用戶的發(fā)帖行為特征;a2.基于第一預(yù)定規(guī)則根據(jù)所述發(fā)帖用戶的發(fā)帖行為特征判斷該帖子是否為垃圾帖子。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟a還包括 al’ .獲取所述帖子中的內(nèi)容關(guān)鍵信息;a2'.根據(jù)所述內(nèi)容關(guān)鍵信息來獲取該發(fā)帖用戶與該帖子有關(guān)的發(fā)帖行為特征; a3’ .根據(jù)發(fā)帖用戶與該帖子有關(guān)的發(fā)帖行為特征來判斷所述帖子是否為垃圾帖子。
4.根據(jù)權(quán)利要求2或3所述的方法,其中,所述發(fā)帖用戶的發(fā)帖行為特征包括以下至少任一項-發(fā)帖人的發(fā)帖頻率;-發(fā)帖人發(fā)帖所在貼吧的信息;其中,所述第一預(yù)定規(guī)則相應(yīng)地包括以下任一項-發(fā)帖人的發(fā)帖頻率超出第一預(yù)定閾值;-發(fā)帖人發(fā)帖所在社區(qū)網(wǎng)絡(luò)的數(shù)目超出第二預(yù)定閾值。
5.根據(jù)權(quán)利要求4所述的方法,其中,還包括-根據(jù)所述判斷結(jié)果,并通過該社區(qū)網(wǎng)絡(luò)管理員的反饋來相應(yīng)調(diào)整所述第一預(yù)定閾值或第二預(yù)定閾值。
6.根據(jù)權(quán)利要求3至5中任一項所述的方法,其中,所述獲取發(fā)帖用戶的發(fā)帖行為特征的步驟還包括-根據(jù)所述發(fā)帖用戶的標識信息在發(fā)帖行為特征庫中查詢,以獲取該發(fā)帖用戶的所述發(fā)帖行為特征。
7.根據(jù)權(quán)利要求6所述的方法,其中,還包括-根據(jù)判斷結(jié)果來更新所述發(fā)帖行為特征庫中該發(fā)帖用戶的所述發(fā)帖行為特征。
8.根據(jù)權(quán)利要求2至7中任一項所述的方法,其中還包括 c獲取該帖子的外部特征;其中,所述步驟a還包括-基于第二預(yù)定規(guī)則對帖子的外部特征進行判斷并結(jié)合用戶的發(fā)帖行為特征來判斷所述帖子是否為垃圾帖子。
9.根據(jù)權(quán)利要求8所述的方法,其中,所述外部特征包括以下至少任一項 -所述帖子的內(nèi)容重復(fù)度;-與所述帖子具有相同或相似內(nèi)容的其他相似帖子所在社區(qū)網(wǎng)絡(luò)的數(shù)目;-與所述帖子具有相同或相似內(nèi)容的其他相似帖子的發(fā)放頻率;其中,所述第二預(yù)定規(guī)則相應(yīng)地包括以下至少任一項-所述帖子的內(nèi)容重復(fù)度是否超出第三預(yù)定閾值;-所述其他相似帖子所在社區(qū)網(wǎng)絡(luò)的數(shù)目是否超出第四預(yù)定閾值;-所述其他相似帖子的發(fā)放頻率是否超出第五預(yù)定閾值。
10.根據(jù)權(quán)利要求2至9中任一項所述的方法,其中,所述步驟a還還包括-基于預(yù)定語義規(guī)則對該帖子的內(nèi)容進行判斷并結(jié)合用戶的發(fā)帖行為特征來判斷所述帖子是否為垃圾帖子;其中,所述預(yù)定語義規(guī)則包括 -所述帖子內(nèi)容是否滿足語法規(guī)則; -所述帖子內(nèi)容中是否含有垃圾詞匯; -所述帖子內(nèi)容中是否含有地址信息。
11.根據(jù)權(quán)利要求10所述的方法,其中,所述地址信息包括網(wǎng)頁地址鏈接、電話號碼、 或QQ號碼。
12.根據(jù)權(quán)利要求1至11中任一項所述的方法,其中,所述方法還包括 當判斷所述帖子為垃圾帖子,則根據(jù)預(yù)定處理規(guī)則對其進行處理。
13.一種用于檢測社區(qū)網(wǎng)絡(luò)中垃圾帖子的設(shè)備,其中,包括帖子檢測裝置,用于根據(jù)發(fā)帖用戶的發(fā)帖行為特征來判斷其所發(fā)帖子是否為垃圾帖子。
14.根據(jù)權(quán)利要求13所述的設(shè)備,其中,所述帖子檢測裝置包括 第一獲取裝置,用于獲取該帖子的發(fā)帖用戶的發(fā)帖行為特征;判斷裝置,用于基于第一預(yù)定規(guī)則根據(jù)所述發(fā)帖用戶的發(fā)帖行為特征判斷該帖子是否為垃圾帖子。
15.根據(jù)權(quán)利要求13所述的設(shè)備,其中,所述帖子檢測裝置包括 提取裝置,用于獲取所述帖子中的內(nèi)容關(guān)鍵信息;第一獲取裝置,用于根據(jù)所述內(nèi)容關(guān)鍵信息來獲取該發(fā)帖用戶與該帖子有關(guān)的發(fā)帖行為特征;判斷裝置,用于根據(jù)發(fā)帖用戶與該帖子有關(guān)的發(fā)帖行為特征來判斷所述帖子是否為垃圾帖子。
16.根據(jù)權(quán)利要求14或15所述的設(shè)備,其中,所述發(fā)帖用戶的發(fā)帖行為特征包括以下至少任一項發(fā)帖人的發(fā)帖頻率;發(fā)帖人發(fā)帖所在貼吧的信息;其中,所述第一預(yù)定規(guī)則相應(yīng)地包括以下任一項-發(fā)帖人的發(fā)帖頻率超出第一預(yù)定閾值;-發(fā)帖人發(fā)帖所在社區(qū)網(wǎng)絡(luò)的數(shù)目超出第二預(yù)定閾值。
17.根據(jù)權(quán)利要求16所述的設(shè)備,其中,還包括調(diào)整裝置,用于根據(jù)所述判斷結(jié)果,并根據(jù)該社區(qū)網(wǎng)絡(luò)管理員的反饋來相應(yīng)調(diào)整所述第一預(yù)定閾值或第二預(yù)定閾值。
18.根據(jù)權(quán)利要求15至17中任一項所述的設(shè)備,其中,所述第一獲取裝置還用于根據(jù)所述發(fā)帖用戶的標識信息在發(fā)帖行為特征庫中查詢,以獲取該發(fā)帖用戶的所述發(fā)帖行為特征。
19.根據(jù)權(quán)利要求18所述的設(shè)備,其中,還包括更新裝置,用于根據(jù)判斷結(jié)果來更新所述發(fā)帖行為特征庫中該發(fā)帖用戶的所述發(fā)帖行為特征。
20.根據(jù)權(quán)利要求14至19中任一項所述的設(shè)備,其中還包括 第二獲取裝置,用于獲取該帖子的外部特征;其中,所述判斷裝置還用于基于第二預(yù)定規(guī)則對帖子的外部特征進行判斷并結(jié)合用戶的發(fā)帖行為特征來判斷所述帖子是否為垃圾帖子。
21.根據(jù)權(quán)利要求20所述的設(shè)備,其中,所述外部特征包括以下至少任一項 -所述帖子的內(nèi)容重復(fù)度;-與所述帖子具有相同或相似內(nèi)容的其他相似帖子所在社區(qū)網(wǎng)絡(luò)的數(shù)目;-與所述帖子具有相同或相似內(nèi)容的其他相似帖子的發(fā)放頻率;其中,所述第二預(yù)定規(guī)則相應(yīng)地包括以下至少任一項-所述帖子的內(nèi)容重復(fù)度是否超出第三預(yù)定閾值;-所述其他相似帖子所在社區(qū)網(wǎng)絡(luò)的數(shù)目是否超出第四預(yù)定閾值;-所述其他相似帖子的發(fā)放頻率是否超出第五預(yù)定閾值。
22.根據(jù)權(quán)利要求14至21中任一項所述的設(shè)備,其中,所述判斷裝置還用于基于預(yù)定語義規(guī)則對該帖子的內(nèi)容進行判斷并結(jié)合用戶的發(fā)帖行為特征來判斷所述帖子是否為垃圾帖子;其中,所述預(yù)定語義規(guī)則包括 -所述帖子內(nèi)容是否滿足語法規(guī)則; -所述帖子內(nèi)容中是否含有垃圾詞匯; -所述帖子內(nèi)容中是否含有地址信息。
23.根據(jù)權(quán)利要求22所述的設(shè)備,其中,所述地址信息包括網(wǎng)頁地址鏈接、電話號碼、 或QQ號碼。
24.根據(jù)權(quán)利要求13至23中任一項所述的設(shè)備,其中,還包括帖子處理裝置,用于當判斷所述帖子為垃圾帖子,則根據(jù)預(yù)定處理規(guī)則對其進行處理。
全文摘要
本發(fā)明提供了一種用于檢測社區(qū)網(wǎng)絡(luò)中垃圾帖子的方法與設(shè)備,其根據(jù)發(fā)帖用戶的發(fā)帖行為特征來判斷其所發(fā)帖子是否為垃圾帖子。在一個優(yōu)選實施例中,本發(fā)明首先獲取該帖子的發(fā)帖用戶的發(fā)帖行為特征;隨后基于預(yù)定規(guī)則根據(jù)所述發(fā)帖用戶的發(fā)帖行為特征判斷該帖子是否為垃圾帖子。在另一優(yōu)選實施例中,本發(fā)明首先獲取該帖子中的內(nèi)容關(guān)鍵信息;然后再根據(jù)該內(nèi)容關(guān)鍵信息來獲取發(fā)帖用戶與該帖子有關(guān)的發(fā)帖行為特征;隨后根據(jù)發(fā)帖用戶與該帖子有關(guān)的發(fā)帖行為特征來判斷該帖子是否為垃圾帖子。與現(xiàn)有技術(shù)相比,本發(fā)明通過對在社區(qū)網(wǎng)絡(luò)中發(fā)帖子的用戶的發(fā)帖行為特征進行檢測,并優(yōu)選地結(jié)合帖子的外部特征和語義分析,從而可更準確地判斷垃圾帖子。
文檔編號G06F17/30GK102315952SQ20101021418
公開日2012年1月11日 申請日期2010年6月29日 優(yōu)先權(quán)日2010年6月29日
發(fā)明者尹佳, 帥帥, 方勇, 舒迅, 袁聃 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司