本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及一種信息處理方法、裝置及計(jì)算機(jī)設(shè)備。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,用戶可以通過網(wǎng)絡(luò)在各個(gè)論壇、社區(qū)、網(wǎng)站等各種公共平臺(tái)上發(fā)表相關(guān)評(píng)論。然而,基于公共平臺(tái)的言論開放性,部分用戶通過將廣告評(píng)論、推銷評(píng)論、其他含有不良影響的評(píng)論等垃圾評(píng)論大量發(fā)布到公共平臺(tái)上,以此影響用戶對(duì)有用信息的獲取,且給用戶帶來(lái)不良影響?,F(xiàn)有的計(jì)算機(jī)設(shè)備在使用的過程中,垃圾評(píng)論已經(jīng)越來(lái)越困擾到用戶,而如何有效識(shí)別垃圾評(píng)論已越來(lái)越受到業(yè)界的普遍關(guān)注。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種信息處理方法、裝置及計(jì)算機(jī)設(shè)備,可以提高信息處理效率。
本發(fā)明實(shí)施例提供一種信息處理方法,所述方法包括:
獲取用戶評(píng)論;
遍歷評(píng)論隊(duì)列,判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值,其中所述評(píng)論隊(duì)列是先進(jìn)先出隊(duì)列且長(zhǎng)度具有第二閾值;
若是,則將所述用戶評(píng)論確定為垃圾評(píng)論;
若否,則將所述用戶評(píng)論加入評(píng)論隊(duì)列,并根據(jù)所述第二閾值對(duì)所述先進(jìn)先出隊(duì)列的隊(duì)尾評(píng)論進(jìn)行處理。
本發(fā)明實(shí)施例還提供一種信息處理裝置,所述裝置包括:
獲取模塊,用于獲取用戶評(píng)論;
第一判斷模塊,用于遍歷評(píng)論隊(duì)列,判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值,其中所述評(píng)論隊(duì)列是先進(jìn)先出隊(duì)列且長(zhǎng)度具有第二閾值;
確定模塊,用于當(dāng)判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量達(dá)到第一閾值時(shí),將所述用戶評(píng)論確定為垃圾評(píng)論;
處理模塊,用于當(dāng)判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量未達(dá)到第一閾值時(shí),將所述用戶評(píng)論加入評(píng)論隊(duì)列,并根據(jù)所述第二閾值對(duì)所述先進(jìn)先出隊(duì)列的隊(duì)尾評(píng)論進(jìn)行處理。
本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器,處理器及存儲(chǔ)在存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其中,所述處理器調(diào)用所述存儲(chǔ)器中存儲(chǔ)的所述計(jì)算機(jī)程序,執(zhí)行本發(fā)明任一實(shí)施例所述的信息處理方法。
附圖說(shuō)明
下面結(jié)合附圖,通過對(duì)本發(fā)明的具體實(shí)施方式詳細(xì)描述,將使本發(fā)明的技術(shù)方案及其它有益效果顯而易見。
圖1為本發(fā)明實(shí)施例提供的一種信息處理方法的流程示意圖。
圖2為本發(fā)明實(shí)施例提供的一種信息處理方法的第一使用狀態(tài)示意圖。
圖3為本發(fā)明實(shí)施例提供的一種信息處理方法的第二使用狀態(tài)示意圖。
圖4為本發(fā)明實(shí)施例提供的一種信息處理方法的另一流程示意圖。
圖5為本發(fā)明實(shí)施例提供的一種信息處理方法的第三使用狀態(tài)示意圖。
圖6為本發(fā)明實(shí)施例提供的一種信息處理方法的第四使用狀態(tài)示意圖。
圖7為本發(fā)明實(shí)施例提供的一種信息處理裝置的結(jié)構(gòu)示意圖。
圖8為本發(fā)明實(shí)施例提供的一種信息處理裝置的另一結(jié)構(gòu)示意圖。
圖9為本發(fā)明實(shí)施例提供的一種計(jì)算機(jī)設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明中的術(shù)語(yǔ)“第一”、“第二”和“第三”等是用于區(qū)別不同對(duì)象,而不是用于描述特定順序。此外,術(shù)語(yǔ)“包括”和“具有”以及它們?nèi)魏巫冃危鈭D在于覆蓋不排他的包含。例如包含了一系列步驟或模塊的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備沒有限定于已列出的步驟或模塊,而是可選地還包括沒有列出的步驟或模塊,或可選地還包括對(duì)于這些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或模塊。
在本文中提及“實(shí)施例”意味著,結(jié)合實(shí)施例描述的特定特征、結(jié)構(gòu)或特性可以包含在本發(fā)明的至少一個(gè)實(shí)施例中。在說(shuō)明書中的各個(gè)位置出現(xiàn)該短語(yǔ)并不一定均是指相同的實(shí)施例,也不是與其它實(shí)施例互斥的獨(dú)立的或備選的實(shí)施例。本領(lǐng)域技術(shù)人員顯式地和隱式地理解的是,本文所描述的實(shí)施例可以與其它實(shí)施例相結(jié)合。
本發(fā)明實(shí)施例提供的一種信息處理方法的執(zhí)行主體,可以為本發(fā)明實(shí)施例提供的一種信息處理裝置,或者集成了所述信息處理裝置的計(jì)算機(jī)設(shè)備(譬如臺(tái)式電腦、筆記本、掌上電腦、平板電腦、智能手機(jī)等),所述信息處理裝置可以采用硬件或者軟件的方式實(shí)現(xiàn)。
請(qǐng)參閱圖1,圖1為本發(fā)明實(shí)施例提供的一種信息處理方法的流程示意圖。所述方法包括:
步驟S101,獲取用戶評(píng)論。
步驟S102,遍歷評(píng)論隊(duì)列,判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值,其中所述評(píng)論隊(duì)列是先進(jìn)先出隊(duì)列且
長(zhǎng)度具有第二閾值;若否,則執(zhí)行步驟S103;若是,則執(zhí)行步驟S104。
一些實(shí)施方式中,可以通過判斷所述評(píng)論隊(duì)列中存在的與所述用戶評(píng)論的相似度達(dá)到第三閾值的歷史評(píng)論的評(píng)論數(shù)量是否達(dá)到第一閾值,來(lái)判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值。當(dāng)判斷所述評(píng)論隊(duì)列中存在的與所述用戶評(píng)論的相似度達(dá)到第三閾值的歷史評(píng)論的評(píng)論數(shù)量未達(dá)到第一閾值時(shí),確定所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量未達(dá)到第一閾值,則執(zhí)行步驟S103。當(dāng)判斷所述評(píng)論隊(duì)列中存在的與所述用戶評(píng)論的相似度達(dá)到第三閾值的歷史評(píng)論的評(píng)論數(shù)量達(dá)到第一閾值時(shí),確定所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量達(dá)到第一閾值,則執(zhí)行步驟S104。
步驟S103,將所述用戶評(píng)論加入評(píng)論隊(duì)列,并根據(jù)所述第二閾值對(duì)所述評(píng)論隊(duì)列的隊(duì)尾評(píng)論進(jìn)行處理。
一些實(shí)施方式中,可以將所述用戶評(píng)論加入所述評(píng)論隊(duì)列作為隊(duì)首評(píng)論,并將溢出所述第二閾值的隊(duì)尾評(píng)論進(jìn)行刪除。
步驟S104,將所述用戶評(píng)論確定為垃圾評(píng)論。
為了更進(jìn)一步理解本發(fā)明技術(shù)方案,請(qǐng)參閱圖2及圖3,圖2為本發(fā)明實(shí)施例提供的一種信息處理方法的第一使用狀態(tài)示意圖,圖3為本發(fā)明實(shí)施例提供的一種信息處理方法的第二使用狀態(tài)示意圖。
如圖2所示,在某一論壇中,“會(huì)飛的老虎”發(fā)表了標(biāo)題為“手機(jī)里的傳感器”的文章,用戶“碼農(nóng)”在該論壇上提交內(nèi)容為“爭(zhēng)取早日再來(lái)個(gè)霧霾傳感器”的用戶評(píng)論。該論壇的服務(wù)器遍歷評(píng)論隊(duì)列,判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值;若是則將所述用戶評(píng)論確定為垃圾評(píng)論;若否則將所述用戶評(píng)論確定為非垃圾評(píng)論,則將所述用戶評(píng)論加入評(píng)論隊(duì)列,并根據(jù)所述第二閾值對(duì)所述先進(jìn)先出隊(duì)列的隊(duì)尾評(píng)論進(jìn)行處理。
例如,所述評(píng)論隊(duì)列是先進(jìn)先出隊(duì)列且長(zhǎng)度具有1000條。
如圖3所示,當(dāng)所述用戶評(píng)論確定為非垃圾評(píng)論時(shí),對(duì)評(píng)論隊(duì)列進(jìn)行更新,將所述用戶評(píng)論“爭(zhēng)取早日再來(lái)個(gè)霧霾傳感器”添加至所述評(píng)論隊(duì)列中作為評(píng)論區(qū)所顯示的隊(duì)首評(píng)論,并將評(píng)論時(shí)間最早且溢出第1000條的隊(duì)尾評(píng)論“求甲醛傳感器?!边M(jìn)行刪除。
本發(fā)明實(shí)施例通過獲取用戶評(píng)論,并遍歷評(píng)論隊(duì)列,判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值,其中所述評(píng)論隊(duì)列是先進(jìn)先出隊(duì)列且長(zhǎng)度具有第二閾值,若是,則將所述用戶評(píng)論確定為垃圾評(píng)論;若否,則將所述用戶評(píng)論加入評(píng)論隊(duì)列,并根據(jù)所述第二閾值對(duì)所述先進(jìn)先出隊(duì)列的隊(duì)尾評(píng)論進(jìn)行處理。本發(fā)明實(shí)施例可以有效識(shí)別出垃圾評(píng)論,并且當(dāng)用戶評(píng)論識(shí)別為非垃圾評(píng)論時(shí),僅需更新評(píng)論隊(duì)列,避免對(duì)數(shù)據(jù)庫(kù)中的所有內(nèi)容進(jìn)行處理,減輕系統(tǒng)運(yùn)行負(fù)擔(dān),有效提高信息處理效率。
一些實(shí)施方式中,在所述獲取用戶評(píng)論之后,還包括:
判斷所述用戶評(píng)論中的評(píng)論信息是否存在黑名單庫(kù)中,若是則將所述用戶評(píng)論確定為垃圾評(píng)論。
一些實(shí)施方式中,所述判斷所述用戶評(píng)論中的評(píng)論信息是否存在黑名單庫(kù)中,包括:
判斷所述用戶評(píng)論中是否包含有與黑名單庫(kù)中的特征信息相匹配的信息,若是則將所述用戶評(píng)論確定為垃圾評(píng)論。
一些實(shí)施方式中,當(dāng)所述用戶評(píng)論確定為垃圾評(píng)論時(shí),檢測(cè)所述用戶評(píng)論中是否含有聯(lián)系方式,若是則將所述聯(lián)系方式添加到黑名單庫(kù)中作為特征信息。
一些實(shí)施方式中,所述與所述用戶評(píng)論相似的評(píng)論包括與所述用戶評(píng)論的相似度達(dá)到第三閾值的歷史評(píng)論。
上述所有可選技術(shù)方案,可以采用任意結(jié)合形成本發(fā)明的可選實(shí)施例,在此不再一一贅述。
請(qǐng)參閱圖4,圖4為本發(fā)明實(shí)施例提供的一種信息處理方法的另一流程示意圖。所述方法包括:
步驟S201,獲取用戶評(píng)論。
例如,如圖2所示,在某一論壇中,“會(huì)飛的老虎”發(fā)表了標(biāo)題為“手機(jī)里的傳感器”的文章,用戶“碼農(nóng)”在該論壇上提交內(nèi)容為“爭(zhēng)取早日再來(lái)個(gè)霧霾傳感器”的用戶評(píng)論,該論壇的服務(wù)器從后臺(tái)獲取到該用戶評(píng)論。
步驟S202,判斷所述用戶評(píng)論中的評(píng)論信息是否存在黑名單庫(kù)中。若否,則執(zhí)行步驟S203;若是,則執(zhí)行步驟S205。
可以理解的是,所述用戶評(píng)論中的評(píng)論信息可以包括用戶名、用戶ID、評(píng)論內(nèi)容、評(píng)論發(fā)布時(shí)間等信息。
一些實(shí)施方式中,判斷所述用戶評(píng)論中是否包含有與黑名單庫(kù)中的特征信息相匹配的信息。若是,則執(zhí)行步驟S205;若否,則執(zhí)行步驟S203。
目前,很多公共平臺(tái)支持用戶之間的互動(dòng)行為,所述公共平臺(tái)的表現(xiàn)形式可以包括電子商務(wù)平臺(tái)、論壇、社區(qū)、網(wǎng)站、微博、貼吧、博客、應(yīng)用下載平臺(tái)等。比如,當(dāng)用戶在網(wǎng)站上注冊(cè)并通過認(rèn)證之后,擁有該網(wǎng)站的用戶身份信息,成為該網(wǎng)站的用戶,用戶可以在網(wǎng)站中展示其用戶行為,例如發(fā)布文章、發(fā)布產(chǎn)品、發(fā)微博、發(fā)帖、回復(fù)評(píng)論等,還可以對(duì)其他發(fā)布的信息進(jìn)行評(píng)論、點(diǎn)贊等。針對(duì)上述評(píng)論內(nèi)容,某些用戶可能會(huì)發(fā)布大量?jī)?nèi)容相同或相近的垃圾評(píng)論,例如廣告評(píng)論,推銷評(píng)論,含有反動(dòng)、暴力、色情、超鏈接、謾罵、誹謗等不良影響的評(píng)論。
可以理解的是,可以預(yù)先設(shè)置黑名單庫(kù),所述黑名單庫(kù)中包含有多個(gè)特征信息。
一些實(shí)施方式中,所述特征信息包括用戶名、用戶ID、聯(lián)系方式、關(guān)鍵字、關(guān)鍵字的諧音中的任意一種或者多種。
可以理解的是,所述聯(lián)系方式的格式可以為字母和數(shù)字的組合,長(zhǎng)度超過7個(gè)字節(jié)。比如電話號(hào)碼、手機(jī)號(hào)碼、微信號(hào)碼、QQ號(hào)碼。
例如,所述關(guān)鍵字可以包括超鏈接與廣告詞、違禁詞、特殊符號(hào)等。
例如,用戶提交的用戶評(píng)論中包含有超鏈接與廣告詞,比如包括產(chǎn)品推銷、店鋪或網(wǎng)站推薦、公司宣傳、業(yè)務(wù)推廣等。所述超鏈接一般以網(wǎng)址形式出現(xiàn),會(huì)出現(xiàn)多個(gè)連續(xù)英文字母字符,如http://...,將所述“http”字符設(shè)置為關(guān)鍵字,可以通過掃描用戶評(píng)論中的關(guān)鍵字來(lái)檢測(cè)是否含有超鏈接;若包含有超鏈接,即認(rèn)為所述用戶評(píng)論可能為垃圾評(píng)論,則進(jìn)一步再判斷是否包含有廣告詞。針對(duì)廣告詞,比如將QQ、特價(jià)、熱賣、淘寶、包郵等詞匯設(shè)置為所述公告詞的關(guān)鍵字,還包括將任意數(shù)字與“元”的組合設(shè)置為特征信息。當(dāng)用戶評(píng)論中包含有所述關(guān)鍵字時(shí),則確定所述用戶評(píng)論中的評(píng)論信息存在黑名單庫(kù)中,則執(zhí)行步驟S205。
例如,所述違禁詞為含有人身攻擊的詞匯。
例如,有些用戶在提交用戶評(píng)論時(shí),可能會(huì)在關(guān)鍵字或者評(píng)論信息的文字中間加入特殊符號(hào),以此避開相關(guān)平臺(tái)的對(duì)垃圾評(píng)論的檢測(cè)。因此,可以將“★”、“*”、“#”、“&”等特殊符號(hào)設(shè)置為關(guān)鍵字,作為特征信息存儲(chǔ)到黑名單庫(kù)中。
例如,用戶可能用諧音或者近音代替原來(lái)的關(guān)鍵字,以此避開相關(guān)平臺(tái)的對(duì)垃圾評(píng)論的檢測(cè),比如“捕魚達(dá)人3逋魚提線迦魏新a5a7a9課提線”。因此針對(duì)上述包含有諧音或者近音的情形,可以將關(guān)鍵字的諧音設(shè)置為特征信息存儲(chǔ)到黑名單庫(kù)中。
例如,在某一論壇上用戶提交的用戶評(píng)論為“代開發(fā)票,加Q(22222211)”,檢測(cè)到所述用戶評(píng)論中包含有與黑名單庫(kù)中的聯(lián)系方式相匹配的信息,則執(zhí)行步驟S205。比如,用戶提交的用戶評(píng)論為“深度好文,值得學(xué)習(xí)?!?,檢測(cè)到所述用戶評(píng)論中包未含有與黑名單庫(kù)中的特征信息相匹配的信息,則執(zhí)行步驟S203。
如圖2所示,在某一論壇中,“會(huì)飛的老虎”發(fā)表了標(biāo)題為“手機(jī)里的傳感器”的文章,用戶“碼農(nóng)”在該論壇上提交了內(nèi)容為“爭(zhēng)取早日再來(lái)個(gè)霧霾傳感器”的用戶評(píng)論。當(dāng)判斷用戶提交的用戶評(píng)論中未包含有與黑名單庫(kù)中的特征信息相匹配的信息時(shí),則執(zhí)行步驟S203。
請(qǐng)參閱圖5,圖5為本發(fā)明實(shí)施例提供的一種信息處理方法的第三使用狀態(tài)示意圖。
在某一論壇中,“會(huì)飛的老虎”發(fā)表了標(biāo)題為“手機(jī)里的傳感器”的文章,用戶在該論壇上提交了內(nèi)容為“捕魚達(dá)人3逋魚提線迦魏新a5a7a9課提線”的用戶評(píng)論。當(dāng)判斷用戶提交的用戶評(píng)論中包含有與黑名單庫(kù)中的特征信息相匹配的信息時(shí),則執(zhí)行步驟S205。
在一些實(shí)施方式中,也可是設(shè)置白名單庫(kù),判斷所述用戶評(píng)論中的評(píng)論信息是否存在白名單庫(kù)中,若是則可以將所述用戶評(píng)論確定為非垃圾評(píng)論;若否則可以將所述用戶評(píng)論確定為垃圾評(píng)論。
例如,針對(duì)產(chǎn)品的用戶評(píng)論,與產(chǎn)品相關(guān)的用戶評(píng)論通常歸類為有用信息,因此可以通過篩選與產(chǎn)品描述相關(guān)的關(guān)聯(lián)詞,比如主題詞或者情感詞來(lái)確實(shí)是否為垃圾評(píng)論。例如以電子商務(wù)平臺(tái)上發(fā)布的產(chǎn)品為例,所述主題詞可以是與產(chǎn)品相關(guān)的核心名詞,可以預(yù)先將關(guān)于產(chǎn)品標(biāo)準(zhǔn)描述的主題詞存儲(chǔ)到白名單庫(kù)中,如果檢測(cè)到用戶針對(duì)該產(chǎn)品提交的評(píng)論信息中未含有產(chǎn)品標(biāo)準(zhǔn)描述中的任何主題詞,則可以將所述用戶評(píng)論確定為垃圾評(píng)論;如果檢測(cè)到用戶針對(duì)該產(chǎn)品提交的評(píng)論信息中含有產(chǎn)品標(biāo)準(zhǔn)描述中的任意一個(gè)或者多個(gè)主題詞時(shí),則可以將所述用戶評(píng)論確定為非垃圾評(píng)論。
例如,所述情感詞包括用戶真實(shí)意愿的表達(dá)自己的主觀性看法、態(tài)度、感覺、情緒等的情感詞匯。比如以對(duì)某一網(wǎng)站銷售的產(chǎn)品的評(píng)價(jià)為例,所述產(chǎn)品的評(píng)論是人們對(duì)產(chǎn)品相關(guān)參數(shù)及購(gòu)買體驗(yàn)的評(píng)價(jià)和議論,人們通過評(píng)論可以真實(shí)的表達(dá)出自己的主觀性看法、態(tài)度、感覺、情緒等。因此,產(chǎn)品評(píng)論必然包含評(píng)論者的情感。情感詞詞數(shù)越少,越有可能屬于垃圾評(píng)論。
步驟S203,遍歷評(píng)論隊(duì)列,判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值;若否,則執(zhí)行步驟S204;若是,則執(zhí)行步驟S205。
可以理解的是,可以通過檢測(cè)評(píng)論隊(duì)列中是否包含有與所述用戶評(píng)論相同或相似的歷史評(píng)論,來(lái)確定所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量。例如,當(dāng)所述用戶評(píng)論中的評(píng)論信息不存在黑名單庫(kù)中時(shí),所述評(píng)論隊(duì)列中還存在大量與所述用戶評(píng)論的內(nèi)容相同或者相似的歷史評(píng)論,當(dāng)內(nèi)容相同或相似的評(píng)論信息的評(píng)論數(shù)量達(dá)到某個(gè)閾值時(shí),也會(huì)妨礙用戶對(duì)有用信息的獲取,實(shí)際上,該重復(fù)內(nèi)容的用戶評(píng)論也可以歸為垃圾評(píng)論。因此為了更準(zhǔn)確的識(shí)別出垃圾評(píng)論,可進(jìn)一步檢測(cè)評(píng)論隊(duì)列中是否包含有與所述用戶評(píng)論相同或者相似的歷史評(píng)論,并判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值。其中,所述評(píng)論隊(duì)列為由歷史評(píng)論組成的先進(jìn)先出隊(duì)列。
一些實(shí)施方式中,所述與用戶評(píng)論相似的評(píng)論包括與所述用戶評(píng)論的相似度達(dá)到第三閾值的歷史評(píng)論??梢酝ㄟ^判斷所述評(píng)論隊(duì)列中存在的與所述用戶評(píng)論的相似度達(dá)到第三閾值的歷史評(píng)論的評(píng)論數(shù)量是否達(dá)到第一閾值,來(lái)確定所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值。
比如,可以通過比對(duì)用戶評(píng)論與評(píng)論隊(duì)列中的歷史評(píng)論中所含有的信息的匹配程度來(lái)確定出所述相似度的大小。比如,所述第三閾值可以為80%,當(dāng)用戶評(píng)論與評(píng)論隊(duì)列中的歷史評(píng)論中所含有的信息的匹配程度達(dá)到90%時(shí),確定為相似;當(dāng)用戶評(píng)論與評(píng)論隊(duì)列中的歷史評(píng)論中所含有的信息的匹配程度達(dá)到100%時(shí),確定為相同。
一些實(shí)施方式中,所述評(píng)論隊(duì)列可以包括鏈?zhǔn)疥?duì)列、數(shù)組隊(duì)列中的任意一種。
可以理解的是,在程序設(shè)計(jì)語(yǔ)言中,隊(duì)列是一種線性表,隊(duì)列的數(shù)據(jù)元素又稱為隊(duì)列元素。在隊(duì)列中插入一個(gè)隊(duì)列元素稱為入隊(duì),從隊(duì)列中刪除一個(gè)隊(duì)列元素成為出隊(duì)。因?yàn)殛?duì)列只允許在一端插入,在另一端刪除,即最早進(jìn)入隊(duì)列的元素才能最先從隊(duì)列中刪除,故隊(duì)列又稱為先進(jìn)先出(FIFO—first in first out)線性表。因此,所述評(píng)論隊(duì)列可以稱為先進(jìn)先出隊(duì)列。
例如,隊(duì)列可以用數(shù)組Q[1…m]來(lái)存儲(chǔ),數(shù)組的上界m即是隊(duì)列所容許的最大容量。在隊(duì)列的運(yùn)算中需設(shè)兩個(gè)指針:head,隊(duì)首指針,指向?qū)嶋H隊(duì)首元素;tail,隊(duì)尾指針,指向?qū)嶋H隊(duì)尾元素的下一個(gè)位置。一般情況下,兩個(gè)指針的初值設(shè)為0,這時(shí)隊(duì)列為空,沒有元素。當(dāng)隊(duì)列元素的個(gè)數(shù)達(dá)到數(shù)組的上界m時(shí),當(dāng)有新的隊(duì)列元素入隊(duì)時(shí),最早進(jìn)入隊(duì)列的隊(duì)列元素從隊(duì)列中刪除。
例如,隊(duì)列也可以用鏈表來(lái)存儲(chǔ),把數(shù)據(jù)在數(shù)學(xué)邏輯上的先后相鄰關(guān)系用元素的存儲(chǔ)地址的指針來(lái)指示,以此形成鏈?zhǔn)疥?duì)列,可以動(dòng)態(tài)地進(jìn)行存儲(chǔ)分配。
例如,所述評(píng)論隊(duì)列為數(shù)組隊(duì)列,則所述評(píng)論隊(duì)列的長(zhǎng)度所具有的第二閾值即為所述數(shù)組隊(duì)列的最大容量,比如為1000條用戶評(píng)論。
比如,當(dāng)檢測(cè)評(píng)論隊(duì)列中包含有與所述用戶評(píng)論相同的歷史評(píng)論時(shí),為了避免評(píng)論隊(duì)列中多次出現(xiàn)重復(fù)內(nèi)容的用戶評(píng)論,進(jìn)而影響用戶的信息獲取效率,可以拒絕對(duì)評(píng)論隊(duì)列進(jìn)行更新,并在記錄與所述用戶評(píng)論相同的歷史評(píng)論的點(diǎn)贊數(shù)組上加1,以表示有其他人發(fā)表與所述歷史評(píng)論的內(nèi)容相同或相似的用戶評(píng)論,或者表示有其他人贊同所述歷史評(píng)論的內(nèi)容。
如圖2所示,比如所述第一閾值為5,所述評(píng)論隊(duì)列中與內(nèi)容為“爭(zhēng)取早日再來(lái)個(gè)霧霾傳感器”的用戶評(píng)論相同的評(píng)論數(shù)量為1,則判定述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量未達(dá)到第一閾值,則執(zhí)行步驟S204。
如圖5所示,比如所述第一閾值為5,所述評(píng)論隊(duì)列中與內(nèi)容為“捕魚達(dá)人3逋魚提線迦魏新a5a7a9課提線”的用戶評(píng)論相同的評(píng)論數(shù)量為7,判定所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量已達(dá)到第一閾值,則執(zhí)行步驟S205。
步驟S204,將所述用戶評(píng)論加入所述評(píng)論隊(duì)列作為隊(duì)首評(píng)論,并將溢出所述第二閾值的隊(duì)尾評(píng)論進(jìn)行刪除。
可以理解的是,所述先進(jìn)先出隊(duì)列的長(zhǎng)度可以預(yù)設(shè)為第二閾值。所述長(zhǎng)度可以用數(shù)組隊(duì)列中的所能容納的數(shù)據(jù)包總數(shù)來(lái)表示,數(shù)組在建立之前需提前設(shè)置為固定的大小,即為每個(gè)隊(duì)列元素設(shè)置一個(gè)合適的字節(jié)長(zhǎng)度,以滿足單個(gè)隊(duì)列元素對(duì)字節(jié)長(zhǎng)度的需求,可以理解為每個(gè)隊(duì)列元素代表一個(gè)數(shù)據(jù)包,每個(gè)數(shù)據(jù)包具有固定的大小,比如數(shù)組為N[1…1000],則所述第二閾值為1000個(gè)。所述先進(jìn)先出隊(duì)列的長(zhǎng)度也可以用鏈?zhǔn)疥?duì)列中的存儲(chǔ)單元的指針個(gè)數(shù)來(lái)表示,鏈表不需要提前分配固定大小的存儲(chǔ)空間,當(dāng)需要存儲(chǔ)數(shù)據(jù)時(shí),可以為每個(gè)隊(duì)列元素設(shè)置一個(gè)合適的存儲(chǔ)單元用于存儲(chǔ)數(shù)據(jù),并將所述存儲(chǔ)單元通過指針與隊(duì)列中的其他的存儲(chǔ)單元鏈接在一起。所述評(píng)論隊(duì)列的內(nèi)容是實(shí)時(shí)變化的,比如,在評(píng)論區(qū)所展示的區(qū)域有新的用戶評(píng)論入隊(duì)列時(shí),將所述用戶評(píng)論添加至評(píng)論隊(duì)列中作為隊(duì)首評(píng)論,作為隊(duì)尾評(píng)論的歷史評(píng)論則出隊(duì)列,其他的歷史評(píng)論的隊(duì)列編號(hào)分別在原來(lái)的基礎(chǔ)上加1。
如圖3所示,所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量小于第一閾值時(shí),對(duì)所述評(píng)論隊(duì)列進(jìn)行更新,將所述用戶評(píng)論“爭(zhēng)取早日再來(lái)個(gè)霧霾傳感器”添加至所述評(píng)論隊(duì)列的隊(duì)首No.1,并刪除位于所述評(píng)論隊(duì)列的隊(duì)尾No.1000的歷史評(píng)論“求甲醛傳感器”。原來(lái)編號(hào)為No.1的歷史評(píng)論“好文章!點(diǎn)贊”的編號(hào)變?yōu)镹o.2,其顯示于編號(hào)No.2的顯示欄位,其余歷史評(píng)論均向后移動(dòng)一個(gè)顯示欄位。
步驟S205,將所述用戶評(píng)論確定為垃圾評(píng)論。
可以理解的是,當(dāng)確定所述用戶評(píng)論為垃圾評(píng)論時(shí),可以拒絕對(duì)評(píng)論隊(duì)列進(jìn)行更新。
請(qǐng)參閱圖6,圖6分別為本發(fā)明實(shí)施例提供的一種信息處理方法的第四使用狀態(tài)示意圖。
當(dāng)確定所述內(nèi)容為“捕魚達(dá)人3逋魚提線迦魏新a5a7a9課提線”的用戶評(píng)論為垃圾評(píng)論時(shí),拒絕對(duì)評(píng)論隊(duì)列進(jìn)行更新。
一些實(shí)施方式中,在拒絕對(duì)評(píng)論隊(duì)列進(jìn)行更新時(shí),還可以彈出提示框,以提醒用戶其評(píng)論信息發(fā)表失敗的提示信息。如圖6所示,當(dāng)用戶點(diǎn)“評(píng)論”按鈕之后,彈出內(nèi)容為“評(píng)論審核未通過:為垃圾評(píng)論!”的提示框,同時(shí)拒絕對(duì)評(píng)論隊(duì)列進(jìn)行更新,所述手機(jī)界面上顯示的發(fā)表評(píng)論的評(píng)論區(qū)沒有變化。
步驟S206,檢測(cè)所述用戶評(píng)論中是否含有聯(lián)系方式,若是則將所述聯(lián)系方式添加到黑名單庫(kù)中作為特征信息。
一些實(shí)施方式中,當(dāng)檢測(cè)到所述用戶評(píng)論中包含有聯(lián)系方式時(shí),且所述聯(lián)系方式為新的聯(lián)系方式時(shí),將所述用戶評(píng)論中提取到的新的聯(lián)系方式新增至所述黑名單庫(kù)中作為特征信息。當(dāng)所述聯(lián)系方式為舊的聯(lián)系方式時(shí),可以對(duì)所述黑名單庫(kù)中原有的聯(lián)系方式進(jìn)行覆蓋,或者不添加到所述黑名單庫(kù)中。
可以理解的是,當(dāng)所述用戶評(píng)論中檢測(cè)到新的聯(lián)系方式時(shí),提取所述新的聯(lián)系方式,并新增至所述黑名單庫(kù)中作為特征信息,以作為下一個(gè)用戶評(píng)論的檢測(cè)依據(jù)。
如圖6所示,比如內(nèi)容為“捕魚達(dá)人3逋魚提線迦魏新a5a7a9課提線”的用戶評(píng)論為垃圾評(píng)論時(shí),提取所述用戶評(píng)論中的新的聯(lián)系方式“a5a7a9”,并將“a5a7a9”新增至所述黑名單庫(kù)中作為特征信息。
本發(fā)明實(shí)施例通過檢測(cè)用戶評(píng)論中是否包含有與黑名單庫(kù)中的特征信息相匹配的信息,以確定所述用戶評(píng)論是否為垃圾評(píng)論,在所述用戶評(píng)論為非垃圾評(píng)論時(shí),遍歷評(píng)論隊(duì)列,且在判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量未達(dá)到第一閾值時(shí),將所述用戶評(píng)論加入所述評(píng)論隊(duì)列作為隊(duì)首評(píng)論,并將溢出所述第二閾值的隊(duì)尾評(píng)論進(jìn)行刪除。本發(fā)明實(shí)施例在識(shí)別出用戶提交的用戶評(píng)論為非垃圾評(píng)論時(shí),進(jìn)一步檢測(cè)內(nèi)容重復(fù)的歷史評(píng)論,以此排除避免加入大量重復(fù)內(nèi)容的用戶評(píng)論,減輕系統(tǒng)運(yùn)行負(fù)擔(dān),有效提高信息處理效率,提升用戶獲取有用信息的效率。
本發(fā)明實(shí)施例還提供一種信息處理裝置,如圖7所示,圖7為本發(fā)明實(shí)施例提供的一種信息處理裝置的結(jié)構(gòu)示意圖。所述信息處理裝置30包括獲取模塊31,第一判斷模塊33,處理模塊34,以及確定模塊35。
其中,所述獲取模塊31,用于獲取用戶評(píng)論。
所述第一判斷模塊33,用于遍歷評(píng)論隊(duì)列,判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值,其中所述評(píng)論隊(duì)列是先進(jìn)先出隊(duì)列且長(zhǎng)度具有第二閾值。
所述確定模塊35,用于當(dāng)判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量達(dá)到第一閾值時(shí),將所述用戶評(píng)論確定為垃圾評(píng)論。
所述處理模塊34,用于當(dāng)判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量未達(dá)到第一閾值時(shí),將所述用戶評(píng)論加入評(píng)論隊(duì)列,并根據(jù)所述第二閾值對(duì)所述評(píng)論隊(duì)列的隊(duì)尾評(píng)論進(jìn)行處理。
請(qǐng)參閱圖8,圖8為本發(fā)明實(shí)施例提供的一種信息處理裝置的另一結(jié)構(gòu)示意圖。所述信息處理裝置30包括獲取模塊31,第二判斷模塊32,第一判斷模塊33,處理模塊34,確定模塊35,以及檢測(cè)模塊36。
其中所述獲取模塊31,用于獲取用戶評(píng)論。
例如,如圖2所示,在某一論壇中,“會(huì)飛的老虎”發(fā)表了標(biāo)題為“手機(jī)里的傳感器”的文章,用戶“碼農(nóng)”在該論壇上提交內(nèi)容為“爭(zhēng)取早日再來(lái)個(gè)霧霾傳感器”的用戶評(píng)論,所述獲取模塊31獲取到該用戶評(píng)論。
所述第二判斷模塊32,用于判斷所述用戶評(píng)論中的評(píng)論信息是否存在黑名單庫(kù)中,若是則將所述用戶評(píng)論確定為垃圾評(píng)論。
可以理解的是,所述用戶評(píng)論中的評(píng)論信息可以包括用戶名、用戶ID、評(píng)論內(nèi)容、評(píng)論發(fā)布時(shí)間等信息。
一些實(shí)施方式中,所述第二判斷模塊32,還用于判斷所述用戶評(píng)論中是否包含有與黑名單庫(kù)中的特征信息相匹配的信息,若是則將所述用戶評(píng)論確定為垃圾評(píng)論。
目前,很多公共平臺(tái)支持用戶之間的互動(dòng)行為,所述公共平臺(tái)的表現(xiàn)形式可以包括電子商務(wù)平臺(tái)、論壇、社區(qū)、網(wǎng)站、微博、貼吧、博客、應(yīng)用下載平臺(tái)等。比如,當(dāng)用戶在網(wǎng)站上注冊(cè)并通過認(rèn)證之后,擁有該網(wǎng)站的用戶身份信息,成為該網(wǎng)站的用戶,用戶可以在網(wǎng)站中展示其用戶行為,例如發(fā)布文章、發(fā)布產(chǎn)品、發(fā)微博、發(fā)帖、回復(fù)評(píng)論等,還可以對(duì)其他發(fā)布的信息進(jìn)行評(píng)論、點(diǎn)贊等。針對(duì)上述評(píng)論內(nèi)容,某些用戶可能會(huì)發(fā)布大量?jī)?nèi)容相同或相近的垃圾評(píng)論,例如廣告評(píng)論,推銷評(píng)論,含有反動(dòng)、暴力、色情、超鏈接、謾罵、誹謗等不良影響的評(píng)論。
可以理解的是,可以預(yù)先設(shè)置黑名單庫(kù),所述黑名單庫(kù)中包含有多個(gè)特征信息。
一些實(shí)施方式中,所述特征信息包括用戶名、用戶ID、聯(lián)系方式、關(guān)鍵字、關(guān)鍵字的諧音中的任意一種或者多種。
可以理解的是,所述聯(lián)系方式的格式可以為字母和數(shù)字的組合,長(zhǎng)度超過7個(gè)字節(jié)。比如電話號(hào)碼、手機(jī)號(hào)碼、微信號(hào)碼、QQ號(hào)碼。
例如,所述關(guān)鍵字可以包括超鏈接與廣告詞、違禁詞、特殊符號(hào)等。
例如,用戶提交的用戶評(píng)論中包含有超鏈接與廣告詞,比如包括產(chǎn)品推銷、店鋪或網(wǎng)站推薦、公司宣傳、業(yè)務(wù)推廣等。所述超鏈接一般以網(wǎng)址形式出現(xiàn),會(huì)出現(xiàn)多個(gè)連續(xù)英文字母字符,如http://...,將所述“http”字符設(shè)置為關(guān)鍵字,可以通過掃描用戶評(píng)論中的關(guān)鍵字來(lái)檢測(cè)是否含有超鏈接;若包含有超鏈接,即認(rèn)為所述用戶評(píng)論可能為垃圾評(píng)論,則進(jìn)一步再判斷是否包含有廣告詞。針對(duì)廣告詞,比如將QQ、特價(jià)、熱賣、淘寶、包郵等詞匯設(shè)置為所述公告詞的關(guān)鍵字,還包括將任意數(shù)字與“元”的組合設(shè)置為特征信息。當(dāng)用戶評(píng)論中包含有所述關(guān)鍵字時(shí),則所述第二判斷模塊32判定所述用戶評(píng)論中的評(píng)論信息存在黑名單庫(kù)中,則將所述用戶評(píng)論確定為垃圾評(píng)論。
例如,所述違禁詞為含有人身攻擊的詞匯。
例如,有些用戶在提交用戶評(píng)論時(shí),可能會(huì)在關(guān)鍵字或者評(píng)論信息的文字中間加入特殊符號(hào),以此避開相關(guān)平臺(tái)的對(duì)垃圾評(píng)論的檢測(cè)。因此,可以將“★”、“*”、“#”、“&”等特殊符號(hào)設(shè)置為關(guān)鍵字,作為特征信息存儲(chǔ)到黑名單庫(kù)中。
例如,用戶可能用諧音或者近音代替原來(lái)的關(guān)鍵字,以此避開相關(guān)平臺(tái)的對(duì)垃圾評(píng)論的檢測(cè),比如“捕魚達(dá)人3逋魚提線迦魏新a5a7a9課提線”。因此針對(duì)上述包含有諧音或者近音的情形,可以將關(guān)鍵字的諧音設(shè)置為特征信息存儲(chǔ)到黑名單庫(kù)中。
例如,在某一論壇上用戶提交的用戶評(píng)論為“代開發(fā)票,加Q(22222211)”,當(dāng)所述第二判斷模塊32判定所述用戶評(píng)論中包含有與黑名單庫(kù)中的聯(lián)系方式相匹配的信息時(shí),則將所述用戶評(píng)論確定為垃圾評(píng)論。
如圖5所示,在某一論壇中,“會(huì)飛的老虎”發(fā)表了標(biāo)題為“手機(jī)里的傳感器”的文章,用戶在該論壇上提交了內(nèi)容為“捕魚達(dá)人3逋魚提線迦魏新a5a7a9課提線”的用戶評(píng)論。當(dāng)所述第二判斷模塊32判定用戶提交的用戶評(píng)論中包含有與黑名單庫(kù)中的特征信息相匹配的信息時(shí),將所述用戶評(píng)論確定為垃圾評(píng)論。
在一些實(shí)施方式中,也可是設(shè)置白名單庫(kù)。所述第二判斷模塊32,也可以用于判斷所述用戶評(píng)論中的評(píng)論信息是否存在白名單庫(kù)中,若是則可以將所述用戶評(píng)論確定為非垃圾評(píng)論;若否則可以將所述用戶評(píng)論確定為垃圾評(píng)論。
例如,針對(duì)產(chǎn)品的用戶評(píng)論,與產(chǎn)品相關(guān)的用戶評(píng)論通常歸類為有用信息,因此可以通過篩選與產(chǎn)品描述相關(guān)的關(guān)聯(lián)詞,比如主題詞或者情感詞來(lái)確實(shí)是否為垃圾評(píng)論。例如以電子商務(wù)平臺(tái)上發(fā)布的產(chǎn)品為例,所述主題詞可以是與產(chǎn)品相關(guān)的核心名詞,可以預(yù)先將關(guān)于產(chǎn)品標(biāo)準(zhǔn)描述的主題詞存儲(chǔ)到白名單庫(kù)中,如果檢測(cè)到用戶針對(duì)該產(chǎn)品提交的評(píng)論信息中未含有產(chǎn)品標(biāo)準(zhǔn)描述中的任何主題詞,則可以將所述用戶評(píng)論確定為垃圾評(píng)論;如果檢測(cè)到用戶針對(duì)該產(chǎn)品提交的評(píng)論信息中含有產(chǎn)品標(biāo)準(zhǔn)描述中的任意一個(gè)或者多個(gè)主題詞時(shí),則可以將所述用戶評(píng)論確定為非垃圾評(píng)論。
例如,所述情感詞包括用戶真實(shí)意愿的表達(dá)自己的主觀性看法、態(tài)度、感覺、情緒等的情感詞匯。比如以對(duì)某一網(wǎng)站銷售的產(chǎn)品的評(píng)價(jià)為例,所述產(chǎn)品的評(píng)論是人們對(duì)產(chǎn)品相關(guān)參數(shù)及購(gòu)買體驗(yàn)的評(píng)價(jià)和議論,人們通過評(píng)論可以真實(shí)的表達(dá)出自己的主觀性看法、態(tài)度、感覺、情緒等。因此,產(chǎn)品評(píng)論必然包含評(píng)論者的情感。情感詞詞數(shù)越少,越有可能屬于垃圾評(píng)論。
所述第一判斷模塊33,用于遍歷評(píng)論隊(duì)列,判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值,其中所述評(píng)論隊(duì)列是先進(jìn)先出隊(duì)列且長(zhǎng)度具有第二閾值。
可以理解的是,可以通過檢測(cè)評(píng)論隊(duì)列中是否包含有與所述用戶評(píng)論相同或相似的歷史評(píng)論,來(lái)確定所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量。例如,當(dāng)所述用戶評(píng)論中的評(píng)論信息不存在黑名單庫(kù)中時(shí),所述評(píng)論隊(duì)列中還存在大量與所述用戶評(píng)論的內(nèi)容相同或者相似的歷史評(píng)論,當(dāng)內(nèi)容相同或相似的評(píng)論信息的評(píng)論數(shù)量達(dá)到某個(gè)閾值時(shí),也會(huì)妨礙用戶對(duì)有用信息的獲取,實(shí)際上,該重復(fù)內(nèi)容的用戶評(píng)論也可以歸為垃圾評(píng)論。因此為了更準(zhǔn)確的識(shí)別出垃圾評(píng)論,可進(jìn)一步檢測(cè)評(píng)論隊(duì)列中是否包含有與所述用戶評(píng)論相同或者相似的歷史評(píng)論,并通過所述第一判斷模塊33判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值。其中,所述評(píng)論隊(duì)列為由歷史評(píng)論組成的先進(jìn)先出隊(duì)列。
一些實(shí)施方式中,所述與用戶評(píng)論相似的評(píng)論包括與所述用戶評(píng)論的相似度達(dá)到第三閾值的歷史評(píng)論??梢酝ㄟ^所述第一判斷模塊33判斷所述評(píng)論隊(duì)列中存在的與所述用戶評(píng)論的相似度達(dá)到第三閾值的歷史評(píng)論的評(píng)論數(shù)量是否達(dá)到第一閾值,來(lái)確定所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值。
比如,可以通過比對(duì)用戶評(píng)論與評(píng)論隊(duì)列中的歷史評(píng)論中所含有的信息的匹配程度來(lái)確定出所述相似度的大小。比如,所述第三閾值可以為80%,當(dāng)用戶評(píng)論與評(píng)論隊(duì)列中的歷史評(píng)論中所含有的信息的匹配程度達(dá)到90%時(shí),確定為相似;當(dāng)用戶評(píng)論與評(píng)論隊(duì)列中的歷史評(píng)論中所含有的信息的匹配程度達(dá)到100%時(shí),確定為相同。
一些實(shí)施方式中,所述評(píng)論隊(duì)列可以包括鏈?zhǔn)疥?duì)列、數(shù)組隊(duì)列中的任意一種。
可以理解的是,在程序設(shè)計(jì)語(yǔ)言中,隊(duì)列是一種線性表,隊(duì)列的數(shù)據(jù)元素又稱為隊(duì)列元素。在隊(duì)列中插入一個(gè)隊(duì)列元素稱為入隊(duì),從隊(duì)列中刪除一個(gè)隊(duì)列元素成為出隊(duì)。因?yàn)殛?duì)列只允許在一端插入,在另一端刪除,即最早進(jìn)入隊(duì)列的元素才能最先從隊(duì)列中刪除,故隊(duì)列又稱為先進(jìn)先出(FIFO—first in first out)線性表。因此,所述評(píng)論隊(duì)列可以稱為先進(jìn)先出隊(duì)列。
例如,隊(duì)列可以用數(shù)組Q[1…m]來(lái)存儲(chǔ),數(shù)組的上界m即是隊(duì)列所容許的最大容量。在隊(duì)列的運(yùn)算中需設(shè)兩個(gè)指針:head,隊(duì)首指針,指向?qū)嶋H隊(duì)首元素;tail,隊(duì)尾指針,指向?qū)嶋H隊(duì)尾元素的下一個(gè)位置。一般情況下,兩個(gè)指針的初值設(shè)為0,這時(shí)隊(duì)列為空,沒有元素。當(dāng)隊(duì)列元素的個(gè)數(shù)達(dá)到數(shù)組的上界m時(shí),當(dāng)有新的隊(duì)列元素入隊(duì)時(shí),最早進(jìn)入隊(duì)列的隊(duì)列元素從隊(duì)列中刪除。
例如,隊(duì)列也可以用鏈表來(lái)存儲(chǔ),把數(shù)據(jù)在數(shù)學(xué)邏輯上的先后相鄰關(guān)系用元素的存儲(chǔ)地址的指針來(lái)指示,以此形成鏈?zhǔn)疥?duì)列,可以動(dòng)態(tài)地進(jìn)行存儲(chǔ)分配。
例如,所述評(píng)論隊(duì)列為數(shù)組隊(duì)列,則所述評(píng)論隊(duì)列的長(zhǎng)度所具有的第二閾值即為所述數(shù)組隊(duì)列的最大容量,比如為1000條用戶評(píng)論。
比如,當(dāng)檢測(cè)評(píng)論隊(duì)列中包含有與所述用戶評(píng)論相同的歷史評(píng)論時(shí),為了避免評(píng)論隊(duì)列中多次出現(xiàn)重復(fù)內(nèi)容的用戶評(píng)論,進(jìn)而影響用戶的信息獲取效率,可以拒絕對(duì)評(píng)論隊(duì)列進(jìn)行更新,并在記錄與所述用戶評(píng)論相同的歷史評(píng)論的點(diǎn)贊數(shù)組上加1,以表示有其他人發(fā)表與所述歷史評(píng)論的內(nèi)容相同或相似的用戶評(píng)論,或者表示有其他人贊同所述歷史評(píng)論的內(nèi)容。
如圖2所示,比如所述第一閾值為5,所述評(píng)論隊(duì)列中與內(nèi)容為“爭(zhēng)取早日再來(lái)個(gè)霧霾傳感器”的用戶評(píng)論相同的評(píng)論數(shù)量為1,則所述第一判斷模塊33判定述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量未達(dá)到第一閾值。
如圖5所示,比如所述第一閾值為5,所述評(píng)論隊(duì)列中與內(nèi)容為“捕魚達(dá)人3逋魚提線迦魏新a5a7a9課提線”的用戶評(píng)論相同的評(píng)論數(shù)量為7,所述第一判斷模塊33判定所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量已達(dá)到第一閾值。
所述處理模塊34,用于將所述用戶評(píng)論加入所述評(píng)論隊(duì)列作為隊(duì)首評(píng)論,并將溢出所述第二閾值的隊(duì)尾評(píng)論進(jìn)行刪除。
可以理解的是,所述先進(jìn)先出隊(duì)列的長(zhǎng)度可以預(yù)設(shè)為第二閾值。所述長(zhǎng)度可以用數(shù)組隊(duì)列中的所能容納的數(shù)據(jù)包總數(shù)來(lái)表示,數(shù)組在建立之前需提前設(shè)置為固定的大小,即為每個(gè)隊(duì)列元素設(shè)置一個(gè)合適的字節(jié)長(zhǎng)度,以滿足單個(gè)隊(duì)列元素對(duì)字節(jié)長(zhǎng)度的需求,可以理解為每個(gè)隊(duì)列元素代表一個(gè)數(shù)據(jù)包,每個(gè)數(shù)據(jù)包具有固定的大小,比如數(shù)組為N[1…1000],則所述第二閾值為1000個(gè)。所述先進(jìn)先出隊(duì)列的長(zhǎng)度也可以用鏈?zhǔn)疥?duì)列中的存儲(chǔ)單元的指針個(gè)數(shù)來(lái)表示,鏈表不需要提前分配固定大小的存儲(chǔ)空間,當(dāng)需要存儲(chǔ)數(shù)據(jù)時(shí),可以為每個(gè)隊(duì)列元素設(shè)置一個(gè)合適的存儲(chǔ)單元用于存儲(chǔ)數(shù)據(jù),并將所述存儲(chǔ)單元通過指針與隊(duì)列中的其他的存儲(chǔ)單元鏈接在一起。所述評(píng)論隊(duì)列的內(nèi)容是實(shí)時(shí)變化的,比如,在評(píng)論區(qū)所展示的區(qū)域有新的用戶評(píng)論入隊(duì)列時(shí),所述處理模塊34將所述用戶評(píng)論添加至評(píng)論隊(duì)列中作為隊(duì)首評(píng)論,作為隊(duì)尾評(píng)論的歷史評(píng)論則出隊(duì)列,其他的歷史評(píng)論的隊(duì)列編號(hào)分別在原來(lái)的基礎(chǔ)上加1。
如圖3所示,所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量小于第一閾值時(shí),對(duì)所述評(píng)論隊(duì)列進(jìn)行更新,所述處理模塊34將所述用戶評(píng)論“爭(zhēng)取早日再來(lái)個(gè)霧霾傳感器”添加至所述評(píng)論隊(duì)列的隊(duì)首No.1,并刪除位于所述評(píng)論隊(duì)列的隊(duì)尾No.1000的歷史評(píng)論“求甲醛傳感器”。原來(lái)編號(hào)為No.1的歷史評(píng)論“好文章!點(diǎn)贊”的編號(hào)變?yōu)镹o.2,其顯示于編號(hào)No.2的顯示欄位,其余歷史評(píng)論均向后移動(dòng)一個(gè)顯示欄位。
所述確定模塊35,用于當(dāng)判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量達(dá)到第一閾值時(shí),將所述用戶評(píng)論確定為垃圾評(píng)論。
可以理解的是,當(dāng)所述確定模塊35確定所述用戶評(píng)論為垃圾評(píng)論時(shí),所述處理模塊34可以拒絕對(duì)評(píng)論隊(duì)列進(jìn)行更新。
如圖6所示,當(dāng)所述確定模塊35確定所述內(nèi)容為“捕魚達(dá)人3逋魚提線迦魏新a5a7a9課提線”的用戶評(píng)論為垃圾評(píng)論時(shí),所述處理模塊34拒絕對(duì)評(píng)論隊(duì)列進(jìn)行更新。
一些實(shí)施方式中,所述處理模塊34在拒絕對(duì)評(píng)論隊(duì)列進(jìn)行更新時(shí),還可以彈出提示框,以提醒用戶其評(píng)論信息發(fā)表失敗的提示信息。如圖6所示,當(dāng)用戶點(diǎn)“評(píng)論”按鈕之后,彈出內(nèi)容為“評(píng)論審核未通過:為垃圾評(píng)論!”的提示框,同時(shí)拒絕對(duì)評(píng)論隊(duì)列進(jìn)行更新,所述手機(jī)界面上顯示的發(fā)表評(píng)論的評(píng)論區(qū)沒有變化。
所述檢測(cè)模塊36,用于當(dāng)所述用戶評(píng)論確定為垃圾評(píng)論時(shí),檢測(cè)所述用戶評(píng)論中是否含有聯(lián)系方式,若是則將所述聯(lián)系方式添加到黑名單庫(kù)中作為特征信息。
一些實(shí)施方式中,當(dāng)所述檢測(cè)模塊36檢測(cè)到所述用戶評(píng)論中包含有聯(lián)系方式時(shí),且所述聯(lián)系方式為新的聯(lián)系方式時(shí),將所述用戶評(píng)論中提取到的新的聯(lián)系方式新增至所述黑名單庫(kù)中作為特征信息。當(dāng)所述聯(lián)系方式為舊的聯(lián)系方式時(shí),可以對(duì)所述黑名單庫(kù)中原有的聯(lián)系方式進(jìn)行覆蓋,或者不添加到所述黑名單庫(kù)中。
可以理解的是,當(dāng)所述用戶評(píng)論中檢測(cè)到新的聯(lián)系方式時(shí),提取所述新的聯(lián)系方式,并新增至所述黑名單庫(kù)中作為特征信息,以作為下一個(gè)用戶評(píng)論的檢測(cè)依據(jù)。
如圖6所示,比如內(nèi)容為“捕魚達(dá)人3逋魚提線迦魏新a5a7a9課提線”的用戶評(píng)論為垃圾評(píng)論時(shí),提取所述用戶評(píng)論中的新的聯(lián)系方式“a5a7a9”,并將“a5a7a9”新增至所述黑名單庫(kù)中作為特征信息。
本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)設(shè)備,如圖9所示,圖9為本發(fā)明實(shí)施例提供的一種計(jì)算機(jī)設(shè)備的結(jié)構(gòu)示意圖。該計(jì)算機(jī)設(shè)備400可以包括射頻(RF,Radio Frequency)電路401、包括有一個(gè)或一個(gè)以上計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的存儲(chǔ)器402、輸入單元403、顯示單元404、傳感器405、音頻電路406、無(wú)線保真(WiFi,Wireless Fidelity)模塊407、包括有一個(gè)或者一個(gè)以上處理核心的處理器408、以及電源409等部件。本領(lǐng)域技術(shù)人員可以理解,圖9中示出的計(jì)算機(jī)設(shè)備結(jié)構(gòu)并不構(gòu)成對(duì)計(jì)算機(jī)設(shè)備的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
射頻電路401可用于收發(fā)信息,或通話過程中信號(hào)的接收和發(fā)送。
存儲(chǔ)器402可用于存儲(chǔ)應(yīng)用程序和數(shù)據(jù)。存儲(chǔ)器402存儲(chǔ)的應(yīng)用程序中包含有計(jì)算機(jī)程序。
輸入單元403可用于接收輸入的數(shù)字、字符信息或用戶特征信息(比如指紋),以及產(chǎn)生與用戶設(shè)置以及功能控制有關(guān)的鍵盤、鼠標(biāo)、操作桿、光學(xué)或者軌跡球信號(hào)輸入。
顯示單元404可用于顯示由用戶輸入的信息或提供給用戶的信息以及計(jì)算機(jī)設(shè)備的各種圖形用戶接口,這些圖形用戶接口可以由圖形、文本、圖標(biāo)、視頻和其任意組合來(lái)構(gòu)成。
計(jì)算機(jī)設(shè)備還可包括至少一種傳感器405,比如光傳感器、運(yùn)動(dòng)傳感器以及其他傳感器。
音頻電路406可通過揚(yáng)聲器、傳聲器提供用戶與計(jì)算機(jī)設(shè)備之間的音頻接口。
無(wú)線保真(WiFi)模塊407可用于短距離無(wú)線傳輸,可以幫助用戶收發(fā)電子郵件、瀏覽網(wǎng)站和訪問流式媒體等,它為用戶提供了無(wú)線的寬帶互聯(lián)網(wǎng)訪問。
處理器408是計(jì)算機(jī)設(shè)備的控制中心,利用各種接口和線路鏈接整個(gè)計(jì)算機(jī)設(shè)備的各個(gè)部分,通過運(yùn)行或執(zhí)行存儲(chǔ)在存儲(chǔ)器402內(nèi)的應(yīng)用程序,以及調(diào)用存儲(chǔ)在存儲(chǔ)器402內(nèi)的數(shù)據(jù),執(zhí)行計(jì)算機(jī)設(shè)備的各種功能和處理數(shù)據(jù),從而對(duì)計(jì)算機(jī)設(shè)備進(jìn)行整體監(jiān)控。
計(jì)算機(jī)設(shè)備還包括給各個(gè)部件供電的電源409(比如電池)。
盡管圖9中未示出,計(jì)算機(jī)設(shè)備還可以包括攝像頭、藍(lán)牙模塊等,在此不再贅述。
具體在本實(shí)施例中,計(jì)算機(jī)設(shè)備中的處理器408會(huì)按照如下的指令,將一個(gè)或一個(gè)以上的應(yīng)用程序的進(jìn)程對(duì)應(yīng)的計(jì)算機(jī)程序加載到存儲(chǔ)器402中,并由處理器408來(lái)運(yùn)行存儲(chǔ)在存儲(chǔ)器402中的應(yīng)用程序,執(zhí)行如下操作:
獲取用戶評(píng)論;
遍歷評(píng)論隊(duì)列,判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值,其中所述評(píng)論隊(duì)列是先進(jìn)先出隊(duì)列且長(zhǎng)度具有第二閾值;
若是,則將所述用戶評(píng)論確定為垃圾評(píng)論;
若否,則將所述用戶評(píng)論加入評(píng)論隊(duì)列,并根據(jù)所述第二閾值對(duì)所述評(píng)論隊(duì)列的隊(duì)尾評(píng)論進(jìn)行處理。
一些實(shí)施方式中,處理器408用于所述將所述用戶評(píng)論加入評(píng)論隊(duì)列,并根據(jù)所述第二閾值對(duì)所述評(píng)論隊(duì)列的隊(duì)尾評(píng)論進(jìn)行處理,包括:
將所述用戶評(píng)論加入所述評(píng)論隊(duì)列作為隊(duì)首評(píng)論,并將溢出所述第二閾值的隊(duì)尾評(píng)論進(jìn)行刪除。
一些實(shí)施方式中,處理器408用于在所述獲取用戶評(píng)論之后,還包括:
判斷所述用戶評(píng)論中的評(píng)論信息是否存在黑名單庫(kù)中,若是則將所述用戶評(píng)論確定為垃圾評(píng)論。
一些實(shí)施方式中,處理器408用于所述判斷所述用戶評(píng)論中的評(píng)論信息是否存在黑名單庫(kù)中,包括:
判斷所述用戶評(píng)論中是否包含有與黑名單庫(kù)中的特征信息相匹配的信息,若是則確定所述用戶評(píng)論中的評(píng)論信息存在黑名單庫(kù)中。
一些實(shí)施方式中,處理器408還用于:
當(dāng)所述用戶評(píng)論確定為垃圾評(píng)論時(shí),檢測(cè)所述用戶評(píng)論中是否含有聯(lián)系方式,若是則將所述聯(lián)系方式添加到黑名單庫(kù)中。
一些實(shí)施方式中,處理器408用于所述判斷所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量是否達(dá)到第一閾值,包括:
判斷所述評(píng)論隊(duì)列中存在的與所述用戶評(píng)論的相似度達(dá)到第三閾值的歷史評(píng)論的評(píng)論數(shù)量是否達(dá)到第一閾值,若是則確定所述評(píng)論隊(duì)列中與所述用戶評(píng)論相同或者相似的評(píng)論數(shù)量達(dá)到第一閾值。
在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
本發(fā)明實(shí)施例中,所述信息處理裝置與上文實(shí)施例中的一種信息處理方法屬于同一構(gòu)思,在所述信息處理裝置上可以運(yùn)行所述信息處理方法實(shí)施例中提供的任一方法,其具體實(shí)現(xiàn)過程詳見所述信息處理方法實(shí)施例,此處不再贅述。
需要說(shuō)明的是,對(duì)本發(fā)明所述信息處理方法而言,本領(lǐng)域普通測(cè)試人員可以理解實(shí)現(xiàn)本發(fā)明實(shí)施例所述信息處理方法的全部或部分流程,是可以通過計(jì)算機(jī)程序來(lái)控制相關(guān)的硬件來(lái)完成,所述計(jì)算機(jī)程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,如存儲(chǔ)在計(jì)算機(jī)設(shè)備的存儲(chǔ)器中,并被該計(jì)算機(jī)設(shè)備內(nèi)的至少一個(gè)處理器執(zhí)行,在執(zhí)行過程中可包括如所述信息處理方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)器(ROM,Read Only Memory)、隨機(jī)存取記憶體(RAM,Random Access Memory)等。
對(duì)本發(fā)明實(shí)施例的所述信息處理裝置而言,其各功能模塊可以集成在一個(gè)處理芯片中,也可以是各個(gè)模塊單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上模塊集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,所述存儲(chǔ)介質(zhì)譬如為只讀存儲(chǔ)器,磁盤或光盤等。
以上對(duì)本發(fā)明實(shí)施例所提供的一種信息處理方法、裝置及計(jì)算機(jī)設(shè)備進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的技術(shù)方案及其核心思想;本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例的技術(shù)方案的范圍。