一種產(chǎn)品垃圾評論者檢測系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種產(chǎn)品垃圾評論者檢測系統(tǒng),包括:預(yù)處理及數(shù)據(jù)輸入模塊,用于對回復(fù)數(shù)據(jù)集進(jìn)行預(yù)處理,過濾無效的回復(fù),得到新的回復(fù)數(shù)據(jù)集,然后將評論數(shù)據(jù)集、回復(fù)數(shù)據(jù)集、評論者集合、回復(fù)者集合、商店集合和產(chǎn)品集合輸入模型計(jì)算模塊;模型計(jì)算模塊,包括評論者可信度模型、評論真實(shí)度模型和商店可靠性模型,用于迭代計(jì)算評論者可信度、評論真實(shí)度和商店可靠性;以及結(jié)果輸出模塊,用于輸出計(jì)算得到的評論者可信度,得到最終的檢測結(jié)果。該系統(tǒng)檢測速度快,準(zhǔn)確度高,通用性強(qiáng)。
【專利說明】一種產(chǎn)品垃圾評論者檢測系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及垃圾評論者識別【技術(shù)領(lǐng)域】,更具體地,涉及一種產(chǎn)品垃圾評論者檢測系統(tǒng)。
【背景技術(shù)】
[0002]當(dāng)前,有很多技術(shù)方法可用于產(chǎn)品垃圾評論者檢測。傳統(tǒng)的垃圾評論者檢測采用檢測評論者行為的方法,該方法能夠準(zhǔn)確地檢測出具有特定類型的垃圾評論者,如發(fā)表重復(fù)評論的垃圾評論者。但是對于發(fā)表非重復(fù)評論的垃圾評論者,則無法檢測。另一方面,現(xiàn)在的大部分的垃圾評論者為了避免被識別,不會寫大量的重復(fù)評論。
[0003]在現(xiàn)有技術(shù)中,還存在著一些新式的垃圾評論者檢測技術(shù)方法。新式的垃圾評論者檢測方法利用評論者、評論、商店的關(guān)系檢測垃圾評論者。新式的垃圾評論者檢測方法迭代計(jì)算每個(gè)評論者的可信度,評論者可信度與他所發(fā)表的評論真實(shí)度有關(guān),真實(shí)度越高其可信度就越高;真實(shí)度與商店可靠性有關(guān),而商店可靠度和評論者可信度有關(guān)。
[0004]然而,新式垃圾評論者檢測有其自身的特點(diǎn),與傳統(tǒng)垃圾評論者檢測有所不同。新式的垃圾評論者檢測方法典型地使用評論數(shù)據(jù)的內(nèi)部關(guān)系,不僅能檢測出寫重復(fù)評論的垃圾評論者,而且能檢測出發(fā)表非重復(fù)的垃圾評論者。
[0005]目前的垃圾評論者檢測方法沒有充分考慮新式垃圾評論者檢測的結(jié)構(gòu)特點(diǎn),而且只能適用于特定類型的垃圾評論者檢測。隨著近年來互聯(lián)網(wǎng)的高速發(fā)展,在利益驅(qū)使下,產(chǎn)品評論中已經(jīng)出現(xiàn)了大量垃圾評論者,需要對垃圾評論者進(jìn)行檢測,這就對垃圾評論者檢測技術(shù)提出了一個(gè)挑戰(zhàn):如何構(gòu)建一個(gè)統(tǒng)一有效的產(chǎn)品垃圾評論者原型系統(tǒng)來檢測出不同類型的垃圾評論者。因此,人們迫切希望有一種高效準(zhǔn)確的垃圾評論者檢測方法,該方法能夠檢測出不同類型的垃圾評論者。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于提供一種產(chǎn)品垃圾評論者檢測系統(tǒng),該系統(tǒng)檢測速度快,準(zhǔn)確度度高,通用性強(qiáng)。
[0007]為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:一種產(chǎn)品垃圾評論者檢測系統(tǒng),包括:
[0008]預(yù)處理及數(shù)據(jù)輸入模塊,用于對回復(fù)數(shù)據(jù)集進(jìn)行預(yù)處理,過濾無效的回復(fù),得到新的回復(fù)數(shù)據(jù)集,然后將評論數(shù)據(jù)集、回復(fù)數(shù)據(jù)集、評論者集合、回復(fù)者集合、商店集合和產(chǎn)品集合輸入模型計(jì)算模塊;
[0009]模型計(jì)算模塊,包括評論者可信度模型、評論真實(shí)度模型和商店可靠性模型,用于迭代計(jì)算評論者可信度、評論真實(shí)度和商店可靠性;以及
[0010]結(jié)果輸出模塊,用于輸出計(jì)算得到的評論者可信度,得到最終的檢測結(jié)果。
[0011]進(jìn)一步的,所述預(yù)處理及數(shù)據(jù)輸入模塊按如下方法過濾無效的回復(fù):
[0012]a)如果回復(fù)者在評論數(shù)據(jù)集中沒有評論,則判定該回復(fù)者是不可信的回復(fù)者,刪除該回復(fù)者的回復(fù);[0013]b)刪除重復(fù)的回復(fù),即刪除同一個(gè)回復(fù)者針對同一個(gè)評論者且針對同一個(gè)產(chǎn)品的多次回復(fù),只計(jì)一次回復(fù);
[0014]c)刪除評論者對自己評論的回復(fù)。
[0015]進(jìn)一步的,所述評論者可信度模型為:
【權(quán)利要求】
1.一種產(chǎn)品垃圾評論者檢測系統(tǒng),其特征在于,包括: 預(yù)處理及數(shù)據(jù)輸入模塊,用于對回復(fù)數(shù)據(jù)集進(jìn)行預(yù)處理,過濾無效的回復(fù),得到新的回復(fù)數(shù)據(jù)集,然后將評論數(shù)據(jù)集、回復(fù)數(shù)據(jù)集、評論者集合、回復(fù)者集合、商店集合和產(chǎn)品集合輸入模型計(jì)算模塊; 模型計(jì)算模塊,包括評論者可信度模型、評論真實(shí)度模型和商店可靠性模型,用于迭代計(jì)算評論者可信度、評論真實(shí)度和商店可靠性;以及 結(jié)果輸出模塊,用于輸出計(jì)算得到的評論者可信度,得到最終的檢測結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種產(chǎn)品垃圾評論者檢測系統(tǒng),其特征在于,所述預(yù)處理及數(shù)據(jù)輸入模塊按如下方法過濾無效的回復(fù): a)如果回復(fù)者在評論數(shù)據(jù)集中沒有評論,則判定該回復(fù)者是不可信的回復(fù)者,刪除該回復(fù)者的回復(fù); b)刪除重復(fù)的回復(fù),即刪除同一個(gè)回復(fù)者針對同一個(gè)評論者且針對同一個(gè)產(chǎn)品的多次回復(fù),只計(jì)一次回復(fù); c)刪除評論者對自己評論的回復(fù)。
3.根據(jù)權(quán)利要求1所述的一種產(chǎn)品垃圾評論者檢測系統(tǒng),其特征在于,所述評論者可信度模型為:
4.根據(jù)權(quán)利要求3所述的一種產(chǎn)品垃圾評論者檢測系統(tǒng),其特征在于,所述模型計(jì)算模塊根據(jù)輸入的評論數(shù)據(jù)集、回復(fù)數(shù)據(jù)集、評論者集合、回復(fù)者集合、商店集合和產(chǎn)品集合,按如下步驟迭代計(jì)算評論者可信度、評論真實(shí)度和商店可靠性: 步驟(1)初始化商店s的商店可靠性R(s)=l,評論者r的評論者可信度T(r)=l ; 步驟(2)計(jì)算評論V的評論真實(shí)度H(V); 步驟(3)根據(jù)步驟(2)得到的評論真實(shí)度,計(jì)算評論者r所有評論的評論真實(shí)度總和Hr ; 步驟(4)根據(jù)步驟(3)得到的結(jié)果,計(jì)算評論者的評論者可信度T (r); 步驟(5)根據(jù)步驟⑵和步驟⑷得到的評論真實(shí)度和評論者可信度,計(jì)算產(chǎn)品i的產(chǎn)品滿意度PS ; 步驟(6)根據(jù)步驟(5)得到的產(chǎn)品滿意度,計(jì)算商店可靠性R(S); 步驟(7)利用步驟(4)和步驟(6)更新的評論者可信度T(r)和商店可靠性R(s)返回步驟(2),重復(fù)步驟(2)-(5)進(jìn)行迭代,直至第i次迭代和第i+1次迭代得到的評論者可信度的向量和(i+1滿足1-cos ((” ^ i+1) < e , e為一設(shè)定閾值,輸出評論者r的評論者可信度。
【文檔編號】G06F17/30GK103745001SQ201410034998
【公開日】2014年4月23日 申請日期:2014年1月24日 優(yōu)先權(quán)日:2014年1月24日
【發(fā)明者】陳國龍, 廖祥文, 林秀嬌, 劉月, 魏晶晶 申請人:福州大學(xué)