一種識(shí)別特定用戶的方法和裝置制造方法
【專利摘要】本申請(qǐng)?zhí)峁┝艘环N識(shí)別特定用戶的方法和裝置,其中所述方法包括:從交易平臺(tái)中提取交易評(píng)價(jià)信息的樣本;從所述交易評(píng)價(jià)信息的樣本中篩選出聚類用的交易評(píng)價(jià)信息;從所述聚類用的交易評(píng)價(jià)信息中提取評(píng)價(jià)用戶作為候選用戶;按各候選用戶分別組織對(duì)應(yīng)的第一評(píng)價(jià)信息集合和第二評(píng)價(jià)信息集合;統(tǒng)計(jì)所述第二評(píng)價(jià)信息集合在第一評(píng)價(jià)信息集合中的占比,若超過第一閾值,則判定為特定用戶。本申請(qǐng)可以用來提高賣家信用的真實(shí)有效性,提高搜索準(zhǔn)確性,并減輕服務(wù)器的負(fù)擔(dān),減少網(wǎng)絡(luò)資源的占用。
【專利說明】—種識(shí)別特定用戶的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及電子交易平臺(tái)數(shù)據(jù)處理的【技術(shù)領(lǐng)域】,特別是涉及一種特定用戶的方法和一種識(shí)別特定用戶的裝置。
【背景技術(shù)】
[0002]電子商務(wù)(Electronic Commerce, EC)是指在全球各地廣泛的商業(yè)貿(mào)易活動(dòng)中,在因特網(wǎng)開放的網(wǎng)絡(luò)環(huán)境下,基于網(wǎng)絡(luò)通訊技術(shù),買賣雙方可不謀面地進(jìn)行各種商貿(mào)活動(dòng),實(shí)現(xiàn)消費(fèi)者的網(wǎng)上購物、商戶之間的網(wǎng)上交易和在線電子支付,以及各種商務(wù)活動(dòng)、交易活動(dòng)、金融活動(dòng)和相關(guān)的綜合服務(wù)活動(dòng)的一種新型的商業(yè)運(yùn)營模式。電子商務(wù)涵蓋的范圍很廣,一般可分為企業(yè)對(duì)企業(yè)(Business-to-Business,B2B)、企業(yè)對(duì)消費(fèi)者(Business-to-Customer, B2C)或消費(fèi)者對(duì)消費(fèi)者(Customer-to-Customer, C2C)等模式。近幾年來,國內(nèi)電子商務(wù)迅速發(fā)展,各種B2B、C2C、B2C模式的電子商務(wù)網(wǎng)站(俗稱購物網(wǎng)站),如淘寶網(wǎng)、當(dāng)當(dāng)網(wǎng)、卓越亞馬遜、拍拍網(wǎng)、京東商城等,已被網(wǎng)民認(rèn)可和接受。
[0003]為了幫助廣大消費(fèi)者對(duì)網(wǎng)上賣家提供的商品和服務(wù)進(jìn)行甄別,目前的電子商務(wù)平臺(tái)一般都會(huì)提供交易評(píng)價(jià)的功能,對(duì)商品和服務(wù)的質(zhì)量以直觀的方式,允許購買以后的買家進(jìn)行打分,或者留下具體的文字、圖片的描述,從而幫助更多的買家進(jìn)行購買時(shí)的參考決策。例如,當(dāng)買家與賣家完成一筆交易后,買家按照評(píng)價(jià)系統(tǒng)提供的“好評(píng)”、“中評(píng)”與“差評(píng)”的參數(shù)選項(xiàng),選擇其中一個(gè)評(píng)價(jià)參數(shù),并給出相應(yīng)的說明?;蛉纾I家按照電子商務(wù)網(wǎng)站中設(shè)置的評(píng)價(jià)參數(shù)選項(xiàng),比如,商品質(zhì)量、賣家服務(wù)態(tài)度、物流速度等,選擇其相應(yīng)級(jí)別進(jìn)行打分,根據(jù)分?jǐn)?shù)對(duì)應(yīng)到關(guān)聯(lián)的“好評(píng)”、“中評(píng)”或“差評(píng)”的評(píng)價(jià)參數(shù),并給出相應(yīng)說明。
[0004]電子商務(wù)平臺(tái)作為充分競(jìng)爭(zhēng)的網(wǎng)上交易平臺(tái),大量的賣家之間存在著良性和非良性的競(jìng)爭(zhēng)關(guān)系。在非良性的競(jìng)爭(zhēng)關(guān)系中,表現(xiàn)之一就是在購買對(duì)方的商品和服務(wù)以后進(jìn)行評(píng)價(jià)時(shí)對(duì)賣家進(jìn)行惡意詆毀。目前我國的網(wǎng)上交易并未實(shí)行對(duì)買家、賣家的實(shí)名制,因此買家的評(píng)價(jià)過程和內(nèi)容,對(duì)于電子商務(wù)平臺(tái)本身是不可控的。一些買家利用這一特點(diǎn),對(duì)購買以后的商品或者服務(wù)做出惡意詆毀的評(píng)價(jià),混淆消費(fèi)者的判斷,目前的電子商務(wù)平臺(tái)只能弓丨導(dǎo)買家自行注意鑒別,但買家自行鑒別的困難巨大。同時(shí),現(xiàn)在的網(wǎng)上交易中還存在一種特定用戶——職業(yè)差評(píng)師,即通過購買由競(jìng)爭(zhēng)對(duì)手指定的電子商務(wù)平臺(tái)賣家的商品或者服務(wù),購買結(jié)束以后,惡意詆毀所購買的商品或者服務(wù)質(zhì)量,以達(dá)到打擊競(jìng)爭(zhēng)對(duì)手并且個(gè)人從中牟利的買家用戶。一些職業(yè)差評(píng)師買家在評(píng)價(jià)時(shí)往往附上圖片、詳細(xì)的文字描述,更增加了買家識(shí)別上的難度。職業(yè)差評(píng)師的存在,不僅嚴(yán)重干擾的網(wǎng)絡(luò)秩序,還會(huì)影響賣家信用的真實(shí)性,而賣家信用往往是電子商務(wù)網(wǎng)站搜索排序的重要參數(shù),虛假的賣家信用導(dǎo)致優(yōu)質(zhì)的搜索結(jié)果的排序降低,相應(yīng)的劣質(zhì)的搜索結(jié)果排序上升,這將嚴(yán)重影響到搜索結(jié)果的準(zhǔn)確性,導(dǎo)致用戶需要時(shí)間和精力去分辨,甚至需要重新搜索等,這不但加重了訪問服務(wù)器的負(fù)擔(dān),而且浪費(fèi)了網(wǎng)絡(luò)資源。
[0005]因此,目前需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問題就是:提出一種識(shí)別特定用戶及其評(píng)價(jià)信息的機(jī)制,用以提高賣家信用的真實(shí)有效性,提高搜索準(zhǔn)確性,并減輕服務(wù)器的負(fù)擔(dān),減少網(wǎng)絡(luò)資源的占用。
【發(fā)明內(nèi)容】
[0006]本申請(qǐng)的目的是提供一種識(shí)別特定用戶的方法和裝置,用以打擊網(wǎng)絡(luò)犯罪,維護(hù)網(wǎng)絡(luò)交易的秩序,提聞賣家/[目用的真實(shí)有效性,提聞搜索準(zhǔn)確性,并減輕服務(wù)器的負(fù)擔(dān),減少網(wǎng)絡(luò)資源的占用。
[0007]為了解決上述問題,本申請(qǐng)實(shí)施例公開了一種識(shí)別特定用戶的方法,包括:
[0008]從交易平臺(tái)中提取交易評(píng)價(jià)信息的樣本,所述交易評(píng)價(jià)信息包括交易信息及對(duì)應(yīng)的評(píng)價(jià)用戶和評(píng)價(jià)信息;
[0009]從所述交易評(píng)價(jià)信息的樣本中篩選出聚類用的交易評(píng)價(jià)信息;
[0010]從所述聚類用的交易評(píng)價(jià)信息中提取評(píng)價(jià)用戶作為候選用戶;
[0011]按各候選用戶分別組織對(duì)應(yīng)的第一評(píng)價(jià)信息集合和第二評(píng)價(jià)信息集合,其中,所述第一評(píng)價(jià)信息集合為各候選用戶在所述交易評(píng)價(jià)信息的樣本中對(duì)應(yīng)的評(píng)價(jià)信息集合;所述第二評(píng)價(jià)信息集合為各候選用戶在聚類用的交易評(píng)價(jià)信息中對(duì)應(yīng)的評(píng)價(jià)信息集合;
[0012]統(tǒng)計(jì)所述第二評(píng)價(jià)信息集合在第一評(píng)價(jià)信息集合中的占比,若超過第一閾值,則判定為特定用戶。
[0013]優(yōu)選地,所述從交易評(píng)價(jià)信息的樣本中篩選出聚類用的交易評(píng)價(jià)信息的步驟包括:
[0014]若所述評(píng)價(jià)信息為中評(píng)或差評(píng),則將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)
信息;
[0015]和/ 或,
[0016]若所述評(píng)價(jià)信息中的交易評(píng)分值低于第二閾值,則將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)信息;
[0017]和/ 或,
[0018]若所述評(píng)價(jià)信息中的評(píng)價(jià)內(nèi)容包括預(yù)置的差評(píng)關(guān)鍵詞,則將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)信息。
[0019]優(yōu)選地,所述交易信息中包括商品信息,所述從交易評(píng)價(jià)信息的樣本中篩選出聚類用的交易評(píng)價(jià)信息的步驟還包括:
[0020]根據(jù)商品信息組織對(duì)應(yīng)的評(píng)價(jià)信息,統(tǒng)計(jì)差評(píng)占比,所述差評(píng)占比為滿足差評(píng)規(guī)則的評(píng)價(jià)信息,在該交易信息對(duì)應(yīng)的所有評(píng)價(jià)信息中所占的比例;其中,所述差評(píng)規(guī)則包括:評(píng)價(jià)信息為中評(píng)或差評(píng);和/或,評(píng)價(jià)信息中的交易評(píng)分值低于第二閾值;和/或,評(píng)價(jià)信息中的評(píng)價(jià)內(nèi)容包括預(yù)置的差評(píng)關(guān)鍵詞;
[0021]根據(jù)所述商品信息組織對(duì)應(yīng)的評(píng)價(jià)用戶,計(jì)算評(píng)價(jià)用戶的分散度;
[0022]若存在所述差評(píng)占比大于第三閾值,并且,所述評(píng)價(jià)用戶的分散度高于第四閾值的交易評(píng)價(jià)信息,則去除該條交易評(píng)價(jià)信息。
[0023]優(yōu)選地,所述的方法還包括:
[0024]提取所述特定用戶的特征,訓(xùn)練生成特定用戶的評(píng)定指標(biāo)。
[0025]優(yōu)選地,所述特定用戶的特征包括評(píng)價(jià)用戶的注冊(cè)時(shí)間長(zhǎng)短,購買商品的類目分布,確認(rèn)收貨與作為評(píng)價(jià)的時(shí)間間隔,評(píng)價(jià)內(nèi)容,和/或,在交易平臺(tái)的活動(dòng)行為信息。[0026]優(yōu)選地,所述的方法還包括:
[0027]當(dāng)獲得新的交易評(píng)價(jià)信息時(shí),按照所述評(píng)定指標(biāo)判定當(dāng)前交易評(píng)價(jià)信息中的評(píng)價(jià)用戶是否為特定用戶;
[0028]若是,則屏蔽或刪除所述特定用戶的評(píng)價(jià)信息,或者,降低所述特定用戶的評(píng)價(jià)信息的權(quán)重。
[0029]優(yōu)選地,所述的方法還包括:
[0030]提取所述特定用戶生成黑名單。
[0031]優(yōu)選地,所述的方法還包括:
[0032]當(dāng)獲得新的交易評(píng)價(jià)信息時(shí),提取當(dāng)前交易評(píng)價(jià)信息中的評(píng)價(jià)用戶,判斷所述評(píng)價(jià)用戶是否在黑名單中;
[0033]若是,則屏蔽或刪除所述特定用戶的評(píng)價(jià)信息,或者,降低所述特定用戶的評(píng)價(jià)信息的權(quán)重。
[0034]本申請(qǐng)實(shí)施例還公開了一種識(shí)別特定用戶的裝置,包括:
[0035]樣本采集模塊,用于從交易平臺(tái)中提取交易評(píng)價(jià)信息的樣本,所述交易評(píng)價(jià)信息包括交易信息及對(duì)應(yīng)的評(píng)價(jià)用戶和評(píng)價(jià)信息;
[0036]數(shù)據(jù)清洗模塊,用于從所述交易評(píng)價(jià)信息的樣本中篩選出聚類用的交易評(píng)價(jià)信息;
[0037]用戶提取模塊,用于從所述聚類用的交易評(píng)價(jià)信息中提取評(píng)價(jià)用戶作為候選用戶;
[0038]組織模塊,用于按各候選用戶分別組織對(duì)應(yīng)的第一評(píng)價(jià)信息集合和第二評(píng)價(jià)信息集合,其中,所述第一評(píng)價(jià)信息集合為各候選用戶在所述交易評(píng)價(jià)信息的樣本中對(duì)應(yīng)的評(píng)價(jià)信息集合;所述第二評(píng)價(jià)信息集合為各候選用戶在聚類用的交易評(píng)價(jià)信息中對(duì)應(yīng)的評(píng)價(jià)信息集合;
[0039]識(shí)別模塊,用于統(tǒng)計(jì)所述第二評(píng)價(jià)信息集合在第一評(píng)價(jià)信息集合中的占比,若超過第一閾值,則判定為特定用戶。
[0040]優(yōu)選地,所述數(shù)據(jù)清洗模塊包括:
[0041]第一提取子模塊,用于在所述評(píng)價(jià)信息為中評(píng)或差評(píng)時(shí),將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)信息;
[0042]和/ 或,
[0043]第二提取子模塊,用于在所述評(píng)價(jià)信息中的交易評(píng)分值低于第二閾值時(shí),將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)信息;
[0044]和/ 或,
[0045]第三提取子模塊,用于在所述評(píng)價(jià)信息中的評(píng)價(jià)內(nèi)容包括預(yù)置的差評(píng)關(guān)鍵詞時(shí),將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)信息。
[0046]優(yōu)選地,所述交易信息中包括商品信息,所述數(shù)據(jù)清洗模塊還包括:
[0047]第一計(jì)算子模塊,用于根據(jù)商品信息組織對(duì)應(yīng)的評(píng)價(jià)信息,統(tǒng)計(jì)差評(píng)占比,所述差評(píng)占比為滿足差評(píng)規(guī)則的評(píng)價(jià)信息,在該交易信息對(duì)應(yīng)的所有評(píng)價(jià)信息中所占的比例;其中,所述差評(píng)規(guī)則包括:評(píng)價(jià)信息為中評(píng)或差評(píng);和/或,評(píng)價(jià)信息中的交易評(píng)分值低于第二閾值;和/或,評(píng)價(jià)信息中的評(píng)價(jià)內(nèi)容包括預(yù)置的差評(píng)關(guān)鍵詞;[0048]第二計(jì)算子模塊,用于根據(jù)所述商品信息組織對(duì)應(yīng)的評(píng)價(jià)用戶,計(jì)算評(píng)價(jià)用戶的分散度;
[0049]去除子模塊,用于在存在所述差評(píng)占比大于第三閾值,并且,所述評(píng)價(jià)用戶的分散度高于第四閾值的交易評(píng)價(jià)信息時(shí),去除該條交易評(píng)價(jià)信息。
[0050]優(yōu)選地,所述的裝置還包括:
[0051]聚類建模模塊,用于提取所述特定用戶的特征,訓(xùn)練生成特定用戶的評(píng)定指標(biāo)。
[0052]優(yōu)選地,所述特定用戶的特征包括評(píng)價(jià)用戶的注冊(cè)時(shí)間長(zhǎng)短,購買商品的類目分布,確認(rèn)收貨與作為評(píng)價(jià)的時(shí)間間隔,評(píng)價(jià)內(nèi)容,和/或,在交易平臺(tái)的活動(dòng)行為信息。
[0053]優(yōu)選地,所述的裝置還包括:
[0054]第一用戶識(shí)別處理模塊,用于在獲得新的交易評(píng)價(jià)信息時(shí),按照所述評(píng)定指標(biāo)判定當(dāng)前交易評(píng)價(jià)信息中的評(píng)價(jià)用戶是否為特定用戶;若是,則屏蔽或刪除所述特定用戶的評(píng)價(jià)信息,或者,降低所述特定用戶的評(píng)價(jià)信息的權(quán)重。
[0055]優(yōu)選地,所述的裝置還包括:
[0056]黑名單創(chuàng)建模塊,用于提取所述特定用戶生成黑名單。
[0057]優(yōu)選地,所述的裝置還包括:
[0058]第二用戶識(shí)別處理模塊,用于在獲得新的交易評(píng)價(jià)信息時(shí),提取當(dāng)前交易評(píng)價(jià)信息中的評(píng)價(jià)用戶,判斷所述評(píng)價(jià)用戶是否在黑名單中;若是,則屏蔽或刪除所述特定用戶的評(píng)價(jià)信息,或者,降低所述特定用戶的評(píng)價(jià)信息的權(quán)重。
[0059]與現(xiàn)有技術(shù)相比,本申請(qǐng)包括以下優(yōu)點(diǎn):
[0060]本申請(qǐng)針對(duì)所有的成功交易進(jìn)行評(píng)價(jià)信息取樣,能夠在全局角度,即在交易平臺(tái)所有交易的角度,而不是某一件商品交易的角度,方便地對(duì)職業(yè)差評(píng)師進(jìn)行識(shí)別,具體通過交易平臺(tái)的開放接口獲取到全網(wǎng)的交易評(píng)價(jià)信息后,對(duì)交易評(píng)價(jià)信息進(jìn)行數(shù)據(jù)清洗,然后通過聚類模型,從買家中篩選出職業(yè)差評(píng)師,并把此模型應(yīng)用于更廣泛的買家對(duì)象,建立起長(zhǎng)效機(jī)制,有效打擊了職業(yè)差評(píng)師的網(wǎng)絡(luò)犯罪行為,維護(hù)網(wǎng)上交易的健康秩序;并且保證賣家信用的真實(shí)有效性,還原了商品的真實(shí)信息,使好的交易信息能在用戶搜索時(shí)正常出現(xiàn)在搜索結(jié)果的前列,減少用戶反復(fù)搜索的時(shí)間,從而減輕服務(wù)器的負(fù)擔(dān),減少網(wǎng)絡(luò)資源的占用。
【專利附圖】
【附圖說明】
[0061]圖1是本申請(qǐng)的一種識(shí)別特定用戶的方法實(shí)施例1的步驟流程圖;
[0062]圖2是本申請(qǐng)的一種識(shí)別特定用戶的方法實(shí)施例2的步驟流程圖;
[0063]圖3是本申請(qǐng)的一種識(shí)別特定用戶的方法實(shí)施例3的步驟流程圖;
[0064]圖4是本申請(qǐng)實(shí)施例應(yīng)用在交易平臺(tái)搜索中的步驟流程圖;
[0065]圖5是本申請(qǐng)的一種識(shí)別特定用戶的裝置實(shí)施例的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0066]為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說明。
[0067]一般而言,職業(yè)差評(píng)師的活動(dòng)流程為:獲取由團(tuán)伙主使指定購買的目標(biāo)對(duì)象,購買商品,等待收貨,收到貨物完成以后,對(duì)購買的對(duì)象做出差評(píng)。評(píng)價(jià)完成以后,得到團(tuán)伙主使分配的報(bào)酬。在目前沒有采用實(shí)名制的交易平臺(tái)中,職業(yè)差評(píng)師的存在,不僅嚴(yán)重干擾的網(wǎng)絡(luò)秩序,還會(huì)影響賣家信用的真實(shí)性,還將進(jìn)一步影響到搜索結(jié)果的準(zhǔn)確性,例如,一些好的交易信息會(huì)受到說明欄中說明信息的影響,基于其所獲得的差評(píng),不會(huì)與好評(píng)的交易信息一同排在搜索結(jié)果的前列,導(dǎo)致用戶需要時(shí)間和精力去分辨,甚至需要重新搜索等,這不但加重了訪問服務(wù)器的負(fù)擔(dān),而且浪費(fèi)了網(wǎng)絡(luò)資源。
[0068]針對(duì)上述問題,本申請(qǐng)發(fā)明人提出本申請(qǐng)實(shí)施例的核心構(gòu)思之一在于,針對(duì)所有的成功交易進(jìn)行評(píng)價(jià)信息取樣,能夠在全局角度,即在交易平臺(tái)所有交易的角度,而不是某一件商品交易的角度,方便地對(duì)職業(yè)差評(píng)師進(jìn)行識(shí)別,具體通過交易平臺(tái)的開放接口獲取到全網(wǎng)的交易評(píng)價(jià)信息后,對(duì)交易評(píng)價(jià)信息進(jìn)行數(shù)據(jù)清洗,然后通過聚類模型,從買家中篩選出職業(yè)差評(píng)師,并把此模型應(yīng)用于更廣泛的買家對(duì)象,建立起長(zhǎng)效機(jī)制,有效打擊了職業(yè)差評(píng)師的網(wǎng)絡(luò)犯罪行為,維護(hù)網(wǎng)上交易的健康秩序;并且保證賣家信用的真實(shí)有效性,還原了商品的真實(shí)信息,使好的交易信息能在用戶搜索時(shí)正常出現(xiàn)在搜索結(jié)果的前列,減少用戶反復(fù)搜索的時(shí)間,從而減輕服務(wù)器的負(fù)擔(dān),減少網(wǎng)絡(luò)資源的占用。
[0069]參照?qǐng)D1,其示出了本申請(qǐng)的一種識(shí)別特定用戶及其評(píng)價(jià)信息的方法實(shí)施例1的步驟流程圖,具體可以包括如下步驟:
[0070]步驟101,從交易平臺(tái)中提取交易評(píng)價(jià)信息的樣本;
[0071]其中,所述交易評(píng)價(jià)信息包括交易信息,及其對(duì)應(yīng)的評(píng)價(jià)用戶和評(píng)價(jià)信息;
[0072]在具體實(shí)現(xiàn)中,可以在交易平臺(tái)提供有開放接口(應(yīng)用程序接口 API)的情況下,通過該開放接口獲取到交易評(píng)價(jià)信息的樣本;在交易平臺(tái)沒有提供開放接口的情況下,則可以采用網(wǎng)頁爬蟲的方式獲取到交易評(píng)價(jià)信息的樣本。
[0073]為提升數(shù)據(jù)處理速度,減少資源耗費(fèi),所述交易評(píng)價(jià)信息可以只取預(yù)設(shè)時(shí)間段內(nèi)的交易評(píng)價(jià)信息,比如,某交易平臺(tái)中最近半年內(nèi)的交易評(píng)價(jià)信息。獲取到所述交易評(píng)價(jià)信息的樣本后,可以進(jìn)行存儲(chǔ),例如,放入某云服務(wù)器的存儲(chǔ)數(shù)據(jù)庫,或放入交易平臺(tái)服務(wù)器
由T寸。
[0074]作為本申請(qǐng)實(shí)施例具體應(yīng)用的一種示例,所述交易信息可以包括商品ID,商品價(jià)格,商品類目等信息,評(píng)價(jià)用戶可以包括用戶ID,用戶昵稱,用戶注冊(cè)時(shí)間和注冊(cè)地,用戶收貨地址等信息,評(píng)價(jià)信息可以包括好評(píng)、中評(píng)、差評(píng)、商品與描述相符度、賣家的服務(wù)態(tài)度、賣家發(fā)貨的速度、物流發(fā)貨的速度、交易的具體評(píng)論、評(píng)論是否推薦到社區(qū)、評(píng)價(jià)時(shí)間等信
肩、O
[0075]例如,從交易平臺(tái)中提取的一條交易評(píng)價(jià)信息樣本如下表所示:
[0076]
【權(quán)利要求】
1.一種識(shí)別特定用戶的方法,其特征在于,包括: 從交易平臺(tái)中提取交易評(píng)價(jià)信息的樣本,所述交易評(píng)價(jià)信息包括交易信息及對(duì)應(yīng)的評(píng)價(jià)用戶和評(píng)價(jià)信息; 從所述交易評(píng)價(jià)信息的樣本中篩選出聚類用的交易評(píng)價(jià)信息; 從所述聚類用的交易評(píng)價(jià)信息中提取評(píng)價(jià)用戶作為候選用戶; 按各候選用戶分別組織對(duì)應(yīng)的第一評(píng)價(jià)信息集合和第二評(píng)價(jià)信息集合,其中,所述第一評(píng)價(jià)信息集合為各候選用戶在所述交易評(píng)價(jià)信息的樣本中對(duì)應(yīng)的評(píng)價(jià)信息集合;所述第二評(píng)價(jià)信息集合為各候選用戶在聚類用的交易評(píng)價(jià)信息中對(duì)應(yīng)的評(píng)價(jià)信息集合; 統(tǒng)計(jì)所述第二評(píng)價(jià)信息集合在第一評(píng)價(jià)信息集合中的占比,若超過第一閾值,則判定為特定用戶。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從交易評(píng)價(jià)信息的樣本中篩選出聚類用的交易評(píng)價(jià)信息的步驟包括: 若所述評(píng)價(jià)信息為中評(píng)或差評(píng),則將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)信息; 和/或, 若所述評(píng)價(jià)信息中的交易評(píng)分值低于第二閾值,則將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)信息; 和/或,· 若所述評(píng)價(jià)信息中的評(píng)價(jià)內(nèi)容包括預(yù)置的差評(píng)關(guān)鍵詞,則將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述交易信息中包括商品信息,所述從交易評(píng)價(jià)信息的樣本中篩選出聚類用的交易評(píng)價(jià)信息的步驟還包括: 根據(jù)商品信息組織對(duì)應(yīng)的評(píng)價(jià)信息,統(tǒng)計(jì)差評(píng)占比,所述差評(píng)占比為滿足差評(píng)規(guī)則的評(píng)價(jià)信息,在該交易信息對(duì)應(yīng)的所有評(píng)價(jià)信息中所占的比例;其中,所述差評(píng)規(guī)則包括:評(píng)價(jià)信息為中評(píng)或差評(píng);和/或,評(píng)價(jià)信息中的交易評(píng)分值低于第二閾值;和/或,評(píng)價(jià)信息中的評(píng)價(jià)內(nèi)容包括預(yù)置的差評(píng)關(guān)鍵詞; 根據(jù)所述商品信息組織對(duì)應(yīng)的評(píng)價(jià)用戶,計(jì)算評(píng)價(jià)用戶的分散度; 若存在所述差評(píng)占比大于第三閾值,并且,所述評(píng)價(jià)用戶的分散度高于第四閾值的交易評(píng)價(jià)息,則去除該條交易評(píng)價(jià)息。
4.根據(jù)權(quán)利要求1或2或3所述的方法,其特征在于,還包括: 提取所述特定用戶的特征,訓(xùn)練生成特定用戶的評(píng)定指標(biāo)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述特定用戶的特征包括評(píng)價(jià)用戶的注冊(cè)時(shí)間長(zhǎng)短,購買商品的類目分布,確認(rèn)收貨與作為評(píng)價(jià)的時(shí)間間隔,評(píng)價(jià)內(nèi)容,和/或,在交易平臺(tái)的活動(dòng)行為信息。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,還包括: 當(dāng)獲得新的交易評(píng)價(jià)信息時(shí),按照所述評(píng)定指標(biāo)判定當(dāng)前交易評(píng)價(jià)信息中的評(píng)價(jià)用戶是否為特定用戶; 若是,則屏蔽或刪除所述特定用戶的評(píng)價(jià)信息,或者,降低所述特定用戶的評(píng)價(jià)信息的權(quán)重。
7.根據(jù)權(quán)利要求1或2或3所述的方法,其特征在于,還包括: 提取所述特定用戶生成黑名單。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,還包括: 當(dāng)獲得新的交易評(píng)價(jià)信息時(shí),提取當(dāng)前交易評(píng)價(jià)信息中的評(píng)價(jià)用戶,判斷所述評(píng)價(jià)用戶是否在黑名單中; 若是,則屏蔽或刪除所述特定用戶的評(píng)價(jià)信息,或者,降低所述特定用戶的評(píng)價(jià)信息的權(quán)重。
9.一種識(shí)別特定用戶的裝置,其特征在于,包括: 樣本采集模塊,用于從交易平臺(tái)中提取交易評(píng)價(jià)信息的樣本,所述交易評(píng)價(jià)信息包括交易信息及對(duì)應(yīng)的評(píng)價(jià)用戶和評(píng)價(jià)信息; 數(shù)據(jù)清洗模塊,用于從所述交易評(píng)價(jià)信息的樣本中篩選出聚類用的交易評(píng)價(jià)信息; 用戶提取模塊,用于從所述聚類用的交易評(píng)價(jià)信息中提取評(píng)價(jià)用戶作為候選用戶; 組織模塊,用于按各候選用戶分別組織對(duì)應(yīng)的第一評(píng)價(jià)信息集合和第二評(píng)價(jià)信息集合,其中,所述第一評(píng)價(jià)信息集合為各候選用戶在所述交易評(píng)價(jià)信息的樣本中對(duì)應(yīng)的評(píng)價(jià)信息集合;所述第二評(píng)價(jià)信息集合為各候選用戶在聚類用的交易評(píng)價(jià)信息中對(duì)應(yīng)的評(píng)價(jià)信息集合; 識(shí)別模塊,用于統(tǒng)計(jì)所述第二評(píng)價(jià)信息集合在第一評(píng)價(jià)信息集合中的占比,若超過第一閾值,則判定為特定用戶。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述數(shù)據(jù)清洗模塊包括: 第一提取子模塊,用于在所述評(píng)價(jià)信息為中評(píng)或差評(píng)時(shí),將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)信息; 和/或, 第二提取子模塊,用于在所述評(píng)價(jià)信息中的交易評(píng)分值低于第二閾值時(shí),將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)信息; 和/或, 第三提取子模塊,用于在所述評(píng)價(jià)信息中的評(píng)價(jià)內(nèi)容包括預(yù)置的差評(píng)關(guān)鍵詞時(shí),將該條交易評(píng)價(jià)信息提取為聚類用的交易評(píng)價(jià)信息。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述交易信息中包括商品信息,所述數(shù)據(jù)清洗模塊還包括: 第一計(jì)算子模塊,用于根據(jù)商品信息組織對(duì)應(yīng)的評(píng)價(jià)信息,統(tǒng)計(jì)差評(píng)占比,所述差評(píng)占比為滿足差評(píng)規(guī)則的評(píng)價(jià)信息,在該交易信息對(duì)應(yīng)的所有評(píng)價(jià)信息中所占的比例;其中,所述差評(píng)規(guī)則包括:評(píng)價(jià)信息為中評(píng)或差評(píng);和/或,評(píng)價(jià)信息中的交易評(píng)分值低于第二閾值;和/或,評(píng)價(jià)信息中的評(píng)價(jià)內(nèi)容包括預(yù)置的差評(píng)關(guān)鍵詞; 第二計(jì)算子模塊,用于根據(jù)所述商品信息組織對(duì)應(yīng)的評(píng)價(jià)用戶,計(jì)算評(píng)價(jià)用戶的分散度; 去除子模塊,用于在存在所述差評(píng)占比大于第三閾值,并且,所述評(píng)價(jià)用戶的分散度高于第四閾值的交易評(píng)價(jià)信息時(shí),去除該條交易評(píng)價(jià)信息。
12.根據(jù)權(quán)利要求9或10或11所述的裝置,其特征在于,還包括: 聚類建模模塊,用于提取所述特定用戶的特征,訓(xùn)練生成特定用戶的評(píng)定指標(biāo)。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述特定用戶的特征包括評(píng)價(jià)用戶的注冊(cè)時(shí)間長(zhǎng)短,購買商品的類目分布,確認(rèn)收貨與作為評(píng)價(jià)的時(shí)間間隔,評(píng)價(jià)內(nèi)容,和/或,在交易平臺(tái)的活動(dòng)行為信息。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,還包括: 第一用戶識(shí)別處理模塊,用于在獲得新的交易評(píng)價(jià)信息時(shí),按照所述評(píng)定指標(biāo)判定當(dāng)前交易評(píng)價(jià)信息中的評(píng)價(jià)用戶是否為特定用戶;若是,則屏蔽或刪除所述特定用戶的評(píng)價(jià)信息,或者,降低所述特定用戶的評(píng)價(jià)信息的權(quán)重。
15.根據(jù)權(quán)利要求9或10或11所述的裝置,其特征在于,還包括: 黑名單創(chuàng)建模塊,用于提取所述特定用戶生成黑名單。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,還包括: 第二用戶識(shí)別處理模塊,用于在獲得新的交易評(píng)價(jià)信息時(shí),提取當(dāng)前交易評(píng)價(jià)信息中的評(píng)價(jià)用戶,判斷所述評(píng)價(jià)用戶是否在黑名單中;若是,則屏蔽或刪除所述特定用戶的評(píng)價(jià)信息,或者,降低所述特定用戶的評(píng)價(jià)信息的權(quán)重。
【文檔編號(hào)】G06F17/30GK103577988SQ201210258891
【公開日】2014年2月12日 申請(qǐng)日期:2012年7月24日 優(yōu)先權(quán)日:2012年7月24日
【發(fā)明者】陳春明, 王正剛, 許亮, 吳云崇 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司