一種電商主體可信度評(píng)價(jià)方法及系統(tǒng)的制作方法
【專利說(shuō)明】一種電商主體可信度評(píng)價(jià)方法及系統(tǒng) 【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種電商主體可信度評(píng)價(jià)方法及系統(tǒng)。 【【背景技術(shù)】】
[0002] 隨著互聯(lián)網(wǎng)的迅速發(fā)展,電子商務(wù)已經(jīng)越來(lái)越成為人們的主流購(gòu)物選擇。但由于 評(píng)價(jià)標(biāo)準(zhǔn)缺失,電商主體(電商平臺(tái)、電商商家、電商商品)的可信度難以評(píng)價(jià),使得監(jiān)管部 門難以有效掌握和監(jiān)管電子商務(wù)活動(dòng)信息,也不利于電子商務(wù)行業(yè)的健康發(fā)展,同時(shí)也使 得普通顧客在選擇電商商品時(shí)無(wú)所適從。 【
【發(fā)明內(nèi)容】
】
[0003] 為了克服現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種電商主體可信度評(píng)價(jià)方法及系統(tǒng), 從而可以為監(jiān)管部門和用戶判斷電商主體的可信度提供參考。
[0004] -種電商主體可信度評(píng)價(jià)方法,包括如下步驟:
[0005] S1,從電商商品的客戶評(píng)價(jià)中獲取主題詞和情感詞共同出現(xiàn)的主題詞-情感詞 對(duì);
[0006] S2,從電商商品的廣告中獲取主題詞和情感詞共同出現(xiàn)的主題詞-情感詞對(duì);
[0007] S3,計(jì)算客戶評(píng)價(jià)中主題詞k的語(yǔ)義傾向度Ori (Okil):
其中,Wpi表示第i個(gè)褒義基準(zhǔn)詞,wn 表示第j個(gè)貶義基準(zhǔn)詞,P表示褒義基準(zhǔn)詞個(gè)數(shù),η表示貶義基準(zhǔn)詞個(gè)數(shù),W1表示客戶評(píng)價(jià) 中主題詞-情感詞對(duì)中的目標(biāo)情感詞,sem (,)表示括號(hào)內(nèi)的兩個(gè)詞的相似度;
[0009] S4,計(jì)算廣告中主題詞k的語(yǔ)義傾向度Ori (ok,2):
其中,W2表示廣告中主題詞-情感詞 對(duì)中的目標(biāo)情感詞;
[0011] S5,計(jì)算電商商品s的可信度i3s,k:
;其中,m表示主題詞的個(gè)數(shù)。
[0013] 在一個(gè)實(shí)施例中,還包括:
[0014] 步驟S6,計(jì)算電商商家t的可信度Bt:
其中,S表示電商商家t的電商商品的數(shù)量。
[0016] 在一個(gè)實(shí)施例中,還包括:
[0017] 步驟S7,計(jì)算電商平臺(tái)的可信度A :
其中,T表不電商平臺(tái)中電商商家的數(shù)量。
[0019] -種電商主體可信度評(píng)價(jià)系統(tǒng),包括如下單元:
[0020] 第一處理單元,用于從電商商品的客戶評(píng)價(jià)中獲取主題詞和情感詞共同出現(xiàn)的主 題詞-情感詞對(duì);
[0021] 第二處理單元,用于從電商商品的廣告中獲取主題詞和情感詞共同出現(xiàn)的主題 詞-情感詞對(duì);
[0022] 第三處理單元,用于計(jì)算客戶評(píng)價(jià)中主題詞k的語(yǔ)義傾向度Ori (Okil):
其中,Wpi表示第i個(gè)褒義基準(zhǔn)詞,wn 表示第j個(gè)貶義基準(zhǔn)詞,P表示褒義基準(zhǔn)詞個(gè)數(shù),η表示貶義基準(zhǔn)詞個(gè)數(shù),W1表示客戶評(píng)價(jià) 中主題詞-情感詞對(duì)中的目標(biāo)情感詞,sem (,)表示括號(hào)內(nèi)的兩個(gè)詞的相似度;
[0024] 第四處理單元,用于計(jì)算廣告中主題詞k的語(yǔ)義傾向度Ori (〇k,2):
其中,W2表示廣告中主題詞-情感詞 對(duì)中的目標(biāo)情感詞;
[0026] 第五處理單元,用于計(jì)算電商商品s的可信度β
;其中,m表示主題詞的個(gè)數(shù)。
[0028] 在一個(gè)實(shí)施例中,還包括第六處理單元,用于計(jì)算電商商家t的可信度Bt:
其中,S表示電商商家t的電商商品的數(shù)量。
[0030] 在一個(gè)實(shí)施例中,還包括第七處理單元,用于計(jì)算電商平臺(tái)的可信度A :
,_其中,T表不電商平臺(tái)中電商商家的數(shù)量。
[0032] 本發(fā)明的有益效果是:
[0033] 建立了有效的電子商務(wù)各主體評(píng)價(jià)體系,有助于為電子商務(wù)活動(dòng)監(jiān)管提供理論依 據(jù)和數(shù)據(jù)支撐;有助于規(guī)范電商行業(yè)的有序發(fā)展;有助于降低廣大顧客的電商商品信息收 集成本。 【【附圖說(shuō)明】】
[0034] 圖1是本發(fā)明一種實(shí)施例的電商主體可信度評(píng)價(jià)方法的流程示意圖。 【【具體實(shí)施方式】】
[0035] 以下對(duì)發(fā)明的較佳實(shí)施例作進(jìn)一步詳細(xì)說(shuō)明。
[0036] 如圖1所示,一種電商主體可信度評(píng)價(jià)方法,其特征是,包括如下步驟:
[0037] S1,建立電商商品信息數(shù)據(jù)庫(kù)
[0038] 利用網(wǎng)絡(luò)爬蟲手段,對(duì)指定的電子商務(wù)平臺(tái)(網(wǎng)站)信息源進(jìn)行信息采集,主要包 括交易信息(交易主體、交易時(shí)間等)、商品信息(商品展示內(nèi)容、商品屬性信息等)、客戶 評(píng)價(jià)信息(評(píng)價(jià)對(duì)象、評(píng)價(jià)內(nèi)容、評(píng)價(jià)時(shí)間等)。
[0039] 對(duì)采集到的信息進(jìn)行預(yù)處理:去除網(wǎng)頁(yè)中的廣告、圖片、鏈接等無(wú)價(jià)值、無(wú)需關(guān)注 的信息。
[0040] 對(duì)所述商品ig息進(jìn)行提取,獲取電商商品的廣告并進(jìn)行存儲(chǔ)。
[0041 ] 對(duì)客戶評(píng)價(jià)信息進(jìn)行提取,獲取電商商品的客戶評(píng)價(jià)文本數(shù)據(jù)并進(jìn)行存儲(chǔ)。
[0042] S2,建立客戶評(píng)價(jià)數(shù)據(jù)庫(kù)
[0043] S21,建立主題詞庫(kù)
[0044] S211,利用自然語(yǔ)言處理方法,對(duì)評(píng)價(jià)文本數(shù)據(jù)進(jìn)行中文分詞和詞性標(biāo)注(去掉 停用詞如"的"、" 了"等),獲得評(píng)價(jià)文本數(shù)據(jù)文件(包含有詞性的分詞結(jié)果),對(duì)其進(jìn)行 TF-IDF變換(TF全名Term Frequency,意為某個(gè)關(guān)鍵詞在要處理的數(shù)據(jù)中出現(xiàn)的頻率;IDF 全名Inverse Document Frequency,意為某個(gè)關(guān)鍵詞在語(yǔ)料庫(kù)中出現(xiàn)的頻率):
[0047] 其中,Iili,表示第i個(gè)詞語(yǔ)t i在評(píng)價(jià)文本數(shù)據(jù)文件中出現(xiàn)的次數(shù),d ,表示第j個(gè) 語(yǔ)料庫(kù),IDl表示語(yǔ)料庫(kù)中的文件總數(shù),IUit1G Ul表示包含詞語(yǔ)h的文件數(shù)目(即 Iili 0的文件數(shù)目),如果該詞語(yǔ)不在語(yǔ)料庫(kù)中將導(dǎo)致分母為0,因此一般情況下使用 1+I Uzt1G d J I進(jìn)行平滑性處理。
[0048] S212,獲得 TFli j和 IDF1 之后,計(jì)算 TFIDF = TFli jXIDF1
[0049] 某一特定文件中的高頻率詞語(yǔ),以及該詞語(yǔ)在整個(gè)文件集合中的低文件頻率,可 以產(chǎn)生出高權(quán)重的TF-IDF。TF-IDF方法用于評(píng)估一個(gè)字詞在待處理數(shù)據(jù)集中的重要程度。 字詞的重要程度隨著它在待處理數(shù)據(jù)中出現(xiàn)的頻率成正比增加,而隨著它在語(yǔ)料庫(kù)中出現(xiàn) 的頻率成反比下降。對(duì)于IDF的作用,主要是為了排除常用詞的影響。因此,通過(guò)每個(gè)詞的 TFIDF的值,可以判斷每個(gè)詞在待處理數(shù)據(jù)中的重要程度(TFIDF越大,該詞在待處理數(shù)據(jù) 中的重要程度越高)若設(shè)定一個(gè)閾值,則可以選出所有TFIDF值大于閾值的詞,從而組成關(guān) 鍵詞表。
[0050] S213,根據(jù)采用TF-IDF方法獲得的關(guān)鍵詞表,人工選定面向電商領(lǐng)域的關(guān)鍵主題 詞,從而獲得主題詞庫(kù)