類數(shù)據(jù)。
[0052] 在一勝說(shuō)明件實(shí)施例中,第四類數(shù)據(jù)可以通過(guò)如下公式獲得:
[0053]
[0054] 其中,E表示評(píng)論信息的情感滿意程度,Gk表示第k個(gè)具有正面情感的子句的正面 情感強(qiáng)度程度,(^表示第1個(gè)具有負(fù)面情感的子句的正面情感強(qiáng)度程度,p和q分別表示具 有正面情感的子句和具有負(fù)面情感的子句的總數(shù),m表示具有情感詞語(yǔ)的子句的總數(shù),S表 示情感強(qiáng)烈程度系數(shù),S為滿足1彡S彡5的整數(shù)。
[0055] 具體流程如圖2所示,包括:
[0056] S21、將每條評(píng)論內(nèi)容拆分成各個(gè)獨(dú)立的子句;
[0057] S22、每個(gè)子句進(jìn)行分詞處理,利用匹配特定詞組方式,識(shí)別出產(chǎn)品相關(guān)詞,用戶用 于評(píng)價(jià)產(chǎn)品的詞,以及表示情感的程度詞;
[0058] S23、將評(píng)價(jià)產(chǎn)品詞與情感詞庫(kù)進(jìn)行匹配,區(qū)分評(píng)價(jià)的正負(fù)傾向;
[0059] S24、將程度詞與情感程度詞庫(kù)進(jìn)行匹配,并根據(jù)反映出的情感強(qiáng)烈程度進(jìn)行標(biāo) 注;其中,程度分5級(jí),級(jí)別越高,情感越強(qiáng)烈。
[0060] S25、通過(guò)公式計(jì)算出情感滿意程度。
[0061] 例如:評(píng)論信息為"冰箱還沒(méi)有開始用,從外觀看,挺漂亮的,內(nèi)空也大,三口之家 夠用了。冰箱表面和冷凍室內(nèi)壁有很明顯的劃痕,看著很不舒服,里面灰塵重,要好好清洗。 還以為是舊貨。等開機(jī)看看有沒(méi)有問(wèn)題再考慮是否退貨。"
[0062]識(shí)別結(jié)果:挺漂亮(好評(píng)3),內(nèi)空也大(好評(píng)2),看著很不舒服(差評(píng)3);
[0063] 計(jì)算結(jié)果:E= (3+2_3V(3*4) =I6·67。
[0064] 在一些說(shuō)明性實(shí)施例中,所述產(chǎn)品的推薦度通過(guò)以下任一一種方式獲得:
[0065] (1)、每個(gè)所述評(píng)論信息的單一數(shù)據(jù)與第四類數(shù)據(jù)之積的求和與每個(gè)所述評(píng)論信 息的所述單一數(shù)據(jù)的求和之比;其中,所述單一數(shù)據(jù)為第一類數(shù)據(jù)、第二類數(shù)據(jù)或第三類數(shù) 據(jù);
[0066] (2)、每個(gè)所述評(píng)論信息的組合數(shù)據(jù)與第四類數(shù)據(jù)之積的求和與每個(gè)所述評(píng)論信 息的所述組合數(shù)據(jù)的求和之比;其中,所述組合數(shù)據(jù)為第一類數(shù)據(jù)、第二類數(shù)據(jù)和第三類數(shù) 據(jù)中任意組合之積。
[0067] 在一些說(shuō)明性實(shí)施例中,當(dāng)所述組合數(shù)據(jù)為第一類數(shù)據(jù)、第二類數(shù)據(jù)和第三類數(shù) 據(jù)之積時(shí),所述每個(gè)所述評(píng)論信息的組合數(shù)據(jù)與第四類數(shù)據(jù)之積的求和與每個(gè)所述評(píng)論信 息的所述組合數(shù)據(jù)的求和之比,具體表示為:
[0068]
[0069] 其中,Pnps表示產(chǎn)品的推薦度,和Eg分別表示第i個(gè)發(fā)布網(wǎng)站上第 j個(gè)評(píng)論信息的發(fā)布網(wǎng)站的影響力的權(quán)重、發(fā)布者的影響力的權(quán)重、評(píng)論信息的影響力的權(quán) 重和情感滿意程度表示第i個(gè)發(fā)布網(wǎng)站上的評(píng)論信息的數(shù)量。1 <i<n,1 <j<隊(duì)。
[0070] 另外,應(yīng)該理解的是上述計(jì)算推薦度的公式是針對(duì)于組合數(shù)據(jù)為第一類數(shù)據(jù)、第 二類數(shù)據(jù)和第三類數(shù)據(jù)之積的情況,對(duì)于單一數(shù)據(jù)和第四類數(shù)據(jù)的進(jìn)行分析的情況時(shí),可 以對(duì)上述公式進(jìn)行適當(dāng)變形,例如對(duì)第三類數(shù)據(jù)和第四類數(shù)據(jù)進(jìn)行分析,公式變形如下:
[0071]
[0072] 又例如對(duì)第一類數(shù)據(jù)、第三類數(shù)據(jù)和第四類數(shù)據(jù)進(jìn)行分析,公式變形如下:
[0073]
[0074] 在一些說(shuō)明性實(shí)施例中,所述獲取所述至少一個(gè)評(píng)論信息,具體包括:
[0075] 刪除原始評(píng)論信息中包含的發(fā)布網(wǎng)站默認(rèn)的評(píng)論信息,得到所述至少一個(gè)評(píng)論信 息,作為有效評(píng)論信息。
[0076] 現(xiàn)在參照?qǐng)D3,圖3示出了根據(jù)一些說(shuō)明性實(shí)施例的衡量產(chǎn)品推薦度的系統(tǒng)的框 圖。
[0077] 如圖3所示,在一些說(shuō)明性實(shí)施例中,公開了一種衡量產(chǎn)品推薦度的系統(tǒng)100,包 括:獲取產(chǎn)品的至少一個(gè)評(píng)論信息的采集模塊101 ;分析出每個(gè)所述評(píng)論信息及其信息源 的各類數(shù)據(jù)的解析模塊102 ;根據(jù)獲取的所述各類數(shù)據(jù)計(jì)算出所述產(chǎn)品的推薦度的評(píng)估模 塊 103。
[0078] 在一些說(shuō)明性實(shí)施例中,所述評(píng)論信息的信息源中至少包含有該評(píng)論信息的發(fā)布 網(wǎng)站和/或該評(píng)論信息的發(fā)布者;所述評(píng)論信息的發(fā)布網(wǎng)站的各類數(shù)據(jù)包括:第一類數(shù)據(jù): 所述評(píng)論信息的發(fā)布網(wǎng)站的影響力的權(quán)重;所述評(píng)論信息的發(fā)布者的各類數(shù)據(jù)包括:第二 類數(shù)據(jù):所述評(píng)論信息的發(fā)布者的影響力的權(quán)重;所述評(píng)論信息的各類數(shù)據(jù)包括:第三類 數(shù)據(jù):所述評(píng)論信息的影響力的權(quán)重;和/或第四類數(shù)據(jù):所述評(píng)論信息的情感滿意程度。
[0079] 在一些說(shuō)明性實(shí)施例中,所述解析模塊中包括:根據(jù)所述評(píng)論信息的發(fā)布網(wǎng)站的 訪問(wèn)量排名ALexa排名獲得所述第一類數(shù)據(jù)的第一解析子模塊,104 ;其中,Alexa排名越靠 前,所述第一類數(shù)據(jù)的值越大。
[0080] 在一些說(shuō)明性實(shí)施例中,所述第一解析子模塊用于通過(guò)如下公式獲得所述第一類 數(shù)據(jù):
[0081;
[0082]其中,W1表示發(fā)布網(wǎng)站的影響力的權(quán)重,x表示發(fā)布網(wǎng)站的訪問(wèn)量排名ALexa排 名,a和b分別為第一調(diào)節(jié)系數(shù)和第二調(diào)節(jié)系數(shù)
[0083] 在一些說(shuō)明性實(shí)施例中,所述解析模塊中包括:根據(jù)所述評(píng)論信息的發(fā)布者在發(fā) 布網(wǎng)站上的級(jí)別獲得所述第二類數(shù)據(jù)的第二解析子模塊105 ;其中,所述評(píng)論信息的發(fā)布 者在發(fā)布網(wǎng)站上的級(jí)別越高,所述第二類數(shù)據(jù)的值越大。
[0084] 在一些說(shuō)明性實(shí)施例中,所述第二解析子模塊用于通過(guò)如下公式獲得所述第二類 數(shù)據(jù):
[0085]W2 =c+y/Z;
[0086] 其中,W2表示發(fā)布者的影響力的權(quán)重,y表示發(fā)布者在發(fā)布網(wǎng)站上的級(jí)別對(duì)應(yīng)的 等級(jí)值,Z表示發(fā)布網(wǎng)站上的各級(jí)別對(duì)應(yīng)的等級(jí)值之和,c為第三調(diào)節(jié)系數(shù),c> 1。
[0087] 在一些說(shuō)明性實(shí)施例中,所述解析模塊中包括:根據(jù)所述評(píng)論信息中的不重復(fù)的 詞語(yǔ)數(shù)獲得所述第三類數(shù)據(jù)的第三解析子模塊106。
[0088] 在一些說(shuō)明性實(shí)施例中,所述第三解析子模塊用于通過(guò)如下公式獲得所述第三類 數(shù)據(jù):
[0089]
[0090]其中,W3表示評(píng)論信息的影響力的權(quán)重,t表示評(píng)論信息中不重復(fù)的詞語(yǔ)數(shù),dn為 第四調(diào)節(jié)系數(shù),dn >…>d2 >山> 0,tn為第二范圍閾值。
[0091] 在一些說(shuō)明性實(shí)施例中,所述解析模塊中包括:對(duì)所述評(píng)論信息進(jìn)行分句處理,并 找出其中具有情感詞語(yǔ)的子句的識(shí)別模塊107 ;分析出每個(gè)所述子句的正面情感強(qiáng)烈程度 或負(fù)面情感強(qiáng)烈程度的分析模塊108 ;根據(jù)分析出的所述正面情感強(qiáng)烈程度或負(fù)面情感強(qiáng) 烈程度獲得所述第四類數(shù)據(jù)的第四解析子模塊109。
[0092] 在一些說(shuō)明性實(shí)施例中,所述第四解析子模塊用于通過(guò)如下公式計(jì)算出所述第四 類數(shù)據(jù):
[0093]
[0094] 其中,E表示評(píng)論信息的情感滿意程度,Gk表示第k個(gè)具有正面情感的子句的正面 情感強(qiáng)度程度,(^表示第1個(gè)具有負(fù)面情感的子句的正面情感強(qiáng)度程度,p和q分別表示具 有正面情感的子句和具有負(fù)面情感的子句的總數(shù),m表示具有情感詞語(yǔ)的子句的總數(shù),S表 示情感強(qiáng)烈程度系數(shù),S為滿足1彡S彡5的整數(shù)。
[0095] 在一些說(shuō)明性實(shí)施例中,所述評(píng)估模塊用于按照以下以下任一一種方式獲得產(chǎn)品 的推薦度:
[0096] (1)、每個(gè)所述評(píng)論信息的單一數(shù)據(jù)與第四類數(shù)據(jù)之積的求和與每個(gè)所述評(píng)論信 息的所述單一數(shù)據(jù)的求和之比;其中,所述單一數(shù)據(jù)為第一類數(shù)據(jù)、第二類數(shù)據(jù)或第三類數(shù) 據(jù);
[0097] (2)、每個(gè)所述評(píng)論信息的組合數(shù)據(jù)與第四類數(shù)據(jù)之積的求和與每個(gè)所述評(píng)論信 息的所述組合數(shù)據(jù)的求和之比;其中,所述組合數(shù)據(jù)為第一類數(shù)據(jù)、第二類數(shù)據(jù)和第三類數(shù) 據(jù)中任意組合之積。
[0098] 在一些說(shuō)明性實(shí)施例中,當(dāng)所述組合數(shù)據(jù)為第一類數(shù)據(jù)、第二類數(shù)據(jù)和第三類數(shù) 據(jù)之積時(shí),所述評(píng)估模塊用于通過(guò)如下公式獲得所述產(chǎn)品的推薦度:
[0099]
[0100] 其中,Pnps表示產(chǎn)品的推薦度,和ElS分別表示第i個(gè)發(fā)布網(wǎng)站上第j個(gè)評(píng)論信息的發(fā)布網(wǎng)站的影響力的權(quán)重、發(fā)布者的影響力的權(quán)重、評(píng)論信息的影響力的權(quán) 重和情感滿意程度表示第i個(gè)發(fā)布網(wǎng)站上的評(píng)論信息的數(shù)量,η表示發(fā)布網(wǎng)站的數(shù)量。
[0101] 在一些說(shuō)明性實(shí)施例中,所述采集模塊用于通過(guò)刪除原始評(píng)論信息中包含的發(fā)布 網(wǎng)站默認(rèn)的評(píng)論信息,得到所述至少一個(gè)評(píng)論信息。
[0102] 以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技 術(shù)人員來(lái)說(shuō),本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修 改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種衡量產(chǎn)品推薦度的方法,其特征在于,包括: 獲取產(chǎn)品的至少一個(gè)評(píng)論信息; 分析出每個(gè)所述評(píng)論信息及其信息源的各類數(shù)據(jù); 根據(jù)獲取的所述各類數(shù)據(jù)計(jì)算出所述產(chǎn)品的推薦度。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述評(píng)論信息的信息源中至少包含有該 評(píng)論