一種兼顧多樣性和有效性的評論排序和篩選方法
【專利摘要】本發(fā)明涉及一種兼顧多樣性和有效性的評論排序和篩選方法,具體為:①從待排序評論集中提取評論目標(biāo)的特征集。②依次對待排序評論集中的每一條評論進(jìn)行處理,得到每條評論中涉及的特征數(shù)。③對待排序評論集根據(jù)特征進(jìn)行聚類,使每條評論歸屬到一個特征類別中。④在每個聚類中,按照評論涉及的評論數(shù)由高到低的順序,對該聚類中的評論進(jìn)行排序。⑤設(shè)定選取數(shù)量為m,從每個聚類中選取前n為聚類數(shù)。然后,將選取出來的條評論,按照評論涉及的評論數(shù)由高到低的順序重新排序并展示。本發(fā)明方法使評論列表排序效果更符合人類認(rèn)知,能夠優(yōu)先輸出對其他用戶更有幫助的列表排序,而且兼顧評論內(nèi)容的全面性。
【專利說明】
-種兼顧多樣性和有效性的評論排序和篩選方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及一種兼顧多樣性和有效性的評論排序和篩選方法,屬于計算機(jī)應(yīng)用技 術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 評論數(shù)據(jù)(Review Data)是一種發(fā)布在互聯(lián)網(wǎng)上,表達(dá)評論目標(biāo)某些特征方面狀 況和自己對評價目標(biāo)情感的數(shù)據(jù)。圍繞同一個評論目標(biāo)的評論文本構(gòu)成了評論數(shù)據(jù)集,在 展示評論數(shù)據(jù)集時多采用列表的方式。
[0003] 傳統(tǒng)的排序方法大多是基于評論文本的某一項屬性進(jìn)行排序,例如按照評論發(fā)表 的時間先后順序、按照評論的點贊數(shù)排序、按照評論人的用戶級別等。運類方法的排序?qū)ο?之間僅存在排序?qū)傩陨系拇涡蜿P(guān)系,而運些排序?qū)傩允欠嫌脩羲悸坊蛘弋a(chǎn)品需求的,對 評論文本排序具有良好的效果。但是,評論文本是用戶對評論目標(biāo)基于自身認(rèn)識而發(fā)表的 個人意見性文本,評論中包含了對評論目標(biāo)的使用感受、情感和特征描述等內(nèi)容,對于其他 用戶具有參考價值,評論內(nèi)容的有效性也是影響評論排序的關(guān)鍵因素。此外,不同用戶發(fā)表 的評論文本在描述評價對象時的側(cè)重點不同,圍繞評論目標(biāo)進(jìn)行全方位的評論文本展示具 有很重要的作用。因此,傳統(tǒng)基于單一排序?qū)傩缘姆椒ú贿m合對評論文本列表進(jìn)行排序。
[0004] 目前,在已有文獻(xiàn)中,還未有兼顧多個特征的評論排序和篩選方法的相關(guān)記載。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是提出一種兼顧多樣性和有效性的評論排序和篩選方法。該方法能 夠篩選出比依賴單一排序?qū)傩苑椒ǜ臃先祟愋枨蟮呐判蚪Y(jié)果。
[0006] 本發(fā)明的目的是通過下述技術(shù)方案實現(xiàn)的。
[0007] 本發(fā)明的一種兼顧多樣性和有效性的評論排序和篩選方法,其具體操作步驟為: [000引步驟一、從待排序評論集中提取評論目標(biāo)的特征集。
[0009] 步驟1.1:采用詞性標(biāo)注工具對評論進(jìn)行標(biāo)注。
[0010] 步驟1.2:對待排序評論集中的名詞出現(xiàn)次數(shù)進(jìn)行統(tǒng)計,利用出現(xiàn)次數(shù)大于頻次中 位數(shù)的名詞構(gòu)成評價目標(biāo)的特征集。
[0011] 步驟二、依次對待排序評論集中的每一條評論進(jìn)行處理,得到每條評論中設(shè)及的 特征數(shù)。
[0012] 步驟=、對待排序評論集根據(jù)特征進(jìn)行聚類,使每條評論歸屬到一個特征類別中。
[0013] 步驟四、在每個聚類中,按照評論設(shè)及的評論數(shù)由高到低的順序,對該聚類中的評 論進(jìn)行排序。
[0014] 步驟五、設(shè)定選取數(shù)量為m,從每個聚類中選取前條評論,其中,n為聚類數(shù)。然 后,將選取出來的^ X n條評論,按照評論設(shè)及的評論數(shù)由高到低的順序重新排序并展 LnJ /J、- O
[0015] 經(jīng)過上述步驟的操作,即兼顧多樣性和有效性,對待評論集評論中的評論進(jìn)行排 序和篩選。
[0016] 有益效果
[0017] 本發(fā)明提出的兼顧多樣性和有效性的評論排序和篩選方法與已有技術(shù)相比較,本 發(fā)明方法使評論列表排序效果更符合人類認(rèn)知,能夠優(yōu)先輸出對其他用戶更有幫助的列表 排序,節(jié)省用戶尋找有用評論的時間,并且兼顧評論內(nèi)容的全面性,便于用戶全面了解目標(biāo) W及其他用戶對于該目標(biāo)的觀點。
【具體實施方式】
[0018] 下面結(jié)合附圖和具體實施例對本發(fā)明技術(shù)方案做進(jìn)一步描述。
[0019] 本實施例使用兼顧多樣性和有效性的評論排序和篩選方法對一個企業(yè)評論集進(jìn) 行排序和篩選,其操作流程如圖1所示,其具體操作步驟為:
[0020] 步驟一、從待排序評論集中提取評論目標(biāo)的特征集。待排序評論集是A公司員工對 本公司的260條評論,獲取特征集的方法為:
[0021 ] 步驟1.1:采用詞性標(biāo)注工具對評論進(jìn)行標(biāo)注。
[0022] 步驟1.2:對待排序評論集中的名詞出現(xiàn)次數(shù)進(jìn)行統(tǒng)計,利用出現(xiàn)次數(shù)大于頻次中 位數(shù)的名詞構(gòu)成評價目標(biāo)的特征集。
[0023] 經(jīng)過該步驟的操作,得到的特征集為:{:員工待遇、加班情況、伙食、出差補助、管理 方式、開會次數(shù)、面試難度、工作壓力、名氣}。
[0024] 步驟二、依次對待排序評論集中的每一條評論進(jìn)行處理,將每一條評論與特征集 中的特征進(jìn)行對比,得到每條評論中設(shè)及特征的數(shù)量。
[0025] 步驟S、對待排序評論集根據(jù)特征進(jìn)行聚類為n個類別,n = 4,使每條評論歸屬到 一個特征類別中。
[0026] 步驟四、在每個聚類中,按照評論設(shè)及的評論數(shù)由高到低的順序,對該聚類中的評 論進(jìn)行排序。
[0027] 步驟五、設(shè)定選取數(shù)量為m = 20,從每個聚類中選取前5條評論。然后,將選取出來 的20條評論,按照評論設(shè)及的評論數(shù)由高到低的順序重新排序并展示。
[0028] 經(jīng)過上述步驟的操作,即兼顧多樣性和有效性,對待評論集評論中的評論進(jìn)行排 序和篩選。
【主權(quán)項】
1. 一種兼顧多樣性和有效性的評論排序和篩選方法,其特征在于:其具體操作步驟為: 步驟一、從待排序評論集中提取評論目標(biāo)的特征集; 步驟1.1:采用詞性標(biāo)注工具對評論進(jìn)行標(biāo)注; 步驟1.2:對待排序評論集中的名詞出現(xiàn)次數(shù)進(jìn)行統(tǒng)計,利用出現(xiàn)次數(shù)大于頻次中位數(shù) 的名詞構(gòu)成評價目標(biāo)的特征集; 步驟二、依次對待排序評論集中的每一條評論進(jìn)行處理,得到每條評論中涉及的特征 數(shù); 步驟三、對待排序評論集根據(jù)特征進(jìn)行聚類,使每條評論歸屬到一個特征類別中; 步驟四、在每個聚類中,按照評論涉及的評論數(shù)由高到低的順序,對該聚類中的評論進(jìn) tx排序; 步驟五、設(shè)定選取數(shù)量為m,從每個聚類中選取前條評論,其中,η為聚類數(shù);然后,將 選取出來的|^| X m條評論,按照評論涉及的評論數(shù)由高到低的順序重新排序并展示; 經(jīng)過上述步驟的操作,即兼顧多樣性和有效性,對待評論集評論中的評論進(jìn)行排序和 篩選。
【文檔編號】G06F17/27GK105955990SQ201610245146
【公開日】2016年9月21日
【申請日】2016年4月19日
【發(fā)明人】牛振東, 陳杰
【申請人】北京理工大學(xué)