一種用于確定評論的有效性的方法與裝置制造方法
【專利摘要】本發(fā)明的目的是提供一種在網絡設備中用于確定評論的有效性的方法和裝置。其中,該方法包括:獲取對于被評論對象的一個或多個評論;對所述一個或多個評論中的各個評論,確定所述評論所對應的評論特征;根據所述評論特征,確定所述評論的有效性。與現有技術相比,本發(fā)明基于評論特征來確定評論的有效性,從而有效地鑒別了評論是否為有效評論,有助于用戶獲取到更為有效的評論信息,從而提升用戶體驗。
【專利說明】一種用于確定評論的有效性的方法與裝置
【技術領域】
[0001] 本發(fā)明涉及互聯(lián)網領域,尤其涉及一種確定評論的有效性的方法與裝置。
【背景技術】
[0002] 當前,互聯(lián)網時代的用戶越來越傾向于從網絡上獲取評論信息以做參考,例如當 用戶需要更多地了解產品質量或商家信譽時,用戶可以從網絡上獲取來自其他用戶的評論 信息。然而,網絡上存在的評論信息質量良莠不齊,其中甚至存在部分虛假或無效的評論信 息。如何自動鑒別評論信息的有效性是一個亟待解決的問題。
【發(fā)明內容】
[0003] 本發(fā)明的目的是提供一種用于確定評論信息的有效性的方法與裝置。
[0004] 根據本發(fā)明的一個方面,提供一種用于確定評論的有效性的方法,其中,該方法包 括:
[0005] -獲取對于被評論對象的一個或多個評論;
[0006] -對所述一個或多個評論中的各個評論,確定所述評論所對應的評論特征;
[0007] -根據所述評論特征,確定所述評論的有效性。
[0008] 根據本發(fā)明的另一個方面,提供一種用于確定評論的有效性的裝置,其中,該裝置 包括:
[0009] -用于獲取對于被評論對象的一個或多個評論的裝置;
[0010]-用于對所述一個或多個評論中的各個評論,確定所述評論所對應的評論特征的 裝置;
[0011]-用于根據所述評論特征,確定所述評論的有效性的裝置。
[0012] 根據本發(fā)明的再一個方面,提供一種搜索信息的方法,其中包括:
[0013] -基于來自用戶設備的查詢序列進行匹配查詢,獲取一條或多條搜索結果,其中包 括至少一個評論;
[0014] -根據所述評論的有效性,將所述至少一個評論提供給用戶設備;
[0015] 其中,還包括,根據前述第一方面的方法來確定各個評論的有效性。
[0016] 根據本發(fā)明的又一個方面,提供一種搜索信息的裝置,其中包括:
[0017] -用于基于來自用戶設備的查詢序列進行匹配查詢,獲取一條或多條搜索結果,其 中包括至少一個評論的裝置;
[0018] -用于根據所述評論的有效性,將所述至少一個評論提供給用戶設備的裝置;
[0019] 其中,還包括,根據前述第二方面的用于確定各個評論的有效性的裝置。
[0020] 與現有技術相比,本發(fā)明基于評論特征來確定評論的有效性,從而有效地鑒別了 評論是否為有效評論,有助于用戶獲取到更為有效的評論信息,從而提升用戶體驗。
【專利附圖】
【附圖說明】
[0021] 通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它 特征、目的和優(yōu)點將會變得更明顯:
[0022] 圖1示出根據本發(fā)明一個方面的實施例的用于確定評論的有效性的方法流程圖;
[0023] 圖2示出根據本發(fā)明另一個方面的實施例的用于確定評論的有效性的裝置的示 意圖。
[0024] 附圖中相同或相似的附圖標記代表相同或相似的部件。
【具體實施方式】
[0025] 下面結合附圖對本發(fā)明作進一步詳細描述。
[0026] 圖1示出根據本發(fā)明一個方面的實施例的用于確定評論的有效性的方法流程圖。
[0027] 該用于確定評論的有效性的方法可以在網絡設備上被實現。此處,所述網絡設備 包括但不限于計算機、網絡主機、單個網絡服務器、多個網絡服務器集或多個服務器構成的 云;在此,云由基于云計算(Cloud Computing)的大量計算機或網絡服務器構成,其中,云 計算是分布式計算的一種,由一群松散耦合的計算機集組成的一個虛擬超級計算機。所述 網絡包括但不限于互聯(lián)網、廣域網、城域網、局域網、VPN網絡、無線自組織網絡(Ad Hoc網 絡)等。
[0028] 首先,在步驟S11中,網絡設備獲取對于被評論對象的一個或多個評論。此處,被 評論對象可以為任何實體或非實體,例如產品、商家、風景點、展覽會等。網絡設備可以通過 查詢存儲評論的數據庫,或通過一定的接口與例如網站等交互來獲取被評論對象的一個或 多個評論。
[0029] 接著,在步驟S12中,網絡設備對所述一個或多個評論中的各個評論,確定所述評 論對應的評論特征。評論特征可以包括任何與評論有關的特征,例如其是否為好評、其是否 由經過實名認證的評論者所發(fā)布等各種特征。在一個實施例中,可以預先設定需要確定的 評論特征的類型。并且,在一個實施例中,還可以根據實際需要來調整需要確定的評論特征 的類型。
[0030] 在一個實施例中,評論特征包括評論者特征以及內容特征中的任一項。其中,評論 者特征可以包括例如評論者所使用的IP地址信息,評論者的注冊信息,評論者進行評論的 時間相關信息,評論者所發(fā)出的評論的內容相關信息等中的任一項或任多項。內容特征可 以包括評論的內容中所包含的各個字符和/或詞的分別的重復次數等信息。
[0031] 在一個實例中,網絡設備可以通過查詢數據庫或通過一定的接口與其他設備進行 交互來來獲取評論的評論者信息。然后網絡設備可以從評論者信息中提取相應的信息作為 評論者特征。
[0032] 以針對產品"桔子手機"的評論為例來進行說明。其中,評論者"桔子粉"發(fā)出"桔 子手機值得擁有,好好好?。?! "的評論。網絡設備可以通過查詢數據庫或通過一定的接口與 其他設備進行交互獲取到該評論者"桔子粉"的相關信息。例如,網絡設備獲取到"桔子粉" 發(fā)出評論時所使用的IP地址為"58. 22. 222. 2","桔子粉"的注冊信息為實名注冊,其綁定 手機號碼為"18622222222","桔子粉"發(fā)出評論的時間為"2012/2/2","桔子粉"針對"桔子 手機"所發(fā)出的其他評論為"桔子手機就是好",從而網絡設備確定該"桔子粉"評論者對桔 子手機所發(fā)出的評論均為好評。
[0033] 在另一個實例中,網絡設備可以通過分析評論來獲取內容特征,例如評論的內容 中所包含的各個字符和/或詞的分別的重復次數等信息。例如,網絡設備可以對評論進行 分詞處理,并對于其中包含的每個字符和/詞,統(tǒng)計其在評論中分別出現的次數。接上例, 網絡設備針對"桔子手機值得擁有,好好好?。?! "的評論進行分析,并得出其中包括詞"桔 子"、"手機"、"值得"、"擁有"、"好",及符號","和"!",以及其在評論中分別出現的次數為 1、1、1、1、3、1和 3。
[0034] 接著在步驟S23中,網絡設備根據評論特征,確定評論的有效性。具體地,在一個 實施例中,網絡設備可以通過將評論特征與預定規(guī)則進行匹配來確定評論的有效性。例如, 預定規(guī)則可以為當評論者發(fā)出評論時所使用的IP地址為黑名單中的地址時,該評論為無 效評論。此處,地址黑名單可以是網絡設備根據歷史統(tǒng)計數據所預先設置的,并且地址黑名 單可以被動態(tài)更新。又例如,預定規(guī)則可以為當評論者未經過實名認證,并且其評論中某 個字符或詞出現的次數大于等于3次時,該評論為無效評論;而當評論者經過實名認證,并 且其評論中某個字符或詞出現的次數大于等于3次時,該評論為有效性較弱的評論。再例 如,預定規(guī)則可以為當評論者未經過實名認證,并且其針對待評論對象發(fā)出多條評論,其均 為同一評價度,例如好評或差評時,則該評論者所發(fā)出的這些評論的有效性較弱?;蚶?, 預定規(guī)則可以為當評論者在單位時間內,針對待評論對象發(fā)出的評論數量超過預定閾值, 并且評論中某個字符或詞出現的次數大于等于3次時,該評論為無效評論。此處,預定閾值 為例如根據經驗值來進行設置,并可以根據實際需要被動態(tài)調整。接上例,網絡設備基于 上述預定規(guī)則,得出該"桔子粉"所發(fā)出的該"桔子手機值得擁有,好好好!!! "的評論符合 "當評論者經過實名認證,并且其評論中某個字符或詞出現的次數大于等于3次時,該評論 為有效性較弱的評論"的規(guī)則,從而確定該評論的有效性較弱。
[0035] 在一個實例中,網絡設備還可以獲取某個評論者針對其他相關被評論對象所發(fā)出 的評論并分析相關特征。例如網絡設備可以分析該評論者對其他被評論對象所發(fā)出的評論 的評價度,例如好評或差評,的相關特征。并結合預定規(guī)則,例如當評論者對其他相關評論 對象所發(fā)出的評論的評價度相同,例如均為好評或差評,并且該評論者對其他相關被評論 對象所發(fā)出的評論的總數超過預定閾值時,則該評論者針對本被評論對象所發(fā)出的評論的 有效性較弱。例如,網絡設備可以獲取"桔子粉"針對其他手機所發(fā)出的評論,并得出其對 其他手機發(fā)出的評論的評價度均為差評,并且對其他手機發(fā)出的評論數量為22條超過預 定閾值,從而根據這一特征及預定規(guī)則得出該"桔子粉"對桔子手機所發(fā)出的評論的有效性 較弱。
[0036] 本領域技術人員應理解,此處,對于評論特征及預定規(guī)則的相關描述僅為示例性 而非限定性描述,存在各種其他各種評論特征及預定規(guī)則而不背離本發(fā)明的精神或范疇, 并以引用的方式包含于此。
[0037] 在一個優(yōu)選實施例中,網絡設備可以根據針對待評論對象的一個或多個評論中的 各個評論的各自的評論特征,確定該各個評論之間的第一聚類關系和/或該各個評論的各 個評論者之間的第二聚類關系,然后根據各個評論的各自的評論特征,以及第一聚類關系 和/或第二聚類關系,來確定所述評論的有效性。
[0038] 此處,各個評論之間的第一聚類關系指根據各個評論的特征確定各個評論之間的 相似度,并根據相似度來確定的聚類關系。各個評論者之間的第二聚類關系指根據各個評 論者特征確定各個評論者之間的相似度,并根據所確定的相似度來確定的各個評論者之間 的聚類關系。
[0039] 在一個實施例中,網絡設備可以預先規(guī)定對于各個評論或評論者之間需要進行 相似性對比的特征,并將各個評論或評論者之間基于各個特征的對比結果進行加權求和, 并根據加權求和的值是否高于預定閾值來確定第一聚類關系和第二聚類關系。此處,預定 的需要對比的特征,以及對不同特征所賦予的權重以及預定閾值均可以根據實際需要進行 調節(jié)。
[0040] 例如對于評論,可以預先規(guī)定需要對比的評論者特征以及內容特征。對于評論的 評論者特征,可以對比各個評論的評論者賬號是否相同或是否來自同一 IP地址。對于各個 評論的內容特征,可以對比其是否具有相同的評價度,如好評或差評,還可以對比其評論內 容是否相似。
[0041] 又例如對于評論者,可以預先規(guī)定需要對比各個評論者的評論者賬號特征以及評 論者發(fā)出評論的特征。對于評論者賬號特征,可對比是否具有相同的結構特征,例如均為4 個字母加4個數字的結構,是否注冊時使用相同的IP地址等特征。對于評論者發(fā)出評論的 特征可以對比各個評論者最后一次發(fā)出評論的IP地址,各個評論者發(fā)出評論所針對的待 評論對象,各個評論者發(fā)出評論的評價度,例如好評或差評等特征。
[0042] 以下以一評論者"桔子粉"對桔子手機所發(fā)出的"桔子手機值得擁有,好好好?。?! " 的評論,以及另一評論者"水果粉"對桔子手機所發(fā)出的"這么好的桔子手機你擁有嗎? "為 例來說明確定第一聚類關系以及第二聚類關系的方法。
[0043] 對于各個評論之間的第一聚類關系的確定,網絡設備首先按照上文所述的方法得 出各個評論的特征。接著網絡設備對需要對比的特征進行對比。在本例中,網絡設備對比 該兩條評論的評論者特征和內容特征。網絡設備得出評論者"桔子粉"和"水果粉"所分別 作出的上述評論來自同一 IP地址,并且其評論內容相似度較高。網絡設備將這兩個對比特 征的對比結果按各自權重進行加權求和,當加權求和的結果超過預定閾值,確定該上述兩 條評論滿足第一聚類關系。
[0044] 對于各個評論者之間的第二聚類關系的確定,網絡設備根據上文所述的方法得出 該兩個評論者的特征。接著,網絡設備對需要對比的特征進行對比。在本例中,網絡設備對 比該兩個評論者的評論者賬號特征以及評論者發(fā)出評論的特征。網絡設備得出評論者"桔 子粉"和"水果粉"的賬號名稱具有相同的結構(均由3個漢字組成),并且其注冊時使用 的IP地址相同。此外,網絡設備得出評論者"桔子粉"和"水果粉"所發(fā)出的評論均主要針 對桔子手機或相關其他手機,并且對于桔子手機的評價度均為好評,而對于其他相關手機 的評價度均為差評。網絡設備將上述對比結果進行加權求和,當加權求和的結果超過預定 閾值,確定該"桔子粉"和"水果粉"兩個評論者之間滿足第二聚類關系。
[0045] 本領域技術人員應理解,此處,對于確定第一聚類關系以及第二聚類關系的相關 描述僅為示例性而非限定性描述,存在各種其他的實現方式而不背離本發(fā)明的精神或范 疇,并以引用的方式包含于此。
[0046] 應注意的是,在實施例中,可以僅確定第一聚類關系,或僅確定第二聚類關系,來 用于評論有效性的確定。
[0047] 在一個優(yōu)選實施例中,網絡設備可以根據所述各個評論的各自的評論特征,將所 述各個評論進行分組,然后根據所述各個評論的各自的評論特征,計算同一分組中的各個 評論之間的余弦距離,并根據所述各個余弦距離,確定所述同一分組中的各個評論之間的 第一聚類關系。
[0048] 在另一個優(yōu)選實施例中,網絡設備可以根據所述各個評論的各自的評論特征,將 所述各個評論的各個評論者進行分組,然后根據所述各個評論的各自的評論特征,計算同 一分組中的各個評論者之間的各個余弦距離,再根據所述各個余弦距離,確定所述同一分 組中的各個評論者之間的第二聚類關系。
[0049] 在以下的說明中,我們將使用表1中的例子來說明確定第一聚類關系和第二聚類 關系的上述方法。
[0050] 表 1
[0051]
【權利要求】
1. 一種用于確定評論的有效性的方法,其中,該方法包括: -獲取對于被評論對象的一個或多個評論; -對所述一個或多個評論中的各個評論,確定所述評論所對應的評論特征; -根據所述評論特征,確定所述評論的有效性。
2. 根據權利要求1所述的方法,其中,所述評論特征包括以下至少任一項: -所述評論的評論者特征; -所述評論的內容特征。
3. 根據權利要求2所述的方法,其中,所述評論者特征包括以下任一項或任多項: -所述評論者所使用的IP地址信息; -所述評論者的注冊相關信息; -所述評論者進行評論的時間相關信息; -所述評論者所發(fā)出的評論的內容相關信息; 其中,所述內容特征包括: -所述評論的內容中所包含的各個字符和/或詞的分別的重復次數。
4. 根據權利要求1至3中任一項所述的方法,其中,所述根據所述評論特征,確定所述 評論的有效性的步驟包括: -根據所述一個或多個評論中的各個評論的各自的評論特征,確定所述各個評論之間 的第一聚類關系和/或所述各個評論的各個評論者之間的第二聚類關系; -根據所述一個或多個評論中的各個評論的各自的評論特征,以及所述第一聚類關系 和/或所述第二聚類關系,確定所述評論的有效性。
5. 根據權利要求4所述的方法,其中,所述根據所述一個或多個評論中的各個評論的 各自的評論特征,確定所述各個評論之間的第一聚類關系的步驟包括: -根據所述各個評論的各自的評論特征,將所述各個評論進行分組; -根據所述各個評論的各自的評論特征,計算同一分組中的各個評論之間的各個余弦 距離; -根據所述各個余弦距離,確定所述同一分組中的各個評論之間的第一聚類關系。
6. 根據權利要求4所述的方法,其中,所述根據所述一個或多個評論中的各個評論的 各自的評論特征,確定所述各個評論的各個評論者之間的第二聚類關系的步驟包括: -根據所述各個評論的各自的評論特征,將所述各個評論的各個評論者進行分組; -根據所述各個評論的各自的評論特征,計算同一分組中的各個評論者之間的各個余 弦距離; -根據所述各個余弦距離,確定所述同一分組中的各個評論者之間的第二聚類關系。
7. 根據權利要求4或6所述的方法,其中,還包括: -根據所述各個評論的各自的評論特征,并基于所述第二聚類關系,對所述各個評論的 各自的評論者的相關信息進行第一處理,其中,所述第一處理包括以下任一項或任多項: -加標簽處理; -過濾處理; -降低權重處理。
8. 根據權利要求1至7中任一項所述的方法,其中,還包括: -根據所確定的所述一個或多個評論中的各個評論的有效性信息,對所述一個或多個 評論進行第二處理,其中所述第二處理包括以下任一項或任多項: -合并處理; -過濾處理; -降低權重處理。
9. 一種用于確定評論的有效性的裝置,其中,該裝置包括: -用于獲取對于被評論對象的一個或多個評論的裝置; -用于對所述一個或多個評論中的各個評論,確定所述評論所對應的評論特征的裝 置; -用于根據所述評論特征,確定所述評論的有效性的裝置。
10. 根據權利要求9所述的裝置,其中,所述評論特征包括以下至少任一項: -所述評論的評論者特征; -所述評論的內容特征。
11. 根據權利要求10所述的裝置,其中,所述評論者特征包括以下任一項或任多項: -所述評論者所使用的IP地址信息; -所述評論者的注冊相關信息; -所述評論者進行評論的時間相關信息; -所述評論者所發(fā)出的評論的內容相關信息; 其中,所述內容特征包括: -所述評論的內容中所包含的各個字符和/或詞的分別的重復次數。
12. 根據權利要求9至11中任一項所述的裝置,其中,所述用于根據所述評論特征,確 定所述評論的有效性的裝置包括: -用于根據所述一個或多個評論中的各個評論的各自的評論特征,確定所述各個評論 之間的第一聚類關系和/或所述各個評論的各個評論者之間的第二聚類關系的裝置; -用于根據所述一個或多個評論中的各個評論的各自的評論特征,以及所述第一聚類 關系和/或所述第二聚類關系,確定所述評論的有效性的裝置。
13. 根據權利要求12所述的裝置,其中,所述用于根據所述一個或多個評論中的各個 評論的各自的評論特征,確定所述各個評論之間的第一聚類關系的裝置包括: -用于根據所述各個評論的各自的評論特征,將所述各個評論進行分組的裝置; -用于根據所述各個評論的各自的評論特征,計算同一分組中的各個評論之間的各個 余弦距離的裝置; -用于根據所述各個余弦距離,確定所述同一分組中的各個評論之間的第一聚類關系 的裝置。
14. 根據權利要求12所述的裝置,其中,所述用于根據所述一個或多個評論中的各個 評論的各自的評論特征,確定所述各個評論的各個評論者之間的第二聚類關系的裝置包 括: -用于根據所述各個評論的各自的評論特征,將所述各個評論的各個評論者進行分組 的裝置; -用于根據所述各個評論的各自的評論特征,計算同一分組中的各個評論者之間的各 個余弦距離的裝置; -用于根據所述各個余弦距離,確定所述同一分組中的各個評論者之間的第二聚類關 系的裝置。
15. 根據權利要求12或14所述的裝置,其中,還包括: -用于根據所述各個評論的各自的評論特征,并基于所述第二聚類關系,對所述各個評 論的各自的評論者的相關信息進行第一處理的裝置,其中,所述第一處理包括以下任一項 或任多項: -加標簽處理; -過濾處理; -降低權重處理。
16. 根據權利要求9至15中任一項所述的裝置,其中,還包括: -用于根據所確定的所述一個或多個評論中的各個評論的有效性信息,對所述一個或 多個評論進行第二處理的裝置,其中所述第二處理包括以下任一項或任多項: -合并處理; -過濾處理; -降低權重處理。
17. -種搜索信息的方法,其中包括: -基于來自用戶設備的查詢序列進行匹配查詢,獲取一條或多條搜索結果,其中包括至 少一個評論; -根據所述評論的有效性,將所述至少一個評論提供給用戶設備; 其中,還包括,根據權利要求1至8中任一項所述的方法來確定各個評論的有效性。
18. -種搜索信息的裝置,其中包括: -用于基于來自用戶設備的查詢序列進行匹配查詢,獲取一條或多條搜索結果,其中包 括至少一個評論的裝置; -用于根據所述評論的有效性,將所述至少一個評論提供給用戶設備的裝置; 其中,還包括,根據權利要求9至16中任一項所述的用于確定各個評論的有效性的裝 置。
【文檔編號】G06F17/30GK104281665SQ201410499733
【公開日】2015年1月14日 申請日期:2014年9月25日 優(yōu)先權日:2014年9月25日
【發(fā)明者】李書鵬, 劉曉明, 馬鋒, 王薇薇 申請人:北京百度網訊科技有限公司