一種評論數(shù)據(jù)處理方法和裝置、一種搜索方法和系統(tǒng)的制作方法
【專利摘要】本申請?zhí)峁┝艘环N評論數(shù)據(jù)處理方法和裝置,涉及網(wǎng)絡(luò)【技術(shù)領(lǐng)域】。所述方法包括:預(yù)置特征詞詞庫和情感詞詞庫;基于所述特征詞詞庫和情感詞詞庫,對評論數(shù)據(jù)處理的步驟包括:根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù);根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞;根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值;根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。本申請可針對商品的不同方面的特征進(jìn)行分析,獲得評論者對所述商品的各方面的情感取向;還提高了對具有短文本、口語化偏重等特點(diǎn)的評論數(shù)據(jù)分析的準(zhǔn)確率、可提高相關(guān)網(wǎng)絡(luò)資源的利用率。
【專利說明】一種評論數(shù)據(jù)處理方法和裝置、一種搜索方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本申請涉及網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別是涉及一種評論數(shù)據(jù)處理方法和裝置、一種搜索方法和系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)以成為人們獲取信息的一個非常重要的手段,但是隨著信息的爆炸式增長,人們很難在較短時間內(nèi)找到自己需要的信息。比如,對于一些商品的相關(guān)信息,這個商品質(zhì)量的好壞,服務(wù)提供商提供的服務(wù)的好壞等等。用戶一般是根據(jù)某個商品的評分或者評論,去了解自己需要的商品的相關(guān)信息。然而隨著交易量的大幅提升,累積了巨量的商品的評論數(shù)據(jù)數(shù)量,就迫切需要對各評論數(shù)據(jù)進(jìn)行分析(比如分析評論者對所述商品的情感傾向),以獲得評論者對于所述商品的評價。比如,對于電子商務(wù)類網(wǎng)站中的某個賣家的一個商品,用戶可以根據(jù)所述商品的評分或購買過所述商品的用戶的評論數(shù)據(jù)去了解所述商品的信息。而對于評論數(shù)據(jù)數(shù)量巨大的商品,比如熱銷商品,其評論數(shù)據(jù)數(shù)能達(dá)到數(shù)萬條,用戶往往不可能逐一閱讀分析,因此,需要對用戶的評論數(shù)據(jù)進(jìn)行情感分析,分析以獲得能簡單的讓用戶對商品進(jìn)行了解的信息。
[0003]現(xiàn)有技術(shù)中對商品評論數(shù)據(jù)進(jìn)行分析分析時,首先對文本進(jìn)行單方面的情感取向進(jìn)行分析,比如,對于一條評論數(shù)據(jù),通常有三種情感取向,即,正面態(tài)度、中立態(tài)度和負(fù)面態(tài)度?,F(xiàn)有技術(shù)對一條評論數(shù)據(jù)分析完后一般只是三者之一,即要么是正面態(tài)度,要么是中立態(tài)度,要么是負(fù)面態(tài)度,這種方式無法全面地反應(yīng)出評論者對商品的評價。
[0004]由于現(xiàn)有技術(shù)是基于長文本和書面化語言的特點(diǎn)進(jìn)行分析,因?yàn)殚L文本由于篇幅較長,包含的情感特征相對比較多,而相同場景下短文本描述特征、情感特征則比較稀疏,語義上存在不確定性。對于商品評論數(shù)據(jù)分析,描述特征是指文本所涵蓋的對商品特征屬性的描述,而情感特征為評論者的情感態(tài)度的表達(dá);其次,長文本通常存在一定的上下文含義。從語義上說,與較短文本相比,長文本會顯示更多的邏輯關(guān)系,基于所述邏輯關(guān)系特征的文本分析法不適用于短文本。再次長文本存在一定的文本結(jié)構(gòu);一般情況下,長文本的首句和結(jié)尾句(含有多個段落的文本亦然)含有更多涉及文本中心意義的描述特征和情感特征。基于所述特征的文本分析法不適用于短文本。
[0005]此外,由于短文本較長文本在措辭上顯得更為隨意和口語化,所述特點(diǎn)將使常規(guī)的文本分析算法的精度下降;雖然現(xiàn)有技術(shù)的分析方式對于長文本、書面語的文本(比如影視評論數(shù)據(jù)等)準(zhǔn)確率較高,但對于文本較短,偏重口語化,涵蓋內(nèi)容廣泛等特點(diǎn)的評論數(shù)據(jù)的分析效果比較差,不夠精確。
[0006]另外現(xiàn)有技術(shù)中由于上述對于短文本的分析效果差,不夠精確,導(dǎo)致在搜索引擎中基于短文本的分析結(jié)果對目標(biāo)對象構(gòu)建搜索引擎時效果不佳,返回給用戶端的結(jié)果也不夠精確,造成相關(guān)網(wǎng)絡(luò)資源的浪費(fèi)。
【發(fā)明內(nèi)容】
[0007]本申請所要解決的技術(shù)問題之一是提供一種評論數(shù)據(jù)處理方法和裝置,能更完整、更準(zhǔn)確的對商品對應(yīng)的偏重口語化、涵蓋內(nèi)容廣泛等特點(diǎn)的評論數(shù)據(jù)進(jìn)行分析,更精確的分析評論數(shù)據(jù)的各種特征詞的情感傾向。
[0008]為了解決上述問題,本申請公開了一種評論數(shù)據(jù)處理方法,包括:
[0009]預(yù)置特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素;
[0010]基于所述特征詞詞庫和情感詞詞庫,對評論數(shù)據(jù)處理的步驟包括:
[0011]根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù);
[0012]根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞;
[0013]根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值;
[0014]根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。
[0015]優(yōu)選的,所述預(yù)置特征詞詞庫步驟包括:
[0016]從商品所屬類目的各商品的評論數(shù)據(jù)中,獲取評論數(shù)據(jù)樣本集;
[0017]從所述評論數(shù)據(jù)樣本集中,提取符合閾值條件的名詞和名詞性語素;
[0018]將所獲得的名詞和名詞性語素作為特征詞,建立特征詞庫。
[0019]優(yōu)選的,所述從所述評論數(shù)據(jù)樣本集中,提取符合閾值條件的名詞和名詞性語素包括:
[0020]對每條評論數(shù)據(jù)進(jìn)行分詞和詞性標(biāo)注,并提取每條評論數(shù)據(jù)中的名詞和名詞性語素;
[0021]將獲得的各條評論數(shù)據(jù)中的名詞或者名詞性語素進(jìn)行匯總,獲得各名詞和名詞性語素的出現(xiàn)的次數(shù);
[0022]將出現(xiàn)次數(shù)小于最小支持度的名詞或名詞性語素去除;所述最小支持度通過評論數(shù)據(jù)總數(shù)乘以支持度閾值獲得;
[0023]去除不代表商品特征的名詞和名詞性語素。
[0024]優(yōu)選的,所述預(yù)置特征詞詞庫步驟包括:
[0025]從商品所屬類目的各商品的評論數(shù)據(jù)中,獲取評論數(shù)據(jù)樣本集;
[0026]根據(jù)所述評論數(shù)據(jù)樣本集,提取形容詞和形容詞性語素作為情感詞種子,并相應(yīng)標(biāo)注情感取向值;
[0027]根據(jù)所述情感詞種子及相應(yīng)情感取向值,結(jié)合同義詞、和/或反義詞詞典構(gòu)建情感詞詞庫。
[0028]優(yōu)選的,所述根據(jù)所述情感詞種子及相應(yīng)情感取向值,結(jié)合同義詞、和/或反義詞詞典構(gòu)建情感詞詞庫包括:
[0029]以所述情感詞種子及相應(yīng)情感取向值構(gòu)建初始情感詞詞庫;
[0030]將各情感詞種子,在同義詞詞典中查詢與情感詞種子的同義詞,將所述同義詞作為情感詞加入情感詞詞庫,并標(biāo)注相應(yīng)情感詞種子的情感取向值;
[0031]和/或,將各情感詞種子,在反義詞詞典中查詢與情感詞種子的反義詞,將所述反義詞作為情感詞加入情感詞詞庫,并標(biāo)注相應(yīng)情感詞種子的相反的情感取向值;
[0032]判斷當(dāng)前情感詞詞庫的數(shù)量是否小于閾值;如果小于,則將當(dāng)前詞庫中未使用過的情感詞作為情感詞種子,繼續(xù)查找同義詞詞典和/或反義詞詞典,獲取情感詞;如果不小于,則退出循環(huán)迭代,將當(dāng)前詞庫作為最終的情感詞詞庫。
[0033]優(yōu)選的,根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值包括:
[0034]將所述條評論數(shù)據(jù)中的形容詞和形容詞性語素在情感詞詞庫中進(jìn)行匹配,當(dāng)匹配上,則將所述形容詞和形容詞性語素作為所述條評論數(shù)據(jù)的情感詞;
[0035]針對獲得的每條評論數(shù)據(jù)的特征詞,選取當(dāng)前語句中與所述特征詞距離最近的情感詞作為所述特征詞的有效的情感詞。
[0036]優(yōu)選的,還包括:
[0037]當(dāng)針對每條評論數(shù)據(jù)的名詞和名詞性語素,遍歷特征詞詞庫,未能獲得每條評論數(shù)據(jù)的特征詞時,則針對每條評論數(shù)據(jù)的詞,遍歷情感詞詞庫,判斷是否存在情感詞;
[0038]當(dāng)存在時,則將距情感詞距離最近的名詞作為特征詞,并將所述情感詞作為對應(yīng)所述特征詞的有效情感詞。
[0039]優(yōu)選的,在所述根據(jù)情感詞詞庫中情感詞對應(yīng)的情感取向值,以及每條評論數(shù)據(jù)的特征詞及其對應(yīng)的情感詞,計(jì)算每條評論數(shù)據(jù)中特征詞的特征值之后,還包括:
[0040]根據(jù)所述各特征詞的特征值,及預(yù)置的各特征詞與目標(biāo)特征詞的對應(yīng)關(guān)系,計(jì)算所述目標(biāo)特征詞的第一特征值;
[0041]和/或,根據(jù)所述各特征詞的特征值,計(jì)算商品信息的綜合特征值。
[0042]優(yōu)選的,根據(jù)所述獲得的特征詞的情感取向值,計(jì)算所述特征詞對應(yīng)的目標(biāo)特征詞的第一特征值時包括:
[0043]根據(jù)預(yù)置的特征詞與目標(biāo)特征詞的多對一或者一對一關(guān)系,在同一目標(biāo)特征詞下,匯總不同情感取向值對應(yīng)的評論數(shù)據(jù)條數(shù);
[0044]對各情感取向值以評論數(shù)據(jù)條數(shù)為權(quán)重進(jìn)行加權(quán)平均計(jì)算,獲得目標(biāo)特征詞的第
一特征值。
[0045]優(yōu)選的,根據(jù)所述獲得的特征詞的情感取向值,計(jì)算商品信息的綜合特征值包括:
[0046]將各特征值的情感取向值乘以對應(yīng)評論者的評論者資深系數(shù)得到各特征詞的第二特征值;
[0047]根據(jù)所述各特征詞的第二特征值計(jì)算所述商品信息的綜合特征值。
[0048]優(yōu)選的,所述對應(yīng)評論者的評論者資深系數(shù)的獲得步驟包括:
[0049]提取所述條評論數(shù)據(jù)的評論者在商品信息所屬類目下的歷史評論數(shù)據(jù);
[0050]基于所述評論數(shù)據(jù),結(jié)合情感詞詞庫和/或特征詞詞庫,分析所述評論者的評論者資深系數(shù)。
[0051]優(yōu)選的,所述基于所述評論數(shù)據(jù),結(jié)合情感詞詞庫和/或特征詞詞庫,分析所述評論者的評論者資深系數(shù)包括:
[0052]基于所述情感詞詞庫,分析所述評論者各條評論數(shù)據(jù)的情感取向值;
[0053]統(tǒng)計(jì)情感取向值屬于正面的評論數(shù)據(jù)的第一數(shù)量,與情感取向值屬于負(fù)面的評論數(shù)據(jù)的第二數(shù)量;
[0054]當(dāng)所述第一數(shù)量與第二數(shù)量之差小于閾值,則增加當(dāng)前評論者資深系數(shù)值。
[0055]優(yōu)選的,所述基于所述評論數(shù)據(jù),結(jié)合情感詞詞庫和/或特征詞詞庫,分析所述評論者的評論者資深系數(shù)包括:
[0056]計(jì)算評論者的各評論數(shù)據(jù)中名詞和名詞性語素出現(xiàn)的總數(shù)與所述評論者的評論數(shù)據(jù)條數(shù)的第一比值;
[0057]計(jì)算目標(biāo)商品的各的評論數(shù)據(jù)中名詞和名詞性語素出現(xiàn)的總數(shù)與所述目標(biāo)商品的評論數(shù)據(jù)條數(shù)的第二比值;所述目標(biāo)商品對應(yīng)所述商品信息;
[0058]當(dāng)所述第一比值大于所述第二比值時,則增加當(dāng)前評論者資深系數(shù)值。
[0059]優(yōu)選的,所述基于所述評論數(shù)據(jù),結(jié)合情感詞詞庫和/或特征詞詞庫,分析所述評論者的評論者資深系數(shù)包括:
[0060]計(jì)算評論者的評論數(shù)據(jù)中屬于特征詞詞庫的名詞或名詞性語素的總數(shù)與所述評論者的評論數(shù)據(jù)條數(shù)的第三比值;
[0061]計(jì)算目標(biāo)商品的各評論數(shù)據(jù)中屬于特征詞詞庫的名詞或名詞性語素的總數(shù)與所述目標(biāo)商品的評論數(shù)據(jù)條數(shù)的第四比值;所述目標(biāo)商品對應(yīng)所述商品信息;
[0062]當(dāng)所述第三比值大于所述第四比值時,則增加當(dāng)前評論者資深系數(shù)值。
[0063]優(yōu)選的,所述基于所述評論數(shù)據(jù),結(jié)合情感詞詞庫和/或特征詞詞庫,分析所述評論者的評論者資深系數(shù)包括:
[0064]計(jì)算目標(biāo)商品的每個評論者的平均評論數(shù)據(jù)條數(shù),當(dāng)一評論者的評論數(shù)據(jù)條數(shù)大于所述平均評論數(shù)據(jù)條數(shù),則增加當(dāng)前評論者資深系數(shù)值;所述目標(biāo)商品對應(yīng)所述商品信
肩、O
[0065]本申請還公開了,一種搜索方法,包括:接收用戶端的查詢詞串;
[0066]根據(jù)所述查詢詞串在商品信息索引中進(jìn)行檢索,得到初始商品信息集合;
[0067]針對初始商品信息集合中每個商品信息,根據(jù)相應(yīng)評論數(shù)據(jù)中的特征詞的特征值,對所述商品信息進(jìn)行排序;
[0068]將排序靠前的至少一個商品信息返回給用戶端;
[0069]其中,所述特征詞的特征值獲得步驟包括:
[0070]預(yù)置特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素;
[0071]基于所述特征詞詞庫和情感詞詞庫,對評論數(shù)據(jù)處理的步驟包括:
[0072]根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù);
[0073]根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞;
[0074]根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值;
[0075]根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。
[0076]優(yōu)選的,所述基于所述特征詞詞庫和情感詞詞庫,對評論數(shù)據(jù)處理的步驟還包括:[0077]根據(jù)所述各特征詞的特征值,及預(yù)置的各特征詞與目標(biāo)特征詞的對應(yīng)關(guān)系,計(jì)算所述目標(biāo)特征詞的第一特征值;
[0078]和/或,根據(jù)所述各特征詞的特征值,計(jì)算商品信息的綜合特征值。
[0079]優(yōu)選的,所述根據(jù)相應(yīng)評論數(shù)據(jù)中的特征詞的特征值,對所述商品信息進(jìn)行排序包括:
[0080]提取與商品信息的評論數(shù)據(jù)相關(guān)的目標(biāo)特征詞,并根據(jù)所述目標(biāo)特征詞的第一特征值對所述商品信息進(jìn)行排序;
[0081]或者,根據(jù)所述商品信息的綜合特征值對所述商品信息進(jìn)行排序。
[0082]本申請還公開了,一種搜索方法,包括:
[0083]接收用戶端的查詢詞串;
[0084]根據(jù)所述查詢詞串在賣家店鋪索引中進(jìn)行檢索,得到初始賣家店鋪集合;
[0085]針對初始賣家店鋪,根據(jù)賣家店鋪中各商品信息的評論數(shù)據(jù)的各特征詞的特征值,對賣家店鋪進(jìn)行排序;
[0086]返回至少一個排序靠前的賣家店鋪給用戶端;
[0087]其中,所述特征詞的特征值獲得步驟包括:
[0088]預(yù)置特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素;
[0089]基于所述特征詞詞庫和情感詞詞庫,對評論數(shù)據(jù)處理的步驟包括:
[0090]根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù);
[0091]根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞;
[0092]根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值;
[0093]根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。
[0094]本申請還公開了一種評論數(shù)據(jù)展示方法,包括:
[0095]接收用戶端的對應(yīng)商品信息的查看請求;
[0096]根據(jù)所述查看請求對應(yīng)的商品信息,提取所述商品信息的評論數(shù)據(jù)的各特征詞及特征值,并根據(jù)所述特征詞及特征值進(jìn)行展示;
[0097]其中,所述商品信息的各特征詞及特征值獲得步驟包括:
[0098]預(yù)置特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素;
[0099]基于所述特征詞詞庫和情感詞詞庫,對評論數(shù)據(jù)處理的步驟包括:
[0100]根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù);
[0101]根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞;
[0102]根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值;
[0103]根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值;
[0104]針對相同的特征詞,將所述特征詞的各特征值進(jìn)行匯總。
[0105]相應(yīng)的本申請公開了一種評論數(shù)據(jù)處理裝置,包括:
[0106]特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素;
[0107]數(shù)據(jù)獲取模塊,用于根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù);
[0108]特征詞獲取模塊,用于根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞;
[0109]情感詞確認(rèn)模塊,用于根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值;
[0110]特征值計(jì)算模塊,用于根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。
[0111]相應(yīng)的本申請還公開了一種搜索系統(tǒng),包括:
[0112]所述搜索引擎和評論數(shù)據(jù)處理裝置;
[0113]所述搜索引擎包括:
[0114]查詢接收模塊,用于接收用戶端的查詢詞串;
[0115]檢索模塊,用于根據(jù)所述查詢詞串在商品信息索引中進(jìn)行檢索,得到初始商品信息集合;
[0116]排序模塊,用于針對初始商品信息集合中每個商品信息,根據(jù)相應(yīng)評論數(shù)據(jù)中的特征詞的特征值,對所述商品信息進(jìn)行排序;
[0117]返回模塊,用于將排序靠前的至少一個商品信息返回給用戶端;
[0118]所述評論數(shù)據(jù)處理裝置包括:
[0119]特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素;
[0120]數(shù)據(jù)獲取模塊,用于根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù);
[0121]特征詞獲取模塊,用于根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞;
[0122]情感詞確認(rèn)模塊,用于根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值;
[0123]特征值計(jì)算模塊,用于根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。
[0124]優(yōu)選的,所述評論數(shù)據(jù)處理裝置還包括:
[0125]第一特征值計(jì)算模塊,用于根據(jù)所述各特征詞的特征值,及預(yù)置的各特征詞與目標(biāo)特征詞的對應(yīng)關(guān)系,計(jì)算所述目標(biāo)特征詞的第一特征值;
[0126]和/或,綜合特征值計(jì)算模塊,用于根據(jù)所述各特征詞的特征值,計(jì)算商品信息的綜合特征值。
[0127]優(yōu)選的,所述根據(jù)相應(yīng)評論數(shù)據(jù)中的特征詞的特征值,對所述商品信息進(jìn)行排序包括:
[0128]第一排序模塊,用于提取與商品信息的評論數(shù)據(jù)相關(guān)的目標(biāo)特征詞,并根據(jù)所述目標(biāo)特征詞的第一特征值對所述商品信息進(jìn)行排序;
[0129]或者,第二排序模塊,用于根據(jù)所述商品信息的綜合特征值對所述商品信息進(jìn)行排序。
[0130]相應(yīng)的本申請還公開了一種搜索系統(tǒng),包括:
[0131]搜索引擎和評論數(shù)據(jù)處理裝置;
[0132]所述搜索引擎包括:
[0133]第一查詢接收模塊,用于接收用戶端的查詢詞串;
[0134]第一檢索模塊,用于根據(jù)所述查詢詞串在賣家店鋪索引中進(jìn)行檢索,得到初始賣家店鋪集合;
[0135]第一排序模塊,用于針對初始賣家店鋪,根據(jù)賣家店鋪中各商品信息的評論數(shù)據(jù)的各特征詞的特征值,對賣家店鋪進(jìn)行排序;
[0136]第一返回模塊,用于返回至少一個排序靠前的賣家店鋪給用戶端;
[0137]所述評論數(shù)據(jù)處理裝置包括:
[0138]特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素;
[0139]數(shù)據(jù)獲取模塊,用于根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù);
[0140]特征詞獲取模塊,用于根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞;
[0141]情感詞確認(rèn)模塊,用于根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值;
[0142]特征值計(jì)算模塊,用于根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。
[0143]相應(yīng)的本申請還公開了一種評論數(shù)據(jù)展示裝置,包括:
[0144]查看請求接收模塊,用于接收用戶端的對應(yīng)商品信息的查看請求;
[0145]展示模塊,用于根據(jù)所述查看請求對應(yīng)的商品信息,提取所述商品信息的各特征詞及特征值,并根據(jù)所述特征詞及特征值進(jìn)行展示;
[0146]其中,所述商品信息的各特征詞及特征值獲得的模塊包括:
[0147]特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素;
[0148]數(shù)據(jù)獲取模塊,用于根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù);
[0149]特征詞獲取模塊,用于根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞;
[0150]情感詞確認(rèn)模塊,用于根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值;
[0151]特征值計(jì)算模塊,用于根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值;
[0152]匯總模塊,用于針對相同的特征詞,將所述特征詞的各特征值進(jìn)行匯總。
[0153]與現(xiàn)有技術(shù)相比,本申請包括以下優(yōu)點(diǎn):
[0154]本申請針對每條評論數(shù)據(jù)的名詞和名詞性語素,遍歷特征詞詞庫,獲得每條評論數(shù)據(jù)的特征詞,并根據(jù)特征詞確定所述特征詞的有效情感詞,然后根據(jù)所述特征詞的有效情感詞,查詢情感詞詞庫獲得特征詞的情感取向值。首先,通過本申請可以針對商品的不同方面的特征進(jìn)行分析,獲得評論者對所述商品的各方面的情感取向,比如評論者對商品的質(zhì)量滿意,但對商品的物流不滿意,對商品的外觀不滿意等。其次,通過本申請,提高了對具有短文本、口語化偏重等特點(diǎn)的評論數(shù)據(jù)分析的準(zhǔn)確率,具有更客觀的分析結(jié)果,這提高了相關(guān)網(wǎng)絡(luò)資源的利用率。
【專利附圖】
【附圖說明】
[0155]圖1是本申請一種評論數(shù)據(jù)處理方法實(shí)施例一的流程示意圖;
[0156]圖2是本申請一種評論數(shù)據(jù)處理方法的特征詞詞庫的建立流程示意圖;
[0157]圖3是本申請一種評論數(shù)據(jù)處理方法的情感詞詞庫的建立流程示意圖;
[0158]圖4是本申請一種評論數(shù)據(jù)處理方法實(shí)施例二的流程示意圖;
[0159]圖5是本申請一種評論數(shù)據(jù)處理方法實(shí)施例三的流程示意圖;
[0160]圖6是本申請一種搜索方法實(shí)施例一的流程不意圖;
[0161]圖7是本申請一種搜索方法實(shí)施例二的流程不意圖;
[0162]圖8是本申請一種評論數(shù)據(jù)展示方法實(shí)施例一的流程示意圖;
[0163]圖9是本申請一種評論數(shù)據(jù)處理裝置實(shí)施例一的結(jié)構(gòu)示意圖;
[0164]圖10是本申請一種搜索系統(tǒng)實(shí)施例一的結(jié)構(gòu)示意圖;
[0165]圖11是本申請一種搜索系統(tǒng)實(shí)施例二的結(jié)構(gòu)示意圖;
[0166]圖12是本申請一種評論數(shù)據(jù)展示裝置實(shí)施例一的結(jié)構(gòu)示意圖,
【具體實(shí)施方式】
[0167]為使本申請的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對本申請作進(jìn)一步詳細(xì)的說明。
[0168]方法實(shí)施例一
[0169]參照圖1,其示出了本申請一種評論數(shù)據(jù)處理方法實(shí)施例一的流程示意圖,具體可以包括:
[0170]步驟100,預(yù)置特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素;
[0171]在本申請中,可預(yù)先建立特征詞詞庫和情感詞詞庫,然后再基于特征詞詞庫進(jìn)行評論數(shù)據(jù)的分析。所述特征詞詞庫用戶判斷和獲取評論數(shù)據(jù)中的特征詞,所述情感詞用于判斷和獲取評論數(shù)據(jù)中的有效情感詞,并設(shè)置有效情感詞的情感取向值。特征詞詞庫中的詞可以是名詞和/或名詞性語素,情感詞詞庫中的詞可以是形容詞和/或形容詞性語素。其中,所述名詞性語素可以是動名詞等,如“發(fā)貨”,所述形容詞性語素可以是副詞+名詞等,如“非常好”。
[0172]本申請的特征詞詞庫和情感詞詞庫可按商品的類目進(jìn)行構(gòu)建。比如抽樣某個類目的50萬件商品的評論數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù),從這些基礎(chǔ)數(shù)據(jù)中提取特征詞和情感詞,并對情感詞進(jìn)行情感取向值的設(shè)定。[0173]優(yōu)選地,參照圖2,所述預(yù)置特征詞詞庫步驟包括:
[0174]步驟AlOI,從商品所屬類目的各商品的評論數(shù)據(jù)中,獲取評論數(shù)據(jù)樣本集;
[0175]在選取商品所屬類目的范圍時,可以根據(jù)實(shí)際需求選取,比如,如果需要對某款筆記本電腦的評論數(shù)據(jù)進(jìn)行分析,那么可以針對所有筆記本電腦這一層級的類目選取評論數(shù)據(jù)樣本集。
[0176]比如獲取得到下列評論數(shù)據(jù)樣本集M:
[0177]I 質(zhì)量非常好,物超所值,但就是發(fā)貨很慢,物流太差?!?br>
[0178]2:“質(zhì)量一般。幫舅舅買的,他說還行。”
[0179]3:“發(fā)貨慢,物流太差了。但是質(zhì)量沒得說?!?br>
[0180]4: “等了一個星期才發(fā)貨,急死人了?!?br>
[0181]步驟A102,從所述評論數(shù)據(jù)樣本集中,提取符合閾值條件的名詞和名詞性語素;
[0182]得到評論數(shù)據(jù)樣本集后,則可基于所述評論樣本集,根據(jù)預(yù)設(shè)的閾值條件對其中的名詞和名稱性語素進(jìn)行提取。
[0183]優(yōu)選的,所述從所述評論數(shù)據(jù)樣本集中,提取符合閾值條件的名詞和名詞性語素包括:
[0184]步驟A1021,對每條評論數(shù)據(jù)進(jìn)行分詞和詞性標(biāo)注,并提取每條評論數(shù)據(jù)中的名詞和名詞性語素;
`[0185]比如對于前述的評論樣本集M,在進(jìn)行分詞和詞性標(biāo)注,提取每條評論數(shù)據(jù)中的名詞和名詞性語素后的得到的項(xiàng)集為:
[0186]1:[質(zhì)量,發(fā)貨,物流]]
[0187]2:[質(zhì)量,舅舅]
[0188]3:[發(fā)貨,物流,質(zhì)量]
[0189]4:[星期,發(fā)貨,人]
[0190]步驟A1022,將獲得的各條評論數(shù)據(jù)中的名詞或者名詞性語素進(jìn)行匯總,獲得各名詞和名詞性語素的出現(xiàn)的次數(shù);
[0191]初始時每個項(xiàng)都被看成候選1-項(xiàng)集(即只包含一個詞的項(xiàng)集),對各個名詞或名詞性語素的出現(xiàn)次數(shù)(也可理解為支持度)計(jì)數(shù),如表一:
[0192]
【權(quán)利要求】
1.一種評論數(shù)據(jù)處理方法,其特征在于,包括: 預(yù)置特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素; 基于所述特征詞詞庫和情感詞詞庫,對評論數(shù)據(jù)處理的步驟包括: 根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù); 根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞; 根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值; 根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)置特征詞詞庫步驟包括: 從商品所屬類目的各商品的評論數(shù)據(jù)中,獲取評論數(shù)據(jù)樣本集; 從所述評論數(shù)據(jù)樣本集中,提取符合閾值條件的名詞和名詞性語素; 將所獲得的名詞和名詞性語素作為特征詞,建立特征詞庫。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述從所述評論數(shù)據(jù)樣本集中,提取符合閾值條件的名詞和名詞性語素包括: 對每條評論數(shù)據(jù)進(jìn)行分詞和詞性標(biāo)注,并提取每條評論數(shù)據(jù)中的名詞和名詞性語素;將獲得的各條評論數(shù)據(jù)中的名詞或者名詞性語素進(jìn)行匯總,獲得各名詞和名詞性語素的出現(xiàn)的次數(shù); 將出現(xiàn)次數(shù)小于最小支持度的名詞或名詞性語素去除;所述最小支持度通過評論數(shù)據(jù)總數(shù)乘以支持度閾值獲得; 去除不代表商品特征的名詞和名詞性語素。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)置特征詞詞庫步驟包括: 從商品所屬類目的各商品的評論數(shù)據(jù)中,獲取評論數(shù)據(jù)樣本集; 根據(jù)所述評論數(shù)據(jù)樣本集,提取形容詞和形容詞性語素作為情感詞種子,并相應(yīng)標(biāo)注情感取向值; 根據(jù)所述情感詞種子及相應(yīng)情感取向值,結(jié)合同義詞、和/或反義詞詞典構(gòu)建情感詞詞庫。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述情感詞種子及相應(yīng)情感取向值,結(jié)合同義詞、和/或反義詞詞典構(gòu)建情感詞詞庫包括: 以所述情感詞種子及相應(yīng)情感取向值構(gòu)建初始情感詞詞庫; 將各情感詞種子,在同義詞詞典中查詢與情感詞種子的同義詞,將所述同義詞作為情感詞加入情感詞詞庫,并標(biāo)注相應(yīng)情感詞種子的情感取向值; 和/或,將各情感詞種子,在反義詞詞典中查詢與情感詞種子的反義詞,將所述反義詞作為情感詞加入情感詞詞庫,并標(biāo)注相應(yīng)情感詞種子的相反的情感取向值; 判斷當(dāng)前情感詞詞庫的數(shù)量是否小于閾值;如果小于,則將當(dāng)前詞庫中未使用過的情感詞作為情感詞種子,繼續(xù)查找同義詞詞典和/或反義詞詞典,獲取情感詞;如果不小于,則退出循環(huán)迭代,將當(dāng)前詞庫作為最終的情感詞詞庫。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值包括: 將所述條評論數(shù)據(jù)中的形容詞和形容詞性語素在情感詞詞庫中進(jìn)行匹配,當(dāng)匹配上,則將所述形容詞和形容詞性語素作為所述條評論數(shù)據(jù)的情感詞; 針對獲得的每條評論數(shù)據(jù)的特征詞,選取當(dāng)前語句中與所述特征詞距離最近的情感詞作為所述特征詞的有效的情感詞。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 當(dāng)針對每條評論數(shù)據(jù)的名詞和名詞性語素,遍歷特征詞詞庫,未能獲得每條評論數(shù)據(jù)的特征詞時,則針對每條評論數(shù)據(jù)的詞,遍歷情感詞詞庫,判斷是否存在情感詞; 當(dāng)存在時,則將距情感詞距離最近的名詞作為特征詞,并將所述情感詞作為對應(yīng)所述特征詞的有效情感詞。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述根據(jù)情感詞詞庫中情感詞對應(yīng)的情感取向值,以及每條評論數(shù)據(jù)的特征詞及其對應(yīng)的情感詞,計(jì)算每條評論數(shù)據(jù)中特征詞的特征值之后,還包括: 根據(jù)所述各特征詞的 特征值,及預(yù)置的各特征詞與目標(biāo)特征詞的對應(yīng)關(guān)系,計(jì)算所述目標(biāo)特征詞的第一特征值; 和/或,根據(jù)所述各特征詞的特征值,計(jì)算商品信息的綜合特征值。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,根據(jù)所述獲得的特征詞的情感取向值,計(jì)算所述特征詞對應(yīng)的目標(biāo)特征詞的第一特征值時包括: 根據(jù)預(yù)置的特征詞與目標(biāo)特征詞的多對一或者一對一關(guān)系,在同一目標(biāo)特征詞下,匯總不同情感取向值對應(yīng)的評論數(shù)據(jù)條數(shù); 對各情感取向值以評論數(shù)據(jù)條數(shù)為權(quán)重進(jìn)行加權(quán)平均計(jì)算,獲得目標(biāo)特征詞的第一特征值。
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,根據(jù)所述獲得的特征詞的情感取向值,計(jì)算商品信息的綜合特征值包括: 將各特征值的情感取向值乘以對應(yīng)評論者的評論者資深系數(shù)得到各特征詞的第二特征值; 根據(jù)所述各特征詞的第二特征值計(jì)算所述商品信息的綜合特征值。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述對應(yīng)評論者的評論者資深系數(shù)的獲得步驟包括: 提取所述條評論數(shù)據(jù)的評論者在商品信息所屬類目下的歷史評論數(shù)據(jù); 基于所述評論數(shù)據(jù),結(jié)合情感詞詞庫和/或特征詞詞庫,分析所述評論者的評論者資深系數(shù)。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述基于所述評論數(shù)據(jù),結(jié)合情感詞詞庫和/或特征詞詞庫,分析所述評論者的評論者資深系數(shù)包括: 基于所述情感詞詞庫,分析所述評論者各條評論數(shù)據(jù)的情感取向值; 統(tǒng)計(jì)情感取向值屬于正面的評論數(shù)據(jù)的第一數(shù)量,與情感取向值屬于負(fù)面的評論數(shù)據(jù)的第二數(shù)量; 當(dāng)所述第一數(shù)量與第二數(shù)量之差小于閾值,則增加當(dāng)前評論者資深系數(shù)值。
13.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述基于所述評論數(shù)據(jù),結(jié)合情感詞詞庫和/或特征詞詞庫,分析所述評論者的評論者資深系數(shù)包括: 計(jì)算評論者的各評論數(shù)據(jù)中名詞和名詞性語素出現(xiàn)的總數(shù)與所述評論者的評論數(shù)據(jù)條數(shù)的第一比值; 計(jì)算目標(biāo)商品的各的評論數(shù)據(jù)中名詞和名詞性語素出現(xiàn)的總數(shù)與所述目標(biāo)商品的評論數(shù)據(jù)條數(shù)的第二比值;所述目標(biāo)商品對應(yīng)所述商品信息; 當(dāng)所述第一比值大于所述第二比值時,則增加當(dāng)前評論者資深系數(shù)值。
14.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述基于所述評論數(shù)據(jù),結(jié)合情感詞詞庫和/或特征詞詞庫,分析所述評論者的評論者資深系數(shù)包括: 計(jì)算評論者的評論數(shù)據(jù)中屬于特征詞詞庫的名詞或名詞性語素的總數(shù)與所述評論者的評論數(shù)據(jù)條數(shù)的第三比值; 計(jì)算目標(biāo)商品的各評論數(shù)據(jù)中屬于特征詞詞庫的名詞或名詞性語素的總數(shù)與所述目標(biāo)商品的評論數(shù)據(jù)條數(shù)的第四比值;所述目標(biāo)商品對應(yīng)所述商品信息; 當(dāng)所述第三比值大于所述第四比值時,則增加當(dāng)前評論者資深系數(shù)值。
15.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述基于所述評論數(shù)據(jù),結(jié)合情感詞詞庫和/或特征詞詞庫,分析所述評論者的評論者資深系數(shù)包括: 計(jì)算目標(biāo)商品的每個評論 者的平均評論數(shù)據(jù)條數(shù),當(dāng)一評論者的評論數(shù)據(jù)條數(shù)大于所述平均評論數(shù)據(jù)條數(shù),則增加當(dāng)前評論者資深系數(shù)值;所述目標(biāo)商品對應(yīng)所述商品信息。
16.一種搜索方法,其特征在于,包括:接收用戶端的查詢詞串; 根據(jù)所述查詢詞串在商品信息索引中進(jìn)行檢索,得到初始商品信息集合; 針對初始商品信息集合中每個商品信息,根據(jù)相應(yīng)評論數(shù)據(jù)中的特征詞的特征值,對所述商品信息進(jìn)行排序; 將排序靠前的至少一個商品信息返回給用戶端; 其中,所述特征詞的特征值獲得步驟包括: 預(yù)置特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素; 基于所述特征詞詞庫和情感詞詞庫,對評論數(shù)據(jù)處理的步驟包括: 根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù); 根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞; 根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值; 根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。
17.根據(jù)權(quán)利要求16所述的方法,其特征在于,所述基于所述特征詞詞庫和情感詞詞庫,對評論數(shù)據(jù)處理的步驟還包括: 根據(jù)所述各特征詞的特征值,及預(yù)置的各特征詞與目標(biāo)特征詞的對應(yīng)關(guān)系,計(jì)算所述目標(biāo)特征詞的第一特征值; 和/或,根據(jù)所述各特征詞的特征值,計(jì)算商品信息的綜合特征值。
18.根據(jù)權(quán)利要求17所述的方法,其特征在于,所述根據(jù)相應(yīng)評論數(shù)據(jù)中的特征詞的特征值,對所述商品信息進(jìn)行排序包括: 提取與商品信息的評論數(shù)據(jù)相關(guān)的目標(biāo)特征詞,并根據(jù)所述目標(biāo)特征詞的第一特征值對所述商品信息進(jìn)行排序; 或者,根據(jù)所述商品信息的綜合特征值對所述商品信息進(jìn)行排序。
19.一種搜索方法,其特征在于,包括: 接收用戶端的查詢詞串; 根據(jù)所述查詢詞串在賣家店鋪索引中進(jìn)行檢索,得到初始賣家店鋪集合; 針對初始賣家店鋪,根據(jù)賣家店鋪中各商品信息的評論數(shù)據(jù)的各特征詞的特征值,對賣家店鋪進(jìn)行排序; 返回至少一個排序靠前的賣家店鋪給用戶端; 其中,所述特征詞的特征值獲得步驟包括: 預(yù)置特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素; 基于所述特征詞詞庫和情感詞詞庫,對評論數(shù)據(jù)處理的步驟包括: 根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù); 根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞; 根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值; 根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。
20.一種評論數(shù)據(jù)展示方法,其特征在于,包括: 接收用戶端的對應(yīng)商品信息的查看請求; 根據(jù)所述查看請求對應(yīng)的商品信息,提取所述商品信息的評論數(shù)據(jù)的各特征詞及特征值,并根據(jù)所述特征詞及特征值進(jìn)行展示; 其中,所述商品信息的各特征詞及特征值獲得步驟包括: 預(yù)置特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素; 基于所述特征詞詞庫和情感詞詞庫,對評論數(shù)據(jù)處理的步驟包括: 根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù); 根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞; 根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值; 根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值; 針對相同的特征詞,將所述特征詞的各特征值進(jìn)行匯總。
21.一種評論數(shù)據(jù)處理裝置,其特征在于,包括:特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素; 數(shù)據(jù)獲取模塊,用于根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù); 特征詞獲取模塊,用于根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞; 情感詞確認(rèn)模塊,用于根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值; 特征值計(jì)算模塊,用于根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。
22.一種搜索系統(tǒng),其特征在于,包括: 所述搜索引擎和評論數(shù)據(jù)處理裝置; 所述搜索引擎包 括: 查詢接收模塊,用于接收用戶端的查詢詞串; 檢索模塊,用于根據(jù)所述查詢詞串在商品信息索引中進(jìn)行檢索,得到初始商品信息集合; 排序模塊,用于針對初始商品信息集合中每個商品信息,根據(jù)相應(yīng)評論數(shù)據(jù)中的特征詞的特征值,對所述商品信息進(jìn)行排序; 返回模塊,用于將排序靠前的至少一個商品信息返回給用戶端; 所述評論數(shù)據(jù)處理裝置包括: 特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素; 數(shù)據(jù)獲取模塊,用于根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù); 特征詞獲取模塊,用于根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞; 情感詞確認(rèn)模塊,用于根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值; 特征值計(jì)算模塊,用于根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。
23.根據(jù)權(quán)利要求22所述的系統(tǒng),其特征在于,所述評論數(shù)據(jù)處理裝置還包括: 第一特征值計(jì)算模塊,用于根據(jù)所述各特征詞的特征值,及預(yù)置的各特征詞與目標(biāo)特征詞的對應(yīng)關(guān)系,計(jì)算所述目標(biāo)特征詞的第一特征值; 和/或,綜合特征值計(jì)算模塊,用于根據(jù)所述各特征詞的特征值,計(jì)算商品信息的綜合特征值。
24.根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于,所述根據(jù)相應(yīng)評論數(shù)據(jù)中的特征詞的特征值,對所述商品信息進(jìn)行排序包括: 第一排序模塊,用于提取與商品信息的評論數(shù)據(jù)相關(guān)的目標(biāo)特征詞,并根據(jù)所述目標(biāo)特征詞的第一特征值對所述商品信息進(jìn)行排序; 或者,第二排序模塊,用于根據(jù)所述商品信息的綜合特征值對所述商品信息進(jìn)行排序。
25.一種搜索系統(tǒng),其特征在于,包括:搜索引擎和評論數(shù)據(jù)處理裝置; 所述搜索引擎包括: 第一查詢接收模塊,用于接收用戶端的查詢詞串; 第一檢索模塊,用于根據(jù)所述查詢詞串在賣家店鋪索引中進(jìn)行檢索,得到初始賣家店鋪集合; 第一排序模塊,用于針對初始賣家店鋪,根據(jù)賣家店鋪中各商品信息的評論數(shù)據(jù)的各特征詞的特征值,對賣家店鋪進(jìn)行排序; 第一返回模塊,用于返回至少一個排序靠前的賣家店鋪給用戶端; 所述評論數(shù)據(jù)處理裝置包括: 特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素; 數(shù)據(jù)獲取模塊,用于根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù); 特征詞獲取模塊,用于根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞; 情感詞確認(rèn)模塊,用于根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值; 特征值計(jì)算模塊,用于根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值。`
26.一種評論數(shù)據(jù)展示裝置,其特征在于,包括: 查看請求接收模塊,用于接收用戶端的對應(yīng)商品信息的查看請求; 展示模塊,用于根據(jù)所述查看請求對應(yīng)的商品信息,提取所述商品信息的各特征詞及特征值,并根據(jù)所述特征詞及特征值進(jìn)行展示; 其中,所述商品信息的各特征詞及特征值獲得的模塊包括: 特征詞詞庫和情感詞詞庫;所述特征詞詞庫包括特征詞,所述特征詞為名詞或名詞性語素;所述情感詞詞庫包括情感詞及對應(yīng)的情感取向值,所述情感詞為形容詞或形容詞性語素; 數(shù)據(jù)獲取模塊,用于根據(jù)商品信息,獲取對應(yīng)商品信息的各條評論數(shù)據(jù); 特征詞獲取模塊,用于根據(jù)特征詞詞庫,確定每條評論數(shù)據(jù)中的特征詞; 情感詞確認(rèn)模塊,用于根據(jù)情感詞詞庫,確定評論數(shù)據(jù)中與各特征詞對應(yīng)的有效的情感詞及所述情感詞的取向值; 特征值計(jì)算模塊,用于根據(jù)所述情感詞與特征詞的對應(yīng)關(guān)系,及所述情感詞的取向值,計(jì)算每條評論數(shù)據(jù)中各特征詞的特征值; 匯總模塊,用于針對相同的特征詞,將所述特征詞的各特征值進(jìn)行匯總。
【文檔編號】G06Q30/00GK103679462SQ201210320786
【公開日】2014年3月26日 申請日期:2012年8月31日 優(yōu)先權(quán)日:2012年8月31日
【發(fā)明者】張輝, 陳志釗 申請人:阿里巴巴集團(tuán)控股有限公司