一種評價信息生成方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息處理技術(shù)領(lǐng)域,特別是涉及一種評價信息生成方法和一種評價信息生成裝置。
【背景技術(shù)】
[0002]目前,隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,人們可以非常容易的通過網(wǎng)絡(luò)查看某一信息點(Point of Interest, POI)如旅游景點、酒店、餐館等的評價信息。
[0003]現(xiàn)有的POI評價信息生成方法可以是:首先,抓取互聯(lián)網(wǎng)上對POI的評論數(shù)據(jù)(包括在線旅游網(wǎng)站,社交媒體,點評網(wǎng)站,游記等),然后對評論數(shù)據(jù)進(jìn)行預(yù)處理,包括提取其中結(jié)構(gòu)化信息(如評分,提交時間,提交人信息,具體評價內(nèi)容等);再提取預(yù)處理后評論數(shù)據(jù)的語義點也即評論詞并統(tǒng)計詞頻,其中,提取語義點可以利用基于統(tǒng)計的模型系統(tǒng)或基于模板的系統(tǒng)等方法實現(xiàn);最后利用情感分析系統(tǒng)來判斷每個語義點的正負(fù)評價后,為用戶展現(xiàn)語義點正負(fù)評價的比例和按頻率排列的語義點。
[0004]然而,按照上述方法生成的評價信息是一個個獨立的Tag標(biāo)簽,例如,房間干凈(比例:70%,詞頻:10),隔音差(比例:80%,詞頻:8),房間大(比例:60%,詞頻:5),衛(wèi)生間小(比例:70%,詞頻:3)等,缺少可讀性。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實施例所要解決的技術(shù)問題是提供一種評價信息生成方法,能夠提高評價信息的可讀性。
[0006]相應(yīng)的,本發(fā)明實施例還提供了一種評價信息生成裝置,用以保證上述方法的實現(xiàn)及應(yīng)用。
[0007]為了解決上述問題,本發(fā)明公開了一種評價信息生成方法,包括:
[0008]抓取信息點的評論數(shù)據(jù);
[0009]對所述評論數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,獲得評論詞及其描述信息,所述描述信息至少包括所述評論詞的正負(fù)評價信息;
[0010]根據(jù)預(yù)置規(guī)則及所述評論詞的描述信息,在所述評論詞中選擇關(guān)鍵評論詞;
[0011]依據(jù)語言生成模型將所述關(guān)鍵評論詞生成自然語句。
[0012]進(jìn)一步,在所述依據(jù)語言生成模型將所述關(guān)鍵評論詞生成自然語句之前,所述方法還包括:
[0013]獲取與所述信息點關(guān)聯(lián)的用戶個性信息;
[0014]在所述關(guān)鍵評論詞中選擇與所述用戶個性信息匹配的關(guān)鍵評論詞作為最終的關(guān)鍵評論詞;
[0015]所述依據(jù)語言生成模型將所述關(guān)鍵評論詞生成自然語句,包括:
[0016]依據(jù)語言生成模型將所述最終的關(guān)鍵評論詞生成自然語句。
[0017]進(jìn)一步,所述獲取與所述信息點關(guān)聯(lián)的用戶個性信息,包括:
[0018]接收所述用戶輸入的與所述信息點關(guān)聯(lián)的個性信息。
[0019]進(jìn)一步,所述獲取與所述信息點關(guān)聯(lián)的用戶個性信息,包括:
[0020]抓取所述用戶對所述信息點的關(guān)聯(lián)信息點的評論數(shù)據(jù);
[0021]對所述用戶的評論數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,獲得所述用戶個性信息。
[0022]進(jìn)一步,所述在所述關(guān)鍵評論詞中選擇與所述用戶個性信息匹配的關(guān)鍵評論詞作為最終的關(guān)鍵評論詞,包括:
[0023]確定所述用戶個性信息對應(yīng)的評論詞類別;
[0024]在所述關(guān)鍵評論詞中選擇屬于所述評論詞類別的關(guān)鍵評論詞,作為最終的關(guān)鍵評論詞。
[0025]本發(fā)明實施例還公開一種評價信息生成方法,包括:
[0026]抓取信息點的評論數(shù)據(jù);
[0027]對所述評論數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,獲得評論詞及其描述信息,所述描述信息至少包括所述評論詞的正負(fù)評價信息;
[0028]根據(jù)預(yù)置規(guī)則及所述評論詞的描述信息,在所述評論詞中選擇關(guān)鍵評論詞;
[0029]將所述關(guān)鍵評論詞通過過濾器過濾成標(biāo)準(zhǔn)化評論詞;
[0030]將所述標(biāo)準(zhǔn)化評論詞拼接成自然語句,生成評價信息。
[0031]進(jìn)一步,在所述將所述關(guān)鍵評論詞通過過濾器過濾成標(biāo)準(zhǔn)化評論詞之前,所述方法還包括:
[0032]獲取與所述信息點關(guān)聯(lián)的用戶個性信息;
[0033]在所述關(guān)鍵評論詞中選擇與所述用戶個性信息匹配的關(guān)鍵評論詞作為最終的關(guān)鍵評論詞;
[0034]所述將所述關(guān)鍵評論詞通過過濾器過濾成標(biāo)準(zhǔn)化評論詞,包括:
[0035]將所述最終的關(guān)鍵評論詞通過過濾器過濾成標(biāo)準(zhǔn)化評論詞。
[0036]進(jìn)一步,所述在所述關(guān)鍵評論詞中選擇與所述用戶個性信息匹配的關(guān)鍵評論詞作為最終的關(guān)鍵評論詞,包括:
[0037]確定所述用戶個性信息對應(yīng)的評論詞類別;
[0038]在所述關(guān)鍵評論詞中選擇屬于所述評論詞類別的關(guān)鍵評論詞,作為最終的關(guān)鍵評論詞。
[0039]進(jìn)一步,在所述將所述關(guān)鍵評論詞通過過濾器過濾成標(biāo)準(zhǔn)化評論詞之后,所述方法還包括:
[0040]獲取與所述信息點關(guān)聯(lián)的用戶個性信息;
[0041]在所述標(biāo)準(zhǔn)化評論詞中選擇與所述用戶個性信息匹配的標(biāo)準(zhǔn)化評論詞;
[0042]所述將所述標(biāo)準(zhǔn)化評論詞拼接成自然語句,生成評價信息,包括:
[0043]將選擇出的標(biāo)準(zhǔn)化評論詞拼接成自然語句,生成評價信息。
[0044]進(jìn)一步,所述在所述標(biāo)準(zhǔn)化評論詞中選擇與所述用戶個性信息匹配的標(biāo)準(zhǔn)化評論詞,包括:
[0045]確定所述用戶個性信息對應(yīng)的評論詞類別;
[0046]在所述標(biāo)準(zhǔn)化評論詞中選擇屬于所述評論詞類別的標(biāo)準(zhǔn)化評論詞。
[0047]進(jìn)一步,所述獲取與所述信息點關(guān)聯(lián)的用戶個性信息,包括:
[0048]接收所述用戶輸入的與所述信息點關(guān)聯(lián)的個性信息。
[0049]進(jìn)一步,所述獲取與所述信息點關(guān)聯(lián)的用戶個性信息,包括:
[0050]抓取所述用戶對所述信息點的關(guān)聯(lián)信息點的評論數(shù)據(jù);
[0051]對所述用戶的評論數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,獲得所述用戶個性信息。
[0052]本發(fā)明還公開了一種評價信息生成裝置,包括:
[0053]數(shù)據(jù)獲取單元,用于抓取信息點的評論數(shù)據(jù);
[0054]分析單元,用于對所述評論數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,獲得評論詞及其描述信息,所述描述信息至少包括所述評論詞的正負(fù)評價信息;
[0055]第一選擇單元,用于根據(jù)預(yù)置規(guī)則及所述評論詞的描述信息,在所述評論詞中選擇關(guān)鍵評論詞;
[0056]信息生成單元,用于依據(jù)語言生成模型將所述關(guān)鍵評論詞生成自然語句。
[0057]進(jìn)一步,所述裝置還包括:
[0058]信息獲取單元,用于獲取與所述信息點關(guān)聯(lián)的用戶個性信息;
[0059]第二選擇單元,用于在所述關(guān)鍵評論詞中選擇與所述用戶個性信息匹配的關(guān)鍵評論詞作為最終的關(guān)鍵評論詞;
[0060]所述信息生成單元,具體用于依據(jù)語言生成模型將所述最終的關(guān)鍵評論詞生成自然語句。
[0061]進(jìn)一步,所述信息獲取單元,具體用于接收所述用戶輸入的與所述信息點關(guān)聯(lián)的個性信息。
[0062]進(jìn)一步,所述信息獲取單元包括:
[0063]獲取子單元,用于抓取所述用戶對所述信息點的關(guān)聯(lián)信息點的評論數(shù)據(jù);
[0064]分析子單元,用于對所述用戶的評論數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,獲得所述用戶個性信息。
[0065]進(jìn)一步,所述第二選擇單元包括:
[0066]類別確定子單元,用于確定所述用戶個性信息對應(yīng)的評論詞類別;
[0067]選擇子單元,用于在所述關(guān)鍵評論詞中選擇屬于所述評論詞類別的關(guān)鍵評論詞,作為最終的關(guān)鍵評論詞。
[0068]本發(fā)明實施例還公開了一種評價信息生成裝置,包括:
[0069]數(shù)據(jù)抓取單元,用于抓取信息點的評論數(shù)據(jù);
[0070]數(shù)據(jù)分析單元,用于對所述評論數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,獲得評論詞及其描述信息,所述描述信息至少包括所述評論詞的正負(fù)評價信息;
[0071]選擇單元,用于根據(jù)預(yù)置規(guī)則及所述評論詞的描述信息,在所述評論詞中選擇關(guān)鍵評論詞;
[0072]過濾單元,用于將所述關(guān)鍵評論詞通過過濾器過濾成標(biāo)準(zhǔn)化評論詞;
[0073]生成單元,用于將所述標(biāo)準(zhǔn)化評論詞拼接成自然語句,生成評價信息。
[0074]進(jìn)一步,所述裝置還包括:
[0075]第一獲取單元,用于獲取與所述信息點關(guān)聯(lián)的用戶個性信息;
[0076]再選擇單元,用于在所述關(guān)鍵評論詞中選擇與所述用戶個性信息匹配的關(guān)鍵評論詞作為最終的關(guān)鍵評論詞;
[0077]所述過濾單元,具