的程度。
[0028]以每種情緒的網(wǎng)絡信息的條數(shù)和網(wǎng)絡信息所賦予的權重為基礎,來計算相應的網(wǎng)絡情緒對所有情緒的量化值。其中,量化值可以表示與其對應的網(wǎng)絡情緒的表現(xiàn)的程度,該值越大,其對應的網(wǎng)絡情緒越強烈;網(wǎng)絡信息所賦予的權重則表示網(wǎng)絡信息對網(wǎng)絡情緒的量化值的影響力,如果網(wǎng)絡信息的權重越大,該網(wǎng)絡信息對其相應的網(wǎng)絡情緒的影響越大。
[0029]本發(fā)明實施例中,按照預先設定的網(wǎng)絡情緒類型(包括第一情緒、第二情緒、第三情緒、第四情緒和第五情緒)進行訓練,得到訓練模型,通過該訓練模型可以識別用戶發(fā)布的網(wǎng)絡信息中所包含的網(wǎng)絡情緒,也即是網(wǎng)絡信息對應的網(wǎng)絡情緒,從而確定用戶的情緒是第一情緒,或者第二情緒,或者第三情緒,或者第四情緒,或者第五情緒。
[0030]通過獲取目標事件的關鍵詞,獲取與該關鍵詞關聯(lián)的網(wǎng)絡信息,利用預先建立的分類模型確定網(wǎng)絡信息對應的網(wǎng)絡情緒,根據(jù)第一情緒、第二情緒、第三情緒、第四情緒和第五情緒中每一種情緒對應的網(wǎng)絡信息的條數(shù)和賦予的權重分別計算每一種情緒的量化值,由于經(jīng)過訓練得到的分類模型可以識別出網(wǎng)絡信息中所包含的網(wǎng)絡情緒包括多種,從而解決了由于對網(wǎng)絡情緒的分類比較單一造成的無法準確地反映網(wǎng)絡情緒的問題,識別出的網(wǎng)絡情緒更加多樣化,從而準確地反映出用戶對目標事件的網(wǎng)絡情緒。進一步地,對各類型的情緒的量化值進行計算,可以得到網(wǎng)絡上對目標事件的情緒的傾向性。
[0031]優(yōu)選地,上述第一情緒、第二情緒、第三情緒、第四情緒和第五情緒可以依次為憤怒、厭惡、高興、悲傷和恐懼。
[0032]優(yōu)選地,可以根據(jù)每條網(wǎng)絡信息的來源確定其權值,再使用計算模型來計算得到每種情緒的量化值。其中,不同來源的網(wǎng)絡信息計算時,由于其權重不同,相應的權值不同,例如,來自網(wǎng)絡媒體的網(wǎng)絡信息的權重會比來自個人的網(wǎng)絡信息的權重要高,不同來源的權值可以在訓練過程中確定,從而可以在計算時由訓練模型來確定每一條網(wǎng)絡信息的權值。
[0033]例如,對于指定時間段內(nèi)的,目標時間相關的網(wǎng)絡信息,先用分類模型對其做情緒分析,確定每條信息對應的網(wǎng)絡情緒,然后按照如下公式計算得到各情緒的量化值:
[0034]Z = a0*b0+ al*bl+ a2*b2+ a2*b2+ a3*b3......
[0035]其中,Z表示量化值,a0、al、a2、a3等表示相應來源的網(wǎng)絡信息條數(shù),b0、bl、b2、b3等表示不同來源的權值。
[0036]以“憤怒”的情緒為例,可以先按信息來源進行統(tǒng)計。比如:官方媒體100條,微博大V 200條,普通網(wǎng)民300條。再從分類模型里,讀出每種來源的權重數(shù)據(jù)。比如:官方媒體0.8,微博大V 0.5,普通網(wǎng)民0.2。然后,對于上述的信息,進行加權匯總?!皯嵟鼻榫w的量化值為:100*0.8+200*0.5+300*0.2 = 240。其他的情緒可以采用上述相同的方式,計算得到量化值。最終得到的是在指定時間段內(nèi),對該時間的各種情緒量化值,比如:憤怒240,厭惡200,高興100,悲傷50,恐懼300。
[0037]需要說明的是,本發(fā)明實施例中的情緒還可以包括第六情緒和/或第七情緒等。另外,再計算每一種情緒的量化值時,也可以認為所有網(wǎng)絡信息的權值都為1,那么每一種情緒的量化值則可以是該情緒對應的網(wǎng)絡信息的條數(shù)。上述示例僅僅是為了描述本發(fā)明實施例的技術原理,并不對本發(fā)明有不當限定。
[0038]優(yōu)選地,本發(fā)明實施例中,還可以結(jié)合地區(qū)、性別、認證身份等指標計算得到相應的量化值,這樣,可以通過這些指標來對網(wǎng)絡情緒進行分析。
[0039]優(yōu)選地,本發(fā)明實施例中的網(wǎng)絡信息可以是用戶在網(wǎng)絡上發(fā)布的博客、微博、朋友圈消息、應用社區(qū)消息(如QQ空間)、論壇上的帖子、評論等等。網(wǎng)絡信息可以通過網(wǎng)絡爬蟲、自動腳本、手工輸入等方式獲取。網(wǎng)絡信息的具體形式可以是文本信息,也可以是音頻信息,還可以是視頻信息等。
[0040]本發(fā)明實施例中,用戶發(fā)布的網(wǎng)絡信息可以是針對用戶當前時刻的情緒的,也可以是針對某個事件、某個事物的情緒。因此,本發(fā)明實施例的方案可以用于網(wǎng)絡中對目標事件或者事物的網(wǎng)絡情緒,具體可以獲取與目標事件或者事物相關的網(wǎng)絡信息,利用分類模型對獲取到的網(wǎng)絡信息進行識別,確定出該網(wǎng)絡信息對應的網(wǎng)絡情緒,從而可以統(tǒng)計出網(wǎng)絡用戶對目標事件或者事物的各種不同的情緒。
[0041]優(yōu)選地,在利用預先建立的分類模型確定網(wǎng)絡信息對應的網(wǎng)絡情緒之前,方法還包括:獲取用于建立分類模型的網(wǎng)絡信息;提取用于建立分類模型的網(wǎng)絡信息中用于表達情感的關鍵詞;按照預設的網(wǎng)絡情緒類型對用于表達情感的關鍵詞進行訓練,得到分類模型。
[0042]用于建立分類模型的網(wǎng)絡信息可以通過網(wǎng)絡爬蟲、自動腳本、手工輸入等方式獲取,由于該網(wǎng)絡信息用于建立分類模型,因此,獲取的該網(wǎng)絡信息的數(shù)據(jù)量相對較大,以便于訓練出識別準確性較高的分類模型。
[0043]在獲取到大量的網(wǎng)絡信息之后,從該網(wǎng)絡信息中提取用于表達情感的關鍵詞,或者關鍵信息,例如“哈哈”,“哎”,“難過”等等,然后按照預設的網(wǎng)路情緒分類(包括憤怒、厭惡、高興、悲傷和恐懼)對關鍵詞進行訓練,得到上述分類模型。在得到分類模型之后,可以利用該分類模型對新輸入的網(wǎng)絡信息進行情緒識別或者分類。
[0044]優(yōu)選地,在獲取用于建立分類模型的網(wǎng)絡信息之后,以及提取用于建立分類模型的網(wǎng)絡信息中的用于表達情感的關鍵詞之前,方法還包括:判斷網(wǎng)絡信息是否為可識別的文本信息;如果判斷出網(wǎng)絡信息不是可識別的文本信息,則將網(wǎng)絡信息轉(zhuǎn)化為可識別的文本信息,對轉(zhuǎn)化后的可識別的文本信息進行分詞;如果判斷出網(wǎng)絡信息是可識別的文本信息,則直接對網(wǎng)絡信息進行分詞。
[0045]本實施例中,由于獲取到的網(wǎng)絡信息可以是多種形式的信息(包括文本信息、音頻信息、視頻信息),而通常關鍵詞的提取是從可識別的文本信息中提取,因此,在獲取到用于建立分類模型的網(wǎng)絡信息之后,以及提取用于建立分類模型的網(wǎng)絡信息中的用于表達情感的關鍵詞之前,可以先判斷獲取到的網(wǎng)絡信息是否為可識別的文本信息,如果是,則可以直接對該網(wǎng)絡信息進行分詞,以便于從中提取關鍵詞;如果否,則將該網(wǎng)絡信息轉(zhuǎn)化為可識別的文本信息,再進行分詞,以便于從轉(zhuǎn)化后的文本信息中提取關鍵詞。
[0046]需要說明的是,本發(fā)明實施例中,在得到分類模型之后,對新輸入的網(wǎng)絡信息進行分類或者識別時,也可以先判斷該網(wǎng)絡信息是否為可識別的文本信息,以便于快速確定網(wǎng)絡信息對應的網(wǎng)絡情緒。
[0047]進一步地,如果判斷出網(wǎng)絡信息不是可識別的文本信息,則將網(wǎng)絡信息轉(zhuǎn)化為可識別的文本信息包括:如果網(wǎng)絡信息為音頻信息,則利用語音識別將音頻信息轉(zhuǎn)化為可識別的文本信息;如果網(wǎng)絡信息為視頻信息,則從視頻信息中提取音頻信息,利用語音識別將提取的音頻信息轉(zhuǎn)化為可識別的文本信息。
[0048]本實施例中,對于音頻信息,可以識別語音識別技術,將語音信息轉(zhuǎn)化為文本信息再從文本信息中提取關鍵詞;對于視頻信息,則可以先提取出該視頻信息中的音頻信息,再采用針對音頻信息的轉(zhuǎn)化方式進行處理。
[0049]需要說明的是,本發(fā)明實施例中,各種網(wǎng)絡信息可以是采用各種語言的信息,例如,中文、英文、日文等等,對于不同的語言,可以轉(zhuǎn)化為相同的可識別的文本信息。
[0050]優(yōu)選地,在利用預先建立的分類模型確定網(wǎng)絡信息對應的網(wǎng)絡情緒之后,方法還包括:獲取網(wǎng)絡信息發(fā)布時的位置信息;基于位置信息確定網(wǎng)絡信息所在的地區(qū);根據(jù)網(wǎng)絡信息對應的網(wǎng)絡情緒確定各地區(qū)的網(wǎng)絡情緒。
[0051]由于用戶發(fā)布的網(wǎng)絡信息中通常都會攜帶有其所在的位置信息,獲取該位置信息,并確定其所在的地區(qū),該地區(qū)可以是以省、市等為單位劃分的行政區(qū)域,然后根據(jù)確定出的網(wǎng)絡信息對應的網(wǎng)絡情緒來確定各地區(qū)的網(wǎng)絡情緒。優(yōu)選地,如果在某個地區(qū)的網(wǎng)絡情緒包括上述網(wǎng)絡情緒(包括憤怒、厭惡、高興、悲傷和恐懼)中的多種,可以將所占比重最大的情緒作為該地區(qū)的網(wǎng)絡情緒。
[0052]例如,對于某一條購房政策,全國各地區(qū)的人們會存在不同的情緒,將每個地區(qū)的主導情緒作為該地區(qū)的情緒,從而可以確定出各地區(qū)對該條政策的傾向性情緒。
[0053]本發(fā)明實施例中,對于與關鍵詞關聯(lián)的網(wǎng)絡信息,可以利用網(wǎng)絡信息與目標事件的關聯(lián)度來確定,具體可以計算網(wǎng)絡信息與目標事件的關鍵詞的關聯(lián)度,其關聯(lián)度超過預設閾值,則確定該網(wǎng)絡信息為與關鍵詞關聯(lián)的網(wǎng)絡信息。
[0054]例如,“釣魚島事件”,以“釣魚島”為關鍵詞,獲取相關聯(lián)的網(wǎng)絡信息,“島嶼主權糾紛”等類似信息與其關聯(lián)度較高,可以作為