與該關(guān)鍵詞關(guān)聯(lián)的網(wǎng)絡(luò)信息。
[0055]本發(fā)明實施例還提供了一種網(wǎng)絡(luò)情緒的確定裝置,該裝置可以用于執(zhí)行本發(fā)明實施例的網(wǎng)絡(luò)情緒的確定方法。如圖2所示,該網(wǎng)絡(luò)情緒的確定裝置包括:第一獲取單元10和第一確定單元20、第一確定單元30和計算單元40。
[0056]第一獲取單元10用于獲取目標(biāo)事件的關(guān)鍵詞。
[0057]第二獲取單元20用于獲取與關(guān)鍵詞關(guān)聯(lián)的網(wǎng)絡(luò)信息。
[0058]第一確定單元30用于利用預(yù)先建立的分類模型確定網(wǎng)絡(luò)信息對應(yīng)的網(wǎng)絡(luò)情緒,其中,分類模型為根據(jù)預(yù)設(shè)的網(wǎng)絡(luò)情緒類型訓(xùn)練得到的訓(xùn)練集,預(yù)設(shè)的網(wǎng)絡(luò)情緒類型包括第一情緒、第二情緒、第三情緒、第四情緒和第五情緒。
[0059]計算單元40用于根據(jù)第一情緒、第二情緒、第三情緒、第四情緒和第五情緒中每一種情緒對應(yīng)的網(wǎng)絡(luò)信息的條數(shù)和網(wǎng)絡(luò)信息所賦予的權(quán)重分別計算每一種情緒的量化值。量化值用于表示與其相應(yīng)的情緒表現(xiàn)的程度。
[0060]以每種情緒的網(wǎng)絡(luò)信息的條數(shù)和網(wǎng)絡(luò)信息所賦予的權(quán)重為基礎(chǔ),來計算相應(yīng)的網(wǎng)絡(luò)情緒對所有情緒的量化值。其中,量化值可以表示與其對應(yīng)的網(wǎng)絡(luò)情緒的表現(xiàn)的程度,該值越大,其對應(yīng)的網(wǎng)絡(luò)情緒越強烈;網(wǎng)絡(luò)信息所賦予的權(quán)重則表示網(wǎng)絡(luò)信息對網(wǎng)絡(luò)情緒的量化值的影響力,如果網(wǎng)絡(luò)信息的權(quán)重越大,該網(wǎng)絡(luò)信息對其相應(yīng)的網(wǎng)絡(luò)情緒的影響越大。
[0061]本發(fā)明實施例中,按照預(yù)先設(shè)定的網(wǎng)絡(luò)情緒類型(包括第一情緒、第二情緒、第三情緒、第四情緒和第五情緒)進行訓(xùn)練,得到訓(xùn)練模型,通過該訓(xùn)練模型可以識別用戶發(fā)布的網(wǎng)絡(luò)信息中所包含的網(wǎng)絡(luò)情緒,也即是網(wǎng)絡(luò)信息對應(yīng)的網(wǎng)絡(luò)情緒,從而確定用戶的情緒是第一情緒,或者第二情緒,或者第三情緒,或者第四情緒,或者第五情緒。
[0062]通過獲取目標(biāo)事件的關(guān)鍵詞,獲取與該關(guān)鍵詞關(guān)聯(lián)的網(wǎng)絡(luò)信息,利用預(yù)先建立的分類模型確定網(wǎng)絡(luò)信息對應(yīng)的網(wǎng)絡(luò)情緒,由于經(jīng)過訓(xùn)練得到的分類模型可以識別出網(wǎng)絡(luò)信息中所包含的網(wǎng)絡(luò)情緒包括多種,從而解決了由于對網(wǎng)絡(luò)情緒的分類比較單一造成的無法準確地反映網(wǎng)絡(luò)情緒,識別出的網(wǎng)絡(luò)情緒更加多樣化,從而準確地反映出用戶對目標(biāo)事件的網(wǎng)絡(luò)情緒的問題。進一步地,對各類型的情緒的量化值進行計算,可以得到網(wǎng)絡(luò)上對目標(biāo)事件的情緒的傾向性。
[0063]優(yōu)選地,上述第一情緒、第二情緒、第三情緒、第四情緒和第五情緒可以依次為憤怒、厭惡、高興、悲傷和恐懼。
[0064]優(yōu)選地,可以根據(jù)每條網(wǎng)絡(luò)信息的來源確定其權(quán)值,再使用計算模型來計算得到每種情緒的量化值。其中,不同來源的網(wǎng)絡(luò)信息計算時,由于其權(quán)重不同,相應(yīng)的權(quán)值不同,例如,來自網(wǎng)絡(luò)媒體的網(wǎng)絡(luò)信息的權(quán)重會比來自個人的網(wǎng)絡(luò)信息的權(quán)重要高,不同來源的權(quán)值可以在訓(xùn)練過程中確定,從而可以在計算時由訓(xùn)練模型來確定每一條網(wǎng)絡(luò)信息的權(quán)值。
[0065]例如,對于指定時間段內(nèi)的,目標(biāo)時間相關(guān)的網(wǎng)絡(luò)信息,先用分類模型對其做情緒分析,確定每條信息對應(yīng)的網(wǎng)絡(luò)情緒,然后按照如下公式計算得到各情緒的量化值:
[0066]Z = a0*b0+ al*bl+ a2*b2+ a2*b2+ a3*b3......
[0067]其中,Z表示量化值,a0、al、a2、a3等表示相應(yīng)來源的網(wǎng)絡(luò)信息條數(shù),bO、bl、b2、b3等表示不同來源的權(quán)值。
[0068]以“憤怒”的情緒為例,可以先按信息來源進行統(tǒng)計。比如:官方媒體100條,微博大V 200條,普通網(wǎng)民300條。再從分類模型里,讀出每種來源的權(quán)重數(shù)據(jù)。比如:官方媒體0.8,微博大V 0.5,普通網(wǎng)民0.2。然后,對于上述的信息,進行加權(quán)匯總?!皯嵟鼻榫w的量化值為:100*0.8+200*0.5+300*0.2 = 240。其他的情緒可以采用上述相同的方式,計算得到量化值。最終得到的是在指定時間段內(nèi),對該時間的各種情緒量化值,比如:憤怒240,厭惡200,高興100,悲傷50,恐懼300。
[0069]需要說明的是,本發(fā)明實施例中的情緒還可以包括第六情緒和/或第七情緒等。另外,再計算每一種情緒的量化值時,也可以認為所有網(wǎng)絡(luò)信息的權(quán)值都為1,那么每一種情緒的量化值則可以是該情緒對應(yīng)的網(wǎng)絡(luò)信息的條數(shù)。上述示例僅僅是為了描述本發(fā)明實施例的技術(shù)原理,并不對本發(fā)明有不當(dāng)限定。
[0070]優(yōu)選地,本發(fā)明實施例中,還可以結(jié)合地區(qū)、性別、認證身份等指標(biāo)計算得到相應(yīng)的量化值,這樣,可以通過這些指標(biāo)來對網(wǎng)絡(luò)情緒進行分析。
[0071]優(yōu)選地,本發(fā)明實施例中的網(wǎng)絡(luò)信息可以是用戶在網(wǎng)絡(luò)上發(fā)布的博客、微博、朋友圈消息、應(yīng)用社區(qū)消息(如QQ空間)、論壇上的帖子、評論等等。網(wǎng)絡(luò)信息可以通過網(wǎng)絡(luò)爬蟲、自動腳本、手工輸入等方式獲取。網(wǎng)絡(luò)信息的具體形式可以是文本信息,也可以是音頻信息,還可以是視頻信息等。
[0072]本發(fā)明實施例中,用戶發(fā)布的網(wǎng)絡(luò)信息可以是針對用戶當(dāng)前時刻的情緒的,也可以是針對某個事件、某個事物的情緒。因此,本發(fā)明實施例的方案可以用于網(wǎng)絡(luò)中對目標(biāo)事件或者事物的網(wǎng)絡(luò)情緒,具體可以獲取與目標(biāo)事件或者事物相關(guān)的網(wǎng)絡(luò)信息,利用分類模型對獲取到的網(wǎng)絡(luò)信息進行識別,確定出該網(wǎng)絡(luò)信息對應(yīng)的網(wǎng)絡(luò)情緒,從而可以統(tǒng)計出網(wǎng)絡(luò)用戶對目標(biāo)事件或者事物的各種不同的情緒。
[0073]優(yōu)選地,裝置還包括:第三獲取單元,用于在利用預(yù)先建立的分類模型確定網(wǎng)絡(luò)信息對應(yīng)的網(wǎng)絡(luò)情緒之前,獲取用于建立分類模型的網(wǎng)絡(luò)信息;提取單元,用于提取用于建立分類模型的網(wǎng)絡(luò)信息中用于表達情感的關(guān)鍵詞;訓(xùn)練單元,用于按照預(yù)設(shè)的網(wǎng)絡(luò)情緒類型對用于表達情感的關(guān)鍵詞進行訓(xùn)練,得到分類模型。
[0074]用于建立分類模型的網(wǎng)絡(luò)信息可以通過網(wǎng)絡(luò)爬蟲、自動腳本、手工輸入等方式獲取,由于該網(wǎng)絡(luò)信息用于建立分類模型,因此,獲取的該網(wǎng)絡(luò)信息的數(shù)據(jù)量相對較大,以便于訓(xùn)練出識別準確性較高的分類模型。
[0075]在獲取到大量的網(wǎng)絡(luò)信息之后,從該網(wǎng)絡(luò)信息中提取用于表達情感的關(guān)鍵詞,或者關(guān)鍵信息,例如“哈哈”,“哎”,“難過”等等,然后按照預(yù)設(shè)的網(wǎng)路情緒分類(包括憤怒、厭惡、高興、悲傷和恐懼)對關(guān)鍵詞進行訓(xùn)練,得到上述分類模型。在得到分類模型之后,可以利用該分類模型對新輸入的網(wǎng)絡(luò)信息進行情緒識別或者分類。
[0076]優(yōu)選地,裝置還包括:判斷單元,用于在獲取用于建立分類模型的網(wǎng)絡(luò)信息之后,以及提取用于建立分類模型的網(wǎng)絡(luò)信息中的用于表達情感的關(guān)鍵詞之前,判斷網(wǎng)絡(luò)信息是否為可識別的文本信息;分詞單元,用于如果判斷出網(wǎng)絡(luò)信息不是可識別的文本信息,則將網(wǎng)絡(luò)信息轉(zhuǎn)化為可識別的文本信息,對轉(zhuǎn)化后的可識別的文本信息進行分詞;如果判斷出網(wǎng)絡(luò)信息是可識別的文本信息,則直接對網(wǎng)絡(luò)信息進行分詞。
[0077]本實施例中,由于獲取到的網(wǎng)絡(luò)信息可以是多種形式的信息(包括文本信息、音頻信息、視頻信息),而通常關(guān)鍵詞的提取是從可識別的文本信息中提取,因此,在獲取到用于建立分類模型的網(wǎng)絡(luò)信息之后,以及提取用于建立分類模型的網(wǎng)絡(luò)信息中的用于表達情感的關(guān)鍵詞之前,可以先判斷獲取到的網(wǎng)絡(luò)信息是否為可識別的文本信息,如果是,則可以直接對該網(wǎng)絡(luò)信息進行分詞,以便于從中提取關(guān)鍵詞;如果否,則將該網(wǎng)絡(luò)信息轉(zhuǎn)化為可識別的文本信息,再進行分詞,以便于從轉(zhuǎn)化后的文本信息中提取關(guān)鍵詞。
[0078]需要說明的是,本發(fā)明實施例中,在得到分類模型之后,對新輸入的網(wǎng)絡(luò)信息進行分類或者識別時,也可以先判斷該網(wǎng)絡(luò)信息是否為可識別的文本信息,以便于快速確定網(wǎng)絡(luò)信息對應(yīng)的網(wǎng)絡(luò)情緒。
[0079]優(yōu)選地,分詞單元包括:第一轉(zhuǎn)化模塊,用于如果網(wǎng)絡(luò)信息為音頻信息,則利用語音識別將音頻信息轉(zhuǎn)化為可識別的文本信息;第二轉(zhuǎn)化模塊,用于如果網(wǎng)絡(luò)信息為視頻信息,則從視頻信息中提取音頻信息,利用語音識別將提取的音頻信息轉(zhuǎn)化為可識別的文本
?目息O
[0080]本實施例中,對于音頻信息,可以識別語音識別技術(shù),將語音信息轉(zhuǎn)化為文本信息再從文本信息中提取關(guān)鍵詞;對于視頻信息,則可以先提取出該視頻信息中的音頻信息,再采用針對音頻信息的轉(zhuǎn)化方式進行處理。
[0081]需要說明的是,本發(fā)明實施例中,各種網(wǎng)絡(luò)信息可以是采用各種語言的信息,例如,中文、英文、日文等等,對于不同的語言,可以轉(zhuǎn)化為相同的可識別的文本信息。
[0082]優(yōu)選地,裝置還包括:第四獲取單元,用于在利用預(yù)先建立的分類模型確定網(wǎng)絡(luò)信息對應(yīng)的網(wǎng)絡(luò)情緒之后,獲取網(wǎng)絡(luò)信息發(fā)布時的位置信息;第二確定單元,用于基于位置信息確定網(wǎng)絡(luò)信息所在的地區(qū);第三確定單元,用于根據(jù)網(wǎng)絡(luò)信息對應(yīng)的網(wǎng)絡(luò)情緒確定各地區(qū)的網(wǎng)絡(luò)情緒。
[0083]由于用戶發(fā)布的網(wǎng)絡(luò)信息中通常都會攜帶有其所在的位置信息,獲取該