本發(fā)明涉及計(jì)算機(jī)技術(shù),特別涉及一種文本情感識(shí)別方法和裝置。
背景技術(shù):
對(duì)文本進(jìn)行情感識(shí)別,在很多地方都可能使用到,比如,輿情系統(tǒng)可以抓取預(yù)訂站點(diǎn)的網(wǎng)絡(luò)內(nèi)容,例如微博、論壇、新聞等,并根據(jù)這些內(nèi)容的文本分析用戶的情感,如果是負(fù)面的情感,表明用戶也許對(duì)相應(yīng)的業(yè)務(wù)存在不滿,業(yè)務(wù)需要進(jìn)行改進(jìn),則需要人工處理,可以根據(jù)帶有負(fù)面情感的文本分析業(yè)務(wù)存在的問題,進(jìn)而進(jìn)行改進(jìn)。其他應(yīng)用場(chǎng)景中也可以使用到對(duì)文本情感的識(shí)別。
相關(guān)技術(shù)中,可以根據(jù)文本中包括的關(guān)鍵詞,分析到文本所體現(xiàn)出的情感,比如,可以根據(jù)關(guān)鍵詞與情感的匹配規(guī)則,識(shí)別文本情感。但是,這種根據(jù)關(guān)鍵詞識(shí)別情感的方法準(zhǔn)確率較低,有時(shí)識(shí)別到的情感并不符合文本的真實(shí)情感。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明提供一種文本情感識(shí)別方法和裝置,以提高文本情感識(shí)別的準(zhǔn)確率。
具體地,本發(fā)明是通過如下技術(shù)方案實(shí)現(xiàn)的:
第一方面,提供一種文本情感識(shí)別方法,所述方法包括:
對(duì)待識(shí)別的文本,通過語言模型編碼成包含文本語義的語義向量;
使用預(yù)先訓(xùn)練的情感模型,將所述語義向量作為所述情感模型的輸入,輸出得到識(shí)別所述語義向量屬于各個(gè)情感類型的概率值;
選擇概率值大的情感類型,作為識(shí)別得到的所述文本的情感。
第二方面,提供一種文本情感識(shí)別裝置,所述裝置包括:
文本編碼模塊,用于對(duì)待識(shí)別的文本,通過語言模型編碼成包含文本語義的語義向量;
預(yù)測(cè)輸出模塊,用于使用預(yù)先訓(xùn)練的情感模型,將所述語義向量作為所述情感模型的輸入,輸出得到識(shí)別所述語義向量屬于各個(gè)情感類型的概率值;
情感確定模塊,用于選擇概率值大的情感類型,作為識(shí)別得到的所述文本的情感。
本發(fā)明的文本情感識(shí)別方法和裝置,通過將文本轉(zhuǎn)換成包含語義的語義向量,再對(duì)該語義向量進(jìn)行情感識(shí)別,使得所識(shí)別的情感是包含語義的文本信息所體現(xiàn)出的情感,相對(duì)于僅根據(jù)關(guān)鍵詞判別的情感,由于考慮了文本的語義,準(zhǔn)確率得到提升。
附圖說明
圖1是本發(fā)明實(shí)施例提供的一種文本情感識(shí)別方法的流程圖;
圖2是本發(fā)明實(shí)施例提供的一種根據(jù)循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練語言模型的流程;
圖3是本發(fā)明實(shí)施例提供的一種循環(huán)神經(jīng)網(wǎng)絡(luò)在時(shí)序序列上的結(jié)構(gòu)示意;
圖4是本發(fā)明實(shí)施例提供的一種全連接神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖;
圖5是本發(fā)明實(shí)施例提供的一種根據(jù)循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練語言模型的流程;
圖6是本發(fā)明實(shí)施例提供的一種文本情感識(shí)別裝置的結(jié)構(gòu)示意圖;
圖7是本發(fā)明實(shí)施例提供的另一種文本情感識(shí)別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
有些文本是帶有情感傾向的:
比如,“這個(gè)應(yīng)用太不好用了,繳費(fèi)好多次都失??!”,該文本體現(xiàn)出的是用戶的負(fù)面情感,負(fù)面情感通常表示用戶對(duì)某個(gè)目標(biāo)事物不滿意,存在缺陷。
又比如,“這個(gè)應(yīng)用非常好,以后充值更方便了!”,該問題體現(xiàn)出的是用戶的正面情感,正面情感通常表示用戶對(duì)某個(gè)目標(biāo)事物很滿意。
很多地方都可能需要對(duì)文本進(jìn)行情感識(shí)別,例如,輿情系統(tǒng)可以采集一段時(shí)間內(nèi)用戶對(duì)某個(gè)新上業(yè)務(wù)的評(píng)價(jià),如果采集文本較多的體現(xiàn)用戶的負(fù)面情感,則需要人工處理,可以根據(jù)帶有負(fù)面情感的文本分析業(yè)務(wù)存在的問題,進(jìn)而進(jìn)行改進(jìn)。本申請(qǐng)實(shí)施例提供一種文本情感識(shí)別方法,將用于對(duì)文本進(jìn)行情感識(shí)別,并且該方法可以使得對(duì)文本識(shí)別的情感具有較高的準(zhǔn)確率。
對(duì)于一個(gè)文本來說,文本中可以包括很多具有情感傾向的關(guān)鍵詞,比如,“好”、“不好”、“方便”、“不好用”等,通常這種關(guān)鍵詞能夠體現(xiàn)一定的文本情感。但是,僅僅根據(jù)關(guān)鍵詞識(shí)別情感,有時(shí)可能會(huì)出錯(cuò),比如,一個(gè)文本中包含有“好”、“方便”等體現(xiàn)正面情感的詞語,然而文本整體所表達(dá)的并不是正面情感,可能是用戶在使用反話表達(dá)方式,其實(shí)是在表達(dá)對(duì)事物的不滿。即文本所包含詞語的體現(xiàn)情感有可能是與文本實(shí)質(zhì)的情感存在偏差。
造成上述偏差情況的一部分原因,可以是簡單提取文本中的關(guān)鍵詞語時(shí),并沒有考慮詞語之間的聯(lián)系,沒有考慮詞語之間的出現(xiàn)順序,缺少對(duì)文本整體語義的理解。因此,本申請(qǐng)實(shí)施例的文本情感識(shí)別方法,在識(shí)別文本的情感時(shí),將結(jié)合文本語義來識(shí)別。
圖1示例了本申請(qǐng)的文本情感識(shí)別方法的流程圖,可以包括:
在步驟101中,對(duì)待識(shí)別的文本,通過語言模型編碼成包含文本語義的語義向量。
本步驟中,可以將文本編碼成語義向量,該語義向量能夠包含文本的語義信息。該編碼可以通過語言模型來實(shí)現(xiàn),將一個(gè)文本輸入語言模型,該模型可以輸出文本對(duì)應(yīng)的語義向量。語言模型的訓(xùn)練將在后面的實(shí)施例描述。
通過將文本編碼成語義向量,不僅可以使得該向量包含文本的語義,而且不需要提取文本中的關(guān)鍵詞,相當(dāng)于直接用原始的文本信息進(jìn)行情感識(shí)別。
在步驟102中,使用預(yù)先訓(xùn)練的情感模型,將所述語義向量作為所述情感模型的輸入,輸出得到識(shí)別所述語義向量屬于各個(gè)情感類型的概率值。
本例子中,情感模型可以是預(yù)先訓(xùn)練好的,后續(xù)的例子中將描述情感模型的訓(xùn)練過程。本步驟可以將步驟101中得到的語義向量作為情感模型的輸入,情感模型的輸出可以是該語義向量屬于各個(gè)情感類型的概率值,并且,各個(gè)情感類型的概率值之和可以為1。
舉例如下:假設(shè)情感模型的輸出包含兩個(gè)情感類型,分別為“負(fù)面情感”和“非負(fù)面情感”,將某個(gè)文本對(duì)應(yīng)的語義向量輸入模型后,輸出得到的可以是該向量屬于“負(fù)面情感”的概率值是0.8,屬于“非負(fù)面情感”的概率值是0.2。
此外,情感模型輸出的情感類型,可以根據(jù)實(shí)際業(yè)務(wù)分析的需要自主設(shè)定。比如,如果文本情感識(shí)別的主要目的是識(shí)別出帶有負(fù)面情感的文本,可以設(shè)置“負(fù)面情感”和“非負(fù)面情感”兩個(gè)類型;或者,如果文本情感識(shí)別的主要目的是識(shí)別出帶有正面情感的文本,可以設(shè)置“正面情感”和“非正面情感”兩個(gè)類型。還可以有其他的情感類型的例子,不再詳舉。
在步驟103中,選擇概率值大的情感類型,作為識(shí)別得到的文本的情感。
例如,在步驟102的例子中,如果文本屬于“負(fù)面情感”的概率值是0.8,屬于“非負(fù)面情感”的概率值是0.2,則可以確定文本的情感是負(fù)面情感。
本例子的文本情感識(shí)別方法,通過將文本轉(zhuǎn)換成包含語義的語義向量,再對(duì)該語義向量進(jìn)行情感識(shí)別,使得所識(shí)別的情感是包含語義的文本信息所體現(xiàn)出的情感,相對(duì)于僅根據(jù)關(guān)鍵詞判別的情感,由于考慮了文本的語義,準(zhǔn)確率得到提升。例如,實(shí)際實(shí)施中將該方法應(yīng)用到了輿情系統(tǒng)的文本情感識(shí)別中,經(jīng)過實(shí)驗(yàn)發(fā)現(xiàn),該方法的準(zhǔn)確率達(dá)到了90%以上。
如下的例子中,對(duì)語言模型和情感模型的訓(xùn)練,進(jìn)行簡單說明。
語言模型的訓(xùn)練:
本申請(qǐng)的例子中,可以基于神經(jīng)網(wǎng)絡(luò)構(gòu)建語言模型,比如,可以使用的神經(jīng)網(wǎng)絡(luò)包括:循環(huán)神經(jīng)網(wǎng)絡(luò)、時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)(longshort-termmemory,lstm)、多層反饋神經(jīng)網(wǎng)絡(luò)(recurrentneuralnetwork,rnn)、深度神經(jīng)網(wǎng)絡(luò)(paragraph2vec)等。
圖2示例了根據(jù)循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練語言模型的流程,可以包括:
在步驟201中,獲取待訓(xùn)練的文本語料。
本步驟中,可以獲取互聯(lián)網(wǎng)上大量的文本,作為模型訓(xùn)練的語料。本例子可以不限制文本獲取的方式以及文本內(nèi)容。
在步驟202中,將所述文本語料中的各個(gè)字級(jí)別的特征詞,表示成詞向量。
圖3示例了一個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)在時(shí)序序列上的結(jié)構(gòu)示意,該網(wǎng)絡(luò)的訓(xùn)練方式即,通過句子的前n個(gè)詞預(yù)測(cè)第n+1個(gè)詞。例如,本例子中使用句子中的單個(gè)的字作為“詞”,以句子[訓(xùn)練語言模型]為例,“訓(xùn)”是一個(gè)詞,“練”是一個(gè)詞,“語”是一個(gè)詞,“言”是一個(gè)詞,以此類推,可以將每個(gè)詞稱為字級(jí)別的特征詞。
如圖3所示,句子中的詞可以表示成詞向量的形式,句子由詞按順序構(gòu)成。向量的形式例如可以是:[-0.02,0.349,-0.97,0.633,0.496,0.278,0.803,0.474,-0.24,-0.16]。圖3中的x(t)是句子中第t個(gè)詞的詞向量表示,h(t)為網(wǎng)絡(luò)中的隱藏向量,表示當(dāng)前語境,y(t)表示結(jié)合當(dāng)前語境h(t)以及當(dāng)前詞x(t)的輸出。其中,w表示網(wǎng)絡(luò)中的參數(shù),例如,h(t)可以是由x(t)和h(t-1)根據(jù)某種公式計(jì)算得到,公式中包括的參數(shù)可以概括用w表示;又例如,y(t)可以是由x(t)和h(t)根據(jù)某種公式計(jì)算得到,公式中包括的參數(shù)也可以用w表示。具體的循環(huán)神經(jīng)網(wǎng)絡(luò)中涉及到的網(wǎng)絡(luò)參數(shù),可以按照常規(guī)的循環(huán)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練執(zhí)行,不再贅述。
在步驟203中,根據(jù)所述詞向量,基于神經(jīng)網(wǎng)絡(luò)構(gòu)建所述語言模型。
在基于圖3示例的網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練時(shí),例如,可以根據(jù)x(t)預(yù)測(cè)y(t),該y(t)中包含x(t)的下一個(gè)詞,并根據(jù)實(shí)際出現(xiàn)的詞調(diào)整網(wǎng)絡(luò)中的參數(shù)。比如,仍以句子[訓(xùn)練語言模型]為例,根據(jù)圖3中的結(jié)構(gòu),x(t-1)可以是以詞向量表示的“訓(xùn)”,根據(jù)h(t-1)可以預(yù)測(cè)到y(tǒng)(t-1),該y(t-1)包含以向量表示的“訓(xùn)”的下一個(gè)出現(xiàn)的詞,而在句子[訓(xùn)練語言模型]中,實(shí)際在“訓(xùn)”后面出現(xiàn)的詞是“練”,根據(jù)該實(shí)際出現(xiàn)的詞和模型訓(xùn)練預(yù)測(cè)得到的詞向量y(t-1),可以調(diào)整參數(shù)w,以使得調(diào)整后可以準(zhǔn)確預(yù)測(cè)到“訓(xùn)”的下一個(gè)實(shí)際出現(xiàn)的詞“練”。在時(shí)序序列上,x(t)可以是向量表示的練,而此時(shí)對(duì)應(yīng)的h(t)可以是綜合根據(jù)x(t)、h(t-1)、w得到的隱藏向量,根據(jù)該h(t)去預(yù)測(cè)y(t),方法同上,可以根據(jù)實(shí)際出現(xiàn)的詞繼續(xù)調(diào)整參數(shù)w。
如上所述的模型訓(xùn)練過程中,由于循環(huán)神經(jīng)網(wǎng)絡(luò)中的隱藏向量h(t),綜合了x(t)、h(t-1)、w等因素,即該隱藏向量h(t)的得到,考慮了句子中在出現(xiàn)順序上位于前面的詞,也考慮了句子文本中前面的詞在預(yù)測(cè)后面的詞時(shí)的語境,是一種前后文的語境的綜合,因此所得到的向量中包含了文本的語義。經(jīng)過不斷的訓(xùn)練和調(diào)整,可以得到語言模型,將一個(gè)文本輸入該語言模型,可以被編碼成含有語義的向量。
情感模型的訓(xùn)練:
本例子中,情感模型的訓(xùn)練可以基于全連接神經(jīng)網(wǎng)絡(luò),圖4示例了一個(gè)全連接神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意,如圖4所示,該神經(jīng)網(wǎng)絡(luò)可以包括輸入層inputlayer、隱藏層hiddenlayer、輸出層outputlayer,其中,以識(shí)別“負(fù)面情感”和“非負(fù)面情感”為例,輸出層的兩個(gè)節(jié)點(diǎn)可以分別代表模型輸出為負(fù)面和非負(fù)面的概率值。
圖5示例了根據(jù)循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練語言模型的流程,可以包括:
在步驟501中,采集具有情感關(guān)聯(lián)參數(shù)的數(shù)據(jù)。
例如,可以由一些定向站點(diǎn)抓取用戶的評(píng)價(jià)數(shù)據(jù),比如,可以獲取用戶對(duì)應(yīng)用商店的軟件評(píng)價(jià),對(duì)酒店的評(píng)價(jià),對(duì)電影的評(píng)價(jià),對(duì)餐廳的評(píng)價(jià)等數(shù)據(jù)。并且,這些數(shù)據(jù)中可以包含情感關(guān)聯(lián)參數(shù),該情感關(guān)聯(lián)參數(shù)指的是能用于代表某種情感傾向的參數(shù),比如,在上述獲取的評(píng)價(jià)數(shù)據(jù)中,可以既有評(píng)價(jià)內(nèi)容,又有打分,該打分就可以稱為情感關(guān)聯(lián)參數(shù),因?yàn)榭梢愿鶕?jù)打分的高低反映用戶的情感,通常打分較高表明用戶對(duì)事物評(píng)價(jià)較好,否則,表明評(píng)價(jià)較低。
在步驟502中,根據(jù)所述情感關(guān)聯(lián)參數(shù),得到所述數(shù)據(jù)對(duì)應(yīng)的情感類型。
以識(shí)別負(fù)面情感為例,本例子可以根據(jù)步驟501中獲取的情感關(guān)聯(lián)參數(shù)識(shí)別情感,比如,可以根據(jù)打分的高低,將評(píng)價(jià)分為好評(píng)、中評(píng)和差評(píng),即正向、中立和負(fù)向情感。
在步驟503中,通過情感詞典,將數(shù)據(jù)內(nèi)容與所述情感關(guān)聯(lián)參數(shù)對(duì)應(yīng)的情感類型不一致的數(shù)據(jù)進(jìn)行過濾,并將過濾后的剩余數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。
例如,用戶的評(píng)價(jià)數(shù)據(jù)中,有時(shí)數(shù)據(jù)內(nèi)容與情感關(guān)聯(lián)參數(shù)的情感傾向不一致,比如,有些評(píng)價(jià)內(nèi)容是差評(píng),而得分卻較高,代表著好評(píng);或者,評(píng)價(jià)內(nèi)容是好評(píng),但得分卻較低為差評(píng)。因此,需要對(duì)評(píng)價(jià)數(shù)據(jù)再做篩選??梢酝ㄟ^一份情感詞典,把得分為差評(píng)但內(nèi)容只有正向情感詞的數(shù)據(jù),以及得分為好評(píng)但內(nèi)容只有負(fù)向情感詞的數(shù)據(jù),都過濾掉。剩余的過濾后的數(shù)據(jù)是質(zhì)量較高的數(shù)據(jù),不會(huì)包括內(nèi)容與得分不一致的數(shù)據(jù),可以作為訓(xùn)練數(shù)據(jù),用于訓(xùn)練模型。
本例子中,情感模型訓(xùn)練所使用的訓(xùn)練數(shù)據(jù)是自動(dòng)獲取的,如上所述的,可以自動(dòng)獲取網(wǎng)絡(luò)數(shù)據(jù),并通過情感詞典對(duì)數(shù)據(jù)進(jìn)行過濾,得到質(zhì)量較高的訓(xùn)練數(shù)據(jù),避免了傳統(tǒng)方式中人工標(biāo)注的操作,訓(xùn)練數(shù)據(jù)的獲取成本降低。
在步驟504中,將訓(xùn)練數(shù)據(jù)作為待識(shí)別的文本,通過語言模型編碼成包含文本語義的語義向量。
本步驟可以使用前述訓(xùn)練得到的語言模型,將步驟503中得到的訓(xùn)練數(shù)據(jù)編碼成語義向量,該語義向量包含了文本的語義。
在步驟505中,根據(jù)所述訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的語義向量,訓(xùn)練得到情感模型。
本步驟可以是比較標(biāo)準(zhǔn)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程。例如,可以根據(jù)圖4中模型輸出的概率值(例如,負(fù)面情感的概率值和非負(fù)面情感的概率值),以及實(shí)際的訓(xùn)練數(shù)據(jù)的情感分類結(jié)果(例如,某一條用戶評(píng)價(jià)數(shù)據(jù),已經(jīng)根據(jù)打分值確定了該評(píng)價(jià)數(shù)據(jù)的情感類型),利用反向梯度求導(dǎo)的方法,從最后一層,依次計(jì)算前一層的梯度值,然后更新網(wǎng)絡(luò)模型中的參數(shù)和輸入的詞向量表示。本步驟的參數(shù)更新過程,既可以包括對(duì)圖4中的神經(jīng)網(wǎng)絡(luò)參數(shù)的更新,也可以包括對(duì)用于編碼訓(xùn)練數(shù)據(jù)的語言模型中的參數(shù)更新。
本例子的方法中,在訓(xùn)練情感模型的神經(jīng)網(wǎng)絡(luò)中,添加使用了語言模型,即將神經(jīng)網(wǎng)絡(luò)的輸入層訓(xùn)練數(shù)據(jù),用語言模型編碼為語義向量,而后預(yù)測(cè)該語義向量所屬的情感類型的概率,使得訓(xùn)練得到的情感模型是根據(jù)包含語義的文本識(shí)別到的情感分類,準(zhǔn)確率得以提升。
此外,在一個(gè)例子中,如果參與模型訓(xùn)練的文本多為短文本,那么在實(shí)際使用中,可以根據(jù)輸入的文本類型不同,采用不同的處理方式。比如,在輿情系統(tǒng)中,微博文本可以直接作為輸入;新聞文本取新聞的標(biāo)題作為輸入文本,這些都是短文本。
而對(duì)于一些較長的文本,可以將文本分成多個(gè)子文本,每個(gè)子文本通過語言模型,分別編碼成包含文本語義的語義向量;然后,將將各個(gè)子文本的屬于同一情感類型的概率值求取均值,選擇均值大的情感類型作為所述文本的情感。例如,以論壇文本為例,該類型文本可能較長,此時(shí)可以從中取一部分內(nèi)容,貼子的標(biāo)題作為一個(gè)子文本,帖子內(nèi)容的前五句話分別作為一個(gè)子文本,那一共是六個(gè)子文本;分別通過語言模型編碼成包含文本語義的語義向量,將語義向量通過情感模型識(shí)別出情感分類的概率值,其中每一個(gè)子文本都可以得到屬于“負(fù)面情感”的概率值和“非負(fù)面情感”的概率值。然后將六個(gè)子文本對(duì)應(yīng)的“負(fù)面情感”的概率值求平均值,將六個(gè)子文本對(duì)應(yīng)的“非負(fù)面情感”概率值求平均值,平均值大的情感類型則為識(shí)別到的論壇文本的情感。
為了實(shí)現(xiàn)上述方法,本發(fā)明還提供了一種文本情感識(shí)別裝置,如圖6所示,該裝置可以包括:文本編碼模塊61、預(yù)測(cè)輸出模塊62和情感確定模塊63。
文本編碼模塊61,用于對(duì)待識(shí)別的文本,通過語言模型編碼成包含文本語義的語義向量;
預(yù)測(cè)輸出模塊62,用于使用預(yù)先訓(xùn)練的情感模型,將所述語義向量作為所述情感模型的輸入,輸出得到識(shí)別所述語義向量屬于各個(gè)情感類型的概率值;
情感確定模塊63,用于選擇概率值大的情感類型,作為識(shí)別得到的所述文本的情感。
在一個(gè)例子中,如圖7所示,該裝置還可以包括:
語言模型訓(xùn)練模塊64,用于:獲取待訓(xùn)練的文本語料;將所述文本語料中的各個(gè)字級(jí)別的特征詞,表示成詞向量;根據(jù)所述詞向量,基于神經(jīng)網(wǎng)絡(luò)構(gòu)建所述語言模型。
在一個(gè)例子中,所述神經(jīng)網(wǎng)絡(luò),包括如下的任一種:循環(huán)神經(jīng)網(wǎng)絡(luò)、時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)。
在一個(gè)例子中,所述裝置還包括:
情感模型訓(xùn)練模塊65,用于:采集具有情感關(guān)聯(lián)參數(shù)的數(shù)據(jù);根據(jù)所述情感關(guān)聯(lián)參數(shù),得到所述數(shù)據(jù)對(duì)應(yīng)的情感類型;通過情感詞典,將數(shù)據(jù)內(nèi)容與所述情感關(guān)聯(lián)參數(shù)對(duì)應(yīng)的情感類型不一致的數(shù)據(jù)進(jìn)行過濾,并將過濾后的剩余數(shù)據(jù)作為訓(xùn)練數(shù)據(jù);將所述訓(xùn)練數(shù)據(jù)作為待識(shí)別的文本,通過語言模型編碼成包含文本語義的語義向量;根據(jù)所述語義向量訓(xùn)練得到所述情感模型。
在一個(gè)例子中,所述文本編碼模塊61,具體用于:將待識(shí)別的文本分成多個(gè)子文本;每個(gè)子文本通過語言模型,分別編碼成包含文本語義的語義向量;
所述情感確定模塊63,具體用于:將各個(gè)子文本的屬于同一情感類型的概率值求取均值,選擇均值大的情感類型作為所述文本的情感。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。