一種基于機器文本對罵的情感發(fā)泄方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于機器文本對罵的情感發(fā)泄方法,其特征在于包括步驟;采集用戶的罵人文本;文本情感分類,以判斷是否健康;若情感是健康的,則推送幽默笑話文本;若情感是不健康的,則利用對罵文本知識庫實現(xiàn)對罵文本知識推理,生成合適的對罵文本;推送對罵文本。本發(fā)明還公開了一種基于機器文本對罵的情感發(fā)泄系統(tǒng),包括:用戶罵人文本采集模塊,罵人文本特征向量構(gòu)造模塊,文本情感分類模型學(xué)習(xí)模塊,文本情感分類模塊,幽默笑話的文本推送模塊,對罵文本知識推理模塊,回罵文本推送模塊。本發(fā)明效果是機器可以說任何難聽的文本而不用難為情,而且只對需要發(fā)泄情感的人對罵,使得發(fā)泄更準(zhǔn)確、效果更好,也適用于安靜環(huán)境。
【專利說明】一種基于機器文本對罵的情感發(fā)泄方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于機器文本對罵的情感發(fā)泄方法及系統(tǒng),屬于醫(yī)療健康、機器 學(xué)習(xí)和移動互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002] 情感狀態(tài)體現(xiàn)了心理的健康狀態(tài),目前很多人都面臨心理壓力,或多或少會出現(xiàn) 一些心理情感問題,表現(xiàn)為煩躁,焦慮,抑郁,生氣等,需要及時引導(dǎo),但是這些信號,對于心 理學(xué)知識缺乏的人很難覺察,也找不到合適的發(fā)泄方式,因此借助信息技術(shù),自動監(jiān)測并提 供合適的發(fā)泄方式有利于恢復(fù)心理健康。自然語言包含了豐富的情感信息,是理解和檢測 情感的重要途徑,通過自然語言分析就可以實現(xiàn)人類情感狀態(tài)判別,進而提供合適的發(fā)泄 方法。
[0003] 罵人似乎不文明,但心理學(xué)研究表明罵人是一種很有效的情感發(fā)泄方法,只要局 限于發(fā)泄情緒的人的范圍,而不影響他人,那么提供一種可以對罵的環(huán)境是合適的。目前有 通過人工對罵的方法來發(fā)泄情緒,但沒有發(fā)現(xiàn)機器文本對罵的方法和系統(tǒng),其支持用戶用 文本罵人,系統(tǒng)自動理解罵人文本,判斷文本情感,然后用對應(yīng)的文本回罵。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明要解決的技術(shù)問題是:機器理解罵人文本的情感,并能用相應(yīng)的文本自動 回罵。目前還沒有發(fā)現(xiàn)通過機器與人對罵的方法和系統(tǒng)來發(fā)泄情緒。針對上述問題,本發(fā) 明提供一種基于機器文本對罵的情感發(fā)泄方法及系統(tǒng)。
[0005] -種基于機器文本對罵的情感發(fā)泄方法的主要技術(shù)步驟包括:
[0006] [ 1 ]采集用戶的罵人文本
[0007] [2]利用文本情感分類模型完成文本情感分類,以判斷用戶的情感是否健康
[0008] [3]若文本情感不健康,則利用對罵文本知識庫實現(xiàn)對罵文本知識推理,生成合適 的對罵文本,否則轉(zhuǎn)[5]
[0009] [4]推送對罵文本給用戶
[0010] [5]從幽默笑話文本知識庫中選擇幽默笑話文本,然后推送選擇的幽默笑話文本 給用戶。
[0011] 其中文本情感分類模型的獲取過程包含以下步驟:
[0012] (a)采集N個文本及其對應(yīng)的情感類別
[0013] (b)構(gòu)造每個人文本的特征向量
[0014] (C)構(gòu)造訓(xùn)練數(shù)據(jù),以文本特征向量為輸入,其對應(yīng)的情感類別為輸出,構(gòu)成訓(xùn)練 樣本集合
[0015] (d)采用訓(xùn)練樣本集合,學(xué)習(xí)文本情感分類模型
[0016] (e)以M倍交叉驗證方式選擇文本情感分類模型的合適參數(shù),進而獲得對應(yīng)參數(shù) 的文本情感分類模型。
[0017] 一種基于機器文本對罵的情感發(fā)泄系統(tǒng),其特征在于其使用了本發(fā)明所述的方 法,所述的系統(tǒng)包括:一個文本情感學(xué)習(xí)樣本庫,一個幽默笑話文本知識庫,一個對罵文本 知識庫。系統(tǒng)還包括:罵人文本采集模塊;罵人文本特征向量構(gòu)造模塊;文本情感分類模型 學(xué)習(xí)模塊;文本情感分類模塊;幽默笑話文本推送模塊;對罵文本知識推理模塊;回罵文本 推送模塊。其中罵人文本采集模塊的輸出與罵人文本特征向量構(gòu)造模塊的輸入連接;罵人 文本特征向量構(gòu)造模塊的輸出與文本情感分類模塊的輸入連接;文本情感分類模型學(xué)習(xí)模 塊的輸出與文本情感分類模塊的輸入連接;文本情感分類模塊的輸出與幽默笑話文本推送 模塊的輸入連接;文本情感分類模塊的輸出與對罵文本知識推理模塊的輸入連接;對罵文 本知識推理模塊的輸出與回罵文本推送模塊的輸入連接。
[0018] 有益效果
[0019] 與現(xiàn)有技術(shù)相比,本發(fā)明的一種基于機器文本對罵的情感發(fā)泄方法及系統(tǒng)具有以 下優(yōu)點:
[0020] [1]與機器對罵,能罵任何難聽的話而不用難為情,這樣與用戶的對罵更自然,更 激烈,用戶發(fā)泄效果更好。
[0021] [2]機器只對情感不健康的用戶對罵,使得對罵更準(zhǔn)確,發(fā)泄效果更好。
[0022] [3]機器對情感健康的用戶不回罵,而是推送幽默笑話,這樣情感健康的用戶也能 使用,應(yīng)用更廣泛。
[0023] [4]因為采用機器實現(xiàn)文本對罵,使得用戶能在安靜的環(huán)境用文本大罵發(fā)泄情緒, 使用方便。
【專利附圖】
【附圖說明】
[0024] 圖1 一種基于機器文本對罵的情感發(fā)泄方法流程圖
[0025] 圖2罵人文本的情感分類過程結(jié)構(gòu)圖
[0026] 圖3罵人文本的情感訓(xùn)練過程結(jié)構(gòu)圖
[0027] 圖4 一種基于機器文本對罵的情感發(fā)泄系統(tǒng)結(jié)構(gòu)圖
【具體實施方式】
[0028] 本發(fā)明提出一種基于機器文本對罵的情感發(fā)泄方法及系統(tǒng),結(jié)合附圖和實施例說 明如下。
[0029] 如圖1所示,為一種基于機器文本對罵的情感發(fā)泄方法的流程圖,該方法包括以 下步驟:
[0030] 第一步:采集用戶的罵人文本。
[0031] 第二步:提取罵人文本的情感特征,形成一個文本特征向量,然后完成情感分類。 這個過程的步驟如圖2所示,由于罵人文本屬于短文本,短文本的情感分類問題面臨短文 本的特征稀疏,短文本的相似性難以度量等問題,本發(fā)明采用情感詞典解決。
[0032] ( -)首先預(yù)處理罵人文本,包括去除停用詞和中文分詞。中文分詞將一個漢字序 列切分成一個一個單獨的詞,中文分詞工具采用中國科學(xué)院計算所的ICTCLAS。
[0033] (二)中文分詞后采用向量空間模型(VSM)提取特征,將文本轉(zhuǎn)化為原始的特征向 量(Ii = {(tn,wn), (ti2,wi2),. . .,(tin,win)},其中tin為特征項,它可以是字、詞或短語;W in
[0034] 為特征項的權(quán)重,表示tin在文本中的重要程度。本實施案例采用如下的TFIDF公式計算權(quán) 重:
【權(quán)利要求】
1. 一種基于機器文本對罵的情感發(fā)泄方法,其特征在于包括w下步驟: [1] 采集用戶的罵人文本 [2] 利用文本情感分類模型完成文本情感分類,W判斷用戶的情感是否健康 [3] 若文本情感不健康,貝時Ij用對罵文本知識庫實現(xiàn)對罵文本知識推理,生成合適的對 罵文本,否則轉(zhuǎn)[5] [4] 推送對罵文本給用戶 [引從幽默笑話文本知識庫中選擇幽默笑話文本,然后推送選擇的幽默笑話文本給用 戶。 其中文本情感分類模型的獲取過程包含W下步驟: (a)采集N個文本及其對應(yīng)的情感類別 化)構(gòu)造每個人文本的特征向量 (C)構(gòu)造訓(xùn)練數(shù)據(jù),W文本特征向量為輸入,其對應(yīng)的情感類別為輸出,構(gòu)成訓(xùn)練樣本 集合 (d) 采用訓(xùn)練樣本集合,學(xué)習(xí)文本情感分類模型 (e) W M倍交叉驗證方式選擇文本情感分類模型的合適參數(shù),進而獲得對應(yīng)參數(shù)的文 本情感分類模型。
2. 根據(jù)權(quán)利要求1所述的一種基于機器文本對罵的情感發(fā)泄方法,其特征在于所述的 步驟[2]通過文本情感分類,判斷用戶的情感是否健康。
3. 根據(jù)權(quán)利要求1和2所述的一種基于機器文本對罵的情感發(fā)泄方法,其特征在于所 述的步驟[2]文本情感分類的方法采用支持向量機。
4. 根據(jù)權(quán)利要求1所述的一種基于機器文本對罵的情感發(fā)泄方法,其特征在于所述的 步驟[3]對罵人文本表達的情感進行了判斷,只對情感不健康的罵人文本,利用對罵文本 知識庫實現(xiàn)對罵文本知識推理,生成合適的對罵文本。
5. 根據(jù)權(quán)利要求1所述的一種基于機器文本對罵的情感發(fā)泄方法,其特征在于所述的 步驟[引對罵人文本的情感進行了判斷,對情感健康的罵人文本,從幽默笑話文本知識庫 中選擇幽默笑話,然后推送選擇的幽默笑話文本給用戶。
6. -種基于機器文本對罵的情感發(fā)泄系統(tǒng),其特征在于其使用了本發(fā)明所述的方法, 所述的系統(tǒng)包括;一個文本情感學(xué)習(xí)樣本庫,一個幽默笑話文本知識庫,一個對罵文本知識 庫。系統(tǒng)還包括;罵人文本采集模塊;罵人文本特征向量構(gòu)造模塊;文本情感分類模型學(xué)習(xí) 模塊;文本情感分類模塊;幽默笑話文本推送模塊;對罵文本知識推理模塊;回罵文本推送 模塊。其中罵人文本采集模塊的輸出與罵人文本特征向量構(gòu)造模塊的輸入連接;罵人文本 特征向量構(gòu)造模塊的輸出與文本情感分類模塊的輸入連接;文本情感分類模型學(xué)習(xí)模塊的 輸出與文本情感分類模塊的輸入連接;文本情感分類模塊的輸出與幽默笑話文本推送模塊 的輸入連接;文本情感分類模塊的輸出與對罵文本知識推理模塊的輸入連接;對罵文本知 識推理模塊的輸出與回罵文本推送模塊的輸入連接。
【文檔編號】G06F17/30GK104346336SQ201310313599
【公開日】2015年2月11日 申請日期:2013年7月23日 優(yōu)先權(quán)日:2013年7月23日
【發(fā)明者】不公告發(fā)明人 申請人:廣州華久信息科技有限公司