本發(fā)明涉及人工智能對話系統(tǒng),尤其涉及一種基于人機對話的用戶畫像自動提取方法及裝置。
背景技術(shù):
在現(xiàn)有的人工智能對話系統(tǒng)中,通常采用基于規(guī)則、機器學(xué)習(xí)方法來從對話中抽取用戶的個人信息,據(jù)此創(chuàng)建用戶畫像。但是不同的用戶信息,往往需要采用不同方法來處理,沒有統(tǒng)一的易擴展的處理框架,使人機對話過程中,人工智能對話系統(tǒng)無法通用地自動提取用戶信息、進而創(chuàng)建用戶畫像。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種基于人機對話的用戶畫像自動提取方法及裝置,旨在解決現(xiàn)有的人機智能對話系統(tǒng)在人機對話過程中無法通用地自動提取用戶信息,進而創(chuàng)建用戶畫像的問題。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
一種基于人機對話的用戶畫像自動提取方法,其特征在于,包括:
根據(jù)用戶的輸入信息,獲取輸入信號;所述輸入信號包括語句類型信號;
根據(jù)信息類型分類器,對所述輸入信號的信息類型進行分類,獲取分類后的輸入信號;
從所述分類后的輸入信號中提取三元組信息;
根據(jù)所述語句類型信號,獲取對用戶畫像的操作類型;
根據(jù)所述對用戶畫像的操作類型,利用所述三元組信息,對用戶畫像進行操作。
在上述實施例的基礎(chǔ)上,進一步地,所述從所述分類后的輸入信號中提取三元組信息的步驟,具體為:
根據(jù)主語判定器,從所述分類后的輸入信號中提取主語信息;
根據(jù)關(guān)系判定器,從所述分類后的輸入信號中提取關(guān)系信息;
根據(jù)實體判定器,從所述分類后的輸入信號中提取實體信息;
將所述主語信息、所述關(guān)系信息、所述實體信息合并為三元組信息。
在上述任意實施例的基礎(chǔ)上,進一步地,所述輸入信號還包括句子話題信號、情緒信號、語言行為信號、語義角色標準信號、人稱信號中的一種或多種。
在上述任意實施例的基礎(chǔ)上,進一步地,所述信息類型分類器包括基于話題的分類器、基于情緒的分類器、基于語言行為的分類器和基于語義角色標準的分類器。
一種基于人機對話的用戶畫像自動提取裝置,包括:
輸入信號獲取模塊,用于根據(jù)用戶的輸入信息,獲取輸入信號;所述輸入信號包括語句類型信號;
分類模塊,用于根據(jù)信息類型分類器,對所述輸入信號的信息類型進行分類,獲取分類后的輸入信號;
提取模塊,用于從所述分類后的輸入信號中提取三元組信息;
操作類型獲取模塊,用于根據(jù)所述語句類型信號,獲取對用戶畫像的操作類型;
操作模塊,用于根據(jù)所述對用戶畫像的操作類型,利用所述三元組信息,對用戶畫像進行操作。
在上述實施例的基礎(chǔ)上,進一步地,所述提取模塊用于:
根據(jù)主語判定器,從所述分類后的輸入信號中提取主語信息;
根據(jù)關(guān)系判定器,從所述分類后的輸入信號中提取關(guān)系信息;
根據(jù)實體判定器,從所述分類后的輸入信號中提取實體信息;
將所述主語信息、所述關(guān)系信息、所述實體信息合并為三元組信息。
在上述任意實施例的基礎(chǔ)上,進一步地,所述輸入信號還包括句子話題信號、情緒信號、語言行為信號、語義角色標準信號、人稱信號中的一種或多種。
在上述任意實施例的基礎(chǔ)上,進一步地,所述信息類型分類器包括基于話題的分類器、基于情緒的分類器、基于語言行為的分類器和基于語義角色標準的分類器。
本發(fā)明的有益效果是:
本發(fā)明提供了一種基于人機對話的用戶畫像自動提取方法及裝置,接收用戶的輸入信息,通過信息類型分類器對輸入信息中獲取的輸入信號進行分類,再利用各種判定器,從分類后的輸入信號中提取三元組信息,根據(jù)三元組信息和語句類型對用戶畫像進行操作。本發(fā)明采用基于語句的多種信號自動提取的方式,充分挖掘了用戶輸入語句中的各類信息,并將這些信息轉(zhuǎn)化成多種輸入信號,再將這些輸入信號作為公共資源應(yīng)用于后續(xù)多種用戶信息提取中,實現(xiàn)了對用戶信息的自動提?。煌瑫r,應(yīng)用多種判定器來提取三元組信息,以此作為對用戶畫像進一步操作的基礎(chǔ),從而創(chuàng)建并更新人物畫像,這就將用戶畫像的自動抽取問題簡化為多種公共信號的組合利用問題;另一方面,本發(fā)明基于統(tǒng)一的處理框架,易于擴展到其它方面用戶信息的提取。
附圖說明
下面結(jié)合附圖和實施例對本發(fā)明進一步說明。
圖1示出了本發(fā)明實施例提供的一種基于人機對話的用戶畫像自動提取方法的流程示意圖;
圖2示出了本發(fā)明實施例提供的一種基于人機對話的用戶畫像自動提取裝置的結(jié)構(gòu)示意圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅用以解釋本發(fā)明,并不限定本發(fā)明。
具體實施例一
如圖1所示,本發(fā)明實施例提供了一種基于人機對話的用戶畫像自動提取方法,其特征在于,包括:
步驟s101,根據(jù)用戶的輸入信息,獲取輸入信號;所述輸入信號包括語句類型(sentencetype)信號。本發(fā)明實施例中,語句類型是一句話的句型,其可以為肯定陳述句、否定陳述句、時間問句、數(shù)量問句等語句類型中的一種。本發(fā)明實施例對獲取輸入信號的方式不做限定,優(yōu)選的,其可以為利用規(guī)則、機器學(xué)習(xí)模型或者深度學(xué)習(xí)模型的方式。本發(fā)明實施例對從用戶輸入語句中獲取的輸入信號不做限定,優(yōu)選的,輸入信號還可以包括句子話題(topic)信號、情緒(mood)信號、語言行為(speechact)信號、語義角色標準(semanticrolelabeling,簡稱srl)信號、人稱(person)信號中的一種或多種,這些信號可以作為公共資源應(yīng)用于后續(xù)多種多樣的用戶信息提取步驟中,獲取的方法是對用戶輸入進行機器學(xué)習(xí)系統(tǒng)和規(guī)則系統(tǒng)處理。本發(fā)明實施例中,句子話題是一句話的主題,一句話的句子話題可以有多個,例如“我的星座是射手座”,這句話的主題可以是“個人相關(guān)”、“星座”。本發(fā)明實施例中,情緒是一句話中用戶表現(xiàn)出來的情緒狀態(tài),例如“我討厭蘋果”這句話中,情緒是“不喜歡”、“厭惡”。本發(fā)明實施例中,語言行為是一句話的行為特點,例如“我覺得明天春游應(yīng)該取消”即為表達個人意見,“你的傷好點了嗎”為詢問信息。本發(fā)明實施例中,語義角色標準是句子的語義結(jié)構(gòu)的表示方法,根據(jù)謂語和變元之間不同的語義關(guān)系,可以把變元分為若干個類型,這種變元的類型可以稱之為“語義角色”,例如施事、受事、與事、工具、結(jié)果、處所等。本發(fā)明實施例中,人稱是一句話中出現(xiàn)的人稱,如“我喜歡你”,出現(xiàn)了兩個人稱,分別是第一人稱“我”,以及第二人稱“你”。
步驟s102,根據(jù)信息類型分類器,對所述輸入信號的信息類型進行分類,獲取分類后的輸入信號。本發(fā)明實施例對信息類型分類器不做限定,優(yōu)選的,所述信息類型分類器可以包括基于話題的分類器、基于情緒的分類器、基于語言行為的分類器和基于語義角色標準的分類器。采用不同的信息類型分類器,可以提取輸入信號在對應(yīng)的信息類型方面體現(xiàn)出來的用戶信息。利用輸入信號可以對用戶的輸入進行分類,判定用戶輸入是談?wù)撃姆N類別的用戶畫像信息:是星座,還是喜好,還是生日等,只有用戶的輸入信息是談?wù)撚脩舻哪愁惍嬒裥畔?,分類器才會有輸出結(jié)果,否則無輸出結(jié)果。例如:用戶輸入的一句話“我喜歡姚明”,判定是談?wù)撚脩魝€人信息,且是喜好相關(guān)的,則分類器的輸出是“喜好”;我的星座是射手座,分類器的輸出是“星座”;用戶輸入“我的老師很喜歡姚明”,根據(jù)信號可以對用戶的輸入進行分類,判定不是談?wù)撚脩舻男畔?,是談?wù)摰谌朔Q“我的老師”的信息,則分類器無輸出結(jié)果,后續(xù)操作不用處理。
步驟s103,從所述分類后的輸入信號中提取三元組信息。
步驟s104,根據(jù)所述語句類型信號,獲取對用戶畫像的操作類型。本發(fā)明實施例對所述操作類型不做限定,優(yōu)選的,其可以為創(chuàng)建(或增加,增加與創(chuàng)建同義)或更新用戶信息、查詢用戶信息、刪除用戶信息、修改(或編輯)用戶信息中的一種。例如,語句類型為肯定陳述句、感嘆句,操作類型可以是創(chuàng)建或更新用戶信息;語句類型為疑問句,操作類型可以是查詢用戶信息;對于否定句,操作類型可以是刪除用戶信息。
步驟s105,根據(jù)所述對用戶畫像的操作類型,利用所述三元組信息,對用戶畫像進行操作。
本發(fā)明實施例首先接收用戶的輸入信息,通過信息類型分類器依據(jù)多種輸入信號對輸入信息進行分類,再利用各種判定器,判定輸入信息談?wù)撃膫€類別的用戶畫像信息,比如是在談?wù)撚脩舻男亲€是談?wù)撚脩舻南埠?,星座、喜好屬于類別,再從分類后的輸入信號中提取三元組信息,根據(jù)三元組信息和語句類型對用戶畫像進行操作,本發(fā)明實施例采用基于語句的多種信號自動提取的方式,充分挖掘了用戶輸入語句中的各類信息,并將這些信息轉(zhuǎn)化成多種輸入信號,再將這些輸入信號作為公共資源應(yīng)用于后續(xù)多種用戶信息提取中,實現(xiàn)了對用戶信息的自動提取;同時,應(yīng)用多種判定器來提取三元組信息,以此作為對用戶畫像進一步操作的基礎(chǔ),從而創(chuàng)建并更新人物畫像,這就將用戶畫像的自動抽取問題簡化為多種公共信號的組合利用問題;另一方面,本發(fā)明實施例基于統(tǒng)一的處理框架,易于擴展到其它方面用戶信息的提取。
本發(fā)明實施例對獲取三元組信息的方式不做限定,優(yōu)選的,所述步驟103可以具體為:根據(jù)主語(subject)判定器,從所述分類后的輸入信號中提取主語信息;根據(jù)關(guān)系(relation)判定器,從所述分類后的輸入信號中提取關(guān)系信息;根據(jù)實體(entity)判定器,從所述分類后的輸入信號中提取實體信息;將所述主語信息、所述關(guān)系信息、所述實體信息合并為三元組信息。通過不同判定器,分別獲取主語信息、關(guān)系信息、實體信息。主語判定器、關(guān)系判定器、實體判定器的實現(xiàn)也主要是依據(jù)多種輸入信號。比如人稱(person)信號可以判定用戶輸入的一句話“我喜歡姚明”中主語是“我”,是第一個人稱,所以主語是用戶自己;根據(jù)語義角色標準(srl)信號中主要動詞“喜歡”,得知關(guān)系是“喜歡”;實體提取器根據(jù)語義角色標準(srl)信號的喜歡的受體是“姚明”,三元組信息為<我,喜歡,姚明>。用戶輸入的語句中涉及了用戶個人信息。同樣的,輸入信息為“你知道嗎?我喜歡姚明”,主語判定器輸出為“我”;關(guān)系判定器輸出是“喜歡”;實體判定器輸出為“姚明”,三元組信息為<我,喜歡,姚明>。本發(fā)明實施例從用戶的輸入信息中提取用戶的畫像信息,也即獲取用戶個人的信息,本發(fā)明實施例中的“主語”并非真正語法結(jié)構(gòu)上語句中的主語。
具體實施例二
如圖2所示,本發(fā)明實施例提供了一種基于人機對話的用戶畫像自動提取裝置,包括:
輸入信號獲取模塊201,用于根據(jù)用戶的輸入信息,獲取輸入信號;所述輸入信號包括語句類型信號。本發(fā)明實施例中,語句類型是一句話的句型,其可以為肯定陳述句、否定陳述句、時間問句、數(shù)量問句等語句類型中的一種。本發(fā)明實施例對獲取輸入信號的方式不做限定,優(yōu)選的,其可以為利用規(guī)則、機器學(xué)習(xí)模型或者深度學(xué)習(xí)模型的方式。本發(fā)明實施例對從用戶輸入語句中獲取的輸入信號不做限定,優(yōu)選的,輸入信號還可以包括句子話題(topic)信號、情緒(mood)信號、語言行為(speechact)信號、語義角色標準(semanticrolelabeling,簡稱srl)信號、人稱(person)信號中的一種或多種,這些信號可以作為公共資源應(yīng)用于后續(xù)多種多樣的用戶信息提取步驟中,獲取的方法是對用戶輸入進行機器學(xué)習(xí)系統(tǒng)和規(guī)則系統(tǒng)處理。本發(fā)明實施例中,句子話題是一句話的主題,一句話的句子話題可以有多個,例如“我的星座是射手座”,這句話的主題可以是“個人相關(guān)”、“星座”。本發(fā)明實施例中,情緒是一句話中用戶表現(xiàn)出來的情緒狀態(tài),例如“我討厭蘋果”這句話中,情緒是“不喜歡”、“厭惡”。本發(fā)明實施例中,語言行為是一句話的行為特點,例如“我覺得明天春游應(yīng)該取消”即為表達個人意見,“你的傷好點了嗎”為詢問信息。本發(fā)明實施例中,語義角色標準是句子的語義結(jié)構(gòu)的表示方法,根據(jù)謂語和變元之間不同的語義關(guān)系,可以把變元分為若干個類型,這種變元的類型可以稱之為“語義角色”,例如施事、受事、與事、工具、結(jié)果、處所等。本發(fā)明實施例中,人稱是一句話中出現(xiàn)的人稱,如“我喜歡你”,出現(xiàn)了兩個人稱,分別是第一人稱“我”,以及第二人稱“你”。
分類模塊202,用于根據(jù)信息類型分類器,對所述輸入信號的信息類型進行分類,獲取分類后的輸入信號。本發(fā)明實施例對信息類型分類器不做限定,優(yōu)選的,所述信息類型分類器可以包括基于話題的分類器、基于情緒的分類器、基于語言行為的分類器和基于語義角色標準的分類器。采用不同的信息類型分類器,可以提取輸入信號在對應(yīng)的信息類型方面體現(xiàn)出來的用戶信息。利用輸入信號可以對用戶的輸入進行分類,判定用戶輸入是談?wù)撃姆N類別的用戶畫像信息:是星座,還是喜好,還是生日等,只有用戶的輸入信息是談?wù)撚脩舻哪愁惍嬒裥畔?,分類器才會有輸出結(jié)果,否則無輸出結(jié)果。例如:用戶輸入的一句話“我喜歡姚明”,判定是談?wù)撚脩魝€人信息,且是喜好相關(guān)的,則分類器的輸出是“喜好”;我的星座是射手座,分類器的輸出是“星座”;用戶輸入“我的老師很喜歡姚明”,根據(jù)信號可以對用戶的輸入進行分類,判定不是談?wù)撚脩舻男畔?,是談?wù)摰谌朔Q“我的老師”的信息,則分類器無輸出結(jié)果,后續(xù)操作不用處理。
提取模塊203,用于從所述分類后的輸入信號中提取三元組信息;
操作類型獲取模塊204,用于根據(jù)所述語句類型信號,獲取對用戶畫像的操作類型。本發(fā)明實施例對所述操作類型不做限定,優(yōu)選的,其可以為創(chuàng)建(或增加,增加與創(chuàng)建同義)或更新用戶信息、查詢用戶信息、刪除用戶信息、修改(或編輯)用戶信息中的一種。例如,語句類型為肯定陳述句、感嘆句,操作類型可以是創(chuàng)建或更新用戶信息;語句類型為疑問句,操作類型可以是查詢用戶信息;對于否定句,操作類型可以是刪除用戶信息。
操作模塊205,用于根據(jù)所述對用戶畫像的操作類型,利用所述三元組信息,對用戶畫像進行操作。
本發(fā)明實施例首先接收用戶的輸入信息,通過信息類型分類器對輸入信息中獲取的輸入信號進行分類,再利用各種判定器,從分類后的輸入信號中提取三元組信息,根據(jù)三元組信息和語句類型對用戶畫像進行操作。本發(fā)明實施例采用基于語句的多種信號自動提取的方式,充分挖掘了用戶輸入語句中的各類信息,并將這些信息轉(zhuǎn)化成多種輸入信號,再將這些輸入信號作為公共資源應(yīng)用于后續(xù)多種用戶信息提取中,實現(xiàn)了對用戶信息的自動提?。煌瑫r,應(yīng)用多種判定器來提取三元組信息,以此作為對用戶畫像進一步操作的基礎(chǔ),從而創(chuàng)建并更新人物畫像,這就將用戶畫像的自動抽取問題簡化為多種公共信號的組合利用問題;另一方面,本發(fā)明實施例基于統(tǒng)一的處理框架,易于擴展到其它方面用戶信息的提取。
本發(fā)明實施例對獲取三元組信息的方式不做限定,優(yōu)選的,所述提取模塊可以用于:根據(jù)主語判定器,從所述分類后的輸入信號中提取主語信息;根據(jù)關(guān)系判定器,從所述分類后的輸入信號中提取關(guān)系信息;根據(jù)實體判定器,從所述分類后的輸入信號中提取實體信息;將所述主語信息、所述關(guān)系信息、所述實體信息合并為三元組信息。通過不同判定器,分別獲取主語信息、關(guān)系信息、實體信息。主語判定器、關(guān)系判定器、實體判定器的實現(xiàn)也主要是依據(jù)多種輸入信號。比如人稱(person)信號可以判定用戶輸入的一句話“我喜歡姚明”中主語是“我”,是第一個人稱,所以主語是用戶自己;根據(jù)語義角色標準(srl)信號中主要動詞“喜歡”,得知關(guān)系是“喜歡”;實體提取器根據(jù)語義角色標準(srl)信號的喜歡的受體是“姚明”,三元組信息為<我,喜歡,姚明>。用戶輸入的語句中涉及了用戶個人信息。同樣的,輸入信息為“你知道嗎?我喜歡姚明”,主語判定器輸出為“我”;關(guān)系判定器輸出是“喜歡”;實體判定器輸出為“姚明”,三元組信息為<我,喜歡,姚明>。本發(fā)明實施例從用戶的輸入信息中提取用戶的畫像信息,也即獲取用戶個人的信息,本發(fā)明實施例中的“主語”并非真正語法結(jié)構(gòu)上語句中的主語。
需要說明的是,在不沖突的情況下,本發(fā)明中的實施例及實施例中的特征可以相互組合。盡管本發(fā)明已進行了一定程度的描述,明顯地,在不脫離本發(fā)明的精神和范圍的條件下,可進行各個條件的適當(dāng)變化??梢岳斫猓景l(fā)明不限于所述實施方案,而歸于權(quán)利要求的范圍,其包括所述每個因素的等同替換。