亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于對話服務(wù)的用戶個性化數(shù)據(jù)處理方法及裝置與流程

文檔序號:12364391閱讀:322來源:國知局
基于對話服務(wù)的用戶個性化數(shù)據(jù)處理方法及裝置與流程

本發(fā)明涉及智能機(jī)器人領(lǐng)域,具體地說,涉及一種基于對話服務(wù)的用戶個性化數(shù)據(jù)處理方法及裝置。



背景技術(shù):

當(dāng)前的機(jī)器人行業(yè)發(fā)展迅速,特別是聊天類的機(jī)器人已經(jīng)被越來越多的人所接受。聊天機(jī)器人(chatterbot)是一個用來模擬人類對話或聊天的程序。聊天機(jī)器人產(chǎn)生的原因是,研發(fā)者把自己感興趣的回答放到數(shù)據(jù)庫中,當(dāng)一個問題被拋給聊天機(jī)器人時,它通過相似度匹配算法,從數(shù)據(jù)庫中找到最相近的問題,然后根據(jù)問題與答案的對應(yīng)關(guān)系,給出最貼切的答案,回復(fù)給它的聊伴。

然而,隨著聊天技術(shù)的發(fā)展,人們已經(jīng)不滿足于現(xiàn)有的聊天機(jī)器人針對同一個問題給出單一類型的回答。因為不同的人的個性有差別,有的人性格豪爽,有的人性格溫和,他們在跟機(jī)器人進(jìn)行聊天的時候,雖然所提出的問題是相同的,但往往希望機(jī)器人能夠提供多樣化的回答方式。比如:用戶說:“你好”如果沒有獲取到用戶個性數(shù)據(jù),則回復(fù):“你也好”等比較中性回答;如果用戶性格比較豪放,則回復(fù):“小子,最近怎么樣”類似這樣的回復(fù)。

綜上,在對話數(shù)據(jù)交互的技術(shù)領(lǐng)域中,需要提供一種能夠讓機(jī)器人根據(jù)當(dāng)前聊天場景下的聊伴的個性來給出對話答案的交互數(shù)據(jù)處理方法或系統(tǒng),從而提高用戶的使用體驗,滿足用戶的聊天需求。



技術(shù)實現(xiàn)要素:

本發(fā)明所要解決的現(xiàn)有技術(shù)問題是需要提供一種能夠讓機(jī)器人根據(jù)當(dāng)前聊天場景下的聊伴的個性來給出對話答案的交互數(shù)據(jù)處理方法或系統(tǒng)。

為了解決上述問題,本發(fā)明實施例首先提供了一種基于對話服務(wù)的用戶個性化數(shù)據(jù)處理方法,所述方法包括以下步驟:對話輸入語句步驟,接收用戶輸入的對話輸入語句;用戶個性化數(shù)據(jù)獲取步驟,識別用戶身份以獲取用戶個性化數(shù)據(jù);對話輸入解析步驟,對所述對話輸入語句進(jìn)行語義解析,并基于解析的結(jié)果搜索知識庫,以得到與所述對話輸入語句匹配的數(shù)據(jù)集合;對話輸出語句選擇輸出步驟,基于所述用戶個性化數(shù)據(jù)來在所述數(shù)據(jù)集合中選擇與所述個性化數(shù)據(jù)相匹配的數(shù)據(jù),根據(jù)所述匹配數(shù)據(jù)生成對話輸出數(shù)據(jù)。

優(yōu)選地,通過捕獲用戶面部特征圖像來進(jìn)行用戶身份的識別,并獲取預(yù)先存儲的該用戶的個性化數(shù)據(jù)記錄。

優(yōu)選地,用戶的個性化數(shù)據(jù)包括:用戶的群體類別、用戶的性格特征以及用戶的屬性信息。

優(yōu)選地,所述知識庫中的各數(shù)據(jù)上攜帶有個性化標(biāo)簽,當(dāng)所述個性化標(biāo)簽與所述用戶的個性化數(shù)據(jù)對應(yīng)時,該數(shù)據(jù)為所述個性化數(shù)據(jù)的匹配數(shù)據(jù)。

優(yōu)選地,在搜索所述知識庫之前,通過LSTM模型對所述知識庫中的數(shù)據(jù)進(jìn)行分類并增加個性化標(biāo)簽。

根據(jù)本發(fā)明的另一方面,還提供了一種基于對話服務(wù)的用戶個性化數(shù)據(jù)處理裝置,所述裝置包括以下單元:對話輸入語句接收單元,其用于接收用戶輸入的對話輸入語句;用戶個性化數(shù)據(jù)獲取單元,其用于識別用戶身份以獲取用戶個性化數(shù)據(jù);對話輸入解析單元,其用于對所述對話輸入語句進(jìn)行語義解析,并基于解析的結(jié)果搜索知識庫,以得到與所述對話輸入語句匹配的數(shù)據(jù)集合;對話輸出語句選擇輸出單元,其用于基于所述用戶個性化數(shù)據(jù)來在所述數(shù)據(jù)集合中選擇與所述個性化數(shù)據(jù)相匹配的數(shù)據(jù),根據(jù)所述匹配數(shù)據(jù)生成對話輸出數(shù)據(jù)。

優(yōu)選地,所述用戶個性化數(shù)據(jù)獲取單元,其用于通過捕獲用戶面部特征圖像來進(jìn)行用戶身份的識別,并獲取預(yù)先存儲的該用戶的個性化數(shù)據(jù)記錄。

優(yōu)選地,用戶的個性化數(shù)據(jù)包括:用戶的群體類別、用戶的性格特征以及用戶的屬性信息。

優(yōu)選地,所述知識庫中的各數(shù)據(jù)上攜帶有個性化標(biāo)簽,所述對話輸出語句選擇輸出單元用于當(dāng)所述個性化標(biāo)簽與所述用戶的個性化數(shù)據(jù)對應(yīng)時,將該數(shù)據(jù)確定為所述個性化數(shù)據(jù)的匹配數(shù)據(jù)。

優(yōu)選地,所述對話輸入解析單元用于在搜索所述知識庫之前,通過LSTM模型對所述知識庫中的數(shù)據(jù)進(jìn)行分類并增加個性化標(biāo)簽。

與現(xiàn)有技術(shù)相比,上述方案中的一個或多個實施例可以具有如下優(yōu)點或有益效果:

本發(fā)明實施例的方法通過識別用戶身份以獲取用戶個性化數(shù)據(jù),并搜索知識庫以得到與對話輸入語句匹配的數(shù)據(jù)集合,在數(shù)據(jù)集合中選擇與個性化數(shù)據(jù)相匹配的數(shù)據(jù),然后根據(jù)匹配數(shù)據(jù)生成對話輸出數(shù)據(jù),能夠讓機(jī)器人根據(jù)當(dāng)前聊天場景下的聊伴的個性來給出對話答案,從而提高用戶的使用體驗,滿足用戶的聊天需求。

本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。

附圖說明

附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實施例共同用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:

圖1是根據(jù)本發(fā)明實施例一的基于對話服務(wù)的用戶個性化數(shù)據(jù)處理方法的流程示意圖。

圖2是根據(jù)本發(fā)明實施例二的基于對話服務(wù)的用戶個性化數(shù)據(jù)處理裝置的結(jié)構(gòu)框圖。

具體實施方式

為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,以下結(jié)合附圖對本發(fā)明實施例作進(jìn)一步地詳細(xì)說明。

(實施例一)

圖1是根據(jù)本發(fā)明實施例一的基于對話服務(wù)的用戶個性化數(shù)據(jù)處理方法的流程示意圖。下面參考圖1來說明該流程的各個步驟。

在步驟S110中,接收用戶輸入的對話輸入語句。

在本例中,用戶主動發(fā)起與機(jī)器人的對話,例如,用戶通過語音向機(jī)器人發(fā)出“你今天好嗎?”的信息,此時可以利用自動語音識別(Automatic Speech Recognition,簡稱ASR)指令喚醒機(jī)器人,在機(jī)器人被喚醒后開始接收來自用戶的對話輸入語句。

在其他實施例中,也可以通過按下機(jī)器人的啟動按鈕后將機(jī)器人喚醒,然后機(jī)器人利用麥克之類的聲音采集器來接收用戶的聲音信號。

在步驟S120中,識別用戶身份以獲取用戶個性化數(shù)據(jù)。

具體地,通過捕獲用戶面部特征圖像來進(jìn)行用戶身份的識別,并獲取預(yù)先存儲的該用戶的個性化數(shù)據(jù)記錄。

更具體來說,首先在機(jī)器人被喚醒后,開始進(jìn)行人臉檢測,即從各種不同的場景中檢測出人臉的存在并確定其位置。然后,在檢測到人臉后,進(jìn)行人臉識別,即將已檢測到的待識別的人臉與數(shù)據(jù)庫中已知人臉進(jìn)行比較匹配,得到相關(guān)信息。人臉識別可以采取提取人臉幾何特征的方法和模板匹配的方法,本例中優(yōu)先采取模板匹配的方法。

人臉識別的具體過程包括:人臉圖像獲取、圖像預(yù)處理、人臉特征的提取與選擇以及進(jìn)行分類決策。在通過上面一系列步驟從圖片庫中查找到匹配圖片,并根據(jù)匹配圖片確定用戶身份后,從存儲用戶個性化數(shù)據(jù)庫中獲取預(yù)先存儲的該用戶的個性化數(shù)據(jù)記錄。

其中涉及到的用戶的個性化數(shù)據(jù)包括:用戶的群體類別、用戶的性格特征以及用戶的屬性信息。

用戶的群體類別,即用戶所屬的群體類別。例如,可以是按年齡分出的群體類別、按喜好分出的群體類別、按工作分出的群體類別等。

用戶的性格特征,包括例如開朗、奔放、靦腆、平和、溫柔、正直等。

用戶的屬性信息,包括例如姓名、性別、年齡、昵稱、所在地區(qū)、學(xué)歷、職業(yè)、收入等。

例如,在通過人臉識別檢測出用戶是“麥克”時,則可以獲取有關(guān)“麥克”的如下個性化數(shù)據(jù):所屬群體類別是未成年人、性格開朗、性別男、年齡12歲、學(xué)生等信息。

通過針對不同的用戶設(shè)定不同的個性化數(shù)據(jù),機(jī)器人在與用戶進(jìn)行通話的過程中,能夠根據(jù)用戶的群體類別、性格特征和/或?qū)傩孕畔?,發(fā)出與不同用戶對應(yīng)的個性化的語音應(yīng)答或提問,使得用戶與機(jī)器人的對話更加富有趣味,提高用戶體驗。

在步驟S130中,對對話輸入語句進(jìn)行語義解析,并基于解析的結(jié)果搜索知識庫,以得到與對話輸入語句匹配的數(shù)據(jù)集合。

需要說明的是,在對對話輸入語句進(jìn)行語義解析之前,需要進(jìn)行語音識別。語音識別,對于人來說接收到的語音可以立馬轉(zhuǎn)換為文字信息,但是對于機(jī)器人來說接收到的則是數(shù)字信號而已。當(dāng)有人提問“你好嗎?”時,“Ni”這個發(fā)音可以是“泥”也可以是“逆”,所以最終要確定是哪個字還需要語音識別技術(shù)來實現(xiàn)計算概率的最大化。

具體地,未知語音信號經(jīng)麥克、話筒之類的語音信號采集設(shè)備變換成電信號后加在識別系統(tǒng)的輸入端,首先經(jīng)過預(yù)處理,再根據(jù)人的語音特點建立語音模型,對輸入的語音信號進(jìn)行分析,并抽取所需的特征,在此基礎(chǔ)上建立語音識別所需的模板。在識別過程中要根據(jù)語音識別的模型,將預(yù)先存儲的語音模板與輸入的語音信號的特征進(jìn)行比較,根據(jù)一定的搜索和匹配策略,找出一系列最優(yōu)的與輸入語音匹配的模板。然后根據(jù)此模板的定義,通過查表就可以給出識別結(jié)果。

在獲取識別結(jié)果之后,利用自然語言處理技術(shù)對識別結(jié)果進(jìn)行語義解析。語義分析,指的是將給定的自然語言轉(zhuǎn)化為反映其意義的某種形式化表示,也就是將人類能夠理解的自然語言轉(zhuǎn)化為計算機(jī)能夠理解的形式語言,做到人與機(jī)器的互相溝通。

在獲得解析結(jié)果后,計算該解析結(jié)果與已設(shè)定的知識庫中的內(nèi)容的語義相似度(問題和問題的相似度),從而在知識庫中搜索與解析結(jié)果相匹配的數(shù)據(jù)。

在步驟S140中,基于用戶個性化數(shù)據(jù)來在數(shù)據(jù)集合中選擇與個性化數(shù)據(jù)相匹配的數(shù)據(jù),根據(jù)匹配數(shù)據(jù)生成對話輸出數(shù)據(jù)。

需要說明的是,在搜索知識庫之前,通過LSTM模型已對知識庫中的數(shù)據(jù)進(jìn)行分類并增加個性化標(biāo)簽。知識庫中的各數(shù)據(jù)上攜帶有個性化標(biāo)簽,當(dāng)個性化標(biāo)簽與用戶的個性化數(shù)據(jù)對應(yīng)時,則將該數(shù)據(jù)設(shè)定為個性化數(shù)據(jù)的匹配數(shù)據(jù)。

一般情況下,根據(jù)解析結(jié)果在知識庫中搜索匹配數(shù)據(jù)時,會搜索到多個與解析結(jié)果相關(guān)的回答,那么利用該用戶的個性化數(shù)據(jù)作為一個參數(shù),從搜索到的多個答案中選取一個和用戶個性化數(shù)據(jù)對應(yīng)的回答。

例如,在知識庫中搜索到與問題“你好嗎?”相關(guān)的回答有如下幾個:

(1)“我很好,你呢?”

(2)“小子,最近怎么樣?”

(3)“美女,我很好,你怎么樣?”

上面這三條回答數(shù)據(jù)分別攜帶有“中性”、“未成年人、性格開朗、性別男”、“性格開朗、性別女”等個性化標(biāo)簽。當(dāng)在步驟S120中所識別的用戶是“麥克”時,與“麥克”所具有的個性化數(shù)據(jù)最匹配的數(shù)據(jù)應(yīng)當(dāng)是(2)。

接下來,通過例如文語(TTS)技術(shù)將與個性化數(shù)據(jù)相匹配的的數(shù)據(jù)以語音方式輸出,與用戶進(jìn)行個性化的數(shù)據(jù)交互。

本發(fā)明實施例通過識別用戶身份以獲取用戶個性化數(shù)據(jù),并搜索知識庫以得到與對話輸入語句匹配的數(shù)據(jù)集合,在數(shù)據(jù)集合中選擇與個性化數(shù)據(jù)相匹配的數(shù)據(jù),然后根據(jù)匹配數(shù)據(jù)生成對話輸出數(shù)據(jù),能夠讓機(jī)器人根據(jù)當(dāng)前聊天場景下的聊伴的個性來給出對話答案,從而提高用戶的使用體驗,滿足用戶的聊天需求。

(實施例二)

圖2是根據(jù)本發(fā)明實施例二的基于對話服務(wù)的用戶個性化數(shù)據(jù)處理裝置的結(jié)構(gòu)框圖。如圖2所示,本申請實施例的用戶個性化數(shù)據(jù)處理裝置200主要包括:對話輸入語句接收單元210、用戶個性化數(shù)據(jù)獲取單元220、對話輸入解析單元230以及對話輸出語句選擇輸出單元240。

對話輸入語句接收單元210,其用于接收用戶輸入的對話輸入語句。

在本例中,用戶主動發(fā)起與機(jī)器人的對話,例如,用戶通過語音向機(jī)器人發(fā)出“你今天好嗎?”的信息,此時可以利用自動語音識別(Automatic Speech Recognition,簡稱ASR)指令喚醒機(jī)器人,在機(jī)器人被喚醒后,對話輸入語句接收單元210開始接收來自用戶的對話輸入語句。

在其他實施例中,也可以通過按下機(jī)器人的啟動按鈕后將機(jī)器人喚醒,然后對話輸入語句接收單元210利用麥克之類的聲音采集器來接收用戶的聲音信號。

用戶個性化數(shù)據(jù)獲取單元220,其用于識別用戶身份以獲取用戶個性化數(shù)據(jù)。

具體地,用戶個性化數(shù)據(jù)獲取單元220通過捕獲用戶面部特征圖像來進(jìn)行用戶身份的識別,并獲取預(yù)先存儲的該用戶的個性化數(shù)據(jù)記錄。

更具體來說,首先在機(jī)器人被喚醒后,用戶個性化數(shù)據(jù)獲取單元220開始進(jìn)行人臉檢測,即從各種不同的場景中檢測出人臉的存在并確定其位置。然后,用戶個性化數(shù)據(jù)獲取單元220在檢測到人臉后,進(jìn)行人臉識別,即將已檢測到的待識別的人臉與數(shù)據(jù)庫中已知人臉進(jìn)行比較匹配,得到相關(guān)信息。人臉識別可以采取提取人臉幾何特征的方法和模板匹配的方法,本例中優(yōu)先采取模板匹配的方法。

人臉識別的具體過程包括:人臉圖像獲取、圖像預(yù)處理、人臉特征的提取與選擇以及進(jìn)行分類決策。在通過上面一系列步驟從圖片庫中查找到匹配圖片,并根據(jù)匹配圖片確定用戶身份后,從存儲用戶個性化數(shù)據(jù)庫中獲取預(yù)先存儲的該用戶的個性化數(shù)據(jù)記錄。

用戶的個性化數(shù)據(jù)包括:用戶的群體類別、用戶的性格特征以及用戶的屬性信息。

對話輸入解析單元230,其用于對對話輸入語句進(jìn)行語義解析,并基于解析的結(jié)果搜索知識庫,以得到與對話輸入語句匹配的數(shù)據(jù)集合。

需要說明的是,在對話輸入解析單元230對對話輸入語句進(jìn)行語義解析之前,需要進(jìn)行語音識別。具體地,對話輸入解析單元230將未知語音信號經(jīng)麥克、話筒之類的語音信號采集設(shè)備變換成電信號后加在識別系統(tǒng)的輸入端,首先經(jīng)過預(yù)處理,再根據(jù)人的語音特點建立語音模型,對輸入的語音信號進(jìn)行分析,并抽取所需的特征,在此基礎(chǔ)上建立語音識別所需的模板。在識別過程中要根據(jù)語音識別的模型,將預(yù)先存儲的語音模板與輸入的語音信號的特征進(jìn)行比較,根據(jù)一定的搜索和匹配策略,找出一系列最優(yōu)的與輸入語音匹配的模板。然后根據(jù)此模板的定義,通過查表就可以給出識別結(jié)果。

在獲取識別結(jié)果之后,對話輸入解析單元230利用自然語言處理技術(shù)對識別結(jié)果進(jìn)行語義解析。在獲得解析結(jié)果后,對話輸入解析單元230計算該解析結(jié)果與已設(shè)定的知識庫中的內(nèi)容的語義相似度(問題和問題的相似度),從而在知識庫中搜索與解析結(jié)果相匹配的數(shù)據(jù)。

對話輸出語句選擇輸出單元240,其用于基于用戶個性化數(shù)據(jù)來在數(shù)據(jù)集合中選擇與個性化數(shù)據(jù)相匹配的數(shù)據(jù),根據(jù)匹配數(shù)據(jù)生成對話輸出數(shù)據(jù)。

需要說明的是,對話輸入解析單元230在搜索知識庫之前,通過LSTM模型對知識庫中的數(shù)據(jù)進(jìn)行分類并增加個性化標(biāo)簽。知識庫中的各數(shù)據(jù)上攜帶有個性化標(biāo)簽,當(dāng)個性化標(biāo)簽與用戶的個性化數(shù)據(jù)對應(yīng)時,對話輸出語句選擇輸出單元240將該數(shù)據(jù)確定為個性化數(shù)據(jù)的匹配數(shù)據(jù)。

一般情況下,對話輸入解析單元230根據(jù)解析結(jié)果在知識庫中搜索匹配數(shù)據(jù)時,會搜索到多個與解析結(jié)果相關(guān)的回答,那么對話輸出語句選擇輸出單元240利用該用戶的個性化數(shù)據(jù)作為一個參數(shù),從搜索到的多個答案中選取一個和用戶個性化數(shù)據(jù)對應(yīng)的回答。

接下來,對話輸出語句選擇輸出單元240通過例如文語(TTS)技術(shù)將與個性化數(shù)據(jù)相匹配的的數(shù)據(jù)以語音方式輸出,與用戶進(jìn)行個性化的數(shù)據(jù)交互。

本發(fā)明實施例能夠讓機(jī)器人根據(jù)當(dāng)前聊天場景下的聊伴的個性來給出對話答案,從而提高用戶的使用體驗,滿足用戶的聊天需求。

由于本發(fā)明的方法描述的是在計算機(jī)系統(tǒng)中實現(xiàn)的。該計算機(jī)系統(tǒng)例如可以設(shè)置在機(jī)器人的控制核心處理器中。例如,本文所述的方法可以實現(xiàn)為能以控制邏輯來執(zhí)行的軟件,其由機(jī)器人控制系統(tǒng)中的CPU來執(zhí)行。本文所述的功能可以實現(xiàn)為存儲在非暫時性有形計算機(jī)可讀介質(zhì)中的程序指令集合。當(dāng)以這種方式實現(xiàn)時,該計算機(jī)程序包括一組指令,當(dāng)該組指令由計算機(jī)運行時其促使計算機(jī)執(zhí)行能實施上述功能的方法??删幊踢壿嬁梢詴簳r或永久地安裝在非暫時性有形計算機(jī)可讀介質(zhì)中,例如只讀存儲器芯片、計算機(jī)存儲器、磁盤或其他存儲介質(zhì)。除了以軟件來實現(xiàn)之外,本文所述的邏輯可利用分立部件、集成電路、與可編程邏輯設(shè)備(諸如,現(xiàn)場可編程門陣列(FPGA)或微處理器)結(jié)合使用的可編程邏輯,或者包括它們?nèi)我饨M合的任何其他設(shè)備來體現(xiàn)。所有此類實施例旨在落入本發(fā)明的范圍之內(nèi)。

應(yīng)該理解的是,本發(fā)明所公開的實施例不限于這里所公開的特定結(jié)構(gòu)、處理步驟,而應(yīng)當(dāng)延伸到相關(guān)領(lǐng)域的普通技術(shù)人員所理解的這些特征的等同替代。還應(yīng)當(dāng)理解的是,在此使用的術(shù)語僅用于描述特定實施例的目的,而并不意味著限制。

說明書中提到的“一個實施例”或“實施例”意指結(jié)合實施例描述的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個實施例中。因此,說明書通篇各個地方出現(xiàn)的短語“一個實施例”或“實施例”并不一定均指同一個實施例。

雖然本發(fā)明所公開的實施方式如上,但所述的內(nèi)容只是為了便于理解本發(fā)明而采用的實施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬技術(shù)領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所公開的精神和范圍的前提下,可以在實施的形式上及細(xì)節(jié)上作任何的修改與變化,但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1