一種應(yīng)用于遠(yuǎn)程信息服務(wù)的人機(jī)交互識(shí)別系統(tǒng)的制作方法

文檔序號(hào)：6426824閱讀：109來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱(chēng)：一種應(yīng)用于遠(yuǎn)程信息服務(wù)的人機(jī)交互識(shí)別系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明屬于計(jì)算機(jī)領(lǐng)域，特別是以人臉、臉部表情、語(yǔ)音、語(yǔ)音情感作為指令輸入手段的人機(jī)交互識(shí)別系統(tǒng)。
背景技術(shù)：
目前，人機(jī)交互的方法包括觸摸屏操作、鼠標(biāo)操作、語(yǔ)音控制等。目前，隨著智能控制技術(shù)的發(fā)展，一種綜合人臉、臉部表情、語(yǔ)音、語(yǔ)音情感等因素的人機(jī)交互手段將更能給用戶(hù)一種便捷、人性化的操作體驗(yàn)。如中國(guó)專(zhuān)利申請(qǐng)200810169232. 4(人機(jī)交互方法及系統(tǒng))公開(kāi)了一種人機(jī)交互方法及系統(tǒng)，將人機(jī)交互的過(guò)程劃分成不同的對(duì)話(huà)狀態(tài)，每個(gè)對(duì)話(huà)狀態(tài)分別對(duì)應(yīng)一個(gè)處理過(guò)程；該方法包括根據(jù)用戶(hù)輸入的即時(shí)上下文信息，獲得反映所述用戶(hù)需求的特征信息；至少根據(jù)所述特征信息和領(lǐng)域知識(shí)，確定當(dāng)前與所述用戶(hù)需求匹配的對(duì)話(huà)狀態(tài)；調(diào)用并執(zhí)行與所述確定的對(duì)話(huà)狀態(tài)對(duì)應(yīng)的處理過(guò)程，并將所述處理過(guò)程的處理結(jié)果返回給用戶(hù)。該發(fā)明，以匹配用戶(hù)需求，實(shí)現(xiàn)個(gè)性化的、擬人體驗(yàn)的人機(jī)交互過(guò)程，從而提高用戶(hù)體驗(yàn)性，但沒(méi)有考慮并綜合人臉、臉部表情、語(yǔ)音、語(yǔ)音情感等因素；中國(guó)專(zhuān)利申請(qǐng)200910061752.8(—種人機(jī)交互平臺(tái))提供了一種人機(jī)交互平臺(tái)，該平臺(tái)包括繪圖引擎，用于顯示圖形、文字；語(yǔ)音引擎，用于合成語(yǔ)音，進(jìn)行播報(bào)；圖像識(shí)別引擎，用于識(shí)別用戶(hù)輸入圖形的樣式，觸發(fā)不同的功能；跨平臺(tái)模塊，用于實(shí)現(xiàn)跨平臺(tái)功能；人機(jī)交互模塊，用于顯示人機(jī)界面；人機(jī)交互模塊通過(guò)接口，經(jīng)繪圖引擎連接跨平臺(tái)模塊；圖像識(shí)別引擎、語(yǔ)音引擎通過(guò)接口相連，并且分別通過(guò)接口連接跨平臺(tái)模塊；上述各模塊均安裝在人機(jī)交互硬件設(shè)備上，跨平臺(tái)模塊還與操作系統(tǒng)相交互。該發(fā)明綜合了圖形、文字、語(yǔ)音因素，但沒(méi)就如何處理人臉、臉部表情、語(yǔ)音、語(yǔ)音情感等因素并獲得操作指令提出解決方案。

發(fā)明內(nèi)容
本發(fā)明的目的就提出一種綜合考慮人臉、臉部表情、語(yǔ)音、語(yǔ)音情感因素，并對(duì)其代表的操作指令進(jìn)行識(shí)別的人機(jī)交互識(shí)別裝置，該人機(jī)交互識(shí)別裝置可以集成在提供網(wǎng)絡(luò)信息服務(wù)的服務(wù)系統(tǒng)或其客戶(hù)端，為用戶(hù)提供一種全新的操作體驗(yàn)方法。下面對(duì)本發(fā)明方案做進(jìn)一步描述一種應(yīng)用于遠(yuǎn)程信息服務(wù)的人機(jī)交互識(shí)別系統(tǒng)，其特征在于，提供網(wǎng)絡(luò)信息服務(wù)的服務(wù)系統(tǒng)或其客戶(hù)端至少具有一個(gè)人機(jī)交互識(shí)別裝置；所述的人機(jī)交互識(shí)別裝置包括聽(tīng)覺(jué)采集模塊，用于采集用戶(hù)的語(yǔ)音信號(hào)；視覺(jué)采集模塊，用于采集用戶(hù)的人臉圖像；第一預(yù)處理模塊，用于對(duì)視覺(jué)采集模塊采集的圖像進(jìn)行預(yù)處理；人臉特征提取模塊，用于通過(guò)對(duì)第一預(yù)處理模塊的圖像進(jìn)行分析，實(shí)現(xiàn)對(duì)人臉整體或特征部位的識(shí)別、定位；人臉識(shí)別模塊，用于根據(jù)人臉特征提取模塊獲得參數(shù)進(jìn)行識(shí)別，輸出人臉識(shí)別的結(jié)果；第二預(yù)處理模塊，用于對(duì)聽(tīng)覺(jué)采集模塊的語(yǔ)音信號(hào)進(jìn)行預(yù)處理；語(yǔ)音特征提取模塊，用于分析并獲得語(yǔ)音參數(shù)；語(yǔ)音識(shí)別模塊，用于根據(jù)語(yǔ)音特征提取模塊獲得的參數(shù)進(jìn)行識(shí)別并獲得該用戶(hù)語(yǔ)音對(duì)應(yīng)的請(qǐng)求或指令；第三預(yù)處理模塊，用于對(duì)視覺(jué)采集模塊采集的圖像進(jìn)行預(yù)處理，形成人臉表情圖像序列；人臉表情特征提取模塊，用于對(duì)第三預(yù)處理模塊輸入的圖像序列進(jìn)行分析處理，獲得人臉表情參數(shù)；人臉表情識(shí)別模塊，用于人臉表情參數(shù)進(jìn)行處理、識(shí)別進(jìn)而獲得人臉表情的識(shí)別結(jié)果；第四預(yù)處理模塊，用于對(duì)聽(tīng)覺(jué)采集模塊的語(yǔ)音信號(hào)進(jìn)行與語(yǔ)言情感相關(guān)的預(yù)處理；語(yǔ)言情感特征提取模塊，用于從第四預(yù)處理模塊輸入的信號(hào)中獲得語(yǔ)言情感特征的參數(shù)；語(yǔ)言情感識(shí)別模塊，用于通過(guò)對(duì)語(yǔ)言情感特征的參數(shù)的分析處理，識(shí)別出該語(yǔ)音信號(hào)包含的情感信息并輸出識(shí)別結(jié)果；顯性識(shí)別融合模塊，用于將人臉識(shí)別模塊和語(yǔ)音識(shí)別模塊的識(shí)別結(jié)果進(jìn)行融合處理，形成綜合了人臉特征和語(yǔ)音特征的識(shí)別結(jié)果；隱性識(shí)別融合模塊，用于將人臉表情識(shí)別模塊和語(yǔ)言情感識(shí)別模塊的識(shí)別結(jié)果進(jìn)行融合處理，形成綜合了人臉表情特征和語(yǔ)音情感特征的識(shí)別結(jié)果。進(jìn)一步，所述的人臉識(shí)別模塊、語(yǔ)音識(shí)別模塊、人臉識(shí)別模塊、語(yǔ)音識(shí)別模塊、顯性識(shí)別融合模塊和隱性識(shí)別融合模塊所形成的識(shí)別結(jié)果均被轉(zhuǎn)換成獲取信息服務(wù)的操作指令；服務(wù)系統(tǒng)將根據(jù)該指令輸出服務(wù)。更進(jìn)一步優(yōu)化，所述人機(jī)交互識(shí)別裝置還具有一個(gè)綜合交互模塊，用于根據(jù)服務(wù)的類(lèi)別，綜合人臉識(shí)別模塊、語(yǔ)音識(shí)別模塊、人臉識(shí)別模塊、語(yǔ)音識(shí)別模塊、顯性識(shí)別融合模塊和隱性識(shí)別融合模塊所形成一種或一種以上識(shí)別結(jié)果，經(jīng)處理后形成與該服務(wù)的類(lèi)別匹配的操作指令輸出。上任一所述的人臉表情識(shí)別模塊進(jìn)行識(shí)別的工具包括自組織影射神經(jīng)網(wǎng)絡(luò)分類(lèi)器、遺傳算法分類(lèi)器、K-鄰近分類(lèi)器、支持向量機(jī)分類(lèi)器、模糊邏輯分類(lèi)器、HMM分類(lèi)器、馬氏距離分類(lèi)器。上任一所述的人臉表情特征提取模塊的提取手段包括主元分析、小波變換。上任一所述的語(yǔ)音特征提取模塊獲得語(yǔ)音參數(shù)包括韻律、能量、基音均值、基音范圍、語(yǔ)速、音強(qiáng)、呼吸聲。上任一所述的顯性識(shí)別融合模塊、隱性識(shí)別融合模塊和綜合交互模塊進(jìn)行信息融合的技術(shù)手段包括統(tǒng)計(jì)模式識(shí)別法、多貝葉斯估計(jì)法、模糊邏輯法、神經(jīng)網(wǎng)絡(luò)法。綜上所述的本發(fā)明具有如下顯著特點(diǎn)或進(jìn)步1.具有六路識(shí)別通道輸出，分別是人臉識(shí)別結(jié)果、語(yǔ)音識(shí)別結(jié)果、人臉表情識(shí)別結(jié)果、語(yǔ)音情感識(shí)別結(jié)果、融合人臉和語(yǔ)音的顯性識(shí)別結(jié)果、融合人臉表情和語(yǔ)音情感的隱性識(shí)別結(jié)果。2.綜合交互模塊可以根據(jù)服務(wù)種類(lèi)對(duì)六路識(shí)別通道輸出進(jìn)行進(jìn)一步處理，更符合不同業(yè)務(wù)需要；3.適合各種處理算法在系統(tǒng)的綜合應(yīng)用，發(fā)揮各自的優(yōu)勢(shì)。

圖1是本發(fā)明系統(tǒng)的人機(jī)交互識(shí)別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式遠(yuǎn)程信息服務(wù)，是指遠(yuǎn)程的業(yè)務(wù)平臺(tái)通過(guò)網(wǎng)絡(luò)為用戶(hù)提供遠(yuǎn)程功能服務(wù)。提供遠(yuǎn)程信息服務(wù)的方式可以包括用戶(hù)直接登陸該業(yè)務(wù)平臺(tái)獲取，也可以通過(guò)本地的客戶(hù)端與遠(yuǎn)程的業(yè)務(wù)平臺(tái)的連接獲取。應(yīng)用于遠(yuǎn)程信息服務(wù)的人機(jī)交互識(shí)別系統(tǒng)，指采用具有人機(jī)交互識(shí)別功能，能對(duì)人的人臉、臉部表情、語(yǔ)音、語(yǔ)音情感進(jìn)行識(shí)別以獲取用戶(hù)需求的遠(yuǎn)程信息服務(wù)系統(tǒng)。人機(jī)交互識(shí)別功能可以集成在遠(yuǎn)程的業(yè)務(wù)平臺(tái)，也可以集成在客戶(hù)端。顯性信息，即提供識(shí)別說(shuō)話(huà)人的人臉圖像和唇讀，語(yǔ)言傳遞說(shuō)話(huà)內(nèi)容等信息；隱性消息，即傳送有關(guān)當(dāng)事人本身的心理活動(dòng)；包括人類(lèi)語(yǔ)言中包含有豐富的情感，情感的特征通過(guò)語(yǔ)言的韻律的變化而表現(xiàn)出來(lái)，不同情感在時(shí)間構(gòu)造、振幅構(gòu)造和基頻構(gòu)造等特征上都有不同程度的差別；人臉表情十分豐富，通常能提供人的思維信息，人的心理狀態(tài)或多或少都會(huì)顯現(xiàn)在人臉上。目前，單獨(dú)對(duì)顯性信息和隱性消息某一因素的識(shí)別已經(jīng)產(chǎn)生了各種算法，但沒(méi)有就如何綜合多種因素提高判定的準(zhǔn)確度和更適應(yīng)多變的業(yè)務(wù)操作需要提出整體的解決方案。下面將結(jié)合附圖，對(duì)本發(fā)明方案做進(jìn)一步描述如圖1所示，本發(fā)明的系統(tǒng)至少具有一個(gè)人機(jī)交互識(shí)別裝置。該裝置由聽(tīng)覺(jué)采集模塊、視覺(jué)采集模塊、第一預(yù)處理模塊、人臉特征提取模塊、人臉識(shí)別模塊、第二預(yù)處理模塊、語(yǔ)音特征提取模塊、語(yǔ)音識(shí)別模塊、第三預(yù)處理模塊、人臉表情特征提取模塊、人臉表情識(shí)別模塊、第四預(yù)處理模塊、語(yǔ)言情感特征提取模塊、語(yǔ)言情感識(shí)別模塊、顯性識(shí)別融合模塊、隱性識(shí)別融合模塊和綜合交互模塊等組成。各模塊之間的作用及關(guān)系為聽(tīng)覺(jué)采集模塊用于采集用戶(hù)的語(yǔ)音信號(hào)；視覺(jué)采集模塊用于采集用戶(hù)的人臉圖像；第一預(yù)處理模塊用于對(duì)視覺(jué)采集模塊采集的圖像進(jìn)行預(yù)處理；人臉特征提取模塊用于通過(guò)對(duì)第一預(yù)處理模塊的圖像進(jìn)行分析，實(shí)現(xiàn)對(duì)人臉整體或特征部位的識(shí)別、定位；人臉識(shí)別模塊用于根據(jù)人臉特征提取模塊獲得參數(shù)進(jìn)行識(shí)別，輸出人臉識(shí)別的結(jié)果，形成的識(shí)別結(jié)果被轉(zhuǎn)換成獲取信息服務(wù)的操作指令；服務(wù)系統(tǒng)將根據(jù)該指令輸出服務(wù)；第二預(yù)處理模塊用于對(duì)聽(tīng)覺(jué)采集模塊的語(yǔ)音信號(hào)進(jìn)行預(yù)處理；語(yǔ)音特征提取模塊用于分析并獲得語(yǔ)音參數(shù)；語(yǔ)音特征提取模塊獲得語(yǔ)音參數(shù)包括韻律、能量、基音均值、基音范圍、語(yǔ)速、音強(qiáng)、呼吸聲等參數(shù)；語(yǔ)音識(shí)別模塊用于根據(jù)語(yǔ)音特征提取模塊獲得的參數(shù)進(jìn)行識(shí)別并獲得該用戶(hù)語(yǔ)音對(duì)應(yīng)的請(qǐng)求或指令；形成的識(shí)別結(jié)果被轉(zhuǎn)換成獲取信息服務(wù)的操作指令；服務(wù)系統(tǒng)將根據(jù)該指令輸出服務(wù)；第三預(yù)處理模塊用于對(duì)視覺(jué)采集模塊采集的圖像進(jìn)行預(yù)處理，形成人臉表情圖像序列；人臉表情特征提取模塊用于對(duì)第三預(yù)處理模塊輸入的圖像序列進(jìn)行分析處理，獲得人臉表情參數(shù)；人臉表情特征提取模塊的提取手段包括主元分析、小波變換等；人臉表情識(shí)別模塊用于人臉表情參數(shù)進(jìn)行處理、識(shí)別進(jìn)而獲得人臉表情的識(shí)別結(jié)果；形成的識(shí)別結(jié)果被轉(zhuǎn)換成獲取信息服務(wù)的操作指令；服務(wù)系統(tǒng)將根據(jù)該指令輸出服務(wù)；人臉表情識(shí)別模塊進(jìn)行識(shí)別的工具包括自組織影射神經(jīng)網(wǎng)絡(luò)分類(lèi)器、遺傳算法分類(lèi)器、 K-鄰近分類(lèi)器、支持向量機(jī)分類(lèi)器、模糊邏輯分類(lèi)器、HMM分類(lèi)器、馬氏距離分類(lèi)器。第四預(yù)處理模塊用于對(duì)聽(tīng)覺(jué)采集模塊的語(yǔ)音信號(hào)進(jìn)行與語(yǔ)言情感相關(guān)的預(yù)處理；語(yǔ)言情感特征提取模塊用于從第四預(yù)處理模塊輸入的信號(hào)中獲得語(yǔ)言情感特征的參數(shù)；語(yǔ)言情感識(shí)別模塊用于通過(guò)對(duì)語(yǔ)言情感特征的參數(shù)的分析處理，識(shí)別出該語(yǔ)音信號(hào)包含的情感信息并輸出識(shí)別結(jié)果；形成的識(shí)別結(jié)果被轉(zhuǎn)換成獲取信息服務(wù)的操作指令；服務(wù)系統(tǒng)將根據(jù)該指令輸出服務(wù)；顯性識(shí)別融合模塊用于將人臉識(shí)別模塊和語(yǔ)音識(shí)別模塊的識(shí)別結(jié)果進(jìn)行融合處理，形成綜合了人臉特征和語(yǔ)音特征的識(shí)別結(jié)果；形成的識(shí)別結(jié)果被轉(zhuǎn)換成獲取信息服務(wù)的操作指令；服務(wù)系統(tǒng)將根據(jù)該指令輸出服務(wù)；本模塊實(shí)現(xiàn)信息融合的技術(shù)手段包括統(tǒng)計(jì)模式識(shí)別法、多貝葉斯估計(jì)法、模糊邏輯法、神經(jīng)網(wǎng)絡(luò)法；隱性識(shí)別融合模塊用于將人臉表情識(shí)別模塊和語(yǔ)言情感識(shí)別模塊的識(shí)別結(jié)果進(jìn)行融合處理，形成綜合了人臉表情特征和語(yǔ)音情感特征的識(shí)別結(jié)果；形成的識(shí)別結(jié)果被轉(zhuǎn)換成獲取信息服務(wù)的操作指令；服務(wù)系統(tǒng)將根據(jù)該指令輸出服務(wù)；本模塊實(shí)現(xiàn)信息融合的技術(shù)手段包括統(tǒng)計(jì)模式識(shí)別法、多貝葉斯估計(jì)法、模糊邏輯法、神經(jīng)網(wǎng)絡(luò)法；綜合交互模塊用于根據(jù)服務(wù)的類(lèi)別，綜合人臉識(shí)別模塊、語(yǔ)音識(shí)別模塊、人臉識(shí)別模塊、語(yǔ)音識(shí)別模塊、顯性識(shí)別融合模塊和隱性識(shí)別融合模塊所形成一種或一種以上識(shí)別結(jié)果，經(jīng)處理后形成與該服務(wù)的類(lèi)別匹配的操作指令輸出。本模塊實(shí)現(xiàn)信息融合的技術(shù)手段包括統(tǒng)計(jì)模式識(shí)別法、多貝葉斯估計(jì)法、模糊邏輯法、神經(jīng)網(wǎng)絡(luò)法。其中，綜合交互模塊對(duì)六路識(shí)別通道輸出，分別是人臉識(shí)別結(jié)果、語(yǔ)音識(shí)別結(jié)果、人臉表情識(shí)別結(jié)果、語(yǔ)音情感識(shí)別結(jié)果、融合人臉和語(yǔ)音的顯性識(shí)別結(jié)果、融合人臉表情和語(yǔ)音情感的隱性識(shí)別結(jié)果進(jìn)行融合時(shí)候，可以根據(jù)服務(wù)種類(lèi)而進(jìn)行。例如，假如某項(xiàng)服務(wù)為語(yǔ)音優(yōu)先的，則可以通過(guò)加大輸出中語(yǔ)音及語(yǔ)音情感的識(shí)別權(quán)重來(lái)實(shí)現(xiàn)；某項(xiàng)服務(wù)是專(zhuān)門(mén)為語(yǔ)音不標(biāo)準(zhǔn)人員提供的，則可以加大輸出中人臉及人臉表情的識(shí)別權(quán)重來(lái)實(shí)現(xiàn)，達(dá)到更貼合業(yè)務(wù)的人性化體驗(yàn)需求。
權(quán)利要求
1.一種應(yīng)用于遠(yuǎn)程信息服務(wù)的人機(jī)交互識(shí)別系統(tǒng)，其特征在于，提供網(wǎng)絡(luò)信息服務(wù)的服務(wù)系統(tǒng)或其客戶(hù)端至少具有一個(gè)人機(jī)交互識(shí)別裝置；所述的人機(jī)交互識(shí)別裝置包括聽(tīng)覺(jué)采集模塊，用于采集用戶(hù)的語(yǔ)音信號(hào)；視覺(jué)采集模塊，用于采集用戶(hù)的人臉圖像；第一預(yù)處理模塊，用于對(duì)視覺(jué)采集模塊采集的圖像進(jìn)行預(yù)處理；人臉特征提取模塊，用于通過(guò)對(duì)第一預(yù)處理模塊的圖像進(jìn)行分析，實(shí)現(xiàn)對(duì)人臉整體或特征部位的識(shí)別、定位；人臉識(shí)別模塊，用于根據(jù)人臉特征提取模塊獲得參數(shù)進(jìn)行識(shí)別，輸出人臉識(shí)別的結(jié)果；第二預(yù)處理模塊，用于對(duì)聽(tīng)覺(jué)采集模塊的語(yǔ)音信號(hào)進(jìn)行預(yù)處理；語(yǔ)音特征提取模塊，用于分析并獲得語(yǔ)音參數(shù)；語(yǔ)音識(shí)別模塊，用于根據(jù)語(yǔ)音特征提取模塊獲得的參數(shù)進(jìn)行識(shí)別并獲得該用戶(hù)語(yǔ)音對(duì)應(yīng)的請(qǐng)求或指令；第三預(yù)處理模塊，用于對(duì)視覺(jué)采集模塊采集的圖像進(jìn)行預(yù)處理，形成人臉表情圖像序列；人臉表情特征提取模塊，用于對(duì)第三預(yù)處理模塊輸入的圖像序列進(jìn)行分析處理，獲得人臉表情參數(shù)；人臉表情識(shí)別模塊，用于人臉表情參數(shù)進(jìn)行處理、識(shí)別進(jìn)而獲得人臉表情的識(shí)別結(jié)果；第四預(yù)處理模塊，用于對(duì)聽(tīng)覺(jué)采集模塊的語(yǔ)音信號(hào)進(jìn)行與語(yǔ)言情感相關(guān)的預(yù)處理；語(yǔ)言情感特征提取模塊，用于從第四預(yù)處理模塊輸入的信號(hào)中獲得語(yǔ)言情感特征的參數(shù)；語(yǔ)言情感識(shí)別模塊，用于通過(guò)對(duì)語(yǔ)言情感特征的參數(shù)的分析處理，識(shí)別出該語(yǔ)音信號(hào)包含的情感信息并輸出識(shí)別結(jié)果；顯性識(shí)別融合模塊，用于將人臉識(shí)別模塊和語(yǔ)音識(shí)別模塊的識(shí)別結(jié)果進(jìn)行融合處理，形成綜合了人臉特征和語(yǔ)音特征的識(shí)別結(jié)果；隱性識(shí)別融合模塊，用于將人臉表情識(shí)別模塊和語(yǔ)言情感識(shí)別模塊的識(shí)別結(jié)果進(jìn)行融合處理，形成綜合了人臉表情特征和語(yǔ)音情感特征的識(shí)別結(jié)果。
2.如權(quán)利要求1所述的人機(jī)交互識(shí)別系統(tǒng)，其特征在于，所述的人臉識(shí)別模塊、語(yǔ)音識(shí)別模塊、人臉識(shí)別模塊、語(yǔ)音識(shí)別模塊、顯性識(shí)別融合模塊和隱性識(shí)別融合模塊所形成的識(shí)別結(jié)果均被轉(zhuǎn)換成獲取信息服務(wù)的操作指令；服務(wù)系統(tǒng)將根據(jù)該指令輸出服務(wù)。
3.如權(quán)利要求2所述的人機(jī)交互識(shí)別系統(tǒng)，其特征在于，所述人機(jī)交互識(shí)別裝置還具有一個(gè)綜合交互模塊，用于根據(jù)服務(wù)的類(lèi)別，綜合人臉識(shí)別模塊、語(yǔ)音識(shí)別模塊、人臉識(shí)別模塊、語(yǔ)音識(shí)別模塊、顯性識(shí)別融合模塊和隱性識(shí)別融合模塊所形成一種或一種以上識(shí)別結(jié)果，經(jīng)處理后形成與該服務(wù)的類(lèi)別匹配的操作指令輸出。
4.如權(quán)利要求1至3任一所述的人機(jī)交互識(shí)別系統(tǒng)，其特征在于，所述人臉表情識(shí)別模塊進(jìn)行識(shí)別的工具包括自組織影射神經(jīng)網(wǎng)絡(luò)分類(lèi)器、遺傳算法分類(lèi)器、K-鄰近分類(lèi)器、支持向量機(jī)分類(lèi)器、模糊邏輯分類(lèi)器、HMM分類(lèi)器、馬氏距離分類(lèi)器。
5.如權(quán)利要求1至3任一所述的人機(jī)交互識(shí)別系統(tǒng)，其特征在于，所述人臉表情特征提取模塊的提取手段包括主元分析、小波變換。
6.如權(quán)利要求1至3任一所述的人機(jī)交互識(shí)別系統(tǒng)，其特征在于，所述語(yǔ)音特征提取模塊獲得語(yǔ)音參數(shù)包括韻律、能量、基音均值、基音范圍、語(yǔ)速、音強(qiáng)、呼吸聲。
7.如權(quán)利要求1至3任一所述的人機(jī)交互識(shí)別系統(tǒng)，其特征在于，所述顯性識(shí)別融合模塊、隱性識(shí)別融合模塊和綜合交互模塊進(jìn)行信息融合的技術(shù)手段包括統(tǒng)計(jì)模式識(shí)別法、多貝葉斯估計(jì)法、模糊邏輯法、神經(jīng)網(wǎng)絡(luò)法。
全文摘要
本發(fā)明屬于計(jì)算機(jī)領(lǐng)域，特別是一種應(yīng)用于遠(yuǎn)程信息服務(wù)的人機(jī)交互識(shí)別系統(tǒng)，其特征在于，提供網(wǎng)絡(luò)信息服務(wù)的服務(wù)系統(tǒng)或其客戶(hù)端至少具有一個(gè)人機(jī)交互識(shí)別裝置；所述的人機(jī)交互識(shí)別裝置包括聽(tīng)覺(jué)采集模塊，用于采集用戶(hù)的語(yǔ)音信號(hào)；視覺(jué)采集模塊，用于采集用戶(hù)的人臉圖像；第一預(yù)處理模塊、人臉特征提取模塊、人臉識(shí)別模塊；第二預(yù)處理模塊、語(yǔ)音特征提取模塊、語(yǔ)音識(shí)別模塊；第三預(yù)處理模塊、人臉表情特征提取模塊、人臉表情識(shí)別模塊；第四預(yù)處理模塊、語(yǔ)言情感特征提取模塊、語(yǔ)言情感識(shí)別模塊；顯性識(shí)別融合模塊，用于將人臉識(shí)別模塊和語(yǔ)音識(shí)別模塊的識(shí)別結(jié)果進(jìn)行融合處理，形成綜合了人臉特征和語(yǔ)音特征的識(shí)別結(jié)果；隱性識(shí)別融合模塊，用于將人臉表情識(shí)別模塊和語(yǔ)言情感識(shí)別模塊的識(shí)別結(jié)果進(jìn)行融合處理，形成綜合了人臉表情特征和語(yǔ)音情感特征的識(shí)別結(jié)果。
文檔編號(hào)G06K9/62GK102298694SQ20111017012
公開(kāi)日2011年12月28日申請(qǐng)日期2011年6月21日優(yōu)先權(quán)日2011年6月21日
發(fā)明者盧忠云, 盧林發(fā), 葉燦才, 黃家祺申請(qǐng)人:廣東愛(ài)科數(shù)字科技有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：盧忠云;黃家祺;盧林發(fā);葉燦才
技術(shù)所有人：廣東愛(ài)科數(shù)字科技有限公司
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線(xiàn)網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

安全信息識(shí)別系統(tǒng)相關(guān)技術(shù)

信息識(shí)別系統(tǒng)相關(guān)技術(shù)

信息技術(shù)應(yīng)用于教學(xué)相關(guān)技術(shù)

人機(jī)交互相關(guān)技術(shù)

人機(jī)交互技術(shù)相關(guān)技術(shù)

人機(jī)交互界面相關(guān)技術(shù)

人機(jī)交互專(zhuān)業(yè)相關(guān)技術(shù)

人機(jī)交互界面開(kāi)發(fā)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種應(yīng)用于遠(yuǎn)程信息服務(wù)的人機(jī)交互識(shí)別系統(tǒng)的制作方法