本發(fā)明涉及一種交互式財(cái)富規(guī)劃咨詢機(jī)器人系統(tǒng),尤其涉及財(cái)富規(guī)劃咨詢機(jī)器人系統(tǒng)。
背景技術(shù):
改革開放三十多年以來,基于中國強(qiáng)勁、持續(xù)的經(jīng)濟(jì)增長(zhǎng),中國國民財(cái)富實(shí)現(xiàn)了快速積累,中國富裕人口比例不斷增加,目前中產(chǎn)階級(jí)人數(shù)為達(dá)1.09億名,已居全球之冠,加之社會(huì)大眾對(duì)金融投資知識(shí)和理念的不斷提升,使財(cái)富規(guī)劃管理市場(chǎng)規(guī)模以25%的年均復(fù)合增長(zhǎng)率快速增長(zhǎng)。一個(gè)迅速成長(zhǎng)的財(cái)富管理市場(chǎng)應(yīng)運(yùn)而生。目前,中國終于超過日本,成為僅次于美國之后的世界第二大經(jīng)濟(jì)體,中國私人財(cái)富已經(jīng)超過120萬億元。大力發(fā)展個(gè)人財(cái)富管理業(yè)務(wù),不僅是為了滿足國民財(cái)富管理的需要,也是提升私人銀行及其他財(cái)富規(guī)劃管理單位的經(jīng)營(yíng)核心競(jìng)爭(zhēng)力、轉(zhuǎn)變銀行業(yè)務(wù)結(jié)構(gòu)和盈利模式的需要,更是充分利用私人銀行資產(chǎn)管理服務(wù)平臺(tái)融通社會(huì)資金,合理引導(dǎo)社會(huì)資本,將巨額財(cái)富導(dǎo)入實(shí)體經(jīng)濟(jì),促進(jìn)實(shí)體經(jīng)濟(jì)發(fā)展的需要。從國家層面來講,財(cái)富規(guī)劃管理業(yè)務(wù)把在國家金融管理渠道之外的巨大的民間資本通過這個(gè)金融活動(dòng)納入國家金融管理渠道內(nèi);以防大量民間資本的非理性流動(dòng)擾亂國家金融順序。因此,當(dāng)國家相當(dāng)富裕(擁有大量富裕家庭和大量民間財(cái)富)時(shí),做好財(cái)富規(guī)劃管理這個(gè)業(yè)務(wù)關(guān)系到國家利益。
我國超過93%的低凈值人士和大量普通中凈值人士的家庭所擁有的財(cái)富接近40%,并且國內(nèi)低凈值人士和普通中凈值人士涵蓋的人群非常廣泛,人數(shù)特別巨大。不過,他們的服務(wù)需求較少,要求不高,產(chǎn)品標(biāo)準(zhǔn)化程度更高。這個(gè)市場(chǎng)的財(cái)富規(guī)劃管理業(yè)務(wù)應(yīng)該大有可為。但是,由于他們?nèi)巳悍浅V泛人數(shù)特別巨大,如果由銀行的業(yè)務(wù)人員為他們直接提供服務(wù),無論在人力或者物力上都是不可能的。因此,有必要開發(fā)設(shè)計(jì)一套交互式財(cái)富規(guī)劃咨詢機(jī)器人系統(tǒng),為廣大低凈值人士和大量普通中凈值人士提供自助式的財(cái)富規(guī)劃管理服務(wù)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是克服現(xiàn)有技術(shù)中存在的不足,提供一種財(cái)富規(guī)劃咨詢機(jī)器人系統(tǒng)。
為了實(shí)現(xiàn)上述目的,本發(fā)明所采用的技術(shù)方案如下:
一種交互式財(cái)富規(guī)劃咨詢機(jī)器人系統(tǒng),包括銀行卡插卡接口、身份證射頻閱讀器、真人活體身份驗(yàn)證模塊、語音交互模塊、財(cái)富規(guī)劃咨詢子系統(tǒng)、輔助顯示模塊,其特征在于:如果是新客戶,在身份證射頻閱讀器上放置身份證,通過銀行接口進(jìn)行身份信息聯(lián)網(wǎng)核查,核查通過后啟動(dòng)真人活體身份驗(yàn)證模塊;如果是老客戶,插入銀行卡或者在身份證射頻閱讀器上放置身份證,機(jī)器人讀出身份證或者銀行卡芯片信息,身份信息驗(yàn)證有效后,啟動(dòng)真人活體身份驗(yàn)證模塊,身份驗(yàn)證通過后啟動(dòng)財(cái)富規(guī)劃咨詢子系統(tǒng),財(cái)富規(guī)劃咨詢子系統(tǒng)為客戶提供一套完整詳盡的財(cái)富規(guī)劃投資建議書,完成后的財(cái)富規(guī)劃投資建議書的網(wǎng)頁鏈接通過短信或者微信或電子郵件發(fā)送到客戶的手機(jī)終端上,客戶點(diǎn)擊短信或微信或電子郵件的鏈接后,可直接完成投資下單購買,然后輸出交易記錄,交易記錄通過短信或者微信或電子郵件送給客戶。
啟動(dòng)財(cái)富規(guī)劃咨詢子系統(tǒng)后,通過數(shù)據(jù)平臺(tái)根據(jù)客戶信息讀取客戶數(shù)據(jù),完善客戶的基本信息以及財(cái)務(wù)投資信息,對(duì)客戶進(jìn)行投資問卷調(diào)查,判斷客戶的投資類型和風(fēng)險(xiǎn)偏好,根據(jù)客戶的財(cái)務(wù)信息、投資類型和風(fēng)險(xiǎn)偏好,為客戶推薦優(yōu)化投資組合,更新投資產(chǎn)品及其比例,并用科學(xué)的模擬,使用模特卡羅模擬,信心指數(shù)分析,有效前沿線分析,以及向后測(cè)試分析,模擬規(guī)劃的預(yù)期資產(chǎn)變化和預(yù)期數(shù)值,根據(jù)數(shù)據(jù)分析為客戶提供一套完整詳盡的資產(chǎn)配置報(bào)告。
在真人活體身份驗(yàn)證模塊中,設(shè)置人臉識(shí)別數(shù)據(jù)庫、聲紋識(shí)別數(shù)據(jù)庫、唇形識(shí)別數(shù)據(jù)庫、語音識(shí)別數(shù)據(jù)庫、微表情識(shí)別數(shù)據(jù)庫和情感識(shí)別數(shù)據(jù)庫;采集操作者讀取隨機(jī)預(yù)設(shè)內(nèi)容時(shí)的視頻信息和音頻信息;根據(jù)所述視頻信息提取人臉圖像信息與人臉識(shí)別數(shù)據(jù)庫中的數(shù)據(jù)相比對(duì)或/和根據(jù)所述音頻信息提取聲紋信息與聲紋識(shí)別數(shù)據(jù)庫中的數(shù)據(jù)相比對(duì),若比對(duì)成功,操作者是本人,否則操作者不是本人;根據(jù)所述視頻信息提取連續(xù)唇形圖像信息與唇語數(shù)據(jù)庫中的數(shù)據(jù)相比對(duì),識(shí)別出唇形語義并與隨機(jī)預(yù)設(shè)內(nèi)容相對(duì)比或/和根據(jù)所述音頻信息提取語音信息與語音識(shí)別數(shù)據(jù)庫中的數(shù)據(jù)相比對(duì),識(shí)別出的語義與隨機(jī)預(yù)設(shè)內(nèi)容相比對(duì),若比對(duì)成功,操作者是智能活體,否則操作者不是智能活體;根據(jù)所述的視頻信息提取連續(xù)人臉圖像,通過算法識(shí)別出操作者的表情變化,判斷是否是活體;根據(jù)所述的音頻信息,提取音頻特征,根據(jù)情感數(shù)據(jù)庫,識(shí)別操作者的情感,情感識(shí)別分為高興、興奮、正常、憤怒和恐懼,當(dāng)操作者的情感識(shí)別為高興或正常時(shí),驗(yàn)證通過;當(dāng)操作者的情感識(shí)別為其他三種狀態(tài)時(shí),跳出驗(yàn)證;若操作者是本人和智能活體、且為正常情感時(shí),身份驗(yàn)證成功,即該操作者確實(shí)是具有正常情感的真人智能活體,否則身份驗(yàn)證失敗。
所述人臉識(shí)別數(shù)據(jù)庫包括人臉模板庫,所述人臉模板庫包括真人人臉圖像信息,所述人臉模板庫中的真人人臉圖像信息與提取到的操作者的人臉圖像信息進(jìn)行人臉識(shí)別比對(duì),若比對(duì)成功,操作者是本人,否則操作者不是本人。
所述人臉識(shí)別主要包括以下步驟:人臉檢測(cè)、人臉跟蹤、圖像質(zhì)量分析、人臉圖像預(yù)處理、人臉特征提取及人臉比對(duì)識(shí)別。
所述聲紋識(shí)別數(shù)據(jù)庫包括本人聲紋信息,所述聲紋識(shí)別數(shù)據(jù)庫中的真人聲紋信息與提取到的操作者的聲紋信息進(jìn)行聲紋識(shí)別比對(duì),若比對(duì)成功,操作者是本人,否則操作者不是本人。
所述聲紋識(shí)別主要包括以下步驟:語音預(yù)處理、提取每一幀語音信號(hào)的特征參數(shù)及使用分類器對(duì)提取的參數(shù)進(jìn)行分類,識(shí)別出說話人。
所述唇形識(shí)別數(shù)據(jù)庫包括標(biāo)準(zhǔn)唇形圖像信息,所述唇形識(shí)別數(shù)據(jù)庫中的標(biāo)準(zhǔn)唇形圖像信息與提取到的操作者的連續(xù)唇形圖像信息進(jìn)行唇形識(shí)別比對(duì),識(shí)別出唇形圖像的語義,與隨機(jī)預(yù)設(shè)語義內(nèi)容對(duì)比,若比對(duì)成功,操作者是智能活體,否則操作者不是智能活體。
所述唇形識(shí)別主要包括以下步驟:圖像預(yù)處理、唇部定位、嘴唇輪廓提取、唇部輪廓跟蹤、唇部輪廓特征提取、特征分類和唇形比對(duì)識(shí)別。
所述語音識(shí)別數(shù)據(jù)庫包括標(biāo)準(zhǔn)語音信息,所述語音識(shí)別數(shù)據(jù)庫中的標(biāo)準(zhǔn)語音信息與提取到的操作者的語音信息進(jìn)行語音識(shí)別識(shí)別,識(shí)別出的語義與隨機(jī)產(chǎn)生語義相比,若比對(duì)成功,操作者是智能活體,否則操作者不是智能活體。
所述語音識(shí)別主要包括以下步驟:語音預(yù)處理、語音特征提取、特征模式識(shí)別和輸出語音識(shí)別結(jié)果。
所述預(yù)設(shè)內(nèi)容包括語音信息或者文字信息,所述文字信息包括文字、字母和數(shù)字中的任意一種字符或任意組合字符。
與現(xiàn)有技術(shù)相比,本發(fā)明的交互式財(cái)富規(guī)劃咨詢機(jī)器人系統(tǒng)的有益效果在于:新老客戶通過真人活體身份驗(yàn)證系統(tǒng)驗(yàn)證身份后,與機(jī)器人系統(tǒng)交互后,完善客戶信息后,機(jī)器人系統(tǒng)生成一套完整詳盡的財(cái)富規(guī)劃投資建議書,完成后的財(cái)富規(guī)劃投資建議書的網(wǎng)頁鏈接通過短信或者微信或電子郵件發(fā)送到客戶的手機(jī)終端上,客戶點(diǎn)擊短信或微信或電子郵件的鏈接后,可直接完成投資下單購買,然后輸出交易記錄,交易記錄通過短信或者微信或電子郵件送給客戶,這大大節(jié)約了人力物力。
附圖說明
圖1為本發(fā)明的財(cái)富規(guī)劃咨詢機(jī)器人系統(tǒng)結(jié)構(gòu)框圖;
圖2為本發(fā)明的財(cái)富規(guī)劃咨詢機(jī)器人系統(tǒng)流程圖;
圖3為本發(fā)明的財(cái)富規(guī)劃咨詢子系統(tǒng)流程圖;
圖4為本發(fā)明人臉識(shí)別模塊的流程框圖;
圖5為本發(fā)明聲紋識(shí)別模塊的流程框圖;
圖6為本發(fā)明所述唇形識(shí)別的流程框圖;
圖7為本發(fā)明所述語音識(shí)別的流程框圖;
圖8為本發(fā)明所述的情感識(shí)別的流程框圖。
具體實(shí)施方案
下面結(jié)合具體的附圖和實(shí)施方案對(duì)本發(fā)明做進(jìn)一步的說明。
如圖1所示,本發(fā)明的財(cái)富規(guī)劃咨詢機(jī)器人系統(tǒng)包括銀行卡插卡接口、身份證射頻閱讀器、真人活體身份驗(yàn)證模塊、語音交互模塊、財(cái)富規(guī)劃咨詢子系統(tǒng)、輔助顯示模塊。
如圖2-3所示,如果是新客戶在在身份證射頻閱讀器上放置身份證,通過銀行接口進(jìn)行身份信息聯(lián)網(wǎng)核查,核查通過后啟動(dòng)真人活體身份驗(yàn)證模塊;如果是老客戶,插入銀行卡或者在身份證射頻閱讀器上放置身份證,機(jī)器人讀出身份證或者銀行卡芯片信息,身份信息驗(yàn)證有效后,啟動(dòng)真人活體身份驗(yàn)證模塊,然后對(duì)客戶進(jìn)行是否是其本人,是否是智能活體的身份驗(yàn)證,并驗(yàn)證客戶當(dāng)前的情感狀態(tài),在確認(rèn)客戶清醒理智,自由意志的前提下,機(jī)器人自動(dòng)啟動(dòng)財(cái)富規(guī)劃咨詢子系統(tǒng),并顯示在機(jī)器人的觸摸屏上,語音引導(dǎo)客戶完成財(cái)富規(guī)劃咨詢內(nèi)容。首先是機(jī)器人通過數(shù)據(jù)平臺(tái)根據(jù)客戶信息讀取客戶數(shù)據(jù),完善客戶的基本信息以及財(cái)務(wù)投資信息,在完善過程中,客戶可以通過語音輸入,經(jīng)過系統(tǒng)語音識(shí)別后,作為輸入內(nèi)容,也可以選擇在機(jī)器人旁邊的觸摸屏上進(jìn)行輸入;客戶確認(rèn)后,對(duì)客戶進(jìn)行投資問卷調(diào)查,判斷客戶的投資類型和風(fēng)險(xiǎn)偏好;根據(jù)客戶的財(cái)務(wù)信息、投資類型和風(fēng)險(xiǎn)偏好,為客戶推薦優(yōu)化投資組合,更新投資產(chǎn)品及其比例,并用科學(xué)的模擬,使用模特卡羅模擬,信心指數(shù)分析,有效前沿線分析,以及向后測(cè)試分析等,模擬規(guī)劃的預(yù)期資產(chǎn)變化和預(yù)期數(shù)值,機(jī)器人會(huì)根據(jù)數(shù)據(jù)分析為客戶提供一套完整詳盡的資產(chǎn)配置報(bào)告。在此過程中,客戶既可以語音完成財(cái)富規(guī)劃咨詢的步驟,也可以通過觸摸屏完成信息輸入。完成后的財(cái)富規(guī)劃投資建議書的網(wǎng)頁鏈接通過短信或者微信或電子郵件發(fā)送到客戶的手機(jī)終端上,客戶點(diǎn)擊短信或微信或電子郵件的鏈接后,可直接完成投資下單購買,然后輸出交易記錄,交易記錄通過短信或者微信或電子郵件送給客戶。
在真人活體身份驗(yàn)證模塊中,采用基于音型像特征的真人活體身份驗(yàn)證方法,設(shè)置人臉識(shí)別數(shù)據(jù)庫、聲紋識(shí)別數(shù)據(jù)庫、唇形識(shí)別數(shù)據(jù)庫和語音識(shí)別數(shù)據(jù)庫,新客戶的真人活體驗(yàn)證主要使用語音識(shí)別模塊、微表情識(shí)別模塊、唇語識(shí)別模塊、情感識(shí)別模塊和人臉識(shí)別模塊,并在此過程中訓(xùn)練學(xué)習(xí)新開客戶的人臉特征、聲紋特征。老用戶的真人活體驗(yàn)證使用語音識(shí)別模塊、聲紋識(shí)別模塊、微表情識(shí)別模塊、唇語識(shí)別模塊、情感識(shí)別模塊和人臉識(shí)別模塊。當(dāng)操作者是新開客戶時(shí),采集操作者讀取預(yù)設(shè)內(nèi)容時(shí)的視頻信息和音頻信息,所述預(yù)設(shè)內(nèi)容包括語音信息或者文字信息,所述文字信息包括文字、字母和數(shù)字中的任意一種字符或任意組合字符;根據(jù)所述視頻信息提取人臉圖像信息與人臉識(shí)別數(shù)據(jù)庫中的數(shù)據(jù)相比對(duì),若比對(duì)成功,操作者是本人,否則操作者不是本人;根據(jù)所述視頻信息提取唇形圖像信息與唇語識(shí)別數(shù)據(jù)庫中的數(shù)據(jù)相比對(duì),識(shí)別出唇語的語義,并與隨機(jī)產(chǎn)生的語義相比對(duì)或/和根據(jù)所述音頻信息提取語音信息與語音識(shí)別數(shù)據(jù)庫中的數(shù)據(jù)相比對(duì),識(shí)別出語音的語義并與隨機(jī)產(chǎn)生的語義相比對(duì),若比對(duì)成功,操作者是智能活體,否則操作者不是智能活體;根據(jù)所述的視頻信息提取連續(xù)人臉圖像,通過算法識(shí)別出操作者的表情變化,判斷是否是活體;根據(jù)所述的音頻信息,提取音頻特征,根據(jù)情感數(shù)據(jù)庫,識(shí)別操作者的情感,情感識(shí)別分為高興、興奮、正常、憤怒和恐懼,當(dāng)操作者的情感識(shí)別為高興或正常時(shí),驗(yàn)證通過;當(dāng)操作者的情感識(shí)別為其他三種狀態(tài)時(shí),跳出驗(yàn)證;若操作者是本人和智能活體、且為正常情感時(shí),身份驗(yàn)證成功,即該操作者確實(shí)是具有正常情感的真人智能活體;否則身份驗(yàn)證失敗。當(dāng)操作者是老客戶時(shí),采集操作者讀取預(yù)設(shè)內(nèi)容時(shí)的視頻信息和音頻信息,所述預(yù)設(shè)內(nèi)容包括語音信息或者文字信息,所述文字信息包括文字、字母和數(shù)字中的任意一種字符或任意組合字符;根據(jù)所述視頻信息提取人臉圖像信息與人臉識(shí)別數(shù)據(jù)庫中的數(shù)據(jù)相比對(duì)或/和根據(jù)所述音頻信息提取聲紋信息與聲紋識(shí)別數(shù)據(jù)庫中的數(shù)據(jù)相比對(duì),若比對(duì)成功,操作者是本人,否則操作者不是本人;根據(jù)所述視頻信息提取唇形圖像信息與唇語識(shí)別數(shù)據(jù)庫中的數(shù)據(jù)相比對(duì),識(shí)別出唇語的語義,并與隨機(jī)產(chǎn)生的語義相比對(duì)或/和根據(jù)所述音頻信息提取語音信息與語音識(shí)別數(shù)據(jù)庫中的數(shù)據(jù)相比對(duì),識(shí)別出語音的語義并與隨機(jī)產(chǎn)生的語義相比對(duì),若比對(duì)成功,操作者是智能活體,否則操作者不是智能活體;根據(jù)所述的視頻信息提取連續(xù)人臉圖像,通過算法識(shí)別出操作者的表情變化,判斷是否是活體;根據(jù)所述的音頻信息,提取音頻特征,根據(jù)情感數(shù)據(jù)庫,識(shí)別操作者的情感,情感識(shí)別分為高興、興奮、正常、憤怒和恐懼,當(dāng)操作者的情感識(shí)別為高興或正常時(shí),驗(yàn)證通過;當(dāng)操作者的情感識(shí)別為其他三種狀態(tài)時(shí),跳出驗(yàn)證;若操作者是本人和智能活體、且為正常情感時(shí),身份驗(yàn)證成功,即該操作者確實(shí)是具有正常情感的真人智能活體;否則身份驗(yàn)證失敗。
在本發(fā)明一實(shí)施例中,所述人臉模板庫中的真人人臉圖像信息與提取到的操作者的人臉圖像信息進(jìn)行人臉識(shí)別比對(duì),若比對(duì)成功,操作者是本人,否則操作者不是本人。
在本發(fā)明一實(shí)施例中,所述人臉模板庫中的真人人臉圖像信息與提取到的操作者的人臉圖像信息進(jìn)行人臉識(shí)別比對(duì),若比對(duì)成功,操作者是本人,否則操作者不是本人。
請(qǐng)參閱圖4所示,人臉識(shí)別模塊主要包括以下步驟:人臉檢測(cè)、人臉跟蹤、圖像質(zhì)量分析、人臉圖像預(yù)處理、人臉特征提取及人臉比對(duì)識(shí)別。人臉圖像預(yù)處理把人臉圖像做色階、對(duì)比度、色彩平衡、銳化、降噪、去模糊、直方圖均衡化、超解析等方法進(jìn)行增強(qiáng)。人臉檢測(cè)算法提取人臉的特征,后使用adboost級(jí)聯(lián)分類器對(duì)其進(jìn)行分類,提取到人臉的人臉部位,對(duì)提取的人臉使用圖像跟蹤算法,對(duì)人臉進(jìn)行跟蹤,確保是同一人,并優(yōu)選多幅高質(zhì)量圖片,從人臉照片中提取用于人臉識(shí)別的特征,并用主成份分析算法對(duì)數(shù)據(jù)進(jìn)行降維處理,形成人臉特征向量,使用分類算法識(shí)別出人臉身份。
在本發(fā)明另一實(shí)施例中,所述聲紋識(shí)別數(shù)據(jù)庫中的真人聲紋信息與提取到的操作者的聲紋信息進(jìn)行聲紋識(shí)別比對(duì),若比對(duì)成功,操作者是本人,否則操作者不是本人。
請(qǐng)參閱圖5所示,聲紋識(shí)別模塊主要包括以下步驟:語音預(yù)處理、提取每一幀語音信號(hào)的特征參數(shù)及使用分類器對(duì)提取的參數(shù)進(jìn)行分類,識(shí)別出說話人。語音預(yù)處理是對(duì)輸入的語音數(shù)據(jù)序列(PCM 碼流)進(jìn)行分幀,計(jì)算各幀語音數(shù)據(jù)的累積能量,提取到具有信息的語音數(shù)據(jù),對(duì)具有信息的語音數(shù)據(jù)通過高通濾波器預(yù)加重處理,將處理后語音信號(hào)劃分為一個(gè)一個(gè)的短時(shí)段,然后再將每幀乘上窗函數(shù),以增加每幀左端和右端的連續(xù)性,對(duì)分幀加窗后的各幀信號(hào)進(jìn)行變換得到各幀的頻譜,根據(jù)頻譜提取每段的語音的特征向量,有特征向量根據(jù)深度神經(jīng)網(wǎng)絡(luò)或其他分類器和模板庫識(shí)別聲紋身份。
在本發(fā)明一實(shí)施例中所述唇形識(shí)別數(shù)據(jù)庫中的標(biāo)準(zhǔn)唇形圖像信息與提取到的操作者的唇形圖像信息進(jìn)行唇形識(shí)別比對(duì),若比對(duì)成功,操作者是智能活體,否則操作者不是智能活體。
請(qǐng)參閱圖6所示,唇形識(shí)別模塊主要包括以下步驟:圖像預(yù)處理、唇部定位、嘴唇輪廓提取、唇部輪廓跟蹤、唇部輪廓特征提取、特征分類和唇形比對(duì)識(shí)別。嘴唇定位是在上述的人臉檢測(cè)定位的人臉圖像區(qū)域中,根據(jù)嘴唇部位顏色的先驗(yàn)知識(shí)區(qū)分出唇部和膚色,并增強(qiáng)嘴唇區(qū)域色彩,利用二值化圖像完成唇部的粗定位,再結(jié)合唇色模型實(shí)現(xiàn)唇部精定位。嘴唇輪廓提取是通過數(shù)學(xué)形態(tài)學(xué)處理,提取出唇部的初始曲線,然后通過基于輪廓提取方法提取出唇部的輪廓曲線。唇部輪廓跟蹤采用光流法或meanshift對(duì)序列圖像進(jìn)行跟蹤,并對(duì)下一幀初始輪廓進(jìn)行預(yù)測(cè),提取唇部輪廓的特征點(diǎn)集矢量,根據(jù)特征矢量和訓(xùn)練模板庫,利用人工智能分類算法進(jìn)行唇語的識(shí)別。
在本發(fā)明另一實(shí)施例中,所述語音識(shí)別數(shù)據(jù)庫中的標(biāo)準(zhǔn)語音信息與提取到的操作者的語音信息進(jìn)行語音識(shí)別比對(duì),若比對(duì)成功,操作者是智能活體,否則操作者不是智能活體。
請(qǐng)參閱圖7所示,語音識(shí)別模塊主要包括以下步驟:語音預(yù)處理、語音特征提取、特征模式識(shí)別和輸出語音識(shí)別結(jié)果。提取每一幀語音信號(hào)的特征參數(shù),使用分類器對(duì)提取的參數(shù)進(jìn)行分類,識(shí)別出說話人。語音預(yù)處理是對(duì)輸入的語音進(jìn)行分幀,計(jì)算各幀語音數(shù)據(jù)的累積能量,提取到具有信息的語音數(shù)據(jù),使用隱馬爾可夫模型構(gòu)建一個(gè)狀態(tài)網(wǎng)絡(luò),從狀態(tài)網(wǎng)絡(luò)中尋找與聲音最匹配的路徑,構(gòu)造單詞級(jí)網(wǎng)絡(luò),展開成音素網(wǎng)絡(luò)和狀態(tài)網(wǎng)絡(luò)。然后在狀態(tài)網(wǎng)絡(luò)中搜索一條最佳路徑,這條路徑和語音之間的概率最大。使用算動(dòng)態(tài)規(guī)劃剪枝的搜索算法,用于尋找全局最優(yōu)路徑,根據(jù)狀態(tài)轉(zhuǎn)移識(shí)別出當(dāng)前語音內(nèi)容。
請(qǐng)參閱圖8所示,情感識(shí)別模塊主要包括以下步驟:語音預(yù)處理、特征參數(shù)提取、特征參數(shù)和五種情感參數(shù)比較、分類器進(jìn)行分類、情感狀態(tài)識(shí)別結(jié)果輸出。首選對(duì)語音信號(hào)進(jìn)行預(yù)處理,然后對(duì)預(yù)處理后的語音信號(hào)提取特征參數(shù),提取后的特征參數(shù)和五種基礎(chǔ)情感參數(shù)比較,然后通過分類器對(duì)特征參數(shù)進(jìn)行分類,確定特征參數(shù)對(duì)應(yīng)的情感狀態(tài)參數(shù),最后輸出情感狀態(tài)識(shí)別結(jié)果。
以上示意性的對(duì)本發(fā)明及其實(shí)施方式進(jìn)行了描述,該描述沒有限制性,附圖中所示的也只是本發(fā)明的實(shí)施方式之一,實(shí)際的結(jié)構(gòu)并不局限于此。所以,如果本領(lǐng)域的普通技術(shù)人員受其啟示,在不脫離本發(fā)明創(chuàng)造宗旨的情況下,不經(jīng)創(chuàng)造性的設(shè)計(jì)出與該技術(shù)方案相似的結(jié)構(gòu)方式及實(shí)施例,均應(yīng)屬于本發(fā)明的保護(hù)范圍。