亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種身份識(shí)別的方法及裝置制造方法

文檔序號(hào):7802283閱讀:183來(lái)源:國(guó)知局
一種身份識(shí)別的方法及裝置制造方法
【專(zhuān)利摘要】本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法及裝置,涉及電視【技術(shù)領(lǐng)域】,用于提高用戶(hù)身份識(shí)別的準(zhǔn)確率。所述方法,包括:接收用戶(hù)的語(yǔ)音信號(hào);提取所述語(yǔ)音信號(hào)的第一參數(shù);分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率;分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率;將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算;將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶(hù)為所述最大第二概率對(duì)應(yīng)的用戶(hù)。
【專(zhuān)利說(shuō)明】一種身份識(shí)別的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及電視【技術(shù)領(lǐng)域】,尤其涉及一種身份識(shí)別的方法及裝置。
【背景技術(shù)】
[0002]在現(xiàn)在高度信息化的生活中,電視設(shè)備早已超越了最初單純收看影畫(huà)的基本屬性,取而代之的是電視設(shè)備的智能化,其中,智能語(yǔ)音電視設(shè)備為智能電視設(shè)備的一種。為了滿(mǎn)足用戶(hù)的使用需求,現(xiàn)有的智能語(yǔ)音電視設(shè)備設(shè)置有兩種工作模式,即通用模式與個(gè)性化模式。在通用模式下,電視設(shè)備根據(jù)用戶(hù)輸入的語(yǔ)音指令直接執(zhí)行相應(yīng)的播放操作;在個(gè)性化模式下,電視設(shè)備根據(jù)用戶(hù)的訪問(wèn)記錄向用戶(hù)推薦節(jié)目,方便用戶(hù)選擇自身喜愛(ài)的節(jié)目。
[0003]在現(xiàn)有技術(shù)中,在智能語(yǔ)音電視設(shè)備啟動(dòng)時(shí),處于通用模式,當(dāng)用戶(hù)需要在個(gè)性化模式下進(jìn)行觀影時(shí),通常采用聲紋識(shí)別的方法將通用模式切換為個(gè)性化模式,即電視設(shè)備接收用戶(hù)輸入的語(yǔ)音信號(hào),并將接收到的語(yǔ)音信號(hào)進(jìn)行預(yù)處理,從而在預(yù)處理后的語(yǔ)音信號(hào)中提取聲紋信息,并將提取的聲紋信息與存儲(chǔ)器中存儲(chǔ)的語(yǔ)音信息數(shù)據(jù)進(jìn)行匹配,當(dāng)提取的聲紋信息與存儲(chǔ)器中存儲(chǔ)的語(yǔ)音信息數(shù)據(jù)匹配時(shí),則確定用戶(hù)的身份,并向用戶(hù)呈現(xiàn)與該用戶(hù)相對(duì)應(yīng)的個(gè)性化界面,即將通用模式切換為個(gè)性化模式。
[0004]在上述實(shí)現(xiàn)模式切換的方法中,采用聲紋識(shí)別的方法將通用模式切換為個(gè)性化模式時(shí),當(dāng)用戶(hù)A與用戶(hù)B的聲紋特征非常接近時(shí),若電視設(shè)備對(duì)用戶(hù)A的身份進(jìn)行識(shí)別,電視設(shè)備在接收到的用戶(hù)A的語(yǔ)音信號(hào)中提取用戶(hù)A的聲紋信息,并將用戶(hù)A的聲紋信息與存儲(chǔ)器中存儲(chǔ)的語(yǔ)音信息數(shù)據(jù)進(jìn)行匹配,此時(shí),可能存在用戶(hù)A的聲紋信息與存儲(chǔ)器中存儲(chǔ)的用戶(hù)B的語(yǔ)音信息數(shù)據(jù)相匹配,則確定的用戶(hù)為用戶(hù)B,即用戶(hù)身份識(shí)別錯(cuò)誤,從而導(dǎo)致電視設(shè)備根據(jù)用戶(hù)B的訪問(wèn)記錄向用戶(hù)A推薦用戶(hù)B喜愛(ài)的節(jié)目。因此,采用聲紋識(shí)別的方法來(lái)確定用戶(hù)的身份時(shí),導(dǎo)致用戶(hù)身份識(shí)別的準(zhǔn)確率不高。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的實(shí)施例提供了一種身份識(shí)別的方法及裝置,用于提高用戶(hù)身份識(shí)別的準(zhǔn)確率。
[0006]為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:
[0007]第一方面,本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法,包括:接收用戶(hù)的語(yǔ)音信號(hào);提取所述語(yǔ)音信號(hào)的第一參數(shù);分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率;分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率;將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算;將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶(hù)為所述最大第二概率對(duì)應(yīng)的用戶(hù)。
[0008]在第一方面的第一種可能的實(shí)現(xiàn)方式中,所述語(yǔ)音信號(hào)通過(guò)麥克風(fēng)陣列獲取。[0009]結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,在第一方面的第二種可能的實(shí)現(xiàn)方式中,當(dāng)所述最大第一概率小于所述第一閾值,通過(guò)所述麥克風(fēng)陣列重新獲取所述用戶(hù)的語(yǔ)
音信號(hào)。
[0010]結(jié)合第一方面,在第一方面的第三種可能的實(shí)現(xiàn)方式中,當(dāng)所述最大第一概率小于所述第一閾值,則提示所述用戶(hù)進(jìn)行注冊(cè)。
[0011]結(jié)合第一方面的第三種可能的實(shí)現(xiàn)方式,在第一方面的第四種可能的實(shí)現(xiàn)方式中,通過(guò)所述麥克風(fēng)陣列獲取用戶(hù)的注冊(cè)語(yǔ)音信號(hào),并對(duì)所述注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理;提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
[0012]結(jié)合第一方面,在第一方面的第五種可能的實(shí)現(xiàn)方式中,對(duì)所述語(yǔ)音信號(hào)進(jìn)行所述預(yù)處理,在進(jìn)行預(yù)處理之后的語(yǔ)音信號(hào)中提取所述第一參數(shù)。
[0013]結(jié)合第一方面的第四種可能的實(shí)現(xiàn)方式,在第一方面的第六種可能的實(shí)現(xiàn)方式中,所述預(yù)處理包括預(yù)加重、分幀、加窗及端點(diǎn)檢測(cè)處理。
[0014]結(jié)合第一方面的第一至第六任一種可能的實(shí)現(xiàn)方式,在第一方面的第七種可能的實(shí)現(xiàn)方式中,所述第一模型包括隱馬爾可夫模型HMM ;所述第二模型包括高斯混合模型GMM ;所述第一參數(shù)包括美爾頻率倒譜系數(shù)MFCC。
[0015]第二方面,本發(fā)明實(shí)施例提供了一種電視設(shè)備,包括:接收單元,用于接收用戶(hù)的語(yǔ)音信號(hào);處理單元,用于提取所述語(yǔ)音信號(hào)的第一參數(shù);所述處理單元,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率;所述處理單元,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率;所述處理單元,還用于將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算;所述處理單元,還用于將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶(hù)為所述最大第二概率對(duì)應(yīng)的用戶(hù),并切換至所述用戶(hù)對(duì)應(yīng)的個(gè)性化模式。
[0016]在第二方面的第一種可能的實(shí)現(xiàn)方式中,所述接收單元,具體用于通過(guò)所述麥克風(fēng)陣列獲取所述語(yǔ)音信號(hào)。
[0017]結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式,在第二方面的第二種可能的實(shí)現(xiàn)方式中,所述接收單元,還用于在所述最大第一概率小于所述第一閾值時(shí),通過(guò)所述麥克風(fēng)陣列重新獲取所述用戶(hù)的語(yǔ)音信號(hào)。
[0018]結(jié)合第二方面,在第二方面的第三種可能的實(shí)現(xiàn)方式中,所述處理單元,還用于在所述最大第一概率小于所述第一閾值時(shí),提示所述用戶(hù)進(jìn)行注冊(cè)。
[0019]結(jié)合第二方面的第三種可能的實(shí)現(xiàn)方式,在第二方面的第四種可能的實(shí)現(xiàn)方式中,所述接收單元,還用于通過(guò)所述麥克風(fēng)陣列獲取用戶(hù)的注冊(cè)語(yǔ)音信號(hào);所述處理單元,還用于對(duì)所述注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理;所述處理單元,還用于提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
[0020]結(jié)合第二方面,在第二方面的第五種可能的實(shí)現(xiàn)方式中,所述處理單元,還用于對(duì)所述語(yǔ)音信號(hào)進(jìn)行所述預(yù)處理,在進(jìn)行預(yù)處理之后的語(yǔ)音信號(hào)中提取所述第一參數(shù)。[0021]結(jié)合第二方面,在第二方面的第六種可能的實(shí)現(xiàn)方式中,所述處理單元,還用于在所述運(yùn)算結(jié)果小于所述第二閾值時(shí),確定所述用戶(hù)不是所述最大第二概率對(duì)應(yīng)的用戶(hù),并切換至通用模式。
[0022]本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法及裝置,電視設(shè)備接收到用戶(hù)的語(yǔ)音信號(hào)之后,在接收的用戶(hù)的語(yǔ)音信號(hào)中提取第一參數(shù),首先分別將第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出第一模型匹配的最大第一概率,即對(duì)用戶(hù)的語(yǔ)音內(nèi)容進(jìn)行識(shí)別;然后分別將第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出第二模型匹配的最大第二概率,即對(duì)用戶(hù)的聲紋特征進(jìn)行識(shí)別,此時(shí),將最大第一概率與第一閾值進(jìn)行比較,若最大第一概率不小于第一閾值,則將最大第二概率與最大第一概率進(jìn)行運(yùn)算,并將運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若運(yùn)算結(jié)果不小于第二閾值,則確定用戶(hù)為最大第二概率對(duì)應(yīng)的用戶(hù),從而根據(jù)用戶(hù)的語(yǔ)音內(nèi)容及聲紋特征確定用戶(hù)的用戶(hù)身份。這樣,當(dāng)用戶(hù)A與用戶(hù)B的聲紋特征非常接近時(shí),在現(xiàn)有技術(shù)中,只根據(jù)用戶(hù)A與用戶(hù)B的聲紋信息確定用戶(hù)的身份,會(huì)導(dǎo)致對(duì)用戶(hù)的身份識(shí)別的準(zhǔn)確率不高。而本發(fā)明中,用戶(hù)A與用戶(hù)B可以輸入不同內(nèi)容的語(yǔ)音信號(hào),則電視設(shè)備根據(jù)獲取的不同內(nèi)容的語(yǔ)音信號(hào)及聲紋特征相結(jié)合的方法來(lái)確定用戶(hù)的用戶(hù)身份,從而提高了身份識(shí)別的準(zhǔn)確率。
【專(zhuān)利附圖】

【附圖說(shuō)明】
[0023]為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0024]圖1為本發(fā)明實(shí)施例提供的一種身份識(shí)別的方法的流程示意圖;
[0025]圖2為本發(fā)明實(shí)施例提供的另一種身份識(shí)別的方法的流程示意圖;
[0026]圖3為本發(fā)明實(shí)施例提供的一種電視設(shè)備的功能示意圖。
【具體實(shí)施方式】
[0027]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0028]本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法,應(yīng)用于帶有麥克風(fēng)陣列的電視設(shè)備中,如圖1所示,包括:
[0029]101、接收用戶(hù)的語(yǔ)音信號(hào)。
[0030]102、提取所述語(yǔ)音信號(hào)的第一參數(shù)。
[0031]其中,所述第一參數(shù)為所述用戶(hù)的語(yǔ)音信號(hào)的特征參數(shù)。
[0032]進(jìn)一步的,所述第一參數(shù)包括MFCC(MelFrequency Cepstrum Coefficient,美爾頻率倒譜系數(shù))。
[0033]具體的,電視設(shè)備在獲取到用戶(hù)的語(yǔ)音信號(hào)之后,將獲取的語(yǔ)音信號(hào)進(jìn)行FFT (Fast Fourier Transform,快速傅里葉變換),即將時(shí)域的語(yǔ)音信號(hào)轉(zhuǎn)換為頻域的語(yǔ)音信號(hào),再將頻域的語(yǔ)音信號(hào)經(jīng)過(guò)由至少一個(gè)帶通濾波器組成的頻率濾波器,得到頻域的語(yǔ)音信號(hào)的對(duì)數(shù)能量譜,進(jìn)而將頻域的語(yǔ)音信號(hào)的對(duì)數(shù)能量譜進(jìn)行DCT(DisCrete CosineTransform,離散余弦變換),從而得到用戶(hù)的語(yǔ)音信號(hào)的MFCC參數(shù)。
[0034]需要說(shuō)明的是,電視設(shè)備還可以根據(jù)其他方法獲取用戶(hù)的語(yǔ)音信號(hào)的MFCC參數(shù),本發(fā)明對(duì)此不作限制。
[0035]需要說(shuō)明的是,第一參數(shù)還可以是其他參數(shù),例如LPCC(Linear PredictiveCoefficient,線性預(yù)測(cè)倒譜系數(shù)),本發(fā)明對(duì)此不做限制。
[0036]103、分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率。
[0037]其中,所述第一模型參數(shù)為與語(yǔ)音內(nèi)容相關(guān)的,且為最大輸出概率對(duì)應(yīng)的參數(shù)。
[0038]具體的,電視設(shè)備在提取出用戶(hù)的語(yǔ)音信號(hào)的第一參數(shù)后,即得到用戶(hù)的語(yǔ)音信號(hào)的特征向量,并將用戶(hù)的語(yǔ)音信號(hào)的特征向量分別與預(yù)先存儲(chǔ)的至少一個(gè)第一模型參數(shù)進(jìn)行第一模型匹配,例如,分別計(jì)算用戶(hù)的語(yǔ)音信號(hào)的特征向量與預(yù)先存儲(chǔ)的每一個(gè)第一模型參數(shù)的第一概率,并在計(jì)算出的所有第一概率中確定出最大第一概率,并將最大第一概率確定為語(yǔ)音內(nèi)容識(shí)別的結(jié)果。
[0039]需要說(shuō)明的是,電視設(shè)備還可以根據(jù)其他方法確定用戶(hù)的語(yǔ)音信號(hào)的特征向量與預(yù)先存儲(chǔ)的每一個(gè)第一模型參數(shù)的第一概率,本發(fā)明對(duì)此不作限制。
[0040]104、分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率。
[0041]其中,所述第二模型參數(shù)為與用戶(hù)特征有關(guān)的,且為最大似然度對(duì)應(yīng)的參數(shù)。
[0042]具體的,電視設(shè)備在得到用戶(hù)的語(yǔ)音信號(hào)的特征向量之后,將用戶(hù)的語(yǔ)音信號(hào)的特征向量分別與預(yù)先存儲(chǔ)的每一個(gè)已注冊(cè)用戶(hù)的第二模型參數(shù)進(jìn)行第二模型匹配,例如,分別計(jì)算用戶(hù)的語(yǔ)音信號(hào)的特征向量與每一個(gè)已注冊(cè)用戶(hù)的第二模型參數(shù)的第二概率,并在計(jì)算出的所有已注冊(cè)用戶(hù)對(duì)應(yīng)的第二概率中確定出最大第二概率,并將最大第二概率確定為對(duì)用戶(hù)的聲紋識(shí)別的結(jié)果,由于每一個(gè)已注冊(cè)用戶(hù)與第二模型參數(shù)是一一對(duì)應(yīng)的,因此,可以根據(jù)最大第二概率對(duì)應(yīng)的第二模型參數(shù)來(lái)確定此第二模型參數(shù)對(duì)應(yīng)的用戶(hù)。
[0043]需要說(shuō)明的是,電視設(shè)備還可以根據(jù)其他方法確定用戶(hù)的語(yǔ)音信號(hào)的特征向量與每一個(gè)已注冊(cè)用戶(hù)對(duì)應(yīng)的第二模型參數(shù)的第二概率,本發(fā)明對(duì)此不作限制。
[0044]105、將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算。
[0045]具體的,電視設(shè)備在確定最大第一概率之后,將最大第一概率與預(yù)先設(shè)定的與語(yǔ)音內(nèi)容有關(guān)的第一閾值進(jìn)行比較,在確定最大第一概率不小于預(yù)先設(shè)定的與語(yǔ)音內(nèi)容有關(guān)的第一閾值時(shí),則確定對(duì)用戶(hù)的語(yǔ)音內(nèi)容識(shí)別的結(jié)果正確,此時(shí),將用戶(hù)的語(yǔ)音內(nèi)容識(shí)別的結(jié)果與聲紋識(shí)別的結(jié)果進(jìn)行結(jié)合,并確定用戶(hù)的語(yǔ)音內(nèi)容識(shí)別的結(jié)果與聲紋識(shí)別的結(jié)果所占的比例,進(jìn)而將最大第一概率與最大第二概率進(jìn)行加權(quán)運(yùn)算,從而得到運(yùn)算結(jié)果。
[0046]需要說(shuō)明的是,電視設(shè)備還可以將最大第二概率與最大第一概率進(jìn)行其他運(yùn)算,本發(fā)明對(duì)此不做限制。
[0047]106、將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶(hù)為所述最大第二概率對(duì)應(yīng)的用戶(hù)。[0048]具體的,電視設(shè)備將加權(quán)運(yùn)算后的運(yùn)算結(jié)果與預(yù)先設(shè)定的與聲紋識(shí)別相關(guān)的第二閾值進(jìn)行比較,當(dāng)確定運(yùn)算結(jié)果不小于與預(yù)先設(shè)定的與聲紋識(shí)別相關(guān)的第二閾值時(shí),則確定輸入語(yǔ)音信號(hào)的用戶(hù)為根據(jù)最大第二概率確定的用戶(hù),即為電視設(shè)備識(shí)別用戶(hù)的身份成功。
[0049]本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法,電視設(shè)備接收到用戶(hù)的語(yǔ)音信號(hào)之后,在接收的用戶(hù)的語(yǔ)音信號(hào)中提取第一參數(shù),首先分別將第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出第一模型匹配的最大第一概率,即對(duì)用戶(hù)的語(yǔ)音內(nèi)容進(jìn)行識(shí)別;然后分別將第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出第二模型匹配的最大第二概率,即對(duì)用戶(hù)的聲紋特征進(jìn)行識(shí)別,此時(shí),將最大第一概率與第一閾值進(jìn)行比較,若最大第一概率不小于第一閾值,則將最大第二概率與最大第一概率進(jìn)行運(yùn)算,并將運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若運(yùn)算結(jié)果不小于第二閾值,則確定用戶(hù)為最大第二概率對(duì)應(yīng)的用戶(hù),從而根據(jù)用戶(hù)的語(yǔ)音內(nèi)容及聲紋特征確定用戶(hù)的用戶(hù)身份。這樣,當(dāng)用戶(hù)A與用戶(hù)B的聲紋特征非常接近時(shí),在現(xiàn)有技術(shù)中,只根據(jù)用戶(hù)A與用戶(hù)B的聲紋信息確定用戶(hù)的身份,會(huì)導(dǎo)致對(duì)用戶(hù)的身份識(shí)別的準(zhǔn)確率不高。而本發(fā)明中,用戶(hù)A與用戶(hù)B可以輸入不同內(nèi)容的語(yǔ)音信號(hào),則電視設(shè)備根據(jù)獲取的不同內(nèi)容的語(yǔ)音信號(hào)及聲紋特征相結(jié)合的方法來(lái)確定用戶(hù)的用戶(hù)身份,從而提高了身份識(shí)別的準(zhǔn)確率。
[0050]本發(fā)明實(shí)施例提供了另一種身份識(shí)別的方法,應(yīng)用于帶有麥克風(fēng)陣列的電視設(shè)備中,如圖2所示,包括:
[0051]201、獲取注冊(cè)指令。
[0052]具體的,電視設(shè)備在檢測(cè)到有注冊(cè)指令時(shí),則確定在接收到用戶(hù)輸入的語(yǔ)音信號(hào)時(shí),需要對(duì)接收到的語(yǔ)音信號(hào)進(jìn)行注冊(cè)。
[0053]202、通過(guò)所述麥克風(fēng)陣列獲取用戶(hù)的注冊(cè)語(yǔ)音信號(hào),并對(duì)所述注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理。
[0054]其中,所述注冊(cè)語(yǔ)音信號(hào)包括所述用戶(hù)輸入至所述麥克風(fēng)陣列的至少一次語(yǔ)音信號(hào)。所述預(yù)處理包括預(yù)加重、分幀、加窗及端點(diǎn)檢測(cè)處理。
[0055]具體的,電視設(shè)備通過(guò)麥克風(fēng)陣列獲取用戶(hù)的注冊(cè)語(yǔ)音信號(hào),并對(duì)注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,即首先對(duì)獲取的注冊(cè)語(yǔ)音信號(hào)通過(guò)一個(gè)一階有限激勵(lì)響應(yīng)高通濾波器,使得注冊(cè)語(yǔ)音信號(hào)的頻譜變得平坦的預(yù)加重處理,然后對(duì)預(yù)加重處理后的語(yǔ)音信號(hào)進(jìn)行分幀處理,得到至少一幀語(yǔ)音信號(hào),并將得到的每一幀語(yǔ)音信號(hào)分別進(jìn)行加窗處理,從而減小吉布斯效應(yīng)的影響,進(jìn)一步對(duì)加窗處理后的語(yǔ)音信號(hào)進(jìn)行端點(diǎn)檢測(cè)來(lái)確定用戶(hù)輸入的注冊(cè)語(yǔ)音信號(hào)的開(kāi)始與結(jié)束位置,并去除語(yǔ)音信號(hào)開(kāi)始與結(jié)束時(shí)的空白噪聲,從而完成對(duì)用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的預(yù)處理。
[0056]需要說(shuō)明的是,電視設(shè)備對(duì)用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的預(yù)處理還可以包括其他處理,例如,在預(yù)加重處理之前對(duì)用戶(hù)的注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)濾波,采樣和量化處理,本發(fā)明對(duì)此不做限制。
[0057]203、提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
[0058]其中,所述第二參數(shù)為所述用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的特征參數(shù)。
[0059]進(jìn)一步的,所述第一模型包括HMM(Hidden Markov Model,隱馬爾可夫模型);所述第二模型包括GMM (Gaussian Mixture Model,高斯混合模型);所述第二參數(shù)包括MFCC參數(shù)。
[0060]具體的,電視設(shè)備在將獲取到的用戶(hù)的注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理之后,將經(jīng)過(guò)加窗處理后的每一幀語(yǔ)音信號(hào)分別進(jìn)行FFT變換,得到每一幀語(yǔ)音信號(hào)的頻譜參數(shù),再將每一幀語(yǔ)音信號(hào)的頻譜參數(shù)經(jīng)過(guò)由至少一個(gè)帶通濾波器組成的頻率濾波器,得到每一幀語(yǔ)音信號(hào)的頻譜參數(shù)的對(duì)數(shù)能量譜,進(jìn)而將每一幀語(yǔ)音信號(hào)的對(duì)數(shù)能量譜進(jìn)行DCT (DiscreteCosine Transform,離散余弦變換),從而得到用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的MFCC參數(shù),即得到用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的特征向量,并將用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的特征向量進(jìn)行HMM模型訓(xùn)練,以得到與用戶(hù)的注冊(cè)語(yǔ)音內(nèi)容相關(guān)的模型參數(shù),即將用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的特征向量作為HMM模型訓(xùn)練的輸入,與HMM模型預(yù)先設(shè)定的初始模型參數(shù)根據(jù)預(yù)設(shè)的規(guī)則不斷調(diào)整模型參數(shù),并構(gòu)成新的模型,以使得輸出概率最大,并將最大輸出概率對(duì)應(yīng)的模型參數(shù)確定為第一模型參數(shù)。
[0061]再將用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的特征向量進(jìn)行GMM模型訓(xùn)練,以得到與用戶(hù)的聲紋相關(guān)的模型參數(shù),即將用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的特征向量作為GMM模型訓(xùn)練的輸入,與GMM模型預(yù)先設(shè)定的初始模型參數(shù)根據(jù)預(yù)設(shè)的規(guī)則訓(xùn)練,并在訓(xùn)練后的數(shù)據(jù)中確定最大似然度對(duì)應(yīng)的模型參數(shù),并將此模型參數(shù)確定為第二模型參數(shù)。
[0062]需要說(shuō)明的是,電視設(shè)備對(duì)用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的特征向量進(jìn)行HMM模型訓(xùn)練及GMM模型訓(xùn)練的具體過(guò)程,與現(xiàn)有技術(shù)中對(duì)語(yǔ)音信號(hào)的特征向量的HMM模型訓(xùn)練及GMM模型訓(xùn)練的過(guò)程相同,本發(fā)明在此不再贅述。
[0063]需要說(shuō)明的是,用戶(hù)的注冊(cè)語(yǔ)音信號(hào)中的每一個(gè)語(yǔ)音信號(hào)的內(nèi)容相同,對(duì)于相同內(nèi)容的語(yǔ)音信號(hào)訓(xùn)練后得到的第一模型參數(shù)及第二模型參數(shù)均只有一個(gè)。對(duì)于不同內(nèi)容的語(yǔ)音信號(hào)訓(xùn)練后得到的第一模型參數(shù)及第二模型參數(shù)的個(gè)數(shù)與語(yǔ)音內(nèi)容的個(gè)數(shù)相對(duì)應(yīng)。
[0064]需要說(shuō)明的是,第二參數(shù)還可以是其他參數(shù),例如LPCC系數(shù),本發(fā)明對(duì)此不做限制。
[0065]需要說(shuō)明的是,電視設(shè)備還可以對(duì)用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的特征向量進(jìn)行其他模型訓(xùn)練,以得到與用戶(hù)的語(yǔ)音內(nèi)容相關(guān)的模型參數(shù)及與用戶(hù)的聲紋相關(guān)的模型參數(shù),本發(fā)明對(duì)此不作限制。
[0066]204、將所述第一模型參數(shù)與所述第二模型參數(shù)進(jìn)行存儲(chǔ)。
[0067]具體的,電視設(shè)備在確定第一模型參數(shù)與第二模型參數(shù)之后,需要將第一模型參數(shù)與第二模型參數(shù)進(jìn)行存儲(chǔ),以便電視設(shè)備在接收到用戶(hù)的語(yǔ)音信號(hào)時(shí),根據(jù)存儲(chǔ)的第一模型參數(shù)確定用戶(hù)的語(yǔ)音內(nèi)容,根據(jù)存儲(chǔ)的第二模型參數(shù)確定用戶(hù)的用戶(hù)身份。
[0068]205、接收用戶(hù)的語(yǔ)音信號(hào)。
[0069]具體的,電視設(shè)備通過(guò)麥克風(fēng)陣列獲取用戶(hù)的語(yǔ)音信號(hào)。
[0070]206、對(duì)所述語(yǔ)音信號(hào)進(jìn)行預(yù)處理。
[0071]具體的,電視設(shè)備對(duì)用戶(hù)的語(yǔ)音信號(hào)的預(yù)處理過(guò)程,與電視設(shè)備對(duì)用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的預(yù)處理過(guò)程類(lèi)似,可參考步驟202,本發(fā)明在此不再贅述。
[0072]207、在所述進(jìn)行預(yù)處理之后的用戶(hù)的語(yǔ)音信號(hào)中提取第一參數(shù)。
[0073]其中,所述第一參數(shù)包括MFCC參數(shù)。
[0074]具體的,電視設(shè)備在將獲取到的用戶(hù)的語(yǔ)音信號(hào)進(jìn)行預(yù)處理之后,將經(jīng)過(guò)加窗處理后的每一幀語(yǔ)音信號(hào)分別進(jìn)行FFT變換,得到每一幀語(yǔ)音信號(hào)的頻譜參數(shù),再將每一幀語(yǔ)音信號(hào)的頻譜參數(shù)經(jīng)過(guò)由至少一個(gè)帶通濾波器組成的頻率濾波器,得到每一幀語(yǔ)音信號(hào)的頻譜參數(shù)的對(duì)數(shù)能量譜,進(jìn)而將每一幀語(yǔ)音信號(hào)的對(duì)數(shù)能量譜進(jìn)行DCT變換,從而得到用戶(hù)的語(yǔ)音信號(hào)的MFCC參數(shù)。
[0075]需要說(shuō)明的是,第二參數(shù)與第一參數(shù)相同,當(dāng)?shù)谝粎?shù)為MFCC參數(shù)時(shí),第二參數(shù)也為MFCC參數(shù);當(dāng)?shù)谝粎?shù)為L(zhǎng)PCC參數(shù)時(shí),第二參數(shù)也為L(zhǎng)PCC參數(shù)。
[0076]需要說(shuō)明的是,電視設(shè)備在執(zhí)行完步驟207之后,可以先執(zhí)行步驟208,再執(zhí)行步驟209 ;也可以先執(zhí)行步驟209,再執(zhí)行步驟208 ;或者步驟208與步驟209同時(shí)執(zhí)行,本發(fā)明對(duì)此不做限制。
[0077]208、分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率。
[0078]其中,所述第一模型參數(shù)為與語(yǔ)音內(nèi)容相關(guān)的,且為最大輸出概率對(duì)應(yīng)的參數(shù)。
[0079]具體的,可參考步驟103,本發(fā)明在此不再贅述。
[0080]209、分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率。
[0081]其中,所述第二模型參數(shù)為與用戶(hù)特征有關(guān)的,且為最大似然度對(duì)應(yīng)的參數(shù)。
[0082]具體的,可參考步驟104,本發(fā)明在此不再贅述。
[0083]需要說(shuō)明的是,電視設(shè)備將最大第一概率與第一閾值進(jìn)行比較的結(jié)果不同,執(zhí)行的步驟也不同,在確定最大第一概率不小于第一閾值時(shí),則執(zhí)行步驟210-211,步驟214-215 ;在確定最大第一概率小于第一閾值時(shí),則執(zhí)行步驟212-215。
[0084]需要說(shuō)明的是,電視設(shè)備在確定最大第一概率不小于第一閾值后,執(zhí)行步驟210與步驟211沒(méi)有先后順序,本發(fā)明對(duì)此不做限制。
[0085]210、將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算。
[0086]具體的,可參考步驟105,本發(fā)明在此不再贅述。
[0087]211、若所述最大第一概率不小于所述第一閾值,則激活所述麥克風(fēng)陣列。
[0088]具體的,電視設(shè)備在確定出最大第一概率不小于第一閾值時(shí),則激活麥克風(fēng)陣列,以使得用戶(hù)通過(guò)麥克風(fēng)陣列輸入語(yǔ)音指令,從而使得電視設(shè)備根據(jù)用戶(hù)輸入的語(yǔ)音指令執(zhí)行相應(yīng)的操作。
[0089]需要說(shuō)明的是,電視設(shè)備在確定最大第一概率小于第一閾值時(shí),有兩種實(shí)現(xiàn)方法,在直接通過(guò)所述麥克風(fēng)陣列重新獲取用戶(hù)的語(yǔ)音信號(hào)時(shí),則執(zhí)行步驟212;在提示用戶(hù)進(jìn)行注冊(cè)時(shí),則執(zhí)行步驟213。
[0090]212、當(dāng)所述最大第一概率小于所述第一閾值,通過(guò)所述麥克風(fēng)陣列重新獲取所述用戶(hù)的語(yǔ)音信號(hào)。
[0091]具體的,電視設(shè)備在確定出最大第一概率小于第一閾值時(shí),則確定對(duì)用戶(hù)輸入的語(yǔ)音內(nèi)容識(shí)別的結(jié)果不正確,此時(shí),電視設(shè)備可以重新獲取用戶(hù)的語(yǔ)音信號(hào)。
[0092]213、當(dāng)所述最大第一概率小于所述第一閾值,則提示所述用戶(hù)進(jìn)行注冊(cè)。
[0093]具體的,電視設(shè)備在確定最大第一概率小于第一閾值時(shí),可以通過(guò)語(yǔ)音設(shè)備輸出有關(guān)注冊(cè)的語(yǔ)音,以使得用戶(hù)接收到此語(yǔ)音后,輸入用戶(hù)的注冊(cè)語(yǔ)音信號(hào)。[0094]214、將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶(hù)為所述最大第二概率對(duì)應(yīng)的用戶(hù)。
[0095]具體的,可參考步驟105,本發(fā)明在此不再贅述。
[0096]本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法,電視設(shè)備在獲取到注冊(cè)指令后,通過(guò)麥克風(fēng)陣列獲取用戶(hù)的注冊(cè)語(yǔ)音信號(hào),并對(duì)用戶(hù)的注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,并對(duì)預(yù)處理后的注冊(cè)語(yǔ)音信號(hào)提取第二參數(shù),并對(duì)第二參數(shù)分別進(jìn)行第一模型訓(xùn)練及第二模型訓(xùn)練,得到第一模型參數(shù)及第二模型參數(shù),并將第一模型參數(shù)及第二模型參數(shù)進(jìn)行存儲(chǔ),從而,電視設(shè)備在接收到用戶(hù)的語(yǔ)音信號(hào)之后,在接收的用戶(hù)的語(yǔ)音信號(hào)中提取第一參數(shù),首先分別將第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出第一模型匹配的最大第一概率,即對(duì)用戶(hù)的語(yǔ)音內(nèi)容進(jìn)行識(shí)別;然后分別將第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出第二模型匹配的最大第二概率,即對(duì)用戶(hù)的聲紋特征進(jìn)行識(shí)另II,此時(shí),將最大第一概率與第一閾值進(jìn)行比較,若最大第一概率不小于第一閾值,則將最大第二概率與最大第一概率進(jìn)行運(yùn)算,并將運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若運(yùn)算結(jié)果不小于第二閾值,則確定用戶(hù)為最大第二概率對(duì)應(yīng)的用戶(hù),從而根據(jù)用戶(hù)的語(yǔ)音內(nèi)容及聲紋特征確定用戶(hù)的用戶(hù)身份。這樣,當(dāng)用戶(hù)A與用戶(hù)B的聲紋特征非常接近時(shí),在現(xiàn)有技術(shù)中,只根據(jù)用戶(hù)A與用戶(hù)B的聲紋信息確定用戶(hù)的身份,會(huì)導(dǎo)致對(duì)用戶(hù)的身份識(shí)別的準(zhǔn)確率不高。而本發(fā)明中,用戶(hù)A與用戶(hù)B可以輸入不同內(nèi)容的語(yǔ)音信號(hào),則電視設(shè)備根據(jù)獲取的不同內(nèi)容的語(yǔ)音信號(hào)及聲紋特征相結(jié)合的方法來(lái)確定用戶(hù)的用戶(hù)身份,從而提高了身份識(shí)別的準(zhǔn)確率。
[0097]如圖3所示,其為本發(fā)明實(shí)施例提供了一種電視設(shè)備的功能示意圖。參考圖3所示,該設(shè)備包括:接收單元301及處理單元304。
[0098]所述接收單元301,用于接收用戶(hù)的語(yǔ)音信號(hào)。
[0099]所述處理單元302,用于提取所述語(yǔ)音信號(hào)的第一參數(shù)。
[0100]其中,所述第一參數(shù)為所述用戶(hù)的語(yǔ)音信號(hào)的特征參數(shù)。
[0101]進(jìn)一步的,所述第一參數(shù)包括MFCC參數(shù)。
[0102]所述處理單元302,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率。
[0103]其中,所述第一模型參數(shù)為與語(yǔ)音內(nèi)容相關(guān)的,且為最大輸出概率對(duì)應(yīng)的參數(shù)。
[0104]所述處理單元302,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率。
[0105]其中,所述第二模型參數(shù)為與用戶(hù)特征有關(guān)的,且為最大似然度對(duì)應(yīng)的參數(shù)。
[0106]所述處理單元302,還用于將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算。
[0107]所述處理單元302,還用于將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶(hù)為所述最大第二概率對(duì)應(yīng)的用戶(hù),并切換至所述用戶(hù)對(duì)應(yīng)的個(gè)性化模式。
[0108]其中,所述個(gè)性化模式為所述電視設(shè)備根據(jù)用戶(hù)的訪問(wèn)記錄為用戶(hù)提供服務(wù)的模式。
[0109]具體的,所述處理單元302在確定用戶(hù)為最大第二條件概率對(duì)應(yīng)的用戶(hù)后,將切換至此用戶(hù)對(duì)應(yīng)的個(gè)性化模式,進(jìn)而根據(jù)已存儲(chǔ)的用戶(hù)的訪問(wèn)記錄來(lái)向用戶(hù)提供服務(wù),例如根據(jù)已存儲(chǔ)的用戶(hù)的訪問(wèn)記錄來(lái)向用戶(hù)推薦電視節(jié)目,以使得用戶(hù)根據(jù)推薦的電視節(jié)目快速選擇自身喜愛(ài)的電視節(jié)目,而不需要對(duì)所有電視頻道進(jìn)行切換來(lái)選擇自身喜愛(ài)的節(jié)目,提聞了用戶(hù)體驗(yàn)。
[0110]進(jìn)一步的,所述接收單元301,還用于獲取注冊(cè)指令。
[0111]所述接收單元301,還用于通過(guò)所述麥克風(fēng)陣列獲取用戶(hù)的注冊(cè)語(yǔ)音信號(hào)。
[0112]其中,所述用戶(hù)的注冊(cè)語(yǔ)音信號(hào)包括所述用戶(hù)輸入至所述麥克風(fēng)陣列的至少一次
語(yǔ)音信號(hào)。
[0113]所述處理單元302,還用于對(duì)所述用戶(hù)的注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理。
[0114]其中,所述預(yù)處理包括預(yù)加重、分幀、加窗及端點(diǎn)檢測(cè)處理。
[0115]所述處理單元302,還用于提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
[0116]其中,所述第二參數(shù)為所述用戶(hù)的注冊(cè)語(yǔ)音信號(hào)的特征參數(shù)。所述第一模型包括隱馬爾可夫模型HMM ;所述第二模型包括高斯混合模型GMM ;所述第二參數(shù)包括MFCC參數(shù)。
[0117]所述處理單元302,還用于對(duì)所述語(yǔ)音信號(hào)進(jìn)行預(yù)處理,在進(jìn)行預(yù)處理之后的語(yǔ)音信號(hào)中提取第一參數(shù)。
[0118]所述處理單元302,還用于在確定所述最大第一概率不小于所述第一閾值時(shí),激活所述麥克風(fēng)陣列。
[0119]所述處理單元302,還用于在所述最大第一概率小于所述第一閾值時(shí),通過(guò)所述麥克風(fēng)陣列重新獲取所述用戶(hù)的語(yǔ)音信號(hào)。
[0120]所述處理單元302,還用于在所述最大第一概率小于所述第一閾值時(shí),提示所述用戶(hù)進(jìn)行注冊(cè)。
[0121]所述處理單元302,還用于在所述運(yùn)算結(jié)果小于所述第二閾值時(shí),確定所述用戶(hù)不是所述最大第二概率對(duì)應(yīng)的用戶(hù),并切換至通用模式。
[0122]其中,所述通用模式為所述電視設(shè)備根據(jù)所述用戶(hù)輸入的語(yǔ)音指令直接執(zhí)行相應(yīng)的播放操作的模式。
[0123]具體的,所述處理單元302在確定運(yùn)算結(jié)果小于預(yù)先設(shè)定的與聲紋識(shí)別相關(guān)的第二閾值時(shí),則確定輸入語(yǔ)音信號(hào)的用戶(hù)不是根據(jù)最大第二概率確定的用戶(hù),即為識(shí)別用戶(hù)身份失敗,則將電視模式切換為通用模式,進(jìn)而根據(jù)用戶(hù)輸入的語(yǔ)音指令直接進(jìn)行相應(yīng)的操作。
[0124]本發(fā)明實(shí)施例提供了一種電視設(shè)備,電視設(shè)備在獲取到注冊(cè)指令后,通過(guò)麥克風(fēng)陣列獲取用戶(hù)的注冊(cè)語(yǔ)音信號(hào),并對(duì)用戶(hù)的注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,并對(duì)預(yù)處理后的注冊(cè)語(yǔ)音信號(hào)提取第二參數(shù),并對(duì)第二參數(shù)分別進(jìn)行第一模型訓(xùn)練及第二模型訓(xùn)練,得到第一模型參數(shù)及第二模型參數(shù),并將第一模型參數(shù)及第二模型參數(shù)進(jìn)行存儲(chǔ),從而,電視設(shè)備在接收到用戶(hù)的語(yǔ)音信號(hào)之后,在接收的用戶(hù)的語(yǔ)音信號(hào)中提取第一參數(shù),首先分別將第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出第一模型匹配的最大第一概率,即對(duì)用戶(hù)的語(yǔ)音內(nèi)容進(jìn)行識(shí)別;然后分別將第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出第二模型匹配的最大第二概率,即對(duì)用戶(hù)的聲紋特征進(jìn)行識(shí)別,此時(shí),將最大第一概率與第一閾值進(jìn)行比較,若最大第一概率不小于第一閾值,則將最大第二概率與最大第一概率進(jìn)行運(yùn)算,并將運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若運(yùn)算結(jié)果不小于第二閾值,則確定用戶(hù)為最大第二概率對(duì)應(yīng)的用戶(hù),從而根據(jù)用戶(hù)的語(yǔ)音內(nèi)容及聲紋特征確定用戶(hù)的用戶(hù)身份。這樣,當(dāng)用戶(hù)A與用戶(hù)B的聲紋特征非常接近時(shí),在現(xiàn)有技術(shù)中,只根據(jù)用戶(hù)A與用戶(hù)B的聲紋信息確定用戶(hù)的身份,會(huì)導(dǎo)致對(duì)用戶(hù)的身份識(shí)別的準(zhǔn)確率不高。而本發(fā)明中,用戶(hù)A與用戶(hù)B可以輸入不同內(nèi)容的語(yǔ)音信號(hào),則電視設(shè)備根據(jù)獲取的不同內(nèi)容的語(yǔ)音信號(hào)及聲紋特征相結(jié)合的方法來(lái)確定用戶(hù)的用戶(hù)身份,從而提高了身份識(shí)別的準(zhǔn)確率。
[0125]在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
[0126]所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
[0127]另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理包括,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0128]上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤(pán)、移動(dòng)硬盤(pán)、只讀存儲(chǔ)器(Read-Only Memory,簡(jiǎn)稱(chēng)ROM)、隨機(jī)存取存儲(chǔ)器(Random Access Memory,簡(jiǎn)稱(chēng)RAM)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0129]最后應(yīng)說(shuō)明的是:以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【權(quán)利要求】
1.一種身份識(shí)別的方法,其特征在于: 接收用戶(hù)的語(yǔ)音信號(hào); 提取所述語(yǔ)音信號(hào)的第一參數(shù); 分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率; 分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率; 將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算; 將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶(hù)為所述最大第二概率對(duì)應(yīng)的用戶(hù)。
2.根據(jù)權(quán)利要求1所述的身份識(shí)別的方法,其特征在于:所述語(yǔ)音信號(hào)通過(guò)麥克風(fēng)陣列獲取。
3.根據(jù)權(quán)利要求2所述的身份識(shí)別的方法,其特征在于: 當(dāng)所述最大第一概率小于所述第一閾值,通過(guò)所述麥克風(fēng)陣列重新獲取所述用戶(hù)的語(yǔ)音信號(hào)。
4.根據(jù)權(quán)利要求1所述的身份識(shí)別的方法,其特征在于: 當(dāng)所述最大第一概率小于所述第一閾值,則提示所述用戶(hù)進(jìn)行注冊(cè)。
5.根據(jù)權(quán)利要求4所述的身份識(shí)別的方法,其特征在于: 通過(guò)所述麥克風(fēng)陣列獲取用戶(hù)的注冊(cè)語(yǔ)音信號(hào),并對(duì)所述注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理;提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
6.根據(jù)權(quán)利要求1所述的身份識(shí)別的方法,其特征在于: 對(duì)所述語(yǔ)音信號(hào)進(jìn)行所述預(yù)處理,在進(jìn)行預(yù)處理之后的語(yǔ)音信號(hào)中提取所述第一參數(shù)。
7.根據(jù)權(quán)利要求5所述的身份識(shí)別的方法,其特征在于:所述預(yù)處理包括預(yù)加重、分幀、加窗及端點(diǎn)檢測(cè)處理。
8.根據(jù)權(quán)利要求1-7任一項(xiàng)所述的方法,其特征在于,所述第一模型包括隱馬爾可夫模型HMM ;所述第二模型包括高斯混合模型GMM ;所述第一參數(shù)包括美爾頻率倒譜系數(shù)MFCC。
9.一種電視設(shè)備,其特征在于,包括: 接收單元,用于接收用戶(hù)的語(yǔ)音信號(hào); 處理單元,用于提取所述語(yǔ)音信號(hào)的第一參數(shù); 所述處理單元,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率; 所述處理單元,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率; 所述處理單元,還用于將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算;所述處理單元,還用于將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶(hù)為所述最大第二概率對(duì)應(yīng)的用戶(hù),并切換至所述用戶(hù)對(duì)應(yīng)的個(gè)性化模式。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于, 所述接收單元,具體用于通過(guò)所述麥克風(fēng)陣列獲取所述語(yǔ)音信號(hào)。
11.根據(jù)權(quán)利要求10所述的設(shè)備,其特征在于, 所述接收單元,還用于在所述最大第一概率小于所述第一閾值時(shí),通過(guò)所述麥克風(fēng)陣列重新獲取所述用戶(hù)的語(yǔ)音信號(hào)。
12.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于, 所述處理單元,還用于在所述最大第一概率小于所述第一閾值時(shí),提示所述用戶(hù)進(jìn)行注冊(cè)。
13.根據(jù)權(quán)利要求12所述的設(shè)備,其特征在于, 所述接收單元,還用于通過(guò)所述麥克風(fēng)陣列獲取用戶(hù)的注冊(cè)語(yǔ)音信號(hào); 所述處理單元,還用于對(duì)所述注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理; 所述處理單元,還用于提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
14.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于, 所述處理單元,還用于對(duì)所述語(yǔ)音信號(hào)進(jìn)行所述預(yù)處理,在進(jìn)行預(yù)處理之后的語(yǔ)音信號(hào)中提取所述第一參數(shù)。
15.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于, 所述處理單元,還用于在所述運(yùn)算結(jié)果小于所述第二閾值時(shí),確定所述用戶(hù)不是所述最大第二概率對(duì)應(yīng)的用戶(hù),并切換至通用模式。
【文檔編號(hào)】H04R3/00GK103943111SQ201410173009
【公開(kāi)日】2014年7月23日 申請(qǐng)日期:2014年4月25日 優(yōu)先權(quán)日:2014年4月25日
【發(fā)明者】匡濤, 賈魁, 王勇進(jìn), 任曉楠 申請(qǐng)人:海信集團(tuán)有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1