本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及用于處理語(yǔ)音數(shù)據(jù)的方法和裝置。
背景技術(shù):
近年來(lái),聲紋識(shí)別這種新興的生物識(shí)別手段因其安全便利性受到了很大關(guān)注。聲紋識(shí)別是基于不同人的發(fā)聲器官例如肺、氣管、聲帶、口腔、鼻腔、咽腔等在尺寸和形態(tài)方面存在的生理差異,利用每個(gè)人語(yǔ)音中包含的獨(dú)特信息,進(jìn)行個(gè)人身份的識(shí)別和驗(yàn)證。但是現(xiàn)實(shí)中,每個(gè)人的語(yǔ)音聲學(xué)特征并非絕對(duì)的、一成不變的,而是受到所處環(huán)境、使用設(shè)備等外界因素和個(gè)人身體狀況、情緒波動(dòng)、言語(yǔ)風(fēng)格變化等內(nèi)在因素等共同影響變化的。另外研究表明,人的語(yǔ)音聲學(xué)特征還會(huì)隨著年齡增長(zhǎng)而出現(xiàn)變化。因此,對(duì)用戶聲紋特征的動(dòng)態(tài)變化進(jìn)行追蹤,使得用戶的聲紋模型能根據(jù)新增聲音樣本進(jìn)行自適應(yīng)更新,這對(duì)于提升聲紋識(shí)別系統(tǒng)的性能具有至關(guān)重要的意義。
目前,對(duì)用戶進(jìn)行身份驗(yàn)證時(shí)通常使用的是根據(jù)用戶在注冊(cè)時(shí)輸入的語(yǔ)音數(shù)據(jù)所生成聲紋模型,但是這種模型不能進(jìn)行自適應(yīng)更新,隨著時(shí)間的推移,這種驗(yàn)證用戶身份的方法會(huì)導(dǎo)致驗(yàn)證結(jié)果不準(zhǔn)確。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)的目的在于提出一種改進(jìn)的用于處理語(yǔ)音數(shù)據(jù)的方法和裝置,來(lái)解決以上背景技術(shù)部分提到的技術(shù)問(wèn)題。
第一方面,本申請(qǐng)?zhí)峁┝艘环N用于處理語(yǔ)音數(shù)據(jù)的方法,該方法包括:接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù);提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量;將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配,并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度;確定匹配度是否大于等于預(yù)設(shè)的更新閾值;響應(yīng)于確定出匹配度大于等于的更新閾值,則利用聲紋特征向量和語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量。
在一些實(shí)施例中,提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量,包括:將語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到中間向量;將中間向量進(jìn)行特征變換得到聲紋特征向量。
在一些實(shí)施例中,在將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配之前,該方法還包括生成注冊(cè)聲紋向量的步驟,包括:獲取用戶輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù);將預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量;對(duì)預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量進(jìn)行特征變換得到預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量;對(duì)預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量進(jìn)行融合,生成用戶的注冊(cè)聲紋向量。
在一些實(shí)施例中,所述利用聲紋特征向量和語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量包括:獲取用戶輸入的注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和用戶已存儲(chǔ)的各個(gè)聲紋特征向量;根據(jù)用戶已存儲(chǔ)的各個(gè)聲紋特征向量、用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量、注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和注冊(cè)聲紋向量,更新注冊(cè)聲紋向量。
在一些實(shí)施例中,根據(jù)用戶已存儲(chǔ)的各個(gè)聲紋特征向量、用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量、注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和注冊(cè)聲紋向量,更新注冊(cè)聲紋向量,包括:對(duì)用戶已存儲(chǔ)的各個(gè)聲紋特征向量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算,并對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算后的向量進(jìn)行求和運(yùn)算,得到用戶已存儲(chǔ)的聲紋特征向量之和;利用注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量乘以注冊(cè)聲紋向量,得到注冊(cè)聲紋向量之積;計(jì)算聲紋特征向量之和與注冊(cè)聲紋向量之積的向量和,并計(jì)算用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量與注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量的數(shù)量和,利用向量和除以數(shù)量和得到更新的注冊(cè)聲紋向量。
在一些實(shí)施例中,在更新注冊(cè)聲紋向量之后,該方法包括:刪除用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)。
在一些實(shí)施例中,獲取用戶輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù),包括:獲取用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)以及語(yǔ)音數(shù)據(jù)的相關(guān)信息,其中,相關(guān)信息包括語(yǔ)音數(shù)據(jù)的輸入時(shí)間點(diǎn);刪除輸入時(shí)間點(diǎn)早于預(yù)設(shè)的時(shí)間分割點(diǎn)的語(yǔ)音數(shù)據(jù),并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)。
在一些實(shí)施例中,獲取用戶輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù),還包括:利用聚類算法對(duì)用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)進(jìn)行聚類,生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇;獲取各個(gè)簇的中心點(diǎn);利用距離算法計(jì)算每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)與每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)所在簇的中心點(diǎn)的距離;刪除距離大于預(yù)設(shè)的距離閾值的語(yǔ)音數(shù)據(jù),并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)。
在一些實(shí)施例中,相關(guān)信息還包括以下至少一項(xiàng):語(yǔ)音數(shù)據(jù)的采集設(shè)備類型、語(yǔ)音數(shù)據(jù)的輸入地點(diǎn);以及在生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇之后,方法還包括:獲取各個(gè)簇中的語(yǔ)音數(shù)據(jù)以及各個(gè)簇中的語(yǔ)音數(shù)據(jù)的相關(guān)信息;利用各個(gè)簇的語(yǔ)音數(shù)據(jù)重新生成用戶的各個(gè)注冊(cè)聲紋向量,并根據(jù)各個(gè)簇的語(yǔ)音數(shù)據(jù)的相關(guān)信息生成各個(gè)注冊(cè)聲紋向量的相關(guān)信息。
在一些實(shí)施例中,在接收用戶通過(guò)用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)之后,該方法還包括:獲取語(yǔ)音數(shù)據(jù)的相關(guān)信息;以及將聲紋特征向量與預(yù)先生成的用戶的注冊(cè)聲紋向量進(jìn)行匹配,包括:根據(jù)語(yǔ)音數(shù)據(jù)的相關(guān)信息與各個(gè)注冊(cè)聲紋向量的相關(guān)信息的匹配度,選擇注冊(cè)聲紋向量;將聲紋特征向量與選擇的注冊(cè)聲紋向量進(jìn)行匹配。
在一些實(shí)施例中,在所述生成所述聲紋特征向量與所述注冊(cè)聲紋向量之間的匹配度之后,所述方法還包括:確定所述匹配度是否大于等于預(yù)設(shè)的通過(guò)閾值;響應(yīng)于確定出所述匹配度大于等于預(yù)設(shè)的通過(guò)閾值,則確定用戶身份驗(yàn)證通過(guò)并執(zhí)行與驗(yàn)證通過(guò)相對(duì)應(yīng)的操作。
第二方面,本申請(qǐng)?zhí)峁┝艘环N用于處理語(yǔ)音數(shù)據(jù)的裝置,該裝置包括:接收單元,配置用于接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù);提取單元,配置用于提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量;匹配單元,配置用于將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配,并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度;第一確定單元,配置用于確定匹配度是否大于等于預(yù)設(shè)的更新閾值;更新單元,配置用于響應(yīng)于確定出匹配度大于等于預(yù)設(shè)的更新閾值,則利用聲紋特征向量和語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量。
在一些實(shí)施例中,提取單元包括:映射模塊,配置用于將語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到中間向量;變換模塊,配置用于將中間向量進(jìn)行特征變換得到聲紋特征向量。
在一些實(shí)施例中,該裝置還包括生成單元,包括:獲取模塊,配置用于獲取用戶輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù);映射模塊,配置用于將預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量;變換模塊,配置用于對(duì)預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量進(jìn)行特征變換得到預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量;融合模塊,配置用于對(duì)預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量進(jìn)行融合,生成用戶的注冊(cè)聲紋向量。
在一些實(shí)施例中,更新單元包括:獲取模塊,配置用于獲取用戶輸入的注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和用戶已存儲(chǔ)的各個(gè)聲紋特征向量;更新模塊,配置用于根據(jù)用戶已存儲(chǔ)的各個(gè)聲紋特征向量、用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量、注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和注冊(cè)聲紋向量,更新注冊(cè)聲紋向量。
在一些實(shí)施例中,更新模塊包括:第一計(jì)算子模塊,配置用于對(duì)用戶已存儲(chǔ)的各個(gè)聲紋特征向量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算,并對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算后的向量進(jìn)行求和運(yùn)算,得到用戶已存儲(chǔ)的聲紋特征向量之和;第二計(jì)算子模塊,配置用于利用注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量乘以注冊(cè)聲紋向量,得到注冊(cè)聲紋向量之積;更新子模塊,配置用于計(jì)算聲紋特征向量之和與注冊(cè)聲紋向量之積的向量和,并計(jì)算用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量與注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量的數(shù)量和,利用向量和除以數(shù)量和得到更新的注冊(cè)聲紋向量。
在一些實(shí)施例中,更新單元進(jìn)一步配置用于:刪除用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)。
在一些實(shí)施例中,獲取模塊包括:第一獲取子模塊,配置用于獲取用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)以及語(yǔ)音數(shù)據(jù)的相關(guān)信息,其中,相關(guān)信息包括語(yǔ)音數(shù)據(jù)的輸入時(shí)間點(diǎn);第一刪除子模塊,配置用于刪除輸入時(shí)間點(diǎn)早于預(yù)設(shè)的時(shí)間分割點(diǎn)的語(yǔ)音數(shù)據(jù),并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)。
在一些實(shí)施例中,獲取模塊包括:生成子模塊,配置用于利用聚類算法對(duì)用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)進(jìn)行聚類,生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇;第二獲取子模塊,配置用于獲取各個(gè)簇的中心點(diǎn);計(jì)算子模塊,配置用于利用距離算法計(jì)算每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)與每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)所在簇的中心點(diǎn)的距離;第二刪除子模塊,配置用于刪除距離大于預(yù)設(shè)的距離閾值的語(yǔ)音數(shù)據(jù),并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)。
在一些實(shí)施例中,相關(guān)信息還包括以下至少一項(xiàng):語(yǔ)音數(shù)據(jù)的采集設(shè)備類型、語(yǔ)音數(shù)據(jù)的輸入地點(diǎn);以及裝置還包括:第一獲取單元,配置用于獲取各個(gè)簇中的語(yǔ)音數(shù)據(jù)以及各個(gè)簇中的語(yǔ)音數(shù)據(jù)的相關(guān)信息;重新生成單元,配置用于利用各個(gè)簇的語(yǔ)音數(shù)據(jù)重新生成用戶的各個(gè)注冊(cè)聲紋向量,并根據(jù)各個(gè)簇的語(yǔ)音數(shù)據(jù)的相關(guān)信息生成各個(gè)注冊(cè)聲紋向量的相關(guān)信息。
在一些實(shí)施例中,該裝置還包括:第二獲取單元,配置用于獲取語(yǔ)音數(shù)據(jù)的相關(guān)信息;以及匹配單元包括:選擇模塊,配置用于根據(jù)語(yǔ)音數(shù)據(jù)的相關(guān)信息與各個(gè)注冊(cè)聲紋向量的相關(guān)信息的匹配度,選擇注冊(cè)聲紋向量;匹配模塊,配置用于將聲紋特征向量與選擇的注冊(cè)聲紋向量進(jìn)行匹配。
在一些實(shí)施例中,該裝置還包括:第二確定單元,配置用于確定所述匹配度是否大于等于預(yù)設(shè)的通過(guò)閾值;執(zhí)行單元,配置用于響應(yīng)于確定出所述匹配度大于等于預(yù)設(shè)的通過(guò)閾值,則確定用戶身份驗(yàn)證通過(guò)并執(zhí)行與驗(yàn)證通過(guò)相對(duì)應(yīng)的操作。
本申請(qǐng)?zhí)峁┑挠糜谔幚碚Z(yǔ)音數(shù)據(jù)的方法和裝置,通過(guò)提取用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)中的聲紋特征向量,并將聲紋特征向量與預(yù)先生成的該用戶的注冊(cè)聲紋向量進(jìn)行匹配,當(dāng)匹配度大于等于預(yù)設(shè)的更新閾值時(shí),則利用該聲紋特征向量和該語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量,從而有效利用了用戶的語(yǔ)音數(shù)據(jù),提高了用戶的注冊(cè)聲紋向量的準(zhǔn)確度。
附圖說(shuō)明
通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本申請(qǐng)的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
圖1是本申請(qǐng)可以應(yīng)用于其中的示例性系統(tǒng)架構(gòu)圖;
圖2是根據(jù)本申請(qǐng)的用于處理語(yǔ)音數(shù)據(jù)的方法的一個(gè)實(shí)施例的流程圖;
圖3是本申請(qǐng)的圖2步驟203中的用戶的注冊(cè)聲紋向量的生成方法的一種實(shí)現(xiàn)方式的流程圖;
圖4是根據(jù)本申請(qǐng)的用于處理語(yǔ)音數(shù)據(jù)的方法的又一個(gè)實(shí)施例的流程圖;
圖5是根據(jù)本申請(qǐng)的用于處理語(yǔ)音數(shù)據(jù)的裝置的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
圖6是適于用來(lái)實(shí)現(xiàn)本申請(qǐng)實(shí)施例的服務(wù)器的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本申請(qǐng)作進(jìn)一步的詳細(xì)說(shuō)明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋相關(guān)發(fā)明,而非對(duì)該發(fā)明的限定。另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本申請(qǐng)。
圖1示出了可以應(yīng)用本申請(qǐng)的用于處理語(yǔ)音數(shù)據(jù)的方法或用于處理語(yǔ)音數(shù)據(jù)的裝置的實(shí)施例的示例性系統(tǒng)架構(gòu)100。
如圖1所示,系統(tǒng)架構(gòu)100可以包括終端設(shè)備101、102、103,網(wǎng)絡(luò)104和服務(wù)器105、106。網(wǎng)絡(luò)104用以在終端設(shè)備101、102、103和服務(wù)器105、106之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)104可以包括各種連接類型,例如有線、無(wú)線通信鏈路或者光纖電纜等等。
用戶110可以使用終端設(shè)備101、102、103通過(guò)網(wǎng)絡(luò)104與服務(wù)器105、106交互,以接收或發(fā)送消息等。終端設(shè)備101、102、103上可以安裝有各種通訊客戶端應(yīng)用,例如購(gòu)物類應(yīng)用、搜索類應(yīng)用、網(wǎng)頁(yè)瀏覽器應(yīng)用、即時(shí)通信工具、郵箱客戶端、社交平臺(tái)軟件、支付軟件等。
終端設(shè)備101、102、103可以是具有顯示屏并且支持?jǐn)?shù)據(jù)接收與發(fā)送,以及攜帶麥克風(fēng)的各種電子設(shè)備,包括但不限于智能手機(jī)、平板電腦、智能手表、膝上型便攜計(jì)算機(jī)和臺(tái)式計(jì)算機(jī)等等。
服務(wù)器105、106可以是提供各種服務(wù)的服務(wù)器,例如對(duì)終端設(shè)備101、102、103上發(fā)送的語(yǔ)音數(shù)據(jù)提供支持的后臺(tái)服務(wù)器。后臺(tái)服務(wù)器可以對(duì)接收到的語(yǔ)音數(shù)據(jù)等數(shù)據(jù)進(jìn)行分析等處理,并將處理結(jié)果(例如登陸成功頁(yè)面或登陸失敗頁(yè)面)反饋給終端設(shè)備。
需要說(shuō)明的是,本申請(qǐng)實(shí)施例所提供的用于處理語(yǔ)音數(shù)據(jù)的方法一般由服務(wù)器105、106執(zhí)行,相應(yīng)地,用于處理語(yǔ)音數(shù)據(jù)的裝置一般設(shè)置于服務(wù)器105、106中。
應(yīng)該理解,圖1中的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器的數(shù)目?jī)H僅是示意性的。根據(jù)實(shí)現(xiàn)需要,可以具有任意數(shù)目的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器。
繼續(xù)參考圖2,示出了根據(jù)本申請(qǐng)的用于處理語(yǔ)音數(shù)據(jù)的方法的一個(gè)實(shí)施例的流程200。所述的用于處理語(yǔ)音數(shù)據(jù)的方法,包括以下步驟:
步驟201,接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)。
在本實(shí)施例中,用于處理語(yǔ)音數(shù)據(jù)的方法運(yùn)行于其上的電子設(shè)備(例如圖1所示的服務(wù)器)可以通過(guò)有線連接方式或者無(wú)線連接方式從用戶利用其進(jìn)行用戶身份驗(yàn)證的終端接收語(yǔ)音數(shù)據(jù),其中,上述語(yǔ)音數(shù)據(jù)可以是用戶根據(jù)上述電子設(shè)備生成的字符串進(jìn)行朗讀而生成的朗讀信息,上述字符串可以是上述電子設(shè)備隨機(jī)生成的字符串,也可以是上述用戶在注冊(cè)用于驗(yàn)證身份的系統(tǒng)賬號(hào)時(shí)所選擇的字符串集合中的字符串。需要指出的是,上述無(wú)線連接方式可以包括但不限于3G/4G連接、WiFi連接、藍(lán)牙連接、WiMAX連接、Zigbee連接、UWB(ultra wideband)連接、以及其他現(xiàn)在已知或?qū)?lái)開(kāi)發(fā)的無(wú)線連接方式。
步驟202,提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量。
在本實(shí)施例中,上述電子設(shè)備可以提取步驟201中接收到的語(yǔ)音數(shù)據(jù)中的聲紋特征向量。聲紋是用電聲學(xué)儀器顯示的攜帶言語(yǔ)信息的聲波頻譜?,F(xiàn)代科學(xué)研究表明,聲紋不僅具有特定性,而且有相對(duì)穩(wěn)定性的特點(diǎn)。聲紋特征向量可以是標(biāo)識(shí)用戶的聲紋頻譜特征的向量。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備可以將上述語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型(Universal Background Model,UBM)中進(jìn)行映射得到中間向量,然后,將上述中間向量進(jìn)行特征變換得到聲紋特征向量。當(dāng)驗(yàn)證用戶身份通過(guò)或不通過(guò)時(shí),與其他偏重個(gè)體特定性的模型相比,上述全局背景模型是一個(gè)在生物識(shí)別驗(yàn)證系統(tǒng)中偏重一般性且個(gè)體通用性的模型,例如,在用戶語(yǔ)音驗(yàn)證系統(tǒng)中,上述全局背景模型是一個(gè)由性別均衡的不同說(shuō)話者的大量語(yǔ)音樣本訓(xùn)練得出的、且與說(shuō)話者不相關(guān)的高斯混合模型(Gaussian Mixture Model,GMM),上述全局背景模型可以用來(lái)表征語(yǔ)音數(shù)據(jù)與中間向量的對(duì)應(yīng)關(guān)系??梢酝ㄟ^(guò)聯(lián)合因子分析方法(Joint Factor Analysis,JFA)對(duì)上述中間向量進(jìn)行特征變換得到聲紋特征向量,上述聯(lián)合因子分析方法是聲紋認(rèn)證算法中針對(duì)信道補(bǔ)償?shù)挠行惴?,它通過(guò)假設(shè)說(shuō)話人空間和信道空間是獨(dú)立的,并可以分別用兩個(gè)低維因子空間進(jìn)行描述,從而估計(jì)信道因子;也可以通過(guò)概率線性判別分析算法(Probabilistic Linear Discriminant Analysis,PLDA)對(duì)上述中間向量進(jìn)行特征變換得到聲紋特征向量,上述概率線性判別分析算法也是一種信道補(bǔ)償算法,是概率形式的線性判別分析算法(Linear Discriminant Analysis,LDA);還可以通過(guò)辨識(shí)矢量(Identifying Vector,I-Vector)對(duì)上述中間向量進(jìn)行特征變換得到聲紋特征向量。
步驟203,將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配,并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度。
在本實(shí)施例中,上述電子設(shè)備可以將上述步驟202中提取的聲紋特征向量與預(yù)先存儲(chǔ)的上述用戶的注冊(cè)聲紋向量進(jìn)行匹配,并生成上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度。上述預(yù)先存儲(chǔ)的的注冊(cè)聲紋向量可以是預(yù)先生成的注冊(cè)聲紋向量,也可以是更新之后的注冊(cè)聲紋向量。上述注冊(cè)聲紋向量可以是上述電子設(shè)備自身生成的,也可以是上述電子設(shè)備從其它已經(jīng)生成上述用戶的注冊(cè)聲紋向量的設(shè)備上獲取到的。當(dāng)提取出上述用戶語(yǔ)音數(shù)據(jù)中的聲紋特征向量之后,上述電子設(shè)備可以首先檢測(cè)設(shè)備本身是否已存儲(chǔ)上述用戶的注冊(cè)聲紋向量;若檢測(cè)到設(shè)備本身存儲(chǔ)了上述用戶的注冊(cè)聲紋向量,則將上述聲紋特征向量與該注冊(cè)聲紋向量進(jìn)行匹配,若沒(méi)有檢測(cè)到設(shè)備本身中存儲(chǔ)了上述用戶的注冊(cè)聲紋向量,則向其它設(shè)備發(fā)送獲取上述用戶的注冊(cè)聲紋向量的請(qǐng)求;若接收到其它設(shè)備發(fā)送的上述用戶的注冊(cè)聲紋向量,則將上述聲紋特征向量與該注冊(cè)聲紋向量進(jìn)行匹配,若沒(méi)有接收到其它設(shè)備發(fā)送的上述用戶的注冊(cè)聲紋向量,則上述電子設(shè)備根據(jù)用戶注冊(cè)時(shí)輸入的多條語(yǔ)音數(shù)據(jù)生成該用戶的注冊(cè)聲紋向量。計(jì)算上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度時(shí),可以采用曼哈頓距離(Manhattan Distance)進(jìn)行計(jì)算,也可以采用閔可夫斯基距離(Minkowski Distance)進(jìn)行計(jì)算,還可以采用余弦相似度(Cosine Similarity)進(jìn)行計(jì)算。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述相關(guān)信息可以包括語(yǔ)音數(shù)據(jù)的采集設(shè)備類型,例如,手機(jī)、電腦和智能手表等等,上述相關(guān)信息還可以包括語(yǔ)音數(shù)據(jù)的輸入地點(diǎn),可以按照外界環(huán)境噪聲的大小將輸入地點(diǎn)劃分為噪聲大的場(chǎng)所,例如,地鐵、商場(chǎng)、娛樂(lè)場(chǎng)所等,和噪聲大的場(chǎng)所,例如圖書(shū)館、教室等。上述電子設(shè)備可以利用聚類算法對(duì)上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)進(jìn)行聚類,生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇,之后,可以獲取各個(gè)簇中的語(yǔ)音數(shù)據(jù)以及該語(yǔ)音數(shù)據(jù)的相關(guān)信息,然后,可以利用各個(gè)簇的語(yǔ)音數(shù)據(jù)重新生成上述用戶的各個(gè)注冊(cè)聲紋向量,并根據(jù)上述各個(gè)簇的語(yǔ)音數(shù)據(jù)的相關(guān)信息生成各個(gè)注冊(cè)聲紋向量的相關(guān)信息。上述簇也可稱之為簇類,是指由類似的對(duì)象組成的多個(gè)類,由聚類所生成的簇是一組數(shù)據(jù)對(duì)象的集合,這些對(duì)象與同一簇中的對(duì)象彼此相似,與其他簇中的對(duì)象相異。作為示例,一個(gè)簇中的輸入地點(diǎn)為噪聲大的場(chǎng)所的語(yǔ)音數(shù)據(jù)的數(shù)量占該簇中所有語(yǔ)音數(shù)據(jù)的數(shù)量的比例為80%,則可以將利用該簇的語(yǔ)音數(shù)據(jù)生成的注冊(cè)聲紋向量的相關(guān)信息中的輸入地點(diǎn)信息設(shè)置為噪聲大的場(chǎng)所。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備在處理語(yǔ)音數(shù)據(jù)時(shí),還可以獲取語(yǔ)音數(shù)據(jù)的相關(guān)信息;之后,根據(jù)上述語(yǔ)音數(shù)據(jù)的相關(guān)信息與上述用戶的各個(gè)注冊(cè)聲紋向量的相關(guān)信息的匹配度,選擇注冊(cè)聲紋向量,例如,當(dāng)獲取到語(yǔ)音數(shù)據(jù)的輸入地點(diǎn)為酒吧時(shí),則可以選擇相關(guān)信息中包含噪聲大的場(chǎng)所的注冊(cè)聲紋向量,當(dāng)獲取到語(yǔ)音數(shù)據(jù)的采集設(shè)備為智能手表時(shí),則可以選擇相關(guān)信息中包含智能手表的注冊(cè)聲紋向量;最后,將該聲紋特征向量與所選擇的注冊(cè)聲紋向量進(jìn)行匹配,得到匹配結(jié)果。
步驟204,確定匹配度是否大于等于預(yù)設(shè)的更新閾值。
在本實(shí)施例中,上述電子設(shè)備可以將步驟203中生成的匹配度與預(yù)設(shè)的更新閾值進(jìn)行比較,確定上述匹配度是否大于或等于上述更新閾值,其中,上述更新閾值是動(dòng)態(tài)的,且個(gè)性化的,用戶不同,用戶所對(duì)應(yīng)的更新閾值也不同,上述更新閾值的設(shè)置是為了將預(yù)設(shè)比例的語(yǔ)音數(shù)據(jù)和聲紋特征向量進(jìn)行存儲(chǔ),以供上述電子設(shè)備根據(jù)存儲(chǔ)的語(yǔ)音數(shù)據(jù)和聲紋特征向量更新用戶的注冊(cè)聲紋向量,例如,當(dāng)預(yù)設(shè)比例為80%時(shí),則上述更新閾值可以使得占用戶總輸入的語(yǔ)音數(shù)據(jù)的80%的語(yǔ)音數(shù)據(jù)被存儲(chǔ)。
步驟205,響應(yīng)于確定出匹配度大于等于預(yù)設(shè)的更新閾值,則利用聲紋特征向量和語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量。
在本實(shí)施例中,當(dāng)確定出上述匹配度大于或等于預(yù)設(shè)的更新閾值,則上述電子設(shè)備可以利用步驟201接收的語(yǔ)音數(shù)據(jù)和步驟202提取出的聲紋特征向量更新上述用戶的注冊(cè)聲紋向量。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,當(dāng)確定出上述匹配度大于或等于預(yù)設(shè)的通過(guò)閾值,則上述電子設(shè)備可以確定上述用戶身份驗(yàn)證通過(guò),并執(zhí)行與驗(yàn)證通過(guò)相對(duì)應(yīng)的操作,例如,當(dāng)用戶在進(jìn)行登錄網(wǎng)站時(shí)的身份驗(yàn)證時(shí),可以向上述用戶返回登錄成功的頁(yè)面;當(dāng)用戶在進(jìn)行密碼鎖的解鎖操作時(shí),可以解開(kāi)密碼鎖。
本申請(qǐng)的上述實(shí)施例提供的方法通過(guò)將用戶語(yǔ)音數(shù)據(jù)中的聲紋特征向量與該用戶的注冊(cè)聲紋向量進(jìn)行匹配,并利用匹配度大于等于更新閾值的語(yǔ)音數(shù)據(jù)和聲紋特征向量來(lái)更新用戶的注冊(cè)聲紋向量,從而提高了用戶的注冊(cè)聲紋向量的準(zhǔn)確度。
繼續(xù)參見(jiàn)圖3,圖3是圖2步驟203中的用戶的注冊(cè)聲紋向量的生成方法的一種實(shí)現(xiàn)方式的流程300。該生成用戶的注冊(cè)聲紋向量的流程300,包括以下步驟:
步驟301,獲取用戶輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)。
在本實(shí)施例中,用于處理語(yǔ)音數(shù)據(jù)的方法運(yùn)行于其上的電子設(shè)備(例如圖1所示的服務(wù)器)可以獲取用戶在注冊(cè)用于驗(yàn)證身份的系統(tǒng)賬號(hào)時(shí)輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù),其中,上述注冊(cè)語(yǔ)音數(shù)據(jù)可以是用戶根據(jù)上述電子設(shè)備生成的字符串進(jìn)行朗讀而生成的朗讀信息,上述字符串可以是上述電子設(shè)備隨機(jī)生成的字符串,也可以是上述用戶在字符串集合中選擇的字符串。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備可以獲取上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)以及該語(yǔ)音數(shù)據(jù)的相關(guān)信息,其中,上述相關(guān)信息包括語(yǔ)音數(shù)據(jù)的輸入時(shí)間點(diǎn);之后,可以刪除上述輸入時(shí)間點(diǎn)早于預(yù)設(shè)的時(shí)間分割點(diǎn)的語(yǔ)音數(shù)據(jù),并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù),并利用該注冊(cè)語(yǔ)音數(shù)據(jù)生成注冊(cè)聲紋向量。作為示例,當(dāng)預(yù)設(shè)的時(shí)間分割點(diǎn)為2016年6月1日,則將輸入時(shí)間點(diǎn)早于2016年6月1日的數(shù)據(jù)刪除。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備可以首先利用聚類算法對(duì)上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)進(jìn)行聚類,生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇,其中,上述聚類算法可以包括基于劃分聚類算法(例如k-means算法)、基于層次聚類算法(例如利用層次方法的平衡迭代規(guī)約和聚類(Balanced Iterative Reducing and Clustering Using Hierarchies,BIRCH))和基于密度聚類算法(例如DBSCAN算法)等;之后,上述電子設(shè)備可以獲取各個(gè)簇的中心點(diǎn),以k-means算法為例,在給定K值和K個(gè)簇的初始中心點(diǎn)的情況下,把每個(gè)點(diǎn)分到離其最近的中心點(diǎn)所代表的簇中,當(dāng)所有點(diǎn)分配完畢后,對(duì)一個(gè)簇中的所有點(diǎn)重新計(jì)算(例如計(jì)算平均值)得到該簇的中心點(diǎn),然后再迭代的進(jìn)行分配點(diǎn)和更新簇的中心點(diǎn)的步驟,直至簇的中心點(diǎn)的變化很小,或者達(dá)到指定的迭代次數(shù),再獲取各個(gè)簇中的中心點(diǎn);然后,可以利用距離算法計(jì)算每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)與每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)所在簇的中心點(diǎn)的距離,其中,上述距離算法可以包括歐式距離算法;最后,可以將上述距離大于預(yù)設(shè)的距離閾值的語(yǔ)音數(shù)據(jù)刪除,并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù),并利用該注冊(cè)語(yǔ)音數(shù)據(jù)生成注冊(cè)聲紋向量。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述電子設(shè)備也可以將語(yǔ)音數(shù)據(jù)輸入時(shí)間點(diǎn)早于預(yù)設(shè)的時(shí)間分割點(diǎn)的語(yǔ)音數(shù)據(jù)以及上述距離大于預(yù)設(shè)的距離閾值的語(yǔ)音數(shù)據(jù)均刪除,并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù),并利用該注冊(cè)語(yǔ)音數(shù)據(jù)生成注冊(cè)聲紋向量。
步驟302,將預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量。
在本實(shí)施例中,上述電子設(shè)備可以將上述預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量。上述全局背景模型是一個(gè)由性別均衡的不同說(shuō)話者的大量語(yǔ)音樣本訓(xùn)練得出的、且與說(shuō)話者不相關(guān)的高斯混合模型,上述全局背景模型可以用來(lái)表征語(yǔ)音數(shù)據(jù)與中間向量的對(duì)應(yīng)關(guān)系。
步驟303,對(duì)預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量進(jìn)行特征變換得到預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量。
在本實(shí)施例中,上述電子設(shè)備可以通過(guò)聯(lián)合因子分析方法、概率線性判別分析算法和辨識(shí)矢量等算法對(duì)上述預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量進(jìn)行特征變換得到預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量。
步驟304,對(duì)預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量進(jìn)行融合,生成用戶的注冊(cè)聲紋向量。
在本實(shí)施例中,上述電子設(shè)備可以對(duì)上述預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量進(jìn)行融合,生成上述用戶的注冊(cè)聲紋向量。例如,用戶甲在注冊(cè)過(guò)程中輸入了K個(gè)注冊(cè)語(yǔ)音數(shù)據(jù),可以提取出K個(gè)注冊(cè)聲紋特征向量,可以通過(guò)下述的公式1對(duì)上述K個(gè)注冊(cè)聲紋特征向量進(jìn)行融合得到上述用戶的注冊(cè)聲紋向量。
其中,V為用戶的注冊(cè)聲紋向量,K為注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量,vi為用戶輸入的第i個(gè)注冊(cè)聲紋特征向量,norm(vi)為對(duì)vi進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化(長(zhǎng)度歸一化)操作,為對(duì)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化(長(zhǎng)度歸一化)操作。
本申請(qǐng)的上述生成用戶的注冊(cè)聲紋向量方法通過(guò)對(duì)用戶的注冊(cè)語(yǔ)音數(shù)據(jù)進(jìn)行映射,特征變換以及融合等處理,生成該用戶的注冊(cè)聲紋向量,從而以該注冊(cè)聲紋向量為基準(zhǔn),確定該用戶的身份驗(yàn)證結(jié)果,實(shí)現(xiàn)了準(zhǔn)確的用戶身份識(shí)別。
進(jìn)一步參考圖4,其示出了用于處理語(yǔ)音數(shù)據(jù)的方法的又一個(gè)實(shí)施例的流程400。該用于處理語(yǔ)音數(shù)據(jù)的方法的流程400,包括以下步驟:
步驟401,接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)。
在本實(shí)施例中,用于處理語(yǔ)音數(shù)據(jù)的方法運(yùn)行于其上的電子設(shè)備(例如圖1所示的服務(wù)器)可以通過(guò)有線連接方式或者無(wú)線連接方式從用戶利用其進(jìn)行用戶身份驗(yàn)證的終端接收語(yǔ)音數(shù)據(jù),其中,上述語(yǔ)音數(shù)據(jù)可以是用戶根據(jù)上述電子設(shè)備生成的字符串進(jìn)行朗讀而生成的朗讀信息,上述字符串可以是上述電子設(shè)備隨機(jī)生成的字符串,也可以是上述用戶在注冊(cè)用于驗(yàn)證身份的系統(tǒng)賬號(hào)時(shí)所選擇的字符串集合中的字符串。
步驟402,提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量。
在本實(shí)施例中,上述電子設(shè)備可以提取步驟401中接收到的語(yǔ)音數(shù)據(jù)中的聲紋特征向量。聲紋是用電聲學(xué)儀器顯示的攜帶言語(yǔ)信息的聲波頻譜?,F(xiàn)代科學(xué)研究表明,聲紋不僅具有特定性,而且有相對(duì)穩(wěn)定性的特點(diǎn)。聲紋特征向量可以是標(biāo)識(shí)用戶的聲紋頻譜特征的向量。
步驟403,將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配,并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度。
在本實(shí)施例中,上述電子設(shè)備可以將上述步驟402中提取的聲紋特征向量與預(yù)先存儲(chǔ)的上述用戶的注冊(cè)聲紋向量進(jìn)行匹配,并生成上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度。上述預(yù)先存儲(chǔ)的的注冊(cè)聲紋向量可以是預(yù)先生成的注冊(cè)聲紋向量,也可以是更新之后的注冊(cè)聲紋向量。上述注冊(cè)聲紋向量可以是上述電子設(shè)備自身生成的,也可以是上述電子設(shè)備從其它已經(jīng)生成上述用戶的注冊(cè)聲紋向量的設(shè)備上獲取到的??梢圆捎寐D距離、閔可夫斯基距離和余弦相似度等計(jì)算上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度。
步驟404,確定匹配度是否大于等于預(yù)設(shè)的更新閾值。
在本實(shí)施例中,上述電子設(shè)備可以將步驟403中生成的匹配度與預(yù)設(shè)的更新閾值進(jìn)行比較,確定上述匹配度是否大于或等于上述更新閾值,其中,上述更新閾值是動(dòng)態(tài)的,且個(gè)性化的,用戶不同,用戶所對(duì)應(yīng)的更新閾值也不同,上述更新閾值的設(shè)置是為了將預(yù)設(shè)比例的語(yǔ)音數(shù)據(jù)和聲紋特征向量進(jìn)行存儲(chǔ),以供上述電子設(shè)備根據(jù)存儲(chǔ)的語(yǔ)音數(shù)據(jù)和聲紋特征向量更新用戶的注冊(cè)聲紋向量,例如,當(dāng)預(yù)設(shè)比例為90%時(shí),則上述更新閾值可以使得占用戶總輸入的語(yǔ)音數(shù)據(jù)的90%的語(yǔ)音數(shù)據(jù)被存儲(chǔ)。
在本實(shí)施例中,上述電子設(shè)備可以針對(duì)用戶的各個(gè)注冊(cè)聲紋向量,為每個(gè)注冊(cè)聲紋向量設(shè)置不同的更新閾值。當(dāng)將聲紋特征向量與所選擇的注冊(cè)聲紋向量進(jìn)行匹配,可以將得到的匹配度與所選擇的注冊(cè)聲紋向量所對(duì)應(yīng)的更新閾值進(jìn)行比較,其中,所述注冊(cè)聲紋向量與所述更新閾值是一一對(duì)應(yīng)的。
步驟405,響應(yīng)于確定出匹配度大于等于預(yù)設(shè)的更新閾值,則獲取用戶輸入的注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和用戶已存儲(chǔ)的各個(gè)聲紋特征向量。
在本實(shí)施例中,當(dāng)確定出上述匹配度大于或等于預(yù)設(shè)的更新閾值時(shí),則上述電子設(shè)備可以獲取用戶輸入的注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和用戶已存儲(chǔ)的各個(gè)聲紋特征向量。當(dāng)確定出上述匹配度大于或等于預(yù)設(shè)的更新閾值之后,上述電子設(shè)備可以首先獲取用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量,也可以獲取狀態(tài)標(biāo)記為未使用的語(yǔ)音數(shù)據(jù)的數(shù)量;之后,確定獲取到的數(shù)量是否大于預(yù)設(shè)的數(shù)量閾值,其中,上述數(shù)量閾值可以是預(yù)先設(shè)置的以供當(dāng)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量大于數(shù)量閾值時(shí)對(duì)上述注冊(cè)聲紋向量進(jìn)行更新,若大于預(yù)設(shè)的數(shù)量閾值時(shí),或者當(dāng)?shù)竭_(dá)預(yù)設(shè)的時(shí)間點(diǎn)時(shí),上述電子設(shè)備可以獲取上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和上述用戶已存儲(chǔ)的各個(gè)聲紋特征向量。
步驟406,對(duì)用戶已存儲(chǔ)的各個(gè)聲紋特征向量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算,并對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算后的向量進(jìn)行求和運(yùn)算,得到用戶已存儲(chǔ)的聲紋特征向量之和。
在本實(shí)施例中,上述電子設(shè)備可以對(duì)上述用戶已存儲(chǔ)的各個(gè)聲紋特征向量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算(或長(zhǎng)度歸一化運(yùn)算),并對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算后的向量進(jìn)行求和運(yùn)算,得到上述用戶已存儲(chǔ)的聲紋特征向量之和,其中,數(shù)據(jù)標(biāo)準(zhǔn)化處理主要包括數(shù)據(jù)同趨化處理和無(wú)量綱化處理兩個(gè)方面。數(shù)據(jù)同趨化處理主要解決不同性質(zhì)數(shù)據(jù)問(wèn)題,對(duì)不同性質(zhì)指標(biāo)直接加總不能正確反映不同作用力的綜合結(jié)果,須先考慮改變逆指標(biāo)數(shù)據(jù)性質(zhì),使所有指標(biāo)對(duì)測(cè)評(píng)方案的作用力同趨化,再加總才能得出正確結(jié)果。數(shù)據(jù)無(wú)量綱化處理主要解決數(shù)據(jù)的可比性。數(shù)據(jù)標(biāo)準(zhǔn)化的方法有很多種,常用的有“最小—最大標(biāo)準(zhǔn)化”、“Z-score標(biāo)準(zhǔn)化”和“按小數(shù)定標(biāo)標(biāo)準(zhǔn)化”等。
步驟407,利用注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量乘以注冊(cè)聲紋向量,得到注冊(cè)聲紋向量之積。
在本實(shí)施例中,上述電子設(shè)備可以利用上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量乘以上述注冊(cè)聲紋向量,得到注冊(cè)聲紋向量之積。
步驟408,計(jì)算聲紋特征向量之和與注冊(cè)聲紋向量之積的向量和,并計(jì)算用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量與注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量的數(shù)量和,利用向量和除以數(shù)量和得到更新的注冊(cè)聲紋向量。
在本實(shí)施例中,上述電子設(shè)備可以計(jì)算上述步驟409得到的上述聲紋特征向量之和與上述步驟410得到的注冊(cè)聲紋向量之積的向量和,并計(jì)算上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量與上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量的數(shù)量和,利用上述向量和除以上述數(shù)量和得到更新的注冊(cè)聲紋向量。具體地,可以通過(guò)下述公式2得到更新的注冊(cè)聲紋向量。
其中,Vnew為更新的注冊(cè)聲紋向量,n為注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量,V為注冊(cè)聲紋向量,K為已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量,vi為第i個(gè)已存儲(chǔ)的聲紋特征向量,norm(vi)為對(duì)vi進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化(長(zhǎng)度歸一化)操作。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,當(dāng)公式2中的K為1時(shí),則上述注冊(cè)聲紋向量可以進(jìn)行在線的實(shí)時(shí)更新。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,在注冊(cè)聲紋向量更新之后,上述電子設(shè)備可以將上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)刪除,或者將其狀態(tài)標(biāo)記為已使用,避免這些已使用的語(yǔ)音數(shù)據(jù)被反復(fù)用于更新。
從圖4中可以看出,與圖2對(duì)應(yīng)的實(shí)施例相比,本實(shí)施例中的用于處理語(yǔ)音數(shù)據(jù)的方法的流程400突出了對(duì)注冊(cè)聲紋向量進(jìn)行更新的具體步驟。由此,本實(shí)施例描述的方案可以利用用戶注冊(cè)時(shí)輸入的語(yǔ)音數(shù)據(jù)和匹配度大于等于預(yù)設(shè)的更新閾值的語(yǔ)音數(shù)據(jù)更新用戶的注冊(cè)聲紋向量,從而得到更準(zhǔn)確的注冊(cè)聲紋向量。
進(jìn)一步參考圖5,作為對(duì)上述各圖所示方法的實(shí)現(xiàn),本申請(qǐng)?zhí)峁┝艘环N用于處理語(yǔ)音數(shù)據(jù)的裝置的一個(gè)實(shí)施例,該裝置實(shí)施例與圖2所示的方法實(shí)施例相對(duì)應(yīng),該裝置具體可以應(yīng)用于各種電子設(shè)備中。如圖5所示,本實(shí)施例的用于處理語(yǔ)音數(shù)據(jù)的裝置500包括:接收單元501、提取單元502、匹配單元503、第一確定單元504和更新單元505。其中,接收單元501配置用于接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù);提取單元502配置用于提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量;匹配單元503配置用于將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配,并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度;第一確定單元504配置用于確定所述匹配度是否大于等于預(yù)設(shè)的更新閾值;更新單元505配置用于響應(yīng)于確定出所述匹配度大于等于預(yù)設(shè)的更新閾值,則利用所述聲紋特征向量和所述語(yǔ)音數(shù)據(jù)更新所述注冊(cè)聲紋向量。
在本實(shí)施例中,用于處理語(yǔ)音數(shù)據(jù)的裝置500的接收單元501可以通過(guò)有線連接方式或者無(wú)線連接方式從用戶利用其進(jìn)行用戶身份驗(yàn)證的終端接收語(yǔ)音數(shù)據(jù),其中,上述語(yǔ)音數(shù)據(jù)可以是用戶根據(jù)上述電子設(shè)備生成的字符串進(jìn)行朗讀而生成的朗讀信息,上述字符串可以是上述電子設(shè)備隨機(jī)生成的字符串,也可以是上述用戶在注冊(cè)用于驗(yàn)證身份的系統(tǒng)賬號(hào)時(shí)所選擇的字符串集合中的字符串。
在本實(shí)施例中,基于接收單元501接收的語(yǔ)音數(shù)據(jù),上述提取單元502可以提取上述語(yǔ)音數(shù)據(jù)中的聲紋特征向量。聲紋是用電聲學(xué)儀器顯示的攜帶言語(yǔ)信息的聲波頻譜?,F(xiàn)代科學(xué)研究表明,聲紋不僅具有特定性,而且有相對(duì)穩(wěn)定性的特點(diǎn)。聲紋特征向量可以是標(biāo)識(shí)用戶的聲紋頻譜特征的向量。
在本實(shí)施例中,基于提取單元502提取的聲紋特征向量,上述匹配單元503可以將上述聲紋特征向量與預(yù)先存儲(chǔ)的上述用戶的注冊(cè)聲紋向量進(jìn)行匹配,并生成上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度。上述預(yù)先存儲(chǔ)的的注冊(cè)聲紋向量可以是預(yù)先生成的注冊(cè)聲紋向量,也可以是更新之后的注冊(cè)聲紋向量。上述注冊(cè)聲紋向量可以是上述電子設(shè)備自身生成的,也可以是上述電子設(shè)備從其它已經(jīng)生成上述用戶的注冊(cè)聲紋向量的設(shè)備上獲取到的。上述匹配單元503可以采用曼哈頓距離、閔可夫斯基距離和余弦相似度計(jì)算上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度。
在本實(shí)施例中,基于匹配單元503生成的匹配度,上述第一確定單元504可以將上述匹配度與預(yù)設(shè)的更新閾值進(jìn)行比較,確定上述匹配度是否大于或等于上述更新閾值,其中,上述更新閾值是動(dòng)態(tài)的,且個(gè)性化的,用戶不同,用戶所對(duì)應(yīng)的更新閾值也不同,上述更新閾值的設(shè)置是為了將預(yù)設(shè)比例的語(yǔ)音數(shù)據(jù)和聲紋特征向量進(jìn)行存儲(chǔ),以供上述電子設(shè)備根據(jù)存儲(chǔ)的語(yǔ)音數(shù)據(jù)和聲紋特征向量更新用戶的注冊(cè)聲紋向量。
在本實(shí)施例中,當(dāng)確定出上述匹配度大于或等于預(yù)設(shè)的更新閾值,則上述更新單元505可以利用上述接收單元501接收的語(yǔ)音數(shù)據(jù)和上述提取單元502提取出的聲紋特征向量更新上述用戶的注冊(cè)聲紋向量。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述提取單元502可以包括映射模塊(圖中未示出)和變換模塊(圖中未示出)。其中,上述映射模塊可以將上述語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到中間向量,然后,上述變換模塊可以將上述中間向量進(jìn)行特征變換得到聲紋特征向量。在用戶語(yǔ)音驗(yàn)證系統(tǒng)中,上述全局背景模型是一個(gè)由性別均衡的不同說(shuō)話者的大量語(yǔ)音樣本訓(xùn)練得出的、且與說(shuō)話者不相關(guān)的高斯混合模型,上述全局背景模型可以用來(lái)表征語(yǔ)音數(shù)據(jù)與中間向量的對(duì)應(yīng)關(guān)系。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,用于處理語(yǔ)音數(shù)據(jù)的裝置500還可以包括生成單元(圖中未示出)。上述生成單元可以包括獲取模塊(圖中未示出),映射模塊(圖中未示出),變換模塊(圖中未示出)和融合模塊(圖中未示出)。其中,上述獲取模塊可以獲取用戶在注冊(cè)用于驗(yàn)證身份的系統(tǒng)賬號(hào)時(shí)輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù),其中,上述注冊(cè)語(yǔ)音數(shù)據(jù)可以是用戶根據(jù)上述電子設(shè)備生成的字符串進(jìn)行朗讀而生成的朗讀信息;上述映射模塊可以將上述預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量,上述全局背景模型是一個(gè)由性別均衡的不同說(shuō)話者的大量語(yǔ)音樣本訓(xùn)練得出的、且與說(shuō)話者不相關(guān)的高斯混合模型,上述全局背景模型可以用來(lái)表征語(yǔ)音數(shù)據(jù)與中間向量的對(duì)應(yīng)關(guān)系;上述變換模塊可以通過(guò)聯(lián)合因子分析方法、概率線性判別分析算法和辨識(shí)矢量等算法對(duì)上述預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量進(jìn)行特征變換得到預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量;上述融合模塊對(duì)上述預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量進(jìn)行融合,生成上述用戶的注冊(cè)聲紋向量。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述更新單元505還可以包括獲取模塊(圖中未示出)和更新模塊(圖中未示出)。其中,上述獲取模塊可以獲取上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和上述用戶已存儲(chǔ)的各個(gè)聲紋特征向量;上述更新模塊可以根據(jù)上述用戶已存儲(chǔ)的各個(gè)聲紋特征向量、上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量、上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和上述注冊(cè)聲紋向量,更新注冊(cè)聲紋向量。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述更新模塊可以包括第一計(jì)算子模塊(圖中未示出),第二計(jì)算子模塊(圖中未示出)和更新子模塊(圖中未示出)。其中,上述第一計(jì)算子模塊可以對(duì)上述用戶已存儲(chǔ)的各個(gè)聲紋特征向量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算,并對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算后的向量進(jìn)行求和運(yùn)算,得到上述用戶已存儲(chǔ)的聲紋特征向量之和;上述第二計(jì)算子模塊可以利用上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量乘以上述注冊(cè)聲紋向量,得到注冊(cè)聲紋向量之積;上述更新子模塊可以計(jì)算上述第一計(jì)算子模塊得到的上述聲紋特征向量之和與上述第二計(jì)算子模塊得到的注冊(cè)聲紋向量之積的向量和,并計(jì)算上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量與上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量的數(shù)量和,利用上述向量和除以上述數(shù)量和得到更新的注冊(cè)聲紋向量。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,在注冊(cè)聲紋向量更新之后,上述更新單元可以將上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)刪除,或者將其狀態(tài)標(biāo)記為已使用,避免這些已使用的語(yǔ)音數(shù)據(jù)被反復(fù)用于更新。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述獲取模塊可以包括第一獲取子模塊(圖中未示出)和第一刪除子模塊(圖中未示出)。其中,上述第一獲取子模塊可以獲取上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)以及該語(yǔ)音數(shù)據(jù)的相關(guān)信息,其中,上述相關(guān)信息包括語(yǔ)音數(shù)據(jù)的輸入時(shí)間點(diǎn);之后,上述第一刪除子模塊可以刪除上述輸入時(shí)間點(diǎn)早于預(yù)設(shè)的時(shí)間分割點(diǎn)的語(yǔ)音數(shù)據(jù),并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù),并利用該注冊(cè)語(yǔ)音數(shù)據(jù)生成注冊(cè)聲紋向量。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述獲取模塊還可以包括生成子模塊(圖中未示出),第二獲取子模塊(圖中未示出),計(jì)算子模塊(圖中未示出)和第二刪除子模塊(圖中未示出)。其中,上述生成子模塊可以利用聚類算法對(duì)上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)進(jìn)行聚類,生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇,其中,上述聚類算法可以包括基于劃分聚類算法、基于層次聚類算法和基于密度聚類算法等;之后,上述第二獲取子模塊可以獲取各個(gè)簇的中心點(diǎn),以k-means算法為例,在給定K值和K個(gè)簇的初始中心點(diǎn)的情況下,把每個(gè)點(diǎn)分到離其最近的中心點(diǎn)所代表的簇中,當(dāng)所有點(diǎn)分配完畢后,對(duì)一個(gè)簇中的所有點(diǎn)重新計(jì)算(例如計(jì)算平均值)得到該簇的中心點(diǎn),然后再迭代的進(jìn)行分配點(diǎn)和更新簇的中心點(diǎn)的步驟,直至簇的中心點(diǎn)的變化很小,或者達(dá)到指定的迭代次數(shù),再獲取各個(gè)簇中的中心點(diǎn);然后,上述計(jì)算子模塊可以利用距離算法計(jì)算每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)與每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)所在簇的中心點(diǎn)的距離,其中,上述距離算法可以包括歐式距離算法;最后,上述第二刪除子模塊可以將上述距離大于預(yù)設(shè)的距離閾值的語(yǔ)音數(shù)據(jù)刪除,并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù),并利用該注冊(cè)語(yǔ)音數(shù)據(jù)生成注冊(cè)聲紋向量。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述相關(guān)信息可以包括語(yǔ)音數(shù)據(jù)的采集設(shè)備類型,例如,手機(jī)、電腦和智能手表等等,上述相關(guān)信息還可以包括語(yǔ)音數(shù)據(jù)的輸入地點(diǎn),可以按照外界環(huán)境噪聲的大小將輸入地點(diǎn)劃分為噪聲大的場(chǎng)所,例如,地鐵、商場(chǎng)、娛樂(lè)場(chǎng)所等,和噪聲大的場(chǎng)所,例如圖書(shū)館、教室等。用于處理語(yǔ)音數(shù)據(jù)的裝置500還可以包括第一獲取單元(圖中未示出)和重新生成單元(圖中未示出)。其中,上述第一獲取單元可以獲取各個(gè)簇中的語(yǔ)音數(shù)據(jù)以及該語(yǔ)音數(shù)據(jù)的相關(guān)信息,之后,上述重新生成單元可以利用各個(gè)簇的語(yǔ)音數(shù)據(jù)重新生成上述用戶的各個(gè)注冊(cè)聲紋向量,并根據(jù)上述各個(gè)簇的語(yǔ)音數(shù)據(jù)的相關(guān)信息生成各個(gè)注冊(cè)聲紋向量的相關(guān)信息。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,用于處理語(yǔ)音數(shù)據(jù)的裝置500還可以包括第二獲取單元(圖中未示出),上述第二獲取單元在處理語(yǔ)音數(shù)據(jù)時(shí),還可以獲取語(yǔ)音數(shù)據(jù)的相關(guān)信息;上述匹配單元503可以包括選擇模塊(圖中未示出)和匹配模塊(圖中未示出),根據(jù)上述語(yǔ)音數(shù)據(jù)的相關(guān)信息與上述用戶的各個(gè)注冊(cè)聲紋向量的相關(guān)信息的匹配度,上述選擇模塊可以選擇注冊(cè)聲紋向量,例如,當(dāng)獲取到語(yǔ)音數(shù)據(jù)的輸入地點(diǎn)為酒吧時(shí),則可以選擇相關(guān)信息中包含噪聲大的場(chǎng)所的注冊(cè)聲紋向量,當(dāng)獲取到語(yǔ)音數(shù)據(jù)的采集設(shè)備為智能手表時(shí),則可以選擇相關(guān)信息中包含智能手表的注冊(cè)聲紋向量;最后,上述匹配模塊可以將該聲紋特征向量與所選擇的注冊(cè)聲紋向量進(jìn)行匹配,得到匹配結(jié)果。
在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,用于處理語(yǔ)音數(shù)據(jù)的裝置500還可以包括第二確定單元(圖中未示出)和執(zhí)行單元(圖中未示出)。其中,當(dāng)上述第二確定單元確定出上述匹配度大于或等于預(yù)設(shè)的通過(guò)閾值,則上述執(zhí)行單元可以確定上述用戶身份驗(yàn)證通過(guò),并執(zhí)行與驗(yàn)證通過(guò)相對(duì)應(yīng)的操作,例如,當(dāng)用戶在進(jìn)行登錄網(wǎng)站時(shí)的身份驗(yàn)證時(shí),可以向上述用戶返回登錄成功的頁(yè)面;當(dāng)用戶在進(jìn)行密碼鎖的解鎖操作時(shí),可以解開(kāi)密碼鎖。
下面參考圖6,其示出了適于用來(lái)實(shí)現(xiàn)本發(fā)明實(shí)施例的服務(wù)器的計(jì)算機(jī)系統(tǒng)600的結(jié)構(gòu)示意圖。
如圖6所示,計(jì)算機(jī)系統(tǒng)600包括中央處理單元(CPU)601,其可以根據(jù)存儲(chǔ)在只讀存儲(chǔ)器(ROM)602中的程序或者從存儲(chǔ)部分608加載到隨機(jī)訪問(wèn)存儲(chǔ)器(RAM)603中的程序而執(zhí)行各種適當(dāng)?shù)膭?dòng)作和處理。在RAM603中,還存儲(chǔ)有系統(tǒng)600操作所需的各種程序和數(shù)據(jù)。CPU601、ROM602以及RAM603通過(guò)總線604彼此相連。輸入/輸出(I/O)接口605也連接至總線604。
以下部件連接至I/O接口605:包括鍵盤(pán)、鼠標(biāo)等的輸入部分606;包括諸如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚(yáng)聲器等的輸出部分607;包括硬盤(pán)等的存儲(chǔ)部分608;以及包括諸如LAN卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分609。通信部分609經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動(dòng)器610也根據(jù)需要連接至I/O接口605??刹鹦督橘|(zhì)611,諸如磁盤(pán)、光盤(pán)、磁光盤(pán)、半導(dǎo)體存儲(chǔ)器等等,根據(jù)需要安裝在驅(qū)動(dòng)器610上,以便于從其上讀出的計(jì)算機(jī)程序根據(jù)需要被安裝入存儲(chǔ)部分608。
特別地,根據(jù)本公開(kāi)的實(shí)施例,上文參考流程圖描述的過(guò)程可以被實(shí)現(xiàn)為計(jì)算機(jī)軟件程序。例如,本公開(kāi)的實(shí)施例包括一種計(jì)算機(jī)程序產(chǎn)品,其包括有形地包含在機(jī)器可讀介質(zhì)上的計(jì)算機(jī)程序,上述計(jì)算機(jī)程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實(shí)施例中,該計(jì)算機(jī)程序可以通過(guò)通信部分609從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)611被安裝。
附圖中的流程圖和框圖,圖示了按照本發(fā)明各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段、或代碼的一部分,上述模塊、程序段、或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來(lái)實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。
描述于本發(fā)明實(shí)施例中所涉及到的單元可以通過(guò)軟件的方式實(shí)現(xiàn),也可以通過(guò)硬件的方式來(lái)實(shí)現(xiàn)。所描述的單元也可以設(shè)置在處理器中,例如,可以描述為:一種處理器包括接收單元、提取單元、匹配單元、第一確定單元和更新單元。其中,這些單元的名稱在某種情況下并不構(gòu)成對(duì)該單元本身的限定。例如,接收單元還可以被描述為“接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)的單元”。
作為另一方面,本發(fā)明還提供了一種非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì),該非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是上述實(shí)施例中上述裝置中所包含的非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì);也可以是單獨(dú)存在,未裝配入終端中的非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)。上述非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有一個(gè)或者多個(gè)程序,當(dāng)上述一個(gè)或者多個(gè)程序被一個(gè)設(shè)備執(zhí)行時(shí),使得上述設(shè)備:接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù);提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量;將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配,并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度;確定匹配度是否大于等于預(yù)設(shè)的更新閾值;響應(yīng)于確定出匹配度大于等于預(yù)設(shè)的更新閾值,則利用聲紋特征向量和語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量。
以上描述僅為本發(fā)明的較佳實(shí)施例以及對(duì)所運(yùn)用技術(shù)原理的說(shuō)明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本發(fā)明中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時(shí)也應(yīng)涵蓋在不脫離發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進(jìn)行任意組合而形成的其它技術(shù)方案。例如上述特征與本發(fā)明中公開(kāi)的(但不限于)具有類似功能的技術(shù)特征進(jìn)行互相替換而形成的技術(shù)方案。