用于處理語(yǔ)音數(shù)據(jù)的方法和裝置與流程

文檔序號(hào)：12475964閱讀：213來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域，具體涉及數(shù)據(jù)處理技術(shù)領(lǐng)域，尤其涉及用于處理語(yǔ)音數(shù)據(jù)的方法和裝置。

背景技術(shù)：

近年來(lái)，聲紋識(shí)別這種新興的生物識(shí)別手段因其安全便利性受到了很大關(guān)注。聲紋識(shí)別是基于不同人的發(fā)聲器官例如肺、氣管、聲帶、口腔、鼻腔、咽腔等在尺寸和形態(tài)方面存在的生理差異，利用每個(gè)人語(yǔ)音中包含的獨(dú)特信息，進(jìn)行個(gè)人身份的識(shí)別和驗(yàn)證。但是現(xiàn)實(shí)中，每個(gè)人的語(yǔ)音聲學(xué)特征并非絕對(duì)的、一成不變的，而是受到所處環(huán)境、使用設(shè)備等外界因素和個(gè)人身體狀況、情緒波動(dòng)、言語(yǔ)風(fēng)格變化等內(nèi)在因素等共同影響變化的。另外研究表明，人的語(yǔ)音聲學(xué)特征還會(huì)隨著年齡增長(zhǎng)而出現(xiàn)變化。因此，對(duì)用戶聲紋特征的動(dòng)態(tài)變化進(jìn)行追蹤，使得用戶的聲紋模型能根據(jù)新增聲音樣本進(jìn)行自適應(yīng)更新，這對(duì)于提升聲紋識(shí)別系統(tǒng)的性能具有至關(guān)重要的意義。

目前，對(duì)用戶進(jìn)行身份驗(yàn)證時(shí)通常使用的是根據(jù)用戶在注冊(cè)時(shí)輸入的語(yǔ)音數(shù)據(jù)所生成聲紋模型，但是這種模型不能進(jìn)行自適應(yīng)更新，隨著時(shí)間的推移，這種驗(yàn)證用戶身份的方法會(huì)導(dǎo)致驗(yàn)證結(jié)果不準(zhǔn)確。

技術(shù)實(shí)現(xiàn)要素：

本申請(qǐng)的目的在于提出一種改進(jìn)的用于處理語(yǔ)音數(shù)據(jù)的方法和裝置，來(lái)解決以上背景技術(shù)部分提到的技術(shù)問(wèn)題。

第一方面，本申請(qǐng)?zhí)峁┝艘环N用于處理語(yǔ)音數(shù)據(jù)的方法，該方法包括：接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)；提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量；將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配，并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度；確定匹配度是否大于等于預(yù)設(shè)的更新閾值；響應(yīng)于確定出匹配度大于等于的更新閾值，則利用聲紋特征向量和語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量。

在一些實(shí)施例中，提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量，包括：將語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到中間向量；將中間向量進(jìn)行特征變換得到聲紋特征向量。

在一些實(shí)施例中，在將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配之前，該方法還包括生成注冊(cè)聲紋向量的步驟，包括：獲取用戶輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)；將預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量；對(duì)預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量進(jìn)行特征變換得到預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量；對(duì)預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量進(jìn)行融合，生成用戶的注冊(cè)聲紋向量。

在一些實(shí)施例中，所述利用聲紋特征向量和語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量包括：獲取用戶輸入的注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和用戶已存儲(chǔ)的各個(gè)聲紋特征向量；根據(jù)用戶已存儲(chǔ)的各個(gè)聲紋特征向量、用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量、注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和注冊(cè)聲紋向量，更新注冊(cè)聲紋向量。

在一些實(shí)施例中，根據(jù)用戶已存儲(chǔ)的各個(gè)聲紋特征向量、用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量、注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和注冊(cè)聲紋向量，更新注冊(cè)聲紋向量，包括：對(duì)用戶已存儲(chǔ)的各個(gè)聲紋特征向量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算，并對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算后的向量進(jìn)行求和運(yùn)算，得到用戶已存儲(chǔ)的聲紋特征向量之和；利用注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量乘以注冊(cè)聲紋向量，得到注冊(cè)聲紋向量之積；計(jì)算聲紋特征向量之和與注冊(cè)聲紋向量之積的向量和，并計(jì)算用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量與注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量的數(shù)量和，利用向量和除以數(shù)量和得到更新的注冊(cè)聲紋向量。

在一些實(shí)施例中，在更新注冊(cè)聲紋向量之后，該方法包括：刪除用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)。

在一些實(shí)施例中，獲取用戶輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)，包括：獲取用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)以及語(yǔ)音數(shù)據(jù)的相關(guān)信息，其中，相關(guān)信息包括語(yǔ)音數(shù)據(jù)的輸入時(shí)間點(diǎn)；刪除輸入時(shí)間點(diǎn)早于預(yù)設(shè)的時(shí)間分割點(diǎn)的語(yǔ)音數(shù)據(jù)，并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)。

在一些實(shí)施例中，獲取用戶輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)，還包括：利用聚類算法對(duì)用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)進(jìn)行聚類，生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇；獲取各個(gè)簇的中心點(diǎn)；利用距離算法計(jì)算每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)與每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)所在簇的中心點(diǎn)的距離；刪除距離大于預(yù)設(shè)的距離閾值的語(yǔ)音數(shù)據(jù)，并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)。

在一些實(shí)施例中，相關(guān)信息還包括以下至少一項(xiàng)：語(yǔ)音數(shù)據(jù)的采集設(shè)備類型、語(yǔ)音數(shù)據(jù)的輸入地點(diǎn)；以及在生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇之后，方法還包括：獲取各個(gè)簇中的語(yǔ)音數(shù)據(jù)以及各個(gè)簇中的語(yǔ)音數(shù)據(jù)的相關(guān)信息；利用各個(gè)簇的語(yǔ)音數(shù)據(jù)重新生成用戶的各個(gè)注冊(cè)聲紋向量，并根據(jù)各個(gè)簇的語(yǔ)音數(shù)據(jù)的相關(guān)信息生成各個(gè)注冊(cè)聲紋向量的相關(guān)信息。

在一些實(shí)施例中，在接收用戶通過(guò)用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)之后，該方法還包括：獲取語(yǔ)音數(shù)據(jù)的相關(guān)信息；以及將聲紋特征向量與預(yù)先生成的用戶的注冊(cè)聲紋向量進(jìn)行匹配，包括：根據(jù)語(yǔ)音數(shù)據(jù)的相關(guān)信息與各個(gè)注冊(cè)聲紋向量的相關(guān)信息的匹配度，選擇注冊(cè)聲紋向量；將聲紋特征向量與選擇的注冊(cè)聲紋向量進(jìn)行匹配。

在一些實(shí)施例中，在所述生成所述聲紋特征向量與所述注冊(cè)聲紋向量之間的匹配度之后，所述方法還包括：確定所述匹配度是否大于等于預(yù)設(shè)的通過(guò)閾值；響應(yīng)于確定出所述匹配度大于等于預(yù)設(shè)的通過(guò)閾值，則確定用戶身份驗(yàn)證通過(guò)并執(zhí)行與驗(yàn)證通過(guò)相對(duì)應(yīng)的操作。

第二方面，本申請(qǐng)?zhí)峁┝艘环N用于處理語(yǔ)音數(shù)據(jù)的裝置，該裝置包括：接收單元，配置用于接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)；提取單元，配置用于提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量；匹配單元，配置用于將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配，并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度；第一確定單元，配置用于確定匹配度是否大于等于預(yù)設(shè)的更新閾值；更新單元，配置用于響應(yīng)于確定出匹配度大于等于預(yù)設(shè)的更新閾值，則利用聲紋特征向量和語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量。

在一些實(shí)施例中，提取單元包括：映射模塊，配置用于將語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到中間向量；變換模塊，配置用于將中間向量進(jìn)行特征變換得到聲紋特征向量。

在一些實(shí)施例中，該裝置還包括生成單元，包括：獲取模塊，配置用于獲取用戶輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)；映射模塊，配置用于將預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量；變換模塊，配置用于對(duì)預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量進(jìn)行特征變換得到預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量；融合模塊，配置用于對(duì)預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量進(jìn)行融合，生成用戶的注冊(cè)聲紋向量。

在一些實(shí)施例中，更新單元包括：獲取模塊，配置用于獲取用戶輸入的注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和用戶已存儲(chǔ)的各個(gè)聲紋特征向量；更新模塊，配置用于根據(jù)用戶已存儲(chǔ)的各個(gè)聲紋特征向量、用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量、注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和注冊(cè)聲紋向量，更新注冊(cè)聲紋向量。

在一些實(shí)施例中，更新模塊包括：第一計(jì)算子模塊，配置用于對(duì)用戶已存儲(chǔ)的各個(gè)聲紋特征向量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算，并對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算后的向量進(jìn)行求和運(yùn)算，得到用戶已存儲(chǔ)的聲紋特征向量之和；第二計(jì)算子模塊，配置用于利用注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量乘以注冊(cè)聲紋向量，得到注冊(cè)聲紋向量之積；更新子模塊，配置用于計(jì)算聲紋特征向量之和與注冊(cè)聲紋向量之積的向量和，并計(jì)算用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量與注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量的數(shù)量和，利用向量和除以數(shù)量和得到更新的注冊(cè)聲紋向量。

在一些實(shí)施例中，更新單元進(jìn)一步配置用于：刪除用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)。

在一些實(shí)施例中，獲取模塊包括：第一獲取子模塊，配置用于獲取用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)以及語(yǔ)音數(shù)據(jù)的相關(guān)信息，其中，相關(guān)信息包括語(yǔ)音數(shù)據(jù)的輸入時(shí)間點(diǎn)；第一刪除子模塊，配置用于刪除輸入時(shí)間點(diǎn)早于預(yù)設(shè)的時(shí)間分割點(diǎn)的語(yǔ)音數(shù)據(jù)，并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)。

在一些實(shí)施例中，獲取模塊包括：生成子模塊，配置用于利用聚類算法對(duì)用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)進(jìn)行聚類，生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇；第二獲取子模塊，配置用于獲取各個(gè)簇的中心點(diǎn)；計(jì)算子模塊，配置用于利用距離算法計(jì)算每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)與每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)所在簇的中心點(diǎn)的距離；第二刪除子模塊，配置用于刪除距離大于預(yù)設(shè)的距離閾值的語(yǔ)音數(shù)據(jù)，并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)。

在一些實(shí)施例中，相關(guān)信息還包括以下至少一項(xiàng)：語(yǔ)音數(shù)據(jù)的采集設(shè)備類型、語(yǔ)音數(shù)據(jù)的輸入地點(diǎn)；以及裝置還包括：第一獲取單元，配置用于獲取各個(gè)簇中的語(yǔ)音數(shù)據(jù)以及各個(gè)簇中的語(yǔ)音數(shù)據(jù)的相關(guān)信息；重新生成單元，配置用于利用各個(gè)簇的語(yǔ)音數(shù)據(jù)重新生成用戶的各個(gè)注冊(cè)聲紋向量，并根據(jù)各個(gè)簇的語(yǔ)音數(shù)據(jù)的相關(guān)信息生成各個(gè)注冊(cè)聲紋向量的相關(guān)信息。

在一些實(shí)施例中，該裝置還包括：第二獲取單元，配置用于獲取語(yǔ)音數(shù)據(jù)的相關(guān)信息；以及匹配單元包括：選擇模塊，配置用于根據(jù)語(yǔ)音數(shù)據(jù)的相關(guān)信息與各個(gè)注冊(cè)聲紋向量的相關(guān)信息的匹配度，選擇注冊(cè)聲紋向量；匹配模塊，配置用于將聲紋特征向量與選擇的注冊(cè)聲紋向量進(jìn)行匹配。

在一些實(shí)施例中，該裝置還包括：第二確定單元，配置用于確定所述匹配度是否大于等于預(yù)設(shè)的通過(guò)閾值；執(zhí)行單元，配置用于響應(yīng)于確定出所述匹配度大于等于預(yù)設(shè)的通過(guò)閾值，則確定用戶身份驗(yàn)證通過(guò)并執(zhí)行與驗(yàn)證通過(guò)相對(duì)應(yīng)的操作。

本申請(qǐng)?zhí)峁┑挠糜谔幚碚Z(yǔ)音數(shù)據(jù)的方法和裝置，通過(guò)提取用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)中的聲紋特征向量，并將聲紋特征向量與預(yù)先生成的該用戶的注冊(cè)聲紋向量進(jìn)行匹配，當(dāng)匹配度大于等于預(yù)設(shè)的更新閾值時(shí)，則利用該聲紋特征向量和該語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量，從而有效利用了用戶的語(yǔ)音數(shù)據(jù)，提高了用戶的注冊(cè)聲紋向量的準(zhǔn)確度。

附圖說(shuō)明

通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述，本申請(qǐng)的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯：

圖1是本申請(qǐng)可以應(yīng)用于其中的示例性系統(tǒng)架構(gòu)圖；

圖2是根據(jù)本申請(qǐng)的用于處理語(yǔ)音數(shù)據(jù)的方法的一個(gè)實(shí)施例的流程圖；

圖3是本申請(qǐng)的圖2步驟203中的用戶的注冊(cè)聲紋向量的生成方法的一種實(shí)現(xiàn)方式的流程圖；

圖4是根據(jù)本申請(qǐng)的用于處理語(yǔ)音數(shù)據(jù)的方法的又一個(gè)實(shí)施例的流程圖；

圖5是根據(jù)本申請(qǐng)的用于處理語(yǔ)音數(shù)據(jù)的裝置的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖；

圖6是適于用來(lái)實(shí)現(xiàn)本申請(qǐng)實(shí)施例的服務(wù)器的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面結(jié)合附圖和實(shí)施例對(duì)本申請(qǐng)作進(jìn)一步的詳細(xì)說(shuō)明?？梢岳斫獾氖?，此處所描述的具體實(shí)施例僅僅用于解釋相關(guān)發(fā)明，而非對(duì)該發(fā)明的限定。另外還需要說(shuō)明的是，為了便于描述，附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。

需要說(shuō)明的是，在不沖突的情況下，本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本申請(qǐng)。

圖1示出了可以應(yīng)用本申請(qǐng)的用于處理語(yǔ)音數(shù)據(jù)的方法或用于處理語(yǔ)音數(shù)據(jù)的裝置的實(shí)施例的示例性系統(tǒng)架構(gòu)100。

如圖1所示，系統(tǒng)架構(gòu)100可以包括終端設(shè)備101、102、103，網(wǎng)絡(luò)104和服務(wù)器105、106。網(wǎng)絡(luò)104用以在終端設(shè)備101、102、103和服務(wù)器105、106之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)104可以包括各種連接類型，例如有線、無(wú)線通信鏈路或者光纖電纜等等。

用戶110可以使用終端設(shè)備101、102、103通過(guò)網(wǎng)絡(luò)104與服務(wù)器105、106交互，以接收或發(fā)送消息等。終端設(shè)備101、102、103上可以安裝有各種通訊客戶端應(yīng)用，例如購(gòu)物類應(yīng)用、搜索類應(yīng)用、網(wǎng)頁(yè)瀏覽器應(yīng)用、即時(shí)通信工具、郵箱客戶端、社交平臺(tái)軟件、支付軟件等。

終端設(shè)備101、102、103可以是具有顯示屏并且支持?jǐn)?shù)據(jù)接收與發(fā)送，以及攜帶麥克風(fēng)的各種電子設(shè)備，包括但不限于智能手機(jī)、平板電腦、智能手表、膝上型便攜計(jì)算機(jī)和臺(tái)式計(jì)算機(jī)等等。

服務(wù)器105、106可以是提供各種服務(wù)的服務(wù)器，例如對(duì)終端設(shè)備101、102、103上發(fā)送的語(yǔ)音數(shù)據(jù)提供支持的后臺(tái)服務(wù)器。后臺(tái)服務(wù)器可以對(duì)接收到的語(yǔ)音數(shù)據(jù)等數(shù)據(jù)進(jìn)行分析等處理，并將處理結(jié)果(例如登陸成功頁(yè)面或登陸失敗頁(yè)面)反饋給終端設(shè)備。

需要說(shuō)明的是，本申請(qǐng)實(shí)施例所提供的用于處理語(yǔ)音數(shù)據(jù)的方法一般由服務(wù)器105、106執(zhí)行，相應(yīng)地，用于處理語(yǔ)音數(shù)據(jù)的裝置一般設(shè)置于服務(wù)器105、106中。

應(yīng)該理解，圖1中的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器的數(shù)目?jī)H僅是示意性的。根據(jù)實(shí)現(xiàn)需要，可以具有任意數(shù)目的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器。

繼續(xù)參考圖2，示出了根據(jù)本申請(qǐng)的用于處理語(yǔ)音數(shù)據(jù)的方法的一個(gè)實(shí)施例的流程200。所述的用于處理語(yǔ)音數(shù)據(jù)的方法，包括以下步驟：

步驟201，接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)。

在本實(shí)施例中，用于處理語(yǔ)音數(shù)據(jù)的方法運(yùn)行于其上的電子設(shè)備(例如圖1所示的服務(wù)器)可以通過(guò)有線連接方式或者無(wú)線連接方式從用戶利用其進(jìn)行用戶身份驗(yàn)證的終端接收語(yǔ)音數(shù)據(jù)，其中，上述語(yǔ)音數(shù)據(jù)可以是用戶根據(jù)上述電子設(shè)備生成的字符串進(jìn)行朗讀而生成的朗讀信息，上述字符串可以是上述電子設(shè)備隨機(jī)生成的字符串，也可以是上述用戶在注冊(cè)用于驗(yàn)證身份的系統(tǒng)賬號(hào)時(shí)所選擇的字符串集合中的字符串。需要指出的是，上述無(wú)線連接方式可以包括但不限于3G/4G連接、WiFi連接、藍(lán)牙連接、WiMAX連接、Zigbee連接、UWB(ultra wideband)連接、以及其他現(xiàn)在已知或?qū)?lái)開(kāi)發(fā)的無(wú)線連接方式。

步驟202，提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量。

在本實(shí)施例中，上述電子設(shè)備可以提取步驟201中接收到的語(yǔ)音數(shù)據(jù)中的聲紋特征向量。聲紋是用電聲學(xué)儀器顯示的攜帶言語(yǔ)信息的聲波頻譜?，F(xiàn)代科學(xué)研究表明，聲紋不僅具有特定性，而且有相對(duì)穩(wěn)定性的特點(diǎn)。聲紋特征向量可以是標(biāo)識(shí)用戶的聲紋頻譜特征的向量。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，上述電子設(shè)備可以將上述語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型(Universal Background Model，UBM)中進(jìn)行映射得到中間向量，然后，將上述中間向量進(jìn)行特征變換得到聲紋特征向量。當(dāng)驗(yàn)證用戶身份通過(guò)或不通過(guò)時(shí)，與其他偏重個(gè)體特定性的模型相比，上述全局背景模型是一個(gè)在生物識(shí)別驗(yàn)證系統(tǒng)中偏重一般性且個(gè)體通用性的模型，例如，在用戶語(yǔ)音驗(yàn)證系統(tǒng)中，上述全局背景模型是一個(gè)由性別均衡的不同說(shuō)話者的大量語(yǔ)音樣本訓(xùn)練得出的、且與說(shuō)話者不相關(guān)的高斯混合模型(Gaussian Mixture Model，GMM)，上述全局背景模型可以用來(lái)表征語(yǔ)音數(shù)據(jù)與中間向量的對(duì)應(yīng)關(guān)系?？梢酝ㄟ^(guò)聯(lián)合因子分析方法(Joint Factor Analysis，JFA)對(duì)上述中間向量進(jìn)行特征變換得到聲紋特征向量，上述聯(lián)合因子分析方法是聲紋認(rèn)證算法中針對(duì)信道補(bǔ)償?shù)挠行惴?，它通過(guò)假設(shè)說(shuō)話人空間和信道空間是獨(dú)立的，并可以分別用兩個(gè)低維因子空間進(jìn)行描述，從而估計(jì)信道因子；也可以通過(guò)概率線性判別分析算法(Probabilistic Linear Discriminant Analysis，PLDA)對(duì)上述中間向量進(jìn)行特征變換得到聲紋特征向量，上述概率線性判別分析算法也是一種信道補(bǔ)償算法，是概率形式的線性判別分析算法(Linear Discriminant Analysis，LDA)；還可以通過(guò)辨識(shí)矢量(Identifying Vector，I-Vector)對(duì)上述中間向量進(jìn)行特征變換得到聲紋特征向量。

步驟203，將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配，并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度。

在本實(shí)施例中，上述電子設(shè)備可以將上述步驟202中提取的聲紋特征向量與預(yù)先存儲(chǔ)的上述用戶的注冊(cè)聲紋向量進(jìn)行匹配，并生成上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度。上述預(yù)先存儲(chǔ)的的注冊(cè)聲紋向量可以是預(yù)先生成的注冊(cè)聲紋向量，也可以是更新之后的注冊(cè)聲紋向量。上述注冊(cè)聲紋向量可以是上述電子設(shè)備自身生成的，也可以是上述電子設(shè)備從其它已經(jīng)生成上述用戶的注冊(cè)聲紋向量的設(shè)備上獲取到的。當(dāng)提取出上述用戶語(yǔ)音數(shù)據(jù)中的聲紋特征向量之后，上述電子設(shè)備可以首先檢測(cè)設(shè)備本身是否已存儲(chǔ)上述用戶的注冊(cè)聲紋向量；若檢測(cè)到設(shè)備本身存儲(chǔ)了上述用戶的注冊(cè)聲紋向量，則將上述聲紋特征向量與該注冊(cè)聲紋向量進(jìn)行匹配，若沒(méi)有檢測(cè)到設(shè)備本身中存儲(chǔ)了上述用戶的注冊(cè)聲紋向量，則向其它設(shè)備發(fā)送獲取上述用戶的注冊(cè)聲紋向量的請(qǐng)求；若接收到其它設(shè)備發(fā)送的上述用戶的注冊(cè)聲紋向量，則將上述聲紋特征向量與該注冊(cè)聲紋向量進(jìn)行匹配，若沒(méi)有接收到其它設(shè)備發(fā)送的上述用戶的注冊(cè)聲紋向量，則上述電子設(shè)備根據(jù)用戶注冊(cè)時(shí)輸入的多條語(yǔ)音數(shù)據(jù)生成該用戶的注冊(cè)聲紋向量。計(jì)算上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度時(shí)，可以采用曼哈頓距離(Manhattan Distance)進(jìn)行計(jì)算，也可以采用閔可夫斯基距離(Minkowski Distance)進(jìn)行計(jì)算，還可以采用余弦相似度(Cosine Similarity)進(jìn)行計(jì)算。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，上述相關(guān)信息可以包括語(yǔ)音數(shù)據(jù)的采集設(shè)備類型，例如，手機(jī)、電腦和智能手表等等，上述相關(guān)信息還可以包括語(yǔ)音數(shù)據(jù)的輸入地點(diǎn)，可以按照外界環(huán)境噪聲的大小將輸入地點(diǎn)劃分為噪聲大的場(chǎng)所，例如，地鐵、商場(chǎng)、娛樂(lè)場(chǎng)所等，和噪聲大的場(chǎng)所，例如圖書(shū)館、教室等。上述電子設(shè)備可以利用聚類算法對(duì)上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)進(jìn)行聚類，生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇，之后，可以獲取各個(gè)簇中的語(yǔ)音數(shù)據(jù)以及該語(yǔ)音數(shù)據(jù)的相關(guān)信息，然后，可以利用各個(gè)簇的語(yǔ)音數(shù)據(jù)重新生成上述用戶的各個(gè)注冊(cè)聲紋向量，并根據(jù)上述各個(gè)簇的語(yǔ)音數(shù)據(jù)的相關(guān)信息生成各個(gè)注冊(cè)聲紋向量的相關(guān)信息。上述簇也可稱之為簇類，是指由類似的對(duì)象組成的多個(gè)類，由聚類所生成的簇是一組數(shù)據(jù)對(duì)象的集合，這些對(duì)象與同一簇中的對(duì)象彼此相似，與其他簇中的對(duì)象相異。作為示例，一個(gè)簇中的輸入地點(diǎn)為噪聲大的場(chǎng)所的語(yǔ)音數(shù)據(jù)的數(shù)量占該簇中所有語(yǔ)音數(shù)據(jù)的數(shù)量的比例為80％，則可以將利用該簇的語(yǔ)音數(shù)據(jù)生成的注冊(cè)聲紋向量的相關(guān)信息中的輸入地點(diǎn)信息設(shè)置為噪聲大的場(chǎng)所。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，上述電子設(shè)備在處理語(yǔ)音數(shù)據(jù)時(shí)，還可以獲取語(yǔ)音數(shù)據(jù)的相關(guān)信息；之后，根據(jù)上述語(yǔ)音數(shù)據(jù)的相關(guān)信息與上述用戶的各個(gè)注冊(cè)聲紋向量的相關(guān)信息的匹配度，選擇注冊(cè)聲紋向量，例如，當(dāng)獲取到語(yǔ)音數(shù)據(jù)的輸入地點(diǎn)為酒吧時(shí)，則可以選擇相關(guān)信息中包含噪聲大的場(chǎng)所的注冊(cè)聲紋向量，當(dāng)獲取到語(yǔ)音數(shù)據(jù)的采集設(shè)備為智能手表時(shí)，則可以選擇相關(guān)信息中包含智能手表的注冊(cè)聲紋向量；最后，將該聲紋特征向量與所選擇的注冊(cè)聲紋向量進(jìn)行匹配，得到匹配結(jié)果。

步驟204，確定匹配度是否大于等于預(yù)設(shè)的更新閾值。

在本實(shí)施例中，上述電子設(shè)備可以將步驟203中生成的匹配度與預(yù)設(shè)的更新閾值進(jìn)行比較，確定上述匹配度是否大于或等于上述更新閾值，其中，上述更新閾值是動(dòng)態(tài)的，且個(gè)性化的，用戶不同，用戶所對(duì)應(yīng)的更新閾值也不同，上述更新閾值的設(shè)置是為了將預(yù)設(shè)比例的語(yǔ)音數(shù)據(jù)和聲紋特征向量進(jìn)行存儲(chǔ)，以供上述電子設(shè)備根據(jù)存儲(chǔ)的語(yǔ)音數(shù)據(jù)和聲紋特征向量更新用戶的注冊(cè)聲紋向量，例如，當(dāng)預(yù)設(shè)比例為80％時(shí)，則上述更新閾值可以使得占用戶總輸入的語(yǔ)音數(shù)據(jù)的80％的語(yǔ)音數(shù)據(jù)被存儲(chǔ)。

步驟205，響應(yīng)于確定出匹配度大于等于預(yù)設(shè)的更新閾值，則利用聲紋特征向量和語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量。

在本實(shí)施例中，當(dāng)確定出上述匹配度大于或等于預(yù)設(shè)的更新閾值，則上述電子設(shè)備可以利用步驟201接收的語(yǔ)音數(shù)據(jù)和步驟202提取出的聲紋特征向量更新上述用戶的注冊(cè)聲紋向量。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，當(dāng)確定出上述匹配度大于或等于預(yù)設(shè)的通過(guò)閾值，則上述電子設(shè)備可以確定上述用戶身份驗(yàn)證通過(guò)，并執(zhí)行與驗(yàn)證通過(guò)相對(duì)應(yīng)的操作，例如，當(dāng)用戶在進(jìn)行登錄網(wǎng)站時(shí)的身份驗(yàn)證時(shí)，可以向上述用戶返回登錄成功的頁(yè)面；當(dāng)用戶在進(jìn)行密碼鎖的解鎖操作時(shí)，可以解開(kāi)密碼鎖。

本申請(qǐng)的上述實(shí)施例提供的方法通過(guò)將用戶語(yǔ)音數(shù)據(jù)中的聲紋特征向量與該用戶的注冊(cè)聲紋向量進(jìn)行匹配，并利用匹配度大于等于更新閾值的語(yǔ)音數(shù)據(jù)和聲紋特征向量來(lái)更新用戶的注冊(cè)聲紋向量，從而提高了用戶的注冊(cè)聲紋向量的準(zhǔn)確度。

繼續(xù)參見(jiàn)圖3，圖3是圖2步驟203中的用戶的注冊(cè)聲紋向量的生成方法的一種實(shí)現(xiàn)方式的流程300。該生成用戶的注冊(cè)聲紋向量的流程300，包括以下步驟：

步驟301，獲取用戶輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)。

在本實(shí)施例中，用于處理語(yǔ)音數(shù)據(jù)的方法運(yùn)行于其上的電子設(shè)備(例如圖1所示的服務(wù)器)可以獲取用戶在注冊(cè)用于驗(yàn)證身份的系統(tǒng)賬號(hào)時(shí)輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)，其中，上述注冊(cè)語(yǔ)音數(shù)據(jù)可以是用戶根據(jù)上述電子設(shè)備生成的字符串進(jìn)行朗讀而生成的朗讀信息，上述字符串可以是上述電子設(shè)備隨機(jī)生成的字符串，也可以是上述用戶在字符串集合中選擇的字符串。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，上述電子設(shè)備可以獲取上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)以及該語(yǔ)音數(shù)據(jù)的相關(guān)信息，其中，上述相關(guān)信息包括語(yǔ)音數(shù)據(jù)的輸入時(shí)間點(diǎn)；之后，可以刪除上述輸入時(shí)間點(diǎn)早于預(yù)設(shè)的時(shí)間分割點(diǎn)的語(yǔ)音數(shù)據(jù)，并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)，并利用該注冊(cè)語(yǔ)音數(shù)據(jù)生成注冊(cè)聲紋向量。作為示例，當(dāng)預(yù)設(shè)的時(shí)間分割點(diǎn)為2016年6月1日，則將輸入時(shí)間點(diǎn)早于2016年6月1日的數(shù)據(jù)刪除。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，上述電子設(shè)備可以首先利用聚類算法對(duì)上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)進(jìn)行聚類，生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇，其中，上述聚類算法可以包括基于劃分聚類算法(例如k-means算法)、基于層次聚類算法(例如利用層次方法的平衡迭代規(guī)約和聚類(Balanced Iterative Reducing and Clustering Using Hierarchies，BIRCH))和基于密度聚類算法(例如DBSCAN算法)等；之后，上述電子設(shè)備可以獲取各個(gè)簇的中心點(diǎn)，以k-means算法為例，在給定K值和K個(gè)簇的初始中心點(diǎn)的情況下，把每個(gè)點(diǎn)分到離其最近的中心點(diǎn)所代表的簇中，當(dāng)所有點(diǎn)分配完畢后，對(duì)一個(gè)簇中的所有點(diǎn)重新計(jì)算(例如計(jì)算平均值)得到該簇的中心點(diǎn)，然后再迭代的進(jìn)行分配點(diǎn)和更新簇的中心點(diǎn)的步驟，直至簇的中心點(diǎn)的變化很小，或者達(dá)到指定的迭代次數(shù)，再獲取各個(gè)簇中的中心點(diǎn)；然后，可以利用距離算法計(jì)算每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)與每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)所在簇的中心點(diǎn)的距離，其中，上述距離算法可以包括歐式距離算法；最后，可以將上述距離大于預(yù)設(shè)的距離閾值的語(yǔ)音數(shù)據(jù)刪除，并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)，并利用該注冊(cè)語(yǔ)音數(shù)據(jù)生成注冊(cè)聲紋向量。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，上述電子設(shè)備也可以將語(yǔ)音數(shù)據(jù)輸入時(shí)間點(diǎn)早于預(yù)設(shè)的時(shí)間分割點(diǎn)的語(yǔ)音數(shù)據(jù)以及上述距離大于預(yù)設(shè)的距離閾值的語(yǔ)音數(shù)據(jù)均刪除，并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)，并利用該注冊(cè)語(yǔ)音數(shù)據(jù)生成注冊(cè)聲紋向量。

步驟302，將預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量。

在本實(shí)施例中，上述電子設(shè)備可以將上述預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量。上述全局背景模型是一個(gè)由性別均衡的不同說(shuō)話者的大量語(yǔ)音樣本訓(xùn)練得出的、且與說(shuō)話者不相關(guān)的高斯混合模型，上述全局背景模型可以用來(lái)表征語(yǔ)音數(shù)據(jù)與中間向量的對(duì)應(yīng)關(guān)系。

步驟303，對(duì)預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量進(jìn)行特征變換得到預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量。

在本實(shí)施例中，上述電子設(shè)備可以通過(guò)聯(lián)合因子分析方法、概率線性判別分析算法和辨識(shí)矢量等算法對(duì)上述預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量進(jìn)行特征變換得到預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量。

步驟304，對(duì)預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量進(jìn)行融合，生成用戶的注冊(cè)聲紋向量。

在本實(shí)施例中，上述電子設(shè)備可以對(duì)上述預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量進(jìn)行融合，生成上述用戶的注冊(cè)聲紋向量。例如，用戶甲在注冊(cè)過(guò)程中輸入了K個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)，可以提取出K個(gè)注冊(cè)聲紋特征向量，可以通過(guò)下述的公式1對(duì)上述K個(gè)注冊(cè)聲紋特征向量進(jìn)行融合得到上述用戶的注冊(cè)聲紋向量。

其中，V為用戶的注冊(cè)聲紋向量，K為注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量，v_i為用戶輸入的第i個(gè)注冊(cè)聲紋特征向量，norm(v_i)為對(duì)v_i進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化(長(zhǎng)度歸一化)操作，為對(duì)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化(長(zhǎng)度歸一化)操作。

本申請(qǐng)的上述生成用戶的注冊(cè)聲紋向量方法通過(guò)對(duì)用戶的注冊(cè)語(yǔ)音數(shù)據(jù)進(jìn)行映射，特征變換以及融合等處理，生成該用戶的注冊(cè)聲紋向量，從而以該注冊(cè)聲紋向量為基準(zhǔn)，確定該用戶的身份驗(yàn)證結(jié)果，實(shí)現(xiàn)了準(zhǔn)確的用戶身份識(shí)別。

進(jìn)一步參考圖4，其示出了用于處理語(yǔ)音數(shù)據(jù)的方法的又一個(gè)實(shí)施例的流程400。該用于處理語(yǔ)音數(shù)據(jù)的方法的流程400，包括以下步驟：

步驟401，接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)。

步驟402，提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量。

在本實(shí)施例中，上述電子設(shè)備可以提取步驟401中接收到的語(yǔ)音數(shù)據(jù)中的聲紋特征向量。聲紋是用電聲學(xué)儀器顯示的攜帶言語(yǔ)信息的聲波頻譜?，F(xiàn)代科學(xué)研究表明，聲紋不僅具有特定性，而且有相對(duì)穩(wěn)定性的特點(diǎn)。聲紋特征向量可以是標(biāo)識(shí)用戶的聲紋頻譜特征的向量。

步驟403，將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配，并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度。

在本實(shí)施例中，上述電子設(shè)備可以將上述步驟402中提取的聲紋特征向量與預(yù)先存儲(chǔ)的上述用戶的注冊(cè)聲紋向量進(jìn)行匹配，并生成上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度。上述預(yù)先存儲(chǔ)的的注冊(cè)聲紋向量可以是預(yù)先生成的注冊(cè)聲紋向量，也可以是更新之后的注冊(cè)聲紋向量。上述注冊(cè)聲紋向量可以是上述電子設(shè)備自身生成的，也可以是上述電子設(shè)備從其它已經(jīng)生成上述用戶的注冊(cè)聲紋向量的設(shè)備上獲取到的?？梢圆捎寐D距離、閔可夫斯基距離和余弦相似度等計(jì)算上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度。

步驟404，確定匹配度是否大于等于預(yù)設(shè)的更新閾值。

在本實(shí)施例中，上述電子設(shè)備可以將步驟403中生成的匹配度與預(yù)設(shè)的更新閾值進(jìn)行比較，確定上述匹配度是否大于或等于上述更新閾值，其中，上述更新閾值是動(dòng)態(tài)的，且個(gè)性化的，用戶不同，用戶所對(duì)應(yīng)的更新閾值也不同，上述更新閾值的設(shè)置是為了將預(yù)設(shè)比例的語(yǔ)音數(shù)據(jù)和聲紋特征向量進(jìn)行存儲(chǔ)，以供上述電子設(shè)備根據(jù)存儲(chǔ)的語(yǔ)音數(shù)據(jù)和聲紋特征向量更新用戶的注冊(cè)聲紋向量，例如，當(dāng)預(yù)設(shè)比例為90％時(shí)，則上述更新閾值可以使得占用戶總輸入的語(yǔ)音數(shù)據(jù)的90％的語(yǔ)音數(shù)據(jù)被存儲(chǔ)。

在本實(shí)施例中，上述電子設(shè)備可以針對(duì)用戶的各個(gè)注冊(cè)聲紋向量，為每個(gè)注冊(cè)聲紋向量設(shè)置不同的更新閾值。當(dāng)將聲紋特征向量與所選擇的注冊(cè)聲紋向量進(jìn)行匹配，可以將得到的匹配度與所選擇的注冊(cè)聲紋向量所對(duì)應(yīng)的更新閾值進(jìn)行比較，其中，所述注冊(cè)聲紋向量與所述更新閾值是一一對(duì)應(yīng)的。

步驟405，響應(yīng)于確定出匹配度大于等于預(yù)設(shè)的更新閾值，則獲取用戶輸入的注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和用戶已存儲(chǔ)的各個(gè)聲紋特征向量。

在本實(shí)施例中，當(dāng)確定出上述匹配度大于或等于預(yù)設(shè)的更新閾值時(shí)，則上述電子設(shè)備可以獲取用戶輸入的注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和用戶已存儲(chǔ)的各個(gè)聲紋特征向量。當(dāng)確定出上述匹配度大于或等于預(yù)設(shè)的更新閾值之后，上述電子設(shè)備可以首先獲取用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量，也可以獲取狀態(tài)標(biāo)記為未使用的語(yǔ)音數(shù)據(jù)的數(shù)量；之后，確定獲取到的數(shù)量是否大于預(yù)設(shè)的數(shù)量閾值，其中，上述數(shù)量閾值可以是預(yù)先設(shè)置的以供當(dāng)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量大于數(shù)量閾值時(shí)對(duì)上述注冊(cè)聲紋向量進(jìn)行更新，若大于預(yù)設(shè)的數(shù)量閾值時(shí)，或者當(dāng)?shù)竭_(dá)預(yù)設(shè)的時(shí)間點(diǎn)時(shí)，上述電子設(shè)備可以獲取上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和上述用戶已存儲(chǔ)的各個(gè)聲紋特征向量。

步驟406，對(duì)用戶已存儲(chǔ)的各個(gè)聲紋特征向量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算，并對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算后的向量進(jìn)行求和運(yùn)算，得到用戶已存儲(chǔ)的聲紋特征向量之和。

在本實(shí)施例中，上述電子設(shè)備可以對(duì)上述用戶已存儲(chǔ)的各個(gè)聲紋特征向量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算(或長(zhǎng)度歸一化運(yùn)算)，并對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算后的向量進(jìn)行求和運(yùn)算，得到上述用戶已存儲(chǔ)的聲紋特征向量之和，其中，數(shù)據(jù)標(biāo)準(zhǔn)化處理主要包括數(shù)據(jù)同趨化處理和無(wú)量綱化處理兩個(gè)方面。數(shù)據(jù)同趨化處理主要解決不同性質(zhì)數(shù)據(jù)問(wèn)題，對(duì)不同性質(zhì)指標(biāo)直接加總不能正確反映不同作用力的綜合結(jié)果，須先考慮改變逆指標(biāo)數(shù)據(jù)性質(zhì)，使所有指標(biāo)對(duì)測(cè)評(píng)方案的作用力同趨化，再加總才能得出正確結(jié)果。數(shù)據(jù)無(wú)量綱化處理主要解決數(shù)據(jù)的可比性。數(shù)據(jù)標(biāo)準(zhǔn)化的方法有很多種，常用的有“最小—最大標(biāo)準(zhǔn)化”、“Z-score標(biāo)準(zhǔn)化”和“按小數(shù)定標(biāo)標(biāo)準(zhǔn)化”等。

步驟407，利用注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量乘以注冊(cè)聲紋向量，得到注冊(cè)聲紋向量之積。

在本實(shí)施例中，上述電子設(shè)備可以利用上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量乘以上述注冊(cè)聲紋向量，得到注冊(cè)聲紋向量之積。

步驟408，計(jì)算聲紋特征向量之和與注冊(cè)聲紋向量之積的向量和，并計(jì)算用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量與注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量的數(shù)量和，利用向量和除以數(shù)量和得到更新的注冊(cè)聲紋向量。

在本實(shí)施例中，上述電子設(shè)備可以計(jì)算上述步驟409得到的上述聲紋特征向量之和與上述步驟410得到的注冊(cè)聲紋向量之積的向量和，并計(jì)算上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量與上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量的數(shù)量和，利用上述向量和除以上述數(shù)量和得到更新的注冊(cè)聲紋向量。具體地，可以通過(guò)下述公式2得到更新的注冊(cè)聲紋向量。

其中，V_new為更新的注冊(cè)聲紋向量，n為注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量，V為注冊(cè)聲紋向量，K為已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量，v_i為第i個(gè)已存儲(chǔ)的聲紋特征向量，norm(v_i)為對(duì)v_i進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化(長(zhǎng)度歸一化)操作。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，當(dāng)公式2中的K為1時(shí)，則上述注冊(cè)聲紋向量可以進(jìn)行在線的實(shí)時(shí)更新。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，在注冊(cè)聲紋向量更新之后，上述電子設(shè)備可以將上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)刪除，或者將其狀態(tài)標(biāo)記為已使用，避免這些已使用的語(yǔ)音數(shù)據(jù)被反復(fù)用于更新。

從圖4中可以看出，與圖2對(duì)應(yīng)的實(shí)施例相比，本實(shí)施例中的用于處理語(yǔ)音數(shù)據(jù)的方法的流程400突出了對(duì)注冊(cè)聲紋向量進(jìn)行更新的具體步驟。由此，本實(shí)施例描述的方案可以利用用戶注冊(cè)時(shí)輸入的語(yǔ)音數(shù)據(jù)和匹配度大于等于預(yù)設(shè)的更新閾值的語(yǔ)音數(shù)據(jù)更新用戶的注冊(cè)聲紋向量，從而得到更準(zhǔn)確的注冊(cè)聲紋向量。

進(jìn)一步參考圖5，作為對(duì)上述各圖所示方法的實(shí)現(xiàn)，本申請(qǐng)?zhí)峁┝艘环N用于處理語(yǔ)音數(shù)據(jù)的裝置的一個(gè)實(shí)施例，該裝置實(shí)施例與圖2所示的方法實(shí)施例相對(duì)應(yīng)，該裝置具體可以應(yīng)用于各種電子設(shè)備中。如圖5所示，本實(shí)施例的用于處理語(yǔ)音數(shù)據(jù)的裝置500包括：接收單元501、提取單元502、匹配單元503、第一確定單元504和更新單元505。其中，接收單元501配置用于接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)；提取單元502配置用于提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量；匹配單元503配置用于將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配，并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度；第一確定單元504配置用于確定所述匹配度是否大于等于預(yù)設(shè)的更新閾值；更新單元505配置用于響應(yīng)于確定出所述匹配度大于等于預(yù)設(shè)的更新閾值，則利用所述聲紋特征向量和所述語(yǔ)音數(shù)據(jù)更新所述注冊(cè)聲紋向量。

在本實(shí)施例中，用于處理語(yǔ)音數(shù)據(jù)的裝置500的接收單元501可以通過(guò)有線連接方式或者無(wú)線連接方式從用戶利用其進(jìn)行用戶身份驗(yàn)證的終端接收語(yǔ)音數(shù)據(jù)，其中，上述語(yǔ)音數(shù)據(jù)可以是用戶根據(jù)上述電子設(shè)備生成的字符串進(jìn)行朗讀而生成的朗讀信息，上述字符串可以是上述電子設(shè)備隨機(jī)生成的字符串，也可以是上述用戶在注冊(cè)用于驗(yàn)證身份的系統(tǒng)賬號(hào)時(shí)所選擇的字符串集合中的字符串。

在本實(shí)施例中，基于接收單元501接收的語(yǔ)音數(shù)據(jù)，上述提取單元502可以提取上述語(yǔ)音數(shù)據(jù)中的聲紋特征向量。聲紋是用電聲學(xué)儀器顯示的攜帶言語(yǔ)信息的聲波頻譜?，F(xiàn)代科學(xué)研究表明，聲紋不僅具有特定性，而且有相對(duì)穩(wěn)定性的特點(diǎn)。聲紋特征向量可以是標(biāo)識(shí)用戶的聲紋頻譜特征的向量。

在本實(shí)施例中，基于提取單元502提取的聲紋特征向量，上述匹配單元503可以將上述聲紋特征向量與預(yù)先存儲(chǔ)的上述用戶的注冊(cè)聲紋向量進(jìn)行匹配，并生成上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度。上述預(yù)先存儲(chǔ)的的注冊(cè)聲紋向量可以是預(yù)先生成的注冊(cè)聲紋向量，也可以是更新之后的注冊(cè)聲紋向量。上述注冊(cè)聲紋向量可以是上述電子設(shè)備自身生成的，也可以是上述電子設(shè)備從其它已經(jīng)生成上述用戶的注冊(cè)聲紋向量的設(shè)備上獲取到的。上述匹配單元503可以采用曼哈頓距離、閔可夫斯基距離和余弦相似度計(jì)算上述聲紋特征向量與上述注冊(cè)聲紋向量之間的匹配度。

在本實(shí)施例中，基于匹配單元503生成的匹配度，上述第一確定單元504可以將上述匹配度與預(yù)設(shè)的更新閾值進(jìn)行比較，確定上述匹配度是否大于或等于上述更新閾值，其中，上述更新閾值是動(dòng)態(tài)的，且個(gè)性化的，用戶不同，用戶所對(duì)應(yīng)的更新閾值也不同，上述更新閾值的設(shè)置是為了將預(yù)設(shè)比例的語(yǔ)音數(shù)據(jù)和聲紋特征向量進(jìn)行存儲(chǔ)，以供上述電子設(shè)備根據(jù)存儲(chǔ)的語(yǔ)音數(shù)據(jù)和聲紋特征向量更新用戶的注冊(cè)聲紋向量。

在本實(shí)施例中，當(dāng)確定出上述匹配度大于或等于預(yù)設(shè)的更新閾值，則上述更新單元505可以利用上述接收單元501接收的語(yǔ)音數(shù)據(jù)和上述提取單元502提取出的聲紋特征向量更新上述用戶的注冊(cè)聲紋向量。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，上述提取單元502可以包括映射模塊(圖中未示出)和變換模塊(圖中未示出)。其中，上述映射模塊可以將上述語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到中間向量，然后，上述變換模塊可以將上述中間向量進(jìn)行特征變換得到聲紋特征向量。在用戶語(yǔ)音驗(yàn)證系統(tǒng)中，上述全局背景模型是一個(gè)由性別均衡的不同說(shuō)話者的大量語(yǔ)音樣本訓(xùn)練得出的、且與說(shuō)話者不相關(guān)的高斯混合模型，上述全局背景模型可以用來(lái)表征語(yǔ)音數(shù)據(jù)與中間向量的對(duì)應(yīng)關(guān)系。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，用于處理語(yǔ)音數(shù)據(jù)的裝置500還可以包括生成單元(圖中未示出)。上述生成單元可以包括獲取模塊(圖中未示出)，映射模塊(圖中未示出)，變換模塊(圖中未示出)和融合模塊(圖中未示出)。其中，上述獲取模塊可以獲取用戶在注冊(cè)用于驗(yàn)證身份的系統(tǒng)賬號(hào)時(shí)輸入的預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)，其中，上述注冊(cè)語(yǔ)音數(shù)據(jù)可以是用戶根據(jù)上述電子設(shè)備生成的字符串進(jìn)行朗讀而生成的朗讀信息；上述映射模塊可以將上述預(yù)設(shè)數(shù)目個(gè)注冊(cè)語(yǔ)音數(shù)據(jù)導(dǎo)入預(yù)先訓(xùn)練的全局背景模型中進(jìn)行映射得到預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量，上述全局背景模型是一個(gè)由性別均衡的不同說(shuō)話者的大量語(yǔ)音樣本訓(xùn)練得出的、且與說(shuō)話者不相關(guān)的高斯混合模型，上述全局背景模型可以用來(lái)表征語(yǔ)音數(shù)據(jù)與中間向量的對(duì)應(yīng)關(guān)系；上述變換模塊可以通過(guò)聯(lián)合因子分析方法、概率線性判別分析算法和辨識(shí)矢量等算法對(duì)上述預(yù)設(shè)數(shù)目個(gè)等長(zhǎng)的中間向量進(jìn)行特征變換得到預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量；上述融合模塊對(duì)上述預(yù)設(shè)數(shù)目個(gè)注冊(cè)聲紋特征向量進(jìn)行融合，生成上述用戶的注冊(cè)聲紋向量。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，上述更新單元505還可以包括獲取模塊(圖中未示出)和更新模塊(圖中未示出)。其中，上述獲取模塊可以獲取上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和上述用戶已存儲(chǔ)的各個(gè)聲紋特征向量；上述更新模塊可以根據(jù)上述用戶已存儲(chǔ)的各個(gè)聲紋特征向量、上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量、上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量和上述注冊(cè)聲紋向量，更新注冊(cè)聲紋向量。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，上述更新模塊可以包括第一計(jì)算子模塊(圖中未示出)，第二計(jì)算子模塊(圖中未示出)和更新子模塊(圖中未示出)。其中，上述第一計(jì)算子模塊可以對(duì)上述用戶已存儲(chǔ)的各個(gè)聲紋特征向量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算，并對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化運(yùn)算后的向量進(jìn)行求和運(yùn)算，得到上述用戶已存儲(chǔ)的聲紋特征向量之和；上述第二計(jì)算子模塊可以利用上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量乘以上述注冊(cè)聲紋向量，得到注冊(cè)聲紋向量之積；上述更新子模塊可以計(jì)算上述第一計(jì)算子模塊得到的上述聲紋特征向量之和與上述第二計(jì)算子模塊得到的注冊(cè)聲紋向量之積的向量和，并計(jì)算上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的數(shù)量與上述注冊(cè)語(yǔ)音數(shù)據(jù)的數(shù)量的數(shù)量和，利用上述向量和除以上述數(shù)量和得到更新的注冊(cè)聲紋向量。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，在注冊(cè)聲紋向量更新之后，上述更新單元可以將上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)刪除，或者將其狀態(tài)標(biāo)記為已使用，避免這些已使用的語(yǔ)音數(shù)據(jù)被反復(fù)用于更新。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，上述獲取模塊可以包括第一獲取子模塊(圖中未示出)和第一刪除子模塊(圖中未示出)。其中，上述第一獲取子模塊可以獲取上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)以及該語(yǔ)音數(shù)據(jù)的相關(guān)信息，其中，上述相關(guān)信息包括語(yǔ)音數(shù)據(jù)的輸入時(shí)間點(diǎn)；之后，上述第一刪除子模塊可以刪除上述輸入時(shí)間點(diǎn)早于預(yù)設(shè)的時(shí)間分割點(diǎn)的語(yǔ)音數(shù)據(jù)，并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)，并利用該注冊(cè)語(yǔ)音數(shù)據(jù)生成注冊(cè)聲紋向量。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，上述獲取模塊還可以包括生成子模塊(圖中未示出)，第二獲取子模塊(圖中未示出)，計(jì)算子模塊(圖中未示出)和第二刪除子模塊(圖中未示出)。其中，上述生成子模塊可以利用聚類算法對(duì)上述用戶已存儲(chǔ)的語(yǔ)音數(shù)據(jù)進(jìn)行聚類，生成至少一個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)的簇，其中，上述聚類算法可以包括基于劃分聚類算法、基于層次聚類算法和基于密度聚類算法等；之后，上述第二獲取子模塊可以獲取各個(gè)簇的中心點(diǎn)，以k-means算法為例，在給定K值和K個(gè)簇的初始中心點(diǎn)的情況下，把每個(gè)點(diǎn)分到離其最近的中心點(diǎn)所代表的簇中，當(dāng)所有點(diǎn)分配完畢后，對(duì)一個(gè)簇中的所有點(diǎn)重新計(jì)算(例如計(jì)算平均值)得到該簇的中心點(diǎn)，然后再迭代的進(jìn)行分配點(diǎn)和更新簇的中心點(diǎn)的步驟，直至簇的中心點(diǎn)的變化很小，或者達(dá)到指定的迭代次數(shù)，再獲取各個(gè)簇中的中心點(diǎn)；然后，上述計(jì)算子模塊可以利用距離算法計(jì)算每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)與每個(gè)已存儲(chǔ)的語(yǔ)音數(shù)據(jù)所在簇的中心點(diǎn)的距離，其中，上述距離算法可以包括歐式距離算法；最后，上述第二刪除子模塊可以將上述距離大于預(yù)設(shè)的距離閾值的語(yǔ)音數(shù)據(jù)刪除，并將刪除后的語(yǔ)音數(shù)據(jù)作為注冊(cè)語(yǔ)音數(shù)據(jù)，并利用該注冊(cè)語(yǔ)音數(shù)據(jù)生成注冊(cè)聲紋向量。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，用于處理語(yǔ)音數(shù)據(jù)的裝置500還可以包括第二獲取單元(圖中未示出)，上述第二獲取單元在處理語(yǔ)音數(shù)據(jù)時(shí)，還可以獲取語(yǔ)音數(shù)據(jù)的相關(guān)信息；上述匹配單元503可以包括選擇模塊(圖中未示出)和匹配模塊(圖中未示出)，根據(jù)上述語(yǔ)音數(shù)據(jù)的相關(guān)信息與上述用戶的各個(gè)注冊(cè)聲紋向量的相關(guān)信息的匹配度，上述選擇模塊可以選擇注冊(cè)聲紋向量，例如，當(dāng)獲取到語(yǔ)音數(shù)據(jù)的輸入地點(diǎn)為酒吧時(shí)，則可以選擇相關(guān)信息中包含噪聲大的場(chǎng)所的注冊(cè)聲紋向量，當(dāng)獲取到語(yǔ)音數(shù)據(jù)的采集設(shè)備為智能手表時(shí)，則可以選擇相關(guān)信息中包含智能手表的注冊(cè)聲紋向量；最后，上述匹配模塊可以將該聲紋特征向量與所選擇的注冊(cè)聲紋向量進(jìn)行匹配，得到匹配結(jié)果。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中，用于處理語(yǔ)音數(shù)據(jù)的裝置500還可以包括第二確定單元(圖中未示出)和執(zhí)行單元(圖中未示出)。其中，當(dāng)上述第二確定單元確定出上述匹配度大于或等于預(yù)設(shè)的通過(guò)閾值，則上述執(zhí)行單元可以確定上述用戶身份驗(yàn)證通過(guò)，并執(zhí)行與驗(yàn)證通過(guò)相對(duì)應(yīng)的操作，例如，當(dāng)用戶在進(jìn)行登錄網(wǎng)站時(shí)的身份驗(yàn)證時(shí)，可以向上述用戶返回登錄成功的頁(yè)面；當(dāng)用戶在進(jìn)行密碼鎖的解鎖操作時(shí)，可以解開(kāi)密碼鎖。

下面參考圖6，其示出了適于用來(lái)實(shí)現(xiàn)本發(fā)明實(shí)施例的服務(wù)器的計(jì)算機(jī)系統(tǒng)600的結(jié)構(gòu)示意圖。

如圖6所示，計(jì)算機(jī)系統(tǒng)600包括中央處理單元(CPU)601，其可以根據(jù)存儲(chǔ)在只讀存儲(chǔ)器(ROM)602中的程序或者從存儲(chǔ)部分608加載到隨機(jī)訪問(wèn)存儲(chǔ)器(RAM)603中的程序而執(zhí)行各種適當(dāng)?shù)膭?dòng)作和處理。在RAM603中，還存儲(chǔ)有系統(tǒng)600操作所需的各種程序和數(shù)據(jù)。CPU601、ROM602以及RAM603通過(guò)總線604彼此相連。輸入/輸出(I/O)接口605也連接至總線604。

以下部件連接至I/O接口605：包括鍵盤(pán)、鼠標(biāo)等的輸入部分606；包括諸如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚(yáng)聲器等的輸出部分607；包括硬盤(pán)等的存儲(chǔ)部分608；以及包括諸如LAN卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分609。通信部分609經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動(dòng)器610也根據(jù)需要連接至I/O接口605?？刹鹦督橘|(zhì)611，諸如磁盤(pán)、光盤(pán)、磁光盤(pán)、半導(dǎo)體存儲(chǔ)器等等，根據(jù)需要安裝在驅(qū)動(dòng)器610上，以便于從其上讀出的計(jì)算機(jī)程序根據(jù)需要被安裝入存儲(chǔ)部分608。

特別地，根據(jù)本公開(kāi)的實(shí)施例，上文參考流程圖描述的過(guò)程可以被實(shí)現(xiàn)為計(jì)算機(jī)軟件程序。例如，本公開(kāi)的實(shí)施例包括一種計(jì)算機(jī)程序產(chǎn)品，其包括有形地包含在機(jī)器可讀介質(zhì)上的計(jì)算機(jī)程序，上述計(jì)算機(jī)程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實(shí)施例中，該計(jì)算機(jī)程序可以通過(guò)通信部分609從網(wǎng)絡(luò)上被下載和安裝，和/或從可拆卸介質(zhì)611被安裝。

附圖中的流程圖和框圖，圖示了按照本發(fā)明各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上，流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段、或代碼的一部分，上述模塊、程序段、或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意，在有些作為替換的實(shí)現(xiàn)中，方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如，兩個(gè)接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行，它們有時(shí)也可以按相反的順序執(zhí)行，這依所涉及的功能而定。也要注意的是，框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合，可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來(lái)實(shí)現(xiàn)，或者可以用專用硬件與計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。

描述于本發(fā)明實(shí)施例中所涉及到的單元可以通過(guò)軟件的方式實(shí)現(xiàn)，也可以通過(guò)硬件的方式來(lái)實(shí)現(xiàn)。所描述的單元也可以設(shè)置在處理器中，例如，可以描述為：一種處理器包括接收單元、提取單元、匹配單元、第一確定單元和更新單元。其中，這些單元的名稱在某種情況下并不構(gòu)成對(duì)該單元本身的限定。例如，接收單元還可以被描述為“接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)的單元”。

作為另一方面，本發(fā)明還提供了一種非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)，該非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是上述實(shí)施例中上述裝置中所包含的非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)；也可以是單獨(dú)存在，未裝配入終端中的非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)。上述非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有一個(gè)或者多個(gè)程序，當(dāng)上述一個(gè)或者多個(gè)程序被一個(gè)設(shè)備執(zhí)行時(shí)，使得上述設(shè)備：接收用戶終端發(fā)送的語(yǔ)音數(shù)據(jù)；提取語(yǔ)音數(shù)據(jù)中的聲紋特征向量；將聲紋特征向量與預(yù)先存儲(chǔ)的用戶的注冊(cè)聲紋向量進(jìn)行匹配，并生成聲紋特征向量與注冊(cè)聲紋向量之間的匹配度；確定匹配度是否大于等于預(yù)設(shè)的更新閾值；響應(yīng)于確定出匹配度大于等于預(yù)設(shè)的更新閾值，則利用聲紋特征向量和語(yǔ)音數(shù)據(jù)更新注冊(cè)聲紋向量。

以上描述僅為本發(fā)明的較佳實(shí)施例以及對(duì)所運(yùn)用技術(shù)原理的說(shuō)明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解，本發(fā)明中所涉及的發(fā)明范圍，并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案，同時(shí)也應(yīng)涵蓋在不脫離發(fā)明構(gòu)思的情況下，由上述技術(shù)特征或其等同特征進(jìn)行任意組合而形成的其它技術(shù)方案。例如上述特征與本發(fā)明中公開(kāi)的(但不限于)具有類似功能的技術(shù)特征進(jìn)行互相替換而形成的技術(shù)方案。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：葉璨;彭藝宇
技術(shù)所有人：百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

語(yǔ)音識(shí)別數(shù)據(jù)處理相關(guān)技術(shù)

語(yǔ)音報(bào)警裝置相關(guān)技術(shù)

處理數(shù)據(jù)的方法和裝置相關(guān)技術(shù)

隔爆型語(yǔ)音報(bào)警裝置相關(guān)技術(shù)

電梯語(yǔ)音報(bào)站裝置相關(guān)技術(shù)

智能語(yǔ)音交互體驗(yàn)裝置相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于處理語(yǔ)音數(shù)據(jù)的方法和裝置與流程