技術(shù)總結(jié)
本發(fā)明提出基于DNN模型和支持向量機(jī)模型的說(shuō)話(huà)人個(gè)數(shù)估計(jì)方法,屬于語(yǔ)音信號(hào)處理和深度學(xué)習(xí)領(lǐng)域。模型訓(xùn)練階段,首先獲取N個(gè)說(shuō)話(huà)人的訓(xùn)練語(yǔ)音數(shù)據(jù),得到深度神經(jīng)網(wǎng)絡(luò)DNN模型;然后獲取M個(gè)說(shuō)話(huà)人的訓(xùn)練語(yǔ)音數(shù)據(jù),每個(gè)說(shuō)話(huà)人的梅爾倒譜特征對(duì)應(yīng)DNN模型的N個(gè)輸出概率,組成M個(gè)說(shuō)話(huà)人的N維特征,建立M個(gè)支持向量機(jī)SVM模型;說(shuō)話(huà)人個(gè)數(shù)估計(jì)階段,將每條待測(cè)語(yǔ)音數(shù)據(jù)的梅爾倒譜特征輸入DNN模型得到N維特征并依次輸入M個(gè)SVM模型中評(píng)分,得分最高的SVM模型即為該條待測(cè)語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的類(lèi)別,類(lèi)別總個(gè)數(shù)即為估計(jì)的說(shuō)話(huà)人個(gè)數(shù)。該方法解決多說(shuō)話(huà)人場(chǎng)景中說(shuō)話(huà)人個(gè)數(shù)計(jì)算不準(zhǔn)確的問(wèn)題,提高語(yǔ)音數(shù)據(jù)中說(shuō)話(huà)人個(gè)數(shù)估計(jì)的準(zhǔn)確率。
技術(shù)研發(fā)人員:何亮;徐燦;陳仙紅;劉藝;田垚;劉巍巍;劉加
受保護(hù)的技術(shù)使用者:清華大學(xué)
文檔號(hào)碼:201710123753
技術(shù)研發(fā)日:2017.03.03
技術(shù)公布日:2017.06.27