技術(shù)總結(jié)
本發(fā)明提供一種基于純凈語音與背景噪聲兩極建模的音頻類型檢測方法,包括步驟:S1、構(gòu)建純凈語音GMM模型以及純粹背景噪聲GMM模型;S2、計(jì)算純凈語音模型自身各高斯混元間的距離,判斷高斯混元是否位于特征重疊空間;S3、剔除位于特征重疊空間中的高斯混元,重新構(gòu)建純凈語音統(tǒng)計(jì)模型、純粹背景噪聲統(tǒng)計(jì)模型;S4、計(jì)算新的純凈語音統(tǒng)計(jì)模型、純粹背景噪聲統(tǒng)計(jì)模型的概率,以及估算音頻樣本信噪比;S5、根據(jù)計(jì)算得到的概率以及估算信噪比,構(gòu)建特征矢量且利用SVM模型進(jìn)行判決,將樣本判別為純凈語音、背景噪聲或含噪聲語音。本發(fā)明在降低GMM?SVM運(yùn)算量的同時(shí),能有效地區(qū)分純凈語音、純凈背景噪聲和含噪聲語音。
技術(shù)研發(fā)人員:賀前華;李洪滔;蔡梓文
受保護(hù)的技術(shù)使用者:華南理工大學(xué)
文檔號(hào)碼:201610847518
技術(shù)研發(fā)日:2016.09.23
技術(shù)公布日:2017.02.22