技術(shù)總結(jié)
本發(fā)明實施例公開了一種笑聲檢測方法及裝置,該方法用于電子設備,該方法包括:針對待檢測語音信號,將所述待檢測語音信號劃分為多個語音幀,并獲取每個語音幀的基因頻率及多維語音特征參數(shù);根據(jù)預先訓練完成的笑聲檢測模型及獲取的每個語音幀的基因頻率及多維語音特征參數(shù),預測每個語音幀是否為笑聲幀;識別與所述當前的語音幀相鄰的第一設定數(shù)量的語音幀中,預測結(jié)果為笑聲幀的語音幀的數(shù)量;當所述數(shù)量大于設定的數(shù)量閾值時,將所述當前的語音幀確定為笑聲幀。由于在本發(fā)明實施例中對于語音中每一幀的檢測引入與其相鄰的設定數(shù)量的多幀進行投票輔助判決,提高了笑聲檢測的準確性,方便用戶及時準確的獲取多媒體文件中的笑聲信息。
技術(shù)研發(fā)人員:謝湘;徐利強
受保護的技術(shù)使用者:北京理工大學
文檔號碼:201610755283
技術(shù)研發(fā)日:2016.08.29
技術(shù)公布日:2017.01.25