技術(shù)總結(jié)
本發(fā)明公開了基于音頻事件和主題模型的音頻場景識別方法及其裝置,該方法包括訓練音頻場景分類模型;提取待識別音頻文檔的主題分布作為音頻特征,并將提取的音頻特征代入音頻場景分類模型中進行分類識別,最終輸出待識別音頻文檔的音頻場景類別。本發(fā)明提出以音頻事件作為統(tǒng)計單元,創(chuàng)新性地對音頻文檔?音頻事件共現(xiàn)矩陣進行主題分析,其與人類的音頻場景識別模式更加一致,因此本發(fā)明提出的音頻場景識別思路更加合理,更能提高識別的準確率。
技術(shù)研發(fā)人員:冷嚴;徐新艷;李登旺;程傳福
受保護的技術(shù)使用者:山東師范大學
文檔號碼:201610525055
技術(shù)研發(fā)日:2016.07.05
技術(shù)公布日:2016.12.07