技術(shù)總結(jié)
本發(fā)明涉及一種語音分割的方法及裝置,所述語音分割的方法包括:自動(dòng)應(yīng)答系統(tǒng)在接收到終端發(fā)送的混合語音時(shí),將所述混合語音分割成多個(gè)短語音段,并對各短語音段標(biāo)注對應(yīng)的說話人標(biāo)識;利用時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)對各說話人標(biāo)識對應(yīng)的短語音段建立聲紋模型,基于所述聲紋模型調(diào)整所述混合語音中對應(yīng)的分割邊界,以分割出各說話人標(biāo)識對應(yīng)的有效語音段。本發(fā)明能夠有效提高語音分割的精度,特別是對于對話交替頻繁、以及有交疊的語音,語音分割的效果較好。
技術(shù)研發(fā)人員:王健宗;郭卉;肖京
受保護(hù)的技術(shù)使用者:平安科技(深圳)有限公司
文檔號碼:201611176791
技術(shù)研發(fā)日:2016.12.19
技術(shù)公布日:2017.05.31