技術(shù)編號:7812366
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。本發(fā)明是,包括以下步驟第一步,掃描一遍視頻,通過小波變換和自相關(guān)函數(shù)法檢測出基音頻率;第二步,尋找基音頻率的平均值μ和標準差σ,作為講話人的基因頻率;第三步,根據(jù)基音頻率,進行初劃分,劃分為時間軸單元;第四步,對于每一個時間軸單元,計算其基音頻率相似性A及頻譜相似性B,對于A,B取兩個閾值,當A和B均大于這兩個閾值時,認為是演講人在說話,排除非演講人說話的時間軸,得到的時間軸為演講人說話的時間軸。本發(fā)明是一種針對視頻講座可以自動產(chǎn)生出高精度的講座視頻時間軸...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。