亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語音處理系統(tǒng)、裝置及方法

文檔序號(hào):6516541閱讀:152來源:國知局
語音處理系統(tǒng)、裝置及方法
【專利摘要】本發(fā)明提供一種語音處理系統(tǒng)、裝置及方法,該系統(tǒng)包括用于選取音頻/視頻文件的檔案讀取單元、控制單元、標(biāo)簽文件生成單元、界面呈現(xiàn)單元,控制單元用于控制一語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別,以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份,標(biāo)簽文件生成單元用于生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件,界面呈現(xiàn)單元用于生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋,控制單元根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
【專利說明】語音處理系統(tǒng)、裝置及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種音頻文件或視頻文件處理裝置、系統(tǒng)及方法,尤其涉及ー種利用語者識(shí)別(speaker recognition)技術(shù)對(duì)音頻文件或視頻文件進(jìn)行處理的裝置、系統(tǒng)及方法。
【背景技術(shù)】
[0002]隨著便攜式影像拍攝裝置的普及,用戶的計(jì)算機(jī)中存儲(chǔ)了越來越多的視頻文件,對(duì)于ー個(gè)不熟悉視頻文件內(nèi)容的人來說,其可能需要花費(fèi)很多時(shí)間逐個(gè)觀看視頻文件才能找到其想要的內(nèi)容。

【發(fā)明內(nèi)容】

[0003]有鑒于此,有必要提供一種音頻文件或視頻文件處理裝置、系統(tǒng)及方法,其能夠?qū)σ纛l文件或視頻文件進(jìn)行處理并且生成相應(yīng)的標(biāo)簽文件,用戶可以方便的搜索到想要的內(nèi)容。
[0004]ー種語音處理系統(tǒng),包括檔案讀取単元,所述檔案讀取單元用于選取音頻文件或視頻文件,還包括控制單元、標(biāo)簽文件生成單元、界面呈現(xiàn)單元,所述控制單元用于控制一語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別,以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份,所述標(biāo)簽文件生成単元用于生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件,所述界面呈現(xiàn)單元用于生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋,所述控制單元還根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
[0005]ー種語音處理裝置,包括處理器、存儲(chǔ)器及語音處理芯片,所述處理器用于執(zhí)行以下操作:根據(jù)用戶的操作選取音頻文件或視頻文件;控制所述語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別,以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份;生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件;生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋;以及根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
[0006]ー種語音處理方法,包括:根據(jù)用戶的操作選取音頻文件或視頻文件;控制ー語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別,以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份;生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件;生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋;以及根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。[0007]經(jīng)過本發(fā)明的語音處理裝置的處理后,音頻文件或視頻文件中的發(fā)言者的身份均被識(shí)別,且發(fā)言者的發(fā)言與不同時(shí)間段的對(duì)應(yīng)關(guān)系記錄在標(biāo)簽文件中,用戶可以方便的搜尋標(biāo)簽文件而能夠確定某一發(fā)言者在何時(shí)發(fā)言。
【專利附圖】

【附圖說明】
[0008]圖1為本發(fā)明的語音處理裝置的方框圖。
[0009]圖2為本發(fā)明的語音處理裝置生成的標(biāo)簽文件的示意圖。
[0010]圖3為本發(fā)明的語音處理裝置生成的界面的示意圖。
[0011]圖4為本發(fā)明的語音處理方法的流程圖。
[0012]主要元件符號(hào)說明
【權(quán)利要求】
1.ー種語音處理系統(tǒng),包括檔案讀取単元,所述檔案讀取單元用于選取音頻文件或視頻文件,其特征在于,還包括控制單元、標(biāo)簽文件生成単元、界面呈現(xiàn)單元,所述控制単元用于控制一語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別,以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份,所述標(biāo)簽文件生成単元用于生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件,所述界面呈現(xiàn)單元用于生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋,所述控制単元還根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
2.如權(quán)利要求1所述的語音處理系統(tǒng),其特征在干,當(dāng)所述檔案讀取單元讀取到視頻文件時(shí),所述界面還包括每個(gè)預(yù)定時(shí)長的部份中的ー幀圖像。
3.ー種語音處理裝置,包括處理器、存儲(chǔ)器及語音處理芯片,其特征在于,所述處理器用于執(zhí)行以下操作: 根據(jù)用戶的操作選取音頻文件或視頻文件; 控制所述語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別,以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份; 生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件; 生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋;以及 根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
4.如權(quán)利要求3所述的語音處理裝置,其特征在干,當(dāng)所述檔案讀取單元讀取到視頻文件時(shí),所述界面還包括每個(gè)預(yù)定時(shí)長的部份中的ー幀圖像。
5.ー種語音處理方法,包括: 根據(jù)用戶的操作選取音頻文件或視頻文件; 控制ー語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別,以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份; 生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件; 生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋;以及 根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
6.如權(quán)利要求5所述的語音處理方法,其特征在干,當(dāng)所述檔案讀取單元讀取到視頻文件時(shí),所述界面還包括每個(gè)預(yù)定時(shí)長的部份中的ー幀圖像。
【文檔編號(hào)】G06F17/30GK103594086SQ201310507989
【公開日】2014年2月19日 申請(qǐng)日期:2013年10月25日 優(yōu)先權(quán)日:2013年10月25日
【發(fā)明者】林海興, 董信宗 申請(qǐng)人:鴻富錦精密工業(yè)(深圳)有限公司, 鴻海精密工業(yè)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1