語音處理系統(tǒng)、裝置及方法

文檔序號(hào)：6516541閱讀：152來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

語音處理系統(tǒng)、裝置及方法
【專利摘要】本發(fā)明提供一種語音處理系統(tǒng)、裝置及方法，該系統(tǒng)包括用于選取音頻/視頻文件的檔案讀取單元、控制單元、標(biāo)簽文件生成單元、界面呈現(xiàn)單元，控制單元用于控制一語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別，以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份，標(biāo)簽文件生成單元用于生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件，界面呈現(xiàn)單元用于生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋，控制單元根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
【專利說明】語音處理系統(tǒng)、裝置及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種音頻文件或視頻文件處理裝置、系統(tǒng)及方法，尤其涉及ー種利用語者識(shí)別(speaker recognition)技術(shù)對(duì)音頻文件或視頻文件進(jìn)行處理的裝置、系統(tǒng)及方法。
【背景技術(shù)】
[0002]隨著便攜式影像拍攝裝置的普及，用戶的計(jì)算機(jī)中存儲(chǔ)了越來越多的視頻文件，對(duì)于ー個(gè)不熟悉視頻文件內(nèi)容的人來說，其可能需要花費(fèi)很多時(shí)間逐個(gè)觀看視頻文件才能找到其想要的內(nèi)容。

【發(fā)明內(nèi)容】

[0003]有鑒于此，有必要提供一種音頻文件或視頻文件處理裝置、系統(tǒng)及方法，其能夠?qū)σ纛l文件或視頻文件進(jìn)行處理并且生成相應(yīng)的標(biāo)簽文件，用戶可以方便的搜索到想要的內(nèi)容。
[0004]ー種語音處理系統(tǒng)，包括檔案讀取単元，所述檔案讀取單元用于選取音頻文件或視頻文件，還包括控制單元、標(biāo)簽文件生成單元、界面呈現(xiàn)單元，所述控制單元用于控制一語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別，以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份，所述標(biāo)簽文件生成単元用于生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件，所述界面呈現(xiàn)單元用于生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋，所述控制單元還根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
[0005]ー種語音處理裝置，包括處理器、存儲(chǔ)器及語音處理芯片，所述處理器用于執(zhí)行以下操作:根據(jù)用戶的操作選取音頻文件或視頻文件；控制所述語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別，以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份；生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件；生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋；以及根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
[0006]ー種語音處理方法，包括:根據(jù)用戶的操作選取音頻文件或視頻文件；控制ー語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別，以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份；生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件；生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋；以及根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。[0007]經(jīng)過本發(fā)明的語音處理裝置的處理后，音頻文件或視頻文件中的發(fā)言者的身份均被識(shí)別，且發(fā)言者的發(fā)言與不同時(shí)間段的對(duì)應(yīng)關(guān)系記錄在標(biāo)簽文件中，用戶可以方便的搜尋標(biāo)簽文件而能夠確定某一發(fā)言者在何時(shí)發(fā)言。
【專利附圖】

【附圖說明】
[0008]圖1為本發(fā)明的語音處理裝置的方框圖。
[0009]圖2為本發(fā)明的語音處理裝置生成的標(biāo)簽文件的示意圖。
[0010]圖3為本發(fā)明的語音處理裝置生成的界面的示意圖。
[0011]圖4為本發(fā)明的語音處理方法的流程圖。
[0012]主要元件符號(hào)說明
【權(quán)利要求】
1.ー種語音處理系統(tǒng)，包括檔案讀取単元，所述檔案讀取單元用于選取音頻文件或視頻文件，其特征在于，還包括控制單元、標(biāo)簽文件生成単元、界面呈現(xiàn)單元，所述控制単元用于控制一語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別，以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份，所述標(biāo)簽文件生成単元用于生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件，所述界面呈現(xiàn)單元用于生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋，所述控制単元還根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
2.如權(quán)利要求1所述的語音處理系統(tǒng)，其特征在干，當(dāng)所述檔案讀取單元讀取到視頻文件時(shí)，所述界面還包括每個(gè)預(yù)定時(shí)長的部份中的ー幀圖像。
3.ー種語音處理裝置，包括處理器、存儲(chǔ)器及語音處理芯片，其特征在于，所述處理器用于執(zhí)行以下操作: 根據(jù)用戶的操作選取音頻文件或視頻文件；控制所述語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別，以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份；生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件；生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋；以及根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
4.如權(quán)利要求3所述的語音處理裝置，其特征在干，當(dāng)所述檔案讀取單元讀取到視頻文件時(shí)，所述界面還包括每個(gè)預(yù)定時(shí)長的部份中的ー幀圖像。
5.ー種語音處理方法，包括: 根據(jù)用戶的操作選取音頻文件或視頻文件；控制ー語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別，以確定每個(gè)預(yù)定時(shí)長的部份中的發(fā)言者的身份；生成記錄每個(gè)預(yù)定時(shí)長的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件；生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋；以及根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長的部份進(jìn)行聲紋識(shí)別。
6.如權(quán)利要求5所述的語音處理方法，其特征在干，當(dāng)所述檔案讀取單元讀取到視頻文件時(shí)，所述界面還包括每個(gè)預(yù)定時(shí)長的部份中的ー幀圖像。
【文檔編號(hào)】G06F17/30GK103594086SQ201310507989
【公開日】2014年2月19日申請(qǐng)日期:2013年10月25日優(yōu)先權(quán)日:2013年10月25日
【發(fā)明者】林海興, 董信宗申請(qǐng)人:鴻富錦精密工業(yè)（深圳）有限公司, 鴻海精密工業(yè)股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：林海興;董信宗
技術(shù)所有人：鴻富錦精密工業(yè)（深圳）有限公司;鴻海精密工業(yè)股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

語音處理系統(tǒng)相關(guān)技術(shù)

濕熱處理的方法和裝置相關(guān)技術(shù)

送配電裝置系統(tǒng)調(diào)試相關(guān)技術(shù)

送配電裝置系統(tǒng)相關(guān)技術(shù)

電力系統(tǒng)自動(dòng)裝置相關(guān)技術(shù)

電力電子裝置及系統(tǒng)相關(guān)技術(shù)

地球系統(tǒng)數(shù)值模擬裝置相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語音處理系統(tǒng)、裝置及方法

語音處理系統(tǒng)、裝置及方法