專利名稱:信息檢索方法、信息檢索設(shè)備、信息存儲(chǔ)方法和信息存儲(chǔ)設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于從音頻信號(hào)檢索特定樂(lè)器、人或動(dòng)物的聲音和/或從視頻信號(hào)檢索特定人或特定場(chǎng)景的圖象的方法和設(shè)備。本發(fā)明還涉及用于存儲(chǔ)利用該檢索方法的信息的方法和設(shè)備。
背景技術(shù):
例如,可能有這樣的需要,即檢索表示會(huì)議的所記錄討論的特定部分的音頻信號(hào)。
例如,按照慣例,表示會(huì)議的所記錄討論并被該記錄的用戶需要的特定部分音頻信號(hào)可以通過(guò)在記錄的時(shí)候?qū)μ囟ú糠址胖脴?biāo)記來(lái)檢索,這樣用戶可以在他或她希望的任何時(shí)間容易地檢索該部分記錄。
還知道一種記錄從記錄的開(kāi)始就帶有計(jì)數(shù)器讀數(shù)(readings)或時(shí)刻(timings)(通常以秒、分和時(shí)來(lái)表示)的聲音信號(hào)的方法,這樣聲音信號(hào)的任何部分都有和它相連的對(duì)應(yīng)的數(shù)值。
然而,不管是放標(biāo)記的方法還是記錄計(jì)數(shù)器讀數(shù)的方法,考慮到他或她以后將必須檢索和使用所記錄的音頻信號(hào)的部分,該用戶必須選擇上面的方法的一種。因此,這些方法伴隨著下面的問(wèn)題1.用戶必須進(jìn)行獨(dú)立的和繁重的放置標(biāo)記或記錄計(jì)數(shù)器讀數(shù)或時(shí)刻的操作。
2.用戶不能檢索沒(méi)有放置標(biāo)記或沒(méi)有計(jì)數(shù)器讀數(shù)被記錄的音頻信號(hào)的任何部分。
3.會(huì)議的特定發(fā)言者的發(fā)言信號(hào)部分或音樂(lè)會(huì)的特定樂(lè)器的音調(diào)不能檢索。換言之,會(huì)議的特定發(fā)言者的發(fā)言或音樂(lè)會(huì)的特定樂(lè)器的音調(diào)不能被分出。
4.由于適合的音頻信號(hào)必須被帶有標(biāo)記或計(jì)數(shù)器讀數(shù)地記錄,不可能通過(guò)多個(gè)檢索器,不記錄一部分音頻信號(hào)而檢索和分類它。
發(fā)明地公開(kāi)考慮到上面的情況,因此,本發(fā)明的一個(gè)目的是提供一種方法和一種裝置,能夠從所記錄的音頻信號(hào)中檢索特定發(fā)言者的發(fā)言或特定樂(lè)器的聲調(diào)的部分,而不需要在記錄該音頻信號(hào)時(shí)放置標(biāo)記或記錄計(jì)數(shù)器讀數(shù)或時(shí)刻的操作。
本發(fā)明的另一個(gè)目的是提供一種方法和一種裝置,能夠通過(guò)使用作為檢索線索的信號(hào)的部分,檢索從特定聲源產(chǎn)生的音頻信號(hào)的特定部分。
根據(jù)本發(fā)明,本發(fā)明的上述目的和其它目的的實(shí)現(xiàn)是通過(guò)提供一種聲音檢索方法,用于通過(guò)比較從作為檢索關(guān)鍵碼(key)操作的各個(gè)音頻信號(hào)獲得的并依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的所述音頻信號(hào)而獲得的聲音特性參數(shù)并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào)。
根據(jù)本發(fā)明,也提供了一種聲音信息存儲(chǔ)方法,用于在記錄介質(zhì)上記錄輸入音頻信號(hào),和通過(guò)比較從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的并依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的所述音頻信號(hào)而獲得的聲音特性參數(shù)并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào),從而記錄與所述檢索關(guān)鍵碼聯(lián)系的檢索處理的結(jié)果和在所述記錄介質(zhì)上用于記錄所述輸入音頻信號(hào)的位置。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析要分析的音頻信號(hào)和獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),提取要分析的音頻信號(hào)的一部分,其類似作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);和結(jié)果顯示裝置,用于顯示所述檢索處理的結(jié)果。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析要分析的音頻信號(hào)和獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),提取要分析的音頻信號(hào)的一部分,其類似作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);和重現(xiàn)裝置,用于根據(jù)所述檢索裝置的檢索處理的結(jié)果,提取和僅重現(xiàn)所述類似部分。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音信息存儲(chǔ)設(shè)備,包括記錄裝置,用于在記錄介質(zhì)上記錄輸入音頻信號(hào);聲音特性參數(shù)分析裝置,用于分析要分析的所述輸入音頻信號(hào)和獲得依賴于音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);和檢索裝置,用于比較作為檢索關(guān)鍵碼操作的一個(gè)或多于一個(gè)的音頻信號(hào)的聲音特性參數(shù)和輸入音頻信號(hào)的所述聲音特性參數(shù),檢索要分析的輸入音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào),所述檢索裝置的檢索處理的結(jié)果被記錄,以便與所述檢索關(guān)鍵碼和在所述記錄介質(zhì)上用于記錄所述輸入音頻信號(hào)的位置相聯(lián)系。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音/圖象信息檢索方法,用于檢索包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的一部分,所述方法包括通過(guò)比較從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的及依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的所述音頻信號(hào)而獲得的聲音特性參數(shù)并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào),并產(chǎn)生所檢索的部分作為對(duì)所述輸入信號(hào)進(jìn)行的檢索操作的結(jié)果。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音/圖象信息檢索方法,用于檢索包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的一部分,所述方法包括通過(guò)比較從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的及依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的所述音頻信號(hào)而獲得的聲音特性參數(shù)并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào),也通過(guò)比較作為檢索關(guān)鍵碼操作和示出該視頻信號(hào)的圖象的特性的每個(gè)檢索關(guān)鍵碼圖象特性參數(shù)和通過(guò)分析要分析的所述輸入的視頻獲得的圖象特性參數(shù),來(lái)檢索所述要分析的所述輸入信號(hào)的視頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的圖象,所述輸入信號(hào)的一部分基于對(duì)所述音頻信號(hào)進(jìn)行的檢索處理的結(jié)果和對(duì)所述視頻信號(hào)進(jìn)行的檢索處理的結(jié)果被檢索。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音/圖象信息存儲(chǔ)方法,用于在記錄介質(zhì)上記錄包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào),通過(guò)比較從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的及依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的所述音頻信號(hào)而獲得的聲音特性參數(shù)并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào),記錄所述檢索處理的結(jié)果,以便與所述檢索關(guān)鍵碼和在所述記錄介質(zhì)上用于記錄所述輸入音頻信號(hào)的位置相聯(lián)系。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音/圖象信息存儲(chǔ)方法,用于在記錄介質(zhì)上記錄包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào),通過(guò)比較從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的及依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的所述音頻信號(hào)而獲得的聲音特性參數(shù)并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào),也通過(guò)比較作為檢索關(guān)鍵碼操作及示出該視頻信號(hào)的圖象的特性的每個(gè)檢索關(guān)鍵碼圖象特性參數(shù)和通過(guò)分析要分析的所述輸入的視頻獲得的圖象特性參數(shù),來(lái)檢索所述要分析的所述輸入信號(hào)的視頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的圖象,記錄對(duì)所述音頻信號(hào)和所述視頻信號(hào)進(jìn)行的檢索處理的結(jié)果,以便與所述檢索關(guān)鍵碼和在所述記錄介質(zhì)上用于記錄所述輸入音頻信號(hào)的位置相聯(lián)系。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音/圖象信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào),并獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),并檢索要分析的音頻信號(hào)的一部分,其類似作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);和結(jié)果顯示裝置,用于顯示所述檢索處理的結(jié)果。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音/圖象信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào),并獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),和檢索要分析的音頻信號(hào)的一部分,其類似作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);和重現(xiàn)裝置,用于提取和重現(xiàn)對(duì)應(yīng)于所述類似部分的所述輸入信號(hào)的部分。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音/圖象信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào),并獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);聲音部分檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),和檢索要分析的音頻信號(hào)的一部分,其類似作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);圖象部分檢索裝置,用于通過(guò)比較作為檢索關(guān)鍵碼操作及示出該視頻信號(hào)的圖象的特性的每個(gè)檢索關(guān)鍵碼圖象特性參數(shù)和通過(guò)分析要分析的所述輸入的視頻獲得的圖象特性參數(shù),來(lái)檢索所述要分析的所述輸入信號(hào)的視頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的圖象;和結(jié)果顯示裝置,用于顯示所述聲音部分檢索裝置的檢索處理的結(jié)果和所述圖象部分檢索裝置的的檢索處理的結(jié)果。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音/圖象信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào),和獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);聲音部分檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),并檢索要分析的音頻信號(hào)的一部分,其類似作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);圖象部分檢索裝置,用于通過(guò)比較作為檢索關(guān)鍵碼操作及示出該視頻信號(hào)的圖象的特性的每個(gè)檢索關(guān)鍵碼圖象特性參數(shù)和通過(guò)分析要分析的所述輸入的視頻獲得的圖象特性參數(shù),來(lái)檢索所述輸入信號(hào)的視頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的圖象;和重現(xiàn)裝置,用于提取和重現(xiàn)基于所述聲音部分檢索裝置的檢索處理的結(jié)果和所述圖象部分檢索裝置的檢索處理的結(jié)果確定的所述輸入信號(hào)的部分。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音/圖象信息存儲(chǔ)設(shè)備,包括記錄裝置,用于在記錄介質(zhì)上記錄包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào);聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào)和獲得依賴于音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);和聲音部分檢索裝置,用于比較作為檢索關(guān)鍵碼操作的一個(gè)或多于一個(gè)的音頻信號(hào)的聲音特性參數(shù)和所述輸入信號(hào)的音頻信號(hào)的所述聲音特性參數(shù),并檢索所述輸入信號(hào)的音頻信號(hào)的一部分,其類似于作為檢索關(guān)鍵碼操作的音頻信號(hào),所述聲音部分檢索裝置的檢索處理的結(jié)果被記錄,以便與所述檢索關(guān)鍵碼和在所述記錄介質(zhì)上用于記錄所述輸入信號(hào)的位置相聯(lián)系。
在本發(fā)明的另一個(gè)方面,也提供了一種聲音/圖象信息存儲(chǔ)設(shè)備,包括記錄裝置,用于在記錄介質(zhì)上記錄包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào);聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào)和獲得依賴于音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);聲音部分檢索裝置,用于比較作為檢索關(guān)鍵碼操作的一個(gè)或多于一個(gè)的音頻信號(hào)的聲音特性參數(shù)和所述輸入信號(hào)的音頻信號(hào)的所述聲音特性參數(shù),并檢索所述輸入信號(hào)的音頻信號(hào)的一部分,其類似于作為檢索關(guān)鍵碼操作的音頻信號(hào);和圖象部分檢索裝置,用于通過(guò)比較作為檢索關(guān)鍵碼操作及示出該視頻信號(hào)的圖象的特性的每個(gè)檢索關(guān)鍵碼圖象特性參數(shù)和通過(guò)分析要分析的所述輸入的視頻獲得的圖象特性參數(shù),來(lái)檢索所述輸入信號(hào)的視頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的圖象,所述聲音部分檢索裝置和所述圖象部分檢索裝置的檢索處理的結(jié)果被記錄,以便與所述檢索關(guān)鍵碼和在所述記錄介質(zhì)上用于記錄所述輸入信號(hào)的位置相聯(lián)系。
圖1是根據(jù)本發(fā)明的聲音檢索設(shè)備的第一個(gè)實(shí)施例的示意框圖;圖2A和2B分別示出男人語(yǔ)音的典型頻率分量分布特性曲線和瞬時(shí)波形;圖3A和3B分別示出女人語(yǔ)音的典型頻率分量分布特性曲線和瞬時(shí)波形;圖4A和4B示出薩克斯的典型頻率分量分布特性曲線和瞬時(shí)波形;圖5A和5B示出低音電吉他的典型頻率分量分布特性曲線和瞬時(shí)波形;圖6是第一個(gè)實(shí)施例的登記檢索關(guān)鍵碼的操作的流程圖;圖7是第一個(gè)實(shí)施例的檢索操作的流程圖;圖8A和8B是第一個(gè)實(shí)施例的檢索操作的結(jié)果的一些顯示例;圖9是第一個(gè)實(shí)施例的檢索操作的結(jié)果的另一個(gè)顯示例;圖10是第一個(gè)實(shí)施例的檢索操作的結(jié)果的另一個(gè)顯示例;圖11是根據(jù)本發(fā)明的聲音檢索設(shè)備的第二個(gè)實(shí)施例的示意框圖;圖12是根據(jù)本發(fā)明的聲音檢索設(shè)備的第三個(gè)實(shí)施例的示意框圖;圖13是根據(jù)本發(fā)明的聲音檢索設(shè)備的第四個(gè)實(shí)施例的示意框圖;圖14是根據(jù)本發(fā)明的聲音檢索設(shè)備的第五個(gè)實(shí)施例的主要部分的示意圖示;圖15是根據(jù)本發(fā)明的聲音檢索設(shè)備的第五個(gè)實(shí)施例的主要部分的操作的流程圖;圖16是根據(jù)本發(fā)明的聲音/圖象信息檢索設(shè)備的第一個(gè)實(shí)施例的示意框圖和圖17是根據(jù)本發(fā)明的聲音/圖象信息檢索設(shè)備的第一個(gè)實(shí)施例的示意圖示。
實(shí)現(xiàn)本發(fā)明的最佳模式現(xiàn)在,將參考附圖描述本發(fā)明,附圖示出了實(shí)現(xiàn)本發(fā)明的最佳模式。
下面將參考附圖描述本發(fā)明的一些優(yōu)選實(shí)施例。
圖1是本發(fā)明的第一個(gè)實(shí)施例的示意框圖。該第一實(shí)施例適用于記錄要檢查的輸入音頻信號(hào)和重現(xiàn)所記錄的信號(hào),該信號(hào)通常表示由麥克風(fēng)拾取的聲音。該實(shí)施例也適用于檢索所重現(xiàn)的音頻信號(hào)。另外,該實(shí)施例也適用于從所輸入的或重現(xiàn)的要檢查的音頻信號(hào)中提取出作為檢索關(guān)鍵碼操作的音頻信號(hào),存儲(chǔ)它們,并通過(guò)使用所存儲(chǔ)的作為檢索關(guān)鍵碼操作的音頻信號(hào)來(lái)實(shí)際上檢查所輸入的或重現(xiàn)的音頻信號(hào),以及在實(shí)施例的顯示部分上顯示檢查的輸出。
所輸入的音頻信號(hào)通過(guò)輸入端11被供給開(kāi)關(guān)電路SW1。當(dāng)記錄輸入音頻信號(hào)時(shí),由從控制部分10供給的開(kāi)關(guān)控制信號(hào)將開(kāi)關(guān)電路SW1切換到a端的一側(cè);當(dāng)從輸入音頻信號(hào)中提取作為檢索關(guān)鍵碼操作的音頻信號(hào)時(shí),由也從控制部分10供給的開(kāi)關(guān)控制信號(hào)將開(kāi)關(guān)電路SW1切換到b端的一側(cè)。
在開(kāi)關(guān)電路SW1的a端的一側(cè)獲得的音頻信號(hào)被記錄在記錄介質(zhì)13上,記錄介質(zhì)13通常是記憶卡、磁盤、諸如磁光盤(magneto-optical disk)的光盤或作為音頻信號(hào)記錄部分12的硬盤。當(dāng)用戶經(jīng)由關(guān)鍵碼操作部分20將一記錄指令給它時(shí),該實(shí)施例的音頻信號(hào)記錄部分12被從控制部分10供給的控制信號(hào)激活以實(shí)現(xiàn)記錄操作。
經(jīng)由輸入端11進(jìn)入的輸入音頻信號(hào)也被供給開(kāi)關(guān)電路SW2的輸入端IN。音頻放大器15和揚(yáng)聲器16被安排在后面,并連接到開(kāi)關(guān)電路SW2,除了當(dāng)實(shí)施例被操作用于信號(hào)重現(xiàn)(后面將描述)時(shí)外,開(kāi)關(guān)電路SW2被來(lái)自控制部分10的開(kāi)關(guān)控制信號(hào)切換到輸入端IN一側(cè)。因此,如果該實(shí)施例不用作信號(hào)重現(xiàn),則輸入音頻信號(hào)經(jīng)由音頻放大器15被供給到揚(yáng)聲器16,以重現(xiàn)音頻信號(hào)的聲音。
當(dāng)用戶經(jīng)由關(guān)鍵碼操作部分20給出用于信號(hào)重現(xiàn)的指令時(shí),音頻信號(hào)重現(xiàn)部分14被來(lái)自該實(shí)施例的控制部分10的控制信號(hào)激活,所重現(xiàn)的音頻信號(hào)和從記錄介質(zhì)13讀取的音頻信號(hào)被供給到開(kāi)關(guān)電路SW2的輸入端PB。在信號(hào)重現(xiàn)的操作處理中,開(kāi)關(guān)電路SW2由來(lái)自控制部分10的開(kāi)關(guān)控制信號(hào)切換到輸入端PB的一側(cè)。因此,所重現(xiàn)的音頻信號(hào)經(jīng)由音頻放大器15被供給到揚(yáng)聲器16,以重現(xiàn)音頻信號(hào)的聲音。
在開(kāi)關(guān)電路SW1的a端一側(cè)獲得的輸入音頻信號(hào)也被供給到開(kāi)關(guān)電路SW3的一個(gè)輸入端,即輸入端d。開(kāi)關(guān)電路SW3的另一個(gè)輸入端,即輸入端c被供給來(lái)自音頻信號(hào)重現(xiàn)部分14的所重現(xiàn)的音頻信號(hào)。
開(kāi)關(guān)電路SW3適合于根據(jù)由用戶經(jīng)由關(guān)鍵碼操作部分20給出的用于音頻信號(hào)檢查的指令,來(lái)選擇要檢查的音頻信號(hào)。
從開(kāi)關(guān)電路SW3獲得的要檢查的音頻信號(hào)然后被供給到聲音特性參數(shù)分析部分21,聲音特性參數(shù)分析部分21通常分析聲音特性參數(shù),該聲音特性參數(shù)依賴于聲源的結(jié)構(gòu)的因素,比如聲音發(fā)射器的結(jié)構(gòu)和回聲系統(tǒng),其正常情況下是彼此不同的??梢杂糜诒景l(fā)明的目的的聲音特性參數(shù)包括音調(diào)頻率、音調(diào)頻率的高次諧波頻率、共振頻率、倒譜信息、線性預(yù)測(cè)系數(shù)及其殘余信號(hào)和PARCOR系數(shù)。
圖2A和2B分另示出男人語(yǔ)音的典型頻率分量分布特性曲線和瞬時(shí)波形,而圖3A和3B則分別示出女人語(yǔ)音的典型頻率分量分布特性曲線和瞬時(shí)波形。圖4A和4B示出薩克斯的典型頻率分量分布特性曲線和瞬時(shí)波形,而圖5A和5B則示出低音電吉他的典型頻率分量分布特性曲線和瞬時(shí)波形。
雖然圖2A到5B只示出了簡(jiǎn)單的頻率分量分布特性曲線和瞬時(shí)波形,但是在大多數(shù)聲音中也可以找到其他的聲學(xué)特性,諸如音調(diào)頻率、音調(diào)頻率的高次諧波頻率、共振頻率等。
除了頻率分量分布特性曲線,諸如線性預(yù)測(cè)系數(shù)及其殘余信號(hào)的聲音特性參數(shù)也可以用于本發(fā)明的目的。
我們也知道,作為音調(diào)頻率的瞬時(shí)波動(dòng)而獲得的語(yǔ)調(diào)參數(shù)也可以被有效地用于表征音頻信號(hào)?;谡Z(yǔ)調(diào),可以從同一個(gè)人的發(fā)言中識(shí)別不同的狀況。例如,當(dāng)一個(gè)人悲傷和/或難過(guò)時(shí),他或她可能以低音調(diào)和低語(yǔ)調(diào)來(lái)說(shuō)話。因此,關(guān)于語(yǔ)調(diào)的信息也可以作為聲音特性參數(shù)用于本發(fā)明的目的。
來(lái)自聲音特性參數(shù)分析部分21的聲音特性參數(shù)被供給到相似性確定部分22,相似性確定部分22通過(guò)計(jì)算來(lái)確定作為檢索關(guān)鍵碼操作的音頻信號(hào)的每個(gè)聲音特性參數(shù)(以下稱為檢索關(guān)鍵碼聲音特性參數(shù))和來(lái)自聲音特性參數(shù)分析部分21的要檢查的音頻信號(hào)的每個(gè)聲音特性參數(shù)的相似性(的程度)。
通過(guò)計(jì)算來(lái)確定相似性確定部分22的兩個(gè)聲音特性參數(shù)的相似性的操作,不同于語(yǔ)音識(shí)別中基于聲音的時(shí)序波形特性曲線的操作,而是通過(guò)計(jì)算確定是否諸如聲音發(fā)射器的結(jié)構(gòu)和回聲系統(tǒng)的一些聲音的結(jié)構(gòu)因素類似于作為檢索關(guān)鍵碼操作的音頻信號(hào)(以下稱為檢索關(guān)鍵碼音頻信號(hào))的聲音的結(jié)構(gòu)因素。如果音頻信號(hào)是高速重現(xiàn)的,則可以實(shí)現(xiàn)這樣的通過(guò)計(jì)算確定兩個(gè)聲音特性參數(shù)的相似性的操作。
現(xiàn)在,假定通常包括音調(diào)頻率和共振頻率的三個(gè)參數(shù)(x,y,z)被用于相似性確定操作的聲音特性參數(shù)。
同時(shí)假定,在時(shí)間段TW中作為檢索關(guān)鍵碼操作的音頻信號(hào)的檢索關(guān)鍵碼聲音特性參數(shù)是(x0,y0,z0),要檢查的音頻信號(hào)的對(duì)應(yīng)的聲音特性參數(shù)是(xi,yi,zi)。然后,相似性確定部分22通過(guò)計(jì)算確定隔開(kāi)它們的距離S作為它們之間的相似性。通過(guò)考慮要使用的參數(shù)的數(shù)目和類型以及相似性確定操作所需要的時(shí)間,時(shí)間段TW被預(yù)先選擇
S=sqrt{(xi-x0)2+(yi-y0)2+(zi-z0)2}其中sqrt是括號(hào)中的值的平方根。
應(yīng)該理解,S的值越小,兩個(gè)音頻信號(hào)的相似性越大。在該實(shí)施例中,對(duì)于每個(gè)預(yù)先選擇的時(shí)間段TW相似性確定部分22通過(guò)計(jì)算確定距離S,當(dāng)通過(guò)計(jì)算所確定的距離S小于預(yù)定值Sth時(shí),判定要檢查的音頻信號(hào)類似于作為檢索關(guān)鍵碼操作的音頻信號(hào),當(dāng)所確定的距離S不小于預(yù)定值Sth時(shí),判定要檢查的音頻信號(hào)不類似于作為檢索關(guān)鍵碼操作的音頻信號(hào)由于值S本身表示兩個(gè)音頻信號(hào)的相似性的程度,直接輸出距離S也是可行的。
關(guān)于兩個(gè)音頻信號(hào)的相似性的判斷的相似性確定部分22的輸出然后經(jīng)由顯示控制部分23被供給到顯示部分24。顯示控制部分23使顯示部分24的顯示屏顯示相似性確定部分22的關(guān)于相似性判斷的輸出,從要檢查的音頻信號(hào)的開(kāi)始,以時(shí)間為單位。具體說(shuō),它通??梢燥@示條形圖,如圖8A和8B所示,其將在后面描述。
現(xiàn)在,將描述該實(shí)施例的檢索關(guān)鍵碼。在該實(shí)施例中,要用作檢索關(guān)鍵碼的音頻信號(hào)被從輸入音頻信號(hào)或重現(xiàn)的音頻信號(hào)中提取,并預(yù)先存儲(chǔ)在存儲(chǔ)器部分32中。
在開(kāi)關(guān)電路SW1的b端獲得的輸入音頻信號(hào)被供給到開(kāi)關(guān)電路SW4的輸入端f,來(lái)自音頻信號(hào)重現(xiàn)部分14的所重現(xiàn)的音頻信號(hào)被供給到開(kāi)關(guān)電路SW4的輸入端e,開(kāi)關(guān)電路SW4適于從輸入音頻信號(hào)或從所重現(xiàn)的音頻信號(hào)提取作為檢索關(guān)鍵碼操作的音頻信號(hào),根據(jù)由用戶經(jīng)由關(guān)鍵碼操作部分20通過(guò)來(lái)自控制部分10的控制信號(hào)輸入的用于選擇它們之一的指令被切換。
來(lái)自開(kāi)關(guān)電路SW4的音頻信號(hào)被提供到檢索關(guān)鍵碼音頻信號(hào)提取/存儲(chǔ)部分31。根據(jù)用戶在關(guān)鍵碼操作部分20的關(guān)鍵碼操作,檢索關(guān)鍵碼音頻信號(hào)提取/存儲(chǔ)部分31被供給來(lái)自控制部分10的控制信號(hào)。
該實(shí)施側(cè)的用戶收聽(tīng)來(lái)自揚(yáng)聲器的輸入音頻信號(hào)或所重現(xiàn)的音頻信號(hào)的所重現(xiàn)的輸出聲音,當(dāng)聽(tīng)到他或她想用作檢索關(guān)鍵碼的部分時(shí),操作關(guān)鍵碼操作部分20的檢索關(guān)鍵碼指定關(guān)鍵碼(未示出)。然后,該實(shí)施例提取對(duì)應(yīng)于包括關(guān)鍵碼操作的時(shí)間的預(yù)定時(shí)間段TW的一部分音頻信號(hào),并存儲(chǔ)該部分在檢索關(guān)鍵碼存儲(chǔ)器32中,檢索關(guān)鍵碼存儲(chǔ)器32具有存儲(chǔ)區(qū)域,每個(gè)大小對(duì)應(yīng)于檢索關(guān)鍵碼的大小,這樣檢索關(guān)鍵碼被存儲(chǔ)在相應(yīng)的存儲(chǔ)區(qū)域。
檢索關(guān)鍵碼音頻信號(hào)提取/存儲(chǔ)部分31有一緩中存儲(chǔ)器,這樣時(shí)間段TW在關(guān)鍵碼操作的時(shí)間之前一點(diǎn)開(kāi)始。然后,對(duì)應(yīng)于由用戶指定的時(shí)間段TW的音頻信號(hào)的部分被存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32中作為檢索關(guān)鍵碼音頻信號(hào)。
檢索關(guān)鍵碼存儲(chǔ)器32可以存儲(chǔ)幾個(gè)檢索關(guān)鍵碼,每次當(dāng)用戶指定新的檢索關(guān)鍵碼音頻信號(hào)時(shí),檢索關(guān)鍵碼存儲(chǔ)器32的檢索關(guān)鍵碼存儲(chǔ)區(qū)域由來(lái)自控制部分10的控制信號(hào)更新。因此,根據(jù)用戶的指令從檢索關(guān)鍵碼提取/存儲(chǔ)部分31提取的時(shí)間段TW的檢索關(guān)鍵碼音頻信號(hào),根據(jù)來(lái)自控制部分10的與檢索關(guān)鍵碼存儲(chǔ)區(qū)域的更新同步的開(kāi)關(guān)控制信號(hào),被存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32的檢索關(guān)鍵碼存儲(chǔ)區(qū)域。
盡管未圖示,存儲(chǔ)相應(yīng)的檢索關(guān)鍵碼音頻信號(hào)的檢索關(guān)鍵碼存儲(chǔ)器32的檢索關(guān)鍵碼存儲(chǔ)區(qū)域也可以被輸入,作為經(jīng)由關(guān)鍵碼操作部分20輸入的備忘錄,輸入的備忘錄可以以表格的形式被顯示在顯示部分24上,該表格示出分配給存儲(chǔ)檢索關(guān)鍵碼音頻信號(hào)的存儲(chǔ)區(qū)域的號(hào)碼。因此,用戶可以通過(guò)指定存儲(chǔ)他或她想使用的檢索關(guān)鍵碼存儲(chǔ)區(qū)域的號(hào)碼,使用所希望的檢索關(guān)鍵碼以檢索音頻信號(hào)。
具體說(shuō),當(dāng)用戶經(jīng)由關(guān)鍵碼操作部分20,選擇檢索模式和指定存儲(chǔ)檢索關(guān)鍵碼音頻信號(hào)的檢索關(guān)鍵碼存儲(chǔ)區(qū)域的號(hào)碼時(shí),開(kāi)關(guān)電路SW6由來(lái)自控制部分10的控制信號(hào)操作,作為檢索關(guān)鍵碼操作的音頻信號(hào)被檢索關(guān)鍵碼音頻信號(hào)讀取部分33從指定的檢索關(guān)鍵碼存儲(chǔ)器32的檢索關(guān)鍵碼存儲(chǔ)區(qū)域讀取。
所讀取的檢索關(guān)鍵碼音頻信號(hào)然后被供給到檢索關(guān)鍵碼聲音特性參數(shù)分析部分34,并由其分析以獲得作為檢索關(guān)鍵碼操作的音頻信號(hào)的檢索關(guān)鍵碼聲音特性參數(shù)。所獲得的檢索關(guān)鍵碼聲音特性參數(shù)然后被供給到上述的相似性確定部分22,被用于檢索預(yù)定時(shí)間段TW的要檢查的音頻信號(hào)。
現(xiàn)在,具有上述結(jié)構(gòu)的音頻信號(hào)檢索設(shè)備的操作將被詳細(xì)討論。
在上述實(shí)施例的情況中,每個(gè)檢索關(guān)鍵碼在其被用于實(shí)際檢索操作之前被登記。如上所述,每個(gè)檢索關(guān)鍵碼被存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32中,并被登記為音頻信號(hào)。圖6是登記檢索關(guān)鍵碼的操作的流程圖,其中控制部分10起了主要作用。當(dāng)用戶經(jīng)由關(guān)鍵碼操作部分20選擇檢索關(guān)鍵碼登記模式時(shí),圖6的處理流程開(kāi)始?,F(xiàn)在,將參考圖6描述登記檢索關(guān)鍵碼的操作。
首先,控制部分10確定用戶經(jīng)由關(guān)鍵碼操作部分20所做的模式選擇。具體說(shuō),它確定是否用戶選擇從輸入音頻信號(hào)提取檢索關(guān)鍵碼的模式或從所重現(xiàn)的音頻信號(hào)提取檢索關(guān)鍵碼的模式(步驟S101)。
如果確定要從輸入音頻信號(hào)提取檢索關(guān)鍵碼,則控制部分10分別切換開(kāi)關(guān)電路SW1、SW2和SW4到輸出端b的一側(cè)、輸入端IN的一側(cè)和輸入端f的一側(cè)(步驟S102)。
另一方面,如果確定要從所重現(xiàn)的音頻信號(hào)提取檢索關(guān)鍵碼,則控制部分10分別切換開(kāi)關(guān)電路SW1、SW2和SW4到輸出端a的一側(cè)、輸入端PB的一例和輸入端e的一側(cè)(步驟S103)。
在步驟S102或S103后,控制部分10前進(jìn)到步驟S104,在那里它等待經(jīng)由關(guān)鍵碼操作部分20給出的用戶的指令,指定要用作檢索關(guān)鍵碼的音頻信號(hào)的部分。同時(shí),要從其提取檢索關(guān)鍵碼的音頻信號(hào)被經(jīng)由音頻放大器15供給到揚(yáng)聲器16,最初的聲音從揚(yáng)聲器16被重現(xiàn),以便用戶可以經(jīng)由關(guān)鍵碼操作部分20輸入他的或她的指令,以指定要用作檢索關(guān)鍵碼的音頻信號(hào)的每個(gè)部分,其可以是會(huì)議的特定發(fā)言者的部分發(fā)言。
然后,在步驟S104檢測(cè)到由用戶輸入的用于提取作為檢索關(guān)鍵碼的一部分音頻信號(hào)的指令后,控制部分10更新檢索關(guān)鍵碼存儲(chǔ)器32的檢索關(guān)鍵碼存儲(chǔ)區(qū)域(步驟S105),控制檢索關(guān)鍵碼音頻信號(hào)提取/存儲(chǔ)部分31以便使它提取對(duì)應(yīng)于預(yù)定時(shí)間段TW的音頻信號(hào)的部分(步驟S106)。然后,控制部分10在檢索關(guān)鍵碼存儲(chǔ)器32的更新的特定檢索關(guān)鍵碼存儲(chǔ)區(qū)域中寫入所提取的音頻信號(hào)的部分作為檢索關(guān)鍵碼的操作(步驟S107)。
其后,控制部分10確定是否用戶經(jīng)由關(guān)鍵碼操作部分20給出用于結(jié)束登記檢索關(guān)鍵碼的當(dāng)前模式的指令(步驟S108)。如果給出了這樣的指令,則控制部分10終止登記檢索關(guān)鍵碼的模式的處理流程。另一方面,如果沒(méi)有給出這樣的指令,控制部分10返回步驟S104,在那里它等待用戶的用于提取檢索關(guān)鍵碼的另一個(gè)指令以重復(fù)上面的步驟。
以這種方式,由用戶從輸入音頻信號(hào)或所重現(xiàn)的音頻信號(hào)提取的作為檢索關(guān)鍵碼的音頻信號(hào)可以被登記和存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32中。如果檢索關(guān)鍵碼存儲(chǔ)器32的存儲(chǔ)能力足夠大到存儲(chǔ)這些新的檢索關(guān)鍵碼,則已經(jīng)存儲(chǔ)在存儲(chǔ)器中作為檢索關(guān)鍵碼的音頻信號(hào)不必被清除,可以保留在那里。
根據(jù)本發(fā)明,由于任何兩個(gè)音頻信號(hào)的相似性是通過(guò)使用聲音特性參數(shù)通過(guò)計(jì)算來(lái)確定的,因此存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32中的每個(gè)作為檢索關(guān)鍵碼的音頻信號(hào)不僅可以被用于檢索象它的原始音頻信號(hào)的部分,也可以用于檢索未從其提取檢索關(guān)鍵碼的任何音頻信號(hào)的部分,如果該部分象它的話。
因此,在圖1的實(shí)施例的情況,一旦用戶在檢索關(guān)鍵碼存儲(chǔ)器32中存儲(chǔ)了長(zhǎng)達(dá)預(yù)定時(shí)間段TW的音頻信號(hào),且他或她想要使用其作檢索關(guān)鍵碼以便檢查特定聲音源,則用戶可以在希望的時(shí)候使用它們作為檢索關(guān)鍵碼。
存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32中的作為檢索關(guān)鍵碼的音頻信號(hào)以下面所述的方式被用于檢索操作。圖7示意性地示出檢索操作的處理流程。當(dāng)用戶經(jīng)由關(guān)鍵碼操作部分20選擇檢索操作模式時(shí),圖7的處理流程開(kāi)始。現(xiàn)在,參考圖7描述檢索操作。
首先,控制部分10確定由用戶經(jīng)由關(guān)鍵碼操作部分20所做的模式選擇。具體說(shuō),它確定用戶選擇了要在輸入音頻信號(hào)上進(jìn)行檢索操作的模式還是要在所重現(xiàn)的音頻信號(hào)上進(jìn)行檢索操作的模式(步驟S201)。
如果確定要在輸入音頻信號(hào)上進(jìn)行檢索操作,則控制部分10分別切換開(kāi)關(guān)電路SW1、SW2和SW3到輸出端a的一側(cè)、輸入端IN的一側(cè)和輸入端d的一側(cè)(步驟S202)。
另一方面,如果確定要在所重現(xiàn)的音頻信號(hào)上進(jìn)行檢索操作,則控制部分10分別切換開(kāi)關(guān)電路SW2和SW3到輸入端PB的一側(cè)和輸入端c的一側(cè)(步驟S203)。
在步驟S202或S203后,控制部分10前進(jìn)到步驟S204,在那里它識(shí)別由用戶選擇的作為檢索關(guān)鍵碼的音頻信號(hào)(步驟S204)和控制實(shí)施例的操作,以便從檢索關(guān)鍵碼存儲(chǔ)器32讀取所選擇的作為檢索關(guān)鍵碼的音頻信號(hào)(步驟S205)。
然后,從檢索關(guān)鍵碼存儲(chǔ)器32讀取的作為檢索關(guān)鍵碼的音頻信號(hào)被供給到檢索關(guān)鍵碼聲音特性參數(shù)分析部分34,然后被供給到相似性確定部分22作為檢索關(guān)鍵碼聲音特性參數(shù),該相似性確定部分22通過(guò)計(jì)算確定要檢查相似性的音頻信號(hào)的每個(gè)時(shí)間段TW的聲音特性參數(shù)和供給到它的檢索關(guān)鍵碼的聲音特性參數(shù)之間的相似性(步驟S206)。如上所述,在該例中,該相似性基于它們之間的距離S確定。
因此,確定是否表示相似性的程度的距離S小于預(yù)定閾值Sth(步驟S207),如果距離S小于預(yù)定閾值Sth,則原始音頻信號(hào)的部分被確定類似該檢索關(guān)鍵碼(步驟S208),而如果距離S不小于預(yù)定閾值Sth,則原始音頻信號(hào)的部分被確定不類似該檢索關(guān)鍵碼(步驟S209)。經(jīng)過(guò)計(jì)算確定的結(jié)果然后經(jīng)由顯示控制部分23顯示在顯示部分24的顯示屏上(步驟S210)。
當(dāng)要檢查的音頻信號(hào)過(guò)去了或當(dāng)由用戶給出結(jié)束檢索操作的指令時(shí),控制部分10確定是否終止檢索操作(步驟S211)。如果終止該操作,則結(jié)束處理流程。否則,控制部分10返回步驟S206,繼續(xù)使用檢索關(guān)鍵碼的檢索操作。
圖8A和8B示意性地示出根據(jù)本發(fā)明可以從所重現(xiàn)的會(huì)議的電子音頻記錄的音頻信號(hào)中由檢索音頻信號(hào)的操作獲得的一個(gè)結(jié)果,其中檢索關(guān)鍵碼從特定發(fā)言者的發(fā)言中選擇。對(duì)圖8A和8B的情況,特定發(fā)言者說(shuō)話的時(shí)間區(qū)段可以在會(huì)議的整個(gè)音頻記錄中被識(shí)別出來(lái)。
盡管在上述的檢索操作的描述中僅使用了單一的檢索關(guān)鍵碼,但不必說(shuō)的是也可以指定多個(gè)檢索關(guān)鍵碼,用于確定兩個(gè)發(fā)言之間的相似性的程度。對(duì)這種情況,可以安排為,這些檢索關(guān)鍵碼每隔幾十毫秒通過(guò)從一個(gè)切換到另一個(gè)而被順序使用,這樣相似性確定部分22基于每個(gè)檢索關(guān)鍵碼通過(guò)計(jì)算確定兩個(gè)發(fā)言的相似性。
或者,可以提供多個(gè)相似性確定部分,并列地同時(shí)使用,使用相應(yīng)的檢索關(guān)鍵碼,以便通過(guò)計(jì)算確定兩個(gè)發(fā)言的相似性。
圖9示意性地示出當(dāng)多個(gè)檢索關(guān)鍵碼被選擇和用作檢索操作時(shí)可以獲得的結(jié)果。對(duì)圖9的情況,三個(gè)特定發(fā)言者A、B和C發(fā)言的時(shí)間區(qū)段可以在會(huì)議的整個(gè)音頻記錄中被識(shí)別出來(lái)。
因此,用上述的實(shí)施例,在出現(xiàn)多個(gè)與會(huì)者的會(huì)議中,如果所有與會(huì)者的音頻信號(hào)被預(yù)先作為檢索關(guān)鍵碼登記,則從會(huì)議的整個(gè)電子音頻記錄中,會(huì)議的所有發(fā)言者的發(fā)言的部分可以被識(shí)別、分類和顯示。
在上面的描述中,以二態(tài)值表達(dá)相似性確定的結(jié)果。換言之,相似性是基于是否預(yù)定閾值被超過(guò)來(lái)確定的。然而,相似性也可以以隔開(kāi)兩個(gè)信號(hào)部分的距離來(lái)表達(dá)。該距離S越小,兩個(gè)信號(hào)部分彼此越類似。然后,相似性的程度可以由陰影的黑的程度來(lái)顯示,如圖8B所示。在圖8B中,陰影越黑,相似性的程度越大?;蛘?,不同的顏色可以被用于顯示相似性的程度。
如果使用了多個(gè)檢索關(guān)鍵碼,則相似性確定的結(jié)果可以通過(guò)為每個(gè)檢索關(guān)鍵碼使用特定的顏色來(lái)顯示,相似性的程度也可以通過(guò)改變顏色的深度來(lái)顯示。
應(yīng)該注意,相似性確定的結(jié)果從上述的要檢查的音頻信號(hào)的開(kāi)始處,作為所消逝的時(shí)間的函數(shù),被輸出和顯示在顯示部分的顯示屏上。另一方面,如果要檢查的音頻信號(hào)是重現(xiàn)的音頻信號(hào),則在記錄介質(zhì)13上的對(duì)應(yīng)于給定消逝時(shí)間的音頻信號(hào)的位置可以容易地知道。因此,對(duì)于一時(shí)間區(qū)段的所重現(xiàn)的音頻信號(hào),當(dāng)獲得相似性確定操作的輸出時(shí),當(dāng)前正在重現(xiàn)的音頻信號(hào)的位置通??梢酝ㄟ^(guò)重放位置指示符光標(biāo)被顯示,該光標(biāo)和該時(shí)間區(qū)段的相似性確定結(jié)果在一起,如圖10所示。
相反地,如果安排為用戶可以指定光標(biāo)的開(kāi)始位置,也可以從圖10所示的重放位置指示符光標(biāo)開(kāi)始重現(xiàn)要檢查的音頻信號(hào)。然后,也可以通過(guò)檢索關(guān)鍵碼提取分類的音頻信號(hào)的部分,并同時(shí)重現(xiàn)它。
由于根據(jù)本發(fā)明,聲音特性參數(shù)被用于通過(guò)計(jì)算確定要檢查的音頻信號(hào)的部分的相似性和要用作檢索關(guān)鍵碼的音頻信號(hào),所以如果要重現(xiàn)的用于檢查的音頻信號(hào)不是以適當(dāng)?shù)乃俣榷且驗(yàn)橐纛l信號(hào)的波形不是以時(shí)序?yàn)榛A(chǔ)使用的而以雙倍或三倍速重放時(shí),相似性確定操作也可以被成功實(shí)現(xiàn),不象語(yǔ)音識(shí)別的情況,在那里在所進(jìn)行的特性曲線匹配的處理操作中檢查兩個(gè)波形特性曲線的相似性。
因此,根據(jù)本發(fā)明,當(dāng)以高速重現(xiàn)音頻信號(hào)時(shí),相似性確定操作也可以進(jìn)行,當(dāng)類似正使用的檢索關(guān)鍵碼的部分被檢測(cè)到時(shí),該部分可以被以適當(dāng)?shù)乃俣戎噩F(xiàn),這樣僅類似檢索關(guān)鍵碼的部分可以被提取和重現(xiàn)給用戶。
另外,在檢索操作后,由于可以使檢索操作的結(jié)果對(duì)應(yīng)于記錄介質(zhì)上的特定地址,也可以僅提取類似特定檢索關(guān)鍵碼的原始音頻信號(hào)的部分,在檢索操作的基礎(chǔ)上重現(xiàn)所提取的部分。
盡管本發(fā)明的上述優(yōu)點(diǎn)在重現(xiàn)音頻信號(hào)的方面被指出,但也可以根據(jù)本發(fā)明檢索類似預(yù)先登記的特定檢索關(guān)鍵碼的輸入音頻信號(hào)的部分。在這種情況下,通過(guò)使用一些檢索關(guān)鍵碼,輸入音頻信號(hào)的一些部分可以被分類。例如,多個(gè)樂(lè)器的音頻信號(hào)可以被預(yù)先登記為多個(gè)檢索關(guān)鍵碼,這樣輸入音頻信號(hào)可以被分為一些部分,這些部分可以被分類,并針對(duì)每個(gè)樂(lè)器顯示。
盡管在上面的第一個(gè)實(shí)施例的描述中,檢索關(guān)鍵碼從輸入音頻信號(hào)或重現(xiàn)的音頻信號(hào)中提取并存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32中,但也可以安排為多個(gè)音頻信號(hào)被預(yù)先存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32中以形成檢索關(guān)鍵碼庫(kù)。
盡管在上面的描述中,相似性確定操作是基于任何兩個(gè)聲音特性參數(shù)的幾何距離S來(lái)進(jìn)行的,但也可以安排為,在幾個(gè)已知參數(shù)的基礎(chǔ)上確定一新參數(shù),任何兩個(gè)聲音特性參數(shù)之間的距離可以使用該新確定的參數(shù)來(lái)確定。
例如,如果三個(gè)聲音特性參數(shù)x,y和z被用于確定一個(gè)新參數(shù),使用下面的公式k=ay+bz,則要檢查的音頻信號(hào)的聲音特性參數(shù)和檢索關(guān)鍵碼的聲音特性參數(shù)的距離可以使用兩個(gè)參數(shù)(x,k),即參數(shù)x和新參數(shù)k來(lái)確定。另外,每個(gè)聲音特性參數(shù)也可以被加權(quán),音頻信號(hào)的任何兩個(gè)部分的相似性也可以通過(guò)給權(quán)重的參數(shù)優(yōu)先權(quán)來(lái)確定。
檢索關(guān)鍵碼存儲(chǔ)器32可以是包含在該實(shí)施例中存儲(chǔ)器,或者是可移動(dòng)存儲(chǔ)器,其通常以存儲(chǔ)卡的形式來(lái)實(shí)現(xiàn)。如果存儲(chǔ)卡被用作檢索關(guān)鍵碼存儲(chǔ)器32,則多個(gè)存儲(chǔ)卡可以被用于存儲(chǔ)多個(gè)類型的檢索關(guān)鍵碼,這樣包含適于檢查特定音頻信號(hào)的檢索關(guān)鍵碼的合適的一個(gè)存儲(chǔ)卡可以被選擇使用。
另外,也可以被安排為,可以提供要用作檢索關(guān)鍵碼的音頻信號(hào)的聲源,經(jīng)由輸入端11從該聲源輸入音頻信號(hào),并被預(yù)先存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32中?;蛘?,每次當(dāng)檢查一音頻信號(hào)時(shí),從該聲源輸入音頻信號(hào),并暫時(shí)存儲(chǔ)在緩沖存儲(chǔ)器中作為檢索關(guān)鍵碼。然后,不再需要使用檢索關(guān)鍵碼存儲(chǔ)器32。
檢索關(guān)鍵碼不限于來(lái)自單一聲源的音頻信號(hào)。如前所述,它可以是從輸入音頻信號(hào)或重現(xiàn)的音頻信號(hào)為特定時(shí)間區(qū)段提取的音頻信號(hào)。
如果涉及與圖象相伴的音頻信號(hào),則該圖象也可以在顯示部分的顯示屏上被顯示。圖象的使用將方便檢索操作的結(jié)果的分類操作。例如,記錄的視頻信號(hào)可以使用音頻信號(hào)被檢查和分類。
圖11是根據(jù)本發(fā)明的音頻信號(hào)檢索設(shè)備的第二個(gè)實(shí)施例的示意框圖。上述第一個(gè)實(shí)施例適用于存儲(chǔ)音頻信號(hào)作為所登記的檢索關(guān)鍵碼,而第二個(gè)實(shí)施例則適用于在檢索關(guān)鍵碼存儲(chǔ)器32中存儲(chǔ)聲音特性參數(shù)作為所登記的檢索關(guān)鍵碼。其他方面,第二個(gè)實(shí)施例具有和第一個(gè)實(shí)施例相同的結(jié)構(gòu),因此,該實(shí)施例與第一個(gè)實(shí)施例相同的部件相應(yīng)地用相同的參考符號(hào)表示。
第二個(gè)實(shí)施例包括安排在開(kāi)關(guān)電路SW4的輸出側(cè)的檢索關(guān)鍵碼音頻信號(hào)提取部分35。該檢索關(guān)鍵碼音頻信號(hào)提取部分35對(duì)應(yīng)于適用于提取由用戶指定作為檢索關(guān)鍵碼的音頻信號(hào)的部分的檢索關(guān)鍵碼音頻信號(hào)提取/存儲(chǔ)部分31。
由檢索關(guān)鍵碼音頻信號(hào)提取部分35提取的檢索關(guān)鍵碼音頻信號(hào),被檢索關(guān)鍵碼聲音特性參數(shù)分析部分36分析,以獲得該音頻信號(hào)的聲音特性參數(shù),該聲音特性參數(shù)然后被存儲(chǔ)在檢索關(guān)鍵碼聲音特性參數(shù)存儲(chǔ)部分37中,也經(jīng)由開(kāi)關(guān)電路SW5存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32中。應(yīng)該理解,檢索關(guān)鍵碼聲音特性參數(shù)存儲(chǔ)部分37對(duì)應(yīng)于圖1的檢索關(guān)鍵碼音頻信號(hào)提取/存儲(chǔ)部分31的用于存儲(chǔ)作為檢索關(guān)鍵碼的提取的音頻信號(hào)的部分的裝置,并存儲(chǔ)檢索關(guān)鍵碼聲音特性參數(shù),取代音頻信號(hào)被用作檢索關(guān)鍵碼。因此,檢索關(guān)鍵碼(在該實(shí)施例中是聲音特性參數(shù))被存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32的相應(yīng)的檢索關(guān)鍵碼存儲(chǔ)區(qū)域中。
在檢索關(guān)鍵碼存儲(chǔ)器32中存儲(chǔ)和作為檢索關(guān)鍵碼操作的任何聲音特性參數(shù)由開(kāi)關(guān)電路SW6和檢索關(guān)鍵碼聲音特性參數(shù)讀取部分38根據(jù)來(lái)自控制部分10的控制信號(hào)讀出,該控制信號(hào)是根據(jù)由用戶經(jīng)由關(guān)鍵碼操作部分20輸入的指令產(chǎn)生的。由于對(duì)于第二個(gè)實(shí)施例的情況,從檢索關(guān)鍵碼存儲(chǔ)器32讀出聲音特性參數(shù),因此其被直接供給到相似性確定部分22,用于確定作為檢索關(guān)鍵碼操作的音頻信號(hào)和要檢查的音頻信號(hào)的部分的相似性的計(jì)算的操作。
從上面的描述可以看出,第二個(gè)實(shí)施例和第一個(gè)實(shí)施例的不同之處僅在于,檢索關(guān)鍵碼存儲(chǔ)器32存儲(chǔ)了取代了音頻信號(hào)的檢索關(guān)鍵碼聲音特性參數(shù),而登記檢索關(guān)鍵碼的操作和使用檢索關(guān)鍵碼的檢索操作與第一個(gè)實(shí)施例是一樣的。因此,第二個(gè)實(shí)施例提供了與上面參考第一個(gè)實(shí)施例描述的相同的優(yōu)勢(shì)。另外,第二個(gè)實(shí)施例也可以以上面參考第一個(gè)實(shí)施例描述的方式以各種方式被修改。
最后,由于在第二個(gè)實(shí)施例中,檢索關(guān)鍵碼存儲(chǔ)器32沒(méi)存儲(chǔ)音頻信號(hào)而是存儲(chǔ)了檢索關(guān)鍵碼聲音特性參數(shù)作為檢索關(guān)鍵碼,該實(shí)施例的檢索關(guān)鍵碼存儲(chǔ)器的需要用于存儲(chǔ)檢索關(guān)鍵碼的存儲(chǔ)容量小于第一個(gè)實(shí)施例的檢索關(guān)鍵碼存儲(chǔ)器。換言之,在該實(shí)施例中,更大量的檢索關(guān)鍵碼可以被存儲(chǔ)。
本發(fā)明的第三個(gè)實(shí)施例的特征在于它使用了可以被用于合成地重現(xiàn)音頻信號(hào)的聲音特性參數(shù)。因?yàn)槁曇籼匦詤?shù)可以被用于合成地重現(xiàn)音頻信號(hào),音頻信號(hào)可以以聲音特性參數(shù)的形式被記錄。因此,如同第二個(gè)實(shí)施例中,聲音特性參數(shù)被作為檢索關(guān)鍵碼存儲(chǔ)在該第三個(gè)實(shí)施例的檢索關(guān)鍵碼存儲(chǔ)器32中。
圖12是根據(jù)本發(fā)明的音頻信號(hào)檢索設(shè)備的第三個(gè)實(shí)施例的示意框圖。在圖12中,該實(shí)施例與前面的實(shí)施例相同的部件相應(yīng)地用相同的參考符號(hào)表示。在該第三個(gè)實(shí)施例中,聲碼器的參數(shù)通??梢员挥米髀曇籼匦詤?shù)。
如圖12所示,輸入音頻信號(hào)經(jīng)由輸入端11被供給到聲音特性參數(shù)分析部分41,并被分析,通常用于聲碼器系統(tǒng)的聲音特性參數(shù)。來(lái)自聲音特性參數(shù)分析部分41的輸入音頻信號(hào)的聲音特性參數(shù)然后經(jīng)由開(kāi)關(guān)電路SW1被供給到聲音特性參數(shù)記錄部分42,該聲音特性參數(shù)記錄部分42在控制部分10的控制下記錄供給它的聲音特性參數(shù)在記錄介質(zhì)13上。
記錄在記錄介質(zhì)13上的輸入音頻信號(hào)的聲音特性參數(shù)由聲音特性參數(shù)重現(xiàn)部分43在控制部分10的控制下重現(xiàn),并供給到音頻信號(hào)合成部分44,該音頻信號(hào)合成部分44通過(guò)使用聲音特性參數(shù)合成地重現(xiàn)原始音頻信號(hào)。
由音頻信號(hào)合成部分44獲得的所重現(xiàn)的音頻信號(hào)然后經(jīng)由開(kāi)關(guān)電路SW2的輸入端側(cè)PB和音頻放大器15被供給到揚(yáng)聲器16,原始的聲音從揚(yáng)聲器16被重現(xiàn)。應(yīng)該理解,通過(guò)輸入端11進(jìn)入的輸入音頻信號(hào)經(jīng)由開(kāi)關(guān)電路SW2的輸入端側(cè)IN和音頻放大器15被供給到揚(yáng)聲器16以重現(xiàn)原始聲音的處理和第一個(gè)和第二個(gè)實(shí)施例的對(duì)應(yīng)部分是相同的。
在該第三個(gè)實(shí)施例中,未提供聲音特性參數(shù)分析部分21,開(kāi)關(guān)電路SW3適用于借助由控制部分10根據(jù)由用戶經(jīng)由關(guān)鍵碼操作部分20給出的指令而產(chǎn)生的切換控制信號(hào),選擇通過(guò)開(kāi)關(guān)電路SW1的輸出端a的輸入音頻信號(hào)的聲音特性參數(shù)或者通過(guò)聲音特性參數(shù)重現(xiàn)部分43所重現(xiàn)的音頻信號(hào)的聲音特性參數(shù),并將其提供給相似性確定部分22。
另一方面,檢索關(guān)鍵碼聲音特性參數(shù)被存儲(chǔ)在該第三個(gè)實(shí)施例的檢索關(guān)鍵碼存儲(chǔ)器32中作為檢索關(guān)鍵碼,如同第二個(gè)實(shí)施例的情況。因此,用該第三個(gè)實(shí)施例,來(lái)自聲音特性參數(shù)分析部分41的聲音特性參數(shù)經(jīng)由開(kāi)關(guān)電路SW1的輸出端側(cè)b,被供給到開(kāi)關(guān)電路SW4的輸入端之一,即輸入端f,而來(lái)自聲音特性參數(shù)重現(xiàn)部分43的聲音特性參數(shù)被供給到開(kāi)關(guān)電路SW4的另一輸入端,即輸入端e。
然后,開(kāi)關(guān)電路SW4根據(jù)來(lái)自控制部分10的切換控制信號(hào),被切換到輸入端e側(cè)或輸入端f側(cè),該切換控制信號(hào)指定聲音特性參數(shù)要從輸入音頻信號(hào)提取或是要從所重現(xiàn)的音頻信號(hào)提取。
然后來(lái)自開(kāi)關(guān)電路SW4的聲音特性參數(shù)被供給到檢索關(guān)鍵碼聲音特性參數(shù)提取/存儲(chǔ)部分45。如同第一個(gè)實(shí)施例的情況,當(dāng)用戶希望用作檢索關(guān)鍵碼的部分來(lái)到時(shí),他或她操作關(guān)鍵碼操作部分20的檢索關(guān)鍵碼指定關(guān)鍵碼(未示出)。然后,該實(shí)施例的檢索關(guān)鍵碼聲音特性參數(shù)提取/存儲(chǔ)部分45提取對(duì)應(yīng)于包括關(guān)鍵碼操作的時(shí)間的預(yù)定時(shí)間段TW的一部分音頻信號(hào),并在檢索關(guān)鍵碼存儲(chǔ)器32中存儲(chǔ)該部分。
因此,檢索關(guān)鍵碼存儲(chǔ)器32存儲(chǔ)或者從輸入音頻信號(hào)或者從所重現(xiàn)的音頻信號(hào)提取的音頻信號(hào)的聲音特性參數(shù)作為檢索關(guān)鍵碼。如同第二個(gè)實(shí)施例的情況,存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32中的任何由用戶指定的檢索關(guān)鍵碼聲音特性參數(shù)被檢索關(guān)鍵碼聲音特性參數(shù)讀取部分38讀出,并供給到相似性確定部分22。
登記和檢索檢索關(guān)鍵碼的操作與第一和第二個(gè)實(shí)施例相同,因此這里就不進(jìn)一步描述了。因此,除了檢索關(guān)鍵碼存儲(chǔ)器32存儲(chǔ)檢索關(guān)鍵碼聲音特性參數(shù),第三個(gè)實(shí)施例的登記和檢索檢索關(guān)鍵碼的操作與第一和第二個(gè)實(shí)施例相同。因此,第三個(gè)實(shí)施例提供了上面參考第一和第二個(gè)實(shí)施例描述的那些優(yōu)勢(shì)。另外,第三個(gè)實(shí)施例也可以以上面參考第一和第二個(gè)實(shí)施例描述的方式以各種不同方式被修改。
另外,對(duì)該第三個(gè)實(shí)施例的情況,由于聲音特性參數(shù)被存儲(chǔ)在記錄介質(zhì)中代替了音頻信號(hào),記錄介質(zhì)的存儲(chǔ)容量可以被有效地利用。另外,由于該第三個(gè)實(shí)施例的同一聲音特性參數(shù)分析部分可以被公共地用于要檢查的音頻信號(hào)和要作為檢索關(guān)鍵碼使用的音頻信號(hào),因此第三個(gè)實(shí)施例可以被做成結(jié)構(gòu)比第一和第二個(gè)實(shí)施例更簡(jiǎn)單。
可用于本發(fā)明的目的的可合成地重現(xiàn)的聲音特性參數(shù)的具體例子包括符合MPEG(運(yùn)動(dòng)圖象專家組)標(biāo)準(zhǔn)的音頻壓縮系統(tǒng)(MPEG音頻層I、層II、層III)的音頻數(shù)據(jù)和ATRAC(自適應(yīng)變換音編碼,Adaptive Transform AcousticCoding)系統(tǒng)的音頻數(shù)據(jù)。
根據(jù)MPEG音頻標(biāo)準(zhǔn)和ATRAC系統(tǒng),音帶被分為多個(gè)用于編碼的子帶,以便有效地利用人類聽(tīng)覺(jué)的生理特性。例如,對(duì)MPEG音頻層I的情況,音頻信號(hào)的整個(gè)音帶被分為具有相同頻率寬度的32個(gè)子帶,所獲得的每個(gè)信號(hào)用1/32的采樣頻率采樣,用于編碼。
因此,當(dāng)符合MPEG標(biāo)準(zhǔn)的音頻壓縮系統(tǒng)的數(shù)據(jù)或ATRAC系統(tǒng)的數(shù)據(jù)(音頻壓縮/編碼數(shù)據(jù))被檢查時(shí),諸如確定音帶水平分布和主帶頻率和檢測(cè)諧波結(jié)構(gòu)和主帶頻率隨時(shí)間的改變的操作,通過(guò)使用子帶數(shù)據(jù)來(lái)進(jìn)行,在這些操作的基礎(chǔ)上獲得檢索關(guān)鍵碼聲音特性參數(shù)。
當(dāng)使用符合MPEG(運(yùn)動(dòng)圖象專家組)標(biāo)準(zhǔn)的音頻壓縮系統(tǒng)的數(shù)據(jù)或ATRAC系統(tǒng)的數(shù)據(jù)的技術(shù)被應(yīng)用到圖12的實(shí)施例且通過(guò)輸入端11進(jìn)入的輸入音頻信號(hào)是模擬信號(hào)或線性PCM信號(hào)時(shí),聲音特性參數(shù)分析部分41產(chǎn)生符合MPEG標(biāo)準(zhǔn)或ATRAC系統(tǒng)的的數(shù)據(jù)。然后,記錄部分42在記錄介質(zhì)13上記錄該音頻壓縮系統(tǒng)的數(shù)據(jù)。
然后,檢索關(guān)鍵碼聲音特性參數(shù)提取/存儲(chǔ)部分45從來(lái)自聲音特性參數(shù)分析部分41或聲音特性參數(shù)重現(xiàn)部分43的該音頻壓縮系統(tǒng)的數(shù)據(jù)產(chǎn)生子帶數(shù)據(jù),進(jìn)行諸如上述的確定音帶水平分布和主帶頻率和檢測(cè)諧波結(jié)構(gòu)和主帶頻率隨時(shí)間的改變的操作。然后,這些操作的結(jié)果被存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器32中作為檢索關(guān)鍵碼聲音特性參數(shù)。
如同圖1和圖11的情況,聲音特性參數(shù)分析部分在相似性確定部分22的上游,子帶數(shù)據(jù)從來(lái)自開(kāi)關(guān)電路SW1或聲音特性參數(shù)重現(xiàn)部分43的音頻壓縮系統(tǒng)的數(shù)據(jù)產(chǎn)生。然后,在該子帶數(shù)據(jù)上進(jìn)行諸如確定音帶水平分布和主帶頻率和檢測(cè)諧波結(jié)構(gòu)和主帶頻率隨時(shí)間的改變的操作。用這種安排,聲音特性參數(shù)分析部分可以具有簡(jiǎn)單結(jié)構(gòu)。然后相似性確定部分22比較作為分析的結(jié)果而獲得的聲音特性參數(shù)和來(lái)自檢索關(guān)鍵碼聲音特性參數(shù)讀取部分38的檢索關(guān)鍵碼聲音特性參數(shù),并確定它們之間的相似性的程度。
盡管在上面的描述中通過(guò)輸入端11進(jìn)入的輸入音頻信號(hào)是模擬信號(hào)或線性PCM信號(hào),但是如果通過(guò)符合IEEE(電氣與電子工程師協(xié)會(huì),Instituteof Electrical and Electronic Engineers,Inc.)1394標(biāo)準(zhǔn)的接口輸入的串行數(shù)字?jǐn)?shù)據(jù)或由數(shù)字廣播接收器接收的數(shù)字音頻壓縮信號(hào)被輸入時(shí),也可以獲得符合MPEG標(biāo)準(zhǔn)的音頻壓縮系統(tǒng)或ATRAC系統(tǒng)的數(shù)據(jù),這樣就不需要圖12的聲音特性參數(shù)分析部分41了。
上述的用于檢索聲音特性參數(shù)的分析音頻壓縮信號(hào)的方法,與在分析之前解碼數(shù)字音頻壓縮系統(tǒng)的數(shù)據(jù)以獲得線性PCM音頻信號(hào)的情況相比,可以最小化檢索操作的延遲以及算術(shù)運(yùn)算量。
在上面描述的第三個(gè)實(shí)施例中聲音特性參數(shù)被記錄在記錄介質(zhì)上以取代音頻信號(hào),而在本發(fā)明的第四個(gè)實(shí)施例中,音頻信號(hào)和對(duì)應(yīng)的聲音特性參數(shù)被相互共存地記錄在記錄介質(zhì)上。由于在該第四個(gè)實(shí)施例中,音頻信號(hào)和聲音特性參數(shù)都被記錄,在該第四個(gè)實(shí)施例中可以被記錄的聲音特性參數(shù)不限于可以被用于合成地重現(xiàn)音頻信號(hào)的那些聲音特性參數(shù)。
在第四個(gè)實(shí)施例中,與音頻信號(hào)共存地,聲音特性參數(shù)被記錄在記錄介質(zhì)上,諸如磁盤、磁光盤、光盤或存儲(chǔ)卡。換言之,通過(guò)音頻信號(hào)的記錄單元(諸如包(pack)、小包(packet)或扇區(qū)(sector)),音頻信號(hào)和聲音特性參數(shù)被記錄在記錄介質(zhì)上,音頻信號(hào)的記錄單元的數(shù)據(jù)和該單元對(duì)應(yīng)的聲音特性參數(shù)在記錄介質(zhì)的記錄區(qū)域方面被聯(lián)系,其方式使得它們的相互對(duì)應(yīng)關(guān)系可以是清晰可見(jiàn)的。例如,它們可以被記錄在記錄介質(zhì)的相鄰記錄區(qū)域。
圖13是根據(jù)本發(fā)明的音頻信號(hào)檢索設(shè)備的第四個(gè)實(shí)施例的示意框圖。在圖13中,該實(shí)施例與前面的實(shí)施例相同的部件相應(yīng)地用相同的參考符號(hào)表示,就不進(jìn)一步描述了。
在該第四個(gè)實(shí)施例中,通過(guò)音頻輸入端11進(jìn)入的輸入音頻信號(hào)經(jīng)由開(kāi)關(guān)電路SW7并供給到音頻信號(hào)記錄部分12。開(kāi)關(guān)電路SW7由來(lái)自控制部分10的開(kāi)關(guān)控制信號(hào)接通,用于記錄操作。然后,提供到音頻信號(hào)記錄部分12的輸入音頻信號(hào)被進(jìn)一步供給到第四個(gè)實(shí)施例的數(shù)據(jù)記錄控制部分51。
通過(guò)音頻輸入端11進(jìn)入的輸入音頻信號(hào)也被供給到聲音特性參數(shù)分析部分41,并被分析,以獲得聲音特性參數(shù)。來(lái)自聲音特性參數(shù)分析部分41的聲音特性參數(shù)被供給到開(kāi)關(guān)電路SW3的輸入端,作為要檢查的輸入音頻信號(hào)的聲音特性參數(shù),同時(shí)也被供給到開(kāi)關(guān)電路SW4的輸入端,用于從輸入音頻信號(hào)提取作為檢索關(guān)鍵碼的聲音特性參數(shù)。另外,來(lái)自聲音特性參數(shù)分析部分41的聲音特性參數(shù)被供給到數(shù)據(jù)記錄控制部分51。
在記錄操作中,數(shù)據(jù)記錄控制部分51以預(yù)定的記錄格式記錄音頻信號(hào)和對(duì)應(yīng)的聲音特性參數(shù),這樣在控制部分10的控制下,它們的相互對(duì)應(yīng)關(guān)系可以是清晰可見(jiàn)的。在該例子中,如上所述,數(shù)據(jù)記錄控制部分51通過(guò)音頻信號(hào)的記錄單元在記錄介質(zhì)13上記錄該音頻信號(hào),并在記錄介質(zhì)13上位于音頻信號(hào)的相鄰位置記錄該單元的對(duì)應(yīng)的聲音特性參數(shù)。
以如上所述的記錄格式在記錄介質(zhì)13上記錄的輸入音頻信號(hào)和對(duì)應(yīng)的聲音特性參數(shù),在控制部分10的控制下由數(shù)據(jù)讀取控制部分52在隨后重現(xiàn)。從記錄介質(zhì)13由數(shù)據(jù)讀取控制部分52重現(xiàn)的音頻信號(hào)然后被供給到音頻信號(hào)重現(xiàn)部分14,然后再經(jīng)由開(kāi)關(guān)電路SW2的輸入端PB和音頻放大器15被供給到揚(yáng)聲器16,這樣原始聲音在揚(yáng)聲器16被重現(xiàn)。
另一方面,從記錄介質(zhì)13由數(shù)據(jù)讀取控制部分52重現(xiàn)的聲音特性參數(shù)然后被供給到開(kāi)關(guān)電路SW3的輸入端c作為要檢查的重現(xiàn)的音頻信號(hào)的聲音特性參數(shù),并被供給到開(kāi)關(guān)電路SW4的輸入端e,用于從重現(xiàn)的音頻信號(hào)提取聲音特性參數(shù)作為檢索關(guān)鍵碼。
另外,從記錄介質(zhì)13由數(shù)據(jù)讀取控制部分52重現(xiàn)的對(duì)應(yīng)的音頻信號(hào)和聲音特性參數(shù)可以通過(guò)外部輸出端(未示出)被供給到外部,用于由一些其他設(shè)備對(duì)音頻信號(hào)進(jìn)行檢索操作。換言之,其他設(shè)備不需要提供有聲音特性參數(shù)分析部分以便準(zhǔn)備聲音特性參數(shù)。
因此,該第四個(gè)實(shí)施例不同于前面的實(shí)施例之處在于,當(dāng)由數(shù)據(jù)記錄控制部分51記錄在記錄介質(zhì)上時(shí),輸入音頻信號(hào)和對(duì)應(yīng)的聲音特性參數(shù)是聯(lián)系的,音頻信號(hào)和對(duì)應(yīng)的聲音特性參數(shù)都由數(shù)據(jù)讀取控制部分52重現(xiàn)。然而,該實(shí)施例與第三個(gè)實(shí)施例的相似之處在于,聲音特性參數(shù)被用于檢索操作,檢索關(guān)鍵碼聲音特性參數(shù)可以從輸入音頻信號(hào)和重現(xiàn)的音頻信號(hào)中被提取。
因此,第四個(gè)實(shí)施例提供了上面參考第一個(gè)實(shí)施例描述的那些優(yōu)勢(shì)。另外,第四個(gè)實(shí)施例也可以以上面參考第一個(gè)實(shí)施例描述的方式以各種不同方式被修改。
另外,如同第三個(gè)實(shí)施例的情況,由于第四個(gè)實(shí)施例的同一聲音特性參數(shù)分析部分公共地用于要檢查的音頻信號(hào)和要用于檢索關(guān)鍵碼的音頻信號(hào),這樣第三個(gè)實(shí)施例可以被做成結(jié)構(gòu)比第一和第二個(gè)實(shí)施例更簡(jiǎn)單。另外,聲音特性參數(shù)可以被供給到一些其他地檢索設(shè)備,這樣其他設(shè)備不需要提供有聲音特性參數(shù)分析部分以便準(zhǔn)備聲音特性參數(shù)。
應(yīng)該注意,如果要記錄的音頻信號(hào)和對(duì)應(yīng)的聲音特性參數(shù)不被彼此相鄰地記錄,它們也可以被聯(lián)系在一起,并記錄在記錄介質(zhì)上。例如,記錄介質(zhì)可以提供有用于記錄音頻信號(hào)的記錄區(qū)域和記錄聲音特性參數(shù)的記錄區(qū)域,音頻信號(hào)和對(duì)應(yīng)的聲音特性參數(shù)可以被記錄在記錄區(qū)域的對(duì)應(yīng)的位置,這些位置以地址的方式被彼此聯(lián)系?;蛘?,聯(lián)系音頻信號(hào)和對(duì)應(yīng)的聲音特性參數(shù)的聯(lián)系信息可以被另外地記錄,這樣它們可以使用聯(lián)系信息被一起重現(xiàn)。
如上所述,根據(jù)本發(fā)明,使用聲音特性參數(shù),通過(guò)確定要檢查的音頻信號(hào)和作為檢索關(guān)鍵碼的音頻信號(hào)的相似性,可以對(duì)要檢查的音頻信號(hào)進(jìn)行檢索操作。因此,在通過(guò)使用特定檢索關(guān)鍵碼分析要檢查的音頻信號(hào)時(shí),可以記錄該音頻信號(hào)。因此,使用檢索關(guān)鍵碼,對(duì)要檢查的音頻信號(hào)進(jìn)行的檢索操作的結(jié)果,在記錄操作結(jié)束前就可用了。因此,可以在記錄介質(zhì)上與記錄音頻信號(hào)的區(qū)域隔開(kāi)的區(qū)域中記錄檢索操作的結(jié)果。
通過(guò)給記錄介質(zhì)提供與記錄音頻信號(hào)的區(qū)域隔開(kāi)的區(qū)域,對(duì)重現(xiàn)的音頻信號(hào)進(jìn)行的檢索操作的結(jié)果也可以在以后的某時(shí)被記錄在記錄介質(zhì)上。
考慮到上面的優(yōu)勢(shì),用本發(fā)明的第五個(gè)實(shí)施例,對(duì)要檢查的音頻信號(hào)進(jìn)行檢索操作的結(jié)果也被記錄在記錄介質(zhì)上。
更具體說(shuō),用本發(fā)明的第五個(gè)實(shí)施例,在記錄音頻信號(hào)的操作處理中,預(yù)先登記的一個(gè)或多于一個(gè)的檢索關(guān)鍵碼被用于分析要記錄的輸入音頻信號(hào)。
例如,諸如磁盤、光盤或磁光盤或存儲(chǔ)卡的盤形記錄介質(zhì)被用于記錄介質(zhì)13。然后音頻信號(hào)被記錄在記錄介質(zhì)中,而記錄介質(zhì)的地址被監(jiān)視。用第五個(gè)實(shí)施例,被確定與作為檢索關(guān)鍵碼的音頻信號(hào)類似的音頻信號(hào)的每部分的地址(存儲(chǔ)位置)被與檢索關(guān)鍵碼的識(shí)別信息一起被記錄。開(kāi)關(guān)電路SW6的開(kāi)關(guān)控制信號(hào)(對(duì)應(yīng)于檢索關(guān)鍵碼的存儲(chǔ)區(qū)域,或檢索關(guān)鍵碼的號(hào)碼)通常被用作檢索關(guān)鍵碼的識(shí)別信息。
圖14是一個(gè)表格,示出了在第五個(gè)實(shí)施例中記錄和檢查音頻信號(hào)的操作完成后獲得的檢索操作的結(jié)果。該表格被用于記錄在記錄介質(zhì)上的音頻信號(hào),作為檢索索引表格。
參考圖14,在登記的時(shí)候,檢索關(guān)鍵碼的名字被預(yù)先給出,如果音頻信號(hào)表示會(huì)議的發(fā)言或討論,則它們通常是與會(huì)者/發(fā)言者的名字。時(shí)間段數(shù)據(jù)是音頻信號(hào)的對(duì)應(yīng)部分類似用于檢索操作的特定檢索關(guān)鍵碼的每個(gè)時(shí)間段上的數(shù)據(jù)。每個(gè)時(shí)間段由開(kāi)始地址ST和終點(diǎn)地址ED定義。在圖14中,ADRi(i表示一整數(shù))表示在記錄介質(zhì)上的地址值。
這樣,用第五個(gè)實(shí)施例,檢索索引表格的信息被記錄在記錄介質(zhì)的與所記錄的音頻信號(hào)的區(qū)域隔開(kāi)的預(yù)先選擇的記錄區(qū)域。
用第五個(gè)實(shí)施例,通過(guò)使用檢索索引表格,類似特定檢索關(guān)鍵碼的音頻信號(hào)的部分可以容易地被提取和重現(xiàn)(檢索/重現(xiàn)操作)。
圖15示意性地示出第五個(gè)實(shí)施例的檢索/重現(xiàn)操作的處理流程。當(dāng)用戶經(jīng)由關(guān)鍵碼操作部分20發(fā)出用于檢索/重現(xiàn)操作的指令時(shí),圖15的處理流程開(kāi)始。
首先,要用于檢索操作的索引數(shù)據(jù)被從記錄介質(zhì)中讀取,以便準(zhǔn)備檢索索引表格(步驟S301)??刂撇糠?0基于讀出的數(shù)據(jù),準(zhǔn)備如圖14中所示的檢索索引表格,并將它顯示在顯示屏上(步驟S302)。
然后,用戶參閱所顯示的檢索索引表格,經(jīng)由關(guān)鍵碼操作部分20,輸入他或她希望用于檢索/重現(xiàn)操作的檢索關(guān)鍵碼??刂撇糠?0識(shí)別由用戶指定的檢索關(guān)鍵碼(步驟S303)。然后它通過(guò)參考檢索索引表格,識(shí)別被確定類似檢索關(guān)鍵碼的音頻信號(hào)的每個(gè)部分的時(shí)間段的數(shù)據(jù)(步驟S304)。然后,控制部分10順序地讀取音頻信號(hào)的部分和由所識(shí)別的時(shí)間段的數(shù)據(jù)所指示的地址(步驟S305)。
因此,用第五個(gè)實(shí)施例,類似指定的檢索關(guān)鍵碼的音頻信號(hào)的部分可以被容易地提取和重現(xiàn)。應(yīng)該理解,用第五個(gè)實(shí)施例,也可以從檢索關(guān)鍵碼存儲(chǔ)器中指定未列在檢索索引表格上的檢索關(guān)鍵碼,并使用該指定的檢索關(guān)鍵碼實(shí)現(xiàn)檢索操作。
盡管檢索索引表格包含檢索關(guān)鍵碼的識(shí)別信息和名字,檢索關(guān)鍵碼的音頻信號(hào)也可以被列在檢索索引表格上,取代或附加于檢索關(guān)鍵碼的名字。然后,通過(guò)重現(xiàn)他或她指定的檢索關(guān)鍵碼的音頻信號(hào)的原始聲音,用戶可以容易地了解該音頻信號(hào)。
盡管在上面的描述中,檢索操作的結(jié)果被記錄在記錄介質(zhì)上,它也可以被附加地記錄在由控制部分控制的存儲(chǔ)器中,其方式使得存儲(chǔ)在該存儲(chǔ)器中的數(shù)據(jù)和和存儲(chǔ)在記錄介質(zhì)中的數(shù)據(jù)有清楚的對(duì)應(yīng)關(guān)系。
盡管在上面的描述中,檢索關(guān)鍵碼被預(yù)先登記在一存儲(chǔ)器中或被單獨(dú)地準(zhǔn)備,它也可以被安排為,當(dāng)用戶指定他或她正在記錄的一部分音頻信號(hào)時(shí)開(kāi)始檢索操作,在記錄操作的處理中檢索操作繼續(xù)。用這種安排,則不必要預(yù)先登記任何檢索關(guān)鍵碼。
從輸入音頻信號(hào)或重現(xiàn)的音頻信號(hào)提取要在檢索關(guān)鍵碼存儲(chǔ)器中登記的檢索關(guān)鍵碼也不是必須的。例如,可以提供一聲源以產(chǎn)生檢索關(guān)鍵碼,從該聲源獲得的音頻信號(hào)可以被使用并登記為檢索關(guān)鍵碼。
通過(guò)互聯(lián)網(wǎng)或通信網(wǎng)絡(luò),也可以獲得要作為檢索關(guān)鍵碼登記的音頻信號(hào)或聲音特性參數(shù)。然后,該音頻信號(hào)或聲音特性參數(shù)將被登記為檢索關(guān)鍵碼。
或者也可以做這樣的安排,當(dāng)包含所記錄的音頻信號(hào)的記錄介質(zhì)被銷售時(shí),候選檢索關(guān)鍵碼也被記錄在記錄介質(zhì)上?;蛘咭部梢宰鲞@樣的安排,當(dāng)包含所記錄的音頻信號(hào)的記錄介質(zhì)被銷售時(shí),它配有存儲(chǔ)候選檢索關(guān)鍵碼的存儲(chǔ)卡。
上面描述的實(shí)施例僅處理作為要檢查的輸入信號(hào)的音頻信號(hào),而如果信號(hào)包含與視頻信號(hào)相聯(lián)系的音頻信號(hào)時(shí),則要被記錄和重現(xiàn)的音頻/視頻信號(hào)可以被用作檢索操作的對(duì)象。
圖16是一記錄/重現(xiàn)裝置的示意框圖,適用于記錄和重現(xiàn)根據(jù)MPEG2標(biāo)準(zhǔn)壓縮的音頻/視頻信號(hào),音頻/視頻檢索設(shè)備的實(shí)施例和音頻/視頻存儲(chǔ)設(shè)備的實(shí)施例被應(yīng)用到其中。
應(yīng)該注意,圖1的記錄/重現(xiàn)設(shè)備適用于根據(jù)MPEG2標(biāo)準(zhǔn)壓縮和編碼視頻信號(hào)和音頻信號(hào),多路復(fù)用所編碼的信號(hào),在硬盤驅(qū)動(dòng)器(HDD)中的硬盤上記錄該信號(hào)為MPEG系統(tǒng)的傳送流(Transport Stream,TS),這樣,所記錄的信號(hào)可以從硬盤被重現(xiàn)。
在以下的描述中,模擬視頻信號(hào)和模擬音頻信號(hào)分別被稱為視頻信號(hào)和音頻信號(hào),而數(shù)字視頻信號(hào)和數(shù)字音頻信號(hào)分別被稱為數(shù)字視頻數(shù)據(jù)和數(shù)字音頻數(shù)據(jù)或簡(jiǎn)單的視頻數(shù)據(jù)和音頻數(shù)據(jù)。
記錄/重現(xiàn)裝置70被連接到用于接收模擬電視廣播的天線61,其包括模擬輸入端71V、71A、71S,模擬輸出端72V、72A、72S,數(shù)字輸入/輸出端73,數(shù)字接口74,輸入處理部分80,輸出處理部分90,多路復(fù)用器/解多路復(fù)用器100,緩沖控制器110,硬盤驅(qū)動(dòng)器120,同步控制電路130,系統(tǒng)控制器140,音頻檢索部分150和操作輸入部分160。
上述安排的硬盤驅(qū)動(dòng)器120包含三個(gè)硬盤121、122、123,傳送流被記錄在它們中的任何一個(gè)中,并從它們中的任何一個(gè)中被重現(xiàn)。
系統(tǒng)控制器140包括連接到其系統(tǒng)總線142的CPU(中央處理單元)141和ROM(只讀存儲(chǔ)器)143和RAM(隨機(jī)存儲(chǔ)器)144。
ROM143預(yù)先存儲(chǔ)要由CPU141執(zhí)行的程序,CPU141因此從存儲(chǔ)在ROM143中存儲(chǔ)的程序中讀出合適的一個(gè),并控制記錄/重現(xiàn)裝置70的部件。RAM44被用于存儲(chǔ)任何其它對(duì)于CPU141控制記錄/重現(xiàn)裝置70的部件必要的程序和數(shù)據(jù)。
操作輸入部分160通常包括鍵盤、鼠標(biāo)、按鈕、開(kāi)關(guān)和遙控器,經(jīng)由輸入/輸出接口(未示出)被連接到系統(tǒng)控制器140的系統(tǒng)總線142。
音頻檢索部分150是通過(guò)使用上述第一到第五實(shí)施例的任何一個(gè)來(lái)實(shí)現(xiàn)的。然而,從該音頻/視頻檢索設(shè)備的實(shí)施例適用于檢索根據(jù)MPEG標(biāo)準(zhǔn)壓縮和編碼的數(shù)據(jù)的觀點(diǎn)來(lái)看,第三個(gè)實(shí)施例最具優(yōu)勢(shì)。
應(yīng)該注意,記錄介質(zhì)13是硬盤驅(qū)動(dòng)器120的硬盤,因此,只要哪個(gè)合適,記錄部分12或42和重現(xiàn)部分14或44是由緩沖控制器110形成的。換言之,音頻檢索部分150包括適于音頻檢索操作的上述實(shí)施例的任何一個(gè)的部件,而不包括適于記錄/重現(xiàn)音頻數(shù)據(jù)作為主數(shù)據(jù)的部件。
檢索關(guān)鍵碼存儲(chǔ)器32可以被安排在音頻檢索部分150中,或者通過(guò)使用硬盤驅(qū)動(dòng)器120的硬盤的存儲(chǔ)區(qū)域的部分來(lái)實(shí)現(xiàn)。
也應(yīng)該注意,幀數(shù)、場(chǎng)數(shù)(field numbers)、PTS(表示時(shí)戳,presentationtime stamps)和/或小包數(shù)(packet numbers)被用作聯(lián)系地址信息,示出數(shù)字音頻壓縮信號(hào)和包含互相聯(lián)系用于記錄和重現(xiàn)的音頻數(shù)據(jù)和視頻數(shù)據(jù)的音頻/視頻數(shù)據(jù)的檢索和登記操作的時(shí)間段。
(模擬輸入和記錄)模擬電視廣播的信號(hào)由天線61接收,在系統(tǒng)控制器140的控制下,根據(jù)操作輸入部分160的操作由調(diào)諧器81選擇。然后,所選擇頻道的復(fù)合視頻信號(hào)和音頻信號(hào)由調(diào)諧器81從接收的信號(hào)中產(chǎn)生,并供給到輸入開(kāi)關(guān)電路32的輸入端之一。
另一方面,來(lái)自外部設(shè)備的復(fù)合視頻信號(hào)和也來(lái)自外部設(shè)備的音頻信號(hào)分別供給到輸入端71V和輸入端71A,而也來(lái)自外部設(shè)備的分離的視頻信號(hào)(包括彼此隔開(kāi)的亮度信號(hào)和色差信號(hào))供給到輸入端71S。
來(lái)自輸入端71V的復(fù)合視頻信號(hào)和來(lái)自輸入端71A的音頻信號(hào)被供給到輸入開(kāi)關(guān)電路82的其它輸入端。然后,輸入開(kāi)關(guān)電路82由系統(tǒng)控制器140操作,從而復(fù)合視頻信號(hào)或?qū)?yīng)的音頻信號(hào)被選擇和從中取出。
來(lái)自輸入開(kāi)關(guān)電路82的復(fù)合視頻信號(hào)被YC分離電路83分為亮度信號(hào)和色差信號(hào),然后被供給到另一輸入開(kāi)關(guān)電路84的一個(gè)輸入端。另一方面,來(lái)自輸入端7lS的分離的視頻信號(hào)(亮度信號(hào)和色差信號(hào))供給到輸入開(kāi)關(guān)電路84的另一輸入端。輸入開(kāi)關(guān)電路84的開(kāi)關(guān)操作由系統(tǒng)控制器140控制,這樣兩組亮度信號(hào)和色差信號(hào)之一被選擇和從輸入開(kāi)關(guān)電路84中取出。
從輸入開(kāi)關(guān)電路84中取出的亮度信號(hào)和色差信號(hào)經(jīng)過(guò)NTSC(國(guó)家電視制式委員會(huì))解碼器85的A/D(模擬到數(shù)字)轉(zhuǎn)換處理,然后經(jīng)過(guò)色度編碼處理,這樣就從NTSC解碼器85獲得了復(fù)合視頻數(shù)據(jù)。
NTSC解碼器85也從從輸入開(kāi)關(guān)電路84中取出的亮度信號(hào)中分離垂直同步信號(hào)和水平同步信號(hào),基于這些同步信號(hào)產(chǎn)生一時(shí)鐘和場(chǎng)(field)鑒別信號(hào)。同步信號(hào)和時(shí)鐘和場(chǎng)鑒別信號(hào)然后被供給到同步控制電路130,該同步控制電路130再通過(guò)參考這些信號(hào)來(lái)產(chǎn)生記錄/重現(xiàn)設(shè)備70的各個(gè)部件部分所必需的時(shí)鐘和定時(shí)信號(hào),并將所產(chǎn)生的時(shí)鐘和定時(shí)信號(hào)提供給各個(gè)部件部分。
來(lái)自NTSC解碼器85的視頻數(shù)據(jù)經(jīng)過(guò)視頻預(yù)處理電路86的包括預(yù)濾波操作的一系列包括預(yù)處理操作,隨后被供給到MPEG視頻編碼器87和輸出處理部分90的視頻后處理電路92。
MPEG視頻編碼器87對(duì)來(lái)自視頻預(yù)處理電路86的視頻數(shù)據(jù)進(jìn)行諸如塊DCT(離散余弦變換)的編碼操作,以產(chǎn)生視頻基本流(elementary stream,ES),該視頻基本流然后被供給到多路復(fù)用器/解多路復(fù)用器100。
另一方面,來(lái)自輸入開(kāi)關(guān)電路82的音頻信號(hào)由A/D轉(zhuǎn)換器88變換為數(shù)字音頻數(shù)據(jù),隨后被供給到MPEG音頻編碼器89和輸出處理部分90的輸出開(kāi)關(guān)電路95。
MPEG音頻編碼器89利用MPEG制式壓縮和編碼來(lái)自A/D轉(zhuǎn)換器88的音頻數(shù)據(jù),以產(chǎn)生音頻基本流,該音頻基本流然后被供給到多路復(fù)用器/解多路復(fù)用器100。
多路復(fù)用器/解多路復(fù)用器100多路復(fù)用來(lái)自MPEG視頻編碼器87的視頻基本流和來(lái)自MPEG音頻編碼器89的音頻基本流以及各種控制信號(hào),以便在其多路復(fù)用器中產(chǎn)生MPEG制式的傳送流。所產(chǎn)生的傳送流然后被送出到緩沖控制器110。
緩沖控制器110斷續(xù)地送出從多路復(fù)用器/解多路復(fù)用器100連續(xù)輸入的傳送流到硬盤驅(qū)動(dòng)器120。更具體說(shuō),由于硬盤驅(qū)動(dòng)器120在進(jìn)行尋道(seek)操作時(shí)不能做任何寫操作,緩沖控制器110暫時(shí)在其緩沖區(qū)中存儲(chǔ)輸入它的傳送流。然后,當(dāng)硬盤驅(qū)動(dòng)器可以寫數(shù)據(jù)時(shí),緩沖控制器110以比其輸入的速率高的速率讀出在緩沖區(qū)中存儲(chǔ)的傳送流,將其送出到硬盤驅(qū)動(dòng)器120。結(jié)果是,連續(xù)輸入到緩沖控制器110的傳送流沒(méi)有任何不連續(xù)地被記錄在硬盤121到123中。
硬盤驅(qū)動(dòng)器120適用于在系統(tǒng)控制器140的控制下將傳送流寫在硬盤121到123上。通常IDE(integrated drive electronics,集成電路設(shè)備)被用于緩沖控制器110和硬盤驅(qū)動(dòng)器120之間的協(xié)議(接口)。
(重現(xiàn)和模擬輸出)對(duì)于重現(xiàn)操作,硬盤驅(qū)動(dòng)器120在系統(tǒng)控制器140的控制下,從硬盤121到123讀出傳送流,將其送出到緩沖控制器110。相反于記錄操作,緩沖控制器110將從硬盤驅(qū)動(dòng)器120斷續(xù)地輸入的傳送流變換成連續(xù)的傳送流,并將它供給到多路復(fù)用器/解多路復(fù)用器100。
多路復(fù)用器/解多路復(fù)用器100在其解多路復(fù)用器中分析連續(xù)傳送流的前端以便從傳送流中隔離PES(packetized elementary stream,打包基本流),并把隔離的PES送到MPEG音頻/視頻解碼器91。
MPEG音頻/視頻解碼器91將來(lái)自多路復(fù)用器/解多路復(fù)用器100的PES分為視頻基本流和音頻基本流,其中視頻基本流由MPEG視頻解碼器解碼,并變換為基帶的視頻數(shù)據(jù),而音頻基本流由MPEG音頻解碼器解碼,并變換為基帶的音頻數(shù)據(jù)。在變換之后,視頻數(shù)據(jù)被供給到視頻后處理電路92,而音頻數(shù)據(jù)被供給到音頻后處理電路95。
視頻后處理電路92執(zhí)行的操作是諸如將從MPEG音頻/視頻解碼器91送的視頻數(shù)據(jù)改變成從視頻預(yù)處理電路86送的視頻數(shù)據(jù)或者相反,合成地結(jié)合兩個(gè)視頻數(shù)據(jù)和/或后濾波。
視頻后處理電路92也執(zhí)行為GUI(graphical user interface,圖形用戶界面)產(chǎn)生多個(gè)代表圖象(靜止圖象)的壓縮靜止圖象顯示操作,壓縮代表圖象,并將它們傳到窗口。所處理的圖象的視頻數(shù)據(jù)然后被供給到OSD(onscreen display,屏上顯示)處理電路93。
可以用于本發(fā)明的目的的代表圖象可以包括節(jié)目的題目的感人的場(chǎng)景和節(jié)目的索引點(diǎn)(一個(gè)場(chǎng)景),它們方便用戶/觀看者能夠快速地訪問(wèn)他或她想看的場(chǎng)景。
OSD處理電路93在系統(tǒng)控制器140的控制下,產(chǎn)生對(duì)應(yīng)于給它的文本信息的視頻數(shù)據(jù),并將它疊加在從視頻后處理電路92送來(lái)的窗口的視頻數(shù)據(jù)上。然后,它送出所處理的圖象數(shù)據(jù)到NTSC編碼器34。圖17示出通過(guò)壓縮相應(yīng)的原始圖象產(chǎn)生的典型代表靜止圖象。在圖17中,總共16個(gè)壓縮的靜止圖象200被貼到窗口。
NTSC編碼器94對(duì)來(lái)自O(shè)SD處理電路93的視頻數(shù)據(jù)(復(fù)合視頻數(shù)據(jù))在將其或不將其變換成亮度數(shù)據(jù)和色差數(shù)據(jù)之后,執(zhí)行D/A(數(shù)字到模擬)轉(zhuǎn)換操作,以產(chǎn)生是模擬信號(hào)的分離視頻信號(hào)和復(fù)合視頻信號(hào),其中分離視頻信號(hào)被供給到輸出端72S,而復(fù)合視頻信號(hào)被供給到輸出端72V。
另一方面,在系統(tǒng)控制器140的控制下,輸出開(kāi)關(guān)電路95選擇性地取出來(lái)自MPEG音頻/視頻解碼器91的音頻數(shù)據(jù)或來(lái)自A/D轉(zhuǎn)換器88的音頻數(shù)據(jù)。所選擇的音頻數(shù)據(jù)然后被D/A轉(zhuǎn)換器36轉(zhuǎn)換為模擬音頻信號(hào),并被供給到輸出端72A。
供給到輸出端72S的分離視頻信號(hào)、供給到輸出端72V的復(fù)合視頻信號(hào)和供給到輸出端72A的音頻信號(hào)然后被送到外部電視接收器的監(jiān)視器2,這樣用戶/觀看者可以收看在監(jiān)視器2上顯示的對(duì)應(yīng)圖象,收聽(tīng)也是從監(jiān)視器2輸出的聲音。
(來(lái)自外部裝置的音頻/視頻數(shù)據(jù)的記錄/重現(xiàn))數(shù)字輸入/輸出端73和主體100由記錄/重現(xiàn)裝置70中的數(shù)字接口74彼此連接,這樣通過(guò)連接數(shù)字輸入/輸出端73到外部裝置63,從外部裝置63輸入的傳送流可以被記錄在硬盤121到123上,從硬盤121到123重現(xiàn)的傳送流可以被輸出到外部裝置63。
外部裝置63可以是IRD(integrated receiver decoder,集成接收器解碼器)或個(gè)人計(jì)算機(jī)。IEEE(電氣與電子工程師協(xié)會(huì))1394數(shù)字接口通常被用于數(shù)字接口74,而IEEE 1394串行總線通常被用于連接外部裝置63和數(shù)字輸入/輸出端73的串行總線64。
從外部裝置63經(jīng)由串行總線64到數(shù)字輸入/輸出端73的輸入的傳送流然后由數(shù)字接口74處理,并被送到多路復(fù)用器/解多路復(fù)用器100,然后再進(jìn)一步從多路復(fù)用器/解多路復(fù)用器100到緩沖控制器110,這樣它就由硬盤驅(qū)動(dòng)器120記錄在硬盤121到123上。
同時(shí),要記錄的傳送流中的PES被多路復(fù)用器/解多路復(fù)用器100的解多路復(fù)用器從傳送流中隔離,并被供給到MPEG音頻/視頻解碼器91,這樣被重現(xiàn)的模擬視頻信號(hào)和模擬音頻信號(hào)可以分別在輸出端72V、72S和72A獲得。
對(duì)于重現(xiàn)操作,傳送流被硬盤驅(qū)動(dòng)器120從硬盤121到123讀出,所重現(xiàn)的傳送流被送到緩沖控制器110,然后從緩沖控制器110被送到多路復(fù)用器/解多路復(fù)用器100。然后,它由數(shù)字接口74處理,并被輸出到數(shù)字輸入/輸出端73,在進(jìn)一步從數(shù)字輸入/輸出端73經(jīng)由串行總線64輸出到外部裝置63,這樣用戶/觀看者就可以收看在連接到外部裝置63的監(jiān)視器7上顯示的對(duì)應(yīng)的圖象,收聽(tīng)也是從監(jiān)視器7輸出的聲音。
同時(shí),所重現(xiàn)的傳送流的PES被多路復(fù)用器/解多路復(fù)用器100的解多路復(fù)用器從傳送流中隔離,并被供給到MPEG音頻/視頻解碼器91,這樣被重現(xiàn)的模擬視頻信號(hào)和模擬音頻信號(hào)可以分別在輸出端72V、72S和72A獲得。
(音頻檢索)如上所述,音頻檢索部分150的操作就象用于檢索聲音段的本發(fā)明的第一個(gè)到第五個(gè)實(shí)施例的任何一個(gè)一樣。特別地,音頻檢索部分150不僅可以提取通過(guò)指定檢索關(guān)鍵碼聲音特性參數(shù)獲得的音頻信號(hào),也可以基于其連接關(guān)系提取對(duì)應(yīng)于所檢索的音頻信號(hào)的視頻信號(hào)的部分。例如,如果要檢查的音頻信號(hào)是音樂(lè)節(jié)目,則可以僅提取特定音樂(lè)響起處參數(shù)的場(chǎng)景。
如上所述,要檢查的音頻信號(hào)不限于記錄在硬盤驅(qū)動(dòng)器120上的信號(hào),也可以從外部接收或輸入的音頻數(shù)據(jù)中選擇。對(duì)于該實(shí)施例,由于有多個(gè)輸入音頻數(shù)據(jù),用戶也可以在他或她觀看監(jiān)視器62上的圖象和收聽(tīng)監(jiān)視器62上的一些其它輸入音頻信號(hào)的同時(shí)(可以使窗口一直出現(xiàn)或僅當(dāng)該圖象檢索時(shí)出現(xiàn)),分析包含在輸入音頻/視頻信號(hào)之一中的音頻信號(hào),隨后在顯示屏的窗口中顯示所檢索的圖象。例如,喜愛(ài)的演員的聲音印痕可以被用作檢索關(guān)鍵碼聲音特性參數(shù),只要發(fā)現(xiàn)該演員,就可以在窗口中顯示對(duì)應(yīng)的場(chǎng)景。
也可以為圖17所示的每個(gè)壓縮的靜止圖象200登記一個(gè)檢索關(guān)鍵碼聲音特性參數(shù),這樣,當(dāng)用戶指定任何一個(gè)壓縮的靜止圖象200時(shí),使用對(duì)應(yīng)于所指定的圖象200的檢索關(guān)鍵碼聲音特性參數(shù)的音頻檢索操作開(kāi)始。
例如,假定由用戶指定的壓縮的靜止圖象示出一個(gè)人,該人的聲音印痕被存儲(chǔ)在檢索關(guān)鍵碼存儲(chǔ)器中,作為檢索關(guān)鍵碼聲音特性參數(shù)。然后,一旦在壓縮的靜止圖象中指明該人的檢索關(guān)鍵碼,該實(shí)施例可以立即開(kāi)始提取該人出現(xiàn)和發(fā)言的場(chǎng)景。因此,如果預(yù)先為每個(gè)壓縮的靜止圖象登記檢索關(guān)鍵碼聲音特性參數(shù),則所壓縮的靜止圖象可以被用作檢索操作的索引。
相反地,也可以登記由特定檢索關(guān)鍵碼聲音特性參數(shù)提取的場(chǎng)景,從而將它作為壓縮的靜止圖象顯示在顯示屏上。例如,由作為語(yǔ)音印痕的一個(gè)人的特性聲音伴隨的場(chǎng)景,如果這個(gè)人不出現(xiàn)在該場(chǎng)景中,可以被作為壓縮的靜止圖象登記以便顯示在顯示屏上。
也可以將作為檢索關(guān)鍵碼或檢索關(guān)鍵碼聲音特性參數(shù)操作的音頻信號(hào)放在廣播信號(hào)上,用于多路復(fù)用。然后,用戶可以選擇和使用所希望的一個(gè)作為檢索關(guān)鍵碼或檢索關(guān)鍵碼聲音特性參數(shù)操作的音頻信號(hào),或者在檢索關(guān)鍵碼存儲(chǔ)器32中登記和存儲(chǔ)合適的作為檢索關(guān)鍵碼或檢索關(guān)鍵碼聲音特性參數(shù)操作的音頻信號(hào)。
上述的第一個(gè)實(shí)施例適用于使用僅用于檢索音頻信號(hào)的檢索關(guān)鍵碼,而該第二個(gè)實(shí)施例適用于使用不僅用于檢索音頻信號(hào)而且用于檢索視頻信號(hào)的檢索關(guān)鍵碼。
用該第二個(gè)實(shí)施例,可以被用于檢索關(guān)鍵碼用于檢索特性圖象的視頻信號(hào)的檢索關(guān)鍵碼圖象特性參數(shù)被預(yù)先登記??梢员挥糜诒景l(fā)明的目的檢索關(guān)鍵碼圖象特性參數(shù)可以包括亮度及其變化、色調(diào)及其變化和示出一個(gè)人或?qū)ο蟮膱?chǎng)景及其變化。
象檢索關(guān)鍵碼聲音特性參數(shù)一樣,檢索關(guān)鍵碼圖象特性參數(shù)也可以通過(guò)分析由用戶從輸入音頻/視頻信號(hào)中指定的視頻信號(hào)的時(shí)間段或者通過(guò)分析特定輸入到該實(shí)施例的視頻信號(hào)來(lái)獲得以便作為檢索關(guān)鍵碼來(lái)操作。也可以預(yù)先通常通過(guò)個(gè)人計(jì)算機(jī)獲得檢索關(guān)鍵碼,并將它們登記在實(shí)施例中。
然后,通過(guò)比較通過(guò)分析要檢查的視頻信號(hào)而獲得的圖象特性參數(shù)和檢索關(guān)鍵碼圖象特性參數(shù)和通過(guò)計(jì)算確定它們之間的相似性,類似檢索關(guān)鍵碼的圖象的圖象可以從要檢查的視頻信號(hào)中被檢索。然后,基于對(duì)音頻信號(hào)進(jìn)行的檢索操作的結(jié)果和對(duì)視頻信號(hào)進(jìn)行的檢索操作的結(jié)果,可以檢索輸入音頻/視頻信號(hào)的希望部分。
為了本發(fā)明的目的,檢索關(guān)鍵碼圖象特性參數(shù)和對(duì)應(yīng)的檢索關(guān)鍵碼聲音特性參數(shù)可以被獨(dú)立地登記為許多檢索關(guān)鍵碼,或者被彼此聯(lián)系地登記。例如,一個(gè)人的圖象的檢索關(guān)鍵碼圖象特性參數(shù)和該人的語(yǔ)音印痕的檢索關(guān)鍵碼聲音特性參數(shù)可以被聯(lián)系地登記。
用該第二個(gè)實(shí)施例,可以獨(dú)立地指定檢索關(guān)鍵碼圖象特性參數(shù)和檢索關(guān)鍵碼聲音特性參數(shù),進(jìn)行各自地檢索操作。也可以指定一個(gè)檢索關(guān)鍵碼,從而使用彼此聯(lián)系的檢索關(guān)鍵碼圖象特性參數(shù)和檢索關(guān)鍵碼聲音特性參數(shù)。
當(dāng)使用檢索關(guān)鍵碼聲音特性參數(shù)和檢索關(guān)鍵碼圖象特性參數(shù)進(jìn)行檢索操作時(shí),所有類似檢索關(guān)鍵碼并通過(guò)使用任何一個(gè)參數(shù)檢索的音頻/視頻信號(hào)的部分可以被輸出,或者類似檢索關(guān)鍵碼并通過(guò)使用兩個(gè)參數(shù)檢索的音頻/視頻信號(hào)的部分可以被輸出,這樣它們至少具有一些是共同的。
作為檢索操作的結(jié)果,被檢索的部分可以通過(guò)使用其地址信息被顯示。對(duì)于涉及的圖象,被檢索的部分的前導(dǎo)場(chǎng)景可以以前面描述的方式被顯示為壓縮的靜止圖象。也可以如上述的音頻檢索的實(shí)施例的情況,順序地重放信號(hào)的所檢索的部分。另外,也可以將檢索操作的結(jié)果和用作該操作的檢索關(guān)鍵碼聯(lián)系起來(lái),并將它們存儲(chǔ)在存儲(chǔ)器中,這樣該結(jié)果可以通過(guò)使用該檢索關(guān)鍵碼被重現(xiàn)。
用該第二個(gè)實(shí)施例,其中通過(guò)使用圖象特性參數(shù)檢測(cè)一時(shí)間段的視頻信號(hào),通過(guò)使用聲音特性參數(shù)檢測(cè)一時(shí)間段的音頻信號(hào),檢索操作可以非常有意義。例如,也可以檢索一部分音頻/視頻信號(hào),其中不同的場(chǎng)景可以出現(xiàn),但敘述繼續(xù)。
如果檢索關(guān)鍵碼被指定以便使用彼此聯(lián)系的檢索關(guān)鍵碼聲音特性參數(shù)和檢索關(guān)鍵碼圖象特性參數(shù),且通過(guò)使用檢索關(guān)鍵碼檢索的音頻/視頻信號(hào)的部分被顯示為許多壓縮的靜止圖象,則所顯示的圖象不僅在圖象方面而且在聲音方面是有意義的。
如上面所詳細(xì)描述的,根據(jù)本發(fā)明,提供了一種方法和一種裝置,可以從記錄的音頻信號(hào)檢索特定發(fā)言者的發(fā)言的部分或一樂(lè)器的調(diào)子,而不需要在記錄音頻信號(hào)時(shí)放置標(biāo)記(marker)或記錄計(jì)數(shù)器讀數(shù)或時(shí)刻。更具體說(shuō),要檢查的音頻信號(hào)和被用作檢索關(guān)鍵碼的音頻信號(hào)被分析,以獲得相應(yīng)的聲音特性參數(shù),所獲得的聲音特性參數(shù)被比較以確定兩個(gè)信號(hào)的相似性。
根據(jù)本發(fā)明,檢索關(guān)鍵碼可以被預(yù)先登記,這樣通過(guò)選擇性地使用任何登記的檢索關(guān)鍵碼,檢索操作可以容易地進(jìn)行。
另外,不象使用標(biāo)記的情況,通過(guò)使用預(yù)先準(zhǔn)備的檢索關(guān)鍵碼而不必記錄音頻信號(hào),要檢查的音頻信號(hào)的任何部分都可以被檢索。
最后,當(dāng)從音頻/視頻信號(hào)檢索希望的場(chǎng)景時(shí),檢索操作的可靠性可以通過(guò)使用聲音特性參數(shù)和圖象特性參數(shù)來(lái)提高。這樣,所檢索的場(chǎng)景在圖象和聲音方面都是有意義的。
權(quán)利要求
1.一種聲音檢索方法,用于通過(guò)比較從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的及依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的音頻信號(hào)而獲得的聲音特性參數(shù),并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào)。
2.如權(quán)利要求1所述的聲音檢索方法,其中所述一個(gè)或多于一個(gè)的音頻信號(hào)被預(yù)先準(zhǔn)備,從所準(zhǔn)備的音頻信號(hào)中,通過(guò)分析作為檢索關(guān)鍵碼操作的及從所述聲源產(chǎn)生的音頻信號(hào)而獲得的聲音特性參數(shù)被所述通過(guò)計(jì)算確定相似性的操作用作檢索關(guān)鍵碼聲音特性參數(shù)。
3.如權(quán)利要求2所述的聲音檢索方法,其中作為檢索關(guān)鍵碼操作的所述音頻信號(hào)從要分析的音頻信號(hào)中提取并存儲(chǔ)。
4.如權(quán)利要求1所述的聲音檢索方法,其中所述檢索關(guān)鍵碼聲音特性參數(shù)由用戶通過(guò)分析由用戶指定的要分析的音頻信號(hào)的部分而獲得,所述要分析的音頻信號(hào)通過(guò)使用檢索關(guān)鍵碼聲音特性參數(shù)被分析。
5.如權(quán)利要求1所述的聲音檢索方法,其中所述一個(gè)或多于一個(gè)的檢索關(guān)鍵碼聲音特性參數(shù)被預(yù)先存儲(chǔ),那些在檢索操作處理中從所存儲(chǔ)的檢索關(guān)鍵碼聲音特性參數(shù)中讀出的檢索關(guān)鍵碼聲音特性參數(shù),被用于所述通過(guò)計(jì)算確定相似性的操作。
6.如權(quán)利要求5所述的聲音檢索方法,其中所述檢索關(guān)鍵碼聲音特性參數(shù)是那些通過(guò)分析從所述要分析的音頻信號(hào)中提取的作為檢索關(guān)鍵碼操作的所述音頻信號(hào)而獲得的檢索關(guān)鍵碼聲音特性參數(shù)。
7.如權(quán)利要求1到5中任何一個(gè)所述的聲音檢索方法,其中對(duì)于通過(guò)計(jì)算確定相似性的處理,多于一個(gè)的檢索關(guān)鍵碼按預(yù)定時(shí)間單元被順序地逐一使用。
8.如權(quán)利要求1到6中任何一個(gè)所述的聲音檢索方法,其中對(duì)于要分析的音頻信號(hào),使用檢索關(guān)鍵碼的每個(gè)檢索處理的結(jié)果以時(shí)間順序顯示。
9.如權(quán)利要求7所述的聲音檢索方法,其中對(duì)于要分析的音頻信號(hào),使用檢索關(guān)鍵碼的每個(gè)檢索處理的結(jié)果以時(shí)間順序顯示。
10.如權(quán)利要求1到6中任何一個(gè)所述的聲音檢索方法,其中僅有類似檢索關(guān)鍵碼的要分析的音頻信號(hào)部分被提取和作為檢索處理的結(jié)果被重現(xiàn)。
11.如權(quán)利要求7所述的聲音檢索方法,其中僅有類似檢索關(guān)鍵碼的要分析的音頻信號(hào)的部分被提取和作為檢索操作的結(jié)果被重現(xiàn)。
12.一種聲音信息存儲(chǔ)方法,用于在記錄介質(zhì)上記錄輸入音頻信號(hào),和通過(guò)比較從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的及依賴于該音頻信號(hào)的聲源結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的音頻信號(hào)而獲得的聲音特性參數(shù)并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào),從而記錄與所述檢索關(guān)鍵碼聯(lián)系的檢索處理的結(jié)果和在所述記錄介質(zhì)上用于記錄所述輸入音頻信號(hào)的位置。
13.如權(quán)利要求12所述的聲音信息存儲(chǔ)方法,其中檢索處理的所述結(jié)果與在所述記錄介質(zhì)上的所述音頻信號(hào)一起被記錄。
14.如權(quán)利要求12或13所述的聲音信息存儲(chǔ)方法,其中從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的每個(gè)所述檢索關(guān)鍵碼聲音特性參數(shù)是作為對(duì)于根據(jù)用戶的指令選擇和提取的一部分所述輸入音頻信號(hào)進(jìn)行的分析處理的結(jié)果而獲得的。
15.如權(quán)利要求14所述的聲音信息存儲(chǔ)方法,其中作為對(duì)于根據(jù)用戶的指令選擇和提取的一部分所述輸入音頻信號(hào)進(jìn)行的分析處理的結(jié)果而獲得的作為檢索關(guān)鍵碼操作的所述一個(gè)或多于一個(gè)的音頻信號(hào)的所述檢索關(guān)鍵碼聲音特性參數(shù)被存儲(chǔ)在緩沖存儲(chǔ)器的不同的各個(gè)存儲(chǔ)器區(qū)域,且隨后被讀出和用于通過(guò)計(jì)算確定相似性檢索輸入音頻信號(hào)的一部分的處理。
16.如權(quán)利要求14所述的聲音信息存儲(chǔ)方法,其中根據(jù)用戶的各個(gè)指令選擇和提取的一個(gè)或多于一個(gè)部分的所述輸入音頻信號(hào)被存儲(chǔ)在緩沖存儲(chǔ)器的不同的各個(gè)存儲(chǔ)器區(qū)域當(dāng)成作為檢索關(guān)鍵碼操作的音頻信號(hào),并且所述作為檢索關(guān)鍵碼操作的一個(gè)或多于一個(gè)的音頻信號(hào)被從所述緩中存儲(chǔ)器讀出、分析以產(chǎn)生各個(gè)檢索關(guān)鍵碼聲音特性參數(shù),這樣所述通過(guò)計(jì)算確定相似性來(lái)檢索一部分輸入音頻信號(hào)的處理,就通過(guò)使用作為檢索關(guān)鍵碼操作的所述音頻信號(hào)來(lái)進(jìn)行。
17.如權(quán)利要求12或13所述的聲音信息存儲(chǔ)方法,其中作為檢索關(guān)鍵碼操作的所述音頻信號(hào)的所述聲音特性參數(shù)或作為檢索關(guān)鍵碼操作的所述音頻信號(hào)與在所述記錄介質(zhì)上的檢索處理的所述結(jié)果一起被記錄。
18.如權(quán)利要求14所述的聲音信息存儲(chǔ)方法,其中作為檢索關(guān)鍵碼操作的所述音頻信號(hào)的所述聲音特性參數(shù)或作為檢索關(guān)鍵碼操作的所述音頻信號(hào)與在所述記錄介質(zhì)上的檢索處理的所述結(jié)果一起被記錄。
19.一種聲音信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析要分析的音頻信號(hào)和獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),檢索要分析的音頻信號(hào)的一部分,其類似作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);和結(jié)果顯示裝置,用于顯示所述檢索處理的結(jié)果。
20.如權(quán)利要求19所述的聲音信息檢索設(shè)備,其中所述結(jié)果顯示裝置,在所述要分析的音頻信號(hào)的時(shí)間經(jīng)過(guò)的同時(shí),顯示由所述檢索裝置確定的所述類似部分。
21.如權(quán)利要求19所述的聲音信息檢索設(shè)備,還包括保持裝置,用于保持作為檢索關(guān)鍵碼操作的所述一個(gè)或多于一個(gè)的音頻信號(hào);讀取裝置,用于在檢索處理時(shí),從所述保持裝置,讀取所選擇的作為檢索關(guān)鍵碼操作的音頻信號(hào);和檢索關(guān)鍵碼聲音特性參數(shù)分析裝置,用于分析由所述讀取裝置讀出的作為檢索關(guān)鍵碼操作的音頻信號(hào),和獲得要提供給所述相似性確定裝置的檢索關(guān)鍵碼聲音特性參數(shù)。
22.如權(quán)利要求19所述的聲音信息檢索設(shè)備,還包括保持裝置,用于保持所述一個(gè)或多于一個(gè)的檢索關(guān)鍵碼聲音特性參數(shù);和讀取裝置,用于從所述保持裝置,讀取所選擇的檢索關(guān)鍵碼聲音特性參數(shù),并將它們提供到所述相似性確定裝置。
23.如權(quán)利要求22所述的聲音信息檢索設(shè)備,還包括檢索關(guān)鍵碼登記裝置,用于通過(guò)根據(jù)用戶的指令分析所述要分析的音頻信號(hào),從所述音頻信號(hào)提取作為檢索關(guān)鍵碼的聲音特性參數(shù),并將它們保持在所述保持裝置中。
24.如權(quán)利要求19所述的聲音信息檢索設(shè)備,其中對(duì)于通過(guò)計(jì)算確定相似性的處理,多于一個(gè)的檢索關(guān)鍵碼按預(yù)定時(shí)間單元被順序地逐一使用。
25.一種聲音信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析要分析的音頻信號(hào)和獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),檢索要分析的音頻信號(hào)的一部分,其類似作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);和重現(xiàn)裝置,用于根據(jù)所述檢索裝置的檢索處理的結(jié)果,提取和僅重現(xiàn)所述類似部分。
26.如權(quán)利要求25所述的聲音信息檢索設(shè)備,還包括保持裝置,用于保持作為檢索關(guān)鍵碼操作的所述一個(gè)或多于一個(gè)的音頻信號(hào);讀取裝置,用于在檢索處理時(shí),從所述保持裝置,讀取所選擇的作為檢索關(guān)鍵碼操作的音頻信號(hào);和檢索關(guān)鍵碼聲音特性參數(shù)分析裝置,用于分析由所述讀取裝置讀出的作為檢索關(guān)鍵碼操作的音頻信號(hào),和獲得要提供給所述相似性確定裝置的檢索關(guān)鍵碼聲音特性參數(shù)。
27.如權(quán)利要求26所述的聲音信息檢索設(shè)備,還包括檢索關(guān)鍵碼登記裝置,用于根據(jù)用戶的指令,從所述要分析的音頻信號(hào)提取作為檢索關(guān)鍵碼操作的所述音頻信號(hào),并將它們保持在所述保持裝置中。
28.如權(quán)利要求25所述的聲音信息檢索設(shè)備,還包括保持裝置,用于保持所述一個(gè)或多于一個(gè)的檢索關(guān)鍵碼聲音特性參數(shù);和讀取裝置,用于從所述保持裝置,讀取所選擇的檢索關(guān)鍵碼聲音特性參數(shù),并將它們提供到所述相似性確定裝置。
29.如權(quán)利要求28所述的聲音信息檢索設(shè)備,還包括檢索關(guān)鍵碼登記裝置,用于通過(guò)根據(jù)用戶的指令分析所述要分析的音頻信號(hào),從所述音頻信號(hào)提取作為檢索關(guān)鍵碼的聲音特性參數(shù),并將它們保持在所述保持裝置中。
30.如權(quán)利要求25所述的聲音信息檢索設(shè)備,其中對(duì)于通過(guò)計(jì)算確定相似性的處理,多于一個(gè)的檢索關(guān)鍵碼按預(yù)定時(shí)間單元被順序地逐一使用。
31.一種聲音信息存儲(chǔ)設(shè)備,包括記錄裝置,用于在記錄介質(zhì)上記錄輸入音頻信號(hào);聲音特性參數(shù)分析裝置,用于分析要分析的所述輸入音頻信號(hào)和獲得依賴于音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);和檢索裝置,用于比較作為檢索關(guān)鍵碼操作的一個(gè)或多于一個(gè)的音頻信號(hào)的聲音特性參數(shù)和輸入音頻信號(hào)的所述聲音特性參數(shù),和檢索要分析的輸入音頻信號(hào)的一部分,其類似于作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào),所述檢索裝置的檢索處理的結(jié)果被記錄,以便與所述檢索關(guān)鍵碼和在所述記錄介質(zhì)上用于記錄所述輸入音頻信號(hào)的位置相聯(lián)系。
32.如權(quán)利要求31所述的聲音信息存儲(chǔ)設(shè)備,其中所述檢索處理的結(jié)果與在所述記錄介質(zhì)上的所述音頻信號(hào)一起被記錄。
33.如權(quán)利要求31或32所述的聲音信息存儲(chǔ)設(shè)備,還包括檢索關(guān)鍵碼聲音特性參數(shù)分析裝置,用于分析根據(jù)用戶的指令提取的一部分所述輸入音頻信號(hào),以獲得所述作為檢索關(guān)鍵碼操作的一個(gè)或多于一個(gè)音頻信號(hào)的所述檢索關(guān)鍵碼聲音特性參數(shù);和檢索關(guān)鍵碼聲音特性參數(shù)保持裝置,用于保持由所述檢索關(guān)鍵碼聲音特性參數(shù)分析裝置作為檢索關(guān)鍵碼獲得的所述檢索關(guān)鍵碼聲音特性參數(shù)。
34.如權(quán)利要求31或32所述的聲音信息存儲(chǔ)設(shè)備,還包括檢索關(guān)鍵碼提取裝置,用于根據(jù)用戶的指令提取一部分所述輸入音頻信號(hào)當(dāng)成作為檢索關(guān)鍵碼操作的音頻信號(hào);檢索關(guān)鍵碼聲音信號(hào)保持裝置,用于存儲(chǔ)由所述檢索關(guān)鍵碼提取裝置提取的所述檢索關(guān)鍵碼音頻信號(hào);和檢索關(guān)鍵碼聲音特性參數(shù)分析裝置,用于根據(jù)從所述檢索關(guān)鍵碼音頻信號(hào)保持裝置讀出的檢索關(guān)鍵碼音頻信號(hào)獲得檢索關(guān)鍵碼聲音特性參數(shù),所述檢索裝置適用于比較由所述檢索關(guān)鍵碼聲音特性參數(shù)分析裝置獲得的檢索關(guān)鍵碼聲音特性參數(shù)和所述輸入音頻信號(hào)的所述聲音特性參數(shù)。
35.如權(quán)利要求34所述的聲音信息存儲(chǔ)設(shè)備,還包括檢索關(guān)鍵碼登記裝置,通過(guò)根據(jù)用戶的指令提取一部分所述要分析的音頻信號(hào)獲得作為檢索關(guān)鍵碼的聲音特性參數(shù),并將它們保持在所述保持裝置。
36.如權(quán)利要求31或32所述的聲音信息存儲(chǔ)設(shè)備,其中對(duì)于通過(guò)計(jì)算確定相似性的處理,多于一個(gè)的檢索關(guān)鍵碼按預(yù)定時(shí)間單元被順序地逐一使用。
37.一種聲音/圖象信息檢索方法,用于檢索包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的一部分,所述方法包括通過(guò)比較從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的及依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的所述音頻信號(hào)而獲得的聲音特性參數(shù)并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào),并且產(chǎn)生所檢索的部分作為對(duì)所述輸入信號(hào)進(jìn)行的檢索操作的結(jié)果。
38.一種聲音/圖象信息檢索方法,用于檢索包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的一部分,所述方法包括通過(guò)比較從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的及依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的所述音頻信號(hào)而獲得的聲音特性參數(shù)并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào),也通過(guò)比較作為檢索關(guān)鍵碼操作及示出該視頻信號(hào)的圖象的特性的每個(gè)檢索關(guān)鍵碼圖象特性參數(shù)和通過(guò)分析要分析的所述輸入的視頻獲得的圖象特性參數(shù),來(lái)檢索所述要分析的所述輸入信號(hào)的視頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的圖象,所述輸入信號(hào)的一部分基于對(duì)所述音頻信號(hào)進(jìn)行的檢索處理的結(jié)果和對(duì)所述視頻信號(hào)進(jìn)行的檢索處理的結(jié)果被檢索。
39.一種聲音/圖象信息存儲(chǔ)方法,用于記錄包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào),通過(guò)比較從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的及依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的所述音頻信號(hào)而獲得的聲音特性參數(shù)并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào),并且記錄所述檢索處理的結(jié)果,以便與所述檢索關(guān)鍵碼和在所述記錄介質(zhì)上用于記錄所述輸入音頻信號(hào)的位置相聯(lián)系。
40.一種聲音/圖象信息存儲(chǔ)方法,用于記錄包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào),通過(guò)比較從作為檢索關(guān)鍵碼操作的各個(gè)音頻信號(hào)獲得的及依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的每個(gè)檢索關(guān)鍵碼聲音特性參數(shù)和通過(guò)分析要分析的所述音頻信號(hào)而獲得的聲音特性參數(shù)并通過(guò)計(jì)算確定它們之間的相似性,來(lái)檢索所述要分析的音頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的音頻信號(hào),也通過(guò)比較作為檢索關(guān)鍵碼操作及示出該視頻信號(hào)的圖象的特性的每個(gè)檢索關(guān)鍵碼圖象特性參數(shù)和通過(guò)分析要分析的所述輸入的視頻獲得的圖象特性參數(shù),來(lái)檢索所述要分析的所述輸入信號(hào)的視頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的圖象,并且記錄對(duì)所述音頻信號(hào)和所述視頻信號(hào)進(jìn)行的檢索處理的結(jié)果,以便與所述檢索關(guān)鍵碼和在所述記錄介質(zhì)上用于記錄所述輸入音頻信號(hào)的位置相聯(lián)系。
41.一種聲音/圖象信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào),獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),并檢索要分析的音頻信號(hào)的一部分,其類似作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);和結(jié)果顯示裝置,用于顯示所述檢索處理的結(jié)果。
42.如權(quán)利要求41所述的聲音/圖象信息檢索設(shè)備,其中所述結(jié)果顯示裝置顯示對(duì)應(yīng)于由所述檢索裝置檢索的部分的視頻信號(hào)部分的圖象。
43.一種聲音/圖象信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào),并獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),并檢索要分析的音頻信號(hào)的一部分,其類似作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);和重現(xiàn)裝置,用于提取和重現(xiàn)對(duì)應(yīng)于所述類似部分的所述輸入信號(hào)的部分。
44.一種聲音/圖象信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào),和獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);聲音部分檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),和檢索要分析的音頻信號(hào)的一部分,其類似作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);圖象部分檢索裝置,用于通過(guò)比較作為檢索關(guān)鍵碼操作及示出該視頻信號(hào)的圖象的特性的每個(gè)檢索關(guān)鍵碼圖象特性參數(shù)和通過(guò)分析要分析的所述輸入的視頻獲得的圖象特性參數(shù),來(lái)檢索所述要分析的所述輸入信號(hào)的視頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的圖象;和結(jié)果顯示裝置,用于顯示所述聲音部分檢索裝置的檢索處理的結(jié)果和所述圖象部分檢索裝置的檢索處理的結(jié)果。
45.一種聲音/圖象信息檢索設(shè)備,包括聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào),及獲得依賴于該音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);聲音部分檢索裝置,用于比較作為檢索關(guān)鍵碼操作的音頻信號(hào)的聲音特性參數(shù)和從所述聲音特性參數(shù)分析裝置獲得的要分析的音頻信號(hào)的所述聲音特性參數(shù),和檢索要分析的音頻信號(hào)的一部分,其類似于作為檢索關(guān)鍵碼操作的和從檢索關(guān)鍵碼的聲源獲得的音頻信號(hào);圖象部分檢索裝置,用于通過(guò)比較作為檢索關(guān)鍵碼操作及示出該視頻信號(hào)的圖象的特性的每個(gè)檢索關(guān)鍵碼圖象特性參數(shù)和通過(guò)分析要分析的所述輸入的視頻獲得的圖象特性參數(shù),來(lái)檢索所述輸入信號(hào)的視頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的圖象;和重現(xiàn)裝置,用于提取和重現(xiàn)基于所述聲音部分檢索裝置的檢索處理的結(jié)果和所述圖象部分檢索裝置的檢索處理的結(jié)果確定的所述輸入信號(hào)的部分。
46.一種聲音/圖象信息存儲(chǔ)設(shè)備,包括記錄裝置,用于在記錄介質(zhì)上記錄包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào);聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào)和獲得依賴于音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);和聲音部分檢索裝置,用于比較作為檢索關(guān)鍵碼操作的一個(gè)或多于一個(gè)的音頻信號(hào)的聲音特性參數(shù)和所述輸入信號(hào)的音頻信號(hào)的所述聲音特性參數(shù),和檢索所述輸入信號(hào)的音頻信號(hào)的一部分,其類似于作為檢索關(guān)鍵碼操作的音頻信號(hào),所述聲音部分檢索裝置的檢索處理的結(jié)果被記錄,以便與所述檢索關(guān)鍵碼和在所述記錄介質(zhì)上用來(lái)記錄所述輸入信號(hào)的位置相聯(lián)系。
47.一種聲音/圖象信息存儲(chǔ)設(shè)備,包括記錄裝置,用于在記錄介質(zhì)上記錄包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào);聲音特性參數(shù)分析裝置,用于分析包括視頻信號(hào)和與所述視頻信號(hào)相聯(lián)系的音頻信號(hào)的輸入信號(hào)的音頻信號(hào)和獲得依賴于音頻信號(hào)的聲源的結(jié)構(gòu)因素的聲音特性參數(shù);聲音部分檢索裝置,用于比較作為檢索關(guān)鍵碼操作的一個(gè)或多于一個(gè)的音頻信號(hào)的聲音特性參數(shù)和所述輸入信號(hào)的音頻信號(hào)的所述聲音特性參數(shù),并檢索所述輸入信號(hào)的音頻信號(hào)的一部分,其類似于作為檢索關(guān)鍵碼操作的音頻信號(hào);和圖象部分檢索裝置,用于通過(guò)比較作為檢索關(guān)鍵碼操作及示出該視頻信號(hào)的圖象的特性的每個(gè)檢索關(guān)鍵碼圖象特性參數(shù)和通過(guò)分析要分析的所述輸入的視頻獲得的圖象特性參數(shù),來(lái)檢索所述輸入信號(hào)的視頻信號(hào)的一部分,其類似于一個(gè)或多于一個(gè)的作為許多檢索關(guān)鍵碼操作的圖象,所述聲音部分檢索裝置和所述圖象部分檢索裝置的檢索處理的結(jié)果被記錄,以與所述檢索關(guān)鍵碼和在所述記錄介質(zhì)上記錄所述輸入信號(hào)的位置相聯(lián)系。
全文摘要
聲音特征參數(shù)分析單元,設(shè)置在相似性計(jì)算單元的前級(jí)中,分析要檢索的聲音信號(hào),以獲得聲音特征參數(shù)。檢索器聲音信號(hào)讀取單元從檢索器存儲(chǔ)器中的檢索器存儲(chǔ)區(qū)域讀取檢索器的聲音信號(hào),用于由檢索器聲音特征參數(shù)分析單元分析以獲得檢索器聲音特征參數(shù)。相似性計(jì)算單元比較由聲音特征參數(shù)分析單元獲得的聲音特征參數(shù)和來(lái)自檢索器聲音特征參數(shù)分析單元的檢索器聲音特征參數(shù),以計(jì)算兩者之間的相似性,從要檢索的聲音信號(hào)中檢索類似于來(lái)自檢索器的聲源的聲音信號(hào)的部分。
文檔編號(hào)G11B27/34GK1327573SQ00802218
公開(kāi)日2001年12月19日 申請(qǐng)日期2000年8月25日 優(yōu)先權(quán)日1999年8月26日
發(fā)明者三浦雅美, 矢部進(jìn) 申請(qǐng)人:索尼公司