判斷聲音信號(hào)中是否混有低頻聲音信號(hào)的方法及相關(guān)裝置的制作方法

文檔序號(hào)：2822131閱讀：363來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：判斷聲音信號(hào)中是否混有低頻聲音信號(hào)的方法及相關(guān)裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明提供一種判斷聲音信號(hào)中是否混有低頻聲音(人聲)信號(hào)的方法及相關(guān)裝置，特別指一種以計(jì)算聲音信號(hào)中過零發(fā)生頻率的低成本、低計(jì)算量的人聲信號(hào)判別方法及相關(guān)裝置。
背景技術(shù)：
隨著信息、電子技術(shù)的進(jìn)步與普及，在現(xiàn)代社會(huì)中，娛樂的形式也越趨多樣化。舉例來說，有卡拉OK之稱的伴唱系統(tǒng)，就能夠播放歌曲的背景配樂，讓使用者不需樂團(tuán)的伴奏，就能隨背景配樂歌唱，享受專業(yè)級(jí)的娛樂環(huán)境。因應(yīng)伴唱系統(tǒng)的需要，現(xiàn)代的娛樂業(yè)者在推出有專業(yè)歌者配唱的歌曲時(shí)，也會(huì)一并推出該首歌曲不含歌者配唱人聲(vocal)的背景配樂，讓使用者在聆聽專業(yè)歌者配唱的歌曲之后，也能利用伴唱系統(tǒng)播放背景配樂，自己享受歌唱的樂趣。
由于信息儲(chǔ)存、傳播技術(shù)的長(zhǎng)足進(jìn)步，現(xiàn)在的電子技術(shù)已經(jīng)能將含有配唱人聲的歌曲及不含配唱人聲的背景音樂以不同聲道的模式同步儲(chǔ)存在同一媒體，由使用者擇一播放。請(qǐng)參考圖1。圖1為一常規(guī)播放裝置10的功能方塊示意圖。播放裝置10可以是一光盤播放器(player)或是配合一計(jì)算機(jī)(未示出)工作的一個(gè)光盤驅(qū)動(dòng)器(drive)，以讀出一光盤24C上儲(chǔ)存的歌曲影音數(shù)據(jù)，并加以播放。播放裝置10中以播放電路12完成其功能，播放電路12中則設(shè)有一接收電路14、一處理模塊16、一轉(zhuǎn)換電路18、一接口電路20及一揚(yáng)聲器22。接收電路14中設(shè)有一馬達(dá)24A及一讀取頭24B，以便從做為信息儲(chǔ)存媒體的光盤24C之中，讀取、分析出其所攜載的信號(hào)25。處理模塊16則用來主控播放裝置10的功能，其中設(shè)有一處理單元26A及一選擇電路26B。處理單元26A用來將接收電路14產(chǎn)生的信號(hào)25作進(jìn)一步的信號(hào)處理(如解調(diào)變、解碼等等)。如前所述，現(xiàn)行的數(shù)據(jù)處理技術(shù)已經(jīng)能將含有配唱人聲的歌曲和不含配唱人聲的歌曲以不同聲道的模式儲(chǔ)存在同一媒體(如光盤24C)上，而處理單元26A也就能由信號(hào)25中，解析出不同聲道的聲音信號(hào)27A、27B。另外，接口電路20可以是一控制面板，用來接受使用者的控制操作，并將使用者的控制操作轉(zhuǎn)換為電子信號(hào)，傳輸至處理模塊16，以使處理模塊16能依照使用者的控制操作來控制播放裝置10的工作。如選擇電路26B，即能接受使用者通過接口電路20的控制，選擇以聲音信號(hào)27A、27B其中之一做為信號(hào)29A，傳輸至轉(zhuǎn)換電路18中。轉(zhuǎn)換電路18可以是一數(shù)字轉(zhuǎn)模擬轉(zhuǎn)換電路，以將選擇電路26B傳來的數(shù)字信號(hào)29A轉(zhuǎn)換為模擬的信號(hào)29B，以利用模擬信號(hào)29B驅(qū)動(dòng)揚(yáng)聲器22，由揚(yáng)聲器22將對(duì)應(yīng)于信號(hào)29A的聲波播放出來，讓使用者能聽到。
換句話說，在常規(guī)的播放裝置10中，處理單元26A可將同時(shí)儲(chǔ)存在光盤24C上的不同聲道聲音信號(hào)27A、27B分析出來，由使用者經(jīng)由對(duì)接口電路20的控制操作，選擇是要將聲音信號(hào)27A或27B播放出來。一般來說，在現(xiàn)行的影音信息規(guī)格(如DVD規(guī)格，Digital Versatile Disc)下，通常即規(guī)范有左、右聲道，能儲(chǔ)存不同的聲音信號(hào)。利用左右聲道的模式，就能同時(shí)在光盤24C中，分別儲(chǔ)存含有配唱人聲的歌曲及不含配唱人聲的背景配樂；而使用者就能通過對(duì)播放裝置10的切換控制操作，選擇播放有人聲的歌曲或是不含配唱人聲的背景配樂。
雖然上述的配置能讓使用者播放不同頻帶的聲音信號(hào)享受不同的樂趣，但在現(xiàn)行的影音信息規(guī)格中，并未規(guī)范人聲歌曲和背景配樂的聲音信號(hào)要分別儲(chǔ)存在左右聲道中的哪一個(gè)聲道，故在市場(chǎng)上的各種音樂媒體資源，有些是將無人聲的背景配樂儲(chǔ)存在左聲道，有些則是將無人聲的背景配樂儲(chǔ)存在右聲道，莫衷一是。連帶地，使用者也要以嘗試查錯(cuò)的方法，切換控制操作播放裝置10，才能順利播出所想要的聲音。舉例來說，使用者想要播放不含人聲的背景配樂以享受伴唱的樂趣，但又不能確定背景配樂是在哪一個(gè)聲道，故使用者僅能選擇先播其中一聲道的聲音，若播放出來的是含有人聲配唱的歌曲，還要控制操作播放裝置10切換播出另一聲道的聲音，才終于能順利地播放不含人聲的背景配樂。這樣一來，對(duì)使用者自然是相當(dāng)不便，控制操作的過程也十分繁瑣。

發(fā)明內(nèi)容
因此，本發(fā)明的主要目的，在于提出一種能自動(dòng)檢測(cè)出人聲信號(hào)所在聲道的方法及相關(guān)裝置，以克服常規(guī)技術(shù)的缺點(diǎn)。
在常規(guī)技術(shù)中，由于音樂媒體資源有可能將無人聲的背景配樂存在左或右聲道中，沒有一定的標(biāo)準(zhǔn)，而常規(guī)技術(shù)的播放裝置又不能自動(dòng)檢測(cè)出人聲信號(hào)所在聲道，使得使用者僅能以嘗試查錯(cuò)的方式，自行猜測(cè)、試驗(yàn)到底左右聲道中分別儲(chǔ)存的是什么樣的音樂，對(duì)使用者來說并不方便。
在本發(fā)明中，則是利用人聲的頻率比背景配樂頻率低的原理，計(jì)算、比較兩聲道的聲音信號(hào)中過零(聲音信號(hào)的電平跨越零電平)發(fā)生的頻率，若一聲道的過零發(fā)生頻率遠(yuǎn)比另一聲道過零發(fā)生頻率低，即可判斷該聲道中已混有人聲信號(hào)。檢測(cè)出人聲信號(hào)所在的聲道后，本發(fā)明中的播放裝置即可依使用者是否要播放背景音樂的需求，自動(dòng)選擇要播放左聲道或右聲道。這樣一來，使用者就再也不必自行以嘗試查錯(cuò)的方式，盲目地控制操作播放裝置。
本發(fā)明公開的人聲聲道檢測(cè)方法所需的計(jì)算量極少，故可簡(jiǎn)單、快速、低廉地以軟件、硬件或固件的方式來實(shí)施；而本發(fā)明公開的方法除了檢測(cè)人聲所在聲道之外，也可推廣運(yùn)用于低頻信號(hào)所在聲道的自動(dòng)檢測(cè)，以極低的計(jì)算量，來實(shí)現(xiàn)快速有效的低頻信號(hào)檢測(cè)。

圖1為一常規(guī)播放裝置的功能方塊示意圖。
圖2為各種聲音信號(hào)典型波形的示意圖。
圖3示意表示的是本發(fā)明判斷人聲聲道的演算法。
圖4為本發(fā)明中用來實(shí)現(xiàn)圖3演算法的播放裝置的功能方塊示意圖。
圖5列表表示的是本發(fā)明實(shí)際實(shí)施時(shí)在不同聲道的過零累計(jì)次數(shù)。
附圖符號(hào)說明10、30播放裝置12、32播放電路14、34接收電路16、36處理模塊18、38轉(zhuǎn)換電路20、40接口電路22、42揚(yáng)聲器 24A、43A馬達(dá)24B、43B讀取頭24C、43C光盤25、29A-29B、45、49A-49B信號(hào)26A、46A處理單元26B、46B選擇電路27A-27B、47A-47B聲音信號(hào)50判斷電路52A-52B檢測(cè)模塊54比較模塊56A-56B過零計(jì)數(shù)結(jié)果
58比較結(jié)果100演算法200表格 CL1、CL2直列RW1-RW14橫行C1比較單元C2計(jì)算單元D延遲單元Vn、Mn、Sn波形t1-t5時(shí)間點(diǎn) T1-T2時(shí)間段L0基準(zhǔn)電平L1-L3電平具體實(shí)施方式
為進(jìn)一步說明本發(fā)明技術(shù)的原理，請(qǐng)先參考圖2；圖2為各種聲音信號(hào)對(duì)應(yīng)波形的示意圖；各波形的橫軸代表時(shí)間，縱軸代表各波形的幅值大小。如本領(lǐng)域技術(shù)人員所知，數(shù)字的聲音信號(hào)中，是以序列排列的各組數(shù)據(jù)來代表一聲波在不同取樣時(shí)間點(diǎn)的幅值大小。集合聲音信號(hào)中的各組數(shù)據(jù)，即可重建回該聲音信號(hào)對(duì)應(yīng)聲波的幅值大小。舉例來說，在圖2中，由一聲音信號(hào)在時(shí)間點(diǎn)t1、t2、t3等等各取樣時(shí)間點(diǎn)對(duì)應(yīng)的各組數(shù)據(jù)中所分別記載的幅值L1、L2及L3等等，就可形成波形Sn。而在圖2中，波形Vn即代表僅有人聲的聲音信號(hào)的典型波形，波形Mn代表僅有背景配樂的聲音信號(hào)的典型波形，而波形Sn則是混有人聲及背景配樂的典型波形，也就是將波形Vn、Mn混音后(例如說是相加性的混合)的結(jié)果；在各波形Mn、Vn及Sn中分別標(biāo)示出的基準(zhǔn)電平L0，就代表幅值為零的零電平。
基本上，歌曲中的人聲部份通常較為低頻，就像圖2中的波形Vn所示，其波形變化較為平緩。相對(duì)地，背景配樂中由樂器演奏出來的音樂，通常具有較高的頻率，而各種樂器開始、結(jié)束演奏的時(shí)機(jī)也不一致，故背景音樂的波形Mn通常具有較為劇烈的變化，其幅值會(huì)在正負(fù)之間頻繁地振蕩，就如圖2中所示。而當(dāng)人聲較低頻的波形Vn和背景配樂較高頻的波形Mn互相混合而形成歌曲后，其混合出的波形Sn則會(huì)呈現(xiàn)高頻信號(hào)被載入至低頻信號(hào)的特征，如圖2中所示。觀察僅有背景配樂的波形Mn和混有人聲的歌曲波形Sn可發(fā)現(xiàn)，在波形Sn中，信號(hào)雖然還是包含有劇烈變化的高頻部份，但由于波形Sn中加入了較低頻的人聲部份，故其波形幅值就不會(huì)頻繁地在正負(fù)之間振蕩。換句話說，混有人聲的波形Sn，其幅值在單位時(shí)間內(nèi)穿越零電平(也就是過零，zero-crossing)的次數(shù)就會(huì)遠(yuǎn)比僅有背景音樂的波形Mn來得少。舉例來說，就如圖2中所示，在時(shí)間段T1中，高頻劇烈振蕩的波形Mn有九次過零(如在時(shí)間點(diǎn)t4a、t4b與t5a、t5b之間，等等)，混入低頻人聲的波形Sn就僅有三次過零(如在時(shí)間點(diǎn)t6a、t6b之間，等等)。同理，在后續(xù)的時(shí)間段T2等等，也可看出混有低頻人聲的波形Sn，其幅值在單位時(shí)間內(nèi)過零的次數(shù)會(huì)比僅有背景音樂的波形Mn少的多。根據(jù)上述這種聲音信號(hào)的特性，本發(fā)明即可利用單位時(shí)間內(nèi)過零次數(shù)的多少(也就是過零發(fā)生的頻率)，來比較、判斷出哪一個(gè)聲道的聲音信號(hào)混有人聲，哪一個(gè)聲道的聲音信號(hào)僅有背景配樂。
綜合以上所述可知，只要分別計(jì)算兩聲道的聲音信號(hào)在一定時(shí)間內(nèi)過零的次數(shù)，若其中一聲音信號(hào)A的過零次數(shù)遠(yuǎn)小于另一聲音信號(hào)B的過零次數(shù)，即可判斷前一聲音信號(hào)A中混有低頻的人聲信號(hào)。請(qǐng)參考圖3。圖3中的演算法100，即是將本發(fā)明上述的技術(shù)構(gòu)思以程序語(yǔ)言描述的演算法來呈現(xiàn)。在演算法100中，變數(shù)LnZCR、RnZCR分別用來記錄左、右聲道中聲音信號(hào)過零次數(shù)的計(jì)數(shù)結(jié)果，變數(shù)Ln、Rn就分別代表左、右聲道中的聲音信號(hào)。如前所述，在聲音信號(hào)中，是將不同取樣時(shí)間點(diǎn)的幅值記錄在聲音信號(hào)中的各組數(shù)據(jù)，故可將變數(shù)Ln、Rn視為陣列變數(shù)，以不同的指標(biāo)來分別代表聲音信號(hào)中的各組數(shù)據(jù)。如圖3中所示，演算法100的A1部份是用來累算聲音信號(hào)Ln中過零的次數(shù)；針對(duì)不同的指標(biāo)I，比較相鄰兩組數(shù)據(jù)Ln(I)及Ln(I+1)(也就是聲音信號(hào)中相鄰兩個(gè)取樣時(shí)間點(diǎn)的幅值)相乘后的正負(fù)，若為負(fù)就代表變數(shù)Ln對(duì)應(yīng)的聲音信號(hào)在此兩組數(shù)據(jù)對(duì)應(yīng)的取樣時(shí)間點(diǎn)之間發(fā)生了過零；而變數(shù)LnZCR也就可累進(jìn)1，代表變數(shù)Ln對(duì)應(yīng)聲音信號(hào)中過零的次數(shù)又增加了一次。而在實(shí)際實(shí)施A1部份時(shí)，可以用一變數(shù)Sampl eLength來設(shè)定指標(biāo)I累進(jìn)的上限；換句話說，變數(shù)SampleLength就對(duì)應(yīng)于一預(yù)設(shè)時(shí)間段，演算法100的A1部份就是要計(jì)算變數(shù)Ln對(duì)應(yīng)的聲音信號(hào)在此預(yù)設(shè)時(shí)間段內(nèi)過零累計(jì)的次數(shù)，并將過零次數(shù)計(jì)算的結(jié)果儲(chǔ)存在變數(shù)LnZCR。同理，演算法的A2部份就是要計(jì)算變數(shù)Rn對(duì)應(yīng)的聲音信號(hào)(也就是另一聲道的聲音信號(hào))在同樣的預(yù)設(shè)時(shí)間段(同樣由變數(shù)SampleLength來控制)內(nèi)過零的次數(shù)，并將次數(shù)累計(jì)的結(jié)果儲(chǔ)存在變數(shù)RnZCR。
在本發(fā)明的演算法100的A3部份，即是用來比較兩聲音信號(hào)的過零次數(shù)，以判斷究竟是哪一個(gè)聲道中的聲音信號(hào)混有低頻的人聲。如圖3的演算法100所示，若變數(shù)Ln對(duì)應(yīng)聲音信號(hào)的過零次數(shù)LnZCR遠(yuǎn)比另一聲音信號(hào)的過零次數(shù)RnZCR大(兩者相差的程度大于一預(yù)設(shè)的閾值(threshold))，就可判斷變數(shù)Rn對(duì)應(yīng)的聲音信號(hào)中混有較低頻的人聲。相對(duì)地，若變數(shù)Ln對(duì)應(yīng)的聲音信號(hào)在預(yù)設(shè)時(shí)間段內(nèi)的過零次數(shù)LnZCR遠(yuǎn)比另一聲音信號(hào)在同一預(yù)設(shè)時(shí)間段內(nèi)的過零次數(shù)RnZCR來得小(相差的程度大于閾值(threshold))，就可判斷變數(shù)Ln對(duì)應(yīng)的聲音信號(hào)中才混有人聲。若兩聲道的過零次數(shù)LnZCR、RnZCR間的相互關(guān)系不符合上述兩者(如兩過零次數(shù)間的差異小于閾值(threshold))，就可能是兩聲道的聲音信號(hào)均混有人聲，或兩者均未混有人聲。若是這種情形，此時(shí)本發(fā)明還可另外采取別的步驟。舉例來說，若兩聲道的聲音信號(hào)皆混有人聲，則可進(jìn)行一降低步驟，將聲音信號(hào)通由一特定的濾波程序或其他的信號(hào)處理，將聲音信號(hào)中的低頻人聲降低、濾除；譬如說是以一帶拒(band-stop)濾波器，將聲音信號(hào)中人聲頻帶的信號(hào)濾除。
換句話說，利用本發(fā)明公開在圖3中的演算法100來比較不同聲道的聲音信號(hào)在單位時(shí)間(預(yù)設(shè)時(shí)間段)中過零發(fā)生的次數(shù)，就能判斷出哪一個(gè)聲道的聲音信號(hào)混有人聲。請(qǐng)注意本發(fā)明的演算法100所需的計(jì)算量極低，僅需單純地比較聲音信號(hào)相鄰兩組數(shù)據(jù)的正負(fù)值以判斷過零是否發(fā)生，并累加過零發(fā)生的次數(shù)。故本發(fā)明的演算法100能簡(jiǎn)單、快速、低成本、高效率地以軟件、硬件電路或固件等等各種形式來實(shí)施，完全不需要濾波、頻譜計(jì)算等高計(jì)算量的繁瑣數(shù)據(jù)處理及信號(hào)處理。事實(shí)上，在一般的數(shù)字聲音信號(hào)中，代表幅值的每組數(shù)據(jù)中皆會(huì)有一位(bit)用來代表幅值的正負(fù)(即正負(fù)位，sign bit)，故在判斷過零是否發(fā)生在相鄰兩組數(shù)據(jù)間時(shí)，僅需對(duì)這兩組數(shù)據(jù)的正負(fù)位進(jìn)行異或(XOR，exclusive OR)運(yùn)算；若這兩組數(shù)據(jù)的正負(fù)位相異，就代表過零發(fā)生。利用正負(fù)位的互斥或運(yùn)算來判斷過零，本發(fā)明的演算法100也就更為快速地工作，所需的運(yùn)算量也就更低了。
請(qǐng)參考圖4。圖4為本發(fā)明實(shí)施于一播放裝置30的功能方塊示意圖。播放裝置30中以播放電路32完成其功能，播放電路32中則設(shè)有一接收電路34、一處理模塊36、一接口電路40、一轉(zhuǎn)換電路38及一揚(yáng)聲器42。播放裝置30可以是一光盤播放器(player)或一光盤驅(qū)動(dòng)器(drive)，其可設(shè)有一馬達(dá)43A及一激光讀取頭43B，以由一光盤43C讀出信號(hào)45(如影音信號(hào))。處理模塊36可設(shè)有一處理單元46A、一判斷電路50及一選擇電路46B；接口電路40則可以是一控制面板，用來接受使用者的控制，而處理模塊36即可根據(jù)接口電路40接收的使用者控制，控制操作播放裝置30的工作。其中，處理模塊36中的處理單元46A可將信號(hào)45做進(jìn)一步的信號(hào)處理(如解碼、解調(diào)變)，由信號(hào)45中解析出左右不同聲道的聲音信號(hào)47A、47B，并在選擇電路46B的控制下，在聲音信號(hào)47A、47B兩者間選擇其中之一成為信號(hào)49A。而轉(zhuǎn)換電路38即可將數(shù)字形式的信號(hào)49A轉(zhuǎn)換為模擬的信號(hào)49B，傳輸至揚(yáng)聲器42，以將信號(hào)49B轉(zhuǎn)換為聲波播放出來。
在本發(fā)明的播放裝置30中，選擇電路46B除了跟常規(guī)的播放裝置10一樣，能根據(jù)使用者通過接口電路40的控制，由使用者手動(dòng)選擇其中一聲道的聲音信號(hào)來播放外，還能以判斷電路50來實(shí)現(xiàn)本發(fā)明在圖3中的演算法，自動(dòng)地在左右聲道的聲音信號(hào)47A、47B中，分辨出混有人聲的聲音信號(hào)，并控制選擇電路40選出適當(dāng)?shù)穆曇粜盘?hào)成為信號(hào)49A。換句話說，本發(fā)明播放裝置30的使用者操作接口，除了能由使用者手動(dòng)切換播出左右聲道的聲音信號(hào)，還可增設(shè)如”卡拉OK模式”(或可稱”無人聲模式”)的操作模式；一旦使用者進(jìn)入此模式，本發(fā)明的判斷電路50就會(huì)開始工作，自動(dòng)在聲音信號(hào)47A、47B中選出未混有人聲的聲音信號(hào)作為信號(hào)49，并通過轉(zhuǎn)換電路38、揚(yáng)聲器42將其播放出來。這樣一來，使用者就不必經(jīng)由繁瑣的嘗試查錯(cuò)才能在左右聲道中找到未混有人聲的背景配樂。當(dāng)然，等效地，本發(fā)明的播放裝置30也能有另一”歌曲模式”，一旦使用者控制操作播放裝置30進(jìn)行此模式，判斷電路50就會(huì)在聲音信號(hào)47A、47B中選出混有人聲的歌曲聲音信號(hào)并予以播放。
為了實(shí)現(xiàn)本發(fā)明在圖3中的演算法100，判斷電路50中可實(shí)現(xiàn)出兩檢測(cè)模塊52A、52B及一比較模塊54。檢測(cè)模塊52A、52B分別用來計(jì)算左右聲道的聲音信號(hào)47A、47B中的過零次數(shù)，并分別產(chǎn)生過零計(jì)數(shù)結(jié)果56A、56B；也就是說，檢測(cè)模塊52A、52B分別用來實(shí)現(xiàn)圖3中演算法100的A1部分及A2部分。比較模塊54則能實(shí)現(xiàn)演算法100的A3部份，根據(jù)聲音信號(hào)47A、47B在預(yù)設(shè)時(shí)間段中過零次數(shù)的多少關(guān)系，自動(dòng)判斷哪一個(gè)聲音信號(hào)是未混有人聲的背景配樂，并產(chǎn)生一對(duì)應(yīng)的比較結(jié)果58。根據(jù)比較結(jié)果58，選擇電路46B就能在聲音信號(hào)47A、47B中選出一適當(dāng)?shù)男盘?hào)，作為信號(hào)49A而傳輸至轉(zhuǎn)換電路38。檢測(cè)模塊52A、52B的實(shí)施方式基本上都是相同的，以檢測(cè)模塊52A為例，檢測(cè)模塊52A中可實(shí)現(xiàn)一延遲器D，以一比較單元C1比較聲音信號(hào)47A中前后兩組數(shù)據(jù)是否為一正一負(fù)；如前所述，比較單元C1可以是一互斥或的邏輯運(yùn)算單元，以比較聲音信號(hào)47A中前后相鄰的兩組數(shù)據(jù)的正負(fù)位是否相同。若該兩組數(shù)據(jù)的確是一正一負(fù)，代表過零發(fā)生了，而比較單元C1就能觸發(fā)一計(jì)算單元C2將過零的次數(shù)累進(jìn)1；反之，若該兩組數(shù)據(jù)同號(hào)(同為正或負(fù))，比較單元C1就不會(huì)觸發(fā)計(jì)算單元C2累進(jìn)1。經(jīng)過一定的預(yù)設(shè)時(shí)間段后(如圖3中變數(shù)SampleLength所定義的)，比較單元C1就可將過零次數(shù)累計(jì)的過零計(jì)數(shù)結(jié)果56A傳輸至比較模塊54。在本發(fā)明中，判斷電路50的整體功能能以簡(jiǎn)單的邏輯電路來實(shí)現(xiàn)，或是以固件形式來實(shí)現(xiàn)。換句話說，圖3中的演算法100可以編譯成一程序碼，儲(chǔ)存在處理模塊36相關(guān)的非易失性存儲(chǔ)器中(如快閃存儲(chǔ)器，但未在圖4中示出)。處理模塊36執(zhí)行該程序碼的功能，就能實(shí)現(xiàn)判斷電路50的功能，自動(dòng)判斷聲音信號(hào)47A、47B中那一個(gè)混有人聲。
為說明本發(fā)明實(shí)際實(shí)施的結(jié)果，請(qǐng)參考圖5(并一并參考圖3)。圖5中的表格200即為本發(fā)明的演算法100(見圖3)實(shí)際實(shí)施于一典型音樂媒體左右兩聲道的聲音信號(hào)后，真實(shí)累計(jì)出來的過零次數(shù)。表格200中的直列CL1、CL2分別記錄的是左右兩聲道的過零次數(shù)，直列CL3則代表演算法100在A3部份判斷的結(jié)果；而各橫列(如圖5中標(biāo)出的橫行RW1、RW2至RW14)則代表不同的時(shí)間段中，兩聲道分別累計(jì)的過零次數(shù)。在得出圖5的表格200時(shí)，兩聲道的聲音信號(hào)具有取樣頻率44100赫茲(HZ)，也就是各聲音信號(hào)在一秒鐘中有44100組數(shù)據(jù)；過零次數(shù)累算的預(yù)設(shè)時(shí)間段為1秒(也就是說，演算法100中的變數(shù)SampleLength設(shè)為44100；因?yàn)橐幻雰?nèi)有44100組數(shù)據(jù))；而要得出比較結(jié)果時(shí)，演算法100中的閾值(threshold)則設(shè)為200。每隔一個(gè)預(yù)設(shè)時(shí)間段的時(shí)間長(zhǎng)度，就重新進(jìn)行演算法100一次。舉例來說，如圖5中橫行RW1代表的就是在第N至第(N+1)秒中，左右兩聲道分別有4527及1308次過零；在進(jìn)行演算法100的A3部份后，即可判斷出左聲道的聲音信號(hào)未混有人聲(因其左聲道的過零次數(shù)比右聲道過零次數(shù)大，且兩者的差異值大于閾值(threshold))。在接下來的第(N+1)至第(N+2)秒中，演算法100又被重新進(jìn)行一次，再度由0開始累計(jì)兩聲道過零的次數(shù)；而其計(jì)數(shù)的結(jié)果就如橫行RW2所示，左右兩聲道中分別有2569及1673次過零，同樣地也能判斷出人聲混在右聲道。橫行RW3則是演算法100在第(N+2)至第(N+3)秒中累計(jì)的過零次數(shù)及比較結(jié)果。最后，橫行RW14中，即是在第(N+13)至第(N+14)秒中，兩聲道的過零次數(shù)及比較結(jié)果。而實(shí)際聆聽左右聲道的聲音后，也可發(fā)現(xiàn)，人聲的確是混在右聲道，而左聲道的是無人聲的背景配樂。總結(jié)來說，由圖5可知，根據(jù)本發(fā)明公開在圖3中的演算法100，的確能正確判斷出哪一個(gè)聲道的聲音信號(hào)混有人聲。
如前所述，在本發(fā)明的播放裝置30(請(qǐng)見圖4)中，可增設(shè)如”卡拉OK模式”或是”歌曲模式”，由判斷電路50實(shí)現(xiàn)演算法100，自動(dòng)判斷人聲所在的聲道。在實(shí)際工作時(shí)，判斷電路50也可依照?qǐng)D5中情形，每隔一段預(yù)設(shè)時(shí)間段，就重新由0累計(jì)各聲音信號(hào)的過零次數(shù)，重新進(jìn)行兩聲道間的比較及判斷；而判斷電路50也可不斷地依據(jù)各時(shí)間段內(nèi)的比較結(jié)果，選擇適當(dāng)?shù)穆暤?。另外，演算?00中閾值(threshold)的設(shè)置，則是用來防止誤判的發(fā)生。由在各聲道中過零的次數(shù)為隨機(jī)值，在某些較為特殊的情形下，在某些時(shí)間段中，有可能混有人聲的聲道反而比無人聲的聲道具有較多的過零，但兩者過零次數(shù)相差必定有限；故在演算法100中設(shè)定適當(dāng)?shù)拈撝?，就能防止誤判的情形發(fā)生。也就是說，只有在兩聲道的過零次數(shù)相差超過閾值，由過零次數(shù)來判斷人聲所在聲道才是有意義的；若兩聲道過零次數(shù)相差的程度過少(少于閾值)，兩者間的過零次數(shù)差異可能就只是某些隨機(jī)出現(xiàn)的過零所造成的，較缺乏意義。不過，由圖5的例子可看出，這種特殊情形發(fā)生的機(jī)會(huì)并不高。
本發(fā)明的構(gòu)思除了使用在光盤播放器、光盤驅(qū)動(dòng)器之外，也可普遍運(yùn)用在其他的播放裝置，甚至成為計(jì)算機(jī)中軟件播放程序的一部份。舉例來說，在圖4中的接收電路34除了可以如圖4一般是光盤伺服機(jī)構(gòu)之外，也可以是一有線或無線的網(wǎng)路接口電路，可由有線或無線網(wǎng)路取得影音信號(hào)。還有，就如圖3中對(duì)演算法100的A3部份的討論，在處理模塊36中也可另外實(shí)現(xiàn)一降低濾波模塊(未示在圖4)，當(dāng)兩聲音信號(hào)47A、47B間過零次數(shù)的差異未超過閾值時(shí)，即可以此降低濾波模塊來降低、濾除聲音信號(hào)中的人聲。另外，在計(jì)算機(jī)中，某些特殊格式的影音文件(如MP3格式的音樂文件)常要以一播放軟件來加以解碼、播放，而本發(fā)明的演算法也可實(shí)施在此種播放軟件中，讓播放軟件本身能自動(dòng)判斷人聲所在的聲道。另外，由本發(fā)明在圖2中的原理討論可知，本發(fā)明除了找出人聲所在的聲音聲道外，也可廣泛用來在多聲道的系統(tǒng)中，以低計(jì)算量、低成本、快速有效率的簡(jiǎn)單方法，找出混有低頻信號(hào)的聲道。
在常規(guī)技術(shù)的播放裝置中，由于缺乏有效、低運(yùn)算量的方法來判斷多聲道系統(tǒng)中人聲所在的聲道，故使用者僅能自己以嘗試查錯(cuò)的方法進(jìn)行手動(dòng)切換，才能順利分辨出哪一個(gè)聲道的信號(hào)中混有人聲。相較之下，本發(fā)明則公開一低成本、低運(yùn)算量的方法及相關(guān)裝置，能在預(yù)設(shè)時(shí)間段內(nèi)計(jì)算各聲道聲音信號(hào)中過零的次數(shù)，并根據(jù)過零次數(shù)的差異來判斷哪一個(gè)聲道中混有人聲。這樣一來，本發(fā)明就能由播放裝置來自動(dòng)判斷人聲所在的聲道，讓使用者省去自行嘗試查錯(cuò)的麻煩，提供使用者更便利的影音播放服務(wù)。
以上所述僅為本發(fā)明的較佳實(shí)施例，凡依本發(fā)明權(quán)利要求所做的等效變化與修改，皆應(yīng)屬本發(fā)明的涵蓋范圍。
權(quán)利要求
1.一種判斷一聲音信號(hào)中是否混有一低頻聲音信號(hào)的方法；該聲音信號(hào)中包含有多組數(shù)據(jù)，各組數(shù)據(jù)分別代表一聲波在不同時(shí)間的幅值大??；而該方法包含有設(shè)定一基準(zhǔn)電平及一預(yù)設(shè)時(shí)間段；進(jìn)行一計(jì)算步驟，以根據(jù)該多組數(shù)據(jù)，計(jì)算該聲波的幅值在該預(yù)設(shè)時(shí)間段內(nèi)跨越該基準(zhǔn)電平的次數(shù)，并產(chǎn)生一對(duì)應(yīng)的計(jì)數(shù)結(jié)果；以及進(jìn)行一判斷步驟，以根據(jù)該計(jì)數(shù)結(jié)果，判斷該聲音信號(hào)中是否混入該低頻聲音信號(hào)。
2.如權(quán)利要求1所述的方法，其中當(dāng)根據(jù)該計(jì)數(shù)結(jié)果判斷時(shí)，若該計(jì)數(shù)結(jié)果小于一預(yù)設(shè)值，則判斷該聲音信號(hào)中有混入該低頻聲音信號(hào)。
3.如權(quán)利要求1所述的方法，其中當(dāng)根據(jù)該計(jì)數(shù)結(jié)果判斷時(shí)，若該計(jì)數(shù)結(jié)果大于一預(yù)設(shè)值，則判斷該聲音信號(hào)中沒有混入該低頻聲音信號(hào)。
4.如權(quán)利要求1所述的方法，其中該低頻聲音信號(hào)的頻帶范圍是人聲的頻帶范圍。
5.如權(quán)利要求1所述的方法，其中當(dāng)進(jìn)行該計(jì)算步驟時(shí)，在對(duì)應(yīng)該預(yù)設(shè)時(shí)間段的多組數(shù)據(jù)中，比較一組數(shù)據(jù)與次一組數(shù)據(jù)是否分別有一組數(shù)據(jù)大于及小于該基準(zhǔn)電平；若該組數(shù)據(jù)與該次組數(shù)據(jù)分別有一組數(shù)據(jù)大于及小于該基準(zhǔn)電平，則判斷該聲波在該組數(shù)據(jù)與該次組數(shù)據(jù)間有跨越該基準(zhǔn)電平。
6.如權(quán)利要求1所述的方法，其中該基準(zhǔn)電平為零電平。
7.如權(quán)利要求1所述的方法，其另包含有若判斷該聲音信號(hào)中已混入該低頻聲音信號(hào)，則進(jìn)行一降低步驟，以減少該聲音信號(hào)中該低頻聲音信號(hào)的大小。
8.如權(quán)利要求1所述的方法，其另包含有取得一第二聲音信號(hào)，該第二聲音信號(hào)中包含有多組數(shù)據(jù)，各組數(shù)據(jù)分別代表一第二聲波在不同時(shí)間的幅值大?。桓鶕?jù)該第二聲音信號(hào)中的多組數(shù)據(jù)，計(jì)算該第二聲波的幅值在該預(yù)設(shè)時(shí)間段內(nèi)跨越該基準(zhǔn)電平的次數(shù)，并產(chǎn)生一對(duì)應(yīng)的第二計(jì)數(shù)結(jié)果；以及當(dāng)進(jìn)行該判斷步驟時(shí)，根據(jù)該聲音信號(hào)的計(jì)數(shù)結(jié)果是否大于該第二計(jì)數(shù)結(jié)果，來判斷該聲音信號(hào)中是否混入該低頻聲音信號(hào)。
9.如權(quán)利要求8所述的方法，其中當(dāng)進(jìn)行該判斷步驟時(shí)，若該計(jì)數(shù)結(jié)果比該第二計(jì)數(shù)結(jié)果小一閾值，則判斷該聲音信號(hào)中有混入該低頻聲音信號(hào)。
10.一種播放電路，其包含有一判斷電路，用來判斷一聲音信號(hào)中是否混有一低頻聲音信號(hào)的方法；該聲音信號(hào)中包含有多組數(shù)據(jù)，各組數(shù)據(jù)分別代表一聲波在不同時(shí)間的幅值大??；該判斷電路包含有一檢測(cè)模塊，用來根據(jù)該多組數(shù)據(jù)，計(jì)算該聲波的幅值在該預(yù)設(shè)時(shí)間段內(nèi)跨越該基準(zhǔn)電平的次數(shù)，并產(chǎn)生一對(duì)應(yīng)的計(jì)數(shù)結(jié)果；一比較模塊，用來根據(jù)該計(jì)數(shù)結(jié)果，判斷該聲音信號(hào)中是否混入該低頻聲音信號(hào)。
11.如權(quán)利要求10所述的播放電路，其中若該計(jì)數(shù)結(jié)果小于一預(yù)設(shè)值，則該比較模塊會(huì)判斷該聲音信號(hào)中有混入該低頻聲音信號(hào)。
12.如權(quán)利要求10所述的播放電路，其中若該計(jì)數(shù)結(jié)果大于一預(yù)設(shè)值，則該比較模塊會(huì)判斷該聲音信號(hào)中沒有混入該低頻聲音信號(hào)。
13.如權(quán)利要求10所述的播放電路，其中該低頻聲音信號(hào)的頻帶范圍是人聲的頻帶范圍。
14.如權(quán)利要求10所述的播放電路，其中該檢測(cè)模塊可在對(duì)應(yīng)該預(yù)設(shè)時(shí)間段的多組數(shù)據(jù)中，比較一組數(shù)據(jù)與次一組數(shù)據(jù)是否分別有一組數(shù)據(jù)大于及小于該基準(zhǔn)電平；若該組數(shù)據(jù)與該次組數(shù)據(jù)分別有一組數(shù)據(jù)大于及小于該基準(zhǔn)電平，則該檢測(cè)模塊會(huì)判斷該聲波在該組數(shù)據(jù)與該次組數(shù)據(jù)間有跨越該基準(zhǔn)電平。
15.如權(quán)利要求10所述的播放電路，其中該基準(zhǔn)電平為零電平。
16.如權(quán)利要求10所述的播放電路，其另可接收一第二聲音信號(hào)，該第二聲音信號(hào)中包含有多組數(shù)據(jù)，各組數(shù)據(jù)分別代表一第二聲波在不同時(shí)間的幅值大??；而該判斷電路中另包含有一第二檢測(cè)模塊，用來根據(jù)該第二聲音信號(hào)中的多組數(shù)據(jù)，計(jì)算該第二聲波的幅值在該預(yù)設(shè)時(shí)間段內(nèi)跨越該基準(zhǔn)電平的次數(shù)，并產(chǎn)生一對(duì)應(yīng)的第二計(jì)數(shù)結(jié)果；而該比較模塊根據(jù)該聲音信號(hào)的計(jì)數(shù)結(jié)果是否大于該第二計(jì)數(shù)結(jié)果，來判斷該聲音信號(hào)中是否混入該低頻聲音信號(hào)。
17.如權(quán)利要求16所述的播放電路，其中若該計(jì)數(shù)結(jié)果比該第二計(jì)數(shù)結(jié)果小一閾值，則該比較模塊會(huì)判斷該聲音信號(hào)中有混入該低頻聲音信號(hào)。
18.如權(quán)利要求16所述的播放電路，其另包含有一揚(yáng)聲器，用來根據(jù)該比較模塊判斷的結(jié)果，將該聲音信號(hào)或該第二聲音信號(hào)轉(zhuǎn)換為聲波播放出來。
19.如權(quán)利要求10所述的播放電路，其另包含有一接收電路，用來產(chǎn)生該聲音信號(hào)。
20.如權(quán)利要求19所述的播放電路，其中該接收電路可由一光盤上讀出該聲音信號(hào)。
全文摘要
本發(fā)明提供一種判斷一聲音信號(hào)中是否混有人聲信號(hào)的方法及相關(guān)裝置。在一多聲道的系統(tǒng)中，該方法針對(duì)不同聲道的聲音信號(hào)，計(jì)算聲音信號(hào)在單位時(shí)間內(nèi)幅值過零發(fā)生的次數(shù)；若第一聲道的某一聲音信號(hào)過零發(fā)生的次數(shù)比第二聲道另一聲音信號(hào)過零發(fā)生的次數(shù)低于某一閾值，則可判斷該第一聲道的聲音信號(hào)中已經(jīng)混有人聲信號(hào)。
文檔編號(hào)G10H7/00GK1584974SQ0315458
公開日2005年2月23日申請(qǐng)日期2003年8月19日優(yōu)先權(quán)日2003年8月19日
發(fā)明者吳俊德申請(qǐng)人:揚(yáng)智科技股份有限公司

完整全部詳細(xì)技術(shù)資料下載