專利名稱:聲音變速播放裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及聲音變速播放裝置,更具體地說是涉及這樣一種聲音變速播放裝置,它在由聲音播放裝置(磁帶放送機、磁帶錄象機、多媒體裝置、計算機等)播放所存儲的聲音時,能防止因變更聲音播放速度而產(chǎn)生的音色變壞及聲音損失,能調(diào)節(jié)聲音的播放速度進行播放,以便像人或快或慢說話那樣聽到上述聲音。
通常,改變磁帶或視頻唱機的播放速度時,其聲音的音色變更。即播放速度變快時就會偏離原來聲音高度而聽到″咔、咔″的聲音。播放速度變慢時,就會聽到人們通常所說的″磁帶拖長的聲音″。
為了防止產(chǎn)生這樣的現(xiàn)象,以往,像在日本專利公開特開平4—168499號(1992.6.16)中所披露的那樣,使用由緩沖器讀出聲音信號后只播放其中的一部分的方法。即,以往是使用由存儲緩沖器讀出聲音信號,在使播放速度成為二倍的情況下,只播放兩個時間段中的一個時間段的信號的方法。
因而,使用以往的方法,用兩倍的速度播放″我與綾子一起去學(xué)?!暹@句話時,就會如
圖1所示,使原音中構(gòu)成綾的聲音脫落,只播放出″我一起去″。
象這樣,用以往的方法,當(dāng)加快播放速度時,由于為了維持聲音的音色只能播放聲音的一部分,喪失了原音具有的意義。因而,使用播放裝置存在著要理解聲音的意義需經(jīng)歷重重困難,有使聽者感到難以接受這樣的問題。
所以,本發(fā)明的目的是為了解決上述問題提供這樣一種聲音變速播放裝置,它在用聲音播放裝置(磁帶放送機、磁帶錄象機、多媒體裝置、計算機等)播放所存儲的聲音時,能防止因變更聲音播放速度而產(chǎn)生的音色變壞和聲音損失,能調(diào)節(jié)聲音的播放速度進行播放,以便像人們或快或慢說話那樣聽到上述聲音。
為了達到上述目的,本發(fā)明的特征在于在聲音變速播放裝置中配置有將輸入的聲音信號分別分離成原音成分和聲音特性的音調(diào)檢測電路;在用上述音調(diào)檢測電路分離出的原音成分和聲音特性中,按播放原音成分的速度來消除和添加以調(diào)節(jié)聲音信號的長度的音調(diào)調(diào)制部件;合成用上述音調(diào)調(diào)制部件調(diào)制的原音成分與聲音特性,輸出變速了的聲音信號的聲音合成電路;借助由外部輸入的控制信號控制上述各構(gòu)成部分的主控制器。
在本發(fā)明中,為使音調(diào)檢測電路能以數(shù)字方式檢測音調(diào)部分,最好還設(shè)置將所輸入的模擬聲音信號變換成數(shù)字聲音信號的模/數(shù)變換器。
聲音合成電路最好還設(shè)置用以將已按數(shù)字方式變換處理過的聲音信號變換成適合于信號處理的模擬方式的數(shù)/模變換器。
最好還配置有存儲裝置,用以將由存儲最初的聲音信號所存儲聲音信號輸出到聲音合成電路,與用聲音合成電路合成的調(diào)制聲音信號進行比較。
最好還配置指令字存儲裝置,用以存儲聲音變速播放所必須的各種控制信號,由主控制器施加、接收控制信號,輸出所存儲的各種控制信號。
音調(diào)檢測電路最好按下述的數(shù)學(xué)式選取原音成分。c(m,δ)=Σn=0N-1|x(n+t(m-1)-x(n+tm+δ)|]]>其中x(n)是已輸入的原來的信號(在時間軸n的音量),tm是第m原音的位置,δ是原音位置的容許范圍。
音調(diào)調(diào)制部件最好使與聲音信號特性對應(yīng)部分像下述數(shù)學(xué)式那樣,以原音的位置為基準(zhǔn),增加一定長度的窗函數(shù)來調(diào)制信號。
Xm(n)=hm(tm-n)x(n)其中Xm(n)是已調(diào)制的聲音信號,hm(n)是窗函數(shù),tm是原音的位置,x(n)是輸入的聲音信號(在時間軸n的音量)。
原音合成電路最好像下列的數(shù)學(xué)式那樣用已調(diào)制的原音成分和聲音特性求出已變速的聲音信號x(n)。x(n)=Σqαq×q(n)hq(tq--n)Σqhq2(tq-n)]]>其中aq是合成音量調(diào)制變量,xq(n)=xm(n-δq)是已調(diào)制的聲音特性,hq(n)是窗函數(shù),tq是已調(diào)制的原音的位置,δq是決定播放速度的變量。
圖1是表示以往的聲音變速播放方式的圖。
圖2是本發(fā)明的聲音變速播放裝置的概略方框圖。
圖3是表示將適用于本發(fā)明的聲音生成模式電子電路化的圖。
圖4是表示與圖2所示的聲音變速播放裝置的主要部分對應(yīng)的信號處理過程的圖。
圖5是表示按圖2的分析過程分離的原音和聲音特性的狀態(tài)的圖。
圖6是表示用圖2所示的聲音變速播放裝置調(diào)制原音的過程的圖。
下面將參照附圖對本發(fā)明的聲音變速播放裝置的優(yōu)選實施例進行詳細(xì)說明。
圖2示出本發(fā)明的聲音變速播放裝置的概略方框圖。參看圖2,它是由如下各部分構(gòu)成連結(jié)輸入信號線(Audio In)與程序母線的模/數(shù)變換器(1);連結(jié)模/數(shù)變換器(1)和程序、數(shù)據(jù)母線的輸入緩沖器(2);連結(jié)輸入緩沖器(2)與程序母線的音調(diào)檢測電路(3);連結(jié)音調(diào)檢測電路(3)與程序母線的音調(diào)調(diào)制部件(4);連結(jié)音調(diào)調(diào)制部件(4)與程序、數(shù)據(jù)母線的聲音合成電路(5);連結(jié)聲音合成電路(5)與程序母線的輸出緩沖器(6);連結(jié)輸出緩沖器(6)與程序母線的數(shù)/模變換器(7);與程序母線連結(jié)的主控制器(8);與主控制器(8)連結(jié)的指令字存儲電路(9);與程序、數(shù)據(jù)母線連結(jié)的存儲裝置(10)。
這里,控制整個聲音變速播放裝置的任務(wù)由主控制器(8)完成,為了用主控制器(8)控制各部分,將必要的指令字存儲到指令字存儲電路(9)中。而且聲音數(shù)據(jù)存儲在存儲裝置(10)中。
各塊之間的控制信號與數(shù)據(jù)的傳輸分別用程序母線和數(shù)據(jù)母線進行,程序母線擔(dān)當(dāng)將來自主控制器(8)的指令傳輸?shù)綉?yīng)控制的部分,數(shù)據(jù)母線從輸入緩沖器(2)接收聲音數(shù)據(jù)并存儲到存儲裝置(10)后,要合成聲音時,通過將所存儲的聲音數(shù)據(jù)傳輸?shù)铰曇艉铣呻娐?5),用聲音合成電路(5)與已調(diào)制的原音信號一起進行再合成。
下面說明有上述結(jié)構(gòu)的本發(fā)明的工作。
本發(fā)明所使用的方式是基于聲音發(fā)生模式。聲音發(fā)生模式是模擬人的發(fā)聲器官,通過由作為聲音發(fā)生源的原音和發(fā)音器官(舌、齒、唇等)決定的聲音傳輸特性、再現(xiàn)聲音。
按照聲音發(fā)生模式,聲音是從人的肺部開始的氣流在由聲帶或口腔內(nèi)的舌、齒、唇構(gòu)成的″狹窄的空間″即發(fā)音點的部位處引起周期性或雜音性的空氣振動,此即聲源,由聲帶接受由上部器官即聲道的發(fā)聲動作決定的聲音傳輸特性的影響,通過原音的頻率成分的有選擇地共鳴,產(chǎn)生聲音。圖3示出將上述聲音發(fā)生模式電子電路化的圖。
本方式是根據(jù)上述的聲音發(fā)生模式,如圖4所示,分成如下三個主要部分由輸入信號分離成原音和聲音特性的分析部分;將已分離的信號用所需要的播放速度進行處理的調(diào)制部分;使用已調(diào)制的信號再合成信號的合成部分。
上述的調(diào)制部根據(jù)上述的聲音生成模式,分為處理已分離的原音信號的原音調(diào)制部,和一邊維持音色即聲音特性一邊完成與再合成所必需的窗函數(shù)有關(guān)的平滑化處理的聲音特性控制部。
本方式的全部流程,為了一邊照原樣維持聲音信號的音色或頻率,一邊改變播放速度,成為在分析已輸入的聲音信號并分離成原音信號和聲音特性后,將已分離的各數(shù)據(jù)進行變速處理,使用已處理過的數(shù)據(jù)進行再合成的過程。此過程示于圖4。
圖4是表示對圖2所示的聲音變速播放裝置的主要部分的信號處理過程的圖。作為本發(fā)明最核心部分的分析部件、調(diào)制部件、合成部件分別與圖2中的音調(diào)檢測部件(3)、音調(diào)調(diào)制部件(4)、聲音合成電路(5)相對應(yīng)。
下面將更詳細(xì)地說明上述工作。
首先,輸入模擬聲音信號時,用模/數(shù)變換器(1)將模擬聲音信號變換成數(shù)字信號后,經(jīng)輸入緩沖器(2)供給音調(diào)檢測電路(3)。
在分析過程中,借助主控制器(8)的控制信號,音調(diào)檢測電路(3)按照聲音發(fā)生模式,從聲音信號中分離成與原音對應(yīng)的部分和與聲音信號特性對應(yīng)的部分并進行處理。
這時,為了從聲音信號求出原音的位置,像下述式(1)那樣來定義相互類似度c(m,δ)(以第m—1原音和第m原音為基準(zhǔn),是所測定的信號差的值,這時前容許范圍是δ)。c(m,δ)=Σn=0N-1|x(n+t(m-1)-x(n+tm+δ)|---(1)]]>其中x(n)是已輸入的原來的信號(在時間軸n的音量),tm是第m原音的位置,δ是原音位置的容許范圍。
這里,所謂相互類似度定義為以鄰接的原音的位置為基準(zhǔn)點通過測定信號的差,表示信號的類似度的標(biāo)準(zhǔn)。因而,第m原音的位置定為相互類似度為最小的位置tm,通過對已輸入的信號反復(fù)地進行這樣的過程選取原音成分。
圖5是表示用上述分析過程分離的原音和聲音特性的狀態(tài)的圖。如圖5所示,通常的聲音信號呈現(xiàn)并穩(wěn)定即在相鄰接的短的時間區(qū)間中有大體類似的特性。這時,有類似信號特性的最大信號周期,我們通常稱之謂音調(diào),在本發(fā)明的分析過程中,從已輸入的聲音信號選取這樣的音調(diào)周期,即原音信號,在聲音播放時用以調(diào)節(jié)速度。
在調(diào)制過程中,完成調(diào)制在上述分析過程分離的原音信號與聲音特性的過程。因而,音調(diào)調(diào)制部件(4)由處理原音信號的原音調(diào)制部件和一邊維持音色即聲音特性一邊完成與再合成時必要的窗函數(shù)有關(guān)的平滑化處理過程的聲音特性控制部件構(gòu)成。
在音調(diào)調(diào)制部件(4)的原音調(diào)制部分中,按照應(yīng)播放由聲音信號選取的原音成分的速度進行消除或添加來調(diào)節(jié)聲音信號的長度。參照圖6進行更詳細(xì)的說明。
在圖6中示出借助圖2所示的聲音變速播放裝置調(diào)制原音的過程。如圖6所示,在使聲音播放速度減慢時,一邊就這樣維持相鄰的原音間的間隔,一邊進一步添加其它原音使信號延伸,在使原音的播放速度加快時,一邊維持相鄰的原音間的間隔,一邊每隔一個來選擇原音,使用聲音特性進行再合成。
在音調(diào)調(diào)制部件(4)的聲音特性控制部分,使與聲音信號特性對應(yīng)的部分像下述式(2)那樣以原音的位置為基準(zhǔn),增加一定長度的窗函數(shù)來調(diào)制信號。這是在當(dāng)下述的聲音合成時通過原音的消除和添加來調(diào)制信號的情況下也用以產(chǎn)生平滑的聲音信號的處理過程。
Xm(n)=hm(tm-n)x(n)……(2)其中Xm(n)是已調(diào)制的聲音信號,hm(n)是窗函數(shù),tm是原音的位置,x(n)是所輸入的聲音信號(在時間軸n的音量)。
最終,在進行合成過程的原音合成電路(5)中,利用通過上述調(diào)制過程調(diào)制了的原音成分和聲音特性,求出已變速的聲音信號x(n)。它用下述的式(3)表示。x(n)=Σqαq×q(n)hq(tq-n)Σqhq2(tq-n)--(3)]]>其中aq是合成音量調(diào)節(jié)變量,Xq(n)=Xm(n—δq)是已調(diào)制的聲音特性,hq(n)是窗函數(shù),tq是已調(diào)制的原音的位置,δq是決定播放速度的變量。
已變速的聲音信號X(n)經(jīng)輸出緩沖器(6)借助數(shù)/模變換器(7)變換成模擬信號后輸出。
當(dāng)用此方式播放聲音時,即使改變播放速度也能一邊就這樣維持所播放的聲音的音色,一邊聽到像人們或快或慢地發(fā)聲那樣播放的聲音。
因而,如VTR唱機那樣快速播放圖象畫面并進行檢索或監(jiān)測時,聽眾不會像已有的VTR唱機那樣因音色改變而失真或因聲音信號損失而聽不清,能得到按原來的音色快速說話的播放聲。
除此之外,可予想到也適合于多媒體裝置的高速掃描這樣的應(yīng)用。今后,隨著多媒體市場的不斷開發(fā),可予期本發(fā)明技術(shù)的應(yīng)用將更多樣化。
如上所述,按照本發(fā)明的實施例提供了這樣一種聲音變速播放裝置,它在由聲音播放裝置(磁帶放送機,磁帶錄象機,多媒體裝置,計算機等)播放所存儲的聲音時,能防止因變更聲音播放速度而產(chǎn)生的音色惡化和聲音損失,能像人們或快或慢說話那樣聽到上述聲音并據(jù)此調(diào)節(jié)聲音的播放速度進行播放。
本發(fā)明的這種效果也能用于各種聲音播放裝置的設(shè)計、制造、銷售等領(lǐng)域。
權(quán)利要求
1.一種聲音變速播放裝置,其特征在于它設(shè)置有用以由所輸入的聲音信號分別分離成原音成分和聲音特性的音調(diào)檢測電路;用以在由上述音調(diào)檢測電路分離出的原音成分和聲音特性中,按播放原音成分的速度進行消除和添加來調(diào)節(jié)聲音信號長度的音調(diào)調(diào)節(jié)部件;用以合成用上述音調(diào)調(diào)制部件調(diào)制的原音成分和聲音特性,輸出已變速的聲音信號的聲音合成電路;用由外部輸入的控制信號控制上述各構(gòu)成部件的主控制器。
2.按照權(quán)利要求1所說的聲音變速播放裝置,其特征在于所說的音調(diào)檢測電路還設(shè)置有模/數(shù)變換器,用以將所輸入的模擬聲音信號變換成數(shù)字聲音信號以便能以數(shù)字方式檢測音調(diào)部分。
3.按照權(quán)利要求1所說的聲音變速播放裝置,其特征在于所說的聲音合成電路還設(shè)置有數(shù)/模變換器,用以將已按數(shù)字方式變換處理的聲音信號變換成適于信號處理的模擬方式。
4.按照權(quán)利要求1所說的聲音變速播放裝置,其特征在于還設(shè)置有用以在存儲最初的聲音信號后,將所存儲的聲音信號輸出到聲音合成電路,并與用聲音合成電路合成的調(diào)制聲音信號進行比較的存儲裝置。
5.按照權(quán)利要求1所說的聲音變速播放裝置,其特征在于還設(shè)置有用以存儲對聲音變速播放所必須的各種控制信號,由主控制器施加接收控制信號并輸出所存儲的各種控制信號的指令字存儲電路。
6.按照權(quán)利要求1所說的聲音變速播放裝置,其特征在于所說的音調(diào)檢測電路按下述的數(shù)學(xué)式選取原音成分C(m,δ)=Σn=0N-1|x(n+t(m-1)-x(n+tm+δ)|]]>其中X(n)是所輸入的原來的信號(在時間軸n的音量),tm是第m原音的位置,δ是原音位置的容許范圍。
7.按照權(quán)利要求1所說的聲音變速播放裝置,其特征在于所說的音調(diào)調(diào)制部將與聲音信號特性相對應(yīng)的部分按下述的數(shù)學(xué)式,以原音位置為基準(zhǔn)施加一定長度的窗函數(shù)來調(diào)制信號Xm(n)=hm(tm-n)x(n)其中Xm(n)是已調(diào)制的聲音信號,hm(n)是窗函數(shù),tm是原音的位置,x(n)是所輸入的聲音信號(在時間軸的音量)。
8.按照權(quán)利要求1所說的聲音變速播放裝置,其特征在于所說的原音合成電路按下述的數(shù)學(xué)式,利用已調(diào)制的原音成分和聲音信號特性求出已變速的聲音信號X(n)x(n)=Σqαq×q(n)hq(tq-n)Σhqq2(tq-n)]]>其中aq是合成音量調(diào)節(jié)變量,xq(n)=Xm(n—δq)是已調(diào)制的聲音特性,hq(n)是窗函數(shù),tq是已調(diào)制的原音的位置,δq是決定播放速度的變量。
全文摘要
本發(fā)明提供了一種聲音變速播放裝置,它在由聲音播放裝置播放所存儲的聲音時,能防止因變更聲音播放速度產(chǎn)生的音色惡化和聲音損失,能調(diào)節(jié)聲音播放速度進行播放,從而能像人或快或慢說話那樣聽到上述聲音。
文檔編號G10L21/04GK1127916SQ9511865
公開日1996年7月31日 申請日期1995年9月28日 優(yōu)先權(quán)日1994年9月28日
發(fā)明者吳永煥, 金淵俊, 裴點漢 申請人:三星電子株式會社