專利名稱:記錄再現(xiàn)裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種數(shù)字聲音數(shù)據(jù)的編碼技術(shù)。
背景技術(shù):
近年來,為了滿足希望方便地聽音樂的用戶的需求,開發(fā)出了用于以低比特率對 聲音或音樂等的音頻數(shù)據(jù)信號進(jìn)行壓縮編碼、再現(xiàn)時進(jìn)行解壓縮譯碼的各種技術(shù)。作為其 代表的方式周知 MP3(MPEG-1 Audio layerIII)。根據(jù)某以往技術(shù),對樂曲間不存在無聲時間的實況版CD中的樂曲序號不同的多 個樂曲連續(xù)地進(jìn)行壓縮編碼,從而記錄在1個音樂文件中,并且將各樂曲的開始位置信息 記錄在其他文件中。進(jìn)而,在指定樂曲序號再現(xiàn)的情況下,參照位置信息文件,根據(jù)音樂文 件中的指定樂曲開始再現(xiàn)(參照專利文獻(xiàn)1)。[專利文獻(xiàn)1]特開2004-93729號公報目前依然存在用戶的如下強(qiáng)烈需求,在以MP3等對存儲于CD等中的聲音數(shù)據(jù)進(jìn)行 編碼記錄時,希望按各樂曲序號將該編碼數(shù)據(jù)分割后記錄。在此,⑶上的聲音數(shù)據(jù)被分配在每個由588采樣構(gòu)成的扇區(qū)中,軌道的邊界就是 扇區(qū)邊界之一。另一方面,編碼是以與扇區(qū)不同的單位進(jìn)行的。例如,MP3流(stream)被 分割為每1152采樣的幀進(jìn)行編碼處理。因此,在大部分的情況下,聲音數(shù)據(jù)的軌道邊界與 MP3流的分割位置并不一致。因而,在以樂曲單位對MP3流進(jìn)行分割時,不能將⑶的軌道邊 界直接作為MP3流的1個樂曲文件的分割位置使用。將CD的軌道邊界近旁的MP3流的幀邊界作為樂曲單位的文件的分割位置的情況 下,在本來不是樂曲邊界的位置對樂曲進(jìn)行了分割。因此,會在樂曲結(jié)尾處混入下一個樂曲 的開頭處的聲音,在樂曲開頭處混入前一個樂曲結(jié)尾處的聲音。根據(jù)CD中樂曲的不同,存 在前一個樂曲的末尾無聲而下一個樂曲的開頭有聲的情況、和前一個樂曲的末尾有聲而下 一個樂曲的開頭無聲的情況。在這種情況下,根據(jù)MP3流再現(xiàn)樂曲的情況下,存在在前一個 樂曲的結(jié)尾處聽到下一個樂曲的開頭的聲音、前一個樂曲的末尾的聲音在下一個樂曲的開 頭處聽到的情況,有可能會感覺到混入了噪聲。
發(fā)明內(nèi)容
本發(fā)明是鑒于這點而進(jìn)行的,目的是在進(jìn)行聲音數(shù)據(jù)的再現(xiàn)與記錄的記錄再現(xiàn)裝 置中,在對聲音數(shù)據(jù)進(jìn)行壓縮編碼從而得到的編碼數(shù)據(jù)中,防止在樂曲的斷開處混入感覺 是噪聲的音。本發(fā)明作為記錄再現(xiàn)裝置具有聲音數(shù)據(jù)處理部,其對輸入的聲音數(shù)據(jù)以由規(guī)定 數(shù)目的采樣構(gòu)成的幀單位,進(jìn)行用于再現(xiàn)的解碼處理、用于記錄的壓縮編碼處理;編碼數(shù)據(jù) 緩存,暫時存儲從所述聲音數(shù)據(jù)處理部輸出的編碼數(shù)據(jù);特征提取用信號處理部,對所述聲 音數(shù)據(jù)進(jìn)行信號處理,提取表示所述聲音數(shù)據(jù)特征的特征信息;樂曲切換檢測部,將對應(yīng)所 述聲音數(shù)據(jù)的樂曲位置信息、以及從所述特征提取用信號處理部輸出的所述特征信息作為輸入,以所述樂曲位置信息以及特征信息為基礎(chǔ)確定要進(jìn)行樂曲切換的幀邊界;以及幀邊 界分割部,由所述樂曲切換檢測部確定了要進(jìn)行樂曲切換的幀邊界時,對存儲于所述編碼 數(shù)據(jù)緩存中的編碼數(shù)據(jù)進(jìn)行修正的處理,以使該編碼數(shù)據(jù)中的幀邊界與所確定的要進(jìn)行樂 曲切換的幀邊界相符合。根據(jù)本發(fā)明所涉及的記錄再現(xiàn)裝置,所輸入的聲音數(shù)據(jù)由聲音數(shù)據(jù)處理部以由規(guī) 定數(shù)目的采樣構(gòu)成的幀單位進(jìn)行用于再現(xiàn)的解碼處理、用于記錄的壓縮編碼處理。所得到 編碼數(shù)據(jù)暫時存儲于編碼數(shù)據(jù)緩存。并且,樂曲切換檢測部以對應(yīng)聲音數(shù)據(jù)的樂曲位置信 息、以及由特征提取用信號處理部提取出的表示聲音數(shù)據(jù)特征的特征信息為基礎(chǔ),確定要 進(jìn)行樂曲切換的幀邊界。在確定了要進(jìn)行樂曲切換的幀邊界時,由幀邊界分割部對存儲于 編碼數(shù)據(jù)緩存中的編碼數(shù)據(jù)進(jìn)行修正處理,以使該編碼數(shù)據(jù)的幀邊界與所確定的幀邊界相 符合。由此,因為編碼數(shù)據(jù)的幀邊界與聲音數(shù)據(jù)中的要進(jìn)行樂曲切換的幀邊界相符合,因此 能夠防止在前一個樂曲的結(jié)尾處混入下一個樂曲的開頭的音、或在前一個樂曲的結(jié)束部分 的音混入下一個樂曲的開始部分。根據(jù)本發(fā)明,在對聲音數(shù)據(jù)進(jìn)行用于再現(xiàn)的解碼處理與用于記錄的壓縮編碼處理 的記錄再現(xiàn)裝置中,由于編碼數(shù)據(jù)的幀邊界與聲音數(shù)據(jù)中的樂曲要進(jìn)行切換的幀邊界相符 合,因此能夠防止可能認(rèn)為是噪聲混入的、前一個樂曲的結(jié)尾處的下一個樂曲的開頭音的 混入、前一個樂曲的結(jié)束部分的音對下一個樂曲的開始部分的混入。
圖1是表示本發(fā)明的第1 第3實施方式所涉及的記錄再現(xiàn)裝置的結(jié)構(gòu)例的框 圖。圖2是表示第1實施方式中的記錄再現(xiàn)裝置的動作例的圖。圖3是表示第1實施方式中的記錄再現(xiàn)裝置的動作例的圖。圖4是表示第1實施方式中的記錄再現(xiàn)裝置的動作例的圖。圖5是表示第1實施方式中的記錄再現(xiàn)裝置的動作例的圖。圖6是表示第2實施方式中的記錄再現(xiàn)裝置的動作例的圖。圖7是表示本發(fā)明的第4實施方式所涉及的記錄再現(xiàn)裝置的結(jié)構(gòu)例的框圖。圖中101、101A-記錄再現(xiàn)裝置102-流控制部103-緩存104-解碼部105-編碼部106-樂曲切換檢測部107-特征提取用信號處理部108-SDRAM109-輸出緩存110-解碼數(shù)據(jù)緩存111-幀邊界分割部
112-主機(jī)接口120-聲音數(shù)據(jù)處理部
具體實施例方式以下,參照附圖對本發(fā)明的實施方式進(jìn)行說明。(第1實施方式)圖1是表示本發(fā)明的第1實施方式所涉及的記錄再現(xiàn)裝置的概略結(jié)構(gòu)的圖。圖 1的記錄再現(xiàn)裝置101是對輸入的聲音數(shù)據(jù)進(jìn)行再現(xiàn)的同時,進(jìn)行壓縮編碼從而記錄的裝 置。在本實施方式中,聲音數(shù)據(jù)記錄在CD上,作為壓縮編碼方式采用MP3。在圖1中,聲音數(shù)據(jù)處理部120進(jìn)行解碼處理和壓縮編碼處理,該解碼處理用于以 規(guī)定數(shù)目的采樣(例如1152采樣)所構(gòu)成幀單位對輸入的聲音數(shù)據(jù)進(jìn)行再現(xiàn);該壓縮編碼 處理用于以規(guī)定數(shù)目的采樣(例如1152采樣)所構(gòu)成幀單位對輸入的聲音數(shù)據(jù)進(jìn)行記錄。 聲音數(shù)據(jù)處理部120具有流控制部102,從聲音數(shù)據(jù)取入各1幀的數(shù)據(jù)并進(jìn)行輸出;緩存 103,暫時存儲從流控制部102輸出的聲音數(shù)據(jù);解碼部104,從緩存103取入1幀的數(shù)據(jù), 為了再現(xiàn)而進(jìn)行解碼處理;以及編碼部105,從緩存103取入1幀的數(shù)據(jù),為了記錄而進(jìn)行 壓縮編碼處理。由解碼部104實施解碼處理的數(shù)據(jù)、與由編碼部105實施壓縮編碼處理的 數(shù)據(jù),是緩存103上的相同數(shù)據(jù)。另外,輸出緩存109暫時存儲來自解碼部104的解碼數(shù)據(jù)并以恒定速度輸出。編 碼數(shù)據(jù)緩存110暫時存儲來自編碼部105的編碼數(shù)據(jù)并輸出至半導(dǎo)體存儲器或硬盤等。輸 出緩存109與編碼數(shù)據(jù)緩存110,確保于SRAM108上。記錄再現(xiàn)裝置101還具有樂曲切換檢測部106、特征提取用信號處理部107、幀邊 界分割部111、以及主機(jī)接口 112。記錄再現(xiàn)裝置101的各部,分別以時間分割進(jìn)行處理。特征提取用信號處理部107基于從聲音數(shù)據(jù)處理部120得到的信息對聲音數(shù)據(jù)進(jìn) 行信號處理,提取表示聲音數(shù)據(jù)特征的特征信息。該特征信息通知給樂曲切換檢測部106。 樂曲切換檢測部106將與被取入聲音數(shù)據(jù)處理部120的聲音數(shù)據(jù)對應(yīng)的樂曲位置信息、以 及從特征提取用信號處理部107輸出的特征信息作為輸入,以這些樂曲位置信息以及特征 信息為基礎(chǔ)確定要進(jìn)行樂曲切換的幀邊界。確定之后的幀邊界的信息被通知給幀邊界分割 部 111。幀邊界分割部111在由樂曲切換檢測部106確定了要進(jìn)行樂曲切換的幀邊界時, 對存儲于編碼數(shù)據(jù)緩存110中的編碼數(shù)據(jù)進(jìn)行修正處理,以便使該編碼數(shù)據(jù)的幀邊界與所 確定的要進(jìn)行樂曲切換的幀邊界相符合。具體而言,例如,對存儲于編碼數(shù)據(jù)緩存110中的 編碼數(shù)據(jù)插入虛擬數(shù)據(jù)(dummy data),使該編碼數(shù)據(jù)的幀邊界與確定的幀邊界相符合。再 有,將表示與確定樂曲切換的幀邊界相對應(yīng)的編碼數(shù)據(jù)的幀邊界的數(shù)據(jù),作為編碼數(shù)據(jù)的 分割位置進(jìn)行輸出。該分割位置信息經(jīng)由主機(jī)接口 112輸出至記錄再現(xiàn)裝置101的外部。另一方面,在樂曲中間(中途)的情況下,樂曲切換檢測部106并不進(jìn)行幀邊界的 通知,幀邊界分割部111也不進(jìn)行特別的動作。此外,在本實施方式中,雖然假定為外部主 模塊中進(jìn)行分割處理,但是也可以在記錄再現(xiàn)裝置101內(nèi)部的其他模塊中進(jìn)行分割處理。 該情況下,分割位置信息發(fā)送至其內(nèi)部模塊。本實施方式中,特征提取用信號處理部107將幀邊界附近的聲音數(shù)據(jù)的聲壓水平作為特征信息提出。另外,樂曲切換檢測部106將記錄在CD的子碼(sub code)作為樂曲 位置信息來利用。⑶中每個聲音數(shù)據(jù)的規(guī)定采樣數(shù)目(例如,588采樣)的扇區(qū),記錄著包 含樂曲序號等的子碼。再有,也可以將聲音數(shù)據(jù)的采樣數(shù)目、數(shù)據(jù)大小、1個樂曲的再現(xiàn)時間 等作為樂曲位置信息而利用。圖2以及圖3是表示本實施方式中的記錄再現(xiàn)裝置的動作的圖,表示作為聲音數(shù) 據(jù)與其聲壓水平、以及編碼數(shù)據(jù)的一例的MP3數(shù)據(jù)。根據(jù)MP3方式,聲音數(shù)據(jù)以幀為單位進(jìn) 行編碼,生成由幀頭(head)與主數(shù)據(jù)(maindata)構(gòu)成的MP3數(shù)據(jù)。并且,從某個幀頭的開 頭至下一個幀頭的開頭為MP3數(shù)據(jù)的1幀,該1幀的數(shù)據(jù)大小由MP3數(shù)據(jù)的比特率決定。在圖2以及圖3中,聲音數(shù)據(jù)的幀N中存在樂曲序號M與樂曲序號(M+1)之間的 軌道邊界(M、N為自然數(shù))。在圖2所示的聲音數(shù)據(jù)中,幀(N-I)與幀N之間的邊界處不是無聲而是有聲,幀N 與幀(N+1)之間的邊界處為無聲。該情況下,若在幀(N-I)與幀N之間的邊界進(jìn)行樂曲切 換,則樂曲(M+1)的開頭處會混入樂曲M的音,從而感覺出現(xiàn)噪聲。因此,在圖2的例子中, 優(yōu)選在幀N與幀(N+1)之間的邊界進(jìn)行樂曲切換。另一方面,在圖3所示的聲音數(shù)據(jù)中,幀(N-I)與幀N之間的邊界處是無聲,幀N 與幀(N+1)之間的邊界處不是無聲而是有聲。該情況下,若在幀N與幀(N+1)之間的邊界 進(jìn)行樂曲切換,則在樂曲M的結(jié)尾處會混入樂曲(M+1)的音,從而感覺出現(xiàn)噪聲。因而,在 圖3的例子中,優(yōu)選在幀(N-I)與幀N之間的邊界進(jìn)行樂曲的切換。這樣,在本實施方式中,樂曲切換檢測部106進(jìn)行如下的動作,利用由特征提取用 信號處理部107提取出的、幀邊界附近的聲音數(shù)據(jù)的聲壓水平的信息,在圖2的情況下確定 在幀N與幀(N+1)之間的邊界進(jìn)行樂曲切換,在圖3的情況下確定在幀(N-I)與幀N之間 的邊界進(jìn)行樂曲的切換。對樂曲切換檢測部106中的處理進(jìn)行詳細(xì)說明。樂曲切換檢測部106將與取入流 控制部102的聲音數(shù)據(jù)相對應(yīng)的子碼作為樂曲位置信息而讀入。特征提取用信號處理部 107求得幀邊界位置處的聲音數(shù)據(jù)的幾個采樣的平均值(表示聲音水平),并作為特征信息 提供給樂曲切換檢測部106。此外,樂曲切換檢測部106讀入的特征信息并不限定于幀邊界 位置處的聲音采樣的聲壓水平的平均值。樂曲切換檢測部106以子碼中包含的樂曲序號與 聲音采樣的平均值為基礎(chǔ),確定要進(jìn)行樂曲切換的幀邊界。首先,流控制部102中取入聲音數(shù)據(jù)的幀0時,樂曲切換檢測部106讀入對應(yīng)該聲 音數(shù)據(jù)的幀0的子碼。由于聲音數(shù)據(jù)的幀0是記錄再現(xiàn)裝置101啟動后一開始的輸入數(shù)據(jù), 因此將該幀0的樂曲序號M作為樂曲序號的初始值。接下來,樂曲切換檢測部106,每次在流控制部102中取入聲音數(shù)據(jù)的幀1 N時, 都讀入與這些聲音數(shù)據(jù)相對應(yīng)的子碼并進(jìn)行樂曲序號的判定。由于該幀的樂曲序號與下一 幀的樂曲序號相等,因此在幀0 (N-I)之間,樂曲切換檢測部106判定為樂曲的中間。流控制部102中取入聲音數(shù)據(jù)的幀N與幀(N+1)時,樂曲切換檢測部106讀入與 幀N與幀(N+1)相應(yīng)的子碼。由于幀N的樂曲序號是M,幀(N+1)的樂曲序號是(M+1),因 此樂曲切換檢測部106在參照了由特征提取用信號處理部107通知的幀邊界位置處的聲音 采樣的平均值的基礎(chǔ)上進(jìn)行判定。在圖2的例子中,幀N的前側(cè)邊界處的聲音采樣的平均值表示有聲,后側(cè)邊界處的
6聲音采樣的平均值表示無聲。該情況下,若在幀N的前側(cè)邊界即幀(N-I)與幀N之間的邊 界進(jìn)行樂曲切換,則會在樂曲(M+1)的開頭處混入噪聲。因而,判定幀N為樂曲的中間,確 定在幀N的后側(cè)邊界即幀N與幀(N+1)之間的邊界進(jìn)行樂曲切換。也就是說,幀N包含在 樂曲M中。另一方面,在圖3的例子中,幀N的前側(cè)邊界處的聲音采樣的平均值表示無聲,后 側(cè)邊界處的聲音采樣的平均值表示有聲。該情況下,若在幀N的后側(cè)邊界即幀N與幀(N+1) 之間的邊界進(jìn)行樂曲切換,則在樂曲M的結(jié)尾處會混入噪聲。因而,確定在幀N的前側(cè)邊界 即幀(N-I)與幀N之間的邊界進(jìn)行樂曲切換。也就是說,幀N包含在樂曲(M+1)中。對幀邊界分割部111的處理進(jìn)行說明。在樂曲切換檢測部106沒有通知樂曲切換 的情況下,幀邊界分割部111不進(jìn)行特別處理。因此,從編碼部105輸出的編碼數(shù)據(jù)直接存 儲于編碼數(shù)據(jù)緩存110中。另一方面,樂曲切換檢測部106確定了要進(jìn)行樂曲切換的幀邊界時,幀邊界分割 部111收到來自樂曲切換檢測部106的通知,從而進(jìn)行在存儲于編碼數(shù)據(jù)緩存110的MP3 數(shù)據(jù)中插入虛擬數(shù)據(jù)的處理。由此,修正MP3數(shù)據(jù),以使聲音數(shù)據(jù)中的要進(jìn)行樂曲切換的幀 邊界與MP3數(shù)據(jù)的幀邊界相符合。例如,在圖2的例子中,在對聲音數(shù)據(jù)的幀N進(jìn)行編碼從而得到的主數(shù)據(jù)N的末 端至幀頭(N+1)的開頭之間插入虛擬數(shù)據(jù),使對聲音數(shù)據(jù)的幀(N+1)進(jìn)行編碼而得到的主 數(shù)據(jù)(N+1)能夠混入MP3數(shù)據(jù)的幀N中的大小為0。然后,由編碼部105對聲音數(shù)據(jù)的幀 (N+1)進(jìn)行編碼時,得到的主數(shù)據(jù)(N+1)從幀頭(N+1)的末端起進(jìn)行配置。另外,在圖3的例子中,在對聲音數(shù)據(jù)的幀(N-I)進(jìn)行編碼從而得到的主數(shù)據(jù) (N-I)的末端起至幀頭N的開頭之間插入虛擬數(shù)據(jù),使對聲音數(shù)據(jù)的幀N進(jìn)行編碼而得到的 主數(shù)據(jù)N能夠混入MP3數(shù)據(jù)的幀(N-I)中的大小為0。然后,由編碼部105對聲音數(shù)據(jù)的幀 N進(jìn)行編碼時,得到的主數(shù)據(jù)N從幀頭N的末端起進(jìn)行配置。結(jié)果,在圖2的示例中,可以在幀頭(N+1)的開頭處進(jìn)行MP3數(shù)據(jù)的分割,幀頭 (N+1)之后成為樂曲(M+1)的MP3數(shù)據(jù)。在圖3的例子中,可以在幀頭N的開頭處進(jìn)行MP3 數(shù)據(jù)的分割,幀頭N之后成為樂曲(M+1)的MP3數(shù)據(jù)。再有,幀邊界分割部111將表示構(gòu)成樂曲切換的MP3數(shù)據(jù)的幀邊界的數(shù)據(jù),作為 MP3數(shù)據(jù)的分割位置進(jìn)行輸出。在圖2的例子中,將編碼數(shù)據(jù)緩存110上的幀頭(N+1)的開 頭地址作為分割位置輸出,在圖3的例子中,將編碼數(shù)據(jù)緩存110上的幀頭N的開頭地址作 為分割位置輸出。從幀邊界分割部111輸出的分割位置,經(jīng)由主機(jī)接口 112通知給記錄再 現(xiàn)裝置101的外部。此外,有可能存在如圖4所示在幀N的前后兩個邊界處聲音采樣表示無聲的情況, 或者如圖5所示在幀N的前后兩個邊界處聲音采樣表示有聲的情況。圖4的情況下,在幀N 的前側(cè)以及后側(cè)邊界的任一處進(jìn)行樂曲切換都不會混入噪聲。另外,圖5的情況下,在幀N 的前側(cè)以及后側(cè)邊界的任一處進(jìn)行樂曲切換都會混入噪聲。這種情況下,樂曲切換檢測部 106可以通知多個樂曲切換的候補(bǔ)。在圖4以及圖5的情況下,幀邊界分割部111若被通知幀N的前側(cè)以及后側(cè)邊界的 雙方都作為樂曲切換的候補(bǔ),則在從主數(shù)據(jù)(N-I)的末端起至幀頭N的開頭、從主數(shù)據(jù)N的 末端起至幀頭(N+1)的開頭的2個位置插入虛擬數(shù)據(jù)。這樣,可以在幀頭N以及幀頭(N+1)的開頭處進(jìn)行編碼數(shù)據(jù)的分割。幀邊界分割部111將編碼數(shù)據(jù)緩存110上的幀頭N以及幀 頭(N+1)的開頭地址作為編碼數(shù)據(jù)的分割位置進(jìn)行輸出。該情況下,進(jìn)行分割處理的外部 模塊,可以選擇所輸出的分割位置的其中一個。另外,為了選擇分割位置也可以一并輸出可 以作為參考的信息。此外,優(yōu)選通知給外部模塊的分割位置的個數(shù)能夠作為幀分割數(shù)目從 外部模塊進(jìn)行指定。如上所述,根據(jù)圖1的記錄再現(xiàn)裝置101,即使在連續(xù)輸入樂曲序號不同的聲音數(shù) 據(jù)的情況下,再現(xiàn)也不會中斷,能夠按樂曲序號對編碼數(shù)據(jù)進(jìn)行分割記錄。另外,樂曲切換檢測部106基于對應(yīng)聲音數(shù)據(jù)的樂曲位置信息、以及由特征提取 用信號處理部107提取出的表示聲音數(shù)據(jù)特征的特征信息,確定要進(jìn)行樂曲切換的幀邊 界。在確定了要進(jìn)行樂曲切換的幀邊界時,由幀邊界分割部111對存儲于編碼數(shù)據(jù)緩存110 中的編碼數(shù)據(jù)進(jìn)行修正處理,以使該編碼數(shù)據(jù)的幀邊界與所確定的幀邊界相符合。由此,由 于編碼數(shù)據(jù)的幀邊界與聲音數(shù)據(jù)中的要進(jìn)行樂曲切換的幀邊界相符合,因此能夠防止在樂 曲結(jié)尾處混入下一個樂曲的開頭的音、在樂曲的開頭處混入前一樂曲的結(jié)尾處的音。因而, 在對聲音數(shù)據(jù)進(jìn)行壓縮編碼而得到的編碼數(shù)據(jù)中,能夠防止被認(rèn)為是噪聲的聲音混入樂曲 的中斷處。(第2實施方式)本發(fā)明的第2實施方式所涉及的記錄再現(xiàn)裝置的概略結(jié)構(gòu)與第1實施方式相同, 如圖1所示。其中,樂曲切換檢測部106以及特征提取用信號處理部107中的處理與第1 實施方式不同。其他結(jié)構(gòu)的動作與第1實施方式相同,在此省略說明。圖6是表示本實施方式中的記錄再現(xiàn)裝置的動作的圖,表示作為聲音數(shù)據(jù)與其聲 壓水平、以及編碼數(shù)據(jù)的一例的MP3數(shù)據(jù)。參照圖6對本實施方式中的樂曲切換檢測部106 以及特征提取用信號處理部107中的處理進(jìn)行說明。在本實施方式中,特征提取用信號處理部107作為表示聲音數(shù)據(jù)特征的特征信 息,提取表示聲音數(shù)據(jù)的聲壓水平的時間推移的時間推移信息。具體而言,例如進(jìn)行聲壓水 平與規(guī)定閾值之間的比較,基于該比較結(jié)果求得聲壓水平低于規(guī)定閾值的區(qū)間的開始點與
結(jié)束點ο樂曲切換檢測部106作為特征信息從特征提取用信號處理部107接收聲壓水平為 規(guī)定閾值以下的區(qū)間的開始點與結(jié)束點。進(jìn)而,確定在更遠(yuǎn)離該開始點或者結(jié)束點的幀邊 界進(jìn)行樂曲切換。在圖6的例子中,與從“聲壓水平 < 閾值”的區(qū)間的開始點至幀N的前側(cè) 邊界的時間長度相比,從“聲壓水平<閾值”的區(qū)間的結(jié)束點至幀N的后側(cè)邊界的時間長度 更長。因此,確定在幀N的后側(cè)邊界即幀N與幀(N+1)之間的邊界進(jìn)行樂曲切換。此外,在此雖然對開始點或者結(jié)束點與幀邊界進(jìn)行比較,但是代替幀邊界也可以 使用軌道的邊界。例如,分別求得從軌道邊界至“聲壓水平<閾值”的區(qū)間的開始點或者結(jié) 束點的時間長度,確定在時間長度較長一側(cè)的幀邊界(圖6的情況下,幀N與幀(N+1)之間 的邊界)進(jìn)行樂曲切換?;蛘撸部梢源_定在處于時間長度較短一側(cè)的幀邊界進(jìn)行樂曲切 換。此外,雖然在此作為聲音數(shù)據(jù)的特征量使用聲壓水平,但是也可以使用除此以外 的特征量。例如,特征提取用信號處理部107可以將聲音數(shù)據(jù)的頻率特性作為特征量進(jìn)行 提取,求得與預(yù)先規(guī)定的特性的相似度,確定該相似度低于規(guī)定閾值的區(qū)間。這種特征信息
8也可以在樂曲切換的判斷中使用?;蛘撸部梢詫⑻囟l帶中的電平信息作為特征量提取, 并與規(guī)定閾值進(jìn)行比較。另外,在本實施方式中,可以根據(jù)解碼部104或編碼部105中的頻率分析處理的結(jié) 果求得頻率特性或特定頻帶中的電平信息。再有,在此雖然作為表示聲音數(shù)據(jù)的特征量的時間推移的時間推移信息,基于特 征量與規(guī)定閾值之間的比較結(jié)果確定特征量低于規(guī)定閾值的區(qū)間的開始點與結(jié)束點,但是 時間推移信息的形式并不限于此。例如,可以取得多個幀或者任意采樣數(shù)目的聲音數(shù)據(jù)的 特征量,并將其時間變化的傾向作為時間推移信息而求得。作為一例,也可以估計聲音數(shù)據(jù) 的特征量要收斂的時間,并基于此確定樂曲切換的位置。(第3實施方式)本發(fā)明的第3實施方式所涉及的記錄再現(xiàn)裝置的概略結(jié)構(gòu)與第1實施方式相同, 如圖1所示。其中,樂曲切換檢測部106以及特征提取用信號處理部107中的處理與第1 以及第2實施方式不同。其他結(jié)構(gòu)的動作與第1實施方式同樣,在此省略說明。在本實施方式中,特征提取用信號處理部107進(jìn)行聲音數(shù)據(jù)的物理特性分析,取 得電平信息或頻率特性等的分析結(jié)果。此處得到的聲音數(shù)據(jù)的特征量包括是聲音或不是 聲音的判別結(jié)果、樂曲速度信息、以及音色信息的至少一個,也可以是它們的綜合的分析結(jié) 果。再有,作為表示聲音數(shù)據(jù)的特征量的時間推移的時間推移信息,提取該分析結(jié)果沿著時 間序列的變化。此外,如第2實施方式所述,也可以利用解碼部104或者編碼部105中的頻 率分析結(jié)果。樂曲切換檢測部106基于由特征提取用信號處理部107提取出的、沿分析結(jié)果的 時間序列的變化,判定樂曲切換位置。例如,可以考慮如下的處理,即求得分析結(jié)果急劇變 化的點、或含有特定聲音的點,將此類推為樂曲切換位置。(第4實施方式)圖7是表示本發(fā)明的第4實施方式所涉及的記錄再現(xiàn)裝置的概略結(jié)構(gòu)的圖。圖7 的結(jié)構(gòu)與圖1的結(jié)構(gòu)大致相同,對與圖1共同的結(jié)構(gòu)部分附于與圖1相同的符號,在此省略 其詳細(xì)說明。在本實施方式中,樂曲切換檢測部106以及特征提取用信號處理部107中的處理, 構(gòu)成為可以經(jīng)由主機(jī)接口 112從記錄再現(xiàn)裝置IOlA的外部進(jìn)行設(shè)定,在這一點上與第1 第3實施方式不同。在開始聲音數(shù)據(jù)的再現(xiàn)與編碼處理時,首先從外部通過主機(jī)接口 112對樂曲切換 部106進(jìn)行編碼后的音頻編碼方式或采樣頻率、緩存的開始結(jié)束區(qū)域、幀分割數(shù)等的編碼 處理內(nèi)容的設(shè)定。進(jìn)行了設(shè)定之后,進(jìn)行聲音數(shù)據(jù)的再現(xiàn)與編碼處理。在處理期間,從幀邊 界分割部111接收幀邊界的分割位置。在進(jìn)行聲音數(shù)據(jù)的再現(xiàn)與編碼處理的停止時,基于 分割位置進(jìn)行停止處理。能夠從外部使用主機(jī)接口 112進(jìn)行例如下面的設(shè)定。(1)在輸入為音樂數(shù)據(jù)的情況下,進(jìn)行第1實施方式所示的處理,在輸入為語音數(shù) 據(jù)的情況下,進(jìn)行第2實施方式所示的處理。(2)在第2實施方式所示的處理中,根據(jù)聲音數(shù)據(jù)的聲壓水平的平均值改變使用 的閾值。
(3)在進(jìn)行第1 第3實施方式所示的處理時,代替樂曲序號直接從外部指定樂曲 位置信息。(4)在進(jìn)行第1 第3實施方式所示的處理時,基于從特征提取用信號處理部107 得到的特征信息的切換檢測結(jié)果、與基于樂曲序號的切換檢測結(jié)果相矛盾的情況下,優(yōu)先 選前者。(5)如圖5所示的例子,無論將哪個幀邊界作為樂曲切換點,在有可能在樂曲的開 頭或者結(jié)束發(fā)生聲音中斷的情況下,避免樂曲開頭(或者結(jié)束)的聲音中斷。這樣,通過從進(jìn)行分割處理的外部模塊控制樂曲切換檢測部106以及特征提取用 信號處理部107的處理內(nèi)容,從而可以使樂曲切換的判斷最優(yōu)化。此外,從外部模塊控制樂曲切換檢測部106以及特征提取用信號處理部107的處 理內(nèi)容的定時是任意的,例如可以是每次系統(tǒng)啟動時,可以是開始編碼時,也可以是編碼處 理過程中。若提高進(jìn)行處理內(nèi)容控制的頻率,則雖然系統(tǒng)負(fù)載升高,但是可以實現(xiàn)更高精度 的最優(yōu)化。按照以上所說明,本發(fā)明所涉及的記錄再現(xiàn)裝置在連續(xù)輸入樂曲序號不同的聲音 數(shù)據(jù)并再現(xiàn),同時按樂曲序號對編碼數(shù)據(jù)進(jìn)行分割記錄時,可防止在編碼之后的樂曲的開 頭或尾部中混入噪聲,在這一點是有效的。
權(quán)利要求
一種記錄再現(xiàn)裝置,其特征在于具有聲音數(shù)據(jù)處理部,其對輸入的聲音數(shù)據(jù)以由規(guī)定數(shù)目的采樣構(gòu)成的幀單位,進(jìn)行用于再現(xiàn)的解碼處理、用于記錄的壓縮編碼處理;編碼數(shù)據(jù)緩存,暫時存儲從所述聲音數(shù)據(jù)處理部輸出的編碼數(shù)據(jù);特征提取用信號處理部,對所述聲音數(shù)據(jù)進(jìn)行信號處理,提取表示所述聲音數(shù)據(jù)的特征的特征信息;樂曲切換檢測部,將對應(yīng)所述聲音數(shù)據(jù)的樂曲位置信息、以及從所述特征提取用信號處理部輸出的所述特征信息作為輸入,以所述樂曲位置信息以及特征信息為基礎(chǔ)確定要進(jìn)行樂曲切換的幀邊界;以及幀邊界分割部,由所述樂曲切換檢測部確定了要進(jìn)行樂曲切換的幀邊界時,對存儲于所述編碼數(shù)據(jù)緩存中的編碼數(shù)據(jù)進(jìn)行修正的處理,以使該編碼數(shù)據(jù)中的幀邊界與所確定的要進(jìn)行樂曲切換的幀邊界相符合。
2.根據(jù)權(quán)利要求1所述的記錄再現(xiàn)裝置,其特征在于,所述幀邊界分割部,將對應(yīng)作為樂曲切換而確定的幀邊界的、表示所述編碼數(shù)據(jù)的幀 邊界的數(shù)據(jù),作為所述編碼數(shù)據(jù)的分割位置進(jìn)行輸出。
3.根據(jù)權(quán)利要求1所述的記錄再現(xiàn)裝置,其特征在于,所述特征提取用信號處理部作為所述特征信息提取幀邊界附近的聲音數(shù)據(jù)的特征量。
4.根據(jù)權(quán)利要求3所述的記錄再現(xiàn)裝置,其特征在于, 所述特征量是聲音數(shù)據(jù)的聲壓水平。
5.根據(jù)權(quán)利要求1所述的記錄再現(xiàn)裝置,其特征在于,所述特征提取用信號處理部作為所述特征信息提取出表示聲音數(shù)據(jù)的特征量的時間 推移的時間推移信息。
6.根據(jù)權(quán)利要求5所述的記錄再現(xiàn)裝置,其特征在于,所述時間推移信息是基于特征量與所述閾值之間的比較結(jié)果的信息。
7.根據(jù)權(quán)利要求5所述的記錄再現(xiàn)裝置,其特征在于, 所述特征量是聲音數(shù)據(jù)的聲壓水平。
8.根據(jù)權(quán)利要求5所述的記錄再現(xiàn)裝置,其特征在于, 所述特征量是聲音數(shù)據(jù)的頻率特性。
9.根據(jù)權(quán)利要求5所述的記錄再現(xiàn)裝置,其特征在于,所述特征提取用信號處理部進(jìn)行聲音數(shù)據(jù)的物理特性分析,作為所述特征量,獲得是 聲音或不是聲音的判別結(jié)果、樂曲速度信息、以及音色信息之中的至少一個。
10.根據(jù)權(quán)利要求1所述的記錄再現(xiàn)裝置,其特征在于,具有主機(jī)接口,所述主機(jī)接口用于能夠從外部控制所述特征提取用信號處理部以及樂 曲切換檢測部中的處理內(nèi)容。
11.根據(jù)權(quán)利要求1所述的記錄再現(xiàn)裝置,其特征在于, 所述聲音數(shù)據(jù)記錄于CD,所述樂曲位置信息包括記錄于CD的子碼。
全文摘要
本發(fā)明提供一種記錄再現(xiàn)裝置,其具有聲音數(shù)據(jù)處理部(120),對聲音數(shù)據(jù)以由規(guī)定數(shù)目的采樣構(gòu)成的幀為單位進(jìn)行解碼處理與壓縮編碼處理。所得到的編碼數(shù)據(jù)暫時存儲于編碼數(shù)據(jù)緩存(110)中。樂曲切換檢測部(106)以對應(yīng)聲音數(shù)據(jù)的樂曲位置信息、以及從特征提取用信號處理部(107)輸出的表示聲音數(shù)據(jù)特征的特征信息為基礎(chǔ),確定要進(jìn)行樂曲切換的幀邊界。幀邊界分割部(111)對存儲于編碼數(shù)據(jù)緩存(110)中的編碼數(shù)據(jù)進(jìn)行修正,以使該編碼數(shù)據(jù)的幀邊界與所確定的幀邊界相符合。
文檔編號G10L11/00GK101911184SQ20088012465
公開日2010年12月8日 申請日期2008年12月5日 優(yōu)先權(quán)日2008年1月16日
發(fā)明者山下美紀(jì), 山田周平, 川西隆之, 浦田慎吾, 藤田剛史 申請人:松下電器產(chǎn)業(yè)株式會社