聲音合成裝置、電子水印信息檢測裝置、聲音合成方法、電子水印信息檢測方法、聲音合成 ...的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明的實施方式涉及聲音合成裝置、電子水印信息檢測裝置、聲音合成方法、電 子水印信息檢測方法、聲音合成程序及電子水印信息檢測程序。
【背景技術(shù)】
[0002] 公知的是,對表示聲帶的振動的聲源信號進行表示聲道特性的過濾,來合成聲音。 另外,合成聲音的品質(zhì)提高,有被濫用的危險性。因此,考慮通過在合成聲音插入水印信息, 能夠防止、抑制濫用。
[0003] 【專利文獻1】特開2003-295878號公報
【發(fā)明內(nèi)容】
[0004] 但是,若在合成聲音組入電子水印,則有時發(fā)生音質(zhì)劣化。本發(fā)明要解決的問題在 于提供能夠在不會使合成聲音的音質(zhì)劣化的情況下插入電子水印的聲音合成裝置、電子水 印信息檢測裝置、聲音合成方法、電子水印信息檢測方法、聲音合成程序及電子水印信息檢 測程序。
[0005] 實施方式的信息處理裝置具備聲源生成部、相位調(diào)制部和聲道過濾部。聲源生成 部使用聲音的基本頻率序列及脈沖信號,生成聲源信號。相位調(diào)制部對聲源生成部所生成 的聲源信號,基于電子水印信息,按每個音高標記調(diào)制脈沖信號的相位。聲道過濾部對相位 調(diào)制部調(diào)制了脈沖信號的相位后的聲源信號,使用頻譜參數(shù)序列生成聲音信號。
【附圖說明】
[0006] 圖1是例示實施方式所涉及的聲音合成裝置的構(gòu)成的方框圖。
[0007] 圖2是例示聲源部的構(gòu)成的方框圖。
[0008] 圖3是例示實施方式所涉及的聲音合成裝置進行的處理的流程圖。
[0009] 圖4是對無電子水印的聲音波形和聲音合成裝置插入了電子水印的聲音波形進 行對比的圖。
[0010] 圖5是例示聲源部的第1變形例及其周邊的構(gòu)成的方框圖。
[0011] 圖6是表不聲首波形、基本頻率序列、首尚標記及頻帶噪聲強度序列的一例的圖。
[0012] 圖7是例示表示具有圖5中所示的聲源部的聲音合成裝置所進行的處理的流程 圖。
[0013] 圖8是例示聲源部的第2變形例及其周邊的構(gòu)成的方框圖。
[0014] 圖9是例示實施方式所涉及的電子水印信息檢測裝置的構(gòu)成的方框圖。
[0015] 圖10是表示在判定部基于代表相位值來判定電子水印信息的有無的情況下進行 的處理的圖。
[0016] 圖11是例示實施方式所涉及的電子水印信息檢測裝置的工作的流程圖。
[0017] 圖12是表示在判定部基于代表相位值來判定電子水印信息的有無的情況下進行 的其他處理的第1例的圖。
[0018] 圖13是表示在判定部基于代表相位值來判定電子水印信息的有無的情況下進行 的其他處理的第2例的圖。
【具體實施方式】
[0019] (聲音合成裝置)
[0020] 以下參照附圖,說明實施方式所涉及的聲音合成裝置。圖1是例示實施方式所涉 及的聲音合成裝置1的構(gòu)成的方框圖。另外,聲音合成裝置1由例如通用的計算機等實現(xiàn)。 即,聲音合成裝置1具有作為具備例如CPU、存儲裝置、輸入輸出裝置及通信接口等的計算 機的功能。
[0021] 如圖1所示,聲音合成裝置1具備輸入部10、聲源部2a、聲道過濾部12、輸出部14 及第1存儲部16。輸入部10、聲源部2a、聲道過濾部12及輸出部14可以分別由硬件電路 或通過CPU執(zhí)行的軟件構(gòu)成。第1存儲部16由例如HDD (Hard Disk Drive,硬盤驅(qū)動器) 或存儲器等構(gòu)成。即,聲音合成裝置1也可以構(gòu)成為通過執(zhí)行聲音合成程序來實現(xiàn)功能。
[0022] 輸入部10對聲源部2a輸入表示基本頻率或基本周期的信息的序列(以下,記載 為基本頻率序列)、頻譜參數(shù)的序列和至少包含電子水印信息的特征參數(shù)的序列。
[0023] 基本頻率序列設(shè)為例如有聲音的幀的基本頻率(F。)的值等和表示是無聲音的幀 這一情況的值的序列。這里,無聲音的幀設(shè)為例如固定為〇等預(yù)先確定的值的序列。另外, 有聲音的幀也可以包含周期信號的每幀的音高周期或?qū)?shù)F。等的值。
[0024] 在本實施方式中,所謂幀,設(shè)為表示聲音信號的區(qū)間。在聲音合成裝置1根據(jù)固定 的幀頻進行分析的情況下,特征參數(shù)為例如每5ms的值。
[0025] 頻譜參數(shù)將聲音的頻譜信息表現(xiàn)為參數(shù)。在聲音合成裝置1與基本頻率序列同樣 地根據(jù)固定的幀頻進行分析的情況下,頻譜參數(shù)為與例如每5ms的區(qū)間對應(yīng)的值。另外,對 頻譜參數(shù),使用例如倒頻譜、梅爾倒頻譜、線性預(yù)測系數(shù)、頻譜包絡(luò)或梅爾LSP等各種參數(shù)。
[0026] 聲源部2a使用從輸入部10輸入的基本頻率序列及后述的脈沖信號等,生成對相 位進行了調(diào)制的聲源信號(使用圖2等詳述),并對聲道過濾部12輸出。
[0027] 聲道過濾部12對聲源部2a調(diào)制了相位后的聲源信號,使用經(jīng)由例如聲源部2a接 收到的頻譜參數(shù)序列,進行卷積運算,生成聲音信號。即,聲道過濾部12生成聲音波形。
[0028] 輸出部14輸出聲道過濾部12所生成的聲音信號。例如,輸出部14將聲音信號 (聲音波形)表現(xiàn)為波形輸出,或者作為聲音文件(例如WAVE文件等)輸出。
[0029] 第1存儲部16預(yù)先存儲用于聲音合成的多種脈沖信號,根據(jù)來自聲源部2a的訪 問,對聲源部2a輸出某脈沖信號。
[0030] 圖2是例示聲源部2a的構(gòu)成的方框圖。如圖2所示,聲源部2a具有例如聲源生 成部20及相位調(diào)制部22。聲源生成部20對從第1存儲部16接收到的脈沖信號,通過使 用從輸入部10接收到的特征參數(shù)的序列進行變形,生成針對有聲音的幀的(脈沖)聲源信 號。即,聲源生成部20制作脈沖列(或音高標記列)。音高標記列是表示配置音高脈沖的 時刻的列的信息。
[0031] 例如,聲源生成部20確定基準時刻,根據(jù)基本頻率序列內(nèi)相符的幀的值計算該基 準時刻處的音高周期。另外,聲源生成部20通過反復(fù)在相對于基準時刻前進了所計算的音 高周期的長度的量的時刻賦予標記的處理,來制作音高標記。另外,聲源生成部20通過求 出基本頻率的倒數(shù),來計算音高周期。
[0032] 相位調(diào)制部22接收聲源生成部20所生成的(脈沖)聲源信號,進行相位調(diào)制。例 如,相位調(diào)制部22對聲源生成部20所生成的聲源信號,基于使用了特征參數(shù)中所包含的電 子水印信息的相位調(diào)制規(guī)則,按每個音高標記調(diào)制脈沖信號的相位。即,相位調(diào)制部22調(diào) 制脈沖信號的相位,生成相位調(diào)制脈沖列。
[0033] 相位調(diào)制規(guī)則既可以是時間序列性的調(diào)制,也可以是頻率序列性的調(diào)制。例如,相 位調(diào)制部22如下式1或下式2所示,按每個頻點以時間序列調(diào)制相位,或者使用以時間序 列及頻率序列中的至少一種隨機地調(diào)制的全通濾波器,時間性地進行調(diào)制。
[0034] 例如,在相位調(diào)制部22以時間序列調(diào)制相位的情況下,也可以構(gòu)成為將表示按每 時間序列(按每預(yù)定的時刻)變化的相位調(diào)制規(guī)則組的表作為電子水印信息所用的密鑰信 息,由輸入部10對相位調(diào)制部22預(yù)先輸入。在該情況下,相位調(diào)制部22基于電子水印信 息所用的密鑰信息,按每個預(yù)定的時刻改變相位調(diào)制規(guī)則。另外,在檢測電子水印信息的電 子水印信息檢測裝置(后述)中,通過使用相位調(diào)制部22用于相位調(diào)制規(guī)則的改變的表, 可以提高電子水印的秘匿性。
[0039] 另外,a表示相位調(diào)制強度(斜率),f表示頻點或頻帶,t表示時間,ph(t,f)表 示