專利名稱:接收裝置、方法及程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及接收裝置、方法及程序,可以適用于例如通過IP網(wǎng)絡(luò)等對聲音等進(jìn)行 通信的終端裝置。
背景技術(shù):
近年來,利用了 IP網(wǎng)絡(luò)的聲音通信(VoIP)被廣泛普及。在VoIP中,各終端裝置 具有固有的動作時鐘。即使想要獲得相同的時鐘頻率,也由于各終端裝置中固有的動作時 鐘,導(dǎo)致很難完全一致。因此,生成終端裝置間的動作速度差(動作時鐘的頻率差),接收緩 存中的接收數(shù)據(jù)中產(chǎn)生過與不足。為了解決這樣的問題,在專利文獻(xiàn)1中提出了如下方法通過在聲音信號的無聲 部分,刪除接收數(shù)據(jù)、或插入無聲數(shù)據(jù),從而校正接收數(shù)據(jù)的過與不足(即動作時鐘差)。并且,在專利文獻(xiàn)2中提出了如下方法通過控制每隔規(guī)定時間的接收數(shù)據(jù)數(shù)(采 樣率),校正接收數(shù)據(jù)的過與不足(即動作時鐘差)。專利文獻(xiàn)1 日本特開2003-46490專利文獻(xiàn)2 日本特開平11-272295但是,在專利文獻(xiàn)1的記載方法中存在如下的問題,即音質(zhì)由于有聲/無聲的誤判 而劣化,并且通話音質(zhì)由于有聲時間和無聲時間的比率變化而劣化。并且,在專利文獻(xiàn)1的記載方法中存在由于變換采樣率而導(dǎo)致接收信號的頻率成 分變化的問題。例如,存在在通信信號是聲音信號時,頻率成分的變化為音質(zhì)的變化,從而 存在與說話者的正常聲音不同的聲音來發(fā)音的顧慮。并且例如,在通信信號是音頻信號時, 頻率成分的變化引起音頻向期望的頻率變化,上述的問題非常嚴(yán)重。因此,希望提出一種可以抑制音質(zhì)的劣化或變化、且可以吸收發(fā)送裝置和接收裝 置之間的動作時鐘頻率的不同的接收裝置、方法及程序。
發(fā)明內(nèi)容
為了解決該課題,本發(fā)明的第1方式提供一種接收裝置,該接收裝置用于接收進(jìn) 行了編碼的、由聲音信號或音頻信號構(gòu)成的處理對象信號,該接收裝置的特征在于,所述接 收裝置包括(1)解碼單元,其對到來的編碼處理對象信號進(jìn)行解碼;(2)樣本數(shù)變換單元, 其根據(jù)從外部提供的要素數(shù)變換信息,對解碼后的每單位時間的信號樣本數(shù)進(jìn)行變換;以 及(3)頻率分布變換單元,其根據(jù)從外部提供的頻率分布變換信息,對頻率分布進(jìn)行變換。本發(fā)明的第2方式提供一種接收方法,該接收方法用于接收進(jìn)行了編碼的、由聲 音信號或音頻信號構(gòu)成的處理對象信號,該接收方法的特征在于,所述接收方法執(zhí)行如下 處理(1)由解碼單元對到來的編碼處理對象信號進(jìn)行解碼;(2)由樣本數(shù)變換單元根據(jù)從 外部提供的要素數(shù)變換信息,對解碼后的每單位時間的信號樣本數(shù)進(jìn)行變換;以及(3)由 頻率分布變換單元根據(jù)從外部提供的頻率分布變換信息,對頻率分布進(jìn)行變換。本發(fā)明的第3方式提供一種接收程序,該接收程序用于接收進(jìn)行了編碼的、由聲音信號或音頻信號構(gòu)成的處理對象信號,該接收程序的特征在于,所述接收程序使計算機(jī) 執(zhí)行如下單元的功能(1)解碼單元,其對到來的編碼處理對象信號進(jìn)行解碼;(2)樣本數(shù) 變換單元,其根據(jù)從外部提供的要素數(shù)變換信息,對解碼后的每單位時間的信號樣本數(shù)進(jìn) 行變換;以及(3)頻率分布變換單元,其根據(jù)從外部提供的頻率分布變換信息,變換頻率分布。根據(jù)本發(fā)明,可以抑制音質(zhì)的劣化或變化、且可以吸收發(fā)送裝置和接收裝置之間的動作時鐘頻率的不同。
圖1是表示第1實施方式的接收裝置的結(jié)構(gòu)的框圖。圖2是表示第1實施方式中的頻率分布變換器的詳細(xì)結(jié)構(gòu)的框圖。圖3是根據(jù)第1實施方式中的頻率分布變換器的頻率分布的變換方法例的說明 圖。圖4是表示第2實施方式的接收裝置的結(jié)構(gòu)的框圖。
具體實施例方式(A)第1實施方式以下,參照圖面說明本發(fā)明的接收裝置、方法及程序的第1實施方式。該第1實施 方式的接收裝置是在處理聲音信號(例如、電話終端或軟電話等)中利用的裝置。第1實施方式中,通過控制每單位時間的聲音樣本數(shù)(接收數(shù)據(jù)數(shù)),吸收發(fā)送裝 置和接收裝置間的動作時鐘頻率的不同,并且即使改變每單位時間的聲音樣本數(shù),也不會 引起音質(zhì)的變化。(A-I)第1實施方式的結(jié)構(gòu)圖1是表示第1實施方式的接收裝置的主要部分的結(jié)構(gòu)的框圖。例如,在搭載第1 實施方式的接收裝置的裝置是軟電話,即使在接收裝置由CPU和由CPU執(zhí)行的軟件實現(xiàn)的 情形下,功能上也可以由圖1的功能框圖來表示。在圖1中,第1實施方式的接收裝置100具有聲音數(shù)據(jù)接收積蓄部(接收緩 存)101、聲音解碼器102、樣本數(shù)變換器103、頻率分布變換器104及變換指示操作部105。聲音數(shù)據(jù)接收積蓄部101對從相對發(fā)送裝置發(fā)送來的編碼聲音數(shù)據(jù)進(jìn)行緩存。例 如,積蓄從接收分組中取出的編碼聲音數(shù)據(jù)、或積蓄串行發(fā)送來的編碼聲音數(shù)據(jù)。聲音解碼器102與從變換指示操作部105指示的起動信號B聯(lián)動地由1單位的編 碼聲音數(shù)據(jù)解碼聲音數(shù)據(jù)。例如,在編碼方式是G. 729時,IOms的編碼聲音數(shù)據(jù)成為1單 位。樣本數(shù)變換器103與從變換指示操作部105指示的起動信號B聯(lián)動地工作,并根 據(jù)同時指示的變化系數(shù)C變換輸出信號對輸入信號的樣本數(shù)。例如,采樣率為8kHz、l單位 為IOms時,輸入到樣本數(shù)變換器103的聲音信號的樣本數(shù)為每單位始終為80個樣本。此 處,當(dāng)變換系數(shù)C是0.9時,輸出信號的樣本數(shù)在相同的時間(IOms)內(nèi)為72個樣本,當(dāng)變 換系數(shù)C為1.1時,輸出信號在相同的時間(IOms)內(nèi)為88個樣本。當(dāng)僅著眼于樣本數(shù)變 換器103的輸入輸出關(guān)系時,看似每單位時間的樣本數(shù)不同,因此變換處理與變換采樣率的處理等同。即、在變換系數(shù)C為0. 9時實施從8kHz到7. 2kHz的速率變換處理,在變換系 數(shù)C為1. 1時實施SkHz到8. SkHz的速率變換處理。樣本數(shù)變換器103通過代替改變樣本 (聲音數(shù)據(jù))的一時鐘間(IOms)的樣本數(shù),而改變輸入規(guī)定樣本數(shù)(80個樣本)的時間,從 而變更采樣率。例如,通過將起動信號B的周期作為與變換系數(shù)C相應(yīng)的周期,在變換系數(shù) C為1.0時每隔IOms起動、在變換系數(shù)C為0.9時每隔9ms起動、在變換系數(shù)C為1. 1時每 隔Ilms起動,從而使樣本數(shù)變換器103的輸出信號的每單位時間(IOms)的樣本數(shù)(80個 樣本)恒定。 經(jīng)由樣本數(shù)變換器103的處理,輸入到樣本數(shù)變換器103的輸入聲音數(shù)據(jù)的頻率 分布與來自樣本數(shù)變換器103的輸出聲音數(shù)據(jù)的頻率分布變得不同。頻率分布變換器104 根據(jù)從變換指示操作部105指示的頻率變換信號D,校正來自樣本數(shù)變換器103的輸出聲音 數(shù)據(jù)的頻率分布。作為頻率分布變換器104,例如可以適用卡拉OK裝置等中適用的音高、音 質(zhì)可變的結(jié)構(gòu)。圖2是表示頻率分布變換器104的內(nèi)部構(gòu)成例的框圖。圖2中,頻率分布變換器 104具有FFT處理部201、頻率分布變換部202、逆FFT處理部203。FFT處理部201對來自 樣本數(shù)變換器103的輸出聲音數(shù)據(jù),實施FFT處理。頻率分布變換部202對其FFT處理結(jié) 果(頻率分布),根據(jù)從變換指示操作部105指示的頻率變換信號D進(jìn)行變換。逆FFT處理 部203對從頻率分布變換部202輸出的、頻率分布的變換后的數(shù)據(jù)實施逆FFT處理。圖3是頻率分布變換器104 (頻率分布變換部202)的頻率分布的變換方法例的說 明圖。由圖3的實曲線表示FFT處理部201的FFT處理結(jié)果(頻率分布;橫軸為頻率、縱 軸為電平)。此時,在頻率變換信號D為1. 0時,頻率分布變換部202直接輸出FFT處理部 201的FFT處理結(jié)果。在頻率變換信號D為0. 9時,如圖3的虛曲線所示,將與變換前的分 布取相同電平的頻率X變換為,變換前的頻率Y的0. 9倍的頻率0. 9XY。在頻率變換信號D 為1. 1時,如圖3的點劃曲線所示,將與變換前的分布取相同電平的頻率Z變換為,變換前 的頻率Y的1. 1倍的頻率1. 1XY。另外,圖3中表示了將原頻率分布沿頻率軸伸張或壓縮的頻率分布的變換方法, 但也可以適用將原頻率分布沿頻率軸移動的頻率分布的變換方法。只要根據(jù)頻率變換信號 D來控制移動量即可。變換指示操作部105根據(jù)利用者的操作輸出起動信號B、變換系數(shù)C及頻率變換信 號D。變換指示操作部105例如內(nèi)置變換表,并將音量的操作符的位置作為地址來訪問變 換表,從而可以適用獲得起動信號B、變換系數(shù)C及頻率變換信號D的裝置。另外,在通信 開始時,可以適用默認(rèn)值,例如起動信號B為10 (ms)、變換系數(shù)C為1. 0、頻率變換信號D為 1.0。利用者根據(jù)自己所聽取的聲音來操作音量的操作符。例如,在默認(rèn)的狀態(tài)下,在如出 現(xiàn)跳音時,對樣本數(shù)變換器103進(jìn)行操作,以使輸出側(cè)的采樣率提高,并且根據(jù)該操作改變 起動信號B、變換系數(shù)C及頻率變換信號D。并且例如,在默認(rèn)狀態(tài)下,在如出現(xiàn)重音時,對 樣本數(shù)變換器103進(jìn)行操作,以使輸出側(cè)的采樣率提高,并且根據(jù)該操作改變起動信號B、 變換系數(shù)C及頻率變換信號D。另外,也可以通過后述的第2實施方式的方法等,獲取反映了相對的裝置與該接 收裝置100之間的時鐘頻率之差的信息(每單位時間(IOms)輸入的編碼聲音數(shù)據(jù)的數(shù)),顯示該信息,并在利用者的操作的判斷中利用。并且,起動信號B、變換系數(shù)C及頻率變換信號D也可以個別操作、設(shè)定。(A-2)第1實施方式的動作接著,說明第1實施方式的接收裝置100的動作。從相對發(fā)送裝置發(fā)送來的編碼聲音數(shù)據(jù)在緩存到數(shù)據(jù)接收積蓄部101后,根據(jù)來自變換指示操作部105的起動信號B,由聲音解碼器102取出1單位的每個編碼聲音數(shù)據(jù)并 解碼,獲得聲音數(shù)據(jù)。對于這樣的聲音數(shù)據(jù),樣本數(shù)變換器103根據(jù)起動信號B、變換系數(shù)C變更每規(guī)定 時間的樣本數(shù)(采樣率)。變更了采樣率的聲音數(shù)據(jù),其頻率分布根據(jù)頻率變換信號D,被頻率分布變換器 104校正后輸出。(A-3)第1實施方式的效果根據(jù)第1實施方式,即使相對發(fā)送裝置和該接收裝置之間的動作時鐘頻率存在差 異,也不依賴于數(shù)據(jù)的缺失或插入,而通過控制每單位時間的樣本數(shù)(采樣率)的方法來對 應(yīng),并通過頻率分布的變換來補(bǔ)償該采樣率的控制所引起的音質(zhì)的變化,因此可以實現(xiàn)音 質(zhì)劣化、通話質(zhì)量劣化少的時鐘頻率差吸收。(B)第2實施方式接著,參照
本發(fā)明的接收裝置、方法及程序的第1實施方式。第2實施方式中,不依賴于手動而自動地決定在第1實施方式中利用的各種參數(shù)。圖4是表示第2實施方式的接收裝置的結(jié)構(gòu)的框圖,將與第1實施方式的圖1相 同的、對應(yīng)的部分標(biāo)上相同的、對應(yīng)符號來表示。在圖4中,第2實施方式的接收裝置100A具有聲音數(shù)據(jù)接收積蓄器101A、聲音解 碼器102、樣本數(shù)變換器103、頻率分布變換器104及變換指示生成器105A。此處,聲音解碼 器102、樣本數(shù)變換器103及頻率分布變換器104與第1實施方式相同,省略其功能說明。第1實施方式的聲音數(shù)據(jù)接收積蓄器IOlA除了具有緩存從相對發(fā)送裝置發(fā)送來 的編碼聲音數(shù)據(jù)的功能外,還具有測量每規(guī)定時間(例如100ms)輸入的編碼聲音數(shù)據(jù)的數(shù) 的測量功能,并且具有將該測量值A(chǔ)提供給變換指示生成器105A的功能。聲音數(shù)據(jù)接收積 蓄器IOlA進(jìn)行測量的規(guī)定時間優(yōu)選為比聲音解碼器102的處理的基本單位時間充分長的 時間。變換指示生成器105A根據(jù)測量值A(chǔ),適用規(guī)定的變換表或變換式,生成起動信號 B、變換系數(shù)C、頻率變換信號D,并供給到上述各部。將聲音數(shù)據(jù)接收積蓄器IOlA的測量的規(guī)定時間作為基本時間的10倍的100ms,并 使編碼方式基于G. 729,使IOms的編碼聲音數(shù)據(jù)(80個樣本)作為處理的基本單位。此時, 當(dāng)聲音數(shù)據(jù)接收積蓄器IOlA的計數(shù)值A(chǔ)為a時,根據(jù)(1)式 (3)式,生成起動信號(起 動周期)B、變換系數(shù)C、頻率變換信號D。B = 8000/a ......(1)C = 800/a ......(2)D = C......(3)根據(jù)10ms、a/10樣本獲得的狀態(tài),計算獲得80個樣本的時間,從而獲得起動周期B,因此其變換式為(1)式。例如,如果a是880個樣本,則作為起動周期獲得約9. 09ms,如 果a是720個樣本,則作為起動周期獲得約11. Ilms0為了將10ms、a/10樣本作為10ms、80個樣本,通過求出與a/10相乘的系數(shù)C,獲 得(2)式。例如,如果a為880個樣本,則作為系數(shù)(輸入輸出的采樣率比)C獲得約0.91, 當(dāng)a為720個樣本時,作為系數(shù)(輸入輸出的采樣率比)C獲得約1. 11。
當(dāng)頻率變換信號D的功能是,將根據(jù)樣本數(shù)變換器103的處理變化后的頻率分布 向逆方向變化而使其復(fù)原時,例如可以適用(3)式。根據(jù)第2實施方式,可以根據(jù)相對發(fā)送裝置和該接收裝置之間的動作時鐘頻率的 差異來自動決定各種值,并執(zhí)行與第1實施方式相同的動作,即,可以不通過手動方式而獲 得與第1實施方式相同的效果。(C)其他的實施方式在上述各實施方式中,示出了在樣本數(shù)變換器的處理后進(jìn)行頻率分布變換器的處 理的方式,但是也可以是在樣本數(shù)變換器的處理前進(jìn)行頻率分布變換器的處理。此時,頻率 分布變換器也仍進(jìn)行預(yù)先消除樣本數(shù)變換器的處理所引起的頻率分布的變動的頻率分布 變換。在上述各實施方式中,示出了處理對象的數(shù)據(jù)為聲音數(shù)據(jù)的情形,但在處理對象 的數(shù)據(jù)為音頻數(shù)據(jù)的情況下,也可以適用本發(fā)明。
權(quán)利要求
一種接收裝置,該接收裝置用于接收進(jìn)行了編碼的、由聲音信號或音頻信號構(gòu)成的處理對象信號,該接收裝置的特征在于,所述接收裝置包括解碼單元,其對到來的編碼處理對象信號進(jìn)行解碼;樣本數(shù)變換單元,其根據(jù)從外部提供的要素數(shù)變換信息,對解碼后的每單位時間的信號樣本數(shù)進(jìn)行變換;以及頻率分布變換單元,其根據(jù)從外部提供的頻率分布變換信息,對頻率分布進(jìn)行變換。
2.根據(jù)權(quán)利要求1所述的接收裝置,其特征在于,所述接收裝置還包括到來樣本數(shù)測量單元,其對從相對裝置到來的每規(guī)定時間的編碼處理對象信號的樣本 數(shù)進(jìn)行測量;以及控制信息生成單元,其根據(jù)由所述到來樣本數(shù)測量單元測量出的樣本數(shù),生成所述要 素數(shù)變換信息和所述頻率分布變換信息。
3.一種接收方法,該接收方法用于接收進(jìn)行了編碼的、由聲音信號或音頻信號構(gòu)成的 處理對象信號,該接收方法的特征在于,所述接收方法執(zhí)行如下處理由解碼單元對到來的編碼處理對象信號進(jìn)行解碼;由樣本數(shù)變換單元根據(jù)從外部提供的要素數(shù)變換信息,對解碼后的每單位時間的信號 樣本數(shù)進(jìn)行變換;以及由頻率分布變換單元根據(jù)從外部提供的頻率分布變換信息,對頻率分布進(jìn)行變換。
4.根據(jù)權(quán)利要求3所述的接收方法,其特征在于, 所述接收方法還執(zhí)行如下處理由到來樣本數(shù)測量單元對從相對裝置到來的每規(guī)定時間的編碼處理對象信號的樣本 數(shù)進(jìn)行測量;以及由控制信息生成單元根據(jù)測量出的樣本數(shù),生成所述要素數(shù)變換信息和所述頻率分布 變換信息。
5.一種接收程序,該接收程序用于接收進(jìn)行了編碼的、由聲音信號或音頻信號構(gòu)成的 處理對象信號,該接收程序的特征在于, 所述接收程序使計算機(jī)執(zhí)行如下單元的功能 解碼單元,其對到來的編碼處理對象信號進(jìn)行解碼;樣本數(shù)變換單元,其根據(jù)從外部提供的要素數(shù)變換信息,對解碼后的每單位時間的信 號樣本數(shù)進(jìn)行變換;以及頻率分布變換單元,其根據(jù)從外部提供的頻率分布變換信息,變換頻率分布。
6.根據(jù)權(quán)利要求5所述的接收程序,其特征在于,所述接收程序使計算機(jī)還執(zhí)行如下 單元的功能到來樣本數(shù)測量單元,其對從相對裝置到來的每規(guī)定時間的編碼處理對象信號的樣本 數(shù)進(jìn)行測量;以及控制信息生成單元,其根據(jù)由所述到來樣本數(shù)測量單元測量出的樣本數(shù),生成所述要素數(shù)變換信息和所述頻率分布變換信息。
全文摘要
本發(fā)明提供一種接收裝置、方法及程序,該接收裝置可以抑制音質(zhì)的劣化和變化的同時,吸收與發(fā)送裝置之間的動作時鐘頻率的差異。本發(fā)明涉及用于接收進(jìn)行了編碼的、由聲音信號或音頻信號構(gòu)成的處理對象信號的接收裝置。該接收裝置的特征在于,包括解碼單元,其對到來的編碼處理對象信號進(jìn)行解碼;樣本數(shù)變換單元,其根據(jù)從外部提供的要素數(shù)變換信息,變換解碼后的每單位時間的信號樣本數(shù);以及頻率分布變換單元,其根據(jù)從外部提供的頻率分布變換信息,變換頻率分布。
文檔編號G10L19/00GK101847408SQ20091022460
公開日2010年9月29日 申請日期2009年11月20日 優(yōu)先權(quán)日2009年3月23日
發(fā)明者青柳弘美 申請人:沖電氣工業(yè)株式會社