專利名稱:語(yǔ)音處理裝置、語(yǔ)音處理方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語(yǔ)音處理裝置、語(yǔ)音處理方法和程序。
背景技術(shù):
在過(guò)去,已知一種抑制包括噪聲的輸入語(yǔ)音中的噪聲的技術(shù)(例如,日本專利第 3484112號(hào)和第4M7037號(hào))。根據(jù)日本專利第3484112號(hào),檢測(cè)從多個(gè)麥克風(fēng)獲得的信號(hào)的方向性,并根據(jù)檢測(cè)結(jié)果通過(guò)執(zhí)行譜減法來(lái)抑制噪聲。此外,根據(jù)日本專利第4M7037 號(hào),在處理多聲道之后,通過(guò)使用聲道之間的互相關(guān)(mutual correlation)來(lái)抑制噪聲。
發(fā)明內(nèi)容
然而,在日本專利第3484112號(hào)中,由于在頻域中執(zhí)行處理,因而存在這樣的問(wèn)題如果應(yīng)付在非常短的時(shí)間段內(nèi)集中的諸如操作聲音的噪聲,則由于噪聲的不均勻性 (disparity)在整個(gè)頻率中展開而不能充分地抑制噪聲。此外,在日本專利第4M7037號(hào)中,通過(guò)使用擴(kuò)展的互相關(guān)在頻域中修改功率譜并執(zhí)行處理以便于抑制偶發(fā)噪聲,但是存在這樣的問(wèn)題類似于日本專利第3484112號(hào),對(duì)于諸如操作聲音的非常短的信號(hào),不能充分地抑制噪聲。從該意義上說(shuō),本發(fā)明考慮了這些問(wèn)題,并且本發(fā)明期望提供一種新型和改進(jìn)的語(yǔ)音處理裝置、語(yǔ)音處理方法和程序,其使得能夠檢測(cè)噪聲在非常短的時(shí)間段內(nèi)集中且產(chǎn)生不均勻性的時(shí)間區(qū)間,從而充分地抑制噪聲。為了解決該問(wèn)題,根據(jù)本發(fā)明的實(shí)施例,提供了一種語(yǔ)音處理裝置,包括區(qū)間檢測(cè)單元,其從輸入信號(hào)檢測(cè)包括語(yǔ)音信號(hào)的語(yǔ)音區(qū)間或包括除了語(yǔ)音信號(hào)之外的非穩(wěn)定的信號(hào)的非穩(wěn)定聲音區(qū)間;以及濾波器計(jì)算單元,其根據(jù)區(qū)間檢測(cè)單元的檢測(cè)結(jié)果來(lái)計(jì)算用于保持語(yǔ)音區(qū)間中的語(yǔ)音信號(hào)和用于抑制非穩(wěn)定聲音區(qū)間中的非穩(wěn)定的信號(hào)的濾波器系數(shù),其中,濾波器計(jì)算單元通過(guò)將在非穩(wěn)定聲音區(qū)間中計(jì)算出的濾波器系數(shù)用于語(yǔ)音區(qū)間并將在語(yǔ)音區(qū)間中計(jì)算出的濾波器系數(shù)用于非穩(wěn)定聲音區(qū)間來(lái)計(jì)算濾波器系數(shù)。此外,語(yǔ)音處理裝置還包括記錄單元,其將濾波器計(jì)算單元中計(jì)算出的濾波器系數(shù)的信息針對(duì)每個(gè)區(qū)間地記錄在存儲(chǔ)單元中,濾波器計(jì)算單元可以通過(guò)使用在語(yǔ)音區(qū)間中記錄的非穩(wěn)定聲音區(qū)間的濾波器系數(shù)的信息和在非穩(wěn)定聲音區(qū)間中記錄的語(yǔ)音區(qū)間的濾波器系數(shù)的信息來(lái)計(jì)算濾波器系數(shù)。濾波器計(jì)算單元可以計(jì)算用于輸出使得輸入信號(hào)被保持在語(yǔ)音區(qū)間中的信號(hào)的濾波器系數(shù),并計(jì)算用于輸出使得輸入信號(hào)在非穩(wěn)定聲音區(qū)間中為零的信號(hào)的濾波器系數(shù)。此外,根據(jù)該實(shí)施例,語(yǔ)音處理裝置包括特征量計(jì)算單元,其計(jì)算語(yǔ)音區(qū)間中的語(yǔ)音信號(hào)的特征量和非穩(wěn)定聲音區(qū)間中的非穩(wěn)定聲音信號(hào)的特征量,并且濾波器計(jì)算單元可以通過(guò)使用語(yǔ)音區(qū)間中的非穩(wěn)定聲音信號(hào)的特征量并使用非穩(wěn)定聲音區(qū)間中的語(yǔ)音信號(hào)的特征量來(lái)計(jì)算濾波器系數(shù)。
此外,區(qū)間檢測(cè)單元可以檢測(cè)包括語(yǔ)音信號(hào)或除了非穩(wěn)定的信號(hào)之外的穩(wěn)定的信號(hào)的穩(wěn)定聲音區(qū)間,并且濾波器計(jì)算單元計(jì)算用于抑制穩(wěn)定聲音區(qū)間中的穩(wěn)定的信號(hào)的濾波器系數(shù)。此外,特征量計(jì)算單元可以計(jì)算穩(wěn)定聲音區(qū)間中的穩(wěn)定聲音信號(hào)的特征量。此外,濾波器計(jì)算單元可以通過(guò)在語(yǔ)音區(qū)間中使用非穩(wěn)定聲音信號(hào)的特征量和穩(wěn)定聲音信號(hào)的特征量、在非穩(wěn)定聲音區(qū)間中使用語(yǔ)音信號(hào)的特征量、以及在穩(wěn)定聲音區(qū)間中使用語(yǔ)音信號(hào)的特征量來(lái)計(jì)算濾波器系數(shù)。此外,根據(jù)該實(shí)施例,語(yǔ)音處理裝置包括驗(yàn)證單元,其驗(yàn)證濾波器計(jì)算單元計(jì)算出的濾波器系數(shù)的約束條件,其中,驗(yàn)證單元可以基于特征量計(jì)算單元計(jì)算出的每個(gè)區(qū)間中的特征量來(lái)驗(yàn)證濾波器系數(shù)的約束條件。此外,驗(yàn)證單元可以基于非穩(wěn)定聲音區(qū)間中的非穩(wěn)定聲音信號(hào)的抑制量和穩(wěn)定聲音區(qū)間中的穩(wěn)定聲音信號(hào)的抑制量是否等于或小于預(yù)定閾值的確定來(lái)驗(yàn)證語(yǔ)音區(qū)間中的濾波器系數(shù)的約束條件。此外,驗(yàn)證單元可以基于語(yǔ)音區(qū)間中的語(yǔ)音信號(hào)的劣化量是否等于或大于預(yù)定閾值的確定來(lái)驗(yàn)證非穩(wěn)定聲音區(qū)間中的濾波器系數(shù)的約束條件。此外,驗(yàn)證單元可以基于語(yǔ)音區(qū)間中的語(yǔ)音信號(hào)的劣化量是否等于或大于預(yù)定閾值來(lái)驗(yàn)證穩(wěn)定聲音區(qū)間中的濾波器系數(shù)的約束條件。此外,為了解決上述問(wèn)題,根據(jù)本發(fā)明的另一實(shí)施例,提供了一種語(yǔ)音處理方法, 包括以下步驟從輸入信號(hào)檢測(cè)包括語(yǔ)音信號(hào)的語(yǔ)音區(qū)間或包括除了語(yǔ)音信號(hào)之外的非穩(wěn)定的信號(hào)的非穩(wěn)定聲音區(qū)間;以及根據(jù)檢測(cè)結(jié)果,通過(guò)將在非穩(wěn)定聲音區(qū)間中計(jì)算出的濾波器系數(shù)用于語(yǔ)音區(qū)間來(lái)保持語(yǔ)音信號(hào),并通過(guò)將在語(yǔ)音區(qū)間中計(jì)算出的濾波器系數(shù)用于非穩(wěn)定聲音區(qū)間來(lái)抑制非穩(wěn)定的信號(hào)。此外,為了解決上述問(wèn)題,提供了一種使計(jì)算機(jī)用作語(yǔ)音處理裝置的程序,語(yǔ)音處理裝置包括區(qū)間檢測(cè)單元,其從輸入信號(hào)檢測(cè)包括語(yǔ)音信號(hào)的語(yǔ)音區(qū)間或包括除了語(yǔ)音信號(hào)之外的非穩(wěn)定的信號(hào)的非穩(wěn)定聲音區(qū)間;以及濾波器計(jì)算單元,其根據(jù)區(qū)間檢測(cè)單元的檢測(cè)結(jié)果計(jì)算用于保持語(yǔ)音區(qū)間中的語(yǔ)音信號(hào)和用于抑制非穩(wěn)定聲音區(qū)間中的非穩(wěn)定的信號(hào)的濾波器系數(shù),并且濾波器計(jì)算單元通過(guò)將在非穩(wěn)定聲音區(qū)間中計(jì)算出的濾波器系數(shù)用于語(yǔ)音區(qū)間并將在語(yǔ)音區(qū)間中計(jì)算出的濾波器系數(shù)用于非穩(wěn)定聲音區(qū)間來(lái)計(jì)算濾波器系數(shù)。
圖1是示出根據(jù)本發(fā)明的第一實(shí)施例的概況的說(shuō)明圖;圖2是示出根據(jù)該實(shí)施例的語(yǔ)音處理裝置的功能組成的框圖;圖3是示出根據(jù)該實(shí)施例的耳機(jī)的外觀的說(shuō)明圖;圖4是示出根據(jù)該實(shí)施例的語(yǔ)音檢測(cè)單元的功能組成的框圖;圖5是示出根據(jù)該實(shí)施例的語(yǔ)音檢測(cè)處理的流程圖;圖6是示出根據(jù)該實(shí)施例的操作聲音檢測(cè)單元的功能組成的框圖;圖7是示出根據(jù)該實(shí)施例的操作聲音區(qū)間中的頻率性質(zhì)的說(shuō)明圖;圖8是示出根據(jù)該實(shí)施例的操作聲音檢測(cè)處理的流程圖9是示出根據(jù)該實(shí)施例的操作聲音檢測(cè)處理的流程圖10是示出根據(jù)該實(shí)施例的濾波器計(jì)算單元的功能組成的框圖11是示出根據(jù)該實(shí)施例的濾波器系數(shù)的計(jì)算處理的流程圖12是示出根據(jù)該實(shí)施例的語(yǔ)音區(qū)間和操作聲音區(qū)間的說(shuō)明圖13是示出根據(jù)該實(shí)施例的濾波器計(jì)算單元的功能組成的框圖14是示出根據(jù)該實(shí)施例的濾波器系數(shù)的計(jì)算處理的流程圖15是示出根據(jù)該實(shí)施例的特征量計(jì)算單元的功能組成的框圖16是示出根據(jù)該實(shí)施例的特征量計(jì)算處理的流程圖17是示出根據(jù)該實(shí)施例的特征量計(jì)算單元的詳細(xì)操作的流程圖18是示出根據(jù)本發(fā)明的第二實(shí)施例的語(yǔ)音處理裝置的功能組成的框圖19是示出根據(jù)該實(shí)施例的特征量計(jì)算處理的流程圖20是示出根據(jù)該實(shí)施例的特征量計(jì)算處理的流程圖21是示出根據(jù)該實(shí)施例的濾波器計(jì)算處理的流程圖22是示出根據(jù)本發(fā)明的第三實(shí)施例的語(yǔ)音處理裝置的功能組成的框圖23是示出根據(jù)該實(shí)施例的約束條件驗(yàn)證單元的功能的框圖24是示出根據(jù)該實(shí)施例的約束條件驗(yàn)證處理的流程圖25是示出根據(jù)該實(shí)施例的約束條件驗(yàn)證處理的流程圖26是示出根據(jù)本發(fā)明的第四實(shí)施例的語(yǔ)音處理裝置的功能組成的框圖27是示出根據(jù)本發(fā)明的第五實(shí)施例的語(yǔ)音處理裝置的功能組成的框圖;以及
圖28是示出根據(jù)本發(fā)明的第六實(shí)施例的語(yǔ)音處理裝置的功能組成的框圖。
具體實(shí)施例方式下文中,將參照附圖來(lái)詳細(xì)描述本發(fā)明的示例性實(shí)施例。在本說(shuō)明書和附圖中,將向?qū)嶋H上具有相同功能組成的構(gòu)成元件提供相同的附圖標(biāo)記,并且將不重復(fù)其重疊描述。此外,將根據(jù)以下順序描述“優(yōu)選實(shí)施例”。1.實(shí)施例的目的2.第一實(shí)施例3.第二實(shí)施例4.第三實(shí)施例5.第四實(shí)施例6.第五實(shí)施例7.第六實(shí)施例<1.實(shí)施例的目的〉首先,將描述實(shí)施例的目的。在過(guò)去,已經(jīng)披露了用于抑制輸入有噪聲的輸入語(yǔ)音中的噪聲的技術(shù)(例如,日本專利第3484112號(hào)和第4247037號(hào))。根據(jù)日本專利第3484112 號(hào),檢測(cè)從多個(gè)麥克風(fēng)獲得的信號(hào)的方向性,并根據(jù)檢測(cè)結(jié)果通過(guò)執(zhí)行譜減法來(lái)抑制噪聲。 此外,根據(jù)日本專利第4247037號(hào),在處理多聲道之后,通過(guò)使用聲道之間的互相關(guān)來(lái)抑制噪聲。然而,在日本專利第3484112號(hào)中,由于在頻域中執(zhí)行處理,因而存在這樣的問(wèn)題如果應(yīng)付在非常短的時(shí)間段內(nèi)集中的諸如操作聲音的噪聲,則由于噪聲的不均勻性在整個(gè)頻率中展開,不能充分地抑制噪聲。此外,在日本專利第4M7037號(hào)中,通過(guò)使用擴(kuò)展的互相關(guān)在頻域中修改功率譜并執(zhí)行處理以便于抑制偶發(fā)噪聲,但是存在這樣的問(wèn)題類似于日本專利第3484112號(hào),對(duì)于諸如操作聲音的非常短的信號(hào),不能充分地抑制噪聲。因此,考慮使用多個(gè)麥克風(fēng)通過(guò)時(shí)域處理來(lái)抑制噪聲。例如,用于僅拾取噪聲的麥克風(fēng)(噪聲麥克風(fēng))被設(shè)置在與用于拾取語(yǔ)音的麥克風(fēng)(主麥克風(fēng))的位置不同的位置處。 在該情況下,可以通過(guò)從主麥克風(fēng)的信號(hào)中減去噪聲麥克風(fēng)的信號(hào)來(lái)去除噪聲。然而,由于麥克風(fēng)的位置不同,包含在主麥克風(fēng)中的噪聲信號(hào)和包含在噪聲麥克風(fēng)中的噪聲信號(hào)不等同。因此,當(dāng)不出現(xiàn)語(yǔ)音時(shí)執(zhí)行學(xué)習(xí),并使這兩個(gè)語(yǔ)音信號(hào)彼此對(duì)應(yīng)。在上述技術(shù)中,需要將兩個(gè)麥克風(fēng)彼此分離得足夠遠(yuǎn),使得語(yǔ)音不被輸入到噪聲麥克風(fēng),但是在該情況下,用于使噪聲信號(hào)彼此對(duì)應(yīng)的學(xué)習(xí)不是容易的,從而惡化了噪聲抑制的性能。此外,如果兩個(gè)麥克風(fēng)變得彼此較近,則語(yǔ)音被包括在噪聲麥克風(fēng)中,從而語(yǔ)音分量因從主麥克風(fēng)的信號(hào)中減去噪聲麥克風(fēng)的信號(hào)而劣化。以下例示了用于在從所有的麥克風(fēng)獲得語(yǔ)音和噪聲的狀態(tài)下抑制噪聲的方法。(I)Adaptive Microphone-Array System for Noise Reduction (AMNOR)(用于噪聲降低的自適應(yīng)麥克風(fēng)陣列系統(tǒng)),Yutaka Kaneda等人,IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP-34, No. 6,1986 年 12 月。(2) An Alternative Approach to Linear 1 y Constrained Adaptive Beamforming, Lloyd J.Griffiths 等人’ IEEE Transaction on Antennas and Propagation, Vol. AP-30,No. 1,1982 年 1 月。將通過(guò)例示上述的(1)號(hào)中提供的AMNOR方法來(lái)提供描述。在AMNOR方法中,在沒(méi)有目標(biāo)聲音的區(qū)間中執(zhí)行濾波器系數(shù)H的學(xué)習(xí)。此刻,執(zhí)行該學(xué)習(xí),使得語(yǔ)音分量的劣化減輕在特定水平內(nèi)。當(dāng)AMNOR方法被應(yīng)用于操作聲音的抑制時(shí),發(fā)現(xiàn)如下兩點(diǎn)。(1)當(dāng)在長(zhǎng)時(shí)間段中出現(xiàn)的噪聲來(lái)自于固定方向時(shí),AMNOR方法非常有效。然而, 濾波器的學(xué)習(xí)未被充分執(zhí)行,這是因?yàn)椴僮髀曇羰莾H在短時(shí)間段中出現(xiàn)的非穩(wěn)定聲音,并且鼠標(biāo)和鍵盤的聲音依賴于它們各自的不同位置而來(lái)自于不同方向。(2)出于控制目標(biāo)聲音劣化的目的,在總是包括噪聲的情況下,AMNOR方法在噪聲抑制方面非常有效,但是操作聲音和語(yǔ)音不穩(wěn)定地重疊,因而該方法可能使目標(biāo)語(yǔ)音的質(zhì)量進(jìn)一步劣化。因此,關(guān)注于以上環(huán)境,并創(chuàng)建了根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音處理裝置。在根據(jù)該實(shí)施例的語(yǔ)音處理裝置中,檢測(cè)噪聲不均勻地在非常短的時(shí)間段內(nèi)集中的時(shí)間區(qū)間,從而充分地抑制噪聲。更具體地,在時(shí)間區(qū)間中執(zhí)行處理以便于抑制在非常短的時(shí)間段內(nèi)不穩(wěn)定且不均勻地集中的噪聲(下文中,其可以通過(guò)被稱作操作聲音來(lái)描述)。此外,多個(gè)麥克風(fēng)被用于在多個(gè)位置出現(xiàn)的操作聲音,并通過(guò)使用聲音的方向來(lái)執(zhí)行抑制。此外,為了響應(yīng)于多樣化的輸入裝置中的操作聲音,根據(jù)輸入信號(hào)來(lái)自適應(yīng)地獲取抑制濾波器。此外,執(zhí)行濾波器的學(xué)習(xí),用于還改善具有語(yǔ)音的區(qū)間中的聲音質(zhì)量。<2.第一實(shí)施例>接下來(lái),將描述第一實(shí)施例。首先,將參照?qǐng)D1來(lái)描述第一實(shí)施例的概況。該實(shí)施例的目的在于抑制例如在語(yǔ)音聊天期間被并入到所傳送的語(yǔ)音中的非穩(wěn)定噪聲。如圖1中所示,假設(shè)用戶IOA和IOB分別使用PC等進(jìn)行語(yǔ)音聊天。此時(shí),當(dāng)用戶IOB傳送語(yǔ)音時(shí),從
鼠標(biāo)、鍵盤等的操作出現(xiàn)的“滴答滴答”的操作聲音連同說(shuō)出“火車的時(shí)間是......”的語(yǔ)
音一起被輸入。如圖1的附圖標(biāo)記50所示,操作聲音不是總與語(yǔ)音重疊。此外,由于引起操作聲音的鍵盤、鼠標(biāo)等的位置改變,噪聲的出現(xiàn)位置改變。此外,由于來(lái)自鍵盤、鼠標(biāo)等的操作聲音依賴于設(shè)備的種類而不同,因而存在各種操作聲音。因此,在該實(shí)施例中,從輸入信號(hào)中檢測(cè)語(yǔ)音的區(qū)間和作為鼠標(biāo)、鍵盤等的非穩(wěn)定聲音的操作聲音的區(qū)間,并且通過(guò)采用每個(gè)區(qū)間中的最佳處理來(lái)高效地抑制噪聲。此外,處理并非依賴于所檢測(cè)的區(qū)間而不連續(xù)地轉(zhuǎn)換,而是當(dāng)語(yǔ)音開始時(shí),連貫地轉(zhuǎn)換處理以減少不適。而且,通過(guò)在每個(gè)區(qū)間中執(zhí)行處理并且隨后使用語(yǔ)音的劣化量和噪聲抑制量,控制最終的聲音質(zhì)量是可能的。在上文中已描述了該實(shí)施例的概況。接下來(lái),將參照?qǐng)D2描述語(yǔ)音處理裝置100 的功能組成。圖2是示出語(yǔ)音處理裝置100的功能組成的框圖。如圖2中所示,語(yǔ)音處理裝置100配備有語(yǔ)音檢測(cè)單元102、操作聲音檢測(cè)單元104、濾波器計(jì)算單元106、濾波器單元108等。語(yǔ)音檢測(cè)單元102和操作聲音檢測(cè)單元104是本發(fā)明的區(qū)間檢測(cè)單元的示例。語(yǔ)音檢測(cè)單元102具有從輸入信號(hào)中檢測(cè)包含語(yǔ)音信號(hào)的語(yǔ)音區(qū)間的功能。對(duì)于輸入信號(hào), 如圖3中所示,在耳機(jī)20中使用兩個(gè)麥克風(fēng),并且在耳機(jī)的嘴部分中提供麥克風(fēng)21而在耳機(jī)的耳部分中提供麥克風(fēng)22。此處,將參照?qǐng)D4來(lái)描述語(yǔ)音檢測(cè)單元102的語(yǔ)音檢測(cè)的功能。如圖4中所示,語(yǔ)音檢測(cè)單元102包括計(jì)算部112、比較/確定部114、保持部116等。計(jì)算部112計(jì)算從這兩個(gè)麥克風(fēng)輸入的輸入能量,并計(jì)算輸入能量之間的差。比較/確定部114將計(jì)算的輸入能量之間的差與預(yù)定閾值比較,并根據(jù)比較結(jié)果確定是否存在語(yǔ)音。然后,比較/確定部114 向特征量計(jì)算單元110和濾波器計(jì)算單元106提供關(guān)于語(yǔ)音的存在/不存在的控制信號(hào)。接下來(lái),將參照?qǐng)D5來(lái)描述語(yǔ)音檢測(cè)單元102進(jìn)行的語(yǔ)音檢測(cè)處理。圖5是示出語(yǔ)音檢測(cè)單元102進(jìn)行的語(yǔ)音檢測(cè)處理的流程圖。如圖5中所示,首先,針對(duì)在耳機(jī)中提供的兩個(gè)麥克風(fēng)計(jì)算每個(gè)麥克風(fēng)的輸入能量(E1和E2) (S102)。通過(guò)下面給出的數(shù)學(xué)表達(dá)式來(lái)計(jì)算輸入能量。xdt)表示在時(shí)間t期間在麥克風(fēng)i中觀察到的信號(hào)。換句話說(shuō),表達(dá)式 1表示區(qū)間LpL2中的信號(hào)的能量。[表達(dá)式1]
權(quán)利要求
1.一種語(yǔ)音處理裝置,包括區(qū)間檢測(cè)單元,其從輸入信號(hào)檢測(cè)包括語(yǔ)音信號(hào)的語(yǔ)音區(qū)間或包括除了所述語(yǔ)音信號(hào)之外的非穩(wěn)定信號(hào)的非穩(wěn)定聲音區(qū)間;以及濾波器計(jì)算單元,其根據(jù)所述區(qū)間檢測(cè)單元的檢測(cè)結(jié)果來(lái)計(jì)算用于保持所述語(yǔ)音區(qū)間中的所述語(yǔ)音信號(hào)和用于抑制所述非穩(wěn)定聲音區(qū)間中的所述非穩(wěn)定信號(hào)的濾波器系數(shù),其中,所述濾波器計(jì)算單元通過(guò)將在所述非穩(wěn)定聲音區(qū)間中計(jì)算出的濾波器系數(shù)用于所述語(yǔ)音區(qū)間并將在所述語(yǔ)音區(qū)間中計(jì)算出的濾波器系數(shù)用于所述非穩(wěn)定聲音區(qū)間來(lái)計(jì)算所述濾波器系數(shù)。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音處理裝置,還包括記錄單元,其將所述濾波器計(jì)算單元中計(jì)算出的所述濾波器系數(shù)的信息針對(duì)每個(gè)區(qū)間地記錄在存儲(chǔ)單元中,其中,所述濾波器計(jì)算單元通過(guò)使用在所述語(yǔ)音區(qū)間中記錄的非穩(wěn)定聲音區(qū)間的濾波器系數(shù)的信息和在所述非穩(wěn)定聲音區(qū)間中記錄的語(yǔ)音區(qū)間的濾波器系數(shù)的信息來(lái)計(jì)算濾波器系數(shù)。
3.根據(jù)權(quán)利要求1所述的語(yǔ)音處理裝置,其中,所述濾波器計(jì)算單元計(jì)算用于輸出使得所述輸入信號(hào)被保持在所述語(yǔ)音區(qū)間中的信號(hào)的濾波器系數(shù),并計(jì)算用于輸出使得所述輸入信號(hào)在所述非穩(wěn)定聲音區(qū)間中為零的信號(hào)的濾波器系數(shù)。
4.根據(jù)權(quán)利要求1所述的聲音處理裝置,還包括特征量計(jì)算單元,其計(jì)算所述語(yǔ)音區(qū)間中的所述語(yǔ)音信號(hào)的所述特征量和所述非穩(wěn)定聲音區(qū)間中的所述非穩(wěn)定聲音信號(hào)的所述特征量,其中,所述濾波器計(jì)算單元通過(guò)使用所述語(yǔ)音區(qū)間中的所述非穩(wěn)定信號(hào)的所述特征量并使用所述非穩(wěn)定聲音區(qū)間中的所述語(yǔ)音信號(hào)的所述特征量來(lái)計(jì)算所述濾波器系數(shù)。
5.根據(jù)權(quán)利要求1所述的語(yǔ)音處理裝置,其中,所述區(qū)間檢測(cè)單元檢測(cè)包括所述語(yǔ)音信號(hào)或除了所述非穩(wěn)定信號(hào)之外的穩(wěn)定信號(hào)的穩(wěn)定聲音區(qū)間,以及其中,所述濾波器計(jì)算單元計(jì)算用于抑制所述穩(wěn)定聲音區(qū)間中的所述穩(wěn)定聲音信號(hào)的濾波器系數(shù)。
6.根據(jù)權(quán)利要求5所述的語(yǔ)音處理裝置,其中,所述特征量計(jì)算單元計(jì)算所述穩(wěn)定聲音區(qū)間中的所述穩(wěn)定聲音信號(hào)的所述特征量。
7.根據(jù)權(quán)利要求6所述的語(yǔ)音處理裝置,其中,所述濾波器計(jì)算單元通過(guò)在所述語(yǔ)音區(qū)間中使用所述非穩(wěn)定聲音信號(hào)的所述特征量和所述穩(wěn)定聲音信號(hào)的所述特征量、在所述非穩(wěn)定聲音區(qū)間中使用所述語(yǔ)音信號(hào)的所述特征量以及在所述穩(wěn)定聲音區(qū)間中使用所述語(yǔ)音信號(hào)的所述特征量來(lái)計(jì)算所述濾波器系數(shù)。
8.根據(jù)權(quán)利要求1所述的語(yǔ)音處理裝置,包括驗(yàn)證單元,其驗(yàn)證所述濾波器計(jì)算單元計(jì)算出的所述濾波器系數(shù)的約束條件,其中,所述驗(yàn)證單元基于所述特征量計(jì)算單元計(jì)算出的每個(gè)區(qū)間中的特征量來(lái)驗(yàn)證所述濾波器系數(shù)的約束條件。
9.根據(jù)權(quán)利要求8所述的語(yǔ)音處理裝置,其中,所述驗(yàn)證單元基于所述非穩(wěn)定聲音區(qū)間中的所述非穩(wěn)定聲音信號(hào)的抑制量和所述穩(wěn)定聲音區(qū)間中的所述穩(wěn)定聲音信號(hào)的抑制量是否等于或小于預(yù)定閾值的確定來(lái)驗(yàn)證所述語(yǔ)音區(qū)間中的所述濾波器系數(shù)的約束條件。
10.根據(jù)權(quán)利要求8所述的語(yǔ)音處理裝置,其中,所述驗(yàn)證單元基于所述語(yǔ)音區(qū)間中的所述語(yǔ)音信號(hào)的劣化量是否等于或大于預(yù)定閾值的確定來(lái)驗(yàn)證所述非穩(wěn)定聲音區(qū)間中的所述濾波器系數(shù)的約束條件。
11.根據(jù)權(quán)利要求8所述的語(yǔ)音處理裝置,其中,所述驗(yàn)證單元基于所述語(yǔ)音區(qū)間中的所述語(yǔ)音信號(hào)的劣化量是否等于或大于預(yù)定閾值來(lái)驗(yàn)證所述穩(wěn)定聲音區(qū)間中的所述濾波器系數(shù)的約束條件。
12.—種語(yǔ)音處理方法,包括以下步驟從輸入信號(hào)檢測(cè)包括語(yǔ)音信號(hào)的語(yǔ)音區(qū)間或包括除了所述語(yǔ)音信號(hào)之外的非穩(wěn)定信號(hào)的非穩(wěn)定聲音區(qū)間;以及根據(jù)檢測(cè)結(jié)果,通過(guò)將在所述非穩(wěn)定聲音區(qū)間中計(jì)算出的濾波器系數(shù)用于所述語(yǔ)音區(qū)間來(lái)保持所述語(yǔ)音信號(hào),并通過(guò)將在所述語(yǔ)音區(qū)間中計(jì)算出的濾波器系數(shù)用于所述非穩(wěn)定聲音區(qū)間來(lái)抑制所述非穩(wěn)定信號(hào)。
13.一種使計(jì)算機(jī)用作語(yǔ)音處理裝置的程序,所述語(yǔ)音處理裝置包括區(qū)間檢測(cè)單元,其從輸入信號(hào)檢測(cè)包括語(yǔ)音信號(hào)的語(yǔ)音區(qū)間或包括除了所述語(yǔ)音信號(hào)之外的非穩(wěn)定信號(hào)的非穩(wěn)定聲音區(qū)間;以及濾波器計(jì)算單元,其根據(jù)所述區(qū)間檢測(cè)單元的檢測(cè)結(jié)果計(jì)算用于保持所述語(yǔ)音區(qū)間中的所述語(yǔ)音信號(hào)和用于抑制所述非穩(wěn)定聲音區(qū)間中的所述非穩(wěn)定信號(hào)的濾波器系數(shù),其中,所述濾波器計(jì)算單元通過(guò)將在所述非穩(wěn)定聲音區(qū)間中計(jì)算出的濾波器系數(shù)用于所述語(yǔ)音區(qū)間并將在所述語(yǔ)音區(qū)間中計(jì)算出的濾波器系數(shù)用于所述非穩(wěn)定聲音區(qū)間來(lái)計(jì)算所述濾波器系數(shù)。
全文摘要
本發(fā)明涉及語(yǔ)音處理裝置、語(yǔ)音處理方法和程序。語(yǔ)音處理裝置包括區(qū)間檢測(cè)單元,其從輸入信號(hào)檢測(cè)包括語(yǔ)音信號(hào)的語(yǔ)音區(qū)間或包括除了語(yǔ)音信號(hào)之外的非穩(wěn)定信號(hào)的非穩(wěn)定聲音區(qū)間;以及濾波器計(jì)算單元,其根據(jù)區(qū)間檢測(cè)單元的檢測(cè)結(jié)果來(lái)計(jì)算用于保持語(yǔ)音區(qū)間中的語(yǔ)音信號(hào)和用于抑制非穩(wěn)定聲音區(qū)間中的非穩(wěn)定信號(hào)的濾波器系數(shù),其中,濾波器計(jì)算單元通過(guò)將在非穩(wěn)定聲音區(qū)間中計(jì)算出的濾波器系數(shù)用于語(yǔ)音區(qū)間并將在語(yǔ)音區(qū)間中計(jì)算出的濾波器系數(shù)用于非穩(wěn)定聲音區(qū)間來(lái)計(jì)算濾波器系數(shù)。
文檔編號(hào)G10L21/02GK102194463SQ20111006085
公開日2011年9月21日 申請(qǐng)日期2011年3月9日 優(yōu)先權(quán)日2010年3月16日
發(fā)明者關(guān)矢俊之, 安部素嗣 申請(qǐng)人:索尼公司