亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

拍攝裝置及噪音降低方法與流程

文檔序號(hào):11541857閱讀:311來源:國知局
拍攝裝置及噪音降低方法與流程
本發(fā)明涉及拍攝裝置、程序、記錄介質(zhì)和噪音降低方法。

背景技術(shù):
近年來,裝載動(dòng)態(tài)圖像攝影功能的拍攝裝置得到普及。一般地,動(dòng)態(tài)圖像的拍攝中發(fā)生的聲音中,可能包含噪音。例如,自動(dòng)聚焦透鏡的驅(qū)動(dòng)音等相當(dāng)于噪音。特別是,沒將動(dòng)態(tài)圖像攝影作為前提設(shè)計(jì)的透鏡鏡筒中,這樣的驅(qū)動(dòng)音很大,噪音也增大。因此,要進(jìn)行噪音降低處理。例如,存在將麥克風(fēng)拾取的音信號(hào)中包含的人物語音進(jìn)行強(qiáng)調(diào)提取,并區(qū)分包含人物語音的音信號(hào)(語音區(qū)間)以及不包含人物語音的音信號(hào)(非語音區(qū)間)的技術(shù)(VAD:VoiceActivityDetection,語音活動(dòng)檢測)(參照專利文獻(xiàn)1)。利用VAD,使用非語音區(qū)間的音信號(hào)計(jì)算推定噪音,從音信號(hào)去掉推定噪音,能抑制噪音(例如,專利文獻(xiàn)1參照)。還有,在能夠進(jìn)行動(dòng)態(tài)圖像攝影的拍攝裝置中進(jìn)行動(dòng)態(tài)圖像攝影時(shí),隨著自動(dòng)聚焦透鏡的驅(qū)動(dòng)部的操作發(fā)出的操作音(以下,稱為AF噪音)等的噪音通過麥克風(fēng)等的聚音裝置進(jìn)行聚音,混入拍攝對(duì)象發(fā)出的語音等的目的音,會(huì)損壞目的音的質(zhì)量。作為降低這樣的AF噪音的方法,提出取得在AF驅(qū)動(dòng)部的操作前輸入的語音信號(hào)的功率(POWER)值,通過基于這個(gè)語音信號(hào)的功率值控制(改變)基底(flooring)系數(shù)來降低噪音的方法(例如,參照專利文獻(xiàn)2)。現(xiàn)有技術(shù)文獻(xiàn)專利文獻(xiàn)專利文獻(xiàn)1:日本特開2009-294537號(hào)公報(bào)專利文獻(xiàn)2:日本特開2008-252389號(hào)公報(bào)然而,如專利文獻(xiàn)1那樣的語音區(qū)間和非語音區(qū)間中,若一概地從音信號(hào)去掉推定噪音,則在語音區(qū)間記錄的人物和/或?qū)櫸锏鹊膭?dòng)物的語音劣化。還有,在專利文獻(xiàn)2的噪音降低處理的場合,雖然能降低AF噪音,但另一面語音等的目的音劣化的可能性較高。

技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的課題在于提供能不引起語音等的目的音的劣化并適當(dāng)?shù)亟档驮胍舻呐臄z裝置、程序、記錄介質(zhì)及噪音降低方法。本發(fā)明根據(jù)以下的解決手段解決上述課題。根據(jù)本發(fā)明的第1方面,提供一種拍攝裝置,其特征在于,包括:動(dòng)態(tài)圖像拍攝部,進(jìn)行動(dòng)態(tài)圖像的拍攝;信號(hào)變換部,將上述動(dòng)態(tài)圖像的拍攝中發(fā)生的聲音變換為音信號(hào);拍攝對(duì)象判斷部,預(yù)測或識(shí)別特定的拍攝對(duì)象;噪音檢測部,檢測在上述動(dòng)態(tài)圖像的拍攝中發(fā)生的聲音包含的噪音;噪音降低部,從上述音信號(hào)降低噪音信號(hào);語音檢測部,從上述音信號(hào)檢測非噪音信號(hào);噪音降低性能變更部,在上述拍攝對(duì)象判斷部預(yù)測或識(shí)別特定的上述拍攝對(duì)象的場合,使基于上述噪音降低部的上述噪音信號(hào)的降低性能減小。上述噪音降低部基于噪音降低系數(shù),從上述音信號(hào)降低上述噪音信號(hào);在上述拍攝對(duì)象判斷部預(yù)測或識(shí)別特定的上述拍攝對(duì)象的場合,上述噪音降低性能變更部將上述噪音降低系數(shù)設(shè)定為比較小的低水平降低系數(shù),以使上述噪音信號(hào)的上述降低性能減小。在上述拍攝對(duì)象判斷部沒有預(yù)測或識(shí)別特定的上述拍攝對(duì)象的場合,上述噪音降低部將上述噪音降低系數(shù)設(shè)定為比上述低水平降低系數(shù)更大的通常水平降低系數(shù)。上述拍攝對(duì)象判斷部是基于上述動(dòng)態(tài)圖像拍攝部拍攝的影像信號(hào)識(shí)別上述拍攝對(duì)象的臉的存在的臉識(shí)別部。上述拍攝對(duì)象判斷部是對(duì)于每個(gè)預(yù)先準(zhǔn)備的多個(gè)攝影模式預(yù)測特定的上述拍攝對(duì)象的情景模式部。上述噪音檢測部通過至少檢測自動(dòng)聚焦的驅(qū)動(dòng)信號(hào),檢測上述噪音。上述語音檢測部,在上述音信號(hào)的頻率的下限閾值到上限閾值的范圍內(nèi),從上述音信號(hào)檢測非噪音信號(hào);在上述拍攝對(duì)象判斷部預(yù)測或識(shí)別特定的上述拍攝對(duì)象的場合,上述語音檢測部降低上述下限閾值,從第1下限閾值設(shè)定為第2下限閾值,以拓寬上述非噪音信號(hào)的檢測范圍。在上述拍攝對(duì)象判斷部沒有預(yù)測或識(shí)別特定的上述拍攝對(duì)象的場合,上述語音檢測部將上述下限閾值設(shè)定為上述第1下限閾值。根據(jù)本發(fā)明的第2方面,提供一種用于使計(jì)算機(jī)作為以下部件起作用的程序,其特征在于,所述部件包括:拍攝對(duì)象判斷部,預(yù)測或識(shí)別特定的拍攝對(duì)象;噪音降低部,從動(dòng)態(tài)圖像的拍攝中發(fā)生的聲音相對(duì)應(yīng)的音信號(hào)降低噪音信號(hào);語音檢測部,從上述音信號(hào)檢測人或動(dòng)物的語音信號(hào);和噪音降低性能變更部,在上述拍攝對(duì)象判斷部預(yù)測或識(shí)別特定的上述拍攝對(duì)象的場合,使基于上述噪音降低部的上述噪音信號(hào)的降低性能減小。根據(jù)本發(fā)明的第3方面,提供一種記錄用于使計(jì)算機(jī)作為以下部件起作用的程序的能夠計(jì)算機(jī)讀取的記錄介質(zhì),其特征在于,所述部件包括:拍攝對(duì)象判斷部,預(yù)測或識(shí)別特定的拍攝對(duì)象;噪音降低部,從動(dòng)態(tài)圖像的拍攝中發(fā)生的聲音相對(duì)應(yīng)的音信號(hào)降低噪音信號(hào);語音檢測部,從上述音信號(hào)檢測人或動(dòng)物的語音信號(hào);和噪音降低性能變更部,在上述拍攝對(duì)象判斷部預(yù)測或識(shí)別特定的上述拍攝對(duì)象的場合,使基于上述噪音降低部的上述噪音信號(hào)的降低性能減小。根據(jù)本發(fā)明的第4方面,提供一種噪音降低方法,其特征在于,包括以下步驟:進(jìn)行動(dòng)態(tài)圖像的拍攝;將上述動(dòng)態(tài)圖像的拍攝中發(fā)生的聲音變換為音信號(hào);預(yù)測或識(shí)別特定的拍攝對(duì)象;檢測在上述動(dòng)態(tài)圖像的拍攝中發(fā)生的聲音包含的噪音;從上述音信號(hào)降低噪音信號(hào);從上述音信號(hào)檢測人或動(dòng)物的語音信號(hào);在預(yù)測或識(shí)別特定的拍攝對(duì)象的場合,使上述噪音信號(hào)的降低性能減小。根據(jù)本發(fā)明的第5方面,提供一種拍攝裝置,其特征在于,包括:聚音裝置;語音區(qū)間檢測部,從上述聚音裝置聚音的聲音信息檢測語音區(qū)間;噪音降低處理部,基于上述語音區(qū)間檢測部的檢測結(jié)果,進(jìn)行不同的噪音降低處理。包括:噪音定時(shí)檢測部,從該拍攝裝置內(nèi)的驅(qū)動(dòng)部的操作信息檢測操作噪音的發(fā)生定時(shí),上述噪音降低處理部基于上述噪音定時(shí)檢測部的檢測結(jié)果,進(jìn)行不同的噪音降低處理。上述噪音降低處理部,在由上述語音區(qū)間檢測部檢測語音區(qū)間的場合,進(jìn)行比上述語音區(qū)間檢測部檢測非語音區(qū)間的場合更弱的低的第1噪音降低處理。上述噪音降低處理部從上述語音區(qū)間檢測部判定為非語音區(qū)間的場合的聲音信息推定噪音,進(jìn)行將該推定的噪音從推定噪音減法前聲音信息減去的第2噪音降低處理。上述噪音降低處理部從上述語音區(qū)間檢測部判定為非語音區(qū)間的場合的聲音信息求基底譜,使用該基底譜對(duì)基底處理前聲音信息進(jìn)行基底處理?;谏鲜稣Z音區(qū)間檢測部的語音區(qū)間的檢測提出語音波形的一部分求自相關(guān)函數(shù),使用其求得的自相關(guān)函數(shù)的峰值進(jìn)行檢測。根據(jù)本發(fā)明的第6方面,提供一種拍攝裝置的噪音降低方法,其特征在于,包括以下步驟:從聚音的聲音信息檢測語音區(qū)間;基于語音區(qū)間的檢測結(jié)果,進(jìn)行不同的噪音降低處理。從上述拍攝裝置內(nèi)的驅(qū)動(dòng)部的操作信息檢測操作噪音的發(fā)生定時(shí);基于操作噪音的發(fā)生定時(shí)的檢測結(jié)果,進(jìn)行不同的噪音降低處理。在檢測為語音區(qū)間的場合,進(jìn)行比檢測為非語音區(qū)間的場合更弱的第1噪音降低處理。從判定為非語音區(qū)間的場合的聲音信息推定噪音;將該推定的噪音進(jìn)行第2噪音降低處理,即從推定噪音減去前的聲音信息進(jìn)行減法運(yùn)算。從判定為非語音區(qū)間的場合的聲音信息求基底譜,使用該基底譜對(duì)基底處理前聲音信息進(jìn)行基底處理。語音區(qū)間的檢測是提出語音波形的一部分求得自相關(guān)函數(shù),使用其求得的自相關(guān)函數(shù)的峰值來檢測。發(fā)明的效果根據(jù)本發(fā)明,提供能不引起語音等的目的音的劣化并適當(dāng)?shù)亟档驮胍舻呐臄z裝置、程序、記錄介質(zhì)及噪音降低方法。附圖說明圖1是本發(fā)明的第1實(shí)施方式涉及的相機(jī)的整體方塊圖。圖2是表示由圖1所示的相機(jī)進(jìn)行動(dòng)態(tài)圖像攝影時(shí)主體CPU檢測聲音時(shí)的處理的流程圖。圖3是用時(shí)間軸表示由圖1所示的相機(jī)進(jìn)行動(dòng)態(tài)圖像攝影的場合發(fā)生的聲音和主體CPU檢測的音信號(hào)的概念圖。圖4是表示語音區(qū)間檢測的一個(gè)例子的概念圖。圖5是表示噪音降低處理的流程圖。圖6是表示用本發(fā)明的第2實(shí)施方式涉及的噪音降低方法進(jìn)行一般噪音的降低處理的場合的處理階段和處理后的波形的概念圖。圖7是表示本發(fā)明的第3實(shí)施方式的相機(jī)的構(gòu)成的方塊圖。圖8是語音波形圖。圖9是說明語音波形的自相關(guān)函數(shù)的圖。圖10A是利用自相關(guān)函數(shù)檢測語音區(qū)間的場合的一個(gè)例子,即麥克風(fēng)的輸出波形。圖10B是利用自相關(guān)函數(shù)檢測語音區(qū)間的場合的一個(gè)例子,即將閾值設(shè)定為自相關(guān)函數(shù)的峰值,作為High(高)表示閾值以上的部分的波形。圖11是說明基于噪音定時(shí)檢測部的操作噪音的發(fā)生定時(shí)檢測的細(xì)節(jié)的圖。圖12是表示噪音降低處理操作的流程的流程圖。圖13是說明成為噪音降低處理的對(duì)象的第1處理對(duì)象聲音的形態(tài)的概略圖。圖14是表示區(qū)間A的譜的圖。圖15是表示區(qū)間B的譜的圖。圖16是表示區(qū)間C的譜的圖。圖17是表示推定噪聲譜的圖。圖18是表示從區(qū)間C的譜減去噪音的譜的圖。圖19是表示使用基底譜A的基底處理后的譜的圖。圖20是表示基底譜A的圖。圖21是表示基底譜B的圖。圖22是表示使用基底譜B的基底處理后的譜的圖。圖23是說明成為噪音降低處理的對(duì)象的第2處理對(duì)象聲音的形態(tài)的概略圖。圖24是表示區(qū)間E的背景聲音和噪音的譜的圖。圖25是表示使用區(qū)間E的譜的推定噪音的圖。圖26是表示區(qū)間F的譜的圖。圖27是表示使用區(qū)間E的推定噪音進(jìn)行基底處理之后的譜的圖。圖28是表示使用區(qū)間F的譜的推定噪音的圖。圖29是表示使用區(qū)間F的推定噪音進(jìn)行基底處理之后的譜的圖。符號(hào)的說明3:相機(jī),16:拍攝元件,43:麥克風(fēng),44:攝影模式切換開關(guān),51:臉識(shí)別處理部,52:VAD處理部,t1:第1下限閾值,t2:第2下限閾值,53:噪音檢測部,54:噪聲抑制處理部,55:噪聲抑制性能變更手段,B:音信號(hào),100:拍攝裝置,131:麥克風(fēng)(聚音裝置),133:噪音降低處理部,134:語音區(qū)間檢測部,135:噪音定時(shí)檢測部,136:第1噪音降低處理部,137:第2噪音降低處理部具體實(shí)施方式[第1實(shí)施方式]圖1是本發(fā)明的第1實(shí)施方式涉及的相機(jī)3的整體方塊圖。相機(jī)3具有相機(jī)主體5和透鏡鏡筒7。透鏡鏡筒7相對(duì)于相機(jī)主體5拆裝自由地安裝。作為本實(shí)施方式涉及的相機(jī),不限于如圖1所示的透鏡交換式相機(jī),也可以是透鏡鏡筒7和相機(jī)主體5為一體的相機(jī),不特別限定相機(jī)的種類。在相機(jī)主體5及透鏡鏡筒7的內(nèi)部,沿著光軸Z,配置多個(gè)光學(xué)部件。在相機(jī)主體5中配置拍攝元件單元15,在拍攝元件單元15的光軸Z方向前方側(cè)(沿著Z軸,將拍攝對(duì)象側(cè)稱為“Z軸前方側(cè)”或“Z軸的正方向側(cè)”),配置快門33。在快門33的光軸Z方向的前方側(cè),配置鏡子70,在其前方側(cè),配置內(nèi)嵌于透鏡鏡筒7的光學(xué)透鏡群24。在相機(jī)主體5,內(nèi)嵌有主體CPU50,經(jīng)由透鏡接點(diǎn)34連接在透鏡CPU80。主體CPU50具有與透鏡鏡筒7的通信功能、和相機(jī)主體5的控制功能。主體CPU50具有臉識(shí)別處理部51、VAD處理部52、噪音檢測部53、噪音降低處理部54、噪音降低性能變更部55。透鏡接點(diǎn)34將主體CPU50和透鏡CPU80電連接。對(duì)主體CPU50,連接有用于向相機(jī)主體5及透鏡鏡筒7中具備的電子元件供給電力的電源47。對(duì)主體CPU50,連接有動(dòng)態(tài)圖像開關(guān)41、釋放開關(guān)42、麥克風(fēng)43、攝影模式切換開關(guān)44、顯示部45、EEPROM(非易失性存儲(chǔ)器)46、電源47、記錄介質(zhì)48、圖像處理控制器31、AF傳感器30、電壓信號(hào)輸出電路28等。對(duì)圖像處理控制器31,經(jīng)由接口電路32,連接有拍攝元件單元15的拍攝元件16。圖像處理控制器31及接口電路32,基于來自主體CPU50的信號(hào),控制由拍攝元件16拍攝的圖像的圖像處理。拍攝元件16是例如CCD和CMOS等的固體拍攝元件。拍攝元件16將通過光學(xué)透鏡群24的光束進(jìn)行光電變換,生成圖像信號(hào)。在動(dòng)態(tài)圖像攝影時(shí),主體CPU50從這個(gè)拍攝元件16取得動(dòng)態(tài)圖像數(shù)據(jù)。臉識(shí)別處理部51采用這個(gè)動(dòng)態(tài)圖像數(shù)據(jù),檢測特定的拍攝對(duì)象(人或動(dòng)物)的臉的存在。攝影模式切換開關(guān)44配置于相機(jī)主體5,以使攝影者能按照攝影情景選擇一個(gè)恰當(dāng)?shù)臄z影模式(情景模式、自動(dòng)模式、P·S·A·M模式等)。作為情景模式,預(yù)先準(zhǔn)備有例如肖像、孩子快照、寵物、風(fēng)景、特寫等。在EEPROM46,記錄適合各個(gè)情景模式的攝影參數(shù)等。主體CPU50,按照攝影者選擇的各個(gè)情景模式,從EEPROM46取得需要的攝影參數(shù)。麥克風(fēng)43將動(dòng)態(tài)圖像的拍攝中發(fā)生的聲音變換為音信號(hào)。顯示部45主要由液晶顯示器等構(gòu)成,顯示輸出結(jié)果和/或菜單等。釋放開關(guān)42是操作靜止畫攝影的定時(shí)的開關(guān)。釋放開關(guān)42,對(duì)主體CPU50,輸出半壓信號(hào)及全壓信號(hào)。主體CPU50,在從釋放開關(guān)42輸入半壓信號(hào)時(shí),控制AF控制、AE控制等的攝影準(zhǔn)備操作,在從釋放開關(guān)42輸入全壓信號(hào)時(shí),控制鏡子提升、快門驅(qū)動(dòng)等的曝光操作。快返鏡70用于在構(gòu)圖決定時(shí)在取景器中放映出像,曝光中從光路退避??旆电R70通過未圖示的鏡驅(qū)動(dòng)部(例如DC馬達(dá))驅(qū)動(dòng)。對(duì)快返鏡70,連接有向AF傳感器30引導(dǎo)光的子鏡70a。這個(gè)子鏡70a也在曝光中從光路退避??扉T33控制曝光時(shí)間??扉T33基于來自主體CPU50的控制,通過未圖示的快門驅(qū)動(dòng)部(例如DC馬達(dá))驅(qū)動(dòng)。AF傳感器30是用于進(jìn)行自動(dòng)聚焦(AF)的傳感器。作為這個(gè)AF傳感器30,通常能用CCD。如圖1所示的動(dòng)態(tài)圖像開關(guān)41是操作動(dòng)態(tài)圖像攝影的定時(shí)的開關(guān)。動(dòng)態(tài)圖像開關(guān)41對(duì)主體CPU50,輸出動(dòng)態(tài)圖像攝影的開始/結(jié)束信號(hào)。主體CPU50,在從動(dòng)態(tài)圖像開關(guān)41取得動(dòng)態(tài)圖像攝影的開始信號(hào)時(shí),進(jìn)行鏡子提升及快門開操作的命令。由此,將通過光學(xué)透鏡群24的光束引導(dǎo)至拍攝元件16,開始動(dòng)態(tài)圖像攝影(即時(shí)顯示攝影)。還有,主體CPU50,在從動(dòng)態(tài)圖像開關(guān)41取得動(dòng)態(tài)圖像攝影的結(jié)束信號(hào)時(shí),進(jìn)行鏡子下降及快門閉操作的命令,動(dòng)態(tài)圖像攝影結(jié)束。即時(shí)顯示攝影中的自動(dòng)聚焦,由主體CPU50基于從拍攝元件16輸出的動(dòng)態(tài)圖像數(shù)據(jù)來進(jìn)行(對(duì)比AF)。在如圖1所示的透鏡鏡筒7中,具備包含自動(dòng)聚焦(AF)透鏡24的光學(xué)透鏡群、焦距編碼器74、距離編碼器72、驅(qū)動(dòng)AF透鏡24的驅(qū)動(dòng)馬達(dá)76、透鏡CPU80、透鏡接點(diǎn)34等。透鏡CPU80具有與主體CPU50的通信功能、和透鏡鏡筒7中裝載的電子元件的控制功能。例如,透鏡CPU80經(jīng)由透鏡接點(diǎn)34向主體CPU50輸出焦距信息、拍攝對(duì)象距離信息等。還有,從主體CPU50向透鏡CPU80,輸入AF信息、動(dòng)態(tài)圖像開始/結(jié)束信息、釋放信息等。透鏡CPU80能基于這些信息,控制AF透鏡24的驅(qū)動(dòng)馬達(dá)76等。焦距編碼器74從未圖示的變焦距透鏡群的位置信息計(jì)算焦距,向透鏡CPU80輸出。距離編碼器72由包含AF透鏡24的對(duì)焦透鏡群的位置信息計(jì)算拍攝對(duì)象距離,向透鏡CPU80輸出。拍攝對(duì)象距離信息用于未圖示的閃光燈的調(diào)光等。如圖1所示,在相機(jī)主體5中,具備電壓信號(hào)輸出電路28。電壓信號(hào)輸出電路28基于來自主體CPU50的控制信號(hào),向拍攝元件單元15的防塵過濾器18具備的多個(gè)電極輸出電壓。主體CPU50的臉識(shí)別處理部51基于拍攝元件16制作的動(dòng)態(tài)圖像數(shù)據(jù)檢測特定的拍攝對(duì)象的臉是否存在于動(dòng)態(tài)圖像數(shù)據(jù)中。在檢測特定的拍攝對(duì)象的臉沒有存在于動(dòng)態(tài)圖像數(shù)據(jù)中時(shí),例如能使用模板匹配等公知的臉識(shí)別功能。如圖3所示,說明在動(dòng)態(tài)圖像攝影時(shí)經(jīng)常發(fā)出聲音B的場合。再者,主體CPU50對(duì)各幀(例如1m秒)的每個(gè)從拍攝元件16取得圖像數(shù)據(jù),生成連續(xù)的動(dòng)態(tài)圖像數(shù)據(jù)。圖3中,僅代表連續(xù)的圖像幀61~69,概念地說明在幀61~69間發(fā)出的聲音B。在聲音B中,可能包括特定的拍攝對(duì)象發(fā)出的聲音H、和噪音N。如圖1所示的麥克風(fēng)43拾取這樣的聲音B,作為如圖3概念表示的語音數(shù)據(jù)M向主體CPU50輸出。再者,如圖1所示的VAD處理部(語音檢測部)52從語音數(shù)據(jù)M提取功率信息,如圖4概念地表示,從提取的頻率信息將比第1下限閾值大的頻帶的始端至末端檢測,作為人和/或動(dòng)物等的語音發(fā)出語音區(qū)間。如圖1所示的透鏡CPU80,通過向AF驅(qū)動(dòng)馬達(dá)76輸出AF驅(qū)動(dòng)信號(hào),驅(qū)動(dòng)AF透鏡24。主體CPU50的噪音檢測部53,經(jīng)由透鏡接點(diǎn)34,與透鏡CPU80相連,能直接檢測AF驅(qū)動(dòng)信號(hào)。若噪音檢測部53檢測AF驅(qū)動(dòng)信號(hào),則噪音降低處理部54進(jìn)行以下敘述的噪音的降低處理。由噪音降低處理部54進(jìn)行的噪音(本實(shí)施方式中,特定的AF驅(qū)動(dòng)噪音)的降低,基于圖5所示的流程圖進(jìn)行。在步驟S30,若噪音降低處理部54讀入噪音降低開始信號(hào),在步驟S31,噪音降低處理部54讀入例如預(yù)先存儲(chǔ)于EEPROM46的AF噪音的反相位的波形。其次,進(jìn)入步驟S32,對(duì)AF噪音的反相位的波形,相乘噪音降低系數(shù)(后述的通常水平降低系數(shù)或低水平降低系數(shù))。其次,進(jìn)入步驟S33,通過對(duì)圖3所示的語音數(shù)據(jù)M相加在步驟S32相乘的結(jié)果得到的波形,進(jìn)行噪音的降低。噪音降低性能變更部55,在臉識(shí)別處理部51檢測特定的拍攝對(duì)象的臉的存在的場合,很小地設(shè)定基于上述的噪音降低處理部54的噪音降低系數(shù)。即,將基于噪音降低處理部54的噪音降低系數(shù)設(shè)定為低水平降低系數(shù)?;?,噪音降低性能變更部55,若取得基于攝影模式切換開關(guān)44的肖像、孩子快照、寵物的任一個(gè)情景模式信號(hào),則將基于噪音降低處理部54的噪音降低系數(shù)設(shè)定為低水平降低系數(shù)。其次,基于如圖2所示的流程圖,關(guān)于如圖1所示的主體CPU50的操作進(jìn)行說明。如圖2所示,在步驟S01,若主體CPU50接受動(dòng)態(tài)圖像的攝影開始信號(hào),則在步驟S02,主體CPU50在某動(dòng)態(tài)圖像幀相對(duì)應(yīng)的語音數(shù)據(jù)M的開始時(shí)判斷特定的拍攝對(duì)象的臉是否存在于動(dòng)態(tài)圖像數(shù)據(jù)中。即,主體CPU50,在判斷特定的拍攝對(duì)象的臉存在于動(dòng)態(tài)圖像數(shù)據(jù)的場合,進(jìn)入步驟S03。在步驟S03,降低要用作在VAD處理部52檢測的語音區(qū)間的邊界的該頻率的下限閾值,設(shè)定為第2下限閾值t2,進(jìn)而,在步驟S04,主體CPU50以構(gòu)成動(dòng)態(tài)圖像的各幀相對(duì)應(yīng)的幀與幀的邊界的定時(shí),判斷語音數(shù)據(jù)M是否在語音區(qū)間(如圖3所示的語音區(qū)間VAD)。在主體CPU50判斷語音數(shù)據(jù)M在語音區(qū)間的場合,進(jìn)入步驟S05。在步驟S05,主體CPU50減小基于噪音降低性能變更部55的噪音降低系數(shù)(低水平降低系數(shù))。再者,在步驟S04,在主體CPU50判斷語音數(shù)據(jù)M在語音區(qū)間外的場合,進(jìn)入步驟S08(后述)。其次,進(jìn)入步驟S09,主體CPU50判斷是否檢測噪音。在某動(dòng)態(tài)圖像幀相對(duì)應(yīng)的語音數(shù)據(jù)M的開始時(shí)主體CPU50檢測噪音的場合,進(jìn)入步驟S10,在其動(dòng)態(tài)圖像幀中,以上述的低水平降低系數(shù),對(duì)圖3所示的語音數(shù)據(jù)M,進(jìn)行噪音降低處理。在步驟S09,在某動(dòng)態(tài)圖像幀相對(duì)應(yīng)的語音數(shù)據(jù)M的開始時(shí)主體CPU50沒檢測噪音的場合,進(jìn)入步驟S11,在其動(dòng)態(tài)圖像幀中,不進(jìn)行噪音的降低處理。還有,在步驟S02,在主體CPU50判斷特定的拍攝對(duì)象的臉不存在于動(dòng)態(tài)圖像數(shù)據(jù)中的場合,進(jìn)入步驟S06。在步驟S06,主體CPU50檢測來自攝影模式切換開關(guān)44的輸入信號(hào),進(jìn)行是否為肖像、孩子快照、寵物的任一個(gè)攝影模式的判斷。在主體CPU50判斷為肖像、孩子快照、寵物的任一個(gè)攝影模式的場合,進(jìn)入步驟S03。在步驟S06,在主體CPU50判斷為風(fēng)景或特寫的攝影模式的場合,進(jìn)入步驟S07,主體CPU50將VAD處理部52中要作為語音區(qū)間的邊界的頻率的下限閾值設(shè)定為第1下限閾值t1。再者,在步驟S07,主體CPU50不必進(jìn)行語音區(qū)間VAD的檢測。其次,進(jìn)入步驟S08,主體CPU50使基于噪音降低性能變更部55的噪音降低系數(shù)成通常的狀態(tài)(通常水平降低系數(shù))。其次,進(jìn)入步驟S09,主體CPU50判斷是否檢測噪音。在某動(dòng)態(tài)圖像幀相對(duì)應(yīng)的語音數(shù)據(jù)M的開始時(shí)主體CPU50檢測噪音的場合,進(jìn)入步驟S10,在其動(dòng)態(tài)圖像幀中,以上述的通常水平降低系數(shù),對(duì)圖3所示的語音數(shù)據(jù)M,進(jìn)行噪音降低處理。在步驟S09,在某動(dòng)態(tài)圖像幀相對(duì)應(yīng)的語音數(shù)據(jù)M的開始時(shí)主體CPU50沒檢測噪音的場合,進(jìn)入步驟S11,在其動(dòng)態(tài)圖像幀中,不進(jìn)行噪音的降低處理。這樣,例如在步驟S03,通過將要作為語音區(qū)間的邊界的頻率的下限閾值設(shè)定為第2下限閾值t2,能可靠地拾取人或動(dòng)物的語音。還有,在某動(dòng)態(tài)圖像幀相對(duì)應(yīng)的語音數(shù)據(jù)M的開始時(shí),主體CPU50對(duì)其幀相對(duì)應(yīng)的語音數(shù)據(jù)M進(jìn)行上述的操作(以低水平降低系數(shù)進(jìn)行噪音降低,以通常水平降低系數(shù)進(jìn)行噪音降低,不進(jìn)行的噪音降低的任一個(gè))。即,在以低水平降低系數(shù)進(jìn)行噪音降低的場合,圖3中以“弱”表示,在以通常水平降低系數(shù)進(jìn)行噪音降低的場合,以“中”表示,在不進(jìn)行噪音降低的場合,以“沒有”表示,作為對(duì)語音數(shù)據(jù)M進(jìn)行噪音降低處理的結(jié)果,主體CPU50生成如圖3所示的噪音降低后的語音數(shù)據(jù)M’(概念地表示語音數(shù)據(jù)M’)。具體地,如圖3所示的幀61相對(duì)應(yīng)的語音數(shù)據(jù)M中,幀61的開始時(shí),主體CPU50沒檢測特定的拍攝對(duì)象的語音,也沒檢測噪音,因此不進(jìn)行噪音降低處理。幀62、63相對(duì)應(yīng)的語音數(shù)據(jù)M中,幀62、63開始時(shí),主體CPU50檢測特定的拍攝對(duì)象的語音,但是沒檢測噪音,因此不進(jìn)行噪音降低處理。幀64相對(duì)應(yīng)的語音數(shù)據(jù)M中,幀64的開始時(shí),主體CPU50檢測特定的拍攝對(duì)象的語音,而且,也檢測噪音,因此減弱噪音降低的效果,防止特定拍攝對(duì)象的語音劣化。幀65相對(duì)應(yīng)的語音數(shù)據(jù)M中,幀65的開始時(shí),主體CPU50沒檢測特定的拍攝對(duì)象的語音,但是檢測噪音,因此使噪音降低的效果成通常水平,進(jìn)行噪音降低處理。幀66相對(duì)應(yīng)的語音數(shù)據(jù)M中,幀66的開始時(shí),主體CPU50沒檢測特定的拍攝對(duì)象的語音,也沒檢測噪音,因此不進(jìn)行噪音降低處理。幀67相對(duì)應(yīng)的語音數(shù)據(jù)M中,幀67的開始時(shí),主體CPU50檢測特定的拍攝對(duì)象的語音,但是沒檢測噪音,因此不進(jìn)行噪音降低處理。幀68相對(duì)應(yīng)的語音數(shù)據(jù)M中,幀68的開始時(shí),主體CPU50檢測特定的拍攝對(duì)象的語音,而且,也檢測噪音,因此減弱噪音降低的效果,防止特定拍攝對(duì)象的語音劣化。幀69相對(duì)應(yīng)的語音數(shù)據(jù)M中,幀69的開始時(shí),主體CPU50沒檢測特定的拍攝對(duì)象的語音,也沒檢測噪音,因此不進(jìn)行噪音降低處理。本實(shí)施方式的相機(jī)3及噪音降低方法中,拍攝元件16進(jìn)行動(dòng)態(tài)圖像的拍攝,并且,麥克風(fēng)43將動(dòng)態(tài)圖像的拍攝中發(fā)出的聲音B變換為音信號(hào)M。這個(gè)聲音B有包括噪音N的情況。噪音檢測部53檢測是否發(fā)出噪音N,在檢測噪音N時(shí),噪音降低處理部54從音信號(hào)M降低與噪音N相對(duì)應(yīng)的噪音信號(hào)。另一方面,VAD處理部52檢測非噪音信號(hào)。所謂非噪音信號(hào)是人或動(dòng)物的語音、音樂等至少相當(dāng)于人的語音的頻域的全部語音信號(hào)。包含這個(gè)非噪音信號(hào)的音信號(hào)作為語音區(qū)間來處理,不包含非噪音信號(hào)的數(shù)據(jù)作為非語音區(qū)間來處理。VAD處理部52利用上述的公知VAD。還有,主體CPU50從攝影模式切換開關(guān)44的輸出信號(hào)預(yù)測特定的拍攝對(duì)象,或主體CPU50(臉識(shí)別處理部51)識(shí)別特定的拍攝對(duì)象。本實(shí)施方式中,主體CPU50通過判斷是否為肖像、孩子快照、寵物的任一個(gè)的攝影情景(步驟S06),能預(yù)測特定的拍攝對(duì)象發(fā)出語音H?;蛘?,主體CPU50通過檢測特定的拍攝對(duì)象的臉存在于動(dòng)態(tài)圖像數(shù)據(jù)中(步驟S02),能識(shí)別特定的拍攝對(duì)象的存在。在那個(gè)場合,噪音降低性能變更部55減小基于噪音降低處理部54的噪音信號(hào)的降低性能。即,與在非語音區(qū)間檢測噪音信號(hào)的場合相比,在語音區(qū)間檢測噪音信號(hào)的場合,噪音降低性能變更部55減小基于噪音降低處理部54的噪音信號(hào)的降低性能。因此,能夠最小限度地抑制在語音區(qū)間記錄的非噪音信號(hào)的劣化。因此,能明確地記錄人和/或動(dòng)物的語音,提高動(dòng)態(tài)圖像的欣賞質(zhì)量。還有,以前,作為噪音對(duì)策,攝影者在動(dòng)態(tài)圖像攝影時(shí)為不使用成為噪音發(fā)生源的功能(AF等)的狀態(tài),攝影的表現(xiàn)的寬度可能變窄,但是,本實(shí)施方式中,攝影者能積極地使用這些功能,能拓寬動(dòng)態(tài)圖像攝影的表現(xiàn)的寬度。本實(shí)施方式的程序,對(duì)預(yù)先拍攝的動(dòng)態(tài)圖像數(shù)據(jù),使電腦實(shí)現(xiàn)上述的部件。還有,本實(shí)施方式的記錄介質(zhì),對(duì)預(yù)先拍攝的動(dòng)態(tài)圖像數(shù)據(jù),使電腦記錄實(shí)現(xiàn)上述的部件的程序。因此,在電腦上從后邊開始編輯預(yù)先拍攝的動(dòng)態(tài)圖像數(shù)據(jù)時(shí),能最小限度地抑制語音區(qū)間的非噪音信號(hào)的劣化。還有,例如,拍攝動(dòng)態(tài)圖像數(shù)據(jù)的相機(jī)即使沒有臉識(shí)別功能等,本實(shí)施方式的程序通過記錄介質(zhì),也能最小限度地抑制語音區(qū)間的非噪音信號(hào)的劣化,和明確地記錄也人和/或動(dòng)物的語音。噪音信號(hào)的降低效果的大小與噪音降低系數(shù)成比例。主體CPU50按照是否預(yù)測或識(shí)別特定的拍攝對(duì)象,使噪音降低系數(shù)在通常水平降低系數(shù)和低水平降低系數(shù)之間可變,因此不用復(fù)雜的演算處理,就能變更噪音信號(hào)的降低效果的大小。特別是,在主體CPU50預(yù)測或識(shí)別特定的拍攝對(duì)象的場合,能減小噪音信號(hào)的降低效果(低水平降低系數(shù)),能最小限度地抑制語音區(qū)間的非噪音信號(hào)的劣化,能明確地記錄人和/或動(dòng)物的語音。其另一方面,主體CPU50在沒有預(yù)測或識(shí)別特定的拍攝對(duì)象的場合,使噪音信號(hào)的降低效果比低水平降低系數(shù)的場合大(通常水平降低系數(shù)),在非語音區(qū)間,能適宜地進(jìn)行噪音信號(hào)的降低。本實(shí)施方式中,通過使用公知的臉識(shí)別功能,臉識(shí)別處理部51能有效地識(shí)別拍攝對(duì)象的臉的存在。在臉識(shí)別處理部51識(shí)別拍攝對(duì)象的臉的存在期間,拍攝對(duì)象發(fā)音的可能性高,所以噪音降低性能變更部55通過減小噪音信號(hào)的降低性能,來最小限度地抑制語音區(qū)間的非噪音信號(hào)的劣化,能明確地記錄人和/或動(dòng)物的語音。攝影者在將攝影模式選擇為肖像、孩子快照、寵物等的任意一個(gè)進(jìn)行動(dòng)態(tài)圖像的攝影的場合,特定的拍攝對(duì)象發(fā)音的可能性高。因此,在這些情景模式時(shí),主體CPU50預(yù)測特定的拍攝對(duì)象發(fā)出語音H,噪音降低性能變更部55減小噪音信號(hào)的降低性能。通過這樣,最小限度地抑制語音區(qū)間的非噪音信號(hào)的劣化,能明確地記錄人和/或動(dòng)物的語音。其另一方面,攝影者在將攝影模式選擇為風(fēng)景、特寫等的任意一個(gè)進(jìn)行動(dòng)態(tài)圖像的攝影的場合,拍攝對(duì)象判斷部50預(yù)測攝影者沒打算使特定的拍攝對(duì)象發(fā)音。因此,這些情景模式時(shí),噪音降低性能變更部55使噪音信號(hào)的降低性成通常的狀態(tài)。因此,能有效地降低檢測的噪音信號(hào)。噪音檢測部53,通過至少檢測自動(dòng)聚焦的驅(qū)動(dòng)信號(hào),可以檢測噪音N。還有,噪音檢測部53,通過至少檢測自動(dòng)聚焦、手勢修正、突變的驅(qū)動(dòng)信號(hào)的任一個(gè),可以檢測噪音N。噪音發(fā)生源和噪音檢測部53可以直接相連。在自動(dòng)聚焦、手勢修正、突變等的驅(qū)動(dòng)中,噪音檢測部53可以檢測這些驅(qū)動(dòng)信號(hào)。這個(gè)場合,能可靠地檢測伴隨驅(qū)動(dòng)的噪音N。VAD處理部(語音檢測部)52,在音信號(hào)M的頻率的下限閾值到上限閾值的范圍內(nèi),從音信號(hào)M檢測語音信號(hào)。在主體CPU50(臉識(shí)別處理部51)識(shí)別特定的拍攝對(duì)象的場合,或者,在主體CPU50判斷為肖像、孩子快照、寵物的任一個(gè)攝影情景的場合,VAD處理部52降低下限閾值,可以從第1下限閾值設(shè)定為第2下限閾值,以拓寬語音信號(hào)的檢測范圍。還有,在主體CPU50(臉識(shí)別處理部51)沒識(shí)別特定的拍攝對(duì)象的場合,或者,在主體CPU50判斷攝影模式為風(fēng)景、特寫等的任一個(gè)攝影情景的場合,VAD處理部52可以將下限閾值設(shè)定為第1下限閾值。應(yīng)用公知的VAD,拍攝對(duì)象判斷部50、51在預(yù)測或識(shí)別特定的拍攝對(duì)象(人或動(dòng)物)的場合,通過拓寬語音信號(hào)的檢測范圍,能更明確地檢測人或動(dòng)物的語音。還有,圖3的幀67中,不進(jìn)行噪音降低的處理那樣地進(jìn)行了說明,但是即使在幀67的過程中,也可以以主體CPU50檢測AF驅(qū)動(dòng)信號(hào)的定時(shí),進(jìn)行噪音降低的處理。[第2實(shí)施方式]第1實(shí)施方式中,例如圖3所示的幀61那樣地,關(guān)于完全不進(jìn)行噪音降低處理的場合進(jìn)行了說明,但是,本實(shí)施方式中,如圖6所示,例如幀61中,還進(jìn)行AF聲音等的噪音(特定噪音)以外的一般噪音(例如,車的引擎聲音、風(fēng)聲等)的降低處理。在圖1所示的EEPROM46,與用于降低特定噪音的程序一起,預(yù)先記錄用于降低特定噪音以外的一般噪音的程序。此外,與上述的第1實(shí)施方式同樣,省略重復(fù)的說明??紤]在圖6所示的聲音B中包括一般噪音。例如,與幀61相對(duì)應(yīng)的語音數(shù)據(jù)M中,幀61的開始時(shí),主體CPU50沒檢測特定的拍攝對(duì)象的語音,但檢測一般噪音,因此以通常水平降低系數(shù),進(jìn)行一般噪音降低處理。還有,例如,與幀64相對(duì)應(yīng)的語音數(shù)據(jù)M中,幀64的開始時(shí),主體CPU50檢測特定的拍攝對(duì)象的語音,而且,也檢測特定噪音,因此減弱噪音降低的效果,防止特定拍攝對(duì)象的語音劣化。還有,例如,幀65的開始時(shí),主體CPU50沒檢測特定的拍攝對(duì)象的語音,但檢測一般噪音。并且,主體CPU50也檢測特定噪音。這個(gè)場合,以通常水平降低系數(shù),進(jìn)行特定噪音的降低。本實(shí)施方式中,不僅是特定噪音,還能進(jìn)行一般噪音的降低。還有,上述的實(shí)施方式中,采用具有鏡子機(jī)構(gòu)的相機(jī)進(jìn)行了說明,但是也能適用于省去鏡子機(jī)構(gòu)的系統(tǒng)的相機(jī)。還有,上述的噪音檢測部檢測的噪音的對(duì)象沒有特別限定,噪音檢測部能檢測手勢校正透鏡驅(qū)動(dòng)馬達(dá)聲音、車的經(jīng)過聲音(噪音)、相機(jī)的操作按鈕的操作聲音等。并且,用于噪音降低的程序、語音檢測部不限于上述的實(shí)施方式,也能采用一般的噪音檢測程序和/或用于一般的語音檢測的程序。[第3實(shí)施方式]以下,參照附圖等,關(guān)于本發(fā)明的第3實(shí)施方式說明。圖7是表示第3實(shí)施方式的相機(jī)的構(gòu)成的方塊圖。如圖7所示,相機(jī)100具備透鏡鏡筒110、圖像處理部120(對(duì)通過透鏡鏡筒110的拍攝對(duì)象進(jìn)行拍攝并進(jìn)行A/D變換,以及,進(jìn)行圖像處理并生成圖像數(shù)據(jù))、聲音信息處理部130(對(duì)聚音的聲音信息進(jìn)行A/D變換,以及,進(jìn)行噪音降低處理)、記錄部140(記錄圖像處理部120得到的圖像數(shù)據(jù)及聲音信息處理部130得到的語音信號(hào))、和CPU150。透鏡鏡筒110具備像移動(dòng)修正部等的VR單元111、AF編碼器112、和AF驅(qū)動(dòng)用馬達(dá)113,其中像移動(dòng)修正部等的VR單元111具有調(diào)焦透鏡(以下,為AF(AutoFocus:自動(dòng)聚焦))透鏡、手勢校正透鏡(以下,為VR(VibrationReduction:減振))透鏡、變焦距透鏡、變焦距透鏡驅(qū)動(dòng)部、縮放編碼器。AF編碼器112檢測光學(xué)系統(tǒng)的AF透鏡的位置,向CPU150輸出。從CPU150向AF驅(qū)動(dòng)用馬達(dá)113輸入用于控制AF透鏡的位置的驅(qū)動(dòng)控制信號(hào),按照其驅(qū)動(dòng)控制信號(hào),控制AF透鏡的位置。CPU150按照設(shè)定的拍攝條件(例如,光圈值、曝光值等)控制透鏡鏡筒110。CPU150生成驅(qū)動(dòng)變焦距透鏡驅(qū)動(dòng)部及AF驅(qū)動(dòng)用馬達(dá)113的驅(qū)動(dòng)控制信號(hào),向變焦距透鏡驅(qū)動(dòng)部及AF驅(qū)動(dòng)用馬達(dá)113輸出。聲音信息處理部130具備作為聚音裝置的麥克風(fēng)131、處理聚音的經(jīng)A/D變換的聲音信息的聲音信號(hào)處理部132、和噪音降低處理部133。聲音信號(hào)處理部132具備從麥克風(fēng)131聚音的聲音信息檢測語音區(qū)間的語音區(qū)間檢測部134、和從AF驅(qū)動(dòng)用馬達(dá)113的操作信息檢測操作噪音發(fā)生的定時(shí)的噪音定時(shí)檢測部135。語音區(qū)間檢測部134基于自相關(guān)函數(shù)的峰值從麥克風(fēng)131聚音的聲音信息辨別包含語音信號(hào)的區(qū)間(語音區(qū)間)及其以外的區(qū)間(非語音區(qū)間)。說明基于語音區(qū)間檢測部134的語音區(qū)間檢測的概要如下。圖8是語音波形。若提出這個(gè)語音波形的任意的一部分求得自相關(guān)函數(shù),則成為如圖9所示的波形。這個(gè)語音波形具有語音,即,在與聲帶的振動(dòng)頻率相對(duì)應(yīng)的基頻及為與其諧音相對(duì)應(yīng)的頻帶域集中峰值的性質(zhì)(諧波性),可以通過利用這個(gè)諧波性根據(jù)自相關(guān)函數(shù)的峰值的大小,區(qū)別是語音還是非語音。圖10A、圖10B利用自相關(guān)函數(shù)表示檢測語音區(qū)間的場合的一個(gè)例子。圖10A是來自麥克風(fēng)131的輸出波形,在其前半部發(fā)生AF噪音,在后半部發(fā)生語音和AF噪音。對(duì)圖10A所示的輸出波形求自相關(guān)函數(shù),對(duì)這個(gè)自相關(guān)函數(shù)的頂峰設(shè)定閾值,若將閾值以上的部分作為High(高)表示,則能得到圖10B那樣的波形。由此,能在輸出波形的后半部檢測存在與語音位置一致的語音區(qū)間。噪音定時(shí)檢測部135從AF驅(qū)動(dòng)用馬達(dá)113的操作信息檢測操作噪音發(fā)生的定時(shí)?;谶@個(gè)噪音定時(shí)檢測部135的操作噪音的發(fā)生定時(shí)使用來自指示的AF驅(qū)動(dòng)指令及AF編碼器112的輸出進(jìn)行檢測(推定),以輸出由CPU150對(duì)AF驅(qū)動(dòng)用馬達(dá)113的驅(qū)動(dòng)控制信號(hào)。說明基于噪音定時(shí)檢測部135的操作噪音的發(fā)生定時(shí)檢測的細(xì)節(jié)如下。如圖11所示,若通過AF驅(qū)動(dòng)指令的輸出使AF驅(qū)動(dòng)用馬達(dá)113操作,則從作為AF驅(qū)動(dòng)指令的輸出時(shí)刻的AF驅(qū)動(dòng)用馬達(dá)113的操作開始時(shí)間t1到操作結(jié)束時(shí)間t3連續(xù)發(fā)生操作噪音。在麥克風(fēng)131,聚音使操作噪音與拍攝對(duì)象的語音等的記錄目的音重疊的聲音信息,從麥克風(fēng)131輸出進(jìn)行那樣聚音的聲音信息。此時(shí),有可能由于AF驅(qū)動(dòng)系的齒輪列引起的反沖等的影響從AF編碼器112從比AF驅(qū)動(dòng)用馬達(dá)113的操作開始時(shí)間t1晚的時(shí)刻t2輸出。因此,噪音定時(shí)檢測部135檢測從AF驅(qū)動(dòng)指令的輸出時(shí)刻t1到AF編碼器112的輸出停止t3作為操作噪音的發(fā)生定時(shí),檢測其以外作為非噪音定時(shí)。再者,在AF操作時(shí),從麥克風(fēng)131實(shí)際輸出的信號(hào)是操作噪音與目的音重疊的信號(hào),但是為了簡略說明,圖11中,僅表示操作噪音。噪音降低處理部133對(duì)圖11表示的操作噪音中在AF操作開始時(shí)及AF操作結(jié)束時(shí)發(fā)生的沖擊音噪音進(jìn)行降低處理。噪音降低處理部133取得圖11表示的操作噪音發(fā)生前的窗口X的第1頻譜、和操作噪音發(fā)生后的窗口Y的第2頻譜。將取得的第1頻譜和第2頻譜相比較,在比較的結(jié)果為第2頻譜比第1頻譜大的場合,通過將第2頻譜替換為第1頻譜,來進(jìn)行第1噪音的降低處理。這里,在由語音區(qū)間檢測部134檢測為語音區(qū)間的場合,不替換到預(yù)定的頻率(例如,4000Hz)為止的頻譜并保存,還有,在檢測為非語音區(qū)間的場合,不替換比其小的預(yù)定的頻率(例如,500Hz)為止的頻譜并保存。即,例如,在檢測為語音區(qū)間的場合保存的頻率的上限為4000Hz,例如,在檢測為非語音區(qū)間的場合保存的頻率的上限為500Hz,由此,在檢測為語音區(qū)間的場合,進(jìn)行比檢測為非語音區(qū)間的場合更弱的第1沖擊音噪音降低處理。還有,噪音降低處理部133從語音區(qū)間檢測部134檢測為非語音區(qū)間進(jìn)行強(qiáng)的沖擊音噪音降低處理的場合的頻譜推定噪音,更新推定噪音,并且,使用其推定噪音,從進(jìn)行第1沖擊音噪音降低處理的頻譜減去并進(jìn)行生成頻譜的譜減法處理(第2噪音降低處理)。除了上述構(gòu)成之外,在聲音信息處理部130中,還具有以下的處理部:針對(duì)每個(gè)預(yù)先決定從麥克風(fēng)131輸出的聲音信息的區(qū)間進(jìn)行分割以窗口數(shù)加權(quán),并且,將每個(gè)這樣的區(qū)間的聲音數(shù)據(jù)進(jìn)行傅立葉變換(FFT:FastFourierTransform)并變換為頻域。還有,具有以下的處理部:通過FFT處理區(qū)分頻域的振幅信息和相位信息,利用頻域的振幅信息進(jìn)行噪音降低處理(譜減法處理),對(duì)于進(jìn)行如此處理的譜,通過進(jìn)行傅立葉逆變換(IFFT:InverseFastFourierTransform),將噪音降低處理后的譜(聲音信息)變換為時(shí)域。關(guān)于這些處理部,省略圖示。并且,噪音降低處理部133,通過第2噪音降低處理(譜減法處理),在譜顯著減少的場合和/或譜消失的場合具有修正譜的基底(flooring)功能。這個(gè)基底,將基于通過噪音定時(shí)檢測部135檢測為非噪音定時(shí),并且,通過語音區(qū)間檢測部134檢測為非語音區(qū)間的場合的聲音信息生成的基底譜和第2噪音降低處理減法之后的譜相比較,在減法后的譜低于基底譜(譜強(qiáng)度小)的場合,生成采用基底譜的聲音信息(譜),對(duì)其進(jìn)行IFFT處理。但是,在減法后的譜高于基底譜(譜強(qiáng)度大)的場合,可以進(jìn)行基底處理,還有,也可以不必進(jìn)行基底處理。還有,用于基底功能的基底譜,采用由噪音定時(shí)檢測部135檢測為非噪音定時(shí),并且,由語音區(qū)間檢測部134檢測為非語音區(qū)間的場合的聲音信息來更新。由此,在基底譜,不包含操作噪聲譜、語音譜的任一個(gè),僅包含背景聲音,在基底處理時(shí)附加語音譜,不會(huì)生成音降低處理后的聲音信息中本來沒有的語音。其次,基于附圖說明本實(shí)施方式的相機(jī)100的噪音降低處理操作(噪音降低方法)。圖12是表示噪音降低處理操作的流程的流程圖。圖13是說明成為噪音降低處理的對(duì)象的第1處理對(duì)象聲音的形態(tài)的概略圖。(第1處理對(duì)象聲音)如圖13所示,第1處理對(duì)象聲音是發(fā)生區(qū)間A僅為背景聲音,區(qū)間B為背景聲音和語音(目的音),區(qū)間C為背景聲音和AF噪音的形態(tài)。說明在圖13所示的第1處理對(duì)象聲音的區(qū)間C,從麥克風(fēng)131聚音輸出的聲音信息對(duì)AF噪音進(jìn)行降低處理的操作及基底更新。(步驟ST1)首先,由噪音定時(shí)檢測部135,基于從麥克風(fēng)131輸出的聲音信息,開始噪音定時(shí)的檢測。將由此時(shí)的麥克風(fēng)43聚音的聲音信息(譜),在圖14表示區(qū)間A,在圖15表示區(qū)間B。(步驟ST2)繼續(xù),由語音區(qū)間檢測部134,基于從麥克風(fēng)131輸出的聲音信息,開始語音區(qū)間的檢測。(步驟ST3)對(duì)從麥克風(fēng)131輸出的聲音信息進(jìn)行FFT處理,分為頻域的振幅信息和相位信息。(步驟ST4)其次,由噪音定時(shí)檢測部135,檢測(判定)是操作噪音的發(fā)生定時(shí)還是非噪音定時(shí)(即是否為AF區(qū)間)。(步驟ST4,是)在步驟ST4,判定區(qū)間C是操作噪音的發(fā)生定時(shí)(AF區(qū)間,是),進(jìn)入步驟ST5。(步驟ST4,否)判定區(qū)間A及B是非噪音定時(shí),進(jìn)入步驟ST11。(步驟ST5)在步驟ST5,由語音區(qū)間檢測部134檢測(判定)是語音區(qū)間還是非語音區(qū)間。因?yàn)閰^(qū)間C是非語音區(qū)間(否),進(jìn)入步驟ST7。(步驟ST7)在這里,在包含AF操作開始時(shí)及AF操作結(jié)束時(shí)的場合,進(jìn)行不替換上限到預(yù)定的頻率(例如,500Hz)為止的譜并保存的所謂強(qiáng)沖擊音噪音降低處理,關(guān)于區(qū)間C得到圖16的譜。在不包含AF操作開始時(shí)及AF操作結(jié)束時(shí)的場合,判斷不包含沖擊音噪音,不進(jìn)行沖擊音噪音降低處理。(步驟ST8)接著,推定由步驟ST7的噪音降低處理得到的譜(圖16)的噪音,向步驟ST9輸出如圖17所示的推定噪聲譜。(步驟ST9)繼續(xù),進(jìn)行從由步驟ST7的沖擊音噪音降低處理得到的譜(圖16)減去由步驟ST8的推定得到的推定噪聲譜(圖17)的譜減法處理(第2噪音降低處理),能得到如圖18所示的譜。(步驟ST10)通過第2噪音降低處理(譜減法處理),存在圖18的譜顯著減少,或者消失的場合,為了與此對(duì)應(yīng),進(jìn)行修正圖18的譜的基底處理。這個(gè)基底處理,將圖18的譜和成為基準(zhǔn)的基底譜的大小相比較。并且,比較的結(jié)果,采用強(qiáng)度大的譜,生成如圖19所示的譜。在這里使用的基底譜,如后述,為從區(qū)間A求得的基底譜。(步驟ST11)返回步驟ST11,在這里,由語音區(qū)間檢測部134檢測(判定)是語音區(qū)間還是非語音區(qū)間(僅背景聲音的區(qū)間)。其結(jié)果,判定區(qū)間B是語音區(qū)間(是),不進(jìn)行噪音降低處理、譜減法、基底處理,進(jìn)入步驟ST13。判定區(qū)間A是非語音區(qū)間(否),進(jìn)入步驟ST12。(步驟ST12)在步驟ST12,使圖14所示的僅背景聲音發(fā)生的區(qū)間A的譜的各頻率的振幅減半,得到如圖20所示的基底譜。在前述用于步驟ST10的基底處理的同時(shí),將這個(gè)基底譜(圖20)更新為這個(gè)基底譜。假如,在使用將區(qū)間B的圖15表示的譜的各頻率的振幅減半而求得的圖21的基底譜進(jìn)行基底處理的場合,成為如圖22表示的譜。若圖22的譜為區(qū)間C的譜,則也包含區(qū)間B(圖15)中包括的語音的譜的成分(特別是f2,f4),不能得到正確的目的音??墒牵鶕?jù)本實(shí)施方式,在用于基底處理的基底譜(圖20)中,不包含語音及操作的噪音的譜。因此,在步驟ST10的基底處理中,附加AF噪音和/或語音的譜能防止產(chǎn)生噪音降低處理后的聲音信息中本來沒有的操作噪音和/或語音。(步驟ST13)在最后的步驟ST13,通過使用在步驟ST3區(qū)分的相位進(jìn)行IFFT處理,將噪音降低處理后的譜變換為時(shí)域,向記錄部140輸出。(第2處理對(duì)象聲音)其次,說明使用第2處理對(duì)象聲音(具有與上述的第1處理對(duì)象聲音不同的形態(tài))的場合的噪音降低處理操作(噪音降低方法)。再者,噪音降低處理操作流程的各步驟中,由于與第1處理對(duì)象聲音的場合大致上相同,因此主要以在各步驟的處理內(nèi)容的不同點(diǎn)為中心來說明。圖23是說明成為噪音降低處理的對(duì)象的第2處理對(duì)象聲音的形態(tài)的概略圖。如圖23所示,處理對(duì)象聲音是發(fā)生區(qū)間D僅為背景聲音,區(qū)間E為背景聲音和AF噪音,區(qū)間F為背景聲音和語音和AF噪音的形態(tài)。說明在圖23所示的處理對(duì)象聲音的區(qū)間E及區(qū)間F,從麥克風(fēng)131聚音輸出的聲音信息對(duì)AF噪音進(jìn)行降低處理的操作及基底更新。步驟ST1到ST4與上述的第1處理對(duì)象聲音的區(qū)間C相同,所以省略。(步驟ST5)在步驟ST5,判定區(qū)間F是語音區(qū)間(是),進(jìn)入步驟ST6。(步驟ST6)在步驟ST6,在包含AF操作開始時(shí)及AF操作結(jié)束時(shí)的場合,進(jìn)行不替換上限到預(yù)定的頻率(例如,4000Hz)為止的譜并保存的所謂弱第1沖擊音噪音降低處理。在不包含AF操作開始時(shí)及AF操作結(jié)束時(shí)的場合,判斷不包含沖擊音噪音,不進(jìn)行沖擊音噪音降低處理。進(jìn)行這個(gè)第1沖擊音噪音降低處理的譜包含語音的譜成分f2,f4。這個(gè)譜不用于推定噪音更新,進(jìn)入用于進(jìn)行作為第2噪音降低處理的譜減法處理的步驟ST9。在第2處理對(duì)象聲音的場合,在以操作噪音的發(fā)生定時(shí)且作為非語音區(qū)間的區(qū)間E,能得到圖24所示的譜,在區(qū)間F,能得到圖26所示的譜。在那里,在步驟ST8,從在區(qū)間E得到的譜推定噪音更新。更新后的推定噪音成為圖25所示的譜。由此,通過在步驟ST9,從區(qū)間F的譜(圖26)減去推定噪音譜(圖25),并且,在步驟ST10進(jìn)行基底處理,生成圖27所示的譜。再者,第2處理對(duì)象聲音的場合的基底譜,從僅背景聲音發(fā)生的區(qū)間D得到。這個(gè)基底譜,采用與第1處理對(duì)象聲音的場合相同地將圖14減半處理的圖20的譜。在這里,假設(shè),在以區(qū)間F的譜(圖26)乘以0.9的推定噪音即圖28為前提進(jìn)行譜減法的場合,成為圖29表示的譜。在這個(gè)場合,對(duì)以f2,f4表示的語音的譜也進(jìn)行減法,不能得到正確的聲音信息??墒歉鶕?jù)本實(shí)施方式,如圖27所示能存在語音譜。以上,根據(jù)本實(shí)施方式,具有以下的效果。(1)從麥克風(fēng)131聚音的聲音信息檢測語音區(qū)間,在檢測為語音區(qū)間的場合,進(jìn)行比檢測為非語音區(qū)間的場合更弱的第1噪音降低處理。為此,相比于沒有語音區(qū)間、非語音區(qū)間的區(qū)分就進(jìn)行強(qiáng)噪音降低處理的場合,不會(huì)引起特別是由語音及背景聲音構(gòu)成的目的音的語音部分的劣化,能恰當(dāng)?shù)亟档驮胍簟?2)第1噪音降低處理后,從判定為非語音區(qū)間的場合的聲音信息推定噪音,進(jìn)行對(duì)這個(gè)推定的噪音進(jìn)行減法的第2噪音降低處理(譜的減法處理)。為此,從非語音區(qū)間的聲音信息求得噪音不除去語音本身,能得到與目的音非常接近的處理聲音。(3)從相機(jī)100內(nèi)的驅(qū)動(dòng)部的操作信息檢測操作噪音的發(fā)生定時(shí),在檢測噪音發(fā)生定時(shí)的場合向噪音降低處理轉(zhuǎn)移。為此,不進(jìn)行徒勞的噪音降低處理,只在需要時(shí)適當(dāng)且能合理地進(jìn)行噪音降低處理。(4)由于對(duì)第2噪音降低處理(譜減法處理)后的聲音信息進(jìn)行基底處理,通過譜減法來減少,或者,能修正有消失可能的譜。由此,防止過多降低噪音的情況,能確保(記錄)聚音的聲音信息中接近目的音的聲音。以上,不限于說明的實(shí)施方式,能夠進(jìn)行以下所示的各種變形和/或變更,那些也在本發(fā)明的范圍內(nèi)。例如,本實(shí)施方式中,說明了對(duì)于麥克風(fēng)131聚音的聲音信息,實(shí)時(shí)地進(jìn)行噪音降低處理的構(gòu)成??墒?,不限于此,也可以是將麥克風(fēng)131聚音的聲音信息臨時(shí)地存儲(chǔ)于緩沖存儲(chǔ)器等,按照需要從緩沖存儲(chǔ)器等讀出聲音信息來進(jìn)行噪音降低處理的構(gòu)成。這個(gè)場合,能減輕實(shí)時(shí)處理時(shí)候裝置涉及的負(fù)荷。再者,實(shí)施方式及變形方式也能適宜地組合來采用,但是,詳細(xì)的說明省略。還有,本發(fā)明不通過以上說明的實(shí)施方式來限定。
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1