專利名稱:圖像處理設備、方法和程序的制作方法
技術領域:
本發(fā)明涉及圖像處理設備、方法和程序,并且更具體地涉及能夠更簡單地識別圖 像中的被攝對象的區(qū)域的圖像處理設備、方法和程序。
背景技術:
迄今為止,作為識別圖像中的被攝對象的區(qū)域的技術,已知一種稱為視覺注意的 技術(例如,參見非專利文獻1和2)。在視覺注意中,從輸入的輸入圖像中提取亮度信息、顏色信息和邊緣信息?;谶@ 些提取的信息項,針對每項提取的信息產(chǎn)生針對輸入圖像的每個區(qū)域指示區(qū)域為被攝對象 的可能性的信息圖。然后,將作為利用DOG濾波器進行濾波處理的結果獲得的信息,或者以通過線性 規(guī)范化將各信息圖規(guī)范化并求和、之后進一步規(guī)范化的方式獲得的信息形成為被攝對象 圖。該被攝對象圖是針對輸入圖像的每個區(qū)域指示區(qū)域為被攝對象的可能性的信息。被攝 對象圖的使用使得能夠識別被攝對象包含在輸入圖像的哪個區(qū)域中。這里,作為亮度信息,從輸入圖像提取輸入圖像的像素的R(紅色)、G(綠色)和 B (藍色)分量的平均值,并且作為顏色信息,提取輸入圖像的像素的R分量和G分量的差、 及B分量和Y(黃色)分量的差。此外,通過利用Gabor濾波器,從輸入圖像提取0°、45°、 90°和135°方向的每個方向的邊緣強度。引用文獻列表非專利文獻NPL 1 :Laurent Itti Christof Koch 禾口 Ernst Niebur, "A Model of Saliency-Based Visual Attention for Rapid Scene Analysis,,NPL 2 Laurent Itti Christof Koch, "Feature combination strategies for saliency-based visual attention systems"
發(fā)明內容
但是,在上述技術中,處理量大,且產(chǎn)生被攝對象費時。例如,由于利用Gabor濾波 器的濾波處理需要指數(shù)計算,處理量大。此外,由于DOG濾波器具有許多抽頭(tap),利用 DOG濾波器的濾波處理量增大。同時,在通過線性規(guī)范化執(zhí)行信息圖的規(guī)范化的情況下,能夠抑制規(guī)范化的處理 量。但是,難以在規(guī)范化期間從信息圖中去除噪聲,并且利用被攝對象圖檢測被攝對象的準 確度降低。即,存在錯誤地將噪聲區(qū)域檢測為被攝對象的區(qū)域的情況。此外,如果要利用硬件執(zhí)行獲得被攝對象圖的處理,那么由于Gabor濾波器的指 數(shù)計算和DOG濾波器的抽頭數(shù)目的影響而使電路規(guī)模變得更大。鑒于這些情況,做出了本發(fā)明,本發(fā)明的目的是能夠更容易和更快地獲得用于識 別圖像中的被攝對象的區(qū)域的信息。
問題的解決方案根據(jù)本發(fā)明的一個方面的圖像處理設備包括提取信息圖像生成裝置,其用于基于 由從輸入圖像的各區(qū)域提取的預定信息構成的提取信息圖像來生成分辨率彼此不同的多 個提取信息圖像;差圖像生成裝置,其用于通過獲得多個提取信息圖像之中的兩個預定的 提取信息圖像之間的差來生成差圖像;信息圖產(chǎn)生裝置,其用于通過執(zhí)行多個差圖像的加 權加法來產(chǎn)生指示輸入圖像中的被攝對象的區(qū)域所擁有的特征的特征量的信息圖;規(guī)范化 裝置,其用于通過從信息圖的每個區(qū)域的值減去信息圖的各區(qū)域的值的平均值而將信息圖 規(guī)范化;以及被攝對象圖產(chǎn)生裝置,其用于通過執(zhí)行多個規(guī)范化的信息圖的加權加法來產(chǎn) 生針對輸入圖像的每個區(qū)域指示區(qū)域為被攝對象的可能性的被攝對象圖。圖像處理設備還可包括邊緣圖像生成裝置,該邊緣圖像生成裝置用于通過利用預 定系數(shù)執(zhí)行輸入圖像的若干像素的像素值的加權加法,來生成代表輸入圖像的各區(qū)域的邊 緣強度的圖像,作為提取信息圖像。提取信息圖像生成裝置可通過將提取信息圖像中彼此相鄰的像素的像素值的平 均值設為與該提取信息圖像不同的另一提取信息圖像的像素的像素值,來生成分辨率彼此 不同的多個提取信息圖像。根據(jù)本發(fā)明的一個方面的圖像處理方法或程序包括步驟基于由從輸入圖像的各 區(qū)域提取的預定信息構成的提取信息圖像,生成分辨率彼此不同的多個提取信息圖像;通 過獲得多個提取信息圖像之中的兩個預定的提取信息圖像之間的差,生成差圖像;通過執(zhí) 行多個差圖像的加權加法,產(chǎn)生指示輸入圖像中的被攝對象所擁有的特征的特征量的信息 圖;通過從信息圖的每個區(qū)域的值減去信息圖的各區(qū)域的值的平均值,將信息圖規(guī)范化; 以及通過執(zhí)行多個規(guī)范化的信息圖的加權加法,產(chǎn)生針對輸入圖像的每個區(qū)域指示區(qū)域為 被攝對象的可能性的被攝對象圖。在本發(fā)明的一個方面中,基于由從輸入圖像的各區(qū)域提取的預定信息構成的提取 信息圖像,生成分辨率彼此不同的多個提取信息圖像。通過獲得多個提取信息圖像之中的 兩個預定的提取信息圖像之間的差,生成差圖像。通過執(zhí)行多個差圖像的加權加法,生成指 示輸入圖像中的被攝對象的區(qū)域所擁有的特征的特征量的信息圖。通過從信息圖的每個 區(qū)域的值減去信息圖的各區(qū)域的值的平均值,將信息圖規(guī)范化。通過執(zhí)行多個規(guī)范化的信 息圖的加權加法,生成針對輸入圖像的每個區(qū)域指示區(qū)域為被攝對象的可能性的被攝對象 圖。根據(jù)本發(fā)明的一個方面,能夠更容易和更快地獲得用于識別圖像中的被攝對象的 區(qū)域的信息。
圖1圖示了應用本發(fā)明的圖像處理設備的實施例的結構的示例。圖2圖示了亮度信息提取單元的結構的示例。圖3圖示了金字塔圖像。圖4圖示了金字塔圖像的生成。圖5圖示了顏色信息提取單元的結構的示例。圖6圖示了邊緣信息提取單元的結構的示例。
圖7圖示了面部信息提取單元的結構的示例。
圖8圖示了運動信息提取單元的結構的示例。
圖9是圖示了被攝對象區(qū)域識別處理的流程圖。
圖10是圖示了亮度信息提取處理的流程圖。
圖11是圖示了顏色信息提取處理的流程圖。
圖12是圖示了邊緣信息提取處理的流程圖。
圖13圖示了提取邊緣的濾波器的示例。
圖14圖示了提取邊緣的濾波器的示例。
圖15是圖示了面部信息提取處理的流程圖。
圖16是圖示了運動信息提取處理的流程圖。
圖17圖示了利用神經(jīng)網(wǎng)絡的學習。
圖18圖示了利用神經(jīng)網(wǎng)絡的學習。
圖19圖示了計算機的結構的示例。
具體實施例方式參照附圖,下面將說明應用本發(fā)明的實施例。[圖像處理設備的結構]圖1圖示了應用本發(fā)明的圖像處理設備的實施例的結構的示例。圖像處理設備11由亮度信息提取單元21、顏色信息提取單元22、邊緣信息提取單 元23、面部信息提取單元M、運動信息提取單元25、被攝對象圖產(chǎn)生單元沈和被攝對象區(qū) 域識別單元27構成。例如,圖像處理設備11包括用于捕獲包含被攝對象的輸入圖像的圖像捕獲裝置。 通過圖像捕獲獲得的輸入圖像被提供給亮度信息提取單元21至運動信息提取單元25,以 及被攝對象區(qū)域識別單元27。該輸入圖像是由Y(亮度)分量,Cr (色差)分量和Cb(色 差)分量構成的視頻信號。亮度信息提取單元21至運動信息提取單元25從供給的輸入圖像提取預定信息, 并基于由提取的信息構成的提取信息圖像產(chǎn)生針對輸入圖像的每個區(qū)域指示區(qū)域為被攝 對象的可能性的信息圖。包含在這些信息圖中的信息是指示特征的特征量的信息,所述特 征在更大程度上被包含在包含被攝對象的區(qū)域中,并且使以對應于輸入圖像的每個區(qū)域的 方式設置的信息成為信息圖。即,可認為信息圖是指示輸入圖像的每個區(qū)域中的特征量的 fn息ο這里,在用戶瞥一眼輸入圖像的情況下,術語“被攝對象”指的是推測用戶注意到 的輸入圖像中的對象體,即,推測用戶使他/她的注意力轉向的對象體。因此,被攝對象不 必局限于人物。此外,在亮度信息提取單元21至運動信息提取單元25中,產(chǎn)生亮度信息圖、 顏色信息圖、邊緣信息圖、面部信息圖和運動信息圖,作為信息圖。更具體地,亮度信息提取單元21通過利用由供給的輸入圖像的Y(亮度)分量構 成的亮度圖像作為提取的信息圖像來產(chǎn)生亮度信息圖,并將亮度信息圖提供給被攝對象圖 產(chǎn)生單元26。顏色信息提取單元22通過利用由供給的輸入圖像的Cr分量構成的Cr圖像 和由供給的輸入圖像的Cb分量構成的Cb圖像作為提取的信息圖像來產(chǎn)生顏色信息圖,并將顏色信息圖提供給被攝對象圖產(chǎn)生單元26。邊緣信息提取單元23通過利用由供給的輸入圖像的每個區(qū)域的邊緣強度構成的 邊緣圖像作為提取的信息圖像來產(chǎn)生邊緣信息圖,并將邊緣信息圖提供給被攝對象圖產(chǎn)生 單元26。面部信息提取單元M通過利用由在供給的輸入圖像的每個區(qū)域中的關于作為被 攝對象的人物的面部的信息構成的圖像作為提取的信息圖像來產(chǎn)生面部信息圖,并將面部 信息圖提供給被攝對象圖產(chǎn)生單元26。運動信息提取單元25通過利用由在供給的輸入圖 像的每個區(qū)域中的關于運動的信息構成的圖像作為提取的信息圖像,來產(chǎn)生運動信息圖, 并將運動信息圖提供給被攝對象圖產(chǎn)生單元26。被攝對象圖產(chǎn)生單元沈通過將從亮度信息提取單元21至運動信息提取單元25 提供的信息圖相加來產(chǎn)生被攝對象圖,并將被攝對象圖提供給被攝對象區(qū)域識別單元27。 該被攝對象圖是用于識別其中包含有輸入圖像中的被攝對象的區(qū)域的信息。被攝對象區(qū)域識別單元27通過利用來自被攝對象圖產(chǎn)生單元沈的被攝對象圖來 識別供給的輸入圖像中的被攝對象的區(qū)域,并輸出識別結果。[亮度信息提取單元的結構]下面將說明亮度信息提取單元21至運動信息提取單元25的更詳細的結構。圖2是圖示了亮度信息提取單元21的結構的示例的方框圖。亮度信息提取單元21由金字塔圖像生成單元51、差計算單元52、加權加法單元53 和規(guī)范化單元M構成。金字塔圖像生成單元51將由供給的輸入圖像的Y分量構成的圖像設為亮度圖像, 利用亮度圖像來產(chǎn)生分辨率彼此不同的多個亮度圖像,并將這些亮度圖像作為亮度的金字 塔圖像,提供給差分計算單元52。這里,從輸入圖像生成的亮度圖像的像素的像素值是輸入 圖像的在與亮度圖像的像素的相同位置處的像素的Y分量的值。此外,例如,如圖3所示,生成從等級Ll到等級L7的七種分辨率的七個金字塔圖 像Ll至L7。同時,等級Ll的金字塔圖像Ll具有最高的分辨率,并且金字塔圖像的分辨率 被設置成按照從等級Ll到等級L7的順序降低。這種情況下,由輸入圖像的Y分量構成的、 其分辨率(像素數(shù))與輸入圖像相同的亮度圖像被設為等級Ll的金字塔圖像Li。此外,如圖4所示,通過獲得等級Li (其中,1 < i ( 6)的金字塔圖像Li的彼此相 鄰的像素的像素值的平均值,生成等級L(i+1)的金字塔圖像L(i+1)。即,對金字塔圖像Li進行下轉換(down-convert),使得它將具有圖中水平方向上 的像素數(shù)的一半,并且這樣獲得的圖像被設為圖像Li'。例如,金字塔圖像Li的水平方向 上的彼此相鄰的像素gl和g2的像素值的平均值被設為圖像Li'的像素g3的像素值。然后,對圖像Li'進行下轉換,使得它將具有圖中垂直方向上的像素數(shù)的一半,并 且這樣獲得的圖像被設為等級L(i+1)的金字塔圖像L(i+1)。例如,圖像Li'的垂直方向 上的彼此相鄰的像素g3和g4的像素值的平均值被設為金字塔圖像L(i+1)的像素g5的像 素值。返回參照圖2的亮度信息提取單元21的描述,差計算單元52在從金字塔圖像生 成單元51供給的每個層級的金字塔圖像之中選擇層級彼此不同的兩個金字塔圖像,獲得 所選金字塔圖像的差,并生成亮度的差圖像。同時,由于每個層級的金字塔圖像具有不同的大小(像素數(shù)),因此當要生成差圖像時,根據(jù)較大的金字塔圖像,對較小的金字塔圖像進行上轉換(up-convert)。當生成預定數(shù)目的差圖像時,差計算單元52將這些生成的差圖像提供給加權加 法單元53。加權加法單元53通過執(zhí)行從差計算單元52供給的差圖像的加權加法來產(chǎn)生亮度 信息圖,并將亮度信息圖提供給規(guī)范化單元討。規(guī)范化單元M使來自加權加法單元53的 亮度信息圖規(guī)范化,并將其提供給被攝對象圖產(chǎn)生單元26。[顏色信息提取單元的結構]圖5是圖示了顏色信息提取單元22的結構的示例的方框圖。顏色信息提取單元22由金字塔圖像生成單元81、金字塔圖像生成單元82、差計算 單元83、差計算單元84、加權加法單元85、加權加法單元86、規(guī)范化單元87和規(guī)范化單元 88構成。金字塔圖像生成單元81將由供給的輸入圖像的Cr分量構成的圖像設為Cr圖像。 金字塔圖像生成單元82將由供給的輸入圖像的Cb分量構成的圖像設為Cb圖像。這里,Cr 圖像和Cb圖像的像素的像素值分別被設為輸入圖像的在與Cr圖像和Cb圖像的像素的相 同位置處的像素的Cr分量和Cb分量的值。金字塔圖像生成單元81和金字塔圖像生成單元82通過利用Cr圖像和Cb圖像來 生成分辨率彼此不同的多個Cr圖像和Cb圖像。然后,金字塔圖像生成單元81和金字塔圖 像生成單元82將這些生成的Cr圖像和Cb圖像作為Cr的金字塔圖像和Cb的金字塔圖像, 提供給差計算單元83和差計算單元84。例如,作為Cr的金字塔圖像和Cb的金字塔圖像,與亮度的金字塔圖像的情況類 似,相應地生成從等級Ll到等級L7的七種分辨率的層級的金字塔圖像。差計算單元83和差計算單元84從來自金字塔圖像生成單元81和金字塔圖像生 成單元82的多個金字塔圖像之中選擇層級彼此不同的兩個金字塔圖像,獲得所選金字塔 圖像之間的差,并且生成Cr的差圖像和Cb的差圖像。同時,由于每個層級的金字塔圖像彼此具有不同的大小,因此當要生成差圖像時, 對較小的金字塔圖像進行上轉換,以具有與較大的金字塔圖像相同的大小。當差計算單元83和差計算單元84生成預定數(shù)目的Cr的差圖像和預定數(shù)目的Cb 的差圖像時,它們將這些生成的差圖像提供給加權加法單元85和加權加法單元86。加權加法單元85和加權加法單元86執(zhí)行從差計算單元83和差計算單元84供給 的差圖像的加權加法,產(chǎn)生Cr的顏色信息圖和Cb的顏色信息圖,并將它們分別提供給規(guī)范 化單元87和規(guī)范化單元88。規(guī)范化單元87和規(guī)范化單元88分別使來自加權加法單元85 和加權加法單元86的顏色信息圖規(guī)范化,并將規(guī)范化后的顏色信息圖提供給被攝對象圖 產(chǎn)生單元26。[邊緣信息提取單元的結構]圖6是圖示了邊緣信息提取單元23的結構的示例的方框圖。邊緣信息提取單元23由邊緣圖像生成單元111至邊緣圖像生成單元114、金字塔 圖像生成單元115至金字塔圖像生成單元118、差計算單元119至差計算單元122、加權加 法單元123至加權加法單元126、和規(guī)范化單元127至規(guī)范化單元130構成。邊緣圖像生成單元111至邊緣圖像生成單元114對供給的輸入圖像執(zhí)行濾波處理,以生成其中在0°、40°、90°和135°方向上的邊緣強度是像素的像素值的邊緣圖像, 作為提取的信息圖像。例如,由邊緣圖像生成單元111生成的邊緣圖像的像素的像素值指示輸入圖像的 在與邊緣圖像的像素的相同位置處的像素中的在0°方向上的邊緣強度。同時,每個邊緣的 方向指的是通過利用輸入圖像中的預定方向作為基準所確定的方向。邊緣圖像生成單元111至邊緣圖像生成單元114將生成的邊緣圖像分別提供給金 字塔圖像生成單元115至金字塔圖像生成單元118。金字塔圖像生成單元115至金字塔圖像生成單元118通過分別利用從邊緣圖像生 成單元111至邊緣圖像生成單元114供給的邊緣圖像來生成分辨率彼此不同的多個邊緣圖 像。然后,金字塔圖像生成單元115至金字塔圖像生成單元118分別將這些生成的每個方 向上的邊緣圖像作為邊緣的每個方向上的金字塔圖像,提供給差計算單元119至差計算單 元 122。例如,作為邊緣的每個方向上的金字塔圖像,與亮度的金字塔圖像的情況類似,生 成均具有從等級Ll到等級L7的七個層級的金字塔圖像。差計算單元119至差計算單元122分別從來自金字塔圖像生成單元115至金字塔 圖像生成單元118的多個金字塔圖像之中選擇層級彼此不同的兩個金字塔圖像,獲得所選 金字塔圖像的差,并且生成邊緣的每個方向上的差圖像。同時,每個層級的金字塔圖像彼此具有不同的大小。因此,當要生成差圖像時,對 較小的金字塔圖像進行上轉換,以具有與較大的金字塔圖像相同的大小。當生成預定數(shù)目的邊緣的每個方向上的差圖像時,差計算單元119至差計算單元 122將這些生成的差圖像分別提供給加權加法單元123至加權加法單元126。加權加法單元123至加權加法單元1 分別對從差計算單元119至差計算單元 122供給的差圖像執(zhí)行加權加法,產(chǎn)生每個方向上的邊緣信息圖,并分別將產(chǎn)生的每個方向 上的邊緣信息圖提供給規(guī)范化單元127至規(guī)范化單元130。規(guī)范化單元127至規(guī)范化單元 130分別將來自加權加法單元123至加權加法單元1 的邊緣信息圖規(guī)范化,并將規(guī)范化后 的邊緣信息圖提供給被攝對象圖產(chǎn)生單元26。[面部信息提取單元的結構]圖7是圖示了面部信息提取單元M的結構的示例的方框圖。面部信息提取單元M由面部檢測單元161、面部信息圖產(chǎn)生單元162和規(guī)范化單 元163構成。面部檢測單元161從供給的輸入圖像檢測作為被攝對象的人物的面部區(qū)域,并將 檢測結果作為提取的信息圖像提供給面部信息圖產(chǎn)生單元162。面部信息圖產(chǎn)生單元162 基于來自面部檢測單元161的檢測結果產(chǎn)生面部信息圖,并將面部信息圖提供給規(guī)范化單 元163。規(guī)范化單元163將從面部信息圖產(chǎn)生單元162供給的面部信息圖規(guī)范化,并將該面 部信息圖提供給被攝對象圖產(chǎn)生單元26。[運動信息提取單元的結構]圖8是圖示了運動信息提取單元25的結構的示例的方框圖。運動信息提取單元25由局部運動矢量提取單元191、全局運動矢量提取單元192、 差計算單元193和規(guī)范化單元194構成。
通過利用供給的輸入圖像、和圖像捕獲時間與該輸入圖像不同的另一輸入圖像, 局部運動矢量提取單元191檢測輸入圖像的每個像素的運動矢量作為局部運動矢量,并將 運動矢量提供給差計算單元193。通過利用供給的輸入圖像、和圖像捕獲時間與該輸入圖像不同的該另一輸入圖 像,全局運動矢量提取單元192檢測全局運動矢量,并將全局運動矢量提供給差計算單元 193。該全局運動矢量指示整個輸入圖像的運動的方向,并且該全局運動矢量例如是輸入圖 像的像素的運動矢量的平均值。差計算單元193獲得來自局部運動矢量提取單元191的局部運動矢量與來自全局 運動矢量提取單元192的全局運動矢量之間的差的絕對值,以生成運動的差圖像,并將該 差圖像提供給規(guī)范化單元194。這里,運動的差圖像中的像素的像素值是輸入圖像的在與運動的差圖像中的像素 的相同位置處的像素的局部運動矢量與整個輸入圖像的全局運動矢量之間的差的絕對值。 因此,運動的差圖像的像素的像素值指示關于在輸入圖像的像素中顯示的對象體(或者背 景)的整個輸入圖像的運動量,即,相對于背景的運動量。規(guī)范化單元194通過將來自差計算單元193的運動的差圖像規(guī)范化來產(chǎn)生運動信 息圖,并將運動信息圖提供給被攝對象圖產(chǎn)生單元沈。同時,更詳細地,在供給關于時間連 續(xù)捕獲的圖像(例如連續(xù)捕獲輸入圖像的圖像)、或者運動圖像作為輸入圖像的情況下,執(zhí) 行運動信息圖的產(chǎn)生。[被攝對象區(qū)域識別處理的說明]順便提及,當輸入圖像被提供給圖像處理設備11時,圖像處理設備11開始被攝對 象區(qū)域識別處理,識別輸入圖像中的被攝對象的區(qū)域,并輸出識別結果。下面將參照圖9的 流程圖來說明被攝對象區(qū)域識別處理。在步驟S11,亮度信息提取單元21執(zhí)行亮度信息提取處理,以便基于供給的輸入 圖像產(chǎn)生亮度信息圖,并將亮度信息圖提供給被攝對象圖產(chǎn)生單元26。然后,在步驟S12, 顏色信息提取單元22執(zhí)行顏色信息提取處理,以便基于供給的輸入圖像產(chǎn)生顏色信息圖, 并將顏色信息圖提供給被攝對象圖產(chǎn)生單元26。在步驟S13,邊緣信息提取單元23執(zhí)行邊緣信息提取處理,以便基于供給的輸入 圖像產(chǎn)生邊緣信息圖,并將邊緣信息圖提供給被攝對象圖產(chǎn)生單元26。此外,在步驟S14, 面部信息提取單元M執(zhí)行面部信息提取處理,以便基于供給的輸入圖像產(chǎn)生面部信息圖, 并將面部信息圖提供給被攝對象圖產(chǎn)生單元26。此外,在步驟S15,運動信息提取單元25 執(zhí)行運動信息提取處理,以便基于供給的輸入圖像產(chǎn)生運動信息圖,并將運動信息圖提供 給被攝對象圖產(chǎn)生單元26。同時,后面將描述亮度信息提取處理、顏色信息提取處理、邊緣信息提取處理、面 部信息提取處理和運動信息提取處理的細節(jié)。此外,更具體地,在關于時間連續(xù)拍攝的輸入 圖像未提供給運動信息提取單元25的情況下,不執(zhí)行運動信息提取處理。在步驟S16,被攝對象圖產(chǎn)生單元沈執(zhí)行從亮度信息提取單元21到運動信息提取 單元25供給的亮度信息圖到運動信息圖的加權加法,以便產(chǎn)生被攝對象圖,并將被攝對象 圖提供給被攝對象區(qū)域識別單元27。例如,被攝對象圖產(chǎn)生單元沈通過利用信息加權Wb來執(zhí)行每個信息圖的線性組合,信息加權Wb是預先關于每個信息圖獲得的加權。即,當通過線性組合獲得的信息圖的 預定像素被設為關注像素時,關注像素的像素值是通過使每個信息圖的在與關注像素的相 同位置處的像素的像素值乘以每個信息圖的信息加權Wb而獲得的值的總和。接下來,被攝對象圖產(chǎn)生單元沈對通過線性組合獲得的信息圖(下面也稱為線性 組合信息圖)的每個像素的像素值,執(zhí)行利用S形函數(shù)的計算處理。更具體地,被攝對象圖產(chǎn)生單元沈預先保存通過使S形函數(shù)形成為表格而獲得的 轉換表。該轉換表由所輸入的預定值、和通過將所述值代入S形函數(shù)而獲得的輸出值形成。 如果利用轉換表來轉換線性組合信息圖,那么獲得與利用S形函數(shù)轉換線性組合信息圖的 情況類似的信息圖。例如,S形函數(shù)是在下面的表達式(1)中所示的雙曲余弦函數(shù)(雙曲正切函數(shù))。f (x) = aXtanh(xXb)...(1)同時,在表達式(1)中,a和b均表示預定常數(shù),并且χ表示要從現(xiàn)在轉換的線性 組合信息圖的像素的像素值。在這樣的雙曲余弦函數(shù)是S形函數(shù)的情況下,使轉換表成為這樣的表,即該表是 通過將輸入值X的范圍限制為-2到2并且通過以1/1 為單位使輸入值χ離散而獲得的。 在這樣的轉換表中,當輸入值χ小于-2時,輸入值χ被處理為_2,而當輸入值χ大于2時, 輸入值χ被處理為2。此外,在轉換表中,輸入值χ越大,輸出值f(x)越大。被攝對象圖產(chǎn)生單元沈通過將線性組合信息圖的像素的像素值從像素X (輸入值 χ)變成與像素值X對應的輸出值f(x),來轉換線性組合信息圖。即,被攝對象圖產(chǎn)生單元 26將通過利用轉換表轉換的線性組合信息圖設為其中執(zhí)行了利用S形函數(shù)的計算處理的 線性組合信息圖。如上所述,與通過利用S形函數(shù)本身執(zhí)行轉換的情況相比,通過利用轉換表轉換 線性組合信息圖,能夠更容易和更快地轉換線性組合信息圖。此外,被攝對象圖產(chǎn)生單元沈將利用轉換表轉換的線性組合信息圖的每個像素 的像素值乘以被攝對象加權Wc (其是預先關于每個像素獲得的加權),以形成被攝對象圖。S卩,當要獲得的被攝對象圖中的被注意的像素被設為關注像素時,通過使在與已 轉換的線性組合信息圖的關注像素的相同位置處的像素的像素值乘以被攝對象加權Wc而 獲得的值被設為關注像素的像素值。同時,更具體地,作為用于產(chǎn)生被攝對象圖的顏色信息圖,使用Cr的顏色信息圖 和Cb的顏色信息圖,并且作為邊緣信息圖,使用在0°、45°、90°和135°方向的每個方向 上的邊緣信息圖。此外,通過學習預先獲得了信息加權Wb和被攝對象加權Wc。當按照上述方式產(chǎn)生被攝對象圖時,從被攝對象圖產(chǎn)生單元沈將被攝對象圖提 供給被攝對象區(qū)域識別單元27,然后處理進行到步驟S17。在步驟S17,被攝對象區(qū)域識別單元27通過利用從被攝對象圖產(chǎn)生單元沈供給的 被攝對象圖來識別供給的輸入圖像中的被攝對象的區(qū)域。例如,被攝對象圖中的像素的像素值越大,則認為輸入圖像中的在與該像素的相 同位置處的像素的區(qū)域更可能是被攝對象的區(qū)域。這種情況下,被攝對象區(qū)域識別單元27 檢測以下區(qū)域該區(qū)域在被攝對象圖中具有大于或等于預定閾值的像素值、由彼此相鄰的 像素構成、并且具有預定面積(像素數(shù))或更大面積,并且輸入圖像中的與檢測到的區(qū)域對應的區(qū)域是包含被攝對象的區(qū)域。當被攝對象區(qū)域識別單元27檢測輸入圖像的包含被攝對象的區(qū)域時,被攝對象 區(qū)域識別單元27將檢測結果輸出給下一級,并且完成被攝對象區(qū)域識別處理。按照上述方式獲得的被攝對象的區(qū)域的檢測結果被用于各種處理,諸如在輸入圖 像的被攝對象的區(qū)域中執(zhí)行的預定圖像處理。此外,被攝對象的區(qū)域的識別結果可被用于 以下圖像處理當輸入圖像被顯示為幻燈片時,將輸入圖像的被攝對象的區(qū)域顯示在屏幕 中央。同時,通過利用被攝對象的區(qū)域的檢測結果,被攝對象區(qū)域識別單元27可對輸入 圖像執(zhí)行預定處理,并輸出圖像。如上所述,圖像處理設備11從輸入圖像產(chǎn)生被攝對象圖,并通過利用被攝對象圖 來識別輸入圖像中的被攝對象的區(qū)域。[亮度信息提取處理的說明]接下來,將說明對應于圖9的步驟Sll至S15的各個處理的處理。首先,下面參照圖10的流程圖來說明與圖9的步驟Sll的處理對應的亮度信息提 取處理。在步驟S41,基于由供給的輸入圖像的Y (亮度)分量構成的亮度圖像,金字塔圖像 生成單元51生成從等級Ll到等級L7的每個層級的金字塔圖像,并將這些金字塔圖像提供 給差計算單元52。在現(xiàn)有技術的視覺注意中,生成八個層級的金字塔圖像。在圖像處理設備11中, 由于生成七個層級的金字塔圖像,所以所生成的金字塔圖像的數(shù)目減少一個。因此,與現(xiàn)有 技術相比,能夠更容易和更快地獲得亮度信息圖。同時,即使將金字塔圖像的層級數(shù)設為7,申請人已證實不會對利用被攝對象圖的 被攝對象的區(qū)域的識別準確度有影響。根據(jù)圖像處理設備11,能夠更快地獲得被攝對象圖, 而不降低被攝對象的區(qū)域的識別準確度。此外,在現(xiàn)有技術的視覺注意中,通過獲得輸入圖像的每個R、G和B分量的平均 值,生成亮度圖像。相比之下,在圖像處理設備11中,通過直接利用輸入圖像的Y(亮度) 分量作為亮度圖像,能夠更容易和更快地獲得亮度圖像。另外,結果是,不必設置用于生成 亮度圖像的電路,并能夠減小圖像處理設備11的大小。在步驟S42,差計算單元52通過利用從金字塔圖像生成單元51供給的金字塔圖像 來生成差圖像,并將差圖像提供給加權加法單元53。更具體地,差計算單元52獲得每個層級的亮度的金字塔圖像之中的等級L2與等 級L5、等級L2與等級L6、等級L3與等級L6、等級L3與等級L7、和等級L4與等級L7的層 級組合的金字塔圖像之間的差。結果,獲得總共5個亮度的差圖像。例如,在生成等級L2與等級L5的組合的差圖像的情況下,根據(jù)等級L2的金字塔 圖像的大小,對等級L5的金字塔圖像進行上轉換。即,在上轉換之前的等級L5的金字塔圖像的一個像素的像素值被設為與該一個 像素對應的、在上轉換之后的等級L5的金字塔圖像的幾個彼此相鄰的像素的像素值。然 后,獲得等級L5的金字塔圖像的像素的像素值與等級L2的金字塔圖像的在與等級L5的金 字塔圖像的該像素的相同位置處的像素的像素值之間的差,并且該差被設為差圖像的像素的像素值。用于生成這些差圖像的處理等同于對亮度圖像執(zhí)行的利用帶通濾波器的濾波處 理并從亮度圖像提取特定頻率分量的處理。按照上述方式獲得的差圖像的像素的像素值指 示每個等級的金字塔圖像的像素值之間的差,即,輸入圖像中的預定像素中的亮度與該像 素的周圍區(qū)域中的平均亮度之間的差。通常,圖像中的與周圍區(qū)域具有較大亮度差的區(qū)域是吸引觀看圖像的人物的注意 力的區(qū)域。從而,該區(qū)域成為被攝對象的區(qū)域的概率高。因此,可以認為在每個差圖像中具 有大的像素值的像素是成為被攝對象的區(qū)域的概率高的區(qū)域。在步驟S43,加權加法單元53基于從差計算單元52供給的差圖像來產(chǎn)生亮度信息 圖,并將亮度信息圖提供給規(guī)范化單元M。例如,加權加法單元53通過利用作為預先獲得的每個差圖像的加權的差加權Wa, 執(zhí)行五個供給的差圖像的加權加法,以產(chǎn)生亮度信息圖。即,使在與每個差圖像的相同位置 處的像素的每個像素值乘以差加權Wa,并且獲得乘以差加權Wa的像素值的總和。同時,當要產(chǎn)生亮度信息圖時,執(zhí)行對差圖像的上轉換,使得差圖像具有相同的大 小。此外,假定差加權Wa是預先通過學習而獲得的。接下來,加權加法單元53通過利用與被攝對象圖產(chǎn)生單元沈所保存的轉換表相 同的轉換表,來轉換所獲得的亮度信息圖的像素的像素值,并將這樣獲得的亮度信息圖提 供給規(guī)范化單元M。另外,在加權加法單元53中,通過利用轉換表來轉換亮度信息圖,能夠更容易和 更快地執(zhí)行轉換。在步驟S44,規(guī)范化單元M使來自加權加法單元53的亮度信息圖規(guī)范化,并將這 樣獲得的亮度信息圖作為最終的亮度信息圖提供給被攝對象圖產(chǎn)生單元26。然后,在輸出 亮度信息圖時,完成亮度信息提取處理。之后,處理進行到圖9的步驟S12。例如,首先,規(guī)范化單元M將亮度信息圖線性規(guī)范化。例如,當亮度信息圖的像素 值的范圍是0到200的范圍時,通過線性規(guī)范化使像素值的范圍成為0到255的范圍。接下來,規(guī)范化單元M獲得已被線性規(guī)范化的亮度信息圖的像素的像素值的平 均值。即,將亮度信息圖的所有像素的像素值的總值除以亮度信息圖的像素數(shù),以獲得平均 值。此外,規(guī)范化單元M將通過從線性規(guī)范化的亮度信息圖的每個像素的像素值減 去獲得的平均值而得到的值設為最終的亮度信息圖的像素的像素值。同時,更具體地,關于通過從像素值減去平均值而獲得的值為負值(小于0的值) 的亮度信息圖的像素,像素的像素值被設為0。即,在線性規(guī)范化的亮度信息圖的像素之中 的其像素值小于或等于平均值的像素的最終像素值被設為0。這里,包含在亮度信息圖中的噪聲的大部分數(shù)值都小于或等于亮度信息圖的每個 像素的平均值。從而,通過從每個像素的像素值減去平均值,從亮度信息圖可靠地去除噪 聲。其原因在于噪聲部分的像素的像素值被設為0。此外,在線性規(guī)范化的亮度信息圖中, 在多數(shù)情況下,在與輸入圖像中的被攝對象的區(qū)域相同位置處的像素的像素值大于平均 值。從而,即使從亮度信息圖的像素值減去平均值并進行規(guī)范化,也不會降低被攝對象的檢 測準確度。
如上所述,通過對亮度信息圖進行線性規(guī)范化并通過從線性規(guī)范化后的亮度信息 圖的像素值減去平均值,能夠更容易和更快地將亮度信息圖規(guī)范化。具體地,根據(jù)亮度信息 提取處理單元21,能夠利用線性規(guī)范化以及簡單的平均值計算和減法處理,來獲得大致與 使用DOG濾波器的情況相同程度的噪聲去除效果。S卩,目前為止,信息圖的規(guī)范化是通過利用DOG濾波器的濾波處理執(zhí)行的。這種濾 波處理涉及大量的處理,并且不能快速地執(zhí)行規(guī)范化。相比之下,規(guī)范化單元M能夠利用 比使用DOG濾波器的情況更簡單的處理,更快地使亮度信息圖規(guī)范化。此外,規(guī)范化使得能 夠更可靠地從亮度信息圖中去除噪聲,并且不會降低被攝對象的區(qū)域的檢測準確度。如上所述,亮度信息提取單元21從輸入圖像產(chǎn)生亮度信息圖。根據(jù)以上述方式獲 得的亮度信息圖,能夠容易地檢測輸入圖像中的亮度差較大的區(qū)域,即,可由瞥一眼輸入圖 像的觀察者容易地識別的區(qū)域。[顏色信息提取處理的說明]接下來,下面將參照圖11的流程圖來說明由圖9的步驟S12的處理進行的顏色信 息提取處理。在步驟S71,金字塔圖像生成單元81和金字塔圖像生成單元82基于由供給的輸 入圖像的色差分量構成的Cr圖像和Cb圖像來生成等級Ll到等級L7的層級中的金字塔圖 像。即,執(zhí)行與參照圖3和4說明的處理相同的處理,并且生成Cr的金字塔圖像和Cb的金 字塔圖像。金字塔圖像生成單元81和金字塔圖像生成單元82將生成的金字塔圖像分別提供 給差計算單元83和差計算單元84。如上所述,另外,在顏色信息提取單元22中,與亮度信息提取單元21的情況類似, 由于生成七個層級的金字塔圖像就足夠了,因此能夠比現(xiàn)有技術更容易和更快地獲得顏色 信息圖。此外,在現(xiàn)有技術的視覺注意中,提取輸入圖像的像素的R分量與G分量之間的 差、以及輸入圖像的像素的B分量與Y(黃色)分量之間的差作為顏色信息。從而,需要用 于獲得這些差的處理。相比之下,在圖像處理設備11中,通過直接將輸入圖像的色差分量設為Cr圖像和 Cb圖像,能夠更容易和更快地獲得關于顏色的提取信息圖像。此外,結果是,不必設置用于 獲得差的電路,從而使得能夠減小圖像處理設備11的大小。在步驟S72,差計算單元83和差計算單元84分別基于從金字塔圖像生成單元81 和金字塔圖像生成單元82供給的金字塔圖像生成差圖像,并分別將差圖像提供給加權加 法單元85和加權加法單元86。例如,差計算單元83獲得層級的Cr的金字塔圖像之中的等級L2與等級L5、等級 L2與等級L6、等級L3與等級L6、等級L3與等級L7、和等級L4與等級L7的組合的金字塔 圖像之間的差。結果,獲得總共5個Cr的差圖像。同時,當要生成差圖像時,根據(jù)具有較大 像素數(shù)的金字塔圖像,對具有較小像素數(shù)的金字塔圖像進行上轉換。此外,差計算單元84通過執(zhí)行與差計算單元83相同的處理來生成總共5個Cb的 差圖像。生成這些差圖像的處理等同于對Cr圖像或Cb圖像執(zhí)行利用帶通濾波器的濾波處理以從Cr圖像或Cb圖像提取預定頻率分量的處理。按照上述方式獲得的差圖像的像素的 像素值指示等級的金字塔圖像之間的差,即,輸入圖像的像素中的特定顏色的分量與該像 素的周圍區(qū)域中的平均特定顏色的分量之間的差。通常,圖像中的具有比周圍區(qū)域更明顯的顏色的區(qū)域,S卩,與特定顏色分量的周圍 區(qū)域具有較大差異的區(qū)域是吸引觀看圖像的人物的注意力的區(qū)域。從而,該區(qū)域成為被攝 對象的區(qū)域的概率高。因此,可認為在每個差圖像中的具有更大像素值的像素指示該區(qū)域 更可能是被攝對象的區(qū)域。在步驟S73,基于從差計算單元83和差計算單元84供給的差圖像,加權加法單元 85和加權加法單元86生成Cr的顏色信息圖和Cb的顏色信息圖,并將它們分別提供給規(guī)范 化單元87和規(guī)范化單元88。例如,加權加法單元85通過利用預先獲得的每個差圖像的差加權Wa來執(zhí)行從差 計算單元83供給的Cr的差圖像的加權加法,從而形成Cr的一個顏色信息圖。接下來,加權 加法單元85通過利用與被攝對象圖產(chǎn)生單元沈所保存的轉換表相同的轉換表,來轉換獲 得的Cr的顏色信息圖的像素的像素值,并將這樣獲得的顏色信息圖提供給規(guī)范化單元87。類似地,加權加法單元86通過利用預先獲得的差加權Wa來執(zhí)行從差計算單元84 提供的Cb的差圖像的加權加法以形成Cb的一個顏色信息圖,通過利用轉換表來轉換Cb的 顏色信息圖,并將轉換后的顏色信息圖提供給規(guī)范化單元88。另外,在加權加法單元85和加權加法單元86中,通過利用轉換表來轉換顏色信息 圖,能夠更容易和更快地執(zhí)行轉換。同時,當要產(chǎn)生顏色信息圖時,對差圖像進行上轉換,使 得差圖像具有相同的大小。在步驟S74,規(guī)范化單元87和規(guī)范化單元88分別使來自加權加法單元85和加權 加法單元86的顏色信息圖規(guī)范化,并將這樣獲得的顏色信息圖作為最終的顏色信息圖,提 供給被攝對象圖產(chǎn)生單元26。例如,規(guī)范化單元87和規(guī)范化單元88執(zhí)行與圖10的步驟 S44的處理相同的處理,以使Cr的顏色信息圖和Cb的顏色信息圖規(guī)范化。然后,當輸出顏色信息圖時,完成顏色信息提取處理,之后處理進行到圖9的步驟 S13。如上所述,通過使顏色信息圖規(guī)范化和從線性規(guī)范化后的顏色信息圖的像素值減 去平均值,能夠更容易和更快地使顏色信息圖規(guī)范化。按照上述方式,顏色信息提取單元22從輸入圖像提取特定顏色的分量的圖像,并 從該圖像產(chǎn)生顏色信息圖。根據(jù)以上述方式獲得的顏色信息圖,能夠容易地檢測輸入圖像 中具有比周圍區(qū)域的特定顏色的更大分量的區(qū)域,即,可由瞥一眼輸入圖像的觀察者容易 地識別的區(qū)域。同時,在顏色信息提取單元22中,提取Cr和Cb分量作為關于從輸入圖像提取的 顏色的信息。然而,可以提取R(紅色)分量與G(綠色)分量之間的差以及B(藍色)分量 與Y(黃色)分量之間的差。[邊緣信息提取處理的說明]接下來,下面將參照圖12的流程圖來說明對應于圖9的步驟S13的處理的邊緣信 息提取處理。在步驟S111,基于供給的輸入圖像,邊緣圖像生成單元111至邊緣圖像生成單元114生成其中在0°、45°、90°和135°方向上的邊緣強度是像素的像素值的邊緣圖像。例如,邊緣圖像生成單元111至邊緣圖像生成單元114預先保存圖13所示的濾波 器,并利用這些濾波器生成邊緣圖像,作為提取的信息圖像。在圖13的示例中,濾波器1、濾 波器2、濾波器45和濾波器135的每一個是一個濾波器。濾波器1中的數(shù)值“-1、_2、-1、2、4、2、-1、-2、-1”指示乘以輸入圖像的像素的系數(shù)。這里,輸入圖像中的預定方向(例如圖4中的水平方向)將被稱為χ方向,并且垂 直于χ方向的方向(即圖4中的垂直方向)將稱為y方向。這種情況下,在利用濾波器1的濾波處理中,在χ方向上連續(xù)排列的9個像素的像 素值分別乘以系數(shù)“-1”、“-2”、“_1”、“2”、“4”、“2”、“-1”、“-2”和“_1”,并將乘以系數(shù)的像 素值的和除以“16”。然后,使這樣獲得的值是以下像素值該像素值是通過對在連續(xù)排列 的9個像素的中心的像素執(zhí)行利用濾波器1的濾波處理而獲得的。在圖13中,以與乘以這些系數(shù)的像素的排列相同的排列對濾波器1的系數(shù)進行設 置。因此,例如,系數(shù)“-1”乘以位于在χ方向上排列的像素的兩端處的像素,并且在χ方向 上排列的像素之中的位于中心的像素乘以系數(shù)“4”。同時,在圖13中,以與乘以這些系數(shù)的像素的排列相同的排列對其它濾波器的系 數(shù)進行設置。此外,在利用濾波器2的濾波處理中,在χ方向上連續(xù)排列的8個像素的像素值分 別乘以系數(shù)“1”、“3”、“3”、“1”、“1”、“3”、“3”和“1”,并將乘以系數(shù)的像素值的和除以“16”。 然后,使這樣獲得的值是以下像素值該像素值是通過對在連續(xù)排列的8個像素的中心的 像素(更具體地,結果是,圖中乘以第四或第五系數(shù)“1”的像素)執(zhí)行利用濾波器2的濾波 處理而獲得的。在利用濾波器45的濾波處理中,使用在由總共9個像素(在χ方向上的3個像素 和在y方向上的3個像素)構成的區(qū)域內的像素。這些像素的像素值乘以系數(shù)“0”、“1”、 “2”、“-1”、“0”、“1”、“-2”、“-1”和“0”。然后,將乘以系數(shù)的像素的像素值的和除以“8”, 并使這樣獲得的值是以下像素值該像素值是通過對位于對其執(zhí)行處理的區(qū)域的中心的像 素執(zhí)行利用濾波器45的濾波處理而獲得的。因此,例如,位于要處理的目標區(qū)域的中心的 像素乘以系數(shù)“0”,并且圖中的與該像素的左側相鄰的像素乘以系數(shù)“-1”。此外,在利用濾波器135的濾波處理中,使用在由總共9個像素(在χ方向上的3 個像素和在y方向上的3個像素)構成的區(qū)域內的像素。這些像素的像素值分別乘以系數(shù) “2,,、“ 1,,、“0,,、“ 1,,、“0,,、“-1,,、“0,,、“-1”和“-2”。然后,將乘以系數(shù)的像素的像素值的和 除以“8”,并且使這樣獲得的值是以下像素值該像素值是通過對位于要處理的目標區(qū)域 的中心的像素執(zhí)行利用濾波器135的濾波處理而獲得的。例如,邊緣圖像生成單元111對輸入圖像執(zhí)行利用濾波器1的濾波處理,并將通過 對這樣獲得的圖像執(zhí)行利用濾波器2的濾波處理而獲得的圖像設為在0°方向上的邊緣圖 像。此外,邊緣圖像生成單元112將通過對輸入圖像執(zhí)行利用濾波器45的濾波處理而獲得 的圖像設為在45°方向上的邊緣圖像。邊緣圖像生成單元113對輸入圖像執(zhí)行利用濾波器2的濾波處理,并將通過進一 步對這樣獲得的圖像執(zhí)行利用濾波器1的濾波處理而獲得的圖像設為在90°方向上的邊緣圖像。此外,邊緣圖像生成單元114將通過對輸入圖像執(zhí)行利用濾波器135的濾波處理 而獲得的圖像設為在135°方向上的邊緣圖像。如上所述,邊緣圖像生成單元111至邊緣圖像生成單元114通過利用預先保存的 濾波器1、濾波器2、濾波器45和濾波器135中的至少一個來生成在每個方向上的邊緣圖 像。這些濾波器是通過近似Gabor濾波器而獲得的、并具有與Gabor濾波器相近的特性的 濾波器。因此,通過利用這些濾波器,獲得與在利用Gabor濾波器的情況類似的在每個方 向上的邊緣圖像。此外,利用這些濾波器的濾波處理是利用預定系數(shù)的加權加法的計算,并 且濾波處理不需要諸如指數(shù)計算的復雜計算。在現(xiàn)有技術的視覺注意中,使用Gabor濾波器來獲得邊緣圖像。然而,在圖像處理 設備11中,通過組合濾波器1、濾波器2、濾波器45和濾波器135來執(zhí)行濾波處理,能夠更 容易和更快地獲得邊緣圖像。同時,用于生成邊緣圖像的濾波器并不局限于圖13所示的示例,并且可以使用其 中結合Sobel濾波器和Roberts濾波器的濾波器。在這種情況下,例如,使用圖14所示的 濾波器。在圖14的示例中,使濾波器O、濾波器90、濾波器45和濾波器135均是一個濾波 器。同時,在圖14中,以與乘以這些系數(shù)的輸入圖像的像素的排列相同的排列對濾波器的 系數(shù)進行設置。濾波器O中的數(shù)值“1、2、1、0、0、0、-1、_2和-1”表示乘以輸入圖像的像素的系數(shù)。 在利用濾波器O的濾波處理中,使用由總共9個像素(即,在X方向上的3個像素和在y方 向上的3個像素)構成的區(qū)域中的像素,并且系數(shù)“ 1 ”、“ 2,,、“ 1,,、“O,,、“O,,、“O,,、“-1,,、“-2,, 和“_1”乘以這些像素的像素值。然后,將乘以系數(shù)的像素的像素值的和除以“8”,并且使這 樣獲得的值是以下像素值該像素值是通過對位于要處理的目標區(qū)域的中心的像素執(zhí)行利 用濾波器O的濾波處理而獲得的。因此,例如,使位于要處理的目標區(qū)域的中心的像素乘以 系數(shù)“0”,并使與該像素的圖中的上側相鄰的像素乘以系數(shù)“2”。 類似地,在利用濾波器90的濾波處理中,使用由總共9個像素(S卩,在χ方向上的 3個像素和在y方向上的3個像素)構成的區(qū)域中的像素。使這些像素的像素值分別乘以 系數(shù)“ 1,,、“O,,、“-1,,、“ 2,,、“O,,、“-2,,、“ 1,,、“O ”和“-1 ”。然后,將乘以系數(shù)的像素的像素值 的和除以“8”,并且使這樣獲得的值是以下像素值該像素值是通過對位于要處理的目標 區(qū)域的中心的像素執(zhí)行利用濾波器90的濾波處理而獲得的。此外,在利用濾波器45的濾波處理中,使用由總共4個像素(S卩,在χ方向上的2 個像素和在y方向上的2個像素)構成的區(qū)域中的像素,并且使這些像素的像素值分別乘 以系數(shù)“0”、“1”、“-1”和“O”。然后,將乘以系數(shù)的像素的像素值的和除以“2”,并且使這樣 獲得的值是以下像素值該像素值是通過對位于要處理的目標區(qū)域的中心的像素(更具體 地,乘以左上方的系數(shù)“O”的像素)執(zhí)行利用濾波器45的濾波處理而獲得的。此外,在利用濾波器135的濾波處理中,使用由總共4個像素(即,在χ方向上的2 個像素和在y方向上的2個像素)構成的區(qū)域中的像素,并且使這些像素的像素值分別乘 以系數(shù)“1”、“0”、“0”和“-1”。然后,將乘以系數(shù)的像素的像素值的和除以“2”,并使這樣 獲得的值是以下像素值該像素值是通過對位于要處理的目標區(qū)域的中心的像素(更具體地,乘以左上方的系數(shù)“1”的像素)執(zhí)行利用濾波器135的濾波處理而獲得。例如,邊緣圖像生成單元111至邊緣圖像生成單元114分別對輸入圖像執(zhí)行利用 濾波器0、濾波器45、濾波器90和濾波器135的濾波處理,并使這樣獲得的圖像為在0°、 45°、90°和135°方向上的邊緣圖像。如上所述,在圖14的示例的情況下,濾波處理同樣不需要復雜的計算處理,諸如 指數(shù)計算。從而,能夠更容易和更快地獲得邊緣圖像。返回參照圖12的流程圖的說明,當邊緣圖像生成單元111至邊緣圖像生成單元 114生成在每個方向上的邊緣圖像時,它們將生成的邊緣圖像分別提供給金字塔圖像生成 單元115至金字塔圖像生成單元118。在步驟S112,基于來自邊緣圖像生成單元111至邊緣圖像生成單元114的邊緣圖 像,金字塔圖像生成單元115至金字塔圖像生成單元118生成金字塔圖像,并將它們分別提 供給差計算單元119至差計算單元122。S卩,執(zhí)行與參照圖3和4說明的處理相同的處理,關于在每個方向上的邊緣圖像生 成等級Ll到等級L7的層級的金字塔圖像。另外,在邊緣信息提取單元23中,與亮度信息 提取單元21的情況類似,生成七個層級的金字塔圖像就足夠了。從而,能夠比現(xiàn)有技術更 容易和更快地獲得邊緣信息圖。在步驟S113,基于從金字塔圖像生成單元115至金字塔圖像生成單元118供給的 金字塔圖像,差計算單元119至差計算單元122生成差圖像,并將它們分別提供給加權加法 單元123至加權加法單元126。例如,差計算單元119獲得每個層級的在0°方向上的金字塔圖像之中的等級L2 與等級L5、等級L2與等級L6、等級L3與等級L6、等級L3與等級L7、和等級L4與等級L7的 層級的組合的金字塔圖像中的差。結果,獲得總共5個差圖像。同時,當要生成差圖像時, 根據(jù)像素數(shù)較大的金字塔圖像,對像素數(shù)較小的金字塔圖像進行上轉換。此外,差計算單元120至差計算單元122執(zhí)行與差計算單元119相同的處理,以生 成總共5個差圖像。生成這些差圖像的處理等同于對邊緣圖像執(zhí)行利用帶通濾波器的濾波處理以從 邊緣圖像提取預定頻率分量的處理。按照上述方式獲得的差圖像的像素的像素值指示每個 等級的金字塔圖像的邊緣強度之差,即,在輸入圖像的預定位置處的邊緣強度與在該位置 的周圍區(qū)域中的平均邊緣強度的差。通常,圖像中的具有比周圍區(qū)域更大的邊緣強度的區(qū)域是吸引觀看圖像的人物的 注意力的區(qū)域。從而,該區(qū)域成為被攝對象的區(qū)域的概率高。因此,在每個差圖像中,可以 認為像素值較大的像素指示成為被攝對象的區(qū)域的概率較高的區(qū)域。在步驟S114,基于從差計算單元119至差計算單元122供給的差圖像,加權加法單 元123至加權加法單元126產(chǎn)生在0°、45°、90°和135°方向上的邊緣信息圖。例如,加權加法單元123通過利用預先獲得的每個差圖像的差加權Wa執(zhí)行從差計 算單元119供給的在0°方向上的差圖像的加權加法,以形成一個在0°方向上的邊緣信息 圖。接下來,加權加法單元123通過利用與被攝對象圖產(chǎn)生單元沈所保存的轉換表相同的 轉換表,來轉換獲得的在0°方向上的邊緣信息圖的像素的像素值,并將這樣獲得的邊緣信 息圖提供給規(guī)范化單元127。
類似地,加權加法單元124至加權加法單元126通過利用預先獲得的差加權Wa執(zhí) 行從差計算單元120至差計算單元122供給的每個方向的差圖像的加權加法,以形成一個 邊緣信息圖。然后,加權加法單元1 至加權加法單元1 通過利用轉換表來轉換獲得的 邊緣信息圖,并將其提供給規(guī)范化單元1 至規(guī)范化單元130。另外,在加權加法單元123至加權加法單元1 中,通過利用轉換表轉換邊緣信息 圖,能夠更容易和更快地執(zhí)行轉換。同時,當要產(chǎn)生邊緣信息圖時,執(zhí)行對差圖像的上轉換, 使得差圖像具有相同的大小。在步驟Sl 15,規(guī)范化單元127至規(guī)范化單元130使來自加權加法單元123至加權 加法單元126的邊緣信息圖規(guī)范化,并將這樣獲得的最終的邊緣信息圖提供給被攝對象圖 產(chǎn)生單元沈。例如,規(guī)范化單元127至規(guī)范化單元130執(zhí)行與圖10的步驟S44的處理相同 的處理,以使在每個方向上的邊緣信息圖規(guī)范化。然后,當輸出邊緣信息圖時,完成邊緣信息提取處理,之后處理進行到圖9的步驟 S14。如上所述,通過使邊緣信息圖線性規(guī)范化并通過從線性規(guī)范化后的邊緣信息圖減 去像素值的平均值,能夠更容易和更快地使邊緣信息圖規(guī)范化。按照上述方式,邊緣信息提取單元23從輸入圖像獲得特定方向的方向上的邊緣 的差圖像,并從差圖像產(chǎn)生邊緣信息圖。根據(jù)以上述方式獲得的每個方向的邊緣信息圖,能 夠容易地檢測輸入圖像中比周圍區(qū)域具有在特定方向的方向上較大邊緣強度的區(qū)域,即, 可容易地由瞥一眼輸入圖像的觀察者識別的區(qū)域。[面部信息提取處理的說明]接下來,下面將參照圖15的流程圖來說明對應于圖9的步驟S14的處理的面部信 息提取處理。在步驟S141,面部檢測單元161從供給的輸入圖像檢測人物的面部的區(qū)域,并將 檢測結果提供給面部信息圖產(chǎn)生單元162。例如,面部檢測單元161對輸入圖像執(zhí)行利用 Gabor濾波器的濾波處理,并通過從輸入圖像提取諸如如眼睛、嘴巴、鼻子等的特征區(qū)域來 檢測輸入圖像中的面部的區(qū)域。在步驟S142,面部信息圖產(chǎn)生單元162通過利用來自面部檢測單元161的檢測結 果來產(chǎn)生面部信息圖,并將面部信息圖提供給規(guī)范化單元163。例如,假定作為來自輸入圖像的面部的檢測結果,檢測到輸入圖像中的推測包含 有面部的多個矩形區(qū)域(下面稱為候選區(qū)域)。這里,還假定在輸入圖像中的預定位置附近 檢測到多個候選區(qū)域,并且這些候選區(qū)域的部分可彼此重疊。即,例如,在關于輸入圖像中 的一個面部的區(qū)域獲得包含面部的多個區(qū)域作為候選區(qū)域的情況下,這些候選區(qū)域的部分
彼此重疊。面部信息圖產(chǎn)生單元162關于通過檢測面部而獲得的候選區(qū)域,針對每個候選區(qū) 域生成具有與輸入圖像相同大小的檢測圖像。該檢測圖像被形成,其方式為使得檢測圖像 中的與要處理的候選區(qū)域的相同區(qū)域中的像素的像素值是大于在不同于候選區(qū)域的區(qū)域 中的像素的像素值的值。此外,檢測圖像中的像素的像素值越大,則在與推測包含人物的面部的概率較高 的候選區(qū)域的相同位置處的像素的像素值越大。面部信息圖產(chǎn)生單元162將按照上述方式獲得的檢測圖像相加以生成一個圖像,從而形成面部信息圖。因此,在面部信息圖中,在與 同輸入圖像中的多個候選區(qū)域的部分重疊的區(qū)域相同的區(qū)域中的像素的像素值增大,并且 包含面部的概率是高的。在步驟S143,規(guī)范化單元163使從面部信息圖產(chǎn)生單元162供給的面部信息圖規(guī) 范化,并將這樣獲得的面部信息圖作為最終的面部信息圖,提供給被攝對象圖產(chǎn)生單元沈。 例如,規(guī)范化單元163執(zhí)行與圖10的步驟S44的處理相同的處理,以使面部信息圖規(guī)范化。然后,當輸出面部信息圖時,完成面部信息提取處理,之后,處理進行到圖9的步 馬聚S15 ο按照上述方式,面部信息提取單元M從輸入圖像中檢測面部,并從檢測結果產(chǎn)生 面部信息圖。按照以上述方式獲得的面部信息圖,能夠容易地檢測作為被攝對象的人物的 面部的區(qū)域。[運動信息提取處理的說明]此外,下面將參照圖16的流程圖來說明對應于圖9的步驟S15的處理的運動信息 提取處理。在步驟S171,局部運動矢量提取單元191通過利用供給的輸入圖像,用梯度方法 等檢測輸入圖像的每個像素的局部運動矢量,并將局部運動矢量提供給差計算單元193。在步驟S172,全局運動矢量提取單元192通過利用供給的輸入圖像來檢測全局運 動矢量,并將全局運動矢量提供給差計算單元193。在步驟S173,差計算單元193獲得來自局部運動矢量提取單元191的局部運動矢 量與來自全局運動矢量提取單元192的全局運動矢量之間的差的絕對值,以生成運動的差 圖像。然后,差計算單元193將生成的運動的差圖像提供給規(guī)范化單元194。在步驟S174,規(guī)范化單元194通過使從差計算單元193供給的差圖像規(guī)范化來產(chǎn) 生運動信息圖,并將這樣獲得的運動信息圖作為最終的運動信息圖,提供給被攝對象圖產(chǎn) 生單元沈。例如,規(guī)范化單元194執(zhí)行與圖10的步驟S44的處理相同的處理,以使運動信 息圖規(guī)范化。然后,當輸出運動信息圖時,完成運動信息提取處理,之后,處理進行到圖9的步 驟 S16。按照上述方式,運動信息提取單元25從輸入圖像檢測運動,并從檢測結果產(chǎn)生運 動信息圖。在輸入圖像中,運動中的對象體的區(qū)域是可容易地由瞥一眼輸入圖像的觀察者 識別的并具有成為被攝對象的高概率的區(qū)域。根據(jù)前面描述的亮度信息提取處理到運動信息提取處理,獲得信息圖,并基于這 些信息圖產(chǎn)生被攝對象圖。按照上述方式,通過在每個信息圖的規(guī)范化中使信息圖線性規(guī)范化并并從線性規(guī) 范化之后的信息圖的像素值減去平均值,能夠更容易和更快地使信息圖規(guī)范化。結果,能夠 更容易和更快地獲得用于識別圖像中的被攝對象的區(qū)域的信息圖。此外,當要使信息圖規(guī) 范化時,通過從信息圖的像素值減去平均值,能夠利用簡單的處理更可靠地去除噪聲。[加權的學習]順便提及,在圖像處理設備11中,從輸入圖像提取推測具有被攝對象的多個區(qū)域 的多個信息項,并通過利用這些信息項來產(chǎn)生被攝對象圖,更可靠地從輸入圖像檢測被攝對象的區(qū)域。推測的吸引瞥一眼輸入圖像的觀察者的注意力的區(qū)域越多,輸入圖像中的被 攝對象圖的像素值越大。從而,在不局限于被攝對象是人物的情況下,即使被攝對象是諸如 動物、植物或建筑物的普通對象,也能夠檢測被攝對象。從輸入圖像提取諸如亮度、顏色、邊緣、面部和運動的信息,以產(chǎn)生這樣的被攝對 象圖。即,使從這些提取信息的金字塔圖像得到的差圖像通過進行利用差加權Wa的加權加 法而成為信息圖,并使這些信息圖進行利用信息加權恥的加權加法。然后,此外,使這樣獲 得的圖像(圖)乘以被攝對象加權Wc,從而形成為被攝對象圖。當產(chǎn)生被攝對象圖時使用的差加權Wa、信息加權Wb和被攝對象加權Wc是通過利 用例如神經(jīng)網(wǎng)絡的學習獲得的。如果使用包含普通被攝對象的圖像,作為在這些加權的學 習期間使用的學習圖像,而不局限于人物,那么利用通過學習獲得的加權產(chǎn)生的被攝對象 圖使得能夠更可靠地從輸入圖像檢測普通被攝對象。下面將說明用于產(chǎn)生被攝對象圖的差加權Wa、信息加權Wb和被攝對象加權Wc的 學習。在學習期間,如圖17所示,使用包含被攝對象的學習圖像、以及設有初始值的差 加權Wa、信息加權Wb和被攝對象加權Wc,以產(chǎn)生被攝對象圖。更具體地,當要產(chǎn)生被攝對象圖時,生成從預先準備的學習圖像提取的每個信息 項的差圖像An (m)(其中1彡η彡N、1彡m彡6)。這里,差圖像An⑴至差圖像An (6)是關 于從學習圖像提取的一個信息項的差圖像。例如,使差圖像Al(I)至差圖像Al (6)為通過利用從學習圖像獲得的亮度的金字 塔圖像而生成的亮度的差圖像。此外,例如,使差圖像AN(I)至差圖像AN(6)為通過利用從 學習圖像獲得的在0°方向上的邊緣的金字塔圖像而生成的在0°方向上的差圖像。同時,在圖17中,示出了針對從學習圖像提取的每個信息獲得的6個差圖像的示 例。然而,差圖像的數(shù)目可以是任何數(shù)目。例如,在圖像處理設備11的示例中,差圖像的數(shù) 目被設為5。當從學習圖像獲得每個信息的差圖像An(m)時,基于這些差圖像和每個差圖像 的差加權Wa,產(chǎn)生信息圖。同時,下面還將與差圖像An(m)相乘的差加權Wa稱為差加權 Wan(m)。例如,使差圖像Al⑴至差圖像Al (6)進行利用每個差圖像的差加權Wal (1)至差 加權Wal (6)的加權加法,并形成為信息圖Blin。此外,對信息圖Blin執(zhí)行利用上述表達式 (1)(即,S形函數(shù)f(x))的計算,結果,獲得信息圖Bl。ut。即,使通過將信息圖BlinW像素的像素值χ代入表達式(1)而獲得的值f(x)成為 信息圖Bl-的在與該像素的相同位置處的像素的像素值。按照上述方式獲得的信息圖Bl。ut 對應于在圖像處理設備11中產(chǎn)生的信息圖,諸如亮度信息圖。同時,S形函數(shù)f(x)并不局限于雙曲余弦函數(shù),而可以是任何函數(shù)。例如,在理想 模型中,f(x)是以下函數(shù)當X彡0時,該函數(shù)輸出值“1”,并且當X < 0時,該函數(shù)輸出值 “-1”。如上所述,當獲得N個信息圖Bl。ut至BN。ut時,使其信息圖&i。ut (其中1彡η彡N) 進行過利用每個信息圖的信息加權Wb的加權加法,從而形成為被攝對象圖Cin。然后,對該 被攝對象圖Cin執(zhí)行利用S形函數(shù)f(x)的計算。結果,獲得被攝對象圖c。ut。此外,使該被攝對象圖C。ut乘以被攝對象加權Wc以被規(guī)范化,從而形成為最終的被攝對象圖。同時,更具體地,當要產(chǎn)生被攝對象圖Cin時,使用在不生成差圖像的情況下獲得 的信息圖,例如,諸如面部信息圖的信息圖,以執(zhí)行加權加法。此外,下面還將乘以信息圖 Bnout的信息加權恥稱為信息加權Wm。按照上述方式,在學習期間產(chǎn)生被攝對象圖的處理被稱為正向傳播。當產(chǎn)生被攝 對象圖時,接下來,如圖18所示,執(zhí)行稱為反向傳播的處理,并更新差加權Wa、信息加權Wb 和被攝對象加權Wc。在稱為反向傳播的處理中,使用產(chǎn)生的被攝對象圖和圖像標記以獲得 加權的差,所述圖像標記是關于學習圖像預先準備的、指示學習圖像中的被攝對象的區(qū)域 的信息,所述加權的差是每個加權應增大/減小的值。這里,圖像標記是具有與學習圖像相同大小的圖像,并且是這樣的圖像,其中,在 與學習圖像中的被攝對象的區(qū)域的像素的相同位置處的像素的像素值被設為1,并且在與 學習圖像中沒有被攝對象的區(qū)域的像素的相同位置處的像素的像素值被設為0。在反向傳播中,獲得被攝對象圖與圖像標記之間的差,并且這樣獲得的圖像被設 為評價圖。然后,基于評價圖和被攝對象圖Cin,根據(jù)下面的表達式( 獲得被攝對象加權 差Δ Wc,被攝對象加權差AWc是被攝對象加權Wc應被改變的量。Affc = η XCinX AC ... (2)在表達式O)中,η表示作為預定常數(shù)的學習速度,并且Cin表示被攝對象圖Cin。 同時,更具體地,表達式O)中的Cin是被攝對象圖Cin的一個像素的像素值,并且針對每個 像素獲得被攝對象加權差AWC。此外,AC是被攝對象圖的差,并且是根據(jù)下面的表達式 ⑶獲得的。AC = EVXf' (Cin) ...(3)在表達式(3)中,EV表示評價圖,并且f' (Cin)是通過將被攝對象圖Cin代入通 過求S形函數(shù)f(x)的導數(shù)得到的函數(shù)而獲得的值。更具體地,通過求函數(shù)f(x)的導數(shù)而 得到的函數(shù)f' (χ)是在下面的表達式中所示的函數(shù)。f' (χ) = aXbXsech(xXb)2— (4)當按照上述方式獲得被攝對象加權差AWc時,將被攝對象加權差AWc加到目前 為止的被攝對象加權Wc中并進行更新,從而獲得新的被攝對象加權Wc。接下來,通過利用更新的被攝對象加權Wc、和當產(chǎn)生被攝對象圖時產(chǎn)生的信息圖 &iin,根據(jù)下面的表達式(5)獲得信息加權差Affbn,信息加權差Δ Wbn是信息加權Wbn應 被改變的量。Affbn = η XBninX ΔBn ...(5)在表達式(5)中,η表示作為預定常數(shù)的學習速度,并且&iin表示信息圖&iin。同 時,更具體地,表達式(5)中的&^是信息圖&iin的一個像素的像素值,并且針對每個像素 獲得信息加權差Affbn。此外,Δ&!是信息圖的差,并且是根據(jù)下面的表達式(6)獲得的。ΔBn = ACXf' (Bnin) Xffc ...(6)在表達式(6)中,Δ C表示通過計算上述表達式C3)而獲得的值,并且f' (Bnin) 是通過將信息圖&iin代入通過求S形函數(shù)f(x)的導數(shù)得到的函數(shù)而獲得的值。此外,Wc 是更新的被攝對象加權Wc。按照上述方式,當獲得信息圖&iin的信息加權差Affbn時,將信息加權差Affbn加到信息圖&iin的信息加權Wm中并進行更新,從而獲得新的信息加權Wbn。此外,使用更新的信息加權ffbn、和當產(chǎn)生被攝對象圖時生成的差圖像An(m),以 根據(jù)下面的表達式⑵獲得差加權的差Δ Wan (m),差加權的差AWan(m)是差加權Wa應被 改變的量。Δ Wan (m) = η XAn (m) X Δ An (m) ... (7)在表達式(7)中,η表示作為預定常數(shù)的學習速度,并且An(m)表示差圖像 An (m)。同時,更具體地,表達式(7)中的An(m)是差圖像An (m)的一個像素的像素值,并且 針對每個像素獲得差AWan(m)。此外,ΔΑη(πι)是差圖像的差,并且是根據(jù)下面的表達式 ⑶獲得的。AAn(Hi) = ABnXf' (An(m))XWbn ...(8)在表達式(8)中,Δ to表示通過計算上述表達式(6)獲得的值,并且f' (An(m)) 是通過將差圖像An (m)代入通過求S形函數(shù)f(x)的導數(shù)得到的函數(shù)而獲得的值。此外,Wbn 是更新的信息加權恥11。按照上述方式,當獲得差圖像An(m)的差加權的差AWan(m)時,將差加權的差 Affan(m)加到差圖像An (m)的差加權Wan (m)中并進行更新,從而獲得新的差加權Wan (m)。然后,通過利用學習圖像、以及如上所述更新的差加權Wa、信息加權Wb和被攝對 象加權Wc,重復上述處理,并且獲得最終的差加權Wa、最終的信息加權Wb和最終的被攝對 象加權Wc。執(zhí)行用于重復更新差加權Wan (m)、信息加權Wbn和被攝對象加權Wc的處理,直到 例如評價圖的像素的像素值的最大值的絕對值小于或等于預定閾值并且每個加權的更新 被執(zhí)行預定次數(shù)以上為止。即,執(zhí)行更新加權的處理,直到獲得能夠以足夠的準確度從圖像 提取被攝對象的被攝對象圖為止。按照上述方式,在利用神經(jīng)網(wǎng)絡的學習中,基于圖像標記和利用預先供給的加權 所產(chǎn)生的被攝對象圖,來產(chǎn)生評價圖。此外,通過反向計算從評價圖獲得加權的差,該加權 的差是每個加權應被改變的變化量。這里,由于圖像標記是指示學習圖像中的被攝對象的區(qū)域的信息,因此,可認為圖 像標記是指示被攝對象圖的正確解答的信息。因此,作為被攝對象圖與圖像標記之間的差 的評價圖指示理想的被攝對象圖與通過利用供給的加權產(chǎn)生的被攝對象圖之間的誤差。通 過利用評價圖執(zhí)行反向計算,獲得供給的加權與理想加權之間的誤差。然后,獲得的誤差是供給的加權應被改變的變化量。如果將該變化量加到加權中, 那么獲得當前時刻的理想加權。如果被攝對象圖是通過利用以上述方式重新獲得加權而產(chǎn) 生的,那么該被攝對象圖使得能夠更可靠地從圖像檢測被攝對象。在利用神經(jīng)網(wǎng)絡的學習 中,作為加權的變化量,獲得差Δ Wan (m)、信息加權差Δ Wbn和被攝對象加權差AWc,并更 新每個加權。同時,例如在“Richar 0. Duda, Peter Ε. Hart, David G. Stork 所著的 ‘Patten Classification,,WILEY-INTERSCIENCE ISBN 0-471-05669-3” 中詳細說明了利用神經(jīng)網(wǎng) 絡的學習??捎捎布蜍浖韴?zhí)行上述系列的信息處理。在由軟件執(zhí)行系列處理的情況下, 將形成軟件的程序從記錄介質安裝到內置于專用硬件中的計算機、或者例如安裝到能夠通過安裝各種程序來執(zhí)行各種功能的通用個人計算機。圖19是圖示了根據(jù)程序執(zhí)行上述系列處理的計算機的結構示例的方框圖。在計算機中,CPU (中央處理器)601、ROM (只讀存儲器)602和RAM(隨機存取存儲 器)603經(jīng)由總線604而彼此互連。此外,輸入/輸出接口 605連接到總線604。包括鍵盤、鼠標、麥克風等的輸入單元 606、包括顯示器、揚聲器等的輸出單元607、包括硬盤、非易失性存儲器等的記錄單元608、 包括網(wǎng)絡接口等的通信單元609、以及用于驅動諸如磁盤、光盤、磁光盤或半導體存儲器的 可拆卸介質的驅動器610連接到輸入/輸出接口 605。在如上所述配置的計算機中,例如,CPU 601通過輸入/輸出接口 605和總線604 將記錄在記錄單元608中的程序載入RAM 603中并執(zhí)行該程序,從而執(zhí)行上述系列處理。通過將程序記錄在用作套裝介質(packaged medium)的可拆卸介質611上來提 供由計算機(CPU 601)執(zhí)行的程序,可拆卸介質611是諸如磁盤(包括軟盤)、光盤(包括 ⑶-R0M(致密盤-只讀存儲器)、DVD (數(shù)字多功能盤)等)、磁光盤、半導體存儲器等的可拆 卸介質。替選地,可經(jīng)由諸如局域網(wǎng)、因特網(wǎng)或數(shù)字衛(wèi)星廣播的有線或無線傳輸介質來提供 程序。然后,通過將可拆卸介質611安裝到驅動器610,可經(jīng)輸入/輸出接口 605將程序 安裝到記錄單元608中。替選地,可經(jīng)有線或無線傳輸介質在通信單元609接收程序,并將 其安裝到記錄單元608。替選地,程序可被預先安裝在ROM 602或記錄單元608中。由計算機執(zhí)行的程序可以是根據(jù)在說明書中描述的次序以時間順序執(zhí)行處理的 程序,或者可以是并行地或者在需要時(例如,當被調用時)執(zhí)行處理的程序。本發(fā)明的實施例并不局限于上述實施例,并且可以做出各種修改,而不脫離本發(fā) 明的范圍和精神。附圖標記列表11圖像處理設備、21亮度信息提取單元、22顏色信息提取單元、23邊緣信息提取 單元、M面部信息提取單元、25運動信息提取單元、沈被攝對象圖產(chǎn)生單元、53加權加法單 元、M規(guī)范化單元、85加權加法單元、86加權加法單元、87規(guī)范化單元、88規(guī)范化單元、123 加權加法單元、1 加權加法單元、125加權加法單元、1 加權加法單元、127規(guī)范化單元、 128規(guī)范化單元、1 規(guī)范化單元、130規(guī)范化單元
權利要求
1.一種圖像處理設備,包括提取信息圖像生成裝置,其用于基于由從輸入圖像的各區(qū)域提取的預定信息構成的提 取信息圖像來生成分辨率彼此不同的多個提取信息圖像;差圖像生成裝置,其用于通過獲得所述多個提取信息圖像之中的兩個預定的提取信息 圖像之間的差來生成差圖像;信息圖產(chǎn)生裝置,其用于通過執(zhí)行所述多個差圖像的加權加法來產(chǎn)生指示所述輸入圖 像中的被攝對象的區(qū)域所擁有的特征的特征量的信息圖;規(guī)范化裝置,其用于通過從所述信息圖的每個區(qū)域的值減去所述信息圖的各區(qū)域的值 的平均值而將所述信息圖規(guī)范化;和被攝對象圖產(chǎn)生裝置,其用于通過執(zhí)行所述多個規(guī)范化的信息圖的加權加法來產(chǎn)生針 對所述輸入圖像的每個區(qū)域指示區(qū)域為被攝對象的可能性的被攝對象圖。
2.根據(jù)權利要求1所述的圖像處理設備,還包括邊緣圖像生成裝置,所述邊緣圖像生 成裝置用于通過利用預定系數(shù)執(zhí)行所述輸入圖像的若干像素的像素值的加權加法,來生成 代表所述輸入圖像的所述各區(qū)域的邊緣強度的圖像,作為所述提取信息圖像。
3.根據(jù)權利要求1所述的圖像處理設備,其中所述提取信息圖像生成裝置通過將所述 提取信息圖像中彼此相鄰的像素的像素值的平均值設為與所述提取信息圖像不同的另一 提取信息圖像的像素的像素值,來生成分辨率彼此不同的所述多個提取信息圖像。
4.根據(jù)權利要求1所述的圖像處理設備,其中所述輸入圖像是由亮度分量和色差分量 構成的圖像,并且其中所述提取信息圖像是由作為所述預定信息的所述輸入圖像的亮度分量或色差分 量構成的圖像。
5.一種用于圖像處理設備的圖像處理方法,所述圖像處理設備包括提取信息圖像生成裝置,其用于基于由從輸入圖像的各區(qū)域提取的預定信息構成的提 取信息圖像來生成分辨率彼此不同的多個提取信息圖像;差圖像生成裝置,其用于通過獲得所述多個提取信息圖像之中的兩個預定的提取信息 圖像之間的差來生成差圖像;信息圖產(chǎn)生裝置,其用于通過執(zhí)行所述多個差圖像的加權加法來產(chǎn)生指示所述輸入圖 像中的被攝對象的區(qū)域所擁有的特征的特征量的信息圖;規(guī)范化裝置,其用于通過從所述信息圖的每個區(qū)域的值減去所述信息圖的各區(qū)域的值 的平均值而將所述信息圖規(guī)范化;和被攝對象圖產(chǎn)生裝置,其用于通過執(zhí)行所述多個規(guī)范化的信息圖的加權加法來產(chǎn)生針 對所述輸入圖像的每個區(qū)域指示區(qū)域為被攝對象的可能性的被攝對象圖, 所述圖像處理方法包括步驟利用所述提取信息圖像生成裝置,根據(jù)所述輸入圖像生成所述提取信息圖像; 利用所述差圖像生成裝置,根據(jù)所述多個提取信息圖像生成所述差圖像; 利用所述信息圖產(chǎn)生裝置,通過執(zhí)行所述多個差圖像的加權加法來產(chǎn)生所述信息圖; 利用所述規(guī)范化裝置將所述信息圖規(guī)范化;和利用所述被攝對象圖產(chǎn)生裝置,通過執(zhí)行所述信息圖的加權加法來產(chǎn)生所述被攝對象圖。
6. 一種用于使計算機執(zhí)行處理的程序,所述處理包括步驟基于由從輸入圖像的各區(qū)域提取的預定信息構成的提取信息圖像,生成分辨率彼此不 同的多個提取信息圖像;通過獲得所述多個提取信息圖像之中的兩個預定的提取信息圖像之間的差來生成差 圖像;通過執(zhí)行所述多個差圖像的加權加法來產(chǎn)生指示所述輸入圖像中的被攝對象所擁有 的特征的特征量的信息圖;通過從所述信息圖的每個區(qū)域的值減去所述信息圖的各區(qū)域的值的平均值而將信息 圖規(guī)范化;和通過執(zhí)行多個規(guī)范化的信息圖的加權加法,來產(chǎn)生針對所述輸入圖像的每個區(qū)域指示 區(qū)域為被攝對象的可能性的被攝對象圖。
全文摘要
本發(fā)明涉及一種圖像處理設備、方法和程序,其能夠更容易地識別圖像中的被攝對象的區(qū)域。亮度信息提取單元21至運動信息提取單元25從輸入圖像提取預定信息,并產(chǎn)生指示輸入圖像的被攝對象的區(qū)域所擁有的特征的特征量的信息圖。此外,亮度信息提取單元21至運動信息提取單元25從產(chǎn)生的信息圖的每個像素的像素值減去整個信息圖的像素的像素值的平均值,以將信息圖規(guī)范化。結果,信息圖可被規(guī)范化,并且與利用DOG濾波器使信息圖規(guī)范化的情況相比,能夠用簡單的處理去除噪聲。被攝對象圖產(chǎn)生單元26對每個信息圖進行線性組合,并且產(chǎn)生針對輸入圖像的每個區(qū)域指示區(qū)域為被攝對象的可能性的被攝對象圖。本發(fā)明可被應用于圖像處理設備。
文檔編號G06T7/00GK102084396SQ201080002008
公開日2011年6月1日 申請日期2010年4月30日 優(yōu)先權日2009年5月8日
發(fā)明者亀谷敬, 木下雅也, 村山淳, 橫川昌俊, 相坂一樹 申請人:索尼公司