專利名稱:從多個圖像生成組合圖像的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理,尤其涉及從多個圖像中生成組合圖像。
背景技術(shù):
用戶頻繁地對對象組拍攝照片,如人員組(例如,家庭成員或朋友),動物組(例如,寵物)等等。令人遺憾的是,在拍攝照片時,時常難以按照可以接受的位置或姿勢拍攝到所有對象。例如,對于一組人,當拍攝照片時,一個或多個人可能會眨眼,皺眉頭,目光不看著照像機等等。也難以使所有對象出現(xiàn)在照片上而不使其他外來的對象出現(xiàn)在照片上, 如避免額外的人走過。這些困難會導致用戶不能獲得他們需要的照片的情況,并會導致用戶在試圖照相時產(chǎn)生挫敗感。
發(fā)明內(nèi)容
提供本發(fā)明內(nèi)容是為了以精簡的形式介紹將在以下具體實施方式
中進一步描述的一些概念。本概述并不旨在標識出所要求保護的主題的關(guān)鍵特征或必要特征,也不旨在用于限定所要求保護的主題的范圍。根據(jù)一個或多個方面,訪問各自都包括多個對象的多個圖像。對于多個圖像中的多個區(qū)域中的每一個區(qū)域,就該區(qū)域被感覺起來如何作出判斷。基于對多個圖像中的多個區(qū)域的對應的區(qū)域被感覺起來如何作出的判斷,從多個圖像生成組合圖像。組合圖像的生成包括自動地從多個圖像中的一個中選擇一個區(qū)域(在該區(qū)域不存在在多個圖像中的其他圖像的一個或多個對應的區(qū)域中存在的對象),以使其包括在組合圖像中。根據(jù)一個或多個方面,訪問各自都包括多個對象的多個圖像。對于多個圖像中的多個區(qū)域中的每一個區(qū)域,就該區(qū)域被感覺起來如何作出判斷。標識多個圖像的基礎圖像, 該基礎圖像可以是具有最多被判斷為感覺為“最佳”區(qū)域的區(qū)域的圖像。如果多個圖像中的另一圖像的對應的區(qū)域被判斷為比基礎圖像的該區(qū)域更佳,則自動地將基礎圖像的每一個區(qū)用該另一圖像的對應的區(qū)域替換,由此,從多個圖像生成組合圖像。另外,顯示多個圖像中的每一個其他圖像的區(qū)域,每一個區(qū)域都對應于基礎圖像的特定區(qū)域。接收用戶對于多個圖像中的其他圖像的對應的區(qū)域中的一個的選擇,將基礎圖像的特定區(qū)域替換為其他圖像的對應的區(qū)域中的用戶選定的那一個。
在各附圖中,使用相同的標號來指示相同的特征。圖1示出了根據(jù)一個或多個實施例的實現(xiàn)從多個圖像生成組合圖像的示例系統(tǒng)。圖2示出了根據(jù)一個或多個實施例的同一個場景的多個圖像的示例。圖3示出了根據(jù)一個或多個實施例的自動地將一個圖像中的區(qū)域替換為來自其他圖像的對應的區(qū)域以生成組合圖像的示例。圖4示出了根據(jù)一個或多個實施例的組合圖像的示例。
圖5示出了根據(jù)一個或多個實施例的用戶界面的示例,通過該用戶界面,用戶可以提供關(guān)于要選擇多個對應的區(qū)域中的哪一個的輸入。圖6是示出了根據(jù)一個或多個實施例的用于從多個圖像生成組合圖像的示例過程的流程圖。圖7是示出了根據(jù)一個或多個實施例的用于基于用戶輸入選擇要包括在組合圖像中的區(qū)域的示例過程的流程圖。圖8示出了根據(jù)一個或多個實施例的可以被配置成從多個圖像生成組合圖像的示例計算設備。
具體實施例方式此處討論了從多個圖像生成組合圖像。捕捉同一個場景的多個圖像,雖然圖像是同一個場景的,但是,在多個圖像之間可能會有差異。標識那些圖像內(nèi)的不同的區(qū)域,對于不同的區(qū)域中的每一個區(qū)域,就該區(qū)域感覺起來如何作出判斷(例如,如果該區(qū)域表示臉, 則判斷人們是否正在微笑,人們是否張開他們的眼睛等等)??梢杂稍u價模塊基于區(qū)域的各種特征,進行關(guān)于區(qū)域感覺起來如何的判斷。通常通過選擇具有將不會被替換為來自多個區(qū)域中的其它區(qū)域的最多區(qū)域的圖像,來選擇多個圖像中的基礎圖像。當多個區(qū)域中的另一圖像的一個區(qū)域被判斷為感覺起來比基礎圖像的對應的區(qū)域更佳時,則可以將基礎圖像中的該區(qū)域自動地替換為來自多個區(qū)域中的另一圖像的對應的區(qū)域。用戶界面也可向用戶顯示基礎圖像中的特定區(qū)域,向用戶顯示多個圖像中的其他圖像的對應的區(qū)域,并允許用戶選擇將替換基礎圖像中的區(qū)域那些對應的區(qū)域中的一個。 另外,還可以標識一個對象存在于基礎圖像中的一個區(qū)域中,但不存在于多個圖像中的一個或多個其他圖像中的對應的區(qū)域中的情況(如當一個人走過場景背景時)。在這樣的情況下,可以可任選地自動地將沒有該對象存在的區(qū)域選為替換基礎圖像中的對應區(qū)域的區(qū)域。圖1示出了根據(jù)一個或多個實施例的實現(xiàn)從多個圖像生成組合圖像的示例系統(tǒng) 100。系統(tǒng)100可被實現(xiàn)為各種不同類型的設備中的一個或多個的一部分,如臺式計算機、 移動站、自助服務終端、娛樂設備、可通信地耦合到顯示設備的機頂盒、電視機、蜂窩式或其他無線電話、照像機、便攜式攝像機、音頻/視頻回放設備、游戲控制臺、車載計算機等等。 可另選地,系統(tǒng)100可以跨相同或不同類型的多個設備地實現(xiàn)。這樣的多個設備可以以各種不同的方式彼此耦合,如經(jīng)由有線或無線連接(例如,通用串行總線(USB)連接、無線USB 連接、根據(jù)IEEE 1394標準的連接等等),或經(jīng)由網(wǎng)絡(例如,因特網(wǎng)、局域網(wǎng)(LAN)、蜂窩式或其他電話網(wǎng)絡等等),等等。系統(tǒng)100包括圖像生成模塊102、對象數(shù)據(jù)庫104,以及用戶界面模塊106。模塊 102、數(shù)據(jù)庫104,以及模塊106可被實現(xiàn)為相同,或者可另選地不同的設備的一部分。圖像生成模塊102接收多個圖像110,并通過從多個圖像110中的不同的圖像選擇不同的區(qū)域, 來生成組合圖像112。對象數(shù)據(jù)庫104是被系統(tǒng)100識別或以其他方式為系統(tǒng)100所知的對象的記錄。對象數(shù)據(jù)庫104可以是,例如,為系統(tǒng)100所知的不同的面部以及相關(guān)聯(lián)的名稱的記錄。對象數(shù)據(jù)庫104可包括多個圖像,其中對象在這些多個圖像中的每一個圖像以及數(shù)據(jù)庫104中標識。例如,對象數(shù)據(jù)庫104可以是數(shù)字相冊(例如,由在線服務維護),其中包括多個不同的圖像,圖像中標識了人(在這些圖像中的不同的圖像中標識了相同人和 /或不同的人)。這種對象記錄可以使用各種不同的數(shù)據(jù)結(jié)構(gòu)或存儲技術(shù)來維護。用戶界面(UI)模塊106管理信息向系統(tǒng)100的用戶的呈現(xiàn)以及從系統(tǒng)100的用戶對請求的接收。圖像110可以由圖像生成模塊102以各種不同的方式來獲取。圖像110可以由包括模塊102的設備捕捉,可以被提供到模塊102,可以存儲在向模塊102標識的、模塊102從中檢索圖像110的位置等等。例如,圖像生成模塊102可被實現(xiàn)為因特網(wǎng)服務的一部分,用戶上傳或以其他方式傳輸圖像110。作為另一示例,圖像生成模塊102可被實現(xiàn)為捕捉圖像110的數(shù)碼相機的一部分。作為再一個示例,圖像生成模塊102可被實現(xiàn)為商店內(nèi)的自助服務終端,該自助服務終端從與其耦合的存儲器設備檢索圖像。圖像生成模塊102包括對象檢測模塊122、評價模塊124、圖像組合模塊126,以及圖像注冊模塊128。這里一般性地討論了模塊122、124、126,以及128的操作,下面將更詳細地討論。一般而言,對象檢測模塊122檢測圖像110內(nèi)的區(qū)域。評價模塊IM對于這些區(qū)域中的每一個區(qū)域,就該區(qū)域被感覺起來如何作出判斷。這些判斷可以以各種不同的方式進行,如下面比較詳細地討論的?;谶@些判斷,圖像組合模塊1 選擇多個圖像110中的一個圖像作為基礎圖像,然后,自動地選擇多個圖像110中的其他圖像的不同的區(qū)域來替換基礎圖像的對應的區(qū)域,以便生成組合圖像112。對于給定區(qū)域,通常,被判斷為感覺起來“最佳”區(qū)域的對應的區(qū)域是將包括在組合圖像112中的區(qū)域。圖像注冊模塊1 可任選地被包括在圖像生成模塊102中,當被包括時,確定圖像如何彼此映射。這種映射表示圖像的哪些部分是彼此對應的區(qū)域。區(qū)域,通常,但不總是包括對象。圖像組合模塊1 可以自動地選擇不包括對象的另一圖像的對應的區(qū)域,盡管基礎圖像可能包括對象。如此,可以從場景中刪除基礎圖像中的對象,并使其不被包括在組合圖像112中。另外,用戶界面模塊106可以允許用戶覆蓋圖像組合模塊126作出的自動選擇,如下面比較詳細地討論的。對象檢測模塊122可以被配置成檢測圖像110的區(qū)域內(nèi)的各種不同類型的對象。 這些類型的對象可以是,例如,人(或人的面部)和/或動物(例如,寵物)。可另選地,可以檢測其他對象,如建筑物、風景或其他地理特征、小汽車或其他車輛,物品或人的器官(例如,在X射線圖像上)等等。對象檢測模塊122通常被配置成檢測一種類型的對象,雖然可另選地可以被配置成檢測任意數(shù)量的不同類型的對象。由圖像生成模塊102接收到的多個圖像110通常是相同場景的,如一組人在婚禮或家庭團聚中的多個圖像。在一個或多個實施例中,對象檢測模塊122可以檢測多個圖像 110中的一個或多個是否不是來自相同的場景。自動地刪除被檢測不是來自相同場景的圖像,圖像生成模塊102不考慮將它們包括在多個圖像110中。可以以各種不同的方式判斷圖像是否來自相同場景。例如,可以將具有至少閾值數(shù)量的相同對象的兩個圖像判斷為來自相同場景。此閾值數(shù)字可以是固定數(shù)量(例如,5個或更多相同的對象)或相對數(shù)(例如,圖像中的60%或更多的對象位于兩個圖像中)。作為另一示例,系統(tǒng)100的用戶可以提供表示哪些圖像是來自相同場景的輸入。如此,盡管兩個圖像可能來自相同場景,兩個圖像不必相同(通常不同)。在一個或多個實施例中,圖像注冊模塊1 判斷哪些圖像來自相同場景。圖像注冊模塊1 使用注冊技術(shù)來判斷圖像彼此在空間上映射得怎么樣。如果兩個圖像彼此映射得足夠好(例如,至少閾值數(shù)量的匹配特征被包括在每一個圖像中),那么,判斷兩個圖像來自相同場景。可以使用各種不同的傳統(tǒng)技術(shù),如使用尺度不變特征變換(SIFT)算法,來標識匹配特征。盡管圖像110來自相同場景,但是,場景內(nèi)的對象可以不同。例如,一個不認識人的可能從一組人背后走過,如此,出現(xiàn)在不同圖像110中的不同位置。作為另一示例,該組人中的一個人可能移動,如此,可能在不同圖像110中位于不同位置。作為再一個示例,人們可能移動他們的腦袋、談話、眨眼等等,如此,可能在不同圖像110中位于不同位置或處于不同姿勢。對象檢測模塊122還對齊多個圖像110。對齊多個圖像110是指標識圖像110中的彼此相對應的不同區(qū)域(例如,包括相同對象)。作為此對齊過程的一部分,對于多個圖像110中的每一個圖像,對象檢測模塊122標識該圖像內(nèi)的對象,標識該圖像中包括該對象的區(qū)域,還對于一個圖像中的被標識的一個區(qū)域來標識不同圖像110中的對應的區(qū)域。不同圖像110中的這些對應的區(qū)域通常位于場景的大致相同的位置。因此,當對象檢測模塊 122標識一個圖像中的一個區(qū)域時,模塊122還標識其他圖像中的該場景的相同位置處的對應的區(qū)域。這些對應的區(qū)域可以,但是未必包括相同對象。例如,如下面比較詳細地討論的,一個區(qū)域可包括在另一圖像的對應的區(qū)域中不存在的對象(例如,從一組人背后走過的一個人)??梢砸圆煌姆绞酱_定不同圖像110中的對應的區(qū)域。例如,圖像注冊模塊1 可以使用注冊技術(shù)來判斷圖像彼此在空間上映射得怎么樣。標識圖像110中的匹配特征, 并標識圖像110中的那些特征的位置。標識那些匹配特征內(nèi)的特定對象(例如,面部),并標識那些特定對象周圍的區(qū)域。在一個或多個實施例中,圖像110中的區(qū)域的標識至少部分地基于對象識別。對象數(shù)據(jù)庫104是被系統(tǒng)100識別或以其他方式為系統(tǒng)100所知的對象的記錄。可以以各種不同的方式生成對象數(shù)據(jù)庫104,如基于來自系統(tǒng)100的用戶的標識特定對象的輸入(例如,標記他們的數(shù)字相冊中的對象),從其他組件或設備中獲取的標識特定對象的信息,等等。對象檢測模塊122使用對象數(shù)據(jù)庫104中的信息來自動地檢測圖像110中的已知對象 (為系統(tǒng)100所知的對象)。然后,可以使用這些已知對象在圖像110中的特定位置的存在來標識檢測到的對象周圍的區(qū)域。在替換實施例中,對象檢測模塊122可以無需對象數(shù)據(jù)庫104即可操作。在這樣的實施例中,對象檢測模塊122檢測圖像110內(nèi)的特定對象,還檢測一個圖像110中的一個對象與圖像110中的另一圖像中的一個對象相同的情況。雖然在這樣的實施例中對象檢測模塊122可能不標識已知對象,但是,對象檢測模塊122仍可以檢測多個圖像中的對象相同的情況。可以以各種不同的常規(guī)方式執(zhí)行對圖像中的對象的檢測??梢岳斫?,檢測圖像中的對象的方式可以基于正在檢測的特定對象而變化。例如,對于檢測檢測動物面部或其他對象的技術(shù),可以使用不同的技術(shù)來檢測人的面部??梢砸愿鞣N不同的常規(guī)方式執(zhí)行多個圖像的對齊和對象周圍的區(qū)域的標識(包括標識縫,沿著該縫可以從一個圖像中“剪切”區(qū)域供刪除或復制,并將一個區(qū)域接合或粘貼到另一圖像中)。在一個或多個實施例中,使用在A. Agarwala等人所著的“InteractiveDigital Photomontage (交互式數(shù)碼蒙太奇照片)”,ACM SIGGRAPH 2004中更詳細地討論的用于將圖像的區(qū)域拼接在一起的蒙太奇照片技術(shù)來執(zhí)行多個圖像的對齊和對象周圍的區(qū)域的標識。在一個或多個實施例中,使用自動選擇和混合技術(shù)來執(zhí)行將一個圖像中的一個區(qū)域拼接到另一圖像。在C. Rother等人所著的“GrabCut Jnteractive Foreground Extraction Using Iterated Graph Cuts (抓取剪切使用迭代圖形剪切的交互式前景提取),,(ACM SIGGRAPH 2004)更詳細地討論了自動選擇技術(shù)的示例,而在A. Criminisi等人所著的"Region Filling and Object Removal by Exemplar-Based Inpainting(基于樣本的內(nèi)繪制進行的區(qū)域填充和對象移除)”(IEEE圖像處理學報,第13卷,第9期,第 1200-1212頁,2004年1月)中更詳細地討論了混合技術(shù)的示例。圖2示出了根據(jù)一個或多個實施例的同一個場景的多個圖像的示例。圖2示出了同一個場景的三個圖像202、204以及206,它們是,例如圖1的多個圖像110。雖然在圖2 的示例中只示出了三個圖像,但是,可以理解,任意數(shù)量的圖像可以適用于此處所討論的技術(shù)。圖像202、204,以及206中的每一個都包括被示為橢圓形的多個區(qū)域,雖然可以理解區(qū)域可以是任何形狀的。這些區(qū)域中的每一個區(qū)域被示為大小相同,雖然可以理解區(qū)域的大小可以不同。這些區(qū)域中的每一個區(qū)域可包括對象,如上文所討論的。每一個圖像202、 204,以及206被示為包括五個區(qū)域,雖然可以理解一個圖像中可以包括任意數(shù)量的區(qū)域。圖像 202 包括區(qū)域 210、212、214、216,以及 218。圖像 204 包括區(qū)域 220、222、224、 226,以及228。圖像206包括區(qū)域230、232、234、236,以及238。不同圖像中的位于大致相同位置的不同區(qū)域是對應的區(qū)域。例如,區(qū)域210、220,以及230是對應的區(qū)域。作為另一示例,區(qū)域214和2 是對應的區(qū)域。返回到圖1,評價模塊IM分析圖像110,就圖像110的每一個區(qū)域被評價模塊IM 感覺起來如何作出判斷?;谶@些判斷,多個對應的區(qū)域中的一個可以被輕松地判斷為多個對應的區(qū)域中的“最佳”區(qū)域。評價模塊IM可以使用各種不同的規(guī)則或準則就圖像的區(qū)域感覺起來如何作出判斷,并可以生成反映此判斷的值。由評價模塊IM所生成的值可以是,例如,表示模塊IM感覺一個區(qū)域與其他區(qū)域相比如何的該區(qū)域的分數(shù),表示模塊IM 感覺一個區(qū)域與其他區(qū)域相比如何的該區(qū)域的排序等等。在多個對應的區(qū)域中,可以選擇具有“最佳”(例如,最高)值的區(qū)域作為多個對應的區(qū)域中的“最佳”區(qū)域。在其中評價模塊124生成表示一個區(qū)域感覺起來如何的該區(qū)域的分數(shù)的各實施例中,通常,帶有較高分數(shù)(例如,較大的數(shù)值)的區(qū)域感覺起來比帶有較低的分數(shù)(例如, 較小的數(shù)值)的區(qū)域好??梢砸愿鞣N不同的方式確定分數(shù)。在一個或多個實施例中,通過評估區(qū)域的各種特征中的一個或多個來確定分數(shù)。評價模塊1 被配置有與影響區(qū)域的分數(shù)的各種特征相關(guān)聯(lián)的權(quán)重,或以其他方式具有對這些權(quán)重的訪問權(quán),一些特征與其他特征相比與較高的權(quán)重相關(guān)聯(lián)。一個區(qū)域中的不同的特征可以增加該區(qū)域的分數(shù)或降低該區(qū)域的分數(shù)(例如,取決于特定特征的權(quán)重)。在其他實施例中,基于學習過程來確定分數(shù),在該學習過程中,組件或模塊(如評價模塊124)自動地學習要給區(qū)域的哪些屬性給予更高的分數(shù)。例如,可以使用神經(jīng)網(wǎng)絡、決策樹或其他學習機,以基于對于區(qū)域的、被用戶標識為好或壞的用戶反饋,來了解區(qū)域中被用戶標識為好的特征,以及區(qū)域中被用戶標識為壞的特征。 然后,可以使用此神經(jīng)網(wǎng)絡、決策樹或其他學習機來為圖像中的不同的區(qū)域分配分數(shù)。
可另選地,可以通過比較(如通過使用神經(jīng)網(wǎng)絡、決策樹,或其他學習機)多個對應的區(qū)域,判斷一個區(qū)域被評價模塊IM感覺起來如何。此比較可以基于評估一個區(qū)域的各種不同的特征中的一個或多個?;诖吮容^,選擇多個對應的區(qū)域中的一個作為被感覺為多個對應的區(qū)域中的“最佳”區(qū)域??梢钥扇芜x地使用神經(jīng)網(wǎng)絡、決策樹,或其他學習機, 自動地確定多個對應的區(qū)域中被感覺為多個對應的區(qū)域中的“最佳”區(qū)域的一個。可以向這些區(qū)域分配排序(例如,按從被感覺為“最佳”的區(qū)域到被感覺為“最差”的區(qū)域的順序, 對區(qū)域進行排序)。可另選地,可以向這些區(qū)域分配分數(shù)(例如,“最佳”或“非最佳”值), 或可以標記或以其他方式將多個區(qū)域中的一個標識為被感覺為多個區(qū)域中的“最佳”區(qū)域。在其中通過評估區(qū)域的一個或多個特征來作出對區(qū)域感覺起來如何的判定的各實施例中,這些特征可包括該區(qū)域內(nèi)的對象的特征和/或該區(qū)域的其他特征。下面是評價模塊IM在判斷一個區(qū)域感覺起來如何時可以使用的多個不同的特征的列表。這些特征是對象被用通常所使用的標記進行了標記,對象被添加了標記,用戶畫了或確認了對象矩形或區(qū)域,對象識別具有高置信度建議,對象檢測器發(fā)現(xiàn)了存在的對象,眼睛數(shù)據(jù)被感覺為好的,微笑數(shù)據(jù)感覺為好的,圖像曝光不足,圖像曝光過度,對象模糊。可以理解,這些特征只是示例,可以可另選地使用其他特征。對象用通常所使用的標記講行了標記。該區(qū)域包括被標識為已知對象的對象(基于對象數(shù)據(jù)庫104),該對象是常用標記對象。標記的對象是其身份已由系統(tǒng)100的用戶標識了的對象。對象的身份可以作為包括該區(qū)域的圖像的一部分來維護(例如,在與圖像相關(guān)聯(lián)的元數(shù)據(jù)中)或者可另選地單獨地維護(例如,在單獨的記錄或數(shù)據(jù)庫中)。常用標記對象是其身份頻繁地在相同或不同圖像中由系統(tǒng)100的用戶標識了的對象。可以基于固定值(例如,對象在五個不同的圖像中由用戶標識五次,或者,對象是前五個最頻繁地標識的對象中的一個)或者基于相對值(例如,對象比對象數(shù)據(jù)庫104中的90%的其他對象更經(jīng)常地由用戶標識),確定此頻率。例如,如果對象數(shù)據(jù)庫104包括人們的多個圖像,那么,系統(tǒng)100的用戶可以通過標識(例如,按名字)那些人來標記那些圖像中的人。對象數(shù)據(jù)庫 104中的圖像中比圖像中的其他人更頻繁地標記的人是常用標記對象。對象被標記。該區(qū)域包括作為標記對象的對象。標記對象是其身份已由系統(tǒng)100 的用戶標識的對象。標記對象類似于蟬蛹標記對象,只是該對象沒有被系統(tǒng)100的用戶頻繁地標識。用戶畫了或確認了對象矩形或區(qū)域。該區(qū)域包括對象周圍的矩形或其他幾何形狀。可以由系統(tǒng)100的用戶在對象周圍畫矩形或其他形狀。可以以不同的方式繪制這樣的矩形或其他形狀,如系統(tǒng)100顯示包括對象的圖像110,并經(jīng)由用戶界面接收矩形或其他形狀的指示(例如,經(jīng)由指針、經(jīng)由觸摸屏上的手指或指示筆等等)??闪磉x地,可以由另一組件或模塊在對象周圍自動畫矩形或其他形狀,并由系統(tǒng)100的用戶確認該矩形或其他形狀的位置。在對象周圍繪制的矩形或其他形狀表示在該矩形或其他形狀內(nèi)存在對象,雖然該對象的身份還沒有被系統(tǒng)100的用戶標識。對象識別具有高置信度建議。該區(qū)域包括已經(jīng)被以高準確性概率自動標識的對象。這樣的對象由特定組件或模塊標識而不是由系統(tǒng)100的用戶標識。對象可以由對象檢測模塊122或者可另選地由另一組件或模塊標識??梢砸圆煌姆绞?,如基于固定值(例如,至少95%準確性概率)或相對值(例如,比由組件模塊檢測到的80%的其他對象高的概率),來標識高準確性概率。對象檢測器發(fā)現(xiàn)對象存在。該區(qū)域包括已經(jīng)由特定組件或樽塊而不是由系統(tǒng)100 的用戶自動標識的對象。對象可被對象檢測模塊122或者可另選地另一組件或模塊標識。眼睛數(shù)據(jù)被感覺為好的。在其中對象包括面部的各實施例中,可以牛成表示每一張臉上的眼睛被感覺起來如何的值。此值可以例如反映,是否檢測到在每一張臉上存在眼睛(例如,而不是由于轉(zhuǎn)頭或一只手蓋住了眼睛而從視圖上遮蔽),是否檢測到眼睛是睜開的(例如,而不是由于眨眼而閉上),眼睛中是否有明顯的反光,等等??梢允褂酶鞣N不同的傳統(tǒng)技術(shù)來檢測臉上的眼睛,判斷眼睛是否是睜開的,標識眼睛中的反光等等??梢?,例如, 通過如果在臉上檢測到?jīng)]有反光的睜開的眼睛,則分配較大的數(shù)值,如果在臉上檢測到有反光的睜開的眼睛,則分配較小的值,而如果在臉上檢測到閉著的眼睛,則分配更小的值, 等等,來生成該值?;蛘?,如果在臉上檢測到增強圖像的反光(例如,基于眼睛中的反光的方向是否匹配圖像中的(其他區(qū)域中的)其他臉中的眼睛中的反光的方向),則可以分配較大的數(shù)值,而如果在臉上檢測到不增強圖像的反光,則分配較小的數(shù)值。可另選地,可以通過學習過程(如神經(jīng)網(wǎng)絡、決策樹或其他學習機)來確定表示臉上的眼睛被感覺起來如何的排序或值,該學習過程自動學習臉的哪些屬性表示眼睛有多好(例如,基于關(guān)于什么是好的用戶反饋)。微笑數(shù)據(jù)被感覺為好的。在其中對象包括面部的各實施例中,可以牛成表示每一張臉上的微笑被感覺起來如何的值??梢陨纱艘岳绫硎?,是否檢測到在每一張臉上存在嘴(例如,而不是由于轉(zhuǎn)頭或手蓋住了嘴而從視圖中遮蔽),是否檢測到存在微笑(例如, 而不是存在皺眉頭或吐舌頭)等等。可以使用各種不同的傳統(tǒng)技術(shù)來檢測臉上是否存在嘴,臉上是否有微笑等等。可以例如通過如果在臉上檢測到微笑,則分配較大的數(shù)值,如果在臉上檢測到閉著嘴,則分配較小的值,而如果在臉上沒有檢測到嘴,則分配更小的值,以此類推,來生成該值。可另選地,可以通過學習過程(如神經(jīng)網(wǎng)絡、決策樹或其他學習機) 來確定表示臉上的微笑被感覺起來如何的排序或值,該學習過程自動學習臉的哪些屬性表示微笑有多好(例如,基于關(guān)于什么是好的用戶反饋)。圖像曝光不足。圖像被判斷為曝光不足。可以基于整個圖像、基于圖像中的所有區(qū)域,或在逐區(qū)域的基礎上,進行此判斷??梢砸圆煌姆绞?,如基于從圖像的或圖像的一個或多個區(qū)域的直方圖導出的曝光值,來確定圖像是否曝光不足。也可以至少部分地基于為多個圖像110中的其他圖像確定的曝光值,來確定圖像是否曝光不足。例如,可以將具有至少比其他多個圖像的曝光值小閾值量的曝光值的圖像判斷為曝光不足。此閾值量可以是固定量(例如,圖像的直方圖的特定部分小于其他圖像的直方圖的相同部分)或者相對量 (例如,圖像的直方圖的特定部分至少比其他圖像的直方圖的相同部分小10% )。圖像曝光過度。圖像被判斷為曝光過度。可以基于整個圖像、基于圖像中的所有區(qū)域,或在逐區(qū)域的基礎上,進行此判斷??梢砸圆煌姆绞剑缁趶膱D像的或圖像的一個或多個區(qū)域的直方圖導出的曝光值,來確定圖像是否曝光過度。也可以至少部分地基于為多個圖像110中的其他圖像確定的曝光值,來確定圖像是否曝光過度。例如,可以將具有至少比其他多個圖像的曝光值大閾值量的曝光值的圖像判斷為曝光過度。此閾值量可以是固定量(例如,圖像的直方圖的特定部分大于其他圖像的直方圖的相同部分)或者相對量 (例如,圖像的直方圖的特定部分至少比其他圖像的直方圖的相同部分大10% )。
10
對象是樽糊的。檢測到區(qū)域中的對象是樽糊的??梢砸愿鞣N不同的常規(guī)方式標識對象是否模糊的、對象的模糊程度或模糊類型(例如,景深模糊、運動模糊、相機抖動模糊
寸寸J。由評價模塊IM所使用的每一特征(如上文所討論的那些)都具有相關(guān)聯(lián)的權(quán)重,并且不同的特征可以具有不同的相關(guān)聯(lián)的權(quán)重。例如,關(guān)于圖像是否曝光過度,圖像是否曝光不足,以及對象是否模糊的特征與其他特征相比可具有較低的相關(guān)聯(lián)的權(quán)重。特征的權(quán)重可以是,例如,特定值(如數(shù)值)或一組值(例如,多個數(shù)值的集合)。在一個或多個實施例中,使用這些權(quán)重中的一個或多個來為區(qū)域生成分數(shù)。使用該分數(shù)來標識哪一個區(qū)域被感覺起來“最佳”(例如,具有最高分數(shù)的區(qū)域被感覺起來“最佳”)??梢砸愿鞣N不同的方式生成一個區(qū)域的分數(shù)。在一個或多個實施例中,評價模塊124 為由模塊1 評估的區(qū)域的每一個特征生成特征分數(shù)或值(例如,表示區(qū)域是否包括被標識為已知對象并且是常用標記對象的對象的特征分數(shù)、作為表示每一張臉上的眼睛被感覺起來如何的值的特征分數(shù)等等)。將這些特征分數(shù)標準化,以便由評價模塊1 評估的各種特征的特征分數(shù)具有相同范圍。對于由評價模塊1 評估的每一個特征,模塊IM確定特征分數(shù)和權(quán)重的乘積,并將一起評估的各種特征的這些乘積相加,以獲得該區(qū)域的分數(shù)。在其他實施例中,將評估的各種特征的特征分數(shù)組合起來(例如,相加、平均等等),而不標準化和/或乘以權(quán)重,來確定區(qū)域的分數(shù)。在其他實施例中,可以選擇這些特征分數(shù)中的一個 (例如,具有最大的值的特征分數(shù))作為該區(qū)域的分數(shù)。在其他實施例中,可以按優(yōu)先次序來分析特征(例如,通過神經(jīng)網(wǎng)絡、決策樹,或其他學習機),并基于特征,分配該區(qū)域的分數(shù)。圖像組合模塊1 使用對區(qū)域感覺起來如何的判定,選擇多個圖像110中的一個作為基礎圖像。此基礎圖像充當正在生成的組合圖像112的起始點,并可以將區(qū)域替換為來自其他圖像的對應的區(qū)域,以生成組合圖像112。在一個或多個實施例中,通過組合圖像各區(qū)域的分數(shù)(例如,相加、平均等等)來計算圖像分數(shù)。基礎圖像被選為具有最大的圖像分數(shù)的圖像。可另選地,可以以不同的方式標識基礎圖像,如選擇具有帶有最高分數(shù)的區(qū)域的圖像作為基礎圖像,選擇具有最大數(shù)量的被判斷為相對于其他圖像的對應的區(qū)域是“最佳”區(qū)域的區(qū)域的圖像,隨機地或根據(jù)某種其他規(guī)則或準則來選擇基礎圖像,等等。對于基礎圖像中的每一個區(qū)域,圖像組合模塊1 判斷是保留該區(qū)域還是將該區(qū)域替換為多個圖像中的另一圖像中的對應的區(qū)域。圖像組合模塊1 通過自動選擇對應的區(qū)域中被判斷為“最佳”區(qū)域的那一個區(qū)域(如如上文所討論的評價模塊IM所判斷的), 來進行此判斷。例如,參考圖2,假設圖像204是基礎圖像。圖像組合模塊1 判斷對應的區(qū)域212、222,以及232中的哪一個區(qū)域被判斷為“最佳”區(qū)域。如果區(qū)域222被判斷為“最佳”區(qū)域,那么,圖像組合模塊1 將區(qū)域222保留在圖像204中,以生成組合圖像。然而, 如果區(qū)域212或232被判斷為“最佳”區(qū)域,那么,圖像組合模塊126自動將圖像204中的區(qū)域222替換為區(qū)域212和232中被判斷為“最佳”區(qū)域的那一個區(qū)域。應該注意,基礎圖像中包括對象的特定區(qū)域可以被圖像組合模塊126自動替換為另一圖像中不存在該對象的對應區(qū)域。例如,參考圖2,假設圖像204是基礎圖像。進一步假設,區(qū)域218和區(qū)域2 兩者都包括不被認為是認識的人的面部,且因此區(qū)域218和區(qū)域 2 兩者都被評價模塊IM分配了低(可能是負的)分數(shù)。進一步假設,在捕捉圖像時該人從場景中走過,且因此該人不被包括在對應區(qū)域238中。評價模塊IM可以向區(qū)域238 分配比區(qū)域218和2 高的分數(shù),因為區(qū)域238不包括不被認為是認識的人的臉。如此,區(qū)域238被判斷為對應區(qū)域218、238,以及238中的“最佳”區(qū)域。因此,圖像組合模塊126自動將圖像204中的區(qū)域2 替換為區(qū)域238,以生成組合圖像。通過將區(qū)域2 替換為區(qū)域238,自動將其中存在一對象的區(qū)域(區(qū)域228)替換為其中不存在該對象的區(qū)域(區(qū)域 238)。圖3示出了根據(jù)一個或多個實施例的自動地將一個圖像中的區(qū)域替換為來自其他圖像的對應區(qū)域以生成組合圖像的示例。圖3示出了相同的場景的三個圖像302、304,以及306,它們分別是,例如圖2的圖像202、204,以及206。雖然在圖3的示例中只示出了三個圖像,但是,可以理解,任意數(shù)量的圖像可以適用于此處所討論的技術(shù)。圖像 302 包括區(qū)域 310、312、314、316,以及 318。圖像 304 包括區(qū)域 320、322、324、 326,以及328。圖像306包括區(qū)域330、332、334、336,以及338。在圖3中利用陰影線示出了被判斷為“最佳”區(qū)域的對應區(qū)域。因此,區(qū)域320被判斷為對應區(qū)域310、320以及330 的集合中的“最佳”區(qū)域。類似地,區(qū)域332被判斷為對應區(qū)域312、322以及332的集合中的“最佳”區(qū)域,區(qū)域314被判斷為對應區(qū)域314、324以及334的集合中的“最佳”區(qū)域,區(qū)域336被判斷為對應區(qū)域316、326以及336的集合中的“最佳”區(qū)域,而區(qū)域338被判斷為對應區(qū)域318、328以及338的集合中的“最佳”區(qū)域。在一個或多個實施例中,圖像306具有最大數(shù)量的被判斷為“最佳”區(qū)域的區(qū)域,因此,圖像306被評價模塊IM選為基礎圖像。區(qū)域320被判斷為區(qū)域310、320以及330中的“最佳”區(qū)域,如此,圖像組合模塊 126在組合圖像中自動地將區(qū)域330替換為區(qū)域320。類似地,區(qū)域314被判斷為區(qū)域314、 324以及334中的“最佳”區(qū)域,如此,圖像組合模塊126自動地將區(qū)域334替換為區(qū)域314。 區(qū)域332被判斷為區(qū)域312、322以及332中的“最佳”區(qū)域,所以區(qū)域332被保留在組合圖像中。類似地,區(qū)域336和338被保留在組合圖像中,因為它們被判斷為相對于其他圖像的它們的對應區(qū)域是“最佳”區(qū)域。應該注意,一個圖像可包括沒有被標識為區(qū)域的區(qū)塊或部分。例如,圖像306包括不是區(qū)域330、332、334、336以及338的一部分的區(qū)塊。對于這樣的沒有被標識為區(qū)域的區(qū) ±夬,圖像組合模塊126保留來自基礎圖像的那些區(qū)塊,不將那些區(qū)塊替換為來自另一圖像的區(qū)塊??闪磉x地,這樣的區(qū)塊可以被視為額外的一個或多個區(qū)域,評價模塊IM判斷這樣的區(qū)塊感覺起來如何,圖像組合模塊126基于這些判斷,自動地將基礎圖像中的這些區(qū)塊替換為另一圖像的對應區(qū)塊。圖4示出了根據(jù)一個或多個實施例的組合圖像的示例。圖4示出了圖像400,該圖像400是從圖3的圖像302、304,以及306生成的組合圖像(例如,通過圖1的圖像組合模塊126)。圖像400包括來自基礎圖像的區(qū)域,以及來自其他圖像的替換了基礎圖像中的區(qū)域的對應的區(qū)域。接在對圖3的討論后面,圖像400包括區(qū)域320、332、314、336以及338。返回到圖1,圖像組合模塊1 基于作出的區(qū)域被評價模塊124感覺起來如何的判定,選擇要包括在組合圖像中的區(qū)域,如上文所討論的。另外,在一個或多個實施例中,圖像組合模塊126和UI模塊106可允許用戶提供關(guān)于將選擇多個對應的區(qū)域中的哪一個區(qū)域包括在組合圖像112中的輸入。此用戶輸入可以覆蓋由圖像組合模塊1 作出的自動選擇,或者也可以在不同的時間輸入(例如,在由圖像組合模塊126作出自動選擇之前)。
UI模塊106生成、管理和/或輸出供顯示的用戶界面。此用戶界面可允許用戶提供關(guān)于要選擇多個對應的區(qū)域中的哪一個區(qū)域的輸入。用戶界面可以顯示在實現(xiàn)用戶界面模塊106的設備的屏幕上,或者也可以生成一個或多個信號,供輸出到一個或多個其他顯示設備,顯示設備包括可以在其上面顯示用戶界面的屏幕??梢砸愿鞣N不同的方式實現(xiàn)屏幕,如使用液晶顯示器(LCD)技術(shù)、等離子屏幕技術(shù)、圖像投影技術(shù)等等。UI模塊106還接收來自用戶(例如,實現(xiàn)UI模塊106的設備的用戶)的用戶輸入。可以以各種不同的方式提供用戶輸入,如通過按下觸摸板或觸摸屏的特定部分,或者通過按下小鍵盤或鍵盤的一個或多個鍵??梢允褂酶鞣N不同的技術(shù)來提供觸摸屏功能。還可以以其他方式提供用戶輸入,如通過可聽的輸入,對設備的其他物理反饋輸入(例如,敲擊設備的任何部分,或者可以被設備的運動檢測組件識別的另一動作,如搖動設備,旋轉(zhuǎn)設備
等等),等等。在一個或多個實施例中,UI模塊106生成用戶界面,對于一個圖像的特定區(qū)域,該用戶界面顯示多個圖像中的每一個其他圖像的對應區(qū)域。這些對應區(qū)域可以按照不同的方式顯示,如在該特定區(qū)域附近的菜單或窗口中,在窗口的條帶或其他部分等等。用戶可以通過UI模塊106提供輸入以選擇其他圖像中的一個圖像,響應于此,圖像組合模塊1 將組合圖像中的區(qū)域替換為用戶選擇的圖像。圖5示出了根據(jù)一個或多個實施例的用戶界面的示例,通過該用戶界面,用戶可以提供關(guān)于要選擇多個對應區(qū)域中的哪一個的輸入。圖5示出了圖像400,該圖像與如圖4 所示的圖像400相同。另外,圖5示出了區(qū)域338附近的窗口 500。用戶可以通過提供各種不同的用戶輸入(例如,當光標顯示在區(qū)域338的頂部時點擊鼠標的特定按鈕,選定一個菜單選項等等),請求顯示窗口 500。窗口 500顯示來自其他圖像的對應于特定區(qū)域的區(qū)域。在圖5中所示出的示例中, 窗口 500包括區(qū)域318,以及328,它們是對應于區(qū)域338的區(qū)域。用戶可以選擇(通過經(jīng)由圖1的UI模塊106提供輸入)區(qū)域318和328中的一個,響應于該選擇,圖1的圖像組合模塊1 將區(qū)域338替換為區(qū)域318和328中的用戶選定的那一個區(qū)域。如此,可以看到, 可以向用戶顯示可以替換自動地選擇的區(qū)域338的其他區(qū)域,而用戶可以選擇這些其他區(qū)域中的一個以替換自動地選擇的區(qū)域338。如此,用戶可以輕松地替換特定區(qū)域,如果他或她更偏愛一不同的區(qū)域的話。圖6是示出了根據(jù)一個或多個實施例的用于從多個圖像生成組合圖像的示例過程600的流程圖。過程600通過諸如實現(xiàn)圖1的圖像生成模塊102的設備之類的設備來執(zhí)行,并可以以軟件、固件、硬件,或其組合來實現(xiàn)。過程600被示為一組動作,不僅限于所示出的用于執(zhí)行各種動作的操作的順序。過程600是用于從多個圖像生成組合圖像的示例過程;此處參考不同的圖包括了關(guān)于從多個圖像生成組合圖像的額外的討論。在過程600中,訪問多個圖像(動作602)??梢砸匀缟衔乃懻摰母鞣N不同的方式接收或獲取這多個圖像。將多個圖像對齊(動作604)。作為此對齊的一部分,如上文所討論的,標識多個圖像的對應區(qū)域。另外,如果多個圖像中的一個或多個無法對齊(例如,由于它們是不同的場景的圖像),那么,從多個圖像中刪除這一個或多個圖像。對于多個圖像的每一個圖像中的多個區(qū)域中的每一個區(qū)域,就該區(qū)域被感覺起來如何作出判斷(動作606)。此判斷可以以各種不同的方式進行,諸如通過評估區(qū)域的各種特征中的一個或多個,和/或基于學習過程,如上文所討論的。基于動作606中進行的判斷,標識基礎圖像(動作608)??梢砸圆煌姆绞綐俗R基礎圖像,諸如選擇具有最大的圖像分數(shù)的圖像,選定具有最大的數(shù)量被感覺為“最佳”的區(qū)域的圖像等等,如上文所討論的。通過自動地將基礎圖像中的一個或多個區(qū)域替換為被感覺為更佳的其他圖像中的對應區(qū)域來生成組合圖像(動作610)。被感覺起來更佳的這些區(qū)域是具有更高的分數(shù)、 具有更高的排序、被學習過程確定為“最佳”的對應的區(qū)域等等。如上文所討論的,所產(chǎn)生的組合圖像包括,對于基礎圖像中的每一個區(qū)域,對應區(qū)域中被感覺起來“最佳”的區(qū)域那一個區(qū)域。對應區(qū)域中被感覺起來“最佳”的區(qū)域的那一個區(qū)域可以是其中不存在存在于多個圖像中的其他圖像的一個或多個對應區(qū)域中的對象的區(qū)域,如上文所討論的。輸出在動作610中所生成的組合圖像(動作612)??梢砸愿鞣N不同的方式輸出組合圖像,如顯示組合圖像,將組合圖像存儲在特定位置(例如,存儲在非易失性存儲器中的文件中),將組合圖像傳遞到實現(xiàn)過程600的設備(或者另一設備)的另一組件或模塊等寸。圖7是示出了根據(jù)一個或多個實施例的用于基于用戶輸入選擇要包括在組合圖像中的區(qū)域的示例過程700的流程圖。過程700通過諸如實現(xiàn)圖1的圖像生成模塊102的設備之類的設備來執(zhí)行,并可以以軟件、固件、硬件,或其組合來實現(xiàn)。過程700被示為一組動作,不僅限于所示出的用于執(zhí)行各種動作的操作的順序。過程700是用于基于用戶輸入選擇要包括在組合圖像中的區(qū)域的示例過程;此處參考不同的附圖給出了關(guān)于基于用戶輸入選擇要包括在組合圖像中的區(qū)域的額外的討論。在過程700中,對于圖像的特定區(qū)域,顯示來自其他圖像的對應區(qū)域(動作702)。 可以以不同的方式顯示這些對應圖像,如在該特定區(qū)域附近的窗口或菜單中。包括特定區(qū)域的圖像可以不同圖像,如用來生成組合圖像的基礎圖像,在來自不同圖像的區(qū)域被自動選擇以包括在組合圖像中之后的組合圖像等等。接收用戶對于對應區(qū)域中的一個區(qū)域的選擇(動作704)。可以響應于各種不同的用戶輸入,接收此用戶選擇,如上文所討論的。響應于動作704中的用戶選擇,圖像的特定區(qū)域被替換為用戶選定的區(qū)域(動作 706)。如此,例如,自動選擇的區(qū)域可以被用戶覆蓋,在組合圖像中包括用戶選擇的區(qū)域,而不是自動選擇的區(qū)域??梢詫τ趫D像的多個不同區(qū)域重復過程700。另外,在一個或多個實施例中,在圖像捕捉過程中,可以使用此處所討論的從多個圖像生成組合圖像的技術(shù)。在這樣的實施例中,除生成組合圖像之外,還進行檢查,以確保對應區(qū)域中的至少一個被感覺起來足夠好??梢砸圆煌姆绞綀?zhí)行此檢查。例如,對于圖像中的每一個區(qū)域,可以進行檢查,弄清該區(qū)域或另一圖像中的對應區(qū)域是否具有超出閾值的分數(shù)??梢砸愿鞣N方式,如憑經(jīng)驗,基于管理員或設計人員的偏好等等,來確定此閾值。 持續(xù)捕捉圖像,直到對應區(qū)域中的至少一個被感覺起來足夠好。例如,數(shù)碼相機可以具有可以通過按下特定按鈕、選擇特定菜單選項等等來激活的“群攝”特征。響應于在激活了群攝特征的情況下拍攝照片的用戶請求(例如,按下快門按鈕),數(shù)碼相機開始捕捉和分析圖像。數(shù)碼相機包括圖像生成模塊(例如,圖1的模塊 102),該模塊標識多個圖像中的區(qū)域,并如上文所討論的,判斷那些區(qū)域感覺起來如何。數(shù)碼相機持續(xù)捕捉圖像,直到對于不同的圖像中的每一組對應的區(qū)域,不同的圖像中的對應的區(qū)域中的至少一個被感覺起來足夠好(例如,超出閾值)。然后,數(shù)碼相機可以停止捕捉圖像,因為可以生成其中每一個自動選擇的區(qū)域被感覺起來足夠好(例如,超出閾值)的組合圖像。數(shù)碼相機可以可任選地提供諸如閃光或可聽音之類的反饋,表示數(shù)碼相機已經(jīng)停止捕捉圖像??闪磉x地,數(shù)碼相機可以響應于其他事件,如已經(jīng)捕捉了閾值數(shù)量的圖像,已經(jīng)對圖像捕捉了特定時間量,正在被檢測的一個或多個用戶在被捕捉的場景不再被檢測到等等,停止捕捉圖像。圖8示出了根據(jù)一個或多個實施例的可以被配置成從多個圖像生成組合圖像的示例計算設備800??梢允褂靡粋€或多個計算設備800來實現(xiàn),例如,圖1的服務100。計算設備800包括一個或多個處理器或處理單元802,一個或多個計算機可讀介質(zhì)804(可包括一個或多個存儲器和/或存儲組件806),一個或多個輸入/輸出(I/O)設備 808,以及可使各種組件和設備彼此進行通信的總線810。計算機可讀介質(zhì)804和/或一個或多個I/O設備808可以作為計算設備800的一部分被包括,或者可另選地可以耦合到計算設備800??偩€810表示若干類型的總線結(jié)構(gòu)中的任何一種總線結(jié)構(gòu)的一個或多個,包括存儲器總線或存儲器控制器、外圍總線、加速圖形端口,以及使用各種不同的總線體系結(jié)構(gòu)中的處理器或局部總線??偩€810可包括有線和/或無線總線。存儲器/存儲組件806表示一個或多個計算機存儲介質(zhì)。組件806可包括易失性介質(zhì)(諸如隨機存取存儲器(RAM))和/或非易失性介質(zhì)(諸如只讀存儲器(ROM)、閃存、光盤、磁盤等等)。組件806可包括固定介質(zhì)(例如,RAM、ROM、固定硬盤驅(qū)動器等等)以及可移動介質(zhì)(例如,閃存驅(qū)動器、可移動硬盤驅(qū)動器、光盤等等)。此處所討論的技術(shù)可以以軟件實現(xiàn),指令由一個或多個處理單元802??梢岳斫?, 不同的指令可以存儲在計算設備800的不同的組件中,諸如存儲在處理單元802中,存儲在處理單元802的各種緩存存儲器中,存儲在設備800(未示出)的其他緩存存儲器中,存儲在其他計算機可讀介質(zhì)上等等。另外,可以理解,指令存儲在計算設備800中的位置可以隨著時間而變化。一個或多個輸入/輸出設備808可使用戶向計算設備800輸入命令和信息,以及可使信息被呈現(xiàn)給用戶和/或其他組件或設備。輸入設備的示例包括鍵盤、光標控制設備 (例如,鼠標)、麥克風、掃描儀等等。輸出設備的示例包括顯示設備(例如,監(jiān)視器或投影儀)、揚聲器、打印機、網(wǎng)卡等等。此處可以在軟件或程序模塊的一般上下文中描述各種技術(shù)。一般而言,軟件包括執(zhí)行特定任務或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等等。這些模塊和技術(shù)的實現(xiàn)可以存儲在某種形式的計算機可讀介質(zhì)上或通過某種形式的計算機可讀介質(zhì)傳輸。計算機可讀介質(zhì)可以是可以被計算設備訪問的任何可用的介質(zhì)。作為示例,而不是限制,計算機可讀介質(zhì)可以包括“計算機存儲介質(zhì)”和“通信介質(zhì)”?!坝嬎銠C存儲介質(zhì)”包括以用于存儲諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)之類的信息的任何方法或技術(shù)實現(xiàn)的易失性和非易失性、可移動和不可移動介質(zhì)。計算機存儲介質(zhì)包括,但不僅限于,RAM、R0M、EEPR0M、閃存或其他存儲技術(shù),CD-ROM、數(shù)字多功能盤(DVD)或其他光存儲器、磁帶盒、磁帶、磁盤存儲器或其他磁存儲設備,或可以用來存儲所需要的信息并可以被計算機訪問的任何其他介質(zhì)。“通信介質(zhì)”通常用諸如載波或其它傳輸機制等已調(diào)制數(shù)據(jù)信號來體現(xiàn)計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)。通信介質(zhì)還包括任何信息傳送介質(zhì)。術(shù)語“已調(diào)制數(shù)據(jù)信號”是指其一個或多個特征以這樣的方式設置或改變以便在信號中對信息進行編碼的信號。作為示例而非限制,通信介質(zhì)可包括有線介質(zhì),如有線網(wǎng)絡或直接線連接,以及諸如聲學、射頻(RF)、紅外線及其他無線介質(zhì)之類的無線介質(zhì)。上面各項中的任何組合也包括在計算機可讀介質(zhì)的范圍內(nèi)。一般而言,此處所描述的任何功能或技術(shù)都可使用軟件、固件、硬件(例如,固定邏輯電路)、手動處理或這些實現(xiàn)的組合來實現(xiàn)。如此處所使用的術(shù)語“模塊”和“組件”一般代表軟件、固件、硬件或其組合。在軟件實現(xiàn)的情況下,模塊或組件表示當在處理器(例如,一個或多個CPU)上執(zhí)行時執(zhí)行指定任務的程序代碼。程序代碼可以存儲在一個或多個計算機可讀的存儲器設備中,可以參考圖8發(fā)現(xiàn)關(guān)于其進一步的描述。此處所描述的從多個圖像生成組合圖像的技術(shù)的特征是平臺無關(guān)的,意味著本發(fā)明的技術(shù)可以在具有各種處理器的各種商業(yè)計算平臺上實現(xiàn)。盡管用結(jié)構(gòu)特征和/或方法動作專用的語言描述了本主題,但可以理解,所附權(quán)利要求書中定義的主題不必限于上述具體特征或動作。相反,上述具體特征和動作是作為實現(xiàn)權(quán)利要求的示例形式公開的。
權(quán)利要求
1.一種方法,包括訪問(60 多個圖像,每一個圖像都包括多個對象;對于所述多個圖像中的多個區(qū)域中的每一個區(qū)域,就所述區(qū)域被所述設備感覺起來如何作出判斷(606);以及基于對所述多個圖像中的所述多個區(qū)域的對應區(qū)域被感覺起來如何作出的判斷,從所述多個圖像生成(610)組合圖像,所述生成包括自動地從所述多個圖像中的一個中選擇區(qū)域以包括在所述組合圖像中,在所述區(qū)域不存在在所述多個圖像中的其他圖像的一個或多個對應區(qū)域中存在的對象。
2.如權(quán)利要求1所述的方法,其特征在于,對于所述多個區(qū)域中的每一個區(qū)域,就所述區(qū)域被感覺起來如何作出判斷包括,對于所述多個區(qū)域中的每一個區(qū)域,基于所述區(qū)域的一個或多個特征,確定與所述區(qū)域相關(guān)聯(lián)的分數(shù)或排序。
3.如權(quán)利要求1所述的方法,還包括對于所述組合圖像的第一區(qū)域,顯示所述多個圖像中的一個或多個其他圖像的對應區(qū)域;接收用戶對于所述一個或多個其他圖像的所述對應區(qū)域中的一個的選擇;以及將所述組合圖像的所述第一區(qū)域替換為所述一個或多個其他圖像的所述對應區(qū)域中的所述用戶選定的那一個。
4.如權(quán)利要求3所述的方法,其特征在于,顯示所述對應區(qū)域包括在所述第一區(qū)域附近的窗口中顯示所述對應的區(qū)域。
5.如權(quán)利要求1所述的方法,其特征在于,所述多個對象中的每一個都包括面部。
6.如權(quán)利要求1所述的方法,其特征在于,還包括如果存在于其他圖像的所述一個或多個對應區(qū)域中的所述對象,基于對象數(shù)據(jù)庫中的信息,沒有被標識為已知對象,則自動地選擇其中不存在所述對象的區(qū)域。
7.如權(quán)利要求1所述的方法,其特征在于,作出所述區(qū)域感覺起來如何的判斷包括判斷由用戶所標識的對象是否包括在所述區(qū)域中,以及基于由所述用戶所標識的對象是否包括在所述區(qū)域中來對于所述區(qū)域進行所述判斷。
8.如權(quán)利要求1所述的方法,其特征在于,所述多個對象包括多個面部,并且,其中作出所述區(qū)域感覺起來如何的判斷包括判斷眼睛在所述區(qū)域中的面部中是否被檢測為睜開的,以及基于眼睛是否被檢測為睜開的和/或是否在所述區(qū)域中的面部中包括反光,來對于所述區(qū)域進行所述判斷。
9.如權(quán)利要求1所述的方法,其特征在于,所述多個對象包括多個面部,并且,其中作出所述區(qū)域感覺起來如何的判斷包括判斷在所述區(qū)域的面部中是否檢測到微笑存在,以及基于在區(qū)域的所述的面部中是否檢測到微笑存在,對于所述區(qū)域進行所述判斷。
10.如權(quán)利要求1所述的方法,其特征在于,生成所述組合圖像包括將所述多個圖像中的第一圖像標識為基礎圖像;以及如果所述多個圖像中的第二圖像的對應區(qū)域被感覺為比所述第一圖像的每一個區(qū)域好,則自動地將所述基礎圖像的所述區(qū)域替換為所述第二圖像的所述對應的區(qū)域,來從所述多個圖像生成組合圖像。
11.如權(quán)利要求10所述的方法,其特征在于,如果所述第二圖像的所述對應的區(qū)域沒有所述對象,則所述第二圖像的所述對應區(qū)域被感覺起來比所述第一圖像的所述區(qū)域好。
12.如權(quán)利要求10所述的方法,其特征在于,將所述第一圖像標識為所述基礎圖像包括對于所述多個圖像中的每一個圖像,判斷所述圖像中有多少區(qū)域被判斷為所述最佳;以及選擇所述多個圖像中具有最大數(shù)量的被判斷為最佳的區(qū)域的圖像作為所述基礎圖像。
13.如權(quán)利要求1所述的方法,其特征在于,所述設備包括捕捉所述多個圖像的數(shù)碼相機,所述方法還包括持續(xù)捕捉圖像以包括在所述多個圖像中,直到,對于圖像中的所述多個區(qū)域中的每一個區(qū)域,所述區(qū)域或所述多個圖像中的另一圖像的對應區(qū)域具有超出閾值的分數(shù)。
14.一種計算設備,包括 處理器(802);以及在其上存儲了多個指令的一個或多個計算機可讀介質(zhì)(804),當由所述處理器執(zhí)行時, 所述指令使所述處理器訪問(60 多個圖像,每一個圖像都包括多個對象;對于所述多個圖像中的多個區(qū)域中的每一個區(qū)域,就所述區(qū)域被所述計算設備感覺起來如何作出判斷(606);標識(60 所述多個圖像的基礎圖像;如果所述多個圖像中的另一圖像的對應區(qū)域被判斷為比所述基礎圖像的每一個區(qū)域好,則自動地將所述基礎圖像的所述區(qū)域替換為所述對應區(qū)域,來從所述多個圖像生成 (610)組合圖像;顯示(70 所述多個圖像中的其他圖像中的每一個圖像的各區(qū)域,每一個所述區(qū)域都對應于所述基礎圖像的特定區(qū)域;接收(704)用戶對于所述多個圖像中的所述其他圖像的所述對應區(qū)域中的一個的選擇;以及將所述基礎圖像的所述特定區(qū)域替換(706)為所述其他圖像的所述對應區(qū)域中的所述用戶選定的那一個。
15.如權(quán)利要求14所述的計算設備,其特征在于,顯示其他圖像中的每一個圖像的所述區(qū)域是在所述特定區(qū)域附近的窗口中顯示所述其他圖像中的每一個圖像的所述區(qū)域。
全文摘要
公開了從多個圖像生成組合圖像的系統(tǒng)和方法。對于多個圖像中的多個區(qū)域中的每一個區(qū)域,就該區(qū)域被感覺起來如何作出判斷。標識基礎圖像,如果多個圖像中的另一圖像的對應的區(qū)域被判斷為比基礎圖像的每一個區(qū)域更佳,則自動地將基礎圖像的區(qū)域替換為對應的區(qū)域,由此,從多個圖像生成組合圖像。生成組合圖像可包括自動地從多個圖像中的一個中選擇一個區(qū)域,在該區(qū)域不存在在其他圖像的一個或多個對應的區(qū)域中存在的對象。另外,對于基礎圖像的一個特定區(qū)域,可以顯示其他圖像的對應的區(qū)域,將該特定區(qū)域替換為其他圖像的對應的區(qū)域中的用戶選定的那一個區(qū)域。
文檔編號G06T5/50GK102236890SQ20111011804
公開日2011年11月9日 申請日期2011年4月29日 優(yōu)先權(quán)日2010年5月3日
發(fā)明者E·J·理查茲, R·A·比肖夫, T·R·奧康納, T·S·M·卡斯佩基維茨 申請人:微軟公司