本發(fā)明涉及圖像處理技術領域,特別涉及一種照片智能裁剪方法及裝置。
背景技術:
隨著智能終端設備拍照性能的不斷增強,人們熱衷于隨手記錄下生活中的美麗瞬間,并分享至社交網(wǎng)絡中。但是通常我們拍攝完的照片并不適合直接上傳至互聯(lián)網(wǎng),需要進行一些后期處理。例如,拍照時手指不小心遮擋了鏡頭邊緣或鏡頭邊緣有人誤入;只想截取照片中的部分畫面用作突出顯示;有一張很美的矩形自拍照,而微信頭像卻要求是正方形。上述這些情況下通常需要進行照片裁剪,目前主流拍照/修圖類應用已提供的照片裁剪功能是通過自由/固定比例手動編輯截圖,但由于普通用戶通常并不具備構圖等專業(yè)的攝影知識,因此手動裁剪出的照片美學質(zhì)量不能保證,另外,手動裁剪出照片的比例可能也不符合應用要求。申請?zhí)枮閏n201410681308.7的發(fā)明對拍攝的圖像進行人臉檢測獲得人臉檢測框;以人臉檢測框中心點為原點,按照面積與人臉檢測框的面積比例10:7生成長寬比為4:3的矩形裁剪框;將圖像中所述矩形裁剪框以外的部分裁剪掉。該發(fā)明從人臉檢測的角度對證件照等人臉為主照片的裁剪具有較好效果,但對于大量的普通照片卻無法實現(xiàn)智能裁剪。
技術實現(xiàn)要素:
鑒于上述問題,本發(fā)明提供了一種照片智能裁剪方法及裝置。
本發(fā)明提供的照片智能裁剪方法,包括以下步驟:
獲取智能設備照片圖像;
在所述照片圖像中生成若干子區(qū)域,計算所述若干子區(qū)域的美學評分,根據(jù)所述美學評分得到最佳美感裁剪區(qū)域;
根據(jù)所述最佳美感裁剪區(qū)域的坐標裁剪所述照片圖像。
本發(fā)明還提供了一種照片智能裁剪裝置,包括:圖像獲取模塊、計算模塊、裁剪模塊:
所述圖像獲取模塊,用于獲取智能設備照片圖像;
所述計算模塊,用于在所述照片圖像中生成若干子區(qū)域,計算所述若干子區(qū)域的美學評分,根據(jù)所述美學評分得到最佳美感裁剪區(qū)域;
所述裁剪模塊,用于根據(jù)所述最佳美感裁剪區(qū)域的坐標裁剪所述照片圖像。
本發(fā)明有益效果如下:
本發(fā)明實施例的照片智能裁剪方法及裝置通過圖像美學評價技術實現(xiàn)照片的智能裁剪,使得從美學角度裁剪出更加符合應用場景的照片;本發(fā)明適用的照片類型更加普遍,且操作方便、效率高。所以,本發(fā)明有效克服了現(xiàn)有技術中的種種缺點而具高度產(chǎn)業(yè)利用價值。
附圖說明
圖1是本發(fā)明方法實施例的照片智能裁剪方法的流程圖;
圖2是本發(fā)明裝置實施例的照片智能裁剪裝置的結構示意圖;
圖3是本發(fā)明實例1的照片智能裁剪方法的流程圖;
圖4是本發(fā)明實例2的照片智能裁剪方法的流程圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現(xiàn)本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。
為了解決現(xiàn)有技術剪出的照片美學質(zhì)量不能保證、或除人臉為主的照片外大量的普通照片卻無法實現(xiàn)智能裁剪的問題,本發(fā)明提供了一種照片智能裁剪方法及裝置,以下結合附圖以及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不限定本發(fā)明。
根據(jù)本發(fā)明的方法實施例,提供了一種照片智能裁剪方法,圖1是本發(fā)明方法實施例的照片智能裁剪方法的流程圖,如圖1所示,根據(jù)本發(fā)明方法實施例的照片智能裁剪方法包括如下處理:
步驟101,獲取智能設備照片圖像。
具體的,智能設備包括個人電腦、智能手機、平板電腦、智能眼鏡,以及其他具有攝像頭及數(shù)據(jù)處理功能的設備。
步驟102,在所述照片圖像中生成若干子區(qū)域,計算所述若干子區(qū)域的美學評分,根據(jù)所述美學評分得到最佳美感裁剪區(qū)域。具體的,在照片圖像中生成若干子區(qū)域包括用預設的滑動窗口遍歷所述照片圖像,得到若干個子區(qū)域。
其中,步驟102包括以下兩種技術方案。第一種技術方案包括以下步驟:使用第一滑動窗口遍歷所述照片圖像,利用預設的美學評價模型得到在遍歷的過程中所述第一滑動窗口對應的若干個美學評分,選取最高美學評分,以最高美學評分對應的位置作為最佳美感裁剪區(qū)域;其中,第一滑動窗口選取以下中的一種或幾種:原始比例滑動窗口、標準比例滑動窗口、預設比例滑動窗口。
更加具體的,當所述第一滑動窗口中包括所述預設比例滑動窗口時,所述使用第一滑動窗口遍歷所述照片圖像,利用預設的美學評價模型得到在遍歷的過程中所述第一滑動窗口對應的若干個美學評分,包括以下步驟:
使用預設比例滑動窗口遍歷所述照片圖像,利用預設的美學評價模型得到在遍歷的過程中所述第一滑動窗口對應的若干個美學評分。
更加具體的,當所述第一滑動窗口包括原始比例滑動窗口和標準比例滑動窗口時,使用第一滑動窗口遍歷所述照片圖像,利用預設的美學評價模型得到在遍歷的過程中所述第一滑動窗口對應的若干個美學評分,選取最高美學評分,包括以下方案a和方案b。
具體的,方案a包括以下步驟:
使用原始比例滑動窗口遍歷所述照片圖像,利用預設的美學評價模型得到在遍歷的過程中所述原始比例滑動窗口對應的若干個美學評分;
使用標準比例滑動窗口遍歷所述照片圖像,利用預設的美學評價模型得到在遍歷的過程中所述標準比例滑動窗口對應的若干個美學評分;
在所述原始比例滑動窗口對應的若干個美學評分、及所述標準比例滑動窗口對應的若干個美學評分中選取最高美學評分。
具體的,方案b包括以下步驟:
使用原始比例滑動窗口遍歷所述照片圖像,利用預設的美學評價模型得到在遍歷的過程中所述原始比例滑動窗口對應的若干個美學評分;
選取原始比例滑動窗口對應的若干個美學評分中最高的美學評分,根據(jù)最高的美學評分對應的原始比例滑動窗口的坐標得到原始比例下的最佳美感裁剪區(qū)域;
計算所述標準比例滑動窗口與所述原始比例下的最佳美感裁剪區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為標準比例下的最佳美感裁剪區(qū)域;
按照指令選擇原始比例下的最佳美感裁剪區(qū)域或標準比例下的最佳美感裁剪區(qū)域中的一個作為圖像最佳美感裁剪區(qū)域。
更加具體的,在方案a和方案b中,原始比例滑動窗口和標準比例滑動窗口可選用為幾個尺度。例如當原始比例滑動窗口選用3個尺度,各尺度的縮放比為1.2,最小尺度滑動窗口的水平方向邊長為原始圖像水平方向長邊的1/4時,即表示選用以下三種尺度的原始比例圖像:大小為原始圖像大小的0.25倍、大小為原始圖像大小的0.25×1.2倍、大小為原始圖像大小的0.25×1.2×1.2倍。
步驟102的第二種技術方案包括以下步驟:使用第二滑動窗口遍歷所述照片圖像,得到在遍歷的過程中所述第二滑動窗口對應的若干個美學評分,以所述若干個美學評分作為遍歷過程中若干個第二滑動窗口中心點坐標的美學質(zhì)量值,根據(jù)若干個美學質(zhì)量值生成美學質(zhì)量圖譜;其中,所述第二滑動窗口為照片圖像原始比例,且第二滑動窗口小于或等于第一滑動窗口,第二滑動窗口步長小于或等于第一滑動窗口;
使用預設的聚類算法得到所述美學質(zhì)量圖譜中的能量最高區(qū)域,以所述能量最高區(qū)域的最小外接矩形作為圖像最佳美感區(qū)域;
計算所需裁剪比例的窗口與所述圖像最佳美感區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為最佳美感裁剪區(qū)域。
具體的,當所述第一滑動窗口包括原始比例滑動窗口和標準比例滑動窗口時,計算第一滑動窗口與所述圖像最佳美感區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為最佳美感裁剪區(qū)域,包括以下步驟:
計算原始比例滑動窗口與所述圖像最佳美感區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為原始比例下的最佳美感裁剪區(qū)域;
計算標準比例滑動窗口與所述圖像最佳美感區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為標準比例下的最佳美感裁剪區(qū)域;
在所述原始比例下的最佳美感裁剪區(qū)域、及標準比例下的最佳美感裁剪區(qū)域中選取中心與所述圖像最佳美感區(qū)域中心最近的一個作為圖像最佳美感裁剪區(qū)域。
作為本發(fā)明方法實施例的另一實施例,還包括以下步驟:獲取指定的目標裁剪區(qū)域種子點;進一步的,所述使用預設的滑動窗口遍歷所述照片圖像,得到在遍歷的過程中所述預設的滑動窗口對應的若干個美學評分,包括以下步驟:
使用預設的滑動窗口遍歷所述目標裁剪區(qū)域種子點鄰域,得到在遍歷的過程中所述預設的滑動窗口對應的若干個美學評分。
步驟103,根據(jù)所述最佳美感裁剪區(qū)域的坐標裁剪所述照片圖像,得到所述照片圖像的最佳裁剪區(qū)域。
本發(fā)明實施例的照片智能裁剪方法通過圖像美學評價技術實現(xiàn)照片的智能裁剪,使得從美學角度裁剪出更加符合應用場景的照片;本發(fā)明適用的照片類型更加普遍,且操作方便、效率高。所以,本發(fā)明有效克服了現(xiàn)有技術中的種種缺點而具高度產(chǎn)業(yè)利用價值。
與本發(fā)明的方法實施例相對應,本發(fā)明還提供了一種照片智能裁剪裝置,圖2是本發(fā)明裝置實施例的照片智能裁剪裝置的結構示意圖,如圖2所示,根據(jù)本發(fā)明裝置實施例的照片智能裁剪裝置包括:圖像獲取模塊20、計算模塊22、裁剪模塊24,以下對本發(fā)明實施例的各個模塊進行詳細的說明。
具體的,所述圖像獲取模塊20,用于獲取智能設備照片圖像。
所述計算模塊22,用于在所述照片圖像中生成若干子區(qū)域,計算所述若干子區(qū)域的美學評分,根據(jù)所述美學評分得到最佳美感裁剪區(qū)域。
具體的,在照片圖像中生成若干子區(qū)域包括用預設的滑動窗口遍歷所述照片圖像,得到若干個子區(qū)域。
所述計算模塊具體用于:使用第一滑動窗口遍歷所述照片圖像,利用預設的美學評價模型得到在遍歷的過程中所述第一滑動窗口對應的若干個美學評分,選取最高美學評分,以最高美學評分對應的位置作為最佳美感裁剪區(qū)域;其中,第一滑動窗口選取以下中的一種或幾種:原始比例滑動窗口、標準比例滑動窗口、預設比例滑動窗口;
或者,用于使用第二滑動窗口遍歷所述照片圖像,得到在遍歷的過程中所述第二滑動窗口對應的若干個美學評分,以所述若干個美學評分作為遍歷過程中若干個第二滑動窗口中心點坐標的美學質(zhì)量值,根據(jù)若干個美學質(zhì)量值生成美學質(zhì)量圖譜;其中,所述第二滑動窗口為照片圖像原始比例,且第二滑動窗口小于或等于第一滑動窗口,第二滑動窗口步長小于或等于第一滑動窗口;
使用預設的聚類算法得到所述美學質(zhì)量圖譜中的能量最高區(qū)域,以所述能量最高區(qū)域的最小外接矩形作為圖像最佳美感區(qū)域;
計算所需裁剪比例的窗口與所述圖像最佳美感區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為最佳美感裁剪區(qū)域。
更加具體的,當所述第一滑動窗口包括原始比例滑動窗口和標準比例滑動窗口時,所述計算模塊具體用于:
使用原始比例滑動窗口遍歷所述照片圖像,利用預設的美學評價模型得到在遍歷的過程中所述原始比例滑動窗口對應的若干個美學評分;
使用標準比例滑動窗口遍歷所述照片圖像,利用預設的美學評價模型得到在遍歷的過程中所述標準比例滑動窗口對應的若干個美學評分;
在所述原始比例滑動窗口對應的若干個美學評分、及所述標準比例滑動窗口對應的若干個美學評分中選取最高美學評分;
或者使用原始比例滑動窗口遍歷所述照片圖像,利用預設的美學評價模型得到在遍歷的過程中所述原始比例滑動窗口對應的若干個美學評分;
選取原始比例滑動窗口對應的若干個美學評分中最高的美學評分,根據(jù)最高的美學評分對應的原始比例滑動窗口的坐標得到原始比例下的最佳美感裁剪區(qū)域;
計算所述標準比例滑動窗口與所述原始比例下的最佳美感裁剪區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為標準比例下的最佳美感裁剪區(qū)域;
按照指令選擇原始比例下的最佳美感裁剪區(qū)域或標準比例下的最佳美感裁剪區(qū)域中的一個作為圖像最佳美感裁剪區(qū)域;
或者計算第一滑動窗口與所述圖像最佳美感區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為最佳美感裁剪區(qū)域,包括以下步驟:
計算原始比例滑動窗口與所述圖像最佳美感區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為原始比例下的最佳美感裁剪區(qū)域;
計算標準比例滑動窗口與所述圖像最佳美感區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為標準比例下的最佳美感裁剪區(qū)域;
在所述原始比例下的最佳美感裁剪區(qū)域、及標準比例下的最佳美感裁剪區(qū)域中選取中心與所述圖像最佳美感區(qū)域中心最近的一個作為圖像最佳美感裁剪區(qū)域。
所述裁剪模塊24,用于根據(jù)所述最佳美感裁剪區(qū)域的坐標裁剪所述照片圖像,得到所述照片圖像的最佳裁剪區(qū)域。
所述預設的美學評價模型通過訓練得到,使用的機器學習方法包括卷積神經(jīng)網(wǎng)絡、受限玻爾茲曼機、深度置信網(wǎng)絡等。更進一步的,本發(fā)明裝置實施例還包括模型訓練模塊,所述模型訓練模塊用于:
獲取已知美學評分的若干個圖像;
利用已知美學評分的若干個圖像對預設的美學評價模型進行訓練,得到訓練后的美學評價模型。
本發(fā)明的照片智能裁剪方法及系統(tǒng),具有以下有益效果:
1、本發(fā)明可以從最佳美學的角度智能地裁剪出標準比例的照片,解決了人工手動裁剪照片可能出現(xiàn)低美感以及裁剪出的照片比例非標準的情況,以符合實際應用需求。
2、支持交互功能,可以在人工指定點的鄰域范圍內(nèi)裁剪出最佳美學的照片,以更好地滿足用戶的定制化裁剪需求。
為了更加詳細的說明本發(fā)明的實施例,給出實例1和實例2。
如圖3所示,實例1包括以下步驟:
步驟s1:從智能設備相冊中獲取照片圖像。
步驟s2:系統(tǒng)判斷是否人工指定有圖像中的某一坐標作為目標裁剪區(qū)域種子點。
步驟s3:若沒有人工指定的目標裁剪區(qū)域種子點,使用多尺度的原始比例及標準比例(1:1、5:3、4:3、5:4、16:9、3:2、7:5)滑動窗口遍歷圖像,并使用卷積神經(jīng)網(wǎng)絡美學評價模型計算得到各窗口內(nèi)的美學評分。選取原始比例及標準比例窗口的最高美學評分對應的位置,作為原始比例及標準比例下最佳美感裁剪區(qū)域;
若存在人工指定的目標裁剪區(qū)域種子點,使用多尺度原始比例及標準比例(1:1、5:3、4:3、5:4、16:9、3:2、7:5)滑動窗口遍歷種子點鄰域,確保各滑動窗口包含種子點,并使用卷積神經(jīng)網(wǎng)絡美學評價模型計算得到各窗口內(nèi)的美學評分。選取原始比例及標準比例窗口的最高美學評分對應的位置,作為原始比例及標準比例下最佳美感裁剪區(qū)域。
步驟s4:智能設備分別根據(jù)原始比例及標準比例下最佳美感裁剪區(qū)域的坐標裁剪原始圖像,得到原始比例及標準比例下圖像最佳裁剪區(qū)域。多比例圖像裁剪結果供用戶選擇。若最佳美感裁剪區(qū)域坐標即為原始圖像坐標,則無需裁剪。
在步驟s1中,從智能設備相冊中獲取照片圖像。
在步驟s2中,系統(tǒng)判斷是否人工指定有圖像中的某一坐標作為目標裁剪區(qū)域種子點。
在步驟s3中,若沒有人工指定圖像中的某一坐標作為目標裁剪區(qū)域種子點,使用多尺度的原始比例及標準比例(1:1、5:3、4:3、5:4、16:9、3:2、7:5)滑動窗口以一定步長遍歷圖像,并使用卷積神經(jīng)網(wǎng)絡美學評價模型計算得到各窗口內(nèi)的美學評分(1-10分)。選取原始比例及標準比例窗口的最高美學評分對應的位置,作為原始比例及標準比例下最佳美感裁剪區(qū)域。
需要說明的是,美學評價模型通過訓練得到,避免了人工規(guī)則模型的主觀性和片面性。檢測原始比例與多種標準比例(1:1、5:3、4:3、16:9、16:9、3:2、7:5)下最佳美感裁剪區(qū)域時,除去使用所有比例下的滑動窗口遍歷圖像外,亦可只用原始比例窗口遍歷一次圖像得到原始比例下最佳美感裁剪區(qū)域,隨后計算多種標準比例窗口與原始比例下最佳美感裁剪區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為標準比例下的最佳美感裁剪區(qū)域。
優(yōu)選地,滑動窗口共7個尺度,各尺度縮放比為1.2,最小尺度滑動窗口的水平方向邊長設為原始圖像水平方向長邊的1/4,滑動窗口的水平方向步長設為原始圖像水平方向邊長的1/16,滑動窗口的豎直方向步長設為原始圖像豎直方向邊長的1/16。
在所述步驟s3中,若人工指定圖像中的某一坐標作為目標裁剪區(qū)域種子點,使用多尺度原始比例及標準比例(1:1、5:3、4:3、5:4、16:9、3:2、7:5)滑動窗口遍歷種子點鄰域,并確保各滑動窗口包含種子點。使用卷積神經(jīng)網(wǎng)絡美學評價模型計算得到各窗口內(nèi)的美學評分(1-10分),選取原始比例及標準比例窗口的最高美學評分對應的位置,作為原始比例及標準比例下最佳美感裁剪區(qū)域。
需要說明的是,美學評價模型通過訓練得到,避免了人工規(guī)則模型的主觀性和片面性。檢測原始比例與多種標準比例(1:1、5:3、4:3、16:9、16:9、3:2、7:5)下最佳美感裁剪區(qū)域時,除去使用所有比例下的滑動窗口遍歷圖像外,亦可只用原始比例窗口遍歷一次圖像得到原始比例下最佳美感裁剪區(qū)域,隨后計算多種標準比例窗口與原始比例下最佳美感裁剪區(qū)域的最大交并比,將產(chǎn)生最大交并比的位置作為標準比例下的最佳美感裁剪區(qū)域。
優(yōu)選地,滑動窗口共7個尺度,各尺度縮放比為1.2,最小尺度滑動窗口的水平方向邊長設為原始圖像水平方向長邊的1/4,滑動窗口的水平方向步長設為原始圖像水平方向邊長的1/16,滑動窗口的豎直方向步長設為原始圖像豎直方向邊長的1/16。優(yōu)選地,在種子點鄰域內(nèi)使用物體識別算法,確保種子點鄰域包含種子點物體的輪廓?,F(xiàn)有技術中已經(jīng)有很多成熟的物體識別算法,故在此不再贅述。
在所述步驟s4中,智能設備分別根據(jù)原始比例及標準比例下最佳美感裁剪區(qū)域的坐標裁剪原始圖像,得到原始比例及標準比例下圖像最佳裁剪區(qū)域。多比例圖像裁剪結果供用戶選擇。若最佳美感裁剪區(qū)域坐標即為原始圖像坐標,則無需裁剪。
需要說明的是,亦可由用戶指定所需裁剪比例,本方法及系統(tǒng)將根據(jù)用戶指定裁剪比例裁剪出最佳圖像區(qū)域。
如圖4所示,實例2包括以下步驟:
步驟s1:從智能設備相冊中獲取照片圖像。
步驟s2:使用卷積神經(jīng)網(wǎng)絡美學評價模型生成照片圖像的美學質(zhì)量圖譜。
步驟s3:系統(tǒng)判斷是否人工指定有圖像中的某一坐標作為目標裁剪區(qū)域種子點。
步驟s4:若沒有人工指定圖像中的某一坐標作為目標裁剪區(qū)域種子點,使用聚類算法得到美學質(zhì)量圖譜中能量最高區(qū)域,得到能量最高區(qū)域的最小外接矩形的坐標,其對應圖像最佳美感區(qū)域坐標。分別計算得到多尺度原始比例及標準比例(1:1、5:3、4:3、5:4、16:9、3:2、7:5)窗口與圖像最佳美感區(qū)域的最大交并比的坐標位置,作為原始比例及標準比例下最佳美感裁剪區(qū)域。
若人工指定圖像中的某一坐標作為目標裁剪區(qū)域種子點,使用聚類算法得到種子點鄰域內(nèi)美學質(zhì)量圖譜中能量最高區(qū)域,并確保能量最高區(qū)域范圍包含種子點,得到能量最高區(qū)域的最小外接矩形的坐標,其對應圖像最佳美感區(qū)域坐標。分別計算得到多尺度原始比例及標準比例(1:1、5:3、4:3、5:4、16:9、3:2、7:5)窗口與圖像最佳美感區(qū)域的最大交并比的坐標位置,作為原始比例及標準比例下最佳美感裁剪區(qū)域。
步驟s5:智能設備分別根據(jù)原始比例及標準比例下最佳美感裁剪區(qū)域的坐標裁剪原始圖像,得到原始比例及標準比例下圖像最佳裁剪區(qū)域。多比例圖像裁剪結果供用戶選擇。若最佳美感裁剪區(qū)域坐標即為原始圖像坐標,則無需裁剪。
在步驟s1中,從智能設備相冊中獲取照片圖像。
在步驟s2中,使用卷積神經(jīng)網(wǎng)絡美學評價模型生成照片圖像的美學質(zhì)量圖譜。以一定大小和步長的滑動窗口遍歷圖像,使用卷積神經(jīng)網(wǎng)絡美學評價模型計算每個滑動窗口的美學評分(1-10分)作為滑動窗中心點坐標的美學質(zhì)量值,隨著滑動窗口遍歷完成,即生成美學質(zhì)量圖譜。
需要說明的是,美學評價模型通過訓練得到,避免了人工規(guī)則模型的主觀性和片面性。
優(yōu)選地,滑動窗口的長寬比與原始圖像相同,滑動窗口的水平方向邊長設為原始圖像水平方向長邊的1/4,滑動窗口的豎直方向邊長設為原始圖像豎直方向長邊的1/4,滑動窗口的水平方向步長設為原始圖像水平方向邊長的1/32,滑動窗口的豎直方向步長設為原始圖像豎直方向邊長的1/32。
在步驟s3中,系統(tǒng)判斷是否人工指定有圖像中的某一坐標作為目標裁剪區(qū)域種子點。
在步驟s4中,若沒有人工指定圖像中的某一坐標作為目標裁剪區(qū)域種子點,使用聚類算法得到美學質(zhì)量圖譜中能量最高區(qū)域,得到能量最高區(qū)域的最小外接矩形的坐標,其對應圖像最佳美感區(qū)域坐標。分別計算得到多尺度原始比例及標準比例(1:1、5:3、4:3、5:4、16:9、3:2、7:5)窗口與圖像最佳美感區(qū)域的最大交并比的坐標位置,作為原始比例及標準比例下最佳美感裁剪區(qū)域。
需要說明的是,當多尺度原始比例及標準比例窗口與圖像最佳美感區(qū)域產(chǎn)生的最大交并比的坐標位置不唯一時,選取窗口中心與圖像最佳美感區(qū)域中心最近的窗口作為最佳美感裁剪區(qū)域。
在步驟s4中,若人工指定圖像中的某一坐標作為目標裁剪區(qū)域種子點,使用聚類算法得到種子點鄰域內(nèi)美學質(zhì)量圖譜中能量最高區(qū)域,并確保能量最高區(qū)域范圍包含種子點,得到能量最高區(qū)域的最小外接矩形的坐標,其對應圖像最佳美感區(qū)域坐標。分別計算得到多尺度原始比例及標準比例(1:1、5:3、4:3、5:4、16:9、3:2、7:5)窗口與圖像最佳美感區(qū)域的最大交并比的坐標位置,作為原始比例及標準比例下最佳美感裁剪區(qū)域。
需要說明的是,當多尺度原始比例及標準比例窗口與圖像最佳美感區(qū)域產(chǎn)生的最大交并比的坐標位置不唯一時,選取窗口中心與圖像最佳美感區(qū)域中心最近的窗口作為最佳美感裁剪區(qū)域。優(yōu)選地,在種子點鄰域內(nèi)使用物體識別算法,確保種子點鄰域包含種子點物體的輪廓?,F(xiàn)有技術中已經(jīng)有很多成熟的物體識別算法,故在此不再贅述。
在所述步驟s5中,智能設備分別根據(jù)原始比例及標準比例下最佳美感裁剪區(qū)域的坐標裁剪原始圖像,得到原始比例及標準比例下圖像最佳裁剪區(qū)域。多比例圖像裁剪結果供用戶選擇。若最佳美感裁剪區(qū)域坐標即為原始圖像坐標,則無需裁剪。
需要說明的是,亦可由用戶指定所需裁剪比例,本方法及系統(tǒng)將根據(jù)用戶指定裁剪比例裁剪出最佳圖像區(qū)域。
本發(fā)明可自動裁剪出照片中最美區(qū)域,而且提供用戶交互的操作方式,可裁剪出用戶指定位置附近最美照片,同時預先對相冊照片進行場景分類,提升美學評價準確性,采用卷積神經(jīng)網(wǎng)絡美學評價模型,避免人工規(guī)則特征的主觀性和片面性。本方法及系統(tǒng)可以適用的范圍廣,可在智能設備中廣泛適用。
以上所述僅為本發(fā)明的實施例而已,并不用于限制本發(fā)明,對于本領域的技術人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的權利要求范圍之內(nèi)。