本發(fā)明涉及視頻識別技術(shù)領(lǐng)域,特別涉及一種場景檢測方法及裝置。
背景技術(shù):
目前,在識別視頻的過程中,常常需要進(jìn)行場景檢測,而相關(guān)技術(shù)中的場景檢測方案通常為人工檢測或者是將相鄰兩鏡頭的視頻幀進(jìn)行比較從而完成場景檢測,而這些場景檢測方案顯然使得檢測結(jié)果不太準(zhǔn)確。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種場景檢測方法及裝置,用以在獲取到當(dāng)前鏡頭的關(guān)鍵幀后,可以將當(dāng)前鏡頭的關(guān)鍵幀和與之連續(xù)的多個鏡頭的關(guān)鍵幀分別進(jìn)行比較,當(dāng)該當(dāng)前鏡頭的關(guān)鍵幀與多個鏡頭中任一鏡頭的關(guān)鍵幀相似時,說明當(dāng)前鏡頭和該任一鏡頭屬于同一場景,而由于當(dāng)前鏡頭與該任一鏡頭之間的所有鏡頭又是連續(xù)的鏡頭,因而,可以準(zhǔn)確確定所述當(dāng)前鏡頭與所述任一鏡頭之間的所有連續(xù)鏡頭的關(guān)鍵幀為同一目標(biāo)場景下的關(guān)鍵幀,從而提高場景檢測的準(zhǔn)確率和效率。
本發(fā)明提供一種場景檢測方法,包括:
獲取當(dāng)前鏡頭的關(guān)鍵幀;
將所述當(dāng)前鏡頭的關(guān)鍵幀和與之連續(xù)的多個鏡頭的關(guān)鍵幀分別進(jìn)行比較;
當(dāng)所述當(dāng)前鏡頭的關(guān)鍵幀與所述多個鏡頭中任一鏡頭的關(guān)鍵幀相似時,確定所述當(dāng)前鏡頭與所述任一鏡頭之間的所有連續(xù)鏡頭的關(guān)鍵幀為同一目標(biāo)場景下的關(guān)鍵幀。
在一個實(shí)施例中,所述方法還包括:
當(dāng)目標(biāo)鏡頭的關(guān)鍵幀和所述當(dāng)前鏡頭與所述任一鏡頭之間的所有連續(xù)鏡頭中的一個鏡頭的關(guān)鍵幀相似時,確定所述目標(biāo)鏡頭的關(guān)鍵幀為所述目標(biāo)場景下的關(guān)鍵幀。
在一個實(shí)施例中,所述當(dāng)前鏡頭的關(guān)鍵幀與所述多個鏡頭中任一鏡頭的關(guān)鍵幀相似,包括:
當(dāng)所述當(dāng)前鏡頭的關(guān)鍵幀和所述任一鏡頭的關(guān)鍵幀的相似度大于預(yù)設(shè)相似度時,確定所述當(dāng)前鏡頭的關(guān)鍵幀與所述任一鏡頭的關(guān)鍵幀相似。
在一個實(shí)施例中,當(dāng)每個鏡頭下的關(guān)鍵幀包括多幀時,所述當(dāng)前鏡頭的關(guān)鍵幀與所述多個鏡頭中任一鏡頭的關(guān)鍵幀相似,包括:
當(dāng)所述當(dāng)前鏡頭和所述任一鏡頭中相似關(guān)鍵幀的比例大于預(yù)設(shè)比例時,確定所述當(dāng)前鏡頭的關(guān)鍵幀與所述任一鏡頭的關(guān)鍵幀相似。
在一個實(shí)施例中,所述多個鏡頭包括:與所述當(dāng)前鏡頭緊鄰的前N個連續(xù)鏡頭或者與所述當(dāng)前鏡頭緊鄰的后N個連續(xù)鏡頭,其中,N為大于或等于2的正整數(shù)。
本發(fā)明還提供一種場景檢測裝置,包括:
獲取模塊,用于獲取當(dāng)前鏡頭的關(guān)鍵幀;
比較模塊,用于將所述當(dāng)前鏡頭的關(guān)鍵幀和與之連續(xù)的多個鏡頭的關(guān)鍵幀分別進(jìn)行比較;
第一確定模塊,用于當(dāng)所述當(dāng)前鏡頭的關(guān)鍵幀與所述多個鏡頭中任一鏡頭的關(guān)鍵幀相似時,確定所述當(dāng)前鏡頭與所述任一鏡頭之間的所有連續(xù)鏡頭的關(guān)鍵幀為同一目標(biāo)場景下的關(guān)鍵幀。
在一個實(shí)施例中,所述裝置還包括:
第二確定模塊,用于當(dāng)目標(biāo)鏡頭的關(guān)鍵幀和所述當(dāng)前鏡頭與所述任一鏡頭之間的所有連續(xù)鏡頭中的一個鏡頭的關(guān)鍵幀相似時,確定所述目標(biāo)鏡頭的關(guān)鍵幀為所述目標(biāo)場景下的關(guān)鍵幀。
在一個實(shí)施例中,所述第一確定模塊包括:
第一確定子模塊,用于當(dāng)所述當(dāng)前鏡頭的關(guān)鍵幀和所述任一鏡頭的關(guān)鍵幀的相似度大于預(yù)設(shè)相似度時,確定所述當(dāng)前鏡頭的關(guān)鍵幀與所述任一鏡頭的關(guān)鍵幀相似。
在一個實(shí)施例中,所述第一確定模塊包括:
第二確定子模塊,用于當(dāng)每個鏡頭下的關(guān)鍵幀包括多幀時,若所述當(dāng)前鏡頭和所述任一鏡頭中相似關(guān)鍵幀的比例大于預(yù)設(shè)比例,則確定所述當(dāng)前鏡頭的關(guān)鍵幀與所述任一鏡頭的關(guān)鍵幀相似。
在一個實(shí)施例中,所述多個鏡頭包括:與所述當(dāng)前鏡頭緊鄰的前N個連續(xù)鏡頭或者與所述當(dāng)前鏡頭緊鄰的后N個連續(xù)鏡頭,其中,N為大于或等于2的正整數(shù)。
本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
在獲取到當(dāng)前鏡頭的關(guān)鍵幀后,可以將當(dāng)前鏡頭的關(guān)鍵幀和與之連續(xù)的多個鏡頭的關(guān)鍵幀分別進(jìn)行比較,當(dāng)該當(dāng)前鏡頭的關(guān)鍵幀與多個鏡頭中任一鏡頭的關(guān)鍵幀相似時,說明當(dāng)前鏡頭和該任一鏡頭屬于同一場景,而由于當(dāng)前鏡頭與該任一鏡頭之間的所有鏡頭又是連續(xù)的鏡頭,因而,可以準(zhǔn)確確定當(dāng)前鏡頭與任一鏡頭之間的所有連續(xù)鏡頭的關(guān)鍵幀為同一目標(biāo)場景下的關(guān)鍵幀,從而提高了場景檢測的準(zhǔn)確率和效率。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
下面通過附圖和實(shí)施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
附圖說明
附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:
圖1是根據(jù)一示例性實(shí)施例示出的一種場景檢測方法的流程圖。
圖2是根據(jù)一示例性實(shí)施例示出的另一種場景檢測方法的流程圖。
圖3是根據(jù)一示例性實(shí)施例示出的一種場景檢測裝置的框圖。
圖4是根據(jù)一示例性實(shí)施例示出的另一種場景檢測裝置的框圖。
圖5是根據(jù)一示例性實(shí)施例示出的又一種場景檢測裝置的框圖。
圖6是根據(jù)一示例性實(shí)施例示出的再一種場景檢測裝置的框圖。
具體實(shí)施方式
以下結(jié)合附圖對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
相關(guān)技術(shù)中,在識別視頻的過程中,常常需要進(jìn)行場景檢測,而相關(guān)技術(shù)中的場景檢測方案通常為人工檢測或者是將相鄰兩鏡頭的視頻幀進(jìn)行比較從而完成場景檢測,而這些場景檢測方案顯然使得檢測結(jié)果不太準(zhǔn)確,例如,在對位于同一場景下的兩個人進(jìn)行拍攝時,如果鏡頭依次在兩個人之間切換,從而得到兩組鏡頭連續(xù)的視頻幀,則在使用相關(guān)技術(shù)中的第二種場景檢測方案進(jìn)行場景檢測時,很可能會誤將這兩個連續(xù)鏡頭判定為兩個場景。
為了解決上述技術(shù)問題,本公開實(shí)施例提供了一種場景檢測方法,該方法適用于場景檢測程序、系統(tǒng)或裝置中,其執(zhí)行主體可以是手機(jī)、平板、計算機(jī)等各種終端,如圖1所示,步驟S101至步驟S103:
在步驟S101中,獲取當(dāng)前鏡頭的關(guān)鍵幀;
該當(dāng)前鏡頭可以是需要進(jìn)行場景檢測的目標(biāo)視頻中的任一鏡頭,而該目標(biāo)視頻可以是新聞視頻、電視視頻、電影視頻、綜藝視頻等包含有多個場景的各種視頻;
其次,關(guān)鍵幀為能夠體現(xiàn)其所在鏡頭的關(guān)鍵內(nèi)容的一個視頻幀,可以是該鏡頭中的第一個關(guān)鍵幀(又稱為鏡頭切變幀,也是該鏡頭中的第一個視頻幀)和/或該鏡頭的其他關(guān)鍵幀,如該鏡頭的所有關(guān)鍵幀。
在步驟S102中,將當(dāng)前鏡頭的關(guān)鍵幀和與之連續(xù)的多個鏡頭的關(guān)鍵幀分別進(jìn)行比較;
與之連續(xù)的多個鏡頭包括與當(dāng)前鏡頭緊鄰的后N個連續(xù)鏡頭或者與當(dāng)前鏡頭緊鄰的前N個連續(xù)鏡頭,例如,當(dāng)該當(dāng)前鏡頭為第一個鏡頭時,則與之連續(xù)的多個鏡頭可以是第二個鏡頭和第三個鏡頭,或者,
當(dāng)該當(dāng)前鏡頭為第四個鏡頭時,則與之連續(xù)的多個鏡頭可以是第二個鏡頭和第三個鏡頭、或者是第五個至第七個鏡頭等,其中,N為大于或等于2的正整數(shù)。
在步驟S103中,當(dāng)當(dāng)前鏡頭的關(guān)鍵幀與多個鏡頭中任一鏡頭的關(guān)鍵幀相似時,確定當(dāng)前鏡頭與任一鏡頭之間的所有連續(xù)鏡頭的關(guān)鍵幀為同一目標(biāo)場景下的關(guān)鍵幀。
由于同一場景下不同鏡頭之間的關(guān)鍵幀都有一定的相似度,因而,在獲取到當(dāng)前鏡頭的關(guān)鍵幀后,可以將當(dāng)前鏡頭的關(guān)鍵幀和與之連續(xù)的多個鏡頭的關(guān)鍵幀分別進(jìn)行比較,當(dāng)該當(dāng)前鏡頭的關(guān)鍵幀與多個鏡頭中任一鏡頭的關(guān)鍵幀相似時,說明當(dāng)前鏡頭和該任一鏡頭屬于同一場景,而由于當(dāng)前鏡頭與該任一鏡頭之間的所有鏡頭又是連續(xù)的鏡頭,因而,可以準(zhǔn)確確定當(dāng)前鏡頭與任一鏡頭之間的所有連續(xù)鏡頭的關(guān)鍵幀為同一目標(biāo)場景下的關(guān)鍵幀(即當(dāng)前鏡頭與任一鏡頭之間的所有連續(xù)鏡頭都是在目標(biāo)場景下拍攝的,屬于目標(biāo)場景下的鏡頭),從而提高了場景檢測的準(zhǔn)確率和效率,例如:當(dāng)該當(dāng)前鏡頭為第一個鏡頭、與之連續(xù)的多個鏡頭為第二個鏡頭和第三個鏡頭時,如果第一個鏡頭的關(guān)鍵幀與第三個鏡頭的關(guān)鍵幀相似,則說明第一個鏡頭、第二個鏡頭和第三個鏡頭同屬于一個目標(biāo)場景。
當(dāng)然,在進(jìn)行完場景檢測后,便于進(jìn)行視頻切分等操作,如將同一場景下的若干個鏡頭的視頻幀切分為一個視頻片段。
如圖2所示,在一個實(shí)施例中,上述圖1所示的方法還可包括步驟S201:
在步驟S201中,當(dāng)目標(biāo)鏡頭的關(guān)鍵幀和當(dāng)前鏡頭與任一鏡頭之間的所有連續(xù)鏡頭中的一個鏡頭的關(guān)鍵幀相似時,確定目標(biāo)鏡頭的關(guān)鍵幀為目標(biāo)場景下的關(guān)鍵幀。
當(dāng)目標(biāo)鏡頭的關(guān)鍵幀和當(dāng)前鏡頭與任一鏡頭之間的所有連續(xù)鏡頭中的一個鏡頭的關(guān)鍵幀相似時,說明目標(biāo)鏡頭與該鏡頭同屬于一個場景,而該鏡頭又屬于目標(biāo)場景下的鏡頭,因而,該目標(biāo)鏡頭的關(guān)鍵幀也是目標(biāo)場景下的關(guān)鍵幀,即該目標(biāo)鏡頭也屬于目標(biāo)場景,例如,如果第一個鏡頭、第二個鏡頭和第三個鏡頭同屬于一個目標(biāo)場景,而第四個鏡頭的關(guān)鍵幀又與第三個鏡頭的關(guān)鍵幀、或者第二個鏡頭的關(guān)鍵幀、或者第一個鏡頭的關(guān)鍵幀相似,則第四個鏡頭的關(guān)鍵幀也為目標(biāo)場景下的關(guān)鍵幀,即第四個鏡頭也屬于目標(biāo)場景下的鏡頭。
在一個實(shí)施例中,上述圖1所示的步驟S103中的步驟“當(dāng)前鏡頭的關(guān)鍵幀與多個鏡頭中任一鏡頭的關(guān)鍵幀相似”可被執(zhí)行為:
當(dāng)當(dāng)前鏡頭的關(guān)鍵幀和任一鏡頭的關(guān)鍵幀的相似度大于預(yù)設(shè)相似度時,確定當(dāng)前鏡頭的關(guān)鍵幀與任一鏡頭的關(guān)鍵幀相似,其中,預(yù)設(shè)相似度可以個性化定制,如可以是50%、70%等。
當(dāng)當(dāng)前鏡頭的關(guān)鍵幀和任一鏡頭的關(guān)鍵幀的相似度大于預(yù)設(shè)相似度時,說明該當(dāng)前鏡頭的關(guān)鍵幀和任一鏡頭的關(guān)鍵幀的相似度比較高,因而,可以確定當(dāng)前鏡頭的關(guān)鍵幀與任一鏡頭的關(guān)鍵幀相似,當(dāng)然,在確定兩個鏡頭的關(guān)鍵幀的相似度時,可以根據(jù)兩個鏡頭的關(guān)鍵幀的顏色直方圖、紋理等參數(shù)進(jìn)行確定。
在一個實(shí)施例中,當(dāng)每個鏡頭下的關(guān)鍵幀包括多幀(即該每個鏡頭下的所有關(guān)鍵幀包括多個幀)時,上述圖1所示的步驟S103中的步驟“當(dāng)前鏡頭的關(guān)鍵幀與多個鏡頭中任一鏡頭的關(guān)鍵幀相似”可被執(zhí)行為:
當(dāng)當(dāng)前鏡頭和任一鏡頭中相似關(guān)鍵幀的比例大于預(yù)設(shè)比例時,確定當(dāng)前鏡頭的關(guān)鍵幀與任一鏡頭的關(guān)鍵幀相似,其中,預(yù)設(shè)比例可以個性化定制,如可以是50%、60%等,而相似關(guān)鍵幀指的是相似度大于預(yù)設(shè)相似度的關(guān)鍵幀。
當(dāng)當(dāng)前鏡頭和任一鏡頭中相似關(guān)鍵幀的比例大于預(yù)設(shè)比例時,說明該當(dāng)前鏡頭和該任一鏡頭中的相似關(guān)鍵幀的比例比較高,因而,確定當(dāng)前鏡頭的關(guān)鍵幀與任一鏡頭的關(guān)鍵幀相似,例如,當(dāng)該預(yù)設(shè)比例為50%、當(dāng)前鏡頭和該任一鏡頭中各有10個關(guān)鍵幀時,如果相似關(guān)鍵幀的數(shù)目為5幀或者6幀,則說明當(dāng)前鏡頭和該任一鏡頭中相似關(guān)鍵幀的比例大于或等于50%,因而,可確定當(dāng)前鏡頭的關(guān)鍵幀與任一鏡頭的關(guān)鍵幀相似。
在一個實(shí)施例中,多個鏡頭包括:與當(dāng)前鏡頭緊鄰的前N個連續(xù)鏡頭或者與當(dāng)前鏡頭緊鄰的后N個連續(xù)鏡頭,其中,N為大于或等于2的正整數(shù)。
如圖3所示,本發(fā)明還提供一種場景檢測裝置,包括:
獲取模塊301,被配置為獲取當(dāng)前鏡頭的關(guān)鍵幀;
比較模塊302,被配置為將當(dāng)前鏡頭的關(guān)鍵幀和與之連續(xù)的多個鏡頭的關(guān)鍵幀分別進(jìn)行比較;
第一確定模塊303,被配置為當(dāng)當(dāng)前鏡頭的關(guān)鍵幀與多個鏡頭中任一鏡頭的關(guān)鍵幀相似時,確定當(dāng)前鏡頭與任一鏡頭之間的所有連續(xù)鏡頭的關(guān)鍵幀為同一目標(biāo)場景下的關(guān)鍵幀。
如圖4所示,在一個實(shí)施例中,上述圖3所示的裝置還可包括:
第二確定模塊401,被配置為當(dāng)目標(biāo)鏡頭的關(guān)鍵幀和當(dāng)前鏡頭與任一鏡頭之間的所有連續(xù)鏡頭中的一個鏡頭的關(guān)鍵幀相似時,確定目標(biāo)鏡頭的關(guān)鍵幀為目標(biāo)場景下的關(guān)鍵幀。
如圖5所示,在一個實(shí)施例中,上述圖3所示的第一確定模塊303可以包括:
第一確定子模塊3031,被配置為當(dāng)當(dāng)前鏡頭的關(guān)鍵幀和任一鏡頭的關(guān)鍵幀的相似度大于預(yù)設(shè)相似度時,確定當(dāng)前鏡頭的關(guān)鍵幀與任一鏡頭的關(guān)鍵幀相似。
如圖6所示,在一個實(shí)施例中,上述圖3所示的第一確定模塊303可以包括:
第二確定子模塊3032,被配置為當(dāng)每個鏡頭下的關(guān)鍵幀包括多幀時,若當(dāng)前鏡頭和任一鏡頭中相似關(guān)鍵幀的比例大于預(yù)設(shè)比例,則確定當(dāng)前鏡頭的關(guān)鍵幀與任一鏡頭的關(guān)鍵幀相似。
在一個實(shí)施例中,多個鏡頭包括:與當(dāng)前鏡頭緊鄰的前N個連續(xù)鏡頭或者與當(dāng)前鏡頭緊鄰的后N個連續(xù)鏡頭,其中,N為大于或等于2的正整數(shù)。
關(guān)于上述實(shí)施例中的裝置,其中各個模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。
最后,本發(fā)明中的場景檢測裝置適用于終端設(shè)備。例如,可以是移動電話,計算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個人數(shù)字助理等。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實(shí)施的計算機(jī)程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實(shí)現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。