亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

估計視頻串流中視頻片段的邊界位置的方法

文檔序號:7662088閱讀:103來源:國知局

專利名稱::估計視頻串流中視頻片段的邊界位置的方法
技術(shù)領(lǐng)域
:本發(fā)明涉及一種用來估計經(jīng)由一多媒體輸入串流所傳送的視頻片段的邊界位置(亦即起始邊界位置或是結(jié)尾邊界位置)的方法,尤其涉及一種通過使用滑動窗口(slidingwindow)來產(chǎn)生多個鏡頭個數(shù)(shotnumber)并比較該多個鏡頭個數(shù)與一預(yù)定闊值來達(dá)到估計多媒體輸入串流中廣告片段的邊界位置的方法。
背景技術(shù)
:目前用以估計視頻片段的機(jī)制已變得日趨重要,其原因是因為視頻節(jié)目(例如一電視節(jié)目)雖可預(yù)先儲存在一儲存裝置中,然而與視頻節(jié)目無關(guān)的視頻片段(例如廣告片段)也會同時儲存于該儲存裝置中,而一般觀賞者不喜歡觀看廣告片段并希望能夠在不受打擾下繼續(xù)欣賞其所喜愛的電視節(jié)目,故需要一種可識別出廣告片段的機(jī)制。此外.對于視頻內(nèi)容分析而言,識別出廣告片段也是相當(dāng)重要,這是因為可在進(jìn)行視頻內(nèi)容分析之前先將廣告片段予以移除來獲得較精確的分析結(jié)果。由于不同國家的法令有不同的規(guī)定,所以已知用來識別出廣告片段的機(jī)制在不同國家也將有所不同,例如,美國或德國規(guī)定在開始播放一廣告片段之前或是在結(jié)束該廣告片段之后需立即播出一全黑幀(blackframe),因此,倘若在視頻節(jié)目中檢測到一張全黑幀則即表示一電視節(jié)目片段剛剛結(jié)束而接著將開始播放一廣告片段,或是表示一廣告片段剛剛結(jié)束而接著將開始播放下一段的電視節(jié)目片段,顯然,該張全黑幀有助于估計出廣告片段的邊界位置。然而,目前在臺灣或是其它地區(qū),并無明文規(guī)定在開始播放一廣告片段之前或是在該廣告片段結(jié)束之后需要立即播出全黑幀,故在此情形下,估計一廣告片段顯然變得較為復(fù)雜與困難,因此,當(dāng)一廣告片段之前或之后不存在全黑幀時,提出一種能夠有效地估計出該廣告片段的邊界位置的方法是十分迫切需要。
發(fā)明內(nèi)容因此本發(fā)明的目的之一在于提供一種依據(jù)攝影鏡頭的出現(xiàn)個數(shù)與一預(yù)定閾值來估計出視頻片段(例如廣告片段)的邊界位置的方法,以解決上述所提到的問題。依據(jù)本發(fā)明的實施例,其披露一種估計經(jīng)由一輸入視頻流所傳送的一視頻片段中一邊界位置的方法。該方法包含有利用一滑動窗口來計算該輸入視頻流中鏡頭出現(xiàn)的個數(shù)以分別產(chǎn)生多個鏡頭個數(shù);以及依據(jù)該多個鏡頭個數(shù)與一預(yù)定閾值來估計出該邊界位置。圖1為本發(fā)明一實施例的估計一視頻片段的邊界位置的方法的操作流程圖。圖2為圖1的延續(xù)流程圖。圖3為本發(fā)明的用來估計視頻片段的邊界位置的方法的運(yùn)作示意圖。附圖符號說明<table>tableseeoriginaldocumentpage7</column></row><table>具體實》包方式在缺乏任何全黑幀來作為參考依據(jù)以檢測出兩電視節(jié)目片段間的廣告片段的情形下,本發(fā)明可利用電視節(jié)目與廣告片段的特性差異來達(dá)到估計出廣告片段的邊界位置的目的,其主要的特性差異在于該電視節(jié)目中鏡頭出現(xiàn)的個數(shù)/鏡頭出現(xiàn)的頻率(亦即不同攝影鏡頭角度的個數(shù))與該廣告片段中鏡頭出現(xiàn)的個數(shù)/鏡頭出現(xiàn)的頻率不同,這是因為為了給觀賞者較深刻的印象,通常廣告片段會拍攝得相當(dāng)花俏,所以廣告片段中鏡頭出現(xiàn)個數(shù)/鏡頭出現(xiàn)的頻率一般會高于電視節(jié)目中鏡頭出現(xiàn)的個數(shù)/鏡頭出現(xiàn)的頻率;本發(fā)明所提出的檢測廣告片段的邊界位置的詳細(xì)實施方式則描述于下。請結(jié)合參考圖1與圖2,圖1是本發(fā)明一實施例的估計一視頻片段的一邊界位置的方法的操作流程圖,圖2則是圖1的延續(xù)流程圖。在本實施例中,該視頻片段會由一多媒體輸入串流(例如一輸入視頻串流)中被識別出,舉例來說,該多媒體輸入串流可經(jīng)由電視頻道來加以傳送,而該視頻片段則可為該電視頻道中的廣告片段,然而,本發(fā)明并非以此為限,亦即,符合本發(fā)明的精神的其它視頻片段也屬于本發(fā)明的范疇。估計該視頻片段的該邊界位置的方法在于利用具有N幀時間長度的一滑動窗口(slidingwindow)來計算該多媒體輸入串流中鏡頭出現(xiàn)個數(shù),以分別產(chǎn)生多個鏡頭個數(shù)(shotnumber);換言之,該滑動窗口依據(jù)該輸入視頻串流及通過每次位移單幀來計算出每N幀的時間長度中鏡頭出現(xiàn)的總個數(shù),因此,每當(dāng)該滑動窗口位移一幀的時間長度時,將會計算出一新的鏡頭個數(shù),故該多個鏡頭個數(shù)會連同該滑動窗口的移動而一一產(chǎn)生。由于一般的廣告片段為了給予觀賞者較深刻印象通常拍攝得相當(dāng)花俏,故倘若該滑動窗口中存在部分的廣告片段,則該滑動窗口此時所對應(yīng)產(chǎn)生的鏡頭個數(shù)通常來說會較多,因此,可依據(jù)所計算出的多個鏡頭個數(shù)的統(tǒng)計特性與至少一預(yù)定閾值來估計該視頻片段(亦即廣告片段)的起始邊界位置或結(jié)尾邊界位置。當(dāng)估計該廣告片段的邊界位置的方法開始運(yùn)作(步驟100)時,首先會估計該廣告片段的起始邊界位置,此時使用上述的滑動窗口(其具有N幀的時間長度)來計算一鏡頭個數(shù)(步驟105),而在計算出該鏡頭個數(shù)之后,該鏡頭例中,該預(yù)定閾值選定等于5,而該滑動窗口所具有的幀數(shù)N則選定為300,然而,此非本發(fā)明的限制。因此,倘若在300幀的時間長度(亦即10秒鐘)內(nèi)鏡頭出現(xiàn)個數(shù)(亦即鏡頭個數(shù))大于5個,則表示在此300幀中可能存在部分的廣告片段,此時會進(jìn)入步驟115。反之,倘若該鏡頭個數(shù)不大于該預(yù)定閾值(亦即5),則會回到步驟105,且該滑動窗口會位移單幀的時間長度來計算出新的鏡頭個數(shù)。(亦即5),則將一第一計數(shù)值累加1(請注意到在本實施例中該第一計數(shù)值的初始值系為0)(步驟115)。接著,在步驟120中,將檢查該第一計數(shù)值是否達(dá)到一第一臨界計數(shù)值;在本實施例中該第一臨界計數(shù)值設(shè)定為50,然而,此非本發(fā)明的限制。倘若該第一計數(shù)值并未達(dá)到該第一臨界計數(shù)值(亦即50),則會進(jìn)入步驟125;在步驟125中,若該鏡頭個數(shù)不大于該預(yù)定閾值(亦即5),則將一第二計數(shù)值累加1(請注意到在本實施例中該第一計數(shù)值的初始值亦設(shè)定為0),并接著檢查該第二計數(shù)值是否達(dá)到一第二臨界計數(shù)值(例如5)。一旦該第二計數(shù)值達(dá)到該第二臨界計數(shù)值(亦即5),則將該第一計數(shù)值與該第二計數(shù)值重置(reset)為其各別的初始值并回到步驟105,然而,若該第二計數(shù)值并未達(dá)到該第二臨界計數(shù)值(亦即5),則該滑動窗口會位移單幀的時間長度來計算出一新的鏡頭個數(shù)(步驟135),并再次執(zhí)行步驟115與步驟120。倘若該第一計數(shù)值達(dá)到該第一臨界計數(shù)值(亦即50),則即表示存在有50個大于該預(yù)定閾值(亦即5)的鏡頭個數(shù),并且依據(jù)此50個已計算的鏡頭個數(shù)中率先出現(xiàn)(leading)的一鏡頭個數(shù)所對應(yīng)的該滑動窗口的一特定時序來決定出包含有該廣告片段的該起始邊界位置的候選時序的一第一時序范圍(步驟140)。在本實施例中,由于部分的電視節(jié)目片段可能仍位于該滑動窗口內(nèi),所以該特定時序選定為該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的結(jié)尾邊界位置,故通過使用該滑動窗口的結(jié)尾邊界位置來決定出包含該廣告片段的該起始邊界位置的候選時序的第一時序范圍,在執(zhí)行視頻編輯運(yùn)作時將可避免因移除由一已估計出的起始邊界位置與稍后一估計出的結(jié)尾邊界位置所分隔的一廣告片段而造成部分的電視節(jié)目內(nèi)容被誤刪,然而上述的選擇方式并非本發(fā)明的限制。另外,一般而言,可決定該第一時序范圍位于該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的結(jié)尾邊界位置的鄰近區(qū)域。通常該滑動窗口的結(jié)尾邊界位置位于所決定出的該第一時序范圍的中心位置,例如,該第一時序范圍可包括有該滑動窗口的結(jié)尾邊界位置及其前后各100幀時序(frametiming),然而,本發(fā)明并非以此100幀時序的設(shè)計為限。在決定出該第一時序范圍之后,接著即可決定出該視頻片段(亦即廣告片段)的起始邊界位置(步驟145),例如,該視頻片段的起始邊界位置可被決定為具有對應(yīng)于該第一時序范圍中的幀之間最大亮度差異(1體inancedifference)值的一目標(biāo)時序(相較于前一個幀時序)。此外,在其它實施例中,也可使用該第一時序范圍內(nèi)的一第一特定幀與一第二特定幀之間的聲音不連續(xù)(audiodiscontinuity)(例如不連續(xù)的音量)來決定出該視頻片段的起始邊界位置,在此情形下,將會決定該視頻片段的起始邊界位置為緊鄰于該第一特定幀之后的該第二特定幀所對應(yīng)的一幀時序。而在決定出該視頻片段(亦即廣告片段)的起始邊界位置之后,將接著估計該視頻片段的結(jié)尾邊界位置。就估計該結(jié)尾邊界位置(亦即廣告片段的結(jié)尾)而言,也會通過上述具有300幀時間長度的滑動窗口來計算出一鏡頭個數(shù)(步驟150),而在計算出該鏡頭個數(shù)之后,該鏡頭個數(shù)會被拿來檢視其是否小于該預(yù)定閾值(亦即5)(步驟155);倘若300幀時間長度(亦即10秒鐘)內(nèi)鏡頭出現(xiàn)個數(shù)小于5個,則表示部分的廣告片段可能已不存在于此300幀內(nèi),接著將進(jìn)入步驟160。反之,倘若該鏡頭個數(shù)不小于該預(yù)定閾值(亦即5),則會回到步驟150,而該滑動窗口會位移一幀的時間長度來產(chǎn)生新的鏡頭個數(shù)。當(dāng)估計上述結(jié)尾邊界位置時,若該鏡頭個數(shù)小于該預(yù)定閾值(亦即5),則將一第三計數(shù)值累加l(請注意到在本實施例中其初始值為0)(步驟160)。在步驟165時,該第三計數(shù)值會被拿來檢視其是否達(dá)到一第三臨界計數(shù)值,在本實施例中,該第三臨界計數(shù)值設(shè)定為1000,然而,本發(fā)明并不以此為限。當(dāng)該第三計數(shù)值并未達(dá)到該第三臨界計數(shù)值(亦即IOOO)時,則將會進(jìn)入步驟170;在步驟170中,若該鏡頭個數(shù)不小于該預(yù)定閾值(亦即5),則會將一第四計數(shù)值累加l(請注意到在本實施例中其初始值為0)。接著,該第四計數(shù)值會被拿來檢視其是否達(dá)到一第四臨界計數(shù)值(例如30)(步驟175);—旦該第四計數(shù)值達(dá)到該第四臨界計數(shù)值(例如30)時,該第三計數(shù)值與該第四計數(shù)值則都會被重置為其各自的初始值并回到步驟150。反之,若該第四計數(shù)值并未達(dá)到該第四臨界計數(shù)值(亦即30)時,則該滑動窗口將會位移單幀的時間長度來計算出新的鏡頭個數(shù)(步驟180),并回到步驟160與步驟165。另一方面,倘若該第三計數(shù)值達(dá)到該第三臨界計數(shù)值(亦即1000),則表示存在有1000個小于該預(yù)定閾值(亦即5)的鏡頭個數(shù),而此時會依據(jù)此1000個所計算出的鏡頭個數(shù)中一率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口第二時序范圍(步驟185)。在本實施例中,由于部分的電視節(jié)目片段可能仍位于該滑動窗口內(nèi),所以該特定時序選定為該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的起始邊界位置,因此,通過使用此時該滑動窗口的起始邊界位置來決定出包含有廣告片段的結(jié)尾邊界位置的多個候選時序的該第二時序范圍,在執(zhí)行視頻編輯運(yùn)作時將可避免因移除由先前已估計的起始邊界位置與此時將估計出的結(jié)尾邊界位置所分隔的廣告片段而造成部分電視節(jié)目內(nèi)容被誤刪的結(jié)果;然而,上述選擇法則并非本發(fā)明的限制。另外,一般而言,可決定該第二時序范圍位于該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的起始邊界位置的鄰近區(qū)域。通常該滑動窗口的起始邊界位置位于所決定出的該第二時序范圍的中心位置,例如,該第二時序范圍可包括有該滑動窗口的起始邊界位置及其前后各100個幀時序,然而,本發(fā)明并非以此100個幀時序的設(shè)計為限。而在決定出該第二時序范圍之后,接著將會決定出該視頻片段(亦即廣告片段)的結(jié)尾邊界位置(步驟190);—般來說,該視頻片段的結(jié)尾邊界位置可被決定為具有對應(yīng)于該第二時序范圍中的幀之間最大亮度差異值的一目標(biāo)時序(相較于前一個幀時序)。另外,在其它實施例中,也可使用該第二時序范圍內(nèi)的一第一特定幀與一第二特定幀間的聲音不連續(xù)(例如不連續(xù)音量)來決定出該視頻片段的結(jié)尾邊界位置,而在此種情形下,將會決定該視頻片段的結(jié)尾邊界位置為在該第二特定幀之前的該第一特定幀所對應(yīng)的一幀時序,并且結(jié)束上述估計該廣告片段的邊界位置的方法(步驟195)。為了能夠更清楚地說明本發(fā)明的技術(shù)特征,在下文中將舉出一范例來描述本發(fā)明中視頻片段的邊界位置估計方式。請參考圖3,圖3是本發(fā)明中用以估計視頻片段的邊界位置的方法的運(yùn)作示意圖。在此例子中,圖中所示的曲線CV經(jīng)由該滑動窗口所計算出的上述多個鏡頭個數(shù)而產(chǎn)生,雖然在圖3中曲線CV以實線來加以表示,然而,在閱讀上述說明后應(yīng)可了解到該實線由多個圓點(每一圓點對應(yīng)于使用該滑動窗口在一特定時序下所計算出的一鏡頭個數(shù))所構(gòu)成。如圖所示,可知曲線CV在時間點A時超過預(yù)定閾值Vth(亦即5),而在時間點B時則低于預(yù)定閾值Vth。由于時間點A至?xí)r間點B的時段內(nèi)所累計的第一計數(shù)值不大于該第一臨界計數(shù)值(亦即50),并且在時間點B之后該第二計數(shù)值將會于該第一計數(shù)值達(dá)到該第一臨界計數(shù)值(亦即50)之前先達(dá)到該第二臨界計數(shù)值(亦即5),所以該第一計數(shù)值與該第二計數(shù)值會分別重設(shè)為其各自的初始值,并接著重新計數(shù)大于/小于預(yù)定閾值Vth的鏡頭個數(shù)來累計該第一計數(shù)值與該第二計數(shù)值,換言之,此時仍未決定出第一時序范圍。如圖3所示,可知曲線CV在時間點C時將會再度超過預(yù)定閾值Vth,而雖然曲線CV在稍后的時間點D的鄰近時序也會低于預(yù)定閾值Vth,然而,由于在該第二計數(shù)值達(dá)到該第二臨界計數(shù)值(亦即5)之前該第一計數(shù)值會先達(dá)到該第一臨界計數(shù)值(亦即50),所以此時低于預(yù)定閾值Vth的鏡頭個數(shù)對估計廣告片段的起始邊界位置的影響可被忽略,因此,此時將依據(jù)該滑動窗口的結(jié)尾邊界位置所對應(yīng)的時間點C來決定出第一時序范圍。承上所述,通常時間點C位于該第一時序范圍的中心位置,舉例來說,該第一時序范圍可為時間點C-至?xí)r間點C+的范圍,而接著將會依據(jù)具有對應(yīng)于該第一時序范圍(亦即時間點C-至?xí)r間點C+)內(nèi)的幀之間最大亮度差異值的一目標(biāo)時序(相較于前一個時序)或是聲音的不連續(xù)來決定出該視頻片段的起始邊界位置;為避免說明書過于冗長,詳細(xì)的說明則不另贅述。在估計出該視頻片段的起始邊界位置之后,接著將估計該視頻片段的結(jié)尾邊界位置。請再次參考圖3,曲線CV在時間點E時開始低于預(yù)定閾值Vth,而其在時間點F時則再度高于預(yù)定閾值Vth,此段時間內(nèi)(由時間點E至?xí)r間點F)所累計出的第三計數(shù)值未大于該第三臨界計數(shù)值(亦即1000),然而曲線CV在時間點F至?xí)r間點G的時段內(nèi)卻會超過該預(yù)定閾值而使得所累計出的第四計數(shù)值大于該第四臨界計數(shù)值(亦即30),換言之,在該第三計數(shù)值達(dá)到該第三臨界計數(shù)值(亦即1000)之前該第四計數(shù)值會先達(dá)到該第四臨界計數(shù)值(亦即30),因此,此時該第三計數(shù)值與該第四計數(shù)值都會被重設(shè)為其各自的初始值,并接著重新計數(shù)大于/小于預(yù)定閾值Vth的鏡頭個數(shù)來累計該第三計數(shù)值與該第四計數(shù)值,故此時仍未決定出第二時序范圍。而在時間點G之后,曲線CV則會持續(xù)低于預(yù)定閾值Vth使得在該第四計數(shù)值達(dá)到該第四臨界計數(shù)值(亦即30)之前該第三計數(shù)值會先達(dá)到該第三臨界計數(shù)值(亦即1000),所以此時將依據(jù)時間點G來決定出第二時序范圍。如上所述,時間點G通常位于該第二時序范圍的中心位置,例如,該第二時序范圍可為時間點G-至?xí)r間點G+的范圍,接著,將依據(jù)具有對應(yīng)于該第二時序范圍(亦即時間點G-至?xí)r間點G+)內(nèi)的幀之間最大亮度差異值的一目標(biāo)時序(相較于前一個時序)或是聲音的不連續(xù)來決定出該視頻片段的結(jié)尾邊界位置;為了簡化敘述,詳細(xì)的說明不另贅述。在另一實施例中,為了減少計算時的復(fù)雜度,也可直接決定該視頻片段的起始邊界位置為此50個已計算出的鏡頭個數(shù)中該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的結(jié)尾邊界位置,以及直接決定該視頻片段的結(jié)尾邊界位置為此1000個計算出的鏡頭個數(shù)中該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的起始邊界位置。在此情形下,用來微調(diào)該視頻片段的起始邊界位置的步驟140、145以及用來微調(diào)該視頻片段的結(jié)尾邊界位置的步驟185、190為非必要的步驟而可予以移除,而雖然使用此一方式來估計邊界位置所能夠達(dá)到的精確度并非最佳,然而同樣可達(dá)到識別出該視頻片段(例如廣告片段)的邊界位置的目的,此亦符合本發(fā)明的精神,并同時屬于本發(fā)明的范疇。同樣地,在其它實施例中,可直接決定該視頻片段的起始邊界位置為對應(yīng)于先前已計算出的一鏡頭個數(shù)且與此5G個已計算的鏡頭個數(shù)中該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的結(jié)尾邊界位置相隔半個窗口大小的一幀時序;當(dāng)然,也可決定該視頻片段的結(jié)尾邊界位置為對應(yīng)于將計算出的一鏡頭個數(shù)且與此100Q個已計算出的鏡頭個數(shù)中該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的起始邊界位置相隔半個窗口大小的一幀時序,此亦不需使用到上述用來微調(diào)廣告片段的起始邊界位置與結(jié)尾邊界位置的相關(guān)步驟,而可將相關(guān)步驟予以移除,故也可減少運(yùn)算時的復(fù)雜度。雖然使用此種方式來估計邊界位置所能夠達(dá)到的精確度并非最佳,然而,由于廣告片段可能恰好位于上述所估計出的該視頻片段的起始邊界位置與結(jié)尾邊界位置之間,故也可分析出該廣告片段。再者,當(dāng)本發(fā)明的方法應(yīng)用于僅具有有限計算資源的電子裝置時,考慮到計算資源可能不足的情形下,一旦一第一鏡頭個數(shù)大于該預(yù)定閾值時,則可直接決定該視頻片段的起始邊界位置為對應(yīng)于該第一鏡頭個數(shù)的該滑動窗口的第一特定時序(亦即該滑動窗口的結(jié)尾邊界位置);同樣地,一旦在該第一鏡頭個數(shù)之后所產(chǎn)生的一第二鏡頭個數(shù)不大于該預(yù)定閾值時,則可直接決定該視頻片段的結(jié)尾邊界位置為對應(yīng)于該第二鏡頭個數(shù)的該滑動窗口的第二特定時序(亦即該滑動窗口的起始邊界位置),利用此種方式,將可進(jìn)一步減少計算時所需的復(fù)雜度,而其也符合本發(fā)明的精神。此外,倘若考慮到計數(shù)上述的計數(shù)值需要耗費(fèi)額外資源,則上述用來計數(shù)出多個計數(shù)值的機(jī)制(亦即步驟115-步驟130與步驟160-步驟175)也可被予以移除,雖然將可能造成估計該視頻片段的邊界位置時對該視頻片段中鏡頭出現(xiàn)個數(shù)的變化的忍受程度較差,然而,此種作法在估計該視頻片段的邊界位置時仍具有可接受的準(zhǔn)確度。以上所述僅為本發(fā)明的較佳實施例,凡依本發(fā)明權(quán)利要求所做的均等變化與修飾,皆應(yīng)屬本發(fā)明的涵蓋范圍。權(quán)利要求1.一種用來估計出經(jīng)由一輸入視頻流所傳送的一視頻片段中一邊界位置的方法,其包含有下列步驟利用一滑動窗口來計算該輸入視頻流中鏡頭出現(xiàn)個數(shù)以分別產(chǎn)生多個鏡頭個數(shù);以及依據(jù)該多個鏡頭個數(shù)與一預(yù)定閾值來估計出該邊界位置。2.如權(quán)利要求l所述的方法,其中估計出該邊界位置的步驟包含有比較每一鏡頭個數(shù)與該預(yù)定閾值來產(chǎn)生一比較結(jié)果;以及依據(jù)該比較結(jié)果來估計出該邊界位置。3.如權(quán)利要求2所述的方法,其中依據(jù)該比較結(jié)果來估計出該邊界位置的步驟包含有若一第一鏡頭個數(shù)大于該預(yù)定閾值,則決定該視頻片段的一起始邊界位置為該第一鏡頭個數(shù)所對應(yīng)的該滑動窗口的一第一特定時序。4.如權(quán)利要求3所述的方法,其中該第一特定時序為該第一鏡頭個數(shù)所對應(yīng)的該滑動窗口的一結(jié)尾邊界位置。5.如權(quán)利要求3所述的方法,其中依據(jù)該比較結(jié)果來估計出該邊界位置的步驟還包含有若在該第一鏡頭個數(shù)之后所產(chǎn)生的一第二鏡頭個數(shù)不大于該預(yù)定閾值,則決定該視頻片段的一結(jié)尾邊界位置為該第二鏡頭個數(shù)所對應(yīng)的該滑動窗口的一第二特定時序。6.如權(quán)利要求5所述的方法,其中該第二特定時序為該第二鏡頭個數(shù)所對應(yīng)的該滑動窗口的一起始邊界位置。7.如權(quán)利要求2所述的方法,其中依據(jù)該比較結(jié)果來估計出該邊界位置的步驟包含有若多個第一鏡頭個數(shù)都大于該預(yù)定闊值,則依據(jù)該多個第一鏡頭個數(shù)中一率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的一第一特定時序來決定出該視頻片段的一起始邊界位置。8.如權(quán)利要求7所述的方法,其中該第一特定時序為該多個第一鏡頭個數(shù)中該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的一結(jié)尾邊界位置。9.如權(quán)利要求7所述的方法,其中依據(jù)該比較結(jié)果來計算出該邊界位置的步驟還包含有當(dāng)計算出該率先出現(xiàn)的鏡頭個數(shù)時,計數(shù)大于該預(yù)定閾值的鏡頭個數(shù)來產(chǎn)生一第一計數(shù)值;其中當(dāng)該第一計數(shù)值達(dá)到一第一臨界計數(shù)值時,決定該視頻片段的該起始邊界位置為該第一特定時序。10.如權(quán)利要求9所述的方法,其中依據(jù)該比較結(jié)果來估計出該邊界位置的步驟還包含有當(dāng)計算出該率先出現(xiàn)的鏡頭個數(shù)時,計數(shù)不大于該預(yù)定閾值的鏡頭個數(shù)來產(chǎn)生一第二計數(shù)值;以及當(dāng)該第二計數(shù)值在該第一計數(shù)值達(dá)到該第一臨界計數(shù)值之前先達(dá)到一第二臨界計數(shù)值時,重置該第一、該第二計數(shù)值以及重新計數(shù)大于該預(yù)定閾值的鏡頭個數(shù)。11.如權(quán)利要求7所述的方法,其中決定出該視頻片段的該起始邊界位置的步驟包含有依據(jù)該多個第一鏡頭個數(shù)中該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的該第一特定時序來決定一第一時序范圍;以及自該第一時序范圍中選取出一第一目標(biāo)時序來作為該視頻片段的該起始邊界位置。12.如權(quán)利要求11所述的方法,其中選取出該第一目標(biāo)時序的步驟包含有識別出該第一時序范圍中幀所對應(yīng)的鏡頭個數(shù)的一極值;以及以該極值所對應(yīng)的一幀時序來作為該第一目標(biāo)時序。13.如權(quán)利要求11所述的方法,其中選取出該第一目標(biāo)時序的步驟包含有識別出該第一時序范圍中一第一特定幀與一第二特定幀間的一聲音不連續(xù);以及以緊鄰在該第一特定幀之后該第二特定幀所對應(yīng)的一幀時序來作為該第一目標(biāo)時序。14.如權(quán)利要求7所述的方法,其中依據(jù)該比較結(jié)果來估計出該邊界位置的步驟還包含有若在該多個第一鏡頭個數(shù)后所產(chǎn)生的多個第二鏡頭個數(shù)都大于該預(yù)定閾值,則依據(jù)該多個第二鏡頭個數(shù)中一率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的一第二特定時序來決定出該視頻片段的一結(jié)尾邊界位置。15.如權(quán)利要求14所述的方法,其中該第二特定時序為該多個第二鏡頭個數(shù)中該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的一起始邊界位置。16.如權(quán)利要求14所述的方法,其中依據(jù)該比較結(jié)果來估計出該邊界位置的步驟還包含有當(dāng)計算出該多個第二鏡頭個數(shù)中該率先出現(xiàn)的鏡頭個數(shù)時,計數(shù)不大于該預(yù)定閾值的鏡頭個數(shù)來產(chǎn)生一第三計數(shù)值;其中當(dāng)該第三計數(shù)值達(dá)到一第三臨界計數(shù)值時,決定該視頻片段的該結(jié)尾邊界位置為該第二特定時序。17,如權(quán)利要求16所述的方法,其中依據(jù)該比較結(jié)果來估計出該邊界位置的步驟還包含有當(dāng)計算出該多個第二鏡頭個數(shù)中該率先出現(xiàn)的鏡頭個數(shù)時,計數(shù)大于該預(yù)定閾值的鏡頭個數(shù)來產(chǎn)生一第四計數(shù)值;以及當(dāng)該第四計數(shù)值在該第三計數(shù)值達(dá)到該第三臨界計數(shù)值之前先達(dá)到一第四臨界計數(shù)值時,重置該第三、該第四計數(shù)值以及重新計數(shù)不大于該預(yù)定閾值的鏡頭個數(shù)。18.如權(quán)利要求14所述的方法,其中決定該視頻片段的該結(jié)尾邊界位置的步驟包含有依據(jù)該多個第二鏡頭個數(shù)中該率先出現(xiàn)的鏡頭個數(shù)所對應(yīng)的該滑動窗口的該第二特定時序來決定一第二時序范圍;以及自該第二時序范圍中選取出一第二目標(biāo)時序來作為該視頻片段的該結(jié)尾邊界位置。19.如權(quán)利要求18所述的方法,其中選取出該第二目標(biāo)時序的步驟包含有識別出該第二時序范圍中幀所對應(yīng)的鏡頭個數(shù)中的一極值;以及以該極值所對應(yīng)的一幀時序來作為該第二目標(biāo)時序。20.如權(quán)利要求18所述的方法,其中選取出該第二目標(biāo)時序的步驟包含有識別出在該第二時序范圍中一第一特定幀與一第二特定幀間的一聲音不連續(xù);以及以在該第二特定幀之前該第一特定幀所對應(yīng)的一幀時序來作為該第二目標(biāo)時序。全文摘要本發(fā)明披露一種估計經(jīng)由一輸入視頻流所傳送的一視頻片段中一邊界位置的方法。該方法包含有利用一滑動窗口來計算該輸入視頻流中鏡頭出現(xiàn)的個數(shù)以分別產(chǎn)生多個鏡頭個數(shù);以及依據(jù)該多個鏡頭個數(shù)與一預(yù)定閾值來估計出該邊界位置。文檔編號H04N7/26GK101193297SQ20071015470公開日2008年6月4日申請日期2007年9月13日優(yōu)先權(quán)日2006年11月29日發(fā)明者葉家宏,施宣輝申請人:智輝研發(fā)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1