專利名稱:多媒體內(nèi)容剪輯的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多媒體內(nèi)容的剪輯。
運(yùn)動圖像專家組(MPEG)標(biāo)準(zhǔn)包括多媒體流格式的規(guī)范。規(guī)范一方面用于視頻流的壓縮編碼,另一方面用于傳送節(jié)目的視頻和音頻流的傳輸流。該傳輸流常用來傳送有線電視系統(tǒng)的電視節(jié)目。
已經(jīng)建議了各種各樣的方法來拼接MPEG流。通常情況下,當(dāng)進(jìn)行拼接時(shí),這些方法需要處理流。一些拼接壓縮MPEG視頻流的方法包括解碼,然后再編碼部分流,以形成拼接。一些拼接MPEG流的方法包括修改流,創(chuàng)建可以進(jìn)行轉(zhuǎn)場的容許點(diǎn)。
發(fā)明內(nèi)容
一方面,剪輯多媒體流的方法通常能將多個(gè)源多媒體流的多個(gè)段剪輯成可能的輸出多媒體流中的任意一種。流剪輯包括計(jì)算用于插入連續(xù)的段之間形成任意輸出流的流的片斷。
本方法可以包括一個(gè)或多個(gè)下列特征本方法包括為根據(jù)期望的這些段的播出時(shí)間界限確定源流的多個(gè)段。
在剪輯之前,至少存儲一些流的片斷。
流片斷存儲在磁盤存儲器內(nèi)。
流片斷用于相繼段之間的串聯(lián)。
流片斷用于串聯(lián),無需修改以形成任意輸出流。
每個(gè)源多媒體流、每個(gè)輸出多媒體流和每個(gè)流片斷包括臨時(shí)編碼的流,如MPEG流。
每個(gè)MPEG流包括一個(gè)MPEG傳輸流。
輸出流包括視頻流,這樣每個(gè)視頻流編碼連續(xù)視頻幀序列的播出。
視頻流避免視頻緩沖檢驗(yàn)器模型的上溢或下溢。
本方法還包括將一系列段剪輯成第一輸出多媒體流。
在剪輯第一輸出流的各段之間的轉(zhuǎn)場之前,計(jì)算流片斷。
獨(dú)立于編輯第一輸出流,計(jì)算流片斷。
至少存儲一些流片斷,剪輯第一輸出流包括檢索這些片斷。
剪輯第一輸出流包括連續(xù)的各每個(gè)相繼的段對之間插入一個(gè)或多個(gè)流片斷。
在每個(gè)相繼的段對之間插入流片斷包括在所述段之間插入兩個(gè)流片斷。
剪輯輸出流包括串聯(lián)兩個(gè)流片斷。
將一系列的段剪輯成第二輸出多媒體流。
至少一些計(jì)算出的流片斷插入第一輸出流和第二輸出流。
剪輯第一輸出多媒體流集,并且至少一些計(jì)算出的流片斷沒有用于所述第一集的任意流的剪輯。
剪輯任意輸出流包括剪輯一連串的任意第一流段集中的段和任意第二流段集中的段。
計(jì)算流片斷包括計(jì)算各個(gè)與從第一段集的不同段轉(zhuǎn)場相關(guān)的流片斷,以及計(jì)算各個(gè)與轉(zhuǎn)場到第二段集的不同段相關(guān)的流片斷。
另一方面,本發(fā)明的特征在于多媒體流的動態(tài)剪輯。存儲用于每套替換段的信息,包括用于替換段的信息、與替換段開始相關(guān)聯(lián)的流片斷以及與替換段結(jié)束相關(guān)聯(lián)的流片斷。對于源多媒體流的一個(gè)或多個(gè)原始段,用存儲的一個(gè)替換段替換原始段。替換段包括插入與每個(gè)原始段以及每個(gè)源流和替換段之間的轉(zhuǎn)場處替換段相關(guān)聯(lián)的流片斷。
另一方面,本發(fā)明的特征通常在于剪輯多媒體流。本方法包括識別一個(gè)或多個(gè)多媒體流內(nèi)的轉(zhuǎn)場點(diǎn),包括識別第一流內(nèi)的第一轉(zhuǎn)場點(diǎn)和第二流內(nèi)的第二轉(zhuǎn)場點(diǎn)。計(jì)算各個(gè)與流內(nèi)轉(zhuǎn)場點(diǎn)之一相關(guān)聯(lián)的流片斷,該計(jì)算包括計(jì)算與第一流內(nèi)的第一轉(zhuǎn)場點(diǎn)相關(guān)聯(lián)的第一流片斷和與第二流內(nèi)的第二轉(zhuǎn)場點(diǎn)相關(guān)聯(lián)的第二流片斷。多媒體流由多個(gè)素材剪輯而成,這些素材包括在轉(zhuǎn)場點(diǎn)之前的第一流的一部分、第一流片斷、第二流片斷以及緊隨第二轉(zhuǎn)場點(diǎn)之后的第二流的一部分。
本發(fā)明的優(yōu)點(diǎn)為下列當(dāng)中的一個(gè)或多個(gè)因?yàn)樵谠碝PEG流內(nèi)創(chuàng)建轉(zhuǎn)場點(diǎn)所要求的計(jì)算可作為一個(gè)過程大量進(jìn)行,該過程產(chǎn)生可存儲用于以后流剪輯的數(shù)據(jù),流的剪輯要求相對較少的計(jì)算,可由相對廉價(jià)的設(shè)備完成,如軟件。
片斷的計(jì)算可獨(dú)立于轉(zhuǎn)場的剪輯,因此除了用于剪輯過程,計(jì)算可提前進(jìn)行,或在另一臺計(jì)算機(jī)上進(jìn)行。
相同預(yù)計(jì)算出的片斷可用于剪輯不同的輸出流,因而減少了計(jì)算的總量。
本方法提供了一種在電視節(jié)目中替換或插入廣告的經(jīng)濟(jì)的方法。因?yàn)椴迦霃V告段操作簡單,可經(jīng)濟(jì)地提供大量的不同廣告流。
在一個(gè)將多個(gè)不同的流傳送給不同的用戶的系統(tǒng)內(nèi),如視頻點(diǎn)播系統(tǒng),本發(fā)明提供了為不同的用戶提供經(jīng)濟(jì)的剪輯流的方法。例如,每個(gè)視頻點(diǎn)播流可針對某個(gè)用戶插入不同的廣告集。
本方法避免了當(dāng)播出剪輯的流時(shí)解碼器緩沖的上溢??杀苊庥憛挼膶?dǎo)致一些解碼器執(zhí)行中下溢的瑕疵。
本方法可剪輯一個(gè)“連貫的”流,這樣視頻圖像就會連續(xù)并有規(guī)律地以期望的在源段任意組合之間的轉(zhuǎn)場間隔播出。
本方法可用于無需準(zhǔn)備與修改以加速轉(zhuǎn)場形成的源多媒體流,并可用來在以前已經(jīng)建立允許的轉(zhuǎn)場點(diǎn)處建立附加的轉(zhuǎn)場點(diǎn)。
下面的描述和權(quán)利要求書明確列出了本發(fā)明的其他特征和優(yōu)點(diǎn)。
圖1是說明多媒體傳輸流的剪輯的示圖;圖2是說明出轉(zhuǎn)場片斷的示圖;
圖3是說明入轉(zhuǎn)場片斷的示圖;圖4是說明出轉(zhuǎn)場片斷的視頻流中的MPEG幀的示圖;圖5是說明入轉(zhuǎn)場片斷的視頻流中的MPEG幀的示圖;圖6是說明位于出轉(zhuǎn)場片斷和入轉(zhuǎn)場片斷界限附近的傳輸流包的示圖;圖7是說明位于出轉(zhuǎn)場片斷和入轉(zhuǎn)場片斷之間的界限附近的幀的傳送和播出時(shí)間的示圖;圖8是一個(gè)系統(tǒng)方框圖;圖9是說明廣告插入步驟的示圖;圖10是一個(gè)機(jī)頂盒的方框圖;以及圖11是說明廣告替換系統(tǒng)的示圖。
具體實(shí)施例方式
1帶轉(zhuǎn)場片斷的內(nèi)容剪輯參照圖1,多媒體內(nèi)容剪輯方法包括合并多個(gè)源MPEG傳輸流的多個(gè)段,形成新的剪輯的MPEG傳輸流。在圖1中,示出了三個(gè)MPEG傳輸流,流的傳送時(shí)間從左至右(不同流的傳送時(shí)間沒有對準(zhǔn))。三個(gè)流包括兩個(gè)源流TSA110和TSB130,以及一個(gè)新(剪輯的)流TSA-B150。合并期望的源流的段包括在剪輯過程中從一個(gè)源流向另一個(gè)源流切換。在從源流TSA110向源流TSB130轉(zhuǎn)場的附近,新的流TSA-B150包括(1)傳輸流TSA110的段112,該段大致上與傳輸流TSA內(nèi)應(yīng)該已經(jīng)播出至期望的播出“出時(shí)間”tA118的內(nèi)容相對應(yīng),(2)轉(zhuǎn)場部分152,當(dāng)該部分被解碼和播出時(shí),會產(chǎn)生一個(gè)短的黑色間隔,以及(3)傳輸流TSB130的段132,該段大致上與傳輸流TSB內(nèi)應(yīng)該已經(jīng)從期望的播出“入時(shí)間”tB138開始播出的內(nèi)容相對應(yīng)。
插入在兩個(gè)源傳輸流之間的轉(zhuǎn)場部分造成播出間隔,該間隔在源流之間短時(shí)間可看見。例如,在從電視節(jié)目至廣告的轉(zhuǎn)場內(nèi),會播出黑色視頻和靜音頻的簡短間隔。而且,源流不必在與期望的入和出時(shí)間正好對應(yīng)的幀處進(jìn)行切換。
作為從流TSA110至流TSB130轉(zhuǎn)場處剪輯傳輸流TSA-B150的第一步,期望的出時(shí)間tA118和入時(shí)間tB138與這些時(shí)間關(guān)聯(lián)的傳輸流的偏移量(如,與起始流相關(guān)的字節(jié)偏移量)映射。繼而,這些期望的轉(zhuǎn)場時(shí)間(入和出時(shí)間)決定形成轉(zhuǎn)場的流段的終點(diǎn),上述終點(diǎn)將形成與這些期望的轉(zhuǎn)場時(shí)間基本上對應(yīng)的段的終點(diǎn)。在該實(shí)施例中,出時(shí)間tA118映射流TSA110內(nèi)的偏移量dA116,入時(shí)間tB138映射流TSB130內(nèi)的偏移量dB136。該映射步驟將在下文中討論。
轉(zhuǎn)場部分152由出轉(zhuǎn)場片斷120和入轉(zhuǎn)場片斷140的串聯(lián)形成,片斷120與TSA110內(nèi)的偏移量dA116處的向另一個(gè)流的“出”轉(zhuǎn)場相關(guān)聯(lián),片斷140與從另一個(gè)流在偏移量dB136處向TSB130的“入”轉(zhuǎn)場關(guān)聯(lián)。
獨(dú)立于剪輯過程,預(yù)先計(jì)算用于TSA的出轉(zhuǎn)場片斷120,并格式化為傳輸流,這樣從TSA110在偏移量dA116處向出轉(zhuǎn)場片斷120的切換不會中斷產(chǎn)生的傳輸流的格式化。也就是說,當(dāng)傳輸流在偏移量dA116處切換時(shí),傳輸流內(nèi)各種級別的包和幀保持正確的格式,在剪輯時(shí)無需檢查流的內(nèi)容。這種正確的格式保證了接收傳輸流TSA-B的兼容MPEG的解碼器能夠正確解碼并播出剪輯的節(jié)目。
也獨(dú)立于剪輯過程進(jìn)行預(yù)計(jì)算入轉(zhuǎn)場片斷140,并格式化為傳輸流,這樣從出轉(zhuǎn)場片斷120進(jìn)行切換,或從任意類似構(gòu)造的、對應(yīng)于不同出點(diǎn)的出轉(zhuǎn)場片斷進(jìn)行通用切換時(shí),入轉(zhuǎn)場片斷140不會中斷產(chǎn)生的傳輸流的格式化。
在新的傳輸流TSA-B150內(nèi),入轉(zhuǎn)場片斷140串聯(lián)在出轉(zhuǎn)場片斷120之后,傳輸流TSB130的段132串聯(lián)在轉(zhuǎn)場片斷之后。這樣使傳輸流TSA-B150是兼容MPEG的傳輸流。如下面的進(jìn)一步討論,兼容包括剪輯的視頻流符合標(biāo)準(zhǔn)視頻緩沖檢驗(yàn)器(VBV)模型,從而確保接收剪輯的視頻流的兼容MPEG的視頻解碼器不會上溢或下溢。兼容還包括確保剪輯的流不含有任意視頻中斷。
出轉(zhuǎn)場片斷120和入轉(zhuǎn)場片斷140串聯(lián)在一起形成轉(zhuǎn)場片斷,該片斷并入原始流的需要的部分112和132。注意源傳輸流的部分112和132簡單的鄰接不會形成有效的MPEG傳輸流。例如,在TSA110的偏移量dA116處,通常有多個(gè)不完整的包和幀,這些包和幀沒有在偏移量136后的TSB130的部分132中完成。而且,即使在串聯(lián)后包和幀的結(jié)構(gòu)是有效的,接收流的解碼器有可能會發(fā)生緩沖器上溢或下溢,因?yàn)楫a(chǎn)生期望的部分132的編碼器假設(shè)解碼器在該段的起始點(diǎn)處于不同的狀態(tài)。
參照圖2,傳輸流TSA110中傳送的、MPEG編碼的節(jié)目210,通常有多個(gè)基本流(ES)組成。例如,電視節(jié)目通常包括視頻基本流、一個(gè)或多個(gè)音頻基本流。在圖2內(nèi),沿與流的播出時(shí)間相對應(yīng)的時(shí)間軸,示出了作為視頻流ESA1212和音頻流ESA2222的流的代表對。注意通常MPEG節(jié)目可包括附加的基本流。例如,多個(gè)不同的音頻流中,每個(gè)音頻流可對應(yīng)不同的語言或不同的音頻壓縮標(biāo)準(zhǔn)。多個(gè)視頻流可對應(yīng)不同的攝影角度或不同的畫面比例。
基本流ESA1212和ESA2222由一系列的幀組成(圖2未示出)。期望的出時(shí)間tA110用來計(jì)算ESA1212內(nèi)的幀偏移量fA1218和ESA2222內(nèi)的幀偏移量fA2228。映射過程的細(xì)節(jié)將在下面詳細(xì)討論。在圖2內(nèi),ESA1212的部分214對應(yīng)保留在剪輯流內(nèi)的節(jié)目210的編碼視頻,ESA2222的部分216對應(yīng)如果使用轉(zhuǎn)場時(shí)沒有保留的視頻。同樣,部分224對應(yīng)保留的節(jié)目210的音頻,部分226對應(yīng)如果使用轉(zhuǎn)場時(shí)沒有保留的音頻。
在相應(yīng)的分組基本流(PES)230內(nèi)傳送節(jié)目210的基本流。分組基本流PESA1232和PESA2242分別傳送基本視頻流ESA1212和ESA2222。每個(gè)分組基本流由一系列的包組成,這些包通常有可變長度。如上所述,PESA1232包括一系列的包234A-D,PESA2242包括一系列的包244A-D。每個(gè)PES包包括一個(gè)標(biāo)題(未示出)和一個(gè)凈荷,該凈荷為相應(yīng)的基本流傳送數(shù)據(jù)。每個(gè)包的標(biāo)題表示包的大小,并可選地包括定時(shí)信息,該信息用來識別在該包內(nèi)的幀的播出時(shí)間和傳送時(shí)間。
當(dāng)在解碼器接收傳輸流時(shí),基本音頻和視頻流被緩沖,并在延時(shí)之后傳送給各自的解碼器,該延時(shí)通常是變化的,并且每個(gè)基本流的延時(shí)不同。視頻數(shù)據(jù)的延時(shí)通常比音頻數(shù)據(jù)長,因此,位于出幀fA1218之前的視頻數(shù)據(jù)出現(xiàn)在PESA1232內(nèi)的數(shù)據(jù)偏移量238處,在PESA1232內(nèi)的數(shù)據(jù)偏移量238處的傳送比對應(yīng)出幀fA2228的在PESA2242的數(shù)據(jù)偏移量24處的傳送早。注意如上所述,出幀通常不會出現(xiàn)在PES包的邊界。如上所述,數(shù)據(jù)偏移量238通過PES包234B出現(xiàn)部分,數(shù)據(jù)偏移量248通過PES包244C出現(xiàn)部分。
節(jié)目的分組基本流復(fù)用至一系列的固定長(188字節(jié))的傳輸包,形成該節(jié)目的傳輸流TSA110。每個(gè)TS包有一個(gè)短的標(biāo)題和一個(gè)凈荷。每個(gè)PES包在多個(gè)傳輸流(TS)包的凈荷部分傳輸,來自不同的PES流的包交織在不同的TS包內(nèi)。每個(gè)PES包的起點(diǎn)位于相應(yīng)TS包凈荷的開始。
PES包234B,即含有出幀fA1218起點(diǎn)的PES包的起點(diǎn)出現(xiàn)在TSA110內(nèi)的dA116,含有出幀fA2228起點(diǎn)的PES包244C的起點(diǎn)出現(xiàn)在TSA110內(nèi)的數(shù)據(jù)偏移量dA266。選數(shù)據(jù)偏移量dA116作為TS包的起點(diǎn),這樣,傳送PES包234B和244C的起點(diǎn)的TS包就不會比dA116出現(xiàn)得早。
從dA116開始的TSA110的部分包括一序列TS包250A-M。在該實(shí)施例中,包250A-B含有PES包234B的初始的部分,對應(yīng)出幀fA1218之前的視頻。包250C和250F包括PES包244C的初始的部分,對應(yīng)出幀fA2228之前的音頻。包250D包括出幀fA1218的起點(diǎn),因此包括當(dāng)使用該轉(zhuǎn)場點(diǎn)時(shí)未保留在剪輯流內(nèi)的數(shù)據(jù)。包括出幀fA1218起點(diǎn)的包也可包括用于fA1218之前的視頻幀的數(shù)據(jù),該數(shù)據(jù)如圖所示保留在剪輯流內(nèi)的。包250E、G、J、K以及M包括用于fA1218之內(nèi)或之后的視頻幀的數(shù)據(jù)。包250L包括位于fA2228之內(nèi)或之后的音頻幀。
剪輯發(fā)生在傳輸流級,不要求在剪輯新流時(shí)PES或ES級的解釋。出轉(zhuǎn)場片斷120對齊TS包的邊界,由整數(shù)個(gè)完整的TS包260A-M組成。通過用出轉(zhuǎn)場片斷的TS包260A-M替換起始于TSA110內(nèi)包250A的TS包,形成多個(gè)新的PES流270。PES流PESA’1272形成新的視頻流的一部分(通過轉(zhuǎn)場結(jié)束部分),流PESA’2282形成新的音頻流的一部分。PESA’1272傳送PESA1232完整的原始的PES包234A的復(fù)制,以及一些新的PES包,作為新的PES包274A和274B。PESA’2282傳送完整的原始的PES包244A-B的復(fù)制,以及一些新的PES包,作為新包284A。出轉(zhuǎn)場幀120的結(jié)構(gòu)應(yīng)為當(dāng)出轉(zhuǎn)場幀的最后字節(jié)傳送之后,沒有部分傳送的PES包。
出轉(zhuǎn)場片斷120通常包括來自ESA1212和ESA2222的音頻和視頻幀內(nèi)的數(shù)據(jù),這些數(shù)據(jù)在出幀fA1218和fA2228之前有各自的播出時(shí)間,但出現(xiàn)在傳輸流TSA110內(nèi)的偏移量dA116之后。
出轉(zhuǎn)場片斷120通常為每個(gè)PES流傳送至少一個(gè)新建立的PES包。如上所述,出轉(zhuǎn)場片斷120包括兩個(gè)PES包274A-B,用于PES流PESA’1272,和一個(gè)新的PES包284A,用于PES流PESA’2282。PES包274A包括一個(gè)初始的部分,該部分傳送視頻源PES包234B的數(shù)據(jù),這些數(shù)據(jù)在出幀fA1218之前有播出時(shí)間。該最初部分在PESA’1272內(nèi)偏移量278處結(jié)束。
在偏移量278處開始,并在出轉(zhuǎn)場片斷120內(nèi)結(jié)束的PES流PESA’1272的剩余部分,傳送將在源節(jié)目之間的轉(zhuǎn)場內(nèi)播出的視頻數(shù)據(jù)。該視頻數(shù)據(jù)傳送黑幀。音頻流在出幀fA2228之后終止,這導(dǎo)致在轉(zhuǎn)場期間音頻解碼器下溢,因此觀眾聽不到聲音。幀和PES和TS包是這樣形成的當(dāng)出轉(zhuǎn)場片斷120傳送結(jié)束之后,解碼器的視頻緩沖檢驗(yàn)器模型,對于緩沖的(已經(jīng)傳送但仍未播出)視頻幀數(shù)量以及用來播出緩沖幀的緩沖數(shù)據(jù)的數(shù)量,處于已知的狀態(tài)。該過程包括在出轉(zhuǎn)場片斷120結(jié)束處增加多個(gè)空包(空包未示出),以控制出轉(zhuǎn)場片斷傳送時(shí)間的結(jié)束。下面進(jìn)一步討論空包數(shù)量的計(jì)算。
參照圖3,在轉(zhuǎn)場點(diǎn)切換的節(jié)目也被傳送在分層的PES和TS包內(nèi)。傳輸流TSB130傳送PES流330,PES流330傳送基本流310。期望的入時(shí)間tb138映射入幀fB1318 and fB2328,分別用于基本流ESB1312 and ESB2322。分組流PESB1332和PESB2342分別傳送PES幀334A-D和344A-D,入幀fA1318和fA2328分別出現(xiàn)在PES包334B和344B。
入偏移量dB136對應(yīng)TSB130的TS包的第一個(gè)字節(jié),出現(xiàn)在最后的TS包之后,最后的TS包傳送來自源流的任意需要修改以實(shí)現(xiàn)有效轉(zhuǎn)場的數(shù)據(jù)。在此情況下,dB136出現(xiàn)在傳送最后的PES包334B和344B的TS包之后。如圖3所示,入偏移量dB136位于第一個(gè)TS包的開始,第一個(gè)TS包緊隨最后一個(gè)TS包,最后一個(gè)TS包傳送一個(gè)PES包,該P(yáng)ES包包括用于相應(yīng)的基本流、位于入幀之前的幀內(nèi)的任意數(shù)據(jù)。
如出轉(zhuǎn)場片斷120一樣,入轉(zhuǎn)場片斷140包括整數(shù)個(gè)TS包360A-H。這些包傳送修改的PES包,含有PES包334B和344B的結(jié)尾部分,這樣當(dāng)入轉(zhuǎn)場片斷與起始于偏移量dB136的TSB130串聯(lián)時(shí),PES包結(jié)構(gòu)有效。串聯(lián)入轉(zhuǎn)場片斷和出轉(zhuǎn)場片斷導(dǎo)致出轉(zhuǎn)場片斷的最后一個(gè)TS包直接緊跟著入轉(zhuǎn)場片斷的第一個(gè)TS包。在入轉(zhuǎn)場片斷140內(nèi)修改PES包334B和344B的標(biāo)題,這樣它們能正確反映在fB1和fB2之后播出的幀中的數(shù)據(jù)的特性(如,長度和任意時(shí)間戳)。對于在fB1和fB2之前的幀,入轉(zhuǎn)場傳送PES包374和384,這些包傳送用于轉(zhuǎn)場幀的數(shù)據(jù),以及在入幀之內(nèi)或之后的數(shù)據(jù)。如下面的進(jìn)一步討論,轉(zhuǎn)場幀是這樣計(jì)算的例如,在入幀fB1和fB2傳送之前,解碼器位于已知狀態(tài),確保解碼器緩沖器既不會上溢也不會下溢。
2轉(zhuǎn)場片斷如上所述,出轉(zhuǎn)場片斷120和入轉(zhuǎn)場片斷140獨(dú)立于剪輯過程進(jìn)行預(yù)計(jì)算。轉(zhuǎn)場片斷的計(jì)算包括幀級的基本流的處理,這樣在任意一個(gè)轉(zhuǎn)場內(nèi),可向接收流的解碼器發(fā)送一個(gè)有效序列的幀。
參照圖4,按幀的播出順序進(jìn)行說明的一序列的源視頻幀420,根據(jù)標(biāo)準(zhǔn)MPEG編碼,由不同類型的幀組成。MPEG編碼包括一系列視頻圖像的臨時(shí)編碼,于是,一個(gè)圖像的編碼取決于另一個(gè)或更多的其他圖像的編碼。在MPEG編碼內(nèi),每個(gè)I幀完整編碼一個(gè)圖像,而P和B幀是預(yù)測的,每個(gè)幀根據(jù)前面的或隨后的多個(gè)圖像的不同來編碼圖像。P幀自前一個(gè)圖像開始前向預(yù)測,該圖像可在I幀或P幀中編碼。B幀根據(jù)早于或晚于在I幀或P幀中編碼的圖像,雙向預(yù)測。
按發(fā)送順序說明的基本視頻流ESA1212,分組成一序列的編碼的幀,每個(gè)組叫做圖像組(GOP)405。一個(gè)GOP 405由初始的I幀和緊隨其后的多個(gè)的P和B幀組成。GOP的長度是靈活的,不過通常是12-15幀長。視頻幀的傳送順序與幀的播出順序不同,特別是B幀,被延遲,并且只在其依賴的幀傳送之后才傳送。例如,播出順序IBBP被傳送成IPBB,這將導(dǎo)致某個(gè)GOP的第一個(gè)B幀,可能播出在該GOP初始的I幀之前。
通過四舍五入到最近的GOP,期望的出時(shí)間tA118被用于計(jì)算與GOP405的起點(diǎn)對應(yīng)的出幀fA1218。也就是說,出時(shí)間映射GOP最后一個(gè)P幀播出之后的幀和在下一個(gè)GOP內(nèi)傳送的任意B幀播出之前的幀。在系統(tǒng)的其它版本內(nèi)對該GOP界限的映射沒有要求。
新的基本流ESA’1430,對應(yīng)圖2中的PESA’1272,傳送與ESA1212相同序列的出幀fA1218。這些幀后面是H黑幀410,H黑幀410使用初始的I幀即IB進(jìn)行編碼,在H黑幀410后面是一系列的零動作P幀即Pz。這些零動作的幀只需很少的數(shù)據(jù)來編碼,如幾百個(gè)字節(jié),因?yàn)閳D像自初始的I幀開始沒有變化?!癶old”參數(shù)H通用于所有的出轉(zhuǎn)場片斷,例如,H=3是“hold”參數(shù)的合適選擇。
在播出順序內(nèi),剪輯的視頻幀440序列在P幀結(jié)束,后面是編碼成I幀的H黑幀,I幀后面是H-1零動作P幀。
用多個(gè)空的傳輸流包(未在圖2或圖4中示出)填充出轉(zhuǎn)場片斷120,使得在出轉(zhuǎn)場片斷末尾傳送結(jié)束時(shí),出轉(zhuǎn)場片斷與某一圖像播出時(shí)間對齊(±1/2 188字節(jié)的TS包傳送時(shí)間之內(nèi))。選擇該播出時(shí)間,使H黑幀被傳送,但不在已經(jīng)接收出轉(zhuǎn)場片斷的解碼器播出。注意在數(shù)據(jù)速率為6Mb/s時(shí),一個(gè)TS包時(shí)長大約為0.25ms,這僅是典型的電視信號幀播出時(shí)間間隔33.3ms的一小部分。
在某些環(huán)境下,出轉(zhuǎn)場片斷120不能用此方法填充,例如,由于音頻播出超出了視頻播出的范圍。在此情況下,需要一個(gè)(必要的話,或更多)除H圖像之外的附加的黑幀Pz。用空的包填充流,保證滿足上述條件。實(shí)質(zhì)上,如果音頻超調(diào)視頻,就增加視頻,直至視頻與音頻范圍相同,然后繼續(xù)按上述方法進(jìn)行。
參照圖5,期望的入時(shí)間tB138映射入幀fB1318,fB1318對應(yīng)基本視頻流ESB1312內(nèi)的GOP 505的起點(diǎn)。注意如上面討論的,由于ESB1312內(nèi)幀的有序傳送,期望的流的部分的fB1318后面的第一I幀后面可以是多個(gè)依賴于fB1前面幀的B幀。入轉(zhuǎn)場片斷140構(gòu)造應(yīng)為如此產(chǎn)生的基本視頻流ESB’1530在I幀之前,在ESB1312入幀fB1處,總共有T-H個(gè)黑幀用于播出。這些黑幀由一個(gè)I幀和其后的多個(gè)零動作的P幀組成。在GOP標(biāo)題內(nèi)設(shè)置與I幀關(guān)聯(lián)的指示符“l(fā)inkbroken”,這樣解碼器能迅速忽略隨后的B幀。實(shí)際上,視頻解碼器沒有必要忽略這種連接中斷指示符之后的B幀。因此,緊跟在I幀之后被傳送的B幀被沒有依賴圖像的B幀所代替,該圖像應(yīng)已經(jīng)在B幀前傳送。例如,使用只依賴于I幀的零動作B幀。
參數(shù)T取決于某個(gè)流ESB1312和入幀fB1318,特別是,當(dāng)在入幀fB1318處的幀已經(jīng)在原始的源流內(nèi)ESB傳送時(shí),T取決于解碼器延時(shí)。解碼器延時(shí)指在偏移量fB1的幀的傳送時(shí)間和該幀的解碼時(shí)間之間的差。參數(shù)T是一個(gè)整數(shù),等于解碼器延時(shí)除以幀播出間隔,四舍五入到下一個(gè)更大的整數(shù)。
在T-H黑幀之后和期望的部分的第一個(gè)I幀之前插入多個(gè)空的傳輸流包(未在圖5中示出)。這些空包的數(shù)量是這樣決定的在最后的T-H黑幀傳送和期望部分的第一個(gè)I幀傳送之后,在期望部分的第一個(gè)I幀已經(jīng)傳送的點(diǎn)上,解碼器延時(shí)與應(yīng)在原始TS流播出的解碼器匹配。通過匹配解碼器延時(shí),保證滿足視頻緩沖檢驗(yàn)器(VBV)解碼器模型,且接收剪輯流的解碼器不會下溢。此外,由于在該點(diǎn)緩沖的黑幀比已經(jīng)在該點(diǎn)緩沖的原始流的幀使用更少的數(shù)據(jù)編碼,也能保證解碼緩沖器不會上溢。
參照圖6,在出轉(zhuǎn)場片斷120和入轉(zhuǎn)場片斷140之間轉(zhuǎn)場附近的詳細(xì)定時(shí)包括用空TS包填充出轉(zhuǎn)場片斷。入轉(zhuǎn)場片斷140以多個(gè)TS包的前導(dǎo)段開始。這些包包括用于轉(zhuǎn)場的流的節(jié)目關(guān)聯(lián)表(PAT)和節(jié)目映射表(PMT)。T-H黑幀形成GOP,GOP編碼成TS包,在前導(dǎo)段后面。GOP標(biāo)題包括連接中斷指示符和從該GOP開始的時(shí)基中斷指示。
記得在出轉(zhuǎn)場片斷內(nèi)的視頻ES流以H黑MPEG幀IBPz...Pz結(jié)束。這些黑幀有源流TSA的時(shí)基的時(shí)間戳。在出轉(zhuǎn)場片斷結(jié)束增加空包,使傳送時(shí)間正好在最后一個(gè)空包的最后一個(gè)字節(jié)或傳送之后,入轉(zhuǎn)場片斷等于第一個(gè)包的傳送時(shí)間第一個(gè)H黑幀的播出時(shí)間,誤差為±1/2TS包傳送時(shí)間。
在入轉(zhuǎn)場片斷內(nèi),多個(gè)初始的TS包,在該實(shí)施例中,3個(gè)包,形成前導(dǎo)段。第一包播出匹配TSB的時(shí)基的變化,后面是傳送T-H黑幀的TS包、多個(gè)用來調(diào)整第一個(gè)I幀的傳送時(shí)間的空TS包,以及期望的入轉(zhuǎn)場片斷140的視頻幀。
根據(jù)第一個(gè)期望的I幀的解碼時(shí)間計(jì)算T-H黑幀的解碼時(shí)間戳(DTS)。為了使計(jì)算結(jié)果更精確,第一個(gè)T-H黑幀的解碼時(shí)間為DTS[1]=DT-((T-H)*FT),T-H黑幀序列的播出時(shí)間戳為PTS[1]=DTS[1]+FT;DTS[2]=DTS[2]+FT以及PTS[2]=DTS[2]+FT。在該符號內(nèi),DTS[n]表示第n個(gè)T-H圖像的解碼時(shí)間戳。DT表示源流內(nèi)第一個(gè)圖像的解碼時(shí)間,F(xiàn)T是幀時(shí)間,幀時(shí)間用90Khz時(shí)鐘表示。
參照圖7,時(shí)基的變化會影響到從出轉(zhuǎn)場片斷的最后一個(gè)H黑幀到入轉(zhuǎn)場片斷的第一個(gè)T-H黑幀的幀時(shí)間的遞增(考慮到時(shí)基的變化)。在圖7里面,時(shí)碼線710與第一個(gè)時(shí)基的傳送時(shí)間關(guān)聯(lián),時(shí)碼線720與第二個(gè)時(shí)基的傳送時(shí)間關(guān)聯(lián)。同樣,時(shí)碼線730與第一個(gè)時(shí)基的播出時(shí)間關(guān)聯(lián),時(shí)碼線740與第二個(gè)時(shí)基的播出時(shí)間關(guān)聯(lián)。如上所述,在傳送時(shí)碼線710上,TSA110最后一個(gè)期望的幀712后面是H黑幀714。如圖所示,使用出轉(zhuǎn)場片斷內(nèi)空TS包調(diào)整入轉(zhuǎn)場片斷的起始傳送時(shí)間,使第一個(gè)H黑轉(zhuǎn)場幀714與入轉(zhuǎn)場片斷的起點(diǎn)重合,誤差為±1/2TS包傳送時(shí)間735。在傳送時(shí)碼線720上,T-H黑幀722在轉(zhuǎn)場之后的第一個(gè)幀時(shí)間之內(nèi)有傳送時(shí)間(未按比例畫圖),接著傳送TSB第一個(gè)期望幀724。同樣如前面所介紹的,在入轉(zhuǎn)場片斷內(nèi)的T-H黑幀722的播出時(shí)間平均分配在一個(gè)幀時(shí)間內(nèi)(比如33.3ms),以匹配黑轉(zhuǎn)場幀后面的第一個(gè)幀的播出時(shí)間。注意T-H黑幀的播出時(shí)間通常并非是入轉(zhuǎn)場片斷的第一個(gè)字節(jié)傳送時(shí)間之后的幀時(shí)間的整倍數(shù),因此,在最后一個(gè)H黑幀和第一個(gè)T-H黑幀之間的實(shí)際幀時(shí)間會與標(biāo)準(zhǔn)的幀時(shí)間會有一半TS包時(shí)間的差異,例如,在一個(gè)6Mbps的流中,誤差為33.3ms±0.25ms。
MPEG標(biāo)準(zhǔn)對相繼的MPEG幀的播出時(shí)間的固定步長沒有嚴(yán)格要求。但實(shí)際上,一些解碼器無法承受一個(gè)步長內(nèi)0.25ms的誤差。一個(gè)可供選擇的實(shí)施例中,視頻幀必須以準(zhǔn)確的增量播出時(shí)間播出,在流剪輯過程中或之后,調(diào)整流內(nèi)的時(shí)間戳重新調(diào)整剪輯的傳輸流的時(shí)間。
3流終點(diǎn)也在源流的開始和結(jié)束計(jì)算轉(zhuǎn)場片斷。例如,要插入節(jié)目的用于廣告的源流可有一個(gè)短時(shí)長,如30秒。在流的起點(diǎn)只計(jì)算入轉(zhuǎn)場片斷,在流的終點(diǎn)只計(jì)算出轉(zhuǎn)場片斷。這些片斷的計(jì)算與上述出入轉(zhuǎn)場片斷的計(jì)算相同,只是出現(xiàn)在源流終點(diǎn)的轉(zhuǎn)場的細(xì)節(jié)不同。例如,參照圖5,沒有延時(shí)的B幀出現(xiàn)在流的第一個(gè)I幀后面,因此,零動作的B幀無需計(jì)算。
4音頻流音頻幀獨(dú)立編碼(與MPEG視頻內(nèi)的I幀類似),在基本音頻流在基本幀界限上開始和終止的期間內(nèi),不會產(chǎn)生音頻瑕疵。當(dāng)沒有音頻發(fā)送時(shí),音頻解碼器通常柔性處理(即產(chǎn)生靜音)。因此,在上述方法中,當(dāng)音頻流在轉(zhuǎn)場中終止時(shí),就播出靜音。
可選擇的一種方法是在出和入轉(zhuǎn)場片斷內(nèi)發(fā)送含有靜音的音頻幀,或可替換的其他合適的轉(zhuǎn)場聲音(參見圖2中的PES包284A,和圖3中的384)。
5系統(tǒng)結(jié)構(gòu)參見圖8,在上面實(shí)施例中描述的用于剪輯流的內(nèi)容拼接系統(tǒng)800接受源MPEG傳輸流810,并產(chǎn)生一個(gè)或更多的輸出MPEG傳輸流890,傳輸流890通過剪輯源流810的不同部分形成。源流810被輸入系統(tǒng),系統(tǒng)800將這些流存儲在源存儲器840內(nèi),通常為RAM或磁盤。源流也由轉(zhuǎn)場點(diǎn)識別模塊820處理,該模塊識別源傳輸流內(nèi)的轉(zhuǎn)場點(diǎn)(時(shí)間和數(shù)據(jù)偏移量)。
源流上也可以預(yù)定義和提供潛在的轉(zhuǎn)場點(diǎn),例如,從帶模擬源的提示音開始,或從嵌入數(shù)字源的DVS-253信令開始。此類信號識別能插入廣告的次數(shù)。根據(jù)MPEG流的內(nèi)容,系統(tǒng)可額外地或有選擇地動態(tài)識別潛在轉(zhuǎn)場點(diǎn),例如,在源視頻上執(zhí)行自動的場景變化分析,來識別潛在轉(zhuǎn)場點(diǎn)。
識別潛在轉(zhuǎn)場點(diǎn)的數(shù)據(jù)存儲在索引850內(nèi)。對于已識別的轉(zhuǎn)場點(diǎn),轉(zhuǎn)場發(fā)生器830根據(jù)上述描述的方法,計(jì)算入和出轉(zhuǎn)場片斷,并將這些片斷存儲在存儲器860內(nèi),存儲器860通常為RAM或磁盤,例如用于源存儲器840的同樣的磁盤。
稍后,間隔時(shí)間和計(jì)算源流轉(zhuǎn)場片斷所需的時(shí)間一樣短,或延長至流剪輯之后,剪輯模塊880存儲在源存儲器840內(nèi)的部分源流810,并從轉(zhuǎn)場存儲器860某些轉(zhuǎn)場片斷,串聯(lián)的部分和片斷,形成輸出流890。以該方式剪輯的源流的某些部分由剪輯表870驅(qū)動,該表規(guī)定了在不同源流之間出現(xiàn)轉(zhuǎn)場的偏移量。
參照圖9,源傳輸流810用段912A-F表示,段912A-F用潛在的轉(zhuǎn)場點(diǎn)分開。轉(zhuǎn)場發(fā)生器830為每個(gè)轉(zhuǎn)場點(diǎn)產(chǎn)生相應(yīng)的出轉(zhuǎn)場片斷和140A-F相應(yīng)的入轉(zhuǎn)場片斷120A-F。
在剪輯過程中,位于段912B內(nèi)的節(jié)目,例如原始的廣告,被段912E內(nèi)的節(jié)目所取代,例如替換的廣告,產(chǎn)生的流890包括一個(gè)替換流950,代替段912B發(fā)送。該替換流包括出轉(zhuǎn)場片斷120B、入轉(zhuǎn)場片斷140E、段912E、出轉(zhuǎn)場片斷120F以及最后的入轉(zhuǎn)場片斷140C。
參照圖10,在一個(gè)可選擇的結(jié)構(gòu)內(nèi),剪輯過程遙控進(jìn)行,例如,在有線電視系統(tǒng)的客戶端的機(jī)頂盒。本方法的應(yīng)用之一就是用根據(jù)機(jī)頂盒選擇的廣告代替電視廣告。在這種應(yīng)用中,機(jī)頂盒從輸入頻道1022接收原始流810和出轉(zhuǎn)場片斷120(例如用于替換段912B內(nèi)廣告的出轉(zhuǎn)場片斷120B),以及入轉(zhuǎn)場片斷(例如入轉(zhuǎn)場片斷140C)??蛇x擇的廣告段(如段912E)以及與其關(guān)聯(lián)的入轉(zhuǎn)場片斷(如片斷140E)和出轉(zhuǎn)場片斷(如片斷120F)在其他的頻道1022發(fā)送。調(diào)諧器/輸入選擇器120動態(tài)為廣告選擇合適的輸入頻道。至于原始廣告段912B的時(shí)長等于替換流950,替換流950包括一對在替換廣告兩端的出和入轉(zhuǎn)場片斷,廣告之后,源流810的繼續(xù)無需重新調(diào)整時(shí)間或緩沖。位于調(diào)諧器選擇不同頻道處的空TS包允許包丟失而不會丟失必要的內(nèi)容。各種類型的輸入頻道1022可用于廣告。例如,這些頻道可對應(yīng)有線電視系統(tǒng)內(nèi)的不同的傳送頻道。這些替換廣告在其播出之前可選擇地發(fā)送至并緩沖在機(jī)頂盒內(nèi)。
參照圖11,廣告替換系統(tǒng)包括存儲多個(gè)廣告?zhèn)鬏斄?110。為每個(gè)廣告流存儲一個(gè)與廣告流的起點(diǎn)關(guān)聯(lián)的入轉(zhuǎn)場片斷1112和一個(gè)與廣告流終點(diǎn)關(guān)聯(lián)的出轉(zhuǎn)場片斷1114。注意對于任意一個(gè)廣告,入轉(zhuǎn)場片斷1112、廣告流1110其本身以及出轉(zhuǎn)場片斷1114可存儲在一起,作為TS包的一個(gè)序列,無需識別三個(gè)成分之間的界限。系統(tǒng)接受源節(jié)目1120。源節(jié)目包括多個(gè)原始廣告1130。為每個(gè)廣告存儲一個(gè)與廣告的起點(diǎn)關(guān)聯(lián)的出轉(zhuǎn)場片斷1132和一個(gè)與廣告終點(diǎn)關(guān)聯(lián)的入轉(zhuǎn)場片斷1134。這些入和出轉(zhuǎn)場片斷可與源流一起計(jì)算并傳送至系統(tǒng),如果存儲了源節(jié)目,以批進(jìn)行計(jì)算,或在傳送廣告之前,短暫地以“on-the fly”計(jì)算。
在傳送期間,每個(gè)原始廣告1130可由零個(gè)或更多的廣告1110代替,形成一個(gè)新的流1140。插入單個(gè)替換廣告對應(yīng)于替換帶出轉(zhuǎn)場片斷1132、入轉(zhuǎn)場片斷1112和替換廣告流1110的原始廣告1130,出轉(zhuǎn)場片斷1114用于替換廣告,入轉(zhuǎn)場片斷1134用于原始廣告。如果沒有廣告可播出,原始廣告1130由出轉(zhuǎn)場片斷1132代替,后面是與原始廣告關(guān)聯(lián)的入轉(zhuǎn)場片斷1134。在每個(gè)廣告之間可串聯(lián)多個(gè)帶一個(gè)出轉(zhuǎn)場片斷和一個(gè)入轉(zhuǎn)場片斷的廣告,以類似的方法替換單個(gè)原始廣告。
另一種應(yīng)用包括通過播出連續(xù)的短片,播出節(jié)目的選擇部分。在此應(yīng)用中,轉(zhuǎn)場片斷播出靜幀。例如,為了播出每個(gè)場景序列的初始部分,入轉(zhuǎn)場片斷與場景的起點(diǎn)關(guān)聯(lián),出轉(zhuǎn)場片斷與一個(gè)或更多的場景的點(diǎn)關(guān)聯(lián)。在操作中,節(jié)目“fast-forward”版本的播出包括替換每個(gè)帶出轉(zhuǎn)場片斷的尾部,后面是另一個(gè)場景的入轉(zhuǎn)場片斷。選擇每個(gè)場景中的出轉(zhuǎn)場點(diǎn),然后決定快速前進(jìn)播出的速度。
6其他方法在上述的實(shí)施例中,當(dāng)剪輯流時(shí),串聯(lián)出轉(zhuǎn)場片斷和入轉(zhuǎn)場片斷。在另一種方法中,除了串聯(lián)出入轉(zhuǎn)場片斷,將片斷交織在一起。記得出轉(zhuǎn)場片斷和入轉(zhuǎn)場片斷都有多個(gè)空的TS包,特別是,每個(gè)出轉(zhuǎn)場片斷有多個(gè)尾隨的空TS包,如圖6所示。如果多個(gè)空包的傳送時(shí)間等于某個(gè)幀的播出時(shí)間,從轉(zhuǎn)場內(nèi)移走這些空包,并從入轉(zhuǎn)場片斷移走一個(gè)T-H黑幀,然后黑轉(zhuǎn)場的時(shí)長短于一個(gè)幀,轉(zhuǎn)場仍然形成一個(gè)兼容MPEG的流。為了有效地移走黑幀,每個(gè)幀在獨(dú)立的入轉(zhuǎn)場片斷內(nèi)的TS包集的PES包內(nèi)進(jìn)行編碼。黑幀的刪除對應(yīng)刪除PES包的關(guān)聯(lián)TS包??芍貜?fù)此步驟,直至在出轉(zhuǎn)場片斷內(nèi)的空包的T-H黑幀耗盡。
除了將源傳輸流內(nèi)的期望拼接時(shí)間(期望的入時(shí)間和出時(shí)間)映射至源傳輸流的每個(gè)基本流內(nèi)的特定的幀,還可以將期望的時(shí)間映射至每個(gè)基本流內(nèi)的一群不同的幀。然后為每個(gè)幀產(chǎn)生入和出的轉(zhuǎn)場。例如,當(dāng)提示時(shí)間不正確時(shí),使用集群。當(dāng)用于期望拼接時(shí)間的默認(rèn)的幀看上去與流的進(jìn)入或離開不匹配時(shí),通過從集群里面選擇另一個(gè)幀(和相應(yīng)的轉(zhuǎn)場片斷)來人工糾正該幀。
除了產(chǎn)生一群拼接點(diǎn),用于事后人工糾正丟失的定時(shí)的拼接提示,還可以分析拼接點(diǎn)附近的內(nèi)容,選取入幀和出幀(可以不同)來最佳匹配廣告替換場景內(nèi)的圖形。一個(gè)例子就是分析拼接點(diǎn)附近圖像的總亮度,選取最暗的圖像。但是注意替換廣告的機(jī)會通常用原始節(jié)目信號內(nèi)的短的黑色間隔來區(qū)分。因此,另外一種方法就是將流留在黑色間隔開始的地方,并將流返回至盡量靠近黑色間隔結(jié)束的地方。這提供了一種用黑色拼接轉(zhuǎn)場序列替換原始的黑色序列,因而降低或消除了感覺到的總體拼接特技。
不必在GOP將期望的轉(zhuǎn)場映射至某個(gè)幀。例如,少量的計(jì)算出點(diǎn)可與GOP內(nèi)的P幀界限對齊,繼而產(chǎn)生更多精確的出轉(zhuǎn)場。通過更多的計(jì)算,也可以在任意幀上創(chuàng)建出點(diǎn)和入點(diǎn),例如,重編碼含有轉(zhuǎn)場的GOP部分。
上述傳輸流的固定速率傳送的方法,同樣也適用于可變速率傳送。同樣,根據(jù)MPEG標(biāo)準(zhǔn),本方法并不局限于多媒體流。
除了圖像,在入和出轉(zhuǎn)場中也可以編碼其他的黑幀,以使用較少的位避免拼接流播出過程中緩沖器上溢。此外,轉(zhuǎn)場特技,例如可在轉(zhuǎn)場片斷內(nèi)編碼靜幀或逐漸淡化。在另一個(gè)實(shí)施中,在整個(gè)轉(zhuǎn)場過程中播出靜幀,入轉(zhuǎn)場片斷不包括初始I幀,使用零動作的預(yù)測幀,這取決于在出轉(zhuǎn)場片斷內(nèi)編碼的圖像。也就是說,GOP跨出和入轉(zhuǎn)場片斷。
除了在其原始I、P和B幀內(nèi)包含圖像的MPEG編碼,轉(zhuǎn)場片斷的計(jì)算能可選地包括解碼和重編碼某些MPEG幀,例如,調(diào)整MPEG流的壓縮程度。
入轉(zhuǎn)場和出轉(zhuǎn)場片斷不必詳細(xì)播出,而是,可計(jì)算用來產(chǎn)生每個(gè)片斷的參數(shù),然后在剪輯時(shí),從該參數(shù)動態(tài)產(chǎn)生轉(zhuǎn)場片斷。
除了使用黑I幀后面是零動作P幀的形式IPPPPPP...的序列來編碼轉(zhuǎn)場片斷內(nèi)的幀,還可以使用包括零動作零動作B幀的幀序列來編碼轉(zhuǎn)場片斷內(nèi)的幀。此序列可有形式IBBPBBP....。該形式常用來編碼視頻節(jié)目,一些機(jī)頂盒的解碼器也許期望這種形式,也許實(shí)際上不會適當(dāng)?shù)靥幚碇挥辛銊幼鱌幀組成的序列。當(dāng)使用零動作B幀時(shí),相應(yīng)調(diào)整幀的的播出和解碼時(shí)間戳。
上述說明著重于MPEG流的剪輯。相同方法可應(yīng)用于其他類型的多媒體流,包括其他版本的MPEG標(biāo)準(zhǔn),以及使用其他標(biāo)準(zhǔn)編碼的多媒體流。
7實(shí)施實(shí)現(xiàn)上述方法的一種方法為使用由計(jì)算機(jī)處理器訪問的軟件,例如,從存儲硬盤或跨局域網(wǎng)。計(jì)算機(jī)在操作系統(tǒng)的控制下執(zhí)行軟件。一個(gè)例子就是在Microsoft Windows操作系統(tǒng)內(nèi)運(yùn)行軟件的通用的英特爾奔騰處理器。也可使用其他通用的或特殊用途的處理器,以及其他軟件環(huán)境。轉(zhuǎn)場片斷的預(yù)計(jì)算和流的剪輯可由同一個(gè)計(jì)算機(jī)或計(jì)算機(jī)組執(zhí)行,或者不同的計(jì)算機(jī)可用來進(jìn)行轉(zhuǎn)場片斷的計(jì)算和流的剪輯。此外,可遙控計(jì)算轉(zhuǎn)場片斷,并將這些片斷傳送給進(jìn)行剪輯過程的計(jì)算機(jī)。在此情況下,轉(zhuǎn)場片斷可與已經(jīng)計(jì)算出片斷的流一起傳送,或單獨(dú)傳送。在替換的實(shí)施方式中,由特殊用途的電路執(zhí)行一些或所有的功能,這些電路可包括編程處理器。
其他的實(shí)施例在下面的權(quán)利要求范圍內(nèi)。
權(quán)利要求
1.一種方法,包括剪輯多個(gè)源多媒體流的多個(gè)段形成多個(gè)輸出多媒體流中的任意一個(gè),包括計(jì)算用于插入相繼的段之間形成任意輸出流的流的片斷。
2.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括根據(jù)期望的所述段的播出時(shí)間界限確定源流的多個(gè)段。
3.根據(jù)權(quán)利要求1所述的方法,其中剪輯輸出流進(jìn)一步包括在剪輯之前至少存儲一些流的片斷。
4.根據(jù)權(quán)利要求3所述的方法,其中存儲流的片斷包括將所述片斷存儲在磁盤存儲器內(nèi)。
5.根據(jù)權(quán)利要求1所述的方法,其中流片斷用于串聯(lián)相繼的段。
6.根據(jù)權(quán)利要求5所述的方法,其中流片斷用于串聯(lián),無需修改以形成任意輸出流。
7.根據(jù)權(quán)利要求1所述的方法,其中每個(gè)源多媒體流、每個(gè)輸出多媒體流和每個(gè)流片斷包括臨時(shí)編碼的流。
8.根據(jù)權(quán)利要求7所述的方法,其中臨時(shí)編碼的流包括MPEG流。
9.根據(jù)權(quán)利要求8所述的方法,其中每個(gè)MPEG流包括MPEG傳輸流。
10.根據(jù)權(quán)利要求7所述的方法,其中剪輯輸出流包括剪輯多個(gè)輸出流,每個(gè)輸出流包括一個(gè)視頻流,這樣視頻流編碼連續(xù)視頻幀序列的播出。
11.根據(jù)權(quán)利要求1所述的方法,其中每個(gè)視頻流避免視頻緩沖檢驗(yàn)器模型的上溢或下溢。
12.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括根據(jù)一系列的段編輯第一輸出多媒體流。
13.根據(jù)權(quán)利要求12所述的方法,其中計(jì)算流片斷在剪輯第一輸出流之前進(jìn)行。
14.根據(jù)權(quán)利要求12所述的方法,其中計(jì)算流片斷獨(dú)立于剪輯第一輸出流而進(jìn)行。
15.根據(jù)權(quán)利要求12所述的方法,其中剪輯流包括至少存儲一些流的片斷,剪輯第一輸出流包括檢索所述片斷。
16.根據(jù)權(quán)利要求12所述的方法,其中剪輯第一輸出流包括在連續(xù)的每個(gè)相繼的段對之間插入一個(gè)或多個(gè)流片斷。
17.根據(jù)權(quán)利要求16所述的方法,其中在每個(gè)相繼的段對之間插入流片斷包括在所述段之間插入兩個(gè)流片斷。
18.根據(jù)權(quán)利要求17所述的方法,剪輯輸出流包括串聯(lián)兩個(gè)流片斷。
19.根據(jù)權(quán)利要求12所述的方法,進(jìn)一步包括根據(jù)一系列的段編輯第二輸出多媒體流。
20.根據(jù)權(quán)利要求19所述的方法,其中剪輯第一和第二輸出流包括在第一輸出流和第二輸出流中插入至少一些計(jì)算出的流的片斷。
21.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括剪輯第一多個(gè)輸出多媒體流,其中至少一些計(jì)算出的流片斷未用于剪輯任意所述第一多個(gè)輸出流。
22.根據(jù)權(quán)利要求1所述的方法,其中剪輯任意輸出流包括剪輯一系列第一多個(gè)流段中的任意段和第二多個(gè)流段中的任意段。
23.根據(jù)權(quán)利要求22所述的方法,其中計(jì)算流片斷包括計(jì)算各個(gè)與從第一段集的不同段轉(zhuǎn)場相關(guān)的流片斷,以及計(jì)算各個(gè)與轉(zhuǎn)場到第二段集的不同段相關(guān)的流片斷。
24.一種用于動態(tài)剪輯多媒體流的方法,包括為各個(gè)替換段存儲信息,包括為每個(gè)替換段存儲與替換段開始相關(guān)聯(lián)的流片斷和與替換段結(jié)束相關(guān)聯(lián)的流片斷;對于各個(gè)源多媒體流的原始段,用存儲的一個(gè)替換段替換原始段,包括插入與每個(gè)原始段關(guān)聯(lián)的流片斷,并在源流和替換段之間的每個(gè)轉(zhuǎn)場插入替換段。
25.一種用于剪輯多媒體流的方法,包括在一個(gè)或多個(gè)多媒體流內(nèi)識別轉(zhuǎn)場點(diǎn),包括識別在第一流內(nèi)的第一轉(zhuǎn)場點(diǎn)和第二流內(nèi)的第二轉(zhuǎn)場點(diǎn);計(jì)算各個(gè)與流中的一個(gè)轉(zhuǎn)場點(diǎn)關(guān)聯(lián)的流片斷,包括計(jì)算與第一流內(nèi)第一轉(zhuǎn)場點(diǎn)關(guān)聯(lián)的第一流片斷和計(jì)算與第二流內(nèi)第二轉(zhuǎn)場點(diǎn)關(guān)聯(lián)的第二流片斷;從素材剪輯多媒體流,包括在第一轉(zhuǎn)場點(diǎn)之前的部分第一流、第一流片斷、第二流片斷以及第二轉(zhuǎn)場點(diǎn)之后的部分第二流。
26.根據(jù)權(quán)利要求25所述的方法,其中剪輯多媒體流包括串聯(lián)素材。
27.根據(jù)權(quán)利要求26所述的方法,其中素材為MPEG傳輸流的部分,串聯(lián)素材形成新的MPEG傳輸流。
28.根據(jù)權(quán)利要求27所述的方法,其中MPEG傳輸流部分由傳輸流包序列組成。
29.根據(jù)權(quán)利要求25所述的方法,其中計(jì)算流片斷包括除了計(jì)算與所述片斷關(guān)聯(lián)的片斷,還獨(dú)立于轉(zhuǎn)場點(diǎn)計(jì)算各個(gè)流片斷。
30.根據(jù)權(quán)利要求25所述的方法,其中計(jì)算流片斷在剪輯流之前進(jìn)行。
31.根據(jù)權(quán)利要求30所述的方法,進(jìn)一步包括在存儲設(shè)備上存儲計(jì)算出的流片斷,剪輯流包括從所述的存儲設(shè)備檢索第一和第二流片斷。
32.根據(jù)權(quán)利要求24所述的方法,其中一個(gè)或多個(gè)多媒體流為MPEG流。
33.根據(jù)權(quán)利要求32所述的方法,其中MPEG流為MPEG傳輸流。
34.存儲在計(jì)算機(jī)可讀介質(zhì)內(nèi)軟件,使計(jì)算機(jī)系統(tǒng)執(zhí)行功能,這些功能包括能剪輯多個(gè)源多媒體流的多個(gè)段形成多個(gè)輸出多媒體流中的任意一個(gè),包括計(jì)算用于插入相繼的段之間形成任意輸出流的流的片斷。
35.一種多媒體處理系統(tǒng),包括能剪輯多個(gè)源多媒體流的多個(gè)段形成多個(gè)輸出多媒體流中的任意一個(gè)的裝置,包括計(jì)算用于插入相繼的段之間形成任意輸出流的流的片斷。
全文摘要
一種剪輯多媒體流的方法,剪輯多個(gè)源多媒體流的多個(gè)段形成可能的多個(gè)輸出多媒體流中的任意一個(gè)。剪輯流包括計(jì)算用于插入相繼的段之間形成任意輸出流的流的片斷。根據(jù)此方法,源MPEG流內(nèi)創(chuàng)建轉(zhuǎn)場點(diǎn)所要求的計(jì)算可作為一個(gè)預(yù)過程大量進(jìn)行,該過程產(chǎn)生可存儲用于以后流剪輯的數(shù)據(jù),流的剪輯要求相對較少的計(jì)算,可由相對廉價(jià)的設(shè)備完成,如軟件。
文檔編號H04N7/24GK1656807SQ03810015
公開日2005年8月17日 申請日期2003年5月2日 優(yōu)先權(quán)日2002年5月3日
發(fā)明者布蘭科·J·格羅瓦茨, 大衛(wèi)·卡維爾 申請人:希昌國際公司