專利名稱:用于編排及播放一多媒體串流的裝置及方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于一種用于編排及播放一多媒體串流的裝置及方法。更具體而言,本發(fā)明借由使影像串流(video stream)與音頻串流(audio stream)相互交錯而編排該多媒體串流,并播放經(jīng)編排的多媒體串流。
背景技術(shù):
由于通訊及多媒體技術(shù)的迅速發(fā)展,所創(chuàng)建的多媒體檔日趨增多。此外,人們不僅可于傳統(tǒng)電腦上、且亦可于移動裝置上觀看多媒體串流。一多媒體串流通常同時包含一影像串流與一音頻串流。當一裝置播放(或存取)多媒體串流時,為得到最佳的效能,需要使影像串流與音頻串流同步。
圖1例示一用于儲存一多媒體串流的先前技術(shù)檔案結(jié)構(gòu)11。檔案結(jié)構(gòu)11包含一第一部分111及一第二部分112,其中第一部分111具有區(qū)塊0至區(qū)塊n,第二部分112則具有區(qū)塊n+1至區(qū)塊m。各該區(qū)塊可為一扇區(qū)或一使用者自定義(user-defined)儲存單元。第一部分111儲存該多媒體串流的一影像串流,而第二部分112儲存該多媒體串流的一音頻串流。該影像串流與該音頻串流分別儲存于檔案結(jié)構(gòu)11中,這是因為二者為實質(zhì)不同種類的多媒體,因而具有不同的編碼及解碼方法。因影像串流與音頻串流是分別儲存,故試圖存取該二串流的裝置必須具有二存取指針(accessing pointer),即一影像存取指針121及一音頻存取指針122。
檔案結(jié)構(gòu)11及相應(yīng)存取方法存在某些缺點。第一缺點是效能大幅降低。當一裝置播放著儲存于如圖1所示檔案結(jié)構(gòu)11中的多媒體串流時,其需要能夠隨機地存取此些串流,以使影像串流與音頻串流二者同步。然而,隨機存取會消耗裝置的大量資源。若裝置為資源有限的移動/可攜式裝置,則其可能無法流暢地播放多媒體檔案。更有甚者,于播放多媒體檔案期間,移動/可攜式裝置可能無法處理其他功能。
另一缺點在于,為了于影像串流與音頻串流間達成同步,除一額外定時器或計數(shù)器外,尚需要一巨大的緩沖器。現(xiàn)今存在二種使影像串流與音頻串流達成同步的主要方法,第一種方法是針對影像串流與音頻串流使用二獨立的觸發(fā)器機構(gòu)(trigger mechanism),其中此些觸發(fā)器機構(gòu)相依于裝置的系統(tǒng)時脈。影像串流的觸發(fā)器機構(gòu)是于每一預定時間間隔觸發(fā)影像串流的一部分,而音頻串流的觸發(fā)器機構(gòu)則以其預定時間間隔觸發(fā)音頻串流的一部分;第二種方法是因應(yīng)音頻串流的每一部分而觸發(fā)影像串流的一部分,其中音頻串流的該部分包含不止一個音頻采樣?,F(xiàn)提供一更具體的實例,其中以N表示影像串流的影像畫面速率(video frame rate)并以M表示音頻串流的音頻采樣頻率(audiosampling rate)。于一秒鐘內(nèi)存在N個影像畫面及M個音頻采樣意味著一個影像畫面對應(yīng)M/N個音頻采樣。于一實例中,影像串流的一部分為一個影像畫面,而音頻串流的一部分包含M/N個音頻采樣。第二種方法是因應(yīng)音頻串流的每一部分(即M/N個音頻采樣)而觸發(fā)影像串流的一部分(即一個影像畫面)。觸發(fā)之前,該二方法皆須完全解碼影像畫面及音頻框,并將其儲存于緩沖器中,以便該裝置可流暢地播放。
根據(jù)上文說明可知,利用傳統(tǒng)檔案結(jié)構(gòu)儲存多媒體串流存在某些缺點。當一資源有限的裝置試圖播放一多媒體檔案時,此些缺點變得愈發(fā)明顯。因此,仍非常需要提供一種用于儲存一多媒體檔案的新結(jié)構(gòu)以及一種用于編排該多媒體檔案的所儲存影像及音頻部分的相應(yīng)方法。
發(fā)明內(nèi)容
本發(fā)明的一目的是提供一種用于編排一多媒體串流的方法。該多媒體串流包含一影像串流及一音頻串流。該方法包含下列步驟(a)寫入該影像串流的一第一部分;(b)寫入該音頻串流的一第一部分,其對應(yīng)于該影像串流的該第一部分;(c)于步驟(a)及步驟(b)后,寫入該影像串流的一次一部分;以及(d)于步驟(a)及步驟(b)后,寫入該音頻串流的一次一部分,其對應(yīng)于該影像串流的該次一部分。
本發(fā)明的另一目的是提供一種用于編排一多媒體串流的裝置。該多媒體串流包含一影像串流及一音頻串流。該裝置包含一處理器。該處理器適以寫入該影像串流的一第一部分;寫入該音頻串流的一第一部分,其對應(yīng)該影像串流的該第一部分;于該影像串流的該第一部分及該音頻串流的該第一部分寫入后,寫入該影像串流的一次一部分;以及于該影像串流的該第一部分及該音頻串流的該第一部分寫入后,寫入該音頻串流的一次一部分,其對應(yīng)該影像串流的該次一部分。
本發(fā)明的再一目的是提供一種用于播放一多媒體串流的方法。該多媒體串流包含一第一影像部分、一次一影像部分、一第一音頻部分、以及一次一音頻部分。該第一影像部分及該第一音頻部分較該次一影像部分及該次一音頻部分先到達。該方法包含下列步驟(a)解碼該第一影像部分,以取得一第一解碼影像部分;(b)解碼該第一音頻部分,以取得一第一解碼音頻部分;(c)播放該第一解碼影像部分及該第一解碼音頻部分;(d)于步驟(a)及步驟(b)后,解碼該次一影像部分以取得一次一解碼影像部分;(e)于步驟(a)及步驟(b)后,解碼該次一音頻部分以取得一次一解碼音頻部分;以及(f)于步驟(c)后,播放該次一解碼影像部分及該次一解碼音頻部分。
本發(fā)明的又一目的是提供一種用于播放一多媒體串流的裝置。該多媒體串流包含一第一影像部分、一次一影像部分、一第一音頻部分、以及一次一音頻部分。該第一影像部分及該第一音頻部分較該次一影像部分及該次一音頻部分先到達。該裝置包含一處理器。該處理器適以播放該第一影像部分及該第一音頻部分,以及于播放該第一影像部分及該第一音頻部分后,播放該次一影像部分及該次一音頻部分。該裝置可更包含一緩沖器,用于暫時儲存該第一音頻部分及該次一音頻部分,其中該緩沖器的一容量小于該第一影像部分的一容量及該次一影像部分的一容量。
對于同時包含一影像串流與一音頻串流的一多媒體串流,本發(fā)明根據(jù)下列準則來編排該影像串流的各部分及該音頻串流的各部分此些影像及音頻串流的前一部分較此些影像及音頻串流的次一部分先到達。換言之,于編排后,此些影像及音頻串流中對應(yīng)于前一時間間隔的部分較此些影像及音頻串流中對應(yīng)于一次一時間間隔的部分先到達。由于本發(fā)明根據(jù)該概念編排多媒體串流;因此,一試圖播放所編排多媒體串流的裝置可按該次序播放之,而無需配備緩沖器、計數(shù)器或定時器。此意味著該裝置可于解碼影像串流的一部分及音頻框的一部分之后立即輸出之,即無需緩沖解碼結(jié)果或者僅緩沖解碼結(jié)果的一小部分。該特征尤其適用于資源有限的可攜式裝置。
為讓本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,以下結(jié)合附圖對本發(fā)明的具體實施方式
作詳細說明,其中 圖1例示一用于儲存一多媒體串流的先前技術(shù)檔案結(jié)構(gòu); 圖2例示本發(fā)明的一第一實施例; 圖3例示第一實施例的檔案的一檔案結(jié)構(gòu); 圖4例示畫面速率與采樣頻率的間關(guān)系的一實例; 圖5例示本發(fā)明的一第二實施例; 圖6A例示本發(fā)明一第三實施例的流程圖的一部分; 圖6B例示第三實施例的流程圖的另一部分;以及 圖7例示本發(fā)明一第四實施例的一流程圖。
主要元件符號說明 2裝置5裝置 11先前技術(shù)檔案結(jié)構(gòu) 21介面 22處理器 23緩沖器 31檔案結(jié)構(gòu) 50多媒體串流 51處理器 52緩沖器 111第一部分 112第二部分 121影像存取指針 122音頻存取指針 201多媒體串流202影像串流 203音頻串流 310標頭 311影像串流的第一部分312音頻串流的第一部分 313影像串流的次一部分314音頻串流的次一部分
具體實施例方式 本發(fā)明的目的是提供一種借由使一多媒體串流的一影像串流與一音頻串流相互交錯而編排該多媒體串流的裝置及方法。此外,亦提供用于播放所編排多媒體串流的相應(yīng)裝置及方法。
圖2例示本發(fā)明的一第一實施例,其為一種用于編排一多媒體串流201的裝置2。裝置2包含一處理器22,且與一介面21及一緩沖器23配合運作。于其他實施例中,介面21及緩沖器23亦可配置于裝置2內(nèi)。
介面21接收多媒體串流201,其中多媒體串流201包含一影像串流202及一音頻串流203。圖3例示多媒體串流201的一檔案結(jié)構(gòu)31。于介面21接收到多媒體串流201后,處理器22寫入多媒體串流201的一標頭310至該檔案中,然后寫入影像串流202的一第一部分311至該檔案中,并接著寫入音頻串流203的一第一部分312至該檔案中,該第一部分312系對應(yīng)于影像串流202的第一部分311。于影像串流202的第一部分311及音頻串流203的第一部分312寫入檔案中之后,處理器22寫入影像串流202的一次一部分313及音頻串流203的一次一部分314至該檔案中,其中音頻串流203的次一部分314系對應(yīng)于影像串流202的次一部分313。對第一部分311、312及次一部分313、314的確定將于下文予以闡釋。若影像串流202及音頻串流203仍存在某些尚未寫入的部分,處理器22將繼續(xù)將影像串流202及音頻串流203交錯編排于該檔案中。于上述過程中,緩沖器23可于音頻串流203的第一部分312及次一部分314被寫入該檔案之前,暫時儲存該第一部分312及次一部分314。應(yīng)注意,處理器22可將上述第一部分311、312及次一部分313、314寫入另一多媒體串流中以供直接傳送。
根據(jù)圖3所示檔案結(jié)構(gòu)31可以理解,處理器22借由交錯編排影像串流202與音頻串流203而將多媒體串流201寫入該檔案中。根據(jù)檔案結(jié)構(gòu)31,標頭310可占據(jù)用于儲存該檔案的一儲存器的區(qū)塊0,影像串流202的第一部分311可占據(jù)用于儲存該檔案的儲存器的區(qū)塊1及2,音頻串流203的第一部分312可占據(jù)用于儲存該檔案的儲存器的區(qū)塊3,影像串流202的次一部分313可占據(jù)用于儲存該檔案的儲存器的區(qū)塊4及5,且音頻串流203的次一部分314可占據(jù)用于儲存該檔案的儲存器的區(qū)塊6。
處理器22于寫入多媒體串流201至該檔案前,決定影像串流202的一畫面速率以及音頻串流203的一采樣頻率。于該實施例中,假定畫面速率是每秒呈現(xiàn)N個畫面,采樣頻率是每秒進行M個采樣。然后,處理器22根據(jù)畫面速率N將影像串流202編碼為多個影像畫面,并根據(jù)采樣頻率M將音頻串流203編碼為多個音頻采樣。于某些情形中,一多媒體串流201的一影像串流202及一音頻串流203可能早已編碼為影像畫面及音頻采樣。于這些情形中,處理器22無需執(zhí)行決定及編碼,而是僅需根據(jù)影像串流202及音頻串流203來決定畫面速率及采樣頻率。
在下文中將闡釋如何決定第一部分311、312及次一部分313、314。于該實施例中,影像串流202的各該第一部分311及次一部分313皆包含此些影像畫面其中之一。類似地,音頻串流203的各該第一部分312及次一部分314皆包含一音頻采樣計算數(shù)目。于其他實施例中,影像串流202的第一部分311與次一部分313二者可分別僅包含一個影像畫面的一部分,例如一切面(slice)、一巨集區(qū)塊(macro-block)、一列巨集區(qū)塊等等,其中音頻串流203的第一部分312及次一部分314隨的包含對應(yīng)部分。
第一部分311、312及次一部分313、314是根據(jù)畫面速率N及采樣頻率M加以決定。該實施例能夠處理M與N的各種組合以及其他狀況,例如(1)M為N的倍數(shù),(2)M不為N的倍數(shù),以及(3)一音頻框中音頻采樣的數(shù)量為固定。
首先,闡述當M為N的倍數(shù)時對第一部分311、312及次一部分313、314的確定。變數(shù)M及N表示于一秒內(nèi)應(yīng)存在N個影像畫面及M個音頻采樣。亦即,每1/N秒應(yīng)存在一個畫面及M/N個音頻采樣,如圖4所示。于圖4中,橫軸表示時間(單位秒),每一V0,V1,V2,...,及VN-1表示影像串流的一影像畫面,每一A0,A1,A2,...,及AN-1則表示音頻串流203的一音頻框。此外,各該Ai包含M/N個音頻采樣。例如,音頻框A0包含音頻采樣a0,0,a0,1,...,及a0,M/N-1。于該實施例中,影像串流202的第一部分311被確定為第一影像畫面V0,音頻串流203的第一部分312被確定為第一音頻框A0(即前M/N個音頻采樣a0,0,a0,1,...,及a0,M/N-1),影像串流202的次一部分313被確定為次一影像畫面V1,且音頻串流203的次一部分314被確定為音頻框A1,等等。根據(jù)上述說明,影像串流202的第一部分311及音頻串流203的第一部分312對應(yīng)于第一區(qū)段時間(即前1/N秒)。類似地,影像串流202的次一部分313及音頻串流203的次一部分314對應(yīng)于次一區(qū)段時間(即次一1/N秒)。
此處提供一具體實例??剂恳韵虑樾我纛l采樣頻率為44100Hz(即M=44100)且畫面速率為每秒15個畫面(N=15),由此計算出每秒有44100個音頻采樣及15個影像畫面。亦即,每1/15秒存在44100/15=2940個音頻采樣及一個影像畫面。因此,該實施例將一影像畫面寫入該檔案中,并接著將一音頻框(即2940個音頻采樣)寫入該檔案中,依此類推。
第二,闡述當M不為N的倍數(shù)(即M/N不為整數(shù))時,如何決定第一部分311、312及次一部分313、314。若M/N不為整數(shù),則音頻采樣包含至少
個音頻采樣。于相除之后,將殘余音頻采樣分配至音頻框中。影像串流202的第一部分311被確定為第一影像畫面,音頻串流203的第一部分312被確定為第一音頻框,影像串流202的次一部分313被確定為次一影像畫面,音頻串流203的次一部分314被確定為次一音頻框,等等。更具體而言,處理器22采用下列規(guī)則 若{M%N==0},則否則,最后,闡述當一音頻框內(nèi)的音頻采樣數(shù)目應(yīng)固定時,如何決定第一部分311、312及次一部分313、314。其一實例為MP3規(guī)格,其需要于一個音頻框內(nèi)具有1152個音頻采樣。假定于一音頻框內(nèi)所需音頻采樣的數(shù)目為L。處理器22首先判斷音頻采樣數(shù)目是否為L的倍數(shù)。若不是,則處理器22填充若干額外音頻采樣至此些音頻采樣,直到所得音頻采樣數(shù)目為L的倍數(shù)。然后,處理器22確定影像串流202的第一部分311為第一影像畫面。處理器22確定音頻串流203的第一部分312包含至少一個音頻框,其中對應(yīng)于第一部分312內(nèi)所包含音頻采樣的一第一時間長度大到足以覆蓋另一影像畫面的起始邊界。然后,處理器22確定影像串流202的次一部分313為次一影像畫面。此后,處理器22確定音頻串流203的次一部分314包含至少一音頻框,其中對應(yīng)于次一部分314中所包含音頻采樣的一第二時間長度大到足以覆蓋另一影像畫面的起始邊界。更具體而言,處理器22采用下列規(guī)則 若則 否則,
其中k為音頻框的索引,且
表示自第0個至第k個音頻框的累積音頻采樣數(shù)目。
現(xiàn)提供一如下情形的具體實例每一音頻框的長度為固定,其中M=44100,N=15且L=1152。因M/N=2940,故理想情況下應(yīng)每2940個音頻采樣出現(xiàn)一影像畫面。亦即,系統(tǒng)2應(yīng)每2940個采樣脈沖出現(xiàn)一影像畫面。為方便起見,將處理器22所確定的影像畫面及音頻框的順序列于表1中。根據(jù)上述規(guī)則,處理器22確定影像串流202的第一部分311為第一影像畫面V0。處理器22確定音頻串流203的第一部分312為三個音頻框A0、A1及A2,其中各該音頻框具有1152個音頻采樣。于音頻框A2之后,對應(yīng)于所寫入音頻采樣(即第一部分312)的第一時間長度大到足以覆蓋另一影像畫面的起始邊界,亦即第一部分312的采樣脈沖(即1152×3=3456)大到足以覆蓋出現(xiàn)于第2940個采樣脈沖處的次一影像畫面V1的起始邊界。然后,處理器22確定影像串流202的次一部分313為次一影像畫面V1。此后,處理器22確定音頻串流203的次一部分314為三個音頻框A3、A4及A5。類似地,于音頻框A2之后,對應(yīng)于所寫入音頻采樣(即第一部分312及次一部分314)的第二時間長度(3456+1152×3=6912)大到足以覆蓋出現(xiàn)于第5880個采樣脈沖處的另一影像畫面的起始邊界。接著,確定影像串流202的次一部分為次一影像畫面V1。此時,處理器22確定音頻串流203的次一部分314為二音頻框A6及A7。此乃因一第三時間長度(3456+3456+1152×2=9216)大到足以覆蓋出現(xiàn)于第8820個采樣脈沖處的另一影像畫面的起始邊界。該多媒體串流201的其余部分依此類推得到處理。
表1 上文已論述了于三種情形中(基于M、N、以及一音頻框的所需長度),如何決定第一部分311、312、次一部分313、314等等。于寫入多媒體串流201至檔案的過程中,處理器22實際根據(jù)音頻采樣的時間次序逐一寫入各音頻采樣至該檔案。更具體而言,處理器22寫入影像串流202的第一部分311至該檔案。然后,處理器22將未寫入的音頻采樣逐一寫入至該檔案,計算已寫入音頻采樣的一累積數(shù)目,并重復此些未寫入音頻采樣的寫入以及累積數(shù)目的計算,直至累積數(shù)目等于一第一所需數(shù)目且對應(yīng)于已寫入音頻采樣的一第一時間長度大于或等于一第一所需時間長度。借此,寫入音頻串流203的第一部分312至該檔案。接著,處理器22寫入影像串流202的次一部分313至該檔案。隨后,處理器22將未寫入的音頻采樣逐一寫入至該檔案,計算已寫入音頻采樣的累積數(shù)目,并重復此些未寫入音頻采樣的寫入以及累積數(shù)目的計算,直至累積數(shù)目等于一第二所需數(shù)目且對應(yīng)于已寫入音頻采樣的一第二時間長度大于或等于一第二所需時間長度。視M、N及L而定,第一所需數(shù)目、第二所需數(shù)目、第一時間長度、及第二時間長度有所不同。
此外,于寫入第一部分311、313及第二部分312、314之后,處理器22將重復地寫入一次一影像畫面及一音頻框,直至整個多媒體串流201皆已得到編排為止。
于某些其他情形中,裝置2可于影像串流202的第一部分311之前寫入音頻串流203的第一部分314,或者于影像串流202的次一部分之前寫入音頻串流203的次一部分314。對裝置2的唯一要求是不時地交錯編排影像串流202與音頻串流203。因影像串流202與音頻串流203是交錯編排,故當一裝置試圖播放該多媒體串流201時,僅需一個存取指針,即一音頻/影像指針。
圖5例示本發(fā)明的一第二實施例,為一種用于播放一多媒體串流50的裝置5。多媒體串流50已于第一實施例中由裝置2加以編排。更具體而言,多媒體串流50包含一第一影像部分、一次一影像部分、一第一音頻部分、以及一次一音頻部分,其中于多媒體串流50中,該第一影像部分及該第一音頻部分較該次一影像部分及該次一音頻部分先到達。該影像串流的第一部分及次一部分分別為一已編碼微區(qū)塊、一已編碼巨集區(qū)塊、一已編碼巨集區(qū)塊列、一已編碼切片、以及一已編碼碼框其中之一。該第一音頻部分及該次一音頻部分分別包含多個已編碼音頻采樣。
裝置5包含一處理器51及一緩沖器52,其中該緩沖器52的一容量小于該第一影像部分的一容量及該次一影像部分的一容量。處理器51解碼該第一影像部分以得到一第一解碼影像部分,解碼該第一音頻部分以得到一第一解碼音頻部分,并播放該第一解碼影像部分及該第一解碼音頻部分。此后,處理器51解碼該第二影像部分以得到一第二解碼影像部分,解碼該第二音頻部分以得到一第二解碼音頻部分,并播放該第二解碼影像部分及該第二解碼音頻部分。
當解碼第一解碼影像部分時,利用該緩沖器52暫時儲存該第一解碼音頻部分的一部分。更具體而言,該第一音頻部分包含若干已編碼音頻采樣,而該第一影像部分包含一個已編碼影像畫面。當此些音頻采樣其中之一(第一音頻部分的一部分)已被解碼為一音頻采樣時,該影像畫面尚未得到解碼。因此,可將已解碼的音頻采樣儲存于緩沖器52中。類似地,當播放第二解碼影像部分時,利用該緩沖器52暫時儲存第二解碼音頻部分。
裝置5可重復地解碼及播放該多媒體串流50,直到整個多媒體串流50皆已得到解碼及播放。
借由第一及第二實施例的配置,可按照時間次序編排多媒體串流,并可由資源有限的裝置播放所編排的多媒體串流。
圖6A及6B例示本發(fā)明一第三實施例的一流程圖。該多媒體串流同時包含一影像串流與一音頻串流。首先,該方法執(zhí)行步驟601,以決定該影像串流的一畫面速率。然后,該方法執(zhí)行步驟602,以決定該音頻串流的一采樣頻率。
于決定畫面速率及采樣頻率后,該方法執(zhí)行步驟603及604,以分別根據(jù)該畫面速率將該影像串流編碼為多個影像畫面以及根據(jù)該采樣頻率將該音頻串流編碼為多個音頻采樣。爾后,該方法執(zhí)行步驟605,以寫入該影像串流的一第一部分至該檔案。此后,該方法執(zhí)行步驟606、607、608,以寫入該音頻串流的一第一部分至該檔案,其中該音頻串流的第一部分對應(yīng)于該影像串流的第一部分。更具體而言,步驟606按照時間次序?qū)⒋诵┪磳懭胍纛l采樣其中之一寫入該檔案,而步驟607是計算已寫入音頻采樣的累積數(shù)目。步驟608判斷該累積數(shù)目是否等于一第一所需數(shù)目以及對應(yīng)于已寫入音頻采樣的一第一時間長度是否大于或等于一第一所需時間長度。若結(jié)果為否,則該方法返回步驟606。若結(jié)果為是,則該方法進行至步驟609,以寫入該影像串流的一次一部分。接著,該方法執(zhí)行步驟610、611、612,以寫入該音頻串流的一次一部分至該檔案,其中該音頻串流的次一部分對應(yīng)于該影像串流的次一部分。更具體而言,步驟610按照時間次序?qū)懭氪诵┪磳懭胍纛l采樣其中之一至該檔案,而步驟611是計算已寫入音頻采樣的累積數(shù)目。步驟612判斷該累積數(shù)目是否等于一第二所需數(shù)目且對應(yīng)于已寫入音頻采樣的一第二時間長度是否大于或等于一第二所需時間長度。若結(jié)果為否,則該方法返回步驟610。而若結(jié)果為是,則該方法繼續(xù)進行至步驟613,以判斷是否整個多媒體串流皆已得到編排。若結(jié)果為否,則返回步驟609。而若結(jié)果為是,則執(zhí)行步驟614,以結(jié)束整個過程。
除上述步驟外,該實施例更可執(zhí)行在第一實施例中所述的操作及方法。
圖7例示本發(fā)明第四實施例的一流程圖,該第四實施例為一種用于播放一多媒體串流的方法。該多媒體串流包含一第一影像部分、一次一影像部分、一第一音頻部分、及一次一音頻部分。于該多媒體串流中,該第一影像部分及該第一音頻部分較該次一影像部分及該次一音頻部分先到達。
首先,執(zhí)行步驟701,解碼該第一影像部分以得到一第一解碼影像部分,并解碼該第一音頻部分以得到一第一解碼音頻部分。于步驟701之后,執(zhí)行步驟702,以播放該第一解碼影像部分及該第一解碼音頻部分。然后,執(zhí)行步驟703,解碼該次一影像部分以得到一次一解碼影像部分,并解碼該第二音頻部分以得到一第二解碼音頻部分。此后,執(zhí)行步驟704,以播放該次一解碼影像部分及該次一解碼音頻部分。然后,執(zhí)行步驟705,以判斷是否整個多媒體串流皆已得到播放。若結(jié)果為否,則再次執(zhí)行步驟703。而若結(jié)果為是,則執(zhí)行步驟706以結(jié)束該方法。
除上述步驟外,該實施例更可執(zhí)行在第二實施例中所述的操作及方法。
上述方法可由一電腦程序執(zhí)行。換言之,任何筆記本電腦、基站及網(wǎng)關(guān)(gateway)皆可單獨安裝恰當?shù)碾娔X程序,該電腦程序具有用以執(zhí)行上述方法的代碼。該電腦程序可儲存于一電腦可讀取記錄媒體中。該電腦可讀取記錄媒體可為一軟式磁盤片、一硬盤、一光盤、一閃存盤(flash disk)、一磁帶、一可自一網(wǎng)絡(luò)存取的資料庫、或者熟習此項技術(shù)者可輕易思及的具有相同功能的一儲存媒體。
根據(jù)上文說明,本發(fā)明以某種次序交錯編排多媒體串流的影像串流與音頻串流。任何試圖播放該多媒體串流的裝置皆將以相同次序解碼及播放該多媒體串流。舉例而言,本發(fā)明時時地使M/N個音頻采樣與一個影像畫面交錯編排。然后,該裝置應(yīng)每次解碼及播放M/N個音頻采樣及一個影像畫面。換言之,于對應(yīng)音頻采樣得到解碼之前,裝置不能解碼次一影像畫面。該方法能確保以串流次序播放音頻串流與影像串流,而無需利用額外的同步化機構(gòu)。此外,裝置可于解碼后立即輸出影像畫面及音頻框。亦即,裝置無需緩沖整個影像畫面的解碼結(jié)果,此尤其適用于一資源有限的可攜式裝置。
雖然本發(fā)明已以較佳實施例揭示如上,然其并非用以限定本發(fā)明,任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),當可作些許的修改和完善,因此本發(fā)明的保護范圍當以權(quán)利要求書所界定的為準。
權(quán)利要求
1.一種用于編排一多媒體串流的方法,該多媒體串流包含一影像串流及一音頻串流,該方法包含下列步驟
(a)寫入該影像串流的一第一部分;
(b)寫入該音頻串流的一第一部分,其對應(yīng)于該影像串流的該第一部分;
(c)于步驟(a)及步驟(b)后,寫入該影像串流的一次一部分;以及
(d)于步驟(a)及步驟(b)后,寫入該音頻串流的一次一部分,其對應(yīng)于該影像串流的該次一部分。
2.如權(quán)利要求1的方法,其特征在于,更包含下列步驟
重復步驟(c)及步驟(d),直到該多媒體串流已完全編排。
3.如權(quán)利要求1的方法,其特征在于,該音頻串流包含多個音頻采樣,該些音頻采樣具有一時間順序,且該步驟(b)包含以下步驟
(b1)根據(jù)該時間順序,寫入該些未寫音頻采樣其中之一;
(b2)計算該些已寫入音頻采樣的一累積數(shù)目;以及
(b3)依次重復步驟(b1)及步驟(b2),直到該累積數(shù)目等于一第一所需數(shù)目,且對應(yīng)該些已寫入音頻采樣的一第一時間長度,大于或等于一第一所需時間長度。
4.如權(quán)利要求3的方法,其特征在于,該步驟(d)包含下列步驟
(d1)根據(jù)該時間順序,寫入該些未寫音頻采樣其中之一;
(d2)計算該些已寫入音頻采樣的累積數(shù)目;以及
(d3)依序重復步驟(d1)及步驟(d2),直到該累積數(shù)目等于一第二所需數(shù)目,且對應(yīng)該些已寫入音頻采樣的一第二時間長度,大于或等于一第二所需時間長度。
5.如權(quán)利要求1的方法,其特征在于,更包含以下步驟
針對該影像串流,決定一畫面速率;
針對該音頻串流,決定一采樣頻率;
根據(jù)該畫面速率,編碼該影像串流為多個影像畫面;以及
根據(jù)該采樣頻率,編碼該音頻串流為多個音頻采樣,其中該影像串流的各第一部分及該影像串流的各次一部分,包含該些影像畫面其中之一,且該音頻串流的各第一部分及該音頻串流的各次一部分,包含一音頻采樣計算數(shù)目。
6.如權(quán)利要求5的方法,其特征在于,該音頻串流的該第一部分及該音頻串流的該次一部分,是根據(jù)該畫面速率及該采樣頻率所決定。
7.如權(quán)利要求1的方法,其特征在于,該影像串流的該第一部分及該音頻串流的該第一部分,對應(yīng)一第一區(qū)段時間,且該影像串流的該次一部分及該音頻串流的該次一部分,對應(yīng)一次一區(qū)段時間。
8.如權(quán)利要求1的方法,其特征在于,于步驟(a)之前,更包含一寫入該多媒體串流的一標頭的步驟。
9.如權(quán)利要求1的方法,其特征在于,各該影像串流的第一部分及各該影像串流的次一部分,為一微區(qū)塊、一巨集區(qū)塊、一巨集區(qū)塊列、一切面以及一畫面其中之一。
10.一種用以編排一多媒體串流的裝置,該多媒體串流包含一影像串流及一音頻串流,該裝置包含
一處理器,適以寫入該影像串流的一第一部分,及寫入該音頻串流的一第一部分,其對應(yīng)該影像串流的該第一部分,及于該影像串流的該第一部分及該音頻串流的該第一部分寫入后,寫入該影像串流的一次一部分,以及于該影像串流的該第一部分及該音頻串流的該第一部分寫入后,寫入該音頻串流的一次一部分,其對應(yīng)該影像串流的該次一部分。
11.如權(quán)利要求10的裝置,其特征在于,該音頻串流包含多個音頻采樣;該音頻采樣具有一時間順序,且該處理器借由下列方式,寫入該音頻串流的該第一部分根據(jù)該時間順序,寫入該些未寫音頻采樣其中之一;計算該些已寫入音頻采樣的一累積數(shù)目;以及重復寫入該些未寫音頻采樣,及重復計算該些已寫入音頻采樣的一累積數(shù)目,直到該累積數(shù)目等于一第一所需數(shù)目,以及對應(yīng)該些已寫入音頻采樣的一第一時間長度,大于或等于一第一所需時間長度。
12.如權(quán)利要求10的裝置,其特征在于,該處理器借由下列方式,寫入該音頻串流的該次一部分根據(jù)該時間順序,寫入該些未寫音頻采樣其中之一;計算該些已寫入音頻采樣的累積數(shù)目;重復寫入該些未寫音頻采樣及重復計算該些已寫入音頻采樣的累積數(shù)目,直到該累積數(shù)目等于一第二所需數(shù)目,以及對應(yīng)該些寫入音頻采樣的一第二時間長度,大于或等于一第二所需時間長度。
13.如權(quán)利要求10的裝置,其特征在于,該處理器更適以針對該影像串流決定一畫面速率,及針對該音頻串流決定一采樣頻率,及根據(jù)該畫面速率,編碼該影像串流為多個影像畫面,以及根據(jù)該采樣頻率,編碼該音頻串流為多個音頻采樣,其中該影像串流的各第一部分及各次一部分,各包含該些影像畫面其中之一,且該音頻串流的各第一部分及各次一部分,各包含一音頻采樣計算數(shù)目。
14.如權(quán)利要求12的裝置,其特征在于,該音頻串流的第一部分及該音頻串流的次一部分,是根據(jù)該畫面速率及該采樣頻率所決定。
15.如權(quán)利要求10的裝置,其特征在于,該影像串流的該第一部分及該音頻串流的該第一部分對應(yīng)一第一區(qū)段時間,且該影像串流的該次一部分及該音頻串流的該次一部分對應(yīng)一次一區(qū)段時間。
16.如權(quán)利要求10的裝置,其特征在于,該處理器更于寫入該影像串流的該第一部分前,寫入該多媒體串流的一標頭。
17.如權(quán)利要求10的裝置,其特征在于,該處理器于寫入該影像串流的該先前部分及該音頻串流的該先前部分后,重復寫入該影像串流的一次一部分及該音頻串流的一對應(yīng)部分。
18.如權(quán)利要求10的裝置,其特征在于,各該影像串流的第一部分及各該影像串流的次一部分為一微區(qū)塊、一巨集區(qū)塊、一巨集區(qū)塊列、一切面以及一畫面其中之一。
19.一種用于播放一多媒體串流的方法,該多媒體串流包含一第一影像部分、一次一影像部分、一第一音頻部分、及一次一音頻部分,于該多媒體串流中,該第一影像部分及該第一音頻部分,較該次一影像部分及該次一音頻部分先到達,該方法包含下列步驟
(a)解碼該第一影像部分,以取得一第一解碼影像部分;
(b)解碼該第一音頻部分,以取得一第一解碼音頻部分;
(c)播放該第一解碼影像部分及該第一解碼音頻部分;
(d)于步驟(a)及步驟(b)后,解碼該次一影像部分以取得一次一解碼影像部分;
(e)于步驟(a)及步驟(b)后,解碼該次一音頻部分以取得一次一解碼音頻部分;以及
(f)于步驟(c)后,播放該次一解碼影像部分及該次一解碼音頻部分。
20.如權(quán)利要求19的方法,其特征在于,該影像串流的各該第一部分及該影像串流的各次一部分為一微區(qū)塊、一巨集區(qū)塊、一巨集區(qū)塊列、一切面以及一畫面其中之一。
21.一種用于播放一多媒體串流的裝置,該多媒體串流包含一第一影像部分、一次一影像部分、一第一音頻部分、及一次一音頻部分,該多媒體串流中該第一影像部分及該第一音頻部分,較該次一影像部分及該次一音頻部分先達到,該裝置包含
一處理器,適以解碼該第一影像部分以取得一第一解碼影像部分,解碼該第一音頻部分以取得一第一解碼音頻部分,播放該第一解碼影像部分及該第一解碼音頻部分,于針對該第一影像部分及該第一音頻部分解碼后,解碼該次一影像部分以取得一次一解碼影像部分,于解碼該第一影像部分及該第一音頻部分后,解碼該次一音頻部分以取得一次一解碼音頻部分,以及于播放該第一解碼影像部分及該第一解碼音頻部分后,播放該次一解碼影像部分及該次一解碼音頻部分。
22.如權(quán)利要求21的裝置,其特征在于,更包含
一緩沖器,用于暫時儲存該第一解碼音頻部分及該次一解碼音頻部分,該緩沖器的一容量小于該第一解碼影像部分的一容量及該次一解碼影像部分的一容量。
23.如權(quán)利要求21的裝置,其特征在于,各該影像串流的第一部分及次一部分為一微區(qū)塊、一巨集區(qū)塊、一巨集區(qū)塊列、一切面以及一畫面其中之一。
全文摘要
本發(fā)明提供用于編排及播放一多媒體串流的裝置及方法。該多媒體串流同時包含一影像串流與一音頻串流。該裝置用以寫入該影像串流的一第一部分以及寫入該音頻串流的一第一部分,其中該音頻串流的第一部分對應(yīng)于該影像串流的第一部分。此后,處理器亦寫入該影像串流的一次一部分及寫入該音頻串流的一次一部分至該檔案,其中該音頻串流的次一部分對應(yīng)于該影像串流的次一部分。緩沖器用以于音頻串流的第一部分及次一部分被寫入該檔案前暫時儲存之。所編排的多媒體串流可由資源有限的裝置進行播放。
文檔編號G11B27/031GK101483055SQ20081017678
公開日2009年7月15日 申請日期2008年11月18日 優(yōu)先權(quán)日2008年1月11日
發(fā)明者沈揚智, 黃浚菁 申請人:慧國(上海)軟件科技有限公司, 慧榮科技股份有限公司