專利名稱:影像壓縮方法
技術(shù)領(lǐng)域:
本發(fā)明是有關(guān)于一種影像壓縮方法,尤指一種將各式影音媒體轉(zhuǎn)換為3GP影像時,能夠確保影像轉(zhuǎn)換品質(zhì)、正確的顯示比例以及達到影像容量大小、占用頻寬的監(jiān)控的影像壓縮方法。
背景技術(shù):
在目前主力為2G(代)行動電話的市場中,行動電話的影音傳輸受限于傳輸頻寬及技術(shù)瓶頸,制作3GP影像的環(huán)節(jié)尚未受到重視,在3G行動電話即將崛起取代傳統(tǒng)2G通信之后,Nokia和Apple公司針對行動電話的使用環(huán)境、播放平臺制訂出適合手機播放的影像規(guī)格3GP,但是到目前為止,規(guī)格制訂出來了,卻沒有一套較為妥善、標(biāo)準的制作流程,傳統(tǒng)的使用技巧僅僅單純的將來源影像、聲音直接的匯入3GP的壓縮軟件內(nèi)。不進行任何的前置處理,因此壓縮出來的3GP常會面臨比例不正確、畫質(zhì)不佳、播放不流暢、無法正確播放的問題,誠屬美中不足之處。
發(fā)明內(nèi)容
為解決上述現(xiàn)有技術(shù)的缺點,本發(fā)明的主要目的是提供一種影像壓縮方法,以期在將各式影音媒體轉(zhuǎn)換為3GP影像時,能夠確保影像轉(zhuǎn)換品質(zhì)、正確的顯示比例以及達到影像容量大小、占用頻寬的監(jiān)控。
為達上述的目的,本發(fā)明的影像壓縮方法,其是應(yīng)用于可攜式裝置的影像壓縮及傳輸,包括下列步驟素材分離,將素材中的影音數(shù)據(jù)進行影像、音頻及字幕的分離;裁切及尺寸變更,將該影像數(shù)據(jù)進行裁切及尺寸變更,以得到每像素長寬正確顯示比例;幀速率變更,降低該影像數(shù)據(jù)的幀播放速率;素材重整,將裁切及變更后的影像數(shù)據(jù)與音頻及字幕予以重整;以及壓縮及傳輸,將重整后的影音數(shù)據(jù)壓縮后予以傳輸出去。
圖1為一示意圖,其繪示本發(fā)明一較佳實施例的影像壓縮方法的流程示意圖。
具體實施例方式
請參照圖1,其繪示本發(fā)明一較佳實施例的影像壓縮方法的流程示意圖。如圖所示,本發(fā)明的影像壓縮方法,其是應(yīng)用于可攜式裝置的影像壓縮及傳輸,例如但不限于第三代手機,且其傳輸速率是為128Kbps,其包括下列步驟素材分離,將素材中的影音數(shù)據(jù)進行影像、音頻及字幕的分離(步驟1);裁切及尺寸變更,將該影像數(shù)據(jù)進行裁切及尺寸變更,以得到每像素長寬正確顯示比例(步驟2);幀速率變更,降低該影像數(shù)據(jù)的幀播放速率(步驟3);素材重整,將裁切及變更后的影像數(shù)據(jù)與音頻及字幕予以重整(步驟4);以及壓縮及傳輸,將重整后的影音數(shù)據(jù)壓縮后予以傳輸出去(步驟5)。
于該步驟1中,該素材可為DVD、VCD或Flash等,其中包括影像、音頻及字幕數(shù)據(jù),在本步驟中將影像、音頻及字幕予以分離,以方便后續(xù)步驟的處理于該步驟2中,將分離出的該影像數(shù)據(jù)進行裁切及尺寸變更,以得到每像素長寬正確顯示比例;其中,每像素長寬的正確顯示比例是為1∶1。在本實施例中是以目前最易取得的素材『DVD』為例加以說明,但若變更其它不同類型媒體(比方說VCD、Flash.....etc),其操作方式雷同于本說明,但需依其顯示比例作適當(dāng)?shù)牟们屑俺叽缱兏纯伞R阅壳芭_灣電視播放的NTSC規(guī)格來說,雖然一般的電視都是以4∶3的方式呈現(xiàn),其所使用的影像解析為720*480,并非標(biāo)準640*480,這是因為每像素的顯示比例并非以標(biāo)準的1∶1的方式顯示。所以若要正確地在手機上顯示,應(yīng)當(dāng)先還原回正確的顯示比例。
以一般D1畫質(zhì)(720*480)要還原回VGA(640*480)顯示,首先需裁切左右兩側(cè)的8個像素(Pixel)的同步信號,以得到702*480,再使用最佳的尺寸變更(ReSize)的方式,將702*480變更尺寸為640*480,如此,便可得到每像素長寬1∶1的正確顯示比例。其中,該尺寸變更是使用Lanczos算法執(zhí)行尺寸變更。
此外,于該步驟2中進一步包括將640*480影像分辨率變更為587*480影像分辨率的步驟,以一般手機(圖未示)所制訂的顯示比例176*144而言,其長寬的比例是為1.222∶1,因此,適合壓縮手機影像的正確尺寸應(yīng)該為587*480,然要將640*480的尺寸變更為587*480,則左右兩側(cè)必須減去53個像素(Pixel),得到481*480影像分辨率,再將裁切完成的影像重新透過Lanczos算法變更尺寸成176*144,以得到最適合壓縮手機傳輸影像的比例及尺寸。其中,該Lanczos算法是為現(xiàn)有技術(shù),故在此不擬贅述。
于該步驟3中,一般電視可顯示連續(xù)動畫的原理是以每秒鐘連續(xù)播放約20幀(frame)以上的單張圖片,人類的視覺就會誤認為是動態(tài)的影像,而以目前電視NTSC的規(guī)格,播放的幀速率(Frame Rate)為每秒鐘30幀(30 Frames Per Sec.),但依據(jù)3GP的制訂規(guī)格,3GP的幀速率是為15FPS以下,因此,要將30FPS的速率變換為適合3GP影像的播放速率,就必須降低播放的幀速率,但若變更幀速率的方式不當(dāng),則影片播放速度會變得時快時慢,因此等比例地降低影像的播放幀速率才能維持影片播放的流暢度。
以3GP制訂的規(guī)格而言,將壓縮的播放率轉(zhuǎn)換為15FPS或是10FPS是較理想的播放速率。將30FPS的NTSC影片,以每兩幀抽除一幀方式進行幀轉(zhuǎn)換,可以得到15FPS的播放率,或以每三幀抽取兩幀的方式獲得10FPS的播放率。在本實施例中,是以每三幀抽取兩幀的方式獲得10FPS的播放率為例加以說明,但并非用以限制本發(fā)明的范疇。
于該步驟4中,將裁切及變更后的影像數(shù)據(jù)與音頻及字幕予以重整,以便進行后續(xù)步驟的壓縮。
于該步驟5中,將重整后的影音數(shù)據(jù)壓縮后予以傳輸出去;其中,影像的比特率(Bit Rate)一向都是決定影像品質(zhì)的主要關(guān)鍵,行動電話受限于傳輸頻寬,因此影像的比特率無法像DVD般高達將近10Mbps的比特率,甚至連VCD的1152Kbps的標(biāo)準也無法達到。以3G行動電話移動中的傳輸速率而言,僅限定最高比特率128Kbps,但是若想在傳輸中能夠更順利的播放以及降低影像在手機儲存卡中所占用的容量,那么就必須降低影像的比特率;然而,若貿(mào)然的降低影像比特率而不進行其它項目的調(diào)整,雖然仍可達成上述兩個目的,但畫質(zhì)會產(chǎn)生嚴重的衰退,甚至到無法觀賞的程度。
因此,理想的調(diào)整手段有以下幾項1.幀播放速率的改變,依據(jù)本發(fā)明步驟3中的方式,降低幀播放速率,例如將15FPS降低至10FPS,則在相同的畫質(zhì)條件下,約可節(jié)省約1/3的比特率及影像占用空間;2.壓縮前的前置調(diào)整,在進入3GP壓縮程序前,調(diào)整原始畫質(zhì)的亮度、對比、色相、飽和度,透過些微程度的調(diào)整,可在肉眼無法察覺的情況下減少因比特率降低而產(chǎn)生的馬賽克毛邊現(xiàn)象;3.二次通道壓縮(Two-Pass Encode),將影像的壓縮進行兩次,第一次對影像的動態(tài)數(shù)據(jù)進行分析,第二次執(zhí)行正式壓縮,因為有第一步驟針對畫質(zhì)的分析,因此在第二次壓縮時,可對畫質(zhì)的維持及容量進行更有效率的掌握;以及4.降低音頻的取樣頻率、壓縮比特率,除了影像之外,影響整體比特率和容量的還有聲音,以目前手機的播放品質(zhì)及揚聲設(shè)備而言,降低聲音的取樣及壓縮比特率并不會對觀賞產(chǎn)生影響。
為達到上述降低影像的比特率且不會影響影音數(shù)據(jù)的播放品質(zhì),本發(fā)明的壓縮及傳輸步驟(步驟5)進一步包括下列次步驟一壓縮前的前置調(diào)整步驟(步驟51);第一次通道壓縮分析(步驟52);降低音頻的取樣頻率、壓縮比特率步驟(步驟53);以及第二次通道壓縮(步驟54)。
其中于步驟51中,在進入壓縮前,先調(diào)整影像數(shù)據(jù)的亮度、對比、色相、飽和度,透過些微程度的調(diào)整,可在肉眼無法察覺的情況下減少因比特率降低而產(chǎn)生的馬賽克毛邊現(xiàn)象。
于步驟52中,通過由執(zhí)行第一次通道壓縮分析以第一次取得影像動態(tài)數(shù)據(jù)的分析。
于步驟53中,通過由降低音頻的取樣頻率、壓縮比特率以降低影音數(shù)據(jù)中的音頻的取樣及壓縮比特率并不會對影像觀賞產(chǎn)生影響。
于步驟54中,該第二次通道壓縮步驟依據(jù)步驟52中第一次信道壓縮分析的數(shù)據(jù)結(jié)果進行實質(zhì)的壓縮。
通過由上述次步驟,以達到降低影像的比特率且不會影響影音數(shù)據(jù)的播放品質(zhì)的目的。其中,于該二次通道壓縮步驟中可使用壓縮工具進行壓縮,例如但不限于Apple公司的QuickTime程序或Nokia公司的Multimedia Converter程序執(zhí)行數(shù)據(jù)的壓縮。
此外,本發(fā)明的影像壓縮方法其于該幀速率變更步驟(步驟3)之前進一步包括一去交錯的步驟(步驟21),其可將NTSC系統(tǒng)的交錯式影像信號變更為循序式掃描。在電視規(guī)格制訂時,因為技術(shù)瓶頸及制作成本的考量,所以采用交錯式的方法,每秒以60個圖場(field)組合成30個幀(Frame)(Non DropFrame)。因為每個圖場只有半個完整的畫面,因此在物體移動時,會出現(xiàn)抽絲的現(xiàn)象,而一般行動電話主要是以循序式掃瞄(Progressive),因此要先將電視播放的影像由交錯式變更為循序式掃瞄,這樣在壓縮成行動電話使用的影像時畫面才不會出現(xiàn)抽絲的現(xiàn)象,而圖場交錯的方式依各原始媒體于去交錯的圖場選擇,需針對不同的交錯方式來處理圖場,若圖場的處理方式選擇錯誤,會產(chǎn)生播放跳頓的現(xiàn)象,以一般DVD而言,幾乎都是奇圖場優(yōu)先。
所以,經(jīng)由本發(fā)明的實施,其將各式影音媒體轉(zhuǎn)換為3GP影像時,能夠確保影像轉(zhuǎn)換品質(zhì)、正確的顯示比例以及達到影像容量大小、占用頻寬的監(jiān)控,因此,確可改進現(xiàn)有影像壓縮方法的缺點。
本發(fā)明所揭示的,乃較佳實施例,舉凡局部的變更或修飾而于本發(fā)明的技術(shù)思想而為熟習(xí)該項技藝的人所易于推知的,俱不脫本發(fā)明的專利權(quán)范疇。
權(quán)利要求
1.一種影像壓縮方法,其是應(yīng)用于可攜式裝置的影像壓縮及傳輸,其特征在于,包括下列步驟素材分離,將素材中的影音數(shù)據(jù)進行影像、音頻及字幕的分離;裁切及尺寸變更,將該影像數(shù)據(jù)進行裁切及尺寸變更,以得到每像素長寬正確顯示比例;幀速率變更,降低該影像數(shù)據(jù)的幀播放速率;素材重整,將裁切及變更后的影像數(shù)據(jù)與音頻及字幕予以重整;以及壓縮及傳輸,將重整后的影音數(shù)據(jù)壓縮后予以傳輸出去。
2.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該素材是為DVD、VCD或Flash;而該可攜式裝置是為一第三代手機,且其傳輸速率是為128Kbps。
3.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該裁切及尺寸變更步驟中,每像素長寬的正確顯示比例是為1∶1。
4.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該裁切及尺寸變更的步驟中,其是將NTSC的720*480影像分辨率裁切左右兩邊各8個像素后得到702*480影像分辨率,再使用最佳的尺寸變更方式將702*480尺寸變更為640*480影像分辨率,以得到長寬1∶1的正確顯示比例。
5.如權(quán)利要求4所述的影像壓縮方法,其特征在于,進一步包括將640*480影像分辨率變更為587*480影像分辨率的步驟。
6.如權(quán)利要求5所述的影像壓縮方法,其特征在于,進一步包括將587*480影像分辨率裁切左右兩邊各53個像素后得到481*480影像分辨率,再使用最佳的尺寸變更方式將481*480尺寸變更為176*144影像分辨率的步驟。
7.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該裁切及尺寸變更步驟中,該尺寸變更是使用Lanczos算法執(zhí)行尺寸變更。
8.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該幀播放速率是為每秒鐘播放10個幀,其是將每秒30個幀的播放速度等比例的降低影像的播放幀速率以維持影像數(shù)據(jù)播放的流暢度。
9.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該壓縮及傳輸步驟中進一步包括一壓縮前的前置調(diào)整步驟;一第一次通道壓縮分析步驟;一降低音頻的取樣頻率、壓縮比特率步驟;以及一第二次通道壓縮步驟;其中,在該壓縮前的前置調(diào)整步驟中,在進入壓縮步驟前,調(diào)整影像數(shù)據(jù)的亮度、對比、色相、飽和度,透過些微程度的調(diào)整,可在肉眼無法察覺的情況下減少因比特率降低而產(chǎn)生的馬賽克毛邊現(xiàn)象;在該第一次通道壓縮分析步驟中,可將影像數(shù)據(jù)執(zhí)行第一次信道壓縮分析以第一次取得影像動態(tài)數(shù)據(jù)的分析;在該降低音頻的取樣頻率、壓縮比特率步驟中,可降低影音數(shù)據(jù)中的音頻的取樣及壓縮比特率并不會對影像觀賞產(chǎn)生影響;而在該第二次通道壓縮步驟中,其可依據(jù)該第一次通道壓縮分析步驟中分析所得的數(shù)據(jù)結(jié)果進行實質(zhì)的壓縮。
10.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該幀速率變更步驟的前進一步包括一去交錯的步驟,其可將NTSC系統(tǒng)的交錯式影像信號變更為循序式掃描,且其中該去交錯的步驟中是以奇圖場為優(yōu)先。
全文摘要
本發(fā)明是關(guān)于一種影像壓縮方法,其是應(yīng)用于可攜式裝置的影像壓縮及傳輸,包括下列步驟素材分離,將素材中的影音數(shù)據(jù)進行影像、音頻及字幕的分離;裁切及尺寸變更,將該影像數(shù)據(jù)進行裁切及尺寸變更,以得到每像素長寬正確顯示比例;幀速率變更,降低該影像數(shù)據(jù)的幀播放速率;素材重整,將裁切及變更后的影像數(shù)據(jù)與音頻及字幕予以重整;以及壓縮及傳輸,將重整后的影音數(shù)據(jù)壓縮后予以傳輸出去。
文檔編號H04N7/26GK1956541SQ20051011806
公開日2007年5月2日 申請日期2005年10月25日 優(yōu)先權(quán)日2005年10月25日
發(fā)明者黃翊證 申請人:影騰媒體科技股份有限公司