專利名稱:用于傳遞媒體信號(hào)的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本公開(kāi)涉及一種用于在源和目的裝置之間傳遞媒體信號(hào)的系統(tǒng)和方法。更為特別的,它涉及一種用于使用人工智能機(jī)制壓縮和解壓流式和靜態(tài)媒體數(shù)據(jù),以在源和目的裝置之間有效傳遞那些信號(hào)的系統(tǒng)和方法。
背景技術(shù):
隨著網(wǎng)絡(luò)的通信,比如互聯(lián)網(wǎng)的發(fā)展,呈指數(shù)式的出現(xiàn)了在彼此相隔較遠(yuǎn)的裝置之間有效傳遞流式和靜態(tài)媒體的性能的可觀的需要。近來(lái)也在世界范圍內(nèi)對(duì)這個(gè)需要投入了大量的開(kāi)發(fā)資源。
這里術(shù)語(yǔ)“媒體”意在表示從源裝置以信號(hào)的形式傳遞到目的裝置以由目的裝置使用的信息;并且,作為在這里使用的,通常期望媒體包括流式或靜態(tài)媒體信號(hào)。為了這個(gè)公開(kāi)的目的,作為應(yīng)用到目的裝置在媒體信號(hào)上的操作的術(shù)語(yǔ)“使用”意在包括播放(例如,聲音,圖像,視頻),處理(例如,遙測(cè)數(shù)據(jù)),或任意其它是媒體信號(hào)的有意的目的的使用或操作。
在這里,術(shù)語(yǔ)“流媒體”意在表示包括意在被傳遞到并且由目的裝置以暫時(shí)的,流式方式使用的媒體信號(hào)。在這里作為應(yīng)用到流媒體信號(hào)的術(shù)語(yǔ)“流式”意在包括在一定時(shí)間內(nèi)以連續(xù)方式傳遞和處理的信號(hào),或者可能是在一定時(shí)間內(nèi)以連續(xù)方式傳遞和處理的信號(hào)的信號(hào),或者是以一系列的被相互關(guān)聯(lián)并且可能之后由目標(biāo)裝置以連續(xù)的,相關(guān)聯(lián)的方式使用的離散分組、片斷、或模塊傳遞的信號(hào)。因此,用于這個(gè)公開(kāi)的流媒體的實(shí)例包括,但是不限于下面類型的媒體視頻,音頻,結(jié)合視頻的音頻,以及比如暫時(shí)遙測(cè)的數(shù)據(jù)串。術(shù)語(yǔ)“流媒體”通常由表示主題媒體的數(shù)字化形式的數(shù)據(jù)參考使用。
在這里,術(shù)語(yǔ)“靜態(tài)媒體”通常意在表示不是作為上面定義的“流式”的媒體。靜態(tài)媒體信號(hào)通常是被傳遞并且意在被作為分組,模塊或片斷使用的類型。因此,靜態(tài)媒體可能包括,但是不限于下面的離散圖像,單獨(dú)的和相關(guān)的暫時(shí)短視頻剪輯片段,聲音或聲音字節(jié),或者比如遙測(cè)信息的信息的片斷或模塊。但是,期望這樣的“單一片斷”的靜態(tài)媒體可能具有足夠的大小來(lái)包括多個(gè)更小的片斷或子部分,例如,整個(gè)圖像的區(qū)域或象素;和在一起可以形成視頻剪輯的單獨(dú)的幀;和在一起可以包括聲音的數(shù)字字節(jié),包括聲音字節(jié)的一組聲音,或者和在一起包括信息的較大的模塊的信息比特。
流媒體通常包括比靜態(tài)媒體文件要大得多的數(shù)據(jù)文件,并且還通常通過(guò)這種文件的暫時(shí)通信表示比大多數(shù)的靜態(tài)媒體文件所經(jīng)歷的要多得多的變化。因此,有效的壓縮流媒體用于適當(dāng)?shù)膫鬟f到目標(biāo)裝置以進(jìn)行使用的能力通常非常復(fù)雜,而且難于達(dá)到目的。因此,很多這種公開(kāi)通過(guò)特別參考流媒體通信提供,并且本發(fā)明也是要提供用于這種通信的顯著的益處。但是,在這里關(guān)于背景特別參考了流媒體,并且在此進(jìn)一步公開(kāi)關(guān)于很多關(guān)于本發(fā)明的益處,并且根據(jù)本領(lǐng)域中的一個(gè)也進(jìn)一步期望靜態(tài)媒體是適用的。
已經(jīng)有很多不同的“特定類型”的媒體系統(tǒng)在很長(zhǎng)時(shí)間內(nèi)用于在源和遠(yuǎn)程目標(biāo)之間發(fā)送特定類型(例如,視頻、音頻、圖像、語(yǔ)音等)流式和靜態(tài)媒體信號(hào)。這種特定類型的媒體系統(tǒng)的典型實(shí)例包括電視傳輸系統(tǒng)、電話線路系統(tǒng)、以及無(wú)線電傳輸系統(tǒng),并且因此每個(gè)電視、電話和無(wú)線電都是媒體的接收裝置。因此,用于有效傳遞流式和靜態(tài)媒體的需要也涉及到了很多不同的通信工業(yè),例如包括電話、電視、電影、音樂(lè),以及近來(lái)的互動(dòng)游戲工業(yè)。
另外,很多媒體通信系統(tǒng)(包括多種長(zhǎng)期存在的特定類型的系統(tǒng))通常也是“特定格式”的,其中以特殊格式傳遞主題媒體信號(hào),使得源、傳輸信道、以及目的裝置必須特別兼容以在那個(gè)格式下工作。這種特定格式的媒體系統(tǒng)的實(shí)例包括,例如,僅為確定類型的媒體工作并且僅以特別編碼的格式從電纜載體傳送的編碼電纜電視系統(tǒng)。因此,這些系統(tǒng)在硬件和軟件上通常僅專用于由內(nèi)容提供商提供的媒體的類型和格式。
社會(huì)的需要已經(jīng)超過(guò)了這些專用的,內(nèi)容特定和格式特定的系統(tǒng)的性能。特別的,沒(méi)有構(gòu)造這些專用系統(tǒng)來(lái)容納逐漸增加的客戶對(duì)于特定流媒體的實(shí)時(shí)需要。另外,近來(lái)互聯(lián)世界的技術(shù)發(fā)展引起了社會(huì)對(duì)于使用一個(gè)裝置以多個(gè)格式拉動(dòng)、接收、推動(dòng)以及發(fā)送多種類型的媒體的興趣。此外,需要內(nèi)容提供商能夠傳送很多不同媒體信號(hào)到很多在他們的客戶的辦公室、居室、以及手中的不同類型的裝置。個(gè)人和公司還需要使用多種不同格式和使用多種不同的各自的裝置彼此通信。
因此,出現(xiàn)了大量用于通過(guò)互聯(lián)網(wǎng)的集中型網(wǎng)絡(luò)傳送流式和靜態(tài)媒體的重要行業(yè)。內(nèi)容傳送公司當(dāng)前通過(guò)互聯(lián)網(wǎng),以視頻和音頻格式傳送很寬范圍的流媒體,包括實(shí)況賽馬以及醫(yī)學(xué)遙測(cè)和教育的提供。根據(jù)來(lái)自DFC情報(bào)機(jī)構(gòu)的一個(gè)公布的報(bào)告,2000年在互聯(lián)網(wǎng)上的視頻流增長(zhǎng)了215%,超過(guò)了總共9億的訪問(wèn)的流。這包括占據(jù)了總訪問(wèn)量大約29%的寬帶流。這個(gè)相同的報(bào)告還估計(jì)現(xiàn)有的流總量中大約15%在其中包括流內(nèi)廣告。在另一由互聯(lián)網(wǎng)研究者Jupiter Media Metrix公布的報(bào)告中,隨著公司在與雇員、客戶和其它商業(yè)伙伴的通信中轉(zhuǎn)向電子互動(dòng)形式,在流式視頻技術(shù)上花費(fèi)的費(fèi)用將從2000年的1.4億美元上升到2005年的將近30億美元。
此外,人口爆炸和在這些系統(tǒng)上人們發(fā)送的數(shù)量的增加也為對(duì)現(xiàn)有的可用信息的可用帶寬帶來(lái)很大影響。因此,使用有限的帶寬資源和有限的傳輸速度來(lái)有效傳遞流媒體的性能也變得越來(lái)越具有社會(huì)重要性。
壓縮/解壓算法(“CODECS”)考慮到用于傳遞不同類型的媒體的指數(shù)式增長(zhǎng)的需要,在很多年中開(kāi)發(fā)出了多種壓縮/解壓系統(tǒng)(“CODEC”),并且已經(jīng)成為近年來(lái)特別重要的研究和開(kāi)發(fā)。為包括(例如)比如圖形和照片的靜止幀圖像的特定類型的媒體和流媒體開(kāi)發(fā)了關(guān)于通信流式和靜態(tài)媒體信號(hào)的特定類型的CODECS和用于管理CODECS的系統(tǒng)。
圖像CODECS開(kāi)發(fā)了多種不同類型的靜態(tài)媒體CODECS,并且這些CODECS中的很多種已經(jīng)是已知的或正在使用的。一種特定類型的靜態(tài)媒體是受到特別關(guān)注的話題,其包括圖像(雖然,因?yàn)轱@著影響適當(dāng)?shù)膲嚎s/解壓需要的更為復(fù)雜的變量,例如,尺寸和幀之間的臨時(shí)關(guān)系的緣故,通常將較長(zhǎng)的關(guān)聯(lián)圖像幀序列,比如在視頻環(huán)境中的,作為流媒體)。因此,在這里通過(guò)參考確定的特定類型的現(xiàn)有圖像CODEC技術(shù)和方法示出靜態(tài)媒體CODEC的實(shí)例。
通??紤]用于圖畫(huà)(例如,藝術(shù)線條)和照片的各個(gè)標(biāo)準(zhǔn),已知兩種最常見(jiàn)的用于在萬(wàn)維網(wǎng)上的圖形圖像的文件格式是“GIF”和“JPEG”格式,并且為了進(jìn)一步理解的目的,在下面會(huì)結(jié)合其它圖像壓縮形式來(lái)進(jìn)行進(jìn)一步描述。
“JPEG”是“聯(lián)合圖象專家組”的首字母縮寫,并且是滿足ISO標(biāo)準(zhǔn)10918的圖形圖像文件。通常用于照片壓縮/解壓的,JPEG文件通過(guò)從壓縮質(zhì)量的范圍中選擇,或者,像在另外的描述中的,通過(guò)從一組壓縮算法中的一個(gè)選擇來(lái)創(chuàng)建。為了創(chuàng)建JPEG文件,或者從另一格式轉(zhuǎn)換到JPEG格式,必須指定所需要的特定圖像的質(zhì)量。通常,因?yàn)楦哔|(zhì)量的圖像會(huì)產(chǎn)生最大的文件,就像由用戶在圖像質(zhì)量和圖像大小之間選擇的,必須對(duì)此做出折衷。JPEG壓縮模式通常包括29個(gè)不同的編碼處理,雖然JPEG的實(shí)施者可能不會(huì)全部使用它們。通常給予JPEG圖像名稱后綴“jpg”。
“GIF”是“可交換的圖像文件格式”的首字母縮寫,并且通常被認(rèn)為是用于互聯(lián)網(wǎng)通信的圖畫(huà)圖像壓縮/解壓的實(shí)際上的標(biāo)準(zhǔn)形式。GIF格式使用已知為L(zhǎng)ZW算法的壓縮算法,該算法由Abraham Lempel,Jacob Ziv,和Terry Welch開(kāi)發(fā),并且由Unisys Corporation實(shí)現(xiàn)商業(yè)應(yīng)用(盡管通常公眾可以無(wú)需付費(fèi)許可來(lái)使用這種算法)。更為特別的,“LZW”壓縮算法需要每一給定長(zhǎng)度(例如,12比特)的輸入比特序列,并且在表中對(duì)特殊的位圖形創(chuàng)建入口,有時(shí)被稱為“字典”或“電報(bào)密碼本”。這個(gè)入口由圖形本身和一更短的碼組成。隨著讀取輸入,任意已經(jīng)被讀取的圖像引起更短的碼的置換,有效的壓縮了輸入的總量到更小的程度。已知為L(zhǎng)Z77和LZ78的更早的方法不包括作為壓縮的文件的一部分的查詢表。但是,當(dāng)前最新的LZW算法形式不在文件中包括表,并且當(dāng)它處理編碼的輸入時(shí),解壓文件用于觀看的解壓程序能夠自己來(lái)使用算法建立表。該GIF格式使用2D光柵數(shù)據(jù)類型(和使用光柵線的顯示屏相關(guān)聯(lián))并且以二進(jìn)制編碼。
GIF格式的兩種版本包括GIF87a,及已經(jīng)更新的GIF89a,其允許用于“動(dòng)態(tài)GIF”文件創(chuàng)建,或者在以順序播放來(lái)表現(xiàn)圖像的運(yùn)動(dòng)或變化(或者在無(wú)限循環(huán)中或者通過(guò)可以到達(dá)終點(diǎn)的進(jìn)程)的單一GIF文件中的更短的圖像序列。GIF89A還允許,并且還用于“交織的GIF”,其是首先作為圖像的模糊的輪廓達(dá)到接收者并由接收者播放,之后逐漸由七個(gè)連續(xù)波的比特流代替的GIF圖像,其中的比特流填滿缺少的線直到達(dá)到整個(gè)分辨率。交織的GIF允許(例如)使用14.4Kbps和28.8Kbps調(diào)制解調(diào)器的觀看者觀察到在處理主題圖像中的確定信息,比如做出決定(例如,點(diǎn)擊圖像來(lái)執(zhí)行比如鏈接的操作)之前的更短的等待時(shí)間。
通過(guò)呈現(xiàn)分辨率填滿圖像序列的波,交織的GIF類似于“前進(jìn)的JPEG”,其使用一組在連續(xù)的波中“漸顯(fade in)”的JPEG壓縮算法來(lái)描述創(chuàng)建的圖像。雖然通常認(rèn)為前進(jìn)的JPEG是在調(diào)制解調(diào)器連接速度上傳送圖像的更為常見(jiàn)的方式,具有更快的連接的用戶可能不會(huì)注意到區(qū)別。
近來(lái)為圖像壓縮開(kāi)發(fā)了“PNG”或“可移植的網(wǎng)絡(luò)圖形”格式,并且,及時(shí)發(fā)布來(lái)代替GIF格式用于互聯(lián)網(wǎng)使用(雖然JPEG格式通常不允許大小/質(zhì)量平衡)。為公眾的消費(fèi)和發(fā)展開(kāi)發(fā)了這個(gè)格式,類似于GIF,認(rèn)為PNG是“無(wú)損的”壓縮格式,并且因此當(dāng)在觀看過(guò)程中解壓壓縮的文件是保存了所有圖像信息。但是,PNG格式的文件通常意在比GIF格式多壓縮百分之10到30。提供PNG文件格式的另外的方面如下(i)可能不會(huì)將顏色透明度限制到一種顏色,而是可以控制透明度的程度(“不透明性”);(ii)相對(duì)于標(biāo)準(zhǔn)GIF改進(jìn)了圖像的“交織”;(iii)起動(dòng)了“伽馬校正”,允許按照特定顯示器制造者的需要關(guān)于顏色亮度“調(diào)諧”圖像;(iv)可以使用類似于GIF的真彩色,調(diào)色板和灰度級(jí)來(lái)保存圖像;以及(v)雖然通常認(rèn)為PNG可擴(kuò)展并且由此可以將軟件分層來(lái)提供用于這種編寫的圖像動(dòng)態(tài),但是通常不支持“動(dòng)態(tài)”。
“TIFF”是“標(biāo)簽圖像文件格式”的首字母縮寫,并且是用于在應(yīng)用程序之間交換光柵圖形(或“比特地圖”)圖像,例如,用于掃描儀圖像的圖形的通常格式。通常給予TIFF文件后綴“TIF”或“TIFF”,并且通常具有在1980年代中期開(kāi)發(fā)的Adobe軟件、微軟(Microsoft)、和惠普(Hewlett-Packard)的支持。TIFF文件可以是任意的一些種類,包括灰度級(jí)、顏色調(diào)色板或RGB完全顏色,其描述和差別將在本公開(kāi)的這里的其它地方進(jìn)一步涉及。TIFF文件還包括具有JPEG、LZW或CCITT組4標(biāo)準(zhǔn)游程長(zhǎng)度圖像壓縮的文件,也會(huì)將其在這里的其它地方進(jìn)一步描述。作為一種最為常用的圖形圖像格式,通常在桌面出版、傳真、3-D應(yīng)用、以及醫(yī)學(xué)攝像應(yīng)用中使用TIFF文件。視頻CODECS視頻壓縮是用于多種應(yīng)用,包括(例如)預(yù)記錄視頻(例如,“視頻點(diǎn)播”)、電信會(huì)議、和實(shí)況視頻(例如,廣播)的熱烈發(fā)展的主題。“桌上型”計(jì)算機(jī)、無(wú)線裝置、現(xiàn)有的電視、以及高清晰度電視是有效的視頻壓縮系統(tǒng)必須服務(wù)的不同類型的接收裝置的實(shí)例。
通常,視頻CODEC算法操作在單獨(dú)的一幀一幀的基礎(chǔ)上,和/或者“暫時(shí)壓縮”的基礎(chǔ)上,或者操作在兩者上,其中每一幀是在現(xiàn)有的使用中的最常見(jiàn)的視頻壓縮算法,基于一些數(shù)學(xué)原理,包括下面的離散余弦變換(“DCT”),小波變換(wavelet transform)和純分形(pure Fractals)。
“離散余弦變換”或“DCT”是到目前位置最為流行的用于圖像壓縮應(yīng)用的變換。通常,DCT是用于將波形數(shù)據(jù)表示為余弦的加權(quán)和的技術(shù)。DCT類似于離散傅立葉變換它將來(lái)自空間域的信號(hào)或圖像轉(zhuǎn)換到頻域。DCT幫助將圖像分離為不同重要性(關(guān)于圖像的視覺(jué)質(zhì)量)的部分(或光譜子帶)。它流行的原因不僅僅包括用于通常圖像的關(guān)于能量緊縮的良好表現(xiàn),還包括一些快速算法的可用性。在兩個(gè)國(guó)際性的圖像/視頻壓縮標(biāo)準(zhǔn)JPEG和MPEG中使用DCT。
“小波變換”通常是將信號(hào)數(shù)據(jù)轉(zhuǎn)換為一組數(shù)學(xué)表示的數(shù)學(xué)算法,并且數(shù)學(xué)表示之后可以由目標(biāo)接收器裝置解碼,例如,以類似于傅立葉變換的方式。通常認(rèn)為小波可以提高弱信號(hào)從噪聲中的恢復(fù)能力,并且由此增強(qiáng)以這種方式處理的圖像,同時(shí)不會(huì)顯著的模糊或混合細(xì)節(jié)。為了這個(gè)原因,特別將小波信號(hào)處理應(yīng)用到醫(yī)學(xué)應(yīng)用中的X射線和磁共振圖像。在互聯(lián)網(wǎng)通信中,相比其它現(xiàn)有方法通??梢赃_(dá)成的程度,使用小波可以將圖像壓縮到更大的程度。在一些情況中,小波壓縮的圖像可以小到使用更為常見(jiàn)的JPEG格式壓縮的具有相同質(zhì)量的圖像的大約25%的大小,其將在本公開(kāi)的其它地方更詳細(xì)的描述。這樣,例如,需要200KB并且花費(fèi)一分鐘來(lái)下載的JPEG格式照片,對(duì)于小波壓縮的格式來(lái)說(shuō),可能僅需要50KB和花費(fèi)15秒來(lái)下載。通常給予小波壓縮的圖像文件后綴“WIF”,并且或者接收器(例如,在計(jì)算機(jī)接收器上的互聯(lián)網(wǎng)瀏覽器)必須支持這個(gè)特定格式的文件,或者需要插入式程序來(lái)讀取這個(gè)文件。
分形圖像壓縮是有損圖像編碼的一種現(xiàn)代技術(shù),其相比現(xiàn)有的傅立葉序列壓縮方案提供了一些改進(jìn)。因?yàn)楫?dāng)在作為階梯函數(shù)模擬時(shí)改進(jìn)了邊緣描繪,邊緣需要大量關(guān)于合適的描繪的傅立葉序列項(xiàng)。分形的其它優(yōu)點(diǎn)包括快速的解碼時(shí)間和縮放獨(dú)立性。分形壓縮基于Mandelbrot設(shè)置,其具有自相似、縮放比例相關(guān)、自然的統(tǒng)計(jì)特性等優(yōu)點(diǎn)(Mandelbrot,1983)。分形壓縮和解壓包括聚類方法,以獨(dú)立于旋轉(zhuǎn)和縮放比例找到示出了和樣本區(qū)域相同的特征的區(qū)域。分形圖像將圖像壓縮為遞歸方程并且說(shuō)明怎樣再現(xiàn)它們。該方程描述關(guān)于在它的分量之間的關(guān)系的圖像。在存儲(chǔ)需求方面的降低是因?yàn)榉中螇嚎s保存方程和指令,而不是保存圖像的象素這個(gè)事實(shí)的緣故。
“MPEG”是運(yùn)動(dòng)圖象專家組的首字母縮寫并且在使用上和從那里公布的確定的展開(kāi)視頻和音頻壓縮標(biāo)準(zhǔn)同義。通常,為使用MPEG視頻文件,個(gè)人計(jì)算機(jī)需要具有足夠的處理器速度、內(nèi)部存儲(chǔ)器和硬盤空間來(lái)處理并播放通常很大的MPEG文件,通常給予其名稱后綴“.mpg”。在客戶系統(tǒng)上必須具有播放MPEG文件的特定的MPEG觀賞器和客戶軟件,并且通??梢詮脑诰W(wǎng)上的很多站點(diǎn)下載商用MPEG播放器的共享件或版本。在這里,用于MPEG格式媒介的操作模式將通過(guò)參考這些下述的連續(xù)發(fā)展的標(biāo)準(zhǔn)進(jìn)行描述。
更為特別的,MPEG-1標(biāo)準(zhǔn)指定用于編碼通常在大約1.5Mbps的傳輸率的順序的視頻。這通常是指定用于Video-CD和CD-I媒體的特定應(yīng)用。MPEG-1音頻層-3(“MP3”)也是從早期的MPEG工作中發(fā)展出的?!癕PEG-2”是通常指定用于編碼在4Mbps的傳輸率以上的交織文件的標(biāo)準(zhǔn),并且通常意在用于數(shù)字TV廣播和數(shù)字多功能光盤。雖然,通常認(rèn)為很多MPEG-2播放器也可以處理MPEG-1數(shù)據(jù),并不認(rèn)為相反的也是正確的,而且MPEG-2編碼的視頻通常和MPEG-1播放器不可兼容。另一個(gè)改進(jìn)的標(biāo)準(zhǔn)“MPEG-3”也被提出用于高清晰度電視(“HDTV”),即使通常MPEG-3混合了認(rèn)為已經(jīng)達(dá)到HDTV需要的MPEG-2。最后,最近開(kāi)發(fā)了“MPEG-4”標(biāo)準(zhǔn),并且其意在提供更為有志向的標(biāo)準(zhǔn)來(lái)解決語(yǔ)音和圖像合成、分形幾何學(xué)以及計(jì)算機(jī)可視化,并且進(jìn)一步將其公開(kāi)來(lái)為了重新構(gòu)建圖像而結(jié)合人工智能。
MPEG-1和MPEG-2標(biāo)準(zhǔn)定義了用于以從25∶1到50∶1的不同的因數(shù)壓縮數(shù)字視頻的技術(shù)。這個(gè)根據(jù)這些標(biāo)準(zhǔn)達(dá)成的壓縮通常使用五種不同的壓縮技術(shù)(i)基于頻率變換的離散余弦變換(DCT);(ii)“量化”,其是用于有損選擇性信息的技術(shù),例如,有損的預(yù)測(cè),其中以在該圖像前面和后面的相鄰的圖像的畫(huà)面預(yù)測(cè)一些圖像。
可由商業(yè)性渠道獲得的視頻壓縮技術(shù)的更為詳細(xì)的實(shí)例包括微軟的媒體播放器(Microsoft Media PlayerTM)(可從微軟公司獲得),RealPlayerTM或RealSystem G2TM(可從Real NetworksTM購(gòu)買獲得),Apple’s QuicktimeTM(可從SorensonTM購(gòu)買獲得);以及“VDO”。通常認(rèn)為微軟媒體播放器是應(yīng)用CODEC的MPEG標(biāo)準(zhǔn)用于壓縮/解壓,然而其它的播放器聲稱使用CODECS的專有類型。標(biāo)準(zhǔn)的壓縮算法,比如MPEG4,使得建立用于企業(yè)流、安全性或類似性能的嵌入式系統(tǒng)的開(kāi)發(fā)者可以有辦法獲得并掌握它們。
近來(lái)的通過(guò)無(wú)線或IP網(wǎng)絡(luò)來(lái)提供流式視頻解決方案的工作的一個(gè)實(shí)例由名為Emblaze Systems(LSE:BLZ)的公司公布。這個(gè)公司公開(kāi)了意在用于在任意平臺(tái)PC、PDA、視頻手機(jī)和互動(dòng)式TV上編碼和回放實(shí)況和視頻點(diǎn)播消息和內(nèi)容的確定的技術(shù)。該Emblaze System被認(rèn)為就是先前的GEO交互式媒體組。接下來(lái)公布的國(guó)際專利申請(qǐng)公開(kāi)了確定的流媒體壓縮技術(shù),其被認(rèn)為和Emblaze System相關(guān),且所稱的GEO交互式媒體組作為“受讓人”W09731445到Carmel et al.;以及W09910836到Carmel。在這里將這些參考的公開(kāi)整體的完全包括并且作為參考。
另一公布了意在改進(jìn)用于無(wú)線應(yīng)用的流媒體通信的CODEC技術(shù)的公司是Packetvideo公司TM,更為特別的,該技術(shù)意在將流式視頻傳遞到蜂窩電話。另外,為了保護(hù)視頻和音頻流不受無(wú)線環(huán)境中的損害,它們認(rèn)為應(yīng)該提升CODEC技術(shù),意在跟蹤臨時(shí)可量測(cè)性和預(yù)示誤碼抵抗力。給Lengwehasatit的美國(guó)專利No.6,167,092進(jìn)一步公開(kāi)了確定的流媒體壓縮/解壓縮技術(shù)的實(shí)例,其被認(rèn)為在這個(gè)專利參數(shù)的首頁(yè)上與稱為“受讓人”的Packetvideo相關(guān)。在這里全部包括有這個(gè)專利參考文獻(xiàn)的公開(kāi)并將其作為參考。
另一先前的參考文獻(xiàn)公開(kāi)了CODEC技術(shù),其意在提供一種低成本、連續(xù)自適應(yīng)的數(shù)字視頻系統(tǒng)和方法,以壓縮用于移動(dòng)圖像的彩色視頻數(shù)據(jù)。這個(gè)方法包括捕捉模擬視頻幀并且將圖像數(shù)字化,成為用于使用獨(dú)特的有損和無(wú)損數(shù)字組合進(jìn)行壓縮的優(yōu)選的源輸入格式。
另一先前的參考文獻(xiàn)公開(kāi)了意在提供低成本、連續(xù)自適應(yīng)的數(shù)字視頻系統(tǒng)和方法,用于壓縮用于移動(dòng)圖像的彩色視頻數(shù)據(jù)的CODEC技術(shù)。這個(gè)方法包括捕捉模擬視頻幀并且將數(shù)字化圖像成為用于使用不同的有損和無(wú)損數(shù)字壓縮技術(shù)的組合進(jìn)行壓縮的優(yōu)選的源輸入格式,其中數(shù)字壓縮技術(shù)包括子帶編碼、小波變換、運(yùn)動(dòng)檢測(cè),游程長(zhǎng)度編碼和可變長(zhǎng)度編碼。該系統(tǒng)包括編碼器和解碼器(CODEC)部分,通常公開(kāi)其使用“Huffman”編碼器,以壓縮并解壓視覺(jué)圖像來(lái)提供高壓縮率,從而意在提供良好到優(yōu)秀的視頻質(zhì)量。壓縮的視頻數(shù)據(jù)提供基本視頻層和另外的以壓縮的數(shù)字音頻多路復(fù)用的視頻數(shù)據(jù)層,以提供數(shù)據(jù)流,其中將該數(shù)據(jù)流分組以通過(guò)包括局域或廣域上的無(wú)線網(wǎng)絡(luò)的互聯(lián)網(wǎng)或內(nèi)部網(wǎng)分配。通過(guò)響應(yīng)于比較數(shù)據(jù)信道上的可用帶寬和用于先前幀的信道上的可用帶寬,公開(kāi)的CODEC系統(tǒng)意在一幀一幀的持續(xù)調(diào)整數(shù)字圖像幀的壓縮,從而提供和網(wǎng)絡(luò)傳輸信道的可用帶寬以及和客戶用戶端的接收器資源性能相當(dāng)?shù)妮敵鰯?shù)據(jù)流??赡苓M(jìn)一步通過(guò)調(diào)整輸出數(shù)據(jù)流的幀速率來(lái)調(diào)整壓縮。
另外的更詳細(xì)的意在至少部分用在流式視頻通信中的CODEC系統(tǒng)的實(shí)例在下面的美國(guó)專利Nos.6,081,295到Adolph et al.;6,091,777到Guetz et al.;6,130,911到Lei;6,173,069B1到Daly et al.;6,263,020B1到Gardos et al.;6,272,177到Murakami et al.;以及6,272,180 B1到Lei中公開(kāi)。在這里將這些參考的公開(kāi)全文引入并且作為參考。
在這種CODECS中,即使不是全部,至少大部分先前的流式視頻壓縮方法使用極其復(fù)雜的數(shù)學(xué)工具以及一些微妙變化來(lái)在所有類型的公共和私人網(wǎng)絡(luò)上實(shí)現(xiàn)“一個(gè)適合所有尺寸”的視頻,該網(wǎng)絡(luò)包括從超低帶寬的網(wǎng)絡(luò)(諸如在無(wú)線網(wǎng)絡(luò)中所發(fā)現(xiàn)的)到衛(wèi)星通信到超高速光纖安裝。在多種現(xiàn)有的壓縮方法中,通常有用戶可定義的參數(shù),其包括圖像大小、幀比率、顏色深度、對(duì)比度、亮度、感受到的幀質(zhì)量、緩沖長(zhǎng)度等的平衡。另外,在算法本身的內(nèi)部,有很多非用戶可以定義的量和加權(quán)計(jì)算。這需要開(kāi)發(fā)者以一個(gè)“通用”重要性一次性的設(shè)置它們,并且之后封裝并運(yùn)輸產(chǎn)品。
但是,雖然視頻流市場(chǎng)繼續(xù)快速發(fā)展,全世界并不會(huì)選擇一個(gè)用于壓縮的標(biāo)準(zhǔn),因?yàn)闆](méi)有一個(gè)對(duì)于所有視頻源、目標(biāo)和傳輸形式都很理想的算法。雖然第一CODEC可能對(duì)于一種類型的信號(hào)是最好的,或?qū)τ谛盘?hào)的第一部分(例如,包括一系列幀的幀或場(chǎng)景)是最好的,另一第二CODEC可能對(duì)于另一類型的信號(hào),或甚至是相同信號(hào)的第二部分是最好的。此外,一個(gè)CODEC可能最適于壓縮/解壓在通信網(wǎng)絡(luò)中的發(fā)送、接收和傳輸裝置中的特殊的流式信號(hào);對(duì)于相同的,但是具有另一組通信裝置參數(shù)的流媒體信號(hào),相比第一CODEC,另一第二CODEC可能更加合適。例如,一些視頻流可能傳送顏色到手持裝置,而且其它視頻流在到手機(jī)的黑白傳輸中可能在象素?fù)p失方面具有優(yōu)勢(shì)從而可以增加幀比率。所需的聲音質(zhì)量、幀比率、清晰度以及緩沖公差都會(huì)明顯的影響在多個(gè)平臺(tái)上的用于最優(yōu)化視頻和音頻傳送的壓縮算法的選擇。
事實(shí)上,確定的通信裝置參數(shù)可能在流媒體傳輸中十分短暫,使得對(duì)于一組最初參數(shù)的開(kāi)始合適的CODEC,因?yàn)槟切﹨?shù)在相同流式信號(hào)傳輸過(guò)程中的變化而變得不如另一CODEC有效。這種短暫的參數(shù)的實(shí)例包括,但是不限于,在數(shù)據(jù)傳輸信道中的可用帶寬,可用存儲(chǔ)器和在發(fā)送或接收裝置中的處理能力,以及在接收裝置中的專用顯示分辨率/窗口(例如,在屏幕上的最小化窗口)。隨著這些一個(gè)CODEC和另一不同因素的不同組合的大量反復(fù),這些問(wèn)題的復(fù)雜程度也呈指數(shù)上升,并且上述的因素是對(duì)于沿著特別的通信裝置系統(tǒng)壓縮,解壓和傳送特定流媒體信號(hào)最為有效的。
因?yàn)镃ODEC系統(tǒng)是“特定格式”的,必須“預(yù)先設(shè)置”源和目的裝置來(lái)在彼此之間根據(jù)通用的、特定的壓縮/解壓形式傳遞媒體信號(hào),而且必須使用代碼轉(zhuǎn)換機(jī)。但是,即使使用了現(xiàn)有的代碼轉(zhuǎn)換機(jī),通常不考慮通信系統(tǒng)中的約束條件(例如,源、傳輸信道、目的裝置),而且通信可能出現(xiàn)嚴(yán)重的故障。為了進(jìn)一步說(shuō)明的目的,圖1A和1B示出了兩個(gè)用于在源110-120和目的裝置130-140之間傳遞媒體的不同的現(xiàn)有方法的不同方案圖示。這些示圖特別示出了流式視頻通信,即使可由類似的系統(tǒng)表示其它媒體形式。
可以看到通常為特定應(yīng)用修改CODEC算法,并且之后在有限的實(shí)例上比類似未修改的設(shè)置更好的執(zhí)行。但是,這通常必須對(duì)一系列的幀、或者理想的、對(duì)于每一單獨(dú)的幀進(jìn)行。對(duì)于發(fā)生的在較高的分辨率和較低的感受到的質(zhì)量的每一幀,一些基于DCT的算法具有多達(dá)二十億的數(shù)學(xué)操作。對(duì)于一般機(jī)械來(lái)說(shuō)這個(gè)數(shù)字太大,即使對(duì)商業(yè)性的服務(wù)器,在一秒內(nèi)也只能執(zhí)行三十到六十次。這也是專用壓縮板或ASIC出現(xiàn)的原因。
音頻CODECS除了近來(lái)公眾對(duì)改進(jìn)視頻壓縮的興趣,音頻壓縮同樣也成為大量用于多種實(shí)況或預(yù)記錄應(yīng)用的工作的話題,其中包括音頻廣播、音樂(lè)和視頻同步的傳輸、實(shí)況互動(dòng)語(yǔ)音(例如,電話)。這些音頻壓縮應(yīng)用中的任意和全部必須可以和廣泛的客戶端的接收器/播放器、比如大量具有多種性能和操作參數(shù)的手持或桌上型裝置兼容,現(xiàn)有的音頻CODECS通常包括幾種不同類型,在下面將為了說(shuō)明的目的大致的概括其中幾個(gè)。
“碼激勵(lì)線性預(yù)測(cè)”或“CELP”是一使用波形的語(yǔ)音壓縮方法的類型CODECS,其中的波形CODEC在激勵(lì)濾波器架構(gòu)中使用“分析—合成”或“AbS”以進(jìn)行目標(biāo)信號(hào)的波形匹配?;贑ELP的CODEC近來(lái)發(fā)展為用于高質(zhì)量語(yǔ)音壓縮的主要技術(shù),并且已經(jīng)被公布以在最低大約6kbps的數(shù)據(jù)速率發(fā)射長(zhǎng)途電話質(zhì)量的壓縮的語(yǔ)音。但是,至少一個(gè)出版物公開(kāi)了CELP編碼語(yǔ)音的質(zhì)量在/或低于4kbps的比特率上嚴(yán)重下降。
“聲碼器”是不基于波形編碼方案的語(yǔ)音CODEC,但是還是使用目標(biāo)輸入語(yǔ)音的量化的參數(shù)描述來(lái)合成重新構(gòu)建的輸出語(yǔ)音。公開(kāi)了聲碼器在低比特率傳送更好的語(yǔ)音質(zhì)量,比如在大約4kbs,并且開(kāi)發(fā)其用于這種應(yīng)用。低比特率的聲碼器使用語(yǔ)音講話的特性和用于講話分析、編碼和合成的平穩(wěn)的非語(yǔ)音講話的“類噪聲(noise-like)”特性。一些更早版本的聲碼器(例如,聯(lián)邦標(biāo)準(zhǔn)1015 LPC-10)使用時(shí)域分析和合成方法。但是,大部分最近的版本,至少一個(gè)出版物標(biāo)注為“諧波編碼器“,其使用用于發(fā)出的語(yǔ)音分段的諧波譜模型。
雖然描述了先前的某些特定語(yǔ)音壓縮技術(shù),由工業(yè)機(jī)構(gòu)開(kāi)發(fā)并由工業(yè)機(jī)構(gòu)和非盈利組織管理大量語(yǔ)音CODEC并作為標(biāo)準(zhǔn)。這些組織的實(shí)例包括,但是不限于下面的歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)(“ETSI”),電氣和電子工程師協(xié)會(huì)(“IEEE”);以及國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)化部分(“ITU-T”),也就是早前的“CCITT”,并且它們的標(biāo)準(zhǔn)通常用作CODEC的參考類型。
一個(gè)最近公開(kāi)的用于語(yǔ)音的混合編碼的方法和設(shè)備指定在4kbps,其編碼用于傳遞到解碼器以進(jìn)行語(yǔ)音再現(xiàn)的語(yǔ)音,其中將語(yǔ)音信號(hào)分為三個(gè)類型(i)穩(wěn)定狀態(tài)發(fā)聲的或“諧音的”;(ii)固定非發(fā)聲的;以及(iii)“短時(shí)間的”或“過(guò)渡的”語(yǔ)音。特別類型的編碼方案用于每一類。諧音的編碼用于穩(wěn)定狀態(tài)發(fā)聲的講話,“類噪聲”編碼用于固定的非發(fā)聲語(yǔ)音,并且特定編碼模式用于過(guò)渡式講話,指定來(lái)捕捉位置、結(jié)構(gòu),以及表現(xiàn)語(yǔ)音的過(guò)渡部分的特色的本地時(shí)間事件的強(qiáng)度。意在將壓縮方案應(yīng)用到語(yǔ)音信號(hào)或LP殘留信號(hào)。
另一近來(lái)公開(kāi)的用于添加新的語(yǔ)音編碼方法到現(xiàn)有的電信系統(tǒng)的方法和裝置也將在下面概括。為了在系統(tǒng)中并行使用“新的”CODEC和“舊的”CODEC,將CODEC引入數(shù)字電信系統(tǒng)的語(yǔ)音發(fā)射收發(fā)機(jī)。通過(guò)實(shí)現(xiàn)在收發(fā)機(jī)之間的信號(hào)交換過(guò)程選擇CODEC,其中在所有收發(fā)機(jī)和在連接的電信系統(tǒng)中的先前使用的收發(fā)機(jī)中實(shí)現(xiàn)語(yǔ)音編碼方法。在每一連接的開(kāi)始使用信號(hào)交換。在開(kāi)始電話呼叫并且在切移之后,該方法檢查雙方是否能使用新的語(yǔ)音編碼。其所選擇的交換消息使得它們?cè)谡Z(yǔ)音質(zhì)量上的效果最小,并且還使得識(shí)別該消息的可能性最大。
再一個(gè)近來(lái)的相關(guān)參考文件公開(kāi)了意在用于語(yǔ)音壓縮的用于級(jí)聯(lián)的CODEC的可調(diào)可感加權(quán)濾波器。可以調(diào)諧特定的濾波器參數(shù)來(lái)提供級(jí)聯(lián)情況的改進(jìn)的性能。更為特別的,使用的參數(shù)是第十階的LPC預(yù)測(cè)器系數(shù)。這個(gè)系統(tǒng)被特定于使用“低延時(shí)激勵(lì)線性預(yù)測(cè)”CODEC或“LD-CELP”。
就像根據(jù)剛剛描述的實(shí)例的另一個(gè)使用CODEC的流式音頻通信系統(tǒng)的詳細(xì)的實(shí)例在下面的US專利參考文件6,144,935到Chen et al.;6,161,085到Haavisto et al.;以及6,233,550到Gersh中提供,并且在這里完全引入這些參考文件的公開(kāi)并作為參考。具有CODEC的人工智能(“AI”)和神經(jīng)網(wǎng)絡(luò)近來(lái)公開(kāi)了多種意在結(jié)合人工智能(“AI”)或神經(jīng)網(wǎng)絡(luò)和流媒體信號(hào)的壓縮和解壓的系統(tǒng)和方法。
術(shù)語(yǔ)“人工智能”在這里意在表示由計(jì)算機(jī)系統(tǒng)進(jìn)行的人類智能的模擬,包括學(xué)習(xí)(獲得用于使用信息的信息和規(guī)則),推理(使用規(guī)則來(lái)達(dá)成大致或精確的結(jié)論),以及自我修正。AI的特別的應(yīng)用包括“專家系統(tǒng)”,其是一種計(jì)算機(jī)程序,其模擬在特別領(lǐng)域中具有專家級(jí)知識(shí)和經(jīng)驗(yàn)的組織或個(gè)人的判斷及行為。通常,專家系統(tǒng)包括對(duì)于每一向程序描述的特別的形勢(shì)的知識(shí)基礎(chǔ),并且可以通過(guò)添加知識(shí)基礎(chǔ)或某組規(guī)則來(lái)進(jìn)行加強(qiáng)。
術(shù)語(yǔ)“神經(jīng)網(wǎng)絡(luò)”在這里意在表示接近人類大腦操作的程序和數(shù)據(jù)系統(tǒng),通常包括大量并行操作的處理器,每一都具有它自己的小知識(shí)范圍并且在它的本地存儲(chǔ)器中的存取數(shù)據(jù)。通常,首先將大量關(guān)于數(shù)據(jù)關(guān)系的數(shù)據(jù)和規(guī)則送入神經(jīng)網(wǎng)絡(luò),之后程序可以告訴網(wǎng)絡(luò)怎樣表現(xiàn)來(lái)響應(yīng)外部激勵(lì)(例如,輸入信息)。在做出這個(gè)決定的過(guò)程中,神經(jīng)網(wǎng)絡(luò)使用一些原理,包括但是不限定于基于梯度的訓(xùn)練和模糊邏輯??梢赃M(jìn)一步以知識(shí)層來(lái)描述神經(jīng)網(wǎng)絡(luò),并且通常是具有包括更深層的更復(fù)雜的網(wǎng)絡(luò)。在“前饋”神經(jīng)網(wǎng)絡(luò)系統(tǒng)中,可以將學(xué)到的關(guān)于數(shù)據(jù)的關(guān)系“前饋”到更高層的知識(shí)。神經(jīng)網(wǎng)絡(luò)還可以學(xué)習(xí)臨時(shí)概念,并且將其廣泛的用在信號(hào)處理和時(shí)序分析中。其它公開(kāi)的神經(jīng)網(wǎng)絡(luò)的應(yīng)用包括石油探測(cè)數(shù)據(jù)分析、天氣預(yù)報(bào)、生物實(shí)驗(yàn)中的核苷序列的解釋,以及思想和意識(shí)的模型的開(kāi)發(fā)。
術(shù)語(yǔ)“模糊邏輯”在這里意在表示基于“真實(shí)度”而不是“Boolean邏輯”的計(jì)算方法,其中的“Boolean邏輯”僅在真/假(或“二進(jìn)制的,如1或0)的領(lǐng)域內(nèi)操作。模糊邏輯首先由加州大學(xué)伯克利的Dr.LotfiZadeh在1960年代提出,關(guān)于計(jì)算機(jī)理解自然語(yǔ)言的問(wèn)題方面的工作,其中的自然語(yǔ)言不能被很容易的翻譯為絕對(duì)的Boolean邏輯術(shù)語(yǔ)。模糊邏輯通常包括0和1作為真值的極端情況的情況,但是還包括多種在真值之間(例如,確定狀態(tài)在一些閾值,比如0.98,可以幫助做出決定來(lái)分配1給在操作中的可接受的低錯(cuò)誤發(fā)生率)的多種狀態(tài)。
一個(gè)先前公開(kāi)的流媒體壓縮/解壓系統(tǒng)的實(shí)例意在通過(guò)神經(jīng)網(wǎng)絡(luò)使用人工智能,其為了壓縮比如視頻數(shù)據(jù)的數(shù)據(jù)而使用Radon變換。一些先前公開(kāi)的AI和/或神經(jīng)網(wǎng)絡(luò)系統(tǒng)意在使用AI和/或神經(jīng)網(wǎng)絡(luò)用于在使用確定的特定無(wú)損壓縮CODECS過(guò)程中的錯(cuò)誤檢測(cè)的目的。例如,采用學(xué)習(xí)系統(tǒng)來(lái)確定接收器在壓縮和傳輸之后所接收到的和預(yù)測(cè)在傳輸終點(diǎn)處所接收到的之間的差別。在學(xué)習(xí)更改CODEC用于另外的傳輸?shù)恼{(diào)整時(shí)處理此差別。
公開(kāi)的方法和裝置的另一實(shí)例意在為了隱藏?cái)?shù)字語(yǔ)音幀誤差而外插用于插入丟失的數(shù)據(jù)段的過(guò)去的信號(hào)歷史數(shù)據(jù)。外插方法使用存儲(chǔ)在緩沖器中的過(guò)去的信號(hào)歷史。以公開(kāi)來(lái)使用有限脈沖響應(yīng)(“FIR”)的、多層、前饋的人工神經(jīng)網(wǎng)絡(luò)的裝置來(lái)實(shí)現(xiàn)本發(fā)明,其中通過(guò)用于語(yǔ)音壓縮算法(“SCA”)參數(shù)的一步外插的后向傳播來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。一旦建立了語(yǔ)音連接,語(yǔ)音壓縮算法裝置開(kāi)始發(fā)送編碼的語(yǔ)音幀。隨著接收到語(yǔ)音幀,將其解碼并且轉(zhuǎn)換回語(yǔ)音信號(hào)電壓。在正常的解碼過(guò)程中,將發(fā)生需要的SCA參數(shù)的預(yù)處理,并且之后將其存儲(chǔ)在過(guò)去的歷史緩沖器中。如果檢測(cè)到語(yǔ)音幀的丟失或者錯(cuò)誤,之后,執(zhí)行外插模塊并且產(chǎn)生替換SCA參數(shù)作為SCA需要的參數(shù)并且發(fā)送。以這種方式,發(fā)送到SCA的信息意在是透明的,并且SCA處理繼續(xù)如常。這個(gè)公開(kāi)宣稱,因?yàn)樵谶^(guò)去接收的、丟失的、以及接下來(lái)接收的語(yǔ)音幀之間實(shí)現(xiàn)了光滑過(guò)渡,收聽(tīng)者一般不會(huì)注意到語(yǔ)音幀丟失。
意在在系統(tǒng)中使用人工智能和/或神經(jīng)網(wǎng)絡(luò)用于媒體壓縮和/或解壓,并且通常關(guān)于特定類型的媒體CODEC方法(例如,話音,視頻)的系統(tǒng)的另外的更詳細(xì)的實(shí)例在下面的美國(guó)專利參考中多種公開(kāi)Naillon et al.的5,005,206;Yoshida et al.的5,041,916;Gerdes的5,184,218;Burel et al.的5,369,503;Fang et al.的5,598,354;Kurdziel的5,692,098;Fang et al.的5,812,700;Imade et al.的5,872,864;Prieto,Jr.的5,907,822;和Mitchell的6,216,267。再一個(gè)實(shí)例在下面出版的國(guó)際專利申請(qǐng)WO 01/54285中提供;Naillon et al.的EPO 0372608A1。將在這里全文包括在這篇文章中引用的所有這些參考的公開(kāi)并將其作為參考。
其它公開(kāi)了使用反饋或其它用于操作CODECS以用于處理多種流媒體信號(hào)的系統(tǒng)的CODEC系統(tǒng),但是不認(rèn)為是特別使用標(biāo)志“AI”或“神經(jīng)網(wǎng)絡(luò)”的公開(kāi),在下面的美國(guó)專利申請(qǐng)Betts et al.的6,072,825;Malvar的6,182,034 B1;Malvar的6,253,165 B1;Malvar的6,256,608B1中公開(kāi)。在這里全文引入這些參考的公開(kāi)并且作為參考。
雖然在CODEC算法本身中具有顯著進(jìn)步,并且盡管先前為了改進(jìn)通信中的壓縮效率有意的使用AI和其它反饋系統(tǒng)以操作CODECS,仍然需要顯著的改進(jìn)通過(guò)多種具有不同帶寬和通信協(xié)議的傳輸信道以有效提供多種流媒體信號(hào)到多種目的接收器裝置的性能。
仍然需要結(jié)合AI和/或神經(jīng)網(wǎng)絡(luò)來(lái)應(yīng)用用于基于多種參數(shù)傳遞流媒體信號(hào)的合適的CODEC,包括但是不限定于下面的一個(gè)或多個(gè)(a)從可用的不同類型和操作的CODEC的庫(kù)中自動(dòng)選擇合適的最優(yōu)化CODEC,包括特別基于相比其它CODEC操作和/或相對(duì)一個(gè)標(biāo)準(zhǔn)的所選CODEC操作的智能知識(shí),(b)在表示現(xiàn)有形式的給定組的操作參數(shù)內(nèi),特別的CODEC操作的預(yù)先訓(xùn)練和/或重復(fù)學(xué)習(xí)的知識(shí);以及(c)基于它關(guān)于現(xiàn)有形式或參考參數(shù)的測(cè)試形式中一個(gè)或兩者的操作的智能知識(shí)的,合適的CODEC的轉(zhuǎn)換。
特別的,仍然需要這種智能的CODEC系統(tǒng),使應(yīng)用的CODEC基于下述一個(gè)或多個(gè)所定義的現(xiàn)有形式流媒體信號(hào)本身的參數(shù);參數(shù)信道性能和約束條件的參數(shù);以及接收器裝置性能和約束條件的參數(shù)。
此外,為了最優(yōu)化主題流媒體信號(hào)的合適的壓縮、傳輸、解壓和播放,仍然需要這種基于智能知識(shí)操作的智能的CODEC系統(tǒng),其中的智能知識(shí)關(guān)于所有這些操作和形式的參數(shù)。
用于流媒體的傳統(tǒng)的代碼轉(zhuǎn)換機(jī)近來(lái)流媒體通信領(lǐng)域的興趣在于提供現(xiàn)在使用的多種“特定格式”編碼系統(tǒng)之間的交互通信。現(xiàn)有的多種不同的特定格式系統(tǒng)和預(yù)編碼內(nèi)容的領(lǐng)域形成了在處理編碼內(nèi)容上廣泛的未完成性能,造成在內(nèi)容提供商和客戶用戶之間的在可兼容性問(wèn)題上的相當(dāng)?shù)睦Ь?。如果一個(gè)客戶需要從特別的源看到或聽(tīng)到流內(nèi)容而且那個(gè)內(nèi)容必須通過(guò)用于壓縮的CODEC,在客戶側(cè)必須使用可兼容的CODEC用于解壓來(lái)享用信號(hào)。不幸的是,源內(nèi)容經(jīng)常只結(jié)合一些,并且通常是僅僅一種,特定的CODEC方案。因此,如果客戶請(qǐng)求這種編碼的內(nèi)容(或者如果源需要將編碼的內(nèi)容送給特殊的客戶),必須達(dá)到兩個(gè)標(biāo)準(zhǔn)中的一個(gè)(1)客戶必須下載或以其它方式擁有特定格式的CODEC(解碼器);或者(2)為了將源媒體從第一格式解碼為可以和客戶的設(shè)備/系統(tǒng)兼容的第二格式,源媒體必須安放“代碼轉(zhuǎn)換機(jī)”。術(shù)語(yǔ)“代碼轉(zhuǎn)換機(jī)”在這里意在表示將媒體信號(hào)從一個(gè)編碼的(也就是,壓縮的)格式轉(zhuǎn)換為另一個(gè)的系統(tǒng)。
已經(jīng)在先前公開(kāi)了多種用于將一個(gè)媒體格式的代碼轉(zhuǎn)換為另一個(gè)的技術(shù)。圖1C示出了一個(gè)具有很多已知的代碼轉(zhuǎn)換技術(shù)特征的一般過(guò)程的說(shuō)明性實(shí)例。更為特別的,首先從特別類型的,用于在最初的、不兼容的格式存在的內(nèi)容的裝置或播放器接收請(qǐng)求159。根據(jù)在圖1C中示出了的特定實(shí)例,接收來(lái)自微軟媒體播放器(microsoft MediaPlayer)的用于實(shí)時(shí)視頻內(nèi)容(Real Video Content)的請(qǐng)求159。隨著特別的請(qǐng)求內(nèi)容,將內(nèi)容從最初的格式(例如,實(shí)時(shí)編碼的格式)解碼,并且之后“重新編碼”為合適的用于請(qǐng)求播放器(例如,微軟媒體格式)的格式。然后將這個(gè)重新編碼的媒體用來(lái)請(qǐng)求客戶,用于在那個(gè)播放器的內(nèi)置系統(tǒng)中解碼。
這個(gè)現(xiàn)有的系統(tǒng)具有顯著的可量測(cè)性方面的限制,在多個(gè)信道上同時(shí)為多個(gè)客戶的饋入必須由相等數(shù)量的代碼轉(zhuǎn)換器支持。例如,圖1D示出了剛剛描述的現(xiàn)有代碼轉(zhuǎn)換技術(shù)的方案實(shí)現(xiàn),其管理從四個(gè)微軟媒體播放器同時(shí)請(qǐng)求的四個(gè)流,其中請(qǐng)求的內(nèi)容最初以RealTM格式編碼。用來(lái)支持四個(gè)編碼器151-154和四個(gè)解碼器155-158的系統(tǒng)結(jié)構(gòu)需要可觀的計(jì)算資源。例如,認(rèn)為在實(shí)例中提供的每一編碼器151-154需要具有128M字節(jié)可用RAM的600MHz(例如,奔騰TMIII),或者具有256M字節(jié)可用RAM的雙400MHz處理器(例如,奔騰II)的計(jì)算機(jī)。還認(rèn)為每一解碼器155-158需要具有64Mb可用RAM的233MHz機(jī)器(例如,奔騰TMII)。所以,四個(gè)這種流需要相當(dāng)于四900Xeon(可從Compaq,Hewlett Packard,Dell and IBM通過(guò)購(gòu)買獲得,估計(jì)在這個(gè)公開(kāi)的時(shí)間零售需要花費(fèi)$9K)。這只是對(duì)于四個(gè)同步流,而對(duì)于現(xiàn)有的公眾需要通常需要上千個(gè)同步流。
仍需要使用最小化的計(jì)算資源和以最節(jié)約成本的方式,用于將多個(gè)特定格式的編碼流媒體信號(hào)有效的轉(zhuǎn)換為多個(gè)其它格式的代碼轉(zhuǎn)換器系統(tǒng)。
影響媒體通信的參數(shù)為了進(jìn)一步說(shuō)明可能影響選擇合適的CODEC的變量的目的,下面是多種不同類型的流式視頻格式和處理系統(tǒng)的大致總結(jié),這里為了將特殊的流媒體信號(hào)傳遞到所述目標(biāo)而選擇合適的CODEC。相信考慮到可用的傳輸速度和帶寬,以及接收器處理參數(shù),為了最優(yōu)化流媒體信號(hào)的傳遞和播放,通常這些不同信號(hào)每一都需要不同類型的壓縮形式(例如,CODECS)。
雖然將在這里進(jìn)一步詳細(xì)描述確定的特定類型的通信格式和系統(tǒng),下面的表1提供關(guān)于可用速度和帶寬的,當(dāng)前可用或公開(kāi)的多種不同的通信系統(tǒng)和傳輸載體的重要交叉部分的總結(jié)。
表1多種通信載體系統(tǒng)的數(shù)據(jù)速率
表的注釋和關(guān)鍵詞
(i)術(shù)語(yǔ)“Kbps”是“千比特每秒”的縮寫。在除了美國(guó)以外的其它國(guó)際英語(yǔ)中,等同于使用“kbits s-1”或“kbits/s”。
(ii)工程師使用數(shù)據(jù)速率而不是速度,但是速度(比如在“為什么我的頁(yè)面不能夠更快一些到這里?”中)可能看起來(lái)更有意義并且技術(shù)傾向性更少。
(iii)關(guān)于數(shù)據(jù)傳輸,相關(guān)的術(shù)語(yǔ),比如帶寬或者“容量”意味著管道有多寬并且可以多快的將比特在管道中沿信道發(fā)送。這些“速度”是總計(jì)的速度。就是說(shuō),通常由信道分配在載體內(nèi)的多個(gè)信號(hào)信道用于不同的使用,或在不同用戶中分配。
關(guān)鍵詞(i)″T″=在美國(guó),加拿大,和日本等的T-載體系統(tǒng)...(ii)″DS″=數(shù)字信號(hào)(digital signal)(在T-載體或在E-載體上運(yùn)行的)...(iii)″E″=等效使用每信道所有8比特的″T″;使用在除了美國(guó),加拿大,和日本的其它國(guó)家中...(iv)″OC″=光學(xué)載體(同步光網(wǎng)絡(luò))″STM″=同步傳輸模塊(參看同步數(shù)字等級(jí))。(v)僅示出最常用的技術(shù)。(vi)“物理媒介”通常表述并且不指定雙絞線對(duì)的類型或數(shù)量,或者光纖是單模式還是雙模式的。(vii)沒(méi)有示出技術(shù)的有效距離。(viii)公布了用于很多這些技術(shù)的標(biāo)準(zhǔn)。
電纜調(diào)制解調(diào)器注釋電纜上的上限52Mbps是到ISP,當(dāng)前并不是到單獨(dú)的PC?,F(xiàn)有的多數(shù)PC是限于內(nèi)部設(shè)計(jì),只能容納不大于10Mbps(雖然PCI總線本身以高速攜帶數(shù)據(jù))。52Mbps電纜信道在單獨(dú)的用戶中被細(xì)分。很明顯,信道越快,ISP將需要越少的信道并且支持單獨(dú)的用戶的成本越低。
互聯(lián)網(wǎng)載體系統(tǒng)通過(guò)互聯(lián)網(wǎng)的流式視頻的傳遞可能在多種傳輸模式中發(fā)生,其包括,例如,數(shù)字用戶線(“DSL”),“T1”線路,電纜調(diào)制解調(diào)器,簡(jiǎn)單的舊的電話服務(wù)(“POTS”)撥號(hào)調(diào)制解調(diào)器,以及無(wú)線載波。雖然在這里分開(kāi)的處理很多不同無(wú)線傳輸模式的描述,為了在下述中進(jìn)一步說(shuō)明的目的,接下來(lái),在這里將緊接著提供多種這些其它傳輸模式的總結(jié)。
術(shù)語(yǔ)“POTS”或“簡(jiǎn)單的舊電話服務(wù)”,或“撥號(hào)”,作為應(yīng)用到通信傳輸信道的,在這里是可互換的使用的。這個(gè)術(shù)語(yǔ)意在表示通常通過(guò)彼此纏繞的銅線,或“雙絞線”,連接在家庭或小型公司的終端用戶到電話公司辦公室的“窄帶”通信。創(chuàng)建現(xiàn)有的電話服務(wù)來(lái)使得你和其它電話用戶通過(guò)模擬信號(hào)交換語(yǔ)音信息,該模擬信號(hào)將表示聲學(xué)模擬信號(hào)的模擬信號(hào)關(guān)于音量(信號(hào)幅度)和音調(diào)(波變化的頻率)轉(zhuǎn)換為等效的電信號(hào)。因?yàn)橐呀?jīng)對(duì)于這些模擬的波傳輸設(shè)立好了電話公司的信令傳輸,對(duì)于它,可以很容易的使用作為在你的電話和電話公司之間向前和向后取得信息的方式。因此,撥號(hào)調(diào)制解調(diào)器是用來(lái)解調(diào)模擬信號(hào)并將它的值調(diào)整為被稱為數(shù)字信息的0和1的值的串的。因?yàn)槟M傳輸僅使用可以通過(guò)銅線發(fā)送的可用信息量的一小部分,使用通常的調(diào)制解調(diào)器,你可以接收的數(shù)據(jù)的最大量是大約56Kbps。你的計(jì)算機(jī)接收信息的性能由這樣一個(gè)事實(shí)所限制,即,電話公司過(guò)濾作為數(shù)字?jǐn)?shù)據(jù)到達(dá)的信息,為了你的電話線路將其變?yōu)槟M形式,并且需要你的調(diào)制解調(diào)器將它變回?cái)?shù)字形式。換句話說(shuō),在你家或公司和電話公司之間的模擬傳輸是帶寬瓶頸。
對(duì)于“ISDN”或一些人認(rèn)為是DSL的有限前身的“互聯(lián)網(wǎng)用戶數(shù)字網(wǎng)絡(luò)”,對(duì)于一些終端用戶客戶來(lái)說(shuō)可以實(shí)現(xiàn)引入的數(shù)據(jù)率高到大約128Kbps。
通常將“DSL”或“數(shù)字用戶線路”定義為用于通過(guò)一般的銅的電話線路傳遞高帶寬通信的“寬帶”傳輸載體。已經(jīng)公開(kāi)了很多不同類型的DSL服務(wù),其通常在數(shù)據(jù)率和預(yù)期應(yīng)用上不同。雖然在這里關(guān)于這些確定的DSL類型提供進(jìn)一步的討論,為了進(jìn)一步形成總的理解的目的,下面的表2提供了用于這些確定的DSL類型的信息的概括。
表2已知的DSL服務(wù)的類型
通常公布的用于DSL服務(wù)的數(shù)據(jù)率,其包括高到6.1Mbps(理論上公布在8.448Mbps)的速率,認(rèn)為這已經(jīng)可以啟用電影、音頻和3-D效果的連續(xù)傳輸,其中DSL服務(wù)可能根據(jù)到提供服務(wù)的公司的中心辦公室的距離而有所不同。更為普遍的單獨(dú)的連接可以提供從512Kbps到1.544Mbps的下行流和大約128Kbps上行流。DSL線路可以攜帶數(shù)據(jù)和語(yǔ)音信號(hào)并且線路的數(shù)據(jù)部分是連續(xù)連接的。一些出版物預(yù)期DSL在很多區(qū)域代替ISDN,并且和電纜調(diào)制解調(diào)器競(jìng)爭(zhēng)到家庭和公司的多媒體通信。DSL僅操作在數(shù)字域中,并且不需要變換為模擬形式及變回來(lái)。將數(shù)字?jǐn)?shù)據(jù)作為數(shù)字?jǐn)?shù)據(jù)直接發(fā)送到目的計(jì)算機(jī),并且這允許電話公司使用更寬的帶寬用于前向傳輸。同時(shí),如果客戶用戶選擇的話,可以分開(kāi)信號(hào),使得一些帶寬可以用來(lái)發(fā)送模擬信號(hào),這使得可以在相同線路上同時(shí)使用電話和計(jì)算機(jī)。
大部分DSL技術(shù)需要在家庭或公司中安裝信號(hào)分離器,這需要電話公司上門安裝。但是,可能從中心辦公室遠(yuǎn)程管理分離。這被稱為無(wú)分離DSL,“DSL Lite”,G.Lite,或通用ADSL(下面進(jìn)一步定義),并且近來(lái)被作為標(biāo)準(zhǔn)。雖然這些由國(guó)際電信聯(lián)盟(ITU)進(jìn)行了標(biāo)準(zhǔn)化,多種DSL仍使用幾種調(diào)制技術(shù)。不同的DSL調(diào)制解調(diào)器制造商使用離散多頻聲技術(shù)(DMT)或無(wú)載波幅度調(diào)制(CAP)。已知為多虛擬線路(MVL)的第三種技術(shù)也是另一可能性。
DSL的多個(gè)操作參數(shù)是可變的并且其影響可以達(dá)到的有效數(shù)據(jù)速率。DSL調(diào)制解調(diào)器通常符合北美和歐洲標(biāo)準(zhǔn)建立的數(shù)據(jù)率的倍數(shù)。通常,用于沒(méi)有轉(zhuǎn)發(fā)器的DSL的最大范圍是5.5km(18,000英寸)。隨著向著電話公司辦公室的距離的減少,數(shù)據(jù)率增加。另一因素是銅線的規(guī)格。對(duì)于超過(guò)5.5千米范圍的目的裝置,仍然可以提供DSL,但是這通常僅在各個(gè)電話公司提供商以光纖電纜延伸了本地回路的情況下。
為了將多個(gè)DSL用戶互連到作為“骨干“的高速網(wǎng)絡(luò),電話公司使用數(shù)字用戶線路接入多路復(fù)用器(“DSLAM”)。通常,該DSLAM連接到可以在吉比特?cái)?shù)據(jù)率聚集數(shù)據(jù)傳輸?shù)漠惒絺鬏斈J?“ATM”)。在每一傳輸?shù)牧硪荒┒耍珼SLAM將信號(hào)解多路復(fù)用并且將它們轉(zhuǎn)送到合適的單獨(dú)DSL連接。
“ADSL”或“非對(duì)稱數(shù)字用戶線路”是對(duì)于家庭和小型商業(yè)用戶將變得更加熟悉的DSL形式。因?yàn)樗碾p向或“雙工的”帶寬專用于發(fā)送數(shù)據(jù)到用戶的下行流方向,ADSL被稱為“不對(duì)稱的”。僅僅一小部分帶寬被用于上行流或用戶交互消息。但是,大多數(shù)互聯(lián)網(wǎng),而且特別是圖形或多媒體密集型網(wǎng)絡(luò)數(shù)據(jù)需要大量的下行流帶寬,且用戶的請(qǐng)求和響應(yīng)很小并且需要很少的上行流帶寬。使用ADSL,可以向下行流發(fā)送高達(dá)6.1兆比特每秒的數(shù)據(jù)以及高達(dá)640Kbps的上行流。高的下行流帶寬意味著電話線路可以傳輸電影、音頻和3-D圖像到目的計(jì)算機(jī)或電視顯示器。另外,一小部分下行流帶寬可專用于語(yǔ)音而不是數(shù)據(jù),且可以不需要單獨(dú)的線路執(zhí)行電話談話。不像類似的通過(guò)“電纜”電話線路的服務(wù),ADSL不和給定區(qū)域中的鄰居競(jìng)爭(zhēng)帶寬。在很多情況中,你的現(xiàn)有的電話線路將工作為ADSL。在一些區(qū)域中,可能需要更新。
“CDSL”或“用戶DSL”是DSL的標(biāo)志性版本,由Rockwell公司提供,可能比ADSL慢(在下行流上1Mbps,并且通常預(yù)期上行流更低)但是其具有不需要在用戶端安裝“分離器”的優(yōu)點(diǎn)。可能需要硬件來(lái)由本地電話公司攜帶CDSL到家庭或公司。CDSL使用它自己的載體技術(shù),而不是DMT或CAP ADSL技術(shù)。
很多公司和電話公司共同工作來(lái)開(kāi)發(fā)ADSL的標(biāo)準(zhǔn)和更容易安裝的版本,被稱為“G.Lite”,并且認(rèn)為在這個(gè)公開(kāi)的時(shí)間已在開(kāi)發(fā)之中。認(rèn)為“G.lite”或“DSL Lite”(還被稱為“無(wú)分離器ADSL”,和“通用ADSL”)是不需要在用戶端分離線路,而是在電話公司遠(yuǎn)程管理來(lái)為用戶分離線路的更慢的ADSL,但是成本可能很低。公開(kāi)G.Lite,正式的ITU-T標(biāo)準(zhǔn)G-992.2來(lái)提供從1.544Mbps到6Mpbs下行流數(shù)據(jù)率和從大約128Kbps到大約384Kbps的上行流數(shù)據(jù)率。至少一個(gè)出版物預(yù)計(jì)G.Lite將成為最廣泛安裝的DSL形式。
認(rèn)為“HDSL”或“高比特率DSL”是DSL最早的變型,其廣泛用于在共同的站點(diǎn)和在電話公司和用戶之間的寬帶數(shù)字傳輸。HDSL的主要特性在于它是對(duì)稱的在兩個(gè)方向上等量的帶寬可用。因?yàn)檫@個(gè)原因,最大數(shù)據(jù)率通常低于ADSL。HDSL在雙絞線的單一線上可以攜帶的和在北美的T1線路上所攜帶的或在歐洲的E1線路上所攜帶的相同(高達(dá)大約2.32Mbps)。
“IDSL”或“ISDN DSL”在一定程度上是用詞不當(dāng),因?yàn)橄啾韧ǔ:虯DSL相關(guān)聯(lián)的更高的數(shù)據(jù)率,它十分接近ISDN的數(shù)據(jù)率,在大約128Kbps服務(wù)。
“RADSL”或“速率自適應(yīng)DSL”是可從Westell公司獲得的ADSL技術(shù),其軟件能夠確定在給定的用戶的電話線路上可以發(fā)送的信號(hào)的速率并且以此調(diào)整傳送速率。Westell“FLEXCAP2Z”版本系統(tǒng)使用RADSL來(lái)通過(guò)現(xiàn)有線路傳送從大約640Kbps到大約2.2Mbps下行流到從大約272Kbps到大約1.088Mbps上行流。
“SDSL”或“對(duì)稱DSL”類似于HDSL,具有單一的雙絞線,在雙向線路的每一方向上攜帶大約1.544Mbps(美國(guó)和加拿大)或者大約2.048Mbps(歐洲)。因?yàn)樵趦蓚€(gè)方向上數(shù)據(jù)率相等,所以是對(duì)稱的。
“UDSL”或“單向DSL”是由歐洲公司提出的,并且通常被認(rèn)為是提供單向版本的HDSL。
認(rèn)為“VDSL”或“超高數(shù)據(jù)率DSL”是開(kāi)發(fā)來(lái)允許在相對(duì)短的距離內(nèi)極高的數(shù)據(jù)率的技術(shù),例如在多達(dá)大約1,000英寸或大約300米長(zhǎng)度上的大約51到大約55Mbps之間的數(shù)據(jù)率。至少一個(gè)出版物預(yù)期VDSL可能在ADSL之后在一定程度上被廣泛采用并且和它共存。在一些環(huán)境中還沒(méi)有確定傳輸技術(shù)(CAP,DMT,或其它)和它的有效性。一些標(biāo)準(zhǔn)化組織正在開(kāi)始其工作。
“X2/DSL”是來(lái)自3Com的調(diào)制解調(diào)器,其支持56Kbps調(diào)制解調(diào)器通信,但是當(dāng)ADSL在用戶的區(qū)域中變?yōu)榭捎脮r(shí),可通過(guò)安裝新的軟件更新到ADSL的調(diào)制解調(diào)器,至少一個(gè)出版物引用3Com對(duì)這個(gè)技術(shù)的描述“你將需要的最后的調(diào)制解調(diào)器。
通常認(rèn)為“T1“傳輸線路是“寬帶”載體,并且將其定義為“T-載體”類型的系統(tǒng),認(rèn)為該系統(tǒng)首先由美國(guó)的Bell系統(tǒng)在1960年代作為第一個(gè)成功支持?jǐn)?shù)字化話音傳輸?shù)南到y(tǒng)提出。T-載波系統(tǒng)是全數(shù)字化的,使用脈沖碼調(diào)制和時(shí)分多址。通常在大約8000次每秒取樣話音信號(hào)并且將每一取樣數(shù)字化為8比特字。通過(guò)同時(shí)數(shù)字化的24信道,在24個(gè)信道中的每一個(gè)上以192比特幀表示8比特字,并將192比特幀一秒發(fā)送大約8000次。每一幀和下一個(gè)由信號(hào)比特分開(kāi),產(chǎn)生193比特模塊。T-1發(fā)布的1.544Mbps數(shù)據(jù)率通常表示乘以8,000的192比特幀、以及1比特信令比特。
T-1系統(tǒng)通常使用4條線路并且提供雙向的容量,其中兩條線路專用于接收并且兩條用于同時(shí)發(fā)送。T-1數(shù)字流包括多路復(fù)用的24、64Kbps信道,其中該標(biāo)準(zhǔn)的64Kbps信道基于需要用于話音談話的帶寬。四條線路最初是一對(duì)雙絞線銅線,但是近來(lái)的系統(tǒng)提供同軸電纜、光纜、數(shù)字微波以及其它載體技術(shù)。信號(hào)的數(shù)量和使用可能根據(jù)標(biāo)準(zhǔn)指導(dǎo)方針來(lái)變化。
用于T-1線路的最初的傳輸率(1.544Mbps),今天通常用在互聯(lián)網(wǎng)服務(wù)提供商(“ISP”)到互聯(lián)網(wǎng)的連接上。通?;ヂ?lián)網(wǎng)服務(wù)提供商還使用另一級(jí)別,T-3線路,公布其提供44.736Mbps。另一經(jīng)常使用的服務(wù)是“部分T-1”,其是租用T-1線路的24信道中的一些部分,同時(shí)不使用另外的信道。
顯示容量/約束條件和相關(guān)標(biāo)準(zhǔn)多種不同類型的接收器顯示容量可能也會(huì)顯著的影響用于有效傳遞特殊的流媒體信號(hào)以由接收器顯示的合適的CODEC形式。提供了示出這種改變的顯示參數(shù)(例如,分辨率,清晰度,顏色,深度,尺寸,特定類型/格式)的確定實(shí)例的大概的總結(jié)以更好的理解下面問(wèn)題。
在不同類型之間其高度可變并且組成流媒體接收器裝置,而且因此可能顯著的影響使用的合適的CODEC的一個(gè)參數(shù)是可能由顯示裝置表示的顏色的范圍,或“調(diào)色板”。標(biāo)準(zhǔn)的“瀏覽器安全”的調(diào)色板可能由大多數(shù)用于基于互聯(lián)網(wǎng)的流媒體顯示的軟件容納,其可能包括,例如,216個(gè)顏色,盡管用于基于網(wǎng)絡(luò)的流媒體必須了解計(jì)算機(jī)顯示容量以及瀏覽器軟件容量。
關(guān)于計(jì)算機(jī)顯示技術(shù),對(duì)在屏幕上的每一單獨(dú)的象素或可尋址的照明元件設(shè)置顏色。每一象素具有紅、綠和藍(lán)(RGB)成分。通過(guò)指定對(duì)于每一這些成分的強(qiáng)度的量,可以給予那個(gè)象素獨(dú)特的顏色?!罢娌噬憋@示通常使用24比特值定義在顯示屏上的象素的顏色,允許多達(dá)16,777,216個(gè)可能顏色的可能性。用來(lái)定義象素的顏色陰影的比特的數(shù)量被稱為“比特深度”。有時(shí)真彩色指的是“24比特顏色”,盡管很多現(xiàn)代的顏色顯示系統(tǒng)提供32比特顏色模式。被稱為“alpha信道”的外部字節(jié)通常用于控制和特定的效果信息。通常將“灰度級(jí)”(包括灰度的離散的陰影)顯示設(shè)置定義為具有N比特深度,其中N表示在象素內(nèi)黑色的飽和度。如果N=1,不將圖像稱為灰度級(jí)而是單色,或者黑色和白色,因?yàn)楸忍刂荒苁情_(kāi)或關(guān),并且不包括陰影信息。
通常的計(jì)算機(jī)分辨率包括,例如,但是不限于下面的(i)VGA或視頻圖形陣列,能夠以4∶3的縱橫比,以16色顯示640×480象素或以256色顯示320×240象素;(ii)SVGA或超級(jí)視頻圖形陣列,能夠顯示800×600×6比特/象素(16色)或650×480×8比特/象素(256色)。由視頻電子協(xié)會(huì)(VESA)創(chuàng)建SVGA;以及(iii)XGA(v1-4)或eXtended圖形陣列,能夠以32,768色顯示1024×768象素。
可能添加比如SXGA的另外的標(biāo)準(zhǔn),定義1960×1440以上的象素尺寸并且顏色深度等于或高于32比特/象素。
在由媒體信號(hào)使用比特殊的顯示器或?yàn)g覽器可以處理的范圍更大的顏色(調(diào)色板)的情況中,多數(shù)瀏覽器通常適于“高頻振動(dòng)”顏色,其在這里意在表示瀏覽器將在它的調(diào)色板內(nèi)找到顏色,其中瀏覽器替代任意在它的調(diào)色板以外的顏色。為了進(jìn)一步說(shuō)明不同系統(tǒng)顯示容量的寬范圍,基于操作系統(tǒng)使用WindowsTM(可從微軟公司獲得)以及MacintoshTM(可從Apple公司獲得)的系統(tǒng)不具有相同的瀏覽器,然而其中40個(gè)是不同的并且因此如果以由其它系統(tǒng)指定的格式將圖像信號(hào)傳遞到那個(gè)類型的系統(tǒng)的話,需要由在一個(gè)系統(tǒng)內(nèi)操作的瀏覽器高頻振動(dòng)。
關(guān)于怎樣從電子信息啟動(dòng)視覺(jué)顯示存在很多不同的技術(shù)。術(shù)語(yǔ)“VDT”或“視頻顯示終端”通常在計(jì)算機(jī)工業(yè)中使用并且在這里意在和簡(jiǎn)單的參考“顯示器“可互換的使用。關(guān)于計(jì)算機(jī)終端使用,VDT包括計(jì)算機(jī)輸出表面和示出文本和圖形圖像到計(jì)算機(jī)用戶的投影機(jī)制,包括,例如陰極射線管(“CRT”),液晶顯示器(“LCD”)發(fā)光二極管(“LED”),氣體等離子管,或其它圖像投影技術(shù)。通常認(rèn)為顯示器包括屏幕或投影表面以及在屏幕上生成信息的裝置。在一些計(jì)算機(jī)中,在分開(kāi)的單元或“監(jiān)視器”中封裝的顯示器、或者可能將顯示器和計(jì)算機(jī)處理器一起集成進(jìn)單一的單元。
特別關(guān)于LCD,這個(gè)技術(shù)通常需要和其它VDT相比最小化的音量和物理深度,并且因此通常在膝上型計(jì)算機(jī)和手機(jī)/PDA中使用。相比LED和氣體顯示VDT,因?yàn)樗鼈兺ǔR宰枞饩€而不是放射光線的原理工作,LCD消耗更少的能量。LCD可能是“無(wú)源矩陣”或“有源矩陣”,還可稱為“薄膜晶體管”或“TFT”顯示器。無(wú)源矩陣LCD具有導(dǎo)體格,并且在格的每一交叉點(diǎn)放置象素。發(fā)送電流通過(guò)在格上的兩個(gè)導(dǎo)體來(lái)控制用于任意象素的光線。有源矩陣具有位于每一象素交叉點(diǎn)上的晶體管,需要更少的電流來(lái)控制象素的亮度。為了這個(gè)原因,可以更為頻繁的打開(kāi)或關(guān)閉在有源矩陣顯示中的電流,改進(jìn)屏幕刷新時(shí)間和由此的流媒體(例如,動(dòng)態(tài)視頻)的更高速度的功效。一些無(wú)源矩陣LCD具有雙重掃描,在其中他們可以以電流在同一時(shí)間掃描格兩次,就像在早先版本中的一個(gè)掃描;但是,通常仍然認(rèn)為有源矩陣是兩個(gè)當(dāng)中更優(yōu)越的技術(shù)。反射的顏色顯示技術(shù)--顏色濾波器和無(wú)源矩陣顯示結(jié)構(gòu)的結(jié)合,對(duì)有源矩陣技術(shù)來(lái)說(shuō)是低能耗、低成本的。因?yàn)樗鼈兎瓷渲車墓饩€,反射的LCD在外部白天光線中使用的過(guò)程中表現(xiàn)出特別高的性能。特別為電視觀看開(kāi)發(fā)了多種不同的顯示技術(shù),以及由此的傳輸格式。這樣對(duì)于電視傳輸出現(xiàn)了一些不同標(biāo)準(zhǔn),并且它們的不同可能顯著的影響在電視環(huán)境中需要(并且由此選擇特別的CODEC)用于傳遞流媒體信號(hào)的壓縮特性和程度。這些標(biāo)準(zhǔn)特別包括,并且不限于,標(biāo)準(zhǔn)清晰度電視(“SDTV”);以及高清晰度電視(“HDTV”)。
“SDTV”或“標(biāo)準(zhǔn)清晰度電視”和“HDTV”或“高清晰度電視”是兩個(gè)種類的用于數(shù)字電視(“DTV”)傳輸?shù)娘@示格式,并且成為了標(biāo)準(zhǔn)。這些格式提供類似于數(shù)字多功能光盤(“DVD”)的畫(huà)面質(zhì)量,并且關(guān)于他們的相似性和不同總結(jié)如下。
HDTV提供更高質(zhì)量的顯示,具有從大約720p到至少大約1080i的垂直分辨率顯示以及通常是16∶9的縱橫比(屏幕的寬度和高度的比值),用于和觀看電影類似的觀看感受。相比起來(lái),SDTV具有較低的分辨率范圍并且沒(méi)有定義的縱橫比。新的電視機(jī)要么是HDTV可行的要么是SDTV可行的,通常是HDTV,其使用以通常將數(shù)字信號(hào)從大約166Mbps減少到大約3Mbps的方式的MPEG-2文件壓縮方法。這允許廣播使用現(xiàn)有電纜、衛(wèi)星和地面系統(tǒng)發(fā)送數(shù)字信號(hào)。MPEG-2使用有損壓縮方法,意味著發(fā)送到電視的數(shù)據(jù)信號(hào)經(jīng)過(guò)壓縮并且丟失了一些數(shù)據(jù),但是這些丟失的數(shù)據(jù)可能會(huì),或可能不會(huì)影響人眼觀看畫(huà)面。ATSC和DVB標(biāo)準(zhǔn)都選擇MPEG-2用于視頻壓縮和傳輸。MPEG-2壓縮標(biāo)準(zhǔn)將在這里的其它地方更詳細(xì)的描述。
因?yàn)閴嚎s的SDTV數(shù)字信號(hào)比壓縮的HDTV信號(hào)小,廣播可以同時(shí)發(fā)送多達(dá)五個(gè)SDTV節(jié)目,而只能發(fā)送一個(gè)HDTV節(jié)目,另外已知為“多點(diǎn)傳送”。因?yàn)殡娨暸_(tái)可以從另外的廣播這些附加廣告而獲得另外的收入,多點(diǎn)傳送是很有吸引力的特征。對(duì)于現(xiàn)今的模擬電視系統(tǒng),在一個(gè)時(shí)間僅可以發(fā)送一個(gè)節(jié)目。注意到這里使用的術(shù)語(yǔ)“多點(diǎn)傳送”和它在流式視頻中的使用不同,在流式視頻中它包括使用特定尋址技術(shù)。
當(dāng)美國(guó)決定做出從模擬電視到DTV的轉(zhuǎn)變時(shí),聯(lián)邦通信委員會(huì)決定讓廣播商確定是否廣播SDTV或HDTV節(jié)目?,F(xiàn)今多數(shù)決定廣播SDTV節(jié)目并且在黃金時(shí)段的廣播中廣播HDTV節(jié)目。SDTV和HDTV都由數(shù)字視頻廣播(DTV)和高級(jí)電視系統(tǒng)委員會(huì)(ATSC)設(shè)置的標(biāo)準(zhǔn)支持。
作為電視顯示技術(shù)的HDTV提供類似35mm膠片的畫(huà)面質(zhì)量以及類似于現(xiàn)今的光盤的聲音質(zhì)量(另外關(guān)于音頻質(zhì)量,HDTV接收,復(fù)制,并且輸出Dolby Digital 5.1)。一些電視臺(tái)開(kāi)始在有限數(shù)量的信道上發(fā)送HDTV廣播給用戶。HDTV通常使用數(shù)字而不是模擬信號(hào)傳輸。但是,在日本,在1989年6月3日廣播了首個(gè)模擬HDTV節(jié)目。首個(gè)出現(xiàn)的圖像是自由女神像和紐約港。它需要20Mhz的信道,這就是為什么模擬HDTV廣播在大多數(shù)國(guó)家不可行的原因。
HDTV提供比SDTV更高質(zhì)量的顯示,具有從720p到1080i的垂直分辨率顯示。該p代表逐行掃描,表示每一掃描包括用于完整畫(huà)面的每一條線,以及I代表交織掃描,表示每一掃描包括用于半個(gè)畫(huà)面的交替的線。將這些比率轉(zhuǎn)換為高達(dá)60幀每秒的幀速率,是現(xiàn)有電視的兩倍。HDTV的一個(gè)最主要的特征是它更寬的16∶9的縱橫比(屏幕的寬度和高度的比率),本開(kāi)發(fā)是基于通過(guò)研究獲得的認(rèn)為可以通過(guò)更寬的屏幕增強(qiáng)觀看者的體驗(yàn)的事實(shí)。相比SDTV的象素在300,000到一百萬(wàn)的范圍,HDTV的象素在從一百萬(wàn)到二百萬(wàn)的范圍。新的電視機(jī)將是HDTV的或SDTV的,并且接收者可以將信號(hào)轉(zhuǎn)化為它們的本地顯示格式。
在美國(guó),F(xiàn)CC已經(jīng)分配了用于DTV傳輸?shù)膹V播信道。在SDTV格式中,DTV使得其可能使用分配的信道在當(dāng)前的質(zhì)量級(jí)別上用于多個(gè)信號(hào)而不是在HDTV級(jí)別上的單一信號(hào),這將允許以相同的帶寬使用發(fā)送更多節(jié)目。商業(yè)的和公共的廣播站當(dāng)前決定它們?cè)鯓舆M(jìn)行它們對(duì)HDTV的使用。
同時(shí)聯(lián)播是在模擬和數(shù)字版本的相同的電視節(jié)目使用兩個(gè)不同頻率的信道的同時(shí)傳輸。在DTV傳輸階段的最后,認(rèn)為模擬參數(shù)將基本上被代替,使得當(dāng)前的模擬信道僅用于DTV。用于數(shù)字廣播的額外的信道,例如,將被拍賣或者用于更多的電視信道或比如數(shù)據(jù)廣播的其它服務(wù)。同時(shí)聯(lián)播還用于同時(shí)傳輸電視和互聯(lián)網(wǎng)服務(wù),傳輸模擬和數(shù)字無(wú)線電廣播,以及傳輸以不同屏幕格式的電視節(jié)目,比如傳統(tǒng)的格式和寬銀幕格式。同時(shí)聯(lián)播廣播被廣泛使用。
到DTV的轉(zhuǎn)變并不是一個(gè)容易或廉價(jià)的轉(zhuǎn)變。為使一個(gè)電視臺(tái)發(fā)送DTV節(jié)目,它必須建立它的DTV設(shè)備,但是電視臺(tái)必須有收入來(lái)建立這些設(shè)備。同時(shí)聯(lián)播允許電視臺(tái)持續(xù)從傳統(tǒng)的模擬節(jié)目中獲得收入并且還從額外的數(shù)字節(jié)目中獲得額外的收入。在到DTV的轉(zhuǎn)變中的另一障礙是用戶們?nèi)狈εd趣。對(duì)于特定裝置的需要妨礙了觀看者看到數(shù)字和模擬節(jié)目之間的不同,并且也降低了公眾對(duì)DTV的熱情。
用于操作DTV的裝備根據(jù)地面、電纜或衛(wèi)星服務(wù)用作傳輸信道/載體。在任意事件中,并且根據(jù)已知的或預(yù)期的系統(tǒng),通常認(rèn)為用戶將最小程度的需要購(gòu)買轉(zhuǎn)換器來(lái)在他們的舊的電視機(jī)上觀看DTV傳輸。另外,使用地面服務(wù)或電線來(lái)接收電視信號(hào)的用戶需要裝備有數(shù)字信號(hào)的天線。因?yàn)槎嗦窂叫?yīng),在符合ATSC的國(guó)家的位于山區(qū)區(qū)域的用戶可能不能接收基于地面的數(shù)字信號(hào)。即使對(duì)于今天的模擬電視系統(tǒng)這也很常見(jiàn)。在符合DVB的國(guó)家,地面不影響數(shù)字信號(hào)的接收。衛(wèi)星用戶已經(jīng)可以享受DTV廣播,但是可能需要較大的碟型衛(wèi)星天線來(lái)觀看HDTV節(jié)目。
在這里將“置頂盒“定義為使得電視機(jī)可以成為到互聯(lián)網(wǎng)的用戶接口并且還使得模擬電視機(jī)可以接收并且解碼DTV廣播的裝置。DTV置頂盒有時(shí)被稱為接收器。估計(jì)到2006年底結(jié)束,估計(jì)轉(zhuǎn)變到DTV的年份,三千五百萬(wàn)個(gè)家庭將使用數(shù)字置頂盒,通常的數(shù)字置頂盒包括一個(gè)或多個(gè)用于運(yùn)行操作系統(tǒng),通常是Linux或Windows CE,并且用于分解MPEG傳輸流的微處理器。置頂盒還包括RAM、MPEG解碼器芯片,以及更多的用于音頻解碼和處理的芯片。置頂盒的內(nèi)容根據(jù)所使用DTV標(biāo)準(zhǔn)。符合DVB的置頂盒包括解碼COFDM傳輸?shù)牟糠?,而且符合ATSC的置頂盒包括解碼VSB傳輸?shù)牟糠?。更加?fù)雜的置頂盒包括用于存儲(chǔ)記錄的電視廣播,用于存儲(chǔ)下載的軟件,以及用于其它由DTV服務(wù)提供商提供的應(yīng)用的硬盤驅(qū)動(dòng)。數(shù)字置頂盒可以用于衛(wèi)星和地面DTV但是主要用于有線電視。置頂盒的價(jià)格在從用于基本特征的$100到用于更為復(fù)雜的盒的$1,000之間。
在互聯(lián)網(wǎng)領(lǐng)域,置頂盒通常真正用作可以和互聯(lián)網(wǎng)“交談”的特定的計(jì)算機(jī),就是說(shuō),它包括網(wǎng)絡(luò)瀏覽器(其是真正的超文本傳輸協(xié)議客戶)以及互聯(lián)網(wǎng)的主要程序,TCP/IP。置頂盒可能通過(guò)電話線,例如,以網(wǎng)絡(luò)TV或通過(guò)像TCI的有線TV公司附加服務(wù)。
為了得到用于衛(wèi)星廣播的Dolby Digital 5.1信道的優(yōu)勢(shì),需要衛(wèi)星接收者提供Dolby Digital輸出。對(duì)于電纜用戶,所有數(shù)字置頂盒裝備有Dolby Digital兩信道解碼器。為使用5.1信道聲音,需要符合5.1信道的置頂盒或外部5.1信道解碼器單元。
因?yàn)楦蟮钠聊?,更寬的縱橫比和更好的分辨率,數(shù)字電視的優(yōu)點(diǎn)的最生動(dòng)的示例是通過(guò)高端HDTV。但是,像多數(shù)新技術(shù)一樣,HDTV很昂貴。不過(guò),更便宜的數(shù)字TV提供相比現(xiàn)有電視可觀的改進(jìn)的觀看體驗(yàn),并且對(duì)于那些選擇保留他們的舊的裝置的人,即使是置頂盒轉(zhuǎn)換器的情況也可以提供顯著改進(jìn)的畫(huà)面和聲音。
FCC用于轉(zhuǎn)變到DTV的計(jì)劃時(shí)間建議到2002年每一個(gè)在美國(guó)的人應(yīng)該可以接入DTV并且到數(shù)字傳輸?shù)霓D(zhuǎn)換必須要么到2006年完成要么當(dāng)在特定區(qū)域的85%的家庭購(gòu)買了數(shù)字電視機(jī)或置頂盒轉(zhuǎn)換器的時(shí)間。
在1990年代早期,歐洲廣播,用戶裝備制造商,以及形成為了在歐洲范圍內(nèi)介紹DTV而啟用“DVB”或“數(shù)字視頻廣播”項(xiàng)目的歐洲啟用組(ELG)的規(guī)則主體。DVB意在提供和閉合系統(tǒng)相對(duì)的開(kāi)放系統(tǒng)。閉合系統(tǒng)是內(nèi)容提供商指定的,不可擴(kuò)展的,并且僅為那些為其開(kāi)發(fā)的系統(tǒng)最優(yōu)化。開(kāi)放系統(tǒng),比如DVB,允許用戶選擇不同的內(nèi)容提供商并且允許結(jié)合PC和電視。DVB系統(tǒng)意在為電視最優(yōu)化,并且同時(shí)支持家庭購(gòu)物和理財(cái)、私人網(wǎng)絡(luò)廣播和互動(dòng)式觀看。DVB意在打開(kāi)提供十分清楚的電視節(jié)目給在公共汽車、汽車、火車中的電視機(jī),和即使手持電視的可能性。因?yàn)橥ㄟ^(guò)DVB內(nèi)容提供商可以在任何DVB支持的地方提供服務(wù)而不顧地理位置,所以DVB對(duì)內(nèi)容提供商也是有益的,并應(yīng)該加以提倡。內(nèi)容提供商可以容易并且廉價(jià)的擴(kuò)展它們的服務(wù)并且因?yàn)榈接脩舻慕尤氡WC無(wú)需授權(quán)的觀看受限,從而降低收入損失。今天,DVB項(xiàng)目在世界范圍內(nèi)超過(guò)29個(gè)國(guó)家包括超過(guò)220個(gè)組織并且DVB廣播服務(wù)在歐洲、非洲、亞洲、大洋州和部分北美洲和南美洲可用。
特定格式媒體用于流媒體信號(hào)本身的多種不同格式也在這里通過(guò)非限制性實(shí)例的方式總結(jié),來(lái)提供CODECS對(duì)于特殊情況怎樣不同的進(jìn)一步理解。
“DVD”是“數(shù)字多功能光盤”的首字母縮寫,通常被定義為相對(duì)新的光盤技術(shù),其在它的兩面上具有大約4.7吉比特的信息,或者足夠用于平均大約133分鐘長(zhǎng)的電影。在它的兩面上的每一層如果具有兩層,它可能具有17吉比特的視頻、音頻或其它信息,相比現(xiàn)有的具有大致相同物理尺寸的擁有大約600M字節(jié)的CD-ROM光盤(DVD擁有大約28倍以上的信息)。需要DVD播放器來(lái)播放DVD,盡管它們還可以播放通常的CD-ROM光盤。DVD可以以下面三種通常格式中的任意記錄,分別為(i)視頻(例如,連續(xù)的電影);(ii)音頻(例如,長(zhǎng)時(shí)間播放的音樂(lè));以及(iii)混合(例如,互動(dòng)式多媒體表現(xiàn))最優(yōu)化。DVD驅(qū)動(dòng)具有在某種程度上比8速CD-ROM播放器要快的傳輸速率。DVD格式通常使用MPEG-2文件和壓縮標(biāo)準(zhǔn),其具有大約4倍于MPEG-1圖像的分辨率并且可以以大約60交織文件每秒傳送,其中兩個(gè)場(chǎng)構(gòu)成一個(gè)圖像(MPEG-1傳送大約30非交織幀每秒)。MPEG-2和-1標(biāo)準(zhǔn)在這里的其它地方更詳細(xì)的定義。在DVD上的音頻質(zhì)量可以和當(dāng)前的音頻光盤的質(zhì)量相比。
“DVD-視頻”是通常給予為完整長(zhǎng)度的電影分配的DVD格式的名稱,并且是將和電視機(jī)一起工作的盒。“DVD-ROM”是給予被一些人認(rèn)為將來(lái)在計(jì)算機(jī)中將代替CD-ROM驅(qū)動(dòng)的播放器的名稱,因?yàn)檫@些更新的驅(qū)動(dòng)意在播放通常的CD-ROM光盤和DVD-ROM光盤?!癉VD-RAM”是給予DVD的可寫版本的名稱?!癉VD-音頻”通常是給予分配來(lái)代替小型音樂(lè)音頻光盤播放器的播放器的名稱。
“VHS”是“視頻家庭系統(tǒng)”的首字母縮寫并且通常被定義為視頻磁帶盒格式,通常半寸寬,為家庭使用開(kāi)發(fā),具有記錄和回放模擬視頻和音頻信號(hào)的性能。主要因?yàn)樗膹V泛的存在和可記錄性,VHS成為流行的格式和用于家庭電影銷售和復(fù)制的事實(shí)上的標(biāo)準(zhǔn)。VHS使用類似于錄音帶的技術(shù)將信號(hào)作為模擬格式存儲(chǔ)在磁帶上。使用VHS錄像機(jī)(VHS VCR)來(lái)回放磁帶并在其上記錄。VHS磁帶通常存儲(chǔ)多達(dá)兩小時(shí)的視頻,盡管一些VCR能夠以更慢的速度記錄它們,從而能夠允許在每個(gè)磁帶上記錄六小時(shí)或甚至八小時(shí)。
VHS格式輸出略高于200線的水平分辨率。相比DVD輸出超過(guò)500線的水平分辨率。從技術(shù)上和感覺(jué)上,VHS是被其它格式,包括,例如,DVD,S-VHS,Hi-8和其它超越的格式。但是,VHS仍然是用于觀看視頻的主要方式,并且在整個(gè)國(guó)家和世界范圍內(nèi)仍然可以在四處從電影租賃店到雜貨店很容易的找到,使得它們易于獲得。
“CD”是“光盤”的縮寫,并且通常被定義為小的、可攜帶的、圓形的用于以電子格式電子的記錄、存儲(chǔ)和/或播放視頻、音頻、文本和其它信息的媒介。最初,CD僅是只讀的;但是,更新的版本還允許用于記錄(例如“CD-RW”)“超級(jí)音頻光盤”或“SACD”是高分辨率的音頻CD格式,其和DVD-音頻(“DVD-A”)一起是競(jìng)爭(zhēng)來(lái)取代標(biāo)準(zhǔn)的音頻CD的兩個(gè)格式(雖然多數(shù)工業(yè)廠商通常支持DVD-A,但是例外的通常包括Philips和Sony)。SACD,像DVD-A一樣,除了2信道立體聲,還提供5.1聲道環(huán)繞聲。通過(guò)增加比特速率和采樣速率,兩個(gè)格式都可以改進(jìn)聲音的復(fù)雜性,并且可以在現(xiàn)有的CD播放器上播放,盡管通常僅可以達(dá)到類似于傳統(tǒng)CD的質(zhì)量等級(jí)。SACD使用直接流數(shù)字(“DSD”)記錄,其是Sony公布獨(dú)有的,將模擬波形轉(zhuǎn)換為1比特的用于直接記錄的信號(hào),而不是脈沖碼調(diào)制(“PCM”)和由標(biāo)準(zhǔn)的CD使用的濾波。DSD使用無(wú)損的壓縮和大約2.8MHz的取樣速率來(lái)改進(jìn)聲音的復(fù)雜性和真實(shí)性。SACD可能還包括另外的信息,比如文本、圖形和視頻剪輯。
同樣為了進(jìn)一步理解的目的,基于互聯(lián)網(wǎng)的通信還具有用于必須由使用互聯(lián)網(wǎng)“超高速公路”的流媒體通信系統(tǒng)相容的通信的特殊協(xié)議。這些協(xié)議,特別是關(guān)于流媒體通信的,為了提供更為詳細(xì)的理解的目的,將在下面緊接著進(jìn)行總結(jié)。
關(guān)于互聯(lián)網(wǎng)通信,通常以數(shù)字格式通過(guò)數(shù)據(jù)分組傳遞流媒體信號(hào)。術(shù)語(yǔ)“分組”這里意在表示在源和目的地之間通過(guò)互聯(lián)網(wǎng)或任意其它分組交換網(wǎng)絡(luò)路由的數(shù)據(jù)的單元。更為特別的,當(dāng)發(fā)送文件時(shí),通信系統(tǒng)的協(xié)議層(例如,基于TCP/IP的系統(tǒng)的TCP層)將文件分為用于路由的大塊有效尺寸。對(duì)這些分組的每一個(gè)分開(kāi)計(jì)數(shù)并且其包括目的地的互聯(lián)網(wǎng)地址。用于給定文件的單獨(dú)的分組可能通過(guò)互聯(lián)網(wǎng)沿著不同路徑傳播。當(dāng)它們?nèi)康竭_(dá)時(shí),將它們重新組合為最初的文件,例如,通過(guò)在接收端的TCP層。分組交換方案是有效的處理在無(wú)連接的網(wǎng)絡(luò),比如互聯(lián)網(wǎng)上的傳輸?shù)姆绞?。作為選擇的方案,電路交換,用于通常為語(yǔ)音連接分配的網(wǎng)絡(luò)。在電路交換中,在網(wǎng)絡(luò)中的線路由很多具有電路交換的用戶共享,但是在連接的過(guò)程中,每一連接通常需要專用的特別路徑。
無(wú)線通信和WAP網(wǎng)關(guān)和先進(jìn)的互聯(lián)網(wǎng)時(shí)代具有同等的重要性,無(wú)線通信的時(shí)代顯著的延伸了公眾和家庭及辦公室的固定界限的外部互動(dòng)的能力,允許我們的遠(yuǎn)程通信剪斷和線路及電纜的臍帶。例如,在2000年,移動(dòng)用戶的數(shù)量增加了將近50%。
但是,無(wú)線通信系統(tǒng)、協(xié)議和啟動(dòng)技術(shù)以特別不連續(xù)的方式開(kāi)發(fā),在世界范圍內(nèi)形成了“特定格式”的市場(chǎng)。相比世界的其它地方,廣泛用在美國(guó)的系統(tǒng)更是如此。因此,做了大量工作來(lái)克服特定格式的系統(tǒng)和相關(guān)的操作在不同平臺(tái)的無(wú)線裝置之間的兼容性問(wèn)題。因?yàn)槠渲笊婕氨景l(fā)明,為了進(jìn)一步理解無(wú)線通信的目的,下面將對(duì)用在無(wú)線通信工業(yè)中的重要的技術(shù),系統(tǒng)和協(xié)議作一個(gè)簡(jiǎn)單的回顧。
通常,對(duì)于用于蜂窩電話的無(wú)限通信系統(tǒng)的進(jìn)步,我們通俗的說(shuō),一般使用術(shù)語(yǔ)“1G”,“2G”,“2.5G”和“3G”,分別表示第一代、第二代等等。最初的系統(tǒng)完全是模擬的,稱作為1G電話和系統(tǒng)。但是,隨著快速發(fā)展,用于手機(jī)的可用帶寬快速減少,將道路讓給了在2G中處理的數(shù)字信號(hào),其顯著的拓寬了可用帶寬和用于高級(jí)電信的復(fù)雜信號(hào)處理的性能。但是,隨著用于無(wú)線互聯(lián)網(wǎng)接入的需求增加,產(chǎn)生了從2G電話(通常沒(méi)有互聯(lián)網(wǎng)功能)的技術(shù)發(fā)展,到2.5G和3G(逐漸具有互聯(lián)網(wǎng)功能)。像接下來(lái)將立即進(jìn)一步開(kāi)發(fā)的,系統(tǒng)、協(xié)議和啟用技術(shù)的開(kāi)發(fā)將主要集中到使得2.5G和3G模式投入大規(guī)模生產(chǎn)和使用。
通常,基于2G技術(shù)主要有四種數(shù)字無(wú)線網(wǎng)絡(luò)時(shí)分多址(“TDMA”)、碼分多址(“CDMA”),全球移動(dòng)通信系統(tǒng)(“GSM”)和蜂窩數(shù)字分組數(shù)據(jù)(“CDPD”)。在下面將對(duì)它們進(jìn)行簡(jiǎn)要介紹。
時(shí)分多址(“TDMA”)是用在數(shù)字蜂窩電話通信中的技術(shù),為了增加可以攜帶的數(shù)據(jù)量,其將每一蜂窩信道劃分為三個(gè)時(shí)隙。TDMA由數(shù)字美國(guó)移動(dòng)電話服務(wù)(D-AMPS),全球移動(dòng)通信系統(tǒng)(“GSM”),和個(gè)人數(shù)字蜂窩(“PDC”)使用。但是,這些系統(tǒng)中的每一個(gè)以在一定程度上不同和不兼容的方式實(shí)現(xiàn)TDMA。TDMA和FDMA(頻分多址)的一個(gè)作為選擇的多路復(fù)用方案是碼分多址(“CDMA”)。
碼分多址(“CDMA”)指的是任意一些用在2G和3G無(wú)線通信中的協(xié)議。像術(shù)語(yǔ)所表示的,CDMA是一種多路復(fù)用的形式,其允許多個(gè)信號(hào)占據(jù)單一的傳輸信道,最優(yōu)化可用帶寬的使用。該技術(shù)用在800MHz到1.9GHz帶寬的超高頻率(UHF)蜂窩電話系統(tǒng)中。CDMA使用模擬數(shù)字轉(zhuǎn)換(ADC)并結(jié)合頻譜擴(kuò)展技術(shù)。首先將音頻輸入數(shù)字化為二進(jìn)制成分。之后根據(jù)定義的模式(碼)來(lái)使發(fā)送的信號(hào)頻率不同,使得其僅可以由其頻率響應(yīng)由相同碼編程,并因此準(zhǔn)確地符合發(fā)射機(jī)頻率的接收機(jī)獲取。存在萬(wàn)億種可能的頻率序列碼,這樣提高了隱私性并且使其難以被復(fù)制。CDMA信道通常是1.23MHz寬。CDMA網(wǎng)絡(luò)使用所謂的“軟切換”的方案,其可以最小化隨著手機(jī)從一個(gè)小區(qū)移動(dòng)到另一小區(qū)產(chǎn)生的信號(hào)中斷。數(shù)字和擴(kuò)展頻譜模式的組合在每單元帶寬中支持幾倍于模擬模式的信號(hào)。CDMA可以和其它蜂窩技術(shù)兼容;這允許全國(guó)范圍的漫游。
最初的CDMA,也就是CDMA ONE,于1993年實(shí)現(xiàn)標(biāo)準(zhǔn)化并且被認(rèn)為是在美國(guó)的手機(jī)中仍然普遍使用的2G技術(shù)。CDMA ONE的一個(gè)版本,IS-95A,是采用1.25MHz載波并且操作在800MHz到1.9GHzRF通帶中的協(xié)議;這個(gè)協(xié)議支持高達(dá)14.4Kbps的數(shù)據(jù)速率。另一版本,IS-95B,通過(guò)捆綁八個(gè)信道能夠支持高達(dá)115Kbps的速度。
近來(lái)的CDMA變型,CDMA2000和寬帶CDMA提供速度快很多倍的數(shù)據(jù)速率。CDMA2000,也被稱為IMT-CDMA多載波或IS-136,是由國(guó)際電信聯(lián)盟(ITU)開(kāi)發(fā)的IMT-2000標(biāo)準(zhǔn)的CDMA版本。該CDMA 2000標(biāo)準(zhǔn)是3G技術(shù),其意在支持在從144Kbps到2Mbps范圍內(nèi)的速率的數(shù)據(jù)通信。開(kāi)發(fā)這種標(biāo)準(zhǔn)的版本的公司包括Ericsson和Qualcomm公司。寬頻CDMA,或者“WCDMA”,是從已知為IMT-2000直接擴(kuò)頻的CDMA引出的ITU標(biāo)準(zhǔn)。WCDMA是意在對(duì)于本地區(qū)域接入支持高達(dá)2Mbps,或者對(duì)于廣義區(qū)域接入的384Kbps的數(shù)據(jù)速率的3G技術(shù),并且支持在這些速度的移動(dòng)/便攜式語(yǔ)音、圖像、數(shù)據(jù)和視頻通信。WCDMA將輸入信號(hào)數(shù)字化并且以編碼的、擴(kuò)頻模式在5MHz寬的載波上發(fā)送數(shù)字化的輸出,這比200KHz寬的窄帶CDMA的范圍要寬很多。
全球移動(dòng)通信系統(tǒng)(“GSM”)是廣泛用在歐洲和世界的其它地方的數(shù)字移動(dòng)電話系統(tǒng);這個(gè)系統(tǒng)使用“TDMA”的變型(緊接著將進(jìn)行介紹)并且是三種數(shù)字無(wú)線電話技術(shù)(TDMA,GSM,和CDMA)中最常用的。GSM將數(shù)據(jù)數(shù)字化、壓縮、并且之后沿著信道和兩個(gè)其它用戶數(shù)據(jù)流一起發(fā)送,每一都在它自己的時(shí)隙內(nèi)。它操作在900MHz或1800MHz頻帶。在這個(gè)公開(kāi)的時(shí)間里,通常認(rèn)為GSM是在歐洲的無(wú)線電話標(biāo)準(zhǔn),并且公開(kāi)其在世界范圍內(nèi)具有超過(guò)1.2億用戶并且在120個(gè)國(guó)家可用。至少一個(gè)美國(guó)公司,美國(guó)個(gè)人通信(SprintTM)使用GSM作為寬帶個(gè)人通信服務(wù)(“PCS”)的技術(shù)。PCS是將語(yǔ)音通信、數(shù)字和文本消息、語(yǔ)音郵件和多種其它特征捆綁為一個(gè)裝置,服務(wù)合同和帳單的電信服務(wù)。PCS最為通常是在數(shù)字蜂窩鏈路上執(zhí)行。規(guī)劃的這個(gè)服務(wù)具有超過(guò)400個(gè)用于多種由比如Ericsson,Motorola,和Nokia公司制造的小型移動(dòng)手機(jī)的基站;這些裝置通常包括電話、文本尋呼機(jī)、以及答錄機(jī)。GSM是無(wú)線移動(dòng)電信革命的一部分,其包括高速電路交換數(shù)據(jù)(HCSD),通用分組無(wú)線系統(tǒng)(GPRS),增強(qiáng)型數(shù)據(jù)GSM環(huán)境(EDGE),和全球移動(dòng)電信服務(wù)(UMTS)。
蜂窩數(shù)字分組數(shù)據(jù)(“CDPD”)是在現(xiàn)有蜂窩電話信道上提供雙向19.2Kbps分組數(shù)據(jù)傳輸?shù)臒o(wú)線標(biāo)準(zhǔn)。
一些不同協(xié)議已在用于通過(guò)多種無(wú)線網(wǎng)絡(luò)的通信中使用。將在下面簡(jiǎn)要介紹多種特定的這些協(xié)議。
“X25”是基于分組的協(xié)議,在這個(gè)公開(kāi)的時(shí)間主要用在歐洲并且適于由國(guó)際電報(bào)與電話顧問(wèn)委員會(huì)(CCITT)的標(biāo)準(zhǔn)。X.25是常用的網(wǎng)絡(luò)協(xié)議,其允許在不同公共網(wǎng)絡(luò)上的計(jì)算機(jī)(例如,CompuServe,Tymnet,或TCP/IP網(wǎng)絡(luò))來(lái)通過(guò)在網(wǎng)絡(luò)層級(jí)別的中間計(jì)算機(jī)通信。X.25的協(xié)議緊密對(duì)應(yīng)在開(kāi)放式系統(tǒng)互連(“OSI”)中的數(shù)據(jù)鏈路和物理層協(xié)議。
“OSI”是網(wǎng)絡(luò)結(jié)構(gòu)和一套來(lái)實(shí)現(xiàn)它的協(xié)議(協(xié)議棧)的模型,由ISO在1978年作為用于在不同種類的計(jì)算機(jī)網(wǎng)絡(luò)結(jié)構(gòu)中的國(guó)際標(biāo)準(zhǔn)的框架開(kāi)發(fā)。OSD結(jié)構(gòu)分為七層,從最低到最頂(1)物理層;(2)數(shù)據(jù)鏈路層;(3)網(wǎng)絡(luò)層;(4)傳輸層;(5)對(duì)話層;(6)表示層;和(7)應(yīng)用層。每一層使用在其下緊鄰的層并且提供服務(wù)到上層。在一些實(shí)施中,層本身可能包括子層。
通用分組無(wú)線服務(wù)(“GPRS”)是基于分組的無(wú)線通信服務(wù),其允許從56到114Kbps的數(shù)據(jù)速率,并且為移動(dòng)電話和計(jì)算機(jī)用戶持續(xù)連接到互聯(lián)網(wǎng)。更高的數(shù)據(jù)速率將允許用戶參與視頻會(huì)議并且和多媒體網(wǎng)絡(luò)站點(diǎn)互動(dòng),以及類似的使用移動(dòng)手持裝置和筆記本計(jì)算機(jī)的應(yīng)用。GPRS基于移動(dòng)通信全球系統(tǒng)(“GSM”)并且將補(bǔ)充現(xiàn)有服務(wù),比如電路交換手機(jī)連接和短消息服務(wù)(“SMS”)。SMS是由GSM數(shù)字手機(jī)系統(tǒng)提供的消息服務(wù)。使用SMS,可以將短的字符消息(160字母字符)發(fā)送到移動(dòng)電話并在那里顯示,更像是在字母尋呼機(jī)系統(tǒng)中的。該消息由GSM網(wǎng)絡(luò)緩存直到電話成為活動(dòng)為止。
GPRS的基于分組的服務(wù)宣稱將花費(fèi)用戶少于電路交換的服務(wù)的成本,因?yàn)橥ㄐ判诺朗枪蚕淼模鳛榛诜纸M需要使用而不是在一個(gè)時(shí)間僅專用于一個(gè)用戶。它還意在使得應(yīng)用對(duì)移動(dòng)用戶可用,因?yàn)楦斓臄?shù)據(jù)速率意味著不再需要當(dāng)前需要適宜應(yīng)用到更慢的無(wú)線系統(tǒng)速度的中間設(shè)備。隨著GPRS成為廣泛可用的,虛擬個(gè)人網(wǎng)絡(luò)(“VPN”)的移動(dòng)用戶將能夠持續(xù)接入個(gè)人網(wǎng)絡(luò)而不是通過(guò)撥號(hào)連接。GPRS還意在實(shí)現(xiàn)“藍(lán)牙”,用于代替在裝置之間的有線連接的無(wú)線無(wú)線電連接的標(biāo)準(zhǔn)。除了互聯(lián)網(wǎng)協(xié)議(“IP”),GPRS支持X.25協(xié)議。還認(rèn)為GPRS是邁向增強(qiáng)型數(shù)據(jù)GSM環(huán)境(“EDGE”)和通用移動(dòng)電話服務(wù)(“UMTS”)的革命性的步驟。
全球移動(dòng)電信服務(wù)(“UMTS”)意在是在高達(dá)2Mbps的數(shù)據(jù)速率的3G,寬帶基于分組的文本、數(shù)字化語(yǔ)音,視頻和多媒體傳輸。UMTS還意在無(wú)論移動(dòng)計(jì)算機(jī)和電話用戶在世界上的什么位置,提供一致的一組服務(wù)給它們。這個(gè)服務(wù)基于GSM通信標(biāo)準(zhǔn),并且由主要的標(biāo)準(zhǔn)實(shí)體和制造商所認(rèn)可,而且是到2002年在世界范圍內(nèi)用于移動(dòng)用戶的計(jì)劃標(biāo)準(zhǔn)。一旦完全實(shí)現(xiàn)UMTS,計(jì)算機(jī)和電話用戶可以在他們旅行的過(guò)程中始終和互聯(lián)網(wǎng)連接。
增強(qiáng)型數(shù)字GSM規(guī)劃(“EDGE”)服務(wù)是全球無(wú)線系統(tǒng)(GSM)無(wú)線服務(wù)的更快速的版本,設(shè)計(jì)來(lái)以高達(dá)384Kbps的數(shù)據(jù)速率傳送數(shù)據(jù),并且可以傳送多媒體和其它寬帶應(yīng)用到移動(dòng)電話和計(jì)算機(jī)用戶。EDGE標(biāo)準(zhǔn)在現(xiàn)有的GSM標(biāo)準(zhǔn)上建立,使用相同的時(shí)分多址(TDMA)幀結(jié)構(gòu)并且被認(rèn)為是在到全球移動(dòng)電信服務(wù)(UMTS)的路途中的革命性的標(biāo)準(zhǔn)。
無(wú)線應(yīng)用協(xié)議(“WAP”)是用于一組通信協(xié)議來(lái)標(biāo)準(zhǔn)化無(wú)線服務(wù),比如手機(jī)和無(wú)線電收發(fā)機(jī)的路線的規(guī)范,可以用于互聯(lián)網(wǎng)接入,包括電子郵件、萬(wàn)維網(wǎng)、新聞組以及互聯(lián)網(wǎng)中繼聊天(“IRC”)。雖然互聯(lián)網(wǎng)接入在WAP之前就已經(jīng)實(shí)現(xiàn),但是不同的制造商使用“特定格式”的技術(shù)。WAP使得裝置和服務(wù)系統(tǒng)可以互相合作。
最近,為了橋接之前在無(wú)線裝置上將個(gè)人從“信息高速公路”分開(kāi)的軟線、線路和電纜之間的空隙,做了很多努力來(lái)混合無(wú)線通信和互聯(lián)網(wǎng)領(lǐng)域。這種技術(shù)的混合在,例如,家庭和辦公室網(wǎng)絡(luò)設(shè)置本身中開(kāi)發(fā),在該網(wǎng)絡(luò)中,開(kāi)發(fā)無(wú)線紅外線和無(wú)線電頻率通信系統(tǒng)用于連接“無(wú)線”辦公室或家庭中的裝備。對(duì)于和更多的遠(yuǎn)程無(wú)線裝置,比如手機(jī)和個(gè)人數(shù)字助理(“PDA”)通信和共享也作出了另一實(shí)質(zhì)性努力。
PDA通常是小的移動(dòng)裝置,其可能是“手持的”并且通常包括用于管理、存儲(chǔ)并且顯示電話地址簿、日歷、計(jì)算器和類似功能的有限的處理器和顯示屏。近來(lái)可用的PDA漸漸成為“具有無(wú)線功能”的,要么通過(guò)具有嵌入在PDA本身之中的無(wú)線調(diào)制解調(diào)器,要么和比如手機(jī)的無(wú)線調(diào)制解調(diào)器“插件”連接。具有無(wú)線功能的PDA還通常是“具有互聯(lián)網(wǎng)功能”的,具有有限的“瀏覽器”性能,允許PDA和服務(wù)器裝置通過(guò)互聯(lián)網(wǎng)通信。商用的無(wú)線“功能”PDA的實(shí)例包括PalmVII(來(lái)自Palm有限公司)以及IPAQ(來(lái)自Compaq,)。這些PDA包括Windows CE操作系統(tǒng),其提供有限的瀏覽器性能以及用于內(nèi)容的屏幕顯示。這些電話具有從大約33MHz到大約220MHz的處理性能以及不同的屏幕顯示性能,例如,320×240象素屏幕顯示。
類似的,近年來(lái)手機(jī)本身也漸漸成為“具有互聯(lián)網(wǎng)功能”的,也具有有限的瀏覽器性能和顯示內(nèi)容的屏幕。“具有互聯(lián)網(wǎng)性能”的手機(jī)的實(shí)例包括,例如在大量其它同類中的Sanyo SCP-4000,MotorolaIL000PLUSTM;這個(gè)很寬的領(lǐng)域表示數(shù)百個(gè)不同的處理和顯示性能。
在“具有互聯(lián)網(wǎng)功能”的PDA或手機(jī)的情況中,必須實(shí)現(xiàn)和通信的互聯(lián)網(wǎng)協(xié)議的兼容性。通常,無(wú)線通信發(fā)生在無(wú)線應(yīng)用協(xié)議(“WAP”)上,然而在根據(jù)一些不同協(xié)議中的一個(gè)的互聯(lián)網(wǎng)處理上,最一般的是傳輸控制協(xié)議/互聯(lián)網(wǎng)協(xié)議(“TCP/IP”)。因此,如圖1E所示的WAP網(wǎng)關(guān),在基本技術(shù)上根本不同的互聯(lián)網(wǎng)世界(或任意其它IP分組網(wǎng)絡(luò))和無(wú)線電話/數(shù)據(jù)網(wǎng)絡(luò)化之間形成橋接。本質(zhì)上,網(wǎng)絡(luò)做出在這兩個(gè)不同實(shí)體之間的解釋,允許用戶使用他們的電話或手持計(jì)算機(jī)裝置(例如,PDA)來(lái)無(wú)線接入互聯(lián)網(wǎng)。
但是,用于傳輸?shù)礁吣芰康挠?jì)算裝置,比如具有可觀的顯示性能的筆記本計(jì)算機(jī)的流媒體通常不和這些具有十分有限的處理和顯示功能性的裝置兼容以由他們接收和觀看。開(kāi)發(fā)特別的“特定格式”的壓縮方案用于特別用在這些裝置中,并且僅特定媒體內(nèi)容可以被以那些格式發(fā)送到這些裝置。
仍然需要適于以合適的由無(wú)線裝置,比如具有獨(dú)特的限定條件的手機(jī)和PDA播放的格式發(fā)送很多種類的流媒體信號(hào)的流媒體通信系統(tǒng),其中約束條件包括,例如,有限的和可變的處理、存儲(chǔ)和顯示性能。
發(fā)明內(nèi)容
本發(fā)明提出并克服了先前已知的用于流媒體通信的方法的多種限制、低效、資源限制和不兼容性,并且在下面提供多種有益的模式,方案,實(shí)施例和變型。
根據(jù)一個(gè)實(shí)施例,本發(fā)明提供了一種流媒體通信系統(tǒng),其是在網(wǎng)絡(luò)系統(tǒng),比如神經(jīng)網(wǎng)絡(luò)中使用計(jì)算機(jī)實(shí)現(xiàn)的智能系統(tǒng),比如人工智能,來(lái)在傳輸裝置和至少一個(gè)目的裝置之間傳遞流媒體信號(hào)。
本發(fā)明根據(jù)的另一實(shí)施例,提供了一種用于在傳輸裝置和多個(gè)每一都具有不同媒體信號(hào)處理性能的目的裝置之間傳遞流媒體信號(hào)的系統(tǒng)。
本發(fā)明根據(jù)另一實(shí)施例,提供了一種流媒體通信系統(tǒng),其適于從單一的傳輸裝置和至少一個(gè)目的裝置通過(guò)多個(gè)不同的傳輸信道傳遞流媒體信號(hào),其中多個(gè)傳輸信道每一具有關(guān)于傳遞流媒體信號(hào)的不同的傳輸性能或約束條件。
本發(fā)明根據(jù)另一實(shí)施例,提供了一種包含有人工智能實(shí)現(xiàn)的神經(jīng)網(wǎng)絡(luò),其適于在適應(yīng)性的學(xué)習(xí)處理中被訓(xùn)練,其中的學(xué)習(xí)處理關(guān)于流媒體壓縮系統(tǒng)在源將流媒體信號(hào)壓縮為流媒體信號(hào)的壓縮的表示的能力,通過(guò)傳輸信道將壓縮的表示發(fā)送到目的裝置的能力,以及將壓縮的表示解壓為流媒體信號(hào)的適于由目的裝置播放的解壓的表示的能力。
本發(fā)明根據(jù)另一實(shí)施例,提供了一種用于根據(jù)CODEC壓縮流媒體信號(hào)的系統(tǒng),其中至少部分基于影響流媒體信號(hào)的通信的參數(shù)中的至少一個(gè)來(lái)使用CODEC。根據(jù)這個(gè)模式的一個(gè)方面,根據(jù)至少一個(gè)下面的參數(shù)來(lái)使用CODEC關(guān)于另一參考信號(hào)的CODEC的先前學(xué)習(xí)到的行為,關(guān)于壓縮或解壓相同的流媒體信號(hào)的先前的嘗試的CODEC的先前學(xué)習(xí)到的行為,關(guān)于流媒體信號(hào)的CODEC的操作和流媒體信號(hào)的參考算法壓縮的比較,傳輸信道的學(xué)習(xí)到的約束條件,以及目的裝置的學(xué)習(xí)到的約束條件。在一個(gè)有益的實(shí)施例中,基于多于一個(gè)的這些參數(shù)使用CODEC,并且在此外的有益的變型中基于所有這些參數(shù)使用CODEC。
本發(fā)明根據(jù)另一實(shí)施例,提供了一種用于使用CODEC庫(kù)壓縮流媒體信號(hào)的系統(tǒng),其中CODEC庫(kù)適于存儲(chǔ)多個(gè)不同類型和操作的CODECS,并且適于由網(wǎng)絡(luò)系統(tǒng)、比如神經(jīng)網(wǎng)絡(luò)搜索和存取以從CODEC庫(kù)中提供用于用在將輸入的流媒體信號(hào)壓縮為用于傳輸?shù)侥康难b置的壓縮的表示的合適的CODEC。
本發(fā)明根據(jù)另一實(shí)施例,提供了一種CODCE操作系統(tǒng),其適于與CODEC庫(kù)和神經(jīng)網(wǎng)絡(luò)連接,以在處理中,比如人工智能處理中使用神經(jīng)網(wǎng)絡(luò)來(lái)從CODEC庫(kù)中選擇合適的CODEC,并且使用所選的CODEC用于將流媒體信號(hào)壓縮為用于傳輸?shù)侥康难b置的流媒體信號(hào)的壓縮的表示。
根據(jù)一個(gè)方面,CODEC庫(kù)適于接收并存儲(chǔ)新的CODEC,使得這些新的CODEC可能與神經(jīng)網(wǎng)絡(luò)的連接,以便在被提供時(shí)被選擇并被應(yīng)用來(lái)壓縮流媒體信號(hào)。
本發(fā)明根據(jù)另一實(shí)施例,提供了一種目的代理,其適于由目的裝置存儲(chǔ),以用在解壓流媒體信號(hào)的壓縮的表示中。目的代理適于和遠(yuǎn)程的壓縮的流媒體傳輸系統(tǒng)通信,以接收并播放來(lái)自那里的流媒體信號(hào)。在特別有益的方面中,軟件代理適于傳送關(guān)于目的裝置的信息到壓縮的流媒體傳輸系統(tǒng),并且還適于接收和解碼來(lái)自壓縮的流媒體傳輸系統(tǒng)的確定的編碼流媒體信號(hào)。
本發(fā)明根據(jù)另一實(shí)施例,提供了一種用于傳遞具有目的代理的流媒體信號(hào)的系統(tǒng),其中目的代理適于被存儲(chǔ)在目的裝置中,以將流媒體信號(hào)的壓縮的表示解壓為可由目的裝置播放的解壓的表示。
根據(jù)這個(gè)實(shí)施例的一個(gè)方面,目的代理具有診斷代理和解壓代理。診斷代理適于確定用于目的裝置的關(guān)于用于處理、存儲(chǔ)或顯示的性能的至少一個(gè)參數(shù)的值。解壓代理適于使用至少部分基于至少一個(gè)參數(shù)的值的CODEC來(lái)應(yīng)用CODEC解壓器來(lái)將流媒體信號(hào)的壓縮的表示解壓為解壓的表示。
根據(jù)另一方面,目的代理包括軟件代理。在一個(gè)變型中,將軟件代理被嵌入目的裝置。在另一變型中,軟件代理適于至少部分由遠(yuǎn)程的源載入到目的裝置上,其中遠(yuǎn)程的源適于將流媒體信號(hào)的壓縮的表示傳送到目的裝置。
本發(fā)明根據(jù)另一實(shí)施例,提供了一種用于對(duì)流媒體信號(hào)在至少一個(gè)最初的格式和至少一個(gè)經(jīng)過(guò)代碼轉(zhuǎn)換的格式之間進(jìn)行代碼轉(zhuǎn)換的代碼轉(zhuǎn)換器。代碼轉(zhuǎn)換器包括用于一些流媒體信號(hào)中的每一個(gè)的單一線程。
本發(fā)明根據(jù)另一實(shí)施例,提供了一種視頻點(diǎn)播流媒體系統(tǒng),包括有在附圖中示出的實(shí)施例和其它在這里描述的。
本發(fā)明根據(jù)另一實(shí)施例,提供了一種移動(dòng)電話通信系統(tǒng),其包括有在附圖中示出的實(shí)施例和其它在這里描述的。
本發(fā)明根據(jù)另一實(shí)施例,提供了一種互動(dòng)游戲系統(tǒng),其包括有在附圖中示出的實(shí)施例和其它在這里描述的。
本發(fā)明根據(jù)另一實(shí)施例,在這里包括有上面和其它地方公開(kāi)的多種模式、實(shí)施例、方案、特征和變型,用于靜態(tài)媒體,以及在處理(例如,壓縮)之后本地存儲(chǔ)并且不發(fā)送的媒體。
圖1A-B是示意性的方框圖,示出了使用現(xiàn)有的CODEC系統(tǒng)的兩個(gè)先前的媒體通信系統(tǒng)的各自的變型。
圖1C-D是示意性的方框圖,示出了先前的媒體代碼轉(zhuǎn)換機(jī)系統(tǒng)的兩個(gè)各自的變型。
圖1E是示意性的方框流程圖,示出了在先前的WAP網(wǎng)關(guān)通信系統(tǒng)中的多種相關(guān)的組分。
圖2-3是示意性的方框圖,示出了分別在兩個(gè)使用模式中的根據(jù)本發(fā)明的一個(gè)實(shí)施例的代碼轉(zhuǎn)換機(jī)系統(tǒng)。
圖4A-5是方框流程圖,分別示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的媒體通信系統(tǒng)的多種細(xì)節(jié)。
圖6是示意性的方框流程圖,示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的“視頻點(diǎn)播”流式視頻通信系統(tǒng)的多種相關(guān)組分。
圖7是示意性的方框流程圖,示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的無(wú)線流式視頻通信系統(tǒng)的多種相關(guān)組分。
圖8是示意性的方框流程圖,示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的WAP網(wǎng)關(guān)媒體通信系統(tǒng)的多種相關(guān)組分。
圖9是示意性的方框流程圖,示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的媒體通信系統(tǒng)的一個(gè)特別使用模式的回程過(guò)程中的無(wú)線通信系統(tǒng)的多種相關(guān)組分。
圖10是示意性的方框流程圖,示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的互動(dòng)游戲通信系統(tǒng)和置頂盒TV瀏覽的多種相關(guān)組分。
具體實(shí)施例方式
像通過(guò)下面的實(shí)施例以不多種方式示出的(并且通過(guò)參考附圖),本發(fā)明提供一種媒體通信系統(tǒng),其包括壓縮系統(tǒng)、傳送系統(tǒng)和解壓系統(tǒng),并且在另一方面包括代碼轉(zhuǎn)換機(jī)系統(tǒng)。通常,這些單獨(dú)的子系統(tǒng)的組合提供在多個(gè)編碼格式之間有效的對(duì)媒體進(jìn)行代碼轉(zhuǎn)換的能力,另外基于比如變量的大量系統(tǒng)參數(shù)定制隨機(jī)選擇的流媒體信號(hào)的壓縮、傳送、解壓。這些變量包括(例如,但是不限于)涉及下面的這些參數(shù)源視頻信號(hào),源發(fā)送裝置,傳輸模式,以及目的裝置。這些定制的媒體信號(hào)的壓縮、傳送和解壓以使其對(duì)于給定的、變化的、使用環(huán)境的最優(yōu)化有效。結(jié)果,可以以高效的標(biāo)準(zhǔn)和很寬的裝置兼容性傳遞很寬范圍的復(fù)雜的流媒體信號(hào),從而相對(duì)其它已知系統(tǒng)做出相當(dāng)?shù)母倪M(jìn)。
雖然在這里描述了整個(gè)流媒體通信系統(tǒng)的優(yōu)點(diǎn),每一描述的子系統(tǒng)也獨(dú)立的提供流媒體通信的有益的有用效果。多種子系統(tǒng)本身,以及多種這些子系統(tǒng)的組合的反復(fù),對(duì)于本領(lǐng)域普通技術(shù)人員,至少部分基于這個(gè)公開(kāi)來(lái)說(shuō)很明顯,并且還預(yù)期在本發(fā)明的范圍之內(nèi)。另外,整個(gè)通信系統(tǒng)的多種方案,以及每一描述的子系統(tǒng),也預(yù)期對(duì)于其它不是特別用于流媒體通信的應(yīng)用也是特別有用的。因此,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)說(shuō)很明顯,這些附加的應(yīng)用也進(jìn)一步預(yù)期在本發(fā)明的范圍之內(nèi),不論應(yīng)用什么特別的有用模式都可以改進(jìn)流媒體通信。代碼轉(zhuǎn)換機(jī)根據(jù)本發(fā)明提供視頻/音頻代碼轉(zhuǎn)換機(jī)200,其使得一個(gè)引入的視頻源210可以在沒(méi)有人為干涉的情況下在多個(gè)格式215(例如,MPEG4,Real VideoTM和QuicktimeTM)上從一個(gè)裝置流動(dòng)。根據(jù)本實(shí)施例的代碼轉(zhuǎn)換機(jī)200以其它商用代碼轉(zhuǎn)換機(jī)系統(tǒng)的一小部分價(jià)格提供實(shí)質(zhì)上更好的功能性。另外,因?yàn)橄到y(tǒng)工作“在空中(on-the-fly)”。顯著的減少了視頻源210的預(yù)壓縮。
更為特別的,根據(jù)本發(fā)明的代碼轉(zhuǎn)換機(jī)200系統(tǒng)和方法適于將來(lái)自任意壓縮或未壓縮格式的數(shù)字化的媒體進(jìn)行代碼轉(zhuǎn)換,按照要求實(shí)時(shí)復(fù)制為任意其它的壓縮格式。系統(tǒng)200和方法也使得可以進(jìn)行具有來(lái)自不同壓縮或未壓縮的格式的多個(gè)不同數(shù)據(jù)的多個(gè)媒體215的有效的、同步的處理,轉(zhuǎn)換為多樣的不同壓縮的格式。
通過(guò)參考圖3的方式在這里描述在這個(gè)系統(tǒng)中的本實(shí)施例的代碼轉(zhuǎn)換器200。如圖所示,第一播放器最初和裝有代碼轉(zhuǎn)換器200的服務(wù)器300連接。播放器格式(例如,Microsoft Media)、連接速度(例如,32Kbps)和協(xié)議(HTTP)是相同的。服務(wù)器300將實(shí)況或預(yù)先編碼的視頻拉進(jìn)“實(shí)況緩存器”或“高速緩存”310,并且將它們編碼為數(shù)字化的但是幾乎未壓縮的數(shù)據(jù)(例如,AVI或MPEG2)。然后,服務(wù)器300在連接速度(例如,32Kbps)載入合適的CODEC線程(例如,Microsoft Media)。之后,服務(wù)器300載入HTTP/MS播放器線程,其服務(wù)第一個(gè)客戶,并且之后,由使用M/S播放器的在100Kbps具有MMS的客戶請(qǐng)求第二個(gè)流。服務(wù)器在合適的100Kbps速率載入合適的MS CODEC線程。之后,服務(wù)器300載入MMS/MS播放器線程來(lái)服務(wù)第二個(gè)客戶。然后,由使用Real Player的客戶在具有RTSP的40Kbps上請(qǐng)求第三個(gè)流。服務(wù)器300在合適的40Kbps速率上載入合適的Real CODEC線程。之后,服務(wù)器300載入RTSP/Real player線程來(lái)服務(wù)第三個(gè)客戶。并且,這個(gè)示圖是示例性的,而且可以由其它的特定CODECS,以及其它比特速率等來(lái)替代。
為了提供本代碼轉(zhuǎn)換機(jī)實(shí)施例的進(jìn)一步的理解,圖3以應(yīng)用來(lái)為不同客戶服務(wù)多個(gè)不同視頻流的另一實(shí)例的方式示出了代碼轉(zhuǎn)換機(jī)200。
大致上,示出和描述的本代碼轉(zhuǎn)換機(jī)200使用“線程”通信而不是很多現(xiàn)有的代碼轉(zhuǎn)換技術(shù)使用的“IPC”和“內(nèi)部處理器通信”。為了這個(gè)代碼轉(zhuǎn)換機(jī)200的描述的目的,在這里術(shù)語(yǔ)“線程”意在表示程序中的控制流程的封裝(encapsulation)。單一線程的程序是那些“在一個(gè)時(shí)間”僅執(zhí)行通過(guò)他們的代碼的一個(gè)路徑。多線程程序可能具有通過(guò)不同碼的線程 “同時(shí)”運(yùn)行的一些線程。在通常的其中存在多個(gè)線程的處理中,在任意一個(gè)時(shí)間可能運(yùn)行零個(gè)或多個(gè)線程。這是根據(jù)在其上運(yùn)行處理的計(jì)算機(jī)的CPU的數(shù)量,并且還根據(jù)怎樣實(shí)現(xiàn)線程系統(tǒng)。雖然具有N個(gè)CPU的數(shù)量的機(jī)器或系統(tǒng)可能適于并行運(yùn)行不多于n個(gè)線程,根據(jù)本代碼轉(zhuǎn)換機(jī)發(fā)明的線程操作可能會(huì)通過(guò)在線程之間共享CPU來(lái)出現(xiàn)“同步”運(yùn)行比n多得多的線程。
代碼轉(zhuǎn)換機(jī)200提供概括的API,并且因此不以本地的編碼器總開(kāi)銷(大得多)存取CODEC。創(chuàng)建緩存310作為用于不同視頻流的客戶拉動(dòng)的功能。此外,本發(fā)明的代碼轉(zhuǎn)換機(jī)200使用用于每一不同連接的單一線程的網(wǎng)絡(luò)結(jié)構(gòu),如果客戶在相同內(nèi)容的緩存段中的話,將它們組合進(jìn)相同線程。代碼轉(zhuǎn)換機(jī)200以在這里示出和描述的一種方式使用線程,即,認(rèn)為其高度有益,因?yàn)檎J(rèn)為在單一處理中的兩個(gè)線程之間的內(nèi)容交換相對(duì)于使用在兩個(gè)處理之間的內(nèi)容交換便宜很多(處理/存儲(chǔ)/IO)。另外,除了用于堆棧和寄存器的,所有數(shù)據(jù)在線程之間共享的事實(shí)使得它們很自然的用于實(shí)現(xiàn)可以分解為子任務(wù)并且需要合作運(yùn)行的任務(wù)。
雖然為了達(dá)成來(lái)自一個(gè)情況一個(gè)情況(case-by-case)基礎(chǔ)的特殊需要,可在剛剛描述的代碼轉(zhuǎn)換機(jī)200周圍建立多種特定的結(jié)構(gòu)。但是,為了進(jìn)一步示出的目的,下面是一個(gè)更為詳細(xì)的使用所述的代碼轉(zhuǎn)換機(jī)200的實(shí)例。提供代碼轉(zhuǎn)換機(jī)200以適于支持大量的同步客戶流,其中每一具有不同的格式。特別的,這種系統(tǒng)可能支持超過(guò)5000同步流,并且在一些情況中是多于7000個(gè)同步客戶流,而且每一具有不同的視頻格式。此外,代碼轉(zhuǎn)換機(jī)200可能實(shí)現(xiàn)來(lái)將任意的大量的視頻源轉(zhuǎn)換為特別適用于很多不同的單獨(dú)客戶所需要的格式,其中每一客戶具有不同的需要。在一個(gè)特殊的實(shí)例中,可能將就像在這里描述的代碼轉(zhuǎn)換機(jī)200實(shí)現(xiàn)來(lái)支持這種在任意下面格式上的同時(shí)的高需要MPEG1;MPEG2;MPEG4;Motion JPEG;AVI;H.261;H.263;H.263+;RealVideoTM;G-8;QuickTimeTM;Shockware FlashyTM;IndeoCinepakTM;ASF。
進(jìn)一步預(yù)期代碼轉(zhuǎn)換機(jī)200可能適于整個(gè)通信系統(tǒng),以符合所有現(xiàn)有的和預(yù)期很快出現(xiàn)的固定和移動(dòng)的終端和裝置。另外,可能實(shí)現(xiàn)代碼轉(zhuǎn)換機(jī)200來(lái)適于輸出流式格式變量以動(dòng)態(tài)的適應(yīng)每一客戶的信道和平臺(tái)情況。此外,包含有代碼轉(zhuǎn)換機(jī)的系統(tǒng)適于支持載入平衡服務(wù)器和用于多代碼轉(zhuǎn)換機(jī)安裝的路由器。因此,認(rèn)為本發(fā)明的代碼轉(zhuǎn)換機(jī)200相比現(xiàn)有的代碼轉(zhuǎn)換技術(shù)和系統(tǒng)具有好得多的功能性和便宜很多的成本。
如上所述,多種不同的系統(tǒng)結(jié)構(gòu)可能結(jié)合本發(fā)明的代碼轉(zhuǎn)換機(jī)200并且不脫離本發(fā)明的范圍。但是,認(rèn)為適于提供剛剛描述的支持的有益標(biāo)準(zhǔn)的特殊結(jié)構(gòu)的更多細(xì)節(jié)包括下面的方面(i)雙P3-933處理器;(ii)任意Unix OS的變型;(iii)512MB RAM;備用的防火墻(firewire)或吉比特以太網(wǎng);備用的電源。這種系統(tǒng)可能以機(jī)架(rack)安裝的結(jié)構(gòu)設(shè)置,或者另外適于特殊需要。
應(yīng)該認(rèn)為本發(fā)明的代碼轉(zhuǎn)換機(jī)200的下面的方面是廣泛有益的,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)說(shuō),不論是獨(dú)立的或者以多種組合的方式,至少部分可從本公開(kāi)看出。
提供一種系統(tǒng)和方法,用于在用戶和核心空間中的異步軟件線程通信來(lái)在多處理器和/或分布的計(jì)算平臺(tái)(比如族)上執(zhí)行有效的代碼轉(zhuǎn)換。能觀察到這個(gè)方法比使用現(xiàn)有的IPC方法來(lái)實(shí)現(xiàn)代碼轉(zhuǎn)換機(jī)有效的多。創(chuàng)建CODEC算法的共享庫(kù)并且用來(lái)訪問(wèn)多種CODEC算法,由此引起相比現(xiàn)有的組合編碼器功能,比如用在大多數(shù)商業(yè)編碼器中的所需要的更少的處理總開(kāi)銷以及更低的存儲(chǔ)器使用。對(duì)于特殊的益處,通常的線程可能用于多個(gè)連接,并且事實(shí)上即使單一線程可能使用本代碼轉(zhuǎn)換機(jī)用于每一單獨(dú)的連接。
還提供了一種系統(tǒng)和方法,來(lái)在無(wú)論何時(shí)要求相同內(nèi)容并且動(dòng)態(tài)緩存(高速緩存)可能容納所有要求的數(shù)據(jù)點(diǎn)時(shí),為組合多個(gè)客戶來(lái)由相同線程服務(wù)(為了效率)。
媒體壓縮和傳送系統(tǒng)還根據(jù)本發(fā)明提供一種數(shù)據(jù)壓縮和傳送系統(tǒng)400用于實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù)信號(hào)處理,以最優(yōu)化在給定的一組約束條件上的最初的媒體數(shù)據(jù)的大致的再生。通過(guò)在圖4A和5中的方框流程圖的方式示意性的示出了這個(gè)系統(tǒng)400和方法。這個(gè)系統(tǒng)的多種有益特征和操作的進(jìn)一步描述在下面以通常包含有參考由這些圖4A-5所提供的描述的示例性的實(shí)例的方式提供。
圖4A是一方框圖,示出了本發(fā)明的數(shù)據(jù)壓縮和傳送系統(tǒng)400的一個(gè)實(shí)施例。如圖4A所示,數(shù)據(jù)壓縮和傳送系統(tǒng)400包括媒體模塊405,動(dòng)態(tài)播放器模塊407,圖像處理器410,基線快像模塊415,分類器417,標(biāo)準(zhǔn)質(zhì)量(QoS)模塊420,網(wǎng)絡(luò)層輸入模塊425和網(wǎng)絡(luò)輸出層模塊430。系統(tǒng)400進(jìn)一步包括神經(jīng)網(wǎng)絡(luò)處理單元440,計(jì)時(shí)器435,CODEC庫(kù)模塊445,動(dòng)態(tài)客戶請(qǐng)求模塊450,ICMP模塊455,裝置和網(wǎng)絡(luò)參數(shù)測(cè)量模塊460和傳送及發(fā)送模塊465。
在一個(gè)實(shí)施例中,位于服務(wù)器節(jié)點(diǎn)的系統(tǒng)400處理引入的未壓縮或先前壓縮的數(shù)據(jù)。系統(tǒng)400采用具有人工智能的神經(jīng)網(wǎng)絡(luò)440來(lái)監(jiān)控引入的數(shù)據(jù),以確定每一數(shù)據(jù)段的多個(gè)關(guān)鍵特性。系統(tǒng)400將引入的數(shù)據(jù)特性和在輸入信號(hào)(例如,視頻信號(hào))中的幀序列中的場(chǎng)景中的圖形的預(yù)先開(kāi)發(fā)的自我參考經(jīng)驗(yàn)式學(xué)習(xí)的規(guī)則的庫(kù)445相關(guān)聯(lián),并且和外部施加的約束條件相關(guān)聯(lián),來(lái)為每一數(shù)據(jù)段最優(yōu)化的選擇優(yōu)選的商用壓縮/解壓算法(例如,CODEC)。之后系統(tǒng)400建立使用控制、參數(shù)和變量的延伸陣列來(lái)最優(yōu)化所選的算法。算法的選擇以及參數(shù)和變量的建立將動(dòng)態(tài)的隨每一引入的數(shù)據(jù)段根據(jù)數(shù)據(jù)特性以及最優(yōu)化處理過(guò)程本身的發(fā)展而改變??赡艿乃惴ǖ脑O(shè)置很多,僅由可用性和其它商業(yè)考慮限定。將每一數(shù)據(jù)段以上述方式編碼并壓縮,之后用于通信信道。
剛剛描述的壓縮系統(tǒng)400對(duì)于流媒體壓縮引擎特別有用,其中,引擎基于來(lái)自可用的CODEC的信息,并且流媒體傳送系統(tǒng)使用另一人工智能神經(jīng)網(wǎng)絡(luò)440執(zhí)行引入的視頻的一幀一幀的分析。之后系統(tǒng)400選擇最合適的壓縮格式,并且基于如在一個(gè)實(shí)施例,來(lái)自下層的系統(tǒng)環(huán)境的峰值信號(hào)的噪聲比率的選擇中測(cè)量的最好的質(zhì)量設(shè)置壓縮參數(shù)用于最優(yōu)化視頻壓縮。結(jié)果是用于本裝置和情況的“最優(yōu)化”的視頻和音頻服務(wù)。
在下面提供作為應(yīng)用到流媒體信號(hào)的這個(gè)系統(tǒng)的更為特定的人工智能/神經(jīng)網(wǎng)絡(luò)440的說(shuō)明方面。最初,將分開(kāi)的和不同的CODEC庫(kù)添加到系統(tǒng),作為可搜索的CODEC庫(kù)445。也提供相關(guān)參考信息的另外的庫(kù),包括網(wǎng)絡(luò)傳輸標(biāo)準(zhǔn)(NTS)庫(kù)443;服務(wù)質(zhì)量(QoS)庫(kù)447。之后,以數(shù)字化或非數(shù)字化格式(使用AD轉(zhuǎn)換)通過(guò)圖像處理器410產(chǎn)生視頻(媒體源)。之后圖像處理器410解壓源(如果需要)并且采用用于“清除”源圖像的多種標(biāo)準(zhǔn)圖像處理算法。作為結(jié)果的源媒體之后通過(guò)基線快像415知識(shí)庫(kù),其中它將用作用于今后比較的“完美的金標(biāo)準(zhǔn)”。類似的,還將這個(gè)產(chǎn)生的源媒體送到分類器417。
為了創(chuàng)建展示時(shí)間、空間和邏輯特征的類似組合的源媒體子段,分類器417分析源媒體的時(shí)間、空間和邏輯的特征。定義“類似的”以表示包括通常的時(shí)間、空間和邏輯特征的源媒體的相鄰的子段,這些特征賦予子段本身特殊的編碼/壓縮算法(比如在CODEC庫(kù)445中找到的)。將這個(gè)源媒體子段(或,在一個(gè)實(shí)施例,一組相鄰的視頻和音頻幀)表示為“場(chǎng)景”。
之后,神經(jīng)網(wǎng)絡(luò)過(guò)程440通過(guò)采用來(lái)自CODEC庫(kù)445的CODEC來(lái)操作在這個(gè)場(chǎng)景上,從而壓縮該場(chǎng)景。每一CODEC的內(nèi)部結(jié)構(gòu)根據(jù)從NTS庫(kù)443、QoS庫(kù)447、計(jì)時(shí)器處理435、網(wǎng)絡(luò)輸入層425、ICMP代理455和裝置和網(wǎng)絡(luò)參數(shù)測(cè)量代理460獲得的輸入來(lái)操縱/改變。然后解壓壓縮的場(chǎng)景,并且使用由質(zhì)量標(biāo)準(zhǔn)處理420做出的質(zhì)量測(cè)量相對(duì)基線快像415進(jìn)行比較。在本發(fā)明的一個(gè)實(shí)施例中,為了執(zhí)行解壓的場(chǎng)景和源媒體的基線快像的比較,質(zhì)量標(biāo)準(zhǔn)處理420采用峰值信號(hào)噪聲比(PSNR)算法。對(duì)于多個(gè)來(lái)自CODEC庫(kù)445的CODEC重復(fù)比較過(guò)程,直到神經(jīng)網(wǎng)絡(luò)處理440在從NTS庫(kù)443、QoS庫(kù)447、計(jì)時(shí)器處理435、網(wǎng)絡(luò)輸入層425、ICMP代理455和裝置和網(wǎng)絡(luò)參數(shù)測(cè)量代理460接收的輸入的約束條件之內(nèi),對(duì)作為結(jié)果的壓縮場(chǎng)景的質(zhì)量滿意。最后,將產(chǎn)生的壓縮的場(chǎng)景發(fā)送到網(wǎng)絡(luò)層輸出430,其使用合適的網(wǎng)絡(luò)傳輸協(xié)議和QoS算法將壓縮的場(chǎng)景傳輸?shù)娇蛻簟?br>
重復(fù)上述過(guò)程直到整個(gè)源媒體已經(jīng)被發(fā)送到客戶或直到因?yàn)槎喾N可能的情況該處理被中斷,其中該情況可能包括客戶請(qǐng)求終止,網(wǎng)絡(luò)傳輸故障,客戶硬件故障等。
NTS庫(kù)443是由網(wǎng)絡(luò)層輸出430選擇和使用來(lái)傳輸壓縮的源媒體到客戶,和由網(wǎng)絡(luò)層輸入425選擇和使用來(lái)從客戶接收信息的網(wǎng)絡(luò)傳輸服務(wù)的知識(shí)庫(kù)。該選擇是基于從網(wǎng)絡(luò)層輸入425、ICMP代理445和裝置和網(wǎng)絡(luò)參數(shù)測(cè)量代理460接收的定性和定量的輸入的。
QoS庫(kù)447是由網(wǎng)絡(luò)層輸出430選擇和使用來(lái)傳輸壓縮的源媒體到客戶的服務(wù)算法的質(zhì)量的知識(shí)庫(kù)。該選擇是基于從網(wǎng)絡(luò)層輸入425、ICMP代理445和裝置和網(wǎng)絡(luò)參數(shù)測(cè)量代理460接收的定性和定量的輸入。
ICMP代理455產(chǎn)生輸入到神經(jīng)網(wǎng)絡(luò)處理440,其中神經(jīng)網(wǎng)絡(luò)處理440動(dòng)態(tài)提供其具有在處理器和客戶之間使用的傳輸?shù)亩ㄐ院投康奶匦?。在本發(fā)明的一個(gè)實(shí)施例中,ICMP協(xié)議用于這個(gè)目的。
裝置和網(wǎng)絡(luò)參數(shù)測(cè)量代理460產(chǎn)生輸入到神經(jīng)網(wǎng)絡(luò)處理440,其中神經(jīng)網(wǎng)絡(luò)處理440動(dòng)態(tài)提供其具有在處理器和客戶環(huán)境之間使用的傳輸?shù)亩ㄐ院投康奶匦?。在本發(fā)明的一個(gè)實(shí)施例中,這些客戶環(huán)境特性包括中心處理單元(CPU)容量、網(wǎng)絡(luò)接口特性,存儲(chǔ)容量和媒體再現(xiàn)裝置性能。
仍然參考圖4A,網(wǎng)絡(luò)層輸入425提供入站的(最初來(lái)自客戶)網(wǎng)絡(luò)傳輸服務(wù)。網(wǎng)絡(luò)層輸出430提供出站的(最初來(lái)自處理器)網(wǎng)絡(luò)傳輸服務(wù)。計(jì)時(shí)器處理435提供用于本發(fā)明的用戶限制神經(jīng)網(wǎng)絡(luò)處理440在處理給定源媒體時(shí)所花費(fèi)的時(shí)間的最大值的方式。
圖4B是一方框圖,示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的神經(jīng)網(wǎng)絡(luò)處理模塊440的CODEC選擇方案的一個(gè)實(shí)施例。如圖4B所述的神經(jīng)網(wǎng)絡(luò)處理模塊440包括視頻幀選擇模塊475,CODEC參數(shù)模塊480,輸入層模塊485,隱藏層486-487和輸出模塊488。在本發(fā)明的一個(gè)實(shí)施例中,CODEC表示的信號(hào)適于用作用于引入到神經(jīng)網(wǎng)絡(luò)處理模塊440的信號(hào)的參考基線信號(hào),其由神經(jīng)網(wǎng)絡(luò)處理模塊440產(chǎn)生。在一個(gè)實(shí)施例中,分類器417確定在引入的視頻信號(hào)的段中的哪個(gè)場(chǎng)景代表在下層的CODEC的可用參數(shù)的光中的最好場(chǎng)景。標(biāo)準(zhǔn)的清單由神經(jīng)網(wǎng)絡(luò)處理模塊440使用來(lái)確定在信號(hào)中哪個(gè)場(chǎng)景表示最好場(chǎng)景。在一個(gè)實(shí)施例中,神經(jīng)網(wǎng)絡(luò)處理模塊440對(duì)在視頻的特殊幀中的象素?cái)?shù)量取樣來(lái)通過(guò)視頻信號(hào)的預(yù)先確定的參數(shù)確定在那個(gè)特殊幀中的象素?cái)?shù)量的變化。在另一實(shí)施例中,可能將在視頻信號(hào)中的特別場(chǎng)景中的顯著的運(yùn)動(dòng)變化用作用于接下來(lái)的引入視頻的基線參考場(chǎng)景(“最好場(chǎng)景”)在本發(fā)明的一個(gè)實(shí)施例中,神經(jīng)網(wǎng)絡(luò)處理模塊440將來(lái)自分類器417的視頻段作為輸入,并且接下來(lái)使用這個(gè)輸入的取樣來(lái)得出足夠的關(guān)于視頻信號(hào)特性的信息。例如,在如圖4B所示的方案中,神經(jīng)網(wǎng)絡(luò)處理模塊440采用窗口快像(例如,176×144象素窗口)來(lái)檢查。對(duì)于神經(jīng)網(wǎng)絡(luò)處理模塊440,觀看取樣窗口的中心來(lái)產(chǎn)生足夠的關(guān)于視頻信號(hào)的信息是有益的。在本發(fā)明的一個(gè)實(shí)施例中,神經(jīng)網(wǎng)絡(luò)處理440使用最多8幀來(lái)產(chǎn)生關(guān)于視頻信號(hào)的必需信息。以從參數(shù)模塊480到輸入層485的特殊CODEC參數(shù)表示來(lái)自取樣窗口的信息。
輸入層485和多個(gè)隱藏層486-487通過(guò)多個(gè)神經(jīng)元連接,其中神經(jīng)元具有每一形成從一個(gè)神經(jīng)元到其它的強(qiáng)或弱的概要(synoptic)連接的連接。在一個(gè)實(shí)施例中,提供每一由神經(jīng)網(wǎng)絡(luò)處理模塊440支持的CODEC具有它自己的神經(jīng)網(wǎng)絡(luò)來(lái)處理和特別的CODEC一起到來(lái)的CODEC特定參數(shù)。神經(jīng)網(wǎng)絡(luò)處理440通過(guò)循環(huán)(round robin)方式產(chǎn)生“最好的”視頻,其中的循環(huán)方式就像從在視頻取樣捕捉時(shí)期內(nèi)的多個(gè)CODEC處理作為“烘烤”(bake-off)提到的處理。在處理來(lái)自引入信號(hào)的最好的視頻表示中,用于每一CODECS的每一對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)從隱藏層486-487產(chǎn)生最好的表示樣本,并且將信號(hào)送到輸出模塊488。在本發(fā)明的一個(gè)實(shí)施例中,來(lái)自每一類由神經(jīng)網(wǎng)絡(luò)處理440處理的CODEC的最好的CODEC的輸出數(shù)據(jù)設(shè)置具有兩個(gè)可能性。第一個(gè)是神經(jīng)網(wǎng)絡(luò)處理440提交用于每一CODEC的最好結(jié)果到輸出模塊448來(lái)“烘烤”多個(gè)用于多個(gè)CODEC中每一個(gè)的“最好的”樣本的神經(jīng)網(wǎng)絡(luò),其中的CODEC反過(guò)來(lái)從多個(gè)最好的CODEC中產(chǎn)生獲勝的最好的CODEC。烘烤神經(jīng)網(wǎng)絡(luò)比處理CODECS處理的神經(jīng)網(wǎng)絡(luò)更小、并且更快。
在第二處理方案中,神經(jīng)網(wǎng)絡(luò)處理440可能實(shí)現(xiàn)處理由多個(gè)CODECS產(chǎn)生的最好的CODEC的基因算法?;蛩惴ú捎煤蛷椬佑螒蛳嗤慕y(tǒng)計(jì)選擇方法。這樣,不將來(lái)自多種神經(jīng)網(wǎng)絡(luò)的獲勝的輸出CODEC送入“烘烤”神經(jīng)網(wǎng)絡(luò),而是可能應(yīng)用基因算法處理,來(lái)將來(lái)自多種神經(jīng)網(wǎng)絡(luò)的輸出模塊488送入存儲(chǔ)桶(bucket),并且從在源媒體末尾的場(chǎng)景集合,例如,電影等中挑出最好的CODEC表示。在本發(fā)明的一個(gè)實(shí)施例中,神經(jīng)網(wǎng)絡(luò)處理440使用前向和后向傳播算法來(lái)處理CODECS。
回到圖4A,為了提供這個(gè)人工智能處理的進(jìn)一步理解的目的,下面提供了一個(gè)特殊應(yīng)用的實(shí)例。應(yīng)該理解應(yīng)將由這個(gè)示例性應(yīng)用提供的系統(tǒng)的操作特性認(rèn)作根據(jù)本發(fā)明的用于數(shù)據(jù)壓縮和傳送的神經(jīng)網(wǎng)絡(luò)440方面廣泛描述的??梢宰龀銎渌鼞?yīng)用并落入本發(fā)明范圍之內(nèi)。
視頻內(nèi)容提供商在它的服務(wù)器上安裝本發(fā)明的系統(tǒng)。為了執(zhí)行最初的如上所述的AI處理,將取樣視頻引入本系統(tǒng)。創(chuàng)建CODEC特性的復(fù)雜矩陣,例如,對(duì)于每一比特速率的視頻圖形等,以在后面畫(huà)出。接下來(lái),為了觀看視頻M,客戶端的用戶和內(nèi)容提供商系統(tǒng)連接。本發(fā)明的位于服務(wù)器上的通信系統(tǒng)傳送軟件代理到客戶的裝置,這樣使得客戶可以和通信系統(tǒng)連接以傳送特定裝置的信息和接收合適的壓縮的信息和用于播放的解壓CODEC。之后,為傳輸合適的壓縮每一幀的目的,AI系統(tǒng)開(kāi)始將視頻M作為流式信號(hào)載入緩存用于對(duì)每一幀選擇合適CODEC。緩存器的時(shí)間周期根據(jù)多個(gè)變量,理論上的系統(tǒng)的處理能力,并且可能通常是,例如,對(duì)于具有用于預(yù)先記錄的合適性能,但是視頻媒體未壓縮的系統(tǒng)來(lái)說(shuō)大約15秒。在緩存器內(nèi),根據(jù)如圖所示的矩陣中的預(yù)先測(cè)試的序列的“類型”比較每一幀和每一CODEC。
接下來(lái),系統(tǒng)400通過(guò)從在客戶裝置上的軟件代理接收的信息觀看用戶端的參數(shù),例如,屏幕分辨率、可用存儲(chǔ)器。之后選擇最合適的CODEC,并且通過(guò)在CODEC內(nèi)設(shè)置特定變量到固定數(shù)量(例如,基于比較源視頻和過(guò)去的圖形、傳輸信號(hào)性能或約束條件以及目的裝置性能或約束條件)來(lái)為最優(yōu)化表現(xiàn)設(shè)置/調(diào)整。通常由分類器417一幀一幀的做出剛剛描述的處理,但是為了時(shí)間的壓縮效率比較CODECS,使得用于每一幀的處理預(yù)期其它在前和在后的幀。一旦選擇了合適的CODEC并為每一幀調(diào)整(和其中由系統(tǒng)自動(dòng)的合適的確定幀的模塊),傳送系統(tǒng)報(bào)告客戶代理并且在對(duì)應(yīng)的要被加壓并播放的幀之前傳送調(diào)整的CODEC。
應(yīng)該認(rèn)可這個(gè)系統(tǒng)400的神經(jīng)網(wǎng)絡(luò)440持續(xù)學(xué)習(xí)并且記住在CODEC庫(kù)445中的CODECS的操作和性能,并且持續(xù)使用它的學(xué)習(xí)來(lái)改進(jìn)輸入媒體信號(hào)的壓縮效率。通過(guò)庫(kù)的運(yùn)行信號(hào)幀的過(guò)程,更改CODEC操作參數(shù),通過(guò)比較邏輯525(圖5)比較壓縮性能和參考標(biāo)準(zhǔn)壓縮,并且再次運(yùn)行循環(huán),并進(jìn)一步更改。該運(yùn)行信號(hào)幀的過(guò)程是反復(fù)的550(圖5),通常持續(xù)改進(jìn)壓縮效率。事實(shí)上,具有在庫(kù)445中的一個(gè)或多個(gè)CODECS的壓縮可能達(dá)到比參考?jí)嚎s算法更好的改進(jìn)標(biāo)準(zhǔn)。
但是,當(dāng)時(shí)間約束條件435(圖4A)存在時(shí)(比如在用于流媒體內(nèi)容的實(shí)時(shí)推動(dòng)或拉動(dòng)要求),這個(gè)過(guò)程必須最終停止在一些點(diǎn)上,使得處理的特殊的幀或幀序列被壓縮575,并且傳送580到目的,同時(shí)沒(méi)有計(jì)時(shí)器435的不可接受的延時(shí)。然后,可能由神經(jīng)網(wǎng)絡(luò)440在CODEC操作系統(tǒng)內(nèi)操作下一個(gè)幀或序列。這些終點(diǎn)可能由到達(dá)預(yù)先確定的所需結(jié)果來(lái)定義,例如,但是不限于(i)到達(dá)預(yù)先確定的百分比(%)壓縮效率,例如,相比參考標(biāo)準(zhǔn);或(ii)到達(dá)在處理上的預(yù)先確定的或派定的時(shí)間限制設(shè)置,例如根據(jù)關(guān)于緩存時(shí)間的時(shí)間(例如,15秒);或(iii)(i)或(ii)的更早的出現(xiàn)。在任意事件中,雖然到達(dá)終點(diǎn)用于選擇合適的CODEC,并且執(zhí)行比較575和傳送580操作。這不標(biāo)志著用于神經(jīng)網(wǎng)絡(luò)440訓(xùn)練繼續(xù)的終點(diǎn)。存儲(chǔ)通過(guò)每一處理的循環(huán)收集的信息550。當(dāng)將來(lái)遇到在引入的幀中的接下來(lái)的類似的幀和系統(tǒng)約束條件參數(shù)時(shí),記住存儲(chǔ)的信息并且通過(guò)神經(jīng)網(wǎng)絡(luò)440重新獲得,以改進(jìn)壓縮575和傳送580。
雖然預(yù)期很多不同的通信協(xié)議,認(rèn)為是有益的一個(gè)特殊的實(shí)施例使用“全雙工網(wǎng)絡(luò)堆?!眳f(xié)議,其允許在服務(wù)器和客戶裝置之間的雙向通信。而且,雖然其它協(xié)議可能適用于特殊的應(yīng)用,優(yōu)選完全雙工系統(tǒng)。
通過(guò)使用流媒體傳送結(jié)構(gòu)來(lái)克服潛在的問(wèn)題和使用嵌入的神經(jīng)網(wǎng)絡(luò)440來(lái)克服速度考慮,剛剛描述的系統(tǒng)400解決了先前已知的CODEC系統(tǒng)遇到的困難。之后,系統(tǒng)400能夠重新設(shè)置用于在神經(jīng)網(wǎng)絡(luò)440中的壓縮的算法,目的是在任意網(wǎng)絡(luò)結(jié)構(gòu)上每一次都達(dá)成最優(yōu)化結(jié)果。
根據(jù)剛剛描述的整個(gè)壓縮系統(tǒng)和方法,可能在CODEC庫(kù)445中使用多種CODECS,雖然根據(jù)本發(fā)明的任意特殊的CODEC的有益的使用、預(yù)期這種CODEC采取單獨(dú)的形式或和其它CODECS組合。例如,合適的CODEC庫(kù)445可能包括一個(gè)或多個(gè)下面類型的CODECS(i)模塊CODECS(例如,MPEG版本,比如Microsoft MediaTM或QucitimeTM(ii)分形CODECS;以及(iii)小波CODECS(例如,Real)。根據(jù)另一方面,合適的CODEC庫(kù)445可能包括一個(gè)或多個(gè)下面類型的CODECS(i)運(yùn)動(dòng)預(yù)測(cè)的CODECS;以及(ii)靜止CODECS。此外,該CODEC庫(kù)445可能包括一個(gè)或多個(gè)下面的(i)有損CODECS;以及(ii)無(wú)損CODECS。
在本發(fā)明的一個(gè)實(shí)施例中,所有這些不同的類型的CODECS可能由根據(jù)本發(fā)明的CODEC庫(kù)445表示;并且,在庫(kù)中可能包括給定類型的多于一個(gè)特殊CODEC?;蛘撸瑸榱诉_(dá)成所需的性能來(lái)最優(yōu)化流媒體通信在信號(hào)本身、傳輸信道約束條件或目的裝置約束條件中的寬范圍的實(shí)時(shí)變量的壓縮,提供這些多種類型的多種組合。此外,本發(fā)明的另外的高度有利的方案允許新的CODECS載入庫(kù)445,并且立即可用于用在神經(jīng)網(wǎng)絡(luò)440壓縮/傳送系統(tǒng)400中。但是,認(rèn)為用在最優(yōu)化通信多種預(yù)期流媒體信號(hào)中是有益的,并且具有用于圖像信號(hào)的特殊益處的CODEC庫(kù)445的一個(gè)特殊實(shí)例,包括下面的特定CODECSMPEG版本1,2或4(例如,Microsoft MediaTM和QuicktimeTM);Duck TrumotionTM;ON2;Real MediaTM;MJPEG;H.261;H.263;H.263+;GIF;JPEG;JPEG2000;BMP;WBMP;DIVX。
下面是剛剛描述的壓縮系統(tǒng)和方法的多種方面的進(jìn)一步的實(shí)例,至少部分基于這個(gè)公開(kāi),認(rèn)為其不論獨(dú)立的和以多種組合對(duì)于本領(lǐng)域普通技術(shù)人員都是廣泛有益的。這個(gè)廣泛的方面的進(jìn)一步的實(shí)例在其它地方的“發(fā)明內(nèi)容”中以及附加的權(quán)利要求中提供。
達(dá)成多種CODEC操作的具有人工智能的神經(jīng)網(wǎng)絡(luò)440的使用是廣泛和具有獨(dú)特利益的。特別的,對(duì)由響應(yīng)于信號(hào)質(zhì)量、數(shù)據(jù)內(nèi)容和數(shù)據(jù)格式學(xué)習(xí)的應(yīng)用確定的源數(shù)據(jù)的預(yù)處理410提供一種系統(tǒng)和方法。提供一種系統(tǒng)和方法,用于通過(guò)選擇和應(yīng)用合適的CODEC(從所有可用的在CODEC庫(kù)445中的CODECS中的一組)處理原數(shù)據(jù)的每一單元(例如,幀或幀模塊),其中根據(jù)源數(shù)據(jù)的觀察到的特性和響應(yīng)于壓縮類似數(shù)據(jù)的過(guò)去學(xué)習(xí)到的應(yīng)用進(jìn)行合適的CODEC的選擇和應(yīng)用。提供一種系統(tǒng)和方法,其用于通過(guò)在所選的壓縮算法中設(shè)置多個(gè)壓縮特性來(lái)最優(yōu)化最初數(shù)據(jù)完整性的捕捉和保存來(lái)處理每一單元源數(shù)據(jù)。此外,將每一或所有上述的信號(hào)處理步驟應(yīng)用到每一單一的、順序的信號(hào)數(shù)據(jù)單元,例如,信號(hào)剪輯(clip),視頻幀,或單獨(dú)的合適的分組。
進(jìn)一步預(yù)期根據(jù)本發(fā)明的CODEC管理系統(tǒng)400提供圖像處理的系統(tǒng)和方法,其中該處理適于正?;畛醯脑磾?shù)據(jù)/圖像并且對(duì)最初數(shù)據(jù)調(diào)整大小和重新取樣來(lái)適應(yīng)神經(jīng)網(wǎng)絡(luò)處理模塊440的規(guī)范。還提供以單一系統(tǒng)和任意源數(shù)據(jù)流服務(wù)任意傳輸或記錄信道的能力。另外,在這里描述了單獨(dú)的或者有益的組合的多種系統(tǒng)和方法,提供它們具有和任意連接和無(wú)連接的協(xié)議,包括,但是不限于TCP、UDP、WTP/WDP、HTTP等的兼容性。
如在這里所示和所述的本發(fā)明還允許用于加速神經(jīng)網(wǎng)絡(luò)440的學(xué)習(xí)速率,并且同時(shí)最小化實(shí)現(xiàn)所述網(wǎng)絡(luò)的數(shù)據(jù)存儲(chǔ)需要的更為有益的應(yīng)用。每一不同種類的數(shù)據(jù)流都具有基本上需要神經(jīng)網(wǎng)絡(luò)440更多的處理的獨(dú)特的特性。例如,視頻數(shù)據(jù)流在運(yùn)動(dòng)的流行和程度、顏色對(duì)比度、以及細(xì)節(jié)的圖形和可見(jiàn)性上不同。更多的處理需要更長(zhǎng)的時(shí)間來(lái)達(dá)到最優(yōu)化的功能性。更多的處理還需要更多可預(yù)測(cè)的庫(kù)存儲(chǔ),通常增長(zhǎng)到無(wú)限大的尺寸。對(duì)于實(shí)時(shí)神經(jīng)網(wǎng)絡(luò)處理,可以最小化處理時(shí)間和存儲(chǔ)來(lái)通過(guò)提供預(yù)先開(kāi)發(fā)的數(shù)據(jù)流種類的可預(yù)測(cè)庫(kù)特性而顯著增加功能性。
因此,下面是本發(fā)明的預(yù)先訓(xùn)練的神經(jīng)網(wǎng)絡(luò)440方面的實(shí)例,其應(yīng)該獨(dú)立的和以組合方式(包括在這里其它地方所示和所述的其它實(shí)施例的組合)廣泛的認(rèn)為該發(fā)明是有益的。提供了一種系統(tǒng)和方法,其在神經(jīng)網(wǎng)絡(luò)440中創(chuàng)建并使用人工智能,并且預(yù)先訓(xùn)練神經(jīng)網(wǎng)絡(luò)用于用在解決問(wèn)題當(dāng)中,其中的問(wèn)題可能是,例如,但是不必須限定于,根據(jù)本發(fā)明的特殊的有益方面的流媒體壓縮。還提供了一種系統(tǒng)和方法,用于將通常要被解決的問(wèn)題細(xì)分為可能根據(jù)智能網(wǎng)絡(luò)的學(xué)習(xí)的歷史處理的有用的種類。
還根據(jù)本發(fā)明提供了智能流媒體傳送系統(tǒng)和方法,其基于用戶端性能和傳輸信道約束條件(例如,但是不限定于)的可用的傳輸速度或帶寬、以及互聯(lián)網(wǎng)擁塞來(lái)管理內(nèi)容傳輸。數(shù)據(jù)壓縮和傳送系統(tǒng)400使用計(jì)算機(jī)實(shí)現(xiàn)的智能處理,比如基于神經(jīng)網(wǎng)絡(luò)的人工處理,來(lái)分析連接的方面(包括但是不限定于不同的比特速率、等待時(shí)間、傳輸特性和裝置限制)來(lái)在壓縮方法中做出變更并且管理服務(wù)質(zhì)量(“QoS”)420問(wèn)題。因此,壓縮的、數(shù)字的、可恢復(fù)的和/或可解壓的數(shù)據(jù)流可能通過(guò)多個(gè)具有不同性能特性的傳輸媒介傳送到多個(gè)不同的本地和/或遠(yuǎn)程裝置。另外,提供解壓系統(tǒng)用于在終端裝置再生該解壓的數(shù)據(jù)。
在一個(gè)有益的實(shí)施例中,終端裝置建立和位于服務(wù)節(jié)點(diǎn)上的系統(tǒng)的連接。除了建立通信正常需要的軟件以外,終端裝置可能最初具有嵌入在其中的和本系統(tǒng)相關(guān)聯(lián)的常駐的軟件。在鏈接終端裝置到服務(wù)器節(jié)點(diǎn)的情況中,系統(tǒng)將軟件代理發(fā)送到終端裝置,其中終端裝置和其它在一起形成整個(gè)傳送系統(tǒng)的服務(wù)器側(cè)的軟件模塊合作。軟件代理通知終端裝置的系統(tǒng)用于解壓和播放數(shù)據(jù)的設(shè)置和處理性能。軟件代理還報(bào)告確定的相關(guān)信息到在終端和服務(wù)器之間的通信信道的特性的系統(tǒng)。這種信息包括,但是不限于,等待時(shí)間、帶寬以及信號(hào)路徑整體性。基于終端裝置配置和信道特性和性能的實(shí)時(shí)更新,系統(tǒng)通過(guò)改變參數(shù),比如緩存長(zhǎng)度、發(fā)送比特速率和錯(cuò)誤校正,有效的管理壓縮的數(shù)據(jù)流的傳輸。系統(tǒng)還將操作情況送到壓縮系統(tǒng)來(lái)動(dòng)態(tài)的改變編碼和壓縮設(shè)置從而最優(yōu)化數(shù)據(jù)的傳送。位于終端裝置上的傳送軟件代理將包括一段一段的變更的數(shù)據(jù)流以壓縮/解壓算法和它的設(shè)置解壓。根據(jù)終端裝置的配置,并且特別的對(duì)于非常細(xì)小的客戶,可能在一段一段的基礎(chǔ)上對(duì)于每一解壓算法和編碼設(shè)置組合更新說(shuō)明。如果適于終端裝置,可能還保存用于解壓的說(shuō)明。
因此,還認(rèn)為所述的用于傳輸?shù)讲⑶矣赡康难b置操作的軟件代理是所述壓縮/傳送系統(tǒng)和方法的高度有益的方面。通過(guò)從源傳送軟件代理到裝置,很多的現(xiàn)有目的裝置可以用于根據(jù)本方法通信,本方法可能包括使用一個(gè)或多個(gè)算法或其它在傳輸源的操作的變量。換句話說(shuō),可能需要目的裝置是“特定格式”的播放器,就像很多現(xiàn)有的流式和靜態(tài)媒體通信系統(tǒng)的需要。而且,通過(guò)把診斷功能提供給目的代理??赡茉谀康难b置收集診斷信息,并且將其以適用于由源使用的格式發(fā)送回源,其中源在它的神經(jīng)網(wǎng)絡(luò)處理中使用以達(dá)成合適的用于給定情況組的CODEC操作。
使用客戶側(cè)的代理來(lái)提供包括實(shí)時(shí)的客戶側(cè)的裝置數(shù)據(jù)和通信信道狀態(tài)的服務(wù)信息的質(zhì)量,并且還認(rèn)為這個(gè)使用超出了也在這里提供的本發(fā)明的特定應(yīng)用和其它方面的組合,并且也是廣泛有益的。另外,壓縮的每一單元的處理,容納客戶側(cè)的服務(wù)的數(shù)據(jù)和實(shí)時(shí)通信信道情況的傳輸完畢數(shù)據(jù)也被廣泛的預(yù)期為具有廣泛達(dá)成的益處。此外,所述的系統(tǒng)和方法提供說(shuō)明到客戶側(cè)的代理來(lái)使得可以解壓每一連續(xù)的,獨(dú)特的數(shù)據(jù)的壓縮單元。因此,本發(fā)明的另一廣泛益處在于提供目的裝置(比如,從如這里所述的用于特殊的實(shí)施例的傳輸源)和適于將最初媒體信號(hào)的壓縮的表示解壓為解壓的表示的CODEC,其是基于關(guān)于下面的至少一個(gè)的可變參數(shù)最初媒體信號(hào)的方案、傳輸信道約束條件、以及目的裝置約束條件。在另一廣泛的方面中,目的裝置適于使用從CODECS庫(kù)中基于與最初媒體信號(hào)有關(guān)的方案選擇的參數(shù)選擇的CODEC。
還認(rèn)為在這里所述的系統(tǒng)和方法可應(yīng)用到每一信號(hào)的獨(dú)特的、連續(xù)的單元,例如,信號(hào)剪輯、視頻幀和合適的單獨(dú)的分組的信號(hào)處理。另外,系統(tǒng)和它的各種子系統(tǒng)可能還完全是軟件的,其必須被載入每一合適的裝置,或者可能將其嵌入主機(jī)硬件組件或芯片,例如,在服務(wù)器側(cè),或在確定情況中,在客戶側(cè)(例如,多個(gè)方面的目的代理),或,例如,可能存儲(chǔ)在(比如)閃存存儲(chǔ)器中。
認(rèn)為剛剛描述的媒體壓縮系統(tǒng)和方法的多個(gè)方面易于根據(jù)很多已知的和預(yù)期很快出現(xiàn)的媒體通信需要的使用,包括,例如,根據(jù)在這里的其它地方描述的多種通信裝置,通信/傳輸信道格式和標(biāo)準(zhǔn),以及媒體類型和格式(例如,在上面的“背景”部分中)。
但是,為了進(jìn)一步理解的目的,圖6示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的作為特別應(yīng)用到“視頻點(diǎn)播”方面的所有流媒體通信系統(tǒng)600的示意性的視圖,其中在很多不同位置的很多不同的末端用戶610-620可能從遠(yuǎn)程源請(qǐng)求并且接收實(shí)時(shí)的(例如,沒(méi)有實(shí)質(zhì)上的延遲)、預(yù)先記錄的視頻。從在圖6中提供進(jìn)一步的信息,至少一個(gè)媒體通信系統(tǒng)600的特定實(shí)現(xiàn)在下面的比特速率(指示可由目的裝置轉(zhuǎn)換為解壓的表示的最初信號(hào)的壓縮的表示,其中由通常的人類觀察者的眼睛觀察,解壓的表示不具有或基本不具有損失)傳送下面類型的視頻低到大約250Kbs的VHS格式視頻;在大約400Kbps的DVD格式視頻;以及在大約900Kbps的HDTV格式視頻。根據(jù)這些速度,相信可以由電話攜帶者通過(guò)現(xiàn)有的傳輸線路信道提供視頻點(diǎn)播,例如,在現(xiàn)有的DSL線路630-640上。
但是,隨著可用帶寬和大量的通信持續(xù)出現(xiàn)問(wèn)題,相信即使可能達(dá)到的更高的效率會(huì)引起這些類型的視頻信號(hào)的壓縮的表示以更慢的比特速率傳輸。而且,如在這里其它地方所述的,本發(fā)明的壓縮效率基本關(guān)于神經(jīng)網(wǎng)絡(luò)440可用的處理能量的函數(shù),并且隨著其改進(jìn),而且神經(jīng)網(wǎng)絡(luò)440的關(guān)于多種類型的媒體持續(xù)學(xué)習(xí)并訓(xùn)練。這些資源可能甚至使得可無(wú)需改變本發(fā)明的功能特征而達(dá)成可觀的壓縮效率。
因此,認(rèn)為下面的用于特定壓縮的視頻信號(hào)的傳輸速率的實(shí)例是所需的并且可根據(jù)本發(fā)明的一個(gè)實(shí)施例達(dá)成和大約200Kbps一樣低的VHS格式視頻,更為優(yōu)選的和大約150Kbps一樣低,并且仍然更為優(yōu)選的和大約100Kbps一樣低;和大約350Kbps一樣低的DVD格式視頻,更為優(yōu)選的和大約300Kbps一樣低,并且仍然更為優(yōu)選的與大約250Kbps一樣低;以及和大約800Kbps一樣低的HDTV格式視頻,以及仍然更為優(yōu)選的和大約700Kbps一樣低。
而且,至少一個(gè)本發(fā)明的一個(gè)實(shí)施例的媒體通信系統(tǒng)400的實(shí)現(xiàn)在7Kbps的傳輸速率傳送20-24幀/秒顏色視頻。相信這可以產(chǎn)生實(shí)質(zhì)上的流媒體信號(hào)通過(guò)WAP網(wǎng)關(guān)到無(wú)線目的裝置的進(jìn)步,這將在下面的其它地方進(jìn)一步談到。
還應(yīng)該認(rèn)可,雖然在這個(gè)公開(kāi)中強(qiáng)調(diào)視頻通信,還預(yù)期有其它類型的流式和靜態(tài)數(shù)據(jù)。例如,觀察到至少一個(gè)壓縮和傳輸實(shí)施例的實(shí)現(xiàn)提供基本上達(dá)到在大約24Kbps的比特速率的CD質(zhì)量的聲音(例如,通過(guò)可由目的裝置轉(zhuǎn)換為解壓的表示的最初的信號(hào)的壓縮的表示,其中解壓的表示不具有和基本上不具有可由通常人類觀察者的耳朵觀測(cè)到的損耗)。在這些速率,可能傳送高保真質(zhì)量的聲音用于通過(guò)撥號(hào)調(diào)制解調(diào)器播放。但是,進(jìn)一步考慮可用的資源事項(xiàng)和神經(jīng)網(wǎng)絡(luò)訓(xùn)練的程度,進(jìn)一步預(yù)期本發(fā)明適于在低到大約20Kbps的速度傳送CD質(zhì)量的聲音,并且甚至低到大約15Kbps和甚至10Kbps。
無(wú)線音頻通信系統(tǒng)進(jìn)一步預(yù)期本發(fā)明的流媒體通信系統(tǒng)在無(wú)線音頻通信網(wǎng)絡(luò)中具有特別有用的應(yīng)用,并且特別是在手機(jī)網(wǎng)絡(luò)中。因此,圖7和8以分別增加的細(xì)節(jié)量示意性的示出了根據(jù)本發(fā)明的確定特定的各個(gè)實(shí)施例,分別特別的應(yīng)用到無(wú)線音頻通信系統(tǒng)的流媒體通信系統(tǒng)700和800。雖然認(rèn)為示出的特別的裝置、系統(tǒng)參數(shù)和通信裝置的布置在本發(fā)明的所有應(yīng)用中是有益的,認(rèn)為它們不產(chǎn)生限制,并且可能由本領(lǐng)域普通技術(shù)人員基于這個(gè)公開(kāi)以合適的替代物來(lái)代替。這樣,為了根據(jù)本發(fā)明的一個(gè)實(shí)施例和多種壓縮、傳送、解壓,以及代碼轉(zhuǎn)換的方面集成的目的,將在這個(gè)公開(kāi)的其它地方參考的多種無(wú)線通信系統(tǒng)700和800、標(biāo)準(zhǔn)、以及協(xié)議包含在這個(gè)部分中。
本發(fā)明的一個(gè)實(shí)施例的通信系統(tǒng)400和蜂窩通信網(wǎng)絡(luò)的其它組分的組合允許根據(jù)本發(fā)明的增強(qiáng)型的壓縮、傳送和解壓來(lái)表明用于無(wú)線音頻通信的增強(qiáng)的服務(wù)質(zhì)量。根據(jù)本發(fā)明的蜂窩通信的改進(jìn)包括,但是不限于,下面的實(shí)例增加可用帶寬,擴(kuò)展接收范圍,并且提供功能衰減(graceful degradation),同時(shí)保持在低信號(hào)質(zhì)量或接收電平的時(shí)期內(nèi)的連通性。
更為特別的,蜂窩電話信號(hào)的特征在于相對(duì)高程度的可變性,這是因?yàn)?,例如,客戶的漫游位置,以及有限的小區(qū)范圍,大氣情況,以及在日用周期中的非常有限和變化的可用帶寬。因此,根據(jù)本發(fā)明的自最優(yōu)化CODEC管理系統(tǒng)特別適于調(diào)整合適的通信及壓縮形式來(lái)改變環(huán)境。最起碼,可能增加壓縮效率并引起用于給定信號(hào)的帶寬的減少,隨著無(wú)線信道業(yè)務(wù)的持續(xù)擁塞,這是十分有價(jià)值的成就。
在一個(gè)特殊的考慮中,如圖9所示,根據(jù)本發(fā)明的增加的壓縮效率很好的應(yīng)用來(lái)在“軟切換”過(guò)程中在小區(qū)之間改進(jìn)帶寬問(wèn)題。在蜂窩電話通信的過(guò)程中,無(wú)論何時(shí)發(fā)射機(jī)或接收機(jī)在小區(qū)覆蓋區(qū)域中遷移,由系統(tǒng)的到小區(qū)之間的“終止”有效通信的需要增加通信帶寬需要和結(jié)果成本。終止通信的行動(dòng)引起從先前有效的蜂窩發(fā)射機(jī)到中心辦公室的“回程”(hackhaul)信道,用于轉(zhuǎn)發(fā)到新的有效的蜂窩發(fā)射機(jī)?;爻绦诺辣硎編挼闹匾褂?。增加壓縮可以產(chǎn)生節(jié)省。如圖所示,這種“回程”方式包括在用于傳遞特別的信號(hào)的帶寬的雙倍(從第一小區(qū)送回的媒體留下并且留到第二小區(qū)用于傳輸)或甚至四倍(從第一和第二小區(qū)的重疊傳遞)。
本發(fā)明的媒體通信系統(tǒng)400可能識(shí)別何時(shí)回程發(fā)生,比如根據(jù)在軟件代理中提供的傳輸信道診斷,并且可能通過(guò)調(diào)整壓縮的程度響應(yīng)來(lái)補(bǔ)償。
WAP視頻網(wǎng)關(guān)隨著特別觀看到的在無(wú)線或移動(dòng)互聯(lián)網(wǎng)中觀察到和預(yù)期的快速增長(zhǎng),本發(fā)明的實(shí)施例預(yù)期智能壓縮/傳送/解壓實(shí)施例和WAP網(wǎng)關(guān)功能型的組合應(yīng)用。
因此也提供了一種根據(jù)本發(fā)明的系統(tǒng)和方法,用于通過(guò)帶寬約束的無(wú)線通信系統(tǒng)使用無(wú)線應(yīng)用協(xié)議(WAP)編碼、壓縮和發(fā)送復(fù)雜的數(shù)字媒體(例如,視頻畫(huà)面)。在一個(gè)實(shí)施例中,數(shù)據(jù)由位于服務(wù)器節(jié)點(diǎn)的系統(tǒng)處理,該節(jié)點(diǎn)采用具有人工智能的神經(jīng)網(wǎng)絡(luò)。從輸入流捕捉數(shù)據(jù)的樣本段,并且處理來(lái)符合某類客戶的獨(dú)特的需要。像在上面消息描述的,系統(tǒng)將持續(xù)變化的數(shù)字?jǐn)?shù)據(jù)流的特性和具有預(yù)先開(kāi)發(fā)的經(jīng)驗(yàn)學(xué)習(xí)的規(guī)則的庫(kù)相關(guān),并且和外部施加的最優(yōu)化設(shè)計(jì)數(shù)據(jù)的一致,連續(xù)性和細(xì)節(jié)的約束條件相關(guān),其中數(shù)據(jù)為在客戶接口最后接收,解碼并呈現(xiàn)的。
在圖8中示意性的示出提供了在這里所述的流媒體通信系統(tǒng)的添加的功能性的網(wǎng)關(guān)。根據(jù)WAP網(wǎng)關(guān)系統(tǒng)830,提供客戶代理,其適于在多個(gè)平臺(tái)上運(yùn)行,并且不需要特定的軟件來(lái)解碼視頻流。根據(jù)在這里其他地方描述的本發(fā)明的流媒體傳送系統(tǒng)的使用,WAP裝置的觀看者保持和系統(tǒng)服務(wù)器上行流的恒定通信,使得用戶側(cè)的客戶825可以把用于流媒體通信的相關(guān)信息提供給編碼平臺(tái),該信息包括,但是不限于可變屏幕尺寸,處理能力,客戶操作系統(tǒng)和瀏覽器版本,連接速度和等待時(shí)間,由此允許流媒體傳送系統(tǒng)定制流到每一單獨(dú)的和它“通話”的客戶。因此,包含了如在這里所述的AI壓縮AI驅(qū)動(dòng)的服務(wù)器830可能和WAP網(wǎng)關(guān)830結(jié)合,將需要的WAP和TCP/IP協(xié)議(或其它協(xié)議,例如,雙向服務(wù)器堆棧)轉(zhuǎn)換結(jié)合,同時(shí)視頻和音頻服務(wù)器835采用在這里所述的壓縮、傳送和解壓的系統(tǒng)和方法,例如,包括在這里所述的代碼轉(zhuǎn)換機(jī)系統(tǒng)和方法。根據(jù)這個(gè)系統(tǒng)的合適的主機(jī)結(jié)構(gòu)(沒(méi)有示出)通常包括運(yùn)行Linux OS的架式安裝系統(tǒng),具有更改的WAP網(wǎng)關(guān)830或作為軟件插入現(xiàn)有的服務(wù)器。
這個(gè)WAP網(wǎng)關(guān)系統(tǒng)830可能進(jìn)一步在主/從關(guān)系中作為另一整個(gè)流媒體傳送結(jié)構(gòu)(可應(yīng)用到除了特殊無(wú)線外的其它傳送系統(tǒng))的有益方面。多種內(nèi)容分配網(wǎng)絡(luò),比如通過(guò)Akamai和Inktomi可用的,投入在通過(guò)互聯(lián)網(wǎng)在位于互聯(lián)網(wǎng)的邊界的服務(wù)器上使用“智能超高速緩存”改進(jìn)數(shù)據(jù)傳送。這種主/從關(guān)系由本系統(tǒng)保持,其中主服務(wù)器位于要被傳送的內(nèi)容的源并且從服務(wù)器位于邊界上。這些服務(wù)器通信“智能的”最優(yōu)化通過(guò)互聯(lián)網(wǎng)的內(nèi)容傳送并且減少等待時(shí)間、帶寬和存儲(chǔ)需要,改進(jìn)到用戶端的視頻/音頻流的總體質(zhì)量,并且減少到內(nèi)容提供商的媒體傳送的成本。
隨著大型電信操作器過(guò)渡到多服務(wù)寬帶網(wǎng)絡(luò),并且隨著到移動(dòng)互聯(lián)網(wǎng)的用戶數(shù)量持續(xù)快速增加,本發(fā)明的WAP網(wǎng)關(guān)830支持移動(dòng)通信的持續(xù)增長(zhǎng)。特別的,移動(dòng)通信是很多種類的系統(tǒng)和協(xié)議,每一具有它自己的約束條件和用于互動(dòng)裝置來(lái)傳遞流式數(shù)據(jù)的需要。網(wǎng)關(guān)830在特別有益的方面可能支持多種“2G”系統(tǒng),同時(shí)具有可更新性,用于接下來(lái)的“2.5G”和“3G”網(wǎng)絡(luò)技術(shù)(系統(tǒng)的數(shù)字的增加通常表示互聯(lián)網(wǎng)功能性的進(jìn)步)。
下面的表3提供了已知的移動(dòng)通信標(biāo)準(zhǔn)的實(shí)例,并且提供了由本發(fā)明的AI系統(tǒng)使用的用于最優(yōu)化在移動(dòng)目的裝置,如媒體播放器領(lǐng)域中的流媒體的通信的確定的相關(guān)信息。
表3現(xiàn)有的/預(yù)期很快的移動(dòng)通信標(biāo)準(zhǔn)
另外,本發(fā)明特別有利的是它的多種流媒體信號(hào)到多種不同類型的無(wú)線通信裝置的能力。適于和本發(fā)明的流媒體通信系統(tǒng)和方法一起使用的無(wú)線通信裝置的實(shí)例,以及系統(tǒng)和方法可互換的支持何種類型,在下面的表4中提供
表4具有互聯(lián)網(wǎng)功能的PDA的實(shí)例
下面將描述多種特定實(shí)例,提供如在這里所述的本發(fā)明的實(shí)際的無(wú)線互聯(lián)網(wǎng)應(yīng)用的觀察。這種實(shí)例包括和下面至少一個(gè)(但是不限于)相關(guān)聯(lián)的變化的參數(shù)的CODEC庫(kù)的使用目的無(wú)線通信裝置;傳輸信道;通信協(xié)議;以及各個(gè)流媒體信號(hào)本身。根據(jù)這些實(shí)例使用的系統(tǒng)和方法的多種特殊特征預(yù)期作為本發(fā)明進(jìn)一步定義的獨(dú)立的有益方面。
共享的交互式環(huán)境還根據(jù)本發(fā)明提供了一種系統(tǒng)和方法,用于使得實(shí)時(shí)遠(yuǎn)程客戶可以和高清晰度的、多維的、多共享的模擬環(huán)境互動(dòng),同時(shí)不需要重大的客戶側(cè)處理能力。更為特別的,圖10示出了作為應(yīng)用到根據(jù)本發(fā)明的共享的互動(dòng)游戲的整體的流媒體通信系統(tǒng)。
這個(gè)系統(tǒng)包括(i)代理服務(wù)器;(ii)圖形呈現(xiàn)性能;(iii)用于反饋客戶輸入到游戲的客戶軟件代理;(iv)用于支持本發(fā)明的傳送系統(tǒng)的客戶軟件代理;以及(v)來(lái)自服務(wù)器到客戶的流。預(yù)期對(duì)于多個(gè)客戶,通常通過(guò)設(shè)計(jì)表現(xiàn)共享的互動(dòng)游戲,提供剛剛描述的多個(gè)組分來(lái)支持每一客戶。
互動(dòng)游戲的實(shí)施例預(yù)期數(shù)據(jù)壓縮和傳送實(shí)施例的實(shí)現(xiàn)具有也是用于來(lái)自其它類似的遠(yuǎn)程裝置系統(tǒng)的信號(hào)的目的裝置的裝置。這個(gè)布置是廣泛有益的,例如,在進(jìn)一步的交互式媒體實(shí)現(xiàn),比如視頻會(huì)議和類似功能當(dāng)中。因此,每一遠(yuǎn)程系統(tǒng)是源和目的裝置,并且在它和其它遠(yuǎn)程系統(tǒng)之間發(fā)送和接收代理。
目的裝置雖然本發(fā)明的通信系統(tǒng)可以將流媒體信號(hào)傳遞到多種目的裝置,本發(fā)明的進(jìn)一步預(yù)期的特征提供由客戶用戶將遠(yuǎn)程接收器作為目的裝置/播放器裝入。這個(gè)置頂盒播放器可能適于服務(wù)至少一個(gè),雖然優(yōu)選的可能有多個(gè),或者可能是下面的全部視頻點(diǎn)播(VOD);音樂(lè)點(diǎn)播(MOD);點(diǎn)播的互動(dòng)游戲(IGOD);互聯(lián)網(wǎng)協(xié)議的語(yǔ)音(“VoIP”),任意通過(guò)IP連接提供語(yǔ)音技術(shù)服務(wù)的技術(shù);電視網(wǎng)絡(luò)接入;數(shù)字視頻記錄來(lái)記錄、暫停并重放實(shí)況電視;電子郵件,聊天;DVD播放器;以及其它對(duì)于本領(lǐng)域普通技術(shù)人員很明顯的應(yīng)用。為了舒適,可能將所有這些發(fā)送到在用戶自己家庭中的現(xiàn)有的電視。另外,客戶使用這個(gè)盒,或其它作為和本發(fā)明的通信系統(tǒng)的接口的系統(tǒng),可以通過(guò)電纜和DSL連接接收DVD質(zhì)量的視頻和環(huán)繞聲。
實(shí)例為了進(jìn)一步示出可能根據(jù)本發(fā)明達(dá)成的高度有利的結(jié)果的目的,下面是用于不同類型的流媒體通信的特定實(shí)施例的實(shí)例,包括觀察到的結(jié)果和相關(guān)討論。這些實(shí)例示出了通過(guò)不同傳輸信道傳遞相同的預(yù)先記錄的視頻和到不同的目的裝置,其中預(yù)先記錄的視頻具有下面的最初特性720線的分辨率和32比特顏色信息,大約1.4吉比特的最初文件大小。
實(shí)例1提供“iPAQ”模型3650手持PDA(可從Compag,Inc通過(guò)商業(yè)渠道獲得,在這個(gè)公開(kāi)的時(shí)間是大約$500)。該P(yáng)DA具有和14.4Kbps(最大)無(wú)線CDPD調(diào)制解調(diào)器(“AirCard300”無(wú)線外部調(diào)制解調(diào)器,可從Sierra Wireless通過(guò)商業(yè)渠道獲得并且在這個(gè)公開(kāi)的時(shí)間是大約$200)的接口,該接口使用擴(kuò)展部件(來(lái)自Compaq,Inc.的IPAQTMPCMCIA擴(kuò)展套件),其具有和無(wú)線調(diào)制解調(diào)器連接的PCMCIA卡槽。使用的IPAQTM通常的特征在于,具有下面的處理參數(shù)206MHz處理器;32Mb存儲(chǔ)器;12b/象素顏色;240×320屏幕大??;來(lái)自Microsoft公司的PocketPCTM操作系統(tǒng)版本3.0以及立體聲。IPAQ在舊金山,加利福尼亞通過(guò)接口的CDPD調(diào)制解調(diào)器通過(guò)AT&T蜂窩無(wú)線載波系統(tǒng)連接到互聯(lián)網(wǎng),并且具有大約13.3K比特/秒的連接帶寬。位于圣何塞,加利福尼亞(相距大約50MI)的服務(wù)器由PDA連接,其中PDA采用http和rtsp協(xié)議,并且使用PDA來(lái)啟動(dòng)用于具有下面操作特定的預(yù)先記錄的視頻的請(qǐng)求720線分辨率和32比特顏色信息,1.4吉比特的最初文件大小。在大約七秒內(nèi),由PDA在PDA屏幕接收、解壓、和播放預(yù)先記錄的視頻的壓縮的近似值。整個(gè)視頻在全運(yùn)動(dòng)中在240×320×12BPP分辨率觀看,沒(méi)有可觀察到的延遲和缺陷。
實(shí)例2提供“JornadaTM”模型548手持PDA(可從HP公司通過(guò)商業(yè)渠道獲得,在這個(gè)公開(kāi)的時(shí)間是大約$300),該P(yáng)DA和9.6Kbps(最大)無(wú)線CDMA電話(“Motorola i85s”無(wú)線外部數(shù)字蜂窩電話,可從Motorola授權(quán)的賣主通過(guò)商業(yè)渠道獲得,在這個(gè)文章的時(shí)間是大約$200)接口,該接口使用和電話及PDA連接并一起形成無(wú)線調(diào)制解調(diào)器的適配器(adaptor)電纜(來(lái)自Motorola和HP的Motorola和HPRS-232標(biāo)準(zhǔn)接口電纜)。使用的Jornada型PDA裝置的總的特征通常是具有下面的處理參數(shù)133MHz處理器;32Mb存儲(chǔ)器;12b/象素顏色;240×320屏幕尺寸;來(lái)自Microsoft公司的PocketPCTM操作系統(tǒng)版本3.0以及環(huán)繞聲。JornadaTM和在newark、NJ通過(guò)接口的CDMA電話/調(diào)制解調(diào)器在Nextel數(shù)字蜂窩無(wú)線載波系統(tǒng)上和互聯(lián)網(wǎng)連接,具有8K比特/秒的連接帶寬。位于圣何塞、加利福尼亞(相距大約2900mi遠(yuǎn))的服務(wù)器由PDA連接,其中PDA采用http和WDP協(xié)議,并且使用PDA來(lái)啟動(dòng)用于具有下面初始特性的預(yù)先記錄的視頻的請(qǐng)求720線分辨率和32比特顏色信息,1.4吉比特的初始文件大小。在大約七秒內(nèi),由PDA在PDA屏幕上接收、解壓和播放預(yù)先記錄的視頻的壓縮的近似值。整個(gè)視頻在完全運(yùn)動(dòng)中在176×120×8BPP分辨率觀看,沒(méi)有可觀察到的延遲和缺陷。
實(shí)例3提供“置頂盒”模型st850筆記本PC(可從MSI公司通過(guò)商業(yè)渠道獲得,在這個(gè)文章的時(shí)間是大約$300)。置頂盒作為10Mbps(最大)以太網(wǎng)/802.11連接的接口,使用連接置頂盒和寬帶連接(DS3)的CAT5以太網(wǎng)電纜(一般的)。使用的置頂盒的通常特性是具有下面的處理參數(shù)400MHz處理器;64Mb存儲(chǔ)器;32b/象素顏色;720線屏幕分辨率;來(lái)自Microsoft公司的Windows CE操作系統(tǒng)版本2.11,以及AC3數(shù)字6聲道環(huán)繞聲。置頂盒在Newark、NJ通過(guò)結(jié)構(gòu)的共享DS3連接通過(guò)Alter.Net互聯(lián)網(wǎng)主干和互聯(lián)網(wǎng)連接,具有376K比特/秒的連接帶寬。位于圣何塞、加利福尼亞(相距大約2900mI遠(yuǎn))的服務(wù)器由PDA連接,其中PDA采用http和rtsp協(xié)議,并且使用PDA來(lái)啟動(dòng)用于具有下面初始特性的預(yù)先記錄的視頻的請(qǐng)求7201線分辨率和32比特顏色信息,1.4吉比特的最初文件大小。在大約七秒內(nèi),由置頂盒在商用的參考監(jiān)視器(Sony)屏幕上接收、解壓和播放預(yù)先記錄的視頻的壓縮的近似值。整個(gè)視頻在完全運(yùn)動(dòng)中在720線x32bpp觀看,沒(méi)有可觀察到的延遲和缺陷。
雖然為了描述本發(fā)明的目的,在這里更詳細(xì)的示出并描述了多種特別實(shí)施例,應(yīng)該認(rèn)可可能由本領(lǐng)域的普通技術(shù)人員根據(jù)這個(gè)公開(kāi),在不脫離本發(fā)明的精神范圍的情況下做出進(jìn)一步的變更和改進(jìn)。例如,可能做出特別描述的多種實(shí)施例的多種不同組合并且仍然在本發(fā)明的精神范圍之內(nèi)。根據(jù)另一實(shí)例,還可以對(duì)多種實(shí)施例做出明顯的改進(jìn)和更改,并且仍然在這個(gè)發(fā)明的精神范圍之內(nèi)。
權(quán)利要求
1.一種用于處理媒體信號(hào)的系統(tǒng),包括可搜索的CODEC庫(kù),其適于存儲(chǔ)多個(gè)分開(kāi)的和獨(dú)特的CODEC,并且還可由人工智能(AI)系統(tǒng)和操作系統(tǒng)中的至少一個(gè)存取和搜索,使得能夠單獨(dú)的定位并存取存儲(chǔ)在CODEC庫(kù)中的每一CODEC,以由AI系統(tǒng)和操作系統(tǒng)中的至少一個(gè)為了壓縮媒體信號(hào)以從源傳輸?shù)侥康难b置而使用。
2.如權(quán)利要求1所述的系統(tǒng),其中該CODEC庫(kù)包括至少一個(gè)是下面三種類型的CODECS中至少一個(gè)的CODEC模塊CODECS;分型CODECS;以及小波CODECS。
3.如權(quán)利要求2所述的系統(tǒng),其中該CODEC庫(kù)包括三種類型中第一類型的第一CODEC,以及三種類型中第二類型的第二CODEC。
4.如權(quán)利要求3所述的系統(tǒng),其中該CODEC庫(kù)包括三種類型的第一類型的第一CODEC,三種類型的第二類型的第二CODEC;以及三種類型的第三類型的第三CODEC。
5.如權(quán)利要求4所述的系統(tǒng),其中該CODEC庫(kù)包括是運(yùn)動(dòng)預(yù)測(cè)CODEC的第一CODEC;以及是靜止CODEC的第二CODEC。
6.如權(quán)利要求5所述的系統(tǒng),其中該CODEC庫(kù)包括是有損CODEC的第一CODEC;以及是無(wú)損CODEC的第二CODEC。
7.如權(quán)利要求1所述的系統(tǒng),進(jìn)一步包括和CODEC庫(kù)相關(guān)聯(lián)的注冊(cè),并且為了在CODEC庫(kù)中搜索和定位特殊的CODEC是可搜索的。
8.一種用于通過(guò)傳輸信道從源到目的裝置傳遞媒體信號(hào)的系統(tǒng),包括目的代理,其適于由目的裝置使用來(lái)和源通信,并從源接收媒體信號(hào)的壓縮的表示,以及將壓縮的表示解壓為媒體信號(hào)的解壓的表示,這樣解壓的表示可由目的裝置存儲(chǔ)或使用。
9.如權(quán)利要求8所述的系統(tǒng),其中該目的代理包括診斷代理,其適于提供用于傳輸?shù)胶驮聪嚓P(guān)聯(lián)的神經(jīng)網(wǎng)絡(luò)的診斷信息,其中該診斷信息表示目的裝置接收、存儲(chǔ)、處理或顯示媒體信號(hào)的能力;以及解壓代理,其適于將媒體信號(hào)的壓縮的表示解壓為要由目的裝置存儲(chǔ)或播放的信號(hào)的解壓的表示。
10.如權(quán)利要求9所述的系統(tǒng),其中該目的代理進(jìn)一步包括解壓代理,其適于接收媒體信號(hào)的壓縮的表示并且還適于接收和來(lái)自傳輸系統(tǒng)的信號(hào)的壓縮的表示相關(guān)聯(lián)的CODEC解壓器,其還適于使用CODEC解壓器來(lái)將信號(hào)的壓縮的表示解壓為要由目的裝置存儲(chǔ)或播放的信號(hào)的解壓的表示。
11.如權(quán)利要求10所述的系統(tǒng),其中目的代理適于在多個(gè)不同目的裝置上被存儲(chǔ)和操作以解壓和播放媒體信號(hào),其中每一目的裝置都具有用于解壓、存儲(chǔ)或播放媒體信號(hào)的不同性能。
12.如權(quán)利要求11所述的系統(tǒng),其中通過(guò)使用不同的CODEC解壓器,該目的代理適于解壓多個(gè)媒體信號(hào)的不同的壓縮的表示,其中每一CODEC解壓器和用來(lái)壓縮信號(hào)的對(duì)應(yīng)的不同CODEC壓縮器相關(guān)聯(lián)。
13.如權(quán)利要求12所述的系統(tǒng),其中該目的代理適于使用CODEC解壓媒體的壓縮的表示,其中基于至少一個(gè)下面的參數(shù)提供CODEC關(guān)于參考媒體信號(hào)的CODEC的計(jì)算機(jī)實(shí)現(xiàn)的先前學(xué)習(xí)的行為,關(guān)于壓縮或解壓相同媒體信號(hào)的先前嘗試的CODEC的計(jì)算機(jī)實(shí)現(xiàn)的先前學(xué)習(xí)的行為,關(guān)于媒體信號(hào)的CODEC操作和媒體信號(hào)的參考算法壓縮的比較,傳輸信道的學(xué)習(xí)到的約束條件,以及目的裝置的學(xué)習(xí)到的約束條件。
14.如權(quán)利要求13所述的系統(tǒng),其中該目的代理適于可互換的使用模塊CODEC、分型CODEC或小波CODEC。
15.一種用于從源到目的裝置通過(guò)傳輸信道通信媒體信號(hào)的系統(tǒng),包括CODEC,其適于壓縮媒體信號(hào)以最優(yōu)化沿著傳輸信道的傳輸和由目的裝置的解壓,其中該壓縮由CODEC基于至少一個(gè)下面的參數(shù)做出關(guān)于另一參考信號(hào)的CODEC的先前學(xué)習(xí)到的行為,關(guān)于壓縮或解壓相同媒體信號(hào)的先前嘗試的CODEC的先前學(xué)習(xí)到的行為,關(guān)于媒體信號(hào)的CODEC操作和媒體信號(hào)的參考算法壓縮的比較,傳輸信道的學(xué)習(xí)到的約束條件,以及目的裝置的學(xué)習(xí)到的約束條件。
16.如權(quán)利要求15所述的系統(tǒng),其中該CODEC適于將媒體信號(hào)壓縮為n個(gè)不同的媒體信號(hào)的壓縮的表示,并且這些表示適于分別在n個(gè)獨(dú)特的比率速率被發(fā)送到目的裝置。
17.如權(quán)利要求15所述的系統(tǒng),進(jìn)一步包括可搜索的服務(wù)質(zhì)量(QoS)庫(kù),其和CODEC相關(guān)聯(lián),并且適于由人工智能系統(tǒng)或操作系統(tǒng)中的至少一個(gè)使用,以基于存儲(chǔ)在QoS標(biāo)準(zhǔn)庫(kù)中的至少一個(gè)QoS標(biāo)準(zhǔn)確定關(guān)于媒體信號(hào)的CODEC的合適的使用。
18.一種用于處理媒體信號(hào)的系統(tǒng),包括CODEC操作系統(tǒng),其適于和CODEC庫(kù)和人工智能(AI)系統(tǒng)接口,以使用AI系統(tǒng)來(lái)從庫(kù)中識(shí)別合適的CODEC,并以該CODEC處理該媒體信號(hào)。
19.如權(quán)利要求18所述的系統(tǒng),進(jìn)一步包括至少一個(gè)CODEC,其和CODEC操作系統(tǒng)相關(guān)聯(lián),用于使用在至少部分基于由CODEC操作系統(tǒng)操作的處理媒體信號(hào)中。
20.如權(quán)利要求19所述的系統(tǒng),進(jìn)一步包括可搜索的CODEC庫(kù),其和CODEC操作系統(tǒng)相關(guān)聯(lián),并且適于存儲(chǔ)多個(gè)分開(kāi)的和獨(dú)特的CODECS,其中該CODEC操作系統(tǒng)適于和可搜索的CODEC庫(kù)并和AI系統(tǒng)合作,以確定存儲(chǔ)在CODEC庫(kù)中的用于用在處理媒體信號(hào)中的合適CODEC。
21.如權(quán)利要求20所述的系統(tǒng),進(jìn)一步包括可搜索的網(wǎng)絡(luò)傳輸標(biāo)準(zhǔn)庫(kù),其和CODEC操作系統(tǒng)相關(guān)聯(lián),并且適于由AI系統(tǒng)或CODEC操作系統(tǒng)中的至少一個(gè)使用,以基于存儲(chǔ)在網(wǎng)絡(luò)傳輸標(biāo)準(zhǔn)庫(kù)中的至少一個(gè)網(wǎng)絡(luò)傳輸標(biāo)準(zhǔn)確定關(guān)于媒體信號(hào)的CODEC的合適的使用。
22.如權(quán)利要求21所述的系統(tǒng),進(jìn)一步包括可搜索的標(biāo)準(zhǔn)質(zhì)量(QoS)庫(kù),其和CODEC操作系統(tǒng)相關(guān)聯(lián),并且適于由AI系統(tǒng)或操作系統(tǒng)中的至少一個(gè)使用,以基于存儲(chǔ)在QoS標(biāo)準(zhǔn)庫(kù)中的至少一個(gè)QoS標(biāo)準(zhǔn)來(lái)確定關(guān)于媒體信號(hào)的CODEC的合適的使用。
23.如權(quán)利要求22所述的系統(tǒng),進(jìn)一步包括目的代理,其和CODEC操作系統(tǒng)相關(guān)聯(lián),并且適于由目的地址使用來(lái)和也和CODEC操作系統(tǒng)相關(guān)聯(lián)的源通信,從而從源接收媒體信號(hào)的壓縮的表示,以及將壓縮的表示解壓為媒體信號(hào)的解壓的表示,使得可由目的裝置存儲(chǔ)或使用解壓的表示。
24.一種用于處理媒體信號(hào)的系統(tǒng),包括目的裝置,其適于和源通信并從源接收媒體信號(hào)的壓縮的表示,其包括CODEC,該CODEC適于基于至少一個(gè)下面的參數(shù)將壓縮的表示解壓為解壓的表示;關(guān)于另一參考信號(hào)的CODEC的先前學(xué)習(xí)到的行為,關(guān)于壓縮或解壓相同媒體信號(hào)的先前嘗試的CODEC的先前學(xué)習(xí)到的行為,關(guān)于媒體信號(hào)的CODEC操作和媒體信號(hào)的參考算法壓縮的比較,傳輸信道的學(xué)習(xí)到的約束條件,以及目的裝置的學(xué)習(xí)到的約束條件。
25.如權(quán)利要求24所述的系統(tǒng),其中該媒體信號(hào)適于被根據(jù)最初的格式使用,其中最初的格式根據(jù)最初的一組參數(shù),而且目的裝置適于以另一格式處理和顯示媒體信號(hào)的解壓的表示,并且此格式是根據(jù)和最初的一組參數(shù)不同的另一組參數(shù)的,這樣目的裝置不能根據(jù)最初的一組參數(shù)處理和顯示最初的格式的媒體信號(hào)。
26.如權(quán)利要求25所述的系統(tǒng),其中CODEC適于將媒體信號(hào)壓縮為n個(gè)不同的媒體信號(hào)的壓縮的表示,并且這些表示適于分別在n個(gè)獨(dú)特的比特速率被發(fā)送到目的裝置。
27.如權(quán)利要求26所述的系統(tǒng),其中n個(gè)不同的壓縮的表示適于被至少在n個(gè)基本上不同的傳輸速率發(fā)送,其中基于至少一個(gè)下面的參數(shù)區(qū)分不同的傳輸速率;不同的傳輸系統(tǒng)標(biāo)準(zhǔn);不同的目的裝置標(biāo)準(zhǔn);以及不同的媒體類型標(biāo)準(zhǔn)。
28.一種用于處理媒體信號(hào)的系統(tǒng),包括CODEC,其適于在媒體信號(hào)上執(zhí)行壓縮和解壓的至少一個(gè);以及人工智能(AI)系統(tǒng),其適于結(jié)合CODEC操作,以調(diào)整相對(duì)媒體信號(hào)的CODEC的操作,其中AI系統(tǒng)適于學(xué)習(xí)CODEC的關(guān)于至少一個(gè)影響CODEC的操作的參數(shù)的行為,并且還適于基于學(xué)習(xí)到的行為更改AI系統(tǒng)本身或CODEC中至少一個(gè)的操作以增加以合適的形式提供CODEC以最優(yōu)化壓縮或解壓媒體信號(hào)的能力。
29.如權(quán)利要求28所述的系統(tǒng),其中該CODEC包括離散余弦變換CODEC。
30.如權(quán)利要求29所述的系統(tǒng),其中CODEC包括分型CODEC。
31.如權(quán)利要求30所述的系統(tǒng),其中CODEC包括小波CODEC。
32.如權(quán)利要求31所述的系統(tǒng),其中CODEC包括有損CODEC。
33.如權(quán)利要求32所述的系統(tǒng),其中CODEC包括基本上無(wú)損的CODEC。
34.如權(quán)利要求33所述的系統(tǒng),進(jìn)一步包括可搜索的CODEC庫(kù),其適于存儲(chǔ)多個(gè)分開(kāi)的和獨(dú)特的CODECS,其中該CODEC適于被存儲(chǔ)在可搜索的CODEC庫(kù)中,并且AI系統(tǒng)適于和CODEC庫(kù)合作,以定位并存取CODEC,使得AI系統(tǒng)可以執(zhí)行至少一個(gè)關(guān)于CODEC的操作。
35.一種用于處理媒體信號(hào)的系統(tǒng),包括CODEC庫(kù),其適于存儲(chǔ)多個(gè)分開(kāi)的和獨(dú)特的CODECS;人工智能(AI)系統(tǒng),其和CODEC庫(kù)相關(guān)聯(lián),并且適于執(zhí)行關(guān)于CODEC庫(kù)的操作,以從多個(gè)CODECS中確定合適的CODEC以使用在處理媒體信號(hào)中;CODEC操作系統(tǒng),其和CODEC庫(kù)及AI系統(tǒng)相關(guān)聯(lián),并且適于控制AI系統(tǒng)關(guān)于CODEC庫(kù)的操作;源系統(tǒng),其適于基于來(lái)自CODEC庫(kù)的CODEC和基于AI系統(tǒng)的操作壓縮媒體信號(hào);目的系統(tǒng),其適于和源系統(tǒng)通信及從源系統(tǒng)接收媒體信號(hào)的壓縮的表示,并將壓縮的表示解壓為用于由目的系統(tǒng)使用的解壓的表示,以及通信系統(tǒng),其和源系統(tǒng)以及目的系統(tǒng)相關(guān)聯(lián),使得源系統(tǒng)適于將媒體信號(hào)的壓縮的表示發(fā)送到目的系統(tǒng),并且目的系統(tǒng)適于接收壓縮的表示并且還適于將壓縮的表示合適的解壓為解壓的表示以由目的系統(tǒng)存儲(chǔ)或使用。
36.如權(quán)利要求35所述的系統(tǒng),進(jìn)一步包括可搜索的網(wǎng)絡(luò)傳輸標(biāo)準(zhǔn)庫(kù),其和AI系統(tǒng)及CODEC操作系統(tǒng)相關(guān)聯(lián),并且適于由AI系統(tǒng)使用,以基于存儲(chǔ)在網(wǎng)絡(luò)傳輸標(biāo)準(zhǔn)庫(kù)中的至少一個(gè)網(wǎng)絡(luò)傳輸標(biāo)準(zhǔn)從CODEC庫(kù)中確定用于處理媒體信號(hào)的合適的CODEC。
37.如權(quán)利要求36所述的系統(tǒng),進(jìn)一步包括可搜索的QoS標(biāo)準(zhǔn)庫(kù),其和AI系統(tǒng)及適于由AI系統(tǒng)使用的CODEC操作系統(tǒng)相關(guān)聯(lián),以基于存儲(chǔ)在QoS標(biāo)準(zhǔn)庫(kù)中的至少一個(gè)QoS標(biāo)準(zhǔn)從CODEC庫(kù)中確定用于處理媒體信號(hào)的合適的CODEC。
38.如權(quán)利要求37所述的系統(tǒng),其中AI系統(tǒng)適于基于至少一個(gè)下面的參數(shù)從CODEC庫(kù)中確定用于處理媒體信號(hào)的CODEC的合適的使用關(guān)于另一參考信號(hào)的CODEC的先前學(xué)習(xí)到的行為,關(guān)于壓縮或解壓相同媒體信號(hào)的先前嘗試的CODEC的先前學(xué)習(xí)到的行為,關(guān)于媒體信號(hào)的CODEC操作和媒體信號(hào)的參考算法壓縮的比較,傳輸信道的學(xué)習(xí)到的約束條件,以及目的裝置的學(xué)習(xí)到的約束條件。
39.一種用于在源和n個(gè)獨(dú)特的目的裝置之間傳遞媒體信號(hào)的系統(tǒng),并且每一獨(dú)特的目的裝置具有處理媒體信號(hào)的獨(dú)特的能力,其中n是大于等于一的整數(shù),該系統(tǒng)包括壓縮系統(tǒng),其和源相關(guān)聯(lián),并且適于將媒體信號(hào)壓縮為n個(gè)媒體信號(hào)的獨(dú)特的壓縮的表示;其中n個(gè)獨(dú)特的壓縮的表示的每一個(gè)適于被從源發(fā)送到n個(gè)目的裝置中的獨(dú)特的一個(gè),并且適于由各個(gè)目的裝置解壓為n個(gè)要由各個(gè)目的裝置播放的媒體信號(hào)的解壓的表示中的獨(dú)特的一個(gè)。
40.如權(quán)利要求39所述的系統(tǒng),其中該壓縮系統(tǒng)進(jìn)一步包括可搜索的CODEC庫(kù),其和壓縮系統(tǒng)相關(guān)聯(lián),并且適于存儲(chǔ)多個(gè)分開(kāi)的和獨(dú)特的CODECS,其中該壓縮系統(tǒng)適于至少部分基于由CODEC庫(kù)存儲(chǔ)的至少一個(gè)CODEC將媒體信號(hào)壓縮為n個(gè)獨(dú)特的壓縮的表示的每一個(gè)。
41.如權(quán)利要求40所述的系統(tǒng),其中該壓縮系統(tǒng)進(jìn)一步包括可搜索的網(wǎng)絡(luò)傳輸標(biāo)準(zhǔn)庫(kù),其和壓縮系統(tǒng)相關(guān)聯(lián),并且適于由壓縮系統(tǒng)使用,以基于存儲(chǔ)在網(wǎng)絡(luò)傳輸標(biāo)準(zhǔn)庫(kù)中的至少一個(gè)網(wǎng)絡(luò)傳輸標(biāo)準(zhǔn)確定至少一個(gè)用于將媒體信號(hào)壓縮為n個(gè)獨(dú)特的壓縮的表示的合適的CODEC。
42.如權(quán)利要求41所述的系統(tǒng),其中該壓縮系統(tǒng)進(jìn)一步包括可搜索的QoS標(biāo)準(zhǔn)庫(kù),其和壓縮系統(tǒng)相關(guān)聯(lián),并且適于由壓縮系統(tǒng)使用以基于存儲(chǔ)在QoS標(biāo)準(zhǔn)庫(kù)中的至少一個(gè)QoS標(biāo)準(zhǔn)從CODEC庫(kù)中確定用于將媒體信號(hào)壓縮為n個(gè)獨(dú)特的壓縮的表示的合適的CODEC。
43.如權(quán)利要求42所述的系統(tǒng),進(jìn)一步包括目的代理,其和壓縮系統(tǒng)相關(guān)聯(lián),并且適于由n個(gè)獨(dú)特的目的裝置的每一個(gè)使用來(lái)和源通信,使得n個(gè)目的裝置中的每一個(gè)可以從源系統(tǒng)接收媒體信號(hào)的n個(gè)壓縮的表示中的獨(dú)特的一個(gè),并且至少部分基于由壓縮系統(tǒng)使用來(lái)創(chuàng)建各個(gè)壓縮的表示的CODEC來(lái)使用合適的CODEC,使得各個(gè)目的裝置可以將各個(gè)壓縮的表示合適的解壓為可由各個(gè)目的裝置存儲(chǔ)或使用的媒體信號(hào)的解壓的表示中的合適的一個(gè)。
44.如權(quán)利要求43所述的系統(tǒng),其中該壓縮系統(tǒng)適于將媒體信號(hào)至少部分基于至少一個(gè)下面的參數(shù)壓縮為n個(gè)不同的壓縮的表示中的每一個(gè)關(guān)于另一參考信號(hào)的至少一個(gè)CODEC的先前學(xué)習(xí)到的行為,關(guān)于壓縮或解壓相同媒體信號(hào)的先前嘗試的至少一個(gè)CODEC的先前學(xué)習(xí)到的行為,關(guān)于媒體信號(hào)的CODEC操作和媒體信號(hào)的參考算法壓縮的比較,傳輸信道的學(xué)習(xí)到的約束條件,以及目的裝置的學(xué)習(xí)到的約束條件。
45.一種用于從至少一個(gè)源到通常的接收器的傳遞n個(gè)媒體信號(hào)的獨(dú)特的壓縮的表示的系統(tǒng),包括目的裝置,其適于和至少一個(gè)源通信并從至少一個(gè)源接收n個(gè)獨(dú)特的壓縮的表示中的每一個(gè),其中該目的裝置進(jìn)一步適于將n個(gè)獨(dú)特的壓縮的表示中的每一個(gè)解壓為n個(gè)媒體信號(hào)的解壓的表示,并且播放n個(gè)解壓的表示中的每一個(gè)。
46.一種用于從源到目的裝置通過(guò)傳輸信道傳遞媒體信號(hào)的系統(tǒng),包括壓縮系統(tǒng),其適于接收關(guān)于傳輸信道的參數(shù)的信息并且通過(guò)使用至少部分基于參數(shù)信息的壓縮技術(shù)將媒體信號(hào)壓縮為媒體信號(hào)的壓縮的表示。
47.一種用于在源和目的之間傳遞n個(gè)獨(dú)特的媒體信號(hào)的系統(tǒng),包括壓縮系統(tǒng),其適于接收關(guān)于媒體信號(hào)的參數(shù)的信息,并且通過(guò)使用至少部分基于參數(shù)信息的壓縮技術(shù)將媒體信號(hào)壓縮為媒體信號(hào)的壓縮的表示。
48.一種用于壓縮來(lái)自源的用于傳輸?shù)侥康难b置的媒體信號(hào)的系統(tǒng),包括壓縮系統(tǒng),其適于基于傳輸信道約束條件、目的信道約束條件、媒體信號(hào)的參數(shù)和壓縮系統(tǒng)的先前壓縮操作的比較中的至少一個(gè),將媒體信號(hào)壓縮為媒體信號(hào)的壓縮的表示。
49.一種用于在目的裝置解壓從源接收的壓縮的媒體信號(hào)的系統(tǒng),其中該目的裝置適于從源接收媒體信號(hào)的壓縮的表示以及來(lái)自源的解壓說(shuō)明,使得目的裝置適于至少部分基于指令將壓縮的表示解壓為媒體信號(hào)的解壓的表示。
50.一種用于構(gòu)建用來(lái)壓縮媒體信號(hào)的神經(jīng)網(wǎng)絡(luò)的方法,包括提供多個(gè)CODECS;以及以一種方式預(yù)先學(xué)習(xí)至少一個(gè)和每一CODEC的關(guān)于預(yù)先確定的類型的媒體信號(hào)的壓縮性能相關(guān)聯(lián)的參數(shù);以及以一種方式記住每一預(yù)先學(xué)習(xí)到的參數(shù),使得將來(lái)可以選擇至少一個(gè)特殊的CODEC來(lái)基于特殊CODEC的預(yù)先學(xué)習(xí)到的參數(shù)來(lái)壓縮特殊的新的媒體信號(hào)。
51.如權(quán)利要求50所述的方法,進(jìn)一步包括形成具有多個(gè)CODECS的CODEC庫(kù);以在CODEC庫(kù)中的每一CODEC壓縮至少一個(gè)預(yù)先確定的類型的測(cè)試媒體信號(hào);自動(dòng)地學(xué)習(xí)至少一個(gè)關(guān)于在壓縮至少一個(gè)預(yù)先確定的類型的測(cè)試媒體信號(hào)中的每一CODEC的表現(xiàn)的參數(shù);以一種方式自動(dòng)記住每一這種學(xué)習(xí)到的參數(shù),使得可以壓縮特殊的媒體信號(hào)。
52.一種用于在源和目的之間至少部分通過(guò)無(wú)線傳輸信道傳遞媒體信號(hào)的系統(tǒng),其中壓縮的表示是壓縮系統(tǒng),其適于將媒體信號(hào)壓縮為可進(jìn)一步適于通過(guò)無(wú)線載波發(fā)送到無(wú)線目的裝置的媒體信號(hào)的壓縮的表示;以及神經(jīng)網(wǎng)絡(luò),其使用人工智能來(lái)通過(guò)壓縮系統(tǒng)學(xué)習(xí)至少一個(gè)下面的參數(shù),從而最優(yōu)化媒體信號(hào)的壓縮無(wú)線目的裝置的約束條件,無(wú)線傳輸載波的約束條件,以及媒體信號(hào)的參數(shù)和壓縮系統(tǒng)的先前的壓縮操作的比較。
53.一種用于壓縮用于從無(wú)線源傳輸?shù)侥康难b置的媒體信號(hào)的系統(tǒng)。
54.一種用于將媒體信號(hào)壓縮為用于傳輸?shù)綗o(wú)線目的裝置的媒體信號(hào)的壓縮的表示的系統(tǒng)。
55.一種用于在目的裝置將媒體信號(hào)的壓縮的表示解壓為媒體信號(hào)的解壓的表示的系統(tǒng),其中從源通過(guò)無(wú)線載波在目的裝置接收壓縮的表示。
56.一種用于通過(guò)IP網(wǎng)絡(luò)在源和目的裝置之間傳遞媒體信號(hào)的系統(tǒng),其中將媒體信號(hào)的壓縮的表示從源通過(guò)IP網(wǎng)絡(luò)發(fā)送到目的裝置。
57.一種用于將媒體信號(hào)壓縮為媒體信號(hào)的壓縮的表示的系統(tǒng),使得能夠?qū)⒚襟w信號(hào)的壓縮的表示從源通過(guò)IP網(wǎng)絡(luò)發(fā)送到目的裝置。
58.一種用于將媒體信號(hào)的壓縮的表示解壓為媒體信號(hào)的解壓的表示的系統(tǒng),其中在目的裝置從源通過(guò)IP網(wǎng)絡(luò)接收壓縮的表示。
59.一種用于通過(guò)IP網(wǎng)絡(luò)傳遞媒體信號(hào)的方法,包括使用人工智能來(lái)從多個(gè)可用的CODECS中確定最合適的用于壓縮和解壓媒體信號(hào)的CODEC,其中基于至少一個(gè)下面的參數(shù)確定合適的CODEC關(guān)于另一參考信號(hào)的CODEC的先前學(xué)習(xí)到的行為,關(guān)于壓縮或解壓相同媒體信號(hào)的先前嘗試的個(gè)CODEC的先前學(xué)習(xí)到的行為,關(guān)于媒體信號(hào)的CODEC操作和媒體信號(hào)的參考算法壓縮的比較,傳輸信道的學(xué)習(xí)到的約束條件,以及目的裝置的學(xué)習(xí)到的約束條件。
60.如權(quán)利要求59所述的方法,其中該系統(tǒng)適于通過(guò)IP網(wǎng)絡(luò)傳遞流媒體信號(hào)。
61.一種用于在源和目的之間通過(guò)傳輸信道傳遞音頻信號(hào)的系統(tǒng),其中壓縮音頻信號(hào)來(lái)形成可以通過(guò)傳輸信道發(fā)送到目的裝置的音頻信號(hào)的壓縮的表示,使得目的裝置可以將壓縮的表示解壓為用于由目的裝置存儲(chǔ)或使用的解壓的表示。
62.如權(quán)利要求61所述的系統(tǒng),其中該系統(tǒng)適于傳遞流音頻信號(hào)。
63.一種用于將音頻信號(hào)壓縮為音頻信號(hào)的壓縮的表示以從源通過(guò)傳輸信道傳遞到目的裝置的系統(tǒng)。
64.一種用于在目的裝置解壓音頻信號(hào)的壓縮的表示以由目的裝置存儲(chǔ)或使用的系統(tǒng),其中由目的裝置從源通過(guò)傳輸信道接收壓縮的表示。
65.一種用于從源通過(guò)傳輸信道傳遞流音頻信號(hào)到目的裝置的方法,包括從源通過(guò)傳輸信號(hào),在低到大約25Kbps的傳輸速率上傳送CD質(zhì)量的音樂(lè)到目的裝置。
66.如權(quán)利要求65所述的方法,其中通過(guò)將源音頻信號(hào)壓縮為壓縮的表示并且通過(guò)傳輸信號(hào)將壓縮的表示在傳輸速率傳送到目的裝置來(lái)傳送CD質(zhì)量的音樂(lè),其中可由目的裝置將壓縮的表示解壓為解壓的表示,其中解壓的表示基本上是最初音頻信號(hào)的CD質(zhì)量的表示,并且可由目的裝置存儲(chǔ)或播放。
67.一種用于在源和目的之間通過(guò)傳輸信道傳遞視頻信號(hào)的系統(tǒng),其中將流視頻信號(hào)壓縮為壓縮的表示,其中可以將壓縮的表示從源通過(guò)傳輸信道發(fā)送到目的,并且由目的裝置解壓為解壓的表示以由目的裝置存儲(chǔ)或播放。
68.一種用于在源和目的之間傳遞流視頻信號(hào)的系統(tǒng),包括媒體處理模塊;動(dòng)態(tài)播放器模塊;圖像處理器;基線快像模塊;信號(hào)分類器;多個(gè)依靠神經(jīng)網(wǎng)絡(luò)處理器的CODECS;CODECS庫(kù);網(wǎng)絡(luò)層輸入模塊;網(wǎng)絡(luò)層輸出模塊;以及計(jì)時(shí)器。
69.如權(quán)利要求68所述的系統(tǒng),進(jìn)一步包括動(dòng)態(tài)客戶請(qǐng)求處理模塊。
70.如權(quán)利要求69所述的系統(tǒng),進(jìn)一步包括裝置和網(wǎng)絡(luò)參數(shù)測(cè)量模塊。
全文摘要
提供了一種用于流媒體信號(hào)的媒體流系統(tǒng)。該媒體流系統(tǒng)采用分開(kāi)的和截然不同的CODEC的庫(kù)(145),提供其具有可搜索的CODEC庫(kù),并用來(lái)確定在媒體信號(hào)中的特定特性,從而識(shí)別信號(hào)的類似部分。該媒體流系統(tǒng)使用計(jì)算機(jī)實(shí)現(xiàn)的智能系統(tǒng),比如智能機(jī)制來(lái)隨著信號(hào)流(150)學(xué)習(xí)和捕捉信號(hào)的獨(dú)特的特性。該媒體流系統(tǒng)還隨著信號(hào)從源媒體(100)流到目的裝置(130,135,140)來(lái)壓縮和解壓媒體信號(hào)。
文檔編號(hào)H04N7/24GK1568466SQ02818931
公開(kāi)日2005年1月19日 申請(qǐng)日期2002年9月26日 優(yōu)先權(quán)日2001年9月26日
發(fā)明者喬迪·林恩·雷諾茲, 羅伯特·沃爾特·英格拉哈姆 申請(qǐng)人:交互設(shè)備有限公司