專利名稱:圖象文件容器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及數(shù)據(jù)處理,且特別涉及圖象文件的存儲和建立。
(2)背景技術(shù)通常,傳統(tǒng)圖象文件格式規(guī)定在一個圖象文件中存儲一個單個的圖象。例如使用這種傳統(tǒng)圖象文件格式的數(shù)字照相機會為每張拍攝的像片建立一個分離的圖象文件。因此,如果攝影師用這個照相機拍幾張相關(guān)的圖象以形成一個全面的照片,每個圖象都會被存儲在一個分離的圖象文件,要求攝影師或其它使用者手工組織和跟蹤各個圖象文件只到它們被整合到一個分開的過程中。這個手工任務(wù)會很麻煩并容易出錯,特別是當(dāng)攝影師/使用者有大量圖象要管理的時候。
傳統(tǒng)圖象文件格式的另一缺點是它們一般不支持?jǐn)?shù)字權(quán)限管理(DRM)特征。因而,圖象所有者一般不可以使用相同級別的普遍可得到的知識產(chǎn)權(quán)保護或音像內(nèi)容。
傳統(tǒng)圖象文件格式的缺點還有它們不為注解圖象提供方便的、集成的支持。例如如果攝影師或使用者想用傳統(tǒng)圖象文件格式為單個的圖象文件或一組相關(guān)的圖象提供聲音注解,攝影師或使用者通常必須將聲音注解存儲在一個分開的文件中并手工管理在這兩個文件之間的關(guān)聯(lián)。
(3)發(fā)明內(nèi)容根據(jù)所述各個實施例的幾個方面,圖象容器文件查具有至少一個第一多媒體流和一個第二多媒體流。圖象容器文件可包含超過兩個多媒體流。第一多媒體流包括代表一個圖象的第一圖象數(shù)據(jù)。第二多媒體流包括任意的數(shù)據(jù),通常與第一多媒體流的圖象相關(guān)。例如該任意數(shù)據(jù)可與同一圖象的不同表示相對應(yīng)。該任意數(shù)據(jù)還可對應(yīng)于對第一圖象數(shù)據(jù)的圖象、音頻、視頻、文本、日期和時間、位置、網(wǎng)鏈接、或動畫注解。任意數(shù)據(jù)還可以對應(yīng)于與第一多媒體流的圖象數(shù)據(jù)在在某些方面相關(guān)的第二圖象數(shù)據(jù)。例如第二多媒體數(shù)據(jù)可以是與在超時期間捕獲到的一系列圖象相對應(yīng)的多個多媒體流之一,或是可與第一圖象數(shù)據(jù)相結(jié)合形成具有更高整體質(zhì)量(例如更大的動態(tài)范圍、象素分辨率或視野)的新圖象。任意數(shù)據(jù)還可對應(yīng)于能用于觀看和/或處理第一圖象數(shù)據(jù)的應(yīng)用程序(即,執(zhí)行文件)。
在另一方面,圖象容器文件還可以包括一個可擴展元數(shù)據(jù)對象,以保存描述存儲在圖象容器文件中的一個或多個圖象表示的信息。元數(shù)據(jù)可包括與圖象(或音頻或視頻片斷)有關(guān)的信息諸如標(biāo)題、創(chuàng)作者、主題、說明、出版人、投稿人、日期、格式、語言和其它類型的取決于應(yīng)用程序的想要的信息。元數(shù)據(jù)還可以根據(jù)每容器或每數(shù)據(jù)流,引用圖象文件容器中的其它流。
在另一方面,圖象容器文件可用加密格式存儲一個或多個圖象表示和/或其它密碼格式的多媒體流。在此例中,圖象容器文件會包括數(shù)字權(quán)限限信息。例如數(shù)字權(quán)限限信息可以涉及得到訪問包含在圖象容器文件中的加密的數(shù)據(jù)的許可。
(4)
以下參照附圖對本發(fā)明的非有限的,非窮盡的實施例進行描述。其中,在各個視圖中相同參考號,除非另行說明,指相同的部分。
圖1為示出根據(jù)一個實施例的使用圖象容器的系統(tǒng)的方框圖。
圖2為示出根據(jù)一個實施例的圖象容器文件的形成的流程圖。
圖3為示出根據(jù)第一實施例的圖象容器文件的組件的方框圖。
圖4為示出根據(jù)第二實施例的圖象容器文件的組件的方框圖。
圖5為示出根據(jù)第三實施例的圖象容器文件的組件的方框圖。
圖6為示出根據(jù)一個實施例適于形成或使用圖象容器文件的示例計算機環(huán)境的方框圖。
(5)具體實施方式
圖1示出根據(jù)一個實施例使用圖象容器文件的簡化的系統(tǒng)100。在此實施例中,系統(tǒng)100包括裝置102和平臺104。在典型的應(yīng)用中,裝置102是圖象生成裝置,例如數(shù)字照相機、掃描儀、移動電話(帶照相機)、帶照相機的個人電腦、帶照相的個人數(shù)字助理(PDA)、帶靜象捕獲的機頂盒、帶靜象捕獲的磁帶放像機、帶靜象捕獲的數(shù)字通用盤放象機(DVD)、或其它合適的圖象感測/捕獲設(shè)備或裝置。平臺104通常和個人電腦、存儲器裝置(例如硬盤驅(qū)動器、壓縮磁盤、數(shù)字通用盤(DVD)、磁帶、網(wǎng)絡(luò)存儲器或其它存儲媒體)、打印機、或其它適合用于存儲或觀看圖象的設(shè)備或裝置一起實施。系統(tǒng)100的其它實施例可以用類似于裝置102的多個裝置或類似于平臺104的多個平臺,或這些裝置和平臺的組合實施。在此實施例中,可以在裝置和/或平臺之間可交換地傳送圖象容器文件。
在此實施例中,裝置102包括圖象容器文件發(fā)生器110、數(shù)據(jù)存儲器114和到通信媒體的接口116。在此實施例中,平臺104包括圖象容器文件讀出器120、數(shù)據(jù)存儲器124和接口126。在其它實施例中,(例如當(dāng)將平臺104主要作為存儲器使用時)可以省略圖象文件讀出器120。
裝置102通過接口116和鏈路108將圖象容器文件106(由圖象容器文件發(fā)生器110生成并存儲在數(shù)據(jù)存儲器114中)發(fā)送至平臺104。作為示例,鏈路108可以是直接布線的連接、無線連接、網(wǎng)絡(luò)(例如局域網(wǎng)、因特網(wǎng)、電話系統(tǒng)等等)、從裝置102到平臺104的可移除媒體的直接傳輸(可移除磁盒媒體、閃存媒體、CD-ROM、DVD-RW或DVD+RW)等等。平臺104通過接口126接收圖象容器文件106并將它存儲在數(shù)據(jù)存儲器124。然后,就可以象用戶想要的那樣,通過圖象容器文件讀出器120訪問圖象容器文件106中包含的數(shù)據(jù)了。
和使用傳統(tǒng)圖象文件格式的系統(tǒng)不同,系統(tǒng)100使用圖象容器文件106,以為存儲圖象、圖象注解、數(shù)字權(quán)限限管(DRM)信息和其它自說明方式的任意信息提供一個靈活的、可擴展的、向后兼容的機制。以下結(jié)合圖3-6更詳細地描述圖象容器文件106的實施例。
圖2示出根據(jù)一個實施例形成圖象容器文件106(圖1)。見圖1和2,裝置102的這個實施例如下形成一個圖象容器文件。在方框202中,裝置102收集圖象數(shù)據(jù)。在一個實施例中,從圖象傳感器(未示出)收集圖象數(shù)據(jù)。例如該傳感器可以是數(shù)字照相機的電荷耦合器件(CCD)。然后將圖象數(shù)據(jù)存儲在數(shù)據(jù)存儲器114中。在一些實施例中,可以用裝置處理圖象數(shù)據(jù),然后將圖象數(shù)據(jù)存儲在數(shù)據(jù)存儲器114中。圖象數(shù)據(jù)可以是原始的傳感器數(shù)據(jù)、非壓縮圖象數(shù)據(jù)(即,處理成圖象的非壓縮表示的原始數(shù)據(jù));壓縮圖象數(shù)據(jù)(即,根據(jù)聯(lián)合圖象專家組(JPEG)或其它合適的壓縮格式)。圖象數(shù)據(jù)的格式通常取決于由裝置執(zhí)行的處理,并如以下將描述的,圖象容器文件106被設(shè)計為接受任何格式。
在方框204中,裝置102存儲來自方框202的圖象數(shù)據(jù),作為圖象容器文件106中的多媒體流。如這里使用的,在此上下文中的多媒體流通常指(但不限于)單個圖象或用于表示單個圖象的信息,記錄的視頻的一部分,記錄的音頻的一部分,或可執(zhí)行對象或應(yīng)用程序。在一個實施例中,圖象容器文件發(fā)生器110從數(shù)據(jù)存儲器114取得圖象數(shù)據(jù)并將與圖象數(shù)據(jù)和圖象容器文件的整個組織相關(guān)的信息存儲在圖象容器文件106中的首部部分中。圖象文件發(fā)生器110還將圖象數(shù)據(jù)(例如象素數(shù)據(jù))中至少一些存儲在圖象容器文件106的數(shù)據(jù)部分。在此實施例中,圖象容器文件發(fā)生器還可以在圖象容器文件的索引部分為存儲在數(shù)據(jù)部分中的圖象數(shù)據(jù)存儲位置信息。例如該位置信息可包括來自圖象容器文件的預(yù)選點的偏移量。在某些實施例中,可以省略索引對象(例如當(dāng)圖象容器文件只包含表示單個圖象的圖象數(shù)據(jù)時)。首部、數(shù)據(jù)和索引部分構(gòu)成圖象容器文件106的此實施例的組成部分。在其它實施例中,圖象容器文件106可包括其它組件。例如下面結(jié)合圖4和5描述的一些附加的組件。
在判定塊206中,裝置102確定是否要將附加的信息與方框202中收集的圖象數(shù)據(jù)相關(guān)聯(lián)。例如裝置102可包括麥克風(fēng)及用于記錄音頻片段的合適處理組件。用戶可通過啟動音頻記錄組件并對著麥克風(fēng)說話來為方框202中收集的圖象數(shù)據(jù)作聲音注解。在此實施例中,將圖象容器文件發(fā)生器110配置成檢測何時啟動音頻記錄特征注解時在方框202中收集的圖象數(shù)據(jù)。
裝置102還可包括其它生成要與在方框202中收集的圖象數(shù)據(jù)相關(guān)聯(lián)的信息的特征。這些特征的例子包括(但不限于)(a)單個圖象的驗證和縮略圖尺寸圖象和全尺寸表示的自動生成;(b)生成隨后將被處理以建立全景圖象的一序列單個圖象;(c)生成具有對不同曝光設(shè)置、白平衡設(shè)置、壓縮設(shè)置、象素分辨率、色空間(例如用于打印的色空間和用于用監(jiān)視器顯示的不同色空間)、視野、彩色背景(以下詳述);(d)生成其它注解(例如視頻、圖形、文本注解);和(e)添加可執(zhí)行應(yīng)用程序(例如解釋原始圖象數(shù)據(jù)或解碼專用壓縮格式所需的應(yīng)用程序)。在一個實施例中,以實質(zhì)上類似于高級系統(tǒng)格式(ASF)的方式將視頻和音頻數(shù)據(jù)流加到圖象容器文件106中。每個附加的數(shù)據(jù)塊都被添加一個具有首部信息的附加多媒體流,首部信息是有關(guān)存儲在首部部分的數(shù)據(jù)的信息,而數(shù)據(jù)本身存儲在圖象容器文件106的數(shù)據(jù)部分。
如這里所使用的,色空間是數(shù)學(xué)空間,在其中可用(通常)少量的顏色坐標(biāo)定義色值。例如RGB色空間用三個坐標(biāo)(標(biāo)志R,G和B)來指定一種顏色,CMYK色空間用四種不同的坐標(biāo)(C,M,Y和K)來指定一種顏色。色值在這二個空間中表現(xiàn)不同。RGB通常用于描述光,它是加法的。CMYK通常用于描述油墨,它是減法的??梢詫⑸祻囊粋€色空間轉(zhuǎn)變成另一個色空間,但在某些情況中,這將會降低色值。
如這里所使用的,彩色背景參照某個對象的標(biāo)準(zhǔn)定義顏色坐標(biāo)實際指什么。例如幾個裝置可使用RGB色空間,但在每個這些裝置上顯示的相同RGB色值可能看上去不一樣(即使在相同的觀看條件下)。這是因為每個裝置都使用不同的彩色背景。
在判決方框206中圖象容器文件發(fā)生器110確定沒有附加信息將與在方框202中收集的圖象數(shù)據(jù)相關(guān)聯(lián),該圖象容器文件是完整的且形成圖象容器文件的操作流程結(jié)束了。否則,操作流程進到方框208。
回到圖2,在方框208中,裝置104形成另一多媒體流。如果附加信息是用于圖象的另一表示的圖象數(shù)據(jù),圖象容器文件發(fā)生器110以與方框202和204中先前描述的實質(zhì)上相同的方式執(zhí)行方框208。即,在此實施例中,圖象容器文件發(fā)生器110生成首部信息并將它存儲在首部部分,將圖象數(shù)據(jù)(例如象素數(shù)據(jù))中至少一些存儲到數(shù)據(jù)部分,并將用于此新信息的位置信息存儲在索引部分中。如果附加信息不是圖象數(shù)據(jù),圖象容器文件發(fā)生器110將執(zhí)行實質(zhì)上相同的操作,但首部信息將在圖象容器文件106的首部部分中包括專用于附加信息的信息。例如首部信息可包括指示該附加信息是音頻數(shù)據(jù)、視頻數(shù)據(jù)、可執(zhí)行應(yīng)用程序等等。然后,操作流程返回到判決方框206,以確定是否應(yīng)形成另一多媒體流。
圖3示出根據(jù)第一實施例的圖象容器文件106(圖1)的組件。在此實施例中,圖象容器文件106包括首部部分302、數(shù)據(jù)部分304和索引部分306。首部部分302包括用于包含在圖象容器文件106中的每個多媒體流的首部信息。在此示例的圖象容器文件中,首部部分302包括分別用于第一多媒體流至第N多媒體流首部信息3121-312N。首部信息包括諸如多媒體流的基本屬性、在多媒體中出現(xiàn)的語言、存儲在用于多媒體流的索引部分306中的索引信息的屬性、在首部信息中指定填充的填充信息之類的信息。首部信息還可包括識別用于此多媒體流的壓縮算法的信息、插入首部信息的手寫命令、識別插入到用于多媒體流的數(shù)據(jù)(存儲在數(shù)據(jù)部分304中)中的標(biāo)記的標(biāo)記信息。在其它實施例中,首部信息可包括有關(guān)多媒體流的其它屬性的信息。在一個實施例中,以與前述ASF格式類似的(但簡化的)方式形成首部信息。以上對首部部分302的描述示出特定實施例;然而,在其它實施例中,可用任何合適的格式(例如不同的首部信息格式、定義等等)形成首部部分302。
在此例中,數(shù)據(jù)部分304包括分別用于第一到第N多媒體流的首部信息3121-312N。在一示例實施例中,將包用于將數(shù)據(jù)存儲在數(shù)據(jù)部分306中。雖然,以下更詳細地描述包數(shù)據(jù)存儲器的實施例。在其它實施例中,可以用不同的方法將數(shù)據(jù)存儲在數(shù)據(jù)部分304中。在此示例實施例中,因為圖象可以相當(dāng)大,包可以有高達四十億字節(jié)的可變的尺寸。在其它實施例中,包可以是固定的或不同的尺寸。在某些實施例中可以可選擇地交叉存取代表來自不同流的數(shù)據(jù)的包。即,來自流A的包接下來是來自流B的包,然后是來自流A的附加包,使裝置102能以任何次序生成信息。另外,包可包含來自多于一個多媒體流的數(shù)據(jù)。還有,多個包可用于存儲單個多媒體流的數(shù)據(jù)。這些包方法為在數(shù)據(jù)部分304中的多媒體數(shù)據(jù)的存儲提供了靈活性。如前所述,包含在數(shù)據(jù)部分304中的數(shù)據(jù)可以是,例如圖象數(shù)據(jù)(原始的、解壓的和/或壓縮的)。另外,數(shù)據(jù)部分304可包含代表單個圖象的多個表示的圖象數(shù)據(jù),用于要組合成單個圖象的多個圖象的圖象數(shù)據(jù)。再有,數(shù)據(jù)部分304可包括注解圖象數(shù)據(jù)的音頻數(shù)據(jù)、音頻數(shù)據(jù)或文本數(shù)據(jù),和/或影響或處理包含在數(shù)據(jù)對象中的圖象數(shù)據(jù)的可執(zhí)行程序代碼。
索引部分306包括分別用于第一到第N多媒體流的索引3161-316N。如前所述,索引信息被用于在數(shù)據(jù)對象中定位數(shù)據(jù)的想要部分。在一個實施例中,索引對象306實質(zhì)上與在前述ASF格式中使用的索引對象類似。在其它實施例中,可以使用其它合適的索引機制。
圖4示出根據(jù)第二實施例的圖象容器文件106(圖1)的組件。此實施例實質(zhì)上與圖3的實施例相類似,除了此實施例在首部部分302中包括一元數(shù)據(jù)部分400。元數(shù)據(jù)部分400提供一個用于將元數(shù)據(jù)與圖象容器文件106的所有多媒體流或與圖象文件容器106的一個或多個特定多媒體流相關(guān)聯(lián)的機制。另外,元數(shù)據(jù)部分400使圖象文件容器106的最終用戶能對元數(shù)據(jù)進行訪問,而不必處理數(shù)據(jù)部分304和索引部分306。還有,元數(shù)據(jù)部分400提供可擴展元數(shù)據(jù)格式,以在將圖象容器文件106適用于其它應(yīng)用程序方面提供靈活性。
在一個實施例中,元數(shù)據(jù)部分400允許定義一個或多個名字空間,在每個名字空間中都具有專用的元數(shù)據(jù)項,包括自說明名字字段和相關(guān)聯(lián)的值字段。在一個實施例中,此元數(shù)據(jù)內(nèi)容被映射成可擴展標(biāo)記語言(XML)。在一個實施例中,名字空間可包含具有實質(zhì)上類似于2003年3月4日出版的Dublin Core Metadata Initiative(DCMI)Metadata Terms中及2003年2月12出版的DCMI Type Vocabulary中的定義的定義。另選的或附加的元數(shù)據(jù)名字空間也可以包括與那些與其它建立的元數(shù)據(jù)標(biāo)準(zhǔn)相對應(yīng)的實質(zhì)上相類似的定義。例如這些其它格式包括2002年4月日本電器工業(yè)發(fā)展聯(lián)合會(Japan Electronic Industry Development Association(JEIDA))的用于數(shù)字照相機(EXIF)版本2.2的可交換圖象文件格式和/或1997年7月國際新聞電訊理事會(International Press Telecommunications Council(IPTC))出版的信息交換模型(IIM)版本4.1。其它標(biāo)準(zhǔn)化的或應(yīng)用程序?qū)S玫淖哉f明名字空間也可包括在元數(shù)據(jù)部分400中。
元數(shù)據(jù)部分400可包括諸如標(biāo)題、創(chuàng)作者、主題、說明、出版人、投稿人、日期、格式、語言和其它類型的取決于應(yīng)用程序的想要的信息之類與圖象(或音頻或視頻片斷)相關(guān)的信息。因為元數(shù)據(jù)部分400是可擴展的,應(yīng)用程序和/或用戶能定義它們自己的元數(shù)據(jù),且這些擴展可以沒有沖突地在單個容器和元數(shù)據(jù)部分同時使用。
圖5示出根據(jù)第三實施例的圖象容器文件106(圖1)的組件。此實施例實質(zhì)上與圖4的實施例相似,除了此實施例在首部部分302包括數(shù)字權(quán)限限管理(DRM)部分500和分別用于第一到第N多媒體流的加密數(shù)據(jù)5141-514N(取代圖4的實施例中的3141-314N)。在一個實施例中,DRM部分500包括與訪問加密數(shù)據(jù)5141-514N有關(guān)的信息。例如DRM部分500可包括許可服務(wù)器的通用資源定位器(URL)(即,用戶可從中取得使用包含在圖象容器文件106中的圖象和其它數(shù)據(jù)的許可)。該許可可包括用于解密和加密的數(shù)據(jù)5141-514N的密鑰。DRM信息還可以與驗證圖象數(shù)據(jù)的真實性相關(guān)。在其它實施例中,可以基于每多媒體流應(yīng)用加密。
圖6示出可用來實施這里所述技術(shù)的通用的計算機環(huán)境600。例如裝置102和平臺104都可包括實質(zhì)上與通用計算機環(huán)境600類似的計算機環(huán)境。計算機環(huán)境600只是計算環(huán)境的一個例子,并不意味著對計算機和網(wǎng)絡(luò)結(jié)構(gòu)的使用范圍和功能的任何限定。不應(yīng)將計算機環(huán)境600解釋成依賴或需要示例計算機環(huán)境600中示出的組件的任何一個或其組合。
參照圖6,實施發(fā)明的示例系統(tǒng)包括諸如計算裝置600之類的計算裝置。在一個非常基本的配置中,計算裝置600通常包括至少一個處理單元602和系統(tǒng)存儲器604。按照計算裝置的確切配置和類型,系統(tǒng)存儲器604可以是易失性的(例如RAM),非易失性的(例如ROM、閃存等等)或兩者的某種組合。系統(tǒng)存儲器604通常包括一操作系統(tǒng)605、一個或多個程序模塊606,還可包括程序數(shù)據(jù)607。此計算裝置600的基本配置由在圖6中虛線608內(nèi)的那些組件示出。
計算裝置600可具有附加的特征或功能。例如計算裝置600還可包括附加的數(shù)據(jù)存儲器裝置(可移除的和/或不可移除的)例如磁盤、光盤或磁帶。這些附加的存儲器在圖6中由可移除存儲器609和不可移除存儲器610示出。計算機存儲媒體可包括在任何用于存儲信息(諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù))的方法和技術(shù)中實施的易失性的和非易失性的,可移除的和/或不可移除的媒體。系統(tǒng)存儲器604、可移除存儲器609和不可移除存儲器610都是計算機存儲媒體的例子。計算機存儲媒體包括,但不限于,RAM、ROM、EEPROM、閃存或其它存儲器技術(shù)、CD-ROM、數(shù)字通用光盤(“DVD”)或其它光存儲器、磁帶盒、磁帶、磁盤存儲器或其它磁存儲器裝置,或任何其它能用于存儲想要的信息及可由計算裝置600訪問的媒體。任何這些計算機存儲媒體都可以是裝置600的一部分。計算裝置600還可包括諸如鍵盤622、鼠標(biāo)623、筆、聲音輸入裝置、接觸式輸入裝置、掃描儀等等之類的輸入裝置612及諸如顯示器、擴音器、打印機等等之類的輸出裝置614。這些裝置在本領(lǐng)域內(nèi)是熟知的,在此不必贅述了。
計算裝置600還可包括使該裝置能(例如通過網(wǎng)絡(luò))與其它計算裝置618通信的通信連接616。通信連接616是通信媒體的一個例子。通信媒體通常由計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它在經(jīng)調(diào)制的數(shù)據(jù)信號(例如載波或其它傳輸機制)中的數(shù)據(jù)來體現(xiàn),并包括任何信息傳送媒體。術(shù)語“經(jīng)調(diào)制的數(shù)據(jù)信號”的意思是一個信號被設(shè)定了一個或多個其特征或以在信號中編碼信息的方式被改變。作為示例而非限定,通信媒體包括諸如有線網(wǎng)絡(luò)和直接連線的連接之類的有線媒體和諸如聲音、RF、紅外線及其它無線媒體之類的無線媒體。這里使用的術(shù)語計算機可讀媒體包括存儲媒體和通信媒體兩者。
這里可以在計算機可執(zhí)行指令的總的上下文中對各種模塊和技術(shù)(例如由一個或多個計算機或其它裝置執(zhí)行的程序模塊)進行描述。一般來說,程序模塊包括用于執(zhí)行特定任務(wù)或?qū)嵤┨囟ǔ橄髷?shù)據(jù)類型的例行程序、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等。這些程序模塊等等可以作為本機碼執(zhí)行或被下載并執(zhí)行,例如在一個虛擬機器或其它即時匯編執(zhí)行環(huán)境中。一般可以在如各種實施例中想要的那樣組合或分配程序模塊的功能。
在整個說明書中引用“一個實施例”或“一示例實施例”的意思是在本發(fā)明的至少一個實施例中包括了特定的所述特征、結(jié)構(gòu)或?qū)傩?。因此,使用這些短語可指不止一個實施例。另外,可以以任何合適的方式在一個或多個實施例中組合所述的特征、結(jié)構(gòu)或?qū)傩浴?br>
然而,在相關(guān)領(lǐng)域中的技術(shù)人員可理解可以沒有一個或多個特定細節(jié)或用其它方法、資源、材料等實施本發(fā)明。在其它例子中,為了避免混淆本發(fā)明,沒有詳細示出或描述熟知的結(jié)構(gòu)、資源或操作。
盡管描繪和描述了本發(fā)明的示例實施例和應(yīng)用程序,應(yīng)理解本發(fā)明不限于上述確切的配置和資源??梢栽诓黄x本發(fā)明權(quán)利要求的范圍的情況下對這里揭示的本發(fā)明的方法和系統(tǒng)的安排、操作和細節(jié)進行各種修改、改變和變形,對本領(lǐng)域的技術(shù)人員來說是顯而易見的。
權(quán)利要求
1.用于圖象文件的以數(shù)據(jù)結(jié)構(gòu)編碼的計算機可讀媒體,其特征在于,所述數(shù)據(jù)結(jié)構(gòu)包含用來包括與第一多媒體流相關(guān)的第一圖象數(shù)據(jù)及與第二多媒體流相關(guān)的第一任意數(shù)據(jù)的數(shù)據(jù)部分;和用來包括包含了與第一多媒體流相關(guān)的信息的第一首部對象及包含了與第二多媒體流相關(guān)的信息的第二首部對象的首部部分。
2.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述第二多媒體流包含第二圖象數(shù)據(jù),第一和第二圖象數(shù)據(jù)提供單個圖象的不同表示。
3.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述數(shù)據(jù)部分包括與三個或更多個多媒體流相關(guān)的數(shù)據(jù)。
4.如權(quán)利要求2所述的計算機可讀媒體,其特征在于,所述第一和第二圖象數(shù)據(jù)分別包括壓縮和非壓縮圖象數(shù)據(jù)。
5.如權(quán)利要求2所述的計算機可讀媒體,其特征在于,所述第一圖象是按第一照相機設(shè)置得到的,而所述第二圖象數(shù)據(jù)是按第二照相機設(shè)置得到的。
6.如權(quán)利要求2所述的計算機可讀媒體,其特征在于,所述第一圖象數(shù)據(jù)表示具有第一象素分辨率的單個圖象,而第二圖象數(shù)據(jù)表示具有不同于第一象素分辨率的第二象素分辨率的單個圖象。
7.如權(quán)利要求2所述的計算機可讀媒體,其特征在于,所述第一圖象數(shù)據(jù)表示具有第一象素格式的單個圖象,而第二圖象數(shù)據(jù)表示具有不同于第一象素格式的第二象素格式的單個圖象,其中象素格式包括一個或多個組件、組件定序和組件數(shù)字格式。
8.如權(quán)利要求2所述的計算機可讀媒體,其特征在于,所述第一圖象數(shù)據(jù)是用第一色空間得到的,而第二圖象數(shù)據(jù)是從第二色空間得到的。
9.如權(quán)利要求2所述的計算機可讀媒體,其特征在于,所述第一圖象數(shù)據(jù)是按第一彩色背景得到的,而第二圖象數(shù)據(jù)是按第二彩色背景得到的。
10.如權(quán)利要求2所述的計算機可讀媒體,其特征在于,所述第一圖象數(shù)據(jù)表示具有第一視野的單個圖象,而第二圖象數(shù)據(jù)表示具有第二視野的單個圖象。
11.如權(quán)利要求2所述的計算機可讀媒體,其特征在于,所述第一圖象數(shù)據(jù)包含原始圖象傳感器數(shù)據(jù)。
12.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述第二多媒體流包括表示由第一圖象數(shù)據(jù)表示的圖象的注解的數(shù)據(jù)。
13.如權(quán)利要求12所述的計算機可讀媒體,其特征在于,所述第二多媒體流包含音頻數(shù)據(jù)。
14.如權(quán)利要求12所述的計算機可讀媒體,其特征在于,所述第二多媒體流包含視頻數(shù)據(jù)。
15.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述第二多媒體流包含可執(zhí)行組件。
16.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述第二多媒體流包含第二圖象數(shù)據(jù),其中來自第一圖象的數(shù)據(jù)和來自第二圖象的數(shù)據(jù)被結(jié)合起來用于表示比由第一和第二圖象數(shù)據(jù)表示的單個圖象大的圖象。
17.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述第二多媒體流包含第二圖象數(shù)據(jù),其中來自第一圖象的數(shù)據(jù)和來自第二圖象的數(shù)據(jù)被結(jié)合起來用于表示比由第一和第二圖象數(shù)據(jù)表示的單個圖象質(zhì)量高的圖象。
18.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述數(shù)據(jù)結(jié)構(gòu)還包括元數(shù)據(jù)。
19.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述數(shù)據(jù)結(jié)構(gòu)還包括包含與存儲在數(shù)據(jù)部分的數(shù)據(jù)的位置相關(guān)的信息的索引部分。
20.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述存儲在數(shù)據(jù)部分的數(shù)據(jù)是加密的。
21.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述首部還包括數(shù)字權(quán)限限管理信息。
22.如權(quán)利要求21所述的計算機可讀媒體,其特征在于,所述數(shù)字權(quán)限限管理信息包括與取得訪問第一圖象數(shù)據(jù)的許可相關(guān)的信息。
23.如權(quán)利要求21所述的計算機可讀媒體,其特征在于,所述數(shù)字權(quán)限限管理信息包含與取得驗證第一圖象數(shù)據(jù)的真實性的許可相關(guān)的信息。
24.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述多媒體數(shù)據(jù)結(jié)構(gòu)與高級系統(tǒng)格式(ASF)兼容。
25.如權(quán)利要求1所述的計算機可讀媒體,其特征在于,所述第二多媒體流包含圖象、音頻、視頻、圖形、文本、日期和時間、位置、Web鏈接、或動畫數(shù)據(jù)。
26.一種用于形成圖象容器文件的方法,其特征在于,包括收集圖象數(shù)據(jù);在圖象容器文件中形成一個第一多媒體流,第一多媒體流包括從收集的圖象數(shù)據(jù)得到的第一圖象數(shù)據(jù)和具有與第一圖象數(shù)據(jù)相關(guān)的信息的第一首部對象;收集任意數(shù)據(jù);及在圖象容器文件中形成一個第二多媒體流,第二多媒體流包括從收集的任意數(shù)據(jù)得到的第一任意數(shù)據(jù)和具有與第一任意數(shù)據(jù)相關(guān)的第二首部對象。
27.如權(quán)利要求26所述的方法,其特征在于,所述第一任意數(shù)據(jù)包括第二圖象數(shù)據(jù),第一和第二圖象數(shù)據(jù)提供單個圖象的不同表示。
28.如權(quán)利要求27所述的方法,其特征在于,所述第一和第二圖象數(shù)據(jù)分別包含壓縮和非壓縮圖象數(shù)據(jù)。
29.如權(quán)利要求27所述的方法,其特征在于,所述第一圖象數(shù)據(jù)是按第一照相設(shè)置得到的,而所述第二圖象數(shù)據(jù)是按第二照相設(shè)置得到的。
30.如權(quán)利要求27所述的方法,其特征在于,所述第一圖象數(shù)據(jù)代表具有第一象素分辨率的第一圖象數(shù)據(jù),而第二圖象數(shù)據(jù)代表具有不同于第一象素分辨率的第二象素分辨率的單個圖象。
31.如權(quán)利要求27所述的方法,其特征在于,所述第一圖象數(shù)據(jù)代表具有第一象素格式的第一圖象數(shù)據(jù),而第二圖象數(shù)據(jù)代表具有不同于第一象素格式的第二象素格式的單個圖象。
32.如權(quán)利要求27所述的方法,其特征在于,所述第一圖象數(shù)據(jù)是按第一色空間得到的而第二圖象數(shù)據(jù)是按第二色空間得到的。
33.如權(quán)利要求27所述的方法,其特征在于,所述第一圖象數(shù)據(jù)是使用第一彩色背景得到的,而第二圖象數(shù)據(jù)是使用第二彩色背景得到的。
34.如權(quán)利要求26所述的方法,其特征在于,所述第一圖象數(shù)據(jù)包括原始圖象傳感器數(shù)據(jù)。
35.如權(quán)利要求26所述的方法,其特征在于,所述第一任意數(shù)據(jù)包括表示由第一圖象數(shù)據(jù)表示的圖象的注解的數(shù)據(jù)。
36.如權(quán)利要求35所述的方法,其特征在于,所述第一任意數(shù)據(jù)包括音頻、視頻、圖形、文本、日期和時間、位置、web鏈接、或動畫數(shù)據(jù)。
37.如權(quán)利要求26所述的方法,其特征在于,所述第一任意數(shù)據(jù)包含一可執(zhí)行組件。
38.如權(quán)利要求26所述的方法,其特征在于,所述第一任意數(shù)據(jù)包含第二圖象數(shù)據(jù),其中來自第一圖象的數(shù)據(jù)和來自第二圖象的數(shù)據(jù)被結(jié)合起來用于表示比由第一和第二圖象數(shù)據(jù)表示的單個圖象大的圖象。
39.如權(quán)利要求26所述的方法,其特征在于,所述第一任意數(shù)據(jù)包含第二圖象數(shù)據(jù),其中來自第一圖象的數(shù)據(jù)和來自第二圖象的數(shù)據(jù)被結(jié)合起來用于表示比由第一和第二圖象數(shù)據(jù)表示的單個圖象質(zhì)量高的圖象。
40.如權(quán)利要求26所述的方法,其特征在于,還包括將元數(shù)據(jù)添加到圖象容器文件。
41.如權(quán)利要求26所述的方法,其特征在于,還包括形成一索引部分,以包含與存儲在圖象容器文件中的數(shù)據(jù)的位置相關(guān)的信息。
42.如權(quán)利要求26所述的方法,其特征在于,還包括將數(shù)字權(quán)限限管理信息存儲在圖象容器文件中。
43.如權(quán)利要求42所述的方法,其特征在于,所述數(shù)字權(quán)限限管理信息包含與取得對第一圖象數(shù)據(jù)進行訪問的許可相關(guān)的信息。
44.如權(quán)利要求42所述的方法,其特征在于,所述數(shù)字權(quán)限限管理信息包含與驗證第一圖象數(shù)據(jù)的真實性相關(guān)的信息。
45.如權(quán)利要求26所述的方法,其特征在于,所述圖象文件容器包含加密的數(shù)據(jù)。
46.如權(quán)利要求26所述的方法,其特征在于,所述多媒體結(jié)構(gòu)與高級系統(tǒng)格式(ASF)兼容。
47.如權(quán)利要求26所述的方法,其特征在于,還包括在圖象容器文件中形成多個多媒體流,該多個多媒體流包括所述第二多媒體流,其中在多個多媒體流中的另一個多媒體流包括第二任意數(shù)據(jù)和與具有第二任意數(shù)據(jù)相關(guān)的信息的第三首部對象。
48.一種用于存儲圖象數(shù)據(jù)的系統(tǒng),其特征在于,該系統(tǒng)包括一個圖象數(shù)據(jù)接收器;和圖象文件發(fā)生器,以形成具有多個多媒體流的圖象容器文件,所述多個多媒體流包括第一多媒體流和第二多媒體流,其中第一多媒體流包括從由圖象數(shù)據(jù)接收器接收的圖象數(shù)據(jù)得到的第一圖象數(shù)據(jù),和第二多媒體流包括任意數(shù)據(jù)。
49.如權(quán)利要求48所述的系統(tǒng),其特征在于,所述任意數(shù)據(jù)包括第二圖象數(shù)據(jù),第一和第二圖象數(shù)據(jù)提供單個圖象的不同表示。
50.如權(quán)利要求48所述的系統(tǒng),其特征在于,所述任意數(shù)據(jù)包含表示由第一圖象數(shù)據(jù)表示的圖象的注解的數(shù)據(jù)。
51.如權(quán)利要求50所述的系統(tǒng),其特征在于,所述任意數(shù)據(jù)包含音頻、視頻、圖形、文本、日期和時間、位置、web鏈接、或動畫數(shù)據(jù)。
52.如權(quán)利要求48所述的系統(tǒng),其特征在于,所述任意數(shù)據(jù)包含一可執(zhí)行組件。
53.如權(quán)利要求48所述的系統(tǒng),其特征在于,所述任意數(shù)據(jù)包含第二圖象數(shù)據(jù),其中來自第一圖象的數(shù)據(jù)和來自第二圖象的數(shù)據(jù)被結(jié)合起來用于表示比由第一和第二圖象數(shù)據(jù)表示的單個圖象大的圖象。
54.如權(quán)利要求48所述的系統(tǒng),其特征在于,所述第一任意數(shù)據(jù)包含第二圖象數(shù)據(jù),其中來自第一圖象的數(shù)據(jù)和來自第二圖象的數(shù)據(jù)被結(jié)合起來用于表示比由第一和第二圖象數(shù)據(jù)表示的單個圖象質(zhì)量高的圖象。
55.如權(quán)利要求48所述的系統(tǒng),其特征在于,所述圖象文件發(fā)生器進一步將元數(shù)據(jù)添加到圖象容器文件。
56.如權(quán)利要求48所述的系統(tǒng),其特征在于,所述圖象文件發(fā)生器進一步添加在圖象容器文件中與第一圖象數(shù)據(jù)和的第一任意數(shù)據(jù)的位置相關(guān)的索引信息。
57.如權(quán)利要求48所述的系統(tǒng),其特征在于,所述圖象容器文件包含加密的數(shù)據(jù)。
58.如權(quán)利要求48所述的系統(tǒng),其特征在于,所述圖象文件發(fā)生器進一步將數(shù)字權(quán)限限管理信息存儲在圖象容器文件中。
59.如權(quán)利要求58所述的系統(tǒng),其特征在于,所述數(shù)字權(quán)限限管理信息包含與取得對第一圖象數(shù)據(jù)進行訪問的許可相關(guān)的信息。
60.如權(quán)利要求58所述的系統(tǒng),其特征在于,所述數(shù)字權(quán)限限管理信息包含與驗證第一圖象數(shù)據(jù)的真實性相關(guān)的信息。
61.如權(quán)利要求48所述的系統(tǒng),其特征在于,可以用多媒體閱讀器訪問所述圖象容器文件。
62.如權(quán)利要求61所述的系統(tǒng),其特征在于,所述多媒體閱讀器包括一個可閱讀高級系統(tǒng)格式(ASF)文件的閱讀器。
63.一種計算機可讀媒體,其特征在于,包含如權(quán)利要求48所述的組件。
64.一種用于存儲圖象數(shù)據(jù)的系統(tǒng),其特征在于,該系統(tǒng)包括收集圖象數(shù)據(jù)的裝置;和用于生成包括多個多媒體流的圖象容器文件的裝置,所述多個多媒體流包括第一多媒體流和第二多媒體流,其中第一多媒體流包括從由圖象數(shù)據(jù)接收器接收的圖象數(shù)據(jù)得到的第一圖象數(shù)據(jù),第二多媒體流包括任意數(shù)據(jù)。
65.如權(quán)利要求64所述的系統(tǒng),其特征在于,所述任意數(shù)據(jù)包括第二圖象數(shù)據(jù),第一和第二圖象數(shù)據(jù)提供單個圖象的不同表示。
66.如權(quán)利要求64所述的系統(tǒng),其特征在于,所述任意數(shù)據(jù)包括表示由第一圖象數(shù)據(jù)表示的圖象的注解的數(shù)據(jù)。
67.如權(quán)利要求66所述的系統(tǒng),其特征在于,所述任意數(shù)據(jù)包括音頻、視頻、圖形、文本、日期和時間、位置、web鏈接、或動畫數(shù)據(jù)。
68.如權(quán)利要求64所述的系統(tǒng),其特征在于,所述用于生成的裝置有選擇地對包含在圖象容器文件中的數(shù)據(jù)加密。
69.如權(quán)利要求64所述的系統(tǒng),其特征在于,所述任意數(shù)據(jù)包括一可執(zhí)行組件。
70.如權(quán)利要求64所述的系統(tǒng),其特征在于,所述用于生成的裝置包括將元數(shù)據(jù)添加到圖象容器文件的裝置。
71.如權(quán)利要求64所述的系統(tǒng),其特征在于,所述用于生成的裝置包括用于存儲與圖象容器文件中第一圖象數(shù)據(jù)和的第一任意數(shù)據(jù)的位置有關(guān)的索引信息的裝置。
72.如權(quán)利要求64所述的系統(tǒng),其特征在于,還包括用于將數(shù)字權(quán)限限管理信息存儲在圖象容器文件中的裝置。
73.如權(quán)利要求72所述的系統(tǒng),其特征在于,所述數(shù)字權(quán)限限管理信息包含與取得對第一圖象數(shù)據(jù)進行訪問的許可相關(guān)的信息。
74.如權(quán)利要求72所述的系統(tǒng),其特征在于,所述數(shù)字權(quán)限限管理信息包含與驗證第一圖象數(shù)據(jù)的真實性相關(guān)的信息。
75.一種計算機可讀媒體,其特征在于,它具有如權(quán)利要求64所述的組件。
76.如權(quán)利要求2所述的計算機可讀媒體,其特征在于,所述照相機設(shè)置包含曝光設(shè)置。
77.如權(quán)利要求2所述的計算機可讀媒體,其特征在于,所述照相機設(shè)置包含白0平衡設(shè)置。
78.如權(quán)利要求25所述的方法,其特征在于,所述照相機設(shè)置包含曝光設(shè)置。
79.如權(quán)利要求25所述的方法,其特征在于,所述照相機設(shè)置包含白平衡設(shè)置。
全文摘要
圖象容器文件至少具有第一和第二多媒體流(MS)。第一MS包括表示一個圖象的第一圖象數(shù)據(jù)。第二MS包括任意數(shù)據(jù),例如它可以對應(yīng)于同一圖象的不同表示;對第一圖象數(shù)據(jù)的注解;第二圖象數(shù)據(jù)和第一圖象數(shù)據(jù)一起形成具有更大動態(tài)范圍、分辨率、視野或其它可以從處理兩個或更多單個圖象得到的屬性;或一個與第一MS相關(guān)的可執(zhí)行文件。圖象容器文件還可以包括保存描述圖象容器文件的一個或多個多媒體流的信息的可擴展元數(shù)據(jù)。另外,圖象容器文件還包括提供與取得對加密數(shù)據(jù)進行訪問的許可或與驗證加密或非加密數(shù)據(jù)的真實性有關(guān)的信息的DRM信息。
文檔編號G11B20/12GK1604080SQ200410055739
公開日2005年4月6日 申請日期2004年7月29日 優(yōu)先權(quán)日2003年9月30日
發(fā)明者G·T·頓巴爾, J·D·特納斯基, K·A·德比奎, W·M·克勞 申請人:微軟公司