專利名稱:結(jié)構(gòu)化文檔、尤其xml文檔的編碼/譯碼的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于結(jié)構(gòu)化文檔,尤其XML文檔編碼的方法或裝置,其中,根據(jù)模式從結(jié)構(gòu)化的文檔中生成比特流,以及涉及一種用于譯碼的方法或裝置,其中,根據(jù)模式從比特流中生成結(jié)構(gòu)化的文檔。
在MPEG-7標(biāo)準(zhǔn)上工作的范圍內(nèi)開(kāi)發(fā)了一種用于XML數(shù)據(jù)的二進(jìn)制編碼的方法,該方法以下稱為BiM法,而且是例如從文獻(xiàn)ISO/IEC FDIS15938-12001(E),“信息技術(shù)-多媒體內(nèi)容描述接口-部分1系統(tǒng)”中公開(kāi)的。該方法采用了在編碼和譯碼時(shí)存在的XML模式定義,例如MPEG-7模式,以便生成XML描述的各個(gè)數(shù)據(jù)元用的代碼。該方法的前提是,在編碼器和譯碼器面前至少部分地存在同樣的模式定義。這可以例如通過(guò)在譯碼器中固定地裝入標(biāo)準(zhǔn)化的XML模式的方式來(lái)確保。此外,還存在著獨(dú)立或附加于原來(lái)的文檔地給譯碼器傳送模式的可能性??梢砸晕谋镜男问絹?lái)執(zhí)行將模式從編碼器向澤碼器的傳輸,其中,可以應(yīng)用一種例如像ZIP那樣的文本壓縮標(biāo)準(zhǔn)。
本發(fā)明所基于的任務(wù)現(xiàn)在在于,如此來(lái)說(shuō)明給出一種方法和裝置,使得特別有效地實(shí)現(xiàn)模式的傳輸,并且在譯碼器上降低了所傳輸?shù)臄?shù)據(jù)量和計(jì)算功率,該數(shù)據(jù)量和計(jì)算功率對(duì)于從模式中生成代碼表是必要的。此外,還應(yīng)確保未完整地傳輸?shù)哪J降囊恢滦浴?br>
在編碼法方面通過(guò)權(quán)利要求1所述的特征,在譯碼法方面通過(guò)權(quán)利要求7所述的特征,在編碼裝置方面通過(guò)權(quán)利要求14所述的特征,和在譯碼裝置方面通過(guò)權(quán)利要求15所述的特征來(lái)根據(jù)本發(fā)明解決該任務(wù)。
其它的權(quán)利要求涉及本發(fā)明方法或裝置的有利的擴(kuò)展方案。
本發(fā)明基本上在于,用編碼法根據(jù)Meta模式(Meta-scheme)從模式中生成比特流,或比特流的一部分,其中,執(zhí)行以下的優(yōu)化中的一項(xiàng)或多項(xiàng)-從元素說(shuō)明和屬性說(shuō)明中分離匿名類型,并編碼為特殊類型,該類型的類型定義被例示為模式定義中的頂層元素,-在編碼器方面將語(yǔ)法樹標(biāo)準(zhǔn)化,-替換類型名稱的字符串,
-傳輸派生樹(Vererbungsbaum)的信息。
譯碼考慮了這些優(yōu)化,并且相反地從比特流中生成一個(gè)模式。
以下借助示出在附圖中的實(shí)施例來(lái)闡述本發(fā)明。
圖1展示了用于闡述本發(fā)明編碼/譯碼的原理示圖,圖2展示了用于闡述本發(fā)明優(yōu)選實(shí)施形式的細(xì)節(jié)的示圖,圖3展示了用于闡述本發(fā)明一個(gè)其它的優(yōu)選實(shí)施形式的細(xì)節(jié)的示圖,以及圖4展示了本發(fā)明譯碼器的優(yōu)選實(shí)施形式的原理示圖。
由于XML模式在它這方面是基于標(biāo)準(zhǔn)化語(yǔ)法定義的XML文檔,即所謂的“模式用的模式(Schema for Schemas)”(W3C規(guī)程),該“模式用的模式”在一定程度上是Meta模式,所以一個(gè)模式可以同樣用上述的BiM法來(lái)編碼和傳輸。
附圖1中展示了一種裝置,其中,在第一步驟中用BiM編碼法BiM-E從XML模式XMLS中根據(jù)Meta模式SS來(lái)生成比特流的一部分或比特流BS1,以及在第二步驟中用同樣的BiM編碼法BiM-E從XML文檔XML中根據(jù)模式XMLS來(lái)生成比特流的一個(gè)其它的部分或比特流BS2,以及在相反的方向上用BiM譯碼法BiM-D從比特流的兩個(gè)部分中,或從比特流BS1和BS2中恢復(fù)XML模式和XML文檔。
在本發(fā)明的第一優(yōu)選的擴(kuò)展方案中,從元素說(shuō)明或?qū)傩哉f(shuō)明中分離所謂的“匿名類型”。
在BiM法“深度優(yōu)先”中實(shí)現(xiàn)XML文檔的傳輸,但是在譯碼器上的模式編譯的過(guò)程則要求建立“寬度優(yōu)先”,其中,例如在因特網(wǎng)頁(yè)http//www.generation5.org/simple_search.shtml上,詳細(xì)闡述了這些表達(dá)。在如序列或選擇那樣的組中,這可以通過(guò)在譯碼器方面的小的暫存器來(lái)補(bǔ)償,但是在采用可定義各個(gè)元素類型或?qū)傩灶愋偷摹澳涿愋汀钡那闆r下,工作量證明在編碼器方面的重構(gòu)是合理的在以下的例子中用AT0來(lái)表示的匿名類型定義被從元素“履歷(CurriculumVitae)”的元素說(shuō)明中分離出來(lái),并且獲得一個(gè)名稱和/或代碼,該名稱和/或代碼在相應(yīng)元素中被用于參考。由此有利地降低了所傳輸類型的等級(jí)的深度,因此簡(jiǎn)化了在譯碼器方面的模式的編譯。
例子
重構(gòu)之前的模式<復(fù)合類型名稱=“個(gè)人描述符”>
<元素名稱=“履歷”>
<復(fù)合類型>
<元素名稱=“名稱”類型=“字符串”/>
<元素名稱=“生日”類型=“日期”/>
...
</復(fù)合類型>
</元素>
<元素名稱=“職業(yè)”類型=“profTp”/>
</復(fù)合類型>
在重構(gòu)之后的模式<復(fù)合類型名稱=“個(gè)人描述符”>
<元素名稱=“履歷”類型=“AT0”/>
<元素名稱=“職業(yè)”類型=“profTp”/>
</復(fù)合類型>
<復(fù)合類型名稱=“AT0”>
<元素名稱=“名稱”類型=“字符串”/>
<元素名稱=“生日”類型=“日期”/>
...
</復(fù)合類型>
在本發(fā)明的第二優(yōu)選的擴(kuò)展方案中,像在BiM中詳細(xì)說(shuō)明的那樣,在編碼器方面執(zhí)行語(yǔ)法樹的標(biāo)準(zhǔn)化。
在BiM法中從映射XML模式結(jié)構(gòu)的語(yǔ)法樹中,生成用于比特流譯碼的所謂的“有限態(tài)自動(dòng)機(jī)”。為了提高編碼效率,這些語(yǔ)法樹不是1∶1地對(duì)應(yīng)于文本的XML定義,而是進(jìn)行標(biāo)準(zhǔn)化。在此可能出現(xiàn)三種不同的情況1.簡(jiǎn)化僅含有一個(gè)元素的組將該組分解,并將所含有的元素在所分解的組的層面上歸類到內(nèi)容模型中,其中,用重新分組之前的所分解的組和元素的相應(yīng)屬性的乘積,來(lái)替換元素的屬性minOccurs和maxOccurs。
2.簡(jiǎn)化選擇組,該選擇組含有具有屬性值minOccurs=0的元素將選擇組的屬性“minOccurs”與以前的值無(wú)關(guān)地設(shè)置到0上,給曾具有屬性值minOccurs=0的元素分配一個(gè)屬性值minOccurs=1。
3.簡(jiǎn)化嵌套的選擇組如果一個(gè)選擇組含有另一個(gè)含有屬性值minOccurs=maxOccurs=1的選擇組,則分解該選擇組,并且直接將內(nèi)容編入位于其上的選擇組中。
應(yīng)在模式的傳輸時(shí)已經(jīng)在編碼器上進(jìn)行這些簡(jiǎn)化,因?yàn)闃?biāo)準(zhǔn)化的代碼的發(fā)放影響了派生樹轉(zhuǎn)換,并且如果可以直接接納內(nèi)容模型,則在譯碼器方面簡(jiǎn)化了模式的編譯。
這里優(yōu)點(diǎn)在于,由此同樣減輕了譯碼器的負(fù)荷,并且可以將內(nèi)容模型像它在類型譯碼時(shí)的那樣,直接分配給模式編譯器。
在本發(fā)明的第三優(yōu)選的擴(kuò)展方案中,像在附圖2中所展示的那樣,執(zhí)行類型名稱的字符串的替換。
在類型定義的屬性“名稱”和“基礎(chǔ)”中,以及在元素說(shuō)明或?qū)傩哉f(shuō)明的屬性“類型”上,常常在模式中出現(xiàn)同樣的類型名稱,會(huì)將這些類型名稱作為字符串來(lái)多次傳輸。因此在類型名稱的編碼時(shí)有利地僅編碼一個(gè)號(hào)來(lái)代替名稱,并且獨(dú)立于此地存在一個(gè)表格,該表格使號(hào)重新與原始的名稱發(fā)生聯(lián)系。建議將類型號(hào)作為號(hào),下面還將詳細(xì)闡述的原類型的派生樹將該類型號(hào)分配給所有的復(fù)合類型。
相應(yīng)的內(nèi)容也適用于全局性元素說(shuō)明的屬性“名稱”及其在“ref”屬性中的參考,并且適用于屬性“替換組”中的替換組的名稱。在這些情況下可以例如采用全局元素的模式轉(zhuǎn)移代碼SBC。
以此可以節(jié)省數(shù)據(jù)容量,因?yàn)榭梢愿o湊地示出對(duì)同樣類型名稱的重復(fù)的參考,并且可以用標(biāo)準(zhǔn)壓縮程序更好地壓縮類型分配表,因?yàn)轭愋兔Q不是分布在比特流上地出現(xiàn),而是緊湊地在比特流中的互相聯(lián)系的范圍中出現(xiàn)。
在一個(gè)有利的實(shí)施形式中,對(duì)包括類型名稱、或元素名稱、或替換組名稱的清單進(jìn)行編碼。在該實(shí)施形式中將名稱在清單中的位置采用為號(hào),來(lái)代替給名稱明確地分配號(hào)。這是有利的,因?yàn)樵谇鍐沃胁槐卦賹⑻?hào)進(jìn)行編碼,并且因此確保了更有效的傳輸。
在本發(fā)明的第四優(yōu)選的擴(kuò)展方案中實(shí)現(xiàn)了派生樹的信息傳輸。
在所謂的屬性“基礎(chǔ)”中,如果它存在著的話,每個(gè)類型定義含有關(guān)于它是從何種類型派生而來(lái)的有關(guān)信息。如果收集了一個(gè)模式的所有這些信息,則得出一種樹結(jié)構(gòu),所謂的派生樹。在BiM編碼法中采用派生樹,以便在類型變換(類型鑄造)的情況下傳送元素的新的類型。在此,分配給所有從基礎(chǔ)類型派生來(lái)的類型的代碼,也就是所謂的類型代碼,以及該代碼的長(zhǎng)度對(duì)于正確的譯碼是決定性的。從基礎(chǔ)類型之下的派生樹中的所有類型的總數(shù)中得出了長(zhǎng)度。如果已完整地傳輸了模式,則在譯碼器方面都可以明確地求出代碼和代碼長(zhǎng)度。但是如果在譯碼器方面模式是不完整的,則還必須傳輸附加信息,以便給已經(jīng)傳輸?shù)念愋头峙漕愋痛a。
每個(gè)傳輸?shù)念愋驮诿Q字段中具有涉及原類型的類型代碼的號(hào)。因此通過(guò)簡(jiǎn)單的求差可以求出所導(dǎo)出類型的類型代碼。還缺少關(guān)于由傳輸類型所定義的子樹的豐度的信息,并且因此缺少關(guān)于從該傳輸類型所導(dǎo)出類型的類型代碼的長(zhǎng)度的信息。用可以變化的長(zhǎng)度代碼中的少數(shù)幾個(gè)比特可以傳輸該長(zhǎng)度。
附圖3中示范性示出了具有類型A的模式的派生樹,從該類型A中導(dǎo)出了其它的類型。相對(duì)于原類型“任何類型”,該類型例如獲得了類型代碼134。從類型A中導(dǎo)出了類型AA,AB和AC,其相對(duì)原類型的類型代碼已被給出。為了求出相對(duì)于基礎(chǔ)類型A的類型代碼,從所希望類型的類型代碼中減去基礎(chǔ)類型的類型代碼和1就已足夠了TCType=TCType bzgl.Urtyp-TCBasistyp bzgl.Urtyp-1所缺少的關(guān)于類型代碼長(zhǎng)度的信息,可以最好作為附加的數(shù)字納入在參考表中。
為了可以用標(biāo)準(zhǔn)壓縮程序來(lái)壓縮類型分配表中的信息,最好針對(duì)整個(gè)字節(jié)將它存放(字節(jié)對(duì)準(zhǔn))。第一個(gè)數(shù)是一個(gè)vluimsbf5數(shù),該vluimsbf5數(shù)編碼表格中的行數(shù),于是跟隨著一個(gè)vluimsbf5數(shù)字,該vluimsbf5數(shù)字編碼在類型代碼比特上的號(hào),并且跟隨著一個(gè)其它的vluimsbf5數(shù)字,該vluimsbf5數(shù)字示出了相對(duì)于原類型本身的類型代碼?,F(xiàn)在跟隨著填充比特,以便對(duì)準(zhǔn)字節(jié)邊界。
類型分配表的格式
類型分配表的傳輸實(shí)現(xiàn)了,甚至當(dāng)未曾或還未曾完整地傳輸和/或譯碼所基于的模式時(shí),就將有時(shí)存在于所編碼文檔中的類型代碼正確地進(jìn)行譯碼。
相應(yīng)地應(yīng)該用全局的元素來(lái)傳送全局的SBC,并且在屬于一個(gè)替換組的元素情況下應(yīng)該傳送替換代碼,其中,首先對(duì)于所有的全局元素一次傳送全局的SBC長(zhǎng)度,并用替換組的頭部元素來(lái)傳送各自的替換代碼的長(zhǎng)度。
在編碼時(shí)在各個(gè)擴(kuò)展方案中所示出的特征的任何組合是可能的,并且也可以以相應(yīng)的方式在譯碼時(shí)得到采用。
BiM法要求,將XML模式編譯為一種格式,該格式允許通過(guò)代碼的值來(lái)確定代碼字的長(zhǎng)度和選擇數(shù)據(jù)元素。為此存在著多種可能性。在MPEG-7標(biāo)準(zhǔn)(ISO/IEC 15938-12001部分1系統(tǒng),或ISO/IEC15938-62001部分6基準(zhǔn)軟件)中,對(duì)于有效負(fù)荷的譯碼建議了一種采用有限態(tài)自動(dòng)機(jī)的模型,而對(duì)于上下文(Context)路徑的譯碼建議了從模式中生成的代碼表。
在本發(fā)明譯碼器的附圖4中所示出的優(yōu)選的擴(kuò)展方案中,用字節(jié)代碼模型說(shuō)明了譯碼過(guò)程,其中,將模式結(jié)構(gòu)翻譯成由交聯(lián)狀態(tài)組成的系統(tǒng),這些狀態(tài)由字節(jié)代碼解釋器BCI來(lái)處理,其中,由編碼器接收的比特流BS含有應(yīng)選擇的后續(xù)狀態(tài)的信息。與在MPEG-7標(biāo)準(zhǔn)中所建議的模型不同,如此來(lái)設(shè)計(jì)字節(jié)代碼模型,使得既可以將表示有效負(fù)荷的比特流進(jìn)行譯碼,也可以將示出上下文路徑的比特流進(jìn)行譯碼。因此不必要為不同的編碼法而兩次在譯碼器上預(yù)留含有在模式中的同一信息。解釋器BCI從輸入比特流中讀出以BiM格式編碼XML文檔或XML模式的信息。該信息允許在當(dāng)前狀態(tài)的后續(xù)狀態(tài)中進(jìn)行選擇,該當(dāng)前狀態(tài)存放在字節(jié)代碼中。將后續(xù)狀態(tài)作為指針P固定地布設(shè)在字節(jié)代碼之內(nèi)。按照配置來(lái)輸出路徑、有效負(fù)荷或字節(jié)代碼。
用以上所建議的修改,模式的譯碼同樣可以有效地實(shí)現(xiàn)在字節(jié)代碼模型中。在此情況下不輸出有效負(fù)荷和路徑,而是直接生成字節(jié)代碼,該字節(jié)代碼可以由字節(jié)代碼解釋器用于相應(yīng)類型的譯碼。
字節(jié)代碼由結(jié)構(gòu)元素或狀態(tài)所組成。狀態(tài)是不同類型的,用狀態(tài)的頭部比特段來(lái)識(shí)別該類型。根據(jù)類型,狀態(tài)含有不同的信息字段,這些信息字段由字節(jié)代碼解釋器來(lái)讀出,并且按照配置(有效負(fù)荷/上下文路徑)和當(dāng)前的狀態(tài)來(lái)分析處理。
對(duì)于表示模式信息的狀態(tài)的種類可以設(shè)想多種變型方案。主要的是可以通過(guò)字節(jié)代碼模型的狀態(tài)來(lái)模擬XML模式的所有的語(yǔ)法元素,并且在所述狀態(tài)下提供整個(gè)的信息來(lái)使用,該信息對(duì)兩個(gè)在MPEG-7標(biāo)準(zhǔn)中所定義的算法(上下文路徑/有效負(fù)荷)的有效譯碼是必要的。
以下簡(jiǎn)述字節(jié)代碼的一種可能的構(gòu)造。
狀態(tài)的種類,概況1.復(fù)合類型的頭部狀態(tài)類型的頭部狀態(tài)形成在復(fù)合類型的譯碼時(shí)的入口點(diǎn)。它含有類型的名稱(如果不涉及匿名類型),以及用于類型(指向基礎(chǔ)狀態(tài)的指針)以及多型性(Polymorphismus)的派生的信息。對(duì)于類型屬性的清單的指針是專門用于有效負(fù)荷編碼的。具有上下文表的和操作數(shù)樹狀分支代碼表的子元素(Kindelement)數(shù)量的字段是專門用于上下文路徑編碼的。最后的信息字段是指向后續(xù)狀態(tài)的指針,即表示復(fù)合類型的內(nèi)容的第一狀態(tài)(例如元素狀態(tài)或選擇狀態(tài))。
頭部狀態(tài)的圖形表達(dá)
2.選擇狀態(tài)選擇狀態(tài)模擬了(nachbilden)XML模式的選擇組。選擇狀態(tài)基本上含有具有可能的后續(xù)狀態(tài)的指針清單。為了確定實(shí)際選出的狀態(tài),必須在譯碼有效負(fù)荷時(shí)讀出比特流。選擇狀態(tài)有兩種變型方案一種轉(zhuǎn)移到不同可能的后續(xù)狀態(tài)中的起始狀態(tài),以及一種重新匯總選擇的最終狀態(tài)。
3.元素狀態(tài)元素狀態(tài)模擬了在模式的復(fù)合類型中的元素說(shuō)明。它含有指向具有元素名稱的字符串的指針,以及指向類型的頭部狀態(tài)的指針。有時(shí)還存在著關(guān)于位置代碼的長(zhǎng)度的(僅用于路徑譯碼)和用于替換組的信息。
4.屬性狀態(tài)屬性狀態(tài)模擬了模式的屬性說(shuō)明。含有了指向?qū)傩悦Q的指針,以及指向?qū)傩缘暮?jiǎn)單類型的頭部狀態(tài)的指針。
5.出現(xiàn)狀態(tài)出現(xiàn)狀態(tài)模擬了minOccurs和maxOccurs屬性,這些minOccurs和maxOccurs屬性在XML模式下可能例如出現(xiàn)在元素或組(選擇、序列、...)中。如果出現(xiàn)了元素或組的一個(gè)其它的實(shí)例(Instanz),它則含有指向后續(xù)狀態(tài)的指針,以及如果已編碼了組的最后的實(shí)例,它則含有指向后續(xù)狀態(tài)的指針。由于在XML模式下存在著元素自包含的可能性(在元素的復(fù)合類型定義中,或在更深的嵌套中,元素本身重新出現(xiàn)),所以出現(xiàn)狀態(tài)也可能是同時(shí)多于一次地激活的。因此需要一個(gè)指向出現(xiàn)狀態(tài)之內(nèi)的一個(gè)批(Stapel)的指針,其確保出現(xiàn)狀態(tài)的每個(gè)激活實(shí)例的當(dāng)前狀態(tài)。
6.類型的最終狀態(tài)類型的最終狀態(tài)含有具有該類型所有屬性的指針清單。它在路徑的譯碼時(shí)是必要的,因?yàn)樵跇錉罘种Тa表中在表格的末尾上歸類了所有的屬性。在達(dá)到最終狀態(tài)時(shí),字節(jié)代碼解釋器在等級(jí)上轉(zhuǎn)移到已調(diào)用該類型的元素中。在字節(jié)代碼解釋器的工作存儲(chǔ)器中必須存放了關(guān)于所調(diào)用元素的相應(yīng)的信息。
7.簡(jiǎn)單類型的頭部狀態(tài)該狀態(tài)控制著內(nèi)容的譯碼,即它含有對(duì)編譯碼器的指針,該編譯碼器可以專門從比特流中讀出和譯碼有關(guān)類型的數(shù)據(jù)。在信息字段中詳細(xì)說(shuō)明了編譯碼器的類型。
與MPEG-7基準(zhǔn)軟件的水準(zhǔn)相比較,字節(jié)代碼模型的主要優(yōu)點(diǎn)是1.對(duì)于兩種編碼法(上下文路徑/有效負(fù)荷)在譯碼器上僅一次表示模式信息。在字節(jié)代碼狀態(tài)下的信息的絕大部分對(duì)于兩種方法是重要的。較小的部分是專門用于兩種方法中的每次一種的。因此模式信息在譯碼器上的表示是很緊湊的。
2.字節(jié)代碼模型將模式信息的良好定義的數(shù)據(jù)格式提供來(lái)使用,該數(shù)據(jù)格式例如也適用于預(yù)編譯和存儲(chǔ)(代替作為文本的XML模式)。
3.可以很迅速地通過(guò)標(biāo)準(zhǔn)壓縮程序來(lái)實(shí)施字節(jié)代碼,因?yàn)樽止?jié)代碼模型很好地準(zhǔn)備了譯碼過(guò)程。所有的信息可以在該狀態(tài)下通過(guò)指針直接提供使用,而且不必(像在ISO/IEC 15938-6,部分6基準(zhǔn)軟件中那樣)部分地才在清單中搜索。
以同樣的方式和方法可以實(shí)現(xiàn)相應(yīng)的編碼器,其中,它以以下的方式是逆反的,使得由結(jié)構(gòu)化文檔的文本表示來(lái)控制狀態(tài),并且狀態(tài)過(guò)渡生成二進(jìn)制的表示。
權(quán)利要求
1.用于編碼結(jié)構(gòu)化文檔、尤其XML文檔的方法,其中,在第一步驟中標(biāo)準(zhǔn)化模式(XMLS)的結(jié)構(gòu),其中,簡(jiǎn)化了具有元素和/或?qū)傩缘慕M,其中,用編碼法(BiM-E)從所標(biāo)準(zhǔn)化的模式中根據(jù)Meta模式(SS)來(lái)生成比特流的一部分或比特流(BS1)。
2.按權(quán)利要求1的方法,其中,在一個(gè)其它的步驟中用所述同樣的BiM編碼法(BiM-E),從文檔(XML)中根據(jù)所述的模式(XMLS)來(lái)生成所述比特流的一個(gè)其它的部分或一個(gè)其它的比特流(BS2)。
3.按權(quán)利要求1或2的方法,其中,如此來(lái)重構(gòu)結(jié)構(gòu)化文檔的模式定義的元素說(shuō)明和/或?qū)傩哉f(shuō)明,使得匿名類型定義(AT0)從所述的元素說(shuō)明和/或?qū)傩哉f(shuō)明中分離出來(lái),并且獲得一個(gè)名稱和/或代碼,該名稱和/或代碼被用于在所述相應(yīng)元素中的參考。
4.按權(quán)利要求1至3之一的方法,其中,僅將號(hào)以及具有在號(hào)和類型名稱、和/或元素名稱、和/或替換組名稱之間的分配關(guān)系的一個(gè)或多個(gè)表格進(jìn)行編碼,來(lái)代替類型名稱、和/或元素名稱、和/或替換組的名稱。
5.按權(quán)利要求1至4之一的方法,其中,將包括所述的類型名稱、和/或元素名稱、和/或替換組名稱的一個(gè)或多個(gè)清單,以及所述的類型名稱、和/或元素名稱、和/或替換組名稱在所述清單中的位置進(jìn)行編碼,來(lái)代替類型名稱、和/或元素名稱、和/或替換組的名稱。
6.按以上權(quán)利要求之一的方法,其中,將類型、全局元素和/或替換組的派生樹的信息進(jìn)行編碼,其中,每個(gè)類型通過(guò)關(guān)于它相對(duì)于原類型的類型代碼的信息,和涉及所描述類型的所有類型代碼的長(zhǎng)度的信息來(lái)描述,和/或每個(gè)全局的元素通過(guò)SBC的長(zhǎng)度和SBC來(lái)描述,和/或在替換組中的每個(gè)元素通過(guò)替換代碼的長(zhǎng)度和替換代碼來(lái)描述。
7.用于譯碼結(jié)構(gòu)化文檔、尤其XML文檔的方法,其中,用譯碼法(BiM-D)從比特流的一部分中,或從比特流(BS1)中,根據(jù)Meta模式(SS)來(lái)生成模式(XMLS),其中,在所述的比特流中確定了,所述模式的結(jié)構(gòu)是否已經(jīng)標(biāo)準(zhǔn)化,其中,已簡(jiǎn)化了具有元素和/或?qū)傩缘慕M,并且對(duì)于該情況不執(zhí)行標(biāo)準(zhǔn)化。
8.按權(quán)利要求7的方法,其中,在第二步驟中,用所述同樣的譯碼法(BiM-D)從所述比特流的一個(gè)其它的部分或一個(gè)其它的比特流(BS2)中,根據(jù)所述的模式(XMLS)來(lái)生成文檔(XML)。
9.按權(quán)利要求7的方法,其中,在譯碼所述的模式(XMLS)期間,用所述同樣的譯碼法(BiM-D)從所述比特流的一個(gè)其它的部分或一個(gè)其它的比特流(BS2)中,根據(jù)所述模式(XMLS)的已經(jīng)譯碼的部分來(lái)生成文檔(XML)。
10.按權(quán)利要求7至9之一的方法,其中,如此來(lái)重構(gòu)結(jié)構(gòu)化文檔的元素說(shuō)明和/或?qū)傩哉f(shuō)明,使得將為了傳輸而已為其分配了名稱和/或代碼的匿名類型(AT0)插入到所述各自的元素說(shuō)明或?qū)傩哉f(shuō)明中,由該元素說(shuō)明或?qū)傩哉f(shuō)明來(lái)參考所述各自的匿名類型。
11.按權(quán)利要求7至10之一的方法,其中,從所述的比特流中,通過(guò)號(hào)以及具有在號(hào)和類型名稱、和/或元素名稱、和/或替換組名稱之間的分配關(guān)系的一個(gè)或多個(gè)表格來(lái)譯碼類型名稱、和/或元素名稱、和/或替換組的名稱。
12.按權(quán)利要求7至11之一的方法,其中,從所述的比特流中,通過(guò)包括所述類型名稱、和/或元素名稱、和/或替換組名稱的一個(gè)或多個(gè)清單,以及所述的類型名稱、和/或元素名稱、和/或替換組名稱在所述清單中的位置,來(lái)譯碼類型名稱、和/或元素名稱、和/或替換組的名稱。
13.按權(quán)利要求7至12之一的方法,其中,首先從所述的比特流中對(duì)類型、和/或全局元素、和/或替換組的派生樹的信息進(jìn)行譯碼,其中,每個(gè)類型通過(guò)關(guān)于它相對(duì)于原類型的類型代碼的信息,和所有涉及所描述類型的類型代碼的長(zhǎng)度信息來(lái)描述,和/或每個(gè)全局的元素通過(guò)所述SBC的長(zhǎng)度和SBC來(lái)描述,和/或在替換組中的每個(gè)元素通過(guò)所述替換代碼的長(zhǎng)度和替換代碼來(lái)描述。
14.用于編碼結(jié)構(gòu)化文檔、尤其XML文檔的裝置,其中,存在著一個(gè)編碼單元,該編碼單元在第一步驟中標(biāo)準(zhǔn)化模式(XMLS)的結(jié)構(gòu),其中,簡(jiǎn)化了具有元素和/或?qū)傩缘慕M,該編碼單元從所述的標(biāo)準(zhǔn)化的模式中,根據(jù)Meta模式(SS)來(lái)生成比特流的一部分或比特流(BS1)。
15.用于譯碼結(jié)構(gòu)化文檔、尤其XML文檔的裝置,其中,存在著一個(gè)譯碼單元,該譯碼單元從比特流的一部分中,或從比特流(BS1)中,根據(jù)Meta模式(SS)來(lái)生成模式,其中,在所述的比特流中確定了,所述模式(XMLS)的結(jié)構(gòu)是否已經(jīng)標(biāo)準(zhǔn)化,其中,已簡(jiǎn)化了具有元素和/或?qū)傩缘慕M,并且對(duì)于該情況不執(zhí)行標(biāo)準(zhǔn)化。
16.按權(quán)利要求14的裝置,其中,所述的編碼單元具有一個(gè)可配置的字節(jié)代碼解釋器,該字節(jié)代碼解釋器解釋在字節(jié)代碼中的信息,并且該字節(jié)代碼解釋器根據(jù)所述的配置從所述的基于字節(jié)代碼的結(jié)構(gòu)化文檔中生成一個(gè)代碼,該代碼表示路徑或有效負(fù)荷。
17.按權(quán)利要求15的裝置,其中,所述的譯碼單元具有一個(gè)可配置的字節(jié)代碼解釋器,該字節(jié)代碼解釋器可以通過(guò)來(lái)自所述比特流中的信息來(lái)配置,并且該字節(jié)代碼解釋器根據(jù)所述的配置,從所述的基于字節(jié)代碼的比特流中生成路徑、有效負(fù)荷或字節(jié)代碼。
全文摘要
本發(fā)明基本上在于,用編碼法根據(jù)Meta模式從模式中生成比特流,或比特流的一部分,其中,執(zhí)行以下的優(yōu)化中的一項(xiàng)或多項(xiàng)從元素說(shuō)明和屬性說(shuō)明中分離匿名類型,并編碼為特殊類型,該類型的類型定義例示為模式定義中的頂層元素;在編碼器方面將語(yǔ)法樹標(biāo)準(zhǔn)化;替換類型名稱的字符串;傳輸派生樹的信息。譯碼考慮了這些優(yōu)化,并且相反地從比特流中生成模式。
文檔編號(hào)H04N7/24GK1669024SQ03816871
公開(kāi)日2005年9月14日 申請(qǐng)日期2003年7月7日 優(yōu)先權(quán)日2002年7月15日
發(fā)明者J·霍伊爾, A·胡特, U·尼德邁爾 申請(qǐng)人:西門子公司