混淆頁(yè)面描述語(yǔ)言輸出以阻礙轉(zhuǎn)換為可編輯格式的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息處理領(lǐng)域,更具體地,涉及用于管理電子文檔的方法、用于管理電子文檔的設(shè)備、以及系統(tǒng)。
【背景技術(shù)】
[0002]電子文檔(ED)描述格式通??煞譃閮深?標(biāo)示語(yǔ)言(ML)格式和頁(yè)面描述語(yǔ)言(PDL)格式。ML格式用于文檔創(chuàng)建和編輯,并傾向于以較高級(jí)的項(xiàng)描述文檔的外觀和布局。例如,ML可通過(guò)指明頁(yè)邊距、行距、字體、字號(hào)等來(lái)描述文本段落,而將確定每個(gè)字符確切位置的細(xì)節(jié)交給渲染段落以用于顯示或打印的軟件或設(shè)備。相對(duì)而言,PDL格式不用于編輯。它們用于幫助忠實(shí)、有效的文檔渲染。通常地,段落的PDL版本將相當(dāng)明確地指明每個(gè)字符在文本中的位置,但不會(huì)指明高級(jí)數(shù)據(jù),比如頁(yè)邊距或行距,因?yàn)槿绻麥?zhǔn)確渲染是唯一目的這些就是不必要的。
[0003]因?yàn)镻DL數(shù)據(jù)歷來(lái)被認(rèn)為是不可編輯的,用戶經(jīng)常將文檔從ML格式轉(zhuǎn)換成PDL格式以作為防止修改的簡(jiǎn)略方式。例如,作者將通常以開放的辦公可擴(kuò)展標(biāo)記語(yǔ)言(OOXML)格式(一種ML格式)來(lái)創(chuàng)建和維護(hù)文檔以用于編輯。然而,作者會(huì)將文件轉(zhuǎn)換成便攜文檔格式(PDF),一種PDL格式,以用于發(fā)布。這樣做的主要原因是PDF文檔的便攜性,但是在某些情況下次要原因是PDF格式使得接收者要惡意修改文件更加困難,比如盜取內(nèi)容或改變文件并將其冒充為接收者的成果。
[0004]最近,出現(xiàn)了大量允許從I3DL格式(例如HF)到ML格式(例如00XML)反向轉(zhuǎn)換的工具。因?yàn)閺腗L格式到PDL格式的轉(zhuǎn)換中丟失了較高層的上下文信息,從PDL格式轉(zhuǎn)換回ML格式需要推斷或猜測(cè)數(shù)據(jù),因而通常充其量也是不完善的,并且在很多情況下幾乎是不可用的。然而,在某些情況下,可允許創(chuàng)建原始文檔的摹寫,這將足以避開發(fā)布者關(guān)于不可修改的格式的目的。
【發(fā)明內(nèi)容】
[0005]總體而言,一方面,本發(fā)明涉及用于管理電子文檔(ED)的方法。所述方法包括:接收用以生成用于ED的混淆頁(yè)面描述語(yǔ)言(TOL)文件的請(qǐng)求;在ED中識(shí)別包括多個(gè)字符的第一文本流;計(jì)算所述多個(gè)字符在頁(yè)面上的多個(gè)位置;響應(yīng)于所述請(qǐng)求通過(guò)對(duì)第一文本流施加混淆技術(shù)來(lái)生成修改的文本流;生成包括多個(gè)位置和已修改的文本流的混淆PDL文件。
[0006]總體而言,一方面,本發(fā)明涉及一種用于管理電子文檔(ED)的設(shè)備.所述設(shè)備包括:顯示部件,用于向用戶顯示圖形用戶界面(GUI),該圖形用戶界面包括用于生成用于所述ED的混淆頁(yè)面描述語(yǔ)言(TOL)文件的選項(xiàng);接收部件,用于接收用于生成所述ED的混淆PDL文件的請(qǐng)求;識(shí)別部件,用于在ED內(nèi)識(shí)別包括多個(gè)字符的第一文本流;計(jì)算部件,用于計(jì)算所述多個(gè)字符在頁(yè)面上的多個(gè)位置;第一生成部件,用于響應(yīng)于所述請(qǐng)求通過(guò)對(duì)第一文本流施加混淆技術(shù)來(lái)生成修改的文本流;以及第二生成部件,用于生成包括所述多個(gè)位置和所述已修改的文本流的混淆PDL文件。
[0007]總體而言,一方面,本發(fā)明涉及系統(tǒng)。所述系統(tǒng)包括:計(jì)算機(jī)處理器;緩沖器,被配置成存儲(chǔ)包括第一文本流的電子文檔,該第一文本流包括多個(gè)字符;位置引擎,其在計(jì)算機(jī)處理器上運(yùn)行并配置成計(jì)算多個(gè)字符在頁(yè)面上的多個(gè)位置;混淆引擎,其在計(jì)算機(jī)處理器上運(yùn)行并配置成通過(guò)對(duì)第一文本流施加混淆技術(shù)來(lái)生成修改的文本流;以及頁(yè)面描述語(yǔ)言(PDL)引擎,其在計(jì)算機(jī)處理器上運(yùn)行并配置成生成用于ED的包括多個(gè)位置和已修改的文本流的混淆PDL文件。
[0008]本發(fā)明的其他方面將從下列描述和所附權(quán)利要求中顯現(xiàn)。
【附圖說(shuō)明】
[0009]圖1示出了依照本發(fā)明的一個(gè)或多個(gè)實(shí)施例的系統(tǒng)。
[0010]圖2示出了依照本發(fā)明的一個(gè)或多個(gè)實(shí)施例的流程圖。
[0011]圖3A和圖3B示出了依照本發(fā)明的一個(gè)或多個(gè)實(shí)施例的示例。
[0012]圖4示出了依照本發(fā)明的一個(gè)或多個(gè)實(shí)施例的的計(jì)算機(jī)系統(tǒng)。
【具體實(shí)施方式】
[0013]現(xiàn)在將參照附圖來(lái)詳細(xì)描述本發(fā)明的具體實(shí)施例。為保持一致性,不同圖中的相同元件用相同的參考符號(hào)來(lái)表示。
[0014]在本發(fā)明實(shí)施例的下列詳細(xì)描述中,詳盡闡述了許多具體細(xì)節(jié)以提供對(duì)本發(fā)明更為深入全面的理解。然而,對(duì)于本領(lǐng)域普通技術(shù)人員而言顯而易見的是,沒有這些具體細(xì)節(jié)本發(fā)明也可實(shí)行。在其他情況下,為了避免不必要地使描述復(fù)雜化,眾所周知的特征沒有詳細(xì)描述。
[0015]總體而言,本發(fā)明的實(shí)施例提供用于管理包括一個(gè)或多個(gè)文本流的ED的系統(tǒng)和方法。所述ED可以是開放的辦公可擴(kuò)展標(biāo)記語(yǔ)言(OOXML格式或任何其他ML格式。作為接收到生成用于ED的混淆PDL文件的用戶請(qǐng)求的響應(yīng),計(jì)算文本流的字符的位置(例如坐標(biāo))。然后,對(duì)PDL數(shù)據(jù)(例如文本流、剪貼畫、圖像、形狀等)應(yīng)用一項(xiàng)或多項(xiàng)混淆技術(shù)以生成修改的PDL數(shù)據(jù)。例如,將混淆技術(shù)應(yīng)用于文本流以生成修改的文本流?;煜齈DL文件包括已修改的文本流和計(jì)算出的位置?;煜齈DL文件還可包括ED中的任意矢量圖的光柵表示?;煜齈DL文件可以是PDF或任何其他PDL格式。和標(biāo)準(zhǔn)PDL文件一樣,混淆I3DL文件幫助ED的忠實(shí)渲染。然而,在應(yīng)對(duì)被設(shè)計(jì)用來(lái)將PDL文件轉(zhuǎn)換回原始ML格式(例如OOXML)或任何其他可編輯/可修改格式的工具上,混淆PDL文件比標(biāo)準(zhǔn)PDL文件更加復(fù)原力。換句話說(shuō),任何這類工具對(duì)混淆PDL文件的操作的輸出將和所述ED有很小類似,減少了將所述輸出作為原件忠實(shí)且輕易可修改的復(fù)制品的功用。
[0016]圖1示出了依照本發(fā)明一個(gè)或多個(gè)實(shí)施例的系統(tǒng)(100)。如圖1所示,系統(tǒng)(100)具有多個(gè)組件,包括緩沖器(114)、圖形用戶界面(116)、位置引擎(118)、混淆引擎(120)和PDL引擎(122)。每個(gè)組件(114、116、118、120、122)可位于相同的硬件設(shè)備(例如,個(gè)人計(jì)算機(jī)(PC)、桌面計(jì)算機(jī)、主機(jī)、服務(wù)器、電話機(jī)、自助服務(wù)機(jī)、電纜箱、個(gè)人數(shù)字助理(PDA)、電子閱讀器、智能電話機(jī)、平板計(jì)算機(jī)等)或使用具有有線和/或無(wú)線網(wǎng)段的網(wǎng)絡(luò)所連接的不同硬件設(shè)備上。在本發(fā)明的一個(gè)或多個(gè)實(shí)施例中,系統(tǒng)(100)輸入ED (106),并輸出用于ED (106)的混淆PDL文件(110)。系統(tǒng)(100)還可輸出用于ED (106)的標(biāo)準(zhǔn)PDL文件(108)。
[0017]在本發(fā)明的一個(gè)或多個(gè)實(shí)施例中,ED(106)包括一個(gè)或多個(gè)文本流。每個(gè)文本流可具有任意數(shù)量的字符,因而可具有任意數(shù)量的單詞。文本流可對(duì)應(yīng)于句子、段落、文本列、注腳、圖片說(shuō)明、尾注、章節(jié)、篇章等。每頁(yè)可有多個(gè)文本流。文本流可跨越多個(gè)頁(yè)面。ED(106)還可包括要在一頁(yè)或多頁(yè)上顯示或跨越一頁(yè)或多頁(yè)顯示的圖形特征(例如照片、矢量圖、剪貼畫、形狀等)。兩個(gè)或多個(gè)圖形特征可能部分重疊。使用ML格式(例如,開放文檔格式(ODF) ,OOXML等)來(lái)表示/定義ED (106)。相應(yīng)地,文本流、圖形特征以及文本流的屬性和圖形特征可作為ML格式標(biāo)簽中的屬性來(lái)記錄/識(shí)別。要正確地渲染(例如,顯示、打印)ED (106),文本流、圖形特征和屬性是必要的。
[0018]如上所述,ED(106)是可編輯/可修改的。而且,ED(106)可通過(guò)用戶應(yīng)用來(lái)創(chuàng)建和/或修改,所述用戶應(yīng)用例如包括字處理應(yīng)用、電子制表應(yīng)用、桌面發(fā)布應(yīng)用、圖形應(yīng)用、照片打印應(yīng)用、網(wǎng)絡(luò)瀏覽器、幻燈片生成應(yīng)用、表格生成器等。
[0019]在本發(fā)明的一個(gè)或多個(gè)實(shí)施例中,標(biāo)準(zhǔn)PDL文件(108)是PDL格式(例如,PDF,XPS等)的ED (106)。標(biāo)準(zhǔn)PDL文件(108)幫助ED (106)的忠實(shí)渲染。相應(yīng)地,和ED (106)一樣,標(biāo)準(zhǔn)PDL文件(108)包括文本流和圖形特征。然而,不同于ED (106),標(biāo)準(zhǔn)PDL文件
(108)包括每個(gè)文本流的每個(gè)字符和每個(gè)圖形特征的明確位置(例如,x、y坐標(biāo),偏移等)。而且,不同于ED (106),標(biāo)準(zhǔn)PDL文件(108)不容易被修改。
[0020]在本發(fā)明的一個(gè)或多個(gè)實(shí)施例中,混淆PDL文件(110)是PDL格式(例如H)F、XPS等)的ED(10