專(zhuān)利名稱(chēng):一種基于版面格式模板的排版方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字處理技術(shù)領(lǐng)域,尤其涉及一種基于版面格式模板的排版方法及裝置。
背景技術(shù):
版面格式是指一類(lèi)文體其版面所具有的固定格式,對(duì)于不同種類(lèi)的文體其具有不 同的版面格式,例如對(duì)于公文類(lèi)文體其上行文是一種版面格式,對(duì)于保險(xiǎn)公司的保單類(lèi)文 體其是另一種版面格式。目前,基于不同的版面格式會(huì)采用不同的模板,例如對(duì)于公文類(lèi)的文體會(huì)采用一 種上行文模板,對(duì)于保險(xiǎn)公司的保單會(huì)采用一種保單模板,即都是基于不同的版面格式生 成不同的模板,基本上沒(méi)有對(duì)各個(gè)版面格式中的基本要素進(jìn)行抽取,也沒(méi)有根據(jù)抽取的基 本要素建立對(duì)應(yīng)的模型。并且,在現(xiàn)有技術(shù)中,當(dāng)需要針對(duì)一種版面格式進(jìn)行排版時(shí),只能根據(jù)該版面格式 進(jìn)行具體的設(shè)置生成對(duì)應(yīng)的模板后再進(jìn)行排版,當(dāng)針對(duì)另一版面格式進(jìn)行排版時(shí),需要再 針對(duì)該版面格式設(shè)置對(duì)應(yīng)的模板再進(jìn)行排版,因此在模板創(chuàng)建上需要浪費(fèi)很大的精力,并 且創(chuàng)建的模板沒(méi)有統(tǒng)一性。并且在同一版面格式中可能有多個(gè)不同部分的內(nèi)容有相同的格 式要求,當(dāng)在具體進(jìn)行模板的設(shè)置時(shí),需要針對(duì)該多個(gè)不同的部分分別設(shè)置對(duì)應(yīng)的格式,需 要付出很多重復(fù)性的勞動(dòng),從而影響了排版的效率。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供一種基于版面格式模板的排版方法及裝置,用以解 決現(xiàn)有技術(shù)中排版過(guò)程效率低的問(wèn)題。本發(fā)明實(shí)施例提供的一種基于版面格式模板的排版方法,包括獲取待排版的文檔,解析所述文檔中的每個(gè)元數(shù)據(jù)信息,并根據(jù)選擇的公文樣式 模板文件,解析所述公文樣式模板文件,獲取所述公文樣式模板文件對(duì)應(yīng)的每個(gè)描述信息, 其中所述公文樣式模板文件包括式樣子文件以及公文元素式樣子文件;將所述每個(gè)元數(shù)據(jù)信息與所述公文元素式樣子文件中的每個(gè)描述信息進(jìn)行匹 配;當(dāng)匹配不成功時(shí),提示用戶(hù)選擇的模板錯(cuò)誤;否則,根據(jù)所述每個(gè)描述信息中引用的所述式樣子文件中預(yù)先設(shè)置的式樣將所述 元數(shù)據(jù)信息灌入,生成排版后的文檔。本發(fā)明實(shí)施例提供的一種基于版面格式模板的排版裝置,包括獲取解析模塊,用于獲取待排版的文檔,解析所述文檔中的每個(gè)元數(shù)據(jù)信息,并根 據(jù)選擇的公文樣式模板文件,解析所述公文樣式模板文件,獲取所述公文樣式模板文件對(duì) 應(yīng)的每個(gè)描述信息,其中所述公文樣式模板文件包括式樣子文件以及公文元素式樣子文 件;
匹配模塊,用于將所述每個(gè)元數(shù)據(jù)信息與所述公文元素式樣子文件中的每個(gè)描述 信息進(jìn)行匹配;排版提示模塊,用于在確定匹配不成功時(shí),提示用戶(hù)選擇的模板錯(cuò)誤,在確定匹配 成功時(shí),根據(jù)所述每個(gè)描述信息中引用的所述式樣子文件中預(yù)先設(shè)置的式樣將所述元數(shù)據(jù) 信息灌入,生成排版后的文檔。本發(fā)明實(shí)施例提供了 一種基于版面格式模板的排版方法及裝置,該方法通過(guò)在解 析公文樣式模板文件,獲取公文樣式模板文件中對(duì)應(yīng)的每個(gè)描述信息解析待排版的文檔獲 取元數(shù)據(jù)信息,在匹配成功時(shí),根據(jù)公文樣式模板文件中的公文元素式樣子文件中的每個(gè) 描述信息中引用的公文樣式模板文件中式樣子文件中預(yù)先設(shè)置的式樣將對(duì)應(yīng)的元數(shù)據(jù)灌 入,生成排版后的文檔,在本發(fā)明實(shí)施例中,由于預(yù)先設(shè)置了多個(gè)模板,保證了每個(gè)模板設(shè) 置的統(tǒng)一性,并且模板中每個(gè)描述信息引用預(yù)先設(shè)定的樣式,從而可以有效的提高排版的 效率,同時(shí)在進(jìn)行排版時(shí),數(shù)據(jù)與樣式分別進(jìn)行處理避免了相互之間的影響和制約,提高了 排版的準(zhǔn)確性。
圖1為本發(fā)明實(shí)施例提供的排版系統(tǒng)的結(jié)構(gòu)示意圖;圖2為本發(fā)明實(shí)施例提供的根據(jù)該圖1提供的排版系統(tǒng)結(jié)構(gòu)圖進(jìn)行的具體排版操 作;圖3為本發(fā)明實(shí)施例提供的頁(yè)面式樣示意圖;圖4為本發(fā)明實(shí)施例提供的字體聲明示意圖;圖5為本發(fā)明實(shí)施例提供的句式樣示意圖;圖6為本發(fā)明實(shí)施例提供的段落式樣描述示意圖;圖7為本發(fā)明實(shí)施例提供的文字表式樣示意圖;圖8為本發(fā)明實(shí)施例提供的單元格式樣示意圖;圖9為本發(fā)明實(shí)施例提供的圖像對(duì)象式樣示意圖;圖10為本發(fā)明實(shí)施例提供的圖形對(duì)象式樣示意圖;圖11為本發(fā)明實(shí)施例提供的圖形對(duì)象中自然段描述信息示意圖;圖12為本發(fā)明實(shí)施例提供的公文元素式樣描述信息示意圖;圖13為本發(fā)明實(shí)施例提供的公文元素式樣中頁(yè)面描述信息示意圖;圖14為本發(fā)明實(shí)施例提供的公文元素式樣中頁(yè)描述信息示意圖;圖15為本發(fā)明實(shí)施例提供的頁(yè)描述信息中眉首的描述信息示意圖;圖16為本發(fā)明實(shí)施例提供的對(duì)文檔進(jìn)行排版的過(guò)程;圖17為本發(fā)明實(shí)施例提供的公文元素式樣中文檔的眉首、主體和版記中的每項(xiàng) 描述信息的示意圖;圖18為本發(fā)明實(shí)施例提供的基于版面格式模板的排版裝置結(jié)構(gòu)示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例為了有效地提高排版的效率,提供了一種基于版面格式模板的排版 方法,該方法包括獲取待排版的文檔數(shù)據(jù),解析所述文檔數(shù)據(jù)中的每個(gè)元數(shù)據(jù)信息,并解析選擇的公文樣式模板文件,獲取所述公文樣式模板文件對(duì)應(yīng)的每個(gè)描述信息,其中所述公文樣式模板文件包括式樣子文件以及公文元素式樣子文件;將所述每個(gè)元數(shù)據(jù)信息與 所述公文元素式樣子文件中對(duì)應(yīng)的每個(gè)描述信息進(jìn)行匹配;當(dāng)匹配不成功時(shí),提示用戶(hù)選 擇的模板錯(cuò)誤;否則,根據(jù)所述每個(gè)描述信息中引用的所述式樣子文件中預(yù)先設(shè)置的式樣 將對(duì)應(yīng)的所述元數(shù)據(jù)信息灌入,生成排版后的文檔。在本發(fā)明實(shí)施例中,由于預(yù)先設(shè)置了多 個(gè)模板,保證了每個(gè)模板設(shè)置的統(tǒng)一性,并且模板中每個(gè)樣式信息引用預(yù)先設(shè)定的樣式,從 而可以有效的提高排版的效率,同時(shí)在進(jìn)行排版時(shí),數(shù)據(jù)與樣式分別進(jìn)行處理避免了相互 之間的影響和制約,提高了排版的準(zhǔn)確性。下面結(jié)合說(shuō)明書(shū)附圖,對(duì)本發(fā)明實(shí)施例進(jìn)行詳細(xì)描述。圖1為本發(fā)明實(shí)施例提供的排版系統(tǒng)的結(jié)構(gòu)示意圖,其中,排版引擎可以實(shí)現(xiàn)對(duì) 文檔的排版,樣式模塊管理單元用于根據(jù)各種樣式格式定義,及保存的各種樣式設(shè)計(jì)工具 生成各種樣式模板文件。在該樣式模板文件中包括式樣集子文件以及公文元素式樣子文 件等,生成的樣式模板文件可以是可擴(kuò)展標(biāo)記語(yǔ)言(Extensible Markup Language,XML)格 式的文件。數(shù)據(jù)模板管理單元用于根據(jù)公文元數(shù)據(jù)定義,及保存的數(shù)據(jù)設(shè)計(jì)工具解析待排 版的數(shù)據(jù)文件生成數(shù)據(jù)模板文件,該生成的數(shù)據(jù)模板文件可以是XML格式的文件。規(guī)則模 板管理單元用于根據(jù)公文規(guī)則定義生成規(guī)則模板文件,該生成的規(guī)則模板文件可以是XML 格式的文件。在本發(fā)明實(shí)施例中樣式模板、數(shù)據(jù)模板和規(guī)則模板分別進(jìn)行管理,從而相互之間 相對(duì)獨(dú)立,而生成的排版后的文件,可以看作是三類(lèi)模板的有機(jī)結(jié)合,即對(duì)三類(lèi)模板的分別 編輯和重用的結(jié)果。圖2為根據(jù)該圖1提供的排版系統(tǒng)結(jié)構(gòu)圖進(jìn)行的具體排版操作,該排版的過(guò)程具 體包括S201 樣式模板管理單元中讀取用戶(hù)選擇的公文樣式模板文件,該公文樣式模板 文件為XML格式的文件,解析該公文樣式模板文件提取該公文樣式模板文件中的每個(gè)描述 信息,生成樣式樹(shù),其中該樣式樹(shù)以XML格式顯現(xiàn),并將該XML格式的樣式樹(shù)發(fā)送到排版裝 置例如排版引擎。即該公文樣式模板文件與該樣式樹(shù)相對(duì)應(yīng),該樣式樹(shù)中包括式樣集子樹(shù)、公文元 素式樣子樹(shù)等。并且,在本發(fā)明實(shí)施例中樣式樹(shù)中還可以包括排版規(guī)則子樹(shù)。S202:數(shù)據(jù)模板管理單元讀取用戶(hù)輸入的數(shù)據(jù)文件,解析該數(shù)據(jù)文件獲取數(shù)據(jù)文 件中的每個(gè)元數(shù)據(jù)信息,生成元數(shù)據(jù)樹(shù),其中該元數(shù)據(jù)樹(shù)以XML格式顯現(xiàn),并將該XML格式 的元數(shù)據(jù)樹(shù)發(fā)送到排版引擎。S203:排版引擎根據(jù)接收的元數(shù)據(jù)樹(shù)和樣式樹(shù),進(jìn)行相應(yīng)信息的匹配。S204:當(dāng)匹配成功時(shí),排版引擎根據(jù)獲得的元數(shù)據(jù)樹(shù)以及樣式樹(shù),進(jìn)行邏輯排版生 成混合樹(shù)。S205 對(duì)排版引擎生成的混合樹(shù)進(jìn)行物理排版,進(jìn)而生成結(jié)果樹(shù)。S206:規(guī)則模板管理單元讀取規(guī)則模板文件,排版引擎基于該讀取的規(guī)則模板文 件進(jìn)行自動(dòng)排版,當(dāng)基于該讀取的規(guī)則模板文件進(jìn)行的排版滿(mǎn)足要求時(shí),則生成排版后的 文件,否則重新進(jìn)行S204,即進(jìn)行混合樹(shù)的生成。由于不同種類(lèi)的文件的版面格式中各個(gè)元素都具有不同的式樣,例如,表格對(duì)應(yīng)表格式樣,文字段對(duì)應(yīng)段落式樣,圖形對(duì)應(yīng)圖形式樣,圖像對(duì)應(yīng)圖像式樣等等。因此在本 發(fā)明實(shí)施例中,可以在樣式模板管理單元中保存式樣集,式樣集中又可以包括多種式樣,其 中,該多種式樣可以是根據(jù)各種文檔的排版要求進(jìn)行設(shè)置的,并且可以賦予每種式樣一個(gè) 唯一的標(biāo)識(shí),并且每種式樣中的每個(gè)描述單元及描述子單元也都有唯一的一個(gè)標(biāo)識(shí)。例如 在本發(fā)明實(shí)施中樣式模板管理單元中包括式樣集,該式樣集中包括頁(yè)面式樣、字體聲明、句 式樣、段落式樣、文字表式樣、單元格式樣、圖像對(duì)象式樣和圖形對(duì)象式樣等,每種式樣都有 唯一的一個(gè)標(biāo)識(shí),每種式樣中每個(gè)描述單元及描述子單元也都有唯一的一個(gè)標(biāo)識(shí)。下面詳細(xì)介紹每種式樣包括的每個(gè)描述單元及描述子單元。 對(duì)于本發(fā)明實(shí)施例中的頁(yè)面式樣,其可以描述模板中每一頁(yè)的頁(yè)面設(shè)置的式樣, 在該頁(yè)面式樣中描述了頁(yè)面的邊空信息、紙張信息和頁(yè)碼的設(shè)置信息等。如圖3所示,頁(yè) 面式樣中可以包括邊空描述單元,紙張描述單元,紙張方向描述單元和頁(yè)碼設(shè)置描述單元 等。在邊空描述單元中又可以包括對(duì)頁(yè)面的四個(gè)方向的邊空描述子單元,對(duì)于紙張描述單 元其可以包括紙張的紙型、紙張的寬度以及高度等描述子單元,在頁(yè)碼設(shè)置描述單元中包 括頁(yè)碼的屬性描述子單元以及其引用的段落式樣信息子單元等,其中頁(yè)碼的屬性描述子 單元包括頁(yè)碼是否在首頁(yè)顯示描述子單元、起始編號(hào)子單元、數(shù)字格式描述子單元、距版 心描述子單元、位置描述子單元、對(duì)齊描述子單元、前綴描述子單元和后綴描述子單元等。在本發(fā)明實(shí)施例的字體聲明中可以描述所屬的字體簇,如圖4所示,其中該字體 聲明包括中文字的字體聲明、西文字的字體聲明,其中每種字體聲明對(duì)應(yīng)不同的編碼,例如 中文字體,宋體四號(hào)字體對(duì)應(yīng)一個(gè)編碼,西文羅馬10號(hào)字體對(duì)應(yīng)一個(gè)編碼等。句式樣可以描述文檔句子中的字體信息、字形信息以及字符間的間距信息等。圖 5為本發(fā)明實(shí)施例提供的句式樣示意圖,在該句式樣中可以包括字體描述單元、字形描述單 元和字符間距描述單元,對(duì)于字體描述單元其可以對(duì)每個(gè)文字的字體,字號(hào)以及顏色進(jìn)行 設(shè)置,當(dāng)選擇不同的字體時(shí)可以應(yīng)用上述字體聲明中的具體設(shè)置形式,例如該字體單元包 括西文字體引用子單元,其引用西文字體的字體聲明,中文字體引用子單元,其引用中文 字體的字體聲明,特殊字體引用子單元,其引用特殊字體的字體聲明。例如在一個(gè)句子中既 包括中文字體又包括西文字體,在對(duì)該句子的字體進(jìn)行描述時(shí),可以應(yīng)用字體聲明中對(duì)應(yīng) 的字體設(shè)置。并且該字體描述單元還包括X字號(hào)描述子單元、Y字號(hào)描述子單元以及字體 的顏色描述子單元。對(duì)于字形描述子單元其包括的描述子單元包括斜體、加粗、下劃線(xiàn)等。 在模板的具體設(shè)置時(shí),可以根據(jù)句式樣的各個(gè)描述單元和子單元進(jìn)行句子式樣的設(shè)置。多個(gè)句子可以構(gòu)成段落,在本發(fā)明實(shí)施例中也需要對(duì)段落的式樣就行描述。圖6 為本發(fā)明實(shí)施例的段落式樣描述示意圖,其描述信息可以包括段落的對(duì)齊方式信息、行距 和段間距信息等。例如段落式樣中可以包括對(duì)齊描述單元、縮進(jìn)描述單元、行距描述單元 以及段間距描述單元等。對(duì)于對(duì)齊描述單元其又可以包括水平對(duì)齊描述子單元和縱向?qū)?齊描述子單元,段間距描述單元又可以包括段前距描述子單元和段后距描述子單元。在模 板的具體設(shè)置時(shí),可以根據(jù)該段落式樣中的各個(gè)描述單元和描述子單元,從而實(shí)現(xiàn)對(duì)排版 過(guò)程中段落的格式進(jìn)行具體的設(shè)置。為了便于各種文類(lèi)中存在的文字表的格式設(shè)置,在本發(fā)明實(shí)施例中還提供了一種 文字表式樣如圖7所示,在該文字表式樣中的描述信息可以包括文字表的屬性信息、調(diào)整 信息以及文字表的輸出屬性信息等。例如該文字表式樣中的描述信息可以包括文字表的位置信息、列寬集信息、對(duì)齊方式信息、邊框信息、自動(dòng)調(diào)整大小信息、自動(dòng)調(diào)整字體信息以 及輸出屬性信息等。對(duì)于列寬集信息其可以對(duì)列寬的大小進(jìn)行選擇設(shè)置,供設(shè)置選擇的列 寬的范圍可以設(shè)置為1到無(wú)窮大。在對(duì)齊信息中可以包括橫向?qū)R信息和縱向?qū)ζ湫畔?等。邊框信息可以包括上下左右四個(gè)方向的邊線(xiàn)的信息,對(duì)于每一個(gè)邊線(xiàn)信息是對(duì)邊線(xiàn)的 屬性的描述,例如邊線(xiàn)的類(lèi)型、邊線(xiàn)的線(xiàn)寬、邊線(xiàn)的單元、顏色等。對(duì)于位置信息其具體可以 描述文字表的位置屬性,例如其可以包括文字表的基點(diǎn)位置信息、文字表的橫軸X軸、縱 軸Y軸的坐標(biāo)信息、文字表的寬度信息、高度信息、以及文字表的X軸、Y軸坐標(biāo)類(lèi)型信息等 中的一個(gè)或幾個(gè)。 對(duì)于各種文類(lèi)中還可能包括單元格,在本發(fā)明實(shí)施例中也可以在模板中設(shè)置單元 格的樣式,具體可以通過(guò)單元格式樣來(lái)進(jìn)行設(shè)置。其中,在本發(fā)明實(shí)施例中單元格式樣中可 以包括單元格的屬性信息,如圖8所示。該單元格的屬性信息包括單元格的邊框信息、行 高信息、列寬信息、邊空信息、對(duì)齊方式信息以及輸出的屬性信息等,其中,每一個(gè)屬性信息 都可以作為單元格式樣中的一個(gè)描述單元存在。當(dāng)包括邊空信息時(shí),將該邊空信息作為單 元格式樣中的一個(gè)描述單元時(shí),該邊空描述單元可以包括上、下、左、右四個(gè)方向的邊空描 述子單元。在排版過(guò)程中還需要對(duì)圖像對(duì)象和/或圖形對(duì)象進(jìn)行排版。在圖像對(duì)象的式樣中 可以根據(jù)各種描述信息進(jìn)行選擇設(shè)置。圖像對(duì)象的式樣包括圖像的位置信息、對(duì)齊方式信 息以及圖像的屬性信息等。如圖9所示,例如在圖像對(duì)象式樣中可以包括圖像對(duì)象的位置 信息、對(duì)齊信息、圖信息以及輸出屬性信息等,并且每種信息對(duì)應(yīng)成為一個(gè)描述單元,每個(gè) 描述單元還可以由幾個(gè)描述子單元組成。例如在圖信息描述單元中還可以包括圖信息引用 的文件屬性描述子單元,以及圖信息的編碼方式描述子單元,該引用的文件屬性包括文件 的文件名、文件類(lèi)型等。在該圖像對(duì)象式樣中可以任意選擇一種或幾種描述單元對(duì)應(yīng)的描 述信息,從而構(gòu)成圖像對(duì)象的模板。從圖形對(duì)象式樣中選擇一種或幾種描述信息,可以形成圖形對(duì)象的模板,其中圖 形對(duì)象式樣中可以包括圖形的位置信息、對(duì)齊方式信息以及圖形的屬性信息等。如圖10所 示,例如在圖形對(duì)象式樣描述信息中包括圖形對(duì)象的位置信息、對(duì)齊信息、圖形信息以及 輸出屬性信息等。而圖形信息對(duì)圖形對(duì)象的基本屬性進(jìn)行了描述,其中在該圖形信息中可 以包括圖形的線(xiàn)條信息、關(guān)鍵點(diǎn)的坐標(biāo)信息、邊框信息、自然段信息、圖形的自動(dòng)調(diào)整大小 信息以及圖形的自動(dòng)調(diào)整字體信息中的一種或幾種,關(guān)鍵點(diǎn)坐標(biāo)信息主要描述了關(guān)鍵點(diǎn)構(gòu) 成的路徑,從而構(gòu)成整個(gè)圖形,如圖11所示,自然段描述信息中包括文字項(xiàng)的字體聲明,以 及文字式樣項(xiàng)引用的式樣樣式,該引用的式樣的樣式包括句式樣,段式樣,以及文字的字體 聲明等。由于圖形對(duì)象可以是包括一般的圖形,以及文本框,不同的圖形對(duì)象可以選擇不同 的描述單元和描述子單元進(jìn)行描述。上述內(nèi)容是構(gòu)成本發(fā)明實(shí)施例的模板的基本式樣,每種式樣在本發(fā)明實(shí)施中都可 以具有唯一的編碼,并且其對(duì)應(yīng)的每個(gè)描述單元、描述子單元也都具有唯一的編碼,當(dāng)選擇 不同的式樣中的對(duì)應(yīng)的描述單元、子單元構(gòu)成模板時(shí),只需保存該式樣、單元、子單元的編 碼信息即可。由于排版文件需要在每個(gè)頁(yè)面中進(jìn)行顯示,并且不同的頁(yè)面中可能需要顯示的內(nèi) 容及顯示的格式都不同,因此為了適應(yīng)不同頁(yè)面排版格式的要求,在本發(fā)明實(shí)施例中,可以進(jìn)行頁(yè)面架構(gòu)的設(shè)置,并且在每頁(yè)中可能包括一種或幾種元素,也可以對(duì)每種元素進(jìn)行
一一的設(shè)置。在本發(fā)明實(shí)施例中采用公文元素式樣庫(kù)對(duì)頁(yè)面和頁(yè)的設(shè)置進(jìn)行描述,如圖12所示,在頁(yè)面描述單元可以設(shè)置每個(gè)頁(yè)面描述的內(nèi)容,及每種描述的式樣,如圖13所示,例如 可以設(shè)置每個(gè)單頁(yè)、雙頁(yè)以及所有頁(yè)中其對(duì)應(yīng)的描述單元,及每種描述單元其引用的式樣, 例如在單頁(yè)中可以設(shè)置文字框、表格、圖形、圖像等元素,并且每元素可以引用相應(yīng)的式樣。如圖14所示,由于文檔中的頁(yè)一般包括頁(yè)眉、頁(yè)腳、眉首、主體以及版記等信息, 而在每頁(yè)中可以包括頁(yè)眉、頁(yè)腳等一系列的元素或者元素集合。例如,在每頁(yè)中可以對(duì)頁(yè) 眉、頁(yè)腳的位置及其他屬性進(jìn)行描述,并且可以對(duì)顯示在每頁(yè)中的眉首、主體、版記的屬性 進(jìn)行描述。其中,眉首的屬性包括在眉首部分包括的信息,如圖15所示,例如該眉首部分 包括的信息包括眉首的份數(shù)序號(hào)、文檔的秘密等級(jí)與保密期限、文檔的緊急程度、文字框、 表格、發(fā)文機(jī)關(guān)標(biāo)識(shí)、發(fā)文字號(hào)與簽發(fā)人、紅色反線(xiàn)和圖形等等信息。對(duì)于元素的表示方法包括用元素標(biāo)簽表示的方法,在屬性中標(biāo)明該元素的類(lèi)型, 以及用元素類(lèi)型表示的方法,在屬性中標(biāo)明該元素的標(biāo)簽。對(duì)于元素的集合可以用集合名 稱(chēng)來(lái)表示,在模板中用集合名稱(chēng)的嵌套,和/或?qū)?biāo)簽元素的包含體現(xiàn)模板描述的文檔的 結(jié)構(gòu)。以眉首的描述信息為例,例如眉首的描述信息為多個(gè)帶標(biāo)簽的元素的集合和多個(gè)帶 類(lèi)型的元素的集合,例如“份數(shù)序號(hào)”用帶標(biāo)簽的元素表示,在屬性中該元素的類(lèi)型為“文本 框”,或者也可以用“文本框”,在屬性中表明該元素的標(biāo)簽為“份數(shù)序號(hào)”。該兩種方法可以 交互使用,從而使模板的描述更加完備和可擴(kuò)充。在本發(fā)明實(shí)施例中,可以根據(jù)從上述式樣集提供的各種式樣,排版規(guī)則以及公文 元素的式樣進(jìn)行選擇,由于每個(gè)式樣及式樣描述單元、描述子單元都有不同的編碼,因?yàn)樵?選擇的內(nèi)容可以構(gòu)成模板,并且該模板可以用文檔架構(gòu)樹(shù)的嵌套形式描述。當(dāng)對(duì)模板中的式樣信息、規(guī)則信息進(jìn)行描述,并賦予每種描述信息一個(gè)編碼后,在 具體排版時(shí),對(duì)待排版的文檔進(jìn)行解析,獲取公文元素式樣中待排版文檔的各個(gè)描述信息, 將獲取的公文元素式樣中待排版文檔的各個(gè)描述信息按照模板中引用的規(guī)則以及每種式 樣,將該各個(gè)描述信息進(jìn)行灌入,按照該規(guī)則和對(duì)應(yīng)的每種式樣對(duì)該待排版文檔進(jìn)行排版, 從而生成排版后的文檔。如圖16所示為在本發(fā)明實(shí)施例中對(duì)文檔進(jìn)行排版的過(guò)程,該過(guò)程具體包括S1601 對(duì)一篇文檔進(jìn)行排版時(shí),需要讀取選擇的公文樣式模板文件,解析該公文 樣式模板文件,其中該公文樣式模板文件中包括排版規(guī)則子文件、式樣子文件以及公文元 素式樣子文件,獲取該公文樣式模板文件中每個(gè)子文件對(duì)應(yīng)的描述信息。在本發(fā)明實(shí)施例中排版規(guī)則、式樣集和公文元素式樣都可以采用XML結(jié)構(gòu)描述, 因此該公文樣式模板文件也可以采用XML結(jié)構(gòu)描述,因此根據(jù)解析的得該公文樣式模板可 以建立公文顯現(xiàn)樹(shù),該公文呈現(xiàn)樹(shù)包括排版規(guī)則子樹(shù)、式樣集子樹(shù)公文元素式樣子樹(shù)。S1602:在對(duì)一篇文檔進(jìn)行排版時(shí),還需要對(duì)該篇文檔進(jìn)行解析,根據(jù)該文檔的結(jié) 構(gòu)特征,解析得到該文檔的元數(shù)據(jù)信息。由于一般的文檔包括頁(yè)眉、頁(yè)腳、眉首、主體和版記信息中的至少一項(xiàng)描述信息, 因此,在解析文檔獲取文檔的數(shù)據(jù)信息時(shí),可以從上述幾項(xiàng)描述信息中獲取,如圖17所示, 為獲取該公文元素式樣中文檔的眉首、主體和版記中的每項(xiàng)描述信息的示意圖。解析該文檔得到元數(shù)據(jù)樹(shù)。S1603:根據(jù)解析獲得的公文樣式模板文件中的描述信息、及文檔中的元數(shù)據(jù)信 息,進(jìn)行排版生成排版后的文檔。將顯現(xiàn)樹(shù)與數(shù)據(jù)樹(shù)進(jìn)行混合,生成結(jié)果樹(shù),從而完成對(duì)該文檔的排版。在本發(fā)明實(shí)施例中進(jìn)行排版生成排版后的文檔時(shí),該方法包括根據(jù)解析獲得的公文樣式模板文件中的描述信息,及文檔中的對(duì)應(yīng)的元數(shù)據(jù)信 息,進(jìn)行邏輯排版,生成數(shù)據(jù)文件。將該數(shù)據(jù)文件進(jìn)行物理排版,生成排版后的文檔。
在進(jìn)行邏輯排版的過(guò)程中,由于該排版規(guī)則、式樣集及公文元素式樣都可以采用 XML的形式標(biāo)識(shí),因此該過(guò)程主要包括將公文元素式樣子文件中的每個(gè)描述信息的名稱(chēng)與解析得到的文檔中的對(duì)應(yīng)元 數(shù)據(jù)信息進(jìn)行匹配;在公文元素式樣子文件中確定匹配成功的描述信息,根據(jù)該描述信息的標(biāo)識(shí)在式 樣子文件中查找該描述信息對(duì)應(yīng)的式樣信息,將該匹配成功的元數(shù)據(jù)按照該式樣信息組合 到公文元素式樣子文件的該匹配成功的描述信息對(duì)應(yīng)的式樣中。其中,包括根據(jù)公文元素式樣子樹(shù)的結(jié)構(gòu)特征生成混合樹(shù)。例如,公文元素式樣子文件中的描述單元為“秘密等級(jí)與保密期限”,與解析得到 的數(shù)據(jù)文件中的描述信息進(jìn)行匹配,例如匹配成功的描述信息為“絕密”,則在該描述單元 “秘密等級(jí)與保密期限”的節(jié)點(diǎn)下生成內(nèi)容節(jié)點(diǎn),并且該內(nèi)容節(jié)點(diǎn)的值為“絕密”。從而實(shí)現(xiàn) 了將匹配成功的描述信息組合到公文元素式樣子文件的每個(gè)描述單元中。根據(jù)該公文元素式樣子文件中的描述單元“秘密等級(jí)與保密期限”,其對(duì)應(yīng)的式樣 為“秘密等級(jí)與保密期限對(duì)象類(lèi)型=‘文字框’式樣引用=‘ID040961’”,根據(jù)該式樣引用 標(biāo)識(shí)符“ ID040961”,查找該設(shè)置的式樣集中,該標(biāo)識(shí)符對(duì)應(yīng)的式樣信息,例如查找到的式樣 信息為“圖形對(duì)象式樣名稱(chēng)=‘秘密等級(jí)與保密期限’標(biāo)識(shí)符=‘ID040961’”,將該標(biāo)識(shí)符 對(duì)應(yīng)的式樣信息,在該描述單元“秘密等級(jí)與保密期限”的節(jié)點(diǎn)下生成式樣節(jié)點(diǎn),且該式樣 節(jié)點(diǎn)對(duì)應(yīng)的值為“圖形對(duì)象式樣”。從而實(shí)現(xiàn)將給描述信息對(duì)應(yīng)的式樣信息組合到公文元素 式樣子文件的每個(gè)描述單元中。在本發(fā)明實(shí)施例中,將該數(shù)據(jù)文件進(jìn)行物理排版,生成排版后的文檔的過(guò)程包 括根據(jù)公文元素式樣子文件中引用的式樣子文件中的頁(yè)面式樣信息建立頁(yè),將建立 的頁(yè)作為排版生成的結(jié)構(gòu)樹(shù)中第一層子節(jié)點(diǎn);按照深度優(yōu)先的策略遍歷混合樹(shù),按照流式排版方法將待排版的數(shù)據(jù)信息在頁(yè)面 中進(jìn)行定位,當(dāng)在一頁(yè)中排不下時(shí),則建立新頁(yè),將建立的新頁(yè)作為第二層子節(jié)點(diǎn),然后在 該頁(yè)中進(jìn)行排版,依次將待排版的數(shù)據(jù)信息在每頁(yè)中進(jìn)行定位,從而確定每個(gè)待排版的數(shù) 據(jù)信息所在的頁(yè),即進(jìn)行物理呈現(xiàn)時(shí)的頁(yè);按照排版規(guī)則依次進(jìn)行實(shí)現(xiàn),生成排版后的文檔。如圖18所示,本發(fā)明實(shí)施例提供了一種排版裝置,該裝置包括獲取解析模塊1801,用于獲取待排版的文檔,解析所述文檔中的每個(gè)元數(shù)據(jù)信息, 并根據(jù)選擇的公文樣式模板文件,解析所述公文樣式模板文件,獲取所述公文樣式模板文件對(duì)應(yīng)的每個(gè)描述信息,其中所述公文樣式模板文件包括排版規(guī)則子文件,式樣子文件以及公文元素式樣子文件;匹配模塊1802,用于將所述每個(gè)元數(shù)據(jù)信息與所述公文元素式樣子文件中的每個(gè) 描述信息進(jìn)行匹配;排版提示模塊1803,用于在確定匹配不成功時(shí),提示用戶(hù)選擇的模板錯(cuò)誤,在確定 匹配成功時(shí),根據(jù)所述每個(gè)描述信息中引用的所述式樣子文件中預(yù)先設(shè)置的式樣將所述元 數(shù)據(jù)信息灌入,生成排版后的文檔。所述排版提示模塊1803包括邏輯排版單元18030,用于將所述公文樣式模板文件中的描述信息,及文檔中的對(duì) 應(yīng)元數(shù)據(jù)信息,進(jìn)行邏輯排版,生成數(shù)據(jù)文件;物理排版單元18033,用于將所述數(shù)據(jù)文件進(jìn)行物理排版,生成排版后的文檔。所述邏輯排版單元18030包括匹配子單元18031,用于將所述公文樣式模板文件中的每個(gè)描述信息的名稱(chēng),與解 析得到的文檔中的對(duì)應(yīng)的元數(shù)據(jù)信息進(jìn)行匹配;查找組合子單元18032,用于在公文元素式樣子文件中確定匹配成功的描述信息, 根據(jù)該描述信息的標(biāo)識(shí)在式樣子文件中查找該描述信息對(duì)應(yīng)的式樣信息,將該匹配成功的 元數(shù)據(jù)按照所述式樣信息組合到公文元素式樣子文件的該匹配成功的描述信息對(duì)應(yīng)的式 樣中。所述物理排版單元18033包括頁(yè)建立子單元18034,用于根據(jù)公文元素式樣子文件中弓丨用的式樣子文件中的頁(yè) 面式樣信息建立頁(yè);判斷子單元18035,用于判斷建立的頁(yè)內(nèi)是否能夠排下排版的元數(shù)據(jù)信息;定位子單元18036,用于將在該頁(yè)內(nèi)排版的元數(shù)據(jù)信息在所述頁(yè)中定位。所述裝置還包括存儲(chǔ)模塊1800,用于保存頁(yè)面式樣信息、字體聲明信息、句式樣信息、段落式樣信 息、文字表式樣信息、單元格式樣信息、圖像對(duì)象式樣信息和圖形對(duì)象式樣信息中的一種或 幾種。所述排版提示模塊1803還用于,根據(jù)讀取的規(guī)則排版子文件中的規(guī)則,將所述元數(shù)據(jù)信息灌入后的文檔進(jìn)行自動(dòng) 排版,判斷自動(dòng)排版后的文檔是否滿(mǎn)足所述規(guī)則的要求,當(dāng)確定不滿(mǎn)足時(shí)重新進(jìn)行對(duì)應(yīng)元 數(shù)據(jù)信息的灌入,當(dāng)確定滿(mǎn)足時(shí),生成排版后的文檔。本發(fā)明實(shí)施例提供了 一種基于版面格式模板的排版方法及裝置,該方法通過(guò)在解 析公文樣式模板文件,獲取公文樣式模板文件中對(duì)應(yīng)的每個(gè)描述信息解析待排版的文檔獲 取元數(shù)據(jù)信息,在匹配成功時(shí),根據(jù)公文樣式模板文件中的公文元素式樣子文件中的每個(gè) 描述信息中引用的公文樣式模板文件中式樣子文件中預(yù)先設(shè)置的式樣將對(duì)應(yīng)的元數(shù)據(jù)灌 入,生成排版后的文檔,在本發(fā)明實(shí)施例中,由于預(yù)先設(shè)置了多個(gè)模板,保證了每個(gè)模板設(shè) 置的統(tǒng)一性,并且模板中每個(gè)描述信息引用預(yù)先設(shè)定的樣式,從而可以有效的提高排版的 效率,同時(shí)在進(jìn)行排版時(shí),數(shù)據(jù)與樣式分別進(jìn)行處理避免了相互之間的影響和制約,提高了 排版的準(zhǔn)確性。
顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精 神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍 之內(nèi),則 本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
一種基于版面格式模板的排版方法,其特征在于,包括獲取待排版的文檔,解析所述文檔中的每個(gè)元數(shù)據(jù)信息,并解析選擇的公文樣式模板文件,獲取所述公文樣式模板文件對(duì)應(yīng)的每個(gè)描述信息,其中所述公文樣式模板文件包括式樣子文件以及公文元素式樣子文件;將所述每個(gè)元數(shù)據(jù)信息與所述公文元素式樣子文件中對(duì)應(yīng)的每個(gè)描述信息進(jìn)行匹配;當(dāng)匹配不成功時(shí),提示用戶(hù)選擇的模板錯(cuò)誤;否則,根據(jù)所述每個(gè)描述信息中引用的所述式樣子文件中預(yù)先設(shè)置的式樣,將對(duì)應(yīng)的所述元數(shù)據(jù)信息灌入,生成排版后的文檔。
2.如權(quán)利要求1所述的方法,其特征在于,所述將對(duì)應(yīng)的所述元數(shù)據(jù)信息灌入,生成排 版后的文檔包括將所述公文樣式模板文件中的描述信息,及文檔中的對(duì)應(yīng)元數(shù)據(jù)信息,進(jìn)行邏輯排版, 生成數(shù)據(jù)文件;將所述數(shù)據(jù)文件進(jìn)行物理排版,生成排版后的文檔。
3.如權(quán)利要求2所述的方法,其特征在于,所述進(jìn)行邏輯排版包括將所述公文樣式模板文件中的每個(gè)描述信息的名稱(chēng),與解析得到的文檔中的對(duì)應(yīng)的元 數(shù)據(jù)信息進(jìn)行匹配;在公文元素式樣子文件中確定匹配成功的描述信息,根據(jù)該描述信息的標(biāo)識(shí)在式樣子 文件中查找該描述信息對(duì)應(yīng)的式樣信息,將該匹配成功的元數(shù)據(jù)按照所述式樣信息組合到 公文元素式樣子文件的該匹配成功的描述信息對(duì)應(yīng)的式樣中。
4.如權(quán)利要求2所述的方法,其特征在于,所述進(jìn)行物理排版包括根據(jù)公文元素式樣子文件中引用的式樣子文件中的頁(yè)面式樣信息建立頁(yè),將排版的元 數(shù)據(jù)信息在所述頁(yè)中定位;當(dāng)在一頁(yè)中排不下時(shí),建立第二頁(yè),將所述第二頁(yè)中將排版的元數(shù)據(jù)信息在所述第二 頁(yè)中定位;依次將每個(gè)元數(shù)據(jù)信息在每頁(yè)中進(jìn)行定位。
5.如權(quán)利要求1所述的方法,其特征在于,所述式樣子文件包括頁(yè)面式樣信息、字體聲明信息、句式樣信息、段落式樣信息、文字表式樣信息、單元格式 樣信息、圖像對(duì)象式樣信息和圖形對(duì)象式樣信息中的一種或幾種。
6.如權(quán)利要求1所述的方法,其特征在于,所述公文樣式模板文件還包括規(guī)則排版子 文件。
7.如權(quán)利要求6所述的方法,其特征在于,將所述元數(shù)據(jù)信息灌入后所述方法進(jìn)一步 包括讀取所述規(guī)則排版子文件中的規(guī)則,進(jìn)行自動(dòng)排版,判斷自動(dòng)排版后的文檔是否滿(mǎn)足 所述規(guī)則的要求,當(dāng)不滿(mǎn)足時(shí)重新進(jìn)行對(duì)應(yīng)元數(shù)據(jù)信息的灌入,當(dāng)滿(mǎn)足時(shí),進(jìn)行后續(xù)步驟。
8.一種基于版面格式模板的排版裝置,其特征在于,該裝置包括獲取解析模塊,用于獲取待排版的文檔,解析所述文檔中的每個(gè)元數(shù)據(jù)信息,并根據(jù)選 擇的公文樣式模板文件,解析所述公文樣式模板文件,獲取所述公文樣式模板文件對(duì)應(yīng)的 每個(gè)描述信息,其中所述公文樣式模板文件包括排版規(guī)則子文件,式樣子文件以及公文元素式樣子文件;匹配模塊,用于將所述每個(gè)元數(shù)據(jù)信息與所述公文元素式樣子文件中的每個(gè)描述信息 進(jìn)行匹配;排版提示模塊,用于在確定匹配不成功時(shí),提示用戶(hù)選擇的模板錯(cuò)誤,在確定匹配成功 時(shí),根據(jù)所述每個(gè)描述信息中引用的所述式樣子文件中預(yù)先設(shè)置的式樣將所述元數(shù)據(jù)信息 灌入,生成排版后的文檔。
9.如權(quán)利要求8所述的裝置,其特征在于,所述排版提示模塊包括邏輯排版單元,用于將所述公文樣式模板文件中的描述信息,及文檔中的對(duì)應(yīng)元數(shù)據(jù) 信息,進(jìn)行邏輯排版,生成數(shù)據(jù)文件;物理排版單元,用于將所述數(shù)據(jù)文件進(jìn)行物理排版,生成排版后的文檔。
10.如權(quán)利要求9所述的裝置,其特征在于,所述邏輯排版單元包括匹配子單元,用于將所述公文樣式模板文件中的每個(gè)描述信息的名稱(chēng),與解析得到的 文檔中的對(duì)應(yīng)的元數(shù)據(jù)信息進(jìn)行匹配;查找組合子單元,用于在公文元素式樣子文件中確定匹配成功的描述信息,根據(jù)該描 述信息的標(biāo)識(shí)在式樣子文件中查找該描述信息對(duì)應(yīng)的式樣信息,將該匹配成功的元數(shù)據(jù)按 照所述式樣信息組合到公文元素式樣子文件的該匹配成功的描述信息對(duì)應(yīng)的式樣中。
11.如權(quán)利要求9所述的裝置,其特征在于,所述物理排版單元包括頁(yè)建立子單元,用于根據(jù)公文元素式樣子文件中引用的式樣子文件中的頁(yè)面式樣信息 建立頁(yè);判斷子單元,用于判斷建立的頁(yè)內(nèi)是否能夠排下排版的元數(shù)據(jù)信息;定位子單元,用于將在該頁(yè)內(nèi)排版的元數(shù)據(jù)信息在所述頁(yè)中定位。
12.如權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括存儲(chǔ)模塊,用于保存頁(yè)面式樣信息、字體聲明信息、句式樣信息、段落式樣信息、文字表 式樣信息、單元格式樣信息、圖像對(duì)象式樣信息和圖形對(duì)象式樣信息中的一種或幾種。
13.如權(quán)利要求8所述的裝置,其特征在于,所述排版提示模塊還用于,根據(jù)讀取的規(guī)則排版子文件中的規(guī)則,將所述元數(shù)據(jù)信息灌入后的文檔進(jìn)行自動(dòng)排 版,判斷自動(dòng)排版后的文檔是否滿(mǎn)足所述規(guī)則的要求,當(dāng)確定不滿(mǎn)足時(shí)重新進(jìn)行對(duì)應(yīng)元數(shù) 據(jù)信息的灌入,當(dāng)確定滿(mǎn)足時(shí),生成排版后的文檔。
全文摘要
本發(fā)明公開(kāi)了一種基于版面格式模板的排版方法及裝置,用以解決現(xiàn)有技術(shù)中排版過(guò)程效率低的問(wèn)題。該方法通過(guò)在解析公文樣式模板文件,獲取公文樣式模板文件中對(duì)應(yīng)的每個(gè)描述信息解析待排版的文檔獲取元數(shù)據(jù)信息,在匹配成功時(shí),根據(jù)公文樣式模板文件中的公文元素式樣子文件中的每個(gè)描述信息中引用的公文樣式模板文件中式樣子文件中預(yù)先設(shè)置的式樣將對(duì)應(yīng)的元數(shù)據(jù)灌入,生成排版后的文檔,在本發(fā)明實(shí)施例中,由于預(yù)先設(shè)置了多個(gè)模板,保證了每個(gè)模板設(shè)置的統(tǒng)一性,并且模板中每個(gè)描述信息引用預(yù)先設(shè)定的樣式,從而可以有效的提高排版的效率,同時(shí)在進(jìn)行排版時(shí),數(shù)據(jù)與樣式分別進(jìn)行處理避免了相互之間的影響和制約,提高了排版的準(zhǔn)確性。
文檔編號(hào)G06F17/25GK101872340SQ20091008264
公開(kāi)日2010年10月27日 申請(qǐng)日期2009年4月23日 優(yōu)先權(quán)日2009年4月23日
發(fā)明者吳於茜, 王學(xué)武, 肖建國(guó), 謝云開(kāi) 申請(qǐng)人:北京大學(xué);北大方正集團(tuán)有限公司;北京方正電子政務(wù)信息科技有限公司