亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

固定格式文檔轉(zhuǎn)換引擎的制作方法

文檔序號:6498013閱讀:230來源:國知局
固定格式文檔轉(zhuǎn)換引擎的制作方法
【專利摘要】固定格式文檔轉(zhuǎn)換引擎和相關(guān)聯(lián)的用于將固定格式的文檔轉(zhuǎn)換成流格式文檔的方法。固定格式文檔轉(zhuǎn)換引擎包括一系列布局分析引擎和語義分析引擎,以分析從固定格式文檔獲得的基本物理布局信息來將物理布局信息豐富、修改和分類成為漸進地更加高級的物理布局信息,并最終成為語義布局信息。將語義布局信息映射且串行化為具有高級流動性的選中的流格式文檔。
【專利說明】固定格式文檔轉(zhuǎn)換引擎
[0001] 背景
[0002] 流格式文檔和固定格式文檔被廣泛使用且具有不同的目的。流格式文檔使用諸如 章節(jié)、段落、欄和表之類的復(fù)雜邏輯格式化結(jié)構(gòu)來組織文檔。結(jié)果,流格式文檔提供了靈活 性且容易修改,使得它們適用于涉及被頻繁更新或受到顯著編輯的文檔的任務(wù)。相反,固定 格式文檔使用諸如文本串、路徑和圖像之類的基本物理布局元素來組織文檔以保存原始外 觀。固定格式文檔提供了一致且精確的格式布局,使得它們適用于涉及不被頻繁或大量改 變的或其中需要統(tǒng)一性的文檔的任務(wù)。這樣的任務(wù)的示例包括文檔歸檔、高質(zhì)量再現(xiàn)、以及 用于商業(yè)發(fā)布和印刷的源文件。固定格式文檔通常從流格式源文檔中創(chuàng)建。固定格式文檔 還包括物理(即,紙質(zhì))文檔的數(shù)字化再現(xiàn)(例如,掃描和照片)。
[0003] 在其中需要編輯固定格式文檔但流格式源文檔不可用的情況下,固定格式文檔必 須被轉(zhuǎn)換成流格式文檔。轉(zhuǎn)換涉及解析該固定格式文檔并將來自固定格式文檔的基本物理 布局元素變換成在流格式文檔中使用的更復(fù)雜的邏輯元素。面對復(fù)雜元素(例如,無邊界 表格)的現(xiàn)有文檔轉(zhuǎn)換器訴諸于被設(shè)計用于以輸出文檔的可流動性為代價來保存布局(例 如文本框、行間距,和字符間距)的視覺保真度的基本技術(shù)。結(jié)果是需要用戶執(zhí)行大量手動 重構(gòu)來獲得真正有用的流格式文檔的受限流格式文檔。本發(fā)明正是對于這些和其他考慮事 項而做出的。
[0004] 簡要概述
[0005] 提供下述概述以便以簡化形式介紹將在以下詳細描述中進一步描述的一些概念。 本概述并不旨在標識所要求保護的主題內(nèi)容的關(guān)鍵特征或必要特征,也不旨在用于限定所 要求保護的主題的范圍。
[0006] 固定格式文檔轉(zhuǎn)換引擎包括布局分析引擎和語義分析引擎。布局分析引擎包括許 多以基于依賴性序列工作的檢測引擎。
[0007] 在一個實施例中,固定格式文檔轉(zhuǎn)換引擎的操作流程包括基本上以下述順序執(zhí)行 下述檢測和/或重構(gòu)引擎和操作:解析器、模式匹配引擎、公式檢測引擎、文本框檢測引擎、 布局分析引擎、交叉區(qū)域段落重構(gòu)引擎、章節(jié)重構(gòu)引擎、樣式重構(gòu)引擎、標題重構(gòu)引擎、內(nèi)容 表格重構(gòu)引擎以及列表重構(gòu)引擎。布局分析引擎的操作流程包括基本上以下述順序執(zhí)行下 述檢測和/或重構(gòu)引擎和操作:白空間(whitespace)檢測操作、矢量圖形分類引擎、另一個 白空間檢測操作、區(qū)域檢測引擎、行檢測引擎、每行單詞檢測引擎、基本圖形聚集擴展操作、 區(qū)域后處理操作、下標/上標檢測引擎、無邊界表格檢測引擎、頁欄(page column)檢測引 擎、區(qū)域內(nèi)段落檢測引擎、腳注/尾注檢測引擎以及頁邊空白(page margin)檢測引擎。
[0008] 在布局分析引擎中的檢測引擎和在語義分析引擎中的重構(gòu)引擎通過一起工作或 順序工作來分析從固定格式文檔獲得的基本物理布局信息以將物理布局信息豐富、修改和 分類為漸進地更加高級的物理布局信息,并最終成為語義布局信息。將語義布局信息映射 且串行化為具有高級流動性的選中的流格式文檔。
[0009] -個或多個實施例的詳情在附圖及以下描述中闡述。通過閱讀以下詳細描述并查 閱相關(guān)聯(lián)的附圖,其它特征和優(yōu)點將是顯而易見的。應(yīng)該理解,下述詳細的描述僅是說明性 的,而不是對所要求保護的發(fā)明的限制。
[0010] 附圖簡述
[0011] 通過參考下述詳細描述、所附權(quán)利要求書和附圖將更好地理解進一步的特征、各 方面和優(yōu)點,其中元素不會縮放以便可以更加清楚地示出細節(jié),其中,類似附圖標記貫穿若 干視圖指代類似元素,并且其中:
[0012] 圖1示出包括固定格式文檔轉(zhuǎn)換引擎的系統(tǒng)。
[0013] 圖2是示出文檔處理器的一個實施例的操作流程的框圖。
[0014] 圖3A-3B構(gòu)成了示出作為固定格式文檔轉(zhuǎn)換引擎的部分的各種引擎的依賴性的 單個框圖。
[0015] 圖4示出了由固定格式文檔轉(zhuǎn)換引擎所執(zhí)行的功能的流程圖。
[0016]圖5A-C構(gòu)成了示出由固定格式文檔轉(zhuǎn)換引擎的布局分析引擎所執(zhí)行的功能的一 個實施例的單個流程圖。
[0017] 圖6示出了執(zhí)行固定格式文檔轉(zhuǎn)換引擎的一個實施例的平板計算設(shè)備。
[0018] 圖7是適用于實現(xiàn)固定格式文檔轉(zhuǎn)換引擎的實施例的示范性計算設(shè)備的簡化框 圖。
[0019] 圖8A示出執(zhí)行固定格式文檔轉(zhuǎn)換引擎的一個實施例的移動計算設(shè)備的一個實施 例。
[0020] 圖8B是適用于實現(xiàn)固定格式文檔轉(zhuǎn)換引擎的實施例的示范性移動計算設(shè)備的簡 化框圖。
[0021] 圖9是適用于實現(xiàn)固定格式文檔轉(zhuǎn)換引擎的實施例的示范性分布式計算系統(tǒng)的 簡化框圖。
[0022] 詳細描述
[0023] 在此描述并在附圖中示出了一種將固定格式文檔轉(zhuǎn)換成流格式文檔的固定格式 文檔轉(zhuǎn)換引擎和相關(guān)聯(lián)的方法。固定格式文檔轉(zhuǎn)換引擎包括布局分析引擎和語義分析引擎 序列以分析從固定格式文檔獲得的基本物理布局信息將物理布局信息豐富、修改和分類為 漸進地更加高級的物理布局信息,并最終成為語義布局信息。將語義布局信息映射且串行 化為具有高級流動性的選中的流格式文檔。將語義布局信息映射且串行化為具有高級流動 性的選中的流格式文檔。
[0024] 圖1示出合并了固定格式文檔轉(zhuǎn)換引擎100的系統(tǒng)。在示出的實施例中,固定格 式文檔轉(zhuǎn)換引擎1〇〇在計算設(shè)備104上執(zhí)行。通過解析器(即解析引擎)110、文檔處理器 112以及串行化器114將固定格式文檔106轉(zhuǎn)換成流格式文檔108。解析器110從固定格 式文檔106中提取數(shù)據(jù)。從固定格式文檔提取的數(shù)據(jù)被寫入可由文檔處理器112和串行化 器114訪問的數(shù)據(jù)存儲116。文檔處理器112使用一個或多個檢測和/或重構(gòu)引擎(例如 本發(fā)明的固定格式文檔轉(zhuǎn)換引擎100)分析該數(shù)據(jù)并將其轉(zhuǎn)換為可流動元素。最后,串行化 器114將可流動元素寫成可流動文檔格式(例如,文字處理格式)。
[0025] 圖2更加詳細地示出文檔處理器112的操作流程的一個實施例。文檔處理器112 包括可選的光學(xué)字符識別(OCR)引擎202、布局分析引擎204以及語義分析引擎206。數(shù)據(jù) 存儲116中包含的數(shù)據(jù)包括物理布局對象208和邏輯布局對象210。在一些實施例中,物 理布局對象208和邏輯布局對象210被分層地安排在編組的樹類陣列(即,數(shù)據(jù)對象)中。 在各個實施例中,頁面是物理布局對象208的頂級編組,而章節(jié)是邏輯布局對象210的頂級 編組。從固定格式文檔106提取的數(shù)據(jù)通常被存儲為由固定格式文檔106中的包含的頁面 所組織的物理布局對象208。從固定格式文檔獲得的基本物理布局對象包括文本串、圖像和 路徑。文本串是在頁面內(nèi)容流中指定當顯示固定格式文檔時字符的繪制位置的文本元素。 圖像是存儲在固定格式文檔106中的光柵圖像(S卩,圖片)。路徑描述了諸如用于構(gòu)建矢量 圖的線、曲線(例如,三次貝塞爾曲線)和文本輪廓等元素。
[0026] 處理開始的位置依賴于被解析的固定格式文檔106的類型。從流格式源文檔直接 創(chuàng)建的本機固定格式文檔l〇6a包含基本物理布局元素中的一些或全部。一般而言,從本機 固定格式文檔l〇6a提取的數(shù)據(jù)可供文檔轉(zhuǎn)換器立即使用;但在一些情況下,鏡像重新格式 化或其他鏡像處理器被應(yīng)用以組織或標準化該數(shù)據(jù)。相反,通過對物理文檔進行數(shù)字圖像 化(例如,掃描或拍照)而創(chuàng)建的基于圖像的固定格式文檔l〇6b中的所有信息被存儲作為 不具有附加數(shù)據(jù)(即,沒有文本串或路徑)的一系列頁面圖像。在這種情況下,任選光學(xué) 字符識別引擎202分析每一頁面圖像并創(chuàng)建對應(yīng)的物理布局對象。一旦物理布局對象208 可用,布局分析引擎204就確定固定格式文檔的布局并用新信息來豐富數(shù)據(jù)存儲(例如,添 力口、移除以及更新物理布局對象)。在布局分析完成之后,語義分析引擎206用從對物理布 局對象和/或邏輯布局對象的分析中獲得的語義信息來豐富數(shù)據(jù)存儲。
[0027] 圖3A-B構(gòu)成了示出作為固定格式文檔轉(zhuǎn)換引擎100的部分的各種引擎的依賴性 的單個框圖。圖4示出了由固定格式文檔轉(zhuǎn)換引擎執(zhí)行各種引擎的順序的流程圖。圖5A-C 構(gòu)成了示出由布局分析引擎204所執(zhí)行的功能的一個實施例的單個流程圖。由于相互關(guān)聯(lián) 的特性,圖3A-5C被一起討論。雖然每個引擎是依賴于緊接在前的引擎進行描述的,但應(yīng)該 理解地是正被討論的引擎應(yīng)該通常被認為也依賴于所述緊接在前的引擎如在圖3A-B所示 所依賴的任何引擎和/或操作。
[0028] 固定格式文檔轉(zhuǎn)換引擎包括布局分析引擎204以及語義分析引擎206。在圖3A 的依賴性圖表中出現(xiàn)的解析器110的層包括頁屬性層304和文本串排序?qū)?06。在圖3A 的依賴性圖表中出現(xiàn)的布局分析引擎204的檢測引擎包括模式匹配引擎308、公式檢測引 擎310、文本框檢測引擎311、矢量圖形分類引擎312、區(qū)域檢測引擎314、無邊界表格檢測引 擎315、頁欄檢測引擎316、區(qū)域讀順序檢測操作318、區(qū)域內(nèi)段落檢測引擎320、頁邊空白檢 測引擎322、腳注/尾注檢測引擎348、用連字符連接(hyphenation)操作350、行檢測引擎 324、每行單詞檢測引擎326以及下標/上標檢測引擎327。矢量圖形分類引擎312包括陰 影檢測引擎330、下劃線/刪除行檢測引擎332、邊界檢測引擎336、表格檢測引擎334以及 基本圖形聚集引擎338。
[0029] 在圖3B的依賴性圖表中出現(xiàn)的語義分析引擎206的重構(gòu)引擎和操作包括章節(jié)重 構(gòu)引擎340、內(nèi)容表格重構(gòu)引擎342、標題重構(gòu)引擎344、樣式重構(gòu)引擎346、交叉區(qū)域段落重 構(gòu)引擎352、列表重構(gòu)引擎354、段落屬性重構(gòu)操作356、表格重構(gòu)操作358以及分頁符重構(gòu) 操作360。重構(gòu)操作是作為重構(gòu)引擎(例如交叉區(qū)域段落重構(gòu)引擎352)的部分來執(zhí)行的專 門操作。
[0030] 在布局分析引擎204中的檢測引擎和在語義分析引擎206中的重構(gòu)引擎通過一起 工作或順序工作來分析從固定格式文檔獲得的基本物理布局信息以將物理布局信息豐富、 修改和分類為漸進地更加高級的物理布局信息,并最終成為語義布局信息。在圖4的實施 例中,固定格式文檔轉(zhuǎn)換引擎的操作流程包括基本上以下述順序執(zhí)行下述檢測和/或重構(gòu) 引擎和操作:解析器110、模式匹配引擎308、公式檢測引擎310、文本框檢測引擎311、布局 分析引擎204、交叉區(qū)域段落重構(gòu)引擎352、章節(jié)重構(gòu)引擎340、樣式重構(gòu)引擎346、標題重構(gòu) 引擎344、內(nèi)容表格重構(gòu)引擎342以及列表重構(gòu)引擎354。在圖5A-C中示出的布局分析引擎 的操作流程包括基本上以在固定格式文檔的每個頁面上的順序執(zhí)行下述檢測和/或重構(gòu) 引擎和操作:白空間檢測操作500a、矢量圖形分類引擎312、另一個白空間檢測操作500b、 區(qū)域檢測引擎314、行檢測引擎324、每行單詞檢測引擎326、基本圖形聚集擴展操作338b、 區(qū)域后處理操作314b、下標/上標檢測引擎327、無邊界表格檢測引擎315、頁欄檢測引擎 316、區(qū)域內(nèi)段落檢測引擎320、腳注/尾注檢測引擎348以及頁邊空白檢測引擎322。將語 義布局信息映射且串行化為具有高級流動性的選中的流格式文檔。
[0031] 所述檢測和/或重構(gòu)引擎以在此所述的取決于某些引擎對一個或多個在先檢測 或重構(gòu)引擎的結(jié)果的依賴性的順序被執(zhí)行。所述布局分析引擎204的檢測引擎分析物理布 局對象并用與文檔的物理布局相關(guān)聯(lián)的新信息來豐富所述數(shù)據(jù)存儲。所述語義分析引擎 206的重構(gòu)引擎分析物理布局對象以及邏輯布局對象,并用與文檔的邏輯布局相關(guān)聯(lián)的新 信息來豐富所述數(shù)據(jù)存儲。對各種檢測和重構(gòu)引擎的功能的概述如下。概述關(guān)注檢測或重 構(gòu)所依賴的任意其它引擎以及在固定格式文檔轉(zhuǎn)換引擎流水線中的執(zhí)行順序。如上所述并 在圖3A-5C中示出的引擎間的依賴性和執(zhí)行順序代表了整個固定格式文檔轉(zhuǎn)換引擎的一 個實施例。構(gòu)想了某個數(shù)量的變化。例如,在一些實施例中,從固定格式文檔轉(zhuǎn)換過程中忽 視所選的引擎。在這樣的情況中,假定引擎依賴于下一更高的父引擎。而且,在一些實施例 中,所選的引擎的執(zhí)行順序可以在引擎并不直接彼此依賴的地方變化。
[0032] 頁屬性層304是在解析期間從固定格式的文檔中確定單個頁面的屬性(例如頁面 大小和方向)的解析器層。在圖3A所示的實施例中,頁面屬性層304通常依賴于解析器 110的操作。
[0033] 文本串排序?qū)?06是基于在解析固定格式的文檔106期間的呈現(xiàn)順序?qū)ξ谋敬?序的解析器層。在圖3A所示的實施例中,文本串排序?qū)?06通常依賴于解析器110的操作。
[0034] 模式匹配引擎308是在整篇文檔中檢測具有基本類似的內(nèi)容并在基本類似的位 置處出現(xiàn)的重復(fù)元素的布局分析引擎。在各種實施例中,模式匹配引擎308檢測頁眉、頁 腳、水印、頁面色彩、頁面邊界以及頁碼。模式匹配引擎308的一些實施例執(zhí)行布局分析引 擎204b的所選檢測引擎以檢測并重構(gòu)頁眉和頁腳區(qū)域;然而,所述結(jié)果是過渡的并僅被模 式匹配引擎308使用。在圖3A-B所示的實施例中,模式匹配引擎308通常依賴于解析器 110的操作而不依賴于任意其它檢測引擎的分析。在圖4-5C中所示的實施例中,在解析引 擎110完成來自固定格式的文檔的數(shù)據(jù)提取之后再執(zhí)行模式匹配引擎308。
[0035] 公式檢測引擎310是基于公式種子(formula seed)的存在來檢測文本串中的公 式的布局分析引擎。在圖3A-B中所示的實施例中,公式檢測引擎310依賴于由模式匹配引 擎308所執(zhí)行的分析。在圖4-5C中所示的實施例中,在模式匹配引擎308完成其分析之后 再執(zhí)行公式檢測引擎310。
[0036] 文本框檢測引擎311是檢測與頁邊空白之外的區(qū)域相交的文本串的布局分析引 擎。文本框不必須由可視框來限制邊界。在圖3A-B中所示的實施例中,文本框檢測引擎 311依賴于由公式檢測引擎310所執(zhí)行的分析。在圖4-5C中所示的實施例中,在公式檢測 引擎310完成其分析之后再執(zhí)行文本框檢測引擎311。
[0037] 白空間檢測操作500a是檢測在一個頁面上的白空間的區(qū)域(即包含非文本串、路 徑或圖像的區(qū)域)的邊界框的布局分析操作。在一些實施例中,白空間檢測操作被作為另 一個布局分析引擎的部分來執(zhí)行。在其它實施例中,白空間檢測操作是由專用的白空間檢 測引擎來執(zhí)行。白空間被用于檢測下劃線和刪除線格式化、高亮、陰影、邊界(例如,框)和 區(qū)域。在各種實施例中,白空間檢測引擎具有非特定依賴性且不對數(shù)據(jù)存儲做出任何改變。 在圖4-5C所示的實施例中,在文本框檢測引擎311完成其分析之后再執(zhí)行白空間檢測操作 500a〇
[0038] 矢量圖形分類引擎312是使用許多子引擎分類矢量圖形的布局分析引擎,所述子 引擎包括陰影檢測引擎330、下劃線/刪除行檢測引擎332、表格檢測引擎334、邊界檢測引 擎336以及基本圖形聚集引擎338。在圖3A-B中所示的實施例中,矢量圖形分類引擎312 依賴于由文本框檢測引擎311所執(zhí)行的分析。在圖4-5C所示的實施例中,在文本框檢測引 擎311完成其分析之后再執(zhí)行矢量圖形分類引擎312。
[0039] 陰影檢測引擎330是檢測形成限定文本串并包含填充(即,背景填充色)的矩形 或類似形狀的路徑的布局分析引擎。從頁面中移除被檢測為陰影的所有路徑,并用合適的 陰影屬性來更新對應(yīng)的文本串。在圖3A-B中所示的實施例中,陰影檢測引擎330依賴于由 下劃線/刪除行檢測引擎332所執(zhí)行的分析。在圖4-5C所示的實施例中,在白空間檢測操 作500a完成之后再執(zhí)行陰影檢測引擎330。
[0040] 下劃線/刪除行檢測引擎332是檢測直接在文本串之下或與文本串重疊的路徑的 布局分析引擎。從頁面中移除被檢測為下劃線/刪除線的所有路徑。并且用合適的下劃線 和/或刪除線屬性來更新對應(yīng)的文本串元素/節(jié)點。在圖3A-B中所示的實施例中,文本框 檢測引擎332依賴于由公式檢測引擎330所執(zhí)行的分析。在圖4-5C中所示的實施例中,在 陰影檢測引擎330完成其分析之后再執(zhí)行下劃線/刪除行檢測引擎332。
[0041] 表格檢測引擎334是用可視邊界制表的布局分析引擎。為了簡化區(qū)域檢測,將 可能表示表格邊界的所有圖形對象聚集起來。表格檢測引擎定位表格的每個單元格的邊 界。另外,表格檢測引擎334喚醒所選的布局分析引擎以在表格的每個單元格上執(zhí)行布局 分析。在圖3A-B中所示的實施例中,表格檢測引擎334依賴于由下劃線/刪除行檢測引擎 332所執(zhí)行的分析。在圖5A-C中所示的實施例中,在下劃線/刪除行檢測引擎332完成其 分析之后再執(zhí)行表格檢測引擎334。
[0042] 邊界檢測引擎336是檢測形成限定文本串并包含填充的矩形或類似形狀的路徑 的布局分析引擎。從頁面中移除被檢測為邊界的所有路徑,并用合適的邊界屬性來更新對 應(yīng)的文本串。在圖3A-B中所示的實施例中,邊界檢測引擎336依賴于由表格檢測引擎334 所執(zhí)行的分析。在圖4-5C中所示的實施例中,在表格檢測引擎334完成其分析之后再執(zhí)行 邊界檢測引擎336。
[0043] 基本圖形聚集引擎338是基于重疊、附近或其它類似特性將自然地屬于單個實體 的所有剩余圖形元素聚集起來的布局分析引擎?;緢D形不局限于圖像,還包括旨在成為 單個實體的一部分的形狀和文本串。在圖3A-B中所示的實施例中,基本圖形聚集引擎338 依賴于由邊界檢測引擎336所執(zhí)行的分析。在圖4-5C所示的實施例中,在邊界檢測引擎 336完成其分析之后再執(zhí)行基本圖形聚集引擎338。
[0044] 區(qū)域檢測引擎314是使用關(guān)于文本串的邊界框以及頁面屬性的信息來將整個文 檔分成可被獨立處理的多個塊(即,區(qū)域)的布局分析引擎。在各種實施例中,出于區(qū)域檢 測的目的,每個表格單元格被作為一個單獨的頁面來處理。在區(qū)域檢測之后,通過沒有文 本串被剩作頁面的節(jié)點的孩子來將頁面上的所有文本串在區(qū)域之間進行劃分。在圖3A-B 中所示的實施例中,區(qū)域檢測引擎314依賴于由矢量圖形分類引擎312所執(zhí)行的分析。在 圖4-5C中所示的實施例中,在矢量圖形分類引擎312完成其分析之后再執(zhí)行區(qū)域檢測引擎 314。在圖4-5C所示的實施例中,在基本圖形聚集引擎338完成其分析之后再次執(zhí)行白空 間檢測操作500b。
[0045] 頁欄檢測引擎316是在頁面級上檢測欄的布局分析引擎。檢測頁欄以全部正確地 建立該頁面的讀取順序。在區(qū)域檢測之后,對應(yīng)的欄應(yīng)該在垂直平行的區(qū)域中,因此,這些 區(qū)域需要被充分處理以重新創(chuàng)建欄。在圖3A-B中所示的實施例中,頁欄檢測引擎316依賴 于由區(qū)域檢測引擎314所執(zhí)行的分析。在圖4-5C中所示的實施例中,在無邊界表格檢測引 擎315完成其分析之后再執(zhí)行頁欄檢測引擎316。
[0046] 區(qū)域讀取順序檢測操作318是由一個或多個布局分析引擎(例如區(qū)域檢測引擎 314)所執(zhí)行的確定在一個區(qū)域內(nèi)的文本串的讀取順序的操作。在區(qū)域檢測之后,通過將區(qū) 域從左上角到右下角進行排序并且需要考慮關(guān)于檢測到的欄的信息來大致確定所述區(qū)域 的讀取順序。而且,為了支持不從左向右讀取的語言,需要完成附加的分析。在圖3A-B中 所示的實施例中,區(qū)域讀取順序檢測操作318依賴于由頁欄檢測引擎316所執(zhí)行的分析。
[0047] 區(qū)域內(nèi)段落檢測引擎320是將一個區(qū)域內(nèi)的行組合成段落的布局分析引擎。在區(qū) 域內(nèi)段落檢測之后,可以通過沒有行被剩作該區(qū)域的節(jié)點的孩子來將該區(qū)域中的所有的行 在段落中進行劃分。在圖3A-B所示的實施例中,區(qū)域內(nèi)段落檢測引擎320依賴于由區(qū)域讀 取順序檢測操作318和行檢測引擎324所執(zhí)行的分析。在圖4-5C中所示的實施例中,在頁 欄檢測引擎316完成其分析之后再執(zhí)行區(qū)域內(nèi)段落檢測引擎320。
[0048] 頁邊空白檢測引擎322是計算頁邊空白以適合段落的幾何形狀的布局分析引擎。 在圖3A-B中所示的實施例中,頁邊空白檢測引擎322依賴于由區(qū)域內(nèi)段落檢測引擎320完 成其分析所執(zhí)行的分析。在圖4-5C中所示的實施例中,在腳注/尾注檢測引擎348完成其 分析之后再執(zhí)行頁邊空白檢測引擎322。
[0049] 行檢測引擎324是基于文本串在區(qū)域內(nèi)以及相對于彼此的位置來將每個區(qū)域內(nèi) 的文本串組合成行的布局分析引擎。在行檢測之后,通過沒有文本串被剩作區(qū)域的孩子來 將每個區(qū)域內(nèi)的所有的文本串在行之間進行劃分。在圖3A-B中所示的實施例中,行檢測引 擎324依賴于由區(qū)域檢測引擎314所執(zhí)行的分析。在圖4-5C中所示的實施例中,在區(qū)域檢 測引擎314完成其分析之后再執(zhí)行行檢測引擎324。
[0050] 每行單詞檢測引擎326是檢測單個行中出現(xiàn)的所有單詞的布局分析引擎。在圖 3A-B中所示的實施例中,每行單詞檢測引擎326依賴于由行檢測引擎324所執(zhí)行的分析。 在圖4-5C中所示的實施例中,在行檢測引擎324完成其分析之后再執(zhí)行每行單詞檢測引擎 326。
[0051] 用連字符連接操作350是由行檢測引擎324或每行單詞檢測引擎326所執(zhí)行的重 構(gòu)單詞的連字符連接的操作。在圖3A-B中所示的實施例中,用連字符連接操作350依賴于 由每行單詞檢測引擎326所執(zhí)行的分析。在一個替換實施例中,用連字符連接操作350依 賴于由行檢測引擎324所執(zhí)行的分析。
[0052] 在圖4-5C所示出的實施例中,在每行單詞檢測引擎326完成其分析之后,所述布 局分析引擎204再次執(zhí)行基本圖形聚集引擎338以執(zhí)行基本圖形聚集擴展操作338b。
[0053] 區(qū)域檢測引擎314的區(qū)域后處理操作314b執(zhí)行各種操作以檢測特征(例如行編 號)。在圖3A-B所示的實施例中,區(qū)域后處理操作314b具有非特定的被指示的依賴性;然 而,它最少包括區(qū)域檢測引擎314的依賴性。在各種實施例中,區(qū)域后處理操作314b還依 賴于由行檢測引擎324、每行單詞檢測引擎326以及基本圖形聚集擴展操作338b所執(zhí)行的 任意或所有的分析。在圖4-5C所示出的實施例中,在基本圖形聚集擴展操作338b完成之 后再執(zhí)行區(qū)域后處理操作314b。
[0054] 下標/上標檢測引擎327是基于文本串相對于所述行位置的位置來檢測所有的上 標/下標的布局分析引擎。在圖3A-B中所示的實施例中,下標/上標檢測引擎327依賴于 由每行單詞檢測引擎326所執(zhí)行的分析。在圖4-5C中所示的實施例中,在每行單詞檢測引 擎326完成其分析之后再執(zhí)行下標/上標檢測引擎327。
[0055] 無邊界表格檢測引擎315是使用白空間來標識構(gòu)成無邊界表格的文本的架構(gòu)化 區(qū)域的布局分析引擎。在圖3A-B中所示的實施例中,無邊界表格檢測引擎315依賴于由區(qū) 域檢測引擎314所執(zhí)行的分析。在圖4-5C中所示的實施例中,在下標/上標檢測引擎327 完成其后處理分析之后再執(zhí)行無邊界表格檢測引擎315。
[0056] 腳注/尾注檢測引擎348標識并重構(gòu)腳注和尾注。在圖3A-B中所示的實施例中, 腳注/尾注檢測引擎348依賴于由區(qū)域內(nèi)段落檢測引擎320所執(zhí)行的分析。在一個替換 實施例中,腳注/尾注檢測引擎348依賴于由頁邊空白檢測引擎322所執(zhí)行的分析。在圖 4-5C中所示的實施例中,在區(qū)域內(nèi)段落檢測引擎320完成其分析之后再執(zhí)行腳注/尾注檢 測引擎348。
[0057] 交叉區(qū)域段落重構(gòu)引擎352是標識并校正跨多個區(qū)域和/或頁面分開的段落。在 圖3A-B中所示的實施例中,交叉區(qū)域段落重構(gòu)引擎352依賴于由頁邊空白檢測引擎322所 執(zhí)行的分析。在圖4-5C所示的實施例中,在布局分析引擎204(具體而言在頁邊空白檢測 引擎322完成其分析)之后,執(zhí)行交叉區(qū)域段落重構(gòu)引擎352。
[0058] 章節(jié)重構(gòu)引擎340是一種當發(fā)生諸如重新開始頁碼之類的所選事件時創(chuàng)建新章 節(jié)的語義分析引擎。在圖3A-B中所示的實施例中,章節(jié)重構(gòu)引擎340依賴于由頁邊空白檢 測引擎322所執(zhí)行的分析。在圖4所示的實施例中,在交叉區(qū)域段落重構(gòu)引擎352完成其 分析之后再執(zhí)行章節(jié)重構(gòu)引擎340。
[0059] 樣式重構(gòu)引擎346是分析段落并收集不同的文本格式化樣式的語義分析引擎。在 廣泛收集了樣式文檔之后,將規(guī)則引擎用于為某些標準樣式定義創(chuàng)建定義。在圖3A-B中所 示的實施例中,樣式重構(gòu)引擎346依賴于由章節(jié)重構(gòu)引擎340所執(zhí)行的分析。在圖4-5C中 所示的實施例中,在章節(jié)重構(gòu)引擎340完成其分析之后再執(zhí)行樣式重構(gòu)引擎346。
[0060] 標題重構(gòu)引擎344是重構(gòu)標題的語義分析引擎。在圖3A-B中所示的實施例中,標 題重構(gòu)引擎344依賴于由樣式重構(gòu)引擎346所執(zhí)行的分析。在圖4-5C中所示的實施例中, 在樣式重構(gòu)引擎346完成其分析之后再執(zhí)行標題重構(gòu)引擎344。
[0061] 內(nèi)容表格重構(gòu)引擎342是標識并重構(gòu)內(nèi)容表格和其它參考表格的語義分析引擎。 在圖3A-B中所示的實施例中,內(nèi)容表格重構(gòu)引擎342依賴于由標題重構(gòu)引擎344所執(zhí)行的 分析。在圖4-5C中所示的實施例中,在標題重構(gòu)引擎344完成其分析之后再執(zhí)行內(nèi)容表格 重構(gòu)引擎342。
[0062] 列表重構(gòu)引擎354是基于成員的水平偏移來標識并重構(gòu)項目符號編號和數(shù)字編 號的列表的語義分析引擎。在圖3A-B中所示的實施例中,列表重構(gòu)引擎354依賴于由標題 重構(gòu)引擎344所執(zhí)行的分析。在圖4-5C中所示的實施例中,在內(nèi)容表格重構(gòu)引擎342完成 其分析之后再執(zhí)行列表重構(gòu)引擎354。
[0063] 段落屬性重構(gòu)操作356是在從物理布局對象到邏輯布局對象的過渡期間標識并 校正段落屬性的操作。在圖3A-B中所示的實施例中,段落屬性重構(gòu)操作356依賴于由交叉 區(qū)域段落重構(gòu)引擎352所執(zhí)行的分析。在一個實施例中,段落屬性重構(gòu)操作356被作為交 叉區(qū)域段落重構(gòu)引擎352的部分來執(zhí)行。
[0064] 表格重構(gòu)操作358是在從物理布局對象到邏輯布局對象的過渡期間重新創(chuàng)建內(nèi) 容和表格屬性的操作。每個表格單兀格經(jīng)歷了使用一個或多個布局分析引擎的完整的布局 分析。在圖3A-B中所示的實施例中,表格重構(gòu)操作358依賴于由交叉區(qū)域段落重構(gòu)引擎 352所執(zhí)行的分析。在一個實施例中,表格重構(gòu)操作358被作為交叉區(qū)域段落重構(gòu)引擎352 的部分來執(zhí)行。
[0065] 分頁符重構(gòu)操作360是在從物理布局對象到邏輯布局對象的過渡期間重新創(chuàng)建 分頁符的操作。在圖3A-B中所示的實施例中,分頁符重構(gòu)引擎360依賴于由頁邊空白檢測 引擎322所執(zhí)行的分析。在一個實施例中,分頁符重構(gòu)操作360被作為交叉區(qū)域段落重構(gòu) 引擎352的部分來執(zhí)行。
[0066] 如上所述并在圖3A-5C中示出的依賴性和執(zhí)行順序代表了整個固定格式文檔轉(zhuǎn) 換引擎的一個實施例。構(gòu)想了某個數(shù)量的變化。例如,在一些實施例中,從固定格式文檔轉(zhuǎn) 換過程中忽視所選的引擎。在這樣的情況中,假定引擎依賴于下一更高的父引擎。在其它 實施例中,在一個引擎不依賴其它引擎(即所述引擎是無關(guān)的)的情況下可以改變某些引 擎的執(zhí)行。作為示例,對下標/上標檢測引擎327的忽略將對交叉區(qū)域段落重構(gòu)引擎352 的操作產(chǎn)生不利的影響。
[0067] 在此所述的固定格式文檔轉(zhuǎn)換引擎和相關(guān)聯(lián)的固定格式文檔轉(zhuǎn)換方法對于將固 定格式的文檔中的各種固定格式元素轉(zhuǎn)換成合適的對應(yīng)的流格式元素來說是有用的。盡管 已在結(jié)合在計算機上的操作系統(tǒng)上運行的應(yīng)用程序執(zhí)行的程序模塊的一般上下文中描述 本發(fā)明,但本領(lǐng)域的技術(shù)人員將認識到,本發(fā)明也可結(jié)合其他程序模塊實現(xiàn)。一般而言,程 序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、組件、數(shù)據(jù)結(jié)構(gòu)和其他類 型的結(jié)構(gòu)。
[0068] 本文描述的實施例和功能可通過多種計算系統(tǒng)來操作,包括但不限于臺式計算機 系統(tǒng)、有線和無線計算系統(tǒng)、移動計算系統(tǒng)(如移動電話、上網(wǎng)本、圖形輸入板或平板型計 算機、筆記本計算機、和膝上型計算機)、手持設(shè)備、多處理器系統(tǒng)、基于微處理器或可編程 消費電子產(chǎn)品、小型計算機、以及大型計算機。圖6示出了執(zhí)行固定格式文檔轉(zhuǎn)換引擎100 的實施例的示例性平板計算設(shè)備600。此外,本文所述的實施例和功能可在分布式系統(tǒng)上操 作(如基于云的計算系統(tǒng)),其中應(yīng)用功能、存儲器、數(shù)據(jù)存儲和檢索、以及各種處理功能可 在諸如因特網(wǎng)或內(nèi)聯(lián)網(wǎng)之類的分布式計算網(wǎng)絡(luò)上彼此遠程地操作。各種類型的用戶界面和 信息可經(jīng)板載計算設(shè)備顯示器或經(jīng)與一個或多個計算設(shè)備相關(guān)聯(lián)的遠程顯示單元被顯示。 例如,各種類型的用戶界面和信息可在墻壁表面上被顯示和交互,各種類型的用戶界面和 信息被投射在墻壁表面上。與可用于實施本發(fā)明的各實施例的許多計算系統(tǒng)的交互包括: 鍵擊輸入、觸摸屏輸入、語音或其他音頻輸入、姿勢輸入(其中相關(guān)聯(lián)的計算設(shè)備配備有用 于捕捉和解釋用于控制計算設(shè)備的功能的用戶姿勢的檢測(如相機)功能)等。圖7到9 以及相關(guān)描述提供了其中可實施本發(fā)明的各實施例的各種操作環(huán)境的討論。然而,關(guān)于圖7 到9所示出和討論的設(shè)備和系統(tǒng)是用于示例的目的,而非對可被用于實施本文所述的本發(fā) 明的各實施例的大量計算設(shè)備配置的限制。
[0069] 圖7是示出可用來實施本發(fā)明的各實施例的計算設(shè)備700的示例物理組件(即硬 件)的框圖。下面描述的計算設(shè)備組件可適用于上述的計算設(shè)備。在基本配置中,計算設(shè) 備700可包括至少一個處理單元702和系統(tǒng)存儲器704。取決于計算設(shè)備的配置和類型, 系統(tǒng)存儲器704可包括,但不限于,易失性存儲器(例如,隨機存取存儲器)、非易失性存儲 器(例如,只讀存儲器)、閃存、或這些存儲器的任何組合。系統(tǒng)存儲器704可包括操作系統(tǒng) 705和適于運行諸如固定格式文檔轉(zhuǎn)換引擎100、解析器110、文檔處理器112以及串行化器 114之類的軟件應(yīng)用720的一個或多個程序模塊706。操作系統(tǒng)705例如可適合于控制計 算設(shè)備700的操作。此外,本發(fā)明的各實施例可以結(jié)合圖形庫、其他操作系統(tǒng)、或任何其他 應(yīng)用程序來實踐,且不限于任何特定應(yīng)用程序或系統(tǒng)。該基本配置在圖7中由虛線708內(nèi) 的那些組件示出。計算設(shè)備700可具有附加特征或功能。例如,計算設(shè)備700還可包括附 加數(shù)據(jù)存儲設(shè)備(可移動和/或不可移動),諸如,例如磁盤、光盤或磁帶。這些附加存儲在 圖7中由可移動存儲設(shè)備709和不可移動存儲設(shè)備710示出。
[0070] 如上所述,可在系統(tǒng)存儲器704中存儲多個程序模塊和數(shù)據(jù)文件。當在處理單元 702上執(zhí)行時,諸如固定格式文檔轉(zhuǎn)換引擎100、解析器110、文檔處理器112以及串行化器 114等程序模塊706可以執(zhí)行包括例如固定格式文檔轉(zhuǎn)換方法的各階段中的一個或多個階 段等過程。上述過程是一示例,且處理單元702可執(zhí)行其他過程。根據(jù)本發(fā)明的實施例可 使用的其他程序模塊可包括電子郵件和聯(lián)系人應(yīng)用、字處理應(yīng)用、電子表格應(yīng)用、數(shù)據(jù)庫應(yīng) 用、幻燈片演示應(yīng)用、繪圖或計算機輔助應(yīng)用等。
[0071] 此外,本發(fā)明的各實施例可在包括分立電子元件的電路、包含邏輯門的封裝或集 成電子芯片、利用微處理器的電路、或在包含電子元件或微處理器的單個芯片上實現(xiàn)。例 如,可以通過片上系統(tǒng)(S0C)來實施本發(fā)明的各實施例,其中,可以將圖7中示出的每個或 許多組件集成到單個集成電路上。這樣的S0C設(shè)備可包括一個或多個處理單元、圖形單元、 通信單元、系統(tǒng)虛擬化單元以及各種應(yīng)用功能,所有這些都被集成到(或"燒錄到")芯片基 板上作為單個集成電路。當通過S0C操作時,在此所述的關(guān)于固定格式文檔轉(zhuǎn)換引擎100、 解析器110、文檔處理器112以及串行化器114的功能可以通過在單個集成電路(芯片)上 與計算設(shè)備700的其它組件集成在一起的專用邏輯來操作。本發(fā)明的各實施例還可以使用 能夠執(zhí)行諸如,例如,AND (與)、0R (或)和NOT (非)等邏輯運算的其他技術(shù)來實踐,包括 但不限于,機械、光學(xué)、流體和量子技術(shù)。另外,本發(fā)明的各實施例可以在通用計算機或任何 其他電路或系統(tǒng)中實現(xiàn)。
[0072] 計算設(shè)備700也可具有一個或多個輸入設(shè)備712,如鍵盤、鼠標、筆、語音輸入設(shè) 備、觸摸輸入設(shè)備等等。也可包括輸出設(shè)備714,如顯示器、揚聲器、打印機等等。上述設(shè)備 是示例且可以使用其他設(shè)備。計算設(shè)備700可包括允許與其他計算設(shè)備718進行通信的一 個或多個通信連接716。合適的通信連接716的示例包括但不限于RF發(fā)射機、接收機和/ 或收發(fā)機電路;通用串行總線(USB)、并行或串行端口、以及適用于與適用的計算機可讀介 質(zhì)一起使用的其他連接。
[0073] 例如,本發(fā)明的各實施方式可被實現(xiàn)為計算機進程(方法)、計算系統(tǒng)或諸如計算 機程序產(chǎn)品或計算機可讀介質(zhì)等制品。計算機程序產(chǎn)品可以是計算機系統(tǒng)可讀并編碼了用 于執(zhí)行計算機進程的指令的計算機程序的計算機存儲介質(zhì)。
[0074] 如此處所使用的術(shù)語計算機可讀介質(zhì)可包括計算機存儲介質(zhì)和通信介質(zhì)。計算機 存儲介質(zhì)可包括以用于存儲諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊、或其他數(shù)據(jù)等信息 的任何方法或技術(shù)實現(xiàn)的易失性和非易失性、可移動和不可移動介質(zhì)。系統(tǒng)存儲器704、可 移動存儲設(shè)備709和不可移動存儲設(shè)備710都是計算機存儲介質(zhì)(即,存儲器存儲)的示 例。計算機存儲介質(zhì)可以包括,但不限于,RAM、R0M、電可擦除只讀存儲器(EEPR0M)、閃存或 其它存儲器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其它光存儲、磁帶盒、磁帶、磁盤存儲或其 它磁性存儲設(shè)備、或可用于存儲信息且可以由計算設(shè)備700訪問的任何其它介質(zhì)。任何這 樣的計算機存儲介質(zhì)都可以是計算設(shè)備700的一部分。
[0075] 通信介質(zhì)由諸如載波或其他傳輸機制等已調(diào)制數(shù)據(jù)信號中的計算機可讀指令、數(shù) 據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)來體現(xiàn),并包括任何信息傳遞介質(zhì)。術(shù)語"已調(diào)制數(shù)據(jù)信號"可 以描述以對該信號中的信息進行編碼的方式設(shè)定或者改變其一個或多個特征的信號。作為 示例而非限制,通信介質(zhì)包括諸如有線網(wǎng)絡(luò)或直接線連接等有線介質(zhì),以及諸如聲學(xué)、射頻 (RF)、紅外線和其他無線介質(zhì)等無線介質(zhì)。
[0076] 圖8A和8B示出可用來實施本發(fā)明的各實施例的移動計算環(huán)境800,例如移動電 話、智能電話、平板個人計算機、膝上型計算機等。參考圖8A,示出了用于實現(xiàn)各實施例的示 例性移動計算設(shè)備800。在一基本配置中,移動計算設(shè)備800是具有輸入元件和輸出元件兩 者的手持式計算機。移動計算設(shè)備800通常包括顯示器805以及允許用戶將信息輸入到移 動計算設(shè)備800中的一個或多個輸入按鈕810。移動計算設(shè)備800的顯示器805也可充當 輸入設(shè)備(如觸摸屏顯示器)。如果包括,則可任選的側(cè)輸入元件815允許進一步的用戶輸 入。側(cè)輸入元件815可以是旋轉(zhuǎn)開關(guān)、按鈕、或任何其他類型的手動輸入元件。在替代實施 例中,移動計算設(shè)備800可結(jié)合更多或更少的輸入元件。例如,在某些實施例中,顯示器805 可以不是觸摸屏。在又一替代實施例中,移動計算設(shè)備800是諸如蜂窩電話之類的便攜式 電話系統(tǒng)。移動計算設(shè)備800還可包括可選的小鍵盤835??蛇x的小鍵盤835可以是物理 小鍵盤或者在觸摸屏顯示器上生成的"軟"小鍵盤。在各種實施例中,輸出元件包括用于示 出圖形用戶界面(GUI)的顯示器805、可視指示器820 (如發(fā)光二極管)、和/或音頻換能器 825 (如揚聲器)。在某些實施例中,移動計算設(shè)備800結(jié)合振動換能器來向用戶提供觸覺 反饋。在又一實施例中,移動計算設(shè)備800結(jié)合諸如音頻輸入(如麥克風插孔)、音頻輸出 (如耳機插孔)、以及視頻輸出(如HDMI端口)之類的輸入和/或輸出端口,用于將信號發(fā) 送到外部設(shè)備或從外部設(shè)備接收信號。
[0077] 圖8B是示出移動計算設(shè)備的一個實施例的架構(gòu)的框圖。即,移動計算設(shè)備800可 結(jié)合系統(tǒng)(即架構(gòu))802以實現(xiàn)某些實施例。在一個實施例中,系統(tǒng)802被實現(xiàn)為能夠運行 一個或多個應(yīng)用(如瀏覽器、電子郵件、日歷、聯(lián)系人管理器、消息收發(fā)客戶端、游戲、以及 媒體客戶端/播放器)的"智能電話"。在某些實施例中,系統(tǒng)802被集成為計算設(shè)備,諸如 集成的個人數(shù)字助理(PDA)和無線電話。
[0078] -個或多個應(yīng)用程序866可被加載到存儲器862中并在操作系統(tǒng)864上或與操作 系統(tǒng)864相關(guān)聯(lián)地運行。應(yīng)用程序的示例包括電話撥號程序、電子郵件程序、個人信息管 理(PM)程序、文字處理程序、電子表格程序、因特網(wǎng)瀏覽器程序、消息通信程序等等。系統(tǒng) 802還包括存儲器862內(nèi)的非易失性存儲區(qū)868。非易失性存儲區(qū)868可被用于存儲在系 統(tǒng)802斷電時不會丟失的持久信息。應(yīng)用程序866可使用信息并將信息存儲在非易失性存 儲區(qū)868中,如電子郵件應(yīng)用使用的電子郵件或其他消息等。同步應(yīng)用(未示出)也駐留 于系統(tǒng)802上且被編程為與駐留在主機計算機上的對應(yīng)的同步應(yīng)用交互,以保持非易失性 存儲區(qū)868中存儲的信息與主機計算機處存儲的相應(yīng)信息同步。如應(yīng)理解的,其他應(yīng)用可 被加載到存儲器862中并在移動計算設(shè)備800上運行,包括此處所述的固定格式文檔轉(zhuǎn)換 引擎1〇〇、解析器110、文檔處理器112以及串行化器114。
[0079] 系統(tǒng)802具有可被實現(xiàn)為一個或多個電池的電源870。電源870還可包括外部功 率源,如補充電池或?qū)﹄姵刂匦鲁潆姷腁C適配器或加電對接托架。
[0080] 系統(tǒng)802還可包括執(zhí)行發(fā)射和接收無線電頻率通信的功能的無線電872。無線電 872通過通信運營商或服務(wù)供應(yīng)商方便了系統(tǒng)802與"外部世界"之間的無線連接。來往無 線電872的傳輸是在操作系統(tǒng)864的控制下進行的。換言之,無線電872接收的通信可通 過操作系統(tǒng)864傳播到應(yīng)用程序866,反之亦然。
[0081] 無線電872允許系統(tǒng)802例如通過網(wǎng)絡(luò)與其他計算設(shè)備通信。無線電872是通信 介質(zhì)的一個示例。通信介質(zhì)通常由諸如載波或其他傳輸機制之類的已調(diào)制數(shù)據(jù)信號中的計 算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊、或其他數(shù)據(jù)來體現(xiàn),并且包括任何信息傳送介質(zhì)。術(shù)語 "已調(diào)制數(shù)據(jù)信號"是指使得以在信號中編碼信息的方式來設(shè)定或改變其一個或多個特征 的信號。作為示例而非限制,通信介質(zhì)包括諸如有線網(wǎng)絡(luò)或直接線連接之類的有線介質(zhì),以 及諸如聲學(xué)、RF、紅外及其他無線介質(zhì)之類的無線介質(zhì)。如此處所使用的術(shù)語"計算機可讀 介質(zhì)"包括存儲介質(zhì)和通信介質(zhì)兩者。
[0082] 系統(tǒng)802的該實施例使用可用于提供可視通知的可視指示器820和/或通過音頻 換能器825來產(chǎn)生音頻通知的音頻接口 874來提供通知。在所示實施例中,可視指示器820 是發(fā)光二極管(LED),而音頻換能器825是揚聲器。這些設(shè)備可直接耦合到電源870,使得 當被激活時,即使為了節(jié)省電池功率而可能關(guān)閉處理器860和其它組件,它們也保留一段 由通知機制指示的保持通電時間。LED可被編程為無限地保持通電,直到用戶采取動作指 示該設(shè)備的通電狀態(tài)。音頻接口 874用于向用戶提供聽覺信號并從用戶接受聽覺信號。例 如,除了被耦合到音頻換能器825之外,音頻接口 874還可被耦合到話筒來接收可聽輸入, 例如便于電話通話。根據(jù)各本發(fā)明的各實施例,話筒也可充當音頻傳感器來便于對通知的 控制,如下文將描述的。系統(tǒng)802可進一步包括允許板載相機830的操作來記錄靜止圖像、 視頻流等的視頻接口 876。
[0083] 實現(xiàn)系統(tǒng)802的移動計算設(shè)備800可具有附加特征或功能。例如,移動計算設(shè)備 800還可包括附加數(shù)據(jù)存儲設(shè)備(可移動和/或不可移動),例如磁盤、光盤或磁帶。這種 附加存儲設(shè)備在圖8B中用非易失性存儲區(qū)868示出。計算機存儲介質(zhì)可包括以用于存儲 諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊、或其他數(shù)據(jù)等信息的任何方法或技術(shù)實現(xiàn)的易 失性和非易失性、可移動和不可移動介質(zhì)。
[0084] 移動計算設(shè)備800生成或捕捉的且經(jīng)系統(tǒng)802存儲的數(shù)據(jù)/信息可如上所述本地 存儲在移動計算設(shè)備800上,或數(shù)據(jù)可被存儲在可由設(shè)備通過無線電872或通過移動計算 設(shè)備800和與移動計算設(shè)備800相關(guān)聯(lián)的一分開的計算設(shè)備之間的有線連接訪問的任何數(shù) 量的存儲介質(zhì)上,該計算設(shè)備如例如因特網(wǎng)之類的分布式計算網(wǎng)絡(luò)中的服務(wù)器計算機。如 應(yīng)理解的,此類數(shù)據(jù)/信息可經(jīng)移動計算設(shè)備800、經(jīng)無線電872或經(jīng)分布式計算網(wǎng)絡(luò)來被 訪問。類似地,這些數(shù)據(jù)/信息可根據(jù)已知的數(shù)據(jù)/信息傳送和存儲手段來容易地在計算 設(shè)備之間傳送以供存儲和使用,這些手段包括電子郵件和協(xié)作數(shù)據(jù)/信息共享系統(tǒng)。
[0085] 圖9示出了用于提供固定格式文檔轉(zhuǎn)換引擎100、解析器110、文檔處理器112以 及串行化器114的系統(tǒng)的體系結(jié)構(gòu)的一個實施例,如上所述。固定格式文檔轉(zhuǎn)換引擎100、 解析器110、文檔處理器112以及串行化器114所開發(fā)的、與其交互的或與其相關(guān)聯(lián)地編 輯的內(nèi)容可被存儲在不同地通信信道或其他存儲類型中。例如,各種文檔可使用目錄服務(wù) 922、web門戶924、郵箱服務(wù)926、即時消息收發(fā)存儲928或社交聯(lián)網(wǎng)網(wǎng)站930來存儲。如 本文所描述的,固定格式文檔轉(zhuǎn)換引擎100、解析器110、文檔處理器112以及串行化器114 可以使用這些類型的系統(tǒng)中的任一個來啟用數(shù)據(jù)利用。服務(wù)器920可以向客戶機提供固定 格式文檔轉(zhuǎn)換引擎1〇〇、解析器110、文檔處理器112以及串行化器114。作為一個示例,月艮 務(wù)器920可以是通過web提供固定格式文檔轉(zhuǎn)換引擎100、解析器110、文檔處理器112以 及串行化器114的web服務(wù)器。服務(wù)器920可以通過網(wǎng)絡(luò)915在web上向客戶機提供固定 格式文檔轉(zhuǎn)換引擎1〇〇、解析器110、文檔處理器112以及串行化器114。作為示例,客戶機 計算設(shè)備918可被實現(xiàn)為計算設(shè)備900并被具體化在個人計算機918a、平板計算設(shè)備918b 和/或移動計算設(shè)備918c (如智能電話)中??蛻舳擞嬎阍O(shè)備918的這些實施例中的任一 個可從存儲916獲得內(nèi)容。在各種實施例中,用于在構(gòu)成本發(fā)明的計算設(shè)備之間進行通信 的網(wǎng)絡(luò)的類型包括但不限于互聯(lián)網(wǎng)、內(nèi)聯(lián)網(wǎng)、廣域網(wǎng)(WAN)、局域網(wǎng)(LAN)、以及虛擬專用網(wǎng) 絡(luò)(VPN)。在本申請中,網(wǎng)絡(luò)包括企業(yè)網(wǎng)絡(luò)和客戶端計算設(shè)備用來訪問企業(yè)網(wǎng)絡(luò)的網(wǎng)絡(luò)(即 客戶端網(wǎng)絡(luò))。在一個實施例中,客戶端網(wǎng)絡(luò)是企業(yè)網(wǎng)絡(luò)的一部分。在另一實施例中,客戶 端網(wǎng)絡(luò)是通過外部可用的接入點(如網(wǎng)關(guān)、遠程訪問協(xié)議、或公共或?qū)S没ヂ?lián)網(wǎng)地址)來訪 問企業(yè)網(wǎng)絡(luò)的一分開的網(wǎng)絡(luò)。
[0086] 本申請中提供的一個或多個實施例的描述和說明不旨在以任何方式限制或約束 如權(quán)利要求所要求保護的發(fā)明范圍。本申請中提供的實施例、示例和細節(jié)被認為是足以傳 達所有權(quán),且使得他人能夠制作并使用所要求保護的發(fā)明的最佳模式。所要求保護的發(fā)明 不應(yīng)被理解為限制于本申請中所提供的任何實施例、示例或細節(jié)。不管是以組合的方式還 是分開的方式示出和描述,各種特征(結(jié)構(gòu)上的和方法邏輯上的)旨在被選擇性地包括或 忽略,以產(chǎn)生具有特定的特征集的實施例。在被提供本申請的描述和說明的情況下,本領(lǐng)域 的技術(shù)人員能夠想象到落在所要求保護的發(fā)明的更寬泛方面以及本申請中所具體化的一 般發(fā)明概念的精神內(nèi)的替代實施例并不背離該更寬泛的范圍。
【權(quán)利要求】
1. 一種用于將固定格式文檔轉(zhuǎn)換成流格式文檔的方法,所述方法包括以下步驟: 將從固定格式文檔中提取的信息存儲為物理布局對象,所述物理布局對象基于所述物 理布局對象之間的物理關(guān)系被分層地安排; 使用布局分析操作的所選序列來豐富所述物理布局對象以分析所述固定格式文檔的 所述物理布局,其中所述布局分析操作的所選序列是基于對來自至少一個在先所述布局分 析操作的結(jié)果的依賴性;以及 使用語義分析操作的所選序列豐富邏輯布局對象以分析所述固定格式文檔的所述物 理布局,其中所述語義分析操作的所述序列是基于對來自至少一個在先所述語義分析操作 或所述布局分析操作的結(jié)果的依賴性。
2. 如權(quán)利要求1所述的方法,其特征在于,所述豐富所述物理布局對象的步驟包括以 下步驟: 檢測所述固定格式文檔中的白空間; 在所述檢測白空間的步驟之后檢測所述固定格式文檔中的陰影; 在所述檢測陰影的步驟之后檢測所述固定格式文檔中的下劃線和刪除線; 在所述檢測下劃線和刪除線的步驟之后檢測所述固定格式文檔中的邊界; 在所述檢測框的步驟之后檢測所述固定格式文檔中的表格; 在所述檢測表格的步驟之后聚集所述固定格式文檔中的基本圖形; 在所述聚集基本圖形的步驟之后檢測所述固定格式文檔中的白空間; 在所述檢測白空間的步驟之后檢測所述固定格式文檔中的區(qū)域; 在所述檢測區(qū)域的步驟之后檢測所述固定格式文檔中的頁欄; 在所述檢測頁欄的步驟之后檢測所述固定格式文檔中的行; 在所述檢測行的步驟之后檢測所述固定格式文檔中的每行單詞; 在所述檢測每行單詞的步驟之后擴展所述固定格式文檔中的基本圖形聚集; 在所述擴展基本圖形聚集的步驟之后,后處理所述固定格式文檔中的區(qū)域; 在所述后處理區(qū)域的步驟之后檢測所述固定格式文檔中的下標和上標; 在所述后處理區(qū)域的步驟之后檢測所述固定格式文檔中的無邊界表格; 在所述后處理區(qū)域的步驟之后檢測所述固定格式文檔中的出現(xiàn)在單個區(qū)域或頁面中 的段落; 在所述檢測段落的步驟之后檢測所述固定格式文檔中的腳注和尾注; 在所述檢測段落的步驟之后檢測所述固定格式文檔中的頁邊空白。
3. 如權(quán)利要求1所述的方法,其特征在于,所述豐富所述邏輯布局對象的步驟包括下 述步驟: 重構(gòu)跨越超過一個的所述物理布局對象的段落; 在所述重構(gòu)段落的步驟之后重構(gòu)章節(jié); 在所述重構(gòu)章節(jié)的步驟之后重構(gòu)標題; 在所述重構(gòu)標題的步驟之后重構(gòu)文本格式化樣式; 在所述重構(gòu)文本格式化樣式的步驟之后重構(gòu)參考表格;以及 在所述重構(gòu)參考表格的步驟之后重構(gòu)項目符號編號和/或數(shù)字編號的列表。
4. 如權(quán)利要求1所述的方法, 其特征在于,所述豐富所述物理布局對象的步驟還包括:在所述物理布局對象是可用 的且所選的語義分析引擎的所有父引擎已經(jīng)完成執(zhí)行之后,依據(jù)所述物理布局對象的可用 性以及從所述多個布局分析引擎和多個所述語義分析引擎中選擇的至少一個父引擎中的 至少一個來執(zhí)行從多個布局分析引擎中選中的布局分析引擎;以及 其特征在于,所述豐富所述邏輯布局對象的步驟還包括:在所選的語義分析引擎的所 有所述父引擎已經(jīng)完成執(zhí)行之后,依據(jù)所述多個布局分析引擎和所述多個語義分析引擎中 選擇的至少一個父引擎來執(zhí)行從所述多個語義分析引擎中選中的語義分析引擎。
5. 如權(quán)利要求1所述的方法,其特征在于,所述物理布局對象對應(yīng)于從所述固定格式 文檔中提取的文本串、路徑和圖像。
6. 如權(quán)利要求1所述的方法,其特征在于,所述邏輯布局對象對應(yīng)于流格式文檔的語 義元素。
7. 如權(quán)利要求1所述的方法,其特征在于,還包括將所述邏輯布局對象串行化以使用 所述多個所述邏輯布局對象和所述多個物理布局對象來創(chuàng)建對應(yīng)于所述固定格式文檔的 流格式文檔的步驟。
8. 如權(quán)利要求1所述的方法,其特征在于,還包括將所述多個物理布局對象安排在類 似樹的節(jié)點陣列中的步驟,頁節(jié)點是頂層所述物理布局對象。
9. 如權(quán)利要求1所述的方法,其特征在于,還包括將所述多個邏輯布局對象安排為類 似樹的節(jié)點陣列的步驟,所述章節(jié)節(jié)點是頂層所述物理布局對象。
10. -種將固定格式文檔轉(zhuǎn)換成流格式文檔的系統(tǒng),所述系統(tǒng)包括固定格式文檔轉(zhuǎn)換 引擎,所述固定格式文檔轉(zhuǎn)換引擎還包括: 物理布局數(shù)據(jù)存儲,操作上存儲多個物理布局對象,每個所述物理布局對象具有基于 物理位置的與另一個所述物理布局對象的層次關(guān)系; 邏輯布局數(shù)據(jù)存儲,操作上存儲多個邏輯布局對象,每個所述邏輯布局對象具有基于 語義位置的與另一個邏輯布局對象的層次關(guān)系; 解析引擎,操作上從固定格式文檔中提取信息并將所述信息存儲在對應(yīng)于文本串、路 徑和圖像中的至少一個的所選的所述物理布局對象中; 多個布局分析引擎,操作上基于所述多個物理布局對象的分析來豐富所述多個物理布 局對象中的至少一個,每個所述布局分析引擎依賴于從所述解析引擎中所選的另一個引擎 和所述多個布局分析引擎中的至少一個;以及 多個語義分析引擎,操作上基于所述多個物理布局對象的分析來豐富所述多個邏輯布 局對象中的至少一個,每個所述語義分析引擎依賴于從所述多個文本分析引擎和所述多個 語義分析引擎中所選的至少一個分析引擎。
11. 如權(quán)利要求10所述的系統(tǒng),其特征在于,還包括串行化引擎,基于所述多個所述邏 輯布局對象和所述多個物理布局對象來創(chuàng)建對應(yīng)于所述固定格式文檔的流格式文檔。
12. 如權(quán)利要求10所述的系統(tǒng),其特征在于,所述物理布局對象對應(yīng)于從所述固定格 式文檔中提取的文本串、路徑和圖像。
13. 如權(quán)利要求10所述的系統(tǒng),其特征在于: 所述多個布局分析引擎包括: 頁屬性檢測引擎,操作上分析與所述多個物理布局對象相關(guān)聯(lián)的頁面屬性,所述頁屬 性檢測引擎依賴于所述解析引擎; 文本框檢測引擎,操作上檢測所述多個物理布局對象中的與頁邊空白相交的文本串, 所述文本框檢測引擎依賴于所述解析引擎; 模式匹配引擎,操作上檢測在所述固定格式文檔中出現(xiàn)在至少兩個頁面上的類似元 素,所述模式匹配引擎依賴于所述解析引擎; 公式檢測引擎,操作上檢測公式,所述公式檢測引擎依賴于所述模式匹配引擎; 下劃線/刪除線引擎,操作上檢測下劃線和刪除線文本格式化,所述下劃線/刪除線引 擎依賴于所述公式檢測引擎; 表格檢測引擎,操作上檢測具有邊界的表格,所述表格檢測引擎依賴于所述下劃線/ 刪除線引擎; 基本圖形聚集引擎,操作上分組相關(guān)的圖形,所述基本圖形聚集引擎依賴于所述表格 檢測引擎;以及 多個文本分析引擎。
14. 如權(quán)利要求10所述的系統(tǒng),其特征在于,所述多個文本分析引擎包括: 區(qū)域檢測引擎,操作上檢測區(qū)域,所述區(qū)域檢測引擎依賴于矢量圖形分類引擎和文本 串排序引擎; 無邊界表格檢測引擎,操作上檢測沒有可視邊界的表格,所述無邊界表格檢測引擎依 賴于所述區(qū)域檢測引擎; 頁欄檢測引擎,操作上檢測頁欄,所述頁欄檢測引擎依賴于所述無邊界表格檢測引 擎; 行檢測引擎,操作上檢測文本串的行,所述行檢測引擎依賴于所述區(qū)域檢測引擎; 每行單詞檢測引擎,操作上檢測與行相關(guān)聯(lián)的單詞,所述每行單詞檢測引擎依賴于所 述行檢測引擎; 區(qū)域內(nèi)段落檢測引擎,操作上檢測在單個區(qū)域或頁面中出現(xiàn)的段落,所述區(qū)域內(nèi)段落 檢測引擎依賴于所述頁欄檢測引擎和所述行檢測引擎;以及 頁邊空白檢測引擎,操作上計算頁邊空白,所述頁邊空白檢測引擎依賴于所述區(qū)域內(nèi) 段落檢測引擎。
15. 如權(quán)利要求10所述的系統(tǒng),其特征在于,所述多個語義分析引擎包括: 交叉區(qū)域段落重構(gòu)引擎,操作上在所述邏輯布局對象中重構(gòu)跨越超過一個的區(qū)域或頁 面的段落,所述交叉區(qū)域段落重構(gòu)引擎依賴于所述頁邊空白檢測引擎; 腳注/尾注檢測引擎,操作上在所述邏輯布局對象中重構(gòu)腳注和尾注,所述腳注/尾注 檢測引擎依賴于所述區(qū)域內(nèi)段落檢測引擎和所述頁邊空白檢測引擎之一; 章節(jié)重構(gòu)引擎,操作上在所述邏輯布局對象中創(chuàng)建章節(jié)對象,所述章節(jié)重構(gòu)引擎依賴 于所述頁邊空白檢測引擎; 樣式重構(gòu)引擎,操作上在所述邏輯布局對象中重構(gòu)樣式,所述樣式重構(gòu)引擎依賴于所 述章節(jié)重構(gòu)引擎; 標題重構(gòu)引擎,操作上在所述邏輯布局對象中重構(gòu)標題,所述標題重構(gòu)引擎依賴于所 述樣式重構(gòu)引擎; 以及 內(nèi)容表格重構(gòu)引擎,操作上在所述邏輯布局對象中重構(gòu)參考表格,所述內(nèi)容表格重構(gòu) 引擎依賴于所述標題重構(gòu)引擎; 列表重構(gòu)引擎,操作上重構(gòu)項目符號編號和/或數(shù)字編號的列表,所述列表重構(gòu)引擎 依賴于所述標題重構(gòu)引擎。
16. 如權(quán)利要求10所述的系統(tǒng),其特征在于,所述固定格式文檔轉(zhuǎn)換引擎在操作上以 基于所述多個布局分析引擎和所述多個語義分析引擎之間的依賴性的順序來執(zhí)行所述多 個布局分析引擎和所述多個語義分析引擎中的每一個。
17. 如權(quán)利要求10所述的系統(tǒng),其特征在于,所述固定格式文檔轉(zhuǎn)換引擎在操作上: 將所述多個物理布局對象安排在類似樹的節(jié)點陣列中,頁面節(jié)點是頂層所述物理布局 對象;以及 將所述多個邏輯布局對象安排在類似樹的節(jié)點陣列中,章節(jié)節(jié)點是頂層所述物理布局 對象。
18. -種包含計算機可執(zhí)行指令的計算機可讀介質(zhì),所述可執(zhí)行指令在被計算機執(zhí)行 時執(zhí)行一種將固定格式文檔轉(zhuǎn)換成流格式文檔的方法,所述方法包括下述步驟: 將從固定格式文檔中提取的信息存儲為物理布局對象,所述物理布局對象基于所述物 理布局對象之間的物理關(guān)系被分層地安排; 使用布局分析操作的所選序列豐富所述物理布局對象以分析所述固定格式文檔的所 述物理布局,其中所述布局分析操作的所選序列是基于對來自至少一個在先所述布局分析 操作的結(jié)果的依賴性;所述布局分析操作的序列包括下述步驟: 檢測所述固定格式文檔中的白空間; 在所述檢測白空間的步驟之后檢測所述固定格式文檔中的陰影; 在所述檢測陰影的步驟之后檢測所述固定格式文檔中的下劃線和刪除線; 在所述檢測下劃線和刪除線的步驟之后檢測所述固定格式文檔中的框; 在所述檢測框的步驟之后檢測所述固定格式文檔中的表格; 在所述檢測表格的步驟之后聚集所述固定格式文檔中的基本圖形; 在所述聚集基本圖形的步驟之后檢測所述固定格式文檔中的白空間; 在所述檢測白空間的步驟之后檢測所述固定格式文檔中的區(qū)域; 在所述檢測區(qū)域的步驟之后檢測所述固定格式文檔中的頁欄; 在所述檢測頁欄的步驟之后檢測所述固定格式文檔中的行; 在所述檢測行的步驟之后檢測所述固定格式文檔中的每行單詞; 在所述檢測行的步驟之后檢測所述固定格式文檔中的每行單詞; 在所述檢測每行單詞的步驟之后擴展所述固定格式文檔中的基本圖形聚集; 在所述擴展基本圖形聚集的步驟之后,后處理所述固定格式文檔中的區(qū)域; 在所述后處理區(qū)域的步驟之后檢測所述固定格式文檔中的下標和上標; 在所述后處理區(qū)域的步驟之后檢測所述固定格式文檔中的無邊界表格; 在所述后處理區(qū)域的步驟之后檢測所述固定格式文檔中的出現(xiàn)在單個區(qū)域或頁面中 的段落; 在所述檢測段落的步驟之后檢測所述固定格式文檔中的腳注和尾注; 在所述檢測段落的步驟之后檢測所述固定格式文檔中的頁邊空白;以及 使用語義分析操作的所選序列來豐富邏輯布局對象以分析所述固定格式文檔的所述 物理布局,其中所述語義分析操作的所述序列是基于對來自至少一個在先所述語義分析操 作或所述布局分析操作的結(jié)果的依賴性,所述語義分析操作的序列包括下述步驟: 重構(gòu)跨越超過一個的所述物理布局對象的段落; 在所述重構(gòu)段落的步驟之后重構(gòu)章節(jié); 在所述重構(gòu)章節(jié)的步驟之后重構(gòu)標題; 在所述重構(gòu)標題的步驟之后重構(gòu)文本格式化樣式; 在所述重構(gòu)文本格式化樣式的步驟之后重構(gòu)內(nèi)容表格;以及 在所述重構(gòu)內(nèi)容表格的步驟之后重構(gòu)項目符號編號和/或數(shù)字編號的列表。
19. 如權(quán)利要求18所述的計算機可讀介質(zhì),其特征在于,所述方法還包括將所述邏輯 布局對象串行化,以使用所述多個所述邏輯布局對象和所述多個物理布局對象來創(chuàng)建對應(yīng) 于所述固定格式文檔的流格式文檔的步驟。
20. 如權(quán)利要求18所述的計算機可讀介質(zhì),其特征在于,所述物理布局對象對應(yīng)于從 所述固定格式文檔中提取的文本串、路徑和圖像。
【文檔編號】G06K9/00GK104221033SQ201280067894
【公開日】2014年12月17日 申請日期:2012年1月23日 優(yōu)先權(quán)日:2012年1月23日
【發(fā)明者】M·拉扎里維克, M·拉斯科維克, A·奧布爾簡, M·舍舒姆, D·拉杜瓦諾維克, D·扎里克, A·托米克, D·斯拉維斯基, M·安提克 申請人:微軟公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1