專利名稱:產(chǎn)生用于在各種大小的顯示器上顯現(xiàn)的基于圖像的可回流文件的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字圖像的處理,更具體地講,涉及處理和顯示含有 文本內(nèi)容的圖像。
背景技術(shù):
隨著計算機和基于計算機的網(wǎng)絡(luò)的使用不斷擴大,內(nèi)容提供商正 在準(zhǔn)備和發(fā)布越來越多的電子形式的內(nèi)容。這個內(nèi)容包括以印刷形式 存在的傳統(tǒng)媒介以及電子媒介,所述傳統(tǒng)媒介諸如書本、雜志、報紙、 時事通訊、手冊、指南、參考文獻、文章、報告、文檔等,在電子媒 介中,前述內(nèi)容以數(shù)字形式存在,或者通過使用掃描裝置將前迷內(nèi)容 從印刷形式轉(zhuǎn)換為數(shù)字形式。特別是,互聯(lián)網(wǎng)通過內(nèi)容圖像的下載和 顯示促進了數(shù)字內(nèi)容的更廣泛的公開。隨著數(shù)據(jù)傳輸速度提高,越來 越多的內(nèi)容頁面圖像正變得可在線獲得。頁面圖像允許讀者象看印刷 形式一樣閱讀內(nèi)容頁面。
然而, 一些讀者可能具有這樣的計算裝置,其具有的顯示器與最 初格式化頁面圖像所面對的顯示器的大小不同。此外, 一些讀者可能 希望在顯示器內(nèi)在大小可變的窗口中觀看頁面圖像中的文本。在一個 實施例中,內(nèi)容提供商可產(chǎn)生和維護相同內(nèi)容的不同版本,以適應(yīng)各 種顯示器的實施例。然而,這種方法可能效率不高,但成本高。本發(fā) 明旨在提供頁面圖像文件,其被配置為自動進行自我調(diào)整,以顯現(xiàn)在 不同大小的顯示器或窗口上。
發(fā)明內(nèi)容
根據(jù)各種示例性的實施例,本發(fā)明提供一種用于創(chuàng)建基于圖像的可回流文件的計算機實施的方法、系統(tǒng)和其上具有編碼指令的計算機 可訪問介質(zhì)?;趫D像的可回流文件被配置為通過根據(jù)顯示器或窗口 的給定大小允許文本的行"回流,,而被顯現(xiàn)在各種大小的顯示器和窗 口上。如這里所使用的,行的"回流"是指改變文本中的行分割。
用于創(chuàng)建基于圖像的可回流文件的方法通常包括六個步驟。首 先,接收具有文本的內(nèi)容圖像,例如,通過在含文本的圖像中掃描來 接收所述圖像。第二,找到在文本中包含的每個回流對象的邊界區(qū)域。 第三,找到文本中的每個回流對象的回流對象基線。簡要地講,單詞 的回流對象基線是指與該單詞中出現(xiàn)的大多數(shù)字符的底線一致的線。 第四,相對于圖像、也相對于包含回流對象的每個邊界區(qū)域來確定包 含回流對象的每個邊界區(qū)域的位置。例如,可將邊界區(qū)域相對于其對 應(yīng)的回流對象基線的位置定義為邊界區(qū)域的一側(cè)和回流對象基線之 間的偏移距離。第五,確定每個邊界區(qū)域的大小。在一方面中,^f艮據(jù) 邊界區(qū)域的寬度和高度確定該邊界區(qū)域的大小。第六,存儲每個邊界 區(qū)域的大小和位置。因此,根據(jù)本發(fā)明的方法而創(chuàng)建的基于圖像的可 回流文件定義了包含在接收的具有文本的圖像中出現(xiàn)的回流對象的 每個邊界區(qū)域的大小和位置,每個邊界區(qū)域還與回流對象基線相關(guān) 聯(lián)。
根據(jù)本發(fā)明的另外的實施例,還可在各種大小的顯示器或窗口上 顯現(xiàn)根據(jù)本發(fā)明的方法而創(chuàng)建的基于圖像的可回流文件。在一個實施 例中,在給定大小的顯示器或窗口上顯現(xiàn)基于圖像的可回流文件的方 法通常包括六個步驟。首先,接收基于圖像的可回流文件,該文件包 括含有文本的圖像。在該文件中,每個回流對象形成子圖像,并被限 定在邊界區(qū)域中,并且在圖像中出現(xiàn)的每個邊界區(qū)域的大小和位置被 定義。第二,確定顯示器或窗口的大小。如果顯示器/窗口大小與用來 創(chuàng)建基于圖像的可回流文件的原始顯示器/窗口大小相同,則可"照原 樣"使用每個邊界區(qū)域的大小和位置來顯現(xiàn)文件。具體地講,可根據(jù) 在所述文件中定義的邊界區(qū)域的位置和大小在顯示器/窗口上顯現(xiàn)這 些邊界區(qū)域(從而其中所包含的回流對象)。另 一方面,如果顯示器/窗口大小以任何方式與原始顯示器/窗口 大小不同,則在第三步驟中,基于每個邊界區(qū)域的大小確定在顯示器 上每條水平線都水平擬合的邊界區(qū)域的數(shù)量,在相鄰的邊界區(qū)域之間 具有預(yù)定義的最小間隔。例如,在給定顯示器/窗口的水平尺寸和每個 邊界區(qū)域的寬度尺寸的情況下,可確定每條水平線將有多少個邊界區(qū) 域水平擬合。第四,確定每個邊界區(qū)域相對于每條水平線的水平位置。 第五,基于邊界區(qū)域的大小確定每條水平線上水平擬合的每個邊界區(qū) 域的垂直位置。例如,在給定顯示器/窗口的垂直尺寸和每個邊界區(qū)域 的高度尺寸的情況下,可確定如何在垂直方向上一致地分隔沿顯示器 上的多條水平線水平擬合的邊界區(qū)域。作為另一特疋的例子,可通過
以下方式實現(xiàn)每個邊界區(qū)域的垂直位置的確定首先基于顯示器的大 小確定多條水平線的每條的垂直位置(比如,通過將顯示器的垂直尺 寸除以最小間隔),并確定每個邊界區(qū)域的垂直位置,以使邊界區(qū)域 的回流對象基線與對應(yīng)的水平線對齊。在第六步驟中,根據(jù)確定的邊 界區(qū)域的水平位置和垂直位置顯現(xiàn)邊界區(qū)域,從而顯現(xiàn)其中包含的回 流對象的子圖像。
根據(jù)本發(fā)明的另 一方面,可根據(jù)讀者所請求的縮放級別在顯示器 /窗口上顯現(xiàn)根據(jù)本發(fā)明的方法而創(chuàng)建的基于圖像的可回流文件。在這 個實施例中,確定每條水平線上水平擬合的邊界區(qū)域的數(shù)量的步驟包 括以下步驟首先,根據(jù)所請求的顯示縮放級別重新調(diào)整邊界區(qū)域的 大小;然后,確定每條水平線上水平擬合的重調(diào)大小的邊界區(qū)域的數(shù) 量。確定每個邊界區(qū)域相對于每條水平線的水平位置的步驟類似地包 括確定每個重調(diào)大小的邊界區(qū)域相對于水平線的水平位置。確定每條 水平線上水平擬合的每個邊界區(qū)域的垂直位置的步驟包括以下步驟 確定每個重調(diào)大小的邊界區(qū)域的垂直位置,以使沿多條水平線水平擬 合的重調(diào)大小的邊界區(qū)域中的重調(diào)大小的回流對象在垂直方向上被 一致地分隔。最后,顯現(xiàn)回流對象的子圖像的步驟包括以下步驟根 據(jù)確定的重調(diào)大小的邊界區(qū)域的水平位置和垂直位置顯現(xiàn)在重調(diào)大 小的邊界區(qū)域中限定的回流對象的子圖像。例如,如果請求放大,則放大每個邊界區(qū)域的大小,并顯現(xiàn)重調(diào)大小(放大)的邊界區(qū)域,從 而顯現(xiàn)其中包含的重調(diào)大小(放大)的回流對象。
結(jié)合附圖,參考以下詳細描述將更容易理解本發(fā)明的前述方面和
許多相伴而生的優(yōu)點,在附圖中
圖1是顯示可實現(xiàn)本發(fā)明的實施例的示例性計算環(huán)境的示意圖2A是顯示可合并在如圖1中描繪的可回流文件產(chǎn)生服務(wù)器中 的部件中的一些部件的功能框圖2B是顯示可合并在如圖1中描繪的客戶端系統(tǒng)中的部件中一 些部件的功能框圖3A是顯示其中具有文本內(nèi)容的內(nèi)容的頁面的數(shù)字圖像的屏幕 顯示器的示意圖3B是在大小小的顯示器/窗口上顯現(xiàn)圖3A的內(nèi)容的瀏覽器程 序的示意圖3C是顯現(xiàn)圖3B的內(nèi)容并示出大比例縮放的瀏覽器程序的示
意圖3D是描繪分別顯現(xiàn)兩幅文本內(nèi)容的數(shù)字圖像的網(wǎng)頁的瀏覽器 程序的示意圖4A是根據(jù)本發(fā)明的一個實施例的用于產(chǎn)生基于圖像的可回流 文件的示例性方法的流程圖4B是根據(jù)本發(fā)明的一個實施例的用于在任何給定大小的顯示 器或窗口上顯現(xiàn)基于圖像的可回流文件的示例性方法的流程圖5示出每行基線和每個包含回流對象的邊界區(qū)域的概念;和
圖6A和圖6E示出回流對象基線的概念和可如何從每字符基線 獲得它們。
具體實施例方式
本發(fā)明涉及用于創(chuàng)建基于圖像的可回流文件的計算機實施的方法、系統(tǒng)和其上具有編碼指令的計算機可訪問介質(zhì)?;趫D像的可回 流文件被配置為自動進行自我調(diào)整以顯現(xiàn)在各種輸出介質(zhì)上,所述輸 出介質(zhì)例如是各種大小的顯示器和窗口、印刷介質(zhì)等。更具體地講, 基于圖像的可回流文件允許回流對象的各行根據(jù)所選擇的輸出介質(zhì) 的給定尺寸和限制,諸如顯示器或窗口的大小來回流。應(yīng)該理解,在 本發(fā)明的上下文中,術(shù)語"回流對象"包括可用于表示圖像中的信息的 一個或多個字母、字符、符號、數(shù)字、公式、圖形、線條畫、表格邊 框、文本內(nèi)容等的選擇。在示出的實施例中,可將可識別的內(nèi)容,諸 如單詞表示為單個回流對象?;蛘撸部蓪⒖勺R別的內(nèi)容表示為許多 個回流對象。如上所述,回流涉及對回流對象的行分割的1務(wù)改。
以下的詳細描述提供本發(fā)明的示例性實施方案。雖然示出了特定 的系統(tǒng)配置和流程圖,但是應(yīng)該理解,所提供的例子不是窮舉的,不 限于所公開的精確形式。計算機和數(shù)字成像領(lǐng)域中的普通技術(shù)人員將 會理解這里所描述的部件和方法步驟,這些部件和方法步驟可與其它 部件或步驟或者部件或步驟的組合互換,但仍可實現(xiàn)本發(fā)明的利益和 優(yōu)點。還應(yīng)該理解,主要在可由常規(guī)計算機部件執(zhí)行的邏輯和操作等 方面給出以下描述。這些計算機部件可分組在單個位置中或者分布在 很廣的區(qū)域上,它們通常包括計算機處理器、存儲器存儲裝置、顯示 裝置、輸入裝置等。在計算機部件分布式存在的狀況下,這些計算機 部件可經(jīng)由通信鏈接相互訪問。
在以下描述中,為了提供本發(fā)明的透徹理解,闡述了許多具體的 細節(jié)。然而,本領(lǐng)域的技術(shù)人員將清楚的是,可在沒有這些具體細節(jié) 中的一些細節(jié)或所有細節(jié)的情況下實施本發(fā)明。在其它例子中,為了 避免不必要地模糊本發(fā)明,不對公知的方法步驟進行詳細描述。
圖l提供可實施本發(fā)明的實施例的一個計算環(huán)境的示例性總圖。
所描繪的環(huán)境包括通過網(wǎng)絡(luò)16例如互聯(lián)網(wǎng)在通信上連接的可回流文 件產(chǎn)生服務(wù)器10和客戶端系統(tǒng)12??蛻舳讼到y(tǒng)12被顯示為與用戶 18相關(guān)聯(lián)。如圖1中還描繪的,可回流文件產(chǎn)生服務(wù)器10包括基于 圖像的可回流文件數(shù)據(jù)庫19,或者與基于圖像的可回流文件數(shù)據(jù)庫19通信。在示出的實施例中,客戶端系統(tǒng)12被配置為經(jīng)由網(wǎng)絡(luò)16從 可回流文件產(chǎn)生服務(wù)器10接收一個或多個基于圖像的可回流文件并 在輸出介質(zhì)例如顯示器屏幕上顯現(xiàn)它們。在示出的實施例中,合適的 閱覽器(比如,Web瀏覽器)應(yīng)用程序在客戶端系統(tǒng)12上運行,以 使它在計算機顯示器上顯現(xiàn)基于圖像的可回流文件。
圖1中的網(wǎng)絡(luò)16可以是局域網(wǎng)("LAN,,)、諸如廣域網(wǎng)("WAN,,) 的更大的網(wǎng)絡(luò)或者諸如互聯(lián)網(wǎng)的網(wǎng)絡(luò)集合。網(wǎng)絡(luò)通信協(xié)議,諸如 TCP/IP對計算機網(wǎng)絡(luò)領(lǐng)域中的技術(shù)人員是公知的。這里將本發(fā)明描 述為使用互聯(lián)網(wǎng)。本領(lǐng)域的普通技術(shù)人員將認識到,還可在其它交互 式環(huán)境中使用本發(fā)明,所述交互式環(huán)境例如是連接存儲相關(guān)文檔和相 關(guān)聯(lián)的文件、腳本和數(shù)據(jù)庫的服務(wù)器的局域網(wǎng)或廣域網(wǎng),或者包括可 訪問音頻或視頻文件、文檔、腳本、數(shù)據(jù)庫等的機頂區(qū)或其它信息家 電的廣播通信網(wǎng)絡(luò)。
圖2A和圖2B描繪用于圖1中顯示的可回流文件產(chǎn)生服務(wù)器10 和客戶端系統(tǒng)12的示例性計算機體系結(jié)構(gòu)。用于可回流文件產(chǎn)生服 務(wù)器10 (圖2A)和客戶端系統(tǒng)12 (圖2B)的示例性計算機體系結(jié)構(gòu) 可用于實現(xiàn)本發(fā)明的一個或多個實施例。當(dāng)然,本領(lǐng)域的技術(shù)人員將 意識到,可回流文件產(chǎn)生服務(wù)器10以及客戶端系統(tǒng)12可包括比圖2A 和圖2B中顯示的部件更多或更少的部件。
圖2A中的可回流文件產(chǎn)生服務(wù)器IO使用網(wǎng)絡(luò)接口 20連接至網(wǎng) 絡(luò)16 (圖1)。網(wǎng)絡(luò)接口 20使得可回流文件產(chǎn)生服務(wù)器10能夠經(jīng)由 計算機網(wǎng)絡(luò)16收發(fā)數(shù)據(jù)、控制信號、數(shù)據(jù)請求和其它信息。例如, 可回流文件產(chǎn)生服務(wù)器10可經(jīng)由網(wǎng)絡(luò)接口 20從網(wǎng)絡(luò)16接收包含其 中具有回流對象的數(shù)字內(nèi)容圖像的文件。
可回流文件產(chǎn)生服務(wù)器10還包括處理器21、存儲器22、計算機 可讀介質(zhì)驅(qū)動器25 (比如,硬盤驅(qū)動器)和輸入/輸出接口 26,所有 這些都在通信上彼此連接,并通過通信總線28連接至網(wǎng)絡(luò)接口 20。 顯示裝置24可以是典型的顯示裝置,諸如計算機顯示器(比如,CRT 或LCD屏幕)、電視機屏幕等。輸入/輸出接口 26被配置為與一個或多個外部裝置例如輸入裝置27通信,以捕捉其中具有文本的內(nèi)容圖 像。輸入裝置27可以是能夠捕捉圖像的任何裝置,包括但不限于 攝像機、掃描儀、數(shù)碼相機、復(fù)印機、掃描筆等。輸入/輸出接口 26 還可被配置為與一個或多個外部輸出裝置例如顯示器適配器23通信。 顯示器適配器23向顯示裝置24提供使用戶能夠觀察可回流文件產(chǎn)生 服務(wù)器10并與可回流文件產(chǎn)生服務(wù)器10交互的信號。另外,輸入/ 輸出接口 26還可被配置為與各種打印適配器(未顯示)通信以在打 印介質(zhì)上顯現(xiàn)可回流文件。輸入/輸出接口 26還可與圖2A中未顯示 的外部裝置通信,諸如用戶可操作的鼠標(biāo)、鍵盤、筆或其它裝置。
處理器21被配置為根據(jù)存儲在存儲器例如存儲器22中的計算機 程序指令操作。程序指令也可以表現(xiàn)為硬件格式,例如編程的數(shù)字信 號處理器。此外,存儲器22可被配置為存儲其中具有回流對象的數(shù) 字內(nèi)容圖像以根據(jù)本發(fā)明進行處理、傳輸和顯示。
存儲器22通常包括RAM、 ROM和/或永久存儲器。存儲器22 存儲用于控制可回流文件產(chǎn)生服務(wù)器10的一般操作的操作系統(tǒng)29。 操作系統(tǒng)29可以是通用操作系統(tǒng),諸如Microsoft⑧操作系統(tǒng)、UNIX 操作系統(tǒng)或Linux⑧操作系統(tǒng)。存儲器22還存儲光學(xué)字符識別(OCR ) 應(yīng)用程序30,其包括被設(shè)計用于分析其中包含回流對象的數(shù)字圖像的 程序代碼和數(shù)據(jù)。本領(lǐng)域的普通技術(shù)人員將會認識到能夠分析和識別 圖像中的回流對象的各種算法和技術(shù)。然而,為了本發(fā)明的目的,如 許多OCR例程實現(xiàn)的那樣,算法和技術(shù)實際識別各個字符或符號或 者解釋它們的意義不是必須的。相反,可使用類似OCR的處理過程, 其中有限的信息,例如數(shù)字圖像中的字符的基線及位置和大小被確 定。如這里所使用的,術(shù)語"字符識別,,是指使用掃描儀和計算機算法 的所有形式的字符識別??缮虡I(yè)利用的OCR軟件的例子包括來自 ScanSoft Inc.的OmniPage Prc)TM和來自SmartLink Corporation的 FineReader .存儲器22另外存儲提供可回流文件產(chǎn)生應(yīng)用程序31 的程序代碼和數(shù)據(jù)??苫亓魑募a(chǎn)生應(yīng)用程序31包含用于處理經(jīng)由 網(wǎng)絡(luò)接口 20、輸入/輸出接口 26等接收的數(shù)字圖像,以產(chǎn)生基于圖像的可回流文件,然后可將該基于圖像的可回流文件發(fā)送到基于圖像的
可回流文件數(shù)據(jù)庫19進行存儲的程序代碼和數(shù)據(jù)。
圖2B描繪用于圖1中顯示的客戶端系統(tǒng)12的示例性計算機體 系結(jié)構(gòu)。圖2B中的客戶端系統(tǒng)12包括可與以上關(guān)于可回流文件產(chǎn)生 服務(wù)器10描述的相同名稱的部件類似地操作的幾個部件??蛻舳讼?統(tǒng)12包括與存儲器33通信的處理器32、與顯示裝置35耦合的顯示 器適配器34、計算機可讀介質(zhì)驅(qū)動器36、與輸入裝置38耦合的輸入 /輸出接口 37和網(wǎng)絡(luò)接口 39,所有這些通過總線40在通信上連接。
如所示,存儲器33存儲控制客戶端系統(tǒng)12的一般操作的操作系 統(tǒng)41。存儲器另外存儲瀏覽器程序42,諸如Web瀏覽器程序。根據(jù) 本發(fā)明的各種示例性實施例,不管顯示裝置35的具體大小如何,與 瀏覽器程序42和顯示器適配器34連接的處理器32都自適應(yīng)地在顯 示裝置35上顯現(xiàn)基于圖像的可回流文件。在本說明書中,可互換使 用術(shù)語"顯示器,,和術(shù)語"窗口",此外,術(shù)語"顯示器"可用于涵蓋顯示 器(或屏幕)和窗口二者。
圖3A是顯示其中具有回流對象的內(nèi)容的數(shù)字頁面圖像的屏幕顯 示器的示意圖。具體地講,圖3A示出正運行瀏覽器程序42的計算裝 置例如客戶端系統(tǒng)12的顯示器(或窗口 ) 43。在示出的例子中,顯 示器43顯示圖書中的完整一頁的圖像。瀏覽器程序42還顯示各種可 選控制,例如允許用戶通篇瀏覽正顯示的內(nèi)容頁面的"前一頁"44和 "后一頁,,45,以及允許用戶在顯示器43內(nèi)向上或向下滾動內(nèi)容的滾 動條46。
圖3B的不同構(gòu)造描繪也可正運行瀏覽器程序47的計算裝置的 屏幕顯示器。與圖3A中的顯示器43相比,圖3B中的顯示器48的高 度尺寸和寬度尺寸都d、一些。根據(jù)本發(fā)明,可自適應(yīng)地在各種大小的 顯示器和窗口上顯現(xiàn)基于圖像的可回流文件。在圖3B中,例如,與 圖3A的顯示器43中的回流對象相同的回流對象(例如文本內(nèi)容)被 自動"回流",并被顯現(xiàn)在更小的顯示器48上。具體地講,圖3A的原 始顯示器43中的第一行包括"Growingupin Vinci",其被回流,從而僅有"Growing up in,,部分出現(xiàn)在更小的顯示器48中的第一行中,而 "Vinci"移到更小的顯示器48的第二行的開頭。由于顯示器48比圖 3A的原始顯示器43小,所以瀏覽器程序47優(yōu)選地還可包括滾動條 49以允許用戶在更小的顯示器48內(nèi)向上和向下滾動內(nèi)容以便看到在 圖3A的原始顯示器43中所包括的整個文本內(nèi)容。
圖3C描繪顯示器(窗口 ) 48,,相對來說,顯示器(窗口 ) 48, 與圖3B的顯示器48的大小相同,但是以更大的比例顯示與圖3B的 顯示器48中的文本內(nèi)容相同的文本內(nèi)容。例如,用戶可選擇放大"+" 控制按鈕50以放大先前在圖3B的顯示器48中顯示的顯示內(nèi)容。然 后,在圖3C中,現(xiàn)在,皮放大的與圖3B的顯示器48中的回流對象相 同的回流對象被自動回流,并被以放大比例顯現(xiàn)在顯示器48,上。具 體地講,圖3B的顯示器48中的第一行包括"Growing up in",其被放 大并被回流,從而現(xiàn)在僅有放大的"Growing"部分出現(xiàn)在顯示器48, 的第一行中,而類似地,放大的"up in"移到顯示器48,的第二行。與 前一樣,滾動條49可用于允許用戶在顯示器48,內(nèi)向上和向下滾動內(nèi) 容以看到在圖3A的原始顯示器43中所包括的整個文本內(nèi)容。
圖3D描繪可實施的本發(fā)明的另一實施例。具體地講,圖3D示 出包括第一顯示器(窗口 ) 52和第二顯示器(窗口 ) 54的瀏覽器程 序42。在本發(fā)明的各種示例性實施例中,兩個顯示器52和54能夠獨 立地回流其中包含的回流對象。例如,圖3D中的第一顯示器52的大 小與圖3A的原始顯示器43相同,因而顯示與原始顯示器43相同的 文本內(nèi)容。第二顯示器54顯示與第一顯示器52不同的文本內(nèi)容部分, 此外,與第一顯示器52中顯示的比例相比,第二顯示器54還以不同 的比例顯示。這是響應(yīng)于例如放大第二顯示器S2中示出的顯示文本 內(nèi)容的用戶請求而顯現(xiàn)與不同的文本內(nèi)容對應(yīng)的回流對象的結(jié)果。
圖4A描繪根據(jù)本發(fā)明的一個實施例的通過用于產(chǎn)生基于圖像的 可回流文件的可回流文件產(chǎn)生應(yīng)用程序31實現(xiàn)的示例性方法70。方 法70在塊71通過接收其中具有一個或多個回流對象的內(nèi)容圖像開 始。接收圖像的格式可以改變,可包括可存取格式的圖像或者非可存取格式的圖像,所述可存取格式諸如Adobe⑧便攜式文檔文件(PDF ), 所述非可存取格式諸如JPEG、 TIFF、 GIF或BMP格式文件。在示 出的實施例中,圖像可對應(yīng)于打印材料的掃描圖像?;蛘撸瑘D像可對 應(yīng)于通過各種軟件應(yīng)用程序產(chǎn)生或者通過第三方軟件部件轉(zhuǎn)換的電 子文檔。
接收的圖像可隱含地與"原始"顯示器大小相關(guān)聯(lián)。例如,如以上 圖3A中所示,通常期望以與頁面圖像在原始打印件中出現(xiàn)時相同的 格式顯示該頁面圖像,以便保持內(nèi)容的原始打印版本的原始"外觀和 感覺"。這里所使用的原始顯示器大小是指能夠以與內(nèi)容的原始打印 版本相同的格式顯現(xiàn)頁面圖像的顯示器的大小。
在塊72,可回流文件產(chǎn)生應(yīng)用程序31確定內(nèi)容圖像中的每個回 流對象的邊界區(qū)域。在示出的實施例中,每個回流對象的邊界區(qū)域可 對應(yīng)于各種幾何形狀,包括但不限于,矩形、圓形、曲線、橢圓、三 角形和更復(fù)雜的多邊形形狀。可回流文件產(chǎn)生應(yīng)用程序31可基于許 多因素選擇邊界區(qū)域形狀,所述因素例如是輸出介質(zhì)的類型、所選擇 的輸出介質(zhì)的特定屬性和/或某些回流對象的特定屬性。例如,可回流 文件產(chǎn)生應(yīng)用程序31可與打印介質(zhì)完全不同地為計算機顯示器選擇 不同的邊界區(qū)域。在另一例子中,可回流文件產(chǎn)生應(yīng)用程序31可與 橢圓形狀顯示屏幕完全不同地為矩形形狀顯示屏幕選擇不同的邊界 區(qū)域。在另一例子中,可回流文件產(chǎn)生應(yīng)用程序31可為可與特定間 隔和/或格式化相關(guān)聯(lián)的相關(guān)回流對象選擇互補邊界區(qū)域,所述相關(guān)回 流對象例如是與帶連字符的單詞的各部分相對應(yīng)的回流對象。
在塊73,可回流文件產(chǎn)生應(yīng)用程序31識別圖像中的每個回流對 象的回流對象基線。然后,在塊74,可回流文件產(chǎn)生應(yīng)用程序31確 定每個邊界區(qū)域相對于最初接收的圖像的位置以及相對于其對應(yīng)的 回流對象基線的位置。在塊75,確定每個邊界區(qū)域的大小。在示出的 實施例中,可回流文件產(chǎn)生應(yīng)用程序31可利用各種數(shù)學(xué)模塊來確定 邊界區(qū)域大小。另外參考圖5和圖6A-6E,將更詳細地描述邊界區(qū) 域、回流對象基線和每個邊界區(qū)域的位置和大小的概念。在圖5中,對于接收的文本內(nèi)容90,找到四個"每行,,基線91, 它們與將在下面詳細描述的回流對象基線不同。通常,發(fā)現(xiàn)每行基線 與在輸出介質(zhì)(比如,顯示器)上的一行中出現(xiàn)的大多數(shù)回流對象的 底線一致,另外發(fā)現(xiàn)回流對象基線與在單個回流對象中出現(xiàn)的大多數(shù) 字符的底線一致。仍參考圖5,在第一每行基線91上,發(fā)現(xiàn)以不同大 小的矩形形狀92 - 95為形式的邊界區(qū)域分別用于包含回流對象 "Growing"、 "up"、 "in"和"Vinci"。在示出的實施例中,發(fā)現(xiàn)邊界區(qū) 域?qū)⒚總€回流對象中環(huán)繞的相關(guān)文本字符綁定在一起??墒褂么鎯υ?br>
可回流文件產(chǎn)生服務(wù)器10 (圖2A)的存儲器22中的合適的OCR或 類似于OCR的軟件程序容易地找到每行基線和邊界區(qū)域二者。
然而,如圖6A所示,通過OCR或類似于OCR的軟件確定的每 行基線通常是斜的(例如,由于傾斜的掃描圖像而導(dǎo)致),從而不會 正確地與文本行中出現(xiàn)的大多數(shù)字符的底線一致。在圖6A中,線100 表示文本"The quick brown fox"的真實的每行基線,而線102表示通 過OCR或類似于OCR的軟件確定的錯誤的每行基線。OCR確定的 每行基線102相對于真實的每行基線100稍微傾斜。在示出的例子中, OCK確定的每行基線102在最左單詞"The"的真實的每行基線100的 上方,而在最右單詞"fox"的真實的每行基線100的下方。因此,如圖 6B所示,如果這樣的OCR確定的錯誤的每行基線用于在單行中顯現(xiàn) 分別具有真實的每行基線100和100,的多個文本行,則顯現(xiàn)的文本不 會沿水平線準(zhǔn)確地對齊。因此,OCR確定的每行基線不能可靠地用 于估計真實的"回流對象"基線,真實的"回流對象"基線通常與在回流
對象中出現(xiàn)的大多數(shù)字符的底線一致。
如圖6C所示,OCR或類似于OCR的軟件還可識別"每字符,,基 線104a-104d。通常,發(fā)現(xiàn)每字符基線與單個字符例如大寫字母的底 線一致。然而,如圖6C所示,OCR確定的每字符基線104a-104d 典型地沿包括多個回流對象的行具有大量跳動。因此,雖然在任何給 定行上的字符的每字符基線可以平均為OCR確定的每行基線,但是 變化(或跳動)量太大以至于不能用于估計真實的"回流對象,,基線。根據(jù)本發(fā)明的各種示例性實施例,基于找到以下擬合函數(shù)來識別
真實的回流對象基線該擬合函數(shù)以最小平均誤差平滑地估計沿包括 多個回流對象的一行中的每個每字符基線的位置??墒褂萌魏螖M合函 數(shù),包括但不限于,線性或多項式回歸。然后,通過將每個回流對象 上的平均值插入到擬合函數(shù)中,擬合函數(shù)可被用于識別沿所述行的每 個回流對象的基本真實的回流對象基線。例如,如果找到擬合函數(shù)為 _V = 0.3x + 1200 ,并且沿一行存在四個回流對象,其水平中心點分別在 義=500、 1200、 1900和2600,則可計算這四個回流對象沿垂直軸少的 回流對象基線值分別為少=1350、 1560、 1770和1980。根據(jù)擬合函數(shù) 計算出的^值找到沿一行的回流對象的回流對象基線,其中,找到的 每條回流對象基線具有相對于其真實的每行基線的對應(yīng)部分的最小 誤差量(距離)。
圖6D示出使用根據(jù)本發(fā)明的方法的擬合函數(shù)而找到的分別關(guān)于 四個回流對象,"The"、 "quick"、 "brown,,和"fox,,的四個"回流對象" 基線106a、 106b、 106c和106d。如所示,每條回流對象基線106a-106d與真實的每行基線100緊密匹配,因而與它在真實的每行基線 IOO上的對應(yīng)部分(即,它的真實"回流對象,,基線)緊密匹配。
圖6E示出通過將以上確定的每條回流對象基線106a - 16d與水 平線104對齊而在顯示器上的水平線104上顯現(xiàn)的四個回流對象。如 所示,當(dāng)通過將所有四個回流對象的對應(yīng)的回流對象基線106a- 106d 與水平線104對齊而在水平線104上顯現(xiàn)這四個回流對象時,這四個 回流對象看起來4艮好。與在如圖6A和圖6B中顯示的線的兩端發(fā)生的 所有誤差相對照,由于由原始圖像的任何傾斜而引起的誤差分布在整 行回流對象上,所以根據(jù)本發(fā)明的方法,這樣的良好的顯現(xiàn)是可能的。
在極度跳動的情況下,可通過以下方式進一 步改進找到回流對象 的回流對象基線的方法,即,通過首先找到擬合函數(shù),然后找到所有 字母(字符)與該擬合函數(shù)間的距離的標(biāo)準(zhǔn)偏差,并找到在該原始擬 合函數(shù)的一個標(biāo)準(zhǔn)偏差內(nèi)最逼近所有字母的擬合函數(shù)。擬合函數(shù)技術(shù) 不考慮上標(biāo)、下標(biāo)、腳注指示符、數(shù)學(xué)符號、連字符和其它類似的不符合基線的字母和符號,從而使得確定的回流對象基線更接近真實的
每行基線100。
返回來參考圖5,可相對于原始圖像確定每個邊界區(qū)域92-95 的位置,例如,根據(jù)邊界區(qū)域的一個或多個角點坐標(biāo)來確定。此外, 可根據(jù)從回流對象基線(與圖5中的每行基線91 一致)到邊界區(qū)域 (見邊界區(qū)域92 )的底側(cè)的偏移距離"B,,來定義每個邊界區(qū)域相對于 其對應(yīng)的回流對象基線的位置。此外,在示出的例子中,由于每個邊 界區(qū)域為矩形形狀,所以可根據(jù)邊界區(qū)域的高度"H,,和寬度"W"來定 義每個邊界區(qū)域的大小??墒褂迷诳臻g維度上擴展的合適的測量單位 來確定邊界區(qū)域的位置和大小(比如,高度和寬度),所述測量單位 諸如英寸、厘米、像素數(shù)量等。
返回來參考圖4A,在塊76,可回流文件產(chǎn)生應(yīng)用程序31存儲 每個邊界區(qū)域的位置和大小,從而形成基于圖像的可回流文件。具體 地講,將每個邊界區(qū)域的位置與每個邊界區(qū)域的大'j、一起存儲,所述 每個邊界區(qū)域的位置為相對于原始顯示圖像(或者原始顯示器大小) 的例如根據(jù)X-Y坐標(biāo)定義的位置和相對于其對應(yīng)的回流對象基線的 例如根據(jù)圖5中所示的偏移距離"B,,定義的位置??梢砸詾榇鎯D像 數(shù)據(jù)而開發(fā)的許多計算機可讀格式中的任何一種格式存儲所述文件, 所述格式包括但不限于,JPEG、 TIFF、 GIF和BMP格式。在可替 換的實施例中,可回流文件產(chǎn)生應(yīng)用程序31可將可回流文件直接輸 出到另一計算裝置或基于網(wǎng)絡(luò)的目的地。
本領(lǐng)域的技術(shù)人員應(yīng)該意識到,定義每個邊界區(qū)域的位置和大小 的各種方法是可能的。例如,可如上所述通過使用每個邊界區(qū)域的寬 度和高度明確地定義每個邊界區(qū)域的大小,或者可通過使用代表大小 的數(shù)學(xué)公式,諸如基于矢量的公式隱含地定義每個邊界區(qū)域的大小。 可絕對地定義每個邊界區(qū)域相對于原始圖像或原始顯示器大小的位 置,例如,根據(jù)X-Y坐標(biāo)絕對地定義每個邊界區(qū)域相對于原始圖像或 原始顯示器大小的位置,或者相對于相鄰的邊界區(qū)域的位置(比如, 緊靠前的邊界區(qū)域的位置)相對地定義每個邊界區(qū)域相對于原始圖像或原始顯示大小的位置。
圖4B描繪用于顯現(xiàn)根據(jù)本發(fā)明創(chuàng)建的基于圖像的可回流文件的 客戶端系統(tǒng)12的存儲器33中的瀏覽器程序42可實現(xiàn)的示例性方法 80。如前所述,在示出的實施例中,可在輸出介質(zhì)上,諸如在任何給 定大小的顯示器或窗口 ,比如客戶端系統(tǒng)12的顯示裝置35上顯現(xiàn)可 回流文件。另外,可在諸如打印介質(zhì)的其它輸出介質(zhì)上顯現(xiàn)可回流文 件。方法80在塊81通過接收基于圖像的可回流文件開始。在基于圖 像的可回流文件中,圖像中包含的每個回流對象形成子圖像,并被限 定在邊界區(qū)域中。此外,在可回流文件中定義每個邊界區(qū)域的大小和 位置。此外,可定義每個回流對象的回流對象基線。
在塊82,瀏覽器程序42確定將顯現(xiàn)可回流文件的輸出介質(zhì)的大 小??筛鶕?jù)輸出介質(zhì)的形狀和尺寸,諸如顯示屏幕的形狀和尺寸來定 義顯示器大小。如果輸出介質(zhì)大小與用來創(chuàng)建基于圖像的可回流文件 的原始顯示器/窗口大小相同或者基本相同,則可使用在可回流文件中 定義的每個邊界區(qū)域的位置和大小來顯現(xiàn)可回流文件。另一方面,如 果輸出介質(zhì)大小小于、大于或者基本不同于原始顯示器/窗口大小,則 瀏覽器程序41可4吏可回流文件中的回流對象"回流"。
具體地講,在塊83,基于輸出介質(zhì)的水平尺寸和每個邊界區(qū)域 的大小確定在輸出介質(zhì)中的多條水平線的每一條上水平擬合的邊界 區(qū)域的數(shù)量,其中在相鄰的邊界區(qū)域之間具有最小間隔。例如,在給 定顯示器/窗口的水平尺寸和每個邊界區(qū)域的寬度尺寸的情況下,可確 定在顯示器中的每條水平線上將有多少個邊界區(qū)域水平擬合。在示出 的實施例中,瀏覽器程序42可在具有互補邊界區(qū)域的兩個回流對象 (比如,與帶有連字符的單詞對應(yīng)的回流對象)之間關(guān)聯(lián)不那么水平 的距離。在塊84,確定每個邊界區(qū)域相對于每條水平線的水平位置。 例如,可確定邊界區(qū)域的一個或多個角沿每條水平線的水平坐標(biāo)(比 如,x值)。
在塊85,瀏覽器程序41基于邊界區(qū)域的大小確定在每條水平線 上水平擬合的每個邊界區(qū)域的垂直位置。例如,在給定顯示器/窗口的垂直尺寸和每個邊界區(qū)域的高度尺寸的情況下,瀏覽器程序41可確 定如何在垂直方向上一致地分隔沿顯示器上的多條水平線水平擬合 的邊界區(qū)域。作為另一具體例子,這可通過以下方式來實現(xiàn)首先基 于顯示器的大小確定顯示器上的多條水平線的每條的垂直位置(比 如,通過將顯示器的垂直尺寸除以最小間隔),并確定每個邊界區(qū)域 的垂直位置,以使邊界區(qū)域的回流對象基線與對應(yīng)的水平線對齊???預(yù)先定義顯示器上的多條水平線之間的最小間隔,以確保被顯現(xiàn)內(nèi)容 的最小尺寸是可辨認的。作為另一例子,可將顯示器/窗口的垂直尺寸 除以與原始顯示器/窗口相同的間隔,以保持原始內(nèi)容的相同外觀和感 覺。在另外的實施例中,瀏覽器程序41還可考慮輸出介質(zhì)的可不顯 現(xiàn)內(nèi)容的某些部分。此外,瀏覽器程序41還可考慮可能不適當(dāng)作為 回流內(nèi)容的任何內(nèi)容,諸如圖表、圖形、圖片、插圖、數(shù)學(xué)方程、軟 件代碼列表、詩歌、頁眉/頁腳等。
最后,在塊86,根據(jù)確定的邊界區(qū)域的水平位置和垂直位置顯 現(xiàn)邊界區(qū)域,從而顯現(xiàn)其中包含的回流對象。
在各種示例性的實施例中,可沿顯示器上的每條水平線使邊界區(qū) 域?qū)R,從而使其中包含的回流對象對齊。具體地講,在找到每條水 平線上水平擬合的邊界區(qū)域的數(shù)量之后,在相鄰的邊界區(qū)域之間具有 最小間隔的情況下,如果沿水平線存在剩余空間,則可適當(dāng)?shù)胤植际?余空間。例如,在向右對齊的情況下,可從水平線的末端(比如,最 右部分)去除剩余空間,并將其插在該水平線的開頭、在該水平線上 出現(xiàn)的第一個(比如,最左)回流對象(或邊界區(qū)域)之前。在居中 對齊的情況下,可從水平線的末端去除剩余空間的一半,并將其插在 水平線的開頭。在全部對齊的情況下,可將剩余空間除以水平線上出 現(xiàn)的相鄰回流對象之間的間隔的數(shù)量(即,比水平線上的回流對象的 數(shù)量少l個),并可將獲得的商數(shù)間隔插在相鄰回流對象之間的每個 間隔中。
仍參考圖4B,在本發(fā)明的另一實施例中,提供用于根據(jù)用戶(讀 者)所請求的縮放級別在顯示器/窗口上顯現(xiàn)基于圖像的可回流文件的方法。首先,在塊82,連同用戶所請求的縮放(或重調(diào)大小)級別確 定輸出介質(zhì)的大小。在塊83,根據(jù)所請求的縮放級別(比如,放大或 縮小)重新調(diào)整邊界區(qū)域的大小,并確定多條水平線的每條水平線上 水平擬合的重調(diào)大小的邊界區(qū)域的數(shù)量。例如,如果請求放大,則放
大每個邊界區(qū)域的大小,從而更少數(shù)量的邊界區(qū)域?qū)⒃诿織l水平線上 水平擬合。另一方面,如果請求縮小,則使每個邊界區(qū)域的尺寸變小, 從而更多的邊界區(qū)域?qū)⒃诿織l水平線上水平擬合。在示出的實施例 中,瀏覽器應(yīng)用程序41可直接與縮放級別的改變成比例地調(diào)整邊界 區(qū)域的大小?;蛘?,瀏覽器程序41可限制邊界區(qū)域的調(diào)整和/或?qū)⒉?同的比例應(yīng)用于邊界區(qū)域調(diào)整。
在塊84,相對于水平線確定每個重調(diào)尺寸的邊界區(qū)域的水平位 置。在塊85,確定每個重調(diào)尺寸的邊界區(qū)域的垂直位置。例如,如果 用戶請求放大在顯示器/窗口中顯示的文本(比如,回流對象),則放 大邊界區(qū)域,因此,顯示器上的水平線可被與所請求的放大級別成比 例地進一步分隔,以容納放大的邊界區(qū)域。如果用戶請求縮小,則與
所請求的縮小級別成比例地壓縮水平線(比如,布置得更靠近)。
最后,在塊86,根椐確定的重調(diào)尺寸的邊界區(qū)域的水平位置和
垂直位置在輸出介質(zhì)上顯現(xiàn)放大的邊界區(qū)域,因而顯現(xiàn)在放大的邊界
區(qū)域中限定的回流對象的子圖像。
盡管已示出和描述了本發(fā)明的說明性實施例,但是將意識到,可
在不脫離本發(fā)明的精神和范圍的情況下,在其中進行各種改變。
權(quán)利要求
1、一種用于處理數(shù)字圖像文件的系統(tǒng),包括數(shù)據(jù)存儲部分,用于存儲數(shù)字圖像文件;和與該數(shù)據(jù)存儲部分通信的計算裝置,該計算裝置檢索數(shù)字圖像;識別所述數(shù)字圖像中的一個或多個回流對象;識別每個回流對象的回流對象基線;識別回流對象的多邊形形狀的邊界區(qū)域;確定每個邊界區(qū)域的大??;確定每個邊界區(qū)域相對于所述圖像以及相對于其對應(yīng)的回流對象基線的位置;產(chǎn)生基于圖像的可回流文件,該基于圖像的可回流文件包括回流對象基線和每個邊界區(qū)域的大小和位置;將產(chǎn)生的基于圖像的可回流文件存儲在所述數(shù)據(jù)存儲部分中;以及在計算機顯示器上顯現(xiàn)所述基于圖像的可回流文件。
2、 根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述數(shù)字圖像對應(yīng)于打 印的文本內(nèi)容的掃描圖像。
3、 根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述一個或多個回流對 象中的至少一個對應(yīng)于文本內(nèi)容的單詞。
4、 一種用于處理數(shù)字圖像文件的計算機實施的方法,該方法包括獲得要處理的圖像;識別所述圖像中的回流對象;識別回流對象的邊界區(qū)域;識別每個回流對象的回流對象基線;確定包含回流對象的每一個邊界區(qū)域相對于所述圖像以及相對 于其對應(yīng)的回流對象基線的位置;確定每個邊界區(qū)域的大??;和 存儲每個邊界區(qū)域的大小和位置。
5、 根據(jù)權(quán)利要求4所述的計算機實施的方法,其中,所述邊界 區(qū)域?qū)?yīng)于幾何形狀。
6、 根據(jù)權(quán)利要求4所述的計算機實施的方法,其中,所迷幾何 形狀為矩形,并且其中,用每個邊界區(qū)域的寬度和高度來定義該邊界 區(qū)域的大小。
7、 根據(jù)權(quán)利要求4所述的計算機實施的方法,其中,用每個邊 界區(qū)域的至少一個角點的坐標(biāo)來定義該邊界區(qū)域相對于所述圖像的 位置,用距回流對象基線的偏移來定義每個邊界區(qū)域相對于其對應(yīng)的 回流對象基線的位置。
8、 根據(jù)權(quán)利要求4所述的計算機實施的方法,其中,識別每個 回流對象的回流對象基線還包括識別在一行中出現(xiàn)的每個回流對象中表示的每個字符的每字符基線;,和、'—。、,, ,'、,回流對象的回流對象基線。
9、 根據(jù)權(quán)利要求8所述的計算機實施的方法,其中,組合在該 行中出現(xiàn)的回流對象中包括的每字符基線包括找到擬合函數(shù),該擬合函數(shù)以最小平均誤差平滑地估計每個每字 符基線的位置;和將每個回流對象的平均值輸入到該擬合函數(shù)。
10、 根據(jù)權(quán)利要求4所述的計算機實施的方法,其中,每個回流 對象形成子圖像,并被限定在邊界區(qū)域中,每個邊界區(qū)域的大小和位 置被定義,所述方法還包括確定輸出介質(zhì)的大小;基于每個邊界區(qū)域的大小確定在具有輸出介質(zhì)的水平尺寸的多 條水平線的每一條上水平擬合的邊界區(qū)域的數(shù)量;基于邊界區(qū)域的大小確定每個邊界區(qū)域相對于每條水平線的水平位置;基于邊界區(qū)域的大小確定每條水平線上水平擬合的每個邊界區(qū)域的垂直位置;和根據(jù)確定的邊界區(qū)域的水平位置和垂直位置顯現(xiàn)在邊界區(qū)域中 限定的回流對象。
11、 根據(jù)權(quán)利要求10所述的計算機實施的方法,其中,所述輸出介質(zhì)為顯示器,并且其中,根據(jù)顯示器的垂直尺寸和水平尺寸來定 義輸出介質(zhì)的尺寸。
12、 根據(jù)權(quán)利要求10所述的計算機實施的方法,其中,所述多 條水平線的每一條上水平擬合的邊界區(qū)域的數(shù)量相同。
13、 根據(jù)權(quán)利要求10所述的計算機實施的方法,其中,所述多 條水平線的每一條上水平擬合的邊界區(qū)域的數(shù)量不同。
14、 根據(jù)權(quán)利要求10所述的計算機實施的方法,其中,確定每 個邊界區(qū)域相對于每條水平線的水平位置還包括逐條水平線地在水 平方向上調(diào)整邊界區(qū)域的水平位置。
15、 根據(jù)權(quán)利要求10所述的計算機實施的方法,其中,為每個 回流對象定義回流對象基線,并且其中,基于邊界區(qū)域的大小確定每 條水平線上水平擬合的每個邊界區(qū)域的垂直位置的步驟還包括基于顯示器的大小確定每條水平線的垂直位置;和 確定每條水平線上水平擬合的每個邊界區(qū)域的垂直位置,以使在 邊界區(qū)域中限定的回流對象的回流對象基線與對應(yīng)的水平線對齊。
16、 根據(jù)權(quán)利要求14所述的計算機實施的方法,其中,基于顯 示器的大小確定每條水平線的垂直位置包括將顯示器的垂直尺寸除 以最小間隔。
17、 根據(jù)權(quán)利要求10所述的計算機實施的方法,還包括 確定顯示縮放級別;根據(jù)顯示縮放級別重新調(diào)整邊界區(qū)域的大小,并確定在所述多條 水平線的每一條上水平擬合的重調(diào)大小的邊界區(qū)域的數(shù)量; 確定每個重調(diào)大小的邊界區(qū)域相對于水平線的水平位置;確定每條水平線上水平擬合的每個重調(diào)大小的邊界區(qū)域的垂直位置;和根據(jù)確定的重調(diào)大小的邊界區(qū)域的水平位置和垂直位置顯現(xiàn)在 重調(diào)大小的邊界區(qū)域中限定的回流對象。
18、 一種執(zhí)行如權(quán)利要求4-17之一所述的方法的計算機程序。
全文摘要
提供了一種計算機實施的、用于創(chuàng)建基于圖像的可回流文件的方法。基于圖像的可回流文件被配置為通過根據(jù)顯示器或窗口的給定大小允許回流對象的行“回流”而自動進行自我調(diào)整,以顯現(xiàn)在不同大小的顯示器或窗口上。該方法包括首先接收具有回流對象的內(nèi)容圖像,以及識別包圍圖像中所含的回流對象的邊界區(qū)域。然后識別每個回流對象的回流對象基線,并且確定包含回流對象的每個邊界區(qū)域相對于圖像以及相對于對應(yīng)的回流對象基線的位置。然后確定及存儲每個邊界區(qū)域的大小,例如寬度和高度。
文檔編號G09G5/00GK101536075SQ200780011599
公開日2009年9月16日 申請日期2007年3月22日 優(yōu)先權(quán)日2006年3月29日
發(fā)明者A·B·科索, F·Z·R·阿卡林, J·沙蓋姆, R·L·古德溫 申請人:亞馬遜科技公司