專利名稱:有效的嵌入式交互編碼的制作方法
技術領域:
本發(fā)明涉及使用數(shù)字筆與媒體的交互。更具體的說,本發(fā)明涉及在與一個或多個表面交互過程中測定數(shù)字筆的位置。
背景技術:
計算機用戶習慣于使用鼠標和鍵盤,并以此作為與個人計算機交互的方式。雖然個人計算機提供了許多與書寫文檔相比而言的優(yōu)點,但是絕大多數(shù)的用戶繼續(xù)使用打印紙張完成特定功能。某些這樣的功能包括對書寫文檔進行讀取和注釋。在注釋的情況下,由于用戶置于打印文檔上的注釋,使打印文檔承擔了更大的重要性。然而具有附加注釋的打印文檔的一個困難是接下來需要將注釋輸回到電子形式的文檔中。這需要原始用戶(original user)或另一個用戶辛苦的讀完注釋并將它們輸入到個人計算機中。在某些情況下,用戶將要在注釋和源文本中搜索,從而創(chuàng)建新的文檔。這些多重的步驟使使基予重復的在打印文檔和電子版本文檔之間的交互處理變得困難。進一步,掃描輸入的圖像通常是不可修改的??赡軟]有辦法將注釋從源文本中分離。這讓使用注釋變得困難了。因此,需要改進處理注釋的方法。
圖10中示出了一個圖像模式。Anoto筆(Anoto公司)使用該模式來測定一張紙上筆的位置。圖10中所示的模式很難做到容易地從該模式的任何部分定方位并測定其精確的旋轉。若旋轉的測定是基于該模式本身的解碼以發(fā)現(xiàn)在數(shù)據(jù)流中編碼的信息,則這個測定需要用于對該數(shù)據(jù)流本身進行解碼的有效處理來測定該模式的合適定方位。這種勞動密集型解密方法阻止了該模式的快速采用,這是由于只是定向圖像的俘獲部分(captured portion)就需要充分的硬件資源定向。除了短注釋,使用該模式的放縮變得很困難(例如,包含僅由手寫的大型文檔),這是由于每個涉及墨水筆畫的照相圖像可能需要在所有方位上全部進行處理,以測定該模式的合適方位。需要改進模式來表現(xiàn)數(shù)據(jù)流。
發(fā)明內容
本發(fā)明的特征為提供了至少對上述其中一個問題的解決方法,因此使我們能確定在觀測圖像上的一個或多個位置。該觀測圖像可在打印紙上,或者可在顯示的計算機圖像上。本發(fā)明的特征為包括由暗圖像(dark images)的行和列表現(xiàn)的編碼模式。該圖像可能整行或整列上連續(xù)、可能在行或列中交替變化、也可能在許多行或列中交替變化,及其它變化。
通過下列的附圖和相關聯(lián)的說明我們將了解本發(fā)明的這些和其它的特征。
當結合附圖閱讀時,能更好的理解本發(fā)明的前述概要,以及下面較佳實施例的詳細說明,該附圖是作為例子,而不是作為對于發(fā)明的權利要求的限制。
圖1示出了可結合本發(fā)明的實施例使用的計算機的通常說明。
圖2A到2E示出了依照本發(fā)明實施例的不同編碼系統(tǒng)。
圖3A到3D示出了與依照圖2A和2B的編碼系統(tǒng)相關聯(lián)的4個可能的合成頂點(resultant corners)[10]圖4示出了依照本發(fā)明實施例的俘獲圖像部分的旋轉。
圖5示出了結合圖2A到2E編碼系統(tǒng)使用的不同旋轉角度。
圖6A到6B示出了依照本發(fā)明的圖像俘獲系統(tǒng)和相應的俘獲圖像。
圖7示出了依照本發(fā)明的實施例測定俘獲圖像位置的方法。
圖8更詳細示出了依照本發(fā)明實施例,測定圖7的俘獲圖像位置的方法。
圖9示出了依照本發(fā)明實施例用于對數(shù)據(jù)進行編碼的過程。
圖10示出用于對文檔中空間進行編碼的傳統(tǒng)方法。
具體實施例方式發(fā)明的特征為涉及測定較大圖像的俘獲圖像的位置。該位置測定方法和這里說明的系統(tǒng)可結合多功能筆使用。
下文按副標題4個閱讀器(原文如此)被分隔。該副標題包括術語、通用計算機、計算機、圖像俘獲筆、位表示法、表示分析、位置測定、數(shù)據(jù)流編碼,和應用。
術語[19]任何筆可包括或不包括保存墨水能力的書寫工具。在某些例子中,可依照本發(fā)明實施例來使用無墨水容量的指示筆。
照相機-圖像俘獲系統(tǒng)。
通用計算機[21]圖1是可用來實現(xiàn)本發(fā)明各個方面的傳統(tǒng)通用數(shù)字計算環(huán)境例子的功能框圖。在圖1中,計算機100包括處理單元110,系統(tǒng)存儲器120以及將包括系統(tǒng)存儲器在內的不同系統(tǒng)組件連接到處理單元110的系統(tǒng)總線130。該系統(tǒng)總線130可為包括存儲器總線或存儲器控制器、外圍總線以及使用許多總線結構的任何一個的本地總線在內的幾種類型總線結構中的任何一個。該系統(tǒng)存儲器120包括只讀存儲器(ROM)140和隨機存取存儲器(RAM)150。
基本輸入/輸出系統(tǒng)160(BIOS),其中包含諸如在啟動階段,幫助在計算機100中的單元之間傳遞信息的基本例程,該基本輸入/輸出系統(tǒng)被保存在ROM 140中。計算機100也包括用于讀入或寫到硬盤(未示出)中的硬盤驅動器170、用于讀入或寫到可移動磁盤190中的磁盤驅動器180,以及用于讀入或寫出到諸如CD ROM或其它光媒體的可移動光盤192中的光盤驅動器191。硬盤驅動器170、磁盤啟動器180和光盤驅動器191分別通過硬盤驅動器接口192、磁盤驅動器接口193和光盤驅動器接口194連接到系統(tǒng)總線130上。該驅動器和它們相關聯(lián)的計算機可讀媒體為個人計算機100提供計算機可讀指令、數(shù)據(jù)結構、程序模塊和的其它數(shù)據(jù)的非易失性存儲。熟悉本領域的技術人員應當認識到能保存可由計算機存取數(shù)據(jù)的其它類型計算機可讀媒體,諸如盒式磁帶、閃存卡、數(shù)字視頻盤、柏努利編碼磁帶(Bernoulli cartridges)、隨機存取存儲器(RAMs)、只讀存儲器(ROMs)、以及類似的裝置,也可在范例操作環(huán)境中使用。
許多程序模塊可保存在硬盤驅動器170、磁盤190、光盤192、ROM 140或RAM 150中,其包括操作系統(tǒng)195、一個或多個應用程序196、其它程序模塊197和程序數(shù)據(jù)198。用戶可通過諸如鍵盤101和指點裝置102這樣的輸入裝置將命令和信息輸入到計算機100中。其它的輸入裝置(未示出)可包括麥克風、操縱桿、游戲墊、圓盤式衛(wèi)星電視天線、掃描儀或類似的裝置。這些和其它的輸入裝置通常通過與系統(tǒng)總線連接的串行端口接口106連接到處理單元110,但其也可通過諸如并行端口、游戲端口或通用串行總線(USB)其它其它的接口來連接。而且進一步,這些裝置可通過合適的接口(未示出)直接與系統(tǒng)總線130連接。監(jiān)視器107或其它類型的顯示裝置也通過諸如視頻適配器108這樣的接口與系統(tǒng)總線130相連。除監(jiān)視器之外,個人計算機通常包括其它外圍輸出裝置(未示出),諸如揚聲器和打印機。在較佳實施例中,為數(shù)字地俘獲徒手的輸入,可提供筆數(shù)字化儀(pen digitizer)165和附隨筆或指示筆166。盡管示出了筆數(shù)字化儀165和串行端口之間的直接連接,但是在實際應用中,筆數(shù)字化儀165可通過并行端口或其它接口以及本領域中所知的系統(tǒng)總線130直接與處理單元110相連。進一步,盡管所示數(shù)字化儀165與監(jiān)視器107分離,數(shù)字化儀165的可用輸入?yún)^(qū)域較好地與監(jiān)視器107的顯示區(qū)域大面積匹配。而且進一步,數(shù)字化儀165可集成到監(jiān)視器107中,或可作為重疊或附加在監(jiān)視器107上的分離裝置而存在。
計算機100可在使用在與一個或多個諸如遠程計算機109這樣遠程計算機的邏輯連接的網(wǎng)絡化環(huán)境中運作。該遠程計算機109可為服務器、路由器、網(wǎng)絡PC、對等裝置(peer device)或其它普通網(wǎng)絡節(jié)點,并且通常包括許多或所有上述相對于計算機100的單元,盡管圖1中只表明了存儲器存儲裝置111。圖1中描述的邏輯連接包括局域網(wǎng)(LAN)112和廣域網(wǎng)(WAN)113。這樣的網(wǎng)絡環(huán)境常見于辦公室、整個企業(yè)的計算機網(wǎng)絡、局域網(wǎng)和國際互聯(lián)網(wǎng)中。
當在LAN網(wǎng)絡環(huán)境中使用時,計算機100通過網(wǎng)絡接口或適配器114連接到本地網(wǎng)112。當在WAN網(wǎng)絡環(huán)境中使用個人計算機100時,個人計算機100通常包括調制解調器115或用于建立與諸如國際互聯(lián)網(wǎng)這樣的廣域網(wǎng)113通信的其它裝置。調制解調器115,可為內置或外置的,通過串行端口接口106連接到系統(tǒng)總線130上。在網(wǎng)絡化環(huán)境中,相對于個人計算機100描述的程序模塊或其部分可保存在遠程存儲器存儲裝置中。
應當認識到所示網(wǎng)絡連接是說明性的,并且可使用用于建立計算機之間通信鏈接的其它技術。假定存在任何不同的著名協(xié)議,諸如TCP/IP、以太網(wǎng)、FTP、HTTP、藍牙、IEEE 802.11x和類似協(xié)議,并且該系統(tǒng)可在客戶-服務器配置中運行,以允許用戶從基于網(wǎng)絡服務器中檢索網(wǎng)頁??墒褂萌魏尾煌膫鹘y(tǒng)網(wǎng)頁瀏覽器來顯示和操作網(wǎng)頁上的數(shù)據(jù)。
圖像俘獲筆[27]本發(fā)明的特征是包括將編碼數(shù)據(jù)流置于顯示表格中。顯示表格可為打印紙(或其它物理媒體)或者可為投影(projecting)與另一個圖像或圖像集合相結合編碼數(shù)據(jù)流的顯示器。例如,編碼數(shù)據(jù)流可表現(xiàn)為紙上的物理圖像或重疊在顯示圖像上的圖像,或者其可為與顯示屏結合或覆蓋在顯示屏上的物理編碼模式(非可修正模式)(這樣被筆俘獲的任何圖像部分是在顯示屏上可定向的)。
這個俘獲圖像的位置測定可用來測定與紙、媒體或顯示屏間的用戶交互的位置。在本發(fā)明的某些方面,該筆可為用于在紙上書寫的墨水筆。在其它方面,該筆可為用戶用于在計算機顯示器表面書寫的指示筆。任何交互可被提供返回到具有文檔上編碼圖像知識或支持在計算機屏幕上顯示文檔的系統(tǒng)中。通過重復俘獲照相機的位置,該系統(tǒng)可跟蹤由用戶正控制的指示筆的運動。
圖6A和圖6B示出了具有照相機603的筆601的說明性范例。筆601包括可包括或不包括墨水貯存器的尖端(tip)602。照相機603從表面607俘獲圖像604。筆601可進一步包括如在破碎盒(broken box)606中表現(xiàn)的附加傳感器和/或處理器。這些傳感器和/或處理器606也可包括將信息傳遞到另一支筆601和/或個人計算機的能力(例如,通過藍牙或其它無線協(xié)議)。
圖6B表現(xiàn)了由照相機603觀測到的圖像。在一個說明性范例中,照相機603觀測范圍是32×32像素(其N=32)。因此,圖6B示出了32像素長、32像素寬的觀測范圍。基于圖像分辨力的需求程度,我們可調節(jié)N的大小。而且,雖然所示照相機603的觀測范圍作為這里說明性目的的是正方,但是觀測范圍可包括本領域中所知的其它形狀。
從照相機603到筆601的輸入可被定義為圖像幀的序列{Ii},I=1,2,...,A,這里Ii由筆601在采樣時間ti處俘獲。該采樣速率可為固定值或可為基于文檔大小的變量。俘獲圖像幀的容量可大可小,其依賴于文檔的大小和需要的精確度。而且,可基于要搜尋文檔的大小來測定照相機圖像的容量。
由照相機603俘獲的圖像可由處理系統(tǒng)直接使用,或可經歷預先濾波。這個預先濾波可在筆601中發(fā)生,或者可發(fā)生在筆601外部(例如,在個人計算機中)。
圖6B的圖像大小是32×32像素。若每個編碼單元大小是3×3像素,則俘獲編碼單元的數(shù)量將大約為100單元。若編碼單元大小為5×5,則俘獲編碼單元的數(shù)量大約為36。
圖6A也示出了其上形成來自位置604模式的圖像610的圖像平面609。接收自目標平面607上模式的光被透鏡608聚焦。透鏡608可為單透鏡或多透鏡系統(tǒng),但是這里為簡單起見,表示為單透鏡。圖像俘獲傳感器611俘獲圖像610。
圖像傳感器611可足夠大,以俘獲圖像610。作為選擇,圖像傳感器611可足夠大,以俘獲在位置612處的筆尖端602的圖像。作為參考,位置612處的圖像被參考為虛擬筆尖端。注意到由于筆尖端、透鏡608和圖像傳感器611之間的恒定關系,圖像傳感器611的虛擬筆尖端位置是固定的。因為從虛擬筆尖端612(表示為Lvirtual-pentip)的位置到實際筆尖端602(表示為Lpentip)的位置轉換,我們可測定關于俘獲圖像610的實際筆尖端的位置。
下面的轉換FS→P將由照相機俘獲的圖像轉換為紙上的實際圖像Lpaper=FS→P(Lsensor)[37]在書寫過程中,筆尖端和紙是在相同的平面上。因此,從虛擬筆尖端到實際筆尖端的轉換也是FS→PLpentip=FS→P(Lvirtual-pentip)[38]轉換FS→P可被參考為透視變換。這個簡化為 作為FS→P的估計,其中θ,sx和sy是在位置604處俘獲模式兩個方位的旋轉和比例。進一步,我們可通過用紙上相應的背景圖像匹配該俘獲圖像而將F′S→P改進為FS→P。“改進”意指通過一種稱作遞歸方法(recursive method)的優(yōu)化算法得到更精確的透視矩陣(perspective matrix)FS→P(8個參數(shù))。該遞歸方法將矩陣F′S→P處理為初始值。FS→P比F′S→P更精確的說明了S和P之間的轉換。
下一步,我們可通過校準來測定虛擬筆尖端的位置。
我們將筆尖端602置于紙上的已知位置Lpentip上。下一步,我們可使筆傾斜,允許照相機603俘獲一連串的具有不同筆姿態(tài)的圖像。對每個俘獲的圖像而言,我們可接收轉換FS→P。從這個轉換中,我們可獲得筆尖端Lvirtual-pentip虛擬圖像的位置Lvirtual-pentip=FP→S(Lpentip)以及,F(xiàn)P→S=1/FS→P[41]通過將接收自每個圖像的Lvirtual-pentip進行平均,我們可測定虛擬筆尖端Lvirtual-pentip的精確位置。
現(xiàn)在我們知道了虛擬筆尖端Lvirtual-pentip,的位置。我們也可獲得來自俘獲圖像的轉換FS→P。最后,我們可使用這個信息來測定實際筆尖端Lpentip的位置Lpentip=FS→P(Lvirtual-pentip)位表示法[43]圖2A示出了對第一位和第二位的采樣編碼技術。第一位201(例如,“1”)用暗色墨水的列來表示。第二位202(例如,“0”)用暗色墨水的行來表示。應當認識到任何顏色墨水都可用來表示不同的本身(various its)。選擇墨水顏色的只是為了提供與媒體背景的顯著對比,以便被圖像俘獲系統(tǒng)區(qū)分。圖2A中的該位用3×3單元矩陣表示?;趫D像俘獲系統(tǒng)的容量和分辨力,該矩陣的大小可被修改為任何大小。圖2C-2E中示出了位0和1的可選擇表示法。應當認識到對圖2A-2E的采樣編碼的一或零表示可被交換而不受影響。圖2C示出了在交叉排列(interleaved arrangement)中占據(jù)兩行或兩列的位表示法。圖2D示出了在虛線表格的行和列中像素的可選擇排列。最后圖2E示出了在非規(guī)則空間格式(irregular spacing format)(例如,兩個暗色塊后跟著光亮塊)中列和行中的像素表示法。
回過來參考圖2A,若位表示為3×3矩陣,并且圖像系統(tǒng)檢測到3×3區(qū)域中的暗色行和兩個白色行,則表示為0(或1)。若檢測到圖像有暗色列和兩個白色列,則表示為1(或零)。
這里,我們使用不只一個塊或像素或點來表示位。使用單像素(或塊或點)來表示位是不牢靠的?;覊m、紙上的折痕、非平坦表面以及類似的因素會增加讀取數(shù)據(jù)單元的單個位表示法的困難程度。
位流被用來創(chuàng)建圖2B的圖像模式203。圖形模式203包括12行和18列。被轉化為使用位表示法201和202的圖形表示法的位流形成行和列。圖2B可視為具有下面的位表示法010001110110010010001110011101001100]]>[47]不同的位流可用來創(chuàng)建圖2B中所示的圖像203。例如,可使用一或零的隨機或偽隨機序列。該位序列能以行、列、對角或下面任何其它公式排序來排列。例如,若從左向右然后向下運行,則下面的位流可形成上面的矩陣0100 0111 0110 0100 1000 1110 0111 0100 1100。
若從頂向底然后向右運行,則下面的位流可形成上述矩陣0101 1100 0011 0010 0110 1001 1001 1110 0010。
若對角然后盤繞(wrapped)運行,則下面的位流可表示上面的矩陣0110 0000 0101 0101 1000 0011 1111 1010 1010。
表示法分析[50]圖2B也包括來自圖像203像素塊的表示法。顯示的圖像204-211示出了5×5像素塊。像素塊204示出了白色行之間的暗色行。像素塊205示出了白色列之間的灰色列。像素塊206示出了左下角。像素塊207示出了右上角。像素塊208示出了左邊具有半個暗色行的暗色列。像素塊209示出了在行上具有半個暗色列的暗色行。像素塊210示出了半個暗色行。像素塊211示出了半個暗色列。分析像素塊的組合,我們認識到在像素塊204-211中發(fā)現(xiàn)的圖像段可形成像素的所有組合。
在圖2B中創(chuàng)建的模式可作為線段形成迷宮的迷宮模式(maze pattern),沒有區(qū)域完全圍繞在該迷宮的所有四邊上。
進一步,我們可嘗試用像素塊的更小集合來表示所有可能的像素組合。如無例外,我們將期待在圖像203中發(fā)現(xiàn)圖3A-3D中所示的4個塊中的每個。然而,僅有3種類型的頂點存在于8個像素塊204-211中。在這個例子中,沒有圖3A表示的像素塊。由于可選擇圖像段201和202來消除一種類型的頂點,所以這就提供機會以測定基于遺失頂點類型的俘獲圖像的定向。
繼續(xù)到圖4,可分析由照相機401俘獲的圖像并且測定其定向,使其對實際由圖像401表現(xiàn)的位置來說是可解釋的。首先,圖像401被審閱以測定需要的θ角度來旋轉圖像,以水平和垂直排列像素。注意到可替換的柵格排列可能包括基本柵格的旋轉,成為非水平和垂直排列(例如,45度)。使用非水平和垂直排列可提供可能的好處,能消除來自用戶的可視化干擾,這是由于用戶可能趨向于在其它模式之前注意水平和垂直模式。為簡單起見,柵格的定向(水平和垂直以及基本柵格的任何其它旋轉)被全體用作為預定柵格定向。
下一步,分析圖401,以測定遺失了哪個頂點、需要將圖像401旋轉到準備用于解碼403圖像的旋轉量o顯示為o=(θ加上旋轉量{由遺失頂點定義})。通過圖5中的等式顯示旋轉量。回過來參考圖4,首先通過像素的布置測定角度θ,以達到像素的水平和垂直(或其它預定柵格定向)排列,并且圖像如402中所示旋轉。然后進行分析,以測定遺失的頂點,而且旋轉圖像402以提出如403的圖像以建立用于解碼的圖像。這里,圖像被逆時針旋轉90度,以使能恢復圖像403的位置。
應當認識到可在圖像401的旋轉之前或之后應用旋轉角度θ,以說明(account for)遺失的頂點。
最后,圖像403中的代碼被讀取出,并與用來創(chuàng)建圖像203的原始位流相關聯(lián)。該相關性可用許多方式來執(zhí)行。例如,可通過遞歸方法來執(zhí)行,其中再現(xiàn)位流與原始位流中的所有其它位流片斷相比較。第二,可在再現(xiàn)位流和原始位流之間進行統(tǒng)計分析,例如,通過使用兩個位流之間的漢明距離。應當認識到可使用多種方法來測定原始位流中再現(xiàn)位流的位置。
位置測定[57]圖7示出了用于測定筆尖端位置的過程。輸入是由照相機俘獲的圖像,而輸出可為與全部圖像比較而言圖像的位置坐標。而且,輸出可包括(或不包括)俘獲圖像的旋轉角度。
在步驟701中,從照相機接收圖像。下一步,可在步驟702中可選地預處理接收的圖像(如步驟702中的虛線所示)以調節(jié)光線和暗色像素之間的對比,以力圖測定俘獲圖像的旋轉角度,以及類似的量。
下一步,在步驟703中,分析該圖像以測定其中的位流。
下一步,在步驟704中,將位流與原始位流相比較,并測定原始位流中接收位流的位置。可在系統(tǒng)察覺到原始位流是如何被圍繞以創(chuàng)建圖像203的時候進行該比較。最后,一旦在步驟704中測定了俘獲圖像的位置,那么可在步驟705中測定筆尖端的位置。
圖8更詳細示出了圖7的方法以測定筆尖端的位置。首先,在步驟801中從照相機接收圖像。然后在步驟802中該圖像可選地經歷圖像預處理(如步驟802的虛線所示)。在步驟803中提取該模式。這里,可提取不同線上的像素以發(fā)現(xiàn)該模式的定向并測定角度θ。
下一步,在步驟804中分析接收圖像,以測定像素和柵格線的基本分布。若在步驟805中發(fā)現(xiàn)柵格線,則在步驟806中從模式中提取該代碼。然后,在步驟807中該代碼被解碼,并且在步驟808中測定筆尖端的位置。若在步驟805中沒有發(fā)現(xiàn)柵格線,則在步驟809中返回錯誤。
數(shù)據(jù)流編碼[63]圖9示出了使用存儲方案的數(shù)據(jù)流進行編碼的過程。在步驟901中,數(shù)據(jù)流由處理器接收。在步驟902中,數(shù)據(jù)流用來自存儲器903中的位表示法進行編碼。下一步,處理器輸出結果圖像,作為輸出904。然后,可在步驟905中可選地打印該輸出,或者在步驟906中可選地在顯示器上顯示該輸出。為了與要在步驟905中打印的頁或在步驟906中的顯示器相關聯(lián),結果圖像可表現(xiàn)為圖形格式,并作為要打印的或被覆蓋到另一個圖像或文檔內容上的圖像發(fā)送到打印機(步驟905)。同樣的,結果圖像可與其它信息組合,并在步驟906中被提出來顯示。將結果圖像的表現(xiàn)形式與其它內容相關聯(lián)的過程通??煞Q作加水印(watermarking)。例如,圖像可顯示為顯示畫面上的水印,或者可被編碼到顯示畫面本身內(例如,在顯示畫面的形成過程中或以后作為透明層的應用)。
應用[64]這里說明的編碼系統(tǒng)能以許多方式應用。首先,編碼系統(tǒng)可作為與已存在圖像組合的圖像或作為在紙上打印的圖像合并到打印紙中。表示編碼系統(tǒng)的圖像可被打印在空白紙上,或者它可附加到具有其它信息(例如,表格)的其它紙張上。用于將嵌入信息附加到圖像上的過程可包括對文檔或頁加水印。這個可包括將水印影印到圖像上,用嵌入的水印打印紙張,用另一個圖像組合水印并一起打印,以及其不同組合。而且,由系統(tǒng)使用的編碼信息也可合并到覆蓋在裝置或系統(tǒng)顯示屏上的透明薄片中,或者合并到可與包括保護薄膜的顯示器組合使用的表面中。
一個例子中,我們可將編碼系統(tǒng)嵌入到液晶顯示器中。如在LCD領域所知的,LCD的每個像素節(jié)距(pitch)有其幀,并且整個LCD像素的幀可結合在一起以形成柵格。附加當前說明的系統(tǒng)允許我們在柵格上附加編碼信息。我們可將薄膜應用到柵格中,其中該薄膜包含編碼信息。薄膜可提供調整以提供可視光中的信息,提供薄膜中的選擇性地吸收IR光線的信息,或者提供薄膜中的在各種光的波長下發(fā)出熒光的信息。進一步,可控制LCD來發(fā)射或吸收光線,用于將信息模式投射到筆或照相機上。
例如,具有諸如800-900nm這樣的特定光譜的IR反射薄膜可被置于LCD柵格上,其薄膜具有編碼信息。下一步,具有IR二極管的筆和照相機(其可具有IR濾波器)可在筆移動橫穿LCD表面時俘獲IR圖像。在這種情況下,僅有LCD柵格上的模式反射諸如800-900nm這樣的特定紅外光。因此IR圖像中的模式可與其它區(qū)域區(qū)分開來。可處理IR圖像并對其進行解碼,以測定筆尖端的位置。
可根據(jù)透鏡設計參數(shù)和分辨力的需要來選擇模式的大小。例如,為獲得0.213mm×0.213mm的像素節(jié)距和照相機視野5mm×5mm的透鏡范圍,模式大小可被設置為2×2像素,這里每個2×2像素包含一個代碼。
編碼系統(tǒng)可具體體現(xiàn)在膝上型電腦監(jiān)視器中,書寫板/基于指示筆的輸入計算機的監(jiān)視器中,個人數(shù)字助理的監(jiān)視器中,電話或任何具有顯示器裝置的監(jiān)視器中。
另一個應用包括將文檔鑒別與文檔相關聯(lián)。一般的,我們可在文檔上打印文檔標題或參考編號。我們可在文檔的部分中(例如,在角落中)打印編碼版本的文檔參考編號或其它信息(通常稱作文檔標識符)。然后,我們可用筆照相機俘獲文檔的編號編碼圖像,將該編碼圖像解碼,以獲得文檔編號,然后把將被接收的注釋和由文檔編號識別的文檔相關聯(lián)。
盡管已經使用附加權利要求書定義了本發(fā)明,但是這些權利要求書是說明性的,因為本發(fā)明規(guī)定了包括這里說明的以任何組合或子組合形式的要素和步驟。相應地,有任何數(shù)量可選擇的組合用于定義本發(fā)明,其結合一個或多個來自說明書的要素,這包括以不同組合或子組合形式的說明、權利要求書和附圖。對相關技術領域中熟練的技術人員來說,根據(jù)本說明書,很明顯,本發(fā)明各方面的交替組合,或者單獨,或者與一個或多個這里定義的要素和步驟組合,可用作本發(fā)明的修正或變化或者用作本發(fā)明的部分??烧J為這里包含的本發(fā)明的書寫說明覆蓋所有這樣的修正和變化。
權利要求
1.用于對文檔圖像進行編碼的系統(tǒng)包含用于接收位流的輸入;具有至少兩個數(shù)據(jù)可視化表示法的貯存器;用于對使用所述至少兩個數(shù)據(jù)可視化表示法的位流進行編碼的處理器,所述編碼位流具有定向信息;以及用于輸出所述編碼位流的輸出。
2.如權利要求書1所述的系統(tǒng),其特征在于所述輸出是紙打印機。
3.如權利要求書1所述的系統(tǒng),其特征在于所述輸出是計算機顯示器。
4.如權利要求書1所述的系統(tǒng),其特征在于所述至少兩個可視化表示法的其中一個是一條暗色像素。
5.如權利要求書1所述的系統(tǒng),其特征在于所述至少兩個可視化表示法的其中一個是一條規(guī)則交替的暗色和光亮像素。
6.如權利要求書1所述的系統(tǒng),其特征在于所述至少兩個可視化表示法的其中一個是一條非規(guī)則交替的暗色和光亮像素。
7.如權利要求書1所述的系統(tǒng),其特征在于所述至少兩個可視化表示法的其中一個至少是兩條交替的暗色和光亮像素。
8.用于對編碼位流進行解碼的系統(tǒng)包含接收來自照相機的圖像的輸入,所述圖像表示部分編碼數(shù)據(jù)流;以及用于處理所述圖像的處理器,所述處理包括測定所述圖像的旋轉和對所述圖像進行解碼。
9.如權利要求書8所述的系統(tǒng),其特征在于所述處理器從預定柵格定向來測定所述定向圖像的旋轉并測定所述圖像中模式的旋轉。
10.用于對編碼圖像進行解碼的方法,包含步驟接收所述編碼圖像;測定所述編碼圖像的旋轉,以按預定的柵格定向排列;基于所述旋轉步驟的測定,從所述編碼圖像檢索模式;測定所述模式的定向;旋轉所述基于所述測定定向步驟的模式;以及對旋轉模式進行解碼,以提取數(shù)據(jù)流。
11.如權利要求書10所述的方法,其特征在于所述測定旋轉步驟包括測定來自至少其中一個水平和垂直中的所述編碼圖像的旋轉。
12.如權利要求書10所述的方法,其特征在于所述測定定向步驟進一步包含步驟測定哪種類型形狀不會發(fā)生在所述模式中;以及將所述模式旋轉與所述遺失類型形狀相關聯(lián)的角度。
13.如權利要求書10所述的方法,其特征在于所述測定定向步驟進一步包含步驟測定哪種類型形狀不會發(fā)生在所述模式中;以及旋轉所述模式一個角度,直到不發(fā)生在所述模式中類型的形狀與預定遺失的形狀一致。
14.包含計算執(zhí)行指令的計算機可讀媒體,所述指令包含測定編碼圖像的旋轉,以用預定柵格定向排列;基于所述旋轉測定步驟檢索來自所述編碼圖像的模式;測定所述模式的定向;基于所述測定定向步驟旋轉所述模式;以及對旋轉模式進行解碼,以提取數(shù)據(jù)流。
15.如權利要求書14所述的計算機可讀媒體,其特征在于測定旋轉步驟包括測定來自至少其中一個水平和垂直中的所述編碼圖像的旋轉。
16.如權利要求書14所述的計算機可讀媒體,其特征在于所述測定定向步驟進一步包含步驟測定哪種類型形狀不會發(fā)生在所述模式中;將所述模式旋轉與所述遺失類型形狀相關聯(lián)的角度。
17.如權利要求書14所述的計算機可讀媒體,其特征在于所述測定定向步驟進一步包含步驟測定哪種類型形狀不會發(fā)生在所述模式中;旋轉所述模式一個角度,直到不發(fā)生在所述模式中類型的形狀與預定遺失的形狀一致。
18.具有數(shù)據(jù)結構的計算機可讀媒體,所述數(shù)據(jù)結構包含由一行與至少另一行光亮圖像相關聯(lián)的暗色圖像表現(xiàn)的第一數(shù)據(jù)區(qū)域;由一列與至少另一列光亮圖像相關聯(lián)的暗色圖像表現(xiàn)的第二數(shù)據(jù)區(qū)域,其中所述第一數(shù)據(jù)區(qū)域表示數(shù)據(jù)流的第一位并且其中所述第二數(shù)據(jù)區(qū)域表示數(shù)據(jù)流的第二位。
19.如權利要求書18所述的計算機可讀媒體,其特征在于所述計算機可讀媒體是打印紙。
20.如權利要求書18所述的計算機可讀媒體,其特征在于所述計算機可讀媒體是計算機顯示器。
21.如權利要求書18所述的計算機可讀媒體,其特征在于所述第一和第二數(shù)據(jù)區(qū)域具有水平和垂直定向。
22.如權利要求書18所述的計算機可讀媒體,其特征在于所述第一和第二數(shù)據(jù)區(qū)域具有非水平和垂直定向。
23.如權利要求書18所述的計算機可讀媒體,其特征在于所述第一和第二數(shù)據(jù)區(qū)域具有規(guī)則交替的暗色和光亮部分。
24.如權利要求書18所述的計算機可讀媒體,其特征在于所述第一和第二數(shù)據(jù)區(qū)域具有非規(guī)則交替的暗色和光亮部分。
25.如權利要求書18所述的計算機可讀媒體,其特征在于所述第一和第二數(shù)據(jù)區(qū)域具有在至少兩行或兩列上交替變化的交替暗色和光亮部分。
26.將注釋與具有文檔標識符的文檔相關聯(lián)的過程包含步驟用所述文檔的打印版本打印所述文檔標識符的編碼版本;俘獲具有與筆相關聯(lián)照相機的所述文檔標識符的所述編碼版本;對所述文檔標識符的所述編碼版本進行解碼;將由所述筆創(chuàng)建的注釋與由所述文檔標識符識別的所述文檔相關聯(lián)。
全文摘要
說明用于提供對位流的編碼方案并顯示或打印該編碼位流的系統(tǒng)和方法。通過使用編碼位流,具有照相機的筆可俘獲編碼位流的部分的圖像。然后,可對俘獲圖像進行解碼,以提供關于編碼位流圖像位置的指示。該編碼方案包括關于定向的信息,這樣就使解碼更容易了。
文檔編號G06K19/06GK1499442SQ0312723
公開日2004年5月26日 申請日期2003年9月30日 優(yōu)先權日2002年10月31日
發(fā)明者建 王, 王建, 王強, 張春暉, 李越 申請人:微軟公司