專利名稱:可以通過手寫檢索查詢來檢索的電子文件管理系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明廣泛地涉及一種電子文件管理系統(tǒng)以及數(shù)字處理器實現(xiàn)的筆跡檢索或者識別系統(tǒng),并且,更具體地,涉及用于提供一電子文件管理系統(tǒng)的一種方法和裝置,所述電子文件管理系統(tǒng)可以由手寫(即手繪的)檢索查詢,或者換句話說,由數(shù)字墨水查詢來檢索或索引。
背景技術(shù):
這里使用的“墨水查詢”是指一用戶準(zhǔn)備的作為一檢索項目或者短語的一系列手繪的數(shù)字墨水筆劃。
對筆計算的越來越多的使用以及基于紙件的到網(wǎng)絡(luò)化計算資源的接口的出現(xiàn)(例如,見P.Lapstun,Netpage System Overview,SilverbrookResearch Pty Ltd,2000年6月6日;以及“Anoto,Ericssion,and TimeManager Take Pen and Paper into the Digital Age with the Anoto Technology”,新聞稿,2000年4月6日),已經(jīng)強調(diào)了對于能夠存儲、索引以及檢索(原始)數(shù)字墨水的技術(shù)的需求。然而,檢索手寫文本比傳統(tǒng)的文本(例如ASCII文本)檢索更難,原因在于筆跡產(chǎn)生中的不一致性以及書寫人之間的格式改變。
在一數(shù)字墨水?dāng)?shù)據(jù)庫中檢索筆跡數(shù)據(jù)的傳統(tǒng)方法是,首先使用圖案識別技術(shù)將數(shù)字墨水?dāng)?shù)據(jù)庫以及對應(yīng)的檢索查詢轉(zhuǎn)換為標(biāo)準(zhǔn)文本,并且隨后將所述查詢文本與數(shù)據(jù)庫中轉(zhuǎn)換的標(biāo)準(zhǔn)文本匹配。模糊的文本檢索方法已經(jīng)被描述了,見P.Hall和G.Dowling,“Approximate String Matching”,Computing Surveys,12(4),381-402頁,1980年,所述方法在存在字符錯誤的情況下進(jìn)行文本匹配,所述字符錯誤類似于那些由筆跡識別系統(tǒng)產(chǎn)生的錯誤。
但是筆跡識別精度仍然很低,并且由(既用于數(shù)據(jù)庫記錄又用于手寫查詢)的筆跡識別引起的誤差的數(shù)量意味著此項技術(shù)不好用。將手寫信息轉(zhuǎn)換為文本的過程導(dǎo)致了相當(dāng)數(shù)量的與該筆跡的一般形狀以及動態(tài)特性相關(guān)的信息的丟失。例如,在書寫某些字母(例如‘u’和‘v’,‘v’和‘r’,‘f’和‘t’,等)時,其形狀上有很大程度的相似。另外,在很多筆跡類型(特別是草書筆跡)中,對有個人特性的筆跡的識別是高度模糊的。
網(wǎng)頁系統(tǒng) 基于筆的計算系統(tǒng)提供了人機交互的一種方便并且靈活的裝置。大多數(shù)利用,這些系統(tǒng)使用類似筆的裝置來作為用于很自然地由此媒介支持的文本、圖或者計算的數(shù)據(jù)輸入和記錄機構(gòu)。另外,寫入的墨水是比數(shù)字文本更具有表現(xiàn)力的格式,并且基于墨水的系統(tǒng)可以是不依賴語言的。另外,公布的信息的主體是以紙件形式發(fā)布的,并且大多數(shù)人更喜歡閱讀打印的材料而不喜歡閱讀基于屏幕的終端上的信息。但是,在線應(yīng)用程序以及發(fā)布系統(tǒng)與筆和紙相比有很多優(yōu)勢,例如根據(jù)需要提供信息的能力,使用超文本提供文件導(dǎo)航的能力,以及檢索并且定制信息的能力。
所述網(wǎng)頁系統(tǒng),見Silverbrook Research,Netpage System DesignDescription,2000年9月8日,通過使用不可見的編碼紙件的頁面(這里也稱為一交互式頁面)以及一光學(xué)成象筆提供到在線信息的交互的基于紙件的接口。由所述網(wǎng)頁系統(tǒng)產(chǎn)生的每個交互式頁面被唯一識別并且存儲在一個網(wǎng)絡(luò)服務(wù)器上,并且使用網(wǎng)頁筆與該交互式頁面(即紙件)的所有用戶交互被捕獲、解釋和存儲。Memjet數(shù)字打印技術(shù),見SilverbrookResearch,Memjet,1999,使網(wǎng)頁文件的按要求打印更加容易,從而允許發(fā)展交互式應(yīng)用程序。網(wǎng)頁打印機、筆以及網(wǎng)絡(luò)結(jié)構(gòu)提供了一基于紙件的替代物,用于替代傳統(tǒng)的基于屏幕的應(yīng)用程序以及在線發(fā)布服務(wù),并且支持用戶接口功能,例如超文本導(dǎo)航以及表格輸入。
網(wǎng)頁是一個三層系統(tǒng),包括客戶層,服務(wù)層以及應(yīng)用層,如圖1中所示??蛻魧影ňW(wǎng)頁筆、Memjet打印機、以及一個數(shù)字墨水中繼。典型地,所述打印機通過寬帶連接從出版商或者應(yīng)用程序供應(yīng)商接收一個文件,其被使用不可見的紅外標(biāo)簽圖案進(jìn)行打印,所述標(biāo)簽使用唯一的標(biāo)識符對每頁進(jìn)行編碼,并且對所述標(biāo)簽在頁面上的位置進(jìn)行編碼。當(dāng)用戶在該頁面上書寫時,成象筆解碼這些標(biāo)簽并且將該筆的移動轉(zhuǎn)換為數(shù)字墨水,見Silverbrook Research,Netpage Pen Design Description,2000年4月27日。所述數(shù)字墨水通過一無線頻道發(fā)送到一中繼基站,并且隨后發(fā)送到服務(wù)層以進(jìn)行處理和存儲。
服務(wù)層包括若干提供應(yīng)用程序開發(fā)功能的服務(wù),每項服務(wù)采取一組網(wǎng)絡(luò)服務(wù)器,所述服務(wù)器提供一可靠并可升級的處理環(huán)境。所述基礎(chǔ)結(jié)構(gòu)提供使用所述網(wǎng)頁系統(tǒng)打印的所有文件的持久存儲,同時還捕獲以及持久存儲所有寫在一交互式頁面上的所有數(shù)字墨水。當(dāng)數(shù)字墨水被提交用于處理時,該系統(tǒng)使用存儲的頁面描述來解釋該數(shù)字墨水,并且通過于產(chǎn)生該文件的應(yīng)用程序的交互來執(zhí)行所請求的動作。
應(yīng)用層通過發(fā)布文件向用戶提供內(nèi)容,并且處理由用戶提交的數(shù)字墨水交互。典型地,一應(yīng)用程序響應(yīng)用戶輸入產(chǎn)生一個或者多個交互式頁面,所述用戶輸入被發(fā)送到服務(wù)層進(jìn)行存儲、提交并且最終打印作為給用戶的輸出。該網(wǎng)頁系統(tǒng)允許通過提供以下服務(wù)對復(fù)雜應(yīng)用程進(jìn)行開發(fā),所述服務(wù)為文件發(fā)布、提交,傳輸、鑒別處理以及安全支付、筆跡識別,以及使用生統(tǒng)技術(shù)例如簽名校驗的用戶確認(rèn)。
有一些現(xiàn)存的技術(shù)用于使手繪的墨水查詢與下面提到的手寫文本數(shù)據(jù)庫、手繪的草圖以及圖象數(shù)據(jù)庫進(jìn)行匹配。
Chans等人(Y.Chans,Z.lei,D.Lopresti,以及S.Kung,“A FeatureBased Approach For Image Retrieval by Sketch”,Proceedings of SPIEVolume 3229Multimedia Storage and Archiving Systems II,1997),根據(jù)“edge segments modeled by Implicit Polynomials(IP)”使手繪草圖與圖象特征匹配。相似性計算則根據(jù)使用一彈性的匹配過程對成對的特征組(稱為curvlets)之間的距離的計算來進(jìn)行。
Lopresti以及Tomkins(D.Lopresti以及A.Tomkins,“Temporal-Domain Matching of Hand-Drawn Pictorial Queries”,Handwriting and ResearchBasic and Applied Issues,IOS Press,387-401頁,1996.,以及D.Lopresti,A.Tomkins以及J.Zhou,“Algorithms for MatchingHand-Drawn Sketches”,Proceedins of the 5th International Workshop onFrontiers in Handwriting Recognition,223-238頁,1995年),描述了一種用于將手繪草圖與一草圖數(shù)據(jù)庫進(jìn)行匹配的系統(tǒng)。數(shù)據(jù)庫中的每個筆劃的全局特征,例如筆劃長度以及跨越角度被抽取,由此可使用矢量量化創(chuàng)建一個筆劃代碼本。使用一字符串模塊編輯算法將輸入草圖與一數(shù)據(jù)庫進(jìn)行匹配,所述算法使用矢量量化的代碼作為原始代碼,見D.Lopresti和A.Tomkins,“Block Edit Models for Approximate StringMatching”,Proceedings of the 2nd Annual South American Workshopon String Processing,11-26頁。一種類似的使用動態(tài)編程來進(jìn)行墨水檢索的方法由Poon等人在A.Poon,K.Weber,and T.Cass,“ScribblerA Tool for Searching Digital Ink”,Proceedings ofthe ACM Computer-Human Interaction,58-64頁,1994中進(jìn)行了描述。
在D.Lopresti and A.Tomkins,“Pictographic Naming”,Proceedings of the一種用于手寫注釋的自動的索引建立算法。墨水筆劃被組成字,并且重新取樣以使每個點沿著墨水軌跡是等距離的。提取每個筆劃的一組角度和曲率特征,并使用分等級的分組對所述特征向量進(jìn)行分組。使用卡方(Chi-squared)統(tǒng)計來選擇有用的索引項目。
D.Lopresti和A.Tomkins,“Pictographic Naming”,Proceedings of the INTER CHI 1993 Conference,1993,討論了使用隱藏馬克波夫模型(HMMs)來匹配象形圖,并且描述了一個廉價判別系統(tǒng),其給出了墨水圖之間相似性的一個大體的指示,該指示用于數(shù)據(jù)庫的刪改。還描述了使用窗口化的動態(tài)編程方法,以允許用戶檢索象形文字命名的文件系統(tǒng)。
Del Bimbo等人(A.Del Bimbo,P.Pala,and S.Santini,“Image Retrieval by Elastic Matching of Shapes and ImagePatterns”,Proceedings of IEEE Multimedia,215-218頁,1996),描述了一圖象檢索算法,該算法使用一彈性匹配形狀-相似性過程。Schomaker等人(L.Schomaker,L.Vuurpijl,以及E.de Leau,“NewUse for the PenOutline-Based Image 20 Queries”,Proceedings ofthe 5th International Conference on Document Analysis andRecognition,293-296頁,1999),提出了一個基于手繪圖象輪廓的圖象查詢技術(shù)。此算法使用了一個特征組,其中包含標(biāo)準(zhǔn)化的點坐標(biāo)以及運轉(zhuǎn)角,以及角的直方圖。為了進(jìn)行識別,使用了歐幾里得距離最近鄰域分級器。Muller等人(S.Muller,S.Eickeler,以及U.Rigoll,“Multimedia Database Retrieval Using Hand-Drawn Sketches”,5thInternational Conference on Document Analysis and Recognition,Bangalore,India,1999年9月),描述了一個多媒體數(shù)據(jù)庫檢索系統(tǒng),所述系統(tǒng)支持既使用形狀又使用顏色對項目的手繪草圖。數(shù)據(jù)庫記錄根據(jù)比率以及旋轉(zhuǎn)不變的特征而表示為HMMs,并且使用數(shù)據(jù)庫刪改技術(shù)來減少檢索費用。
Pavlidis等人(I.Pavlidis,R.Singh,以及N.Papanikolopoulos,“Recognition of On-Line Handwritten PatternsThrough Shape Metamorphosis”,Proceedings of the 13thInternational Conference on Pattern Recognition,Vol.3,18-22頁,1996),使用形狀變形(即變體)來匹配在線手寫文本以及在線手繪圖形。所述信號在高和低曲率區(qū)域處被分割,并且這些分割點被用作執(zhí)行輸入和目標(biāo)形狀之間形狀變形的特征。最終的相似性分?jǐn)?shù)是根據(jù)將輸入信號轉(zhuǎn)換到目標(biāo)所需要的變形程度。
Manmatha等人(R.Manmatha,C.Han,E.Riseman,以及W.Croft,“Indexing 10 Handwriting Using Word Matching”,Proceedings ofthe First ACM International Conference on Digital Libraries,151-159頁,1996),通過將文本分割為字并且對所述字上進(jìn)行相似性匹配來建立手寫文件的文本索引,,其中所述匹配是通過(使用一位圖“異或”邏輯)將字圖象與該文本中的所有其他字圖象進(jìn)行匹配來執(zhí)行的。成組的類似的詞隨后被形成索引。Mahmood(見T.Mahmood,“Indexingof Handwritten Document Images”,Proceedings of the 1997 Workshopon Document Image Analysis,1997)使用了一項稱為幾何散列法的技術(shù)(見Y.Lamdan和H.Wolfson,“Geometric HashingA General andEfficient Model-Based Recognition Scheme”.Proceedings of theInternational Conference on Computer Vision,218-249頁,1988)來使用在仿射變換下不變的特征表示來索引離線的手寫文本。
Kamel(見I.Kamel,“Fast Retrieval of Cursive Handwriting”,Proceedings of the 5th Internat ional Conference on Information andKnowledge Management,Rockville,MD USA,1996年11月12-16日)描述了一種快速索引和檢索草書筆跡的方法。筆劃在“x-y坐標(biāo)的每個局部最小值處”被分割,并且根據(jù)幾何特性例如筆劃長度以及跨越的角度將其轉(zhuǎn)換為一特征向量。所述特征向量隨后被使用Karhunen-Loeve(i.e.Principal Component Analysis,see R.Duda,P.Hart,and D.Stork,Pattern ClassifIcation,第二版,John Wiley & Sons,Inc.,115-117頁,2001)轉(zhuǎn)換映射到一更低的維數(shù),其隨后被使用一R樹(B樹的一個多維版本,描述在A.Guttman,“R-TreesA Dynamic IndexStructure for Spatial Searching”,F(xiàn)roceedings of the ACM SIGMOD,1994之中)檢索。所述檢索使用一表決算法,所述算法使每個輸入筆劃與筆劃索引進(jìn)行比較。在I.Kamel,D.Barbera,“Retriving ElectronicInk by Content”,Proceedings of the 1996lnternational Workshopon Multi-Media Database Management Systems,1996中,此項技術(shù)被使用一兩步索引方案而擴展,所述方案包括一個過濾步驟以及一個提煉步驟。所述過濾步驟使用全局特征在該數(shù)據(jù)庫中定位一超級矩形,所述數(shù)據(jù)庫就是隨后使用一順序算法來尋找最相似匹配的而被檢索的數(shù)據(jù)庫。
Aref等人(W.Aref,D.Barbera,P.Vallabhaneni,“TheHandwritten TrieIndexing Electronjc Ink”,The 1995 ACM SIGMODInternational Conference on Management of Data,San Jose,California,1995年5月)使用了局部和全局特征的組合來訓(xùn)練一組HMMs,其模仿手寫鍵(trie)的字母。一個波束檢索被用于遍歷所述鍵,并且最大期望節(jié)點在每個點擴展。在W,Aref,D.Barbera,D.Lopresti,以及A.Tomkins中,“Ink as a First-Class Datatype in MultimediaDatabases”,Database SystemIssues and ResearchDirection,113-163頁,1996中,描述了一個算法(稱為ScriptSearch),其用于在一連續(xù)的文本流中搜索一手寫的短語。所述方法不執(zhí)行字的分割,相反,它使用動態(tài)編程對矢量量化的原始筆劃序列進(jìn)行匹配。還描述了一項技術(shù),其使用基于HMMs的樹狀結(jié)構(gòu)來檢索大的墨水?dāng)?shù)據(jù)庫。
Napper等人(在基于澳大利亞臨時專利申請No.PR8243的一個共同未決的PCT申請中)描述了一項使用基于文本的查詢來檢索數(shù)字墨水?dāng)?shù)據(jù)庫的技術(shù)。所述過程使用從一訓(xùn)練數(shù)據(jù)庫產(chǎn)生的一個手寫模型將查詢文本映射到一與作者相關(guān)的特征組,其隨后用于對數(shù)據(jù)庫進(jìn)行順序的相似性檢索 Lopresti等人在D.Lopresti,Y.Ma,以及J.Zhou的“DocumentSearch and Retrieval System with Partial Match Searching ofUser-Drawn Annotations”,美國專利5,832,474,中,公開了一個自動的墨水匹配系統(tǒng)。其說明書描述的處理包括筆劃分割、特征抽取、矢量量化、以及使用編輯距離順序檢索的模糊匹配技術(shù)。
Bricklin等人在D.Bricklin等人“Graphic Indexing System”,美國專利5,867,150中,描述了一種在用戶的指示下建立手寫記錄索引的方法。在該系統(tǒng)中,該用戶使用一套索姿勢來指示要索引的墨水區(qū)域,并且隨后的檢索通過用戶瀏覽所述墨水索引集手動來執(zhí)行。
Barbera等人在D.Barbara,W.Aref,I.Kamel,andP.Vallabhaneni的“Method 10 and Apparatus for Indexing aPlurality of Handwritten Objects”,美國專利號5,649,023,中描述了一個B樹數(shù)據(jù)結(jié)構(gòu),其被用于索引一組左到右的HMMs,每個HMM表示一個手寫的對象。在D.Barbara以及I.Kamel的“Method andApparatus for Similarity Matching of Handwritten Data Objects”,美國專利5,710,916中,他們描述了另一個索引系統(tǒng),其使用一組全局筆劃特征以及一個R樹來進(jìn)行索引。在D.Barbara和H.Korth的“Method and Apparatus for Storage and Retrieval of HandwrittenInformation”,美國專利5,524,240,以及D.Barbara和W.Aref,“Method for Indexing and Searching Handwritten Documents in aDatabase”,美國專利5,553,284中他們描述了一定數(shù)量的基于HMM的復(fù)雜程度比較低的索引方法。在W.Aref和D.Barbara的“TrieStructure Based Method and Apparatus for Indexing and SearchingHandwritten Databases with Dynamic Search Sequencing”,美國專利5,768,423中公開了一組合的HMM以及鍵結(jié)構(gòu)檢索技術(shù)(見W.Aref,D.Barbera,P.Vallabhaneni,“The Handwritten TrieIndexingElectronic Ink”,The 1995 ACM 25 SIGMOD International Conferenceon Management of Data,San Jose,California,1995年5月)。
Mahmood在T.Mahmood的“Method of Indexing Words in HandwrittenDocument Images Using Image Hash Tables”,美國專利5,953,451中,公開了一種使用幾何散列法的手寫文件的索引方法(見T.Mahmood,“Indexing of Handwritten Document Images”,Proceedings of the1997 Workshop on Document Image Analysis,1997)。
Hull等人在R.Hull,D.Reynolds以及D.Gupter的“ScribbleMatching”,美國專利6,018,591中,描述了一項技術(shù)使用速度最小值來進(jìn)行筆劃分割的草書匹配技術(shù)。定義三個匹配算法,一個彈性的匹配器,一個基于形狀信息的匹配器(稱為一個合成的匹配器),以及一個基于使用參考線分區(qū)進(jìn)行高度編碼的匹配器(稱為一個字匹配器)。
Poon等人在A.Poon,K.Weber和T.Cass的“Searching andMatching Unrecognized Handwriting”,美國專利5,687,254中,描述了一種使用動態(tài)時間變形來檢索以及匹配基于姿勢的筆跡的方法。此項技術(shù)用于建立手寫文件的索引以及用于在手寫文本上執(zhí)行“查找和替換”功能。
這就強調(diào)了對使用基于筆的計算的對電子文件管理系統(tǒng)的需求,其允許用戶存儲或檢索形式為注解和筆記等的數(shù)據(jù),并且可以隨后根據(jù)手寫(即手繪的)查詢來檢索此數(shù)據(jù)。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的廣義形式,提供了一種方法,所述方法提供了一可以使用手寫檢索查詢來檢索的電子文件管理系統(tǒng),所述方法包括下列步驟 使用一輸入裝置獲取手寫檢索查詢 根據(jù)手寫的檢索查詢與在存儲在至少一個數(shù)據(jù)庫中的交互式頁面上所作的手寫注釋之間的對照,對所述至少一數(shù)據(jù)庫進(jìn)行檢索;以及 向用戶提供檢索結(jié)果并且使得對檢索結(jié)果中標(biāo)識的至少一交互式頁面的訪問更容易。
優(yōu)選地,所述手寫檢索查詢是從輸入裝置與一交互式頁面的交互中獲得的。根據(jù)另一種優(yōu)選的方式,所述輸入裝置是成象筆。
在本發(fā)明的一個特定的實施方式中,所述手寫檢索查詢對至少一個數(shù)據(jù)庫的檢索產(chǎn)生影響,所述至少一個數(shù)據(jù)庫用于手寫注釋與交互式頁面內(nèi)容的組合。在本發(fā)明的另一個特定的實施方式中,所述手寫檢索查詢使得在所選擇的文本字符串的給定物理距離內(nèi)執(zhí)行對手寫注釋的檢索。還是在本發(fā)明的再一個實施方式中,所述手寫檢索查詢是由與一交互式頁面上的文本字符串相關(guān)的一手繪的環(huán)、下劃線、彎曲線、十字形、抑揚符號、星號等形成的。
根據(jù)本發(fā)明的特定實施方式,所述交互式頁面以打印的紙件的形式提供給用戶。可以選擇的是,所述交互式頁面在一顯示裝置上顯示給用戶。優(yōu)選地,該手寫注釋是用戶筆跡、符號、圖、標(biāo)記等。
根據(jù)本發(fā)明另外的實施方式,附加的屬性被用于改進(jìn)檢索,并且附加的屬性可以包括 手寫注釋完成的日期和時間; 使用的特殊的輸入裝置; 手寫注釋完成的地理位置; 手寫注釋在交互式頁面上的物理位置; 使用的軟件應(yīng)用程序;和/或 完成手寫注釋所用的字段類型。
根據(jù)本發(fā)明的另一個實施方式,所述至少一個數(shù)據(jù)庫可以通過網(wǎng)絡(luò)遠(yuǎn)程檢索。所述至少一個數(shù)據(jù)庫可以是一個數(shù)字圖象數(shù)據(jù)庫,包括圖片、圖畫、圖象、圖形等。
根據(jù)本發(fā)明的另一個實施方式,當(dāng)所述檢索查詢是墨水查詢時,所述檢索可以通過下列步驟來執(zhí)行 將在所述至少一個數(shù)據(jù)庫中的手寫注釋分割成分段筆劃,并且將所述分段筆劃映射到第一序列的特征表示; 將所述手寫檢索查詢分割成分段筆劃,并且將所述分段筆劃映射到第二序列的特征表示; 對第一序列的特征表示以及第二序列的特征表示執(zhí)行一個編輯距離計算;以及 通過從編輯距離計算定位最小值來確定在所述至少一個數(shù)據(jù)庫中的手寫注釋與手寫檢索查詢之間的匹配。
根據(jù)本發(fā)明的另一個較寬形式的實施方式,其提供了一種方法,所述方法提供一種可以使用手寫檢索查詢來檢索的電子文件管理系統(tǒng),所述方法包括下列步驟 使用成象筆捕獲數(shù)字墨水以形成一個手寫的檢索查詢; 將所述手寫檢索查詢提交到至少一個數(shù)據(jù)庫; 根據(jù)手寫檢索查詢與在存儲在至少一個數(shù)據(jù)庫中的交互式頁面上所作的手寫注釋之間的對照,對所述至少一數(shù)據(jù)庫進(jìn)行檢索;以及 提供檢索結(jié)果并且使得對檢索結(jié)果中標(biāo)識的交互式頁面副本的訪問更容易。
根據(jù)本發(fā)明的再一個較寬形式的實施方式,其提供了一種裝置,所述裝置提供一種可以使用手寫檢索查詢來檢索的電子文件管理系統(tǒng),所述裝置包括 (1)至少一個用于存儲交互式頁面的數(shù)據(jù)庫; (2)一個輸入裝置; (3)用于提供或者顯示一交互式頁面的裝置; 一個處理器,所述處理器可以適用于(A)從輸入設(shè)備接收手寫檢索查詢; (B)向所述至少一個數(shù)據(jù)庫提交所述手寫檢索查詢; 從而,根據(jù)手寫的檢索查詢與在存儲在至少一個數(shù)據(jù)庫中的交互頁面上所作的手寫注釋之間的對照,對所述至少一數(shù)據(jù)庫進(jìn)行檢索,并且檢索結(jié)果被提供或者顯示給一用戶。
根據(jù)本發(fā)明的再一個較寬形式的實施方式,其提供了一種裝置,所述裝置提供一種可以使用手寫檢索查詢來檢索的電子文件管理系統(tǒng),所述裝置包括 (4)至少一個用于存儲交互式頁面的數(shù)據(jù)庫; (5)一成象筆,用于產(chǎn)生形成手寫檢索查詢的數(shù)字墨水; (6)用戶訪問一交互式頁面的裝置; (4)一個處理器,所述處理器可以適用于 (A)從成象筆接收手寫檢索查詢; (B)向所述至少一個數(shù)據(jù)庫提交所述手寫檢索查詢; 從而,根據(jù)手寫檢索查詢與在存儲在至少一個數(shù)據(jù)庫中的交互式頁面上所作的手寫注釋之間的對照,對所述至少一數(shù)據(jù)庫進(jìn)行檢索,并且用戶可以訪問此檢索結(jié)果。
通過以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例而非限制性實施例的舉例描述,本發(fā)明會變得更加清楚,在所述附圖中 圖1(現(xiàn)有技術(shù))示出了網(wǎng)頁系統(tǒng)結(jié)構(gòu)。
圖2示出了一處理系統(tǒng)。
圖3示出了每筆劃的點的最佳化的曲線。
圖4示出了表示Y加權(quán)的最佳化的曲線。
圖5示出了替代加權(quán)的最佳化的曲線。
圖6示出了VQ距離權(quán)重的最佳化的曲線。
具體實施例方式 下列描述的實施方式被應(yīng)用于本發(fā)明的書面說明和附加的權(quán)利要求中,目的是提供對本發(fā)明的主題的更精確的理解。
優(yōu)選的實施方式 本發(fā)明提供了一種方法和設(shè)備,用于提供可以由一手寫的檢索查詢即數(shù)字墨水檢索查詢進(jìn)行檢索或者索引的電子文件管理系統(tǒng)。
數(shù)字墨水檢索 數(shù)字墨水的持久和數(shù)字墨水檢索的組合使得有可能實現(xiàn)許多高度期望的服務(wù)。由于由用戶寫入或者描繪在交互式頁面上的所有信息被永久地存儲,該用戶能夠針對若干關(guān)鍵字或者圖示檢索注釋、記錄、評論以及其他的手寫的信息,能夠?qū)λ袝嫘畔⑦M(jìn)行快速和方便的訪問。另外,不需要保留所述手寫信息的物理拷貝,原因是可以容易地將筆跡和繪畫放置在永久性數(shù)據(jù)庫中以及被復(fù)制。
數(shù)字墨水檢索程序并不被限制為簡單地匹配查詢文本,并且附加的屬性可以用于更精確地指定所期望的信息。這些屬性的例子包括筆跡的日期和時間,用于產(chǎn)生所述筆跡的筆,筆跡產(chǎn)生的地理位置,與所述筆跡相關(guān)的應(yīng)用程序(例如電子郵件或者筆記本),包括所述筆跡的字段類型(例如文本輸入字段,一個繪圖字段),注釋或者文本在所述頁面上的位置等等。
除此之外,可以通過將手寫注釋與文件內(nèi)容組合起來而建立復(fù)雜的查詢。這樣的例子包括檢索手寫注釋,所述手寫注釋在一打印文本字符串頁面或包含某一打印文本字符串的手繪套索或者環(huán)(即橢圓環(huán)的形式)頁面上的某一距離內(nèi)。
這樣就具有了可以使用注釋來索引任何文件的能力。例如,通過以一個或者多個分類描述來注釋文件使“虛擬檔案柜”功能成為可能。用戶簡單地寫下有關(guān)來自任意來源(例如筆記本中的若干頁,新聞紙或者技術(shù)雜志中的文章,與同事的通信)的文件的描述或者一個或多個關(guān)鍵詞,并且在后來的日子可以使用數(shù)字墨水檢索來定位或者復(fù)制此信息。此系統(tǒng)允許組織、索引以及檢索的級別大大超過傳統(tǒng)文件管理系統(tǒng)所提供的級別范圍,因為文件可以由任意數(shù)量的目錄來檢索,檢索可以自動地執(zhí)行(而不是用手動進(jìn)行),并且信息可以在提供對在線系統(tǒng)的訪問的任何地方得到。
基于筆的查詢也允許檢索筆跡之外的信息。手繪圖片檢索可以用于定位一筆記本中的繪圖和圖表,并且可以用于檢索來檢索一個在線相冊或者商業(yè)圖象庫,以尋找包括期望的視覺特征或者視覺特征組的圖片。
本發(fā)明的實施方式可以使用如圖2中的例子所示的處理系統(tǒng)來實現(xiàn)。特別地,處理系統(tǒng)10可用于提供如圖1中所示的“客戶層”設(shè)備。處理系統(tǒng)10通常包括至少一個處理器20,一個存儲器21,以及一個輸入裝置22,例如網(wǎng)頁編碼頁(例如交互式頁面)以及成象筆,一個輸出裝置23,例如一打印機或者一顯示器,并且其部件通過所示的總線或者其他的通信路徑24連接在一起。也提供了一個如25所示的外部接口,用于將處理器系統(tǒng)連接到數(shù)據(jù)庫11。所述數(shù)據(jù)庫11至少是部分地包括可檢索的數(shù)字墨水。
在一個替代實施方式中,輸入裝置22可以是由一監(jiān)視器或者顯示器提供的交互式頁面。所述監(jiān)視器或者顯示器可以是觸敏的,以跟蹤筆的位置,或者可以使用其他的系統(tǒng),例如光筆或者是位置敏感的筆,以便于手寫或者手繪數(shù)據(jù)的輸入。
使用時,處理系統(tǒng)10被適配,以允許向數(shù)據(jù)庫11存入和/或由其檢索數(shù)據(jù)。處理器20通過輸入22接收一個檢索查詢,例如一個墨水查詢。從這一點上可以看出,所述處理系統(tǒng)10可以是任意形式的處理系統(tǒng)或者終端,例如計算機、便攜式電腦、服務(wù)器、專用硬件等。
數(shù)字墨水檢索是指根據(jù)一些相似性規(guī)則檢索連續(xù)的墨水流以尋找與一輸入查詢最匹配的圖案的過程 所述數(shù)字墨水檢索程序允許在子串(例如“scope”應(yīng)當(dāng)與“telescope”和“microscope”匹配)、字以及短語上的匹配。另外,也支持布爾檢索操作符例如AND,OR以及NOT。所述處理也支持對包括草書、打印的以及混合的(即草書以及打印成份的混合)筆跡的數(shù)據(jù)庫的檢索,并且優(yōu)選地其應(yīng)該是對大小寫字母區(qū)分不敏感的。
當(dāng)檢索查詢是這里提出的墨水查詢時,用于墨水檢索的可能的算法通過比較檢索精度(即結(jié)果的準(zhǔn)確性)、性能,以及數(shù)據(jù)存儲和處理開銷來評估。這里使用的精度量度是簡單地對由檢索算法返回的正確項目的等級求和,使用所執(zhí)行的查詢數(shù)量進(jìn)行標(biāo)準(zhǔn)化,從而給出平均的正確項目位置。例如,如果對于一系列查詢,檢索算法返回在等級0(即第一)、1和2的正確位置,那么所述精度量度為(0+1+2)/3=l,指示正確的結(jié)果的平均值等級為第二級。顯然,比較低的精度值優(yōu)于比較高的值。
這里討論的用于確定最佳處理的實驗數(shù)據(jù)庫包括十五頁的草書(大約4000字),以及由單個作者使用CrossPad便攜式數(shù)字筆記本寫入的印刷文本。
除此之外,還使用Wacom Intuos圖形輸入板建立了135個書面查詢,每個查詢包括可以在所述數(shù)據(jù)庫文本中找到的一個書面字或者字的序列。所述數(shù)據(jù)庫中的匹配文本的正確位置的頁和筆劃被記錄,以允許為所述檢索算法計算精度量度。
預(yù)處理 首先使用霍夫變換來標(biāo)準(zhǔn)化每頁文本的定位,如A.Rosenthal,J.Hu以及M.Brown,“Size and orientation normalization of on-linehandwriting using Hough transform”,ICASSP′97,Munich,Germany,1997年4月,得到了基本上水平的文本行。也可以使用一定數(shù)量的可選的定位標(biāo)準(zhǔn)化方案,包括該處理的改進(jìn)版,描述在M.Morita,S.Garnes,J.Facon,F(xiàn).Bortolozzi,J.Facon,以及R.Sabourin的“MathematicalMorphology and Weighted Least Squares to Correct HandwritingBaseline Skew”,F(xiàn)ifth International Conference on DocumentAnalysis and Recognition(ICDAR′99),Bangalore(India),1999年9月20-22日,430-433頁中。
為了執(zhí)行行分割,首先使用按時間順序的墨水筆劃檢測潛在的行分割點。通常,通過識別向下以及向左的移動可以檢測拉丁手跡中的新行。當(dāng)然,其他的跳行也是可能的,例如文件中的簽名,其中筆的移動可能是向下的并且是向右的。結(jié)果是,任何顯著的向下移動都被當(dāng)作潛在的斷行。
為了執(zhí)行行分割,比較筆劃的邊界框與當(dāng)前行的基線,所述基線是使用識別所述文本區(qū)域的水平的投影直方圖而計算的,見R.Powalka,“Extracting and using reliable zoning information”,InteralReport.Department of Computing,The Nottingham TrentUniversity,1993年12月9日。如果筆劃邊界落到所述基線以下,就產(chǎn)生一個斷行的假設(shè)。為了驗證該假設(shè),建立一個新行并且計算用于筆劃的文本區(qū)域,直到出現(xiàn)下一個斷行假設(shè)。如果新行的區(qū)域完全地落在先前行的區(qū)域以下,則假設(shè)被確認(rèn)并且接受斷行。否則,所述斷行被拒絕并且筆劃被合并回到先前的行中。處理繼續(xù)進(jìn)行一直到頁面上的所有筆劃都被處理完成。行分割處理的結(jié)果是得到表示每一行的一組筆劃分組,以及每一行的分區(qū)信息。
子串檢索 數(shù)字墨水檢索被定義為在墨水?dāng)?shù)據(jù)庫中放置所有墨水查詢的情況。但是傳統(tǒng)的數(shù)據(jù)庫檢索以及索引方案不適合用于數(shù)字墨水檢索,原因是筆跡在形狀和結(jié)構(gòu)方面有很大程度的變化。由于同一作者兩次所寫的字在筆劃的數(shù)量和順序以及那些筆劃的形狀和位置上具有不同之處,因此,應(yīng)使用一種近似的字符串匹配技術(shù),例如編輯距離計算,見R.Wagner以及M.Fischer,“The String-to-String Correction Problem”,Journalof the Association for Computing Machinery,21(1),168-173頁,1974年。
編輯距離計算d(X,Y)被定義為僅使用符號插入、刪除以及替換操作將序列X={x1,...,xm}轉(zhuǎn)換為序列Y={y1,...,yn}所需要的最低成本,并且可以使用動態(tài)編程來解決 d0,0=0 di,0=di-1,0+cins(xi) 1≤i≤m d0,j=d0,j-1+cdel(yj) 1≤j≤n 并且對于1≤i≤m且1≤j≤n
上面給出的標(biāo)準(zhǔn)的編輯距離算法需要序列X與整個長度Y匹配。但是檢索作為Y的子序列的序列X需要對所述計算進(jìn)行改變以允許查詢序列開始在數(shù)據(jù)庫序列中的任意點開始匹配 d0,j=0 為了執(zhí)行數(shù)字墨水檢索,所述墨水查詢以及數(shù)字墨水?dāng)?shù)據(jù)庫的每個被映射到一原始單元序列,并且在所述序列上執(zhí)行編輯距離計算。成本值cdel(xi)和cins(yi)被定義為被插入或者刪除的墨水xi的長度,而csub(xi,yi)被認(rèn)為是兩個筆劃之間的歐幾里得距離(除非另外指定)。
數(shù)字墨水?dāng)?shù)據(jù)庫中的匹配是通過尋找dm,j的最小值并且跟蹤回到所述序列匹配的起點的最小成本路徑被發(fā)現(xiàn),這里,能夠發(fā)現(xiàn)所述匹配的頁碼以及筆劃偏置。這些匹配被記錄并且通過記分來分級。注意由于相鄰筆劃的插入和刪除可能產(chǎn)生許多低分?jǐn)?shù)密集聚集的結(jié)果,所以一個匹配序列可以產(chǎn)生多個匹配。作為結(jié)果,只有某一窗口內(nèi)的最小值被報告為所述的匹配分?jǐn)?shù)。
其他的例子 下面的例子提供了用于提供數(shù)字墨水檢索功能的一種可能的裝置的更詳細(xì)的輪廓。這些例子的目的僅是用于說明性的而不是用于限制本發(fā)明的范圍。其他形式的檢索也是可能的。
筆劃分割 為了執(zhí)行正確的字符串匹配,所述數(shù)字墨水?dāng)?shù)據(jù)庫以及墨水查詢被分割成原始單元序列。使用8個區(qū)域標(biāo)準(zhǔn)化的坐標(biāo)(表2中所描述)作為特征,測試一定數(shù)量的標(biāo)準(zhǔn)的筆劃分割方案,。對于所有的分割方法,分割點只在當(dāng)在該點出分割該筆劃所產(chǎn)生的子筆劃都大于(從區(qū)域高度得到的)最小長度時才被使用。該結(jié)果被匯總在表格1中分割方案精度Y最小值19.47Y極值3.04角極值20.23 表1.筆劃分割結(jié)果 在Y坐標(biāo)極值處的分割產(chǎn)生最精確的結(jié)果。注意此分割方法的處理費用也高于其他的方案,由于發(fā)現(xiàn)許多另外的分割點(由此發(fā)現(xiàn)子筆劃單元),導(dǎo)致所述順序檢索程序中很多另外的步驟。但是,由精確的結(jié)果反映的此方法的改進(jìn)的精度來看,該費用是值得的。
特征選擇 為了執(zhí)行墨水查詢與數(shù)據(jù)庫序列之間的相似性匹配,所述分割的筆劃被映射到允許執(zhí)行距離計算的特征表示。測試一定數(shù)量的公共特征表示被名稱描述 精 度邊界標(biāo)準(zhǔn)化的坐標(biāo)子筆劃的坐標(biāo)被重新取樣到8個等距離的點,并且由整個筆劃的邊界矩形標(biāo)準(zhǔn)化。
39.34區(qū)域標(biāo)準(zhǔn)化的坐標(biāo)子筆劃的坐標(biāo)被重新取樣到8個等距離的點,并且Y坐標(biāo)被中間區(qū)域標(biāo)準(zhǔn)化,X坐標(biāo)被所述子筆劃的邊界矩形的寬度標(biāo)準(zhǔn)化。
3.04曲率表示沿其長度等距離重新取樣的子筆劃的曲率的8個角度。
35.01 角度表示沿其長度等距離重新取樣的所述子筆劃的定位的8個角度。
30.20 NICI特征由Nijmegen Institute for Cognition andInformation(NICI)提出的特征組(如L.Schomaker,H.Teulings,E.Helsper,以及G.Abbink,“Adaptive recognition of online,cursivehandwriting”,Proceedings of the SixthInternational Conference on Handwriting andDrawing.Paris,July,4-7Telecom,(19-21頁),1993年中所定義的。)此特征組包括9個角度,3個笛卡兒座標(biāo),以及兩個結(jié)構(gòu)特征。注意所述笛卡兒特征由區(qū)域高度標(biāo)準(zhǔn)化并且乘以一個加權(quán)系數(shù)(根據(jù)前面的最佳化實驗對本實驗設(shè)置為1.8)。
5.23 Rubine特征由Dean Rubine在姿勢識別的正文中提出的特征組(見D.Rubine,“Specifying Gestures byExample.”Computer Graphics,329-337頁,1991年8月)并且被應(yīng)用到數(shù)字墨水檢索中,見W,Aref,D.Barbera,D.Lopresti,and A.Tomkins,“Inkas a First-Class Datatype in Multimedia Databases”,Database System.Issues and Research Direction,113-163頁,1996年。此特征組使用13個主要的全局特征來描述筆劃(注意最后兩個基于動態(tài)信息的特征沒有被使用)。
6.90 表2.特征選擇結(jié)果 由于所述Rubine組中的特征的高度關(guān)聯(lián)的性質(zhì)以及特征幅度的大的改變,在使用這些特征時,Mahalanobis距離(見R.Duda和P.Hart,Pattern Classification and Scene Analysis,WileyInterscience,1973年)被用作所述檢索程序的距離量度 d2=(x-y)t∑-1(x-y) 其中∑是從數(shù)據(jù)庫中的特征導(dǎo)出的協(xié)方差矩陣。
令人吃驚的是,所述區(qū)域標(biāo)準(zhǔn)化的坐標(biāo)方法產(chǎn)生了最高檢索精度的測試的特征表示。此特征組被用于所有后續(xù)的實驗。
參數(shù)最佳化 在已經(jīng)確定筆劃分割方案和特征表示的情況下,采取實驗以最佳化所述特征生成參數(shù)。為此,使用在每一步驟修改的單個參數(shù)重復(fù)執(zhí)行所述檢索程序。圖3描繪了改變每個子筆劃的點數(shù)的結(jié)果,最佳值被發(fā)現(xiàn)為是4(即每個子筆劃8個特征)。
基于人-馬達(dá)系統(tǒng)特性對產(chǎn)生筆跡的研究建議(見L.Schomaker和H.Teulings的文章“A Handwriting Recognition System basedon the Properties and Architectures of the Human Motor System”Proceedings of the International Workshop on Frontiers inHandwriting Recognition(IWFHR)195-211頁.MontrealCENPARMIConcordia,1990)筆劃的垂直部分(即Y坐標(biāo))具有最高的信噪比(SNR)并且包括比水平部分更多的信息。為了對此進(jìn)行利用,一系列加權(quán)被應(yīng)用到特征的Y坐標(biāo),結(jié)果顯示在圖4中。Y加權(quán)的最佳值被發(fā)現(xiàn)為大約1.5。
插入/刪除花費(cdel and cins)與替換花費(csub)之間的比率將會影響所述最佳路徑計算,并且從而影響檢索程序的精度。此比率可以通過應(yīng)用一個權(quán)重α來改變,使
圖5示出了改變替換權(quán)重參數(shù)的結(jié)果,使用權(quán)重1(即不加權(quán))產(chǎn)生的結(jié)果接近于最佳結(jié)果。
性能最佳化 通過對檢索程序過程的描述,可以看到主要的時間花在了歐幾里得距離計算上。為了提高性能,替換使用了具有加權(quán)系數(shù)的平方的歐幾里得距離,在速度提高了25%的情況下產(chǎn)生同樣的精度。通過展開所述平方的歐幾里得距離計算可獲得進(jìn)一步的改進(jìn)。
為了進(jìn)一步地提高性能,可以使用標(biāo)準(zhǔn)的K-means clustering(見R.Duda和P.Hart,Pattern Classification and Scene Analysis,Wiley Interscience,1973年)來實現(xiàn)對子筆劃的矢量量化,其中,歐幾里得距離計算被碼字距離的表格查找所代替(距離權(quán)重的最佳化被詳細(xì)地描述在圖6中)。但是,盡管這樣做比最佳平方歐幾里得距離技術(shù)產(chǎn)生35%的性能提高,檢索結(jié)果的精度受到了相反的影響。所述性能最佳化結(jié)果被匯總在表3中最佳化性能精度歐幾里得距離1.000.67平方的歐幾里得距離0.760.64展開的ED循環(huán)0.610.64矢量量化0.392.43 表3.性能最佳化結(jié)果 全筆劃匹配 上面描述的試驗允許將查詢與檢索數(shù)據(jù)庫中任意的子串匹配。但是,不允許子筆劃匹配并且要求待被完全匹配或者完全不匹配的筆劃能夠得到高精度的結(jié)果。為此,對表示一筆劃中第一子筆劃的檢索矩陣中的所有的列設(shè)置d0,j=0,否則 d0,j=d0,j-1+cdel(yj)1≤j≤n 另外,分?jǐn)?shù)只在筆劃邊界處計算(即在數(shù)據(jù)庫中的整個筆劃已經(jīng)被匹配之后)。使用此方法,可提高檢索的精度,與上面給出的之前的最好結(jié)果0.64相比具有0.17的精度結(jié)果。表4示出了這些結(jié)果,以及最差匹配的等級以及其正確結(jié)果的等級被定為第1級的查詢的百分?jǐn)?shù)名稱精度最差等級 定為1級子筆劃匹配0.6424 82%全筆劃匹配0.178 93% 表4.全筆劃匹配結(jié)果 很明顯,如果所述檢索不需要子筆劃匹配,強制筆劃完整匹配會導(dǎo)致更加精確的查詢結(jié)果。
因此,基于在Y極值處分割的筆劃使用匹配程序可獲得改進(jìn)的檢索結(jié)果,其中,每個子筆劃由所述區(qū)域標(biāo)準(zhǔn)化的坐標(biāo)的一個特征組來表示,優(yōu)選地為四個等距離的點??梢酝ㄟ^在特征組中對Y坐標(biāo)進(jìn)行加權(quán)來獲得精度上的附加增益。使用全筆劃匹配程序,93%的查詢將正確的位置作為最好的匹配返回,同時最壞的結(jié)果將正確的位置定級到第八位置。
上面討論的所有算法執(zhí)行線性時間檢索。高級的性能可以使用索引或者過濾技術(shù)來獲得。另外,可以分析字的邊界,這對于提高字級別匹配可能是有用的。類似的技術(shù)也可以用于使用手繪查詢檢索圖象數(shù)據(jù)庫。
因此,已經(jīng)根據(jù)本發(fā)明提供了一種方法和裝置,用以提供可以由一手寫的檢索查詢來檢索或者索引的電子文件管理系統(tǒng)。
本發(fā)明也可以從廣義上說單獨地包括在本申請的說明書中提及或指示的部件、單元以及特征,或者組合地包括所述部件、單元以及特征中的一個或多個的任意或所有組合,這里提到具有本發(fā)明涉及的現(xiàn)有技術(shù)中的已知等效技術(shù)的特定的整數(shù),該已知等效技術(shù)被認(rèn)為包括在其中,如同單獨描述的一樣。
盡管詳細(xì)地描述了優(yōu)選的實施方式,應(yīng)該理解的是可以由本領(lǐng)域中的普通技術(shù)人員在不脫離這里描述的以及后面權(quán)利要求的范圍的情況下作出各種改變、替換以及變更。
權(quán)利要求
1.一種提供可以使用手寫的檢索查詢來檢索的電子文件管理系統(tǒng)的方法,所述方法包括下列步驟
使用輸入裝置獲得手寫檢索查詢;
根據(jù)所述手寫檢索查詢與在交互式頁面上所作的手寫注釋之間的對比,對至少一個數(shù)據(jù)庫進(jìn)行檢索,所述交互式頁面存儲在所述至少一個數(shù)據(jù)庫中;以及
向用戶提供檢索結(jié)果并且使用戶能夠容易地訪問檢索結(jié)果中標(biāo)識的至少一交互式頁面。
2.如權(quán)利要求1所述的方法,其中,通過打印檢索結(jié)果中標(biāo)識的交互式頁面,可更容易地實現(xiàn)對所述交互式頁面的訪問。
3.如權(quán)利要求1或2所述的方法,其中,所述手寫檢索查詢從輸入裝置與一交互式頁面的交互中獲得。
4.如權(quán)利要求1-3中任何一項所述的方法,其中,訪問檢索結(jié)果中標(biāo)識的交互式頁面在一顯示裝置上給顯示用戶。
5.如權(quán)利要求1-4中任何一項所述的方法,其中,手寫注釋是筆跡、符號、繪圖、標(biāo)記等。
6.如權(quán)利要求1-5中任何一項所述的方法,其中,所述輸入裝置是成象筆。
7.如權(quán)利要求1-6中任何一項所述的方法,其中,所述手寫檢索查詢影響對用于手寫注釋與交互式頁面內(nèi)容組合的至少一個數(shù)據(jù)庫的檢索。
8.如權(quán)利要求1-7中任何一項所述的方法,其中,所述手寫檢索查詢使對手寫注釋所進(jìn)行的查詢在一指定文本字符串的給定物理距離內(nèi)。
9.如權(quán)利要求1-8中任何一項所述的方法,其中,所述手寫檢索查詢試圖匹配與一交互式頁面上的文本字符串相關(guān)的一手繪的環(huán)、下劃線、彎曲線、十字形、抑揚符號、星號等中的一項。
10.如權(quán)利要求1-9中任何一項所述的方法,其中,所述方法被用于定位電子文件,所述電子文件使用手寫注釋來索引或者分類。
11.如權(quán)利要求1-10中任何一項所述的方法,其中,所述輸入裝置的附加屬性和/或交互式頁面被用于允許更多的靈活檢索。
12.如權(quán)利要求11所述的方法,其中,所述附加屬性包括
手寫注釋完成的日期或時間;
所使用的特定的輸入裝置;
手寫注釋完成的地理位置;
手寫注釋在交互式頁面上的物理位置;
與包含所述手寫注釋的頁面區(qū)域相關(guān)的軟件應(yīng)用程序;
手寫注釋;和/或
手寫注釋完成的字段類型。
13.如權(quán)利要求1-12中任何一項所述的方法,其中,所述至少一個數(shù)據(jù)庫可以通過一網(wǎng)絡(luò)進(jìn)行遠(yuǎn)程檢索。
14.如權(quán)利要求1-13中任何一項所述的方法,其中,所述交互式頁面、所述輸入裝置以及所述至少一個數(shù)據(jù)庫形成網(wǎng)頁系統(tǒng)的一部分。
15.如權(quán)利要求6所述的方法,其中,所述檢索通過以下步驟完成
將在所述至少一個數(shù)據(jù)庫中的手寫注釋分割成分段筆劃,并且將所述分段筆劃映射到第一序列的特征表示;
將所述手寫檢索查詢分割成分段筆劃,并且將所述分段筆劃映射到第二序列的特征表示;
對第一序列的特征表示以及第二序列的特征表示上執(zhí)行一個編輯距離計算;以及
通過從編輯距離計算定位最小值來確定在所述至少一個數(shù)據(jù)庫中的手寫注釋與手寫檢索查詢之間的匹配。
16.如權(quán)利要求15所述的方法,其中,所述編輯距離計算使用子筆劃插入,子筆劃刪除和/或子筆劃替換。
17.如權(quán)利要求15或16所述的方法,其中,使用在筆劃的垂直軸(Y)極值坐標(biāo)處的分割。
18.如權(quán)利要求15到17中任何一項所述的方法,其中,使用一種區(qū)域標(biāo)準(zhǔn)化坐標(biāo)的方法將所述分割的筆劃映射到特征表示中。
19.如權(quán)利要求15到18中任何一項所述的方法,其中,一個加權(quán)系數(shù)被應(yīng)用到特征表示的垂直軸線(Y)坐標(biāo)。
20.如權(quán)利要求15到19中任何一項所述的方法,其中,所述分割的筆劃經(jīng)歷矢量量化,且編輯距離計算被一碼字距離查詢表所取代。
21.如權(quán)利要求15到20中任何一項所述的方法,其中,所述方法使用檢索查詢的全筆劃匹配。
22.如權(quán)利要求1-14中任何一項所述的方法,其中,所述至少一個數(shù)據(jù)庫是一個數(shù)字圖象數(shù)據(jù)庫,包括圖片、圖畫、圖象、圖形等。
23.一種提供可以使用手寫的檢索查詢來檢索的電子文件管理系統(tǒng)的方法,所述方法包括下列步驟
使用成象筆捕獲數(shù)字墨水成象筆以形成一個手寫的檢索查詢;
將所述手寫檢索查詢提交到至少一個數(shù)據(jù)庫;
根據(jù)手寫的檢索查詢與交互式頁面上所作的手寫注釋之間的對照,對所述至少一數(shù)據(jù)庫進(jìn)行檢索,所述交互式網(wǎng)頁存儲在至少一個數(shù)據(jù)庫中;以及
提供檢索結(jié)果并且使得對在檢索結(jié)果中標(biāo)識的交互式頁面副本的訪問更容易。
24.一種提供可以使用手寫的檢索查詢來檢索的電子文件管理系統(tǒng)的裝置,所述裝置包括
(1)至少一個用于存儲交互式頁面的數(shù)據(jù)庫;
(2)成象筆一輸入裝置;
(3)用戶提供或顯示一交互式頁面的裝置;
(4)一個處理器,所述處理器可以適用于
(A)從輸入裝置接收手寫檢索查詢;
(B)向所述至少一個數(shù)據(jù)庫提交所述手寫檢索查詢;
由此,根據(jù)手寫的檢索查詢與在存儲在所述至少一個數(shù)據(jù)庫中的交互式頁面上所作的手寫注釋之間的對照,對所述至少一數(shù)據(jù)庫進(jìn)行檢索,并且所述檢索結(jié)果被提供或者顯示給用戶。
25.如權(quán)利要求24所述的裝置,其中,所述用戶能夠訪問在檢索結(jié)果中標(biāo)識的交互式頁面。
26.如權(quán)利要求24或25所述的裝置,其中,所述裝置或者其部件適合于執(zhí)行如權(quán)利要求1到23中任何一項所述的方法。
27.如權(quán)利要求24所述的裝置,其中,所述用于向用戶提供交互式頁面的裝置是打印機。
28.如權(quán)利要求24所述的裝置,其中,所述用于向用戶顯示交互式頁面的裝置是顯示裝置。
29.如權(quán)利要求24到28中任何一項所述的裝置,其中,所述處理器通過一計算機網(wǎng)絡(luò)與所述至少一個數(shù)據(jù)庫通信。
30.如權(quán)利要求24到29中任何一項所述的裝置,其中,所述輸入裝置是成象筆。
31.如權(quán)利要求24到30中任何一項所述的裝置,其中,所述至少一個數(shù)據(jù)庫包括可檢索的圖片、圖畫、圖象、圖形等。
32.一種提供可以使用手寫的檢索查詢來檢索的電子文件管理系統(tǒng)的裝置,所述裝置包括
(1)至少一個用于存儲交互式頁面的數(shù)據(jù)庫;
(2)一成象筆,用于產(chǎn)生形成手寫檢索查詢的數(shù)字墨水;
(3)用戶訪問交互式頁面的裝置;
(4)一個處理器,所述處理器適用于
(A)從成象筆接收手寫檢索查詢;
(B)向所述至少一個數(shù)據(jù)庫提交所述手寫檢索查詢;
由此,根據(jù)手寫的檢索查詢與在存儲在至少一個數(shù)據(jù)庫中的交互式頁面上所作的手寫注釋之間的對照,對所述至少一數(shù)據(jù)庫進(jìn)行檢索,并且檢索結(jié)果可以由用戶訪問。
全文摘要
一種可以提供電子文件管理系統(tǒng)的方法,所述電子文件管理系統(tǒng)可以使用一手寫檢索查詢來檢索,所述方法包括下列步驟使用一輸入裝置獲取所述手寫檢索查詢;根據(jù)手寫檢索查詢與交互式頁面上所作的筆跡注釋之間的對照,對至少一數(shù)據(jù)庫進(jìn)行檢索,所述交互式頁面存儲在所述至少一個數(shù)據(jù)庫中;以及向用戶提供結(jié)果并且使其能夠訪問檢索結(jié)果中標(biāo)識的至少一交互式頁面。還公開了一裝置。優(yōu)選地,所述交互式頁面以打印的紙件形式提供給用戶,并且所述手寫注釋是用戶筆跡、符號、圖形、標(biāo)記等等。
文檔編號G06K9/34GK1625741SQ03803078
公開日2005年6月8日 申請日期2003年1月13日 優(yōu)先權(quán)日2002年1月31日
發(fā)明者喬納森·利·納珀, 保羅·拉普施特恩, 卡·西爾弗布魯克 申請人:西爾弗布魯克研究有限公司