專利名稱:圖像要素檢索的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種檢索平臺(tái),該檢索平臺(tái)能夠?qū)ξ募奈淖趾屠L圖部分中的要素進(jìn)行檢索和關(guān)聯(lián)。通過(guò)定位和關(guān)聯(lián)文件的文字和繪圖部分中的要素,該檢索平臺(tái)能夠讓用戶快速并且高效地查看和分析文件全文中的要素。
圖1表示本發(fā)明的檢索平臺(tái)架構(gòu)的實(shí)施例。在所示實(shí)施例中,用戶操作客戶端100 可通過(guò)網(wǎng)絡(luò)105訪問(wèn)服務(wù)器110。服務(wù)器110可配置有檢索引擎120,檢索引擎120可與文件集合130連接,并且在某些實(shí)施例中可與元數(shù)據(jù)140連接。
文件集合130可包括一個(gè)以上的用于保存文件的數(shù)據(jù)庫(kù)。上述文件可具有用于以不同方式表述信息的不同部分,例如,文字部分(包含文本、段落、標(biāo)題、符號(hào)、代碼等)以及繪圖部分(包含圖像、插圖、圖表、線圖、地圖、照片、簡(jiǎn)圖、表格等),或者上述文件可以是通過(guò)若干種引用或者指示符將文字和繪圖部分關(guān)聯(lián)起來(lái)的不同文件。在文件數(shù)據(jù)庫(kù)內(nèi)保存的示例性文件包括至少含有一張圖形、繪圖、線圖、符號(hào)、地圖、照片、簡(jiǎn)圖、圖表等的文件,這些圖形、繪圖、線圖、符號(hào)、地圖、照片、簡(jiǎn)圖、繪圖等(“繪圖”)包括或者可能包括說(shuō)明性文本,該說(shuō)明性文本是對(duì)一部分繪圖的說(shuō)明,并以某種方式顯示在繪圖和文本中的相應(yīng)位置。 示例性文件還可以包括技術(shù)或醫(yī)學(xué)類期刊、書(shū)籍或論文、法律文件和意見(jiàn)、雜志、廣告、市場(chǎng)文件、照片、網(wǎng)頁(yè)、地圖、建筑繪圖、工程繪圖、工藝與操作手冊(cè)、以及軟件手冊(cè)。在其它實(shí)施例中,文件可以包括諸如與一個(gè)以上國(guó)家專利局相關(guān)的專利和/或?qū)@_(kāi)文本等法律文件。元數(shù)據(jù)140可以包括一個(gè)以上的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)用于存儲(chǔ)與文件相關(guān)的數(shù)據(jù)(例如, 與各個(gè)文件相關(guān)的要素的列表、以及上述要素在各個(gè)文件的各部分中的相關(guān)位置的列表)。 在一個(gè)實(shí)施例中,要素對(duì)應(yīng)于專利文件中的與諸如數(shù)字符號(hào)或者字母符號(hào)等引用標(biāo)識(shí)符相關(guān)的主題。
檢索引擎120可以采用多種方式來(lái)檢索和識(shí)別位于文件的不同部分中的要素。在某些實(shí)施例中,如圖2和圖3所示,基于用戶在文件的第二部分中所作的要素的指示,檢索引擎120能夠識(shí)別該要素在文件的第一部分中的位置。在其它實(shí)施例中,如圖4所示,基于用戶在檢索請(qǐng)求中所作的要素的指示,檢索引擎120能夠識(shí)別該要素在文件的各部分中的位置。
在圖2所示的實(shí)施例中,客戶端100可向檢索引擎120提供一個(gè)以上的與文件的文字部分相關(guān)的要素的指示(框200)。客戶端100可以以任何合適的方式提供該指示。例如,在一個(gè)實(shí)施例中,要素可以包括后面帶有引用標(biāo)識(shí)符的文本,并且當(dāng)向客戶端100顯示文件的文字部分中的要素的指示時(shí),可以用包括鼠標(biāo)、指針設(shè)備、鍵盤(pán)、手寫(xiě)筆等的選擇裝置選擇文本和/或引用標(biāo)識(shí)符或在文本和/或引用標(biāo)識(shí)符上方滾過(guò)(roll over),以由此提供該要素的指示。
響應(yīng)于指示,檢索引擎120能夠確定所指示的要素在文件的繪圖部分或者在另一文件的繪圖部分中的一個(gè)以上的位置(框210)。位置的判斷方式可以有很多種。在一個(gè)實(shí)施例中,例如,檢索引擎120能夠通過(guò)對(duì)文件的繪圖部分進(jìn)行光學(xué)識(shí)別來(lái)當(dāng)場(chǎng)確定所述一個(gè)以上位置。例如,光學(xué)識(shí)別能夠?qū)ふ遗c所指示的要素相關(guān)的文字和/或引用標(biāo)識(shí)符。在其它實(shí)施例中,能夠在圖像匹配方法中通過(guò)利用要素?cái)?shù)據(jù)庫(kù)來(lái)識(shí)別和檢索出繪圖要素或符號(hào)的形狀。此外,元數(shù)據(jù)或者其它類型的標(biāo)簽可以與繪圖要素相關(guān)聯(lián),并且用于檢索與該標(biāo)簽相鏈接的相應(yīng)數(shù)據(jù)庫(kù)。在其它示例中,圖案、明暗度、顏色、或者其它圖形圖案可用于識(shí)別繪圖要素。
一旦確定所有要素在繪圖部分中的位置,檢索引擎120可向客戶端100提供所確定的一個(gè)或多個(gè)位置(框220),以用于顯示(框230)。在繪圖部分中顯示要素的方式有很多種。在一個(gè)實(shí)施例中,例如,檢索引擎120可通過(guò)高亮顯示與所指示的要素相關(guān)的任何上述文字和/或引用標(biāo)識(shí)符、從這些文字和/或引用標(biāo)識(shí)符引出的引線以及與引線連接的任何線來(lái)顯示所述一個(gè)以上的位置。在其它實(shí)施例中,檢索引擎120可高亮顯示與所指示的要素相關(guān)的文本和/或引用標(biāo)識(shí)符、從這些文本和/或引用標(biāo)識(shí)符引出或與之相關(guān)的引線或者諸如鏈接、電子標(biāo)簽或者元數(shù)據(jù)等其它標(biāo)識(shí)符、以及繪圖部分的由這些引線指示的任何部分(例如,與引線連接的任何線、或者不與線連接且包圍引線的端部或與之相關(guān)的任何區(qū)域)中的一者或多者。此外,可以用諸如不同的顏色、明暗度或者圖案等其它不同方式來(lái)高亮顯示所指示的要素。
在圖3所示的實(shí)施例中,客戶端100可向檢索引擎120提供與文件的繪圖部分相關(guān)的一個(gè)以上要素的指示(框300)??蛻舳?00可以以任何合適的方式提供該指示。例如,在一個(gè)實(shí)施例中,要素可以包括文字和/或引用標(biāo)識(shí)符,并且當(dāng)向客戶端100顯示文件的繪圖部分中的要素的指示時(shí),可以通過(guò)諸如指針設(shè)備等選擇裝置來(lái)選擇文字和/或引用標(biāo)識(shí)符或在文字和/或引用標(biāo)識(shí)符上方滾過(guò),以提供要素的指示。
響應(yīng)于指示,檢索引擎120可確定所指示的要素在文件的文字部分中的一個(gè)以上的位置(框310)。判斷位置的方式可以有很多種。在一個(gè)實(shí)施例中,例如,檢索引擎120可通過(guò)檢索文件內(nèi)的文字字段或者另一文件內(nèi)的文字字段來(lái)確定引用標(biāo)識(shí)符和相關(guān)文本的一個(gè)以上位置。在其它實(shí)施例中,檢索引擎120可對(duì)文件的文字部分進(jìn)行光學(xué)識(shí)別,以尋找諸如圖形、顏色、符號(hào)、照片、圖案等任何非文本性字符。例如,光學(xué)識(shí)別可尋找與所指示的要素相關(guān)的文字和/或引用標(biāo)識(shí)符。如果文件已具有嵌入的元數(shù)據(jù)或者標(biāo)簽,也能夠利用這些圖案在文件或其源編碼部分中檢索標(biāo)識(shí)符。
此外,在其它實(shí)施例中,響應(yīng)于指示,檢索引擎120可通過(guò)使用要素的文本引用的組合、用于圖形或圖像檢索的圖像查詢、或者這兩者的組合,來(lái)創(chuàng)建檢索查詢,并然后對(duì)含有圖形部分和/或文本部分的其它文件進(jìn)行該檢索查詢,從而確定所指示的要素在其它文件的數(shù)據(jù)庫(kù)的文字部分中的一個(gè)以上的位置(框310)。上述檢索的結(jié)果將顯示每個(gè)檢索結(jié)果的文本部分和/或繪圖部分。根據(jù)本文所描述的檢索方法來(lái)執(zhí)行檢索。
一旦確定所有要素在文字部分中的位置,檢索引擎120可向客戶端100提供所確定的一個(gè)或多個(gè)位置(框320),以進(jìn)行顯示(框330)。在文字部分中顯示要素的方式有很多種。在一個(gè)實(shí)施例中,例如,檢索引擎120可通過(guò)高亮顯示與所指示的要素相關(guān)的任何文本和/或引用標(biāo)識(shí)符來(lái)顯示所述一個(gè)以上的位置。此外,可以諸如在計(jì)算機(jī)屏幕上通過(guò)不同的顏色、明暗度、圖案或者在不同的視覺(jué)區(qū)域中進(jìn)行顯示等其它不同方式來(lái)高亮顯示所指示的要素。
圖4表示用于檢索文件以及在結(jié)果文件中識(shí)別相應(yīng)要素的請(qǐng)求屏幕的實(shí)施例。在所示實(shí)施例中,請(qǐng)求屏幕400包含請(qǐng)求字段410和檢索按鈕420。請(qǐng)求字段410可從用戶操作客戶端100接收用于構(gòu)成檢索項(xiàng)的輸入。輸入可以包括諸如單詞、短語(yǔ)或者其它文本描述等數(shù)據(jù)。能夠輸入和檢索的非文本描述包括數(shù)字、圖形、符號(hào)、元數(shù)據(jù)、或者標(biāo)簽。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到,所列舉的示例僅僅是示例性的,輸入和檢索文件的其它方式也包括在實(shí)施例的范圍內(nèi)。在請(qǐng)求區(qū)域410中輸入檢索項(xiàng)之后,用戶可點(diǎn)擊檢索按鈕420,檢索按鈕420用于命令檢索引擎120檢索所有文件,并在與如下主題相關(guān)的文件中識(shí)別所有的相應(yīng)要素,該主題與輸入的檢索項(xiàng)具有類似性。
檢索引擎120以多種方式對(duì)諸如文件集合130等文件集合進(jìn)行檢索。如圖5的實(shí)施例所示,例如,檢索引擎120可接收由諸如請(qǐng)求屏幕400等用戶界面提供的檢索項(xiàng)(框 500)。檢索引擎120可基于接收到的檢索項(xiàng)產(chǎn)生查詢(框510),并且對(duì)文件集合執(zhí)行查詢 (框 520)。
在一個(gè)實(shí)施例中,例如,檢索引擎120可采用全文檢索法來(lái)識(shí)別文件集合中的任何如下文件,該文件包括所提供的檢索項(xiàng)中的任一者。在另一個(gè)實(shí)施例中,檢索引擎120可采用基于向量的檢索法來(lái)識(shí)別文件集合中的如下文件,該文件與所提供的檢索項(xiàng)具有相似性。
在采用基于向量的檢索法的實(shí)施例中,檢索引擎120可以為文件向量創(chuàng)建查詢, 文件向量是基于所接收的檢索項(xiàng)而產(chǎn)生的。例如,文件向量可以是單詞和短語(yǔ)的權(quán)重賦值列表,例如舉個(gè)簡(jiǎn)單的例子
[桌子,1][椅子,0.5][盤(pán)子,0.2]
一旦創(chuàng)建了查詢文件向量,檢索引擎120對(duì)查詢文件向量和檢索文件向量進(jìn)行比較,所述檢索文件向量是為文件集合130中的每個(gè)待檢索文件預(yù)先創(chuàng)建的。例如,該比較可以包括將查詢文件向量和各個(gè)檢索文件向量之中的所有共同項(xiàng)的權(quán)重進(jìn)行相乘,并將結(jié)果相加,以得到相似度等級(jí)。再舉個(gè)簡(jiǎn)單的例子
查詢文件向量[桌子,1][椅子,0. 5][盤(pán)子,0. 2]
檢索文件向量[杯子,1][茶碟,0. 7][椅子,0. 6][盤(pán)子,0. 5]
相似度=0.5*0. 6+0. 2*0. 5 = 0. 4
如果相似度等級(jí)超出預(yù)設(shè)閾值,檢索引擎120可以認(rèn)為與檢索文件向量相關(guān)聯(lián)的文件是匹配文件。
在上述基于向量的檢索方法中,在文件集合130中保存的每個(gè)文件可與一個(gè)以上的文件向量相關(guān)聯(lián)。例如,由于諸如專利文件等文件例如通常具有規(guī)定數(shù)量的章節(jié)以便符合法定的提交要求,所以可以為專利文件的各個(gè)部分創(chuàng)建不同的文件向量,以使得檢索引擎120能夠?yàn)閷@募木唧w章節(jié)定制檢索。此外,可以調(diào)整文件向量以除去所提供的檢索項(xiàng)中的非相關(guān)單詞或者短語(yǔ),從而產(chǎn)生更小和更簡(jiǎn)明的文件向量,由此能夠提高查詢處理的效率,這是因?yàn)闄z索引擎120處理被刪字符串不花費(fèi)時(shí)間。
圖6表示用于對(duì)能夠通過(guò)檢索引擎120顯示的文件進(jìn)行識(shí)別的顯示屏幕的實(shí)施例。在所示實(shí)施例中,顯示屏幕600包括說(shuō)明書(shū)窗口 610,說(shuō)明書(shū)窗口 610將專利文件的文字部分顯示給客戶端100。如圖7所示,檢索引擎120還可以提供與文字部分中的諸如所顯示的要素620(“WHEEL150”)等要素相關(guān)的功能,以使用戶能夠在文件的與要素620相關(guān)的繪圖部分中定位這些要素。如上面參照?qǐng)D2所述,該功能可以有很多種。
例如,在一個(gè)實(shí)施例中,該功能可以基于點(diǎn)擊輸入事件。在該實(shí)施例中,可在所顯示的文字部分中將要素表示為可點(diǎn)擊的鏈接,使得在通過(guò)諸如與客戶端100相關(guān)的指針設(shè)備等選擇裝置進(jìn)行選擇時(shí),能夠提供所選擇的要素在文件的繪圖部分中的任一位置,以用于顯示(例如,對(duì)應(yīng)于框220)。在另一個(gè)實(shí)施例中,該功能可基于滾過(guò)輸入事件。在本實(shí)施例中,可以以如下方式在所顯示的文字部分中表示要素在與客戶端100相關(guān)的選擇裝置位于要素附近或者在其上方滾過(guò)時(shí),能夠提供所滾過(guò)的要素在文件繪圖部分中的任一位置,以用于顯示(例如,對(duì)應(yīng)于框220)。
圖7表示用于對(duì)文件的文字和繪圖部分中的要素進(jìn)行識(shí)別的顯示屏幕的實(shí)施例。在所示實(shí)施例中,一旦在說(shuō)明書(shū)窗口 610中接收到要素620的指示(例如,對(duì)應(yīng)于框200), 檢索引擎120可提供繪圖窗口 700,以識(shí)別文件的繪圖部分中的所指示的要素。雖然圖7所示實(shí)施例通過(guò)高亮顯示與所指示的要素相關(guān)的引用標(biāo)識(shí)符(例如“150”)、從該引用標(biāo)識(shí)符引出的引線以及與引線相連的線來(lái)識(shí)別繪圖窗口 700中的所指示的要素,但如上所述,能夠識(shí)別所指示的要素的方式可以有多種。
文字部分和繪圖部分一起顯示的方式可以有多種。例如,如圖7的實(shí)施例所示,在顯示屏幕600中,可以將繪圖窗口 700提供在說(shuō)明書(shū)窗口 610附近。在另一個(gè)實(shí)施例中, 例如,檢索引擎120可以在顯示屏幕600中以與說(shuō)明書(shū)窗口 610重疊的方式提供繪圖窗口 700,例如,將繪圖窗口 700提供在鼠標(biāo)懸停(mouseover)窗口 /氣泡提示框中。在又一實(shí)施例中,檢索引擎120可以在不同于顯示屏幕600的其它屏幕中提供繪圖窗口 700。
而且,根據(jù)圖3所示,以與上述類似的方式,檢索引擎120還可以顯示文件的繪圖部分、接收由用戶在繪圖部分中制作的要素的指示、以及為用戶定位和識(shí)別文件的文字部分中的所指示的要素。而且,根據(jù)與圖4相關(guān)的實(shí)施例,以與上述相似的方式,響應(yīng)于用于指定檢索項(xiàng)的請(qǐng)求,檢索引擎120可以提供顯示屏幕,以用于識(shí)別文件的文字和/或繪圖部分中的與所指定的檢索項(xiàng)相匹配的一個(gè)以上的要素。
檢索引擎120還可以提供如下功能,即,搜索引擎120在目前顯示的窗口中對(duì)要素進(jìn)行連續(xù)定位和顯示。實(shí)施該功能的方式可以有很多種。在一個(gè)實(shí)施例中,例如,如圖6和圖7所示,可以通過(guò)分別“查找下一個(gè)”按鈕和“查找上一個(gè)按鈕”(例如,按鈕630和按鈕 640)的方式實(shí)現(xiàn)該功能。該功能能夠在窗口中定位和顯示高亮顯示的特定要素或者任何要ο
確定要素在文件的特定部分中的位置的方式可以有很多種。在一個(gè)實(shí)施例中,例如,在接收到要素(例如,用戶對(duì)所顯示的文件中的要素的選擇或者基于檢索項(xiàng)的文件請(qǐng)求)的指示時(shí),檢索引擎120可通過(guò)分析文件的特定部分來(lái)確定要素的位置。在另一個(gè)實(shí)施例中,檢索引擎120可通過(guò)分析所保存的與文件相關(guān)的元數(shù)據(jù)(例如,如圖8所示,保存在數(shù)據(jù)結(jié)構(gòu)中的元數(shù)據(jù))來(lái)確定要素的位置。在該實(shí)施例中,可以在用戶在所顯示的文件中選擇要素之前或者在基于檢索項(xiàng)請(qǐng)求文件之前(例如,在文件集合130被編譯或者編制索引時(shí))產(chǎn)生元數(shù)據(jù)。
圖8表示與文件元數(shù)據(jù)相關(guān)的數(shù)據(jù)結(jié)構(gòu)的實(shí)施例。在所示實(shí)施例中,元數(shù)據(jù)140 可以包括文件數(shù)據(jù)、要素?cái)?shù)據(jù)、繪圖位置數(shù)據(jù)以及文字位置數(shù)據(jù)。例如,文件數(shù)據(jù)能夠識(shí)別文件集合130中的文件。要素?cái)?shù)據(jù)可以與文件數(shù)據(jù)相關(guān),并且能夠識(shí)別文件的文字和/或繪圖部分中的一個(gè)或多個(gè)要素。繪圖位置數(shù)據(jù)和文字位置數(shù)據(jù)可以與要素?cái)?shù)據(jù)相關(guān),并且能夠分別識(shí)別相關(guān)文件的繪圖和文字部分中的相應(yīng)要素的繪圖和文字位置。
例如,在圖8所示的實(shí)施例中,文件A可以識(shí)別文件集合130中的文件。要素A、B 和C可以通過(guò)指針或者其它合適的數(shù)據(jù)結(jié)構(gòu)機(jī)制與文件A相關(guān),并且能夠識(shí)別文件A的文字部分中的不同要素。繪圖位置Al和A2可以通過(guò)指針或者其它合適的數(shù)據(jù)結(jié)構(gòu)機(jī)制與要素A相關(guān),并且能夠識(shí)別要素A在文件A的繪圖部分中的位置。同樣,文字位置Al和A2可以通過(guò)指針或者其它合適的數(shù)據(jù)結(jié)構(gòu)機(jī)制與要素A相關(guān),并且能夠識(shí)別要素A在文件A的文字部分中的位置。要素B可以與繪圖位置數(shù)據(jù)或者文字位置數(shù)據(jù)不相關(guān),這意味著在文件A的文字或者繪圖部分中不存在要素B。連續(xù)的點(diǎn)代表可以以這種方式表示任一數(shù)量的文件和要素。
雖然將文件集合130和元數(shù)據(jù)140示出為圖1所示實(shí)施例中的不同數(shù)據(jù)庫(kù),但是在其它實(shí)施例中,文件集合130和元數(shù)據(jù)140中所包含的數(shù)據(jù)可以共同保存在一個(gè)以上的數(shù)據(jù)庫(kù)或者其它合適的存儲(chǔ)介質(zhì)中。
圖9表示用于將文件的文字部分中的要素與文件的繪圖部分中的要素相關(guān)聯(lián)的過(guò)程的實(shí)施例。該過(guò)程可以由處理單元執(zhí)行,以能夠構(gòu)架例如圖8所示的數(shù)據(jù)結(jié)構(gòu)。在圖 9所示的實(shí)施例中,處理單元可以通過(guò)任何合適的方式來(lái)識(shí)別文件中的要素(框900)。在一個(gè)實(shí)施例中,例如,要素可以是指與文件的文字或者繪圖部分中的諸如數(shù)字或者字符集等引用標(biāo)識(shí)符相關(guān)的任何名詞/名詞短語(yǔ)或者圖形表示,并且處理單元可以通過(guò)對(duì)引用標(biāo)識(shí)符進(jìn)行例如全文檢索和/或光學(xué)識(shí)別來(lái)識(shí)別要素。一旦或者在識(shí)別出文件中的要素時(shí), 處理單元能夠確定所識(shí)別的要素在文件的文字部分中的位置(框910)以及在文件的繪圖部分中的位置(框920)。由處理單元確定的位置信息可以包括任何合適的數(shù)據(jù),這些數(shù)據(jù)反映出文件中的與所識(shí)別的要素相關(guān)聯(lián)的部分。一旦確定位置信息,處理單元可以以例如圖8所示的數(shù)據(jù)結(jié)構(gòu)等形式將確定的位置與它們對(duì)應(yīng)的識(shí)別要素關(guān)聯(lián)起來(lái)(框930)。
圖10表示計(jì)算裝置的示例的框圖,該計(jì)算裝置通常可以對(duì)應(yīng)于客戶端100和服務(wù)器110。計(jì)算裝置1000的結(jié)構(gòu)可以有很多種。例如,計(jì)算裝置1000可以是個(gè)人計(jì)算機(jī)、工作站、服務(wù)器、手持計(jì)算裝置,或者任何其它合適類型的基于微處理器的裝置。計(jì)算裝置1000 可以例如包括一個(gè)以上的部件,這些部件包括處理器1010、輸入設(shè)備1020、輸出裝置1030、 存儲(chǔ)器1040以及通信裝置1060。這些部件可以有很多種,并且能夠以諸如物理總線、網(wǎng)線或者無(wú)線等任何合適的方式互相連接。
例如,輸入設(shè)備1020可以包括鍵盤(pán)、鼠標(biāo)、觸摸屏幕或者監(jiān)視器、語(yǔ)音識(shí)別裝置、 或者任何其它用于提供輸入的合適裝置。輸出設(shè)備1030可以例如包括監(jiān)視器、打印機(jī)、磁盤(pán)驅(qū)動(dòng)器、揚(yáng)聲器,或者任何其它用于提供輸出的合適裝置。
存儲(chǔ)器1040可以包括諸如一個(gè)或多個(gè)電、磁或者光存儲(chǔ)器等易失性/或非易失性數(shù)據(jù)存儲(chǔ)器,例如,RAM、cache、硬盤(pán)、CD-ROM驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器或者可移動(dòng)存儲(chǔ)磁盤(pán)。通信裝置1060可以例如包括網(wǎng)絡(luò)接口卡、調(diào)制解調(diào)器或者能夠在網(wǎng)上收發(fā)信號(hào)的任何其它合適的元件。
例如,網(wǎng)絡(luò)105可以包括諸如局域網(wǎng)(LAN)或者寬域網(wǎng)(WAN)等任何合適的互連通信系統(tǒng)。網(wǎng)絡(luò)105可以采用任何合適通信協(xié)議,并且能夠利用任何合適的安全協(xié)議來(lái)保證安全。對(duì)應(yīng)的網(wǎng)絡(luò)鏈路可以例如包括電話線、DSL、電纜網(wǎng)絡(luò)、Tl或者T3線、無(wú)線網(wǎng)絡(luò)連接,或者用于傳輸和接收網(wǎng)絡(luò)信號(hào)的任何其它合適的布置。
軟件1050能夠保存在存儲(chǔ)器1040中,并且由處理器1010執(zhí)行,并且軟件1050可以例如包括用于實(shí)現(xiàn)本發(fā)明的各種實(shí)施例中描述的功能的編制程序。上述編制程序可以采用任何合適的形式。例如,在一個(gè)實(shí)施例中,用于實(shí)現(xiàn)檢索引擎120的文件集合檢索功能的程序可以基于微軟公司的FAST企業(yè)檢索平臺(tái)(FAST Enterprise Search Platform)等企業(yè)檢索平臺(tái)。
軟件1050還可以保存在指令執(zhí)行系統(tǒng)、設(shè)備或裝置(例如,計(jì)算設(shè)備1000)所使用的或與之相關(guān)的任何計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,或者在這些計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中傳輸, 上述指令執(zhí)行系統(tǒng)、設(shè)備或裝置能夠從指令執(zhí)行系統(tǒng)、設(shè)備或裝置獲取與該軟件相關(guān)的指1令,并且執(zhí)行該指令。在本文中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是諸如存儲(chǔ)器1040等任何介質(zhì), 上述介質(zhì)可以含有或者保存由指令執(zhí)行系統(tǒng)、設(shè)備或者裝置使用的或與之相關(guān)的編制程序。
軟件1050還可以在指令執(zhí)行系統(tǒng)、設(shè)備或裝置(例如,計(jì)算設(shè)備1000)所使用的或與之相關(guān)的任何傳輸介質(zhì)內(nèi)傳輸,上述指令執(zhí)行系統(tǒng)、設(shè)備或者裝置能夠從指令執(zhí)行系統(tǒng)、設(shè)備或者裝置獲取與該軟件相關(guān)的指令,并且執(zhí)行該指令。在本文中,傳輸介質(zhì)可以是能夠通信、傳輸或者傳送指令執(zhí)行系統(tǒng)、設(shè)備或裝置(例如,計(jì)算設(shè)備1000)所使用的或與之相關(guān)的程序的任何介質(zhì)。傳輸可讀介質(zhì)能夠包括但不限于電、磁、光、電磁或者紅外線的有線或無(wú)線傳輸介質(zhì)。
相關(guān)領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以使用所公開(kāi)的實(shí)施例的多種合理的變形和組合,盡管這些變形和組合仍然采用本質(zhì)上相同的機(jī)制和方法。出于說(shuō)明的目的,上文說(shuō)明是參照具體實(shí)施例進(jìn)行的。然而,上述描述性的討論并不意味著完全涵蓋本發(fā)明或者將本發(fā)明限制到本文公開(kāi)的具體內(nèi)容。根據(jù)上述啟示,可以進(jìn)行很多合理的修改和變化。選擇并說(shuō)明了實(shí)施例,以便闡明本發(fā)明的原理以及它們的實(shí)際應(yīng)用,并使得本領(lǐng)域的其它技術(shù)人員能夠最佳地利用本發(fā)明和各種實(shí)施例及其變形,以適用于所期望的特定用途。
此外,盡管本說(shuō)明書(shū)包括很多細(xì)節(jié),但是這些細(xì)節(jié)不應(yīng)當(dāng)視為對(duì)所要求保護(hù)或者能夠要求保護(hù)的權(quán)利要求的范圍的限制,而應(yīng)當(dāng)視為對(duì)特定實(shí)施例所特有的特征的說(shuō)明。 在本說(shuō)明書(shū)中的不同實(shí)施例中所描述的某些特征也能夠在單個(gè)實(shí)施例中組合實(shí)施。相反地,在單個(gè)實(shí)施例中所描述的各種特征也可以在多個(gè)實(shí)施例中單獨(dú)地或者以任何合適的次組合(subcombination)方式實(shí)施。而且,盡管特征被如上描述為在某些組合中起作用以及甚至在如最初要求保護(hù)的那樣起作用,但是也可以將要求保護(hù)的組合中的一個(gè)或者多個(gè)特征從該組合刪除,并且所要求保護(hù)的組合可以是次組合或者次組合的變形。
權(quán)利要求
1.一種系統(tǒng),所述系統(tǒng)包括檢索引擎,所述檢索引擎由微處理器執(zhí)行,并且用于接收與文件的文字部分相關(guān)的要素的指示,在繪圖部分中確定與所述要素相關(guān)的位置,所述繪圖部分是所述文件的繪圖部分或另一文件的繪圖部分,以及提供所確定的位置以用于顯示。
2.如權(quán)利要求1所述的系統(tǒng),其中,所述檢索引擎通過(guò)接收選擇裝置對(duì)所述文字部分中顯示的所述要素所作的選擇來(lái)接收所述要素的所述指示。
3.如權(quán)利要求1所述的系統(tǒng),其中,所述檢索引擎在指針裝置位于所述文字部分中的所述要素上方時(shí)接收所述要素的所述指示。
4.如權(quán)利要求1所述的系統(tǒng),其還包括所述檢索引擎基于與所述要素相關(guān)的所述繪圖部分從文件數(shù)據(jù)庫(kù)檢索其它繪圖部分, 所述要素與所述文字部分相關(guān)。
5.如權(quán)利要求1所述的系統(tǒng),其中,所述文件包括法律文件,以及所述檢索引擎通過(guò)接收用于識(shí)別所述要素的請(qǐng)求來(lái)接收所述要素的所述指示,以對(duì)法律文件集合進(jìn)行檢索。
6.如權(quán)利要求1所述的系統(tǒng),其中,響應(yīng)于所述要素的所述指示的接收,所述檢索引擎通過(guò)分析所述文件的所述繪圖部分來(lái)確定所述繪圖部分中的所述位置。
7.如權(quán)利要求1所述的系統(tǒng),其中,所述檢索引擎通過(guò)分析保存的與所述文件或者所述另一文件相關(guān)的元數(shù)據(jù)來(lái)確定所述繪圖部分中的所述位置。
8.如權(quán)利要求1所述的系統(tǒng),其中,所述要素與引用標(biāo)識(shí)符相關(guān),并且所述檢索引擎通過(guò)從所述繪圖部分檢索所述引用標(biāo)識(shí)符來(lái)確定所述位置。
9.如權(quán)利要求1所述的系統(tǒng),其中,所述檢索引擎在與顯示所述文件的所述文字部分的窗口不同的窗口中提供所確定的位置以用于顯示。
10.如權(quán)利要求1所述系統(tǒng),其中,所述檢索引擎通過(guò)高亮顯示所述繪圖部分中的所述要素來(lái)提供所確定的位置以用于顯示。
11.如權(quán)利要求1所述的系統(tǒng),其中,所述文件是專利或者專利申請(qǐng)。
12.—種系統(tǒng),所述系統(tǒng)包括搜索引擎,所述搜索引擎由微處理器執(zhí)行,并且用于接收與文件的繪圖部分相關(guān)的要素的指示,在文字部分中確定與所述要素相關(guān)的位置,所述文字部分是所述文件的文字部分或另一文件的文字部分,以及提供所確定的位置以用于顯示。
13.如權(quán)利要求12所述的系統(tǒng),其中,所述檢索引擎通過(guò)接收指針裝置對(duì)所述繪圖中顯示的所述要素所作的選擇來(lái)接收所述要素的所述指示。
14.如權(quán)利要求12所述的系統(tǒng),其中,所述檢索引擎在指針裝置位于所述繪圖部分中的所述要素上方時(shí)接收所述要素的所述指示。
15.如權(quán)利要求12所述的系統(tǒng),所述系統(tǒng)還包括所述檢索引擎基于與所述要素相關(guān)的所述繪圖部分從文件數(shù)據(jù)庫(kù)檢索其它繪圖部分, 所述要素與所述文字部分相關(guān)。
16.如權(quán)利要求12所述的系統(tǒng),其中, 所述文件包含法律文件,以及所述檢索引擎通過(guò)接收用于識(shí)別所述要素的請(qǐng)求來(lái)接收所述要素的所述指示,以對(duì)法律文件集合進(jìn)行檢索。
17.如權(quán)利要求12所述的系統(tǒng),其中,響應(yīng)于所述要素的所述指示的接收,所述檢索引擎通過(guò)分析所述文件的所述文字部分來(lái)確定所述文字部分中的所述位置。
18.如權(quán)利要求12所述的系統(tǒng),其中,所述檢索引擎通過(guò)分析保存的與所述文件相關(guān)的元數(shù)據(jù)來(lái)確定所述文字部分中的所述位置。
19.如權(quán)利要求12所述的系統(tǒng),其中,所述要素與引用標(biāo)識(shí)符相關(guān),并且所述檢索引擎通過(guò)從所述文字部分檢索所述引用標(biāo)識(shí)符來(lái)確定所述位置。
20.如權(quán)利要求12所述的系統(tǒng),其中,所述檢索引擎在與顯示所述文件的所述繪圖部分的窗口不同的窗口中提供所確定的位置以用于顯示。
21.如權(quán)利要求12所述的系統(tǒng),其中,所述文件是專利或者專利申請(qǐng)。
22.一種方法,其包括通過(guò)由微處理器執(zhí)行的處理單元識(shí)別文件中的要素;通過(guò)所述處理單元在所述文件的文字部分中確定與所識(shí)別的要素相關(guān)的位置; 通過(guò)所述處理單元在所述文件的繪圖部分中確定與所識(shí)別的要素相關(guān)的位置;并且通過(guò)所述處理單元將所識(shí)別的要素與所確定的位置之間的相關(guān)性保存在存儲(chǔ)器中。
23.如權(quán)利要求22所述的方法,其中,所述要素與引用標(biāo)識(shí)符相關(guān),并且所述處理單元通過(guò)從所述文字部分和所述繪圖部分檢索所述引用標(biāo)識(shí)符來(lái)確定所述位置。
24.一種編碼有數(shù)據(jù)結(jié)構(gòu)的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其包括 第一數(shù)據(jù),其用于識(shí)別文件;第二數(shù)據(jù),其與所述第一數(shù)據(jù)相關(guān),并且所述第二數(shù)據(jù)用于識(shí)別所述文件中引用的要素;第三數(shù)據(jù),其與所述第二數(shù)據(jù)相關(guān),并且所述第三數(shù)據(jù)用于在所述文件的第一部分中識(shí)別與所述要素相關(guān)的位置;以及第四數(shù)據(jù),其與所述第二數(shù)據(jù)相關(guān),并且所述第四數(shù)據(jù)用于在所述文件的第二部分中或另一文件的一部分中識(shí)別與所述要素相關(guān)的位置。
25.如權(quán)利要求M的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其還包括第五數(shù)據(jù),其用于識(shí)別從文件數(shù)據(jù)庫(kù)檢索的其它繪圖部分的檢索結(jié)果,所述檢索結(jié)果是基于所述第三數(shù)據(jù)中的所述繪圖部分進(jìn)行定位的。
26.如權(quán)利要求M的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述要素與引用標(biāo)識(shí)符相關(guān)。
27.一種用于保存指令的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述指令可由計(jì)算機(jī)執(zhí)行以用于執(zhí)行搜索引擎,所述搜索引擎用于接收與文件的文字部分相關(guān)的要素的指示,在所述文件的繪圖部分中或另一文件的繪圖部分中確定與所述要素相關(guān)的位置,以及提供所確定的位置以用于顯示。
28.一種用于保存指令的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述指令可由計(jì)算機(jī)執(zhí)行以用于執(zhí)行搜索引擎,所述搜索引擎用于接收與文件的繪圖部分相關(guān)的要素的指示,在所述文件的文字部分中或另一文件的文字部分中確定與所述要素相關(guān)的位置,以及提供所確定的位置以用于顯示。
全文摘要
本發(fā)明涉及能夠?qū)ξ募奈淖趾屠L圖部分中的要素進(jìn)行檢索和關(guān)聯(lián)的檢索平臺(tái)。檢索引擎能夠接收與文件的文字部分相關(guān)的要素的指示、在文件的繪圖部分中確定與所述要素相關(guān)的位置、以及提供所確定的位置以用于顯示。相反地,檢索引擎也能夠接收與文件的繪圖部分相關(guān)的要素的指示、在文件的文字部分中確定與所述要素相關(guān)的位置、以及提供所確定的位置以用于顯示。所述要素是指任何與一個(gè)或者多個(gè)文件的文字或繪圖部分中的唯一字母數(shù)字標(biāo)識(shí)符或者符號(hào)標(biāo)識(shí)符相關(guān)的文字的、符號(hào)的、或者編碼的短語(yǔ)或者圖形表示。
文檔編號(hào)G06F17/24GK102483747SQ200980160860
公開(kāi)日2012年5月30日 申請(qǐng)日期2009年8月11日 優(yōu)先權(quán)日2009年8月11日
發(fā)明者蘭迪·拉卡斯 申請(qǐng)人:Cpa全球?qū)@芯坑邢薰?br>