亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

從結(jié)構(gòu)化數(shù)據(jù)中提取高階知識(shí)的制作方法

文檔序號(hào):6424364閱讀:169來(lái)源:國(guó)知局
專利名稱:從結(jié)構(gòu)化數(shù)據(jù)中提取高階知識(shí)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息搜索,尤其涉及從結(jié)構(gòu)化數(shù)據(jù)中提取高階知識(shí)。
背景技術(shù)
當(dāng)前,萬(wàn)維網(wǎng)通過(guò)借助于Web的通信,提供作為數(shù)據(jù)存儲(chǔ)數(shù)百萬(wàn)計(jì)算機(jī)管理的存儲(chǔ)設(shè)備上的巨大的信息源。如此處所使用的,“信息”或“內(nèi)容”可以表示在計(jì)算設(shè)備的網(wǎng)絡(luò)中可用的任何類型和形式的信息性材料以及處理器可執(zhí)行應(yīng)用程序,例如,文本、聲音(例如,歌曲),數(shù)值(例如,圖、表)、視頻、視聽(tīng)、歷史、統(tǒng)計(jì)、交互式網(wǎng)頁(yè)、腳本等等。當(dāng)今,人可以幾乎在世界上的任何位置使用個(gè)人計(jì)算機(jī)或移動(dòng)通信設(shè)備來(lái)輕松地訪問(wèn)巨大的信息源。雖然巨大的信息量輕松地可用,但是,人或網(wǎng)絡(luò)的“用戶”搜索并檢索用戶所希望的特定內(nèi)容常常是困難的。例如,當(dāng)使用當(dāng)前搜索工具時(shí),可能向用戶返回?cái)?shù)千或數(shù)百萬(wàn)的 “命中”,可以按照與由用戶輸入的關(guān)鍵字的接近度,與標(biāo)識(shí)網(wǎng)頁(yè)的索引中所保留的單詞進(jìn)行比較,并按照當(dāng)前流行度,例如,基于到網(wǎng)頁(yè)的多個(gè)鏈接,對(duì)“命中”進(jìn)行排序。某個(gè)人所希望的特定內(nèi)容可能不是流行的,在可以由用戶標(biāo)識(shí)并檢索所希望的內(nèi)容之前,對(duì)其檢索可能需要大量的搜索和/或繁瑣地查看數(shù)以百計(jì)的“命中”。在許多情況下,傳統(tǒng)的搜索引擎返回與用戶所希望的信息不相干的過(guò)多的“命中”。同樣,所希望的內(nèi)容可能以難以表達(dá)為傳統(tǒng)的搜索查詢的方式與其他內(nèi)容關(guān)聯(lián)。

發(fā)明內(nèi)容
本發(fā)明提供了用于標(biāo)識(shí)可以表征將響應(yīng)用戶對(duì)所需內(nèi)容的請(qǐng)求的信息的高階知識(shí)的方法和系統(tǒng)。在各個(gè)方面,高階知識(shí)由根據(jù)特定結(jié)構(gòu)類型(例如,列表、表、序列、電子表格等等)而結(jié)構(gòu)化的數(shù)據(jù)的存在來(lái)表示。包括約束、規(guī)則、表達(dá)式,和條件的任何組合的關(guān)系框架可以管控?cái)?shù)據(jù)的結(jié)構(gòu)化,并表示高階知識(shí)。約束、規(guī)則、表達(dá)式,和條件可以將特定數(shù)據(jù)與其他數(shù)據(jù)綁定、相關(guān)和/或相關(guān)聯(lián)。在各實(shí)施方式中,可以由可由計(jì)算機(jī)執(zhí)行的至少一個(gè)計(jì)算表達(dá)式來(lái)標(biāo)識(shí)和表示關(guān)系框架??梢韵蛐畔z索系統(tǒng)(例如,具有適用于在搜索棧中使用計(jì)算表達(dá)式的搜索引擎的系統(tǒng))提供計(jì)算表達(dá)式??梢允褂么颂幩枋龅南到y(tǒng)和方法例如來(lái)通過(guò)查找和檢索具有在由計(jì)算表達(dá)式捕捉到的高階知識(shí)中反映的特征的內(nèi)容, 來(lái)搜索可在萬(wàn)維網(wǎng)上獲得的所需內(nèi)容。與傳統(tǒng)的搜索方法相比,使用高階知識(shí)的搜索方法, 可以更高效地搜索巨大的數(shù)據(jù)庫(kù),且更準(zhǔn)確地標(biāo)識(shí)用戶所需內(nèi)容。在某些實(shí)施方式中,由信息檢索系統(tǒng)或中介根據(jù)接收到的數(shù)據(jù)確定表示關(guān)系框架的計(jì)算表達(dá)式,接收到的數(shù)據(jù)被以自動(dòng)化或半自動(dòng)化方式處理,以標(biāo)識(shí)關(guān)系框架,并將它轉(zhuǎn)換為一個(gè)或多個(gè)計(jì)算表達(dá)式。在某些實(shí)施方式中,可以基于與由信息檢索系統(tǒng)接收到的數(shù)據(jù)相關(guān)聯(lián)的元數(shù)據(jù),來(lái)標(biāo)識(shí)計(jì)算表達(dá)式和/或關(guān)系框架。在某些情況下,可以可另選地基于模式匹配或其他處理技術(shù)來(lái)標(biāo)識(shí)關(guān)系框架??梢韵蛩阉鳁L峁┯尚畔z索系統(tǒng)標(biāo)識(shí)的任何計(jì)算表達(dá)式,以便包括在搜索過(guò)程中。搜索??梢愿鶕?jù)計(jì)算表達(dá)式來(lái)定位、檢索和/或過(guò)濾數(shù)據(jù)。以此方式,可以將反映高階知識(shí)的搜索結(jié)果返回到請(qǐng)求所需內(nèi)容的用戶。
此處描述了用于搜索并檢索多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備上的信息的系統(tǒng)。該系統(tǒng)包括至少一個(gè)被配置成從至少一個(gè)聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)設(shè)備接收數(shù)據(jù)的輸入組件,以及至少一個(gè)被配置成向至少一個(gè)信息檢索系統(tǒng)傳輸數(shù)據(jù)的輸出組件。該系統(tǒng)還包括適用于接收根據(jù)至少一個(gè)關(guān)系框架結(jié)構(gòu)化的數(shù)據(jù)的至少一個(gè)處理器。在各實(shí)施方式中,關(guān)系框架表示高階知識(shí)的至少一個(gè)特征。處理器還可以適用于處理接收到的數(shù)據(jù)以標(biāo)識(shí)至少一個(gè)關(guān)系框架,并將關(guān)系框架表示為一個(gè)或多個(gè)計(jì)算表達(dá)式。在各實(shí)施方式中,計(jì)算表達(dá)式可由至少一個(gè)計(jì)算機(jī)處理器執(zhí)行。標(biāo)識(shí)關(guān)系框架并將它表示為一個(gè)或多個(gè)計(jì)算表達(dá)式的處理器可以向適用于將計(jì)算表達(dá)式包括在搜索棧中的信息檢索系統(tǒng)提供計(jì)算表達(dá)式,而搜索棧定位并檢索用戶所需內(nèi)容。還可和如上文所描述的系統(tǒng)一起執(zhí)行有用的方法。在一個(gè)實(shí)施方式中,用于搜索和檢索存儲(chǔ)在多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備上的信息的方法包括由與信息檢索系統(tǒng)進(jìn)行通信的至少一個(gè)處理器接收根據(jù)至少一個(gè)關(guān)系框架結(jié)構(gòu)化的數(shù)據(jù)。該方法還可以包括由至少一個(gè)處理器處理接收到的數(shù)據(jù)以標(biāo)識(shí)關(guān)系框架,并由至少一個(gè)處理器將關(guān)系框架表示為一個(gè)或多個(gè)計(jì)算表達(dá)式,這些計(jì)算表達(dá)式可由至少一個(gè)計(jì)算機(jī)處理器執(zhí)行??梢岳斫?,本發(fā)明可以作為計(jì)算機(jī)可執(zhí)行指令或代碼被包含在制造的非瞬態(tài)計(jì)算機(jī)存儲(chǔ)介質(zhì)中。在各實(shí)施方式中,指令由基于計(jì)算機(jī)處理器的系統(tǒng)讀取,并使系統(tǒng)適應(yīng)以執(zhí)行如上文所描述的方法步驟,或如下面所描述的本發(fā)明的替換實(shí)施方式的方法步驟。以上發(fā)明內(nèi)容是對(duì)由所附權(quán)利要求定義的本發(fā)明的非限定性的概述。


附圖不旨在按比例繪制。在附圖中,各個(gè)附圖形中示出的每一完全相同或近乎完全相同的組件由同樣的標(biāo)號(hào)來(lái)表示。出于簡(jiǎn)明的目的,不是每個(gè)組件在每張附圖中均被標(biāo)號(hào)。在圖形中圖1是示出其中可以實(shí)施本發(fā)明的一些實(shí)施方式的計(jì)算環(huán)境的高級(jí)框圖;圖2是適用于執(zhí)行與數(shù)據(jù)關(guān)系的高階知識(shí)相關(guān)聯(lián)的計(jì)算表達(dá)式的搜索棧的實(shí)施方式的體系結(jié)構(gòu)框圖;圖3描繪了可以包括聲明性模型的規(guī)范的語(yǔ)句類型;圖4是諸如那些可以為圖3的聲明性模型指定的語(yǔ)句的示例的圖示;圖5是根據(jù)某些實(shí)施方式的可以在搜索棧執(zhí)行期間執(zhí)行的過(guò)程的流程圖;圖6是用戶可以用來(lái)輸入搜索查詢并查看響應(yīng)于查詢返回的顯示的信息的用戶界面的示例;圖7A是示出用于標(biāo)識(shí)表示關(guān)系框架的計(jì)算表達(dá)式的系統(tǒng)的實(shí)施方式的框圖;圖7B描繪了根據(jù)高階知識(shí)的數(shù)據(jù)關(guān)系的實(shí)施方式;以及圖8A-8B是描繪用于標(biāo)識(shí)表示用于基于高階知識(shí)的搜索的關(guān)系框架的計(jì)算表達(dá)式的方法的實(shí)施方式的流程圖。
具體實(shí)施例方式概覽此處所描述的方法和系統(tǒng)實(shí)施方式涉及從結(jié)構(gòu)化數(shù)據(jù)標(biāo)識(shí)可以用于基于計(jì)算機(jī)處理器的信息檢索系統(tǒng)中的高階知識(shí)??梢詫⒏唠A知識(shí)格式化,以便信息檢索系統(tǒng)可以應(yīng)用知識(shí)以定位和檢索系統(tǒng)的用戶所需內(nèi)容和/或數(shù)據(jù)?;诟唠A知識(shí)的搜索可以提高信息檢索系統(tǒng)標(biāo)識(shí)用戶所需內(nèi)容和數(shù)據(jù)的效率和準(zhǔn)確性。為便于理解,下面定義了在本發(fā)明中所使用的多個(gè)術(shù)語(yǔ)。術(shù)語(yǔ)“高階知識(shí)”是指定義反映在一組數(shù)據(jù)中的模式、關(guān)系、規(guī)則等等的抽象推理。術(shù)語(yǔ)“結(jié)構(gòu)化數(shù)據(jù)”被用來(lái)指代具有結(jié)構(gòu)的數(shù)據(jù)塊或組。術(shù)語(yǔ)“結(jié)構(gòu)類型”被用來(lái)指代諸如數(shù)據(jù)的表、列表、序列或電子表格等可標(biāo)識(shí)結(jié)構(gòu)類型。術(shù)語(yǔ)“關(guān)系框架”被用來(lái)指代將特定數(shù)據(jù)相關(guān)到結(jié)構(gòu)化數(shù)據(jù)集中的其他數(shù)據(jù)的規(guī)則、表達(dá)式、綁定、計(jì)算等等??梢杂斜硎靖唠A知識(shí)的特征并反映在結(jié)構(gòu)化數(shù)據(jù)中的規(guī)則、表達(dá)式、綁定、計(jì)算或其他計(jì)算表達(dá)式的任何組合。術(shù)語(yǔ)“計(jì)算表達(dá)式”被用來(lái)指代表示為計(jì)算機(jī)代碼或以任何其他合適的機(jī)器語(yǔ)言表示的計(jì)算機(jī)可執(zhí)行表達(dá)式。作為引言和出于啟發(fā)式目的,現(xiàn)在將描述高階知識(shí)標(biāo)識(shí)和基于高階知識(shí)的搜索的示例。常規(guī)搜索引擎適用于爬行網(wǎng)絡(luò)以標(biāo)識(shí)在向搜索引擎展示的網(wǎng)頁(yè)、網(wǎng)站或任何數(shù)據(jù)存儲(chǔ)中標(biāo)識(shí)的項(xiàng)或關(guān)鍵字。這些項(xiàng)可以被用來(lái)索引頁(yè)面、站點(diǎn)或數(shù)據(jù)存儲(chǔ)。然而,常規(guī)搜索引擎不適用于提取如何在這些信息源中組織內(nèi)容的高階知識(shí)。例如,一個(gè)信息源處的數(shù)據(jù)可包括與從該信息源可用的其他數(shù)據(jù)相關(guān)的數(shù)據(jù)。如果在對(duì)數(shù)據(jù)進(jìn)行排序中固有的高階知識(shí)是已知的,并可以由信息檢索系統(tǒng)應(yīng)用,則信息檢索系統(tǒng)可以更好地定位對(duì)用戶請(qǐng)求作出響應(yīng)的信息。在某些實(shí)施方式中,信息檢索系統(tǒng)可以處理接收到的數(shù)據(jù),以標(biāo)識(shí)數(shù)據(jù)中隱式地或顯式地包含的關(guān)系框架。此關(guān)系框架可以按可以由信息檢索系統(tǒng)在響應(yīng)于用戶請(qǐng)求生成信息時(shí)應(yīng)用的格式來(lái)表示。在某些實(shí)施方式中,高階知識(shí)可以被表示為可以包含一個(gè)或多個(gè)表示等式、約束或規(guī)則的計(jì)算表達(dá)式的信息模型。帶有可以反映隱式高階知識(shí)的組織的數(shù)據(jù)結(jié)構(gòu)類型的簡(jiǎn)單示例是電子表格、列表、表或序列。高階知識(shí)的其他示例包括圖、圖表、 關(guān)系圖等等。在各實(shí)施方式中,本發(fā)明的信息檢索系統(tǒng)適用于標(biāo)識(shí)表示在網(wǎng)絡(luò)上向搜索引擎展示的數(shù)據(jù)中的高階知識(shí)的關(guān)系框架,并生成捕捉高階知識(shí)的一個(gè)或多個(gè)計(jì)算表達(dá)式。 可以將一個(gè)或多個(gè)計(jì)算表達(dá)式包括到現(xiàn)有模型中,或者可以定義由信息檢索系統(tǒng)使用的新模型中。但是,應(yīng)該理解,被處理以生成表示高階知識(shí)的模型的數(shù)據(jù)可以來(lái)自任何合適的源,在某些實(shí)施方式中,可以提供專門用于生成供信息檢索系統(tǒng)使用的模型的數(shù)據(jù)。作為具有隱式高階知識(shí)的結(jié)構(gòu)化數(shù)據(jù)的一個(gè)示例,考慮存儲(chǔ)由政府機(jī)構(gòu)提供的調(diào)查結(jié)果或統(tǒng)計(jì)結(jié)果的文檔,其中按重要性的順序列出了影響房屋買主的決定的五個(gè)引用最多的因素(F1,F(xiàn)2,...F5)。這些因素可以是Fl 鄰近地區(qū),F(xiàn)2 價(jià)格,F(xiàn)3 大小,F(xiàn)4 與工作單位的距離,以及F5 房齡。這些因素可以在示出因素以及該因素被引用的次數(shù)的有序列表或表中提供。數(shù)據(jù)的列表或表揭示表示高階知識(shí)的關(guān)系框架。此處所描述的信息檢索系統(tǒng)可以標(biāo)識(shí)由數(shù)據(jù)展示的關(guān)系框架,例如,影響房屋購(gòu)買的五個(gè)最重要的因素的有序列表, 并在由信息檢索系統(tǒng)執(zhí)行的搜索類型中,以一個(gè)或多個(gè)計(jì)算表達(dá)式的形式使用此信息。作為在一個(gè)或多個(gè)計(jì)算表達(dá)式中捕捉的所提取的高階知識(shí)如何對(duì)信息檢索系統(tǒng)有利的示例, 考慮下面的簡(jiǎn)單情況。基于計(jì)算機(jī)處理器的信息檢索系統(tǒng)的用戶可以在搜索查詢中輸入“房屋”、“房地產(chǎn)經(jīng)紀(jì)人”和“Eastowne”等項(xiàng),以便查找有關(guān)festowne附近待售的房屋的信息。搜索查詢的項(xiàng)可以搜索的上下文的一部分。但是,對(duì)信息檢索系統(tǒng)可用的任何信息都可以構(gòu)成上下文,包括由用戶進(jìn)行的以前的搜索,用戶簡(jiǎn)檔,或有關(guān)用戶的其他信息。在此示例中,上下文可以表示用戶正在查找festowne村的待售的房屋。信息檢索系統(tǒng)可以在搜索棧中包含捕捉期待購(gòu)買房屋的人按特定重要性順序加權(quán)五個(gè)因素的高階知識(shí)的計(jì)算表達(dá)式。信息檢索系統(tǒng)可以定位、檢索,以及向用戶提供反映高階知識(shí)以及可任選地響應(yīng)于與高階知識(shí)相關(guān)聯(lián)的提示由用戶提供的任何附加輸入的搜索結(jié)果。以此方式,可以更高效地檢索到與用戶的需求有關(guān)的用戶所需內(nèi)容。可以理解,可以標(biāo)識(shí)并挖掘上面所列的其他類型的結(jié)構(gòu)化數(shù)據(jù),以獲取表示高階知識(shí)的關(guān)系框架。一旦標(biāo)識(shí)了關(guān)系框架,就可以由信息檢索系統(tǒng)和/或由捕捉高階知識(shí)的系統(tǒng)的用戶來(lái)生成一個(gè)或多個(gè)計(jì)算表達(dá)式。然后,可以將計(jì)算表達(dá)式包含在搜索棧中,以更高效并準(zhǔn)確地向系統(tǒng)的用戶提供搜索結(jié)果。作為另一個(gè)示例,可以預(yù)期,結(jié)構(gòu)化數(shù)據(jù),例如,根據(jù)一個(gè)或多個(gè)關(guān)系框架組織的數(shù)據(jù)和/或內(nèi)容,對(duì)于通過(guò)信息檢索系統(tǒng)訪問(wèn)和搜索將變得越來(lái)越重要。目前,數(shù)據(jù)所有者 /發(fā)布者開(kāi)始向搜索引擎展示真正簡(jiǎn)單聚合(RSS)web饋源,web服務(wù)和電子表格文件。然而,搜索引擎目前沒(méi)有被配置成捕捉和索引有關(guān)數(shù)據(jù)和/或發(fā)布者/所有者擁有的或可以由數(shù)據(jù)的聚集者或者管理者添加的內(nèi)容之間的關(guān)系的高階知識(shí)。作為另一個(gè)示例,通過(guò)處理表示RSS饋源(表示來(lái)自氣象臺(tái)的數(shù)據(jù))的數(shù)據(jù),可以標(biāo)識(shí)符號(hào)“。C”、時(shí)間和表示特定時(shí)間時(shí)的溫度的值之間的關(guān)系。利用常規(guī)搜索引擎,指定一個(gè)查詢以使用常規(guī)搜索查詢來(lái)返回該信息將是困難的。如果用戶正在搜索某一時(shí)間間隔平均或最高溫度,則難度將更大。然而,通過(guò)在模型中捕捉反映在RSS饋源中的數(shù)據(jù)的排序的較高階知識(shí),可以通過(guò)應(yīng)用該模型,自動(dòng)地生成所需信息。同樣,世界的大量結(jié)構(gòu)化數(shù)據(jù)是以電子表格形式存在的??梢允褂秒娮颖砀駚?lái)合并和關(guān)聯(lián)來(lái)自不同的源的數(shù)據(jù),整理,并共享數(shù)據(jù)。電子表格內(nèi)的信息可隱式地和/或顯式地包括有關(guān)數(shù)據(jù)的高階知識(shí),例如,以計(jì)算出的列及其他計(jì)算關(guān)系的形式存在的知識(shí)。目前,搜索引擎沒(méi)有辦法從電子表格或其他類型的結(jié)構(gòu)化數(shù)據(jù)和/或內(nèi)容中提取此高階知識(shí),并以可能影響搜索結(jié)果的方式索引知識(shí)。此外,除例如由電子表格所提供的含義以外, 數(shù)據(jù)和內(nèi)容所有者、發(fā)布者、聚集者或者管理者沒(méi)有辦法將高階知識(shí)添加到它們的數(shù)據(jù)中。 具體而言,表示有關(guān)結(jié)構(gòu)化數(shù)據(jù)的高階知識(shí)的等式、約束和規(guī)則目前沒(méi)有被向搜索引擎展

在本發(fā)明的各實(shí)施方式中,至少一個(gè)計(jì)算機(jī)處理器適用于標(biāo)識(shí)表示結(jié)構(gòu)化數(shù)據(jù)的高階知識(shí)的關(guān)系框架。對(duì)關(guān)系框架的標(biāo)識(shí)可以包括標(biāo)識(shí)或生成表示關(guān)系框架的至少一個(gè)計(jì)算表達(dá)式??梢韵蛐畔z索系統(tǒng)提供計(jì)算表達(dá)式用于在聯(lián)網(wǎng)的計(jì)算環(huán)境中搜索用戶所需內(nèi)容。系統(tǒng)實(shí)施方式圖1是示出其中可以實(shí)施本發(fā)明的一些實(shí)施方式的計(jì)算環(huán)境100的高級(jí)圖示。計(jì)算環(huán)境100包括與計(jì)算設(shè)備105交互的用戶102。計(jì)算設(shè)備105可以是任何合適的計(jì)算設(shè)備,諸如臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、移動(dòng)電話、或PDA。計(jì)算設(shè)備105可以在任何合適的計(jì)算體系結(jié)構(gòu)下操作,并且包括諸如由微軟公司開(kāi)發(fā)的WINDOWS 操作系統(tǒng)的變體等任何合適的操作系統(tǒng)。
計(jì)算設(shè)備105可以具有經(jīng)由任何合適的有線或無(wú)線通信介質(zhì)來(lái)與服務(wù)器106通信的能力。在計(jì)算設(shè)備105與服務(wù)器106之間的通信可以經(jīng)由計(jì)算機(jī)網(wǎng)絡(luò)108,該計(jì)算機(jī)網(wǎng)絡(luò) 108可以是諸如因特網(wǎng)、公司內(nèi)聯(lián)網(wǎng)、或蜂窩網(wǎng)絡(luò)等任何適當(dāng)數(shù)量或類型的電信網(wǎng)絡(luò)。服務(wù)器106可以使用任何合適的計(jì)算體系結(jié)構(gòu)來(lái)實(shí)現(xiàn),并且可以被配置有諸如由微軟公司開(kāi)發(fā)的WINDOWS 操作系統(tǒng)的變體等任何合適的操作系統(tǒng)。此外,雖然在圖1中服務(wù)器106被示為單個(gè)計(jì)算機(jī),但它可以是被配置成用作相干系統(tǒng)的任何合適數(shù)量的計(jì)算機(jī),例如服務(wù)器場(chǎng)、中介處理設(shè)備和服務(wù)器,或者中介和服務(wù)器場(chǎng)。中介處理設(shè)備可被設(shè)置在服務(wù)器和網(wǎng)絡(luò)之間的系統(tǒng)中,并且管理去往和來(lái)自服務(wù)器的通信。在圖1的示例中,服務(wù)器106或服務(wù)器的代理或中介(兩者都未示出)可用作搜索引擎,以允許用戶102檢索與搜索查詢相關(guān)的信息。用戶可以諸如以任何合適的方式(諸如經(jīng)由鍵盤、鍵區(qū)、鼠標(biāo)或語(yǔ)音輸入)通過(guò)將查詢術(shù)語(yǔ)輸入到計(jì)算設(shè)備105來(lái)顯式地指定查詢。 Additionally and/or alternatively, the user may provide an implicit query. 例如,計(jì)算設(shè)備105可以配備有(或經(jīng)由有線或無(wú)線連接來(lái)連接到)數(shù)碼相機(jī)110。諸如對(duì)象、場(chǎng)景、條形碼掃描等取自數(shù)碼相機(jī)110的圖像可以用作隱式查詢。無(wú)論由觸發(fā)查詢的生成的用戶102提供的輸入類型是什么,計(jì)算設(shè)備105可以將查詢發(fā)送給服務(wù)器106以獲得與該查詢相關(guān)的信息。當(dāng)檢索諸如例如網(wǎng)頁(yè)等與搜索查詢相關(guān)的數(shù)據(jù)之后,服務(wù)器106可以將一個(gè)或多個(gè)模型應(yīng)用于該數(shù)據(jù)以生成返回給用戶102的信息。在某些實(shí)施方式中,一個(gè)或多個(gè)模型可以結(jié)合搜索查詢來(lái)應(yīng)用以反映信息檢索系統(tǒng)如何定位和檢索用戶所需信息。由服務(wù)器106生成的信息可以經(jīng)由計(jì)算機(jī)網(wǎng)絡(luò)108來(lái)發(fā)送, 并且在計(jì)算設(shè)備105的顯示器104上顯示。顯示器104可以是任何合適的顯示器,包括IXD 或CRT顯示器,并且可以是內(nèi)置或外置于計(jì)算設(shè)備105。圖2是根據(jù)某些實(shí)施方式的諸如可由圖1的服務(wù)器106實(shí)現(xiàn)的搜索棧200的體系結(jié)構(gòu)框圖。搜索棧200的組件可以諸如出于負(fù)載平衡或冗余的目的、使用任何合適的配置或任何數(shù)量的計(jì)算設(shè)備來(lái)實(shí)現(xiàn)。例如,結(jié)合搜索棧的每一組件來(lái)描述的功能可以通過(guò)被配置成擔(dān)當(dāng)相干系統(tǒng)的不同物理計(jì)算機(jī)或基于處理器的設(shè)備來(lái)執(zhí)行,和/或單個(gè)物理計(jì)算機(jī)可以執(zhí)行歸結(jié)到多個(gè)組件的功能。另外,在某些實(shí)施方式中,可以將歸結(jié)到搜索棧的單個(gè)組件的某種功能分布到多個(gè)物理計(jì)算機(jī)或基于處理器的設(shè)備,物理計(jì)算機(jī)中的每一個(gè)可以并行地執(zhí)行搜索計(jì)算的不同部分。無(wú)論搜索棧200的具體配置是什么,可以將用戶查詢202作為輸入經(jīng)由計(jì)算機(jī)聯(lián)網(wǎng)通信介質(zhì)來(lái)提供給搜索棧200,例如結(jié)合網(wǎng)絡(luò)輸入到個(gè)人計(jì)算機(jī)或PDA中。用戶查詢可以是隱式的或顯式的,如結(jié)合圖1所討論的。在圖2的示例中,可以將用戶查詢202提供給搜索棧200中的輸入組件,諸如搜索引擎204,它可以是任何合適的搜索引擎,諸如由微軟公司開(kāi)發(fā)的BING ^索引擎。搜索引擎204可以與包括數(shù)據(jù)索引206的一個(gè)或多個(gè)存儲(chǔ)介質(zhì)通信??梢詫?shù)據(jù)索引206存儲(chǔ)在任何合適的存儲(chǔ)介質(zhì)上,包括內(nèi)部或本地附連的介質(zhì), 諸如硬盤、通過(guò)存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)連接的存儲(chǔ)、或聯(lián)網(wǎng)的附連存儲(chǔ)(NAQ。數(shù)據(jù)索引206 可以按任何合適的格式,包括一個(gè)或多個(gè)非結(jié)構(gòu)化文本文件、或一個(gè)或多個(gè)關(guān)系數(shù)據(jù)庫(kù)。搜索引擎204可以查閱數(shù)據(jù)索引206以檢索與用戶查詢202相關(guān)的數(shù)據(jù)。檢索到的數(shù)據(jù)208可以是基于用戶查詢202和/或諸如用戶簡(jiǎn)檔或用戶上下文等與該搜索相關(guān)的其他因素來(lái)檢索的搜索結(jié)果的數(shù)據(jù)部分。即,數(shù)據(jù)索引206可以包括與搜索查詢相關(guān)的一個(gè)或多個(gè)因素(例如,用戶查詢術(shù)語(yǔ)、用戶簡(jiǎn)檔、用戶上下文)與匹配查詢和/或與查詢相關(guān)的數(shù)據(jù)(諸如數(shù)據(jù)頁(yè)面)之間的映射。數(shù)據(jù)索引206中的映射可以使用常規(guī)技術(shù)或按任何其他合適的方式來(lái)實(shí)現(xiàn)。無(wú)論使用數(shù)據(jù)索引206來(lái)檢索與搜索相關(guān)的數(shù)據(jù)而執(zhí)行的映射的類型是什么,檢索到的數(shù)據(jù)208可以包括由搜索引擎204從大數(shù)據(jù)主體中檢索的任何合適的數(shù)據(jù),該大數(shù)據(jù)主體諸如例如,網(wǎng)頁(yè)、醫(yī)療記錄、實(shí)驗(yàn)室測(cè)試結(jié)果、財(cái)務(wù)數(shù)據(jù)、人口統(tǒng)計(jì)數(shù)據(jù)、視頻數(shù)據(jù) (例如,血管造影、超聲)、或圖像數(shù)據(jù)(例如,χ光、EKG、VQ掃描、CT掃描、或MRI掃描)。檢索到的數(shù)據(jù)208可以通過(guò)搜索引擎204動(dòng)態(tài)地標(biāo)識(shí)和檢索,或它可以被高速緩存為由搜索引擎204基于相似或相同查詢來(lái)執(zhí)行的先前查詢的結(jié)果。檢索到的數(shù)據(jù)208可以使用常規(guī)技術(shù)或按任何其他合適的方式來(lái)檢索。搜索棧200還可以包括模型選擇組件,諸如模型選擇器210,它可以從存儲(chǔ)在模型選擇器210可訪問(wèn)的一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)上的模型集中選擇一個(gè)或多個(gè)適當(dāng)?shù)哪P?14。模型選擇器210隨后可以將所選模型214應(yīng)用于由搜索引擎204執(zhí)行的搜索的結(jié)果(即,檢索到的數(shù)據(jù)208)。在某些實(shí)施方式中,所選模型214被應(yīng)用于響應(yīng)于用戶查詢而檢索到的數(shù)據(jù)的一個(gè)或多個(gè)步驟??梢詫⒛P瓦x擇器210耦合到模型索引212,后者可以與數(shù)據(jù)索引206設(shè)置在一起或可被設(shè)置為單獨(dú)的索引。模型索引212可以被實(shí)現(xiàn)在任何合適的存儲(chǔ)介質(zhì)上(包括那些結(jié)合數(shù)據(jù)索引206來(lái)描述的介質(zhì)),并且可以按任何合適的格式(包括那些結(jié)合數(shù)據(jù)索引206來(lái)描述的格式)。模型索引212可以包括與用戶的搜索相關(guān)的一個(gè)或多個(gè)因素(例如,用戶查詢202中的項(xiàng)、用戶簡(jiǎn)檔、用戶上下文、和/或由搜索引擎204檢索到的數(shù)據(jù)208)與可被應(yīng)用于獲取檢索到的數(shù)據(jù)208的適當(dāng)?shù)哪P?14之間的映射。所選擇的模型214可以選自存儲(chǔ)在與服務(wù)器106(圖1)相關(guān)聯(lián)的計(jì)算機(jī)可讀介質(zhì)上的較大的模型池250。在某些實(shí)施方式中,模型池250可以由操作該搜索系統(tǒng)的實(shí)體來(lái)供應(yīng)。盡管在某些實(shí)施方式中,從其中選擇模型214的模型池250中的所有或部分模型由除了操作該搜索系統(tǒng)的實(shí)體以外的各方來(lái)提供。在某些實(shí)施方式中,模型池250中的模型由輸入用戶查詢202的用戶來(lái)供應(yīng)。在這一場(chǎng)景中,由模型選擇器210訪問(wèn)的模型池250的一部分可以包括被分隔成存儲(chǔ)對(duì)各個(gè)用戶是私人的數(shù)據(jù),諸如存儲(chǔ)提交用戶查詢202的每一個(gè)用戶的數(shù)據(jù)的計(jì)算機(jī)存儲(chǔ)介質(zhì)。在某些實(shí)施方式中,用戶的社區(qū)可以具有對(duì)搜索系統(tǒng)的訪問(wèn),并且模型池250包括由除了提交用戶查詢202的用戶以外的用戶提交的模型。在另外的實(shí)施方式中,從中選擇模型214的模型池250中的某些或全部模型是由例如模型作者2M之類的其他第三方提供的。這些第三方可以包括業(yè)務(wù)或組織,這些業(yè)務(wù)或組織具有專用需求或能力以指定要響應(yīng)于搜索查詢來(lái)生成的信息的本質(zhì)。例如,計(jì)算距待售房屋的通勤距離的模型可以由不動(dòng)產(chǎn)代理來(lái)提供。計(jì)算比較性實(shí)驗(yàn)室結(jié)果的模型可以由醫(yī)療協(xié)會(huì)來(lái)提供。因此,應(yīng)當(dāng)理解,可以將任何數(shù)量或類型的模型并入模型池250??梢韵蛩阉鳁L峁┯傻谌絼?chuàng)作的模型供處理搜索查詢時(shí)使用。為創(chuàng)作模型,第三方可以使用諸如創(chuàng)作組件256之類的創(chuàng)作組件。創(chuàng)作組件256可包括創(chuàng)作工具,該創(chuàng)作工具允許模型作者2M使用作為該工具的一部分的用戶界面來(lái)指定要包括在模型中的信息??梢砸匀魏魏线m的方式實(shí)現(xiàn)創(chuàng)作工具并使其供用戶或其他第三方使用。例如,它可以是可用于下載并安裝在由模型作者邪4操作的計(jì)算設(shè)備上的可執(zhí)行程序,或者也可以是在服務(wù)器上執(zhí)行的(可以是,或者也可以不是搜索棧的一部分)并在web瀏覽器中向模型作者邪4顯示的應(yīng)用程序。還可使創(chuàng)作工具對(duì)提交搜索查詢的任何用戶202可用,例如, 使其用作搜索棧的一部分。如此,用戶202可以針對(duì)特定搜索修改現(xiàn)有模型、或由信息檢索系統(tǒng)或信息檢索系統(tǒng)的代理所生成的模型??梢砸赃@樣的方式設(shè)計(jì)創(chuàng)作組件256的用戶界面和模型的基礎(chǔ)規(guī)范,以使得不熟悉計(jì)算機(jī)編程的用戶可以輕松地創(chuàng)作模型。例如,用戶界面可以接收定義模型的規(guī)范的用戶輸入。用戶輸入可以是聲明性語(yǔ)句的形式,如包括約束、等式、計(jì)算、規(guī)則和/或不等式的表達(dá)式?;谀P妥髡咝?與用戶界面的交互,創(chuàng)作工具可以以特定格式,如任何合適的文件格式(例如,文本文件、二進(jìn)制文件、網(wǎng)頁(yè)、XML等等)來(lái)生成模型。在一個(gè)實(shí)施方式中, 由用戶輸入的用于包括模型的規(guī)范的聲明性語(yǔ)句以諸如XML之類的文本文件格式來(lái)存儲(chǔ)。在某些實(shí)施方式中,模型或模型的至少一部分是由信息檢索系統(tǒng)或信息檢索系統(tǒng)的代理所生成的。信息檢索系統(tǒng)的代理可包括與信息檢索系統(tǒng)進(jìn)行通信的任何基于計(jì)算機(jī)處理器的設(shè)備,例如,服務(wù)器、計(jì)算機(jī)、位于服務(wù)器106和網(wǎng)絡(luò)108之間的網(wǎng)絡(luò)中的中介設(shè)備。模型或模型的一部分可以通過(guò)處理數(shù)據(jù)以標(biāo)識(shí)表示高階知識(shí)的關(guān)系框架的方式來(lái)生成。信息檢索系統(tǒng)或信息檢索系統(tǒng)的代理可包括提取器沈2。提取器262可以是信息檢索系統(tǒng)的組件,例如,在服務(wù)器上運(yùn)行的應(yīng)用程序,或者也可以是單獨(dú)的元件。提取器262 可以是在與信息檢索系統(tǒng)進(jìn)行通信的和/或與搜索棧200進(jìn)行通信的處理器上操作的應(yīng)用程序。在某些實(shí)施方式中,提取器262與搜索引擎204進(jìn)行通信,并可以適用于接收至少某些檢索到的數(shù)據(jù)208來(lái)作為輸入。但是,由提取器262操作的數(shù)據(jù)可以從任何合適的源中獲取,包括從用于發(fā)現(xiàn)網(wǎng)絡(luò)上的內(nèi)容的如在本領(lǐng)域內(nèi)已知的“爬行器”。在某些實(shí)施方式中,提取器262處理接收到的數(shù)據(jù)以標(biāo)識(shí)接收到的數(shù)據(jù)是否包含某一結(jié)構(gòu)類型的結(jié)構(gòu)化數(shù)據(jù),例如,列表、序列、記錄、陣列、表、電子表格等等。提取器262 可以標(biāo)識(shí)結(jié)構(gòu)化數(shù)據(jù)類型。對(duì)結(jié)構(gòu)化類型的標(biāo)識(shí)可以通過(guò)模式匹配來(lái)進(jìn)行,或者也可以通過(guò)結(jié)構(gòu)化數(shù)據(jù)中所包括的結(jié)構(gòu)類型標(biāo)識(shí)符來(lái)進(jìn)行。在一些實(shí)現(xiàn)中,提取器處理每一檢索到的數(shù)據(jù)208,以判斷結(jié)構(gòu)是否透露至少一個(gè)關(guān)系框架。在某些實(shí)施方式中,搜索引擎204判斷檢索到的數(shù)據(jù)208是否包含某一結(jié)構(gòu)類型的結(jié)構(gòu)化數(shù)據(jù),而搜索引擎向提取器262只提供這樣的結(jié)構(gòu)化數(shù)據(jù)260。但是,向提取器262輸入的數(shù)據(jù)可以來(lái)自任何合適的源。例如, 在附加的實(shí)施方式中,模型作者254向提取器262提供結(jié)構(gòu)化數(shù)據(jù)沈0。在各實(shí)施方式中,提取器262處理結(jié)構(gòu)化數(shù)據(jù)沈0以標(biāo)識(shí)至少一個(gè)關(guān)系框架?;陉P(guān)系框架,提取器262可以確定將結(jié)構(gòu)化數(shù)據(jù)集的某些數(shù)據(jù)綁定到或關(guān)聯(lián)到結(jié)構(gòu)化數(shù)據(jù)集的其他數(shù)據(jù)的至少一個(gè)規(guī)則、表達(dá)式、等式或約束。作為示例,提取器262可以基于電子表格或表的兩個(gè)列中的數(shù)據(jù),判斷第一類型的數(shù)據(jù)與第二類型的數(shù)據(jù)相關(guān)聯(lián)。例如,數(shù)據(jù)可以通過(guò)數(shù)學(xué)等式來(lái)關(guān)聯(lián)。作為另一個(gè)示例,提取器262可以基于根據(jù)按照表決數(shù)或選擇的次數(shù)確定的比率加權(quán)的列表中的數(shù)據(jù),判斷某些類型的事件具有某一個(gè)出現(xiàn)頻率。在某些實(shí)現(xiàn)中,提取器262掃描作為結(jié)構(gòu)化數(shù)據(jù)260接收到的電子表格。提取器 262可以掃描電子表格以提取顯現(xiàn)在電子表格中的顯式的和/或隱式數(shù)據(jù)結(jié)構(gòu)。例如,提取器262可以標(biāo)識(shí)帶有列標(biāo)題的重復(fù)的行、分層結(jié)構(gòu),或顯式地標(biāo)記的表。在某些實(shí)施方式中,提取器262可以標(biāo)識(shí)與諸如外部數(shù)據(jù)庫(kù)或解析多維數(shù)據(jù)集之類的外部數(shù)據(jù)源的綁定。提取器262可以掃描電子表格以提取在電子表格中引用的計(jì)算和/或函數(shù)。在某些實(shí)施方式中,提取器262掃描電子表格,以提取向電子表格中添加的元數(shù)據(jù),元數(shù)據(jù)表示可以是關(guān)系框架的一部分或促進(jìn)關(guān)系框架的識(shí)別的信息的元數(shù)據(jù)。在某些實(shí)施方式中,提取器262通過(guò)處理結(jié)構(gòu)化數(shù)據(jù)沈0并以計(jì)算方式發(fā)現(xiàn)隱式地綁定或關(guān)聯(lián)數(shù)據(jù)的規(guī)則、表達(dá)式、等式或約束,來(lái)確定綁定或關(guān)聯(lián)數(shù)據(jù)的規(guī)則、表達(dá)式、等式或約束。作為簡(jiǎn)單的示例,提取器262可以將電子表格中的第一列數(shù)字除以電子表格中的第二列,以發(fā)現(xiàn)共同的乘數(shù)或共同的累加因子。然后,可以將數(shù)據(jù)的關(guān)系框架標(biāo)識(shí)為第二列等于第一列乘以乘數(shù),或者第二列等于第一列加累加因子??梢詫⒋岁P(guān)系框架轉(zhuǎn)換為可由處理器執(zhí)行的一個(gè)或多個(gè)計(jì)算表達(dá)式,并記錄為模型,以便它可以在第一列或第二列中的類型的數(shù)據(jù)將被作為對(duì)用戶的信息請(qǐng)求作出響應(yīng)的一部分來(lái)處理的其他情況下應(yīng)用。在一些實(shí)現(xiàn)中,提取器262通過(guò)處理結(jié)構(gòu)化數(shù)據(jù)260并提取顯式地與數(shù)據(jù)包括在一起的規(guī)則、表達(dá)式、等式或約束,來(lái)確定綁定或關(guān)聯(lián)數(shù)據(jù)的規(guī)則、表達(dá)式、等式或約束??梢允褂闷渌畔?lái)標(biāo)識(shí)向其應(yīng)用這樣的關(guān)系的數(shù)據(jù)類型。作為示例,結(jié)構(gòu)化數(shù)據(jù)可在首部中作為元數(shù)據(jù)或根據(jù)模式包括結(jié)構(gòu)化數(shù)據(jù)內(nèi)的數(shù)據(jù)類型的顯式標(biāo)識(shí)。但是,可以以任何合適的方式,包括基于用戶輸入,來(lái)確定關(guān)聯(lián)的數(shù)據(jù)類型。在附加的實(shí)施方式中,提取器262結(jié)合從模型作者2M接收到的輸入確定綁定或關(guān)聯(lián)數(shù)據(jù)的規(guī)則、表達(dá)式、等式或約束。例如,提取器262可以判斷接收到的結(jié)構(gòu)數(shù)據(jù)208中的數(shù)據(jù)的一個(gè)或多個(gè)部分看起來(lái)像通過(guò)規(guī)則、表達(dá)式、等式或約束關(guān)聯(lián),但是,提取器不能確定準(zhǔn)確的關(guān)系。這可以例如當(dāng)提取器262處理當(dāng)被繪制成圖時(shí)表示趨勢(shì)的數(shù)據(jù)時(shí)發(fā)生。 提取器262可以嘗試使數(shù)據(jù)符合線性關(guān)系,而數(shù)據(jù)符合較高階多項(xiàng)式、指數(shù)或三角函數(shù)則最佳。在提取器262判斷關(guān)系框架看起來(lái)像存在但是不能準(zhǔn)確地確定用于數(shù)據(jù)的規(guī)則、表達(dá)式、等式或約束的情況下,提取器262可以向模型作者2M或向用戶202提供數(shù)據(jù),以便模型作者或用戶可以幫助標(biāo)識(shí)對(duì)于結(jié)構(gòu)化數(shù)據(jù)的關(guān)系框架。在提取器262判斷有多個(gè)用于結(jié)構(gòu)化數(shù)據(jù)的規(guī)則、表達(dá)式、等式和/或約束的情況下,提取器262可以向模型作者2M或向用戶202提供數(shù)據(jù)和候選規(guī)則、表達(dá)式、等式和/或約束,以便模型作者或用戶可以消除規(guī)則、表達(dá)式、等式和/或約束的歧義,以最佳地標(biāo)識(shí)對(duì)于結(jié)構(gòu)化數(shù)據(jù)的關(guān)系框架。此外,提取器262可以自動(dòng)標(biāo)識(shí)數(shù)據(jù)類型之間的關(guān)系,但是,可以要求用戶輸入確定通過(guò)關(guān)系聯(lián)接的數(shù)據(jù)類型。圖7A描繪了與信息檢索系統(tǒng)750進(jìn)行通信的提取器沈2的實(shí)施方式。在各實(shí)施方式中,提取器包括至少一個(gè)處理器730、接收結(jié)構(gòu)化數(shù)據(jù)沈0的至少一個(gè)輸入,以及向信息檢索系統(tǒng)750提供數(shù)據(jù),例如,計(jì)算表達(dá)式740的至少一個(gè)輸出。信息檢索系統(tǒng)可以接收搜索查詢720和計(jì)算表達(dá)式740,并影響響應(yīng)于搜索查詢?cè)谒阉鳁?00上的搜索。在各實(shí)施方式中,提取器沈2的至少一個(gè)處理器730適用于生成一個(gè)或多個(gè)計(jì)算表達(dá)式740,它們表示對(duì)于由提取器處理的結(jié)構(gòu)化數(shù)據(jù)208的規(guī)則、表達(dá)式、等式和/或約束。每一個(gè)被處理的結(jié)構(gòu)化數(shù)據(jù)都可以產(chǎn)生規(guī)則、表達(dá)式、等式,和/或約束,而后者又產(chǎn)生不同的計(jì)算表達(dá)式740集。在各實(shí)施方式中,如在圖7A中表示的,計(jì)算表達(dá)式被提供給信息檢索系統(tǒng)750,并可由信息檢索系統(tǒng)執(zhí)行。計(jì)算表達(dá)式740可以包括數(shù)學(xué)表達(dá)式、布爾表達(dá)式、條件表達(dá)式、聲明性表達(dá)式、約束、規(guī)則、不等式等等的任何組合,它們被編碼為由信息檢索系統(tǒng)750執(zhí)行的任何語(yǔ)法或可識(shí)別的格式。
在某些實(shí)施方式中,提供給信息檢索系統(tǒng)750的計(jì)算表達(dá)式740被作為模型 250 (圖2)包括在搜索棧200中。例如,可以由提取器262處理特定結(jié)構(gòu)化數(shù)據(jù)沈0,以產(chǎn)生至少一個(gè)計(jì)算表達(dá)式740,而后者又定義被索引和存儲(chǔ)在模型索引212中的一個(gè)模型250。 在一些實(shí)現(xiàn)中,將多個(gè)計(jì)算表達(dá)式740包括到一個(gè)模型中。可以根據(jù)一個(gè)特定結(jié)構(gòu)化數(shù)據(jù) 208或根據(jù)多個(gè)結(jié)構(gòu)化數(shù)據(jù)集來(lái)確定多個(gè)計(jì)算表達(dá)式。由信息檢索系統(tǒng)750索引的任何模型也都可以用于隨后的搜索過(guò)程中。在一些實(shí)現(xiàn)中,提取器262可以將索引信息與計(jì)算表達(dá)式一起提供給信息檢索系統(tǒng)750。索引信息可以被信息檢索系統(tǒng)750用來(lái)索引用于存儲(chǔ)并隨后被信息檢索系統(tǒng)750 訪問(wèn)的計(jì)算表達(dá)式740。在某些情況下,索引信息可以被用來(lái)構(gòu)建索引,以便可以響應(yīng)于用戶搜索查詢來(lái)定位諸如可以由計(jì)算表達(dá)式740所定義的模型。以此方式,可以響應(yīng)于用戶的信息請(qǐng)求來(lái)標(biāo)識(shí)和應(yīng)用模型,以便在計(jì)算表達(dá)式中捕捉到的高階知識(shí)可以被用來(lái)響應(yīng)于用戶的請(qǐng)求而生成信息。由于信息檢索由高階知識(shí)引導(dǎo),因此,它可能與用戶的請(qǐng)求有關(guān)。出于啟發(fā)式目的,圖7B描繪了結(jié)構(gòu)化數(shù)據(jù)和高階知識(shí)之間的分層關(guān)系的一個(gè)實(shí)施方式。返回到上面闡述的購(gòu)買房地產(chǎn)的示例,內(nèi)容710bl可以是列出了影響房屋購(gòu)買者的購(gòu)買的五個(gè)最頻繁地引用的因素的政府網(wǎng)頁(yè)。提取器262可以根據(jù)排序的列表的關(guān)系框架710b,處理內(nèi)容710bl,并標(biāo)識(shí)網(wǎng)頁(yè)上存在的五組數(shù)據(jù)。由這樣的排序的列表揭示的關(guān)系框架710b可以表示高階知識(shí)705,例如,當(dāng)購(gòu)買住房時(shí),住房購(gòu)買者賦予位置、價(jià)格、大小、 與工作單位的距離,以及建筑物的年齡最大的權(quán)重??梢杂商崛∑魃梢圆蹲酱烁唠A知識(shí)的一部分的計(jì)算表達(dá)式可以是在其中用戶正在尋求有關(guān)要購(gòu)買的房屋的信息(諸如提供關(guān)于鄰近地區(qū)的平均房屋價(jià)格的信息,或者首先按照位置然后按照價(jià)格和大小對(duì)搜索結(jié)果進(jìn)行排序)的上下文可以應(yīng)用的表達(dá)式。可以將這樣的計(jì)算表達(dá)式包括到模型250中,以便該模型捕捉高階知識(shí)。雖然在圖7B中只示出了可以用來(lái)標(biāo)識(shí)關(guān)系框架的一個(gè)內(nèi)容710bl,但是,在某些實(shí)施方式中,可以由提取器262處理多個(gè)數(shù)據(jù)集710al-710a4,例如,多個(gè)網(wǎng)頁(yè),以標(biāo)識(shí)關(guān)系框架710a。例如,返回到購(gòu)買房地產(chǎn)的示例,可以處理示出了鄰近地區(qū)的最近銷售價(jià)格的多個(gè)網(wǎng)頁(yè),以標(biāo)識(shí)“本地價(jià)格趨勢(shì)”關(guān)系框架?,F(xiàn)在返回到圖2,在創(chuàng)作組件256作為搜索棧200的一部分來(lái)執(zhí)行的某些實(shí)施方式中(諸如如果它在由模型作者2M操作的計(jì)算設(shè)備上執(zhí)行),模型作者254向信息檢索系統(tǒng)提供使用創(chuàng)作組件256創(chuàng)建的模型,或者使用創(chuàng)作組件256修改的現(xiàn)有的或提取器所創(chuàng)建的模型。在某些實(shí)施方式中,提取器262提供作為模型直接提供的計(jì)算表達(dá)式。然后,信息檢索系統(tǒng)可以將所提供的模型存儲(chǔ)到模型池250中。如果由模型作者2M或提取器262所提供的模型不是合適的格式,則創(chuàng)作組件256可以首先將所提供的模型轉(zhuǎn)換為適當(dāng)格式, 要么自動(dòng)地要么部分地基于由模型作者2M所提供的信息。在某些實(shí)施方式中,為促進(jìn)方便地將模型添加到模型池250中,圖2中所示出的搜索系統(tǒng)包括索引器252。索引器252可以基于模型池250內(nèi)包含的模型,包括由第三方所提供的模型,由信息檢索系統(tǒng)所生成的模型,由信息檢索系統(tǒng)的代理所生成的模型,或由提取器262所生成的模型,更新模型索引212。在某些實(shí)施方式中,模型池250中的每一模型包含標(biāo)識(shí)在其中可以應(yīng)用該模型的上下文的元標(biāo)簽。索引器252可以使用這一和附連到網(wǎng)頁(yè)的元標(biāo)簽類似的信息來(lái)構(gòu)造模型索引212。就此,索引器252可以使用本領(lǐng)域中用于實(shí)現(xiàn)web爬尋器來(lái)建立頁(yè)面索引的已知技術(shù)來(lái)實(shí)現(xiàn)。為支持這一實(shí)現(xiàn),模型池250中的每一模型可以被格式化為網(wǎng)頁(yè)。然而,應(yīng)當(dāng)認(rèn)識(shí)到,可以使用任何合適的技術(shù)來(lái)構(gòu)造模型索引212,包括機(jī)器學(xué)習(xí)技術(shù)或顯式人類輸入。為響應(yīng)于用戶請(qǐng)求而生成信息,模型選擇器210可以使用用于基于索引來(lái)實(shí)現(xiàn)搜索引擎的本領(lǐng)域內(nèi)已知的技術(shù)來(lái)實(shí)現(xiàn)。然而,并非基于數(shù)據(jù)索引來(lái)標(biāo)識(shí)將哪些頁(yè)面返回到用戶,模型選擇器210可以使用模型索引212來(lái)標(biāo)識(shí)用于生成信息的模型,以提供給用戶和 /或響應(yīng)于用戶查詢而包含在搜索棧中。模型選擇器210可以基于與搜索有關(guān)的因素和模型索引中的項(xiàng)之間的匹配,來(lái)標(biāo)識(shí)模型。但是,可以另選地或另外地使用不準(zhǔn)確的匹配技術(shù)。在某些實(shí)施方式中,聲明性模型本身存儲(chǔ)在模型索引212中,而在其他實(shí)施方式中,模型本身與模型索引212分開(kāi)存儲(chǔ),但是,應(yīng)保證在模型索引212中可以適當(dāng)?shù)貥?biāo)識(shí)它們。搜索棧200還可包括模型應(yīng)用引擎216,該模型應(yīng)用引擎216可以向由搜索引擎 204檢索到的數(shù)據(jù)208應(yīng)用所選模型214。在應(yīng)用模型時(shí),檢索到的數(shù)據(jù)208可以充當(dāng)由模型應(yīng)用引擎216對(duì)其應(yīng)用所選模型的參數(shù)。在應(yīng)用模型期間,還可作為對(duì)所選模型的輸入, 提供諸如用戶查詢202的某些部分之類的附加參數(shù)。但是,應(yīng)該理解,可以在模型中標(biāo)識(shí)圖 2中所示出的搜索環(huán)境內(nèi)可用的任何數(shù)據(jù),或者當(dāng)應(yīng)用模型時(shí),由模型應(yīng)用引擎216使用它們。作為對(duì)由模型應(yīng)用引擎216執(zhí)行的搜索結(jié)果應(yīng)用模型的結(jié)果,可以生成信息218。 可以由搜索棧200的輸出組件(未示出)將所生成的信息218返回到用戶。但是,可以以任何合適的方式使用所生成的信息,包括作為供由搜索引擎204進(jìn)行進(jìn)一步搜索的查詢。所生成的信息218可包括由模型應(yīng)用引擎216執(zhí)行的模型應(yīng)用的結(jié)果,可包括由搜索引擎204 檢索到的數(shù)據(jù)208,或者其任何合適的組合。例如,基于由模型應(yīng)用引擎216執(zhí)行的模型應(yīng)用,向數(shù)據(jù)208的用戶呈現(xiàn)的順序可以變化,可以修改作為檢索到的數(shù)據(jù)208的一部分呈現(xiàn)的內(nèi)容,以便它包括附加的或替換的內(nèi)容,該內(nèi)容是由模型應(yīng)用引擎216執(zhí)行的計(jì)算的結(jié)果,或者兩者的任何合適的組合。如此,當(dāng)將選擇模型214應(yīng)用到諸如由搜索引擎檢索到的數(shù)據(jù)208之類的原始數(shù)據(jù)時(shí),所生成的信息218可能處于較高的抽象級(jí)別,因此,比原始數(shù)據(jù)本身對(duì)用戶更有用。在響應(yīng)于搜索查詢接收到所生成的信息218之后,用戶202可以向搜索棧200提供有關(guān)作為產(chǎn)生所生成的信息218的一部分應(yīng)用的模型的有用性的反饋。因此,搜索棧200 還可包括用戶反饋分析器258,該分析器258可以接收這樣的用戶反饋并分析或處理用戶反饋。由反饋分析器258執(zhí)行的分析的結(jié)果可以被用來(lái)更新模型索引212,例如,以基于對(duì)用戶反饋的分析,喜歡或不喜歡與特定搜索項(xiàng)相關(guān)聯(lián)的模型。如此,基于用戶反饋對(duì)模型索引212的更新可以影響由模型選擇器210選擇哪一個(gè)(哪些)模型,并應(yīng)用這個(gè)(些)模型以生成響應(yīng)于搜索查詢返回的信息??梢曰谟煞答伔治銎?58執(zhí)行的分析,以任何合適的方式更新模型索引212。作為示例,反饋分析器258可以直接更新模型索引212,或者它可以將適當(dāng)?shù)男畔鬏數(shù)剿饕?52,該索引器252本身可以代表反饋分析器258更新模型索引212。圖3是聲明性模型300的數(shù)據(jù)結(jié)構(gòu)的略圖,諸如由圖2的模型選擇器210選擇的模型214中的一個(gè)。模型300可以按任何合適的方式來(lái)存儲(chǔ)。在某些實(shí)施方式中,模型被存儲(chǔ)在文件中,并且可被視作網(wǎng)頁(yè)。因此,在這些實(shí)施方式中,像其他網(wǎng)頁(yè)那樣,模型300包括用于輔助索引模型(諸如圖2的模型索引212)的元標(biāo)簽302模型300可以包括一個(gè)或多個(gè)元素,其在所示實(shí)施方式中是聲明性語(yǔ)言的語(yǔ)句。 在某些實(shí)施方式中,聲明性語(yǔ)言處于不是計(jì)算機(jī)編程者的人類可理解以及創(chuàng)作的級(jí)別。例如,它可以包含等式的語(yǔ)句以及基于等式的求值的結(jié)果的形式,諸如等式304和結(jié)果305, 以及等式306和結(jié)果307。在某些實(shí)施方式中,模型的語(yǔ)言由提取器262提供。由提取器 262所提供的語(yǔ)言可以是聲明性的,或者可以是常見(jiàn)的計(jì)算機(jī)語(yǔ)言,或腳本,例如,C,C++, Java,或者可以是機(jī)器語(yǔ)言。等式可以涵蓋符號(hào)或數(shù)學(xué)計(jì)算。等式可以對(duì)于輸入數(shù)據(jù)集執(zhí)行,或者,可以作為搜索過(guò)程的一部分來(lái)執(zhí)行。模型300還可以包括一個(gè)或多個(gè)規(guī)則(諸如規(guī)則308)的語(yǔ)句以及基于對(duì)等式的求值的結(jié)果的形式(諸如規(guī)則結(jié)果309)。對(duì)某些類型的規(guī)則的應(yīng)用可觸發(fā)執(zhí)行搜索,縮窄搜索以限制檢索到的數(shù)據(jù),或擴(kuò)展搜索以收集新信息。根據(jù)某些實(shí)施方式,當(dāng)諸如由模型應(yīng)用引擎216應(yīng)用包含規(guī)則(諸如規(guī)則308)的模型(諸如模型300)時(shí),對(duì)作為模型的應(yīng)用的一部分來(lái)執(zhí)行的規(guī)則的求值生成搜索查詢,并且觸發(fā)要由數(shù)據(jù)搜索引擎(諸如搜索引擎 204)執(zhí)行的搜索。由此,在這些實(shí)施方式中,因特網(wǎng)搜索可以基于通過(guò)將模型應(yīng)用于搜索數(shù)據(jù)所生成的搜索查詢來(lái)觸發(fā)。但規(guī)則可以指定任何合適的結(jié)果。例如,結(jié)果可以是條件語(yǔ)句以及取決于動(dòng)態(tài)地求值的條件是真還是假而應(yīng)用的結(jié)果。因此,規(guī)則的結(jié)果部分可以指定要有條件地執(zhí)行的動(dòng)作、或要返回的信息、或任何其他類型的信息。模型300還可以包括一個(gè)或多個(gè)約束的語(yǔ)句,所述約束諸如約束310和結(jié)果311。 約束可以定義被應(yīng)用于在模型的應(yīng)用上產(chǎn)生的一個(gè)或多個(gè)值的限制。約束的示例可以是不等式語(yǔ)句,諸如將模型應(yīng)用于從搜索中檢索到的數(shù)據(jù)208的結(jié)果大于定義的值的指示。模型300還可以包括要對(duì)輸入數(shù)據(jù)執(zhí)行的一個(gè)或多個(gè)計(jì)算的語(yǔ)句,所述計(jì)算諸如計(jì)算312。每一計(jì)算還可以具有相關(guān)聯(lián)的結(jié)果,諸如結(jié)果313。在此示例中,結(jié)果可以根據(jù)所指定的計(jì)算312來(lái)標(biāo)記,使得它可以在模型300內(nèi)的其他語(yǔ)句中被引用,或以其他方式指定如何可將計(jì)算的結(jié)果在生成信息給用戶中進(jìn)一步應(yīng)用。計(jì)算312可以是用作為結(jié)果的數(shù)值來(lái)表示的數(shù)字計(jì)算的表達(dá)式,或任何其他合適的計(jì)算類型,諸如符號(hào)計(jì)算或串計(jì)算。在將模型300應(yīng)用于由搜索引擎檢索的數(shù)據(jù)208時(shí),模型應(yīng)用引擎216可以對(duì)數(shù)據(jù)208執(zhí)行在模型規(guī)格中指定的任何計(jì)算,包括嘗試求解對(duì)數(shù)據(jù)208的等式、不等式、以及約束。在某些實(shí)施方式中,表示模型內(nèi)的等式、規(guī)則、約束或計(jì)算的語(yǔ)句可以相互關(guān)聯(lián),使得作為一個(gè)語(yǔ)句的結(jié)果被生成的信息可以在模型300內(nèi)的另一語(yǔ)句中被引用。在這一場(chǎng)景中,應(yīng)用模型 300可能需要確定求值這些語(yǔ)句的次序,使得可以一致地應(yīng)用所有語(yǔ)句。在某些實(shí)施方式中,應(yīng)用一模型可能需要多次迭代,在所述多次迭代期間只應(yīng)用語(yǔ)句中的所有參數(shù)的值都可用的那些語(yǔ)句。作為某些語(yǔ)句的應(yīng)用生成被用于應(yīng)用其他語(yǔ)句的值,那些其他語(yǔ)句可以在連續(xù)迭代中求值。如果對(duì)迭代中的語(yǔ)句的應(yīng)用改變了在應(yīng)用另一語(yǔ)句中使用的參數(shù)值, 則將基于其依賴的所改變的參數(shù)值再次應(yīng)用該另一語(yǔ)句。對(duì)模型中的語(yǔ)句的應(yīng)用可以按此方式迭代地繼續(xù),直到應(yīng)用該模型中的所有語(yǔ)句的一致結(jié)果從一個(gè)迭代到另一個(gè)迭代中出現(xiàn),實(shí)現(xiàn)穩(wěn)定且一致的結(jié)果。然而,應(yīng)當(dāng)認(rèn)識(shí)到,可以使用任何合適的技術(shù)來(lái)應(yīng)用模型300。在某些實(shí)施方式中,模型300可以影響搜索過(guò)程。例如,響應(yīng)于由用戶202輸入的搜索查詢,信息檢索系統(tǒng)可以在定位和檢索信息過(guò)程中選擇一個(gè)模型并將其包括到搜索棧 200中。選擇的模型可以縮窄或擴(kuò)展搜索。返回到用戶202輸入與購(gòu)買房地產(chǎn)有關(guān)的搜索項(xiàng)的示例,可以由信息檢索系統(tǒng)選擇“房地產(chǎn)購(gòu)買”模型,該模型可以觸發(fā)涉及定位和檢索有關(guān)候選房產(chǎn)的位置、價(jià)格、大小、與工作單位的距離,和/或房齡的信息。圖4提供了諸如可以由提取器262為模型300指定或提取和所生成的語(yǔ)句的示例。在圖4的示例中,當(dāng)用戶執(zhí)行房屋搜索時(shí)可以選擇并且應(yīng)用該模型,并且在此示例中, 該模型將待售房屋與用戶的通勤相關(guān)。在圖4的示例中對(duì)模型的應(yīng)用可以生成每一待售房屋與用戶的辦公室位置之間的通勤距離的信息和/或時(shí)間。由此,規(guī)則語(yǔ)句408是來(lái)自圖 3的規(guī)則308的示例,它指定將被用作模型計(jì)算的一部分的房屋位置的形式。在此示例中, 規(guī)則語(yǔ)句408指定被標(biāo)識(shí)為房屋位置的一參數(shù)是待售房屋的地址、城市和州的全球定位系統(tǒng)(GPS)坐標(biāo)的形式。當(dāng)模型被應(yīng)用時(shí),可以由模型應(yīng)用引擎216基于檢索到的數(shù)據(jù)208 將值給予這些參數(shù)。在此示例中,當(dāng)網(wǎng)頁(yè)或檢索到的數(shù)據(jù)的其他項(xiàng)包含被規(guī)則308的應(yīng)用識(shí)別為房屋位置的信息時(shí),規(guī)則308可以求值為真。因此,可以使用規(guī)則308來(lái)標(biāo)識(shí)模型內(nèi)的其他語(yǔ)句對(duì)其應(yīng)用的數(shù)據(jù)項(xiàng)。等式語(yǔ)句404是圖3的等式304的示例,該等式語(yǔ)句404基于規(guī)則語(yǔ)句408中指定的待售房屋的位置,提供用于到達(dá)通勤距離要執(zhí)行的計(jì)算,以及在此示例中被指示為辦公室位置且可以對(duì)模型應(yīng)用引擎216可用的值。在此示例中,辦公室位置是對(duì)模型的輸入?yún)?shù),該輸入?yún)?shù)可以例如作為用戶查詢的一部分、作為用戶簡(jiǎn)檔或用戶上下文的一部分來(lái)提供。然而,房屋位置是基于從對(duì)模型的另一輸入(諸如作為搜索引擎的結(jié)果來(lái)返回的數(shù)據(jù)208)所接收的規(guī)則語(yǔ)句408的應(yīng)用。結(jié)果語(yǔ)句405是圖3的結(jié)果305的示例,該結(jié)果語(yǔ)句405指定如何顯示對(duì)等式語(yǔ)句404所執(zhí)行的計(jì)算的結(jié)果。由此,在此示例中,結(jié)果語(yǔ)句405根據(jù)與被顯示在對(duì)房屋的描述旁邊的搜索結(jié)果來(lái)指定到每一待售房屋的通勤距離,該通勤距離是可基于檢索到的數(shù)據(jù) 208來(lái)建立的值的參數(shù)。圖4的示例示出了可以在模型中存在以向用戶查詢顯示結(jié)果的某些語(yǔ)句。在此示例中,結(jié)果與待售房屋相關(guān)。因此,圖4中描繪的模型可以由模型選擇器210(圖2)響應(yīng)于請(qǐng)求關(guān)于待售房屋的信息的用戶查詢202來(lái)選擇。模型應(yīng)用引擎216可以將模型應(yīng)用于檢索到的數(shù)據(jù)208中的數(shù)據(jù)的每一項(xiàng)。然而,不是每一檢索到的數(shù)據(jù)的項(xiàng)都可以遵循規(guī)則308 或由模型內(nèi)的語(yǔ)句建立的其他條件。因此,不是檢索到的數(shù)據(jù)208的每一項(xiàng)都可以被包括在所生成的信息218中。然而,圖4示出了可以將不明確地包含在檢索到的數(shù)據(jù)208中的其他信息包括在所生成的信息218中。在圖4的簡(jiǎn)單示例中,被稱為“通勤距離”的參數(shù)的值在應(yīng)用圖4所描繪的模型時(shí)由模型應(yīng)用引擎216來(lái)計(jì)算。圖5是根據(jù)某些實(shí)施方式的可由諸如圖2的搜索棧200等搜索棧在執(zhí)行期間執(zhí)行的過(guò)程的流程圖。該過(guò)程可以當(dāng)諸如圖1的計(jì)算設(shè)備105等計(jì)算設(shè)備代表用戶202將搜索查詢發(fā)送給諸如圖2的搜索引擎204等搜索引擎時(shí)開(kāi)始。然而,并不要求搜索過(guò)程由明確的用戶輸入或按文本形式的明確的用戶輸入來(lái)觸發(fā)。非文本輸入或暗示的用戶數(shù)據(jù)可以被視為觸發(fā)對(duì)圖5的過(guò)程的執(zhí)行的查詢。在步驟502,搜索??梢越邮沼脩舻牟樵?。如以上討論的,用戶的查詢可以是隱式的或顯式的。例如,在某些實(shí)施方式中,搜索??梢陨纱碛脩舻乃阉鞑樵?。搜索棧例如可以基于與用戶相關(guān)聯(lián)的上下文信息來(lái)生成搜索查詢。這可以例如由圖2的搜索引擎204 執(zhí)行。
不管查詢是如何生成的,在步驟503中,可由信息檢索系統(tǒng)來(lái)選擇第一模型或模型集以便包括在搜索棧200中。第一模型可縮窄或擴(kuò)展搜索過(guò)程。第一模型可由提取器 262生成或以任何其他合適的方式獲取。第一模型的實(shí)現(xiàn)可以在或不在搜索過(guò)程中使用。在步驟504中,搜索引擎可以從具有至少一個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備的網(wǎng)絡(luò)中定位和檢索數(shù)據(jù)??梢曰谒阉鞑樵兊钠ヅ漤?xiàng),或基于在搜索棧中執(zhí)行第一模型,或者匹配和執(zhí)行的組合,選擇檢索到的數(shù)據(jù)。返回的數(shù)據(jù)可以基于查詢(和/或諸如用戶上下文和用戶簡(jiǎn)檔之類的其他因素)和諸如圖2的數(shù)據(jù)索引206之類的可以被搜索引擎訪問(wèn)的索引中的項(xiàng)之間的匹配(無(wú)論是顯式的或隱式的)。該過(guò)程隨后前進(jìn)至步驟506,其中搜索棧可以檢索適于用戶的搜索的一個(gè)或多個(gè)第二模型。在圖2的示例性實(shí)現(xiàn)中,合適的第二模型可以由模型選擇器210結(jié)合索引(例如,模型索引21 來(lái)選擇,該索引將用戶的查詢和/或由搜索引擎返回的數(shù)據(jù)與一個(gè)或多個(gè)合適的模型相關(guān)。第二模型可由提取器262來(lái)創(chuàng)作、生成,或者可包括所創(chuàng)作的和提取器生成的模型的組合。在步驟508,搜索棧隨后可以將檢索到的第二模型應(yīng)用于檢索到的數(shù)據(jù)208。在圖 2的示例性實(shí)現(xiàn)中,這一步驟可以由模型應(yīng)用引擎216來(lái)執(zhí)行。除了檢索到的數(shù)據(jù)本身之外,諸如用戶查詢(或其一個(gè)或多個(gè)部分)等與索引有關(guān)的其他因素也可以用于對(duì)作為將該第二模型應(yīng)用于檢索到的數(shù)據(jù)的結(jié)果來(lái)執(zhí)行的一個(gè)或多個(gè)計(jì)算的輸入。在步驟508,處理可能需要多次迭代。在某些實(shí)施方式中,第二模型可以應(yīng)用于數(shù)據(jù)的每一項(xiàng),諸如包括在檢索到的數(shù)據(jù)208中的網(wǎng)頁(yè)。因此,在步驟508,在對(duì)包含在檢索到的數(shù)據(jù)208內(nèi)的每一項(xiàng)進(jìn)行重復(fù)的意義上,處理可以是迭代的。另選地或另外地,在步驟508,處理可以是迭代的,因?yàn)闊o(wú)論第二模型是被應(yīng)用于數(shù)據(jù)的各個(gè)項(xiàng)還是數(shù)據(jù)項(xiàng)的集合,第二模型的應(yīng)用都可能需要迭代地應(yīng)用第二模型中的語(yǔ)句,直到實(shí)現(xiàn)穩(wěn)定且一致的結(jié)果。在模型選擇器210可以選擇多個(gè)第二模型、使得遵循每一個(gè)所選第二模型的信息可以通過(guò)在步驟508的處理來(lái)生成的意義上,步驟508的處理可以另選地或另外地是迭代的。轉(zhuǎn)向步驟510,搜索棧隨后可以輸出所生成的結(jié)果作為將第二所選模型應(yīng)用于檢索到的數(shù)據(jù)的結(jié)果。在此示例中,輸出可能需要將信息返回給隨后可以為用戶將該信息呈現(xiàn)在顯示器上的用戶計(jì)算機(jī)。在某些實(shí)施方式中,所生成的信息包括將第二模型應(yīng)用在從搜索引擎返回的數(shù)據(jù)以及數(shù)據(jù)本身上的結(jié)果的某種組合。例如,所生成的信息可以基于第二模型的應(yīng)用來(lái)過(guò)濾搜索數(shù)據(jù)或?qū)λ阉鲾?shù)據(jù)重新排序,或可以提供附加信息或按與由搜索結(jié)果返回的數(shù)據(jù)不同格式的數(shù)據(jù)。在某些實(shí)施方式中,對(duì)搜索數(shù)據(jù)的重新排序可以結(jié)合時(shí)間元素。例如,第二模型可以標(biāo)識(shí)多個(gè)事件的集合的時(shí)間順序。這一模型的應(yīng)用隨后可能需要標(biāo)識(shí)與那些事件有關(guān)的搜索數(shù)據(jù),并且生成按根據(jù)模型的時(shí)間順序的一順序向用戶返回的信息。然而,應(yīng)當(dāng)認(rèn)識(shí)到,所生成的信息的本質(zhì)是可作為第二模型的應(yīng)用的結(jié)果被指定的任何適當(dāng)?shù)男问?,它可以包含諸如計(jì)算、等式、約束和/或規(guī)則等元素的組合。當(dāng)(經(jīng)由用戶的計(jì)算設(shè)備)向用戶返回?cái)?shù)據(jù)之后,圖5的過(guò)程可以被終止。圖6是用戶可以用來(lái)在信息檢索系統(tǒng)中訪問(wèn)和執(zhí)行搜索的用戶界面的示例。在此示例中,用戶可以輸入搜索查詢,并且查看響應(yīng)于該查詢來(lái)返回的信息。盡管可以使用任何合適的應(yīng)用來(lái)生成用戶界面,但圖6示出了該界面由web瀏覽器600顯示。web瀏覽器600可以是任何合適的web瀏覽器,在此示例中被示為由微軟公司開(kāi)發(fā)的INTERNET EXPLORER ,并且可以在由用戶操作的計(jì)算設(shè)備(諸如圖1的計(jì)算設(shè)備105)上執(zhí)行。在圖6的示例中, web瀏覽器已加載由諸如圖2中所示的信息檢索系統(tǒng)返回的網(wǎng)頁(yè)。在圖6所示的實(shí)施方式中,用戶在用戶界面的查詢輸入域602中已輸入文本查詢 604,“我的辦公室附近的待售房屋”,并且經(jīng)由web瀏覽器600將該查詢發(fā)送給根據(jù)某些實(shí)施方式的作為搜索棧的一部分的搜索引擎。作為響應(yīng),搜索棧經(jīng)由web瀏覽器向用戶返回所生成的信息,在圖6中被示為顯示在web瀏覽器中的所返回的信息元素606和608。當(dāng)接收用戶的查詢之后,搜索引擎可以檢索包括用戶辦公室附近的待售房屋的結(jié)果的數(shù)據(jù)集(例如,網(wǎng)頁(yè))。如以上討論的,從搜索引擎返回的數(shù)據(jù)集可以基于查詢項(xiàng)與和網(wǎng)頁(yè)有關(guān)的索引中的項(xiàng)之間的匹配。然而,如圖所示,可以在求值搜索查詢時(shí)使用其他數(shù)據(jù)源。在此示例中,搜索查詢包括短語(yǔ)“我的辦公室”。該短語(yǔ)可以與處理查詢的搜索和檢索系統(tǒng)可訪問(wèn)的用戶簡(jiǎn)檔中的信息相關(guān)聯(lián)。因此,在執(zhí)行查詢后,信息檢索系統(tǒng)可以基于根據(jù)用戶簡(jiǎn)檔中指定的信息的地理位置來(lái)過(guò)濾或定位結(jié)果。然而,應(yīng)當(dāng)認(rèn)識(shí)到,可以使用任何合適的技術(shù)來(lái)處理搜索查詢以及檢索數(shù)據(jù)。例如,可由例如模型選擇器210來(lái)選擇第一模型或模型集來(lái)影響信息定位和檢索?;诓樵兒?或檢索到的數(shù)據(jù),適當(dāng)?shù)牡诙P碗S后可以由諸如圖2的模型選擇器210等搜索棧來(lái)選擇。在圖6的示例中,將待售房屋與用戶的通勤相關(guān)的圖4中指定的第二模型是基于查詢文本的一部分即“我的辦公室附近”來(lái)選擇的。隨后檢索所選擇的第二模型并將其應(yīng)用于從搜索中得到的數(shù)據(jù)(即,待售房屋的網(wǎng)頁(yè))。可以由例如模型應(yīng)用引擎216執(zhí)行將第二模型應(yīng)用于數(shù)據(jù)。在圖6的示例中,用戶的辦公室位置還可以是到所選擇的第二模型的輸入?yún)?shù)的值。因?yàn)椴樵兾谋尽拔业霓k公室附近”并不指定確切的辦公室位置,因此在此示例中,用戶的辦公室位置可以取自例如用戶的簡(jiǎn)檔或用戶的上下文。在此示例中,如結(jié)合圖4討論的,應(yīng)用所選擇的第二模型包括從搜索結(jié)果中確定每一待售房屋的地址、城市和州的GPS坐標(biāo),計(jì)算每一房屋與用戶辦公室之間的通勤距離,以及安排所生成的信息以將通勤距離顯示在對(duì)每一待售房屋的描述旁邊。 在圖6的示例中,還基于通勤距離對(duì)所生成的信息的顯示進(jìn)行了排序。由此,在圖6的示例中,待售房屋的兩個(gè)列表由搜索棧返回,并且在web瀏覽器中顯示所返回的信息元素606和608。每一所返回的信息606和608分別包括待售房屋的圖片610和612以及對(duì)待售房屋分別的描述614和616。另外,所返回的信息元素606包括顯示在描述614旁邊的通勤信息618即“離工作2英里”,并且所返回的信息元素608包括顯示在描述616旁邊的通勤信息620即“離工作5英里”。在圖6的示例中,所返回的信息元素606和608是作為基于通勤距離按升序排序來(lái)返回的。因此,作為由圖4的示例指定的模型的應(yīng)用的結(jié)果,更多有用信息被返回給用戶。 即,本發(fā)明的信息檢索系統(tǒng)可以向用戶返回定制以便更好地滿足用戶需求的信息,而不是僅僅返回待售房屋的列表。返回的信息可以基于附加的動(dòng)態(tài)計(jì)算,這些動(dòng)態(tài)計(jì)算是針對(duì)用戶或他的查詢執(zhí)行的(即,基于他的辦公地點(diǎn)),基于動(dòng)態(tài)地標(biāo)識(shí)的數(shù)據(jù)執(zhí)行的(在此示例中,待售的房屋),以信息量更大的方式排列或向用戶呈現(xiàn)。因此,應(yīng)用選擇模型允許信息檢索系統(tǒng)定位、檢索與他的搜索查詢關(guān)系更密切的信息,并將信息提供給用戶。選擇并應(yīng)用于由搜索棧執(zhí)行的搜索過(guò)程的模型可以由搜索棧的操作員創(chuàng)建,如上文所描述的,由提取器262生成,或者可以由第三方提供。這樣的第三方可包括具有指定要響應(yīng)于搜索查詢生成的信息的特征的專門的愿望,能力的企業(yè),組織或個(gè)人。在某些情況下,模型可以由使諸如電子表格、web服務(wù)或RSS饋源之類的結(jié)構(gòu)化數(shù)據(jù)在網(wǎng)絡(luò)上可用的任何個(gè)人或組織來(lái)提供。例如,個(gè)人或組織可將模型作為元數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)包括在一起,或者將數(shù)據(jù)中的引用包括到模型中。在某些情況下,可以在首部中和/ 或根據(jù)模式,將模型與結(jié)構(gòu)化數(shù)據(jù)包括在一起。在計(jì)算與待出售的房屋的通勤距離的模型的情況下,如由圖4的示例所指定的模型,模型可能已經(jīng)由房地產(chǎn)代理提供。作為另一個(gè)示例,可以由醫(yī)學(xué)協(xié)會(huì)提供計(jì)算比較室驗(yàn)室結(jié)果的模型。作為再一個(gè)示例,照像機(jī)愛(ài)好者或照像機(jī)零售商可以提供執(zhí)行涉及照像機(jī)的規(guī)格(例如,光學(xué)變焦級(jí)別、重量或兆像素范圍、與照像機(jī)一起購(gòu)買的典型的配件) 的計(jì)算的模型,可以將該模型應(yīng)用到合適的查詢,如“短途旅行照像機(jī)”。作為第四示例, 時(shí)裝設(shè)計(jì)師可以提供帶有美學(xué)邏輯的模型,該模型可以在搜索結(jié)果內(nèi)排序和聚集布料和附件(例如,根據(jù)樣式、顏色、裁剪、場(chǎng)面)。作為第五示例,一個(gè)氣象專家可以提供一個(gè)模型,以預(yù)測(cè)一個(gè)特定位置的天氣(例如,使用曲線擬合該氣象專家的本地觀察的多項(xiàng)式,對(duì)于Cascades處的小氣候,預(yù)測(cè)未來(lái)七天的雪情),可以響應(yīng)于對(duì)其應(yīng)用該模型可能有價(jià)值的合適的查詢(例如,“Cascades處的滑雪條件”),來(lái)應(yīng)用該模型。作為再一個(gè)示例,一個(gè)營(yíng)養(yǎng)師或保健組織可以提供計(jì)算涉及有關(guān)某一食品的特定食譜(例如,推薦的每日給飼量 (RDA))的信息的模型,以便當(dāng)用戶搜索食譜時(shí),例如,該模型可以被觸發(fā),并計(jì)算一次供應(yīng)食譜中的脂肪或碳水化合物的RDA的百分比。方法實(shí)施方式鑒于前面的關(guān)于本發(fā)明的各實(shí)施方式的結(jié)構(gòu)和操作描述,本領(lǐng)域的技術(shù)人員可以理解,可以執(zhí)行各種發(fā)明方法或過(guò)程。參考圖5描述了一個(gè)方法的實(shí)施方式。下面將描述更多方法的附加的實(shí)施方式。當(dāng)描述方法或過(guò)程時(shí),除非明確地陳述,方法步驟的列表不應(yīng)該被解釋為執(zhí)行步驟的必需的順序。在某些情況下,可以完全地或部分地將兩個(gè)或更多方法的步驟組合起來(lái)以構(gòu)成本發(fā)明的范圍內(nèi)的一種方法。例如,可以將一個(gè)或多個(gè)第二或第三所描述的方法的一個(gè)或多個(gè)步驟添加到第一所描述的方法的一個(gè)或多個(gè)步驟中或代替它們。現(xiàn)在參考圖8A-8B,示出了描繪了可以由提取器262執(zhí)行的方法的實(shí)施方式的流程圖。如圖8A所示的用于從數(shù)據(jù)中提取高階知識(shí)的一種方法800,該方法可以包括接收805 數(shù)據(jù),處理810接收到的數(shù)據(jù),標(biāo)識(shí)815接收到的數(shù)據(jù)中的至少一個(gè)關(guān)系框架,以及通過(guò)一個(gè)或多個(gè)計(jì)算表達(dá)式表示830至少一個(gè)關(guān)系框架的步驟。該方法還可以包括消除至少一個(gè)已標(biāo)識(shí)的關(guān)系框架的歧義820的步驟,例如,提示用戶或模型作者提供輸入,以確定處理過(guò)的數(shù)據(jù)的正確關(guān)系框架。該方法還可包括向信息檢索系統(tǒng)提供840 —個(gè)或多個(gè)計(jì)算表達(dá)式。接收805數(shù)據(jù)的步驟可以包括由與信息檢索系統(tǒng)進(jìn)行通信的至少一個(gè)處理器從任何合適的源接收結(jié)構(gòu)化數(shù)據(jù),包括從網(wǎng)絡(luò)爬行或從結(jié)構(gòu)化數(shù)據(jù)的提供商接收數(shù)據(jù)。至少一個(gè)處理器可以是提取器262的處理器。接收到的數(shù)據(jù)可以包括結(jié)構(gòu)化數(shù)據(jù),例如,諸如列表、表、序列、記錄、電子表格、圖等等之類的某一結(jié)構(gòu)類型的數(shù)據(jù)。關(guān)系框架可以表示高階知識(shí),或表示高階知識(shí)的至少一個(gè)特征。在各實(shí)施方式中,至少一個(gè)處理器處理810接收到的數(shù)據(jù)。處理可包括判斷結(jié)構(gòu)化數(shù)據(jù)是否存在,例如,判斷是否存在表、列表、圖。處理還可以包括分析數(shù)據(jù)以確定數(shù)據(jù)的各部分之間的關(guān)系。在某些實(shí)施方式中,處理可包括根據(jù)與數(shù)據(jù)相關(guān)聯(lián)的元數(shù)據(jù)或首部確定關(guān)系框架的各方面。作為處理810接收到的數(shù)據(jù)的結(jié)果,至少一個(gè)處理器可以標(biāo)識(shí)815與數(shù)據(jù)相關(guān)聯(lián)的至少一個(gè)關(guān)系框架。標(biāo)識(shí)的步驟可以包括模式匹配,或應(yīng)用一個(gè)或多個(gè)分類器或適用于基于數(shù)據(jù)來(lái)標(biāo)識(shí)關(guān)系的其他處理技術(shù)。但是,在某些實(shí)施方式中,處理可能需要從數(shù)據(jù)中讀取等式??梢詮臄?shù)據(jù)中讀取關(guān)系,例如,在數(shù)據(jù)是利用關(guān)聯(lián)電子表格的單元格中的數(shù)據(jù)的公式編程的諸如Excel 電子表格之類的電子表格的情況下。在某些實(shí)施方式中,標(biāo)識(shí)815的步驟可包括標(biāo)識(shí)一組數(shù)據(jù)看起來(lái)具有某些關(guān)系框架,該組數(shù)據(jù)看起來(lái)不屬于可識(shí)別的類型的關(guān)系框架。標(biāo)識(shí)815的步驟還可包括標(biāo)識(shí)接收到的數(shù)據(jù)的多種類型的關(guān)系框架。在用于從數(shù)據(jù)中提取高階知識(shí)的方法800的某些實(shí)施方式中,可以包括可選消除歧義820的步驟。消除歧義的步驟可以包括向用戶202或模型作者邪4提供接收到的數(shù)據(jù)供評(píng)論,并由用戶或模型作者判斷什么關(guān)系框架在接收到的數(shù)據(jù)中是明顯的??梢杂商崛∑魃?向用戶或模型作者提供接收到的數(shù)據(jù)以及候選類型的關(guān)系框架,而用戶或模型作者可以選擇候選類型中的一種。歧義消除可以用于,例如,當(dāng)通過(guò)關(guān)系所適用的檢測(cè)的關(guān)系不自動(dòng)檢測(cè)時(shí)。類似地,歧義消除可以適用于當(dāng)關(guān)系所適用的上下文不被自動(dòng)確定,而是由模型作者的輸入來(lái)提供時(shí)。類似的歧義消除還可以適用于當(dāng)在數(shù)據(jù)中檢測(cè)到多個(gè)可能的關(guān)系,但是,沒(méi)有哪一個(gè)被以超出閾值的置信度檢測(cè)出時(shí)。在對(duì)于接收到的數(shù)據(jù)完成了關(guān)系框架的標(biāo)識(shí)之后,至少一個(gè)處理器可以以一個(gè)或多個(gè)計(jì)算表達(dá)式來(lái)表示830關(guān)系框架,計(jì)算表達(dá)式捕捉表示關(guān)系框架的高階知識(shí)。如上文所描述的,計(jì)算表達(dá)式可包括可由信息檢索系統(tǒng)識(shí)別的和/或執(zhí)行的數(shù)學(xué)表達(dá)式、布爾表達(dá)式、規(guī)則、條件語(yǔ)句、字符串計(jì)算、聲明性表達(dá)式等等。在各實(shí)施方式中,向信息檢索系統(tǒng)提供表達(dá)式,供信息檢索系統(tǒng)執(zhí)行。它們的執(zhí)行影響響應(yīng)于搜索查詢提供給用戶202的結(jié)^ ο圖8B描繪了用于從結(jié)構(gòu)化數(shù)據(jù)中提取高階知識(shí)的方法的另一實(shí)施方式。圖8B的方法可以包括由提取器262的至少一個(gè)處理器接收805數(shù)據(jù)、標(biāo)識(shí)815至少一個(gè)關(guān)系框架, 以及向信息檢索系統(tǒng)提供840計(jì)算表達(dá)式的步驟。在某些實(shí)施方式中,可以以標(biāo)識(shí)關(guān)系框架以及另外標(biāo)識(shí)表示關(guān)系框架的計(jì)算表達(dá)式的元數(shù)據(jù)來(lái)標(biāo)記接收到的數(shù)據(jù)。在這樣的實(shí)施方式中提取器262可以標(biāo)識(shí)根據(jù)元數(shù)據(jù)標(biāo)識(shí)關(guān)系框架和計(jì)算表達(dá)式。然后,可以將已標(biāo)識(shí)的計(jì)算表達(dá)式直接傳遞到信息檢索系統(tǒng)或修改后提供840到信息檢索系統(tǒng)。至此描述了本發(fā)明的至少一個(gè)實(shí)施方式的若干方面,可以理解,本領(lǐng)域的技術(shù)人員可容易地想到各種更改、修改和改進(jìn)。這樣的更改、修改和改進(jìn)旨在是本發(fā)明的一部分,且旨在處于本發(fā)明的精神和范圍內(nèi)。從而,上述描述和附圖僅用作示例??梢杂枚喾N方式中的任一種來(lái)實(shí)現(xiàn)本發(fā)明的上述實(shí)施方式。例如,可使用硬件、軟件或其組合來(lái)實(shí)現(xiàn)各實(shí)施方式。當(dāng)使用軟件實(shí)現(xiàn)時(shí),該軟件代碼可在無(wú)論是在單個(gè)計(jì)算機(jī)中提供的還是在多個(gè)計(jì)算機(jī)之間分布的任何合適的處理器或處理器的集合上執(zhí)行。此外,應(yīng)當(dāng)理解,計(jì)算機(jī)可以用多種形式中的任一種來(lái)具體化,如機(jī)架式計(jì)算機(jī)、 臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、或圖形輸入板計(jì)算機(jī)。另外,計(jì)算機(jī)可以具體化在通常不被認(rèn)為是計(jì)算機(jī)但具有合適的處理能力的設(shè)備中,包括個(gè)人數(shù)字助理(PDA)、智能電話、或任何其它合適的便攜式或固定電子設(shè)備。同樣,計(jì)算機(jī)可以具有一個(gè)或多個(gè)輸入和輸出設(shè)備。這些設(shè)備主要可被用來(lái)呈現(xiàn)用戶界面??杀挥脕?lái)提供用戶界面的輸出設(shè)備的示例包括用于可視地呈現(xiàn)輸出的打印機(jī)或顯示屏和用于可聽(tīng)地呈現(xiàn)輸出的揚(yáng)聲器或其它聲音生成設(shè)備??杀挥糜谟脩艚缑娴妮斎朐O(shè)備的示例包括鍵盤和諸如鼠標(biāo)、觸摸板和數(shù)字化輸入板等定點(diǎn)設(shè)備。作為另一示例,計(jì)算機(jī)可以通過(guò)語(yǔ)音識(shí)別或以其它可聽(tīng)格式來(lái)接收輸入信息。這些計(jì)算機(jī)可以通過(guò)任何合適形式的一個(gè)或多個(gè)網(wǎng)絡(luò)來(lái)互連,包括作為局域網(wǎng)或廣域網(wǎng),如企業(yè)網(wǎng)絡(luò)或因特網(wǎng)。這些網(wǎng)絡(luò)可以基于任何合適的技術(shù)并可以根據(jù)任何合適的協(xié)議來(lái)操作,并且可以包括無(wú)線網(wǎng)絡(luò)、有線網(wǎng)絡(luò)或光纖網(wǎng)絡(luò)。而且,此處略述的各種方法或過(guò)程可被編碼為可在采用各種操作系統(tǒng)或平臺(tái)中任何一種的一個(gè)或多個(gè)處理器上執(zhí)行的軟件。此外,這樣的軟件可使用多種合適的程序設(shè)計(jì)語(yǔ)言和/或程序設(shè)計(jì)或腳本工具中的任何一種來(lái)編寫,而且它們還可被編譯為可執(zhí)行機(jī)器語(yǔ)言代碼或在框架或虛擬機(jī)上執(zhí)行的中間代碼。就此,本發(fā)明可被具體化為用一個(gè)或多個(gè)程序編碼的一個(gè)計(jì)算機(jī)可讀介質(zhì)(或多個(gè)計(jì)算機(jī)可讀介質(zhì))(例如,計(jì)算機(jī)存儲(chǔ)器、一個(gè)或多個(gè)軟盤、緊致盤(CD)、光盤、數(shù)字視頻盤(DVD)、磁帶、閃存、現(xiàn)場(chǎng)可編程門陣列或其他半導(dǎo)體器件中的電路配置、或其他非瞬態(tài)的有形計(jì)算機(jī)存儲(chǔ)介質(zhì)),當(dāng)這些程序在一個(gè)或多個(gè)計(jì)算機(jī)或其他處理器上執(zhí)行時(shí),它們執(zhí)行實(shí)現(xiàn)本發(fā)明的上述各個(gè)實(shí)施方式的方法。這一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)可以是可移植的, 使得其上存儲(chǔ)的一個(gè)或多個(gè)程序可被加載到一個(gè)或多個(gè)不同的計(jì)算機(jī)或其它處理器上以便實(shí)現(xiàn)本發(fā)明上述的各個(gè)方面。如此處所使用的,術(shù)語(yǔ)“非瞬態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)”只包含可被認(rèn)為是制品或機(jī)器的計(jì)算機(jī)可讀介質(zhì)。此處以一般的意義使用術(shù)語(yǔ)“程序”或“軟件”來(lái)指可被用來(lái)對(duì)計(jì)算機(jī)或其他處理器編程以實(shí)現(xiàn)本發(fā)明上述的各個(gè)方面的任何類型的計(jì)算機(jī)代碼或計(jì)算機(jī)可執(zhí)行指令集。另外,應(yīng)當(dāng)理解,根據(jù)本實(shí)施方式的一個(gè)方面,當(dāng)被執(zhí)行時(shí)實(shí)現(xiàn)本發(fā)明的方法的一個(gè)或多個(gè)計(jì)算機(jī)程序不必駐留在單個(gè)計(jì)算機(jī)或處理器上,而是可以按模塊化的方式分布在多個(gè)不同的計(jì)算機(jī)或處理器之間以實(shí)現(xiàn)本發(fā)明的各方面。計(jì)算機(jī)可執(zhí)行指令可以具有可由一個(gè)或多個(gè)計(jì)算機(jī)或其他設(shè)備執(zhí)行的各種形式, 諸如程序模塊。一般而言,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等。通常,程序模塊的功能可以按需在各個(gè)實(shí)施方式中進(jìn)行組合或分布。而且,數(shù)據(jù)結(jié)構(gòu)能以任何合適的形式存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上。為簡(jiǎn)化說(shuō)明,數(shù)據(jù)結(jié)構(gòu)可被示為具有通過(guò)該數(shù)據(jù)結(jié)構(gòu)中的位置而相關(guān)的字段。這些關(guān)系同樣可以通過(guò)對(duì)各字段的存儲(chǔ)分配傳達(dá)各字段之間的關(guān)系的計(jì)算機(jī)可讀介質(zhì)中的位置來(lái)得到。然而,可以使用任何合適的機(jī)制來(lái)在數(shù)據(jù)結(jié)構(gòu)的各字段中的信息之間建立關(guān)系,例如通過(guò)使用指針、標(biāo)簽、 或在數(shù)據(jù)元素之間建立關(guān)系的其他機(jī)制。本發(fā)明的各個(gè)方面可單獨(dú)、組合或以未在前述實(shí)施方式中特別討論的各種安排來(lái)使用,從而并不將其應(yīng)用限于前述描述中所述或附圖形中所示的組件的細(xì)節(jié)和安排。例如, 可使用任何方式將一個(gè)實(shí)施方式中描述的各方面與其它實(shí)施方式中描述的各方面組合。
同樣,本發(fā)明可被具體化為方法,其示例已經(jīng)提供。作為該方法的一部分所執(zhí)行的動(dòng)作可以按任何合適的方式來(lái)排序。因此,可以構(gòu)建各個(gè)實(shí)施方式,其中各動(dòng)作以與所示的次序所不同的次序執(zhí)行,不同的次序可包括同時(shí)執(zhí)行某些動(dòng)作,即使這些動(dòng)作在各說(shuō)明性實(shí)施方式中被示為順序動(dòng)作。在權(quán)利要求書中使用諸如“第一”、“第二”、“第三”等序數(shù)詞來(lái)修飾權(quán)利要求元素本身并不意味著一個(gè)權(quán)利要求元素較之另一個(gè)權(quán)利要求元素的優(yōu)先級(jí)、先后次序或順序、 或者方法的各動(dòng)作執(zhí)行的時(shí)間順序,而僅用作將具有某一名字的一個(gè)權(quán)利要求元素與(若不是使用序數(shù)詞則)具有同一名字的另一元素區(qū)分開(kāi)的標(biāo)簽以區(qū)分各權(quán)利要求元素。同樣,此處所使用的短語(yǔ)和術(shù)語(yǔ)是出于描述的目的而不應(yīng)被認(rèn)為是限制。此處對(duì) “包括”、“包含”、或“具有”、“含有”、“涉及”及其變型的使用旨在包括其后所列的項(xiàng)目及其等效物以及其它項(xiàng)目。
權(quán)利要求
1.一種用于搜索并檢索多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備上的信息的方法,所述方法包括由與信息檢索系統(tǒng)(750)進(jìn)行通信的至少一個(gè)處理器(730)接收(805)根據(jù)至少一個(gè)關(guān)系框架(710a、710b)結(jié)構(gòu)化的數(shù)據(jù)060),所述關(guān)系框架是高階知識(shí)(705)的至少一個(gè)特征;由所述至少一個(gè)處理器(730)處理(810)所述接收到的數(shù)據(jù)以標(biāo)識(shí)(815)所述至少一個(gè)關(guān)系框架(710a、710b);由所述至少一個(gè)處理器(730)將所述至少一個(gè)關(guān)系框架表示(830)為一個(gè)或多個(gè)計(jì)算表達(dá)式(740),所述一個(gè)或多個(gè)計(jì)算表達(dá)式可由至少一個(gè)計(jì)算機(jī)處理器執(zhí)行。
2.如權(quán)利要求1所述的方法,其特征在于,還包括由所述至少一個(gè)處理器(730)向信息檢索系統(tǒng)(750)提供(840)所述一個(gè)或多個(gè)計(jì)算表達(dá)式(740),以用于響應(yīng)于搜索查詢 (720)生成向用戶返回的信息。
3.如權(quán)利要求2所述的方法,其特征在于,還包括,利用所述信息檢索系統(tǒng)(750)來(lái)接收搜索查詢(720);響應(yīng)于所述搜索查詢來(lái)生成搜索結(jié)果O08、260)以及向所述搜索結(jié)果應(yīng)用所述一個(gè)或多個(gè)計(jì)算表達(dá)式(740)。
4.如權(quán)利要求1所述的方法,其特征在于,所述接收到的數(shù)據(jù)(208J60)是通過(guò)爬行網(wǎng)絡(luò)的組件生成的數(shù)據(jù)。
5.如權(quán)利要求1所述的方法,其特征在于,所述接收到的數(shù)據(jù)(208J60)包括文檔的至少一部分,所述部分包括從下面的組中選擇的結(jié)構(gòu)類型列表、表、記錄、圖、序列,以及電子表格。
6.如權(quán)利要求1所述的方法,其特征在于,所述至少一個(gè)關(guān)系框架(710a、710b)在與電子表格相關(guān)聯(lián)的元數(shù)據(jù)或模式中標(biāo)識(shí)。
7.如權(quán)利要求1所述的方法,其特征在于,所述一個(gè)或多個(gè)計(jì)算表達(dá)式(740)中的每一個(gè)都表示在電子表格中標(biāo)識(shí)的計(jì)算或函數(shù)。
8.如權(quán)利要求1所述的方法,其特征在于,所述一個(gè)或多個(gè)計(jì)算表達(dá)式(740)中的每一個(gè)都包括從下面的組中選擇的計(jì)算機(jī)可執(zhí)行表達(dá)式類型規(guī)則、約束、布爾表達(dá)式、聲明性表達(dá)式、條件語(yǔ)句、數(shù)學(xué)表達(dá)式,及其任何組合。
9.如權(quán)利要求0所述的方法,其特征在于,所述標(biāo)識(shí)(815)包括標(biāo)識(shí)一組不與處理器可識(shí)別關(guān)系框架相對(duì)應(yīng)的數(shù)據(jù);向用戶(102)或模型作者(254)提供該組數(shù)據(jù);以及從所述用戶或模型作者接收標(biāo)識(shí)該組數(shù)據(jù)的關(guān)系框架的輸入。
10.一種用于搜索和檢索由多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備提供的信息的系統(tǒng)(106、262),所述系統(tǒng)包括被配置成從至少一個(gè)聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)設(shè)備(105、110)接收數(shù)據(jù)的輸入組件;被配置成向至少一個(gè)信息檢索系統(tǒng)(200、750)傳輸數(shù)據(jù)的輸出組件;以及至少一個(gè)處理器(730),適用于標(biāo)識(shí)(81 表示由所述輸入組件接收到的數(shù)據(jù)的關(guān)系框架(710a、710b)的至少一個(gè)計(jì)算表達(dá)式,所述關(guān)系框架將所述接收到的數(shù)據(jù)的一部分相關(guān)到所述接收到的數(shù)據(jù)的另一部分,所述關(guān)系框架是高階知識(shí)(705)的至少一個(gè)特征;以及向信息檢索系統(tǒng)(200、750)提供(840)所述至少一個(gè)計(jì)算表達(dá)式,以用于響應(yīng)于搜索查詢(202,720)生成向用戶(102)返回的信息(218)。
11.如權(quán)利要求10所述的系統(tǒng),其特征在于,標(biāo)識(shí)(815)所述至少一個(gè)計(jì)算表達(dá)式 (740)包括至少部分地基于在電子表格中標(biāo)識(shí)的計(jì)算或函數(shù)來(lái)標(biāo)識(shí)所述計(jì)算表達(dá)式。
12.如權(quán)利要求10所述的系統(tǒng),其特征在于,所述至少一個(gè)計(jì)算表達(dá)式(740)包括從下面的組中選擇的計(jì)算機(jī)可執(zhí)行表達(dá)式類型規(guī)則、約束、布爾表達(dá)式、聲明性表達(dá)式、條件語(yǔ)句、數(shù)學(xué)表達(dá)式,及其任何組合。
13.如權(quán)利要求10所述的系統(tǒng),其特征在于,所述標(biāo)識(shí)(815)所述至少一個(gè)計(jì)算表達(dá)式包括標(biāo)識(shí)所述接收到的數(shù)據(jù)O08、260)的至少一部分中的數(shù)據(jù)結(jié)構(gòu)類型并分析所述數(shù)據(jù)結(jié)構(gòu)類型。
14.如權(quán)利要求13所述的系統(tǒng),其特征在于,所述數(shù)據(jù)結(jié)構(gòu)類型包括從下面的組中選擇的元素列表、表、記錄、圖、序列,以及電子表格。
15.如權(quán)利要求10所述的系統(tǒng),其特征在于,所述至少一個(gè)計(jì)算表達(dá)式(740)被包括為供所述信息檢索系統(tǒng)(750)用來(lái)進(jìn)行搜索的模型050)。
全文摘要
發(fā)明涉及從結(jié)構(gòu)化數(shù)據(jù)中提取高階知識(shí)。描本述了用于對(duì)可以從數(shù)據(jù)存儲(chǔ)設(shè)備的網(wǎng)絡(luò)中獲得的內(nèi)容進(jìn)行基于高階知識(shí)的搜索的系統(tǒng)和方法。在各實(shí)施方式中,標(biāo)識(shí)表示內(nèi)容的關(guān)系框架的至少一個(gè)計(jì)算表達(dá)式,并將其提供到信息檢索系統(tǒng),以供用于搜索用戶所希望的內(nèi)容。內(nèi)容的關(guān)系框架可包括將某些內(nèi)容與其他內(nèi)容綁定、相關(guān)或相關(guān)聯(lián)的規(guī)則、表達(dá)式、等式和/或約束??梢酝ㄟ^(guò)處理結(jié)構(gòu)化數(shù)據(jù)確定計(jì)算表達(dá)式??梢栽谂佬芯W(wǎng)絡(luò)期間標(biāo)識(shí)結(jié)構(gòu)化數(shù)據(jù),或者可以顯式地將它們提供給提取器。信息檢索系統(tǒng)對(duì)計(jì)算表達(dá)式的使用可以比利用傳統(tǒng)的信息搜索方法更高效并且更準(zhǔn)確地向用戶返回所需內(nèi)容。
文檔編號(hào)G06F17/30GK102243647SQ20111012885
公開(kāi)日2011年11月16日 申請(qǐng)日期2011年5月11日 優(yōu)先權(quán)日2010年5月11日
發(fā)明者D·E·魯賓, T·F·貝格施特雷瑟, V·米塔爾 申請(qǐng)人:微軟公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1