亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種能夠運(yùn)行在不同格式的廠商站點(diǎn)上的電子購(gòu)物代理的制作方法

文檔序號(hào):6540499閱讀:337來(lái)源:國(guó)知局

專(zhuān)利名稱(chēng)::一種能夠運(yùn)行在不同格式的廠商站點(diǎn)上的電子購(gòu)物代理的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及一種電子購(gòu)物代理,或稱(chēng)之為“智能搜索工具(bots)”,它能運(yùn)行在因特網(wǎng)(Internet)上,便于客戶(hù)查找能夠提供他們感興趣的商品和服務(wù)的在線廠商。
背景技術(shù)
:隨著個(gè)人計(jì)算機(jī)的日益普及,因特網(wǎng)和網(wǎng)絡(luò)相關(guān)技術(shù)也得到廣泛發(fā)展。其中發(fā)展最快的商業(yè)領(lǐng)域之一是電子商務(wù),特別是零售方式的用戶(hù)購(gòu)物。因特網(wǎng)能使用戶(hù)迅速地找到他們感興趣的商品和服務(wù)。在很多情況下,他們能夠在網(wǎng)頁(yè)上看到商品的圖像并能直接訂貨。用戶(hù)可以通過(guò)信用卡進(jìn)行電子付款,然后商品就能運(yùn)送給他們。比較購(gòu)物(comparativeshopping)使用因特網(wǎng)作為一種搜尋和檢索工具來(lái)定位和檢索類(lèi)似商品的信息和價(jià)格,也是一個(gè)發(fā)展迅速的領(lǐng)域。已經(jīng)有幾種可用于因特網(wǎng)上的比較購(gòu)物工具,如Junglee和Jango。這些購(gòu)物工具能夠接受用戶(hù)輸入的關(guān)鍵字和種類(lèi)信息,用來(lái)創(chuàng)建一種自動(dòng)代理或“購(gòu)物智能搜索工具”,其在因特網(wǎng)上瀏覽并從一組在線廠商定位相關(guān)產(chǎn)品,查找到的產(chǎn)品條目再由購(gòu)物智能搜索工具返回,然后利用簡(jiǎn)單的表格方式呈現(xiàn)給用戶(hù),從而用戶(hù)就可以進(jìn)行比較購(gòu)物。盡管現(xiàn)有的購(gòu)物工具能夠幫助用戶(hù)進(jìn)行比較購(gòu)物,但在所有的購(gòu)物智能搜索工具中仍存在著一些局限性。首先是包含在比較庫(kù)(conparisonpool)中的用戶(hù)能訪問(wèn)并用于比較的在線廠商的數(shù)量很小。這一局限性主要?dú)w因于一個(gè)歷史事實(shí),即因特網(wǎng)的演變。因特網(wǎng)最初被設(shè)計(jì)為采用一種非常特殊的被稱(chēng)為超文本標(biāo)記語(yǔ)言(HTML)的格式對(duì)信息進(jìn)行編碼來(lái)運(yùn)行的。HTML是一種表示語(yǔ)言,它使用嵌入在文檔中的代碼來(lái)定義文檔的特殊部分如何在像Web瀏覽器這樣的顯示機(jī)制上呈現(xiàn)出來(lái)。雖然HTML有預(yù)先定義的和固定的格式,但它不能給出任何用這種HTML格式化的信息的本意或語(yǔ)義。因此,盡管Web瀏覽器能夠讀取HTML并能使用HTML代碼來(lái)識(shí)別信息中的選定部分,比如文本和圖形,但瀏覽器不能使用HTML代碼從已識(shí)別的文檔部分析取信息。另外,依賴(lài)不同設(shè)計(jì)者和廠商的喜好,偏愛(ài)和市場(chǎng)需求網(wǎng)頁(yè)常常極為不同。因此,對(duì)于一個(gè)搜索引擎來(lái)說(shuō),從種類(lèi)繁多的使用不同HTML代碼的網(wǎng)頁(yè)上析取象物品價(jià)格這樣的特定信息是困難且冗長(zhǎng)的。為了克服這一困難,一些購(gòu)物智能搜索工具使用諸如所謂的“包裝(wrappers)”或“信息適配器(informationadapters)”這樣的機(jī)制,其中的一種機(jī)制被編程以發(fā)現(xiàn)或“獲悉”有關(guān)每個(gè)廠商站點(diǎn)的每一產(chǎn)品的類(lèi)別。但是,這些機(jī)制的運(yùn)行速度很慢,且通常會(huì)耗費(fèi)數(shù)小時(shí)至數(shù)天的時(shí)間才能將一個(gè)新的廠商包含在比較庫(kù)中。而且,一旦廠商改變了其網(wǎng)頁(yè)的格式,為了使搜索引擎繼續(xù)工作,也需要耗費(fèi)大量的時(shí)間來(lái)改變用于該廠商站點(diǎn)的機(jī)制。因特網(wǎng)上持續(xù)不斷的信息流量需要購(gòu)物智能搜索工具的提供者雇用大量的程序員來(lái)設(shè)計(jì)和維護(hù)他們的服務(wù),而所能覆蓋的廠商站點(diǎn)的數(shù)目必定還是很小的。第二點(diǎn)限制是用戶(hù)通過(guò)已有的購(gòu)物智能搜索工具所能獲得的信息量。目前,大多數(shù)購(gòu)物智能搜索工具僅能向用戶(hù)提供有限的信息,如商品的價(jià)格、商品的簡(jiǎn)要說(shuō)明和廠商的鏈接。但是,在用戶(hù)看來(lái),價(jià)格也許并不是決定購(gòu)物的唯一標(biāo)準(zhǔn)。其它的因素,比如運(yùn)貨日期、保證信息、廠商的信譽(yù)以及服務(wù)等,常常也會(huì)對(duì)購(gòu)物的決策產(chǎn)生影響。盡管向已有的購(gòu)物智能搜索工具增添附加的標(biāo)準(zhǔn)是可能的,但這意味著要修改對(duì)應(yīng)不同類(lèi)別、子類(lèi)別以及廠商站點(diǎn)的成百甚至成千的“包裝”或“信息適配器”。這一工作無(wú)論是在時(shí)間還是在人力資源上都是一項(xiàng)很大的投入?,F(xiàn)有購(gòu)物智能搜索工具的第三點(diǎn)限制是它的性能和搜索結(jié)果的準(zhǔn)確率。大多數(shù)已有的購(gòu)物智能搜索工具速度都很慢,并需要耗費(fèi)較長(zhǎng)的時(shí)間才能產(chǎn)生搜索結(jié)果。因此,許多現(xiàn)有的系統(tǒng)把從廠商站點(diǎn)檢索到的信息存儲(chǔ)于一個(gè)本地?cái)?shù)據(jù)庫(kù)中,這樣可使搜索速度大大加快。但是,本地?cái)?shù)據(jù)庫(kù)僅能通過(guò)與廠商站點(diǎn)連接而得到周期性的更新,因此搜索的結(jié)果經(jīng)常是過(guò)時(shí)的,并且不是很準(zhǔn)確或者說(shuō)并未反映廠商站點(diǎn)的實(shí)際情況。因此,需要有一個(gè)能夠運(yùn)行在各種不同格式的廠商站點(diǎn)上的購(gòu)物智能搜索工具,其能快速適應(yīng)現(xiàn)有廠商站點(diǎn)新的格式或變化。還要求有一個(gè)能夠被容易和快速地修改的購(gòu)物智能搜索工具,以便檢索和顯示與廠商站點(diǎn)當(dāng)前展示的信息相比新的、不同的信息。還需要有一個(gè)能夠快速地向用戶(hù)提供準(zhǔn)確和及時(shí)的信息的購(gòu)物智能搜索工具。
發(fā)明內(nèi)容根據(jù)本發(fā)明的原理,當(dāng)產(chǎn)生一個(gè)信息請(qǐng)求時(shí),一個(gè)購(gòu)物智能搜索工具可以使用實(shí)時(shí)代理,該代理自動(dòng)與各不相同的、提供大量不同類(lèi)別和廠商的網(wǎng)頁(yè)相連接,檢索和統(tǒng)一這些網(wǎng)頁(yè)的信息以便進(jìn)行顯示。這樣,就不必為每個(gè)類(lèi)別或廠商創(chuàng)建一個(gè)“包裝”或“信息適配器”,因?yàn)橥淮砟軌驒z索和處理不同格式的信息。尤為特別的是,購(gòu)物智能搜索工具根據(jù)用戶(hù)輸入的關(guān)鍵字和一個(gè)URL(統(tǒng)一資源定位符)信息數(shù)據(jù)庫(kù)產(chǎn)生查詢(xún),然后對(duì)查詢(xún)返回的信息進(jìn)行過(guò)濾、語(yǔ)法分析并將其轉(zhuǎn)換成一種標(biāo)準(zhǔn)的格式。這樣,被格式化的信息就能顯示出來(lái)。由于信息能夠被實(shí)時(shí)地轉(zhuǎn)換成標(biāo)準(zhǔn)格式,本發(fā)明就能快速地添加在線廠商,而且附加的商品類(lèi)別也能快速容易地添加。此外,隨著市場(chǎng)需求的增加,產(chǎn)品項(xiàng)目信息能夠很容易地得到擴(kuò)充而不用逐個(gè)修改代碼數(shù)據(jù)庫(kù)。根據(jù)本發(fā)明的一個(gè)實(shí)施例,URL信息數(shù)據(jù)庫(kù)包括每個(gè)廠商站點(diǎn)上各個(gè)站點(diǎn)目錄特定的URL地址,這樣就可以通過(guò)用戶(hù)提供的關(guān)鍵字很容易地產(chǎn)生查詢(xún)。根據(jù)本發(fā)明的另一個(gè)實(shí)施例,從廠商站點(diǎn)檢索到的信息包括瀏覽器通常顯示的信息。對(duì)這種典型的HTML或XML格式的信息進(jìn)行語(yǔ)法分析和過(guò)濾,并使用一個(gè)多級(jí)樹(shù)(hierarchicaltree)結(jié)構(gòu)將信息轉(zhuǎn)換成要求的類(lèi)別,之后顯示比較信息。根據(jù)本發(fā)明的又一個(gè)實(shí)施例,使用高效的高速緩存和分布式算法來(lái)減少用戶(hù)的響應(yīng)時(shí)間。本發(fā)明上述的和更多的優(yōu)點(diǎn)可以通過(guò)參考下面結(jié)合附圖的描述更好地理解。其中圖1是一個(gè)網(wǎng)絡(luò)配置的示意性方框圖,該網(wǎng)絡(luò)配置包括因特網(wǎng),并將幾個(gè)本地計(jì)算機(jī)系統(tǒng)連接至遠(yuǎn)程服務(wù)器;圖2是說(shuō)明了本發(fā)明的購(gòu)物系統(tǒng)主要組成部分的示意性方框圖;圖3A和圖3B一起構(gòu)成一個(gè)流程圖,說(shuō)明了本發(fā)明通過(guò)存儲(chǔ)的用于發(fā)布查詢(xún)至廠商站點(diǎn)的URL并行產(chǎn)生查詢(xún)以及并行處理結(jié)果的過(guò)程;圖4是說(shuō)明從查詢(xún)結(jié)果中抽取相關(guān)信息的過(guò)程的流程圖;圖5是處于一個(gè)有三個(gè)結(jié)點(diǎn)層次的多級(jí)樹(shù)分枝上的信息的例示圖;圖6是處于另一個(gè)有三個(gè)結(jié)點(diǎn)層次的多級(jí)樹(shù)分枝上的信息的例示圖;圖7是處于又一個(gè)也有三個(gè)結(jié)點(diǎn)層次的多級(jí)樹(shù)分枝上的信息的例示圖。具體實(shí)施例方式圖1示出了一種普遍使用的網(wǎng)絡(luò)配置,在該配置中,本地計(jì)算機(jī)系統(tǒng)100和102通過(guò)局域網(wǎng)(LAN)104連接到本地服務(wù)器106上,該本地服務(wù)器106可以通過(guò)因特網(wǎng)108訪問(wèn)多臺(tái)遠(yuǎn)程服務(wù)器110-114。每臺(tái)遠(yuǎn)程服務(wù)器110-114可以包括萬(wàn)維網(wǎng)站點(diǎn)(網(wǎng)站),而每個(gè)網(wǎng)站包括多個(gè)萬(wàn)維網(wǎng)網(wǎng)頁(yè)(網(wǎng)頁(yè))。每個(gè)本地計(jì)算機(jī)系統(tǒng)100和102(其中系統(tǒng)100被詳細(xì)顯示)可以使用網(wǎng)絡(luò)瀏覽器軟件101訪問(wèn)遠(yuǎn)程網(wǎng)站,這些瀏覽器軟件包括如加利福尼亞MountainView網(wǎng)景(Netscape)通信公司的NetscapeNavigatorTM或華盛頓雷蒙德微軟公司的InternetExplorer。一個(gè)網(wǎng)站有一個(gè)位于最高層次的主頁(yè)。主頁(yè)一般包含有關(guān)廠商的綜合信息,其中包括生動(dòng)的圖像,主頁(yè)還可能包含其它信息,如一個(gè)允許訪問(wèn)網(wǎng)站的用戶(hù)定位至其它構(gòu)成該站點(diǎn)的網(wǎng)頁(yè)上的菜單。站點(diǎn)也可包括一個(gè)站點(diǎn)目錄,該目錄是一個(gè)含有與其它網(wǎng)頁(yè)的鏈接的網(wǎng)頁(yè)。一個(gè)站點(diǎn)目錄經(jīng)常包括一個(gè)站點(diǎn)搜索部件,該部件是一個(gè)能夠接收關(guān)鍵字形式的用戶(hù)輸入并搜索匹配站點(diǎn)的完整的搜索引擎。用戶(hù)使用的信息,如產(chǎn)品說(shuō)明和價(jià)格,一般位于較低的層次級(jí)別上。訂購(gòu)信息,如信用卡信息,可能會(huì)存放在站點(diǎn)的另一層次上。萬(wàn)維網(wǎng)實(shí)際上是一個(gè)在因特網(wǎng)108上使用超文本傳輸協(xié)議(HTTP)的服務(wù)器的集合。HTTP是一個(gè)公知的為用戶(hù)提供文件(該文件可使用不同的格式,如文本,圖形,圖像,聲音和視頻)訪問(wèn)的應(yīng)用協(xié)議,這種文件使用一種被稱(chēng)為超文本標(biāo)記語(yǔ)言(HTML)的標(biāo)準(zhǔn)頁(yè)描述語(yǔ)言。在許多基本的文檔格式化功能中,HTML允許軟件開(kāi)發(fā)者在顯示的網(wǎng)頁(yè)上定義指向駐留在遠(yuǎn)程服務(wù)器上其它網(wǎng)頁(yè)的圖形指針(通常指的是“超鏈接”)。超鏈接通常以高亮文本或其它生動(dòng)圖像的形式顯示在網(wǎng)頁(yè)上。使用一個(gè)指點(diǎn)設(shè)備如計(jì)算機(jī)鼠標(biāo)選擇一個(gè)超鏈接,能使本地計(jì)算機(jī)從遠(yuǎn)程服務(wù)器上下載相關(guān)網(wǎng)頁(yè)的HTML代碼。網(wǎng)頁(yè)的位置用“統(tǒng)一資源定位符”(URL)來(lái)表示。這種方法能為遠(yuǎn)程服務(wù)器提供必要的信息以上傳與本地計(jì)算機(jī)選定的細(xì)目相關(guān)的遠(yuǎn)程網(wǎng)頁(yè)。在線廠商構(gòu)建的網(wǎng)站包括待售商品的說(shuō)明和/或圖片。每個(gè)站點(diǎn)一般都以含有多個(gè)結(jié)點(diǎn)的分級(jí)分支樹(shù)結(jié)構(gòu)配置,這些結(jié)點(diǎn)包含了該站點(diǎn)中一個(gè)或更多網(wǎng)頁(yè)。該站點(diǎn)上的每個(gè)結(jié)點(diǎn)都被設(shè)想處于樹(shù)結(jié)構(gòu)每個(gè)分支的不同層次上。例如,如果第一結(jié)點(diǎn)中一個(gè)網(wǎng)頁(yè)的URL包含同一分支中的第二結(jié)點(diǎn),則該第一結(jié)點(diǎn)就被認(rèn)為處在比第二結(jié)點(diǎn)更低的層次上。相反,如果第二結(jié)點(diǎn)中一個(gè)網(wǎng)頁(yè)的URL包含同一分支中的第三結(jié)點(diǎn),則該第三結(jié)點(diǎn)就被認(rèn)為處在比第二結(jié)點(diǎn)更高的層次上。經(jīng)由瀏覽器軟件101在因特網(wǎng)上訪問(wèn)網(wǎng)頁(yè),并且網(wǎng)頁(yè)通常被下載至本地計(jì)算機(jī)系統(tǒng)100的一個(gè)高速緩存103中。然后瀏覽器軟件101使用HTML代碼將各種文件定位在顯示屏幕上。本發(fā)明的購(gòu)物系統(tǒng)在圖2中加以說(shuō)明,它包括一個(gè)搜索引擎核心(SEK)206,一個(gè)或更多的搜索引擎208-212,以及一個(gè)或更多的自動(dòng)學(xué)習(xí)對(duì)象(ALO)214-218。內(nèi)核206可以設(shè)在本地服務(wù)器上(圖1,106),與一個(gè)或更多的用戶(hù)200-204相互作用以接收用戶(hù)的信息請(qǐng)求并將結(jié)果發(fā)回到做出請(qǐng)求的用戶(hù)。SEK206最好是一個(gè)獨(dú)立的平臺(tái),以便它能夠運(yùn)行于任何硬件平臺(tái)和操作系統(tǒng)上。在一個(gè)實(shí)施例中,SEK206是用SunMicrosystems公司的Java程序語(yǔ)言編寫(xiě)的,且它能運(yùn)行于任何平臺(tái),只要該平臺(tái)以Java環(huán)境運(yùn)行。SEK206首先分析用戶(hù)的請(qǐng)求,然后根據(jù)該用戶(hù)的請(qǐng)求啟動(dòng)合適的功能。例如,SEK206可以從一個(gè)用戶(hù)200-204接收一個(gè)有關(guān)具有特定主題,比如有關(guān)“子女婚姻支持”(childspousalsupport)的主題的書(shū)籍的請(qǐng)求信息。請(qǐng)求準(zhǔn)則(criteria)由用戶(hù)以各種不同的方式輸入。該準(zhǔn)則可經(jīng)由一個(gè)互動(dòng)界面輸入,通過(guò)該互動(dòng)界面用戶(hù)回答一系列基于關(guān)鍵字的問(wèn)題?;蛘?,用戶(hù)可以使用下拉列表和菜單選擇一個(gè)預(yù)定義的類(lèi)別,比如從項(xiàng)目列表或圖形顯示中選擇“書(shū)籍”。一般來(lái)說(shuō),請(qǐng)求包括至少一種類(lèi)別,比如“書(shū)籍”或“汽車(chē)”,還包括選擇的關(guān)鍵字,比如“子女”,“婚姻”和“支持”,或者包括一個(gè)短語(yǔ)“子女婚姻支持”,該短語(yǔ)可由常規(guī)的分析程序分解為一個(gè)或更多關(guān)鍵字。在應(yīng)答中,SEK206產(chǎn)生一個(gè)或更多與所選主題相關(guān)的查詢(xún)。為了產(chǎn)生這些查詢(xún),SEK206使用了一個(gè)內(nèi)部URL數(shù)據(jù)庫(kù)220。該數(shù)據(jù)庫(kù)可包括由參與廠商所設(shè)立的表目,或可以是一個(gè)手工下載的表,或可由維護(hù)本發(fā)明購(gòu)物系統(tǒng)的公司來(lái)提供。數(shù)據(jù)庫(kù)220包含了大量由類(lèi)別配置的URL。當(dāng)用戶(hù)輸入一個(gè)類(lèi)別時(shí),數(shù)據(jù)庫(kù)220將返回該用于類(lèi)別的URI。根據(jù)本發(fā)明的一個(gè)重要方面,存儲(chǔ)在數(shù)據(jù)庫(kù)220中的URL不是某個(gè)特定廠商站點(diǎn)的URL,而是站點(diǎn)目錄的URL,特別是各個(gè)站點(diǎn)的站點(diǎn)搜索的URL。這些URL很容易與用戶(hù)鍵入的關(guān)鍵字結(jié)合起來(lái)以形成一個(gè)查詢(xún)。這種查詢(xún)利用存在于大多數(shù)廠商站點(diǎn)中的內(nèi)部搜索引擎來(lái)完成至少一部分搜索,從而減輕了本發(fā)明系統(tǒng)不得不創(chuàng)建對(duì)每個(gè)廠商站點(diǎn)特定的查詢(xún)的負(fù)擔(dān)。例如,繼續(xù)上面的例子,如果用戶(hù)已經(jīng)選擇了“書(shū)籍”這一類(lèi)別,則SEK206可以從數(shù)據(jù)庫(kù)220中檢索象amazon.com和kingbooks.com這樣的在線書(shū)籍銷(xiāo)售商的URL。但是,從數(shù)據(jù)庫(kù)220檢索到的URL實(shí)際上是這些站點(diǎn)上的搜索引擎的URLhttp//www.amazon.com/exec/obidos/external-search/?和http//www.kingbooks.com/scripts/search3.exe?by=keywords&amp;這些URL采取很容易與用戶(hù)鍵入的關(guān)鍵字結(jié)合的形式,以便形成如下的查詢(xún)http//www.amazon.com/exec/obidos/external-search/?keyword=child+Spousal+support和http//www.kingbooks.com/scripts/search3.exe?by=keywords&amp;keyword=child+spousal+support這些查詢(xún)很有益,因?yàn)樗鼈兪褂酶髯跃W(wǎng)站上的內(nèi)置搜索引擎來(lái)完成實(shí)際的搜索,這樣就緩解了SEK必須為每個(gè)站點(diǎn)定制一個(gè)搜索以及當(dāng)站點(diǎn)變化時(shí)必須改變這種定制好的搜索的壓力。但是,一些廠商站點(diǎn)沒(méi)有內(nèi)部搜索引擎。取而代之的是,一些站點(diǎn)有一個(gè)在線目錄而其它站點(diǎn)則只是些簡(jiǎn)單的網(wǎng)頁(yè)。在廠商站點(diǎn)有目錄的情形下,程序員必需進(jìn)入站點(diǎn)并定位至產(chǎn)生用戶(hù)選擇的的目錄區(qū)域。對(duì)應(yīng)這些目錄區(qū)域的URL經(jīng)常就能與用戶(hù)鍵入的關(guān)鍵字結(jié)合以產(chǎn)生需要的查詢(xún)。數(shù)據(jù)庫(kù)220可以包含一個(gè)廠商站點(diǎn)的幾個(gè)URL,而每個(gè)URL都被轉(zhuǎn)換為一個(gè)或更多的關(guān)鍵字。當(dāng)用戶(hù)鍵入用來(lái)查詢(xún)的關(guān)鍵字時(shí),就使用該關(guān)鍵字選擇一個(gè)廠商站點(diǎn)的URL,然后通過(guò)將選擇的關(guān)鍵字與用戶(hù)鍵入的信息結(jié)合而產(chǎn)生最終的查詢(xún)。在廠商站點(diǎn)只是一個(gè)簡(jiǎn)單的網(wǎng)頁(yè)集合的情形下,程序員必須進(jìn)入站點(diǎn)并直接定位至一個(gè)顯示產(chǎn)品項(xiàng)目的網(wǎng)頁(yè)上。然后將識(shí)別該網(wǎng)頁(yè)的URL鍵入數(shù)據(jù)庫(kù)220中,并把該URL轉(zhuǎn)換成從該網(wǎng)頁(yè)內(nèi)容選擇的各種各樣的關(guān)鍵字。隨后,當(dāng)用戶(hù)鍵入關(guān)鍵字信息時(shí),該信息就用于從數(shù)據(jù)庫(kù)220中選擇被轉(zhuǎn)換成匹配關(guān)鍵字的URL。后面這種方法不如使用一個(gè)內(nèi)部站點(diǎn)搜索那樣有益,因?yàn)槿绻麖S商站點(diǎn)改變,則轉(zhuǎn)換也必須改變。如上所述,某個(gè)廠商的關(guān)鍵字是基于用戶(hù)選擇的類(lèi)別來(lái)選定的,并且使用與關(guān)鍵字相匹配的該廠商站點(diǎn)的URL形成一個(gè)查詢(xún)。用這種方式,可以為每個(gè)在選擇的類(lèi)別中具有一個(gè)URL的廠商站點(diǎn)產(chǎn)生查詢(xún)。當(dāng)每個(gè)查詢(xún)產(chǎn)生時(shí),SEK產(chǎn)生一個(gè)搜索引擎線程(thread),例如搜索引擎208,并為它提供一個(gè)廠商站點(diǎn)的查詢(xún)。搜索引擎208將這一查詢(xún)發(fā)布給合適的廠商站點(diǎn)。作為應(yīng)答,該廠商站點(diǎn)返回查詢(xún)的結(jié)果。發(fā)布查詢(xún)的搜索引擎208收到來(lái)自該廠商站點(diǎn)的查詢(xún)結(jié)果并將其轉(zhuǎn)發(fā)給SEK206。當(dāng)收到結(jié)果時(shí),SEK為每個(gè)廠商站點(diǎn)產(chǎn)生一個(gè)ALO,例如ALO214。ALO處理這些結(jié)果以析取相關(guān)的信息。析取的信息返回到SEK206用以格式化顯示。最后,格式化的結(jié)果返回至發(fā)出最初請(qǐng)求的一個(gè)用戶(hù)200-204。整個(gè)過(guò)程在圖3A和3B的流程圖中進(jìn)行了說(shuō)明,當(dāng)這兩個(gè)圖放在一起時(shí),就構(gòu)成了一個(gè)完整的流程圖。過(guò)程開(kāi)始于步驟300,并進(jìn)行到步驟302,在此嘗試在用戶(hù)選擇的類(lèi)別下從SEK數(shù)據(jù)庫(kù)220中檢索一個(gè)廠商URL。在步驟304中,進(jìn)行一項(xiàng)檢查來(lái)確定這一嘗試是否成功。如果不存在額外的URL并且檢索不成功,則過(guò)程將進(jìn)行至步驟306并結(jié)束。或者,在步驟304中,如果從數(shù)據(jù)庫(kù)220中檢索到一個(gè)額外的URL,則過(guò)程將進(jìn)行至步驟308。在步驟308中,通過(guò)將該URL與用戶(hù)鍵入的關(guān)鍵字相連接可以產(chǎn)生一個(gè)查詢(xún)。如上所述,在很多情況下,該查詢(xún)將直接指向一個(gè)位于廠商站點(diǎn)的站點(diǎn)搜索引擎。接著,在步驟310中,產(chǎn)生一個(gè)本地搜索引擎線程來(lái)發(fā)布查詢(xún)至相應(yīng)的網(wǎng)站。然后過(guò)程返回至步驟302以檢索另一個(gè)URL并產(chǎn)生另一個(gè)搜索引擎線程。每個(gè)搜索線程的運(yùn)行過(guò)程在圖3B中加以說(shuō)明。特別的是,過(guò)程經(jīng)由脫頁(yè)(off-page)連接器312和316進(jìn)行至步驟318,在該步驟中,SEK產(chǎn)生一個(gè)自動(dòng)學(xué)習(xí)對(duì)象以接收來(lái)自一個(gè)廠商站點(diǎn)的搜索結(jié)果。搜索引擎收到由廠商站點(diǎn)搜索引擎產(chǎn)生的查詢(xún)結(jié)果并將其轉(zhuǎn)發(fā)給先前產(chǎn)生的ALO,這在步驟320中加以闡明。來(lái)自一個(gè)站點(diǎn)的數(shù)據(jù)可能不馬上返回,但是一接收到數(shù)據(jù),ALO便開(kāi)始處理過(guò)程。在步驟322中,發(fā)布查詢(xún)的本地搜索引擎接著等待確定是否廠商站點(diǎn)將提供額外的結(jié)果。如果收到額外的結(jié)果,則重復(fù)步驟320。換言之,如果在步驟322中確定沒(méi)有額外的結(jié)果,則過(guò)程在步驟324結(jié)束。SEK206跟蹤產(chǎn)生的所有ALO208-212,并在ALO208-212之間執(zhí)行必要的同步。有益的是,搜索過(guò)程與不同的搜索引擎線程正在處理的各個(gè)查詢(xún)并行進(jìn)行,且相應(yīng)的結(jié)果由不同的ALO來(lái)處理。這種并行處理極大地減少了獲得比較結(jié)果所需要的時(shí)間。另外,從用戶(hù)接收請(qǐng)求信息并初始化一個(gè)搜索引擎的過(guò)程非常短,這樣就只耗費(fèi)最短的時(shí)間。SEK中各種不同的ALO共享相同的資源,使內(nèi)部處理通信更加高效,并消除了不必要的轉(zhuǎn)換?;陬?lèi)別、子類(lèi)別、產(chǎn)品名以及用戶(hù)提供的其它相關(guān)信息,SEK206啟動(dòng)一個(gè)或更多的搜索引擎208-212來(lái)檢查所有可能擁有用戶(hù)請(qǐng)求的產(chǎn)品信息的廠商站點(diǎn)。每個(gè)搜索引擎執(zhí)行一個(gè)由SEK產(chǎn)生的查詢(xún),并到相關(guān)的網(wǎng)站上檢索所需的信息。通常,通過(guò)上述查詢(xún)從一個(gè)網(wǎng)站檢索到的信息要通過(guò)一個(gè)瀏覽器顯示出來(lái)。該信息經(jīng)常要使用象HTML或XML那樣的“表示語(yǔ)言”或其它表示性語(yǔ)言來(lái)編碼。HTML是一種簡(jiǎn)單的“標(biāo)記語(yǔ)言”,它適于顯示小且相對(duì)簡(jiǎn)單的文檔,這些文檔通常在萬(wàn)維網(wǎng)上傳送。另一種被稱(chēng)為可擴(kuò)展標(biāo)記語(yǔ)言(XML)的標(biāo)記語(yǔ)言經(jīng)常用于更復(fù)雜的文檔,這些文檔要求比由HTML提供的更好的性能。XML更容易擴(kuò)展,并允許確認(rèn),還定義了怎樣使用URL來(lái)識(shí)別XML文檔的組成部分。HTML和XML文檔由一系列的實(shí)體或?qū)ο蠼M成。每個(gè)實(shí)體能包含一個(gè)或更多的邏輯元素,而每個(gè)元素能夠具有確定的描述其被處理的方式的屬性或性質(zhì)。這兩種語(yǔ)言都能提供一種正式的語(yǔ)法用以描述組成文檔的實(shí)體、元素以及屬性之間的關(guān)系。這種語(yǔ)法告訴一臺(tái)計(jì)算機(jī)怎樣組織每個(gè)文檔的組成部分。HTML和XML使用成對(duì)的標(biāo)記符來(lái)識(shí)別文檔的組成部分。這種標(biāo)記符是一些很容易辨認(rèn)的代碼,它們被添加到文檔中以識(shí)別每個(gè)文檔組成部分。特別地,每個(gè)邏輯元素的開(kāi)始和結(jié)束都通過(guò)在元素前加入一個(gè)開(kāi)始符和在元素后加入一個(gè)結(jié)束符來(lái)清楚地識(shí)別。例如,能以下面的方式使用標(biāo)識(shí)符&lt;to&gt;和&lt;/to&gt;來(lái)識(shí)別一個(gè)文檔的元素“recipient”documenttext...&lt;to&gt;Recipient&lt;/to&gt;...documenttext.標(biāo)記符的編排是分級(jí)的,因此一些標(biāo)記過(guò)的文檔部分能夠包含其它標(biāo)記過(guò)的文檔部分。為使用一整套標(biāo)記符,用戶(hù)需要知道怎樣根據(jù)正文和不同元素間的關(guān)系來(lái)確定這些標(biāo)記符。例如,在一些XML系統(tǒng)中,元素和它們的屬性在一對(duì)匹配的角形括號(hào)(&lt;...&gt;)內(nèi)輸入,而元素用一個(gè)“與”符號(hào)定位開(kāi)始,用一個(gè)分號(hào)定位結(jié)束(&amp;...;)。在HTML中整套標(biāo)記符是固定的且規(guī)模相對(duì)較小。在XML文檔中,標(biāo)記符的形式和組成能由用戶(hù)定義,但為了在用戶(hù)間提供互用性,經(jīng)常由一個(gè)同業(yè)公會(huì)或類(lèi)似的團(tuán)體來(lái)定義。XML標(biāo)記符組基于文檔的邏輯結(jié)構(gòu),因而容易閱讀和理解。XML能夠描述更多種類(lèi)的文檔,但既然不同的文檔有不同的部分或組成,那么為所有文檔的所有元素預(yù)定義標(biāo)識(shí)符是不現(xiàn)實(shí)的。相反,能夠?qū)⑽臋n歸類(lèi)成“類(lèi)型”,而每種類(lèi)型都有確定的元素。一個(gè)文檔類(lèi)型定義(DTD)規(guī)定了一個(gè)文檔類(lèi)型中期望有哪些元素,還規(guī)定了在文檔中發(fā)現(xiàn)的每個(gè)元素是不被允許、或是允許且需要還是允許但不需要。通過(guò)在DTD中定義每個(gè)文檔元素的角色,就有可能檢查每個(gè)元素是否處在文檔中的合法位置。例如,一個(gè)XMLDTD允許檢查當(dāng)不存在一個(gè)二級(jí)標(biāo)題時(shí)鍵入了一個(gè)三級(jí)標(biāo)題。如果從上述查詢(xún)返回的信息中的標(biāo)識(shí)符識(shí)別了與本發(fā)明購(gòu)物智能搜索工具相關(guān)的文檔的組成部分,比如商品說(shuō)明,價(jià)格等,那將是很便利的。但是,在大多數(shù)情況下,返回的信息被編碼以便在一個(gè)瀏覽器上顯示,且必須進(jìn)一步處理才能析取所要求的購(gòu)物信息。下面給出一個(gè)從查詢(xún)中返回的信息的例子。這一信息用HTML代碼來(lái)編碼,并由前面提到的Netscape或InternetExplorer瀏覽器來(lái)使用。<prelisting-type="program-listing"><html><head><title>BooksFoundbySearch</title><head><bodybgcolor=”#FFFFFF”><divalign=”center”><center><tableborder=”0”width=”750”><tr><tdwidth=”375”><fontcolor=”#000000”size=”5”><strong>BooksFoundbySearch<br><br></strong></font><fontcolor=”#000000”size=”3”>Yoursearchbroughtup1titles.<br>Clickonatitleformoreinformation.</font></td><tdvalign=”top”width=”375”><fontsize=”4”><imgsrc=”/images/future.gif”width=”20”height=”20”>&amp;amp;nbsp;Thisiconrepresentsnewandupcomingreleases.><br></font>Forcurrentavailabilityinto,pleaseclickonthetitle.</td></tr></table><tableborder=”0”width=”750”><tr><tdwidth=”750”>Yoursearchresultissortedbypublicationdatewithmostrecentonefirst.</td></tr></table></center></div>&lt;!--SIPO&lt;DPn="11"&gt;--&gt;&lt;dpn="d11"/&gt;<!--lSBN0944058316--><divalign=”center”><center><tableborder=”0”width=”750”><tr><tdwidth=”40”><fontsize=”4”><strong>1.</strong></font></td><tdwidth=”710”colspan=”5”><aname=”0370994”href=”/scripts/detail4.exe?/results/b9bflcb4.html-0370994”><fontsize=”4”>HowtoSettleChildandSpousalSupport;WithCalSuppotSoftwareWith3.5Disk</font></a></td></tr><tr><tdwidth=”40”>&amp;amp;nbsp;</td><tdwidth=”710”colspan=”5”>Authorsherman,Ed~SubjectDomesticRelations-Divorce&amp;amp;Separation~Pub.Date;1/1998</td></tr><tr><tdwidth=”40”>&amp;amp;nbsp;</td><tdwidth=”710”colspan=”5”>Pub.Price$29.25~Kingbooks.comPrice<fontcolor=”#FF0000”>$23.96</font><fontcolor=”#000000”~</font>YouSave<fontcolor=”#FF0000”>$5.99</font></td></tr></table></center></div><divalign=”center”><center><imgsrc=”images/redline.gif”width=”750”height=”4”></center></div></body></html></pre>該信息必須被處理以獲取ALO所執(zhí)行的過(guò)程的相關(guān)信息。如上所述,為縮短處理時(shí)間,需要為SEK206收到的每個(gè)結(jié)果集產(chǎn)生一個(gè)單獨(dú)的ALO線程。圖4中的流程圖說(shuō)明了一個(gè)處理程序的例子。這一程序從步驟400開(kāi)始并執(zhí)行到步驟402。在步驟402中,一個(gè)過(guò)濾裝置將刪除格式化信息和屬性。這一過(guò)濾功能能用一種識(shí)別標(biāo)記符的分析機(jī)制來(lái)實(shí)現(xiàn)。這種分析機(jī)制對(duì)諸如HTML和XML這樣的表示語(yǔ)言是眾所周知的。接著,被識(shí)別的標(biāo)記符與一個(gè)預(yù)定義的標(biāo)記符列表相比較,而格式化標(biāo)記符如&lt;html&gt;,&lt;head&gt;,&lt;title&gt;,&lt;font&gt;,&lt;br&gt;等將被刪除。另外,標(biāo)記符中格式化屬性也將被刪除。在上面的例子中,保留的信息將是<prelisting-type="program-listing"><table><tr><tdBooksFoundbySearchYoursearchbroughtup1titles.Clickonatitleformoreinformation.</td><td>Thisiconrepresentsnewandupcomingreleases.Forcurrentavailabilityinfo,pleaseclickonthetitle.</td></tr></table><table><tr><tdYoursearchresultissortedbypublicationdatewithmostrecentonefirst.</td></tr></table><table><tr><td1.</td><td><aname=”0370994”href=”/scripts/detail4.exe?/results/b9bflcb4.html-0370994”>HowtoSettleChildandSpousalSupport;WithCalSupportSoftwareWith3.5Disk</td></tr><tr><td>;&lt;!--SIPO&lt;DPn="13"&gt;--&gt;&lt;dpn="d13"/&gt;</td><td>AuthorSherman,Ed~SubjectDomesticRelations-Divorce&amp;amp;Separation~Pub.Date;1/1998</td></tr><tr><td>;</td><td>Pub.Price$29.95~Kingbooks.comPrice$23.96~YouSave$5.99</td></tr></table></pre>接著,如步驟404所述,保留的信息被解析成一個(gè)數(shù)據(jù)樹(shù)。在使用HTML和XML的情況下,語(yǔ)言是自然分級(jí)的,這使得解析相對(duì)容易。上面給出的例子被分解為三個(gè)獨(dú)立的樹(shù),這些樹(shù)由一些用鋸齒狀的部分表示的多級(jí)結(jié)點(diǎn)組成(添加鋸齒以強(qiáng)調(diào)各組成部分)。這些樹(shù)在圖5,6和7中加以說(shuō)明并由標(biāo)記符&lt;table&gt;&lt;/table&gt;加以描繪。圖5說(shuō)明第一個(gè)樹(shù)包括一個(gè)由包含在&lt;table&gt;&lt;/table&gt;標(biāo)記符之間的信息組成的第一級(jí)結(jié)點(diǎn)500,一個(gè)由&lt;tr&gt;&lt;/tr&gt;標(biāo)記符加以描述的第二級(jí)結(jié)點(diǎn)502以及兩個(gè)由&lt;td&gt;&lt;/td&gt;標(biāo)記符加以描述的第三級(jí)結(jié)點(diǎn)504和506。以同樣的方式,圖6說(shuō)明第二個(gè)樹(shù)包括一個(gè)由包含在&lt;table&gt;&lt;/table&gt;標(biāo)記符之間的信息組成的第一級(jí)結(jié)點(diǎn)600,一個(gè)由&lt;tr&gt;&lt;/tr&gt;標(biāo)記符加以描述的第二級(jí)結(jié)點(diǎn)602以及一個(gè)由&lt;td&gt;&lt;/td&gt;標(biāo)記符加以描述的第三級(jí)結(jié)點(diǎn)604。圖7說(shuō)明第三個(gè)樹(shù)包括一個(gè)由包含在&lt;table&gt;&lt;/table&gt;標(biāo)記符之間的信息組成的第一級(jí)結(jié)點(diǎn)700,三個(gè)由&lt;tr&gt;&lt;/tr&gt;標(biāo)記符加以描述的第二級(jí)結(jié)點(diǎn)702、704和706以及六個(gè)由&lt;td&gt;&lt;/td&gt;標(biāo)記符加以描述的第三級(jí)結(jié)點(diǎn)708-718。如步驟406所闡述的,每一個(gè)樹(shù)的結(jié)點(diǎn)將被檢查以確定它們是否含有相關(guān)的信息。正如圖中箭頭所示,這些結(jié)點(diǎn)按級(jí)別順序被檢查,以便找到含有一些或所有要求信息的“完整”的結(jié)點(diǎn)級(jí)別。例如在圖5中,首先檢查結(jié)點(diǎn)500。由于它是空的,所以接著檢查處于第二級(jí)的結(jié)點(diǎn)502。它也是空的,于是檢查處于第三級(jí)的結(jié)點(diǎn)504和506。結(jié)點(diǎn)504和506含有信息,該信息將象下面所討論的那樣被檢查。但是,由于結(jié)點(diǎn)504和506含有的信息都不是相關(guān)的信息,如上述例子中書(shū)的標(biāo)題、作者或價(jià)格,因而包含結(jié)點(diǎn)500和502的整個(gè)樹(shù)將被刪除,不再考慮。如果在步驟408(圖4)中確定沒(méi)有發(fā)現(xiàn)相關(guān)的信息,則過(guò)程將返回至步驟406。下一步,在步驟406中檢查圖6所示的樹(shù)。首先檢查結(jié)點(diǎn)600,由于它是空的,所以接著檢查結(jié)點(diǎn)602。它也是空的,所以檢查結(jié)點(diǎn)604。結(jié)點(diǎn)604含有信息并且該信息將象下面所討論的那樣被檢查。但是,由于結(jié)點(diǎn)604不含有相關(guān)的信息,因而包含結(jié)點(diǎn)600和602的整個(gè)樹(shù)將被刪除,不再考慮。然后過(guò)程繼續(xù)從步驟408返回至步驟406。接著,檢查圖7表示的樹(shù)。首先檢查結(jié)點(diǎn)700。由于它是空的,所以檢查結(jié)點(diǎn)702、704和706。這些結(jié)點(diǎn)也是空的,所以檢查結(jié)點(diǎn)708-718,所有這些結(jié)點(diǎn)都含有被檢查的信息。結(jié)點(diǎn)710,714和718含有相關(guān)的信息,因而在步驟410中,該信息被一個(gè)析取機(jī)制析取并映射至相應(yīng)的緩沖區(qū)中。在上述例子中,結(jié)果如下TitleAuthorDescriptionPriceHowtoSettleChildSherman,Ed~DomesticRelations-Divorce&amp;$23.96andSpousalSupport;Separation~PubDate1/1998WithCalSupportPub.Price$29.95SoftwareWith3.5Disk在步驟412中,被緩沖的信息返回至SEK,在這里信息被格式化以便在用戶(hù)的計(jì)算機(jī)上顯示。這樣,過(guò)程便在步驟414結(jié)束。為了在每個(gè)結(jié)點(diǎn)上析取信息,將對(duì)照針對(duì)正被檢查類(lèi)別的規(guī)則集檢查信息。規(guī)則集中的每個(gè)規(guī)則定義了一個(gè)或多個(gè)字段(field)的特征。例如,一個(gè)規(guī)則可能規(guī)定如果某個(gè)結(jié)點(diǎn)包含所有相關(guān)的字段,它就是完整的。在上述例子中,這些字段是標(biāo)題、作者、說(shuō)明和價(jià)格。如果一個(gè)字段不存在,另一個(gè)規(guī)則可能要求進(jìn)一步檢查以確定該結(jié)點(diǎn)是否完整以及是否應(yīng)析取來(lái)自該結(jié)點(diǎn)的信息。例如,如果在一個(gè)結(jié)點(diǎn)中發(fā)現(xiàn)一個(gè)價(jià)格字段和一個(gè)名字字段,則該結(jié)點(diǎn)很可能包含相關(guān)的數(shù)據(jù)。通過(guò)搜索對(duì)每個(gè)類(lèi)別特定的關(guān)鍵字、符號(hào)或數(shù)據(jù)類(lèi)型,可以定位每個(gè)結(jié)點(diǎn)中的相關(guān)信息。于是,可以檢查與這些關(guān)鍵字臨近的單詞以尋找相關(guān)的信息。例如,可以檢查每個(gè)結(jié)點(diǎn)以尋找諸如“名字”、“標(biāo)題”、“說(shuō)明”、“價(jià)格”或“作者”這樣的字符串。如果發(fā)現(xiàn)任何關(guān)鍵字,那么隨后的字符將被認(rèn)為是相關(guān)的信息。另一個(gè)規(guī)則可將一個(gè)價(jià)格字段定義為結(jié)點(diǎn)中遇到的最小的數(shù)字,在其前面使用或不使用“$”符號(hào)。價(jià)格字段也可被定義為一個(gè)在其前有或沒(méi)有“價(jià)格”關(guān)鍵字的數(shù)字。規(guī)則能以多種方式產(chǎn)生。在一個(gè)具體的實(shí)施例中,規(guī)則由程序員為每個(gè)廠商站點(diǎn)制定并維護(hù)。在本實(shí)施例中,處理所接收數(shù)據(jù)的ALO將從規(guī)則集中尋找一個(gè)與數(shù)據(jù)匹配的規(guī)則并使用該規(guī)則析取數(shù)據(jù)。在另一個(gè)實(shí)施例中,搜索結(jié)果被解析為如上所述的樹(shù)結(jié)點(diǎn),ALO將檢查每個(gè)結(jié)點(diǎn)以尋找關(guān)鍵字,該關(guān)鍵字是從一個(gè)取決于用戶(hù)選擇類(lèi)別的關(guān)鍵字集中選擇的。然后析取在這些預(yù)先確定的關(guān)鍵字之后的信息。在這一方案中,每個(gè)站點(diǎn)不必有單獨(dú)的規(guī)則,而規(guī)則也不必由程序員維護(hù)。換言之,能夠制定規(guī)則以允許用戶(hù)在一個(gè)數(shù)據(jù)樹(shù)的特定層次上手動(dòng)地選擇一個(gè)數(shù)據(jù)塊,以使程序能夠在每次返回結(jié)果時(shí)搜索和析取該數(shù)據(jù)塊。由于可以為每個(gè)字段制定規(guī)則,所以每個(gè)ALO都是非常靈活和通用的。這種靈活性允許將不同的廠商快速且容易地添加至搜索和比較庫(kù)中。它也允許從一個(gè)取決于消費(fèi)者或市場(chǎng)需求的站點(diǎn)上搜索不同的信息。在一個(gè)選擇性實(shí)施例中,該系統(tǒng)可以做為一個(gè)與計(jì)算機(jī)系統(tǒng)一起使用的計(jì)算機(jī)程序產(chǎn)品來(lái)實(shí)現(xiàn)。這一實(shí)現(xiàn)可能包含一系列的計(jì)算機(jī)指令,這些指令固化在一個(gè)有形的介質(zhì),比如一個(gè)計(jì)算機(jī)可讀的媒介(如硬盤(pán),CD或非易失性存儲(chǔ)器)中,或者經(jīng)由一個(gè)調(diào)制解調(diào)器或其它接口設(shè)備,比如一個(gè)網(wǎng)絡(luò),傳輸給一個(gè)計(jì)算機(jī)系統(tǒng)。這一系列計(jì)算機(jī)指令包含了前述有關(guān)該系統(tǒng)的所有或部分功能。本領(lǐng)域的技術(shù)人員應(yīng)該理解,這些計(jì)算機(jī)指令能夠使用許多種程序語(yǔ)言來(lái)編寫(xiě),以便用于許多種計(jì)算機(jī)體系結(jié)構(gòu)或操作系統(tǒng)。并且,這些指令可以存儲(chǔ)在任何存儲(chǔ)設(shè)備里,如半導(dǎo)體、磁介質(zhì)、光學(xué)或其它存儲(chǔ)設(shè)備,并且可以使用任何一種通信技術(shù)如光學(xué)、紅外線、微波或其它傳輸技術(shù)來(lái)傳輸。人們希望這種帶有打印的或電子文檔(如壓縮包軟件)的計(jì)算機(jī)程序產(chǎn)品能夠通過(guò)可移動(dòng)介質(zhì)來(lái)傳播,能夠預(yù)加載于一個(gè)計(jì)算機(jī)系統(tǒng)中(如加載于系統(tǒng)ROM中或固定的磁盤(pán)上),或能夠通過(guò)網(wǎng)絡(luò)(如因特網(wǎng)或萬(wàn)維網(wǎng))從一個(gè)服務(wù)器或電子公告板發(fā)布。盡管已經(jīng)公開(kāi)了本發(fā)明的各種示范性實(shí)施例,但對(duì)于那些本領(lǐng)域技術(shù)人員來(lái)說(shuō),很明顯能夠?qū)ζ溥M(jìn)行各種改變和修改,而這些改變和修改將獲得本發(fā)明的一些優(yōu)點(diǎn)而不會(huì)脫離本發(fā)明的真實(shí)范圍。這些以及其它明顯的修改規(guī)定為由附后的權(quán)利要求書(shū)所涵蓋。權(quán)利要求1.一種用于響應(yīng)包括一個(gè)類(lèi)別和一個(gè)關(guān)鍵字的用戶(hù)請(qǐng)求,從多個(gè)具有不同信息格式的廠商站點(diǎn)檢索比較物品信息的裝置,該裝置包括一個(gè)數(shù)據(jù)庫(kù),包含多個(gè)類(lèi)別,以及對(duì)于每個(gè)類(lèi)別,用于多個(gè)廠商站點(diǎn)中的一個(gè)的至少一個(gè)URL;一個(gè)響應(yīng)請(qǐng)求類(lèi)別的查詢(xún)生成器,用于通過(guò)將從擁有請(qǐng)求類(lèi)別的數(shù)據(jù)庫(kù)獲得的URL與請(qǐng)求關(guān)鍵字相連接而構(gòu)成一個(gè)查詢(xún);一個(gè)搜索引擎,用于使用查詢(xún)從多個(gè)廠商站點(diǎn)檢索信息;和一個(gè)自動(dòng)學(xué)習(xí)對(duì)象,用于處理檢索到的信息,以便析取物品的信息。2.如權(quán)利1要求所述的裝置,其中所述查詢(xún)生成器為請(qǐng)求類(lèi)別構(gòu)成多個(gè)查詢(xún),且其中并行于為每個(gè)查詢(xún)構(gòu)造的一個(gè)搜索引擎而產(chǎn)生多個(gè)搜索引擎。3.如權(quán)利1要求所述的裝置,其中所述查詢(xún)生成器為請(qǐng)求類(lèi)別構(gòu)成多個(gè)查詢(xún),其中并行于建立用以處理從每個(gè)查詢(xún)檢索到的信息的自動(dòng)學(xué)習(xí)對(duì)象而產(chǎn)生多個(gè)自動(dòng)學(xué)習(xí)對(duì)象。4.如權(quán)利1要求所述的裝置,其中所述自動(dòng)學(xué)習(xí)對(duì)象包括一個(gè)過(guò)濾器,用于刪除檢索到的信息中的格式化信息;和一個(gè)分析器,用于將經(jīng)過(guò)濾的信息分解為一個(gè)或更多的數(shù)據(jù)樹(shù),每個(gè)數(shù)據(jù)樹(shù)有一個(gè)或更多的結(jié)點(diǎn)。5.如權(quán)利4要求所述的裝置,其中所述自動(dòng)學(xué)習(xí)對(duì)象還包括一個(gè)用于檢查每個(gè)結(jié)點(diǎn)的相關(guān)信息的機(jī)制;和一個(gè)用于從相關(guān)信息中析取物品信息的析取機(jī)制。6.如權(quán)利1要求所述的裝置,其中檢索到的信息以HTML代碼的形式編碼,且其中自動(dòng)學(xué)習(xí)對(duì)象處理HTML代碼以刪除HTML格式化標(biāo)記符。7.如權(quán)利要求1所述的裝置,其中檢索到的信息以XML代碼的形式編碼,且其中自動(dòng)學(xué)習(xí)對(duì)象處理XML代碼以刪除XML格式化標(biāo)記符。8.如權(quán)利要求1所述的裝置,其中所述數(shù)據(jù)庫(kù)包括用于位于多個(gè)廠商站點(diǎn)的一個(gè)上的搜索引擎的至少一個(gè)URL。9.一種用于響應(yīng)包括一個(gè)類(lèi)別和一個(gè)關(guān)鍵字的用戶(hù)請(qǐng)求,從多個(gè)具有不同信息格式的廠商站點(diǎn)檢索比較物品信息的方法,該方法包括(a)構(gòu)造一個(gè)數(shù)據(jù)庫(kù),其包含多個(gè)類(lèi)別,以及對(duì)于每個(gè)類(lèi)別,用于多個(gè)廠商站點(diǎn)中的一個(gè)的至少一個(gè)URL;(b)響應(yīng)請(qǐng)求類(lèi)別,通過(guò)將從擁有請(qǐng)求類(lèi)別的數(shù)據(jù)庫(kù)獲得的URL與請(qǐng)求關(guān)鍵字相連接而構(gòu)成一個(gè)查詢(xún);(c)使用一個(gè)搜索引擎利用該查詢(xún)從多個(gè)廠商站點(diǎn)檢索信息;和(d)創(chuàng)建一個(gè)自動(dòng)學(xué)習(xí)對(duì)象,用于處理檢索到的信息以便析取出物品信息。10.如權(quán)利要求9所述的方法,其中步驟(b)包括為請(qǐng)求的類(lèi)別構(gòu)成多個(gè)查詢(xún),其中步驟(c)包括并行于用于每個(gè)查詢(xún)的一個(gè)搜索引擎而使用多個(gè)搜索引擎。11.如權(quán)利要求9所述的方法,其中步驟(b)包括為請(qǐng)求的類(lèi)別構(gòu)成多個(gè)查詢(xún),其中步驟(d)包括并行于建立用以處理從每個(gè)查詢(xún)檢索到的信息的一個(gè)自動(dòng)學(xué)習(xí)對(duì)象而產(chǎn)生多個(gè)自動(dòng)學(xué)習(xí)對(duì)象。12.如權(quán)利要求9所述的方法,其中步驟(d)包括(d1)刪除檢索到的信息中的格式化信息;(d2)將經(jīng)過(guò)濾的信息分解為一個(gè)或更多的數(shù)據(jù)樹(shù),每個(gè)數(shù)據(jù)樹(shù)具有一個(gè)或更多的結(jié)點(diǎn)。13.如權(quán)利要求12所述的方法,其中步驟(d)還包括(d3)檢查每個(gè)結(jié)點(diǎn)的相關(guān)信息;和(d4)從相關(guān)信息中析取物品信息。14.如權(quán)利要求9所述的方法,其中檢索到的信息以HTML代碼的形式編碼,其中步驟(d)包括處理HTML代碼以刪除HTML格式化標(biāo)記符。15.如權(quán)利要求9所述的方法,其中檢索到的信息以XML代碼的形式編碼,其中步驟(d)包含處理XML代碼以刪除XML格式化標(biāo)記符。16.如權(quán)利要求9所述的方法,其中所述數(shù)據(jù)庫(kù)構(gòu)建為包括用于位于多個(gè)廠商站點(diǎn)的一個(gè)上的搜索引擎的至少一個(gè)URL。17.一種計(jì)算機(jī)程序產(chǎn)品,用于響應(yīng)包括一個(gè)類(lèi)別和一個(gè)關(guān)鍵字的用戶(hù)請(qǐng)求從多個(gè)具有不同信息格式的廠商站點(diǎn)檢索比較物品信息,該計(jì)算機(jī)程序產(chǎn)品包含一種計(jì)算機(jī)可用的介質(zhì),在該介質(zhì)上存儲(chǔ)計(jì)算機(jī)可讀的程序代碼,該計(jì)算機(jī)程序產(chǎn)品包括用于構(gòu)建一個(gè)數(shù)據(jù)庫(kù)的程序代碼,該數(shù)據(jù)庫(kù)包括多個(gè)類(lèi)別,以及對(duì)于每個(gè)類(lèi)別,用于多個(gè)廠商站點(diǎn)中的一個(gè)的至少一個(gè)URL;用于響應(yīng)請(qǐng)求類(lèi)別,通過(guò)將從擁有請(qǐng)求類(lèi)別的數(shù)據(jù)庫(kù)獲得的URL與請(qǐng)求關(guān)鍵字相連接而構(gòu)成一個(gè)查詢(xún)的程序代碼;用于創(chuàng)建一個(gè)搜索引擎以便使用該查詢(xún)從多個(gè)廠商站點(diǎn)檢索信息的程序代碼;用于創(chuàng)建一個(gè)用于處理檢索到的信息,以便析取物品信息的自動(dòng)學(xué)習(xí)對(duì)象的程序代碼。18.如權(quán)利要求17所述的計(jì)算機(jī)程序產(chǎn)品,其中用于構(gòu)成一個(gè)查詢(xún)的程序代碼包含用于為請(qǐng)求的類(lèi)別構(gòu)成多個(gè)查詢(xún)的程序代碼,其中用于創(chuàng)建一個(gè)搜索引擎的程序代碼包含用于并行于每個(gè)查詢(xún)所使用的一個(gè)搜索引擎而產(chǎn)生多個(gè)搜索引擎的程序代碼。19.如權(quán)利要求17所述的計(jì)算機(jī)程序產(chǎn)品,其中用于構(gòu)成一個(gè)查詢(xún)的程序代碼包含用于為請(qǐng)求的類(lèi)別構(gòu)成多個(gè)查詢(xún)的程序代碼,其中用于創(chuàng)建一個(gè)搜索引擎的程序代碼包含用于并行于被建立用以處理從每個(gè)查詢(xún)檢索到的信息的一個(gè)自動(dòng)學(xué)習(xí)對(duì)象而產(chǎn)生多個(gè)自動(dòng)學(xué)習(xí)對(duì)象的程序代碼。20.如權(quán)利要求17所述的計(jì)算機(jī)程序產(chǎn)品,其中用于創(chuàng)建一個(gè)自動(dòng)學(xué)習(xí)對(duì)象的程序代碼包括用于刪除檢索到的信息中的格式化信息的程序代碼;和用于將經(jīng)過(guò)濾的信息分解為一個(gè)或更多的數(shù)據(jù)樹(shù)的程序代碼,其中每個(gè)數(shù)據(jù)樹(shù)具有一個(gè)或更多的結(jié)點(diǎn)。21.如權(quán)利要求20所述的計(jì)算機(jī)程序產(chǎn)品,其中用于創(chuàng)建一個(gè)自動(dòng)學(xué)習(xí)對(duì)象的程序代碼還包括用于檢查每個(gè)結(jié)點(diǎn)的相關(guān)信息的程序代碼;和用于從該相關(guān)信息中析取物品信息的程序代碼。22.如權(quán)利要求17所述的計(jì)算機(jī)程序產(chǎn)品,其中檢索到的信息以HTML代碼的形式編碼,且其中用于創(chuàng)建自動(dòng)學(xué)習(xí)對(duì)象的程序代碼包含用于處理HTML代碼以刪除HTML格式化標(biāo)記符的程序代碼。23.如權(quán)利要求17所述的計(jì)算機(jī)程序產(chǎn)品,其中檢索到的信息以XML代碼的形式編碼,且其中用于創(chuàng)建自動(dòng)學(xué)習(xí)對(duì)象的程序代碼包含用于處理XML代碼以刪除XML格式化標(biāo)記符的程序代碼。24.如權(quán)利要求17所述的計(jì)算機(jī)程序產(chǎn)品,其中所述數(shù)據(jù)庫(kù)構(gòu)建為包括用于位于多個(gè)廠商站點(diǎn)的一個(gè)上的搜索引擎的至少一個(gè)URL。25.一種包含在載波中的計(jì)算機(jī)數(shù)據(jù)信號(hào),用于響應(yīng)包括一個(gè)類(lèi)別和一個(gè)關(guān)鍵字的用戶(hù)請(qǐng)求從多個(gè)具有不同信息格式的廠商站點(diǎn)檢索比較物品信息,該計(jì)算機(jī)數(shù)據(jù)信號(hào)包括用于構(gòu)建一個(gè)數(shù)據(jù)庫(kù)的程序代碼,該數(shù)據(jù)庫(kù)包括多個(gè)類(lèi)別,以及對(duì)于每個(gè)類(lèi)別,用于多個(gè)廠商站點(diǎn)中的一個(gè)的至少一個(gè)URL;用于響應(yīng)請(qǐng)求類(lèi)別,通過(guò)將從擁有請(qǐng)求類(lèi)別的數(shù)據(jù)庫(kù)獲得的URL與請(qǐng)求關(guān)鍵字相連接而構(gòu)成一個(gè)查詢(xún)的程序代碼;用于創(chuàng)建一個(gè)搜索引擎以便使用該查詢(xún)從多個(gè)廠商站點(diǎn)檢索信息的程序代碼;用于創(chuàng)建一個(gè)用于處理檢索到的信息以便析取物品信息的自動(dòng)學(xué)習(xí)對(duì)象的程序代碼。26.如權(quán)利要求25所述的計(jì)算機(jī)數(shù)據(jù)信號(hào),其中用于構(gòu)成一個(gè)查詢(xún)的程序代碼包含用于為請(qǐng)求的類(lèi)別構(gòu)成多個(gè)查詢(xún)的程序代碼,其中用于創(chuàng)建一個(gè)搜索引擎的程序代碼包含用于并行于每個(gè)查詢(xún)所使用的一個(gè)搜索引擎而產(chǎn)生多個(gè)搜索引擎的程序代碼。27.如權(quán)利要求25所述的計(jì)算機(jī)數(shù)據(jù)信號(hào),其中用于構(gòu)成一個(gè)查詢(xún)的程序代碼包含用于為請(qǐng)求的類(lèi)別構(gòu)成多個(gè)查詢(xún)的程序代碼,其中用于創(chuàng)建一個(gè)搜索引擎的程序代碼包含用于并行于被建立用以處理從每個(gè)查詢(xún)檢索到的信息的一個(gè)自動(dòng)學(xué)習(xí)對(duì)象而產(chǎn)生多個(gè)自動(dòng)學(xué)習(xí)對(duì)象的程序代碼。28.如權(quán)利要求25所述的計(jì)算機(jī)數(shù)據(jù)信號(hào),其中用于創(chuàng)建一個(gè)自動(dòng)學(xué)習(xí)對(duì)象的程序代碼包括用于刪除檢索到的信息中的格式化信息的程序代碼;和用于將經(jīng)過(guò)濾的信息分解為一個(gè)或更多的數(shù)據(jù)樹(shù)的程序代碼,其中每個(gè)數(shù)據(jù)樹(shù)具有一個(gè)或更多的結(jié)點(diǎn)。29.如權(quán)利要求25所述的計(jì)算機(jī)程序產(chǎn)品,其中所述數(shù)據(jù)庫(kù)被構(gòu)建為包括用于位于多個(gè)廠商站點(diǎn)的一個(gè)上的搜索引擎的至少一個(gè)URL。全文摘要一種購(gòu)物智能搜索工具,使用實(shí)時(shí)代理,該代理自動(dòng)與各種不同的、代表大量不同類(lèi)別和廠商的網(wǎng)頁(yè)相連接,并在產(chǎn)生一個(gè)對(duì)信息的請(qǐng)求時(shí)檢索并統(tǒng)一化該信息以用于顯示。因此就不必為每個(gè)類(lèi)別或廠商創(chuàng)建一個(gè)“包裝”或“信息適配器”,因?yàn)橥淮砟軌驒z索和處理不同格式的信息。尤其是,該購(gòu)物智能搜索工具根據(jù)用戶(hù)輸入的關(guān)鍵字和一個(gè)URL信息數(shù)據(jù)庫(kù)產(chǎn)生查詢(xún),然后對(duì)查詢(xún)返回的信息實(shí)時(shí)過(guò)濾、分析并轉(zhuǎn)換成一種標(biāo)準(zhǔn)格式。于是被格式化的信息就能顯示出來(lái)。由于信息被實(shí)時(shí)轉(zhuǎn)換成標(biāo)準(zhǔn)格式,故本發(fā)明就能快速地添加在線廠商,且附加的商品類(lèi)別也能快速容易地添加。此外,隨著市場(chǎng)需求的增加,產(chǎn)品內(nèi)容信息能夠容易地?cái)U(kuò)充而不用逐個(gè)修改代碼數(shù)據(jù)庫(kù)。根據(jù)一個(gè)實(shí)施例,URL信息數(shù)據(jù)庫(kù)包括對(duì)每個(gè)廠商站點(diǎn)上的站點(diǎn)目錄特定的URL,這樣就可以通過(guò)附加用戶(hù)提供的關(guān)鍵字很容易地產(chǎn)生查詢(xún)。文檔編號(hào)G06Q30/00GK1408093SQ00814894公開(kāi)日2003年4月2日申請(qǐng)日期2000年9月27日優(yōu)先權(quán)日1999年10月7日發(fā)明者西蒙·M·林申請(qǐng)人:U-諾軟件公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1