專利名稱:用于選取和自動(dòng)更新結(jié)構(gòu)化文本中任意元素的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般是與計(jì)算機(jī)處理系統(tǒng)相關(guān)的,尤其是涉及一種用于選取和自動(dòng)更新計(jì)算機(jī)處理系統(tǒng)內(nèi)的結(jié)構(gòu)化文本中任意元素的方法和系統(tǒng)。
2.背景概述很顯然,因特網(wǎng)和內(nèi)聯(lián)網(wǎng)提供了一種既有成本效果又普遍的能夠聯(lián)系世界各地的人們和組織機(jī)構(gòu)的媒介,通過富含多媒體內(nèi)容的網(wǎng)絡(luò)文本進(jìn)行信息交換和共享。
用于網(wǎng)絡(luò)中提供信息的最新技術(shù)之一被稱為“壓棧(push)”。在“壓?!奔夹g(shù)中,整個(gè)網(wǎng)絡(luò)站點(diǎn)乃至應(yīng)用程序都能基于預(yù)定的周期被發(fā)送到用戶的計(jì)算機(jī)中,而無需用戶反復(fù)提出相同的請(qǐng)求。在“壓?!奔夹g(shù)中,你“訂閱”網(wǎng)站(也可稱為“頻道”)上的信息,他們就會(huì)按您指定的時(shí)間間隔進(jìn)行發(fā)送?!邦l道”通常是指由發(fā)布者建立的某一令人感興趣的區(qū)域,這里包括HTML頁、JAVA小應(yīng)用程序、ActiveX控件、多媒體對(duì)象以及其它通過壓棧技術(shù)被打包在一起提供給用戶的信息。術(shù)語“訂閱”并不是指要支付信息費(fèi)用。而是用于指明您要求定期接收信息。
隨著“壓棧技術(shù)”的發(fā)展,主要是POINTCAST技術(shù),網(wǎng)絡(luò)上的內(nèi)容提供者能夠?qū)⒍ㄖ频亩ㄆ诔霭娴臅r(shí)事通訊發(fā)送給網(wǎng)絡(luò)上成百萬的用戶。這是能夠滿足用戶主要要求的最初解決措施之一,這種要求即指在需要時(shí)自動(dòng)地發(fā)送用戶所渴求的網(wǎng)絡(luò)內(nèi)容。
目前,NETSCAPE和INTERNET EXPLORER瀏覽器都以頻道的形式利用“壓?!奔夹g(shù)(分別使用NETCASTING和WEBCASTING技術(shù))向用戶發(fā)送個(gè)性化的網(wǎng)絡(luò)內(nèi)容。通過使用頻道,網(wǎng)絡(luò)內(nèi)容以預(yù)定的方式被自動(dòng)地發(fā)送給用戶,而無需他/她顯式進(jìn)行交互。用戶能夠自定制、在何時(shí)、以及通常將怎樣發(fā)送網(wǎng)絡(luò)內(nèi)容到他們的臺(tái)式電腦中。被發(fā)送的內(nèi)容可能富含基于動(dòng)態(tài)HTML(超文本結(jié)構(gòu)化語言)和JAVASCRIPT語言的多媒體和交互式內(nèi)容,這些被發(fā)送的內(nèi)容既可以在任何一個(gè)瀏覽器窗口瀏覽也可以以全屏幕模式顯示。
這種向用戶發(fā)送個(gè)性化的網(wǎng)絡(luò)內(nèi)容的技術(shù)的主要缺點(diǎn)之一是限制了可能實(shí)現(xiàn)的個(gè)性化設(shè)置的數(shù)量。個(gè)人化的網(wǎng)頁,如YAHOO、LYCOS、CNN上所提供的,只能允許在這些網(wǎng)站上可用的素材的有限范圍內(nèi)實(shí)現(xiàn)個(gè)性化。而且,這些網(wǎng)頁不能刷新(更新)其內(nèi)容。因此,因特網(wǎng)的用戶要求使個(gè)人化概念再前進(jìn)一步。即,用戶希望最好只在規(guī)則的時(shí)間間隔地將網(wǎng)頁的某特定部分發(fā)送到他們的臺(tái)式電腦上。例如,一些用戶可能只提出網(wǎng)頁上羅列的所有報(bào)價(jià)中的某些股票報(bào)價(jià)能被發(fā)送過來。其它用戶可能只希望重要報(bào)刊(例如紐約時(shí)報(bào)或華盛頓郵報(bào))的網(wǎng)站上經(jīng)常被刷新的新聞標(biāo)題能被發(fā)送過來。談到個(gè)性化,就是希望能向用戶提供盡可能多的選擇。
一種嘗試僅向用戶發(fā)送網(wǎng)頁的一部分的系統(tǒng)被稱為DIBS(請(qǐng)參見http//www.modaka.com/solutions/index.html)。這種工具允許用戶在網(wǎng)頁上選擇一個(gè)矩形區(qū)域,其中的內(nèi)容被更新后按用戶選定的時(shí)間間隔發(fā)送到用戶的臺(tái)式電腦上。這類如DIBS的系統(tǒng)中存在兩個(gè)主要的缺陷。其一,選擇機(jī)制是純幾何性的。問題主要出在網(wǎng)頁要隨時(shí)動(dòng)態(tài)地更換其上附加的廣告等。這樣,網(wǎng)頁上特定幾何區(qū)域在某個(gè)時(shí)刻上所顯示出的內(nèi)容并不與另一時(shí)刻該位置上顯示出的內(nèi)容相關(guān)。其二,選擇機(jī)制對(duì)上下文是無關(guān)的,因此,在一定時(shí)間段內(nèi),或者導(dǎo)致內(nèi)容冗余或者導(dǎo)致丟失內(nèi)容的后果。
因此,若能提供一種方法和系統(tǒng),它能夠克服傳統(tǒng)的用于提供網(wǎng)頁中一部分的方法和系統(tǒng)所固有的問題——即幾何性選取和內(nèi)容變化(丟失或增加),則是極符合需要的,也是很有益的。
按本發(fā)明的第一個(gè)方面,這里向一個(gè)用于自動(dòng)地向用戶提供的系統(tǒng)提供計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境內(nèi)結(jié)構(gòu)化文本中用戶選中的元素。結(jié)構(gòu)化文本包括多種特性。該系統(tǒng)包括一種編輯工具,它允許用戶在結(jié)構(gòu)化文本中選擇感興趣的部分,讓用戶指定接收被選擇部分的更新版本的時(shí)間間隔,能夠生成一種包含著與感興趣的被選擇部分相關(guān)聯(lián)的特性標(biāo)識(shí)符的映射,以及能夠輸出這些標(biāo)識(shí)符。數(shù)據(jù)庫存儲(chǔ)著這些標(biāo)識(shí)符。服務(wù)器獲取對(duì)應(yīng)這些被存儲(chǔ)的標(biāo)識(shí)符的結(jié)構(gòu)化文本的同期版本,然后提取出對(duì)應(yīng)所存儲(chǔ)的標(biāo)識(shí)符的結(jié)構(gòu)化文本的同期版本中的某些部分,再將這些被提取的部分按用戶指定的時(shí)間間隔提供給用戶。
按本發(fā)明的第二個(gè)方面,網(wǎng)絡(luò)環(huán)境是指全球網(wǎng),結(jié)構(gòu)化文本指網(wǎng)頁。
按本發(fā)明的第三個(gè)方面,被選取的部分以HTML文件的形式被提供給用戶。
按本發(fā)明的第四個(gè)方面,編輯工具包括一種用于接收結(jié)構(gòu)化文本的位置標(biāo)識(shí)符的用戶接口控制器。
按本發(fā)明的第五個(gè)方面,服務(wù)器根據(jù)結(jié)構(gòu)化文本的同期版本生成一種映射,其包括了含在該同期版本之中的特性標(biāo)識(shí)符。
按本發(fā)明的第六個(gè)方面,服務(wù)器將被獲取的結(jié)構(gòu)化文本的同期版本中的標(biāo)識(shí)符與被存儲(chǔ)的標(biāo)識(shí)符進(jìn)行比較,以確定他們之中那些相同的標(biāo)識(shí)符。
按本發(fā)明的第七個(gè)方面,相同的標(biāo)識(shí)符被該服務(wù)器用于生成一種新的文本,該文本中包括了此結(jié)構(gòu)化文本中用戶所選取部分的更新版本。
本發(fā)明的上述以及其它方面、特性和優(yōu)點(diǎn)將在下面優(yōu)選實(shí)施例的詳細(xì)說明中體現(xiàn)。閱讀這些優(yōu)選實(shí)施例時(shí)應(yīng)結(jié)合相應(yīng)的附圖進(jìn)行。
圖2是流程圖說明了有關(guān)按本發(fā)明的實(shí)施例
圖1的系統(tǒng)中客戶方所執(zhí)行的步驟。
圖3是流程圖說明了有關(guān)按本發(fā)明的實(shí)施例圖1的系統(tǒng)中服務(wù)器方所執(zhí)行的步驟。
圖4說明了按本發(fā)明的一種實(shí)施例的圖2和圖3中執(zhí)行步驟的結(jié)果。
優(yōu)選實(shí)施例詳述本發(fā)明致力于一種用于選取和自動(dòng)更新結(jié)構(gòu)化文本中任意元素的方法和系統(tǒng)。本發(fā)明優(yōu)選通過包含兩臺(tái)或多臺(tái)計(jì)算機(jī)的網(wǎng)絡(luò)(例如因特網(wǎng)或內(nèi)聯(lián)網(wǎng))實(shí)現(xiàn),但這不是必要的。此外,本發(fā)明也可在單獨(dú)一臺(tái)計(jì)算機(jī)上實(shí)現(xiàn),其上某特定結(jié)構(gòu)化文件中的信息要被經(jīng)常(如手動(dòng))更新而用戶希望能夠按他/她指定的時(shí)間間隔瀏覽該文件的一部分。結(jié)構(gòu)化文本的類型依據(jù)特定的使用執(zhí)行程序而有所不同,這一點(diǎn)應(yīng)被本領(lǐng)域中的技術(shù)人員所掌握。
出于解說的目的,這里參考全球網(wǎng)(以下稱為“網(wǎng)絡(luò)”)對(duì)本發(fā)明進(jìn)行說明,結(jié)構(gòu)化文本指“網(wǎng)頁”。但是,應(yīng)當(dāng)理解本發(fā)明不只限于網(wǎng)絡(luò)和網(wǎng)頁。因此,其它類型的計(jì)算機(jī)配置(優(yōu)選網(wǎng)絡(luò))和其它類型的結(jié)構(gòu)化文件也是可以使用的。
本發(fā)明中進(jìn)行圖解說明的實(shí)施例包括一個(gè)客戶或用戶部分和一個(gè)服務(wù)器部分。在網(wǎng)絡(luò)這種情況中,本發(fā)明允許用戶從任何網(wǎng)頁上拾取和選擇感興趣的元素(片段)。而且,本發(fā)明是以交互的方式實(shí)現(xiàn)的,并被配置成能夠使用所熟知的“剪貼”編輯范例。另外,本發(fā)明提供了一種,能夠?qū)Φ玫降摹熬W(wǎng)頁片斷”進(jìn)行格式化的增強(qiáng)模式。除此之外,本發(fā)明還向服務(wù)器一方提供了維護(hù)最新片段所需要的支持。
以下將給出本發(fā)明的一般性說明,向讀者介紹本發(fā)明的一些概念和優(yōu)點(diǎn)。隨后,有關(guān)本發(fā)明各個(gè)方面的詳細(xì)說明將給出。
本發(fā)明允許用戶選擇不同網(wǎng)頁上的不同元素,用戶選取的內(nèi)容被周期性地更新后再被發(fā)送給用戶。選取技術(shù)依賴于特定的實(shí)現(xiàn)機(jī)制而千差萬別。
本發(fā)明解決現(xiàn)有技術(shù)中存在的幾何性選取和內(nèi)容丟失的問題。例如,本發(fā)明允許用戶從某一頁上選取股票報(bào)價(jià),從另一頁上選取最近的體育報(bào)道標(biāo)題,而再從又一頁上選取氣象報(bào)告,等等。本發(fā)明在用戶選擇的時(shí)間間隔內(nèi)更新所有這些選中區(qū)域內(nèi)的內(nèi)容,然后將這些選中區(qū)域發(fā)送到用戶的臺(tái)式電腦中。與DIBS系統(tǒng)不同,我們的系統(tǒng)不是基于幾何形狀更新用戶的選擇區(qū),而是將用戶的選擇區(qū)與網(wǎng)絡(luò)文本的底層結(jié)構(gòu)緊密關(guān)聯(lián)。因此,更新過程更為可靠,而且隨著時(shí)間的推移用戶選擇區(qū)的相關(guān)性依然能被保持。
應(yīng)該理解本發(fā)明可以被應(yīng)用到各種形式的硬件、軟件、固件、特殊用途處理器、以及它們的組合結(jié)構(gòu)中。本發(fā)明優(yōu)選地被應(yīng)用到軟件上,如確實(shí)體現(xiàn)在程序存儲(chǔ)設(shè)備中的程序。這類程序可以被裝載到包括了任何適合結(jié)構(gòu)的機(jī)器上,并被其所執(zhí)行。優(yōu)選地,該機(jī)器在計(jì)算機(jī)平臺(tái)上實(shí)現(xiàn),此計(jì)算機(jī)平臺(tái)包括硬件如一個(gè)或多個(gè)中央處理器(CPU)、隨機(jī)存儲(chǔ)器(RAM)和輸入/輸出接口(I/O)。計(jì)算機(jī)平臺(tái)也包括操作系統(tǒng)和微指令代碼。這里說明的各種處理進(jìn)程和功能或者是微指令代碼的一部分或者是通過操作系統(tǒng)執(zhí)行的程序的一部分(或者兩者的組合)。另外,各種其它的外圍設(shè)備也要被連接到計(jì)算機(jī)平臺(tái)上,如附加數(shù)據(jù)存儲(chǔ)設(shè)備和打印設(shè)備。
還應(yīng)當(dāng)理解的是,由于相應(yīng)附圖中說明的一些組成系統(tǒng)的部件和方法步驟優(yōu)選地在軟件中實(shí)現(xiàn),因此系統(tǒng)部件(或處理步驟)之間的實(shí)際聯(lián)系會(huì)依據(jù)本發(fā)明編程方式的不同而千差萬別。
圖1是系統(tǒng)100中主要部件的圖解,該系統(tǒng)按本發(fā)明的一個(gè)實(shí)施例用于選取和自動(dòng)地更新結(jié)構(gòu)化文本中的任意元素。本發(fā)明中的三個(gè)主要部件是客戶前端編輯工具102、數(shù)據(jù)庫引擎104和網(wǎng)絡(luò)服務(wù)器106。這些部件被分成兩組客戶部分(或客戶方)和服務(wù)器部分(或服務(wù)器方)。但是,其它類型的結(jié)構(gòu)也是允許的,包括至少一個(gè)中間部分(依特定的實(shí)現(xiàn)方式而定)。在本發(fā)明該圖解說明的實(shí)施例中,客戶前端編輯工具102對(duì)應(yīng)著客戶部分,數(shù)據(jù)庫引擎104和網(wǎng)絡(luò)服務(wù)器106對(duì)應(yīng)著服務(wù)器部分。這些部件對(duì)應(yīng)著三種主要的由本發(fā)明執(zhí)行的任務(wù),它們分別是從網(wǎng)頁中確定選擇區(qū)、保存這些選擇區(qū)、復(fù)制這些被保存過的選擇區(qū)。
圖2是流程圖說明了關(guān)于圖1中按本發(fā)明實(shí)施例的系統(tǒng)的客戶方所執(zhí)行的步驟。編輯頁面被裝載到網(wǎng)絡(luò)瀏覽器中(步驟202)。編輯頁面時(shí)允許用戶選擇網(wǎng)頁中的某些部分。在本發(fā)明的優(yōu)選實(shí)施例中,編輯頁面具有一個(gè)浮動(dòng)工具欄形式的用戶接口控件。
首張目標(biāo)頁的URL(統(tǒng)一資源地址)被鍵入到這一用戶接口中(步驟204)。結(jié)果是目標(biāo)頁被獲取到。一旦取到此目標(biāo)頁,客戶方的拓?fù)溆成?以下稱其為t-映射)就為該頁而被創(chuàng)建(步驟206)。T-映射在步驟206中被創(chuàng)建,以便為該頁中被映射的特性生成特性ID。T-映射是一種映射/數(shù)據(jù)結(jié)構(gòu),它將結(jié)構(gòu)化文本中被映射的特性的標(biāo)識(shí)符與這些特性的對(duì)應(yīng)位置信息聯(lián)系在一起,該位置信息相應(yīng)于一個(gè)給出的文本存在。當(dāng)然t-映射中也可能包括與各種特性相關(guān)的附加信息。
結(jié)構(gòu)化文本中的特性可能是,例如,表、段落等等。被映射的特性的標(biāo)識(shí)符被稱為“特性標(biāo)識(shí)符”。
結(jié)構(gòu)化文本通常是層次性的,其表現(xiàn)形式可能會(huì)包含有嵌套區(qū)域。T-映射允許根據(jù)這些特性的位置和范圍索引這些被映射的特性。而且,t-映射允許將文本表現(xiàn)形式中的嵌套區(qū)域與底層文本特性關(guān)聯(lián)起來。在本發(fā)明該圖解說明的實(shí)施例中,與較局限的區(qū)域相比,范圍較大的區(qū)域顯示在t-映射的更底層。而且,在圖解的實(shí)施例中,位置信息是以絕對(duì)平面坐標(biāo)的形式存在的。但是,應(yīng)當(dāng)理解,其它次序關(guān)系也可以被用于排列t-映射中的信息,例如,與較大范圍的區(qū)域相比,狹窄范圍區(qū)域出現(xiàn)在t-映射的較底層。而且,其它類型的信息也可以被用于表示被映射信息的地址。
在本發(fā)明的其它實(shí)施例中,t-映射被實(shí)現(xiàn)為一種鏈接層次結(jié)構(gòu),這種結(jié)構(gòu)中包含了其它特性區(qū)域的特性區(qū)域在結(jié)構(gòu)中的高層節(jié)點(diǎn)處。被定義為高層節(jié)點(diǎn)的區(qū)域內(nèi)所包含的各個(gè)特性區(qū)域則作為該節(jié)點(diǎn)的子節(jié)點(diǎn)出現(xiàn)。同胞兄弟節(jié)點(diǎn)間被水平地鏈接起來,代與代(父-子)的節(jié)點(diǎn)間則被垂直地鏈接起來?;谶@里提供的講解,相關(guān)技術(shù)領(lǐng)域中的一名普通技術(shù)人員就能聯(lián)想到t-映射這些和其它類似實(shí)現(xiàn)方式。
用戶在目標(biāo)頁中選擇感興趣的區(qū)域(步驟208a)。然后,用戶確定其感興趣的這些區(qū)域要在什么頻率上進(jìn)行一次刷新(步驟208b)。接下來才確定是否還存在著其它的目標(biāo)頁(其上也有被選擇出來的感興趣的部分)(步驟210)。如果存在,則返回步驟204。另一方面,如果沒有其它的目標(biāo)頁了,這些選取區(qū)的URL和特性標(biāo)識(shí)符就都被存儲(chǔ)到數(shù)據(jù)庫引擎104中(步驟212)。
數(shù)據(jù)庫引擎104是客戶和服務(wù)器之間的接口。對(duì)于每個(gè)系統(tǒng)100的用戶而言,數(shù)據(jù)庫引擎104存儲(chǔ)著各目標(biāo)頁的URL/特性標(biāo)識(shí)符列表,用戶利用它們可以創(chuàng)建他/她自己的剪貼頁。剪貼頁是顯示給用戶的最終目標(biāo)HTML文件的預(yù)覽版本。剪貼頁反映了用戶制定的選擇區(qū)。數(shù)據(jù)庫引擎104也保存著必要的用戶安全性和優(yōu)先級(jí)信息。網(wǎng)絡(luò)服務(wù)器106使用數(shù)據(jù)庫信息管理用戶會(huì)話期。
一旦用戶請(qǐng)求聯(lián)機(jī),會(huì)話就被啟動(dòng)。然后,剪貼頁就會(huì)按如下所述被創(chuàng)建。當(dāng)用戶退出時(shí),或者經(jīng)過暫停時(shí)間間隔后,會(huì)話就被關(guān)閉。
圖3是流程圖說明關(guān)于圖1中按本發(fā)明的實(shí)施例的系統(tǒng)中服務(wù)器方所執(zhí)行的步驟。服務(wù)器106從數(shù)據(jù)庫引擎104中讀取特性標(biāo)識(shí)符/URL列表信息(步驟302)。然后服務(wù)器106預(yù)取創(chuàng)建剪貼頁所必需的目標(biāo)網(wǎng)頁,并創(chuàng)建服務(wù)器方的t-映射(步驟304)。一旦這些網(wǎng)頁在當(dāng)?shù)乜衫脮r(shí),利用預(yù)取得到的網(wǎng)頁中的文本就可以從其中摘取相關(guān)的內(nèi)容了(步驟306a)。然后,這些內(nèi)容被粘貼到最終用戶可以瀏覽的目標(biāo)HTML文件中(步驟306b)。接下來,瀏覽器被指向最終的目標(biāo)HTML文件(步驟308)。圖4是說明了按本發(fā)明的實(shí)施例的圖2和圖3中那些步驟的執(zhí)行結(jié)果的圖示。
步驟306a包括一步,要將預(yù)取的目標(biāo)網(wǎng)頁的特性標(biāo)識(shí)符與被存儲(chǔ)的特性標(biāo)識(shí)符進(jìn)行比較,確定這些特性標(biāo)識(shí)符當(dāng)中相同的部分。
前端編輯工具102允許用戶從不同的網(wǎng)頁中選擇內(nèi)容。它提供了一種簡(jiǎn)單的機(jī)制用于從不同的網(wǎng)頁中選取內(nèi)容,如圖4所示。一個(gè)可以改變大小的矩形被用于圈定所選擇的區(qū)域。當(dāng)從某一頁中選擇了特定的區(qū)域時(shí),其底層的特性就被確定下來,并作為特性標(biāo)識(shí)符被存儲(chǔ)到數(shù)據(jù)庫引擎104中。用戶也要指定他/她希望多久刷新一次內(nèi)容。
在服務(wù)器方,被選取的頁是要進(jìn)行預(yù)取的。然后,服務(wù)器方的t-映射從該頁的HTML源中被生成。接下來,利用編輯過程中確定的特性標(biāo)識(shí)符,這些頁中的相關(guān)選擇區(qū)會(huì)被重新創(chuàng)建,并被粘貼到可以讓用戶瀏覽的目標(biāo)頁中。該過程在圖4的下半面上進(jìn)行了說明。
下面介紹一下使用上下文有關(guān)的機(jī)制映射文本以及以t-映射為基礎(chǔ)進(jìn)行網(wǎng)絡(luò)內(nèi)容的選擇和復(fù)制所具有的優(yōu)點(diǎn)的一些描述。首先,選擇機(jī)制獨(dú)立于幾何形狀、瀏覽器或平臺(tái)因素。其次,如果網(wǎng)頁的結(jié)構(gòu)有時(shí)曾經(jīng)改變,客戶端和服務(wù)器端的t-映射可能會(huì)不同步,用戶可以會(huì)被提示有必要重新編輯該頁的內(nèi)容。第三,一旦文本的一個(gè)部分被選定,不論該部分怎樣改變,服務(wù)器都能檢索出文本被選中的結(jié)構(gòu)特性,即允許信息的上下文有關(guān)的表現(xiàn)形式。第四,生成t-映射的過程要遵循該文本結(jié)構(gòu)的層次屬性。即使選擇區(qū)是不完整的,由于選中的范圍是已知的,因此,服務(wù)器總能收集信息重建該文本丟失的部分,以便更好的顯示出來。
盡管這里該圖解說明的實(shí)施例參考相應(yīng)的附圖進(jìn)行說明,應(yīng)當(dāng)理解,本系統(tǒng)和方法不只限于這些確切的實(shí)施例,在不背離本發(fā)明的范圍和精神的條件下,本領(lǐng)域中的技術(shù)人員可以實(shí)行各種形式的變化和修改。所有這些變化和修改都如從附加的權(quán)利說明中說明的那樣意圖是被包括在本發(fā)明的范圍之內(nèi)。
權(quán)利要求
1.一種系統(tǒng),用于自動(dòng)地向用戶提供計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境內(nèi)結(jié)構(gòu)化文本中用戶選取的元素,其中結(jié)構(gòu)化文本包括多種特性,該系統(tǒng)由以下部分組成一種編輯工具,它能夠讓用戶在結(jié)構(gòu)化文本中選擇感興趣的部分,讓用戶指定接收被選擇部分的更新版本的時(shí)間間隔,生成一種包含著與感興趣的被選擇部分相關(guān)聯(lián)的特性標(biāo)識(shí)符的映射,以及能夠輸出這些標(biāo)識(shí)符;一個(gè)數(shù)據(jù)庫,用于存儲(chǔ)這些標(biāo)識(shí)符;和一臺(tái)服務(wù)器,用于荻取對(duì)應(yīng)這些被存儲(chǔ)的標(biāo)識(shí)符的結(jié)構(gòu)化文本的同期版本,然后提取出對(duì)應(yīng)這些被存儲(chǔ)的標(biāo)識(shí)符的結(jié)構(gòu)化文本的同期版本中的某些部分,再將被提取的部分按用戶指定的時(shí)間間隔提供給用戶。
2.按權(quán)利要求1的系統(tǒng),其中網(wǎng)絡(luò)環(huán)境是指全球網(wǎng),結(jié)構(gòu)化文本是指網(wǎng)頁。
3.按權(quán)利要求2的系統(tǒng),其中被選中的部分以HTML文件的形式被提供給用戶。
4.按權(quán)利要求2的系統(tǒng),其中該編輯工具包括一種用于接收結(jié)構(gòu)化文本的位置標(biāo)識(shí)符的用戶接口控制器。
5.按權(quán)利要求2的系統(tǒng),其中該服務(wù)器根據(jù)結(jié)構(gòu)化文本的同期版本生成一種映射,其包含了同期版本中所含有的特性的標(biāo)識(shí)符。
6.按權(quán)利要求5的系統(tǒng),其中該服務(wù)器將被獲取到的結(jié)構(gòu)化文本同期版本中的標(biāo)識(shí)符與被存儲(chǔ)的標(biāo)識(shí)符進(jìn)行比較,以便確定它們之中共同的標(biāo)識(shí)符。
7.按權(quán)利要求6的系統(tǒng),其中這些共同的標(biāo)識(shí)符被該服務(wù)器用于生成新的文本,此文本包括了用戶在結(jié)構(gòu)化文本中選中部分的更新版本。
8.一種方法用于自動(dòng)地向用戶提供計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境內(nèi)結(jié)構(gòu)化文本中用戶可選取的元素,其中結(jié)構(gòu)化文本包括多種特性,該方法包括以下步驟在此結(jié)構(gòu)化文本中至少選擇一個(gè)感興趣的部分;指定一時(shí)間間隔,在該時(shí)間間隔內(nèi)至少一個(gè)被選中部分的更新版本要能被用戶接收到;建立一種映射,該映射包括了與至少一個(gè)被選取部分相關(guān)的特性的標(biāo)識(shí)符;存儲(chǔ)這些標(biāo)識(shí)符;獲取對(duì)應(yīng)這些被存儲(chǔ)的標(biāo)識(shí)符的結(jié)構(gòu)化文本同期版本;提取出對(duì)應(yīng)這些被存儲(chǔ)的標(biāo)識(shí)符的結(jié)構(gòu)化文本同期版本中的某些部分;按用戶指定的時(shí)間間隔向用戶提供這些被提取出來的部分。
9.按權(quán)利要求8中的方法,其中該網(wǎng)絡(luò)環(huán)境是指全球網(wǎng),結(jié)構(gòu)化文本指網(wǎng)頁。
10.按權(quán)利要求9的方法,其中被選中的部分以HTML文件的形式被提供給用戶。
11.按權(quán)利要求9的方法,其中選取一步中包括以下步驟接收結(jié)構(gòu)化文本的位置標(biāo)識(shí)符;和利用這些位置標(biāo)識(shí)符獲取結(jié)構(gòu)化文本。
12.按權(quán)利要求9的方法,其中該方法還包括根據(jù)該結(jié)構(gòu)化文本的同期版本生成一種映射的步驟,其包含了同期版本中所含有的特性的標(biāo)識(shí)符。
13.按權(quán)利要求12的方法,其中所述提取步聚包括將被獲取的結(jié)構(gòu)化文本的同期版本的標(biāo)識(shí)符與被存儲(chǔ)的標(biāo)識(shí)符進(jìn)行比較的步驟,以便確定出它們之中共同的那些標(biāo)識(shí)符。
14.按權(quán)利要求13的方法,其中所述提供步驟包括利用這些共同的標(biāo)識(shí)符生成新文本的步驟,此新文本包括了用戶在結(jié)構(gòu)化文本中所選取部分的更新版本。
15.一種程序存儲(chǔ)設(shè)備可被機(jī)器讀取,該設(shè)備中確實(shí)包括一組機(jī)器可執(zhí)行的指令程序,用以實(shí)現(xiàn)一種自動(dòng)地向用戶提供計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境內(nèi)結(jié)構(gòu)化的文本中用戶選取的元素的方法步驟,此種方法步驟包括在結(jié)構(gòu)化文本中至少選擇一個(gè)感興趣的部分;指定一時(shí)間間隔,在該時(shí)間間隔內(nèi)至少一個(gè)被選中部分的更新版本要被用戶所接收;建立一種映射,該映射包括了與至少一個(gè)被選取部分相關(guān)的特性的標(biāo)識(shí)符;存儲(chǔ)這些標(biāo)識(shí)符;獲取對(duì)應(yīng)這些被存儲(chǔ)的標(biāo)識(shí)符的結(jié)構(gòu)化文本的同期版本;提取出對(duì)應(yīng)這些被存儲(chǔ)的標(biāo)識(shí)符的結(jié)構(gòu)化文本的同期版本中的某些部分;按用戶指定的時(shí)間間隔向用戶提供這些被提取出來的部分。
16.按權(quán)利要求15的程序存儲(chǔ)設(shè)備,其中網(wǎng)絡(luò)環(huán)境是指全球網(wǎng),結(jié)構(gòu)化文本指網(wǎng)頁。
17.按權(quán)利要求16的程序存儲(chǔ)設(shè)備,其中被選定的部分以HTML文件的形式被提供給用戶。
18.按權(quán)利要求16的程序存儲(chǔ)設(shè)備,其中所說的選取步聚包括步驟接收結(jié)構(gòu)化文本的位置標(biāo)識(shí)符;和利用這些位置標(biāo)識(shí)符獲取結(jié)構(gòu)化文本。
19.按權(quán)利要求16的程序存儲(chǔ)設(shè)備,其中所述方法還包括基于結(jié)構(gòu)化文本的同期版本生成一映射的步驟,其包括在同期版本中所含有的特性的標(biāo)識(shí)符。
20.按權(quán)利要求19的程序存儲(chǔ)設(shè)備,其中所說的提取步驟包括將被獲取的結(jié)構(gòu)化文本同期版本的標(biāo)識(shí)符與被存儲(chǔ)的標(biāo)識(shí)符進(jìn)行比較的步驟,確定出它們之中共同的標(biāo)識(shí)符。
21.按權(quán)利要求20中的方法,其中所述提供步驟包括利用這些共同的標(biāo)識(shí)符生成新文本的步驟,此新文本包括了用戶在結(jié)構(gòu)化文本中選取的部分的更新版本。
全文摘要
按本發(fā)明的一種實(shí)施例,這里提供了一種方法,它能自動(dòng)地向用戶提供計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境內(nèi)的結(jié)構(gòu)化文本中用戶所選中的元素。該結(jié)構(gòu)化文本包括多種特性。該方法包括一步從結(jié)構(gòu)化文本中至少選擇一個(gè)感興趣的部分(步驟208a)。指定一段時(shí)間間隔,在此間隔內(nèi)至少一個(gè)被選中部分的更新版本要能被用戶接收到(步驟208b)。建立一種映射關(guān)系,其包括了與至少一個(gè)被選中部分相關(guān)的屬性標(biāo)識(shí)符(步驟206)。這些標(biāo)識(shí)符被存儲(chǔ)起來(步驟212)。對(duì)應(yīng)這些被存儲(chǔ)的標(biāo)識(shí)符的結(jié)構(gòu)化文本的同期版本被獲取(步驟304)。對(duì)應(yīng)這些被存儲(chǔ)的標(biāo)識(shí)符的結(jié)構(gòu)化文本的同期版本中的某些部分被提取出來(步驟306a)。被提取出來的部分按用戶指定的時(shí)間間隔被提供給用戶(步驟308)。
文檔編號(hào)G06F17/30GK1451126SQ00815732
公開日2003年10月22日 申請(qǐng)日期2000年9月5日 優(yōu)先權(quán)日1999年9月15日
發(fā)明者A·皮扎諾, S·塞甘, C·R·薩斯特里, D·路易斯 申請(qǐng)人:西門子共同研究公司