亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

以電子方式創(chuàng)建個性化文檔的系統(tǒng)和方法

文檔序號:6552898閱讀:215來源:國知局
專利名稱:以電子方式創(chuàng)建個性化文檔的系統(tǒng)和方法
一般而言,本發(fā)明涉及創(chuàng)建電子文檔,特別是作為參考文檔的組合來產(chǎn)生電子文檔。更具體地說,本發(fā)明涉及一種方法、系統(tǒng)和程序產(chǎn)品,用于分析參考材料或參考材料的一些片斷,并把這些片斷按某種排序方式聚集起來,以創(chuàng)建具有導(dǎo)航能力的個性化文檔。本發(fā)明還涉及一種方法、系統(tǒng)和程序產(chǎn)品,用于根據(jù)使用者建議的關(guān)鍵詞對個性化電子文檔編索引和安排格式。
利用一個或多個其他信息源作為參考材料合成個性化文檔是當(dāng)今學(xué)術(shù)或商務(wù)環(huán)境中的一個普通功能。學(xué)生或?qū)I(yè)人員等往往希望由已經(jīng)發(fā)表的信息源編輯信息(或數(shù)據(jù))以創(chuàng)建他們個人的作品。例如,一個在寫關(guān)于美國革命的綜合性文章的學(xué)歷史的學(xué)生可以利用電子數(shù)據(jù)庫(如因特網(wǎng))中找到的歷史書藉、報紙或雜志文章以及新近寫的報道作為參考。在典型的文檔綜合過程中,在所創(chuàng)建的文檔中只包括參考材料中的相關(guān)部分。所創(chuàng)建的文檔通常是把標(biāo)題、索引、參考段落、以及作者的個人評注以一種粘聚的形式鏈接在一起而完成的。
因特網(wǎng)的迅速發(fā)展,部分地由于在它上面有當(dāng)前可得到的大量信息,使得因特網(wǎng)已成為最被廣泛利用的數(shù)據(jù)檢索資源之一。當(dāng)今使用因特網(wǎng)允許使用者打入一個搜索查詢,并作為對該查詢的響應(yīng)收到至因特網(wǎng)上一些站點的超文本鏈接,在那些站點上存在與搜索請求有關(guān)的信息。在當(dāng)前的因特網(wǎng)環(huán)境中,這種信息大多在使用超文本置標(biāo)語言(HTML)創(chuàng)建的萬維網(wǎng)(Web)站點上找到。該信息在萬維網(wǎng)文檔中找到,它們傾向于展示出一篇文章或頁面級分塊,也就是說,在進行編輯或與其他文檔組合時這整個文檔保持為單個塊。在由HTML創(chuàng)建的站點上進行搜索通常會造成命中,其中一些命中只是根據(jù)在與該超文本鏈接相關(guān)聯(lián)的萬維網(wǎng)站內(nèi)出現(xiàn)了一個單個詞。含有單個詞命中的文檔通常不是要搜索的材料,盡管如此卻被送回來了。還有,如果一使用者希望訪問包含搜索查詢項的一段HTML文檔,該使用者不得不下載(即在他的計算機系統(tǒng)中打開)整個文檔并通篇搜索。再有,如果一使用者希望由含有該搜索查詢的兩個文檔創(chuàng)建一個合成文檔,使用者不得不把這兩個文檔整個地鏈接起來,或者在文字處理應(yīng)用程序中人工剪切和粘貼這些文檔的一些部分。
在人工文檔合成過程中,文檔起草人通讀整個參考材料,選擇或加亮感興趣的部分,把那些部分復(fù)制到他的筆記本中或他的計算機上。然后,起草人對下一個參考材料重復(fù)這一過程。在一些情況中,在起草人創(chuàng)建他的文檔時,首先要閱讀所有參考材料,然后從每個參考材料中仔細地選出各單個部分。
在電子介質(zhì)中進行的是類似的過程,只是可以以電子方式得到參考材料。起草人通讀若干在線信息源并選擇有關(guān)的部分以包括在他的個性化文檔中。然后,這些有關(guān)部分可被剪切和粘貼或以某種其他方式復(fù)制到文字處理應(yīng)用程序中,在那里由起草人對它們進行人工鏈接。
上述兩種個性化文檔合成方法都特別費時間和效率低,特別是當(dāng)使用者只希望把相關(guān)信息組合以供日后能通過訪問單一文檔容易地進行參考的時候更是如此。
在因特網(wǎng)上信息發(fā)布站點的一般種類已大量增長,然而在這些站點并不完成資源的相關(guān)、聚集和再使用。一些先有工作已討論過把萬維網(wǎng)上的多個文檔聚集成一單個文檔的構(gòu)想。例如,美國專利5,924,090披露一種分類系統(tǒng),利用該系統(tǒng)根據(jù)其內(nèi)容使用元數(shù)據(jù)屬性把各項放到各類別或子類別中。該分類系統(tǒng)利用一種裝置,它搜索一數(shù)據(jù)庫并把搜索結(jié)果放到一組最相關(guān)的類別中,從而使使用者能夠只得到相關(guān)的那些記錄。
在“如我們可以想到的”(The Atlantic Monthly(大西洋月刊),1945年7月,第101-108頁,它已用http協(xié)議重印在Sloan.stanford.edu/mousesite/Secondary/Bush.html中),該作者描述了memex裝置的構(gòu)想。memex裝置有助于信息發(fā)現(xiàn)和信息合成以供再使用。該文章還討論了關(guān)聯(lián)索引,用它可把兩個或更多個信息項按用戶確定的關(guān)聯(lián)詞連接起來,并創(chuàng)建一尾標(biāo)代表相應(yīng)信息項的一部分。
上述參考文獻中沒有一個講到允許從相關(guān)參考材料合成一個個性化文檔的導(dǎo)航能力(即一種具有可感知特性的物理指示器,它指示應(yīng)如何利用或完成某種東西)。
本發(fā)明認(rèn)識到,如果有一種方法、系統(tǒng)和程序產(chǎn)品用于把電子參考材料分解成組成部分并由該電子參考材料的各組成部分有效地合成一個個性化電子文檔,那將是有好處的。一種方法、系統(tǒng)和程序產(chǎn)品,它允許使用者搜索參考材料,然后根據(jù)使用者送入一文檔生成實用程序中的指導(dǎo)路線由所選的參考材料自動產(chǎn)生一個只包含相關(guān)信息的合成文檔,這樣的方法、系統(tǒng)和程序產(chǎn)品將是一個受歡迎的改進。如果這樣的方法、系統(tǒng)和程序產(chǎn)品允許自動對一文檔(例如所產(chǎn)生的個性化文檔)進行格式編排和編索引,也將是有好處的。在本發(fā)明中認(rèn)出了這些和其他好處。
披露了一種方法、系統(tǒng)和程序產(chǎn)品,用于由至少一個電子參考材料以電子方式創(chuàng)建一個個性化文檔。該方法首先選擇電子參考材料。然后,該電子參考材料被解析成子成分。然后該方法在所述子成分當(dāng)中聚集相似項,以創(chuàng)建個性化文檔,它被輸出時自動帶有一組導(dǎo)航能力,這組導(dǎo)航能力是根據(jù)使用者在產(chǎn)生文檔之前所作的選擇形成的。
在一個最佳實施例中,該方法、系統(tǒng)和程序產(chǎn)品還以文檔產(chǎn)生前使用者送入的評注來注釋該個性化文檔,并根據(jù)使用者選擇的索引選項和索引深度為該個性化文檔創(chuàng)建一個索引。該索引是利用取自子成分當(dāng)中的關(guān)鍵詞創(chuàng)建的。
本發(fā)明的上述以及其他目的、特點和優(yōu)點將在下文的詳細書面描述中變得顯然。
在所附權(quán)利要求中提出了相信能表征本發(fā)明的新特性。然而,結(jié)合附圖參閱所示實施例的如下詳細描述,將會最好地理解本發(fā)明本身以及最佳的使用方法、進一步的目的和優(yōu)點,這里,

圖1A是為實現(xiàn)本發(fā)明的最佳實施例所使用的數(shù)據(jù)處理系統(tǒng)的方框圖1B是為實現(xiàn)本發(fā)明的最佳實施例所使用的客戶機-服務(wù)器-數(shù)據(jù)庫網(wǎng)絡(luò)的方框圖;圖2是一個信息中心應(yīng)用程序的圖形用戶界面(GUI)圖,根據(jù)本發(fā)明的一個實施例,在該應(yīng)用程序中,使用者可以選擇產(chǎn)生電子文檔和編索引的選項;圖3A是根據(jù)本發(fā)明的一個實施例用于檢索參考材料的搜索GUI;圖3B是根據(jù)本發(fā)明的一個實施例用于注釋新創(chuàng)建的個性化文檔的注釋GUI;圖4是根據(jù)本發(fā)明的一個實施例產(chǎn)生個性化電子文檔過程的邏輯流程圖;圖5是根據(jù)本發(fā)明的一個實施例對一文檔進行電子編輯索引過程的邏輯流程圖;以及圖6是根據(jù)本發(fā)明的一個實施例產(chǎn)生個性化電子文檔過程的方框流程圖。
現(xiàn)在參考附圖,特別是參考圖1A,圖中描繪了用于本發(fā)明最佳實施例的數(shù)據(jù)處理系統(tǒng)20的基本結(jié)構(gòu)。數(shù)據(jù)處理系統(tǒng)20有至少一個中央處理單元(CPU)或處理器裝在系統(tǒng)單元22中。系統(tǒng)單元22與若干外圍裝置相連,包括輸入/輸出裝置如顯示監(jiān)視器96、鍵盤82、圖形指示裝置84、以及打印機94,供用戶界面使用。裝在系統(tǒng)單元22中的還有永久存儲器裝置(如硬盤)用于存儲數(shù)據(jù)處理系統(tǒng)的操作系統(tǒng)和使用者程序/應(yīng)用程序,以及暫時存儲器裝置(如隨機存取存儲器或RAM),它由CPU用于實現(xiàn)程序指令。系統(tǒng)單元22通過各種裝置與外圍裝置通信,包括通過總線或直接通道(利用總線橋可以提供不只一個總線)。
數(shù)據(jù)處理系統(tǒng)20可以有許多附加的部件,這些在圖中未畫出,如用于和調(diào)制解調(diào)器92或CD ROM78等連接的串行端口、并行端口和USB端口。在本發(fā)明的這個實施例中,可以經(jīng)由連到地上線或無線蜂窩電話系統(tǒng)上的調(diào)制解調(diào)器92進行與數(shù)據(jù)處理系統(tǒng)20的通信,反過來,調(diào)制解調(diào)器92又與本地網(wǎng)絡(luò)提供者(如因特網(wǎng)服務(wù)提供者(ISP))相連。此外,數(shù)據(jù)處理系統(tǒng)20還可經(jīng)由網(wǎng)絡(luò)適配器連到一個網(wǎng)絡(luò)。被傳送的數(shù)據(jù)到達調(diào)制解調(diào)器或網(wǎng)絡(luò)卡,并被處理,以便由數(shù)據(jù)處理系統(tǒng)的CPU或其他軟件應(yīng)用來接收。在該最佳實施例中,因特網(wǎng)服務(wù)提供者提供參考數(shù)據(jù),這些參考數(shù)據(jù)可經(jīng)由調(diào)制解調(diào)器92下載到數(shù)據(jù)處理系統(tǒng)20中。調(diào)制解調(diào)器92還可提供與其他參考數(shù)據(jù)源的連接,如服務(wù)器、電子公告板(BBS)或因特網(wǎng)(包括萬維網(wǎng))。
本領(lǐng)域技術(shù)人員會進一步理解,可能與圖1A中所示那些部件結(jié)合使用的還會有其他部件,例如,與處理器相連的顯示適配器可以被用于控制一視頻顯示監(jiān)視器30,一個存儲器控制器可用作為暫時存儲裝置和CPU之間的接口。數(shù)據(jù)處理系統(tǒng)20還包括一個固件,它的主要目的是在數(shù)據(jù)處理系統(tǒng)20首次接通時用于從外圍裝置之一(通常是一永久性存儲器裝置)中找出并加載操作系統(tǒng)。在該最佳實施例中,數(shù)據(jù)處理系統(tǒng)含有一個相對快的CPU以及足夠大的暫時存儲裝置和在永久存儲裝置上的空間,以及所需要的其他硬件部件。
傳統(tǒng)的數(shù)據(jù)處理系統(tǒng)往往利用一個圖形用戶界面(GUI)向使用者展現(xiàn)信息。GUI是由加載到數(shù)據(jù)處理系統(tǒng)上的軟件創(chuàng)建的,具體地說,是該數(shù)據(jù)處理系統(tǒng)的與應(yīng)用程序聯(lián)合動作的操作系統(tǒng)。本發(fā)明的最佳實施例是由基于GUI的應(yīng)用程序?qū)崿F(xiàn)的,該應(yīng)用程序有若干個用戶界面,并支持作為程序代碼存儲在一介質(zhì)上的功能部件,該介質(zhì)與處理器相連并可由該處理器讀出。
本發(fā)明的實現(xiàn)是在如上所述數(shù)據(jù)處理系統(tǒng)上發(fā)生的。然而,應(yīng)該理解,其他類型的數(shù)據(jù)處理系統(tǒng)是可能的,它們可以有一些或更多些上述基本部件。例如,可以利用單用途文檔合成系統(tǒng)來取代通用數(shù)據(jù)處理系統(tǒng)。
本發(fā)明可在如圖1B中所示網(wǎng)絡(luò)環(huán)境中實現(xiàn)。網(wǎng)絡(luò)環(huán)境包含一個客戶機和一個服務(wù)器153,在客戶機上本發(fā)明作為一個信息中心應(yīng)用151來實現(xiàn),而服務(wù)器153作為個性化文檔合成所用參考數(shù)據(jù)155的源或管道。網(wǎng)絡(luò)環(huán)境可以是一個局域網(wǎng)(LAN)或廣域網(wǎng)(WAN),如因特網(wǎng)。本發(fā)明最佳實施例是在與廣域網(wǎng)相連的數(shù)據(jù)處理系統(tǒng)上實現(xiàn)的,它有因特網(wǎng)瀏覽器能力用于搜索因特網(wǎng)以得到有關(guān)的參考材料。這里將參考一個廣域網(wǎng)(WAN)和所連接的數(shù)據(jù)處理系統(tǒng)來描述本發(fā)明。
萬維網(wǎng)(Web)是用于因特網(wǎng)的一個圖形交互界面,在這整個說明書中名詞因特網(wǎng)與Web可相互變換使用。在與Web相連的數(shù)據(jù)處理系統(tǒng)上有不同的計算機程序應(yīng)用(即Web瀏覽器客戶機,下文中稱作Web瀏覽器)用于訪問與Web相連的服務(wù)器。信息是作為網(wǎng)頁存儲在一Web服務(wù)器上。一個網(wǎng)頁包含一個或多個圖形和/或文本顯示,它們可以鏈接在一起并可利用Web瀏覽器下載到客戶機數(shù)據(jù)處理系統(tǒng)。在Web內(nèi)的每個網(wǎng)頁有一個唯一地址,或統(tǒng)一資源定位器(URL),它可利用傳輸控制協(xié)議/網(wǎng)際協(xié)議(TCP/IP)訪問。在客戶機瀏覽器內(nèi)網(wǎng)頁往往由一相應(yīng)的超文本鏈接來表示,該鏈接還可提供關(guān)于頁面內(nèi)容的信息。
當(dāng)今的網(wǎng)頁設(shè)計已從使用展現(xiàn)頁面級分塊的HTML格式過渡到可擴展置標(biāo)語言(XML)格式,它展現(xiàn)描述文檔內(nèi)容的動態(tài)可擴展機制、更精細的分塊以及在HTML中不能得到的其他功能元素。XML是在1996年由萬維網(wǎng)咨詢委員會開發(fā)的。它是一個文件說明,用于把有結(jié)構(gòu)的數(shù)據(jù)放到一個文本文件中,然后它允許訪問該文本文件/數(shù)據(jù)的單個成分。使用XML格式準(zhǔn)備的文本文件在其后能被觀看,無需使用用以產(chǎn)生該文件的程序。XML文件的文本格式易于由一計算機以一種不混淆的方式產(chǎn)生和閱讀,而且是獨立于平臺的。XML利用標(biāo)記(即由‘<’和‘>’括起來的詞)及屬性分割數(shù)據(jù)塊。XML包括用于指向一XML文檔各部分(數(shù)據(jù)塊)的句法。XML允許萬維網(wǎng)作者向萬維網(wǎng)文檔增添標(biāo)記,以指定搜索查詢的含義,從而使查詢更精確。XML還通過操縱相應(yīng)數(shù)據(jù)來提供定制的觀看信息。本發(fā)明在實現(xiàn)圖4和圖5的流程圖中所示若干步驟時以XML功能作為一種手段。
本發(fā)明利用XML語言的功能,以允許由數(shù)據(jù)庫中找到的多個XML文檔創(chuàng)建或合成個性化文檔。為了本發(fā)明的目的,數(shù)據(jù)庫一詞是指創(chuàng)建個性化文檔過程中由使用者選擇的一個或多個參考材料的任何集合。本發(fā)明提供了一個發(fā)現(xiàn)和重新使用信息的系統(tǒng),它產(chǎn)生一個被相關(guān)觀看的、被充分理解的個性化文檔。本發(fā)明依靠XML文檔類型定義(DTD)來強制對數(shù)據(jù)的語義組織,并利用XSL作為數(shù)據(jù)過濾技術(shù),它為合成結(jié)果的共享提供變換編碼服務(wù)。
本發(fā)明主要是在圖3A所示信息中心GUI內(nèi)實現(xiàn)的。為了本發(fā)明的目的,信息中心GUI是指面向產(chǎn)品或域的一個入口。信息中心GUI還可稱作資源中心或文檔產(chǎn)生中心。在信息中心GUI中存在的元素是利用Widget(專用接口工具集)創(chuàng)建的,它們添加到用戶界面并向使用者提供更多的設(shè)施供選擇。在本最佳實施例中,信息中心GUI300有瀏覽器功能,使它能根據(jù)使用者送入的查詢在因特網(wǎng)上搜索。信息中心GUI300使用圖2所示搜索GUI201訪問萬維網(wǎng)。在圖2中,一個搜索查詢被送入查詢字段207,并可以補充送入上下文字段205和類別字段203中的上下文搜索項。后兩個字段是用于通過進一步確定被參考的一般區(qū)域來準(zhǔn)確定位該搜索。由于XML格式文檔的精細分塊搜索能力,使這一特性利用了增強的搜索實用程序并使能發(fā)生更精確的命中。使用者選擇提交查詢按鈕209把搜索請求發(fā)送到因特網(wǎng)。當(dāng)發(fā)生命中時,一個通告窗口211提醒使用者他的搜索已然成功。
現(xiàn)在轉(zhuǎn)到圖3A,當(dāng)使用者將一搜索項送入搜索字段321中時,信息中心GUI300的萬維網(wǎng)瀏覽器功能被啟動,它打開圖2的搜索GUI201。相關(guān)的命中作為超文本鏈接回送到信息中心GUI的第一框323中。然后,使用者可以從這里完成對若干文章的“售貨車”選擇。使用者選擇那里他相信包含為產(chǎn)生個性化文檔所需的好參考材料的文章,并把它們復(fù)制到參考段303(通過拖放操作或雙擊選擇等)。到選定參考的鏈接在參考段303中生成鏡象。當(dāng)選定鏈接時,這些文檔的實際文本(即不僅是超文本鏈接)被下載到信息中心GUI300的參考存儲區(qū),并在分析和合成步驟發(fā)生時暫時存儲在那里。為便于演示,顯示出3個參考文檔作為已選定用于文檔合成的文檔。一旦選定了所希望的參考文檔,使用者能送入他希望在要產(chǎn)生的個性化文檔中反映出來的格式、索引和注釋信息。
在信息中心GUI300的格式、索引和注釋區(qū)中,使用者能為新的個性化文檔輸入訂制信息,例如導(dǎo)航能力和注釋。為了本發(fā)明的目的,導(dǎo)航能力被定義為是指該個性化文檔中包括的標(biāo)題、索引、參考段、題頭和/或副題頭、到參考源的超文本鏈接等。這樣,訂制信息包括送入標(biāo)題字段305中的新個性化文檔標(biāo)題,在索引深度選擇區(qū)311中送入的為個性化文檔編索引所希望的索引級別,以及從格式下拉菜單307中的可選格式列表中選出的個性化文檔展現(xiàn)格式。應(yīng)該理解,其他類型的訂制信息是可以得到的,上述列表不意味著對本發(fā)明的限定。格式風(fēng)格包括例如Lotus風(fēng)格和IBM風(fēng)格等。
使用者可在評注區(qū)309中送入要在個性化文檔中包括的個人評注。當(dāng)然,進一步的評注可在日后加到該個性化文檔中,而本發(fā)明僅僅提供一個短的描述性概要或?qū)铣刹牧系慕榻B。在另一實施例中,使用者被允許根據(jù)編索引判據(jù)對整個個性化文檔分段進行注釋。這樣,使用者可注釋所完成的個性化文檔內(nèi)的每個主要檢索題頭的開始和結(jié)尾。例如,使用者可在該個性化文檔的開始處寫入一引言段,在每個主要部分的開始處寫入一個概要句子或段落,在個性化文檔的結(jié)尾加上結(jié)論。在圖3B中描繪的評注GUI中進行不只一個使用者評注的輸入和選擇,這將在下文中描述。
最后,使用者在輸出選擇區(qū)313中選擇輸出方法。使用者選擇多種輸出方法之一,這包括瀏覽器、PDF、下載新的XML源、提交打印、作為文檔文件保存等。在一個實施例中,個性化文檔是作為一個新的XML文檔輸出的,它可在因特網(wǎng)上向外發(fā)出。
在另一實施例中,使用者還可選擇在個性化文檔末尾創(chuàng)建一個要包括的參考材料的目錄。在目錄中包括的參考材料是以超文本鏈接來展現(xiàn)的,以允許后來的使用者拖出參考材料的整個文本或相關(guān)部分。一但所有這些區(qū)域都已填完,則使用者選擇提交按鈕315,以開始產(chǎn)生文檔。
圖3B顯示用于輸入使用者評論的圖形用戶界面350,這些評論作為即將建成的個性化電子文檔選定部分的注釋。GUI350包括兩框,片斷框351和注釋框353。片斷框包括所希望的個性化文檔布局的內(nèi)容列表。在內(nèi)容列表中的每一項是一可選擇項,當(dāng)它被選定時,它把注釋框353中寫入的評注與該特性項耦合起來。這樣,例如,使用者選擇引言-概要項,然后在注釋框353中送入被寫的評注。當(dāng)他已完成他的評注時,他再選擇另一項并送入相應(yīng)的評注。對另一項的選擇導(dǎo)致打開注釋框353中的另一頁,或者,如果該項在先前已被選擇過,則打開與此項對應(yīng)的先前框。在該框的下方是用于確定在該個性化文檔片斷內(nèi)該評注位置的位置(或安排)圖標(biāo)357。圖中顯示出3個可能的位置,它們有相應(yīng)的按鈕。這些按鈕是之前按鈕359A、之后按鈕359B和選擇按鈕359C。對這一安排功能的各種修改是可能的。這些按鈕可以在每個項選擇之后被單個選擇,或者應(yīng)用于整個個性化文檔。一旦完成評注,使用者選擇返回按鈕361,它關(guān)閉GUI350。
在另一最佳實施例中,GUI350被用作創(chuàng)建個性化文檔的框架。為內(nèi)容列表中每一項寫入的評注被用于搜索相關(guān)的參考信息。這樣,當(dāng)選擇返回按鈕361時,在每個評注中的關(guān)鍵詞被選作搜索詞或短語送入圖3A的搜索查詢區(qū)。這些搜索詞在因特網(wǎng)上傳送出去,并返回針對特定片斷的特定搜索詞的命中。然后使用者為每個片斷選擇相關(guān)的命中并把這些命中提交給產(chǎn)生文檔實用程序。在一個實施例中,由關(guān)鍵詞和從各相關(guān)參考材料中提取的信息創(chuàng)建索引詞或索引頭。
圖4顯示使用者進行搜索數(shù)據(jù)庫和其后向產(chǎn)生文檔實用程序提交相關(guān)參考材料的交互過程。該過程在塊401開始,然后進入塊403,在那里使用者送入搜索查詢。一旦返回搜索結(jié)果,則在塊405中選擇適當(dāng)?shù)钠ヅ湟杂米鲄⒖肌H缓?,使用者在塊407中送入標(biāo)題、索引、注釋、格式以及輸出信息。一旦使用者已送入了所有的必要信息,則在塊409由使用者提交產(chǎn)生個性化文檔請求,于是過程在塊411結(jié)束。如參考圖3B討論的那樣,可以以不同的過程順序完成本發(fā)明的其他實現(xiàn)。這里展現(xiàn)的順序只是為了舉例說明。
現(xiàn)在參考圖6,圖中顯示本發(fā)明主要功能的方框流程圖。如圖中所示,3個參考文檔doc.A601、doc.B602和doc.C603用作創(chuàng)建個性化文檔doc.D615的輸入。每個參考文檔有多個基于其XML格式的子部分。對參考文檔中類似項的選擇是基于它們的XML格式的語義標(biāo)記。該信息有元數(shù)據(jù),它們可以根據(jù)主題、標(biāo)題和作者來分開。所以可能進行按上下文的搜索。語法分析實用程序607分別分離出參考材料的各單個組成部分,并把這些分離開的部分送到編輯器實用程序609。編輯器實用程序609把各參考文檔中的相似片斷(例如Doc.A601中的W與Doc.B603中的W等)組合起來。可以按使用者確定的順序或按缺省順序進行這種組合。然后,利用XML格式、索引頭以及參考文檔中的其他底層組成部分,由參考文檔編輯出個性化文檔,這里將來自全部3個源的相似區(qū)域組合到一特定的索引頭之下。然后將編輯過的片斷送到編索引實用程序,它創(chuàng)建所編輯的片斷的索引,如下文中參考圖6描述的那樣。然后格式器實用程序613對個性化文檔編排格式,包括插入索引、個人評注、標(biāo)題、參考片斷等。然后根據(jù)使用者選擇的輸出方法輸出個性化文檔doc.D615。雖然各實用程序是按一特定順序描述的和以連接鏈來顯示的,但描述這些實用程序的順序?qū)Ρ景l(fā)明的各種實施例而言是不重要的。在一些應(yīng)用中,特定的實用程序,如編索引實用程序611,可以作為獨立實用程序。再有,用其他功能部件實現(xiàn)這里描述的本發(fā)明各特定功能是可能的。
圖5顯示根據(jù)本發(fā)明對文檔編索引的過程。編索引過程在塊501開始,然后進入塊503。在塊503,使用者被提示送入所希望的索引深度。一旦收到索引深度信息,則在塊505加載題頭和子題頭類別列表,這些題頭可以由使用者提供,或根據(jù)相關(guān)主題從索引數(shù)據(jù)庫中提取。然后,在塊507,利用題頭和深度信息搜索該文檔。取決于該文檔的復(fù)雜程度,這種搜索可在段落級或片斷級完成。接下來,在塊509基于搜索產(chǎn)生主要點分布圖。然后,在塊511,與每個主要點相關(guān)的小點被映射到它們各自的主要點。然后在塊513確定是否已達到所需要的深度。如果尚未達到所需要的深度,則繼續(xù)在塊511進行在下一個深度/級別尋找下一個小點的步驟,每次重復(fù)便產(chǎn)生更細小點的更深度索引。一旦達到了所希望的深度,則在塊515向使用者輸出該索引。然后在塊517,該索引被加在該文檔的開始處。然后該過程在塊519結(jié)束。
應(yīng)該理解,在本發(fā)明范圍內(nèi),為完成編索引功能,其他過程塊可能是必要的,或者這些過程塊可以以不同的順序排列。例如,可以在文檔內(nèi)從文檔起始到結(jié)尾順序地評估每類題頭和子題頭。再有,編索引可在原來的文檔上完成,也可在新建的合成文檔(即一個性化文檔)上完成。信息中心GUI300的索引選擇區(qū)還可擴展到允許使用者送入所希望的個性化文檔內(nèi)信息展現(xiàn)序列,它也直接影響索引的布局。
這樣,本發(fā)明操作格式化為語義XML單元的信息,這有助于它本身進行面向?qū)ο蟮陌l(fā)現(xiàn)。本發(fā)明實現(xiàn)一個查詢界面,它把使用者的意圖映射成信息數(shù)據(jù)庫的語義。本發(fā)明還實現(xiàn)了一個交互界面,它使使用者能添加注釋、選擇導(dǎo)航能力(內(nèi)容表、一般索引或受主題限制的索引、到其他源或來自其他源的鏈接集)。該界面還使能選擇展現(xiàn)風(fēng)格(通常,企業(yè)業(yè)務(wù)規(guī)則影響重發(fā)表的信息的外表和感覺),以及選擇所希望的結(jié)果格式(作為一個新的信息單元重新引入到該文獻中或輸出到其他數(shù)據(jù)庫中,作為可讀的在線格式供個人使用,作為分頁格式結(jié)果以適于打印等)。
本發(fā)明實現(xiàn)文檔內(nèi)或文檔數(shù)據(jù)庫內(nèi)的搜索,并過濾出與搜索查詢對應(yīng)的相關(guān)項,然后返回一個已做好的、高度鏈接的合成文檔,它干凈地注釋和關(guān)聯(lián)那些突出點。然后這合成文檔或者可作為對已有的研究信息集合的補充,或者可以作為一個再生文檔傳輸出到其他數(shù)據(jù)庫,從而實現(xiàn)該合成文檔的共享。
最后,重要的是,盡管本發(fā)明的實施示例是在全功能數(shù)據(jù)處理系統(tǒng)的環(huán)境中描述的,但本領(lǐng)域技術(shù)人員將會理解,本發(fā)明實施例的軟件方面能作為各種形式的程序產(chǎn)品發(fā)布,而且不論實際進行這種發(fā)布所用的信號承載介質(zhì)的具體類型如何,本發(fā)明的實施示例同樣地適用。信號承載介質(zhì)的實例包括可記錄型介質(zhì),如軟盤、硬盤驅(qū)動器、CDROM,以及傳輸型介質(zhì),如數(shù)字的和模擬的通信鏈路。
盡管已經(jīng)參考最佳實施例具體顯示和描述了本發(fā)明,但本領(lǐng)域技術(shù)人員將會理解,這里可進行形式和細節(jié)上的各種改變,而不離開本發(fā)明的精神和范圍。
權(quán)利要求
1.一種在數(shù)據(jù)處理系統(tǒng)內(nèi)由至少一個電子參考文檔以電子方式創(chuàng)建個性化文檔的方法,所述方法包含如下步驟響應(yīng)使用者的輸入,選擇所述至少一個電子參考文檔;自動地把所述至少一個電子參考文檔解析成若干子成分;響應(yīng)所述解析步驟的完成,自動地從所述子成分中聚集類似項,以創(chuàng)建所述個性化文檔;以及根據(jù)使用者在創(chuàng)建文檔前所作的選擇,輸出帶有一組自動產(chǎn)生的導(dǎo)航能力的所述個性化文檔。
2.權(quán)利要求1的方法,進一步包含如下步驟以文檔產(chǎn)生前由所述使用者送入的評注來注釋所述個性化文檔;以及根據(jù)使用者選擇的索引選項和索引深度,對所述個性化文檔編索引,其中所述編索引步驟利用從所述子成分中提取的關(guān)鍵詞。
3.權(quán)利要求1的方法,其中所述選擇步驟包括把所述至少一個電子參考文檔的內(nèi)容復(fù)制到與所述數(shù)據(jù)處理系統(tǒng)相連的暫時存儲單元之中的步驟。
4.權(quán)利要求1的方法,進一步包含對所述至少一個電子參考文檔進行上下文搜索的步驟,其中所述搜索是根據(jù)使用者送入的查詢和上下文信息進行的。
5.權(quán)利要求4的方法,其中在所述進行搜索步驟中的至少一個電子文檔是以擴展置標(biāo)語言建立的,有元標(biāo)記用于區(qū)分所述至少一個電子文檔的相關(guān)片斷,而且其中所述進行搜索步驟搜索一個材料數(shù)據(jù)庫以得到所述至少一個具有所述元標(biāo)記的電子文檔。
6.權(quán)利要求5的方法,其中所述搜索是在因特網(wǎng)上進行的,所述材料數(shù)據(jù)庫包括至少一個由相關(guān)超文本鏈接代表的網(wǎng)頁,其中所述至少一個電子文檔位于所述至少一個網(wǎng)頁上,所述選擇步驟包括選擇所述至少一個電子文檔的超文本鏈接。
7.權(quán)利要求5的方法,其中所述解析步驟利用所述元標(biāo)記和產(chǎn)生文檔前由使用者送入的判據(jù)集合來描述所述至少一個電子文檔的所述子成分。
8.權(quán)利要求7的方法,其中所述聚集步驟包括下列步驟使所述子成分彼此匹配;對所述具有類似元素的子成分進行組合,以創(chuàng)建子集組;以及鏈接所述子集組,以產(chǎn)生所述個性化文檔。
9.權(quán)利要求8的方法,其中所述輸出步驟包括下列步驟把使用者在產(chǎn)生文檔之前選擇的格式偏好應(yīng)用于所述個性化文檔;在所述個性化文檔中預(yù)先確定標(biāo)題和概要;以及把所述個性化文檔中的所述索引放在預(yù)先確定的位置處。
10.由至少一個電子參考文檔以電子方式創(chuàng)建個性化文檔的計算機程序產(chǎn)品,所述程序產(chǎn)品包含計算機可讀介質(zhì);以及在所述計算機可讀介質(zhì)上的程序指令,用于響應(yīng)使用者的輸入,選擇所述至少一個電子參考文檔;自動地把所述至少一個電子參考文檔解析成若干子成分;響應(yīng)所述解析步驟的完成,自動地從所述子成分中聚集類似項,以創(chuàng)建所述個性化文檔;以及根據(jù)使用者在執(zhí)行程序前的選擇,輸出帶有一組自動產(chǎn)生的導(dǎo)航能力的所述個性化文檔。
11.權(quán)利要求10的計算機程序產(chǎn)品,進一步包含程序指令,用于以文檔產(chǎn)生前由所述使用者送入的評注來注釋所述個性化文檔;以及根據(jù)使用者選擇的索引選項和索引深度,對所述個性化文檔編索引,其中所述編索引步驟利用從所述子成分中提取的關(guān)鍵詞。
12.權(quán)利要求10的程序產(chǎn)品,其中所述選擇程序指令包括把所述至少一個電子參考文檔的內(nèi)容復(fù)制到與所述數(shù)據(jù)處理系統(tǒng)相連的暫時存儲單元之中所用的程序指令。
13.權(quán)利要求10的計算機程序產(chǎn)品,進一步包含對所述至少一個電子參考文檔進行上下文搜索所用的程序指令,其中所述搜索是根據(jù)使用者送入的查詢和上下文信息進行的。
14.權(quán)利要求13的計算機程序產(chǎn)品,其中在所述進行搜索的程序指令中的至少一個電子文檔是以擴展置標(biāo)語言建立的,有元標(biāo)記用于區(qū)分所述至少一個電子文檔的相關(guān)片斷,而且其中所述進行搜索程序指令搜索一個材料數(shù)據(jù)庫以得到所述至少一個具有所述元標(biāo)記的電子文檔。
15.權(quán)利要求14的計算機程序產(chǎn)品,其中所述搜索是在因特網(wǎng)上進行的,所述材料數(shù)據(jù)庫包括至少一個由相關(guān)超文本鏈接代表的網(wǎng)頁,其中所述至少一個電子文件位于所述至少一個網(wǎng)頁上,所述選擇程序指令包括選擇所述至少一個電子文檔的超文本鏈接所用的程序指令。
16.權(quán)利要求14的計算機程序產(chǎn)品,其中所述解析程序指令利用所述元標(biāo)記和產(chǎn)生文檔前由使用者送入的判據(jù)集合來描述所述至少一個電子文檔的所述子成分。
17.權(quán)利要求16的計算機程序產(chǎn)品,其中所述聚集程序指令包括程序指令用于使所述子成分彼此匹配;對所述具有類似元素的子成分進行組合,以創(chuàng)建子集組;以及鏈接所述子集組,以產(chǎn)生所述個性化文檔。
18.權(quán)利要求17的計算機程序產(chǎn)品,其中所述輸出程序指令包括程序指令用于把使用者在產(chǎn)生文檔之前選擇的格式偏好應(yīng)用于所述個性化文檔;在所述個性化文檔中預(yù)先確定標(biāo)題和概要;以及把所述個性化文檔中的所述索引放在預(yù)先確定的位置處。
19.一種由在線參考材料產(chǎn)生個性化電子文檔的數(shù)據(jù)處理系統(tǒng),所述處理系統(tǒng)包含處理器和數(shù)據(jù)存儲區(qū);連接介質(zhì),用于把所述處理器連到相關(guān)參考材料數(shù)據(jù)庫;存儲在所述數(shù)據(jù)存儲區(qū)并可由所述處理器執(zhí)行的第一圖形用戶界面(GUI),用于送入一搜索項和在所述數(shù)據(jù)庫上進行搜索;存儲在所述數(shù)據(jù)存儲區(qū)并可由所述處理器執(zhí)行的第二GUI,用于選擇從所述第一GUI上進行的搜索中返回的相關(guān)參考材料并送入與使用者希望的個性化文檔格式相關(guān)的導(dǎo)航能力;與所述第二GUI鏈接的文檔產(chǎn)生實用程序,用于由所述相關(guān)參考材料的組成部分合成一個個性化文檔,其中所述個性化文檔具有所述導(dǎo)航能力,所述文檔產(chǎn)生實用程序存儲在所述數(shù)據(jù)存儲區(qū)并可由所述處理器執(zhí)行。
20.一種以電子方式創(chuàng)建個性化文檔的方法,包含下列步驟創(chuàng)建包括關(guān)鍵詞的個性化文檔注釋概要,用于包括到所述個性化文檔中;將所述注釋概要提交給搜索引擎,使能搜索和提取具有關(guān)于所述關(guān)鍵詞的組成部分的參考材料;接收一組所述參考材料;以及利用所述注釋概要和所述一組參考材料的所述組成部分,自動合成所述個性化文檔。
21.權(quán)利要求20的方法,其中在所述創(chuàng)建步驟中的所述注釋概要包括標(biāo)題、引言和對一個或多個所述關(guān)鍵詞的評注。
22.權(quán)利要求20的方法,其中所述自動合成步驟包括下列步驟為所述個性化文檔選擇格式編排風(fēng)格;為所述個性化文檔選擇輸出方法;以及在所述個性化文檔已被合成之后創(chuàng)建所述個性化文檔索引。
23.權(quán)利要求22的方法,其中所述創(chuàng)建步驟包括選擇所述索引深度的步驟。
24.一種以電子方式創(chuàng)建個性化文檔的系統(tǒng),包含注釋實用程序,用于送入關(guān)于所述個性化文檔的使用者評注;搜索實用程序,用于在一電子文檔數(shù)據(jù)庫中搜索與所述使用者評注中的那些關(guān)鍵詞相關(guān)的參考材料;用戶界面,用于允許使用者選擇要包括在所述個性化文檔之中的相關(guān)參考材料和導(dǎo)航能力;文檔產(chǎn)生實用程序,用于利用所述相關(guān)參考材料、所述用戶評注和所述導(dǎo)航能力,自動產(chǎn)生所述文檔;以及輸出實用程序,用于輸出所述個性化文檔。
25.權(quán)利要求24的系統(tǒng),進一步包含一個編索引實用程序,用于自動創(chuàng)建所述個性化文檔的索引。
26.一種用于以電子方式創(chuàng)建個性化文檔的計算機程序產(chǎn)品,包含計算機可讀介質(zhì);以及存儲在所述計算機可讀介質(zhì)上的程序指令,包含注釋實用程序,用于送入關(guān)于所述個性化文檔的使用者評注;搜索實用程序,用于在一電子文檔數(shù)據(jù)庫中搜索與所述使用者評注中的那些關(guān)鍵詞相關(guān)的參考材料;用戶界面,用于允許使用者選擇要包括在所述個性化文檔之中的相關(guān)參考材料和導(dǎo)航能力;文檔產(chǎn)生實用程序,用于利用所述相關(guān)參考材料、所述用戶評注和所述導(dǎo)航能力,自動產(chǎn)生所述文檔;以及輸出實用程序,用于輸出所述個性化文檔。
27.權(quán)利要求26的計算機程序產(chǎn)品,進一步包含一個編索引實用程序,用于自動創(chuàng)建所述個性化文檔的索引。
全文摘要
一種方法、系統(tǒng)和程序產(chǎn)品,用于由至少一個電子參考材料以電子方式創(chuàng)建一個個性化文檔。該方法首先選擇電子參考材料,然后,該電子參考材料被解析成子成分。然后該方法在所述子成分當(dāng)中聚集相似項,以創(chuàng)建個性化文檔,它被輸出時自動帶有一組導(dǎo)航能力,這組導(dǎo)航能力是根據(jù)使用者在產(chǎn)生文檔之前所作的選擇形成的。該方法還以文檔產(chǎn)生前使用者送入的評注來注釋該個性化文檔,并根據(jù)使用者選擇的索引選項和索引深度為該個性化文檔創(chuàng)建一個索引。
文檔編號G06F17/21GK1319817SQ01112120
公開日2001年10月31日 申請日期2001年3月29日 優(yōu)先權(quán)日2000年3月31日
發(fā)明者安·紐曼-科林斯, 唐·魯特勒支·戴 申請人:國際商業(yè)機器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1