亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

信息處理設(shè)備、信息處理系統(tǒng)、數(shù)據(jù)庫搜索方法和程序的制作方法

文檔序號:6412845閱讀:136來源:國知局
專利名稱:信息處理設(shè)備、信息處理系統(tǒng)、數(shù)據(jù)庫搜索方法和程序的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于對數(shù)據(jù)庫執(zhí)行信息搜索的信息搜索系統(tǒng),特別涉及用于從數(shù)據(jù)庫自動搜索對用戶有用的知識和信息并提供給用戶的信息搜索系統(tǒng)。
背景技術(shù)
作為用于知識管理等等的信息搜索的基礎(chǔ)技術(shù),一個方法是將由每個用戶(例如某一個組織的成員)所保有的信息資源(知識)向數(shù)據(jù)庫登記,并且由需要預(yù)定知識和信息的用戶來搜索數(shù)據(jù)庫,以得到想要的知識和信息(例如參見專利文獻(xiàn)1)。
此外,還有一種現(xiàn)有技術(shù),其通過主動地從數(shù)據(jù)庫方提供用戶所要求的信息來減少用戶的麻煩。更具體地,它是這樣一種系統(tǒng),其中用戶闡明他或她所需要的信息,并且那些在合適類別中的信息被自動地通知給用戶,在這種情況下信息在數(shù)據(jù)庫上登記(例如參見非專利文獻(xiàn)1)。根據(jù)這種現(xiàn)有技術(shù),每當(dāng)在數(shù)據(jù)庫登記時,用戶所要求的信息便會由數(shù)據(jù)庫方自動提供。因此,用戶不必每次都執(zhí)行搜索操作,并且除此之外,用戶所要求的類別的最新信息可以在任何時候提供,以使有效的信息搜索成為可能。
已公開的未審查專利申請2001-282972[非專利文獻(xiàn)1]″CIO Online Emerging Technology,″[online],IDG Japan,[searched on Jul.26,2003],Internet<URLhttp//www.idg.co.jp/CIO/contents/emerging/emerging1.html> 如上所述,迄今為止已經(jīng)提出了多種使用計算機(jī)來對數(shù)據(jù)庫進(jìn)行信息搜索的技術(shù)。但是,以上過去的信息搜索技術(shù)的麻煩在于,為了獲得所要的知識和信息,需要通過使用戶輸入類別或關(guān)鍵字來告知數(shù)據(jù)庫哪些知識和信息是要求的。
至于在非專利文獻(xiàn)1中披露的現(xiàn)有技術(shù),每次用戶執(zhí)行信息搜索時,不需要為搜索輸入信息,例如類別或關(guān)鍵字。但是,這導(dǎo)致了同樣的麻煩,因?yàn)橛脩粜枰ㄟ^用戶他或她自身的主動操作預(yù)先選擇這樣的信息,并在數(shù)據(jù)庫中進(jìn)行登記。
考慮到上述現(xiàn)有技術(shù)中的問題,本發(fā)明的目的之一在于消除用戶確定在信息搜索中所要的知識和信息時所執(zhí)行的操作,以減少用戶的麻煩。
本發(fā)明的另一個目的在于提供一種能夠根據(jù)用戶的信息活動從數(shù)據(jù)庫中選擇被認(rèn)為對用戶有用的知識和信息并主動提供給用戶的信息處理系統(tǒng)。

發(fā)明內(nèi)容
為了達(dá)到這些目的,本發(fā)明可實(shí)現(xiàn)成以如下方式構(gòu)成的信息處理系統(tǒng)。更具體地,該信息處理系統(tǒng)包括數(shù)據(jù)庫服務(wù)器和通過網(wǎng)絡(luò)連接到數(shù)據(jù)庫服務(wù)器的客戶機(jī),并且客戶機(jī)在通過預(yù)定信息活動獲得的文本中提取用于數(shù)據(jù)庫搜索的關(guān)鍵字并將它發(fā)送給數(shù)據(jù)庫服務(wù)器。并且數(shù)據(jù)庫服務(wù)器接收客戶機(jī)發(fā)送來的關(guān)鍵字,將關(guān)鍵字作為搜索條件來執(zhí)行數(shù)據(jù)庫搜索,并將搜索結(jié)果發(fā)送給客戶機(jī)。
為了更詳細(xì)地描述,被用作客戶機(jī)的信息處理設(shè)備包括用于保存通過預(yù)定信息活動獲得的文本的文本保存單元,用于分析信息活動的模式、根據(jù)分析結(jié)果確定提取用于數(shù)據(jù)庫搜索的關(guān)鍵字的方法、并且利用所確定的提取方法從文本保存單元保存的文本中提取關(guān)鍵字的關(guān)鍵字提取單元。它還包括用于發(fā)送由關(guān)鍵字提取單元提取、作為搜索條件的關(guān)鍵字給網(wǎng)絡(luò)上的數(shù)據(jù)庫服務(wù)器的通信控制單元,以及用于輸出利用關(guān)鍵字提取單元提取的關(guān)鍵字進(jìn)行的數(shù)據(jù)庫搜索的結(jié)果的輸出控制單元。
關(guān)鍵字提取單元最好根據(jù)信息活動模式的分析結(jié)果,把被確定為通過被執(zhí)行以獲得預(yù)定信息的信息活動而已經(jīng)獲得的文本,選作關(guān)鍵字的提取的對象(subject)。更具體地,關(guān)鍵字提取單元從通過對文本保存單元保存的文本執(zhí)行詞法分析而獲得的單詞中,提取預(yù)定數(shù)量的高出現(xiàn)頻率的單詞作為關(guān)鍵字。
也可以是,例如,用一個與外部設(shè)備交換其中存儲的電子郵件的郵箱來構(gòu)成文本保存單元,并且構(gòu)成關(guān)鍵字提取單元以分析作為信息活動模式、存儲在文本保存單元中的電子郵件的發(fā)送和接收動作,并且根據(jù)分析結(jié)果選擇電子郵件作為關(guān)鍵字提取的對象,以提取關(guān)鍵字。更具體地,在預(yù)定主題線索(thread)中的電子郵件發(fā)送和接收動作以單純的接收或者發(fā)送開始,并以預(yù)定數(shù)量的發(fā)送和接收之后的發(fā)送結(jié)束的情況下,它選擇該主題線索中的電子郵件以從中提取關(guān)鍵字。也可以分析發(fā)送和接收動作,并且針對每個主題線索確定發(fā)送和接收是否已經(jīng)執(zhí)行以便提供預(yù)定信息或獲得預(yù)定信息,使得根據(jù)確定結(jié)果從預(yù)定電子郵件中提取關(guān)鍵字。
作為另一個例子,也可以用存儲聊天中所交換的非定型(nontypical)消息的消息倉庫(message repository),消息板(messageboard)等等來構(gòu)成文本保存單元,并且構(gòu)成關(guān)鍵字提取單元,以分析作為信息活動模式的消息的樹結(jié)構(gòu),以及問題單詞和問題標(biāo)志是否被包括在非定型消息中,以便選擇作為關(guān)鍵字提取對象的消息并提取關(guān)鍵字。
另外,該信息處理系統(tǒng)中的數(shù)據(jù)庫服務(wù)器保存從客戶機(jī)接收的關(guān)鍵字,并且在與關(guān)鍵字相關(guān)的新信息在數(shù)據(jù)庫上登記的情況下,搜索新信息并將之發(fā)送給客戶機(jī)。在沒有來自客戶機(jī)的顯式搜索請求的情況下,數(shù)據(jù)庫服務(wù)器按照預(yù)定定時使用所保存的關(guān)鍵字執(zhí)行數(shù)據(jù)庫搜索,并將搜索結(jié)果發(fā)送給客戶機(jī)。
此外,信息處理系統(tǒng)還可以如此構(gòu)成,使得對于關(guān)鍵字,客戶機(jī)向數(shù)據(jù)庫服務(wù)器發(fā)送信息,其中在借以獲得的作為關(guān)鍵字提取源的文本的信息活動中,該信息指示客戶機(jī)設(shè)備是信息的接收者還是提供者,并且對于從客戶機(jī)發(fā)送的關(guān)鍵字中的預(yù)定關(guān)鍵字,數(shù)據(jù)庫服務(wù)器將有關(guān)已發(fā)送關(guān)鍵字、作為信息提供者的客戶機(jī)的信息,發(fā)送到發(fā)送過關(guān)鍵字、作為信息接收者的客戶機(jī)。
除了達(dá)到這些目的之外,本發(fā)明也可作為下述的使用計算機(jī)的數(shù)據(jù)庫搜索方法來實(shí)現(xiàn)。該搜索方法的特征在于包括步驟從通過預(yù)定信息活動所獲得的文本中,通過根據(jù)信息活動模式的分析結(jié)果而確定的關(guān)鍵字提取方法,提取用于數(shù)據(jù)庫搜索的關(guān)鍵字,在預(yù)定關(guān)鍵字存儲裝置中存儲提取的關(guān)鍵字,以及使用存儲在關(guān)鍵字存儲裝置中的關(guān)鍵字來執(zhí)行數(shù)據(jù)庫搜索。
另外,本發(fā)明也可以作為控制計算機(jī)來實(shí)現(xiàn)上述信息處理設(shè)備的功能的程序產(chǎn)品,或使計算機(jī)執(zhí)行與數(shù)據(jù)庫搜索方法的每一步相對應(yīng)的過程的程序產(chǎn)品來實(shí)現(xiàn)??梢酝ㄟ^將這個程序存儲在磁盤,光盤,半導(dǎo)體存儲器和其他記錄介質(zhì)中,以及通過網(wǎng)絡(luò)分布或發(fā)送它來提供。
根據(jù)如上構(gòu)成的本發(fā)明,可以在服務(wù)器上保存客戶機(jī)提取的關(guān)鍵字,在沒有來自客戶機(jī)的顯式搜索請求的情況下根據(jù)這個關(guān)鍵字執(zhí)行數(shù)據(jù)庫搜索,并且向客戶機(jī)提供搜索結(jié)果,以消除用戶為確定所要的知識和信息而執(zhí)行的操作,例如發(fā)出搜索請求和登記搜索條件,并因此顯著地減少了用戶的麻煩。
根據(jù)本發(fā)明,服務(wù)器在沒有來自客戶機(jī)的顯式搜索請求和搜索條件的登記的情況下自動執(zhí)行搜索,并且將搜索結(jié)果提供給客戶機(jī)。因此,它具有從信息處理系統(tǒng)方主動提供被認(rèn)為對用戶有用的知識和信息的效果。


附圖1是表示其中利用根據(jù)本實(shí)施方案的信息處理的信息處理系統(tǒng)的全面結(jié)構(gòu)的圖示;附圖2的示意圖表示適于實(shí)現(xiàn)本實(shí)施方案的服務(wù)器10和客戶機(jī)20的計算機(jī)設(shè)備的硬件結(jié)構(gòu)的例子;附圖3是表示根據(jù)本實(shí)施方案的客戶機(jī)20的功能性結(jié)構(gòu)的圖示;附圖4是對關(guān)鍵字提取單元22的關(guān)鍵字提取過程進(jìn)行解釋的流程圖;
附圖5是表示在根據(jù)本實(shí)施方案的客戶機(jī)是信息接收者還是提供者的基礎(chǔ)上對電子郵件進(jìn)行分類的標(biāo)準(zhǔn)(criteria)的表格。
附圖6是表示根據(jù)本實(shí)施方案的服務(wù)器的功能性結(jié)構(gòu)的圖示;附圖7是表示存儲在關(guān)鍵字管理數(shù)據(jù)庫13中數(shù)據(jù)結(jié)構(gòu)的例子的圖示;附圖8是已經(jīng)更新了與附圖7的關(guān)鍵字管理數(shù)據(jù)庫13中的電子郵件地址“”相關(guān)的關(guān)鍵字的表現(xiàn)的圖示;附圖9是表示本實(shí)施方案的信息處理系統(tǒng)的全部處理流程的流程圖;附圖10是在客戶機(jī)信息活動是多個計算機(jī)使用協(xié)作軟件進(jìn)行的協(xié)作工作的情況下,表示客戶機(jī)的功能性結(jié)構(gòu)的圖示;附圖11是在客戶機(jī)信息活動是多個計算機(jī)使用協(xié)作軟件進(jìn)行的協(xié)作工作的情況下,表示服務(wù)器的功能性結(jié)構(gòu)的圖示。
10,30服務(wù)器11信息知識管理DB(數(shù)據(jù)庫)12搜索執(zhí)行單元13關(guān)鍵字管理DB(數(shù)據(jù)庫)14發(fā)送和接收控制單元20,40客戶機(jī)21郵箱22關(guān)鍵字提取單元23發(fā)送和接收控制單元24輸出控制單元25最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)處理單元26用戶簡表DB(數(shù)據(jù)庫)41消息倉庫50網(wǎng)絡(luò)101 CPU(中央處理器)
103 主存儲器105 磁盤存儲驅(qū)動器(HDD)106 網(wǎng)絡(luò)接口具體實(shí)施方式
下面,將參考附圖詳細(xì)描述一個實(shí)現(xiàn)本發(fā)明的優(yōu)選實(shí)施方案。
附圖1是表示其中利用根據(jù)本實(shí)施方案的信息處理的信息處理系統(tǒng)的全面結(jié)構(gòu)的圖示。
如附圖1所示,本實(shí)施方案包括包括用于存儲并累積信息資源的數(shù)據(jù)庫的服務(wù)器10,以及用于通過網(wǎng)絡(luò)50連接到服務(wù)器并獲得信息的客戶機(jī)20。根據(jù)本實(shí)施方案的信息處理系統(tǒng)根據(jù)在客戶機(jī)20上執(zhí)行的信息活動自動提取信息搜索的搜索條件,并且根據(jù)提取的搜索條件在服務(wù)器10上執(zhí)行數(shù)據(jù)庫搜索,以便將搜索的信息(搜索結(jié)果)發(fā)送給客戶機(jī)20。
服務(wù)器10是在計算機(jī)設(shè)備,例如工作站或者個人計算機(jī)上實(shí)現(xiàn)的數(shù)據(jù)庫服務(wù)器。服務(wù)器10不但響應(yīng)搜索請求從數(shù)據(jù)庫讀取滿足搜索請求的搜索條件的信息并且應(yīng)答搜索請求,而且具有根據(jù)預(yù)先登記的搜索條件按照預(yù)定定時執(zhí)行數(shù)據(jù)庫搜索,并將它發(fā)送給對應(yīng)于搜索條件的客戶機(jī)20的功能。
客戶機(jī)20在計算機(jī)設(shè)備,如工作站、個人計算機(jī)、例如PDA(個人數(shù)字助理)的信息設(shè)備、或具有網(wǎng)絡(luò)功能的移動電話上實(shí)現(xiàn)。根據(jù)本實(shí)施方案的客戶機(jī)20是與服務(wù)器10有關(guān)的客戶機(jī),包括實(shí)際系統(tǒng)結(jié)構(gòu)中由個人最終用戶使用的終端設(shè)備和管理這些終端設(shè)備之間的消息交換的消息服務(wù)器。
網(wǎng)絡(luò)50可以是公共廣域網(wǎng)絡(luò),例如國際互聯(lián)網(wǎng),或本地網(wǎng)。更具體地,可通過以國際互聯(lián)網(wǎng)上提供的公共數(shù)據(jù)庫服務(wù)器作為服務(wù)器10的方式來構(gòu)成本實(shí)施方案的系統(tǒng),或者以一種封閉的形式,例如企業(yè)內(nèi)部互聯(lián)網(wǎng)來構(gòu)成。
附圖2的示意圖表示適于實(shí)現(xiàn)本實(shí)施方案的服務(wù)器10和客戶機(jī)20的計算機(jī)設(shè)備的硬件結(jié)構(gòu)的例子。
附圖2中所示的計算機(jī)設(shè)備包括作為計算裝置的CPU 101(中央處理單元),通過M/B(主板)芯片組102和CPU總線連接到CPU 101的主存儲器103,類似地通過主板芯片組102和AGP(加速圖形接口)連接到CPU 101的視頻卡104,通過PCI(外設(shè)部件互連)總線連接到主板芯片組102的硬盤驅(qū)動器(HDD)105,網(wǎng)絡(luò)接口106,以及通過橋電路107和低速總線例如ISA(工業(yè)標(biāo)準(zhǔn)結(jié)構(gòu))總線從PCI總線連接到主板芯片組102的軟盤驅(qū)動器108和鍵盤/鼠標(biāo)109。
附圖2僅僅舉例說明了用于實(shí)現(xiàn)本實(shí)施方案的計算機(jī)設(shè)備的硬件結(jié)構(gòu),如果本實(shí)施方案適用,則可以采用其他各種結(jié)構(gòu)。例如,可僅僅安裝視頻存儲器而不是提供視頻卡104,并且通過CPU 101來處理圖像數(shù)據(jù),或者通過例如ATA(AT附件)或SCSI(小型計算機(jī)系統(tǒng)接口)的接口提供CD-R(可記錄光盤驅(qū)動器)或者DVD-RAM(數(shù)字化通用光盤隨機(jī)存取存儲器)驅(qū)動器作為外部存儲器。
根據(jù)本實(shí)施方案,預(yù)定信息設(shè)備之間的消息交換被看作是客戶機(jī)20上用來提取服務(wù)器10上的搜索條件的信息活動。至于用于消息交換的手段,可考慮各種手段,例如電子郵件,通過使用協(xié)作軟件發(fā)送和接收協(xié)作工作中的消息,聊天等等。但是,考慮到現(xiàn)在企業(yè)運(yùn)營中基本上通過電子郵件提供和接收信息,使用電子郵件的情況將被作為本實(shí)施方案的一個例子進(jìn)行描述。更具體地,作為服務(wù)器10上的搜索條件的信息從客戶機(jī)20發(fā)送和接收的電子郵件中提取,以便被送往服務(wù)器10。
附圖3是表示根據(jù)本實(shí)施方案的客戶機(jī)20的功能性結(jié)構(gòu)的圖示。
參照附圖3,客戶機(jī)20包括其中存儲所發(fā)送和接收的郵件的郵箱21,用于從存儲在郵箱21中的郵件中提取關(guān)鍵字作為服務(wù)器10上數(shù)據(jù)庫搜索的搜索條件的關(guān)鍵字提取單元22,用于控制與服務(wù)器10的數(shù)據(jù)交換的發(fā)送和接收控制單元23,和用于輸出由發(fā)送和接收控制單元23所接收的、服務(wù)器10上的數(shù)據(jù)庫搜索結(jié)果的輸出控制單元24。
在附圖3中所示的結(jié)構(gòu)中,郵箱21通過例如附圖2中的計算機(jī)設(shè)備的主存儲器103或磁盤存儲驅(qū)動器105來實(shí)現(xiàn)。關(guān)鍵字提取單元22通過例如附圖2中的計算機(jī)設(shè)備的程序控制CPU 101來實(shí)現(xiàn)。發(fā)送和接收控制單元23通過例如附圖2中的計算機(jī)設(shè)備的程序控制CPU101和網(wǎng)絡(luò)接口106來實(shí)現(xiàn)。輸出控制單元24通過例如附圖2中的計算機(jī)設(shè)備的程序控制CPU 101和視頻卡104來實(shí)現(xiàn)。對于用于通過CPU 101實(shí)現(xiàn)關(guān)鍵字提取單元22,發(fā)送和接收控制單元23和輸出控制單元24的功能的程序,通過將它存儲在磁盤,光盤,半導(dǎo)體存儲器和其他記錄介質(zhì)中,以及通過網(wǎng)絡(luò)分布或發(fā)送來提供。
在客戶機(jī)20的結(jié)構(gòu)中,郵箱21積累(accumulate)在客戶機(jī)20和例如其它終端設(shè)備和服務(wù)器的信息設(shè)備之間交換的電子郵件以及其通信歷史。對于郵箱21,可應(yīng)用迄今為止已經(jīng)使用的電子郵件軟件(郵件發(fā)送者(mailer))的電子郵件管理功能。
為了從存儲的電子郵件中提取用于服務(wù)器10的數(shù)據(jù)庫搜索的關(guān)鍵字,關(guān)鍵字提取單元22按照預(yù)定定時(例如,在系統(tǒng)啟動時或者周期性地)搜索郵箱21。
附圖4是對關(guān)鍵字提取單元22的關(guān)鍵字提取過程進(jìn)行解釋的流程圖。
如附圖4所示,關(guān)鍵字提取單元22首先以主題線索為單位對存儲在郵箱21中的全部電子郵件進(jìn)行重新配置。根據(jù)電子郵件發(fā)送和接收模式,它針對在主題線索中客戶機(jī)20自身是信息提供者(銷售者)還是接收者(購買者)對每個主題線索進(jìn)行分類(步驟401)。
更具體地,在第一個動作是接收并且沒有關(guān)于一個預(yù)定主題線索的隨后動作的情況下,確定在主題線索中客戶機(jī)20是信息接收者。關(guān)于這種主題線索的一個例子,存在接收信息遞送服務(wù)的郵件,例如郵件雜志的情況。
在第一個動作是接收并且接收之后的動作是發(fā)送(返回郵件)再接收的情況下,可以確定客戶機(jī)20在主題線索中是信息提供者。這是因?yàn)?,大多?shù)情況下,在這樣的主題線索中,電子郵件在首先接收一個詢問(接收),回答(發(fā)送)并接收感謝問候(接收)的過程中被交換。同樣可考慮首先接收,隨后若干次交換電子郵件以及以接收來結(jié)束的情況。
在第一個動作是發(fā)送并且沒有隨后動作的情況下,可以確定客戶機(jī)20在主題線索中是信息提供者。作為這樣主題線索的一個例子,存在從客戶機(jī)20向其他方面發(fā)送通知的情況。
在第一個動作是發(fā)送并且隨后的動作是為接收再發(fā)送(返回郵件)的情況下,可以確定客戶機(jī)20在主題線索中是信息的接收者。這是因?yàn)?,在這樣的主題線索中,電子郵件被假設(shè)在與前面的接收再發(fā)送再接收的情況相反的過程中交換,即客戶機(jī)20詢問其它方面(發(fā)送),接收對其的響應(yīng)(接收)并且發(fā)送感謝問候(發(fā)送)。同樣考慮首先發(fā)送,隨后若干次交換電子郵件以及以發(fā)送來結(jié)束的情況。
在第一個動作是發(fā)送并且隨后的動作是接收再發(fā)送再接收的情況下,可以確定客戶機(jī)20在主題線索中是信息提供者。這是因?yàn)椋谶@樣的主題線索中,電子郵件被假設(shè)在從客戶機(jī)20發(fā)送某通知(發(fā)送),接收關(guān)于它的詢問(接收),回答(發(fā)送)并接收感謝問候(接收)的過程中交換。同樣考慮首先發(fā)送,隨后若干次交換電子郵件以及以接收來結(jié)束的情況。
在第一個動作是接收并且隨后的動作是刪除已接收的電子郵件的情況下,可以確定所接收的電子郵件是無用的電子郵件,例如垃圾郵件,并且可以確定客戶機(jī)20既不是信息的提供者,也不是接收者。
附圖5是概括上述電子郵件的分類的標(biāo)準(zhǔn)的表格。
接著,在步驟401中,關(guān)鍵字提取單元22選擇其中客戶機(jī)20被分類為信息接收者的主題線索,順序地將注意力聚焦于每一個所選擇的主題線索并且對包括在每一個主題線索中的電子郵件的語句執(zhí)行詞法分析,從而提取包括在電子郵件的語句中的名詞(步驟402)。并且它計算每一個已提取名詞的出現(xiàn)頻率(步驟403)。例如,名詞的出現(xiàn)頻率可以以如下方式計算。
首先,每個主題線索的重要性是1,并且根據(jù)出現(xiàn)的次數(shù),重要性被分配給出現(xiàn)在主題線索中的名詞,它是主題線索中的出現(xiàn)頻率(按照主題線索的出現(xiàn)頻率)。并且它對其中客戶機(jī)20位于信息接收者位置的全部主題線索中相同名詞的按照主題線索的出現(xiàn)頻率進(jìn)行累計,這是名詞的出現(xiàn)頻率。
計算是通過采用具體的例子執(zhí)行的。
對于其中客戶機(jī)20被確定為信息接收者的預(yù)定主題線索A,假定在包括在主題線索A中的電子郵件的語句中詞“知識管理”總共出現(xiàn)7次,詞“電子學(xué)習(xí)”總共出現(xiàn)3次。在這個例子里,“知識管理"的出現(xiàn)次數(shù)為7,并且總共提取10個詞(7+3)。因此,在主題線索A中其按照主題線索的出現(xiàn)頻率如下。
7/(7+3)=0.7同樣地,在主題線索A中“電子學(xué)習(xí)”的按照主題線索的出現(xiàn)頻率如下。
0.3(=3/(7+3))對于其中客戶機(jī)20同樣被確定為信息接收者的另一個主題線索B,假定在包括在主題線索B中的電子郵件的語句中詞“知識管理”總共出現(xiàn)3次,詞“投資效果對比”總共出現(xiàn)2次。在這個例子里,用以上計算方法,主題線索B中“知識管理,,的按照主題線索的出現(xiàn)頻率是0.6(=3/(3+2)),主題線索B中“投資效果對比”的按照主題線索的出現(xiàn)頻率是0.4(=2/(3+2))。
在郵件交換中,在其中客戶機(jī)20位于信息接收者位置的主題線索僅僅是主題線索A和主題線索B的情況下,如果累加在主題線索A和B中相同名詞的按照主題線索的出現(xiàn)頻率,則在主題線索A中“知識管理”的按照主題線索的出現(xiàn)頻率是0.7,而在主題線索B中是0.6。因此,“知識管理”的按照主題線索的出現(xiàn)頻率計算如下。
0.7+0.6=1.3因?yàn)椤半娮訉W(xué)習(xí)”僅僅出現(xiàn)在主題線索A中而“投資效果對比"僅僅出現(xiàn)在主題線索B中,按照線索的出現(xiàn)頻率(對于“電子學(xué)習(xí)”是0.3,對于“投資效果對比”是0.4)就是這些名詞本身的出現(xiàn)頻率。
接著,在通過步驟402的詞法分析提取的電子郵件的語句中的名詞中,關(guān)鍵字提取單元22排除非常常用的單詞(例如“會議”,“今天”,“總部”等等),并且從其余單詞中選擇高出現(xiàn)頻率的單詞作為關(guān)鍵字(步驟404)。常用單詞的消除可以通過預(yù)先準(zhǔn)備一個要排除的單詞的列表(詞典),并且將在步驟402中提取的名詞與列表進(jìn)行匹配來實(shí)現(xiàn)。也可根據(jù)關(guān)鍵字提取單元22提取的名詞自動地創(chuàng)建這個單詞列表。例如,有一種適合的方法,例如選擇對于所有用戶(不管是信息接收者還是信息提供者)均高頻率出現(xiàn)的單詞作為常用單詞,并且將它們在單詞列表中登記(更具體地,可建立一個標(biāo)準(zhǔn),例如選擇對于所有用戶(包括接收者和提供者)的50%或更多,具有最高頻率的若干單詞作為常用單詞)。按照單詞出現(xiàn)頻率的降序選擇預(yù)定數(shù)量的關(guān)鍵字。被選擇的關(guān)鍵字的數(shù)量是任意的和可變的。被選擇的關(guān)鍵字由發(fā)送和接收控制單元23發(fā)送給服務(wù)器10。
上述關(guān)鍵字選擇方法和在這里使用的單詞出現(xiàn)頻率計算方法僅僅是示例。任何其它任意的方法都可被采用,只要它是能夠從郵箱21中積累的電子郵件中適當(dāng)提取作為服務(wù)器10上數(shù)據(jù)庫搜索的搜索條件的關(guān)鍵字的方法。
發(fā)送和接收控制單元23通過網(wǎng)絡(luò)50向服務(wù)器10發(fā)送并從中接收數(shù)據(jù),并將關(guān)鍵字提取單元22提取的關(guān)鍵字發(fā)送給服務(wù)器10,或者接收自服務(wù)器10處發(fā)送出的搜索信息(數(shù)據(jù)庫搜索結(jié)果)。由發(fā)送和接收控制單元23接收自服務(wù)器10的搜索信息被送往輸出控制單元24。
輸出控制單元24向顯示單元輸出從發(fā)送和接收控制單元23接收的服務(wù)器10上的搜索信息,以在其上顯示。
關(guān)鍵字提取單元22提取的關(guān)鍵字是從通過客戶機(jī)20上的信息活動(電子郵件交換)獲得的文本中提取的。因此,在通過發(fā)送和接收控制單元22將關(guān)鍵字送往服務(wù)器10時,需要向服務(wù)器10發(fā)送把關(guān)鍵字和客戶機(jī)20關(guān)聯(lián)起來的信息,使得服務(wù)器10能夠識別出關(guān)鍵字所針對的客戶機(jī)。這里,根據(jù)本實(shí)施方案,客戶機(jī)20是被最終用戶使用的信息設(shè)備。但是,是最終用戶他或她自己而不是信息設(shè)備需要數(shù)據(jù)庫搜索所獲得的信息。因此,可以將用于識別使用客戶機(jī)20的最終用戶的信息而不是客戶機(jī)20與關(guān)鍵字關(guān)聯(lián)起來。更具體地,最終用戶的電子郵件地址與關(guān)鍵字一起被送往服務(wù)器10。
附圖6是表示根據(jù)本實(shí)施方案的服務(wù)器的功能性結(jié)構(gòu)的圖示。
參考附圖6,服務(wù)器10包括了用于存儲信息資源的信息資源管理DB(數(shù)據(jù)庫)11,用于執(zhí)行針對信息資源管理DB 11的數(shù)據(jù)庫搜索的搜索執(zhí)行單元12,用于存儲用于搜索執(zhí)行單元12的數(shù)據(jù)庫搜索的關(guān)鍵字的關(guān)鍵字管理DB(數(shù)據(jù)庫)13,和用于控制在它和客戶機(jī)20之間的數(shù)據(jù)交換的發(fā)送和接收控制單元14。
在如附圖6所示的結(jié)構(gòu)中,信息資源管理數(shù)據(jù)庫11和關(guān)鍵字管理數(shù)據(jù)庫13通過例如附圖2示出的計算機(jī)設(shè)備的主存儲器103和磁盤存儲驅(qū)動器105來實(shí)現(xiàn)。搜索執(zhí)行單元12通過例如附圖2示出的計算機(jī)設(shè)備的程序控制CPU 101來實(shí)現(xiàn)。發(fā)送和接收控制單元14通過例如附圖2舉出的計算機(jī)設(shè)備的程序控制CPU 101和網(wǎng)絡(luò)接口106來實(shí)現(xiàn)。輸出控制單元24通過例如附圖2示出的計算機(jī)設(shè)備的程序控制CPU 101和視頻卡104來實(shí)現(xiàn)。對于用CPU 101實(shí)現(xiàn)搜索執(zhí)行單元12和發(fā)送及接收控制單元14的功能的程序,通過將它存儲在磁盤,光盤,半導(dǎo)體存儲器和其他記錄介質(zhì)中,以及通過網(wǎng)絡(luò)分布或發(fā)送來提供該程序。
在服務(wù)器10的結(jié)構(gòu)中,信息資源管理數(shù)據(jù)庫11將信息資源存儲為服務(wù)器10上的數(shù)據(jù)庫搜索的對象。
搜索執(zhí)行單元12使用存儲在關(guān)鍵字管理數(shù)據(jù)庫13中的關(guān)鍵字針對信息資源管理數(shù)據(jù)庫11執(zhí)行數(shù)據(jù)庫搜索。搜索執(zhí)行單元12對信息資源管理數(shù)據(jù)庫11的搜索按照預(yù)定定時重復(fù)執(zhí)行(例如,周期性地)。因此,在新登記的、靈活性于預(yù)定關(guān)鍵字的信息資源存在于信息資源管理數(shù)據(jù)庫11中的情況下,搜索可以在任何時候進(jìn)行。
關(guān)鍵字管理數(shù)據(jù)庫13對通過使用電子郵件地址針對每一個最終用戶從客戶機(jī)20發(fā)送的關(guān)鍵字進(jìn)行分類和存儲。
發(fā)送和接收控制單元14通過網(wǎng)絡(luò)50向客戶機(jī)20發(fā)送并從其接收數(shù)據(jù),并且接收從客戶機(jī)20發(fā)送的關(guān)鍵字以將它存儲在關(guān)鍵字管理數(shù)據(jù)庫13中,或者將搜索執(zhí)行單元12搜索的信息送往一個可用的電子郵件地址。
附圖7是表示存儲在關(guān)鍵字管理數(shù)據(jù)庫13中的數(shù)據(jù)結(jié)構(gòu)的例子的圖示。
如附圖7所示,關(guān)鍵字管理數(shù)據(jù)庫存儲以使其關(guān)聯(lián)的方式用于識別最終用戶以作為信息用戶的內(nèi)部(in-house)郵件ID(電子郵件地址),作為搜索條件的關(guān)鍵字,關(guān)鍵字的最后搜索日期以及有效標(biāo)志。
這里,ID信息而不是電子郵件地址可被用作用于識別最終用戶的信息。但是,通過使用電子郵件地址,可通過將該電子郵件地址發(fā)送給它,來通知信息資源管理數(shù)據(jù)庫11的搜索結(jié)果。例如,當(dāng)關(guān)鍵字被從客戶機(jī)20送出時,電子郵件地址可以一起獲得。
最后搜索日期是最后用關(guān)鍵字執(zhí)行信息資源管理數(shù)據(jù)庫11的搜索的日期,并且在最后搜索日期及以后,搜索執(zhí)行單元12搜索在信息資源管理數(shù)據(jù)庫11中登記的信息。因此,可避免重復(fù)搜索過去已搜索的信息和將它送往客戶機(jī)20。
有效標(biāo)志是用于區(qū)別在搜索執(zhí)行單元12對信息資源管理數(shù)據(jù)庫11執(zhí)行搜索時實(shí)際使用的關(guān)鍵字(真),和沒有用于這個搜索的關(guān)鍵字(假)的標(biāo)志。例如,在針對每個電子郵件地址的有效關(guān)鍵字的數(shù)量被設(shè)置為3的情況下,與相同電子郵件地址關(guān)聯(lián)的關(guān)鍵字中的3個的有效標(biāo)志變?yōu)檎?在所示例子中,在與電子郵件地址“aaa@jp.ibm.com”相關(guān)的關(guān)鍵字中,三個關(guān)鍵字“知識管理”,“注釋”和“咨詢”為真)。
考慮到其中與預(yù)定電子郵件地址相關(guān)的關(guān)鍵字被存儲在服務(wù)器10的關(guān)鍵字管理數(shù)據(jù)庫13中,并且與電子郵件地址相關(guān)的關(guān)鍵字還通過發(fā)送和接收控制單元14新輸入的情況(如上所述,例如每次系統(tǒng)啟動時關(guān)鍵字被從客戶機(jī)20發(fā)送)。在這種情況下,關(guān)鍵字管理數(shù)據(jù)庫13中與電子郵件地址相關(guān)的關(guān)鍵字通過新輸入的關(guān)鍵字來更新。這里,假定例如三個關(guān)鍵字“知識管理”,“電子學(xué)習(xí)”和“投資效果對比”是按照某個定時從由“”識別的最終用戶所使用的客戶機(jī)20發(fā)送。
附圖8示出了在附圖7的關(guān)鍵字管理數(shù)據(jù)庫13已更新與電子郵件地址“”相關(guān)的關(guān)鍵字的表現(xiàn)。
如果對比附圖8和附圖7,單詞“電子學(xué)習(xí)”作為對應(yīng)于電子郵件地址“”的關(guān)鍵字被添加(最后的搜索日期為空,因?yàn)樗且粋€新附加的關(guān)鍵字)。并且附加的這三個關(guān)鍵字“電子學(xué)習(xí)”,“知識管理”和“投資效果對比”的有效標(biāo)志是真。關(guān)鍵字“注釋”和“咨詢”的有效標(biāo)志變?yōu)榧?。更具體地,從客戶機(jī)20發(fā)送的三個當(dāng)前關(guān)鍵字是有效的,并且除“知識管理”外也被包括在當(dāng)前關(guān)鍵字中的兩個關(guān)鍵字同舊關(guān)鍵字一樣是無效的。
在這里,舊關(guān)鍵字通過有效標(biāo)志在有效和無效之間切換,而不是被從關(guān)鍵字管理數(shù)據(jù)庫13中刪除。這是為了防止在關(guān)鍵字被作為當(dāng)前關(guān)鍵字以后從客戶機(jī)20再次發(fā)送的情況下,信息資源管理數(shù)據(jù)庫13被重復(fù)搜索。
作為一個具體的例子,考慮關(guān)鍵字“投資效果對比”,其有效標(biāo)志在附圖7中是假,但在附圖8中是真。
在附圖7中,三個關(guān)鍵字“知識管理”,“注釋”和“咨詢”是真,而且關(guān)鍵字“投資效果對比”與舊關(guān)鍵字一樣是假。在這個關(guān)鍵字“投資效果對比”被從關(guān)鍵字管理數(shù)據(jù)庫13中刪除的情況下,關(guān)鍵字“投資效果對比”在如附圖8所示的下一次更新中,被作為當(dāng)前關(guān)鍵字從客戶機(jī)20發(fā)送,并且因此這個關(guān)鍵字被重新在關(guān)鍵字管理數(shù)據(jù)庫13中登記。然后,搜索執(zhí)行單元12從在信息資源管理數(shù)據(jù)庫11中新登記的信息資源中搜索隸屬于新關(guān)鍵字“投資效果對比”的所有信息。
但是,關(guān)鍵字“投資效果對比”先前已經(jīng)作為關(guān)鍵字登記過,并且隸屬于這個關(guān)鍵字的信息那時已經(jīng)被搜索過并發(fā)送給客戶機(jī)20。因此,如果所有在信息資源管理數(shù)據(jù)庫11中登記的信息資源在關(guān)鍵字“投資效果對比”再次登記時均被搜索并發(fā)送給客戶機(jī)20,則先前發(fā)送給客戶機(jī)20的信息將變得冗余。因此,根據(jù)本實(shí)施方案,舊關(guān)鍵字并不從關(guān)鍵字管理數(shù)據(jù)庫13中刪除,而是僅僅將有效標(biāo)志作為假的從搜索條件中排除,以及有關(guān)通過該關(guān)鍵字進(jìn)行搜索的最后搜索日期的信息被保存,使得當(dāng)關(guān)鍵字下次變?yōu)檎鏁r,只有在最后搜索日期及此后存儲在信息資源管理數(shù)據(jù)庫11中的信息資源被搜索。對于附圖8中所示的例子,關(guān)鍵字“投資效果對比”的最后搜索日期為2003年4月5日。因此,在此日期及此日期之后在信息資源管理數(shù)據(jù)庫中登記的信息資源被搜索,以便向客戶機(jī)20發(fā)送隸屬于關(guān)鍵字“投資效果對比”的信息,如果存在的話。
根據(jù)如上構(gòu)成的本實(shí)施方案的信息處理系統(tǒng),對數(shù)據(jù)庫的搜索請求并非從客戶機(jī)20發(fā)送,而是被認(rèn)為是對客戶機(jī)20的最終用戶有用的信息在任何時候被從服務(wù)器10送往客戶機(jī)20。
附圖9是表示本實(shí)施方案的信息處理系統(tǒng)的全部處理流程的流程圖。
如附圖9中所示,按照預(yù)定定時(在系統(tǒng)啟動時或者周期性地),客戶機(jī)20使存儲在郵箱21中的電子郵件的主題線索被分析,并對其中客戶機(jī)20被確定為信息接收者(購買者)的主題線索進(jìn)行選擇,以便對包括在主題線索內(nèi)的電子郵件的文本執(zhí)行詞法分析(步驟901)。并且它被分解成單詞,并且計算每一個單詞(名詞)的出現(xiàn)頻率,使得關(guān)鍵字被選擇并與客戶機(jī)20的最終用戶的電子郵件地址一起發(fā)送給服務(wù)器10(步驟902)。
從客戶機(jī)20送往服務(wù)器10的關(guān)鍵字根據(jù)和關(guān)鍵字一起獲得的電子郵件地址被分類,并且被存儲在服務(wù)器10的關(guān)鍵字管理數(shù)據(jù)庫13中。信息資源管理數(shù)據(jù)庫11被搜索執(zhí)行單元12使用存儲在關(guān)鍵字管理數(shù)據(jù)庫13中的關(guān)鍵字作為搜索條件,按照預(yù)設(shè)和預(yù)定定時(例如在每天的固定時間內(nèi))進(jìn)行搜索,使所獲得的作為搜索結(jié)果的信息被送往客戶機(jī)20(步驟904)??蛻魴C(jī)20輸出并在其上顯示從服務(wù)器10發(fā)送的信息,以便通知其最終用戶(步驟905)。
根據(jù)上述操作的實(shí)施例,服務(wù)器10按照預(yù)設(shè)和預(yù)定定時執(zhí)行對信息資源管理數(shù)據(jù)庫11的搜索。但是,當(dāng)新關(guān)鍵字被從客戶機(jī)20發(fā)送時,也可以使用新關(guān)鍵字來執(zhí)行數(shù)據(jù)庫搜索。
另外,根據(jù)上述實(shí)施例,客戶機(jī)20在接收后,將作為搜索結(jié)果的信息輸出并在其上顯示。但是,也可在預(yù)定存儲裝置中存儲信息本身,并且通過顯示或聲音僅僅向最終用戶通知信息的接收。另外,為了將作為搜索結(jié)果的信息送往與關(guān)鍵字相關(guān)的電子郵件地址,也可由最終用戶通過使用電子郵件地址獲得來自信息設(shè)備而不是他或她自己的客戶機(jī)20的信息。
此外,本實(shí)施方案已經(jīng)通過所舉的客戶機(jī)20是最終用戶所使用的信息設(shè)備的例子進(jìn)行描述。但是,也可使用管理電子郵件交換的郵件服務(wù)器作為客戶機(jī)20。在這種情況下,作為客戶機(jī)20的郵件服務(wù)器分析其所管理的電子郵件交換的主題線索,提取關(guān)鍵字并將之送往服務(wù)器10。并且它將服務(wù)器10送來的信息發(fā)送給一個在主題線索中處于信息接收者位置的終端的用戶,其中關(guān)鍵字被作為郵件服務(wù)器的客戶機(jī)的用戶終端從該主題線索中提取。
根據(jù)該實(shí)施方案,電子郵件的交換被作為客戶機(jī)20的信息活動的一個實(shí)例。但是,實(shí)質(zhì)上對于本發(fā)明,從通過客戶機(jī)上的信息活動獲得的文本中提取關(guān)鍵字并發(fā)送給服務(wù)器10,使得即使客戶機(jī)20的最終用戶沒有通過他或她的主動操作設(shè)定數(shù)據(jù)庫搜索的搜索條件,搜索仍然自動地由服務(wù)器10執(zhí)行,以提供被認(rèn)為對最終用戶有用的信息。因此,信息活動的內(nèi)容不限于上述電子郵件的交換。下面,將給出對一個實(shí)施方案的描述,其中客戶機(jī)20的信息活動的概念是多個計算機(jī)通過使用協(xié)作軟件進(jìn)行的協(xié)作工作。
附圖10是在客戶機(jī)信息活動是多個計算機(jī)使用協(xié)作軟件進(jìn)行的協(xié)作工作的情況下,表示客戶機(jī)的功能性結(jié)構(gòu)的圖示。附圖11是表示在同樣情況下服務(wù)器的功能性結(jié)構(gòu)的圖示。
如附圖10所示,與在附圖3中所示的客戶機(jī)20相比,根據(jù)本實(shí)施方案的客戶機(jī)40包括消息倉庫41,用于存儲在協(xié)作軟件而不是郵箱21的協(xié)作工作中交換的非定型消息。否則,其結(jié)構(gòu)與附圖3中所示的客戶機(jī)20的結(jié)構(gòu)一樣。
但是,對于存儲在消息倉庫41的非定型消息,不可能象針對電子郵件分析直接信息活動的模式那樣直接分析發(fā)送和接收模式(參見附圖5),以及確定客戶機(jī)40是信息的提供者還是接收者。因此,為了分析客戶機(jī)40上的信息活動的模式,關(guān)鍵字提取單元22首先作為預(yù)處理來分析存儲在消息倉庫41中的每一條非定型消息的語句,以檢測問題單詞和問題標(biāo)記,例如“是嗎?”,“不是嗎?”和“?”。下一步,它參照消息的樹結(jié)構(gòu)并計出出現(xiàn)在客戶機(jī)40發(fā)送的消息中的問題單詞和問題標(biāo)記的數(shù)量。并且在問題單詞和問題標(biāo)記出現(xiàn)的數(shù)量較大的情況下(例如,在預(yù)定數(shù)量(閾值)或更多的情況下),可以確定在其一條消息交換過程中客戶機(jī)40位于信息接收者的位置。
此后,對消息執(zhí)行詞法分析和提取關(guān)鍵字的操作幾乎與附圖4中的關(guān)鍵字提取單元22的處理一樣。然而根據(jù)本實(shí)施方案,不僅在客戶機(jī)40是信息接收者的情況下,而且在它作為信息提供者的情況下,提取關(guān)鍵字,并且用于識別它是接收者還是提供者的識別數(shù)據(jù)被連同關(guān)鍵字一起發(fā)送給服務(wù)器10。
如附圖11中所示,除針對如附圖6中所示的服務(wù)器10的信息資源管理數(shù)據(jù)庫11,搜索執(zhí)行單元12和發(fā)送及接收控制單元14以外,根據(jù)本實(shí)施方案的服務(wù)器30還包括最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)處理單元31。它還包括用戶簡表數(shù)據(jù)庫32而不是關(guān)鍵字管理數(shù)據(jù)庫13。
最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)處理單元31通過例如在附圖2中例示的計算機(jī)設(shè)備的程序控制CPU 101來實(shí)現(xiàn)。
對于關(guān)鍵字,用戶簡表數(shù)據(jù)庫32象附圖6中所示的服務(wù)器10中的關(guān)鍵字管理數(shù)據(jù)庫13那樣存儲并保存關(guān)鍵字,并且也存儲用于指示已經(jīng)發(fā)送關(guān)鍵字的客戶機(jī)40是信息的接收者還是提供者的識別數(shù)據(jù)。并且搜索執(zhí)行單元12僅針對從作為信息接收者的客戶機(jī)40發(fā)送的關(guān)鍵字執(zhí)行對信息資源管理數(shù)據(jù)庫11的搜索。
最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)處理單元31搜索用戶簡表數(shù)據(jù)庫32,并且針對預(yù)定關(guān)鍵字檢查是否存在通過作為信息接收者的客戶機(jī)40的發(fā)送而進(jìn)行的登記,和通過從作為信息提供者的客戶機(jī)40的發(fā)送而進(jìn)行的登記。在存在這種關(guān)鍵字的登記的情況下,對于關(guān)鍵字,最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)處理單元31發(fā)送有關(guān)作為信息提供者的客戶機(jī)40的信息(用于交換消息的電子郵件地址等等)給作為信息接收者的客戶機(jī)40。例如,這種有關(guān)信息提供者的信息發(fā)送可在發(fā)送和關(guān)鍵字相關(guān)的搜索結(jié)果時一起執(zhí)行。
客戶機(jī)40獲得和關(guān)鍵字相關(guān)的搜索結(jié)果,以及對于關(guān)鍵字,作為有關(guān)信息提供者的客戶機(jī)40的信息,并且因此能夠直接與作為信息提供者的客戶機(jī)40交換消息,來獲得所要的信息。
以上描述了本發(fā)明的實(shí)施方案。但是顯然本發(fā)明的技術(shù)方案并不限于上述實(shí)施方案。例如,根據(jù)這些實(shí)施方案,客戶機(jī)包括用于提取關(guān)鍵字的裝置。但是,在信息處理系統(tǒng)的情況下,服務(wù)器本身也可具有關(guān)鍵字提取功能,其中是由服務(wù)器來管理作為客戶機(jī)上信息活動的結(jié)果所獲得的文本。因此,可適應(yīng)適當(dāng)結(jié)合硬件和軟件、在沒有超過本發(fā)明技術(shù)方案的范圍內(nèi)的各種系統(tǒng)結(jié)構(gòu)。
權(quán)利要求
1.一種信息處理設(shè)備,包括文本保存單元,用于保存通過預(yù)定信息活動獲得的文本;關(guān)鍵字提取單元,用于分析信息活動的模式以根據(jù)分析結(jié)果指定提取用于數(shù)據(jù)庫搜索的關(guān)鍵字的方法,并且用于通過該指定的提取方法從保存在文本保存單元中的文本中提取關(guān)鍵字;和輸出控制單元,用于輸出通過使用關(guān)鍵字提取單元提取的關(guān)鍵字執(zhí)行的數(shù)據(jù)庫搜索的結(jié)果。
2.根據(jù)權(quán)利要求1的信息處理設(shè)備,其中關(guān)鍵字提取單元根據(jù)信息活動模式的分析結(jié)果,把被確定為通過被執(zhí)行以獲得預(yù)定信息的信息活動而已經(jīng)獲得的文本,選作關(guān)鍵字的提取的對象。
3.根據(jù)權(quán)利要求1的信息處理設(shè)備,其中關(guān)鍵字提取單元將通過對文本保存單元保存的文本執(zhí)行詞法分析所獲得的單詞提取為關(guān)鍵字。
4.根據(jù)權(quán)利要求3的信息處理設(shè)備,其中從根據(jù)文本獲得的單詞中,關(guān)鍵字提取單元提取具有高出現(xiàn)頻率的預(yù)定數(shù)量的單詞作為關(guān)鍵字。
5.根據(jù)權(quán)利要求1的信息處理設(shè)備,其中文本保存單元是在其中存儲與外部設(shè)備交換的電子郵件的郵箱。
6.根據(jù)權(quán)利要求5的信息處理設(shè)備,其中關(guān)鍵字提取單元分析存儲在文本保存單元中的電子郵件的發(fā)送和接收動作,并且選擇根據(jù)分析結(jié)果而選定的電子郵件作為關(guān)鍵字提取對象。
7.根據(jù)權(quán)利要求5的信息處理設(shè)備,其中關(guān)鍵字提取單元在預(yù)定主題線索中的電子郵件發(fā)送和接收動作以單純的接收或者發(fā)送開始,并以預(yù)定數(shù)量的發(fā)送和接收之后的發(fā)送結(jié)束的情況下,分析存儲在文本保存單元中的電子郵件的發(fā)送和接收動作,并且選擇該主題線索中的電子郵件作為關(guān)鍵字提取對象。
8.根據(jù)權(quán)利要求5的信息處理設(shè)備,其中關(guān)鍵字提取單元分析存儲在文本保存單元中的電子郵件的發(fā)送和接收動作,并且針對每個主題線索確定發(fā)送和接收是否已經(jīng)執(zhí)行以便提供預(yù)定信息或獲得預(yù)定信息,并且根據(jù)確定結(jié)果從預(yù)定電子郵件中提取關(guān)鍵字。
9.一種信息處理設(shè)備,包括文本保存單元,用于保存通過預(yù)定信息活動獲得的文本;關(guān)鍵字提取單元,用于分析信息活動的模式以根據(jù)分析結(jié)果指定提取用于數(shù)據(jù)庫搜索的關(guān)鍵字的方法,并且用于通過該指定的提取方法從保存在文本保存單元中的文本中提取關(guān)鍵字;和通信控制單元,用于發(fā)送由關(guān)鍵字提取單元提取的作為搜索條件的關(guān)鍵字到網(wǎng)絡(luò)上的數(shù)據(jù)庫服務(wù)器。
10.根據(jù)權(quán)利要求9的信息處理設(shè)備,其中關(guān)鍵字提取單元根據(jù)信息活動模式的分析結(jié)果,把被確定為通過被執(zhí)行以獲得預(yù)定信息的信息活動而已經(jīng)獲得的文本,選作關(guān)鍵字的提取的對象。
11.根據(jù)權(quán)利要求9的信息處理設(shè)備,其中關(guān)鍵字提取單元將通過對文本保存單元保存的文本執(zhí)行詞法分析所獲得的單詞提取為關(guān)鍵字。
12.一種信息處理系統(tǒng),包括數(shù)據(jù)庫服務(wù)器和通過網(wǎng)絡(luò)連接到數(shù)據(jù)庫服務(wù)器的客戶機(jī);其中客戶機(jī)根據(jù)預(yù)定信息活動的模式指定提取用于數(shù)據(jù)庫搜索的關(guān)鍵字的方法,通過指定的方法從通過預(yù)定信息活動獲得的文本中提取關(guān)鍵字,并將關(guān)鍵字發(fā)送給數(shù)據(jù)庫服務(wù)器;并且數(shù)據(jù)庫服務(wù)器接收客戶機(jī)發(fā)送的關(guān)鍵字,使用關(guān)鍵字作為搜索條件來執(zhí)行數(shù)據(jù)庫搜索,并將搜索結(jié)果發(fā)送給客戶機(jī)。
13.根據(jù)權(quán)利要求12的信息處理系統(tǒng),其中數(shù)據(jù)庫服務(wù)器保存從客戶機(jī)接收的關(guān)鍵字,并且在與關(guān)鍵字相關(guān)的新信息在數(shù)據(jù)庫中登記的情況下,數(shù)據(jù)庫服務(wù)器將新信息發(fā)送給客戶機(jī)。
14.根據(jù)權(quán)利要求12的信息處理系統(tǒng),其中數(shù)據(jù)庫服務(wù)器保存從客戶機(jī)接收的關(guān)鍵字,按照預(yù)設(shè)定時執(zhí)行數(shù)據(jù)庫搜索,并將搜索結(jié)果發(fā)送給客戶機(jī)。
15.根據(jù)權(quán)利要求12的信息處理系統(tǒng),其中客戶機(jī)從與外部設(shè)備交換的電子郵件中提取關(guān)鍵字;并且數(shù)據(jù)庫服務(wù)器根據(jù)使用客戶機(jī)的最終用戶的電子郵件地址對從客戶機(jī)接收的關(guān)鍵字進(jìn)行分類和保存,并且將基于關(guān)鍵字的數(shù)據(jù)庫搜索結(jié)果發(fā)送到電子郵件地址。
16.根據(jù)權(quán)利要求12的信息處理系統(tǒng),其中,對于關(guān)鍵字,客戶機(jī)還向數(shù)據(jù)庫服務(wù)器發(fā)送指示在信息活動中客戶機(jī)設(shè)備曾是信息的接收者還是提供者的信息,其中曾通過所述信息活動獲得作為關(guān)鍵字提取對象的文本;并且對于從客戶機(jī)發(fā)送的關(guān)鍵字中的預(yù)定關(guān)鍵字,數(shù)據(jù)庫服務(wù)器將有關(guān)作為信息提供者、發(fā)送過關(guān)鍵字的客戶機(jī)的信息,發(fā)送到作為信息接收者、發(fā)送過關(guān)鍵字的客戶機(jī)。
17.一種用于搜索利用計算機(jī)構(gòu)成的數(shù)據(jù)庫的數(shù)據(jù)庫搜索方法,該方法包括以下步驟從通過預(yù)定信息活動獲得并且存儲在預(yù)定文本存儲裝置中的文本中,通過根據(jù)信息活動模式的分析結(jié)果而確定的關(guān)鍵字提取方法,提取用于數(shù)據(jù)庫搜索的關(guān)鍵字;在預(yù)定關(guān)鍵字存儲裝置中存儲提取的關(guān)鍵字;以及使用存儲在關(guān)鍵字存儲裝置中的關(guān)鍵字來執(zhí)行數(shù)據(jù)庫搜索。
18.根據(jù)權(quán)利要求17的數(shù)據(jù)庫搜索方法,其中提取關(guān)鍵字的步驟包括步驟將通過對文本執(zhí)行詞法分析所獲得的單詞提取為關(guān)鍵字。
19.根據(jù)權(quán)利要求17的數(shù)據(jù)庫搜索方法,其中按照預(yù)設(shè)和預(yù)定定時重復(fù)用于執(zhí)行數(shù)據(jù)庫搜索的步驟,以便在任何時間搜索到隸屬關(guān)鍵字的新登記信息。
20.一種程序產(chǎn)品,用于使計算機(jī)執(zhí)行以下處理利用通過預(yù)定信息活動獲得并且存儲在預(yù)定存儲裝置中的信息,根據(jù)分析信息活動的模式的分析結(jié)果,指定提取用于數(shù)據(jù)庫搜索的關(guān)鍵字的方法;用提取方法從通過預(yù)定信息活動獲得的文本中提取關(guān)鍵字;以及輸出所提取的作為數(shù)據(jù)庫搜索的搜索條件的關(guān)鍵字。
21.根據(jù)權(quán)利要求20的程序產(chǎn)品,在指定提取關(guān)鍵字的方法的過程中,用于將存儲在存儲裝置中的文本分類成被確定為通過被執(zhí)行以獲得預(yù)定信息的信息活動已經(jīng)獲得的文本,和被確定為通過其他信息活動已經(jīng)獲得的文本,并且選擇被確定為通過被執(zhí)行以獲得預(yù)定信息的信息活動而獲得的文本,以作為關(guān)鍵字提取對象。
22.根據(jù)權(quán)利要求20的程序產(chǎn)品,在提取關(guān)鍵字的過程中,用于將通過對文本保存單元保存的文本執(zhí)行詞法分析所獲得的單詞提取為關(guān)鍵字。
23.根據(jù)權(quán)利要求22的程序產(chǎn)品,在提取關(guān)鍵字的過程中,用于從根據(jù)文本獲得的單詞中,提取具有高出現(xiàn)頻率的預(yù)定數(shù)量的單詞作為關(guān)鍵字。
24.根據(jù)權(quán)利要求20的程序產(chǎn)品,在指定提取關(guān)鍵字的方法的過程中,用于在預(yù)定主題線索中的電子郵件發(fā)送和接收動作以單純的接收或者發(fā)送開始,并以預(yù)定數(shù)量的發(fā)送和接收之后的發(fā)送結(jié)束的情況下,分析存儲在郵件中的電子郵件的發(fā)送和接收動作,并且選擇該主題線索中的電子郵件作為關(guān)鍵字提取對象。
25.根據(jù)權(quán)利要求20的程序產(chǎn)品,在指定提取關(guān)鍵字的方法的過程中,用于分析存儲在郵件中的電子郵件的發(fā)送和接收動作,并且針對每個主題線索確定發(fā)送和接收是否已經(jīng)執(zhí)行以便提供預(yù)定信息或獲得預(yù)定信息,并且根據(jù)確定結(jié)果選擇預(yù)定電子郵件作為關(guān)鍵字提取對象。
全文摘要
減少由用戶執(zhí)行的操作,從而在信息搜索中指定所要求的資源和信息,以便減少用戶的麻煩。一種信息處理系統(tǒng)包括具有數(shù)據(jù)庫的服務(wù)器10和通過網(wǎng)絡(luò)50連接到服務(wù)器10的客戶機(jī)20。客戶機(jī)20在預(yù)定信息活動模式的基礎(chǔ)上指定一種提取用于數(shù)據(jù)庫搜索關(guān)鍵字的方法,從預(yù)定信息活動所獲得的文本中提取一個用于數(shù)據(jù)庫搜索的關(guān)鍵字并將它發(fā)送給服務(wù)器10。并且服務(wù)器10接收并保存客戶機(jī)發(fā)送來的關(guān)鍵字,在沒有來自客戶機(jī)20的搜索請求時,將關(guān)鍵字作為一個搜索條件,在預(yù)定時間內(nèi)執(zhí)行數(shù)據(jù)庫搜索,并將搜索結(jié)果發(fā)送給客戶機(jī)20。
文檔編號G06F17/30GK1581171SQ20041005643
公開日2005年2月16日 申請日期2004年8月10日 優(yōu)先權(quán)日2003年8月12日
發(fā)明者田淵敬三 申請人:國際商業(yè)機(jī)器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1