專利名稱:更新興趣的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種更新興趣的方法,特別涉及一種更新用戶興趣的方法。
背景技術(shù):
在當前信息豐富的環(huán)境下,人們非常關(guān)心開發(fā)改進的信息檢索方法。具體地說,代理技術(shù)領(lǐng)域正在大力開發(fā)用于搜索、概括、過濾以及顯示信息的代理(agent),例如,Davies,Weeks & Revett 1997(“Information Agents for the WWW”in Software agents and softcomputing,Eds H.Nwana,N.Azarmi,Berlin Springer-Verlag)。這些工作大部分(即使不是全部)依賴于該代理具有用戶的某些知識。不僅對于代理技術(shù),而且總體上對于因特網(wǎng)而言,用戶信息的包含正在迅速變成至關(guān)重要的領(lǐng)域,正如最近建議的Open Profiling Standard Dunn,Gwerzmann,Layman & Partovi 1997(“Privacy and profiling on theweb”Technical note,WWW consortium 2 June 1997)所描述的那樣。無疑,隨著數(shù)字圖書館、電子商務(wù)以及個性化應(yīng)用的進一步普及,用戶信息所起的作用與日俱增。
過濾代理(例如電子郵件優(yōu)先化代理)是典型的關(guān)于信息量管理的第一代代理。Maes 1994描述了這種用于減少信息過載的代理的多種動機、方法以及應(yīng)用(Maes(1994)“Agents that reduce workload andinformation overload”Communications of the ACM,July)。實際上,這可能就是代理在互聯(lián)網(wǎng)環(huán)境下獲得成功的唯一的最重要的原因?qū)τ谌魏我粋€人來說都有太多的資源以至于難以詳盡地查閱,并且事實上,如果某人很幸運的已經(jīng)瀏覽了所有這些網(wǎng)頁,那么他將發(fā)現(xiàn)其中只有一小部分是他所感興趣或相關(guān)的。作為減少工作量的手段,搜索代理(例如Amalthaea)正變得很突出,它們大部分都包括某種允許用戶告訴代理他們各自的興趣以及偏愛的方法。代理技術(shù)的進一步發(fā)展已經(jīng)開始考慮預(yù)先與用戶進行交互,同時了解他們的興趣。
現(xiàn)在的很多代理都包括某種形式的用戶簡況編輯(userprofiling),例如Yenta(Foner & Crabtree,1977(“Multi-agent matchmaking”in Software agents and soft computing,Eds H.Nwana,N.Azarmi,Berlin Springer-Verlag)),Syskill&Webert(Pazzani and Billsus,1997“Learning andrevising user profilesthe identification of interesting websites”,Machine learning 27(3)),Personal WebWatcher(Mladenic,1996“Personal webwatcherdesign and implementation”,Technical report ljs-DP-7472,Schoolof computer science,Carnegie-Mellon University,Pittsburgh USA,October.),Letizia(Lieberman.1995“LetiziaAn agent that assistsweb browsing”,Proceeding,14thJoint International Conference onartificial intelligence(IJDAI-95),Montreal,Canada)NewSIEVE(Haneke,1997,“Leaning based filtering of textinformation using simple interest profiles”,In P.Kandzia &M.klusch,Co-operative information agents.BerlinSpringer-Verlag”),以及INSOP(Kindo etal 1997“Adaptive personal informationfiltering system that organizes personal profiles automatically”,Proceedings 15thInternational Joint Conference on ArtificialIntelligence(IJCAI-97)pp.716-721 Nagoya,Japan)。
Syskill&Webert的代理了解用戶的簡況并利用簡況來指導(dǎo)它的對感興趣網(wǎng)頁的建議。用戶評估該建議與用戶興趣的相關(guān)性,并且代理采用了一個自然Bayesian分類器來相應(yīng)地修改用戶的簡況。Amalthaea(Moukas,1997“User modelling in a multiagent evolving system”Proceedings,workshop on Machine learning for user modelling,6thInternational Conference on User modelling,Chia Laguna,Sardinia)采用了加權(quán)的關(guān)鍵字表示來用于用戶的簡況,然后查閱該用戶簡況以便查詢因特網(wǎng)搜索引擎,從而檢索用戶所感興趣的網(wǎng)頁。Amalthaea的用戶簡況包括多個信息過濾代理(IFA),每個代理都專用于一個特定主題。這些IFA可以由多種方法構(gòu)造(例如通過分析用戶的喜好網(wǎng)頁的熱門列表;通過觀察用戶與它們的瀏覽器之間的交互(使用網(wǎng)頁訪問歷史記錄)等等)。進一步,IFA可以不斷改進,因此隨著用戶與Amalthaea之間的不斷交互,它們可以更適應(yīng)于用戶。
很多網(wǎng)站都會搜集關(guān)于用戶的信息以便于a)了解人口統(tǒng)計學信息,b)從網(wǎng)站提供個性化服務(wù)和信息。為了使得網(wǎng)站能夠維護忠誠用戶基礎(chǔ),這一技術(shù)變得更加重要。事實上,F(xiàn)irefly,Autonomy以及OpenSesame!最近都已經(jīng)發(fā)布了能夠具有這種適應(yīng)性的產(chǎn)品。
因此非常清楚的是,為了向一個用戶提供他所感興趣的服務(wù)和信息,掌握這個用戶的簡況是至關(guān)重要的。雖然上述的系統(tǒng)使用了各種技術(shù)和信息源,可是并不是很多系統(tǒng)都試圖根據(jù)用戶的狀態(tài)環(huán)境在簡況中布置關(guān)鍵字或者標識符。用戶在一個時刻的狀態(tài)環(huán)境基本上決定了用戶此時感興趣信息的類型和內(nèi)容(例如如果一個用戶正在工作,則用戶就會想知道與工作相關(guān)的興趣),并且在該領(lǐng)域內(nèi)的一些進展會有助于減少提供給用戶的信息量。
本申請人的專利EP807291(IPD case ref A24976)講述了一種基于軟件的系統(tǒng)“JASPER”代理,其中存儲了與用戶感興趣文檔有關(guān)的元信息,例如文檔的URL以及表示文檔內(nèi)容的關(guān)鍵字。JASPER還存儲了用戶簡況,其中包括表示用戶興趣尤其是信息類型的關(guān)鍵字,并且JASPER還在用戶之間進行了協(xié)作過濾以便于識別出可能具有共同興趣的用戶(將用戶分組)。JASPER在不同用戶組之間比較元信息,并且如果組A中的一個用戶識別出一個文檔與其相關(guān),則JASPER會將與該被識別出的文檔有關(guān)的元信息提供給組A中的其它用戶(例如通過email)。該用戶簡況可以根據(jù)狀態(tài)環(huán)境(例如工作,休閑的類型)、按照類別存儲關(guān)鍵字,并且JASPER還可以根據(jù)檢測到的用戶所查看信息類型的變化對這些類別的內(nèi)容進行改變(例如在針對一個狀態(tài)環(huán)境存儲的關(guān)鍵字之間進行比較并將其與被查看的文檔中的關(guān)鍵字進行比較)。因此,JASPER為了發(fā)布信息以及在各個用戶組之間進行識別,而對表征一個狀態(tài)環(huán)境的一組關(guān)鍵字進行識別。
在以下的說明中,使用了術(shù)語“興趣”、“用戶簡況”、“信息源”、“狀態(tài)環(huán)境”、“例示興趣”,以下是它們的定義“興趣”包括代表一個主題的諸如一組關(guān)鍵字和/或圖像和/或音樂的與主題有關(guān)的數(shù)據(jù)。通常,圖像和音樂附帶有某種形式的描述,例如音樂“Faure安魂彌撒曲,寫于1887年,該片斷反映Faure對死的想象”。在這種情況下,可以從該描述中提取關(guān)鍵字,而且該關(guān)鍵字可以用于描述興趣(例如,主題Impressionist,Death)。
“用戶簡況”包括針對一個用戶存儲的一個或者多個興趣。
“信息源”包括一個含有例如文檔的信息的實體。
“狀態(tài)環(huán)境”包括用于描述用戶的當前狀態(tài)的表示-例如狀態(tài)(工作,玩)、位置(在家,在外)以及陪伴(同事)。
“例示興趣”,在識別了用戶狀態(tài)后,例示用戶的狀態(tài)環(huán)境-例如識別出用戶在家工作,所以將狀態(tài)環(huán)境例示為工作、在家。然后,根據(jù)例示的狀態(tài)環(huán)境來過濾興趣,并將這些興趣稱為例示興趣。
發(fā)明內(nèi)容
根據(jù)本發(fā)明,提供一種改變表示用戶感興趣的主題內(nèi)容的簡況的方法。該簡況包括多組與主題有關(guān)的數(shù)據(jù),該方法包括以下步驟(i)向用戶建議改變簡況的內(nèi)容,該建議包括一個或多個表示建議的改變的選擇項;(ii)從用戶接收一個或多個選擇項;(iii)根據(jù)每個選擇項修改用戶簡況;(iv)監(jiān)視用戶的修改動作;并且,如果用戶動作符合預(yù)定的條件,
(v)根據(jù)每個選擇項永久地改變簡況。
優(yōu)選地,監(jiān)視步驟(iv)以用戶可配置的頻率發(fā)生,包括以下步驟提供給用戶至少一個進一步的選擇項;接收該每個進一步的選擇項;以及將每個進一步的選擇項與預(yù)定的條件比較。
此外,該每個進一步的選擇項包括一個或多個表示在步驟(i)中所建議的建議改變的選擇項的確認。
另選地,監(jiān)視步驟(iv)可包括計算用戶訪問與該選擇項有關(guān)的信息的次數(shù),并且將所述數(shù)與閾值數(shù)比較。作為另一種選擇,監(jiān)視步驟(iv)可以包括觀察與選擇項有關(guān)的用戶訪問的模式,并將觀察到的模式與一個或多個預(yù)定的模式比較。這些模式包括,例如,訪問與選擇項有關(guān)的信息所用的時間、訪問與選擇項有關(guān)的信息的時刻、以及用戶訪問與選擇項有關(guān)的信息的方法的重復(fù)性。
優(yōu)選地,該方法還包括在兩個或更多個用戶之間執(zhí)行比較分析和/或群集分析中的至少一種分析,并接收其輸出。然后該輸出用于提供至少一個表示建議的改變的選擇項。因此,例如,如果興趣A與興趣B鏈接并且用戶U1有興趣A,那么興趣B將是建議的改變??梢允褂闷渌臄?shù)據(jù)采集和分析方法來識別潛在的興趣,如模糊邏輯、啟發(fā)式的和基于知識的方法。
優(yōu)選地,此方法還包括評價與比較分析和/或群集分析的輸出相關(guān)聯(lián)的確信度值,并且根據(jù)與所述輸出相關(guān)聯(lián)的評價的確信度值,執(zhí)行基于所述輸出建議改變簡況內(nèi)容的步驟(i)。例如,可以用統(tǒng)計技術(shù)以本技術(shù)領(lǐng)域普通技術(shù)人員所知的方式來計算這些確信度值。
優(yōu)選地,此方法還包括把輸出與被認為與用戶無關(guān)的改變的列表比較,并且,如果輸出中的任何選擇項與列表中的任何項匹配,則從輸出中丟棄匹配的選擇項。因此,把興趣B與“非興趣”的項目表比較,只有在其未列入“非興趣”的項目表中時,才將其建議給用戶。
根據(jù)以下參考附圖對本發(fā)明優(yōu)選實施例所做的說明,本發(fā)明的其它方面、特征以及優(yōu)點將變得更加明顯,附圖包括圖1是示出根據(jù)本發(fā)明的通信系統(tǒng)的物理層或傳輸層的示意圖;圖2是示出根據(jù)本發(fā)明的信息提供器的各部分的示意框圖;圖3是示出產(chǎn)生由構(gòu)成圖2所示信息提供器的設(shè)備的一部分的簡況編輯器執(zhí)行的動作的裝置的示意框圖;圖4是示出輸入到構(gòu)成圖2所示信息提供器的設(shè)備的一部分的狀態(tài)環(huán)境確定裝置的各外部輸入的示意框圖;圖5a是示出根據(jù)本發(fā)明確定用戶狀態(tài)環(huán)境過程中的各步驟的示意流程圖;圖5b是示出輸入到圖4所示狀態(tài)環(huán)境確定裝置的其它各外部輸入的示意框圖;圖6是示出由構(gòu)成圖2所示信息提供器的設(shè)備的一部分的第二檢索裝置執(zhí)行的各步驟的示意流程圖;圖7是示出與監(jiān)視裝置部分配合的、圖2所示信息提供器的第二檢索裝置的示意框圖;以及圖8是示出構(gòu)成監(jiān)視裝置部分的一部分的貝葉斯(Bayes)網(wǎng)的示意圖。
具體實施例綜述參考圖1,在物理層,用戶U1的通信環(huán)境包括用戶攜帶的蜂窩式電話T1和個人數(shù)字助理T2;以及包括調(diào)制解調(diào)器的計算機工作站T3。工作站T3可能位于與用戶U1有一定距離的位置。
在這種情況下,工作站T3包括連接到與用戶距離不同的其它終端(僅示出一個T4)的局域網(wǎng)(LAN)服務(wù)器。與各種終端進行通信的是構(gòu)成不同概念網(wǎng)絡(luò)(盡管其中一些或者全部可能被共同擁有)的部分的一些不同通信信道。工作站T3還連接到數(shù)據(jù)庫服務(wù)器DB1、DB2,數(shù)據(jù)庫服務(wù)器DB1、DB2如圖所示位于與終端T3相同的LAN N3上;顯然,數(shù)據(jù)庫服務(wù)器DB1、DB2可以位于通過一個或者多個交換機和/或者路由器(未示出)與LAN N3相連的LAN上。
公用交換電話網(wǎng)(PSTN)N1通過網(wǎng)關(guān)G1(例如市話交換中心或國際交換中心)與綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)N2互連,而且通過ISDN線L1連接到終端T3,并因此連接到局域網(wǎng)N3。公用陸地移動通信網(wǎng)(PLMN)(例如GSM-兼容數(shù)字蜂窩網(wǎng))N4通過網(wǎng)關(guān)G2連接到PSTN N1和ISDN N2。PLMN的基站B1在用戶U1所在的建筑環(huán)境中提供Pico小區(qū),而基站B2在同一個一般區(qū)域內(nèi)提供一個小區(qū)。因此,網(wǎng)絡(luò)N1-N4能夠以不同速率將數(shù)據(jù)發(fā)送到各種終端T1-T3通過PLMN N4發(fā)送低速數(shù)據(jù),通過PSTNN1發(fā)送高速數(shù)據(jù),通過ISDN N2或LAN N3發(fā)送更高速數(shù)據(jù)。
例如保持在服務(wù)器IS1-IS4上的信息源分布在網(wǎng)絡(luò)N1-N4上。盡管僅示出4個服務(wù)器,但是還可以設(shè)想其它分布情況。用戶U1希望從系統(tǒng)內(nèi)的任何一個或者所有信息源接收有關(guān)信息。
使用本發(fā)明的一個實施例提供信息的系統(tǒng)的概述用戶U1在某個時刻的狀態(tài)環(huán)境基本上確定了用戶U1此時正感興趣的信息類型和信息內(nèi)容,例如,如果用戶U1在工作,則用戶U1很可能想知道與工作有關(guān)的興趣。如果根據(jù)用戶的狀態(tài)環(huán)境對信息進行分類和顯示,則它可以做到3件事首先,減少對用戶U1顯示的信息量,其次,用戶不必手動過濾與其當前狀態(tài)環(huán)境無關(guān)的信息,再次,用戶不會被與其當前狀態(tài)環(huán)境無關(guān)的信息所煩擾。因此,便于根據(jù)用戶的狀態(tài)環(huán)境來過濾信息,從而減少與用戶無關(guān)的信息量。
參考圖2,作為本發(fā)明實施例,信息提供器200位于終端T3。信息提供器200主要包括簡況編輯器201,用于產(chǎn)生包括用戶興趣的簡況;接口裝置203,用于連接用戶;索引生成器205,用于對存儲在服務(wù)器IS1-IS4上的信息源編索引;以及檢索引擎207,用于根據(jù)用戶的狀態(tài)環(huán)境來檢索信息。
以下將更詳細說明信息提供器200的各部分,但是概括地說,簡況編輯器201通過接口裝置203從用戶接收興趣信息,產(chǎn)生用戶的個人簡況,將個人簡況存儲到簡況數(shù)據(jù)庫DB1內(nèi)。包括簡況的興趣附帶有通常用于描述用戶狀態(tài)環(huán)境的屬性,例如在家/在外、工作/玩。如上所述,索引生成器205用于對存儲在服務(wù)器IS1-IS4上的信息源編索引。
檢索引擎207包括狀態(tài)環(huán)境確定裝置209、第一檢索裝置211以及第二檢索裝置213。狀態(tài)環(huán)境確定裝置209從外部信息源接收與用戶U1有關(guān)的信息,例如,用戶位置、時刻,和來自日記的一個或者多個輸入,利用這些信息確定用戶U1的狀態(tài)環(huán)境。設(shè)置第一檢索裝置211用于從簡況編輯器201產(chǎn)生的個人簡況中檢索信息,這樣,一旦狀態(tài)環(huán)境確定裝置209確定了用戶的狀態(tài)環(huán)境,第一檢索裝置211就可以檢索與該狀態(tài)環(huán)境有關(guān)的興趣。第二檢索裝置213利用第一檢索裝置211檢索的與狀態(tài)環(huán)境有關(guān)的興趣來查詢索引生成器205并檢索對應(yīng)于這些查詢的信息源。
許多人擔心他們不信任的一些人對他們的用戶簡況的各方面進行訪問及操作。而且,好像許多用戶不希望自動的簡況改編,而寧愿完全控制任何簡況改變。但是,用戶密集的系統(tǒng),例如要求用戶改變其簡況的系統(tǒng),與開發(fā)代理是為了減少用戶的負荷的基于代理的系統(tǒng)的最終目的相反。
本發(fā)明主要涉及簡況編輯器201的各方面,用于根據(jù)各種外部輸入和來自用戶的反饋來修改用戶簡況的內(nèi)容。由系統(tǒng)建議改變,但是只在用戶允許時才有效。因此這就省去用戶直接修改簡況,而只是響應(yīng)用戶的允許進行改變。另外,對改變進行查看,因此如果發(fā)現(xiàn)一個改變不可接受,可以修改和/或者撤消它??梢栽谟脩艨蛇x擇的時間段上對改變進行查看,因此用戶能通知系統(tǒng)她沒有時間檢驗改變,從而重新設(shè)置查看時間。
這種個性化的信息檢索的安排,打破了用戶負荷和過分自動的簡況管理兩個突沖問題之間的平衡。
簡況編輯器201信息提供器200具有預(yù)定、有限數(shù)量的興趣,可以從這些興趣中選擇與用戶U1相關(guān)的興趣。這些興趣包括在下面的非窮舉的興趣種類列表中一般興趣例如,時事、金融、家庭、商務(wù)、休閑、愛好、俱樂部等;地址例如,家鄉(xiāng)、休假地、商務(wù)旅行、家里等。
存在一般興趣的“原版拷貝”,這些興趣通過連接符互連為一個非循環(huán)圖。將原版拷貝存儲到簡況數(shù)據(jù)庫DB1的數(shù)據(jù)庫表中。每個興趣(一般類型或位置類型)具有一個或者多個與興趣相關(guān)聯(lián)的預(yù)定關(guān)鍵字,而且還將這些關(guān)鍵字存儲到簡況數(shù)據(jù)庫DB1內(nèi)并鏈接到其相應(yīng)的興趣。(關(guān)鍵字用于檢索與用戶相關(guān)的信息,以下將對此做更詳細說明)。每個興趣具有唯一標識符(ID),而且非循環(huán)圖中的連接符將各興趣鏈接到一起(以便使興趣所包括的關(guān)鍵字至少部分地取決于其它哪個興趣鏈接到該興趣,以致例如興趣I1從其父興趣或子興趣那里繼承預(yù)定數(shù)量的關(guān)鍵字)。
設(shè)置簡況編輯器201以從用戶接收興趣信息,并產(chǎn)生包括用戶興趣和與其興趣有關(guān)的關(guān)鍵字的簡況。簡況編輯器201還可以根據(jù)預(yù)定規(guī)則隱式識別各興趣。
簡況的顯式修改用戶可以顯式輸入表示用戶的興趣的單詞和/或短語,由此,簡況編輯器201嘗試在原版拷貝中查找與該輸入匹配的興趣。這樣就需要通過非循環(huán)圖搜索該輸入與興趣之間的匹配,有可能的話可以使用WORDNET(詞法參考系統(tǒng))或者類似系統(tǒng)來擴大搜索。如果簡況編輯器201不能定位與輸入匹配的興趣,則用戶U1可以瀏覽這些興趣并手動選擇興趣。
簡況編輯器201還可以與語法分析器(未示出)配合將輸入的關(guān)鍵字和/或短語翻譯為一個或者多個預(yù)定興趣;許多已知系統(tǒng)可以對輸入進行語法分析并將語法分析的輸入翻譯為簡況編輯器201可以理解的格式。
此外,用戶還可以隨時訪問其簡況。因此,用戶可以看到其簡況,看到其例示狀態(tài)環(huán)境,直接修改其簡況,甚至修改用于根據(jù)簡況中的興趣檢索信息的信息源。
簡況的隱式修改簡況編輯器201可以包括一個或者多個與興趣互相相關(guān)的規(guī)則,因此,如果興趣A與興趣B鏈接在一起而且用戶U1具有興趣A,則簡況編輯器201將自動將興趣B包括在用戶的簡況中。規(guī)則還可以基于簡況編輯器201從其它用戶和/或外部信息源檢索的信息。后者尤其可以用于對用戶提供與服務(wù)有關(guān)的信息-例如,如果信息源IS1-IS4之一包括與銀行有關(guān)的信息,則信息提供器200就可以將與銀行有關(guān)的信息傳送到用戶。然而,為了傳送與用戶相關(guān)的與銀行有關(guān)的信息,信息提供器200需要知道用戶U1在哪個銀行開戶了。顯然,用戶U1可以顯式輸入該信息,但是如果不直接需要用戶操作就可以取出該信息,則這可能對用戶U1非常方便。為此,可以進一步設(shè)置簡況編輯器201與萬維網(wǎng)瀏覽器(未示出)配合,萬維網(wǎng)瀏覽器位于用戶U1使用的每個終端T1、T2和T4上。具體地說,簡況編輯器201可以將用于網(wǎng)站跟蹤的軟件下載到終端T1、T2、T4的硬盤驅(qū)動器上。假定用戶U1“在線”進行銀行交易,則下載的軟件可以訪問用戶銀行的URL,而且簡況編輯器201可以根據(jù)此檢索銀行名稱,將其添加到位于簡況數(shù)據(jù)庫DB1中的用戶簡況中。作為一種選擇,如果簡況編輯器201訪問了用戶使用的第三方服務(wù)和/或系統(tǒng)的計費信息,則可以設(shè)置簡況編輯器201從與第三方有關(guān)的計費系統(tǒng)請求銀行詳情。第三方系統(tǒng)可以位于網(wǎng)絡(luò)N1-N4之一上。用戶U1可以不考慮隱式推斷的任何興趣。
設(shè)置簡況編輯器201以對每個興趣標記一個狀態(tài)環(huán)境類型。盡管可能有許多其他的狀態(tài)環(huán)境類型,在本實施例中,描述了兩類狀態(tài)環(huán)境,即狀態(tài)(state)和位置(situation)。在其最簡單形式中,這些狀態(tài)環(huán)境類別有兩種狀態(tài)“狀態(tài)環(huán)境”有工作和玩,而位置狀態(tài)環(huán)境有在家和在外。對于每類狀態(tài)環(huán)境,某些興趣可以被標記兩種狀態(tài)環(huán)境-例如,用戶U1可能對利用計算機進行工作和玩感興趣??梢燥@式或隱式輸入狀態(tài)環(huán)境類型,而且可以利用缺省狀態(tài)環(huán)境類型標記每個興趣。
簡況的存儲在為用戶U1選擇一個興趣時,簡況編輯器201將對應(yīng)于該興趣的ID的標識符與該興趣在樹形分層結(jié)構(gòu)中的位置一起輸入到用戶U1的數(shù)據(jù)庫表中。在將數(shù)據(jù)存儲到數(shù)據(jù)庫、在數(shù)據(jù)庫中查詢數(shù)據(jù)以及從數(shù)據(jù)庫接收數(shù)據(jù)的過程中所需的處理過程對于數(shù)據(jù)庫管理技術(shù)領(lǐng)域內(nèi)的普通技術(shù)人員是公知的。關(guān)于地名興趣,例如UK的地名,存在地名的“原版拷貝”,它們分別附帶郡信息,而且利用從原版拷貝檢索的國家/郡/地點動態(tài)創(chuàng)建對于地名的興趣。
可以將興趣與諸如股票價值和位置的屬性一起存儲。設(shè)置股票價值屬性表示用戶U1對特定興趣的股票價值感興趣(例如,興趣可以是一家公司)。設(shè)置位置屬性表示用戶U1對與興趣有關(guān)的位置信息感興趣(例如,興趣可以是銀行,使得規(guī)定諸如Bognor Regis的位置屬性精確確定了對位于Bognor Regis的銀行的興趣。)其它屬性包括技能、隱私、相關(guān)性權(quán)重、優(yōu)先級權(quán)重、時間、日期、信息量、發(fā)送信道、布局、信息源質(zhì)量以及書簽。存在每個屬性的缺省設(shè)置,但是用戶U1可以通過接口裝置203(以下說明)改變其中任何一項設(shè)置。
簡況編輯器201還可以將問題“推”到用戶U1-例如根據(jù)預(yù)定規(guī)則對用戶建議興趣。預(yù)定規(guī)則包括隱式簡況編輯(例如通過集群分析,卡嗒流,協(xié)作過濾等)、興趣非循環(huán)圖的改變、系統(tǒng)管理員發(fā)出的信息以及用戶U1提供的反饋。簡況編輯器201監(jiān)測用戶對問題的響應(yīng),并根據(jù)該響應(yīng)修改規(guī)則。
因此,參考圖3,簡況編輯器201優(yōu)選還包括簡況修改器301,它用于從多種輸入311,313,315,317,319(例如,協(xié)作過濾的輸出、系統(tǒng)興趣等的改變,或者用戶U1的反饋)中接收信息并根據(jù)這些輸入302創(chuàng)建動作305。這些輸入可以附帶有諸如將信息推到用戶U1的時間、與興趣類型有關(guān)的優(yōu)先級狀態(tài)等條件。簡況修改器301訪問預(yù)定的函數(shù)列表F1…Fn,并根據(jù)輸入302的性質(zhì)和相應(yīng)條件,選擇函數(shù)之一以創(chuàng)建動作305。存儲在該列表內(nèi)的各函數(shù)包括“用戶交互函數(shù)”,包括用于激活建議和問題以提示用戶的功能(利用問題類型限定);以及興趣的“系統(tǒng)函數(shù)”,包括用于添加新興趣、刪除參考興趣、修改參考興趣等的功能?!坝脩艚换ズ瘮?shù)”包括通過接口裝置203將信息推到用戶,并且可以利用包括“在試驗中”和“回復(fù)原始設(shè)置”等的問題類型來標記“用戶交互函數(shù)”,而且可以根據(jù)請求的優(yōu)先級將“用戶交互函數(shù)”發(fā)送到用戶?!跋到y(tǒng)函數(shù)”包括對存儲的用戶簡況實施變更。在以下例子中說明簡況編輯器201的該進一步功能通過對各用戶之間的興趣進行協(xié)作過濾,將興趣I1送到簡況修改器301。簡況修改器301創(chuàng)建建議動作305,該建議是應(yīng)該把新興趣I1添加到用戶簡況,而且,因為該興趣是新興趣,所以簡況修改器301對該建議指定低優(yōu)先級條件。然后,將建議動作305推到用戶U1。通常,還利用“在試驗中”來標記新興趣,以致推到用戶U1的消息的內(nèi)容為“我們認為你可能有意將新興趣I1添加到你的簡況內(nèi)。
這樣做的效果是使象Story1、Story2、Story3的故事返回你愿意將興趣I1添加到你的簡況中嗎?請回答是、否、我試驗一個星期”。
簡況修改器301還可以從用戶U1接收響應(yīng)。如果用戶選擇選項“我試驗一個星期”,則將一個消息發(fā)送到簡況修改器301,簡況修改器301識別反饋的類型,存儲該消息并根據(jù)創(chuàng)建用于用于提示某個用戶反饋的動作的定時器條件。一旦定時器過期,簡況修改器301就產(chǎn)生反饋動作305用于進行反饋,關(guān)閉定時器以及從簡況修改器301中刪除該消息。推到用戶的消息的內(nèi)容為“上個星期RF建議將興趣I1添加到你的簡況中。
你保持此變更嗎?請回答是或否(如果你的回答是否,則將回復(fù)到你的原始設(shè)置)”簡況修改器301接收用戶U1的反饋,識別反饋的類型。如果反饋包括改變用戶簡況,則根據(jù)系統(tǒng)函數(shù)產(chǎn)生系統(tǒng)動作305,并修改簡況,如上所述。
另選地,簡況修改器301可以監(jiān)視用戶訪問與建議的興趣I1有關(guān)的信息的次數(shù),并且如果該次數(shù)超過一個閾值,簡況修改器301將生成一個自動將興趣I1加到簡況中的系統(tǒng)動作305。而且,簡況修改器301能識別用戶訪問與興趣I1有關(guān)的信息的時間、位置、并把其作為興趣I1的狀態(tài)環(huán)境信息來存儲。然后,當把興趣I1加到簡況中時,簡況修改器301還用存儲的狀態(tài)環(huán)境信息標記該興趣。
而且,或者另選地,為了監(jiān)視用戶訪問與建議的興趣I1有關(guān)的信息的次數(shù),設(shè)置簡況修改器301以監(jiān)視用戶訪問與建議的興趣I1有關(guān)的信息的方式。只有他們的訪問行為的各方面滿足特定的條件,簡況修改器301才把興趣I1加到簡況中。例如,條件可以是用戶訪問信息至少2分鐘,或者用戶在3天中至少每天5次訪問與興趣有關(guān)的信息。正如本技術(shù)領(lǐng)域普通人員所知,這些訪問模式可以有許多形式。
其它的輸入319包括系統(tǒng)管理員的輸入——例如用戶喜歡接收信息的終端格式。
簡況修改器301還包括用于存儲用戶U1的反饋,特別是用于保持列出了用戶U1不感興趣的各興趣310(例如,列在刪除興趣列表上)的興趣列表的裝置。因此,每當接收關(guān)于一個新興趣的輸入時,簡況修改器301將新興趣與刪除興趣310列表進行比較(而且不對刪除興趣創(chuàng)建動作)。除了對輸入的輸入與刪除興趣進行嚴格比較外,對于刪除列表內(nèi)的興趣,簡況修改器301還可以訪問詞法WORDNET或者類似系統(tǒng),將新請求與WORDNET識別為與刪除興趣等效的項目進行比較。
在另一個的實施例中,簡況修改器301只在確信興趣與用戶有關(guān)時,才創(chuàng)建用戶交互函數(shù)。因此對每個潛在的新興趣,簡況修改器301估計確信度值,并與確信度閾值比較。如果確信度值大于確信度閾值,如上所述,簡況修改器301生成用戶交互函數(shù)(如建議動作)。這在圖3中示出,其中確信度值321與各輸入311,313,315,317,319相關(guān)聯(lián)。
如果通過例如群集或者過濾等統(tǒng)計技術(shù),識別出一個新興趣,則可以根據(jù)群集中使用的數(shù)據(jù)來估計確信度值。例如,如果用群集分析識別了一個興趣,則可以估計出在群集內(nèi)點的標準偏差,并用來獲得與群集分析相關(guān)聯(lián)的確信度值。
接口裝置203接口裝置203控制用戶U1與信息提供器200之間的信息通信。如圖1所示,通過3個終端T1、T2和T3之任一個,用戶U1可以例如與位于終端T3的信息提供器200通信。可以設(shè)置兩個終端T1和T2以利用WML發(fā)送和接收數(shù)據(jù)(終端T1和T2分別具有藍牙發(fā)送與接收裝置,因此終端T2可以接收通過終端T1接收的信息),而且可以設(shè)置第三終端T4以利用HTML發(fā)送和接收數(shù)據(jù)。終端T1、T2和T4均可以運行萬維網(wǎng)瀏覽器。在已知的方式中,用戶通過瀏覽器上的表單輸入數(shù)據(jù),以執(zhí)行下列動作,包括(非窮舉列表)修改構(gòu)成用戶簡況的興趣;修改用戶的狀態(tài)環(huán)境;觀看推到用戶的項目;以及選擇推到用戶的項目。
該表單基本上可以捕獲用戶輸入的任何參數(shù),并將捕獲的參數(shù)發(fā)送到存儲在狀態(tài)T3上的信息提供器200的其它部分。關(guān)于進一步信息,請參考“Client/Server Programming with Java and Corba”,2ndEdition,R.Orfali and D,Harkey,pp.239-242。
在用戶U1對用戶簡況顯式添加或者刪除興趣時,該表單將該興趣與關(guān)于該興趣將執(zhí)行的動作(例如,添加、刪除)一起提供到簡況編輯器201,簡況編輯器201如上所述對該信息進行處理。該表單可以包括下拉式菜單等,以便用戶在預(yù)定列表中進行選擇,預(yù)定列表特別適用于定義電影、食品等方面的興趣,因為用戶U1可以選擇他感興趣的電影,或者可以選擇他感興趣的食品種類。
作為一種選擇或者附加地,可以對接口裝置203配置用于顯示候選列表和/或用于通過語音媒體與用戶U1交互的至少一部分的裝置(未示出)。
索引生成器205索引生成器205為存儲在信息源服務(wù)器IS1-IS4上的每個信息源創(chuàng)建索引,并將該信息存儲到索引數(shù)據(jù)庫DB2上的索引表中。每個索引表至少包括一些如下信息1.信息源的名稱(例如,文檔名稱)。
2.從信息源提取的關(guān)鍵項目。
3.信息源的網(wǎng)絡(luò)地址(URL)。
4.信息源的地區(qū)記錄。
5.創(chuàng)建信息源的日期和時間。
6.信息源的狀態(tài)環(huán)境屬性-即,是否與工作、玩、在家或者在外相關(guān)(可選)。
地區(qū)記錄是以緯度、經(jīng)度和高度確定的位置,是一個定義該記錄有效的地區(qū)的三維形狀,所定義的位置在三維形狀的中心??梢苑謩e配置與各信息源相關(guān)聯(lián)的地區(qū)。因此,用戶可以在較大范圍內(nèi)容易地訪問某些信息(例如氣象信息),而對于除了狹窄定義的地區(qū)以外的所有區(qū)域,可以濾除更具位置特殊性的其它信息(例如,本地服務(wù)信息)。
索引生成器205索引的信息類型包括新聞數(shù)據(jù)、股市價單、Lycos、氣象數(shù)據(jù)、分類廣告、賽事指南、諸如電影院節(jié)目單的娛樂信息、逗留地點、用餐地點、體育、金融信息、例如商場導(dǎo)購的購物信息以及關(guān)于例如自動提款機位置、加油站位置的服務(wù)方面的信息。對非結(jié)構(gòu)化信息源建立索引的方法有多種,而且所采用的特定方法對于該實施例并不重要。因此,可以采用能夠根據(jù)上述定義的索引表檢索并存儲數(shù)據(jù)的任何裝置(請參考lan H.Written,Alistair Moffat Timothy C.Bell MorganKaufmann編寫的“Managing Gigabytes”;ISBN1558605703,來對當前在搜索和檢索技術(shù)中采用的多種方法有一個總覽)。索引生成器205以規(guī)則間隔訪問信息服務(wù)器IS1-IS4,以便該索引表是最新的(根據(jù)信息源的性質(zhì)以及它變化的速率可以是每日、每小時、每周)。
檢索引擎207檢索引擎207的功能是實時確定并例示用戶的狀態(tài)環(huán)境,以從簡況編輯器201檢索與例示的狀態(tài)環(huán)境相關(guān)聯(lián)的興趣并根據(jù)這些興趣利用索引生成器205從信息源IS1-IS4檢索信息。
在第一階段,檢索引擎207確定并例示用戶的狀態(tài)環(huán)境,第一階段由狀態(tài)環(huán)境確定裝置209執(zhí)行,并參考圖4進行說明。狀態(tài)環(huán)境確定裝置209包括用于定義每個狀態(tài)環(huán)境類型的可配置列表400-例如可以利用一個位置將HOME(在家)定義為緯度值和經(jīng)度值,可以將AWAY(在外)定義為離家大于n1 Km的任何位置。同樣,可以利用時間和位置來定義WORK(工作),可以利用時間和離開工作大于n2 Km的任何位置來定義PLAY(玩)。設(shè)置狀態(tài)環(huán)境確定裝置209以從例如日記401、時鐘403以及個人跟蹤裝置405之類的信息源接收輸入,并將這些輸入與預(yù)定列表內(nèi)的信息組合在一起以獲得用戶U1的狀態(tài)環(huán)境。圖4所示的例子僅是示意性示出可以與狀態(tài)環(huán)境確定裝置209合作的源的類型(以下給出更多例子)。
時鐘403可以是位于終端T3上的系統(tǒng)時鐘。日記401可以是Micorsoft OutlookTM日歷,或者客戶建立的日記,狀態(tài)環(huán)境確定裝置209可以在預(yù)定時間向其提交查詢,請求關(guān)于用戶的計劃動作的帶時間標記的數(shù)據(jù)。關(guān)于與OutlookTM連接的信息請參考“Programming MicrosoftOutlook and Microsoft Exchange”by Thomas Rizzo,Microsoft Press;ISBN0735605092。日記401中的各條目通常包括短語,需要將該短語進行語法分析以成為被狀態(tài)環(huán)境確定裝置209識別的格式;可以配置日記401以與語法分析器交互并相應(yīng)地翻譯各條目。
用戶U1攜帶個人跟蹤裝置405,并使其位置位于要跟蹤的通信環(huán)境內(nèi)。例如,在此實施例中,跟蹤裝置405包括載有用于識別用戶的數(shù)據(jù)的芯片承載卡或“智能卡”,并對承載讀卡器的一些或者所有終端T1-T5進行配置以讀取該卡。作為一種選擇,它可以包括“智能標志”轉(zhuǎn)發(fā)器,在建筑內(nèi)跟蹤其位置。具體地說,工作站T1-T4和蜂窩式電話T1攜帶這種智能卡讀取器。將其它智能卡讀取器安裝在建筑內(nèi)的入口門處,并將它們連接到LAN N3以在其上發(fā)送信號。此外,除了蜂窩式電話通信部件外,蜂窩式電話T1優(yōu)選包括全球定位系統(tǒng)(GPS)接收機,并對蜂窩式電話T1進行配置以周期性地獲得其位置并發(fā)送其位置信號,正如EP0467651(Motorola)所公開的那樣。作為一種選擇,蜂窩式電話T1可以附加地利用諸如采用差分GPS定位方法的陸基定位信號,或者單純利用諸如差分GSM三角測量信號的陸基定位信號進行定位。作為另一個選擇,用戶可以手動輸入他的位置。
一旦狀態(tài)環(huán)境確定裝置209從日記401、時鐘403和跟蹤裝置405以及其它這種裝置(未示出)采集了信息,就將該信息組合以例示用戶的狀態(tài)環(huán)境。作為例子,對于狀態(tài)環(huán)境工作/玩;在家/在外,參考圖5a定義該處理過程S5.1取當前時間(t)并與對工作預(yù)定義的時間段(time slots)進行比較(開始時間T1、結(jié)束時間T2、額定工作日)i.如果(T1<t<T2)而且日記信息與工作有關(guān),則狀態(tài)環(huán)境WORKii.如果(T1<t<T2)而且日記信息與玩有關(guān),則狀態(tài)環(huán)境PLAY(例如,休假日)iii.如果(t<T1或t>T2)而且日記信息與工作有關(guān),則狀態(tài)環(huán)境WORK(例如,在晚上工作)iv.如果(t<T1或t>T2)而且日記信息與玩有關(guān),則狀態(tài)環(huán)境PLAY(例如,晚上空閑)S5.2將位置數(shù)據(jù)轉(zhuǎn)換為緯度和經(jīng)度(Ii,Ij)并與家宅位置(Ioc1,Ioc2)進行比較(i)如果(Ioc1<Ii<Ioc1+n1)“與”(Ioc2<Ij<Ioc2+n1),則狀態(tài)環(huán)境HOME(ii)如果(Ii>Ioc1+n1)“或”(Ij>Ioc2+n1),則狀態(tài)環(huán)境AWAY使得S5.1(i或ii i)與S5.2(i)使WORK,HOME(W,H)為狀態(tài)環(huán)境S5.1(i或ii i)與S5.2(ii)使WORK,AWAY(W,A)為狀態(tài)環(huán)境S5.1(ii或iv)與S5.2(i)使PLAY,HOME(P,H)為狀態(tài)環(huán)境S5.1(ii或iv)與S5.2(ii)使PLAY,AWAY(P,A)為狀態(tài)環(huán)境除了關(guān)于狀態(tài)和位置例示用戶的狀態(tài)環(huán)境外,可以確定附加狀態(tài)環(huán)境信息,例如“外部”、“有壓力的”、“忙著”等。下面1-7點列出的裝置(圖5b示出其中一些裝置)的輸入可以用于識別此附加的狀態(tài)環(huán)境信息。也可以如下面詳述的那樣,用這些附加的狀態(tài)環(huán)境信息來確定是否把信息推給用戶。這些設(shè)備可以包括1.來自用戶的信息用戶U1可以使用預(yù)定鍵,或者鍵序列通過終端T1表示他正在分神或者在移動中;2.氣象信息;3.光能級檢測器,例如可以從Remote Measurement Systems 2633Eastlake Ave E,Suite 20,Seattle WA 98102獲得的光電檢測裝置(例如PVC-1裝置)4.熱電偶傳感器,例如可以從TC Ltd(TC Ltd,P.O.Box 130,UXBRIDEG UB8 2YS,England)獲得的溫度指示器-有助于確定用戶U1是在外部還是在內(nèi)部;5.代表壓力水平的輸入-例如監(jiān)測體溫或者用戶與其終端T1、T2、T4的交互。本申請人的第WO00/25565號專利申請公開對監(jiān)測用戶/終端交互的方法進行了披露(IPD案號A25709);6.代表噪聲電平的輸入-可以通過分析利用終端T1上的音頻輸入接收的音頻信號來確定;7.來自附加物理傳感器的輸入,這些傳感器通過串行接口(未示出)連接到終端T1,包括來自如下的輸入低加速度檢測器501(例如,ADXL202,用于測量兩個方向上的小作用力產(chǎn)生的加速度);高加速度檢測器503(ACH04-08-05,可以從MeasurementSpecialties Incorporated(可以通過因特網(wǎng)上的統(tǒng)一資源定位地址(URL)http//www.msiusa.com查詢)),它用于測量3個方向上的大作用力產(chǎn)生的加速度;方向檢測器505(例如,指南針、HMC2003,可以從Honeywell獲得(可以通過URL http//www.ssechoneywell.com查詢),用于給出終端T1方向的絕對測量值);以及方向與速度檢測器507(采用可以從Murata ManufacturingCompany Ltd.(URL http//www.murata.com)獲得的ENC壓電振動陀螺儀(以GYROSTAR注冊商標銷售的部件號S42E-2))。加速度檢測器、方向檢測器以及速度檢測器可以通過復(fù)用器509(MUX)連接到狀態(tài)環(huán)境確定裝置213。
物理數(shù)據(jù)的復(fù)雜性使得利用簡單規(guī)則從所有這些輸入中確定用戶的狀態(tài)環(huán)境是不可靠的。在根據(jù)輸入1-7的組合例示狀態(tài)環(huán)境時,可以利用隱藏馬爾可夫模型(HMM),或卡爾曼濾波器更準確地確定用戶的狀態(tài)環(huán)境。du Plessis,R.M.1967“Poor man’s explanation of KalmanFilter or How I stopped worrying and Learned to Love Matrixinversion”對卡爾曼濾波器的結(jié)構(gòu)和應(yīng)用進行了很好的說明。
第二階段-在第二階段,檢索引擎207從簡況編輯器201檢索與用戶例示的狀態(tài)環(huán)境相關(guān)聯(lián)的興趣,由第一檢索裝置211執(zhí)行第二階段,第一檢索裝置211將關(guān)于用戶例示的狀態(tài)環(huán)境的請求提交到簡況編輯器201。簡況編輯器201查詢簡況數(shù)據(jù)庫DB1,數(shù)據(jù)庫DB1根據(jù)查詢檢索信息,并將與例示的狀態(tài)環(huán)境有關(guān)的興趣返回第一檢索裝置211。例如,如果例示的狀態(tài)環(huán)境是工作、玩,數(shù)據(jù)庫DB1搜索標記有W,P的興趣。
第三階段-在第三階段,檢索引擎207從信息源IS1-IS4檢索與用戶的例示興趣有關(guān)的信息,由第二檢索裝置213,如圖6所示執(zhí)行此第三階段。
第二檢索裝置213執(zhí)行以下步驟·S6.1從第一檢索裝置211接收例示興趣數(shù)據(jù);·S6.2選擇含有與信息源有關(guān)的數(shù)據(jù)的索引表之一,并且例如利用關(guān)鍵字匹配,檢驗例示的興趣與索引關(guān)鍵字之間的對應(yīng)性;·S6.3對于肯定的關(guān)鍵字匹配,檢索網(wǎng)絡(luò)地址(URL)和信息源的名稱;·S6.4對利用索引生成器205編了索引的所有信息源重復(fù)S6.2和S6.3;·S6.5將在S6.3檢索的網(wǎng)絡(luò)地址(URL)和信息源的名稱編譯為候選列表中的項目。
在另選實施例中,第一檢索裝置211檢索所有用戶興趣。然后,利用對興趣標記的狀態(tài)環(huán)境屬性,例如足球P(玩),H(玩,在家);計算機W,P(工作,玩),第二檢索裝置213根據(jù)用戶的例示狀態(tài)環(huán)境對候選列表上的項目進行等級評定。然后根據(jù)評定的等級組織在S6.4創(chuàng)建的候選列表上的各項目,以便將與用戶的例示狀態(tài)環(huán)境最相關(guān)的項目設(shè)置到候選列表的頂部。
在對例如2千兆字節(jié)左右或者更多字節(jié)數(shù)據(jù)的相當大的數(shù)據(jù)量編索引時,當前硬件的能力意味著有本發(fā)明可能根據(jù)第一實施例進行操作(即只檢索關(guān)于例示興趣的數(shù)據(jù))。在這種情況下,可以設(shè)置第二檢索裝置213以在稍后(預(yù)定)時間檢索與例示興趣以外的興趣有關(guān)的信息。
可以將候選列表存儲到數(shù)據(jù)庫DB1,并創(chuàng)建候選列表頁面視圖(例如,創(chuàng)建包括候選列表數(shù)據(jù)的HTML/WML頁面視圖),用于通過接口裝置203傳送到用戶U1。
可以設(shè)置接口裝置203以預(yù)定間隔從數(shù)據(jù)庫DB1接收候選列表頁面視圖,并傳送該數(shù)據(jù)以顯示在用戶終端T1、T2、T4上。在一種配置中,從第二檢索裝置213請求候選列表頁面視圖,并將候選列表頁面視圖從第二檢索裝置213傳送到接口裝置203。如上所述,評定為最高等級的項目被顯示在該候選列表的頂部。用戶U1可以選擇候選列表上的任何一個項目,并將該選擇提供到第二檢索裝置213,第二檢索裝置213將關(guān)于數(shù)據(jù)的請求發(fā)送到項目內(nèi)的URL。然后,對用戶U1顯示從URL返回的數(shù)據(jù)。
在一些例子中,用戶U1的例示狀態(tài)環(huán)境可以表示不安排用戶U1接收信息。例如,用戶U1可能正在旅行、在開會、疲勞、處于不好的照明環(huán)境下等,在此情況下很難對該信息作出響應(yīng)。在這些狀況下,第二檢索裝置203可以暫停發(fā)送信息直到確定用戶的狀態(tài)環(huán)境更適于接收信息為止。因此,配置第二檢索裝置213以從狀態(tài)環(huán)境確定裝置209接收表示用戶的例示狀態(tài)環(huán)境的輸入,并將其與預(yù)定信息提供規(guī)則進行比較,例如IF(狀態(tài)環(huán)境==疲勞)OR(狀態(tài)環(huán)境==在外)OR(狀態(tài)環(huán)境==亮度低)OR(狀態(tài)環(huán)境包括旅行)等。
THEN(設(shè)置定時器(X分鐘)以檢驗X分鐘之后的狀態(tài)環(huán)境)其中X是預(yù)定義的ELSE(將信息發(fā)送到用戶)顯然,還可以采用其它形式的規(guī)則。
簡況的修改上述說明的實施例根據(jù)用戶的例示狀態(tài)環(huán)境對在用戶的候選列表上的項目進行等級評定,以便首先對用戶U1顯示與例示興趣有關(guān)的項目。除了狀態(tài)環(huán)境信息外,還將諸如相關(guān)性、重要性等的偏好屬性(如上所述)作為因子引入到評定過程中。然而,有可能用戶U1習慣性地忽略與特殊興趣有關(guān)的信息(尤其對于基于規(guī)則隱式導(dǎo)出的興趣是可能的(請參考如下例子))。
如圖7所示,信息提供器200可以進一步包括監(jiān)視裝置701,監(jiān)視裝置701用于觀察用戶U1訪問候選列表上的項目的方式,并相應(yīng)地修改用戶興趣的屬性。監(jiān)視裝置701最好包括貝葉斯網(wǎng)703,而且與第二檢索裝置213配合。如圖8所示,將候選列表上的項目輸入到貝葉斯網(wǎng)703,以計算與對應(yīng)于這些項目的興趣相關(guān)聯(lián)的優(yōu)先級。在本技術(shù)領(lǐng)域內(nèi)眾所周知,貝葉斯網(wǎng)考慮歷史數(shù)據(jù)的因果關(guān)系來調(diào)整事件發(fā)生的先驗概率。“Artificial Intelligence-A Modern Approach”by S.Russell and P.Norvig,Prentice Hall,USA對貝葉斯網(wǎng)進行了討論。
根據(jù)觀察用戶U1如何處理候選列表上的項目,貝葉斯網(wǎng)703可以修改偏好屬性。例如,候選列表上位置高的項目表示出該信息源與用戶相關(guān)。然而,在實踐中,用戶可能選擇在這天中的稍后時候訪問與該興趣有關(guān)的信息。如果情況是這樣,監(jiān)視裝置701利用貝葉斯網(wǎng)703修改偏好屬性,以致與該興趣有關(guān)的項目在下一次出現(xiàn)在候選列表上時,監(jiān)視裝置701可以預(yù)測用戶U1將要如何處理它,并相應(yīng)地將此作為因素引入該興趣的評定。
除了如上所述隱式修改用戶簡況外,還可以進一步配置第二檢索裝置213以從簡況修改器301接收信息。如上所述,簡況修改器301可以將問題推到用戶U1,請求信息源的顯式評定-例如,可以向用戶U1給出-2至+2的等級,而且要求用戶指示特定信息源與它們的相關(guān)程度。通常,如果用戶返回一個高分,則對于與該信息源有關(guān)的興趣,第二檢索裝置213降低相關(guān)性偏好屬性的閾值,相反,如果用戶返回一個低分,則第二檢索裝置213提高相關(guān)性閾值。
如果用戶繼續(xù)對已經(jīng)為一個興趣識別的信息源指定低分,則可能表示與該興趣相關(guān)聯(lián)的關(guān)鍵字需要修改。系統(tǒng)管理員或者顯式地修改關(guān)鍵字,或者提示用戶建議一些關(guān)鍵字??梢酝ㄟ^反饋來監(jiān)測用戶對修改的關(guān)鍵字的響應(yīng),提供用于改善針對一個興趣的關(guān)鍵字質(zhì)量的手段。
數(shù)據(jù)存儲信息提供器200能夠?qū)υS多用戶提供信息,而且,在用戶每次請求信息時(自動或者手動),基于每個用戶,對每個用戶產(chǎn)生候選列表頁面視圖。這樣將大量負載施加到信息提供器200的各種部件上,這可以通過對數(shù)據(jù)進行高速緩存數(shù)據(jù)來減少。目標是在高速緩存上僅一次創(chuàng)建要由用戶觀看的頁面(即,僅從其存儲地址請求一次數(shù)據(jù)),從而可以從該高速緩存發(fā)送該頁面的任何后續(xù)請求。這樣可以縮短請求-響應(yīng)鏈、改善響應(yīng)時間并降低網(wǎng)絡(luò)負載。
使用幾種高速緩存配置1.高速緩存每個用戶的候選列表上的項目。
每個用戶U1的候選列表上的項目最好由第二檢索裝置213進行后處理,以除去重復(fù)信息,而且,如上所述,在存儲到數(shù)據(jù)庫DB1之前,根據(jù)用戶的例示狀態(tài)環(huán)境,對各項目進行評定。通常,在候選列表上有大量項目,但是,因為終端顯示器的制約,每次只能對用戶顯示一個選擇。因此,需要將候選列表上的各項目高速緩存到內(nèi)容高速緩存(未示出)中,可以利用數(shù)據(jù)庫DB1上的存儲器提供該內(nèi)容高速緩存,因此不必對顯示給用戶的每個選擇進行上述后處理。
2.高速緩存包括候選列表上的項目的頁面視圖。
如上所述,通??梢岳肳ML/HTML(但是也可以采用其它格式,如下所述)創(chuàng)建包括候選列表數(shù)據(jù)的頁面視圖。利用HTTP檢索這些頁面視圖,HTTP是一種請求-響應(yīng)型協(xié)議,在其最簡單的配置中,是一個客戶機應(yīng)用,在此為檢索裝置213,將請求發(fā)送到服務(wù)器,在此為索引生成器205,然后,通過從內(nèi)容高速緩存中檢索數(shù)據(jù)并將它發(fā)送到第二檢索裝置213,索引生成器205響應(yīng)該請求。在此配置中(未示出),存在作為中介的高速緩存,因此檢索裝置213對該高速緩存發(fā)出請求(例如,請求一個顯示候選列表的頁面視圖),而非對索引生成器205發(fā)出請求。然后,該高速緩存代表檢索裝置213對索引生成器205發(fā)出請求。索引生成器205應(yīng)答該高速緩存,然后,該高速緩存將該應(yīng)答轉(zhuǎn)發(fā)到檢索裝置213(其將該信息傳送到接口裝置203)。每個頁面視圖均應(yīng)該遵循HTTP 1.1高速緩存規(guī)則(請參考“Illustrated guide to HTTP”,Paul Hethmon,ManningPublications Co.或者RFC 2616 Hypertext Transfer Protocol-HTTP/1.1.R.Fielding,J.Gettys,J.Mogul,H.Frystyk,L.Masinter,P.Leach,T.Berners-Lee.June 1999.(FormatTXT=422317,PS=5529857,PDF=550558 bytes)(Obsoletes RFC 2068)(Updted by RFC2817)(StatusDRAFT STANDARD));特別是以下內(nèi)容必須包括在頁面視圖的響應(yīng)首部內(nèi)(i)期滿首部,具有HTTP日期;(ii)高速緩存控制max-age=sec tag,說明內(nèi)容的壽命(iii)內(nèi)容長度響應(yīng)首部(還允許持續(xù)連接)在一種配置中,對網(wǎng)絡(luò)地址(URL,索引表內(nèi)的項目3)預(yù)附加用戶的會話ID,而且,通過會話ID的改變(例如改變用戶簡況、更新信息源等)來控制高速緩存的操作(當修改用戶的簡況(例如,添加興趣)時,則被高速緩存的頁面視圖過期(因為頁面視圖中的內(nèi)容過期);為了防止將這些舊頁面發(fā)送到用戶U1,變更會話ID)。因此,一旦改變了會話ID,則觸發(fā)高速緩存以從索引生成器205請求新數(shù)據(jù)(如果使用類型1高速緩存,索引生成器205從內(nèi)容高速緩存檢索數(shù)據(jù))。
3.高速緩存所有用戶的查詢結(jié)果。
如果存在大量用戶,則有些興趣可能重復(fù)-即,用戶U1的一些興趣與用戶U2的興趣相同(盡管在各用戶之間對興趣標記的狀態(tài)環(huán)境屬性不同),因此,對于同一個查詢進行許多次是沒有效率的。
現(xiàn)在研究對關(guān)于用戶U1的興趣I1…In進行查詢(假定之前還未進行過此查詢)。
·根據(jù)圖6,第二檢索裝置213檢索(步驟S6.3)與用戶例示狀態(tài)環(huán)境相關(guān)的信息源所對應(yīng)的URL和信息源名稱。將其存儲到查詢高速緩存中,可以利用數(shù)據(jù)庫DB1上的存儲器提供該查詢高速緩存(未示出)。
·將與興趣I1…In有關(guān)的關(guān)鍵字散列,存儲到例如一個文件等中,并鏈接到查詢高速緩存內(nèi)的相應(yīng)標識符。
·在關(guān)于(例如用戶U2的)興趣J1…Jn的新查詢到達時,將對應(yīng)關(guān)鍵字與散列關(guān)鍵字進行比較以識別是否已經(jīng)對這些興趣進行了查詢。
·如果進行了查詢,則○第二檢索裝置213不必對興趣J1…Jn進行查詢,而且○將興趣J1…Jn鏈接到查詢高速緩存內(nèi)的被識別項目。
可以對查詢的請求時間以及用戶群中的通用度進行監(jiān)測,使得可以在預(yù)定時間自動對被確定在特定時間間隔內(nèi)頻繁發(fā)生的請求進行查詢。
下面的工作實例說明了信息提供器200的功能假定用戶具有包括下列幾組興趣的用戶簡況移動因特網(wǎng)(工作)WAP(工作、玩)Durlacher(工作)汽車運輸(工作,在家)電視節(jié)目單(在家,玩)野鳥習性觀察(玩)出去吃飯(昂貴食物)(玩)
足球-Startreck United(玩)Tattingstone White Horse(玩,在家)在08:00點,在上班途中時,用戶U1接收通知其在Martlesham附近發(fā)生局部交通延誤的SMS告警。用戶不顧該報告,繼續(xù)前進并因交通堵塞而受阻。用戶U1感到煩悶,決定通過其WAP電話從信息提供器200觀看新聞。用戶滾動第二檢索裝置213發(fā)送的候選列表,并標記他隨后希望閱讀的感興趣新聞。缺省情況下,對用戶U1顯示與工作有關(guān)的興趣,因為狀態(tài)環(huán)境確定裝置209已經(jīng)確定了用戶要工作的狀態(tài)環(huán)境。然而,存在到與休閑有關(guān)的興趣的鏈接。
用戶U1有一個在09:00點會見Durlacher的會議安排。用戶U1已經(jīng)將與Durlacher興趣有關(guān)的信息設(shè)置為高優(yōu)選值,因此候選列表在其頂部包括與Durlacher有關(guān)的信息。幸運的是,與Durlacher有關(guān)的新聞文章的描述出現(xiàn)在候選列表中,因此用戶U1可以在09:00點開會之前閱讀該文章。
在這一天的晚些時候,在用戶U1坐在辦公桌前感到有些煩時,開始考慮晚上的活動。用戶U1將狀態(tài)環(huán)境變更為玩/在家的狀態(tài)環(huán)境,因此,對用戶U1顯示包括該晚的電視節(jié)目、有關(guān)其足球隊的新聞以及下一次野鳥習性觀察活動的通知在內(nèi)的各項目的候選列表。
在周末,用戶U1參觀Norwich。根據(jù)用戶的銀行業(yè)務(wù)細節(jié),簡況編輯器201包括了關(guān)于NatWest自動提款機位置的興趣,而且根據(jù)用戶的汽車運輸興趣,簡況編輯器201包括了關(guān)于加油站位置的興趣。對所有狀態(tài)環(huán)境(在該實施例中對工作、在家、玩、在外)添加這兩個隱含興趣。狀態(tài)環(huán)境確定裝置209確定用戶的狀態(tài)環(huán)境為在外和玩,而且根據(jù)跟蹤裝置405確定的用戶位置,第二檢索裝置213檢索詳細說明位于Norwich附近的昂貴餐館、NatWest自動提款機以及加油站的位置的信息。
其它細節(jié)和修改狀態(tài)環(huán)境變更在上述說明中,利用狀態(tài)環(huán)境確定裝置209確定用戶U1的狀態(tài)環(huán)境,并利用該信息評定候選列表上的數(shù)據(jù)。然而,用戶U1可能希望觀看與不同于他目前的狀態(tài)環(huán)境的狀態(tài)環(huán)境有關(guān)的信息。例如,如果用戶U1在工作,他可能希望閱讀與其足球隊(Startreck United)有關(guān)的新聞。該興趣足球很可能附帶有狀態(tài)環(huán)境玩、在家或玩,在外。假定設(shè)置信息提供器200以檢索僅與用戶的例示狀態(tài)環(huán)境有關(guān)的信息,則用戶U1必須顯式地改變狀態(tài)環(huán)境以觀看此信息。因此,顯示在(終端T1、T2、T4之任一上的)瀏覽器上的表單包括通過輸入獲得狀態(tài)環(huán)境的時間或者通過顯式地輸入新狀態(tài)環(huán)境,來輸入改變狀態(tài)環(huán)境的請求的手段。如上所述,在接口裝置203提供該表單時,將新狀態(tài)環(huán)境信息發(fā)送到第一檢索裝置211,并禁止來自狀態(tài)環(huán)境確定裝置209的輸入。
也可包括不同類型的狀態(tài)環(huán)境——如朋友/家人,可以用工作日和周末來分類所有這些狀態(tài)環(huán)境(因為周末的休閑活動可能不同于工作日的休閑活動)。
對用戶類型的分類在用戶U1第一次加入該系統(tǒng)時,在其瀏覽器上對用戶U1顯示的表單可以包括多個下拉式菜單和包括用戶可以選擇的興趣的列表。作為一種選擇,或者附加地,該表單可以包括用戶類型的描述,而且用戶U1可以指出他是哪種用戶。例如,可以存在幾個鞋子按鈕·拖鞋按鈕·高跟鞋按鈕·時尚軟運動鞋按鈕·布行鞋按鈕·牛仔鞋按鈕等。
其中每個按鈕分別具有對其附加的預(yù)配置的興趣列表,而且,在選擇其中一個按鈕后,對用戶U1指定所有相應(yīng)的興趣。
作為按鈕的一種選擇或者附加,提示用戶U1選擇這些按鈕中最能代表他們的按鈕??梢耘渲煤啗r編輯器201以保持用戶對按鈕類型的列表,而且對類似類型用戶之間的興趣數(shù)據(jù)進行某種協(xié)作過濾和隱式過濾。
數(shù)據(jù)的格式可以概括信息,并將信息發(fā)送到各種裝置,而且可以將信息優(yōu)化為各種格式。這些格式包括但并不局限于HTML、WML、I-模式(cHTML)、VxML、XML、Postscript、PDF。這些裝置包括但并不局限于PC,移動電話、PDA、其它通信裝置、游戲控制臺、機頂盒、多媒體公用電話、可攜帶計算機、FAX以及印刷的硬拷貝。
可以根據(jù)要求將信息發(fā)送到用戶U1,或者對用戶U1告警。告警可以采用許多種機制,包括但并不局限于電子郵件、因特網(wǎng)推業(yè)務(wù)、SMS、WAP推業(yè)務(wù)、話音。
索引生成器205編數(shù)據(jù)索引的過程包括本地源和遠程源,本地源和遠程源被保持的格式包括但并不局限于XML、HTML、WML、CHTML、純文本、RTF以及語音。
用于發(fā)送數(shù)據(jù)的網(wǎng)絡(luò)進一步包括UMTS、GPRS分組交換移動通信網(wǎng)。
隱式修改簡況的例子交通信息假定用戶U1已經(jīng)對狀態(tài)環(huán)境工作和在家顯式地規(guī)定了在摩托車運動、運輸以及轎車等方面的興趣,而簡況編輯器201包括一個規(guī)定“如果用戶的興趣在機動車方面,則包括交通報道方面的興趣”的規(guī)則。根據(jù)上述說明,將修改用戶簡況以包括興趣交通。假定進一步自動配置信息提供器200以在每天08:30對用戶U1發(fā)送信息。狀態(tài)環(huán)境確定裝置209確定用戶在去上班的路上(來自跟蹤裝置405的輸入指出用戶在移動,而且移動在使用戶靠近工作地址而且更遠離家宅;來自日記401和時鐘403的輸入確認用戶在去上班的路上)。第一檢索裝置211從用戶簡況中檢索與其例示狀態(tài)環(huán)境有關(guān)的信息,將此信息傳送到第二檢索裝置213,第二檢索裝置213對與用戶興趣相關(guān)的信息源的候選列表進行編輯,并將該候選列表發(fā)送到檢索引擎701和用戶終端T1。由于交通興趣與用戶當前狀態(tài)環(huán)境相關(guān),所以很可能與交通興趣相關(guān)聯(lián)的等級較高,因此,該興趣出現(xiàn)在該候選列表上的高位。然而,假定用戶選擇忽略交通興趣,則貝葉斯網(wǎng)703修改與交通相關(guān)聯(lián)的偏好權(quán)重,以致在第二天(假定確定用戶在同一個狀態(tài)環(huán)境中)應(yīng)用此修改的偏好權(quán)重,而且該興趣很可能出現(xiàn)在候選列表的更下面(實際位置取決于對權(quán)重的修改程度)。
修改偏好權(quán)重的程度可以依賴于忽略興趣的天數(shù),因此可以利用某種時間相關(guān)函數(shù)來計算權(quán)重。
信息提供器200的各方面,特別是存儲在數(shù)據(jù)庫DB1上的簡況信息可以在防火墻后工作,因此外部各方不能訪問簡況信息。作為一種選擇,整個系統(tǒng)可以在內(nèi)部網(wǎng)絡(luò)內(nèi),或者在安全網(wǎng)絡(luò)環(huán)境下運行,使得它與外部系統(tǒng)進行的唯一通信就是為了編索引而接收更新的信息源并與移動用戶通信。
本技術(shù)領(lǐng)域內(nèi)的熟練技術(shù)人員明白,可以以一個或者多個計算機程序來實現(xiàn)上述說明的本發(fā)明。可以將這些程序容納在各種傳輸和/或存儲介質(zhì)上,例如軟盤、CD-ROM或者磁帶,使得可以將該程序加載到一個或者多個通用計算機上,或者可以通過計算機網(wǎng)絡(luò),利用適當傳輸介質(zhì)下載該程序。
除非上下文明確要求,否則在說明書以及權(quán)利要求中,可以認為單詞“包括(comprise)”、“包括(comprising)”等應(yīng)理解為包含,而不是排他性的或者窮舉的意思,即“包括,但并不局限于”的意思。認為單詞“X包括Y”等表示X至少具有Y,但是很可能具有Y之外的其它要素。
權(quán)利要求
1.一種改變表示用戶感興趣的主題內(nèi)容的簡況的方法,該簡況包括多組與主題有關(guān)的數(shù)據(jù),該方法包括以下步驟(i)向用戶建議改變簡況的內(nèi)容,該建議包括一個或多個表示建議的改變的選擇項;(ii)從用戶接收一個或多個選擇項;(iii)根據(jù)每個選擇項修改用戶簡況;(iv)監(jiān)視用戶的修改動作;并且,如果用戶動作符合預(yù)定的條件,(v)根據(jù)每個選擇項永久地改變簡況。
2.根據(jù)權(quán)利要求1所述的方法,其中監(jiān)視步驟(iv)包括以下步驟提供給用戶至少一個進一步的選擇項;接收該每個進一步的選擇項;以及將每個進一步的選擇項與預(yù)定的條件比較。
3.根據(jù)權(quán)利要求2所述的方法,其中每個進一步的選擇項包括一個或多個表示在步驟(i)中所建議的建議改變的選擇項的確認。
4.根據(jù)前面任何一項權(quán)利要求所述的方法,其中監(jiān)視步驟(iv)包括以下步驟計算用戶訪問與該選擇項有關(guān)的信息的次數(shù),并且將所述數(shù)與閾值數(shù)比較。
5.根據(jù)前面任何一項權(quán)利要求所述的方法,其中監(jiān)視步驟(iv)包括以下步驟觀察與選擇項有關(guān)的用戶訪問的模式,并將觀察到的模式與一個或多個預(yù)定的模式比較。
6.根據(jù)前面任何一項權(quán)利要求所述的方法,其中監(jiān)視步驟(iv)以用戶可配置的頻率發(fā)生。
7.根據(jù)前面任何一項權(quán)利要求所述的方法,還包括在兩個或更多個用戶之間執(zhí)行比較分析和/或群集分析中的至少一種分析,并接收其輸出,該輸出提供至少一個表示建議的改變的選擇項。
8.根據(jù)權(quán)利要求7所述的方法,還包括評價與比較分析和/或群集分析的輸出相關(guān)聯(lián)的確信度值,并且根據(jù)與所述輸出相關(guān)聯(lián)的評價的確信度值,執(zhí)行基于所述輸出建議改變簡況內(nèi)容的步驟(i)。
9.根據(jù)權(quán)利要求7或8所述的方法,還包括把輸出與被認為與用戶無關(guān)的改變的列表比較,并且,如果輸出中的任何選擇項與列表中的任何項匹配,則從輸出中丟棄匹配的選擇項。
10.一種計算機程序,或者一套計算機程序,包括一組使一個計算機或者一組計算機執(zhí)行根據(jù)權(quán)利要求1至9中任何一項的方法步驟的指令。
全文摘要
本發(fā)明涉及一種改變表示用戶感興趣的主題內(nèi)容的簡況的方法,該簡況包括多組與主題有關(guān)的數(shù)據(jù)。本發(fā)明的方法包括以下步驟(i)向用戶建議改變簡況,該建議包括一個或多個表示建議的改變的選擇項,(ii)從用戶接收一個或多個選擇項,(iii)根據(jù)每個選擇項修改用戶簡況,(iv)監(jiān)視關(guān)于修改的用戶動作,并且,如果用戶的動作符合預(yù)定的條件,(V)根據(jù)每個選擇項永久地改變簡況。
文檔編號G06F13/00GK1476568SQ0181922
公開日2004年2月18日 申請日期2001年11月16日 優(yōu)先權(quán)日2000年11月20日
發(fā)明者伊恩·巴里·克拉布特里, 伊恩 巴里 克拉布特里, 亞歷山大·勞福勒, 大 勞福勒, 約翰 博萊因, 馬休·約翰·博萊因, 約瑟夫 奧多諾修, 約翰·約瑟夫·奧多諾修, 邁克爾 伯斯凱爾, 杰里米·邁克爾·伯斯凱爾, 約翰 蒂特馬斯, 理查德·約翰·蒂特馬斯 申請人:英國電訊有限公司