專利名稱:基于背景的內(nèi)容推薦的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及以電子方式獲取信息。更具體地,本發(fā)明涉及一種用于基于背景的內(nèi)
容推薦的方法和設(shè)備。 現(xiàn)有技術(shù)描述 在電子網(wǎng)絡(luò)中伴隨著找到信息的一個(gè)問題是關(guān)于人們怎樣盡快和盡可能有效地 與滿足他們需要的信息/產(chǎn)品/服務(wù)連接。這是自萬維網(wǎng)(Worldwide Web)開始以來,網(wǎng)頁 和搜索引擎的主要目標(biāo)之一。未能做到如此會導(dǎo)致在電子商務(wù)、電子旅行以及電子營銷站 點(diǎn)的情況下失去業(yè)務(wù),使電子支持站點(diǎn)上的顧客覺得沮喪,其有可能之后呼叫顧客支持,因 而浪費(fèi)了許多公司的金錢,使電子媒體站點(diǎn)上的觀眾/讀者失去興趣,其迅速放棄該站點(diǎn), 因此對于廣告收入、以及內(nèi)部網(wǎng)上的非生產(chǎn)性雇員喪失了機(jī)會。 網(wǎng)站設(shè)計(jì)是解決信息發(fā)現(xiàn)問題的人工嘗試以一種設(shè)計(jì)者設(shè)想會幫助用戶找到他 們正在尋找的信息的方式來組織信息。這種方式雖然在某些情況下有效,但是以這種方式 試圖找到信息常常是緩慢和低效的,因?yàn)橛脩舨扇≡谡军c(diǎn)上到處瀏覽以尋找他們需要的信 息。實(shí)際上,如果在三次點(diǎn)擊內(nèi),用戶沒有找到所尋找的信息,多數(shù)會放棄這個(gè)站點(diǎn)。 一個(gè) 問題是該站點(diǎn)是靜態(tài)的。最近幾年,作為緩解這個(gè)問題的嘗試,Web分析學(xué)已經(jīng)出現(xiàn)。設(shè)計(jì) 者可看到在他們的站點(diǎn)上發(fā)生的所有動作,并且將其收集在報(bào)告中,報(bào)告旨在提供怎樣更 有效地重新設(shè)計(jì)或重新配置站點(diǎn)的一些指導(dǎo)。這雖然提供了某些益處,但是所提供的信息 常常是含糊不清的,并且只提供用于改進(jìn)的提示而不是具體建議。在最好的情況下,這個(gè)進(jìn) 程也是乏味的,要求大量的人工精力,因?yàn)樵O(shè)計(jì)者要與認(rèn)知一致來重新設(shè)計(jì)站點(diǎn),并且需要 很長的時(shí)間。因而反饋環(huán)路是緩慢而低效的。
自動內(nèi)容推薦是在Web存在的非常早期出現(xiàn)的一種完全不同的策略。搜索引擎諸
如Google、Yaho0以及Ask是這種技術(shù)的常見代表。其基本思想是,用戶以搜索查詢的形式
明確描述他們正在尋找什么,而自動進(jìn)程嘗試識別最匹配他們的查詢的內(nèi)容片段,最經(jīng)常
的是一個(gè)Web頁。這種做法等于查看所有可能的文檔和推薦目標(biāo)查詢在文本中以最高頻率
發(fā)生的那些地方,即關(guān)鍵字匹配。這項(xiàng)基本技術(shù)的現(xiàn)代改編版本添加了復(fù)雜的層,例如自然
語言處理,但是這些方式的關(guān)鍵仍然是使用內(nèi)容自身的屬性,例如文檔中的詞,以確定最終
的關(guān)聯(lián)等級。這代表了內(nèi)容推薦的第一個(gè)以內(nèi)容為中心的階段(見
圖1)。 存在這種方式的許多變化,最顯著地,包括元標(biāo)記。在這種方式中,內(nèi)容創(chuàng)建者選
擇少量術(shù)語來描述該內(nèi)容。這些術(shù)語被嵌入該內(nèi)容中,常常作為HTML元標(biāo)記,但是不一定
對內(nèi)容的顧客可見。這是允許搜索引擎搜索不是基于文本的內(nèi)容的一種方式,如視頻剪輯。
這種方式在20世紀(jì)90年代末非常普遍,但是由于保持該元標(biāo)記為最新的以及與對內(nèi)容的修改同步所需要的巨大的精力,這種方式已經(jīng)不受歡迎。 在許多方面,這個(gè)第一個(gè)以內(nèi)容為中心的方法表面上很有意義,S卩,如果你想要推
薦內(nèi)容,考慮內(nèi)容自身。這種方式的一個(gè)關(guān)鍵問題是其常常帶回大量可能是相關(guān)的但是沒有用處的文檔。許多文檔可能展示出強(qiáng)烈的關(guān)鍵字匹配,但是已過時(shí)或沒有與用戶當(dāng)前的興趣真正相關(guān)。如果用戶在前幾個(gè)結(jié)果中沒有找到有用的結(jié)果,他們最有可能會放棄該搜索。 關(guān)鍵字匹配并不真實(shí)地反映我們在真實(shí)世界中怎樣最有效地找到信息。在每天的
日常生活中,找到我們正在尋找的信息/產(chǎn)品/服務(wù)的最好的方式是詢問知道以正確的方
向指點(diǎn)我們的人。因而內(nèi)容推薦的第二個(gè)階段將焦點(diǎn)從內(nèi)容轉(zhuǎn)移到用戶(見圖l)。 Google的"PageRank"算法,雖然我們把它放在階段1,但其實(shí)際上是一種關(guān)注階段2的到來的過渡技術(shù)。網(wǎng)頁等級算法的突破是不僅考慮網(wǎng)頁自身的內(nèi)容,而且考慮其由其他網(wǎng)站設(shè)計(jì)者從其他網(wǎng)頁怎樣被鏈接到。這代表了對網(wǎng)頁重要性的表決形式。因此,被更頻繁地鏈接到的網(wǎng)頁被看作是更有價(jià)值的。當(dāng)把人們帶入這種考慮時(shí),正在表決的人們是Web設(shè)計(jì)者,而非是內(nèi)容的消費(fèi)者,即用戶。內(nèi)容推薦的階段2全是關(guān)于用戶的。屬于階段2的三個(gè)最著名的方式是公眾分類(folksonomy)、特征分析/行為分析(profiling/behavioral targeting)、以及協(xié)同過濾(collaborative filtering)。
公眾分類 第一個(gè),公眾分類,代表對階段l的最直接的添加。這里,允許用戶自己標(biāo)記內(nèi)容。所以,不是網(wǎng)站設(shè)計(jì)者或單個(gè)的設(shè)計(jì)者,負(fù)責(zé)提出最好的關(guān)鍵字集合來描述該內(nèi)容,公眾分類讓群體(community)來做。 一旦做到這點(diǎn),這些群體創(chuàng)建的標(biāo)記本質(zhì)上變成內(nèi)容的一部分,并且可使用階段1開發(fā)的傳統(tǒng)的信息檢索/搜索技術(shù)來搜索。這種方法的重要的假設(shè)是,花時(shí)間來明確標(biāo)記網(wǎng)頁的群體的子集最終產(chǎn)生了一種有效的、代表更大的群體看法的描述。常常并非是如此。
特征分析/行為分析 普通形式的特征分析/行為分析也從階段l借用了大量技術(shù)。這里,基于用戶在站點(diǎn)上的以前的行為,例如,點(diǎn)擊的網(wǎng)頁或購買的產(chǎn)品,為那個(gè)用戶建立一個(gè)配置文件(profile)。在簡單的情況下,這個(gè)配置文件可基于對點(diǎn)擊的網(wǎng)頁或購買的產(chǎn)品的收集。該配置文件還可利用自身的內(nèi)容或元標(biāo)記來嘗試辨別用戶的歷史的感興趣的主題。例如,如果一個(gè)用戶在過去購買了許多由內(nèi)容提供者標(biāo)記為"恐怖"的電影,那么行為分析系統(tǒng)將傾向于推薦更多"恐怖"電影給該用戶。這里的重要假設(shè)是,用戶的歷史的行為是對未來興趣的很好的預(yù)言者。雖然有時(shí)候是真的,但是此假設(shè)往往失敗和有效至少一樣頻繁。失敗的原因在于人們展示出各種行為,取決于他們當(dāng)前的興趣、背景、和目的。例如,某人幾個(gè)星期前給妻子買了幾本關(guān)于吉他的書作為一次性禮物,行為分析方式可能繼續(xù)推薦給他吉他書籍,即使他可能不再對這個(gè)主題感興趣。特征分析方式常常還會考慮到用戶的人口統(tǒng)計(jì)數(shù)據(jù),例如年齡、性別、以及地理位置。此方式隱含的核心理念是只要我知道關(guān)于一個(gè)用戶的足夠的信息,我就能準(zhǔn)確預(yù)測他們想要什么。然而, 一些基本的內(nèi)省揭露了這種方式隱含的謬誤。例如,我可能比其他人或機(jī)器更多地了解我的妻子。因而我是她理想的特征分析系統(tǒng)。然而,沒有某種背景,我仍無法預(yù)測她當(dāng)前正在在線尋找什么。
協(xié)同過濾
協(xié)同過濾是另一個(gè)以用戶為中心的方式,可以說是最嚴(yán)格的以用戶為中心。這里,基于常見的購買、點(diǎn)擊歷史或明確的評級(ratings)相互比較用戶。例如,基于一個(gè)人在電影站點(diǎn)上的之前的電影評級,找到最贊同那個(gè)人的評級的其他人,并且推薦他喜歡的其他電影。標(biāo)準(zhǔn)的"購買了這個(gè)的人也購買了那個(gè)"方式實(shí)際上是協(xié)同過濾方式的變化,其中,用戶最近的動作作為識別相似的用戶的唯一基礎(chǔ)。這種方式受到亞馬遜推薦引擎的歡迎。這種方式的重要假設(shè)是,基于過去行為的用戶之間的某些全局相似性度量是預(yù)測未來的興趣的一種有用的方式。然而,這是一個(gè)有缺陷的假設(shè)。某人在工作背景中可能與他的某些的同事非常相似,例如,他們都是Java工程師,具有關(guān)于編程相似的興趣,但是當(dāng)在辦公室外時(shí),例如,在高爾夫球場上,此人可能與這些同事相當(dāng)不同。在高爾夫的背景中,某人可能有一個(gè)非常不同的對等組(peer group)。在全局水平上把用戶分組通常更容易誤導(dǎo)而不是更有幫助。 階段2中所有的以用戶為中心的方式的另一個(gè)弱點(diǎn)是對喜好的明確度量或過于簡單化的隱性度量的依賴。明確度量包括要用戶來表明其對特定內(nèi)容片段的喜好,例如,在1-5級上。這種方式幾乎總是有偏見的,因?yàn)樗麄兇砹朔浅P〉娜丝诒壤?。進(jìn)一步地,花時(shí)間做這些評級的人們并不代表作為整體的群體。他們往往非常自以為是,或者反映了愿意花時(shí)間來發(fā)表看法的特殊的個(gè)性類型。 利用隱性意見(implicit observations)作為規(guī)則的這些方式查看點(diǎn)擊或購買。用點(diǎn)擊來評估喜好是一種有缺陷的方式,因?yàn)樽屇橙它c(diǎn)擊結(jié)果要對引人興趣的、可能甚至是不明確的網(wǎng)頁上的主題和位置進(jìn)行很多工作。 一旦被選擇來觀看,它不告訴關(guān)于用戶怎樣尋找該內(nèi)容的任何事情。另一個(gè)極端,許多系統(tǒng)使用購買作為喜好的度量。雖然購買是評估此的合理的方式,但是其很受限制。例如,當(dāng)購得一個(gè)相機(jī)時(shí),某人可能會在做決定前認(rèn)真考慮許多產(chǎn)品。所有的那些信息可能對于最終購買的相機(jī)之外的其他對相機(jī)感興趣的人是有價(jià)值的。
發(fā)明概述 本發(fā)明的實(shí)施方式代表內(nèi)容推薦的演變的階段3 (見圖1)。這里,這個(gè)想法是從了解當(dāng)前用戶的背景開始,即他們的意圖是什么?他們在尋找什么?基于這種了解,然后找到適當(dāng)?shù)膶Φ冉M,所述適當(dāng)?shù)膶Φ冉M代表在此被識別的興趣背景中與當(dāng)前的用戶最像的其他用戶。從那里,找到那個(gè)對等組識別為與當(dāng)前背景最相關(guān)的內(nèi)容。 本發(fā)明所采用的方式是以背景為中心的,或者,換一種說法,以意圖為中心。用于實(shí)現(xiàn)此方式的技術(shù)隨后介紹,并且其根本上是基于2005年12月27日提交的美國專利申請第11/319, 928號中部分地描述的UseRank技術(shù)和親和力引擎(affinity engine),該申請通過引用而整體并入此處。應(yīng)當(dāng)注意的是,所有以前的方式,包括以內(nèi)容為中心的和以用戶為中心的方式,被本發(fā)明中所表現(xiàn)的階段3包含和改進(jìn)。因?yàn)楸景l(fā)明對在用戶和內(nèi)容之上的圖畫添加了背景的維度,所以總是可能選擇忽視背景并且使用該系統(tǒng)來提供階段2的功能性,諸如協(xié)同過濾或行為分析/特征分析。然而,基于提供全面行為指紋(full-spectrumbehavioral fingerprint)的本發(fā)明的關(guān)鍵方面,即使這些以前已知的方式在其功能性方面也得以顯著地改進(jìn)。
附圖簡述 圖1是逐漸引到本發(fā)明的內(nèi)容推薦的演變的示意視8
圖2是示出根據(jù)本發(fā)明的一種用于基于背景的內(nèi)容推薦的方法和設(shè)備的結(jié)構(gòu)示意圖; 圖3是示出根據(jù)本發(fā)明的親和力引擎集成的結(jié)構(gòu)示意圖; 圖4是示出根據(jù)本發(fā)明的群體指導(dǎo)Web和群體智慧(wisdom)的動態(tài)的、自適應(yīng)的、實(shí)時(shí)的平臺的結(jié)構(gòu)示意圖; 圖5是示出根據(jù)本發(fā)明的群體智慧平臺的結(jié)構(gòu)示意 圖6是示出背景到推薦的翻譯過程的示意流程圖; 圖7是示出根據(jù)本發(fā)明的虛擬公眾分類(virtual folksonomy)的實(shí)現(xiàn)過程的示意流程圖; 圖8是示出根據(jù)本發(fā)明的主題吸引、主題匹配和活動性(activeness)的示意 圖9是示出根據(jù)本發(fā)明的行為指紋的過程的示意流程圖; 圖IO是示出根據(jù)本發(fā)明的帶有結(jié)構(gòu)覆蓋圖(overlay)的長尾營銷(marketing)模型的曲線圖; 圖11是"群體的智慧"的擬方程(pseudo-equation); 圖12是示出根據(jù)本發(fā)明的親和力引擎記憶預(yù)測機(jī)器(MemoryPredictionMachine)的示意流程圖; 圖13是示出根據(jù)本發(fā)明的顧客門戶(portal)的歡迎屏幕的截屏; 圖14是根據(jù)本發(fā)明的顧客門戶中的提升報(bào)告(lift r印ort)的截屏; 圖15是示出根據(jù)本發(fā)明的群體指導(dǎo)的電子商務(wù)的截屏,包括根據(jù)本發(fā)明的對競
爭和配套產(chǎn)品的推薦; 圖16是示出根據(jù)本發(fā)明的群體指導(dǎo)的電子旅行的截屏;
圖17是示出根據(jù)本發(fā)明的群體指導(dǎo)的營銷的截屏; 圖18是示出根據(jù)本發(fā)明的社會化搜索(social search)和群體信息彈出/覆蓋圖的截屏; 圖19是示出根據(jù)本發(fā)明的群體指導(dǎo)的在線支持的截屏;
圖20是示出根據(jù)本發(fā)明的群體內(nèi)部網(wǎng)/知識門戶的截屏;
圖21是示出根據(jù)本發(fā)明的群體指導(dǎo)的媒體的截屏; 圖22是示出根據(jù)本發(fā)明的對于媒體的群體指導(dǎo)的社會化搜索的截屏; 圖23是示出根據(jù)本發(fā)明的對于媒體的群體指導(dǎo)的跨站點(diǎn)(cross-site)推薦的截
屏和示意圖; 圖24是示出根據(jù)本發(fā)明的群體指導(dǎo)的視頻推薦的截屏; 圖25是示出根據(jù)本發(fā)明的群體指導(dǎo)的主題推薦的截屏; 圖26是示出根據(jù)本發(fā)明的群體指導(dǎo)的相應(yīng)背景的廣告推薦的示意流程圖。 圖27是示出根據(jù)本發(fā)明的即時(shí)連接的示意流程圖; 圖28是示出本發(fā)明的優(yōu)選實(shí)施方式的系統(tǒng)結(jié)構(gòu)的方框示意圖; 圖29是示出本發(fā)明的優(yōu)選實(shí)施方式中通過JavaScript標(biāo)記和REST的客戶集成
的代碼片段的方框示意圖;以及 圖30是示出根據(jù)本發(fā)明的AJAX平臺的方框示意圖。
發(fā)明詳述
9
本發(fā)明展現(xiàn)了內(nèi)容推薦的演變的階段3(見圖1)。這里,這個(gè)想法是從先了解當(dāng)前用戶的背景開始,即他們的意圖是什么?他們在尋找什么?基于這種了解,然后找到適當(dāng)?shù)膶Φ冉M,所述適當(dāng)?shù)膶Φ冉M代表在此被識別的興趣背景中與當(dāng)前的用戶最像的其他用戶。從那里,找到該對等組識別為與當(dāng)前背景最相關(guān)的內(nèi)容。 本發(fā)明所采用的方式是以背景為中心的,或者,換一種說法,以意圖為中心。用于實(shí)現(xiàn)此方式的技術(shù)隨后介紹,并且其根本上是基于2005年12月27日提交的美國專利申請第11/319, 928號中部分地描述的UseRank技術(shù)和親和力引擎。應(yīng)當(dāng)注意的是,所有以前的方式,包括以內(nèi)容為中心的和以用戶為中心的方式,被本發(fā)明中所表現(xiàn)的階段3包含和改進(jìn)。因?yàn)楸景l(fā)明對在用戶和內(nèi)容之上的圖畫添加了背景的維度,所以總是可能選擇忽視背景而使用該系統(tǒng)來提供協(xié)同過濾、特征分析。然而,基于提供全面行為指紋的本發(fā)明的關(guān)鍵方面,即使這些以前已知的方式在其功能性方面也得以顯著地改進(jìn)。 圖2是示出根據(jù)本發(fā)明的一種用于基于背景的內(nèi)容推薦的方法和設(shè)備的結(jié)構(gòu)示意圖。 全面行為指紋提供針對當(dāng)前技術(shù)發(fā)展現(xiàn)狀隱性評級的重大進(jìn)展,其本質(zhì)上等于點(diǎn)擊分析和購買行為。首先,他們考慮到用戶的各種各樣的行為,包括但不限于點(diǎn)擊、花費(fèi)在網(wǎng)頁上的時(shí)間、滾讀(scrol 1 ing)和鼠標(biāo)移動、明確的動作諸如打印、電子郵件、書簽使用的鏈接、回訪頻率、以及執(zhí)行的搜索。第二,所有的這些行為可與其他頁面上的當(dāng)前用戶的行為互相關(guān),并且也可以與當(dāng)前頁面上的被識別的對等體的行為和群體的其余部分互相關(guān)。從此分析,該用戶已經(jīng)在特定內(nèi)容片段中找到價(jià)值的可能性可以被辨別并且被饋入(feed)學(xué)習(xí)系統(tǒng)。 本發(fā)明的另一個(gè)方面涉及對用于自動內(nèi)容推薦的現(xiàn)有策略的無縫集成(見圖3),包括搜索引擎301和特征分析系統(tǒng)302以及廣告服務(wù)器303,還有用于包括推銷規(guī)則及系統(tǒng)的人工推薦的系統(tǒng)304。本發(fā)明還無縫地集成與該內(nèi)容相關(guān)的其他信息資源,如產(chǎn)品目錄305,其可用于顯示、過濾或?qū)W習(xí)的目的。 最后,由于所學(xué)習(xí)的親和力和收集的信息的綜合性,該系統(tǒng)代表一個(gè)通用的智慧平臺501 ,在其之上可以建立許多應(yīng)用(見圖4和圖5),諸如社會化搜索502、內(nèi)容推薦503和產(chǎn)品推薦504、 Insights 505、電子郵件506、以及專為各種應(yīng)用如電子商務(wù)、電子營銷等的即時(shí)連接507。其他應(yīng)用包括與投標(biāo)管理系統(tǒng)的集成和報(bào)告,用于搜索引擎優(yōu)化和搜索引擎營銷508、移動和IPTV509、和定制應(yīng)用或混搭(mashup)510。后文中對其中的一些應(yīng)用進(jìn)行描述?,F(xiàn)在詳細(xì)地描述這些關(guān)鍵方面中的每一個(gè)方面。
以背景和意圖為中心 本發(fā)明所體現(xiàn)的內(nèi)容推薦的演變中的一個(gè)核心進(jìn)展是用于識別和代表用戶當(dāng)前的興趣主題以及將該興趣轉(zhuǎn)變?yōu)橛杏玫耐扑]和信息集的過程。此過程的步驟在圖6中示出,并且概述如下 步驟1 :當(dāng)用戶來到一個(gè)網(wǎng)站,他們立即開始建立他們當(dāng)前的背景。他們可能通過在該站點(diǎn)的搜索框內(nèi)輸入查詢、導(dǎo)航到特定部分來做到這點(diǎn),或甚至可能通過在外部搜索引擎如Goggle或Yahoo上做通向此站點(diǎn)的搜索,而在到達(dá)該站點(diǎn)之前已經(jīng)建立某種背景。所有這些信息由觀察者標(biāo)記(Observer Tag),即嵌入網(wǎng)站的一段HTML/JavaScript,來捕獲。隨著用戶繼續(xù)通過網(wǎng)站移動,基于他們隱性的動作,他們還可能示出對于特定的頁面或
10內(nèi)容片段的興趣?;谟稍撚^察者標(biāo)記所收集的不同的行為而確定興趣,并且使用本發(fā)明的全面行為指紋技術(shù)601(在下面更詳細(xì)地描述)來分析興趣。這些感興趣的網(wǎng)頁還進(jìn)一步促成用戶的背景。 所有這些信息被儲存為用戶當(dāng)前的背景矢量602,其是術(shù)語和文檔的混合矢量,每一個(gè)輸入具有權(quán)重,反映那個(gè)術(shù)語或文檔反映用戶當(dāng)前的背景的強(qiáng)烈程度。當(dāng)用戶輸入搜索術(shù)語和/或點(diǎn)擊導(dǎo)航鏈接時(shí),增加對應(yīng)輸入或點(diǎn)擊的術(shù)語和短語的矢量輸入,來捕獲表達(dá)的興趣。當(dāng)這些動作進(jìn)一步移動成為過去,相應(yīng)的輸入被減少或衰減(decay)。相似地,用戶點(diǎn)擊的或表明對其感興趣的文檔(如基于他們的隱性動作而確定的),增加了相應(yīng)的矢量輸入,增加的程度基于由本發(fā)明所確定的興趣水平和確定性水平。此結(jié)果作為背景矢量,代表用戶的當(dāng)前背景。也有可能是,基于用戶感興趣的歷史動作和歷史背景,進(jìn)一步增加該背景矢量。雖然在優(yōu)選的實(shí)施方式中通常不會這樣做,因?yàn)檫@種信息可能是誤導(dǎo)性的,但是有可能基于歷史行為被認(rèn)為是相關(guān)的應(yīng)用中的這些歷史背景來較小的程度地增加該背景矢量。 步驟2 :基于從聚合智慧(aggregated wisdom)604學(xué)習(xí)到的親和力/聯(lián)系,擴(kuò)大和改進(jìn)內(nèi)容矢量為意圖矢量603,聚合智慧604從對群體作為一個(gè)整體的長期的觀察中收集。例如,用戶可能已經(jīng)輸入關(guān)于數(shù)字SLR相機(jī)的查詢,并且表示了對于Nikon網(wǎng)頁的隱性的興趣。在背景矢量中,對應(yīng)于"數(shù)字SLR相機(jī)"以及"數(shù)字"、"SLR"、和"相機(jī)"的輸入被較小的程度地增加,這是對應(yīng)于感興趣的特定的Nikon網(wǎng)頁的矢量輸入。為創(chuàng)建該意圖矢量,系統(tǒng)查看背景矢量中的術(shù)語和文檔與其他術(shù)語的親和力。例如,群體智慧可能已經(jīng)發(fā)現(xiàn)術(shù)語"高分辨率"可能與術(shù)語"Nikon"以及與感興趣的具體的Nikon網(wǎng)頁高度相關(guān)。因而該意圖矢量在對應(yīng)"高分辨率"的輸入處被增加。相似地,與背景矢量中的術(shù)語相關(guān)的其他文檔可能基于群體智慧而被發(fā)現(xiàn),并且被增加到意圖矢量中。例如,Cannon相機(jī)頁面可能對"SLR相機(jī)"具有強(qiáng)烈的親和力,并且某些程度上變成意圖矢量的一部分。允許背景矢量擴(kuò)展為意圖矢量的親和力604由親和力引擎所確定,該親和力引擎在下面描述,并且在2005年12月27日提交的美國專利申請第11/319, 928號中詳細(xì)描述。概括來說,親和力引擎通過觀看站點(diǎn)上用戶群體的所有隱性行為,并通過利用行為指紋和使用等級算法來確定興趣和聯(lián)系,從而學(xué)習(xí)文檔和術(shù)語、文檔和文檔、術(shù)語和術(shù)語、以及用戶到其他用戶、文檔以及術(shù)語之間的關(guān)系。有效地將背景翻譯成意圖的能力是本發(fā)明的關(guān)鍵方面。
步驟3 :識別共享對當(dāng)前意圖的親和力的用戶組、以及該意圖的背景中展示出與當(dāng)前用戶最像的行為的那些用戶。在2005年12月27日提交的美國專利申請第11/319, 928號中,這些分別稱為"專家"和"對等體",但是這里我們將其結(jié)合成一個(gè)名字"對等體"。此對等組由用戶矢量605代表,并且該矢量中的每一個(gè)用戶輸入可具有權(quán)重,表明在此背景中他對于當(dāng)前用戶來說是對等體的強(qiáng)烈程度。雖然通常未被推薦,但是系統(tǒng)也有能力基于預(yù)定義的屬性集,諸如年齡、性別、位置或其他人口統(tǒng)計(jì)的變量,把對等組限制到匹配當(dāng)前用戶的那些用戶。相似地,對等組可被限制于在一天的同一時(shí)間(例如上午、下午、晚上)訪問該站點(diǎn)的那些用戶。在某些情況下,這些屬性可被用來影響用戶的對等權(quán)重,諸如給予對基于這些預(yù)定義變量的用戶最匹配的那些用戶稍多的對等權(quán)重。本發(fā)明還通過在每一個(gè)預(yù)定義的屬性組之中或之間比較行為模式,例如,最簡單的例子比較被找到是有用的文檔,來學(xué)習(xí)這些權(quán)重。與組間的相似性比較,更高的組內(nèi)行為相似性表明該組是有個(gè)體差異的,
11并且因而當(dāng)影響對等組時(shí),團(tuán)體化的影響的權(quán)重更高是有理由的??赏ㄟ^對用戶的聚合興趣矢量的許多相似性計(jì)算之一(例如余弦相似性)來查看使用的文檔和術(shù)語相似性,來度量相似性。 步驟4 :查看哪些文檔對當(dāng)前意圖606中的所識別的對等體具有最高的親和力。為做到這點(diǎn),親和力引擎查看多種因素組合,這些因素包括,如活動性矢量(activenessvector)所代表的一段內(nèi)容的整體有用性、如術(shù)語-文檔矩陣所代表的所學(xué)習(xí)到的術(shù)語和內(nèi)容之間的親和力、以及如下一步矩陣(next-st印matrice)所代表的預(yù)計(jì)的導(dǎo)航模式,連同那些對等體,根據(jù)其對等權(quán)重,這些因素被加權(quán),并且被聚合地用來計(jì)算具有與當(dāng)前意圖最高親和力的那些文檔。這些文檔成為未過濾推薦607。由下面更詳細(xì)地描述,過濾現(xiàn)在可被用來限制或補(bǔ)充這些群體推薦。 步驟5 :既然該推薦已經(jīng)被識別并被適當(dāng)?shù)剡^濾,那么最后的可選擇的步驟是向親和力引擎要求關(guān)于每一個(gè)推薦608的群體信息。這些信息可與其他資產(chǎn)信息諸如主題、尺寸或價(jià)格結(jié)合,并被顯示給用戶以幫助他們了解推薦下所隱含的群體智慧。與親和力引擎中的文檔相關(guān)聯(lián)的群體智慧的許多方面可被揭示,但是在普通的實(shí)施中,我們揭示在該文檔中找到有價(jià)值東西的用戶的總數(shù)、將該文檔與當(dāng)前背景/意圖相關(guān)聯(lián)的對等體的數(shù)目、以及對等群體已經(jīng)將其與該文檔相聯(lián)系的術(shù)語/短語。 此后面的段,S卩,與該文檔相聯(lián)系的術(shù)語,被稱作虛擬公眾分類,因?yàn)槠浯砣后w已經(jīng)將之聯(lián)系到該文檔的術(shù)語,但是不像傳統(tǒng)的公眾分類,如上所述其中用戶必須明確作出該聯(lián)系,虛擬公眾分類基于用戶群體的隱性行為,由親和力引擎自動創(chuàng)建。如由行為指紋所確定的,在一個(gè)或多個(gè)步驟內(nèi),被搜索或點(diǎn)擊為導(dǎo)航鏈接并被引導(dǎo)到有用內(nèi)容的術(shù)語,自動成為相關(guān)的。這些術(shù)語_文檔連接對于提供推薦的過程,以及對于提供給用戶關(guān)于與每一個(gè)推薦相聯(lián)系的主題的有用的反饋,都是重要的。當(dāng)這些術(shù)語被顯示給用戶時(shí),可被做成可點(diǎn)擊的,以使得用戶可點(diǎn)擊它們來提供關(guān)于他們當(dāng)前意圖的進(jìn)一步輸入。然后此信息成為他們背景向量的一部分,整個(gè)過程重復(fù),并且可基于此新信息提供新推薦。圖7提供了虛擬公眾分類的概念圖,與用于連接術(shù)語到文檔的傳統(tǒng)的方式作對比。
時(shí)間(衰減、趨勢、和時(shí)尚(fad)檢測) 在從背景到推薦的移動中,對于所有的計(jì)算,時(shí)間是很重要的因素。首先,親和力引擎所收集的所有信息受時(shí)間衰減的影響。這意味著,例如,來自上月的信息比來自今天的信息對計(jì)算有較少的影響。這一點(diǎn)很重要,因?yàn)檎军c(diǎn)可能變化,例如,添加或移除了新的內(nèi)容,人們可能分別地會變化,例如,他們的興趣可能會變化,并且,作為整體的群體也可能轉(zhuǎn)移興趣,例如新的時(shí)尚。雖然對于所有信息都有默認(rèn)的衰減率,但是一些信息可能更迅速地衰減,如果確定這是必要的。例如,時(shí)尚行為,諸如來得快去得快的對圣誕節(jié)產(chǎn)品的興趣,可能需要被更快地衰減,以防止圣誕節(jié)已經(jīng)過去很久后仍推薦圣誕節(jié)產(chǎn)品。為防止這點(diǎn),系統(tǒng)定期在所有的內(nèi)容上運(yùn)行趨勢檢測系統(tǒng),例如每天一次,或者對于對時(shí)間非常敏感的網(wǎng)站每五分鐘一次。趨勢檢測能以多種方式做到,而一種方式是使用Mann-Kendall算法。其他
方式包括采用最小二乘法擬合的各種回歸技術(shù)。如果對于一段給定的內(nèi)容,檢測到了強(qiáng)烈的消極趨勢,那么親和力引擎中與該內(nèi)容相關(guān)的信息將以更快的速率被衰減。結(jié)果是降低了親和力引擎推薦這段內(nèi)容的可能性。 定期運(yùn)行的時(shí)尚檢測的另一種算法是周期性時(shí)尚檢測。如果一段內(nèi)容示出強(qiáng)烈的
12積極趨勢,并且在過去每隔一段時(shí)間可找到同樣的趨勢,那么該段內(nèi)容在未來趨勢的預(yù)測 上可被自動增強(qiáng)重要性。 在傳統(tǒng)的網(wǎng)站,即使其中站點(diǎn)的經(jīng)營者試圖了解顧客行為,通常使用的技術(shù)是調(diào) 查顧客并且分析顧客響應(yīng)以產(chǎn)生報(bào)告。到該報(bào)告被分析時(shí)候,報(bào)告的結(jié)果與報(bào)告正在被評 審時(shí)的實(shí)際情況不同步。例如,在傳統(tǒng)的系統(tǒng)中,商務(wù)站點(diǎn)可能在圣誕季節(jié)收集反饋并響應(yīng) 那個(gè)信息來在二月重新設(shè)計(jì)他們的站點(diǎn)。實(shí)際上,該商務(wù)站點(diǎn)正試圖在二月銷售圣誕節(jié)產(chǎn) 品。可選擇地,分析報(bào)告可被離線創(chuàng)建并由專家組分析,以推斷趨勢并確定適當(dāng)?shù)膭幼?;?費(fèi)幾個(gè)星期或一個(gè)月的過程再次導(dǎo)致過時(shí)的站點(diǎn)修改。以這種方式,這里本發(fā)明的自動性 允許網(wǎng)站實(shí)時(shí)適應(yīng)所發(fā)現(xiàn)的趨勢和時(shí)尚,提供給用戶適合當(dāng)前背景和時(shí)間的推薦。
然而,除了有助于自動內(nèi)容推薦的過程,本發(fā)明所使用的趨勢和時(shí)尚檢測算法 (fad detection algorithm)還可通過顧客門戶中的報(bào)告被揭示給內(nèi)容系統(tǒng)的所有者,例 如網(wǎng)站。在優(yōu)選實(shí)施方式中,對于群體趨勢和時(shí)尚的這種報(bào)告可例如被商人用來在正確的 時(shí)間促銷某些產(chǎn)品或內(nèi)容,使得這些促銷更為有效。以在圣誕季節(jié)期間銷售的產(chǎn)品為例,如 果這種銷售圣誕節(jié)后消失了,那么該商業(yè)網(wǎng)站的經(jīng)營者將能基于與網(wǎng)站的群體互動來遵循 銷售曲線。另一方面,如果緊急的新聞報(bào)道快速驅(qū)動了對某個(gè)產(chǎn)品的需求,那么本發(fā)明允許 商人觀看需求曲線并且實(shí)時(shí)響應(yīng)。因此,如果人們突然急劇地都對一段特定的內(nèi)容或產(chǎn)品 感興趣,網(wǎng)站的經(jīng)營者可更快地提供那種內(nèi)容或產(chǎn)品。如果需求快速消失了,例如興趣是基 于時(shí)尚的,那么站點(diǎn)的經(jīng)營者也能適應(yīng)這一事實(shí)。 [OO75] 親和力引擎 如上所述,并且如在2005年12月27日提交的美國專利申請第11/319, 928號中更 詳細(xì)地討論的,親和力引擎學(xué)習(xí)術(shù)語-文檔、術(shù)語-術(shù)語、術(shù)語-用戶、文檔-文檔、文檔-用 戶、以及用戶_用戶之間的連接/親和力。(注意術(shù)語如文檔、內(nèi)容、和資產(chǎn)在整個(gè)本文檔 中可交換地使用。在所有的情況下,這些術(shù)語是指提供信息或服務(wù)的任意類型的媒體,包 括,例如但不限于網(wǎng)頁、word文件、pdf、視頻、音頻文件、widget和/或產(chǎn)品)。在優(yōu)選實(shí)施
方式中,所有的親和力被儲存為稀疏矩陣和矢量。然而,還有本領(lǐng)域的技術(shù)人員已知的儲存 此信息的許多可選擇的方式。雖然最終只有一個(gè)數(shù)字可被計(jì)算來代表任意兩個(gè)實(shí)體例如文 檔和術(shù)語之間的親和力,但是通常存在以加權(quán)和來組合的幾個(gè)子親和力(sub-affinity), 來得出那個(gè)單個(gè)數(shù)字。該和的權(quán)重可能取決于背景。例如,文檔具有對其他文檔的至少三 種親和力虛擬公眾分類中的相似性,即,群體關(guān)聯(lián)到文檔的術(shù)語;用戶組中的相似性,即, 多少用戶已經(jīng)使用了兩個(gè)文檔;以及導(dǎo)航模式使用中的相似性,例如,用戶示出在使用了其 他的文檔后在一個(gè)文檔中找到價(jià)值的模式。雖然結(jié)合矢量空間模型和定制可能性的技術(shù)當(dāng) 前被本發(fā)明的優(yōu)選實(shí)施方式所使用,但是,對每一種數(shù)據(jù),可酌情采用多種數(shù)學(xué)技術(shù)。更多 的討論參見2005年12月27日提交的美國專利申請第11/319, 928號。
本發(fā)明的一個(gè)重要方面是,所有的子親和力總是被雙向計(jì)算。為闡明此雙向性,我 們描述其對來源于虛擬公眾分類的術(shù)語_文檔子親和力的應(yīng)用。圖8是示出本發(fā)明的一些 方面的結(jié)構(gòu)圖,這些方面涉及主題吸引和主題匹配,即構(gòu)成術(shù)語和文檔之間的雙向虛擬公 眾分類連接的兩個(gè)維度,以及總的活動性。在圖8的示例中,提供了查詢801,并且標(biāo)明了在 三個(gè)示例文檔的一個(gè)中最終找到價(jià)值的答復(fù)的百分比。該查詢涉及特定的Nikon相機(jī),并 且可以看見20%的答復(fù)在專注于高分辨率相機(jī)802的網(wǎng)頁中找到價(jià)值,78%的答復(fù)在具體相機(jī)的概述頁803中找到價(jià)值,以及僅2%的作此查詢的用戶在對相機(jī)的詳細(xì)的規(guī)格表804 中找到價(jià)值。作為邊注,記住該價(jià)值由用戶展示在給定頁上的各種行為所確定(稍后詳細(xì) 描述)。 有兩種方式來考慮該查詢和每一個(gè)示例文檔之間的虛擬公眾分類連接。主題吸引 從查詢開始,并且考慮搜索"Nikon 508X"并隨后在每一個(gè)文檔中找到價(jià)值的用戶的比例。 例如,概述頁803具有最高的主題吸引,有78%的用戶在那里找到價(jià)值,其次是高分辨率相 機(jī)頁802,有20%的用戶在那里找到價(jià)值,并且之后是規(guī)格表804,僅有2%的用戶在那里找 到價(jià)值。注意為說明起見簡化了這個(gè)示例。事實(shí)上,我們也將查詢分解成其組成部分,并考 慮這些組成部分對每一個(gè)文檔的親和力,以及考慮親和力弓I擎已經(jīng)學(xué)習(xí)到的具有和這一個(gè) 查詢相似的意義的其他術(shù)語之間的親和力。以這種方式,給定該查詢所代表的意圖,主題吸 引可被認(rèn)為是預(yù)測用戶在給定的文檔中找到價(jià)值的可能性的問題。在優(yōu)選的實(shí)施方式中, 得到此可能性是使用概率技術(shù)的結(jié)合來完成,包括貝葉斯推理。 主題匹配從另一方向查看,從每一個(gè)文檔開始,并考慮所有的通過其他用戶的行 為與之相關(guān)的其他術(shù)語。所以,例如,高分辨率相機(jī)頁802可具有連接到它的許多其他相機(jī) 的名字,并且因此對輸入的特定查詢的關(guān)注程度比其他兩種頁都低,具體地,其他兩種頁的 術(shù)語-文檔連接更加高度集中圍繞"Nikon 580X"。實(shí)際上,規(guī)格表804可變?yōu)榫哂行g(shù)語連 接最專注圍繞"Nikon 580X"的文檔,并且因而具有對此查詢最高的主題匹配,雖然它具有 最低的主題吸引。與主題吸引一樣,事實(shí)上,主題匹配也將查詢分解成其組成部分,并考慮 不在此查詢中的其他術(shù)語之間的親和力。以這種方式,主題匹配可被視為找到具有對查詢 所代表的意圖在主題上最佳整體匹配的文件。在優(yōu)選實(shí)施方式中,矢量空間模型和修改的 余弦相似性技術(shù),與傳統(tǒng)的全文搜索所使用的技術(shù)相似,被用來確定匹配的程度。
考慮每一個(gè)文檔對查詢的親和力的這兩種方向,(即,主題吸引和主題匹配),以 及最后一個(gè)因素,總的活動性(即有用性),三者被以非線性加權(quán)和結(jié)合起來,得出一個(gè)用 于虛擬公眾分類子親和力的值。此子親和力之后被與其他子親和力(例如基于導(dǎo)航模式 的那些親和力)結(jié)合,并被通過對等組的透鏡所過濾,得出文件對查詢的最后的等級,稱為 UseRank。當(dāng)提供對特定的網(wǎng)頁的推薦時(shí),以及當(dāng)考慮全面背景和意圖矢量時(shí),相似的雙向 技術(shù)被用來計(jì)算UseRank。 存在幾種方法,其用于結(jié)合不同的子親和力和其中的雙向維度,以得出特定的用 戶和背景的文檔的最終UseRank。在優(yōu)選實(shí)施方式中,在基于混合算術(shù)幾何加權(quán)平均被結(jié) 合在一起之前,一個(gè)或多個(gè)閾值被用于每一個(gè)維度,包括絕對和相對閾值。在再次基于混 合算術(shù)幾何加權(quán)平均與其他子親和力結(jié)合之前,每一個(gè)得到的子親和力相似性受閾值的影 響。閾值的值一般是固定的,然而,加權(quán)平均的各個(gè)權(quán)重可基于由親和力引擎返回的結(jié)果集 的成功而被調(diào)節(jié)并被學(xué)習(xí)。
全面行為指紋 如這里所討論,本發(fā)明的一個(gè)關(guān)鍵特征是處理和分析在網(wǎng)站的實(shí)際使用期間所做 的隱性意見,例如,對比使用明確反饋的技術(shù)中的傳統(tǒng)方式。通過科學(xué)研究證實(shí),并從人類 心理學(xué)和社會學(xué)了解,本發(fā)明的一項(xiàng)關(guān)鍵優(yōu)點(diǎn)在于人類不擅長給予反饋,尤其如果反饋必 須被明確給予時(shí)。當(dāng)某人被調(diào)查時(shí),其不具有以反饋的形式給予實(shí)際準(zhǔn)確性的誘因。本發(fā) 明的一個(gè)方面通過使用在由群體中的個(gè)人在網(wǎng)絡(luò)上使用特定材料的期間所觀察到的隱性行為,消除了這種調(diào)查偏差。因此,本發(fā)明相信人們做什么而不觀看他們說什么。本發(fā)明通 過他們實(shí)際的動作、隱性的行為,觀看人們的行為,并能準(zhǔn)確詮釋他們真實(shí)的意圖是什么, 以及他們是否喜歡或不喜歡某物。因而,對比點(diǎn)擊動作,本發(fā)明觀察行為。
當(dāng)前技術(shù)聚焦于點(diǎn)擊,如網(wǎng)絡(luò)鏈接點(diǎn)擊。如果某人點(diǎn)擊了鏈接,該點(diǎn)擊被報(bào)告。該 點(diǎn)擊可被報(bào)告為已經(jīng)導(dǎo)致了一個(gè)被瀏覽的網(wǎng)頁,即使在此人點(diǎn)擊的頁面上沒有花費(fèi)太多時(shí) 間。因而,不管該頁面是好的或壞的,這個(gè)已知的方式無論如何不是一個(gè)好的指示。如果一 個(gè)鏈接被放在網(wǎng)頁上的突出位置,那么人們很可能點(diǎn)擊它。然而,當(dāng)人們到達(dá)該鏈接所指示 的位置時(shí),他們可能立即離開了該站點(diǎn)。這就是為什么瀏覽器上頭號使用的按鈕是BACK按 鈕。BACK按鈕的使用可指示對站點(diǎn)的喜歡或不喜歡。因此,本發(fā)明認(rèn)識到,是點(diǎn)擊后的用戶 動作要緊,而非點(diǎn)擊本身。本發(fā)明跟蹤點(diǎn)擊之外的行為以確定頁面是好或壞。因而,如果某 人退出該網(wǎng)頁,被認(rèn)為是消極反饋,即,此人不喜歡它。以這種方式,在本發(fā)明中,點(diǎn)擊可識 別非常消極的反應(yīng)。如果某人去了一個(gè)鏈接,追隨著該鏈接,在那里花時(shí)間,并做了其他事, 那么該行為也被跟蹤。如果對等組驗(yàn)證該行為是一貫的,例如,相當(dāng)數(shù)量的組成員對該頁面 反應(yīng)時(shí)展示出同樣的行為,那么該網(wǎng)頁被認(rèn)為是好網(wǎng)頁。 本發(fā)明的一種實(shí)施方式更進(jìn)了一步。本發(fā)明不僅基于行為指紋確定哪些資產(chǎn)是有 用的,其還學(xué)習(xí)與有用性相關(guān)的背景。例如,本發(fā)明可學(xué)習(xí)特定的相機(jī)頁面對在高分辨率相 機(jī)上示出興趣和意圖的用戶非常有用,但是如果意圖是袖珍相機(jī)則沒有用。以這種方式,親 和力引擎有能力基于用戶通過他們的隱性動作所表示的背景和意圖來分辨資產(chǎn)的有用性。 [OOSS] 驅(qū)動所有的已學(xué)習(xí)到的聯(lián)系(親和力)的親和力引擎的主要輸入是用戶在站點(diǎn)上 的行為。在優(yōu)選實(shí)施方式中,所有的行為被觀察者標(biāo)記所捕獲,觀察者標(biāo)記即嵌入網(wǎng)站的一 段HTML/JavaScript,通常在文件頭和文件尾模板中。雖然這是用于捕獲用戶行為的優(yōu)選的 方法,但是也可能使用瀏覽器插件或低級別網(wǎng)絡(luò)流量分析儀來捕獲用戶行為。被捕獲的行
為包括 訪問的網(wǎng)頁以及以何種順序 花費(fèi)在每一頁面上的時(shí)間 點(diǎn)擊的鏈接 執(zhí)行的搜索 在頁面上滾讀所花費(fèi)的時(shí)間 在瀏覽器窗口可見的頁面部分,以及多長,打開或關(guān)閉的頁面子元素 啟動的媒體,觀看該媒體所花費(fèi)的時(shí)間,以及在該媒體上所做的明確的動作 BACK按鈕的使用 對一段特定的內(nèi)容的重復(fù)訪問 在該頁面時(shí)的鼠標(biāo)移動 觀看的廣告和點(diǎn)擊的廣告 明確的動作,例如,加入購物車、購買、發(fā)電子郵件、保存、打印、打印預(yù)覽 虛擬打印在幾個(gè)小時(shí)或幾天的過程中經(jīng)常返回的內(nèi)容 虛擬書簽在數(shù)小時(shí)或數(shù)天中,具有間歇的活動周期的保持打開的內(nèi)容 入口和出口路徑
所捕獲的信息被發(fā)送回親和力引擎用于處理。圖9示出用于分析從各種用戶接口 設(shè)備所捕獲的這些行為或其他隱性數(shù)據(jù)的過程。此過程的輸入是用戶蹤跡(trail)901,其 包括所有的所訪問的資產(chǎn)和在那些資產(chǎn)上所觀察到的隱性的(和明確的)動作。處理這些 行為有兩個(gè)主要步驟,其結(jié)合起來提供對什么內(nèi)容是有用的和在什么背景中的認(rèn)識。第一 步是確定用戶是否在一段特定的內(nèi)容中找到價(jià)值(有用性)。在概念上,以思考模式花在頁 面上的時(shí)間越長,即,用戶正在處理信息,有用的可能性越高。思考模式可由在頁面上非滾 讀的時(shí)間來近似,其中一些滾讀或鼠標(biāo)移動已經(jīng)以指定的時(shí)間范圍檢測到。重復(fù)訪問和頁 面被看的百分比一般還是對喜好或有用性的好的指示者。對于每一個(gè)用戶和每一段內(nèi)容, 我們可創(chuàng)建行為矢量902,在該矢量中的每一個(gè)條目都代表上面列出的特征之一或預(yù)定義 的特征組合。然而,既不是所有的內(nèi)容都被創(chuàng)建成平等的,也不是所有的用戶都被創(chuàng)建成平 等的。我們以幾種方式規(guī)范該行為矢量。第一,我們規(guī)范用戶使得行為矢量與用戶群903 其余的部分可比較。例如, 一些用戶可能比其他用戶閱讀得慢,影響他們花費(fèi)在頁面上的平 均時(shí)間。 一些用戶可能比其他用戶更多地使用鼠標(biāo)。完成此規(guī)范化的一種方式是,通過將 所有的條目翻譯成z-得分(z-score),其調(diào)整那個(gè)用戶所特有的均值和標(biāo)準(zhǔn)差。
第二個(gè)規(guī)范化是基于內(nèi)容規(guī)范?;趦?nèi)容的固有的或指定的屬性來做到這點(diǎn)。例 如,花費(fèi)在一個(gè)段落文檔上的30秒很可能與花費(fèi)在10頁文檔上的30秒具有不同的意義。 因而可基于頁面長度或字?jǐn)?shù)來規(guī)范停留時(shí)間。相似地,觀看30秒長的視頻所花費(fèi)的30秒 與觀看5分鐘長的視頻所花費(fèi)的30秒具有不同的意義。在許多情況中,觀察者標(biāo)記有能力 通過DOM(文檔對象模型)中的信息捕獲這些頁面特性。然而,當(dāng)在DOM中不可得時(shí),本發(fā) 明提供其他機(jī)制用于從離線目錄例如產(chǎn)品或媒體目錄收集需要的信息,或用于允許網(wǎng)站設(shè) 計(jì)者在頁面本身中添加明確的信息,例如,像元標(biāo)記或添加的JavaScript變量。例如,在 電子商務(wù)站點(diǎn)上,某些頁面可被定義為對比產(chǎn)品的信息。系統(tǒng)可為這些內(nèi)容組的每一個(gè)獨(dú) 立地規(guī)范行為矢量。以這種方式,表明喜好所需的停留時(shí)間可針對內(nèi)容的類型來調(diào)節(jié)。以 這種方式使得所有的行為(特征)是可適用的。在當(dāng)前的實(shí)施中,這些規(guī)范策略是硬編碼 (hard-coded)。然而,本發(fā)明允許插入各種機(jī)器學(xué)習(xí)技術(shù)以學(xué)習(xí)適當(dāng)?shù)囊?guī)范的可能性。
現(xiàn)在我們具有對于用戶和內(nèi)容904規(guī)范化的行為矢量。在當(dāng)前的系統(tǒng)中,預(yù)定義 的規(guī)則集被用來確定此行為矢量是否代表喜歡/有用性。依次地,每一個(gè)規(guī)范的特征被考 慮來確定其是否滿足用于指示有用性的預(yù)先指定的閾值。每一個(gè)通過的特征增加了有用性 905的可能性。在某些情況下,給定特征的閾值基于之前的經(jīng)驗(yàn)而由實(shí)施系統(tǒng)的人預(yù)先指定 并調(diào)節(jié)。在其他情況下,這些閾值由系統(tǒng)動態(tài)確定。例如,已知某些特征可呈現(xiàn)雙峰分布, 并且閾值可被動態(tài)地確定位于兩個(gè)模式之間。本發(fā)明還提供機(jī)制,用于插入不同的機(jī)器學(xué) 習(xí)技術(shù),以學(xué)習(xí)哪些特征是最重要的,并且因而動態(tài)學(xué)習(xí)用于從行為矢量轉(zhuǎn)換到有用性可 能性的規(guī)則。 —旦確定了有用性或有用性可能性,分析行為的第二步是了解圍繞那段內(nèi)容的使 用的整個(gè)背景,包括在該使用之前所做的搜索、之前點(diǎn)擊的鏈接、以及之前使用的頁面。所 有這種信息結(jié)合關(guān)于用戶的信息來影響親和力906(親和力能以多種方式被學(xué)習(xí)和儲存, 在2005年12月27日提交的美國專利申請第11/319, 928號中詳細(xì)描述)。然而,在此之 前,有一個(gè)最后的步驟驗(yàn)證(validation)。驗(yàn)證是噪聲濾波的一種形式,其中,親和力連 接被建立在例如文檔和術(shù)語之間,當(dāng)且僅當(dāng)足夠的相似用戶已經(jīng)通過他們的行為證實(shí)此連接。對于親和力的出現(xiàn),一個(gè)用戶建立此連接是不夠的。同樣的背景(對等體)中的最少 數(shù)量的用戶必須已經(jīng)展示出用于驗(yàn)證該親和力的相似的行為和連接。我們稱之為對等驗(yàn)證 的行為。 UseRank 基于用戶背景和意圖、基于學(xué)習(xí)到的親和力和全面的行為指紋的內(nèi)容有用性的最 終等級,UseRank 可媲美因Google而出名的非常流行的PageRank策略。在PageRank中, 基于鏈接到它的其他頁面的數(shù)量,給予每一個(gè)網(wǎng)頁一個(gè)值。另外,來自本身具有高值的網(wǎng)頁 的鏈接將PageRank甚至提高得更多。這種民主(democratic)的策略在讓用戶基于他們的 Google查詢到達(dá)有用的網(wǎng)站中是非常有效的,但是一旦用戶開始在網(wǎng)站本身中尋找進(jìn)一步 的信息時(shí)一般就行不通了。對此的主要原因是在一個(gè)網(wǎng)站中的多個(gè)頁面,尤其是那些帶有 長尾內(nèi)容的網(wǎng)頁,不管在外部或內(nèi)部都沒有被緊密地鏈接到。在內(nèi)部,鏈接由網(wǎng)站的結(jié)構(gòu)唯 一確定,并且更多的鏈接不一定意味著更多的價(jià)值。另外,在此類站點(diǎn)上的許多頁面不是 HTML格式的,例如PDF、 Word文檔、或視頻,并且根本不鏈接到其他內(nèi)容。
基于網(wǎng)站上的用戶行為,UseRank方法學(xué)減少了所有這些問題。代替依靠Web設(shè) 計(jì)者對文檔的鏈接,其依靠Web用戶對文檔的用法,Web用戶在任何網(wǎng)站上都是豐富的信息 來源。用法是學(xué)習(xí)什么內(nèi)容是最有價(jià)值的真正民主的方式。事實(shí)上,PageRank的設(shè)計(jì)者認(rèn) 識到他們的方式是對用戶活動的近似。考慮到與跟蹤用戶在整個(gè)Web上的行為有關(guān)的隱私 問題,Google選擇基于PageRank來近似用戶價(jià)值是有意義的。在UseRank的優(yōu)選實(shí)施方 式中,我們僅跟蹤配備有觀察者標(biāo)記的站點(diǎn)上的用戶行為,并且總是以匿名的方式,除非由 部署觀察者標(biāo)記的網(wǎng)站以其它方式配置。長尾 本發(fā)明的另一個(gè)重要方面出現(xiàn)于親和力引擎所隱含的背景驅(qū)動方式。以內(nèi)容為中 心或以用戶為中心的許多之前的系統(tǒng)都有一個(gè)問題,其中僅僅最受歡迎的產(chǎn)品/內(nèi)容被推 薦。因?yàn)檫@些系統(tǒng)缺乏對用戶當(dāng)前背景/意圖的深刻了解,他們盡了最大的努力。本發(fā)明 提供以背景為中心的方式,其允許親和力引擎將其關(guān)注點(diǎn)窄化到匹配當(dāng)前用戶的背景/意 圖的用戶(對等體)和內(nèi)容的子集,即使該意圖在大的事物體系中不是非常受歡迎的。這 就是已知的產(chǎn)品的長尾,即,這些產(chǎn)品總的來說不是特別流行的,但是極為重要,因?yàn)樗麄?強(qiáng)烈滿足群體中小而重要的子集的需要(見C. Anderson, The Long Tail :Why the Future of Business is Selling Less o預(yù)ore, Hyperion出版社(2006))。本發(fā)明有能力識別隨 同有關(guān)的對等組和相關(guān)的內(nèi)容的長尾興趣,并且因而可在適當(dāng)?shù)臅r(shí)間推薦那些重要的長尾 產(chǎn)品/內(nèi)容(見圖10)。這點(diǎn)對于產(chǎn)品/內(nèi)容提供者來說至關(guān)重要,因?yàn)榻?jīng)常是這些長尾產(chǎn) 品對于群體最有用,并經(jīng)常會導(dǎo)致公司本身獲得最高利潤或利益。 因此,本發(fā)明使用志趣相投(like-minded)的對等體作為使能者來沿著長尾定位 小目標(biāo)片段,而不是使用在現(xiàn)有技術(shù)中已知的個(gè)人問題個(gè)性化或歷史興趣。本發(fā)明提供背 景化定位(contextual targeting)。給定背景中的人們的需要在志趣相投的人們中通常類 似。本發(fā)明的洞察是,人們具有數(shù)以百計(jì)的特征,如果不具有數(shù)以千計(jì)的特征的話。這些特 征沒有交叉連接到現(xiàn)實(shí),所以沒有背景時(shí),很難預(yù)測個(gè)人的使用水平。 一旦個(gè)人是在特定的 背景中,例如,在志趣相投的對等體中,該人表現(xiàn)得與組背景中的其他每個(gè)人類似。因而,如 果某人正在訪問高爾夫器械站點(diǎn)去買高爾夫驅(qū)動器或球棒,那么他表現(xiàn)得與其他打高爾夫 球的人相似。此人的政治偏見或他們的文化背景是什么是無關(guān)緊要的。個(gè)人的這些方面沒有相關(guān)性,因?yàn)榇巳嘶诮M成員身份的目前的背景是更有關(guān)的。
群體的智慧 本發(fā)明代表一種利用隱性的群體智慧來創(chuàng)建自適應(yīng)的網(wǎng)站和其他信息門戶的新 方式。在其著作The Wisdom of Crowds中,James Surowiecki解釋了一大組平均個(gè)人的集 體才智幾乎總是超過了專家的才智。為說明此概念,他使用來自縣集市的一個(gè)示例,其中一 組集市參與者嘗試猜測一頭奶牛的重量。 一組所謂的專家例如屠夫、奶農(nóng)等也做猜測。最 后,專家的猜測都偏離了很大的數(shù)目。然而,非專家的群體所猜測的平均重量與奶牛的實(shí)際 重量相差在一磅之內(nèi)。Surowiecki繼續(xù)示出如何在從股票市場預(yù)測到民主統(tǒng)治的每一件事 中看出相似的現(xiàn)象。個(gè)體行為者的組可集體地展示出集體才智水平,甚至超越個(gè)體行為者 自身的總和,這個(gè)觀念在生物學(xué)和人工智能領(lǐng)域中被稱為突現(xiàn)行為(emergent behavior) 和集體的才智。大自然當(dāng)中存在無數(shù)的示例,其中非常簡單的個(gè)體動物,例如螞蟻或蜜蜂, 在滿足組的需要方面,集體展示出非凡的才能和機(jī)智,例如覓食或筑巢。
在網(wǎng)站設(shè)計(jì)的背景中,Surowiecki的專家是Web設(shè)計(jì)者。這些專家試圖對哪些網(wǎng) 頁應(yīng)該鏈接到另外哪些網(wǎng)頁作出正確決策,以使得訪問者最能找到他們所尋找的。Web設(shè)計(jì) 者還可能在調(diào)節(jié)搜索結(jié)果以匹配其訪問者預(yù)期的需要的努力上花費(fèi)許多時(shí)間。在此背景中 的群體是來到此站點(diǎn)的大組網(wǎng)站訪問者。一般地,群體對網(wǎng)站的組織沒有直接的影響。他們 保持沉默。本發(fā)明給此群體出了個(gè)主意,使得他們的集體的動作,即,所表達(dá)的看法的形式, 被收集,并且通過他們對所推薦的內(nèi)容的直接影響來自動驅(qū)動對網(wǎng)站組織的決策。因此,本 發(fā)明出于創(chuàng)建有用網(wǎng)站的目的,深入了解群體的智慧。雖然在優(yōu)選的實(shí)施方式中,群體智慧 的影響被劃分為網(wǎng)站中的推薦和社會化搜索的具體區(qū)域,但是容易想象擴(kuò)展的執(zhí)行,其中 網(wǎng)站的整個(gè)組織、其所有的鏈接和菜單,例如,最終由網(wǎng)站訪問者的行為驅(qū)動并適應(yīng)于網(wǎng)站 訪問者的行為。以這種方式,由多個(gè)相互連接的站點(diǎn)所組成的整個(gè)互聯(lián)網(wǎng)可開始演變并適 應(yīng)為一種最能滿足互聯(lián)網(wǎng)用戶需要的形式。 圖ll提供群體智慧的擬方程,示出背景/意圖如何以廣義的方式被融合來擴(kuò)展群 體智慧的概念,如本發(fā)明的一種實(shí)施方式所示例的。在此擬方程中,每一個(gè)用戶的隱性表決 根據(jù)當(dāng)前用戶背景和用戶在其中作出表決的背景之間的相似性被加權(quán)。此方程可被進(jìn)一步 擴(kuò)展來融合用戶之間的相似性。當(dāng)所有的背景都是相同的,那么此方程正確簡化為一個(gè)簡 單的平均。記憶預(yù)測機(jī)器 親和力引擎的動作還可被認(rèn)為是一種記憶預(yù)測機(jī)器的形式。近來的從認(rèn)知科學(xué)的 學(xué)習(xí)教授了 大腦被構(gòu)造成對在記憶的目標(biāo)區(qū)域內(nèi)的對象與概念之間或之中的聯(lián)系進(jìn)行捕 獲和編碼,并以從抽象到具體的層次來組織那些聯(lián)系。基于之前的剌激造成的記憶,對新的 剌激做出響應(yīng)并預(yù)測其結(jié)果,并因而編碼所學(xué)習(xí)到的聯(lián)系。在網(wǎng)站的環(huán)境中,相似地,親和 力引擎通過觀察用戶、對象和背景之間的互動,來學(xué)習(xí)他們之間的聯(lián)系,并且在其存儲器中 記住那些模式,并有層次地儲存。當(dāng)用戶展示之前已經(jīng)由親和力引擎學(xué)習(xí)到的背景時(shí),親和 力引擎指明了存儲器中的適當(dāng)?shù)穆?lián)系,這觸發(fā)了對最滿足當(dāng)前用戶和背景的需要的那些對 象的預(yù)測。圖12是其功能作為記憶預(yù)測機(jī)器的親和力引擎的結(jié)構(gòu)示意圖。
與外部系統(tǒng)的無縫集成 本發(fā)明的一個(gè)重要的方面是其與其他推薦系統(tǒng)、政策和信息來源無縫集成的能 力。 一些示例在圖3中示出。
搜索引擎 當(dāng)用戶在以本發(fā)明實(shí)施的站點(diǎn)上執(zhí)行搜索時(shí),搜索術(shù)語被發(fā)送到親和力引擎進(jìn)行 處理。親和力引擎基于從過去的群體行為學(xué)習(xí)到的親和力,確定給定的那個(gè)搜索的背景下 最有用的內(nèi)容集。然而,親和力還可考慮來自外部來源的看法,例如搜索引擎。搜索引擎 301有它自己的親和力引擎可接受的推薦集。來自搜索引擎的相關(guān)性評級可與親和力引擎 中所體現(xiàn)的信息結(jié)合,來產(chǎn)生單個(gè)的統(tǒng)一的推薦集(在2005年12月27日提交的美國專利 申請第11/319, 928號中更充分地討論)。XML feed是用于本系統(tǒng)與搜索引擎接口的一種 典型的方式。
產(chǎn)品目錄 本發(fā)明還提供用于自動輸入產(chǎn)品或媒體目錄305的機(jī)制。這樣做的優(yōu)選方式是使
用系統(tǒng)可訪問的XML feed。目錄可用三種方式來使用 1)來自目錄的信息可隨著推薦一起被顯示,如摘要或價(jià)格; 2)來自目錄的屬性可被用來過濾結(jié)果集,例如,網(wǎng)站設(shè)計(jì)者可能想要把推薦限制 為僅為網(wǎng)站的特定部分的產(chǎn)品或PDF。 3)在上述行為指紋過程中,出于規(guī)范的目的,內(nèi)容分類可被用來對內(nèi)容分組。
廣告服務(wù)器 本發(fā)明的另一方面在于它是內(nèi)容無關(guān)的。系統(tǒng)可觀察進(jìn)行的行為并推薦網(wǎng)頁、圖 片、視頻、文檔、博客、下載以及甚至廣告。在推薦廣告的情況下,經(jīng)常有必要與廣告服務(wù)器 集成。廣告服務(wù)器303可提供與如上所述的搜索引擎和目錄系統(tǒng)都相似的功能性。本發(fā)明 以與那些接口相似的方式與廣告服務(wù)器接口 ,通常通過XML。
推銷系統(tǒng) 推銷系統(tǒng)304在一般情況下為網(wǎng)站所有者提供一種機(jī)制以影響什么產(chǎn)品/內(nèi)容被 推薦給用戶。在本發(fā)明中,優(yōu)選地,群體是主要的推薦驅(qū)動器。然而,有些時(shí)候,所有者有必 須被滿足的具體需要,但與群體所表示的興趣無關(guān)。例如,在特定的背景中,所有者可總是 選擇首先推薦一特定的產(chǎn)品或一段內(nèi)容,例如,可能有產(chǎn)品的促銷。所有者也可能希望影響 群體來購買具有更高利潤的產(chǎn)品,或防止某段內(nèi)容被推薦。本發(fā)明有兩種方式來實(shí)踐這種 影響。首先是通過作為本發(fā)明的一個(gè)組件的定制規(guī)則接口。這里,網(wǎng)站所有者可登錄,并從 多種預(yù)定義的規(guī)則類型中選擇,規(guī)則類型包括鎖定,即,迫使一個(gè)特定的推薦顯示;列入黑 名單,即,防止一個(gè)給定的推薦或一類推薦顯示;和激勵,即,增加一個(gè)推薦或一類推薦顯示 的機(jī)會,但是仍然實(shí)踐群體智慧。對于給定的搜索術(shù)語,對于給定的一類用戶,在特定的時(shí) 間范圍,所有的這些規(guī)則類型可被全局應(yīng)用或僅在一個(gè)給定的背景中應(yīng)用,例如在一個(gè)特 定的頁面上。另一種規(guī)則類型允許所有者充分實(shí)踐群體智慧,但是影響推薦的目標(biāo)。例如, 親和力引擎可被告知來推薦用戶最可能購買的產(chǎn)品,而非關(guān)注于推薦有用的產(chǎn)品。另一個(gè) 示例,親和力引擎可被要求來推薦最可能引導(dǎo)用戶到特定的目標(biāo)頁面集的內(nèi)容。除了定制 規(guī)則接口,本發(fā)明提供用于以XML形式從外部推銷應(yīng)用中輸入規(guī)則的機(jī)制。當(dāng)規(guī)則類型存 在于外部系統(tǒng)中而在本發(fā)明中還不存在時(shí),則定制規(guī)則插件可被設(shè)計(jì)用于所發(fā)明的系統(tǒng), 其匹配外部規(guī)則類型所期望的行為。
用戶特征分析 親和力引擎可與之集成的另一類型系統(tǒng)是用戶特征分析系統(tǒng)302。在其最簡單的
19形式中,特征分析系統(tǒng)是與用戶相關(guān)的屬性集,例如人口統(tǒng)計(jì)屬性。這些屬性可在推薦請求 時(shí)被傳給親和力引擎。如前所述,親和力引擎可在識別對等組時(shí)考慮這些屬性,其然后影響 返回的推薦。更復(fù)雜的特征分析系統(tǒng)要求與其他的外部組件相似的XML集成。這里,親和 力引擎可能需要在對等識別過程期間動態(tài)地聯(lián)系外部特征分析系統(tǒng)。
優(yōu)選實(shí)施方式 在本發(fā)明的優(yōu)選實(shí)施方式中,推薦系統(tǒng)在軟件即服務(wù)(Software as aService, SaaS)模型被實(shí)施,以提供幫助網(wǎng)站訪問者找到他們喜歡或需要的產(chǎn)品或內(nèi)容的自動建議。 圖2是用于基于背景的內(nèi)容推薦的方法和設(shè)備的結(jié)構(gòu)示意圖。圖2中,用戶與網(wǎng)站的互動 產(chǎn)生隱性的突現(xiàn)行為。這種用戶互動包括頁面轉(zhuǎn)送、鏈接、條目蹤跡、查詢、頁面大小、鼠標(biāo) 移動、對等體、消極經(jīng)驗(yàn)、虛擬書簽、花費(fèi)的時(shí)間、虛擬打印、退出蹤跡,諸如此類。根據(jù)本發(fā) 明在推薦/親和力引擎中處理這些行為,導(dǎo)致以社會化搜索和導(dǎo)航指導(dǎo)的形式的自動的內(nèi) 容推薦和產(chǎn)品推薦,還提供實(shí)時(shí)反饋給商人,例如關(guān)于訪問者倶樂部(Visitor Club),以及 識別內(nèi)容缺口 (gap)(其中每一項(xiàng)下面都更詳細(xì)地討論)。下面的關(guān)鍵過程包括推薦系統(tǒng)
捕獲隱性行為——隱性網(wǎng)站行為201作為推薦系統(tǒng)的輸入在客戶端由嵌入網(wǎng)站 頁面的小片段JavaScript代碼捕獲,例如,通過網(wǎng)站模板。然后該行為被發(fā)送到遠(yuǎn)程推薦 引擎,在那里使用這里描述的全面行為指紋技術(shù)來將其處理。
提煉集體的智慧——推薦/親和力引擎202處理所有進(jìn)來的信息以識別網(wǎng)站訪 問者中出現(xiàn)的意圖,并捕獲群體的集體智慧。推薦引擎識別并學(xué)習(xí)用戶、內(nèi)容和術(shù)語之間和 之中的親和力,識別一貫的行為模式和消除噪聲。親和力引擎還實(shí)時(shí)認(rèn)出并適應(yīng)不斷變化 的時(shí)尚和趨勢、以及周期性的行為模式例如季節(jié)性模式、和其他的用戶興趣的轉(zhuǎn)移。
傳遞推薦結(jié)果和搜索結(jié)果——當(dāng)訪問者到達(dá)頁面時(shí),推薦引擎被傳送了關(guān)于用 戶當(dāng)前背景的信息,要么由稱為推薦標(biāo)記的客戶的JavaScript片段傳送,要么由網(wǎng)站服務(wù) 器傳送,并且請求適當(dāng)?shù)耐扑]。推薦引擎使用此申請中所描述的技術(shù)將用戶背景翻譯成 意圖,識別適當(dāng)?shù)膶Φ冉M,并最終返回一組內(nèi)容推薦203,這些內(nèi)容推薦基于其被計(jì)算出的 UseRankTM而排序。這些推薦之后被顯示在用戶瀏覽器的網(wǎng)頁中。這些推薦可采取導(dǎo)航鏈 接或增強(qiáng)的搜索結(jié)果的形式。當(dāng)傳遞推薦結(jié)果時(shí),推薦系統(tǒng)可另外聯(lián)系其他外部服務(wù),諸如 網(wǎng)站的全文搜索引擎、產(chǎn)品目錄或廣告服務(wù)器(見圖3)。
顧客門戶——在優(yōu)選實(shí)施方式中,網(wǎng)站的所有者也可通過稱為Insights 204的 顧客門戶訪問由推薦引擎所學(xué)習(xí)到的信息和模式。顧客門戶提供能力來配置推薦系統(tǒng)和添 加推銷規(guī)則、以及觀看由提供關(guān)于群體對網(wǎng)站使用的信息的一組報(bào)告以及系統(tǒng)所學(xué)習(xí)到的 行為模式和親和力。圖13示出在優(yōu)選的實(shí)施方式中的顧客門戶主頁的截屏。通過使用此 門戶中的鏈接可訪問許多不同的報(bào)告和配置。例如,本發(fā)明允許產(chǎn)品/內(nèi)容缺口檢測,其中 缺口基于站點(diǎn)上的用法模式被檢測,并且?guī)椭军c(diǎn)所有者在缺口被檢測的那些區(qū)域中引進(jìn) 新的產(chǎn)品或內(nèi)容。另一個(gè)示例,顧客門戶還提供一組報(bào)告給網(wǎng)站所有者,以跟蹤推薦引擎正 帶給網(wǎng)站的持續(xù)的價(jià)值。圖14示出跟蹤在網(wǎng)站上由于推薦的存在而收入提升的A/B報(bào)告 的截屏。發(fā)明人始終如一地看到收入提高了 20-30%或更多。在門戶中可得的其他提升報(bào) 告包括改善網(wǎng)站中的頁面瀏覽、投入時(shí)間、站點(diǎn)粘著性(stickiness)、平均訂單價(jià)值、和到 指定"商業(yè)目標(biāo)"的用戶轉(zhuǎn)變。
應(yīng)用
下面的討論涉及上述技術(shù)的不同應(yīng)用 圖15是示出群體指導(dǎo)的電子商務(wù)的截屏。在圖15中,呈現(xiàn)了產(chǎn)品推薦的5種不 同的能力 1)基于志趣相投的對等體關(guān)于他們的產(chǎn)品考慮的親和力,S卩,如前所述的觀察到 的全面的行為指紋,出于比較購物和向上銷售(up-selling)的目的,示出比較的產(chǎn)品,也 稱為相似的或競爭的產(chǎn)品?;诳紤]的對等推薦推動了更高端/特殊的產(chǎn)品,并為站點(diǎn)產(chǎn) 生更多的收入和利潤。 2)附屬產(chǎn)品也被示出,用于相關(guān)的交叉銷售/非競爭的產(chǎn)品例如配件,以增加總 訂單量。 3)本發(fā)明還示出最流行的產(chǎn)品,如整個(gè)站點(diǎn)上或某個(gè)分類中最具吸引力的產(chǎn)品。
4)本發(fā)明還產(chǎn)生意圖驅(qū)動(intent-driven)的登陸頁面(landing page),也稱為 AdGuide和Site Concierge,具有基于訪問者在標(biāo)準(zhǔn)的Web搜索引擎如Google、 Yahoo或 MSN上搜索什么的推薦。如果訪問者在Google上搜索"Viking Cooktop"并登陸了顧客站 點(diǎn),AdGuide會將最好的VikingCooktop推薦動態(tài)地提供給登陸頁面上的訪問者,而非示給 他一些無關(guān)的事物。 5)本發(fā)明還提供基于上述的對產(chǎn)品的群體過濾的搜索。 對于對等驅(qū)動的推薦,本發(fā)明自動識別具有獨(dú)特的興趣的小型的和大型的人口部 分,并引導(dǎo)個(gè)人到流行的、競爭的和附屬的產(chǎn)品。本發(fā)明提供用戶意圖和產(chǎn)品映射,其將購 物者的意圖翻譯成對等驗(yàn)證的產(chǎn)品和品牌。發(fā)明者已經(jīng)基于獨(dú)立的研究找到7倍的轉(zhuǎn)換能 力。本發(fā)明提供時(shí)尚和趨勢檢測,并實(shí)時(shí)識別和適應(yīng)購物者興趣的季節(jié)性的、促銷的和其他 轉(zhuǎn)移。本發(fā)明還允許產(chǎn)品缺口檢測,其中產(chǎn)品缺口被檢測并且?guī)椭W(wǎng)站所有者在缺口被檢 測到的那些區(qū)域引進(jìn)新的產(chǎn)品或內(nèi)容。本發(fā)明用實(shí)時(shí)顧客反饋協(xié)助推銷。其與現(xiàn)有的推銷、 促銷、分段和搜索一起工作,并擴(kuò)大了產(chǎn)品或產(chǎn)品家族。本發(fā)明實(shí)時(shí)地提供對由無形的群體 所產(chǎn)生的凈收入的內(nèi)置的同時(shí)的A/B測試和報(bào)告。 圖16是示出具有旅行示例的群體指導(dǎo)的產(chǎn)品搜索的截屏。在圖16中,用戶已經(jīng) 查詢紐約市的旅館。由于此網(wǎng)站的相似的用戶出于相似的目的,并通過觀察用戶怎樣使用 返回的信息,對此人推薦關(guān)于在紐約市中選擇旅館?;谥救は嗤兜膶Φ润w的興趣和意圖 而非通過簡單匹配關(guān)鍵字和元數(shù)據(jù)(這個(gè)情況下是"紐約旅館")來示出許多不相關(guān)的結(jié) 果,此搜索結(jié)果更加有效和相關(guān)。 圖17是示出群體指導(dǎo)的營銷和在線消費(fèi)勘察(online lead generation)的截 屏。如同電子營銷應(yīng)用一樣,五種不同的能力被提供給營銷網(wǎng)站。 1)本發(fā)明此特征的方面包括涉及UseRank 和隱性學(xué)習(xí)的社會化搜索。這種方式 是意圖驅(qū)動的、自適應(yīng)的,并利用了隱性公眾分類、群體術(shù)語,例如他們使用的鏈接文本以 及他們輸入的搜索查詢,如上所述。本發(fā)明支持音頻、視頻、二進(jìn)制代碼和所有其他內(nèi)容類 型,因?yàn)樗槐刈陨斫馕鰞?nèi)容,而典型的搜索引擎需要這么做,因而僅限于文本內(nèi)容和元數(shù) 據(jù)。 2)本發(fā)明還基于志趣相投的用戶的隱性的行為反饋來提供相關(guān)的或相似的內(nèi)容。 本發(fā)明基于背景和意圖,通過有用性和切合目標(biāo)性將推薦分等級。 3)本發(fā)明還提供最流行的分類,其提供在整個(gè)站點(diǎn)或站點(diǎn)的子部分中具有最大價(jià)
21值的內(nèi)容。此促銷信息導(dǎo)致商業(yè)目標(biāo)轉(zhuǎn)變的增加,如試用/下載/注冊轉(zhuǎn)變,并可在網(wǎng)站或 主題的水平下被提供。 4)提供了下一步特征,其涉及導(dǎo)致顧客轉(zhuǎn)變的常見的接下去的步驟。下一步可能 是商業(yè)過程中的任何一個(gè)下一步或與該過程有關(guān)的將要閱讀的正常的下一個(gè)內(nèi)容集。
5)相似的意圖驅(qū)動的登陸頁面,如同上述的電子營銷應(yīng)用一樣,對于營銷網(wǎng)站是 可用的。 圖18是示出根據(jù)本發(fā)明的社會化搜索的截屏。在該示例中,對儲存設(shè)備進(jìn)行搜 索。用戶被提供有信息,其是關(guān)于信息是否切合目標(biāo)和多少訪問者、以及流行評級和群體等 級,即UseRankTM。切合目標(biāo)的值也與結(jié)果一同被提供。進(jìn)一步地,基于親和力引擎中的信 息,結(jié)果由有用性分類。作為之前和之后的比較,還提供了來自IR或全文搜索引擎的初始 的關(guān)鍵字等級。在此示例中,如果沒有使用UseRankTM,主要的儲存產(chǎn)品的這段好信息可能 作為等級87而被掩藏了,即第9搜索結(jié)果頁面上的第7個(gè)結(jié)果,因而沒有人能找到和使用 它。UseRankTM已經(jīng)將它移動到搜索結(jié)果的第一頁面上的第三位。在接口水平,如果那里不 使用本發(fā)明,則原始結(jié)果鏈接被提供來給予用戶初始結(jié)果。這是另外一種看見UseRankTM的 之前和之后的影響的方式。 圖19是示出群體指導(dǎo)的在線支持以促進(jìn)顧客群中的自助服務(wù)和滿意的截屏。此 頁面示出頂級問題解決方案,包括最有幫助的文章、最常見的問題解答、和幫助論壇、以及 博客文章。此頁面還示出相關(guān)幫助,包括關(guān)于這個(gè)主題的有深度的文章、可選擇的解決辦 法、以及,最后地提供了提示。進(jìn)一步地,提供了常見的隨后步驟,包括解決方案、常見的下 載、以及附加的支持信息和聯(lián)系信息的自然的隨后步驟。最后,基于UseRankTM和隱性學(xué)習(xí), 本發(fā)明示出社會化搜索,其是本發(fā)明的此實(shí)施方式的關(guān)鍵方面。因此,社會化搜索是意圖驅(qū) 動的和自適應(yīng)的,利用了隱性公眾分類,并支持所有的內(nèi)容類型。對于這種使用的其他好的 支持應(yīng)用包括知識管理(KM)門戶、社區(qū)論壇和討論線索(discussion thread)、聊天、維基 和開發(fā)者的網(wǎng)絡(luò)等等。 圖20示出群體指導(dǎo)的內(nèi)部網(wǎng)和知識門戶。在此示例中,社會化搜索被用于內(nèi)部網(wǎng) 中。該搜索返回相關(guān)頁面,其包括關(guān)于這個(gè)主題的相似的頁面,這些頁面由過去的對等體經(jīng) 驗(yàn)所證明,并且啟用偶然發(fā)現(xiàn)。進(jìn)一步地,該搜索過濾掉低價(jià)值的內(nèi)容,本發(fā)明還提供最流 行的搜索結(jié)果,其包括具有最大價(jià)值的內(nèi)容、公司內(nèi)的頂級應(yīng)用、和部門所特有的信息或跨 公司的信息。最后,本發(fā)明提供隨后的步驟,包括人們從此頁面去滿足他們的目的、在商業(yè) 過程中的下一步、以及關(guān)于該主題的將閱讀的下一個(gè)內(nèi)容集。外部網(wǎng),例如醫(yī)患門戶、經(jīng)銷 商網(wǎng)、顧客門戶,是其他應(yīng)用示例。 圖21示出在媒體站點(diǎn)上所實(shí)施的推薦,并且圖22示出在媒體站點(diǎn)上所實(shí)施的社 會化搜索。圖23是示出群體指導(dǎo)的媒體和跨站點(diǎn)的背景的推薦的截屏。相似的文章和博 客基于相似的背景被推薦。如果你正在閱讀泰格伍茲高爾夫故事,基于其他相似的對等興 趣,其他三個(gè)相關(guān)的泰格新聞被供給相同的訪問者。訪問者得到更多的內(nèi)容并滿意。此站 點(diǎn)得到更高的CPM和CPA,這兩個(gè)都是從廣告的角度對訪問者轉(zhuǎn)換率和站點(diǎn)價(jià)值的當(dāng)前工 業(yè)測量。也被Baynote稱為BrandRank 的UseRank 還可被用來將關(guān)于媒體的廣告和產(chǎn)品 重新分等級,而非隨機(jī)地或基于關(guān)鍵字匹配放置廣告和產(chǎn)品。對等體所驗(yàn)證的廣告具有明 顯更高的CPM和CPA值,并且因此增加了媒體站點(diǎn)的收入。另外,這些不同的來源所包含的信息被用于親和力引擎,其發(fā)現(xiàn)不同站點(diǎn)中的跨站點(diǎn)親和力。結(jié)果是提供切題的內(nèi)容和產(chǎn)
PI
PR o 圖24是本發(fā)明被用來推薦視頻內(nèi)容的示例。如此申請所述,本發(fā)明是內(nèi)容無關(guān)的
并有能力完全基于隱性用戶動作來學(xué)習(xí)術(shù)語、用戶和內(nèi)容之間的親和力。 圖25示出隱性主題云(Implicit Topic Cloud)的截屏。本發(fā)明的另一個(gè)應(yīng)用
是收集和顯示群體詞匯或術(shù)語。表面上,主題云看起來與明確的加了標(biāo)記的云類似,如
Deli-cio-us、社會書簽等。但是關(guān)鍵的不同在于隱性。隱性主題云是基于站點(diǎn)上實(shí)際的用
戶行為建立的,即,他們所輸入的查詢和他們所使用的鏈接文本。行動勝于雄辯。隱性主題
云反映在站點(diǎn)訪問者的100%的興趣中,不是愿意給事物加標(biāo)記的少數(shù)的大聲的訪問者。沉
默的大多數(shù)是收集真實(shí)群體智慧的關(guān)鍵。 圖26示出本發(fā)明和廣告服務(wù)器之間的集成的結(jié)構(gòu)視圖。為將最好的廣告提供給 用戶,集成系統(tǒng)首先聯(lián)系現(xiàn)有的廣告服務(wù)器,以得到向給定的人口統(tǒng)計(jì)和其他信息的用戶 顯示的一個(gè)可接受的廣告列表。然后此列表被發(fā)送到親和力引擎,其基于廣告、用戶和內(nèi)容 之間的所學(xué)習(xí)到的親和力,選擇最好的廣告顯示給當(dāng)前用戶。這允許所提供的廣告對于用 戶以及用戶當(dāng)前的背景和意圖都是適當(dāng)?shù)摹?除了社會化搜索和在線內(nèi)容/產(chǎn)品推薦,還有許多方式來利用由推薦引擎所提煉 的群體智慧。許多應(yīng)用可被建立或修改來通過對推薦引擎的API而直接深入了解此智慧。 圖4是示出本發(fā)明的作用是群體智慧平臺的結(jié)構(gòu)圖。群體智慧平臺還可包括這些條目,如 背景化電子郵件營銷(contextual email marketing)、移動應(yīng)用、IPTV系統(tǒng)、SE0/SEM應(yīng)用 和定制應(yīng)用中的混搭。在這些系統(tǒng)中,來自推薦引擎的輸入可被用來動態(tài)確定最適當(dāng)?shù)男?息和/或信息組織以呈現(xiàn)給用戶。這種平臺是建立在包括如AJAX和REST (下面討論)這 些特征的Web服務(wù)上的。因此,本發(fā)明是建立在新版Web 2.0基礎(chǔ)之上的,其包括對無形群 體的真實(shí)了解、從志趣相投的對等體聚集信息、作出內(nèi)容推薦或產(chǎn)品推薦、提供現(xiàn)場的社會 化搜索、隱性的基于群體的報(bào)告,諸如此類。下面的描述給出關(guān)于他們怎樣被部署的細(xì)節(jié)
電子郵件推薦營銷使用大量的電子郵件與顧客和可能的顧客聯(lián)系。但是電子郵 件活動的內(nèi)容一般由營銷人員確定。本發(fā)明通過眾包(crowd-sourcing)給志趣相投的對 等體而提高了電子郵件活動的質(zhì)量。電子郵件的內(nèi)容由流行的或是與志趣相投的電子郵件 讀者感興趣的事物相似的事物所確定。營銷商簡便地促進(jìn)了讓一個(gè)顧客隱性地將內(nèi)容推廣 給另一個(gè)顧客的過程。 移動推薦由于移動設(shè)備如手機(jī)和個(gè)人設(shè)備的小尺寸,移動推薦的質(zhì)量要求甚至 比Web更高。本發(fā)明的志趣相投的對等體和意圖驅(qū)動的方式好于傳統(tǒng)的基于協(xié)同過濾、頁 面瀏覽量和人口統(tǒng)計(jì)或購買數(shù)據(jù)的方式。意圖/背景驅(qū)動的對等體預(yù)測人們的需求遠(yuǎn)遠(yuǎn)好 于競爭方式。 IPTV推薦對于使用數(shù)字TV/HDTV來觀看互聯(lián)網(wǎng)所傳送的電影和視頻節(jié)目,相似 的推薦是有效的。有數(shù)以千計(jì)的電影和TV節(jié)目選擇,像"你還可能喜歡這些電影"的特征 對于向上銷售和交叉銷售電影和TV節(jié)目是極為重要的。背景驅(qū)動的對等推薦是對于喜歡 該推薦的觀眾最有效的方式。 即時(shí)連接圖27示出即時(shí)連接系統(tǒng)的結(jié)構(gòu)視圖。由于本發(fā)明可識別志趣相投的對 等體,除了隱性地收獲他們的集體智慧和對個(gè)人做出對等推薦,本發(fā)明還可將個(gè)人與志趣相投的對等組連接起來并讓他們交流信息、知識和經(jīng)驗(yàn)。這同彼此不認(rèn)識的志趣相投的對 等體的現(xiàn)實(shí)世界的經(jīng)驗(yàn)相似。想象你在Best Buy購買TV,你看見其他的志趣相投的對等體 也在購買TV,你可以向他們詢問他們關(guān)于某些產(chǎn)品的經(jīng)驗(yàn)。 SE0/SEM推薦本發(fā)明還用于在登陸站點(diǎn)的時(shí)刻指導(dǎo)網(wǎng)站訪問者。此特征被稱 為"AdGuide", "Site Concierge",禾口 "Site Maitre' d"。本申請檢查人們已經(jīng)在Google、 Yahoo、 MSN、 ASK和其他主要Web搜索引擎上搜索的查詢,然后使用這些查詢作為用戶意 圖的代理,來為訪問者在其登陸該站點(diǎn)時(shí),在無論是預(yù)先設(shè)計(jì)的登陸頁面(SEM)還是正常 的搜索結(jié)果頁面(SEO)上,顯示正確的產(chǎn)品或內(nèi)容。例如,如果訪問者在Google上搜索 "Viking Cooktop"并登陸B(tài)aynote顧客站點(diǎn),AdGuide基于志趣相投的對等體的集體的興 趣,在登陸頁面上將最好的Viking cooktop推薦動態(tài)地提供給訪問者,而非通過簡單地匹 配關(guān)鍵字給他顯示一些不相關(guān)的或不太重要的內(nèi)容。 基于親和力引擎所學(xué)習(xí)到的親和力,本發(fā)明還有能力提供關(guān)鍵字推薦系統(tǒng),其提 供建議給營銷商,在該系統(tǒng)上關(guān)鍵字應(yīng)該在外部搜索引擎上被購買,作為他們的SEO/SEM 努力的一部分。例如,本發(fā)明可建議群體最常使用來描述網(wǎng)站上的內(nèi)容的那些術(shù)語,以及最 有可能導(dǎo)致站點(diǎn)中有用的內(nèi)容的那些術(shù)語。此外,假設(shè)特定集合的關(guān)鍵字已經(jīng)被購買了,本 發(fā)明可建議群體所使用的具有對現(xiàn)有集合高的親和力的其他詞語。要么是通過顧客門戶中 的報(bào)告,這些推薦可被提供給SE0/SEM商人,或者這些推薦可直接與外部SE0/SEM系統(tǒng)集 成,以動態(tài)地和自動地競標(biāo)推薦關(guān)鍵字。 博客、論壇、和討論線索推薦本發(fā)明可用于群體產(chǎn)生的內(nèi)容,諸如博客、論壇、討 論、播客(pod cast)、視頻內(nèi)容等等。由于涉及的內(nèi)容數(shù)量,以正確的順序呈現(xiàn)正確的內(nèi)容 比專家產(chǎn)生的網(wǎng)站甚至更重要。使用志趣相投的對等體用于推薦和社會化搜索是極為重要 和有效的。這些網(wǎng)站可以是面向公眾的博客站點(diǎn)、或要求登錄的站點(diǎn)如伙伴門戶或醫(yī)患門 戶、或開發(fā)者的網(wǎng)絡(luò)、或內(nèi)部網(wǎng)。諸如"相似的內(nèi)容"、"附屬產(chǎn)品"、"接下來的步驟"、"最流行 的"的特征和社會化搜索是非常有用和有效的。 Insights(訪問者倶樂部、內(nèi)容缺口等)Insights,顧客門戶,早些時(shí)候已經(jīng)在 本申請中部分地討論了。雖然本發(fā)明的主要使用是作為自動推薦系統(tǒng),但是有時(shí)候站點(diǎn) 管理者可能想要基于親和力引擎所學(xué)習(xí)到的知識,來修改推薦系統(tǒng)的行為或觀看報(bào)告。 Insights目前通過它的UI提供三個(gè)主要的功能分類配置、管理和報(bào)告。配置使得站點(diǎn)管 理者充分配置完整的功能和部署所需的推薦引擎的所有方面,包括與信息的外部來源如全 文搜索引擎和廣告服務(wù)器集成。管理使得站點(diǎn)管理者能夠以整體的方式或?qū)τ谝?guī)定的背景 所特有的方式(例如一個(gè)特定的搜索術(shù)語或頁面位置或用戶),來修改社會化搜索和推薦 的行為。例如,管理者可創(chuàng)建產(chǎn)品/內(nèi)容促銷,以在設(shè)置的時(shí)間段凌駕于群體智慧之上,可 將產(chǎn)品/內(nèi)容加入黑名單而不被推薦,人工修改或提升規(guī)定的產(chǎn)品/內(nèi)容類別,或建立商業(yè) 規(guī)則例如限制適用于特定的背景中的推薦的產(chǎn)品/推薦的類別。報(bào)告提供關(guān)于由親和力引 擎所提煉的群體智慧的各種視圖。雖然報(bào)告包括在傳統(tǒng)的分析中可找到的基于點(diǎn)擊的和基 于購買的信息的子集,但是它們超越了這些,提供了許多關(guān)于群體智慧的細(xì)節(jié),該群體智慧 通過由親和力引擎所學(xué)習(xí)到的全面的行為指紋和連接被提煉。示例報(bào)告討論如下。
內(nèi)容缺口報(bào)告使用親和力引擎來分析未被站點(diǎn)上現(xiàn)有的內(nèi)容滿足的那些用戶興 趣。使用全面行為指紋技術(shù),并通過分析本申請?jiān)缧r(shí)候討論的群體行為,親和力引擎可識
24別群體興趣。然后親和力引擎可分析所有的情況,其中特定興趣由用戶和該用戶隨后的行 為表達(dá),包括內(nèi)容的使用和提取的價(jià)值水平、以及隨后的搜索或退出。如果大部分的具有特 定興趣的用戶群未能找到有用內(nèi)容,那么該興趣被指定為內(nèi)容缺口。由親和力引擎所推測 的缺口達(dá)到的程度也可被報(bào)告。然后管理者可采取必要的動作以通過添加新內(nèi)容來補(bǔ)救該 缺口,并且之后繼續(xù)使用內(nèi)容缺口報(bào)告來查看缺口存在的影響。 訪問者倶樂部報(bào)告提供關(guān)于由親和力引擎所學(xué)習(xí)到的親和力的最全面的觀點(diǎn)。站 點(diǎn)的訪問者基于共享的興趣被隱性地分組。每一個(gè)興趣組或訪問者倶樂部,隨同該倶樂部 中的訪問者的數(shù)量、他們總體的活動水平、描述該倶樂部的術(shù)語的虛擬公眾分類、以及對于 在該倶樂部的興趣背景中對倶樂部最有用的內(nèi)容/產(chǎn)品,一起被顯示在界面中。另外,所有 的倶樂部特性可隨著時(shí)間的推移被繪制,以了解興趣隨著時(shí)間的推移的趨勢如何。對于成 員身份的重疊,倶樂部還可相互比較。此報(bào)告把在用戶、內(nèi)容/產(chǎn)品、和術(shù)語/背景之間探 索所學(xué)習(xí)到的聯(lián)系的能力提供給管理者。之后這些聯(lián)系可在Insights的管理部分中驅(qū)動 促銷或其他推銷活動。訪問者倶樂部信息還可用于驅(qū)動所發(fā)明的系統(tǒng)的背景之外的不同的 商業(yè)決策。
結(jié)構(gòu)
推薦服務(wù)器 圖3是示出根據(jù)本發(fā)明的親和力引擎集成的結(jié)構(gòu)示意圖。圖3中,在特定的內(nèi)容 站點(diǎn)中展示可觀測的行為(如當(dāng)前位置和/或搜索)的當(dāng)前用戶,基于之前的動作或用戶 屬性,來訪問親和力引擎,其包括資產(chǎn)/產(chǎn)品、用戶和術(shù)語,全部被基于親和力安排歸類。提 供關(guān)于產(chǎn)品、分類、信息、媒體等諸如此類的資產(chǎn)推薦給用戶。親和力引擎由站點(diǎn)所有者填 充,站點(diǎn)所有者提供管理性輸入和施加管理性影響。信息由XML/直接輸入提供。管理性輸 入和管理性影響過濾、限制和催化親和力引擎,施加推銷規(guī)則,以及表達(dá)目的,例如,可能使 用或可能購買特定的產(chǎn)品。資產(chǎn)信息還可以XML信息的形式(例如產(chǎn)品目錄或全文搜索工 具)被提供。親和力引擎從訪問者群體收集隱性意見,以對當(dāng)前用戶作出這種資產(chǎn)推薦。這 些隱性意見包括資產(chǎn)動作,例如頁面上所花費(fèi)的時(shí)間、滾讀、鼠標(biāo)移動或點(diǎn)擊、頁面互動、和 虛擬打印或書簽;資產(chǎn)導(dǎo)航和資產(chǎn)導(dǎo)航模式,包括例如進(jìn)入路徑、退出路徑、所使用的連接、 重復(fù)的訪問、以及頻率訪問、后退按鈕的使用、以及推薦使用;和訪問者群體搜索,包括輸入 和/或重新輸入的術(shù)語、點(diǎn)擊的結(jié)果、使用的結(jié)果、和隨后的導(dǎo)航。 圖28是示出本發(fā)明的優(yōu)選實(shí)施方式的系統(tǒng)結(jié)構(gòu)的方框示意圖。此結(jié)構(gòu)的各個(gè)方 面的更加詳細(xì)的討論提供如下。為了更詳細(xì)地了解圖28,必須參考申請人的共同未決的 2005年12月27日提交的美國專利申請第11/319, 928號,其通過引用而被整體并入此處, 并且其更詳細(xì)地描述了用于有關(guān)本發(fā)明的使用的優(yōu)選的系統(tǒng)。 此結(jié)構(gòu)由服務(wù)器場20、顧客企業(yè)22、和用戶瀏覽器21組成。用戶瀏覽器配備有擴(kuò) 展23,并訪問在顧客企業(yè)22的顧客服務(wù)器25以及經(jīng)由負(fù)載均衡器27訪問服務(wù)器場20。目 前使用HTTPS協(xié)議實(shí)現(xiàn)與服務(wù)器場的通信。用戶訪問顧客服務(wù)器合乎于企業(yè)協(xié)議。瀏覽器 擴(kuò)展23更詳細(xì)地討論如下。 顯要的與本發(fā)明有關(guān)的是提供故障保護(hù)。擴(kuò)展23以及企業(yè)擴(kuò)展24被構(gòu)造成使得, 如果服務(wù)器場20未以成功的方式響應(yīng),那么該擴(kuò)展被關(guān)閉,并且企業(yè)和瀏覽器以正常的方 式互動。本發(fā)明的特征僅在服務(wù)器是活動的并正確執(zhí)行它的操作時(shí)提供。因此,服務(wù)器的失敗無論如何不會損害對于企業(yè)用戶的企業(yè)操作。 如上所述,擴(kuò)展24還被提供用于企業(yè),其經(jīng)由HTTPS協(xié)議,在服務(wù)器場20與負(fù)載 均衡器27通信。 企業(yè)還包括助手(helper) 26,其經(jīng)由代理31使用HTTPS協(xié)議與服務(wù)器場通信。代 理從企業(yè)檢索日志信息并將其提供給日志分析器28,其產(chǎn)生的結(jié)果被呈現(xiàn)給用法庫29。為 了下載信息到親和力引擎32中,代理還與企業(yè)可訪問的任何數(shù)據(jù)來源通信。這些信息包括 目錄數(shù)據(jù)庫信息、使用配置文件數(shù)據(jù)、身份驗(yàn)證數(shù)據(jù)、以及對于確定或過濾推薦和搜索結(jié)果 的目的有用的任何其他形式的數(shù)據(jù)。 信息經(jīng)由不同的分配器30在親和力引擎32和瀏覽器和企業(yè)之間交換。自此,瀏 覽器本身提供意見給服務(wù)器,并響應(yīng)于來于此的搜索或推薦請求接收顯示??蛇x擇地,顧客 服務(wù)器25可使用REST,通過Baynote擴(kuò)展24,直接從親和力引擎32直接請求搜索結(jié)果或 推薦結(jié)果。 本發(fā)明的一個(gè)關(guān)鍵特征是親和力引擎32,其包括多個(gè)處理器33/34和配置管理工 具35。在本發(fā)明的操作期間,一種形式的信息,也稱為智慧,被收集在智慧數(shù)據(jù)庫36中。
客戶端集成 Baynote擴(kuò)展23的優(yōu)選實(shí)施方式使用定制建立的基于標(biāo)記的AJAX結(jié)構(gòu),用于從 容戶收集網(wǎng)站行為,以及將推薦提供給客戶。圖29提供與客戶集成的JavaScript代碼片 段。圖30是示出根據(jù)本發(fā)明的AJAX標(biāo)記平臺的方框示意圖。圖30中,網(wǎng)頁被顯示在客戶 機(jī)上,并包括特定的腳本。在此示例中,來自系統(tǒng)的所有的文件和結(jié)果被作為〈script〉元 素動態(tài)注入D0MS??尚诺腤eb服務(wù)器上的協(xié)調(diào)器提供諸如故障保護(hù)機(jī)制、共同的代碼、政 策、處理機(jī)(handler)、和通信工具這些事物。系統(tǒng)服務(wù)器提供諸如心跳(heartbeat)、共同 的JavaScript、政策、處理機(jī)如觀察者和向?qū)А⒁约坝H和力引擎這類單元。圖30中,協(xié)調(diào)器 是位于可信網(wǎng)站上的一段代碼。在目前優(yōu)選實(shí)施方式中,協(xié)調(diào)器駐留在顧客的網(wǎng)站上。因 此,有一個(gè)文件作為協(xié)調(diào)器的角色來服務(wù),并駐留在特定的顧客網(wǎng)站上,然而它可以駐留在 任何其他可信的網(wǎng)站上。本發(fā)明的此方面由于故障保護(hù)的原因,涉及可信Web服務(wù)器的觀 念。重要的是確定如果所發(fā)明的系統(tǒng)崩潰了,它不會使客戶網(wǎng)站崩潰或阻礙客戶網(wǎng)站。因 此,協(xié)調(diào)器代碼被提供作為故障保護(hù)程序。它檢查故障保護(hù)程序,來確保服務(wù)器的網(wǎng)站崩潰 后的正確的恢復(fù)。 代碼的結(jié)構(gòu)被分解,以使得共同的代碼被使用。共同的代碼或一段代碼被用于所 有類型的推薦。因此,標(biāo)記可能要求共同的代碼。政策可能是顧客所特有的,或它可能是用 戶所特有的。這涉及怎樣做出推薦。政策信息被分別加載。然后,具體的標(biāo)記所需的代碼 也被加載。例如,如果有一個(gè)用于最流行的推薦的標(biāo)記,并且另外一個(gè)是推薦,那么這些標(biāo) 記被加載。然后系統(tǒng)加載執(zhí)行特定的標(biāo)記操作所必需的代碼。另一種類型的標(biāo)記或代碼是 觀察用戶做什么的觀察者,如上所述。用戶看不見標(biāo)記,但它仍然是標(biāo)記。標(biāo)記必須也能夠 與系統(tǒng)進(jìn)行通信。這些功能的每一個(gè)都由一段代碼如JavaScript執(zhí)行,被加載到網(wǎng)頁中。 JavaScript通過動態(tài)腳本注入被加載到頁面。 本發(fā)明的此方面認(rèn)識到網(wǎng)頁可變得更加動態(tài)。例如,存在諸如HTML和JavaScript 的事物,導(dǎo)致事物被動態(tài)添加到頁面。如果腳本標(biāo)記需要一段特定的信息,那么那個(gè)代碼被 注入該頁面。例如,如果需要政策,那么JavaScript標(biāo)記被注入到訪問該政策的頁面。該政策可要求信息的進(jìn)一步注入,例如處理機(jī)。因此,處理機(jī)現(xiàn)在作為JavaScript段被動態(tài) 地注入頁面。以相似的情況處理通信。 上述方法的一個(gè)優(yōu)勢是提供使用第一方cookies或第三方cookies的選擇。顧客 訪問的主要網(wǎng)頁可能是商人的網(wǎng)站。該商人與系統(tǒng)通信以得到關(guān)于推薦等的信息。在此情 況下,該商人是第一方,系統(tǒng)是第三方。作為動態(tài)腳本注入的結(jié)果,本發(fā)明允許cookies設(shè) 置在第一方域和第三方域中。設(shè)置第一和第三方cookies的能力還允許本發(fā)明跨域運(yùn)行。
雖然這里描述的發(fā)明是參考優(yōu)選實(shí)施方式的,但是本領(lǐng)域的技術(shù)人員很容易領(lǐng) 會,在不偏離本發(fā)明的精神和范圍的情況下,本文所闡述的這些可由其他應(yīng)用代替。因此, 本發(fā)明應(yīng)只受限于下面所包括的權(quán)利要求。
權(quán)利要求
一種用于內(nèi)容推薦的由計(jì)算機(jī)實(shí)施的方法,包括以下步驟所述計(jì)算機(jī)接收用戶動作所導(dǎo)致的信息,并識別當(dāng)前用戶的背景;基于所述識別,所述計(jì)算機(jī)找到適當(dāng)?shù)膶Φ冉M,所述對等組代表在所述識別的背景中與所述當(dāng)前用戶最像的其他用戶;所述計(jì)算機(jī)找到所述對等組識別為與所述當(dāng)前背景最相關(guān)的內(nèi)容;以及所述計(jì)算機(jī)產(chǎn)生輸出,所述輸出包括用于顯示給所述當(dāng)前用戶的推薦的內(nèi)容。
2. 如權(quán)利要求l所述的方法,還包括以下步驟 所述計(jì)算機(jī)通過以下操作產(chǎn)生全面的行為指紋 考慮包括多種多樣的用戶行為的輸入;將所有的這些用戶行為與對應(yīng)于所述當(dāng)前用戶在其他頁面上的行為的儲存信息進(jìn)行 互相關(guān),并與群體中其余部分和識別出的對等體在當(dāng)前頁面上的行為進(jìn)行互相關(guān);根據(jù)此分析,所述計(jì)算機(jī)產(chǎn)生所述當(dāng)前用戶在一段特定的內(nèi)容中已經(jīng)找到價(jià)值的可能 性;以及所述計(jì)算機(jī)儲存所述可能性供在學(xué)習(xí)系統(tǒng)中使用。
3. —種由計(jì)算機(jī)實(shí)施的以背景為中心的內(nèi)容推薦方法,其包括以下步驟 所述計(jì)算機(jī)基于代表網(wǎng)站上的用戶動作的輸入,為所述網(wǎng)站上的用戶建立當(dāng)前背景; 所述計(jì)算機(jī)用嵌入所述網(wǎng)站中的觀察者標(biāo)記捕獲所述用戶的當(dāng)前背景信息; 所述計(jì)算機(jī)基于由所述觀察者標(biāo)記所收集的各種的用戶行為確定所述用戶的興趣; 所述計(jì)算機(jī)使用全面行為指紋技術(shù)來分析所述行為;所述計(jì)算機(jī)將所有的結(jié)果信息作為所述用戶的當(dāng)前背景矢量儲存在存儲器中,所述背 景矢量包括在每一個(gè)條目上都帶有權(quán)重的、術(shù)語和文檔的混合矢量,所述權(quán)重反映該術(shù)語 或文檔反映所述用戶的當(dāng)前背景的強(qiáng)烈程度;當(dāng)用戶輸入搜索術(shù)語和/或點(diǎn)擊導(dǎo)航鏈接時(shí),所述計(jì)算機(jī)增加對應(yīng)于被輸入或被點(diǎn)擊 的術(shù)語和短語的所述背景矢量的條目,以捕獲所表達(dá)的興趣;當(dāng)用戶動作進(jìn)一步移動成為過去時(shí),所述計(jì)算機(jī)減少或衰減相應(yīng)的條目;所述計(jì)算機(jī)增加用戶點(diǎn)擊的或基于用戶的隱性動作所確定的用戶表示感興趣的相應(yīng) 的矢量條目文檔;以及根據(jù)前述操作,所述計(jì)算機(jī)產(chǎn)生所述用戶的當(dāng)前背景的代表來作為背景矢量,用于對 所述用戶進(jìn)行內(nèi)容推薦。
4. 如權(quán)利要求3所述的方法,還包括以下步驟基于從聚合智慧所學(xué)習(xí)到的親和力和聯(lián)系,所述計(jì)算機(jī)將所述背景矢量擴(kuò)展和改進(jìn)為 意圖矢量,所述聚合智慧從對群體作為一個(gè)整體的長期的觀察中收集;其中所述意圖矢量通過查看在所述背景矢量中的術(shù)語和文檔與其他術(shù)語的親和力來 創(chuàng)建。
5. 如權(quán)利要求4所述的方法,還包括以下步驟所述計(jì)算機(jī)利用親和力引擎確定親和力,所述親和力允許將所述背景矢量擴(kuò)展為意圖其中所述親和力引擎通過觀看用戶群體在網(wǎng)站上的所有的隱性行為并通過應(yīng)用行為 指紋和使用等級算法來確定興趣和聯(lián)系,從而學(xué)習(xí)文檔和術(shù)語、文檔和文檔、術(shù)語和術(shù)語、以及用戶到其他用戶、文檔、和術(shù)語之間的連接。
6. 如權(quán)利要求5所述的方法,還包括以下步驟所述計(jì)算機(jī)識別共享對當(dāng)前意圖的親和力的用戶的對等組、以及在該意圖的背景中展 示出與所述當(dāng)前用戶最像的行為的那些用戶,所述對等組由用戶矢量代表,其中在所述用 戶矢量中的每一個(gè)用戶條目可具有權(quán)重,該權(quán)重指示他在當(dāng)前背景中對于所述當(dāng)前用戶是 對等體的強(qiáng)烈程度。
7. 如權(quán)利要求6所述的方法,還包括以下步驟所述計(jì)算機(jī)識別哪些文檔在當(dāng)前意圖中對所識別的對等體具有最高的親和力; 其中所述親和力引擎查看與那些對等體相關(guān)的、根據(jù)他們的對等體權(quán)重被加權(quán)的活動性矢量、術(shù)語_文檔矩陣以及下一步矩陣,并聚合地使用這些來計(jì)算對所述當(dāng)前意圖具有最高的親和力的那些文檔;以及其中所述文檔是未過濾的推薦。
8. 如權(quán)利要求7所述的方法,還包括以下步驟所述計(jì)算機(jī)向所述親和力引擎請求關(guān)于所述推薦中的每一個(gè)推薦的群體信息; 其中所述信息與其他資產(chǎn)信息結(jié)合并被顯示給用戶以幫助其了解推薦所隱含的群體 智慧。
9. 如權(quán)利要求8所述的方法,其中所顯示的信息包括以下中的任意項(xiàng)在文檔中找到 價(jià)值的用戶總數(shù)、將文檔與當(dāng)前背景和/或意圖關(guān)聯(lián)起來的對等體的數(shù)量、以及對等群體 已經(jīng)將之與一文檔相關(guān)聯(lián)的術(shù)語和/或短語。
10. 如權(quán)利要求9所述的方法,其中,所述術(shù)語和/或短語包括代表所述群體已經(jīng)關(guān)聯(lián) 到一文檔的術(shù)語的虛擬公眾分類;其中所述虛擬公眾分類由所述親和力引擎基于所述用戶群體的隱性動作自動創(chuàng)建。
11. 一種用于內(nèi)容推薦的設(shè)備,包括用于接收輸入信息以在識別當(dāng)前用戶的背景中使用的裝置;用于基于所述識別而找到適當(dāng)?shù)膶Φ冉M的裝置,所述對等組代表在所述識別的背景中 與所述當(dāng)前用戶最像的其他用戶;用于找到所述對等組識別為與所述當(dāng)前背景最相關(guān)的內(nèi)容的裝置;以及 用于產(chǎn)生包括推薦給所述當(dāng)前用戶的內(nèi)容的輸出的裝置。
12. 如權(quán)利要求11所述的設(shè)備,還包括 用于通過以下操作產(chǎn)生全面行為指紋的裝置 考慮包括多種多樣的用戶行為的輸入;將所有的這些用戶行為與所述當(dāng)前用戶在其他頁面上的行為、以及與群體中其余部分 和所識別的對等體在當(dāng)前頁面上的行為進(jìn)行互相關(guān);根據(jù)此分析,產(chǎn)生所述當(dāng)前用戶在一段特定的內(nèi)容中已經(jīng)找到價(jià)值的可能性;以及 儲存所述可能性供學(xué)習(xí)系統(tǒng)使用。
13. —種以背景為中心的內(nèi)容推薦設(shè)備,包括用于接收代表用戶動作的輸入并用于根據(jù)所述輸入在網(wǎng)站上建立當(dāng)前用戶背景的裝置;被嵌入所述網(wǎng)站用于捕獲所述用戶的當(dāng)前背景信息的觀察者標(biāo)記;用于基于由所述觀察者標(biāo)記所收集的各種的行為確定所述用戶的興趣的裝置; 用于使用全面行為指紋技術(shù)來分析所述行為的裝置;用于將所有的結(jié)果信息作為所述用戶的當(dāng)前背景矢量儲存在存儲器中的裝置,所述背 景矢量包括在每一個(gè)條目上都帶有權(quán)重的、術(shù)語和文檔的混合矢量,所述權(quán)重反映該術(shù)語 或文檔反映所述用戶的當(dāng)前背景的強(qiáng)烈程度;用于當(dāng)用戶輸入搜索術(shù)語和/或點(diǎn)擊導(dǎo)航鏈接時(shí)增加對應(yīng)于被輸入或被點(diǎn)擊的術(shù)語 和短語的所述背景矢量的條目以捕獲所表達(dá)的興趣的裝置;用于當(dāng)用戶動作進(jìn)一步移動成為過去時(shí)減少或衰減相應(yīng)的條目的裝置;用于增加用戶點(diǎn)擊的或基于用戶的隱性動作所確定的用戶表示感興趣的相應(yīng)的矢量 條目文檔的裝置;以及用于根據(jù)前述操作產(chǎn)生所述用戶的當(dāng)前背景的代表作為背景矢量用于對所述用戶進(jìn) 行推薦的裝置。
14. 如權(quán)利要求13所述的設(shè)備,還包括用于基于從聚合智慧所學(xué)習(xí)到的親和力和聯(lián)系將所述背景矢量擴(kuò)展和改進(jìn)為意圖矢 量的裝置,所述聚合智慧從對群體作為一個(gè)整體的長期的觀察中收集;其中所述意圖矢量通過查看在所述背景矢量中的術(shù)語和文檔與其他術(shù)語的親和力來 創(chuàng)建。
15. 如權(quán)利要求14所述的設(shè)備,還包括用于利用親和力引擎確定親和力的裝置,所述親和力允許將所述背景矢量擴(kuò)展為意圖其中所述親和力引擎通過觀看用戶群體在網(wǎng)站上的所有的隱性行為并通過應(yīng)用行為 指紋和使用等級算法來確定興趣和聯(lián)系,從而學(xué)習(xí)文檔和術(shù)語、文檔和文檔、術(shù)語和術(shù)語、 以及用戶到其他用戶、文檔、和術(shù)語之間的連接。
16. 如權(quán)利要求15所述的設(shè)備,還包括用于識別共享對當(dāng)前意圖的親和力的用戶的對等組以及在該意圖的背景中展示出與 所述當(dāng)前用戶最像的行為的那些用戶的裝置,所述對等組由用戶矢量代表,其中在所述用 戶矢量中的每一個(gè)用戶條目可具有權(quán)重,該權(quán)重指示他在當(dāng)前背景中對于所述當(dāng)前用戶是 對等體的強(qiáng)烈程度。
17. 如權(quán)利要求16所述的設(shè)備,還包括用于查看哪些文檔在當(dāng)前意圖中對所識別的對等體具有最高的親和力的裝置; 其中所述親和力引擎查看與那些對等體相關(guān)的、根據(jù)他們的對等體權(quán)重被加權(quán)的活動性矢量、術(shù)語_文檔矩陣以及下一步矩陣,并聚合地使用這些來計(jì)算對所述當(dāng)前意圖具有最高的親和力的那些文檔;以及其中所述文檔是未過濾的推薦。
18. 如權(quán)利要求17所述的設(shè)備,還包括用于向所述親和力引擎請求關(guān)于所述推薦中的每一個(gè)推薦的群體信息的裝置; 其中所述信息與其他資產(chǎn)信息結(jié)合并被顯示給所述用戶以幫助其了解推薦所隱含的 群體智慧。
19. 如權(quán)利要求18所述的設(shè)備,其中所顯示的信息包括以下中的任意項(xiàng)在文檔中找到價(jià)值的用戶總數(shù)、將文檔與當(dāng)前背景和/或意圖關(guān)聯(lián)起來的對等體的數(shù)量、以及對等群 體已經(jīng)將之與一文檔相關(guān)聯(lián)的術(shù)語和/或短語。
20.如權(quán)利要求19所述的設(shè)備,其中,所述術(shù)語和/或短語包括代表所述群體已經(jīng)關(guān)聯(lián) 到一文檔的術(shù)語的虛擬公眾分類;其中所述虛擬公眾分類由所述親和力引擎基于所述用戶群體的隱性動作自動創(chuàng)建。
全文摘要
從企業(yè)內(nèi)部和周邊的人們開始,儲存在人們的大腦中的在他們?nèi)粘5男袨橹兴故镜膶I(yè)知識和工作模式被檢測和捕獲。一個(gè)基于行為的知識索引因而被創(chuàng)建,其用來產(chǎn)生專家指導(dǎo)的、個(gè)性化的信息。
文檔編號G06F13/00GK101779180SQ200880102339
公開日2010年7月14日 申請日期2008年8月8日 優(yōu)先權(quán)日2007年8月8日
發(fā)明者斯科特·布雷夫, 杰克·賈 申請人:貝諾特公司