趨勢響應(yīng)管理的制作方法
【專利摘要】本文檔涉及趨勢響應(yīng)管理。一個(gè)示例能夠檢測熱門話題并標(biāo)識與該熱門話題相關(guān)聯(lián)的內(nèi)容。該示例能夠采取與所述內(nèi)容有關(guān)的動(dòng)作,該動(dòng)作降低趨勢引發(fā)的處理高峰和/或增強(qiáng)與該熱門話題相關(guān)聯(lián)的用戶搜索體驗(yàn)。
【專利說明】趨勢響應(yīng)管理
【背景技術(shù)】
[0001 ] 如Google?和Yahoo?的搜索入口屬于最日常訪問網(wǎng)站之中,表明這些服務(wù)對 于終端用戶多么重要。響應(yīng)于它們的流行性,搜索引擎提供商已經(jīng)在通常通過服務(wù)器側(cè)或 客戶端側(cè)高速緩存來優(yōu)化它們的基礎(chǔ)設(shè)施中付諸巨大努力,以實(shí)現(xiàn)盡可能最快的搜索用戶 體驗(yàn)。
[0002] 遺憾的是,由于搜索查詢量的不可預(yù)測的本質(zhì),導(dǎo)致這些優(yōu)化低效率或高成本。具 體地,在現(xiàn)實(shí)世界中發(fā)生的重要事件能夠立即轉(zhuǎn)化成搜索請求的重大的且通常不可預(yù)測的 高峰。例如,就在諸如9/11或更近的波斯頓馬拉松爆炸的恐怖襲擊之后,用戶傾向于搜索 web以獲得關(guān)于這些事件的細(xì)節(jié)。類似地,當(dāng)諸如選舉等的其他重大"熱門(trending)"事件 正在發(fā)生時(shí),大量用戶同時(shí)地搜索web以獲悉結(jié)果。這些搜索量高峰即使不是每天發(fā)生,也 對搜索后端和移動(dòng)用戶體驗(yàn)兩者都具有重大影響。
[0003] 首先,數(shù)據(jù)中心被過多供應(yīng)以承受諸如搜索量高峰的最壞情形。搜索量高峰越大, 過多供應(yīng)的成本越高(數(shù)據(jù)中心中的活躍服務(wù)器越多)或者終端用戶體驗(yàn)的延遲越高。服務(wù) 器側(cè)高速緩存技術(shù)能夠減小這些熱門請求中的每個(gè)對數(shù)據(jù)中心的影響,但是它們不能夠阻 止大量請求點(diǎn)擊數(shù)據(jù)中心的前端。其次,在存在這種不可預(yù)測事件的情況下,終端用戶失去 由先前提出的用于客戶端側(cè)搜索索引高速緩存的方法遞送的實(shí)時(shí)搜索體驗(yàn)的益處。這種負(fù) 面影響對裝備有受冗長連接設(shè)置時(shí)間限制的能量消耗蜂窩鏈接的移動(dòng)設(shè)備而言尤其重要。 當(dāng)這些設(shè)備被快速安置以變成用于訪問搜索服務(wù)的主要入口點(diǎn)時(shí),遞送的移動(dòng)體驗(yàn)變成針 對搜索引擎的驅(qū)動(dòng)優(yōu)化因子。
【發(fā)明內(nèi)容】
[0004] 本文檔涉及趨勢(trend)響應(yīng)管理。一個(gè)示例能夠檢測熱門話題(例如,事件)并標(biāo) 識與該熱門話題相關(guān)聯(lián)的內(nèi)容。該示例能夠采取與所述內(nèi)容有關(guān)的動(dòng)作,該動(dòng)作降低趨勢 引發(fā)的處理高峰和/或增強(qiáng)與該熱門話題相關(guān)聯(lián)的用戶搜索體驗(yàn)。例如,除此之外,該動(dòng)作 能夠?qū)崿F(xiàn)將內(nèi)容推送給所選擇的用戶。
[0005] 另一示例可以包括顯示器和被配置為存儲(chǔ)計(jì)算機(jī)可讀指令的存儲(chǔ)裝置。該示例還 能夠包括被配置為執(zhí)行如下計(jì)算機(jī)可讀指令的處理器。該示例能夠接收用戶搜索查詢并將 用戶搜索查詢發(fā)送到遠(yuǎn)程服務(wù)。該示例能夠從遠(yuǎn)程服務(wù)獲得包括針對用戶搜索查詢的結(jié)果 和與熱門搜索話題有關(guān)的數(shù)據(jù)集的分組的集合。用戶搜索查詢與熱門搜索話題無關(guān)。該示 例能夠?qū)⒃摂?shù)據(jù)集存儲(chǔ)在存儲(chǔ)裝置上。該示例能夠從用戶接收與熱門搜索話題有關(guān)的后續(xù) 搜索查詢,并從存儲(chǔ)裝置上所存儲(chǔ)的數(shù)據(jù)集檢索與熱門話題有關(guān)的、針對后續(xù)搜索查詢的 搜索結(jié)果,而不是將后續(xù)搜索查詢發(fā)送到遠(yuǎn)程服務(wù)。該示例能夠在顯示器上呈現(xiàn)針對后續(xù) 搜索查詢的搜索結(jié)果。
[0006] 提供本
【發(fā)明內(nèi)容】
從而以簡化的形式介紹下面在【具體實(shí)施方式】中進(jìn)一步描述的對 概念的選擇。本
【發(fā)明內(nèi)容】
不旨在確定要求保護(hù)的主題的關(guān)鍵或必要方面,也不旨在用作輔 助確定要求保護(hù)的主題的范圍。
【附圖說明】
[0007] 參考附圖描述【具體實(shí)施方式】。在附圖中,參考標(biāo)記的最左邊的(一個(gè)或多個(gè))數(shù)字 標(biāo)識參考標(biāo)記首次出現(xiàn)的附圖。在說明書和附圖中的不同實(shí)例中對相似參考標(biāo)記的使用可 以指示相似或相同的項(xiàng)目。
[0008] 圖1和5是根據(jù)一些實(shí)施方式的趨勢響應(yīng)管理方法的流程圖。
[0009] 圖2-4是能夠采用根據(jù)當(dāng)前構(gòu)思的一些實(shí)施方式的趨勢響應(yīng)管理的系統(tǒng)的示例。
【具體實(shí)施方式】 [0010]
[0011] 熱門搜索話題(例如,事件)能夠瞬時(shí)地將搜索引擎的后端的查詢負(fù)載增加30 %或 更多。這些不可預(yù)測的查詢負(fù)載高峰不僅對搜索引擎的后端造成壓力,這是因?yàn)槠浔仨毐?適當(dāng)?shù)剡^多供應(yīng)以承受這些峰負(fù)載,而且通過引入更長的延遲對終端尤其是移動(dòng)終端的用 戶搜索體驗(yàn)造成壓力。為此,考慮引入圖1,圖1涉及趨勢響應(yīng)管理方法或技術(shù)1〇〇。在這種情 況下,該技術(shù)能夠在102處檢測熱門話題。熱門話題能夠被認(rèn)為是熱門搜索查詢話題,并且 該技術(shù)能夠?qū)崟r(shí)檢測熱門話題(例如,在至少一些用戶搜索熱門話題之前)。
[0012] 趨勢響應(yīng)管理技術(shù)能夠在104處標(biāo)識與熱門話題相關(guān)聯(lián)的內(nèi)容。該內(nèi)容可以涉及 搜索查詢、來自搜索查詢的術(shù)語、搜索結(jié)果、搜索結(jié)果中到網(wǎng)頁內(nèi)容的鏈接、網(wǎng)頁內(nèi)容、來自 社交網(wǎng)絡(luò)的相關(guān)內(nèi)容、和/或其他搜索相關(guān)內(nèi)容。該技術(shù)能夠在106處采取與內(nèi)容有關(guān)的動(dòng) 作。該動(dòng)作能夠降低在搜索引擎處的趨勢引發(fā)的處理高峰和/或增強(qiáng)用戶體驗(yàn)。例如,該動(dòng) 作能夠涉及通過及時(shí)的方式將內(nèi)容智能地推送給個(gè)體終端用戶。以這種方式,當(dāng)前實(shí)施方 式中的一些實(shí)施方式能夠?qū)崿F(xiàn)客戶端側(cè)搜索引擎,其能夠即刻地回復(fù)與熱門事件有關(guān)的用 戶查詢,而同時(shí)減小這些趨勢對搜索引擎的后端工作負(fù)載的影響。
[0013]圖2示出了能夠?qū)崿F(xiàn)趨勢響應(yīng)管理的系統(tǒng)200。為了解釋的目的,系統(tǒng)200包括四個(gè) 設(shè)備202(1)-202(4),其能夠與能夠提供訪問(諸如搜索引擎服務(wù))的其他設(shè)備202(5)進(jìn)行 通信。(所圖示的設(shè)備的數(shù)目當(dāng)然旨在為表示性的而非限制性的)。設(shè)備202(1)-202(4)能夠 經(jīng)由(由閃電球206表示的)一個(gè)或多個(gè)網(wǎng)絡(luò)與設(shè)備202(5)進(jìn)行通信。在一些情況下,在參考 標(biāo)記之后利用括號插入語來區(qū)分類似的元件。對沒有相關(guān)聯(lián)的括號插入語的參考標(biāo)記的使 用對元件是通用的。
[0014] 為了解釋的目的,設(shè)備202(1)-202(4)能夠被認(rèn)為是運(yùn)行在客戶端側(cè)208上(例如, 它們是客戶端側(cè)設(shè)備)。設(shè)備202(5)能夠被認(rèn)為是運(yùn)行在服務(wù)器側(cè)210上(例如,其是例如數(shù) 據(jù)中心或服務(wù)器場中的服務(wù)器側(cè)設(shè)備)。服務(wù)器側(cè)設(shè)備能夠提供針對客戶端側(cè)設(shè)備的各種 遠(yuǎn)程功能,例如搜索功能。在這種實(shí)施方式中,每個(gè)設(shè)備202能夠包括趨勢響應(yīng)管理組件212 的實(shí)例。這是僅僅一個(gè)可能的配置,并且其他實(shí)施方式可以例如包括服務(wù)器側(cè)趨勢響應(yīng)管 理組件212(5),但是除去了客戶端側(cè)趨勢響應(yīng)管理組件212(1 )-212(4)。在這種情況下,設(shè) 備202還能夠包括高速緩存214。
[0015] 系統(tǒng)200還可以維持針對設(shè)備202(1 )-202(4)的用戶的用戶簡檔216。在該示例中, 用戶簡檔216被維持在服務(wù)器側(cè)設(shè)備202(5)。(用戶簡檔能夠備選地或額外地被維持在客戶 端側(cè)設(shè)備上。)用戶簡檔216(1)對應(yīng)于設(shè)備202(1)的用戶,用戶簡檔216(2)對應(yīng)于設(shè)備202 (2)的用戶,以此類推。用戶簡檔能夠包含與用戶對什么類型的內(nèi)容(例如,運(yùn)動(dòng)、計(jì)算機(jī)科 學(xué)、電影,等等)感興趣、用戶傾向于在何時(shí)進(jìn)行搜索(例如,工作日在上午8:00、中午以及下 午6:00)、位置(例如,時(shí)區(qū))、社交網(wǎng)絡(luò)信息(例如,社交網(wǎng)絡(luò)標(biāo)識符和具有相關(guān)的標(biāo)識符的 親密朋友的列表)、用戶是否已經(jīng)搜索其他熱門事件等有關(guān)的信息。
[0016] 系統(tǒng)200還包括在垂直軸上表示搜索查詢的數(shù)目并且在水平軸上表示時(shí)間的假設(shè) 圖218。實(shí)線220表示普通或背景搜索查詢數(shù)目。虛線222表示能夠在沒有當(dāng)前的趨勢響應(yīng)管 理技術(shù)(例如,峰負(fù)載查詢量)的情況下發(fā)生的由于熱門話題的搜索查詢數(shù)目的臨時(shí)增加 (例如,高峰)。點(diǎn)線224表示當(dāng)前的技術(shù)如何能夠采取動(dòng)作來降低熱門話題對搜索引擎數(shù)目 的影響(例如,減小的峰負(fù)載搜索查詢量)。例如,在這種實(shí)施方式中,服務(wù)器側(cè)趨勢響應(yīng)管 理組件212 (5)能夠標(biāo)識熱門內(nèi)容并將該內(nèi)容推送到個(gè)體設(shè)備202的高速緩存。趨勢檢測能 夠由服務(wù)器側(cè)設(shè)備執(zhí)行,服務(wù)器側(cè)設(shè)備例如為設(shè)備202(5)或與設(shè)備202(5)進(jìn)行通信的不同 的服務(wù)器側(cè)設(shè)備。
[0017] 服務(wù)器側(cè)趨勢響應(yīng)管理組件212(5)能夠利用各種參數(shù)來標(biāo)識將向其推送熱門內(nèi) 容的個(gè)體設(shè)備。例如,參數(shù)能夠包括搜索引擎資源成本、網(wǎng)絡(luò)帶寬、設(shè)備電源狀態(tài)、設(shè)備高速 緩存大小、設(shè)備位置和時(shí)區(qū)和/或來自用戶簡檔的參數(shù),等等??赡艿氖?,將熱門內(nèi)容推送到 全部客戶端側(cè)設(shè)備202(1)-202(4)中能夠具有超過與推送相關(guān)聯(lián)的任何增益的搜索引擎資 源成本。因此,服務(wù)器側(cè)趨勢響應(yīng)管理組件能夠選擇個(gè)體客戶端側(cè)設(shè)備何時(shí)推送熱門內(nèi)容 和/或如何推送熱門內(nèi)容。
[0018] 為了解釋的目的,假設(shè)設(shè)備202(1)的用戶傾向于為相對頻繁的(例如,高量)搜索 者并且設(shè)備202(1)-202(4)的用戶傾向于為相對不頻繁的搜索者。在這種情況下,服務(wù)器側(cè) 趨勢響應(yīng)管理組件212(5)可以基于用戶將后續(xù)搜索熱門話題的可能性來確定將內(nèi)容推送 到設(shè)備202( 1)(例如,主動(dòng)推送)。當(dāng)用戶實(shí)際上提交趨勢相關(guān)的查詢時(shí),該內(nèi)容在本地對設(shè) 備202(1)上的用戶可用于實(shí)時(shí)使用。另外,假設(shè)在檢測到熱門話題之后,從設(shè)備202(3)接收 到不相關(guān)的搜索查詢。在這種情況下,服務(wù)器側(cè)趨勢響應(yīng)管理組件212(5)可以將趨勢內(nèi)容 與結(jié)果一起附帶到用戶的不相關(guān)的搜索查詢(例如,被動(dòng)推送)。這種后面的策略具有對服 務(wù)器側(cè)設(shè)備202(5)的相對低的成本,并且能夠在用戶搜索熱門話題的情況下向用戶提供來 自本地設(shè)備高速緩存的即時(shí)的結(jié)果。另一策略能夠是基于它們的時(shí)區(qū)來更新用戶(例如,如 果在歐洲早上時(shí)間檢測到熱門事件,則以不同的延遲將熱門內(nèi)容推送到美國的設(shè)備以便為 可用的并且在不同的美國的各州中的用戶醒來時(shí)是最新的)。
[0019] 總之,在一些情況下,智能推送的內(nèi)容能夠包括主動(dòng)和/或被動(dòng)內(nèi)容推送。例如,該 內(nèi)容能夠被主動(dòng)推送到具有將高概率搜索熱門事件的用戶的子集。備選地,內(nèi)容能夠被被 動(dòng)推送給在已經(jīng)檢測到熱門事件并且熱門事件仍然是活動(dòng)的之后到達(dá)搜索引擎的任何用 戶。以這種方式,趨勢響應(yīng)管理能夠解決熱門查詢量高峰,而不更進(jìn)一步地對服務(wù)器側(cè)設(shè)備 (例如,搜索引擎的后端)造成壓力。發(fā)現(xiàn)趨勢能夠通過利用在當(dāng)今可用的產(chǎn)品(例如,Bing Trends?)中使用的已知技術(shù)開始來完成??捎泌厔莓a(chǎn)品能夠被校準(zhǔn)以檢測能夠影響總體搜 索引擎量的趨勢的類型。趨勢響應(yīng)管理能夠利用趨勢檢測來增強(qiáng)(并且潛在地優(yōu)化)數(shù)據(jù)中 心工作負(fù)載和終端用戶搜索體驗(yàn)兩者。具體地,趨勢響應(yīng)管理能夠自動(dòng)檢測與熱門事件相 關(guān)的搜索內(nèi)容,并在不顯著增加數(shù)據(jù)中心工作負(fù)載的情況下將該內(nèi)容有效地推送給用戶。
[0020] 圖3示出了與客戶端側(cè)設(shè)備202(1)(表示設(shè)備202(1)-202(4))和服務(wù)器側(cè)設(shè)備202 (5)的組件有關(guān)的附加細(xì)節(jié)。設(shè)備202能夠支持運(yùn)行在操作系統(tǒng)(OS)層306上的應(yīng)用層304。 操作系統(tǒng)層能夠與硬件層308交互。硬件層中的硬件的示例能夠包括存儲(chǔ)介質(zhì)或存儲(chǔ)裝置 310、(一個(gè)或多個(gè))處理器312、顯示器314和/或電池316,等等。存儲(chǔ)裝置310能夠包括高速 緩存214。注意所圖示的硬件組件不旨在為限制性的,并且不同的設(shè)備實(shí)現(xiàn)形式能夠具有不 同的硬件組件。
[0021]趨勢響應(yīng)管理組件212能夠與(一個(gè)或多個(gè))應(yīng)用層304和/或操作系統(tǒng)層306協(xié)作 地工作。例如,趨勢響應(yīng)管理組件212能夠被實(shí)現(xiàn)為應(yīng)用或應(yīng)用部分。在一個(gè)這樣的示例中, 趨勢響應(yīng)管理組件(圖3上的"TRM")能夠?yàn)樗阉饕鎽?yīng)用318的應(yīng)用部分(或者與其協(xié)作地 工作)。
[0022]在一些配置中,趨勢響應(yīng)管理組件212和搜索引擎應(yīng)用318能夠協(xié)作地用作網(wǎng)頁內(nèi) 容應(yīng)用和/或用作"虛擬助理"的部分。例如,能夠以許多不同的方式來利用在本地存儲(chǔ)在客 戶端側(cè)設(shè)備上的高速緩存。首先,用戶通過專用搜索框或通過客戶端側(cè)設(shè)備上的網(wǎng)絡(luò)瀏覽 器提交的搜索查詢能夠訪問該高速緩存以即時(shí)地訪問用戶的查詢。另外,客戶端側(cè)設(shè)備上 的任何應(yīng)用能夠利用該高速緩存。例如,用戶利用其進(jìn)行他的/她的搜索的任何搜索應(yīng)用能 夠進(jìn)入到高速緩存中的信息中。另外,想要示出搜索結(jié)果的任何應(yīng)用能夠在點(diǎn)擊傳統(tǒng)網(wǎng)絡(luò) 搜索引擎之前進(jìn)入到高速緩存的內(nèi)容中。另外,諸如幫助用戶容易地獲得對正確信息的訪 問的虛擬助理的對話系統(tǒng)還能夠進(jìn)入到高速緩存的內(nèi)容中以實(shí)現(xiàn)與用戶的快速通信。 [0023]趨勢響應(yīng)管理組件212可以包括熱門事件檢測(TED)模塊320、熱門內(nèi)容標(biāo)識(TCI) 模塊322以及熱門內(nèi)容遞送模塊(TCD)324。簡言之,這些模塊能夠完成趨勢響應(yīng)管理的特定 方面。正如它們的名稱所暗示的,在趨勢檢測中涉及熱門事件檢測模塊320,在標(biāo)識與趨勢 相關(guān)聯(lián)的內(nèi)容中涉及熱門內(nèi)容標(biāo)識模塊,并且在確定如何處理對服務(wù)器側(cè)設(shè)備、個(gè)體客戶 端側(cè)設(shè)備和/或從網(wǎng)絡(luò)帶寬視角有利的趨勢內(nèi)容中涉及熱門內(nèi)容遞送模塊。下面關(guān)于圖4更 詳細(xì)地描述這些模塊。
[0024]從一種視角,設(shè)備202能夠被認(rèn)為是計(jì)算機(jī)。處理器312能夠運(yùn)行以計(jì)算機(jī)可讀指 令形式執(zhí)行數(shù)據(jù)以提供一定功能。數(shù)據(jù)(諸如計(jì)算機(jī)可讀指令和/或用戶相關(guān)的數(shù)據(jù))能夠 被存儲(chǔ)在存儲(chǔ)裝置310(例如,能夠在計(jì)算機(jī)的內(nèi)部或外部的存儲(chǔ)裝置)上。存儲(chǔ)裝置能夠包 括易失性存儲(chǔ)器或非易失性存儲(chǔ)器、硬盤驅(qū)動(dòng)器、閃存設(shè)備和/或光學(xué)存儲(chǔ)設(shè)備(例如,CD、 DVD,等等),等等中的任何一個(gè)或多個(gè)。如本文中所使用的,術(shù)語"計(jì)算機(jī)可讀介質(zhì)"可以包 括信號。對比之下,術(shù)語"計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)"排除信號。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)包括"計(jì)算 機(jī)可讀存儲(chǔ)設(shè)備"。計(jì)算機(jī)可讀存儲(chǔ)設(shè)備的示例包括易失性存儲(chǔ)介質(zhì)(例如RAM)和非易失性 存儲(chǔ)介質(zhì)(例如硬盤驅(qū)動(dòng)器、光盤以及閃存,等等)。
[0025]在一些配置中,設(shè)備202能夠包括片上系統(tǒng)(S0C)類型設(shè)計(jì)。在這種情況下,由計(jì)算 機(jī)提供的功能能夠被集成在單個(gè)S0C或多個(gè)耦合的S0C上。一個(gè)或多個(gè)處理器能夠被配置為 與共享資源(例如存儲(chǔ)器、存儲(chǔ)裝置、等等)和/或一個(gè)或多個(gè)專用資源(例如被配置為執(zhí)行 某種特定功能的硬件塊)協(xié)作。因此,如本文中所使用的術(shù)語"處理器"還能夠是指中央處理 單元(CPU)、圖形處理單元(GPU)、控制器、微控制器、處理核心或其他類型的處理設(shè)備。 [0026]通常,能夠使用軟件、固件、硬件(例如,固定邏輯電路)、人工處理或這些實(shí)施方式 的組合來實(shí)施本文描述的功能中的任何功能。如本文中所使用的術(shù)語"組件"一般表示軟 件、固件、硬件、整體設(shè)備或網(wǎng)絡(luò)、或其組合。在軟件實(shí)施方式的情況下,例如,這些可以表示 當(dāng)運(yùn)行在處理器(例如,一個(gè)或多個(gè)CPU)上時(shí)執(zhí)行指定任務(wù)的程序代碼。程序代碼能夠被存 儲(chǔ)在一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)設(shè)備(例如計(jì)算機(jī)可讀存儲(chǔ)介質(zhì))中。組件的特征和技術(shù)是 平臺(tái)無關(guān)的,這意味著它們可以被實(shí)施在具有各種處理配置的各種商用計(jì)算平臺(tái)上。
[0027] 注意不可預(yù)測的工作負(fù)載高峰是針對幾乎每個(gè)單個(gè)網(wǎng)絡(luò)服務(wù)的現(xiàn)實(shí),并且不限于 諸如搜索引擎318的搜索引擎。因此,已經(jīng)存在大量工作以直接在網(wǎng)絡(luò)層級處解決數(shù)據(jù)中心 內(nèi)的這些挑戰(zhàn)。數(shù)據(jù)中心通過動(dòng)態(tài)資源管理和聯(lián)網(wǎng)協(xié)議優(yōu)化來處理這種類型的問題。這些 技術(shù)是對當(dāng)前的趨勢響應(yīng)管理技術(shù)的補(bǔ)充。簡言之,當(dāng)前的趨勢響應(yīng)管理技術(shù)能夠在應(yīng)用 層304(5)處實(shí)現(xiàn)一種系統(tǒng)架構(gòu),其能夠利用服務(wù)(在這種情況下為搜索引擎318(5))的語義 來緩解查詢負(fù)載高峰。
[0028] 趨勢響應(yīng)管理組件212(5)可以被認(rèn)為是針對服務(wù)器側(cè)服務(wù)(例如搜索服務(wù))的新 架構(gòu),其能夠?qū)崟r(shí)地檢測由于熱門事件的搜索查詢量高峰,標(biāo)識與這些事件相關(guān)聯(lián)的搜索 索引的一部分,并且以及時(shí)的方式高效地將其傳播到終端用戶。這種系統(tǒng)架構(gòu)能夠利用兩 個(gè)值得注意的觀察。首先,僅僅少量的搜索查詢和搜索結(jié)果負(fù)責(zé)大多數(shù)熱門事件的查詢量。 趨勢響應(yīng)管理組件212(5)能夠利用這種觀察來采用用于標(biāo)識與熱門事件相對應(yīng)的搜索索 引的小部分、減小被推送到終端用戶的數(shù)據(jù)的足跡的兩步算法。
[0029] 其次,存在來自數(shù)億搜索引擎用戶的、具有在未來將高概率搜索熱門事件的用戶 的子集。具體地,就在熱門事件開始之前訪問搜索引擎318(5)的頻繁用戶很可能在未來搜 索熱門事件。因此,趨勢響應(yīng)管理組件212 (5)能夠?qū)?zhǔn)朝向搜索引擎318 (5)的高量的最近 的用戶的更新。另外,許多用戶在已經(jīng)檢測到熱門事件之后利用與熱門事件不相關(guān)的查詢 來訪問搜索引擎318 (5)。趨勢響應(yīng)管理組件212 (5)能夠通過將熱門搜索內(nèi)容連同所請求的 搜索結(jié)果一起附帶來利用該發(fā)現(xiàn)來投機(jī)性地更新這些用戶。例如,在趨勢響應(yīng)管理組件212 (5)檢測熱門話題之后,設(shè)備202(1)的用戶能夠提交不相關(guān)的搜索查詢326。搜索引擎318 (5)能夠用公式表示針對不相關(guān)的搜索查詢的搜索結(jié)果328。搜索結(jié)果能夠在熱門內(nèi)容330 與它們一起附帶的情況下被返回到設(shè)備202(1)(例如,作為包含一個(gè)或多個(gè)分組的單個(gè)通 信)。換句話說,搜索結(jié)果能夠在趨勢內(nèi)容330被附帶在對不相關(guān)的搜索查詢的響應(yīng)上的情 況下被返回到設(shè)備202(1)(例如,作為包含一個(gè)或多個(gè)搜索結(jié)果的單個(gè)響應(yīng))。這意味著趨 勢內(nèi)容能夠在不要求額外客戶端連接和設(shè)備的網(wǎng)絡(luò)無線電的額外激活(即,在設(shè)備上消耗 更少的能量)的情況下被推送。
[0030] 被推送到用戶的設(shè)備202(1)的趨勢內(nèi)容330能夠被存儲(chǔ)在高速緩存214(1)上。趨 勢響應(yīng)管理組件212(1)能夠與搜索引擎318(1)協(xié)作地工作以提供能夠提供瞬時(shí)結(jié)果的本 地客戶端側(cè)搜索引擎。例如,趨勢響應(yīng)管理組件212( 1)能夠使得搜索引擎318(1)在請求遠(yuǎn) 程服務(wù)之前檢查針對內(nèi)容的高速緩存214(1)。例如,如果用戶輸入搜索查詢,例如熱門話題 搜索查詢,則趨勢響應(yīng)管理組件212( 1)能夠使得搜索引擎318( 1)檢查針對搜索結(jié)果的高速 緩存214(1)。如果內(nèi)容處于高速緩存中,則搜索結(jié)果能夠被即時(shí)地提供給用戶。如果不是的 話,搜索引擎能夠?qū)⑺阉鞑樵儼l(fā)送到服務(wù)器側(cè)210以用于運(yùn)行。
[0031 ]總之,本地搜索引擎318(1)和(例如,存儲(chǔ)在高速緩存214(1)中的)經(jīng)高速緩存的 熱門內(nèi)容能夠提供對熱門話題有關(guān)的后續(xù)用戶查詢的即時(shí)答復(fù),同時(shí)減小這些趨勢對數(shù)據(jù) 中心工作負(fù)載的影響。注意趨勢響應(yīng)管理組件212的作用不是代替搜索引擎,而是與搜索引 擎一起工作從而以對用戶透明的方式實(shí)現(xiàn)更快的(并且潛在地盡可能最快的)搜索體驗(yàn)。回 顧當(dāng)用戶提交查詢時(shí),用戶的設(shè)備上的趨勢響應(yīng)管理組件212(1)能夠被調(diào)用以檢查經(jīng)高速 緩存的熱門內(nèi)容是否包含針對查詢的搜索結(jié)果,并且如果是的話,能夠即時(shí)地顯示結(jié)果。否 貝1J,查詢能夠被路由到服務(wù)器側(cè)210。在混合配置中,來自高速緩存的本地結(jié)果能夠在針對 更新和/或附加信息查詢服務(wù)器側(cè)的同時(shí)被呈現(xiàn)給用戶。
[0032]趨勢響應(yīng)管理能夠使任何類型的客戶端側(cè)設(shè)備受益,然而,客戶端側(cè)優(yōu)點(diǎn)可以比 移動(dòng)設(shè)備上更顯著,指示因?yàn)橐苿?dòng)設(shè)備傾向于使用能夠是緩慢的且對設(shè)備的電池316(1)功 率緊缺的無線網(wǎng)絡(luò)。網(wǎng)絡(luò)還能夠從使熱門內(nèi)容與其他數(shù)據(jù)包一起發(fā)送而非作為后續(xù)不同的 通信而受益。在一些配置中,趨勢響應(yīng)管理組件212(1)和搜索引擎318(1)能夠被認(rèn)為是為 部分網(wǎng)絡(luò)瀏覽器的本地應(yīng)用,使得用戶查詢能夠在可能的情況下在本地被答復(fù),并且如果 不能的話則在遠(yuǎn)程被答復(fù)。
[0033]總之,趨勢響應(yīng)管理組件212能夠完成若干目的。在這些目標(biāo)之中值得注意的是消 除由于熱門話題的服務(wù)器側(cè)設(shè)備202(5)的(例如,搜索后端的)查詢量的高峰,并且因此在 成本上減少了數(shù)據(jù)中心過多供應(yīng)的第一目標(biāo)。第二個(gè)值得注意的目標(biāo)是遞送針對與熱門話 題有關(guān)的查詢中的大多數(shù)(和/或全部)的即時(shí)搜索體驗(yàn)。趨勢響應(yīng)管理組件212能夠通過實(shí) 時(shí)地檢測趨勢搜索話題,標(biāo)識與這些話題相關(guān)聯(lián)的搜索內(nèi)容,并且及時(shí)地將其傳播到終端 用戶,來實(shí)現(xiàn)這些目標(biāo)。
[0034]注意用戶的隱私能夠在實(shí)施當(dāng)前的構(gòu)思的同時(shí)通過僅僅在用戶給出他的/她的明 確同意時(shí)收集用戶數(shù)據(jù)而得到保護(hù)。所有隱私和安全流程能夠被實(shí)施以保護(hù)用戶的安全。 例如,用戶可以提供關(guān)于他的/她的設(shè)備或簡檔的授權(quán)(和/或定義授權(quán)的條件)。否則,用戶 信息不被收集并且不利用用戶的個(gè)人信息的功能能夠被提供給用戶。甚至當(dāng)用戶已經(jīng)給出 明確同意時(shí),當(dāng)前的實(shí)施方式能夠提供在保護(hù)用戶的個(gè)人信息、隱私和安全并將使用的范 圍限制到授權(quán)的條件的同時(shí)將優(yōu)點(diǎn)提供給用戶。
[0035]圖4示出了利用圖2-3中介紹的元件的系統(tǒng)架構(gòu)400。在這種情況下,在服務(wù)器側(cè) 210(例如,搜索后端)上完成趨勢響應(yīng)管理。趨勢響應(yīng)管理能夠由熱門事件檢測模塊320、熱 門內(nèi)容標(biāo)識模塊322以及熱門內(nèi)容遞送模塊324來完成。下面的段落簡要地介紹系統(tǒng)架構(gòu) 400的元素。隨后,進(jìn)一步詳細(xì)地討論具體方面。系統(tǒng)架構(gòu)通過與現(xiàn)實(shí)生活的波斯頓馬拉松 爆炸災(zāi)難有關(guān)的示例來解釋,但是當(dāng)然適用于其他熱門事件/話題。
[0036]熱門事件檢測模塊320能夠利用各種技術(shù)來檢測趨勢。在一種情況下,熱門事件檢 測模塊能夠?qū)嵤┰谒阉魅罩?02的頂部上的簡單而又高效的趨勢算法來接近實(shí)時(shí)地檢測所 有熱門事件。例如,熱門事件檢測模塊320能夠分析各種源,例如搜索日志402、社交媒體、 Twitter,等等。熱門事件檢測模塊能夠根據(jù)搜索日志和/或其他源來標(biāo)識關(guān)鍵字404。熱門 事件檢測模塊能夠通過分析這些關(guān)鍵字被利用的頻率來檢測熱門關(guān)鍵字406。在該示例中, 在408(1)和408(2)處標(biāo)識熱門關(guān)鍵字的兩個(gè)集合。在這點(diǎn)上,一個(gè)目標(biāo)是檢測比正常更頻 繁地(例如,比在之前一天的相同小時(shí)期間五倍地頻繁地)被搜索的關(guān)鍵字。熱門事件檢測 模塊320能夠確定熱門關(guān)鍵字的組408(1)和408(2)是否屬于相同的熱門事件。如果是的話, 熱門事件檢測模塊320能夠如在410處所指示的將檢測到的熱門關(guān)鍵字分組到一起以形成 熱門事件412。在該階段處的熱門事件412是頻繁搜索的共同發(fā)生的關(guān)鍵字的集合。
[0037]熱門內(nèi)容標(biāo)識模塊322能夠進(jìn)一步處理熱門事件412。在414處,熱門內(nèi)容標(biāo)識模塊 能夠進(jìn)行前向經(jīng)過,其能夠鑒于熱門事件412掃描搜索日志402以標(biāo)識包括包含大量熱門關(guān) 鍵字406的所有查詢的熱門內(nèi)容416。熱門內(nèi)容標(biāo)識模塊能夠?qū)⑦@些查詢標(biāo)記為熱門。熱門 內(nèi)容標(biāo)識模塊能夠在418處選擇這些趨勢查詢中的具有最高搜索速率和最高數(shù)量的點(diǎn)擊的 子集。換句話說,前向經(jīng)過能夠標(biāo)識與趨勢相關(guān)的搜索查詢和被提供給用戶并且由用戶點(diǎn) 擊的搜索結(jié)果。
[0038]類似地,在420處,熱門內(nèi)容標(biāo)識模塊322能夠進(jìn)行后向經(jīng)過420,其能夠使用在前 向經(jīng)過414中產(chǎn)生的被點(diǎn)擊的搜索結(jié)果。后向經(jīng)過能夠重新檢查搜索日志402中的搜索查詢 以標(biāo)識在用戶選擇(例如,點(diǎn)擊)在前向經(jīng)過中標(biāo)識的搜索結(jié)果中得到的其他搜索查詢。后 向經(jīng)過能夠?qū)⑦@些額外搜索查詢添加到熱門內(nèi)容416以產(chǎn)生經(jīng)更新的熱門內(nèi)容422。換句話 說,前向經(jīng)過能夠捕獲大多數(shù)相關(guān)搜索查詢并搜索與熱門話題相關(guān)聯(lián)的結(jié)果。后向經(jīng)過能 夠標(biāo)識盡管在前向經(jīng)過中未標(biāo)識到,但是仍然與如由點(diǎn)擊針對熱門話題的搜索結(jié)果的用戶 標(biāo)識的熱門話題有關(guān)的附加搜索查詢。
[0039]因此,熱門內(nèi)容416和經(jīng)更新的熱門內(nèi)容422兩者都貢獻(xiàn)于熱門搜索內(nèi)容424。該子 集能夠之后通過熱門內(nèi)容遞送模塊324以對服務(wù)器側(cè)210和/或客戶端側(cè)208有益的方式來 處理。例如,該策略能夠確保大多數(shù)相關(guān)趨勢搜索內(nèi)容將在不浪費(fèi)用戶的設(shè)備上的帶寬和 存儲(chǔ)資源的情況下被傳播給用戶。例如,熱門內(nèi)容遞送模塊324能夠?qū)②厔菟阉鲀?nèi)容424推 送到個(gè)體客戶端側(cè)設(shè)備。下面更詳細(xì)地討論該方面。
[0040]熱門內(nèi)容檢測模塊320和熱門內(nèi)容標(biāo)識模塊322能夠連續(xù)地運(yùn)行在服務(wù)器側(cè)搜索 后端中以檢測熱門事件412和相關(guān)聯(lián)的熱門搜索內(nèi)容424。熱門內(nèi)容遞送模塊324能夠確定 何時(shí)、如何主動(dòng)地或被動(dòng)地將從熱門搜索內(nèi)容424得到的熱門內(nèi)容更新426推送到個(gè)體終端 用戶以及推送給誰。熱門內(nèi)容遞送模塊324能夠?qū)衢T搜索內(nèi)容424和/或熱門內(nèi)容更新426 配置為針對客戶端設(shè)備的數(shù)據(jù)集432(被圖示為與客戶端側(cè)有關(guān))。在當(dāng)前的實(shí)施方式中,數(shù) 據(jù)集432能夠被實(shí)現(xiàn)為哈希表。能夠利用諸如圖形、鍵值存儲(chǔ)、數(shù)據(jù)表或任何自定義數(shù)據(jù)表 示的其他數(shù)據(jù)集配置。熱門內(nèi)容遞送模塊324能夠在428處利用數(shù)據(jù)壓縮以減小用于將數(shù)據(jù) 集作為被動(dòng)和/或主動(dòng)更新430推送到個(gè)體用戶1-n所消耗的帶寬。更新430能夠是數(shù)據(jù)集 432的壓縮形式和/或數(shù)據(jù)集的子集,例如更新426。
[00411在客戶端側(cè)208處,客戶端設(shè)備202能夠存儲(chǔ)數(shù)據(jù)集432。數(shù)據(jù)集432能夠?qū)⑺阉鞑?詢映射到搜索結(jié)果或者將搜索查詢引用到搜索結(jié)果。當(dāng)用戶(例如,用戶1)在他的/她的設(shè) 備202(1)上提交趨勢查詢或非趨勢查詢時(shí),趨勢響應(yīng)管理組件212(參見圖2)在客戶端設(shè)備 上的本地版本能夠計(jì)算針對查詢的哈希值并且檢查數(shù)據(jù)集432。當(dāng)沒有檢測到匹配(例如, 缺失434)時(shí),本地趨勢響應(yīng)管理組件212能夠以搜索應(yīng)用當(dāng)今工作的相同的方式(例如,經(jīng) 由通信組件436(例如,無線電)自動(dòng)地將用戶查詢發(fā)送到服務(wù)器側(cè)210。通信組件能夠?qū)⒂?戶查詢發(fā)送到服務(wù)器側(cè)作為如在438處指示的http請求(或其他格式)。
[0042] 對比之下,當(dāng)本地趨勢響應(yīng)管理組件212檢測到數(shù)據(jù)集432中的本地匹配時(shí),所匹 配的查詢連同許多前面的搜索結(jié)果一起能夠被即時(shí)地顯示給用戶(例如,用戶1)。用戶能夠 在搜索結(jié)果中的任何上進(jìn)行點(diǎn)擊或者顯式地選擇以將針對最新搜索結(jié)果的該查詢提交到 服務(wù)器側(cè)210。以這種方式,趨勢響應(yīng)管理不替代搜索引擎,而是其與搜索引擎一起工作以 實(shí)現(xiàn)針對終端用戶的盡可能快的搜索體驗(yàn)。
[0043]返回到熱門事件檢測方面以進(jìn)行更詳細(xì)的討論,熱門事件檢測模塊320能夠標(biāo)識 熱門關(guān)鍵字406的初始集合。熱門事件檢測模塊320能夠?qū)衢T關(guān)鍵字406分組到一起以形 成熱門事件412。
[0044]在正常條件下,個(gè)體關(guān)鍵字傾向于針對可比較的時(shí)間段(例如,并發(fā)的天的上午 10:00到上午11:00)大體具有一致數(shù)量的事件出現(xiàn)。與參考時(shí)間和天相比,明顯更大數(shù)量的 事件,屮,孤.仿|丨加 Fi倍η倍.能被指·劫^亦公式h,在一些實(shí)施方式中,如果
[0045 (1)
[0046]則關(guān)鍵字被定義為頻繁的。其中Cumcmr是針對關(guān)鍵字在當(dāng)前小時(shí)中出現(xiàn)的次數(shù), 并且Refhcmr是關(guān)鍵字在參考天中的相同小時(shí)中出現(xiàn)的次數(shù)。
[0047]公式1中的KeywordRatioThreshold是將能夠跨幾天發(fā)生的關(guān)鍵字的隨機(jī)的小頻 率變化與指示熱門事件的重大頻率變化分開的憑經(jīng)驗(yàn)定義的閾值。當(dāng)前的實(shí)施方式目的在 于檢測導(dǎo)致重大搜索量高峰的重大熱門事件,因此找到針對KeywordRatioThreshold的恰 當(dāng)?shù)闹底兊貌恢匾?。一些?shí)施方式將關(guān)鍵字比平常更頻繁地出現(xiàn)超過五倍(例如)的閾值設(shè) 置為指示導(dǎo)致搜索量高峰的強(qiáng)熱門事件。
[0048] 即使公式1中的Refhcmr針對大多數(shù)關(guān)鍵字具有非零值,存在由于熱門事件而驟然 出現(xiàn)的關(guān)鍵字。例如,在2013年教皇選舉期間如"教皇"的關(guān)鍵字和在波斯頓馬拉松爆炸期 間如"爆炸"的關(guān)鍵字完全是新關(guān)鍵字(Refhc^iO)。為了處理這種情況,并且為了將實(shí)際熱 門關(guān)鍵字406與隨機(jī)的新關(guān)鍵字404區(qū)分開,具有R efhcmr = 0的關(guān)鍵字僅僅在觀察到其在上 一小時(shí)中至少占全部查詢的0.1% (例如)的意義上其是統(tǒng)計(jì)上重要的情況下才變得熱門。
[0049] 在檢測到熱門關(guān)鍵字406之后,熱門事件檢測模塊320能夠評價(jià)針對潛在分組的關(guān) 鍵字。實(shí)際上,每個(gè)熱門關(guān)鍵字406都能夠本身為熱門事件412。然而,檢測到的熱門關(guān)鍵字 能夠?qū)儆谕瑫r(shí)發(fā)生的一個(gè)或多個(gè)熱門事件。熱門事件檢測模塊能夠通過檢查熱門關(guān)鍵字如 何頻繁地一起被搜索而恰當(dāng)?shù)貙㈥P(guān)鍵字分組到一起以形成熱門事件。一般地,兩個(gè)關(guān)鍵字 越經(jīng)常一起被搜索,它們指代同一話題的概率越高。例如,針對波斯頓馬拉松爆炸事件,詞 語"馬拉松"和"爆炸" 93 %的時(shí)間一起被搜索。一起被搜索超過熱門關(guān)鍵字出現(xiàn)在搜索日志 中的總次數(shù)的大約20 % (例如)的熱門關(guān)鍵字傾向于指代相同的熱門事件。因此,熱門事件 檢測模塊320能夠?qū)⒁黄鸨凰阉鳠衢T關(guān)鍵字出現(xiàn)在日志中的次數(shù)的至少20%的每對熱門關(guān) 鍵字合并以形成單個(gè)熱門事件。例如,熱門關(guān)鍵字408 (1)和408 (2)在410處被分組到熱門事 件412中。熱門事件檢測模塊還能夠針對所有當(dāng)前熱門關(guān)鍵字評價(jià)每個(gè)新的熱門關(guān)鍵字,并 且其加入活動(dòng)熱門事件或形成新熱門事件。
[0050] 熱門事件檢測模塊320不必要將檢測到的熱門事件當(dāng)作是當(dāng)下活躍的。熱門事件 檢測模塊能夠?qū)⑺鼈儺?dāng)作例如僅僅在上一小時(shí)(或其他時(shí)間段)中的查詢包含熱門事件的 關(guān)鍵字中的至少一個(gè)的總百分比高于閾值時(shí)為活動(dòng)的。在一個(gè)示例中,閾值為1 % (例如)。 該閾值能夠確保僅僅針對足夠大以對數(shù)據(jù)中心和終端用戶兩者具有影響的事件,將內(nèi)容推 送給用戶。
[0051] 在這點(diǎn)上,熱門事件412是被頻繁地一起搜索的熱門關(guān)鍵字的集合。熱門內(nèi)容標(biāo)識 模塊322能夠利用關(guān)鍵字的這種集合來標(biāo)識與熱門事件有關(guān)的搜索內(nèi)容。在該上下文中的 搜索內(nèi)容能夠被定義為與熱門事件有關(guān)的搜索查詢和與這些查詢相關(guān)聯(lián)的搜索結(jié)果。檢測 到該內(nèi)容出于兩個(gè)原因能夠是相當(dāng)挑戰(zhàn)的。首先,設(shè)備用戶由于所使用的大量同義詞或輸 入和語法錯(cuò)誤(例如,"boeton explo")以多個(gè)不同的方式搜索特定話題。其次,看起來很相 似的查詢能夠在語義上是很不相同的。例如,查詢:"波斯頓馬拉松"和"波斯頓馬拉松爆炸" 可能是很不相同的,指示因?yàn)榍罢呤桥c事件有關(guān)的信息查詢,而后者關(guān)注于爆炸事故。
[0052] 熱門內(nèi)容標(biāo)識模塊322能夠使用前向經(jīng)過414和后向經(jīng)過420來檢測相關(guān)查詢。首 先,搜索日志402的前向經(jīng)過能夠進(jìn)行以標(biāo)識具有與熱門事件412相關(guān)的高度確定的查詢的 小集合?;诟叨认嚓P(guān)的查詢的該小集合和用戶作為響應(yīng)點(diǎn)擊的搜索結(jié)果,熱門內(nèi)容標(biāo)識 模塊322能夠在416處標(biāo)識與被指示為熱門內(nèi)容的熱門事件相關(guān)的搜索結(jié)果的核心集合。在 第二步驟處,在與熱門事件相關(guān)的額外查詢能夠基于在第一步驟中標(biāo)識的搜索結(jié)果的集合 來標(biāo)識的情況下,進(jìn)行搜索日志的后向經(jīng)過420。具體地,導(dǎo)致用戶點(diǎn)擊與熱門事件相關(guān)的 搜索結(jié)果的所有查詢能夠被自動(dòng)當(dāng)作與熱門事件相關(guān)。以這種方式,能夠捕獲甚至用于搜 索熱門事件的不頻繁的且非常規(guī)的查詢(例如,"波斯頓爆炸")。
[0053] 假定前向經(jīng)過414的目標(biāo)是標(biāo)識具有高概率與熱門事件有關(guān)的少量搜索查詢,熱 門內(nèi)容標(biāo)識模塊322能夠遵循保守方法。在這種實(shí)施方式中,在過去一個(gè)小時(shí)中包含三個(gè)或 更多個(gè)熱門關(guān)鍵字的所有搜索查詢被自動(dòng)地假定為與熱門事件相關(guān)。假定用戶尤其是移動(dòng) 用戶的查詢大部分時(shí)間傾向于包含三個(gè)/四個(gè)或更少的關(guān)鍵字的事實(shí),三個(gè)熱門關(guān)鍵字能 夠指示強(qiáng)匹配。包含零個(gè)或僅僅一個(gè)熱門關(guān)鍵字的所有搜索查詢能夠在該步驟中被忽略, 指示因?yàn)榧词怪T如"波斯頓"、"cnn"或"新聞"的普通關(guān)鍵字也能夠變成熱門。在移動(dòng)搜索日 志中的最常見情況,精確地包含兩個(gè)熱門關(guān)鍵字的搜索查詢能夠是更復(fù)雜的。例如,查詢 "波斯頓馬拉松結(jié)果"和"今天波斯頓爆炸"精確地包含針對波斯頓馬拉松爆炸事件的兩個(gè) 熱門關(guān)鍵字。然而,第一次查詢很可能與爆炸不相關(guān),這是因?yàn)橛脩絷P(guān)心馬拉松結(jié)果而非爆 炸事故。
[0054]為了處理這些情況,熱門內(nèi)容標(biāo)識模塊322能夠?qū)嵤┢ヅ渌惴?,其中不同的熱門關(guān) 鍵字根據(jù)它們多么獨(dú)特而在匹配過程中被給予不同的權(quán)重。例如,關(guān)鍵字"波斯頓"能夠在 許多不同的查詢(例如,"波斯頓天氣")中被使用,并且因此其獨(dú)特性低于關(guān)鍵字"爆炸"。熱 門內(nèi)容標(biāo)識模塊322能夠通過在熱門事件的時(shí)間段與參考時(shí)間段之間的關(guān)鍵字頻率增加來 將這兩種情況區(qū)分開(公式1)。如"波斯頓"的關(guān)鍵字通常具有相對低的增加比率(5倍-8 倍),而如"爆炸"的關(guān)鍵字能夠具有超過100倍的比率。
[0055] 考慮到這種觀察,熱門內(nèi)容標(biāo)識模塊322可以計(jì)算針對每個(gè)候選搜索查詢的匹配 分?jǐn)?shù) Queryscore:
[0056]
[0057] 其中Uniquenessk表示關(guān)鍵字k多么獨(dú)特:
[0058]
[0059] 分別表示在上一小時(shí)中和在參考小時(shí)中包含熱門關(guān)鍵字k的查 詢的次數(shù)。關(guān)鍵字k在搜索日志中出現(xiàn)頻率的幾率越高,其獨(dú)特性值越高。注意熱門關(guān)鍵字 的權(quán)重(等式2)通過將關(guān)鍵字的獨(dú)特性和絕對頻率相乘來考慮關(guān)鍵字的獨(dú)特性和絕對頻率 兩者。針對每次查詢,熱門內(nèi)容標(biāo)識模塊322能夠找到查詢的匹配權(quán)重作為通過所有可用熱 門關(guān)鍵字的總權(quán)重來歸一化的、被包含在查詢中的所有熱門關(guān)鍵字的權(quán)重的總和。以這種 方式,針對查詢的匹配分?jǐn)?shù)是在0與1之間的值。在一個(gè)實(shí)施方式中,具有高于0:5的匹配分 數(shù)的每個(gè)查詢能夠被假設(shè)為與熱門事件相匹配。
[0060] 在后向經(jīng)過420處,熱門內(nèi)容標(biāo)識模塊322能夠記錄用戶在提交了已經(jīng)被標(biāo)識為熱 門的查詢之后點(diǎn)擊的所有搜索結(jié)果。熱門內(nèi)容標(biāo)識模塊322能夠利用這些搜索結(jié)果來標(biāo)識 屬于熱門事件的附加查詢。具體地,搜索日志中的導(dǎo)致在前向經(jīng)過步驟中標(biāo)識的搜索結(jié)果 中的一個(gè)結(jié)果上的點(diǎn)擊的每個(gè)查詢被添加到熱門事件。
[0061 ]在已經(jīng)檢測到熱門事件之后,熱門內(nèi)容標(biāo)識模塊322能夠標(biāo)識與該事件相關(guān)聯(lián)的 搜索查詢的集合。通過檢查用戶已經(jīng)在提交這些查詢之后點(diǎn)擊的所有搜索結(jié)果,熱門內(nèi)容 標(biāo)識模塊322能夠生成與熱門事件相關(guān)聯(lián)的搜索結(jié)果(統(tǒng)一資源定位符(URL)和片段)的最 終集合作為熱門搜索內(nèi)容424。
[0062]當(dāng)考慮與該事件相關(guān)聯(lián)的每個(gè)單個(gè)查詢和搜索結(jié)果時(shí),查詢和搜索結(jié)果的總數(shù)目 可能是相當(dāng)大的。將所有這種數(shù)據(jù)推送給用戶,尤其是移動(dòng)用戶,由于帶寬要求傾向于是不 被期望的。然而,與熱門事件相關(guān)的大多數(shù)搜索流量傾向于被集中在這些查詢的小集合和 對應(yīng)的搜索結(jié)果(例如,前50個(gè)搜索結(jié)果)附近。因此,熱門搜索內(nèi)容模塊424能夠利用最流 行的1000 (例如)熱門搜索查詢連同對應(yīng)的搜索結(jié)果一起來形成被推送給用戶的熱門高速 緩存(例如,數(shù)據(jù)集432)。該方法能夠確保高(并且潛在地接近理想的)性能,同時(shí)減小(并且 潛在最小化)用于得到對個(gè)體用戶1-n的經(jīng)壓縮的趨勢內(nèi)容更新所消耗的帶寬。
[0063]在已經(jīng)標(biāo)識了熱門搜索內(nèi)容之后,熱門搜索內(nèi)容模塊424能夠及時(shí)地且有效地將 該內(nèi)容傳播給個(gè)體用戶1-n。給定大量搜索引擎用戶,這能夠在數(shù)據(jù)中心要完成的帶寬方面 是昂貴的。為了使更新用戶對搜索后端具有的影響最小化,熱門搜索內(nèi)容模塊424能夠采用 各種策略。下面描述這些策略中的兩種策略。
[0064]第一,熱門搜索內(nèi)容模塊424可以標(biāo)識搜索引擎的用戶中的、具有在未來將高概率 搜索熱門話題的子集。例如,熱門搜索內(nèi)容模塊424能夠標(biāo)識在熱門事件發(fā)生之前的兩個(gè)小 時(shí)(或其他時(shí)間段)內(nèi)提交查詢的所有用戶,并且能夠按他們的查詢量的降序順序?qū)衢T搜 索內(nèi)容推送給這些用戶。為了限制主動(dòng)更新對搜索后端和其帶寬消耗的影響,熱門搜索內(nèi) 容模塊424能夠強(qiáng)制最大數(shù)量的用戶每分鐘更新。以這種方式,熱門搜索內(nèi)容模塊424不會(huì) 通過同時(shí)將內(nèi)容推送給所有用戶來擊垮數(shù)據(jù)中心(例如服務(wù)器側(cè)設(shè)備)和/或網(wǎng)絡(luò)。
[0065] 第二,基于移動(dòng)搜索邏輯分析的發(fā)現(xiàn),熱門搜索內(nèi)容模塊424能夠利用被動(dòng)用戶更 新來補(bǔ)充主動(dòng)內(nèi)容推送。(高達(dá)26%)的大百分比的用戶在已經(jīng)檢測到熱門事件之后提交與 熱門事件不相關(guān)的查詢。熱門搜索內(nèi)容模塊424能夠利用這個(gè)來投機(jī)性地將熱門搜索內(nèi)容 (例如,數(shù)據(jù)集432)連同針對不相關(guān)搜索查詢的搜索結(jié)果一起推送給這些用戶。以這種方 式,熱門搜索內(nèi)容模塊424能夠及時(shí)地更新可能從未通過主動(dòng)更新而更新用戶,而不增加數(shù) 據(jù)中心的工作負(fù)載。
[0066] 總之,(圖2-3中介紹的)趨勢響應(yīng)管理組件212能夠解決四個(gè)基本的挑戰(zhàn):推送什 么熱門搜索內(nèi)容,何時(shí)推送它,向誰推送它,以及如何推送它。
[0067]首先,趨勢管理技術(shù)能夠自動(dòng)地接近實(shí)時(shí)地檢測熱門事件,并且同時(shí)標(biāo)識與這些 事件相關(guān)的搜索索引的部分。搜索索引的該部分將變成將被推送給終端用戶的實(shí)際搜索內(nèi) 容(搜索查詢和對應(yīng)的搜索結(jié)果)。該方法的可行性能夠在一些情況下取決于與熱門話題相 關(guān)聯(lián)的搜索內(nèi)容實(shí)際上多么集中。如果用戶的點(diǎn)擊均勻地分布在大量搜索結(jié)果上,則標(biāo)識 搜索索引的熱門部分能夠是相當(dāng)困難的。相反,如果大多數(shù)用戶在搜索熱門話題時(shí)在少量 搜索結(jié)果上點(diǎn)擊,則包括搜索查詢和結(jié)果中的URL的熱門搜索內(nèi)容是更緊湊的并且因此是 可管理的。
[0068]給定所標(biāo)識的搜索查詢的集合和對應(yīng)的搜索結(jié)果,熱門搜索內(nèi)容模塊424仍然判 定何時(shí)將該內(nèi)容推送給終端用戶。即使熱門事件能夠很早地(例如,在例如20分鐘內(nèi))被檢 測到,與事件相關(guān)的內(nèi)容也可能隨時(shí)間尤其是在最開始演變。因此,過早地推送熱門數(shù)據(jù)可 能是低效率的,這是因?yàn)殛P(guān)鍵內(nèi)容可能缺少。
[0069]為了解決熱門事件的不斷演變,趨勢響應(yīng)管理能夠持續(xù)地掃描搜索日志以標(biāo)識最 新的熱門搜索內(nèi)容,并且將其推送給用戶。每次用戶被更新時(shí),最新的熱門內(nèi)容能夠被用于 滿足趨勢相關(guān)的查詢。
[0070] 示例技術(shù)
[0071]圖5圖示了趨勢響應(yīng)管理技術(shù)或方法500的流程圖。
[0072] 在框502處,該方法可以從搜索查詢獲得熱門關(guān)鍵字的集合。
[0073] 在框504處,該方法可以將傾向于共同位于搜索查詢中的關(guān)鍵字的子集區(qū)分開。 [0074]在框506處,該方法可以根據(jù)關(guān)鍵字的子集來確定熱門話題。
[0075] 在框508處,該方法可以基于關(guān)鍵字的子集來檢測搜索查詢中的、與熱門話題相關(guān) 的子集。
[0076] 在框510處,該方法可以識別針對搜索查詢的子集返回的并且由個(gè)體用戶選擇的 搜索結(jié)果。
[0077] 在框512處,該方法可以標(biāo)識未在子集中的、返回所選擇的搜索結(jié)果的其他查詢。
[0078] 在框514處,該方法可以創(chuàng)建針對熱門話題的、包括查詢的子集和被映射到所選擇 的搜索結(jié)果的其他查詢的數(shù)據(jù)集。數(shù)據(jù)集能夠被主動(dòng)地或被動(dòng)地被發(fā)送到個(gè)體用戶。另外, 個(gè)體用戶的簡檔可以被評價(jià)以確定他/她是否有可能對熱門話題感興趣。例如,能夠確定感 興趣的可能性。如果可能性超過閾值,則用戶能夠被視為針對主動(dòng)或被動(dòng)推送的強(qiáng)候選。如 果可能性低于閾值,則用戶可以被視為不太可能受益于熱門內(nèi)容。因此,用戶簡檔能夠被當(dāng) 作在決定是否將熱門內(nèi)容推送給用戶時(shí)考慮的另一信息源(例如,另一參數(shù))。參數(shù)能夠被 認(rèn)為具有相等的重要性,或者一些參數(shù)能夠被加權(quán)超過其他參數(shù)。
[0079] 趨勢響應(yīng)管理技術(shù)能夠確定向哪些用戶1-n推送熱門搜索內(nèi)容,并且關(guān)于檢測到 的熱門搜索內(nèi)容他們將以什么順序被更新。這不是不重要的任務(wù),這是因?yàn)樯逃盟阉饕?具有數(shù)億用戶。試圖利用熱門搜索內(nèi)容來同時(shí)更新每個(gè)用戶將很可能擊垮數(shù)據(jù)中心,從而 產(chǎn)生比一個(gè)趨勢響應(yīng)管理解決的問題更大的問題。趨勢響應(yīng)管理技術(shù)的一些實(shí)施方式能夠 采用至少兩個(gè)不同的方法。趨勢響應(yīng)管理技術(shù)能夠'主動(dòng)地'或'被動(dòng)地'更新用戶。下面首 先描述兩個(gè)主動(dòng)策略,跟著描述被動(dòng)策略。
[0080] 在第一主動(dòng)策略中,趨勢響應(yīng)管理技術(shù)能夠標(biāo)識搜索引擎的忠實(shí)用戶,這是因?yàn)?忠實(shí)用戶更有可能回來并搜索熱門話題。在一個(gè)實(shí)施方式中,忠實(shí)用戶能夠被定義為在過 去已經(jīng)提交了大量查詢的用戶,并且他們還已經(jīng)在過去搜索了至少一個(gè)多個(gè)熱門事件。換 句話說,主動(dòng)策略可以定義活躍用戶的第一子集,其被定義為在一定時(shí)間段內(nèi)已經(jīng)提交了 至少預(yù)定義數(shù)量的搜索查詢。例如,在第一集合中的活躍用戶可以例如已經(jīng)在上周提交了 至少50次查詢。
[0081] 能夠由趨勢響應(yīng)管理技術(shù)采用的第二主動(dòng)策略是基于最近在搜索引擎中提交了 搜索查詢的用戶將在他們一發(fā)現(xiàn)熱門內(nèi)容時(shí)就最可能搜索熱門內(nèi)容的假設(shè)來標(biāo)識將熱門 搜索內(nèi)容推送給誰。換句話說,活躍用戶的第二子集能夠被定義為已經(jīng)在檢測之前的預(yù)定 義時(shí)間(例如一個(gè)小時(shí))內(nèi)提交了至少一個(gè)搜索查詢。其他實(shí)施方式可以反向地加權(quán)自用戶 上次提交了不相關(guān)的搜索查詢經(jīng)過的時(shí)間。例如,在檢測到趨勢之前的五分鐘提交了搜索 查詢的用戶可以比先前三個(gè)小時(shí)最后提交搜索查詢的用戶更有可能搜索該趨勢。因此,內(nèi) 容可以在更遠(yuǎn)的用戶之前先被推送給更最近的用戶。
[0082] 主動(dòng)更新傾向于要求數(shù)據(jù)中心跟蹤個(gè)體用戶,并在熱門搜索內(nèi)容變得可用時(shí)搶先 地將趨勢搜索內(nèi)容推送給它們。然而,這樣的方式能夠?qū)е聦?nèi)容推送給大量用戶,大量用 戶中的僅僅一些可能最終搜索該內(nèi)容。假定如果不是高度準(zhǔn)確的話,主動(dòng)推送還能夠?qū)?shù) 據(jù)中心造成壓力,一些實(shí)施方式能夠備選地或額外地采用被動(dòng)的投機(jī)性的更新。具體地,每 次用戶將查詢提交到搜索引擎并且熱門搜索話題當(dāng)前活動(dòng)時(shí),趨勢響應(yīng)管理組件能夠與搜 索引擎協(xié)作地操作以投機(jī)性地向用戶更新最新的熱門搜索內(nèi)容以及將搜索結(jié)果提供到(非 趨勢相關(guān)的)查詢。以這種方式,不需要將額外的請求提交到數(shù)據(jù)中心并且不要求用戶跟
[0083] 由以上關(guān)于圖2-4描述的系統(tǒng)和/或設(shè)備和/或由其他設(shè)備和/或系統(tǒng)執(zhí)行所描述 的方法。方法被描述的順序不旨在被理解為限制,并且任何數(shù)量的所描述的動(dòng)作能夠以任 何順序來組合以實(shí)施該方法或備選方法。另外,可以以任何適當(dāng)?shù)挠布?、軟件、固件或其組 合來實(shí)施該方法,使得設(shè)備能夠?qū)嵤┰摲椒?。在一種情況下,該方法被存儲(chǔ)在計(jì)算機(jī)可讀存 儲(chǔ)介質(zhì)上作為指令集使得由計(jì)算設(shè)備的處理器的運(yùn)行引起計(jì)算設(shè)備執(zhí)行該方法。
[0084]
[0085] 盡管已經(jīng)以對結(jié)構(gòu)特征和/或方法動(dòng)作特定的語言描述了本主題,但是應(yīng)理解在 所附的權(quán)利要求中限定的主題不必限于以上描述的特定特征或動(dòng)作。相反,以上描述的特 定特征和動(dòng)作被公開為實(shí)施權(quán)利要求的示例形式。
【主權(quán)項(xiàng)】
1. 一種由一個(gè)或多個(gè)計(jì)算設(shè)備執(zhí)行的方法,包括: 從搜索查詢獲得熱門關(guān)鍵字的集合; 標(biāo)識與所述搜索查詢中的、包括所述熱門關(guān)鍵字中的至少一些熱門關(guān)鍵字的子集相關(guān) 聯(lián)的熱門話題; 標(biāo)識被返回給所述搜索查詢的所述子集并由用戶選擇的搜索結(jié)果; 標(biāo)識未在所述搜索查詢的所述子集中但是返回選擇的所述搜索結(jié)果的其他搜索查詢; 創(chuàng)建針對所述熱門話題的、包括所述搜索查詢的所述子集和被映射到選擇的所述搜索 結(jié)果的所述其他搜索查詢的數(shù)據(jù)集;以及, 使得所述數(shù)據(jù)集被存儲(chǔ)在個(gè)體用戶的設(shè)備的硬件高速緩存上以用于實(shí)時(shí)可用性。2. 根據(jù)權(quán)利要求1所述的方法,其中標(biāo)識熱門話題包括: 將趨于共同位于所述搜索查詢中的所述關(guān)鍵字的子集區(qū)分開; 根據(jù)所述關(guān)鍵字的所述子集來確定所述熱門話題; 基于所述關(guān)鍵字的所述子集來檢測所述搜索查詢中的與所述熱門話題有關(guān)的所述子 集;以及, 識別針對所述搜索查詢的所述子集返回并且由所述個(gè)體用戶或其他個(gè)體用戶選擇的 所述搜索結(jié)果。3. 根據(jù)權(quán)利要求1所述的方法,其中所述使得包括將所述數(shù)據(jù)集附帶到針對不相關(guān)的 搜索查詢返回的搜索結(jié)果上。4. 根據(jù)權(quán)利要求1所述的方法,其中所述計(jì)算設(shè)備包括還提供搜索引擎功能的服務(wù)器 計(jì)算設(shè)備。5. -種具有計(jì)算機(jī)可運(yùn)行指令的一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可運(yùn)行 指令當(dāng)由處理器運(yùn)行時(shí)執(zhí)行包括以下的動(dòng)作: 檢測熱門話題; 標(biāo)識與所述熱門話題相關(guān)聯(lián)的內(nèi)容;以及, 使得所述內(nèi)容被發(fā)送到活躍用戶的集合并且被存儲(chǔ)在所述活躍用戶的設(shè)備的硬件高 速緩存上,以用于在所述活躍用戶后續(xù)搜索所述熱門話題時(shí)的實(shí)時(shí)可用性。6. 根據(jù)權(quán)利要求5所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中標(biāo)識內(nèi)容包括:標(biāo)識包括由其他用 戶提交的熱門查詢和被返回給所述其他用戶并由所述其他用戶選擇的統(tǒng)一資源定位符 (URL)的熱門搜索內(nèi)容。7. 根據(jù)權(quán)利要求6所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中所述使得包括將所述熱門搜索內(nèi) 容哈希存儲(chǔ)到將熱門查詢引用至搜索結(jié)果的熱門內(nèi)容更新哈希表中。8. 根據(jù)權(quán)利要求7所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),還包括對所述哈希表進(jìn)行壓縮。9. 根據(jù)權(quán)利要求5所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中所述活躍用戶的第一子集被定義 為在一個(gè)時(shí)間段內(nèi)已經(jīng)提交至少預(yù)定義數(shù)目的搜索查詢,并且其中所述活躍用戶的第二子 集在所述檢測之前的預(yù)定義時(shí)間內(nèi)已經(jīng)提交至少一個(gè)搜索查詢。10. 根據(jù)權(quán)利要求5所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中所述使得包括在個(gè)體用戶提交不 相關(guān)的搜索查詢時(shí)推送所述內(nèi)容,并且所述內(nèi)容與搜索結(jié)果一起附帶到返回給所述個(gè)體用 戶的所述不相關(guān)的搜索查詢。
【文檔編號】G06F17/30GK105981011SQ201580007578
【公開日】2016年9月28日
【申請日】2015年2月2日
【發(fā)明人】D·利姆貝洛鮑洛斯, O·莉娃, D·伯格, K·施特勞斯, G·佩罕科歐
【申請人】微軟技術(shù)許可有限責(zé)任公司