本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,尤其涉及基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法。
背景技術(shù):搜索引擎一般采用基于相關(guān)度排序的方式來呈現(xiàn)搜索結(jié)果。隨著數(shù)據(jù)量的劇增,其弊端日益突出:如,搜索結(jié)果排序不太準(zhǔn)確;用戶需花費(fèi)較多時(shí)間來獲取想要的信息;某些關(guān)于搜索結(jié)果的統(tǒng)計(jì)信息無法獲取。例如,使用現(xiàn)有搜索引擎,用戶難以獲取計(jì)算機(jī)領(lǐng)域論文分布最集中的子領(lǐng)域,同時(shí)獲取該子領(lǐng)域內(nèi)的論文在時(shí)間、地點(diǎn)和作者三方面上的具體分布情況,而該需求在實(shí)際應(yīng)用中十分重要。現(xiàn)有搜索引擎在準(zhǔn)確度上進(jìn)行了大量改進(jìn),利用優(yōu)先級(jí)和相關(guān)性對(duì)搜索結(jié)果進(jìn)行排序,使用戶感興趣的搜索結(jié)果優(yōu)先呈現(xiàn)。例如,公開號(hào)為101305364的專利文獻(xiàn)公開了用于呈現(xiàn)搜索結(jié)果的系統(tǒng)和方法??梢曰谝粋€(gè)或多個(gè)標(biāo)準(zhǔn)混合搜索結(jié)果和/或區(qū)分搜索結(jié)果的優(yōu)先級(jí)??梢曰谟脩魴n案數(shù)據(jù)、優(yōu)選廣告商/商戶排序或其組合來混合搜索結(jié)果或區(qū)分搜索結(jié)果的優(yōu)先級(jí)。搜索結(jié)果可以與廣播和/或流式內(nèi)容同時(shí)在顯示設(shè)備上呈現(xiàn)給觀看者。搜索結(jié)果可以被“推”到客戶端一方設(shè)備,并與相關(guān)的廣播內(nèi)容一起呈現(xiàn)?;蛘撸阉鹘Y(jié)果可以是基于一個(gè)或多個(gè)用戶提供的搜索標(biāo)準(zhǔn)的。在展示方式上也進(jìn)行了拓展。例如,公開號(hào)為103092958A的專利文獻(xiàn)公開了一種搜索結(jié)果展示方法和裝置,所述方法包括:獲取用戶的搜索請(qǐng)求;根據(jù)所述搜索請(qǐng)求在存儲(chǔ)有多種視頻來源的數(shù)據(jù)庫(kù)中進(jìn)行查詢,以得到初步搜索結(jié)果;根據(jù)所述初步搜索結(jié)果,計(jì)算出各視頻來源對(duì)應(yīng)的搜索結(jié)果列表,分別對(duì)各搜索結(jié)果列表進(jìn)行統(tǒng)計(jì),生成多個(gè)包含視頻來源名稱及所述視頻來源名稱對(duì)應(yīng)的搜索結(jié)果總數(shù)的搜索分類展示按鈕;在視頻結(jié)果展示界面展示所述多個(gè)搜索分類展示按鈕及所有視頻來源的搜索結(jié)果列表,或者展示所述多個(gè)搜索分類展示按鈕及第一視頻來源對(duì)應(yīng)的搜索結(jié)果列表。該專利文獻(xiàn)實(shí)現(xiàn)了對(duì)直播、回放、VOD、互聯(lián)網(wǎng)視頻和UGC等不同內(nèi)容來源視頻搜索結(jié)果的統(tǒng)一展現(xiàn),可生成并顯示更方便于用戶使用的數(shù)據(jù)。搜索引擎一般假設(shè)文檔除文本信息外是沒有其他屬性的,而隨著數(shù)據(jù)資源質(zhì)量的提升和文本處理技術(shù)的發(fā)展,可以從文檔中抽取屬性,即為文檔添加標(biāo)簽。標(biāo)簽按其語(yǔ)義,可歸屬于不同的維度(如概念、時(shí)間、地點(diǎn)、人物等),維度一般具有層次結(jié)構(gòu)(如“國(guó)家-省-地區(qū)”為地點(diǎn)維度的層次結(jié)構(gòu))。文檔本身帶有多個(gè)不同的維度標(biāo)簽為設(shè)計(jì)新的搜索結(jié)果呈現(xiàn)方法提供了空間。當(dāng)前,對(duì)新搜索結(jié)果呈現(xiàn)方法的研究已有所發(fā)展,但效果不是很理想。采取聚類或基于特征向量聚類的方法,需要大量的計(jì)算,且在特征向量維度較大時(shí),聚類效果會(huì)變差;采取相關(guān)度或帶有優(yōu)先權(quán)的相關(guān)度排序的方法,仍屬于單維度呈現(xiàn)方法,無法提供多維度的呈現(xiàn)功能;采取折疊方式分層展示的方法,以不同直徑的同心圓展示當(dāng)前數(shù)據(jù)節(jié)點(diǎn)及其下層孩子節(jié)點(diǎn),視覺上比較直觀,但無法查看同一層次上數(shù)據(jù)的分布情況,缺乏宏觀性。此外,上述方法均只提供一種查看模式,與用戶的交互能力偏弱。
技術(shù)實(shí)現(xiàn)要素:本發(fā)明要解決的問題是提供一種交互性強(qiáng)、可智能導(dǎo)航的結(jié)果集呈現(xiàn)方法,搜索得到的數(shù)據(jù)集是帶有多種維度標(biāo)簽的文檔集。一種基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法,包括如下步驟:步驟1,讀取所有文檔的維度信息,初始化文檔概要集,并將當(dāng)前結(jié)果集以及臨時(shí)結(jié)果集設(shè)置為所有文檔;步驟2,根據(jù)文檔概要集以及當(dāng)前結(jié)果集構(gòu)建維度層次樹及分頁(yè)形式的文檔列表,并顯示維度層次樹、文檔列表中的指定頁(yè)面以及分頁(yè)信息;步驟3,等待用戶指令,并在接收到用戶指令后,判斷來自用戶的操作指令的類型并進(jìn)行相應(yīng)操作:若為過濾或?yàn)g覽,進(jìn)入步驟4;若為查詢,則根據(jù)查詢中的條件,由搜索引擎進(jìn)行搜索并返回帶有維度標(biāo)簽的搜索結(jié)果集,并用帶有維度標(biāo)簽的搜索結(jié)果集替換當(dāng)前結(jié)果集,返回步驟2;若為翻頁(yè),則得到用戶輸入的頁(yè)碼K,進(jìn)入步驟6;步驟4,利用操作指令生成操作請(qǐng)求,再根據(jù)操作請(qǐng)求更新臨時(shí)結(jié)果集,并對(duì)維度層次樹進(jìn)行相應(yīng)的處理,接著根據(jù)操作類型進(jìn)入對(duì)應(yīng)的后續(xù)步驟:若為過濾,則依據(jù)臨時(shí)結(jié)果集更新維度層次樹上各個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量,利用臨時(shí)結(jié)果集替換當(dāng)前結(jié)果集,并進(jìn)入步驟5;若為瀏覽,則直接進(jìn)入步驟5;步驟5,根據(jù)臨時(shí)結(jié)果集中有效文檔的個(gè)數(shù)更新文檔列表的分頁(yè)信息,將頁(yè)碼K設(shè)為預(yù)設(shè)的指定頁(yè)面,并進(jìn)入步驟6;步驟6,將臨時(shí)結(jié)果集中的有效文檔按分頁(yè)信息劃分,獲取對(duì)應(yīng)第K頁(yè)的文檔概要,并將每個(gè)文檔概要構(gòu)建成一條列表項(xiàng),將N個(gè)列表項(xiàng)用于更新文檔列表中顯示窗口的內(nèi)容,返回步驟3,其中N為預(yù)設(shè)值。本發(fā)明要求文檔具有維度信息,通過讀取文檔的維度信息來生成維度層次樹。文檔列表以分頁(yè)形式顯示臨時(shí)結(jié)果集中有效文檔,其包含顯示窗口和分頁(yè)信息。文檔列表將其數(shù)據(jù)源(臨時(shí)結(jié)果集中有效文檔組成的集合)按順序分組,每組N個(gè)文檔概要,每組又稱作“一頁(yè)”。每次顯示窗口中的內(nèi)容為文檔列表的數(shù)據(jù)源中第K頁(yè)的N個(gè)文檔概要所構(gòu)建的N個(gè)列表項(xiàng)。查詢的操作條件為若干關(guān)鍵詞。在步驟5中,更新文檔列表的分頁(yè)信息方法為,先統(tǒng)計(jì)有效文檔的總數(shù),依據(jù)每頁(yè)文檔個(gè)數(shù),確定總頁(yè)數(shù)。其中,步驟1中所有文檔為預(yù)存的文檔,其中每個(gè)文檔的維度信息包括維度ID以及對(duì)應(yīng)的維度值,且每個(gè)文檔可根據(jù)內(nèi)容提取出文檔概要,從而形成文檔概要集。步驟2中,文檔列表中的指定頁(yè)面為文檔列表的首頁(yè)。由于文檔通常數(shù)量較大,如果一次性構(gòu)建全部列表頁(yè)面耗時(shí)較長(zhǎng),因此在初次顯示時(shí)僅在顯示窗口中顯示由首頁(yè)文檔概要構(gòu)建成的列表項(xiàng),其他頁(yè)面根據(jù)用戶所選擇的頁(yè)面再進(jìn)行構(gòu)建,并在顯示窗口中顯示出來。在步驟1中得到的文檔概要集表示為Dall={d1,d2,…,dm},其中在文檔概要集Dall中的ID為i的文檔概要di表示為在文檔概要di中維度ID為j的維度值集合w為的元素個(gè)數(shù)。在文檔概要集中,每個(gè)文檔概要具有多個(gè)維度值,這些維度值從文檔概要中提取得到。在步驟2中,創(chuàng)建維度層次樹的步驟如下:步驟2-1,創(chuàng)建維度層次樹的樹根節(jié)點(diǎn),其中,樹根節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量為零,孩子節(jié)點(diǎn)為空,樹根節(jié)點(diǎn)對(duì)應(yīng)的實(shí)體為根實(shí)體;步驟2-2,判斷當(dāng)前結(jié)果集中是否存在未訪問的文檔概要:是,則根據(jù)當(dāng)前結(jié)果集從文檔概要集中取出一個(gè)未訪問的文檔概要,進(jìn)入步驟2-3;否則維度層次樹創(chuàng)建結(jié)束;步驟2-3,判斷文檔概要中是否存在未訪問的維度值集合:是,則取出一個(gè)未訪問的維度值集合,進(jìn)入步驟2-4;否則,返回步驟2-2;步驟2-4,判斷維度值集合中是否存在未訪問的維度值:是,取出一個(gè)未訪問的維度值,進(jìn)入步驟2-5;否則,返回步驟2-3;步驟2-5,對(duì)于當(dāng)前維度值集合中的維度值,判斷維度層次樹中是否存在從樹根到該維度值所在節(jié)點(diǎn)的路徑:是,進(jìn)入步驟2-7;否則,進(jìn)入步驟2-6;步驟2-6,在維度層次樹中創(chuàng)建路徑中所有缺失的節(jié)點(diǎn),對(duì)于每個(gè)新節(jié)點(diǎn),節(jié)點(diǎn)統(tǒng)計(jì)量為零,對(duì)應(yīng)的孩子節(jié)點(diǎn)集為空,維度值設(shè)為該節(jié)點(diǎn)對(duì)應(yīng)的維度值,進(jìn)入步驟2-7;步驟2-7,將路徑上所有節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量加1,對(duì)于路徑中未指定孩子節(jié)點(diǎn)的節(jié)點(diǎn),將其直接后繼節(jié)點(diǎn)設(shè)為其孩子節(jié)點(diǎn),其中路徑上最后一個(gè)節(jié)點(diǎn)的孩子節(jié)點(diǎn)為空,接著返回步驟2-4。根實(shí)體是以所有維度層次樹的樹根所代表的實(shí)體為孩子實(shí)體的一個(gè)虛構(gòu)實(shí)體。該實(shí)體是一個(gè)抽象實(shí)體,不具有實(shí)際含義。當(dāng)前結(jié)果集中每個(gè)文檔添加兩個(gè)屬性,一個(gè)是文檔ID,另外一個(gè)是用以標(biāo)記當(dāng)前文檔是否有效的dirty。通過以上方法建立的維度層次樹,使得各個(gè)文檔概要按不同的維度值出現(xiàn)在維度層次樹的不同節(jié)點(diǎn)上。操作指令為過濾,則步驟4,具體步驟如下:步驟4-1,生成操作請(qǐng)求,所述操作請(qǐng)求包括若干條件,且每個(gè)條件包括一個(gè)維度ID以及對(duì)應(yīng)的維度值;步驟4-2,將維度層次樹上所有節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量置零,利用當(dāng)前結(jié)果集生成的副本來替換臨時(shí)結(jié)果集;步驟4-3,判斷臨時(shí)結(jié)果集是否存在未訪問的文檔:是,根據(jù)臨時(shí)結(jié)果集從文檔概要集中取出一個(gè)未訪問的文檔所對(duì)應(yīng)的文檔概要,進(jìn)入步驟4-4;否則,用臨時(shí)結(jié)果集替換當(dāng)前結(jié)果集,進(jìn)入步驟5;步驟4-4,判斷操作請(qǐng)求中是否存在未訪問的條件:是,進(jìn)入步驟4-5;否則,進(jìn)入步驟4-7;步驟4-5,取出一個(gè)未訪問的條件,判斷其中的維度值是否為當(dāng)前文檔對(duì)應(yīng)維度的維度值集合的子集,其中當(dāng)前文檔對(duì)應(yīng)維度為該條件所包含的維度ID對(duì)應(yīng)的維度:是,返回步驟4-4;否則,進(jìn)入步驟4-6;步驟4-6,將臨時(shí)結(jié)果集中該文檔標(biāo)記為失效,并返回步驟4-3;步驟4-7,找到從維度層次樹的樹根節(jié)點(diǎn)到當(dāng)前文檔概要中每個(gè)維度值所在節(jié)點(diǎn)的路徑,并將這些路徑上所有節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量加1,并返回步驟4-3。在用戶進(jìn)行操作之后,通過操作請(qǐng)求中的條件,將維度層次樹上不符合條件的文檔標(biāo)記為失效,從而得到符合條件的文檔概要集合。在過濾操作中,在生成臨時(shí)結(jié)果集之前將維度層次樹上的節(jié)點(diǎn)統(tǒng)計(jì)量清零,此處的維度層次樹,根據(jù)臨時(shí)結(jié)果集重新得到節(jié)點(diǎn)統(tǒng)計(jì)量。在過濾操作中,用所生成的臨時(shí)結(jié)果集來替換當(dāng)前結(jié)果集,所得的當(dāng)前結(jié)果集與生成的臨時(shí)結(jié)果集中的內(nèi)容相同,因此根據(jù)替換后的當(dāng)前結(jié)果集更新的維度層次樹隨著所生成的臨時(shí)結(jié)果集的改變而改變。操作指令為瀏覽,則步驟4具體步驟如下:步驟4-1,生成操作請(qǐng)求,所述操作請(qǐng)求包括若干條件,且每個(gè)條件包括一個(gè)維度ID以及對(duì)應(yīng)的維度值;步驟4-2,利用當(dāng)前結(jié)果集生成的副本來替換臨時(shí)結(jié)果集;步驟4-3,判斷臨時(shí)結(jié)果集是否存在未訪問的文檔:是,根據(jù)臨時(shí)結(jié)果集從文檔概要集中取出一個(gè)未訪問的文檔所對(duì)應(yīng)的文檔概要,進(jìn)入步驟4-4;否則,進(jìn)入步驟5;步驟4-4,判斷操作請(qǐng)求中是否存在未訪問的條件:是,進(jìn)入步驟4-5;否則,進(jìn)入步驟4-6;步驟4-5,取出一個(gè)未訪問的條件,判斷其中的維度值是否為當(dāng)前文檔對(duì)應(yīng)維度的維度值集合的子集,其中當(dāng)前文檔對(duì)應(yīng)維度為該條件所包含的維度ID對(duì)應(yīng)的維度:是,返回步驟4-4;否則,進(jìn)入步驟4-6;步驟4-6,將臨時(shí)結(jié)果集中該文檔標(biāo)記為失效,保留當(dāng)前的維度層次樹,并返回步驟4-3。本發(fā)明方法通過維度層次樹向用戶呈現(xiàn)當(dāng)前結(jié)果集中文檔在各個(gè)維度上的分布情況,通過文檔列表向用戶呈現(xiàn)文檔概要。瀏覽和過濾對(duì)維度層次樹的處理不同,其中瀏覽過程中對(duì)維度層次樹進(jìn)行保留,能夠節(jié)省開銷。在步驟6中,將每個(gè)文檔概要構(gòu)建成一條列表項(xiàng)的方法為,對(duì)于每個(gè)文檔概要,將每個(gè)維度值集合置于一行,從而得到具有多行維度值的列表項(xiàng)。本發(fā)明方法通過“過濾”和“瀏覽”幫助用戶查看結(jié)果集,起到了導(dǎo)航的作用;而文檔的多維度化使得用戶可以在維度上按層展開結(jié)果集,查看分布信息和文檔概要,加速了用戶獲取所需信息的速度。本發(fā)明的優(yōu)點(diǎn)包括:獲取信息迅速,亦適應(yīng)需求復(fù)雜、模糊的情況。文檔標(biāo)簽是由專家制定的知識(shí)體系,凝練而準(zhǔn)確,用戶通過維度層次樹上實(shí)體的所屬文檔概要,可以快速確定所需信息的準(zhǔn)確描述,從而獲取所需內(nèi)容。本發(fā)明的多維度導(dǎo)航方法是一種交互能力強(qiáng)的導(dǎo)航。用戶通過過濾和瀏覽兩種模式來查看結(jié)果集,擺脫了搜索引擎所提供的固定檢索結(jié)果順序的局面,增強(qiáng)了交互性。幫助挖掘隱藏于深處的信息,有助于發(fā)現(xiàn)知識(shí)。該方法可從不同維度依維度內(nèi)的層次結(jié)構(gòu)呈現(xiàn)結(jié)果集,使得那些深埋于線性評(píng)級(jí)列表深處的搜索結(jié)果不易被忽略,具有知識(shí)發(fā)現(xiàn)功能。附圖說明圖1為本發(fā)明方法基于深度搜索結(jié)果的多維度導(dǎo)航方法流程圖;圖2為本發(fā)明一個(gè)實(shí)施例構(gòu)建維度層次樹的方法流程圖;圖3為本發(fā)明當(dāng)前實(shí)施例的過濾方法流程圖;圖4為本發(fā)明當(dāng)前實(shí)施例的瀏覽方法流程圖。具體實(shí)施方式現(xiàn)結(jié)合實(shí)施例和附圖對(duì)本發(fā)明進(jìn)行詳細(xì)的解釋。如圖1所示,本發(fā)明提出了基于搜索結(jié)果的多維度導(dǎo)航方法,該方法包括如下步驟:步驟1,讀取所有文檔的維度信息,初始化文檔概要集,并將當(dāng)前結(jié)果集以及臨時(shí)結(jié)果集設(shè)置為所有文檔。首先,初始化所有文檔的概要集Dall,Dall={d1,d2,…,dm},表示所有文檔概要的集合(文檔概要集),其中文檔ID為i的文檔概要文檔ID為i的文檔概要di中維度ID為j的維度的維度值(即實(shí)體值)集合表示為,集合中每個(gè)元素為該維度的維度值,w為維度值個(gè)數(shù),維度由文檔概要決定;Rcurr={ID1,ID2,…,IDk}表示當(dāng)前結(jié)果集,IDi為當(dāng)前結(jié)果集中第i個(gè)文檔的ID。在初始化所有文檔的概要集從而得到當(dāng)前結(jié)果集之后,進(jìn)入步驟2。步驟2,根據(jù)文檔概要集以及當(dāng)前結(jié)果集構(gòu)建維度層次樹及分頁(yè)形式的文檔列表,并顯示維度層次樹、文檔列表中的指定頁(yè)面以及分頁(yè)信息。文檔列表采取分頁(yè)形式顯示文檔概要,每個(gè)分頁(yè)包含N個(gè)文檔概要。步驟2主要負(fù)責(zé)根據(jù)得到的當(dāng)前結(jié)果集,創(chuàng)建相應(yīng)的維度層次樹,同時(shí)完成文檔分布的統(tǒng)計(jì),其流程圖如圖2所示,具體步驟包括:步驟2-1,創(chuàng)建維度層次樹T的樹根節(jié)點(diǎn),設(shè)定初始的節(jié)點(diǎn)統(tǒng)計(jì)量fdoc域?yàn)榱?,children域?yàn)榭?,entity域?yàn)楦鶎?shí)體。維度層次樹的結(jié)點(diǎn)結(jié)構(gòu)表示為:Node={fdoc,children,entity},其中,fdoc為當(dāng)前節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量,當(dāng)前節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量為隸屬于當(dāng)前節(jié)點(diǎn)的文檔個(gè)數(shù)與當(dāng)前節(jié)點(diǎn)所有孩子節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量的總和,entity為當(dāng)前節(jié)點(diǎn)所代表的實(shí)體(即維度,包括維度ID和維度值),children代表當(dāng)前節(jié)點(diǎn)的孩子節(jié)點(diǎn)集。若維度值集合包含節(jié)點(diǎn)的實(shí)體值entity,那么稱文檔概要dt隸屬于節(jié)點(diǎn)這里表示維度ID為j的維度樹的第i個(gè)節(jié)點(diǎn)。步驟2-2,判斷當(dāng)前結(jié)果集Rcurr中是否存在未訪問的文檔概要di:是,則根據(jù)當(dāng)前結(jié)果集Rcurr從文檔概要集Dall中取出一個(gè)未訪問的文檔概要di,進(jìn)入步驟2-3;否則維度層次樹創(chuàng)建結(jié)束;步驟2-3,判斷文檔概要di中是否存在未訪問的維度值集合是,則取出一個(gè)未訪問的維度值集合進(jìn)入步驟2-4;否則,返回步驟2-2;步驟2-4,判斷維度值集合中是否存在未訪問的維度值是,取出一個(gè)未訪問的維度值進(jìn)入步驟2-5,其中t為大于零且小于或等于w的整數(shù);否則,返回步驟2-3;步驟2-5,對(duì)于當(dāng)前維度值集合中的維度值判斷維度層次樹T中是否有從樹根到所在節(jié)點(diǎn)的路徑P:有,進(jìn)入步驟2-7;否則,進(jìn)入步驟2-6;步驟2-6,在維度層次樹T中創(chuàng)建路徑P中所有缺失的節(jié)點(diǎn)(即創(chuàng)建樹根到所在節(jié)點(diǎn)的路徑P),新節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量fdoc為零,孩子節(jié)點(diǎn)children域?yàn)榭?,?shí)體entity域?yàn)橄鄳?yīng)的維度值,路徑P中最后一個(gè)節(jié)點(diǎn)的實(shí)體entity域?yàn)檫M(jìn)入步驟2-7;步驟2-7,將路徑P上所有節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量fdoc域加1,對(duì)于路徑P中各個(gè)未設(shè)孩子節(jié)點(diǎn)的節(jié)點(diǎn),將其直接后繼節(jié)點(diǎn)設(shè)為孩子節(jié)點(diǎn),路徑P上最后一個(gè)節(jié)點(diǎn)的孩子節(jié)點(diǎn)children域?yàn)榭眨又祷夭襟E2-4。步驟3,判斷來自用戶的操作指令的類型并進(jìn)行相應(yīng)操作:若為過濾或?yàn)g覽,進(jìn)入步驟4;若為查詢,則根據(jù)查詢中的條件,由搜索引擎進(jìn)行搜索并返回帶有維度標(biāo)簽的搜索結(jié)果集,并用帶有維度標(biāo)簽的搜索結(jié)果集作為當(dāng)前結(jié)果集,返回步驟2;若為翻頁(yè),則得到用戶輸入的頁(yè)碼K,進(jìn)入步驟6。在過濾或?yàn)g覽的情況下,根據(jù)操作指令的類型,對(duì)維度層次樹的處理方式不相同,并得到對(duì)應(yīng)的臨時(shí)結(jié)果集。步驟4,利用操作指令生成操作請(qǐng)求,再根據(jù)操作請(qǐng)求更新臨時(shí)結(jié)果集,并對(duì)維度層次樹進(jìn)行相應(yīng)的處理,接著根據(jù)操作類型進(jìn)入對(duì)應(yīng)的后續(xù)步驟:若為過濾,則依據(jù)臨時(shí)結(jié)果集更新維度層次樹上各個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量,用臨時(shí)結(jié)果集替換當(dāng)前結(jié)果集,并進(jìn)入步驟5;若為瀏覽,則直接進(jìn)入步驟5。其中,過濾操作支持多維度的多關(guān)鍵詞過濾。在過濾模式下,步驟4至步驟6操作過程如圖3所示。其中過濾模式下,操作請(qǐng)求為過濾請(qǐng)求。步驟4具體如下:步驟4-1,從操作指令中收集搜索詞以及維度約束(若未指定維度約束,則為默認(rèn)維度),并生成過濾請(qǐng)求FR=((dim1,k1),(dim2,k2),…,(dimm,km))。其中任意一個(gè)元素(dimi,ki)表示一個(gè)條件。此處條件為過濾條件,每個(gè)過濾條件都是一個(gè)維度約束,dimi表示在第i個(gè)過濾條件中該維度約束的維度ID,ki表示對(duì)應(yīng)的維度值。步驟4-2,利用當(dāng)前結(jié)果集Rcurr生成的副本來替換臨時(shí)結(jié)果集Rtemp。步驟4-3,判斷當(dāng)前結(jié)果集是否存在未訪問的文檔:是,根據(jù)臨時(shí)結(jié)果集Rtemp從文檔概要集Dall中取出一個(gè)未訪問的文檔所對(duì)應(yīng)的文檔概要,進(jìn)入步驟4-4;否則,用臨時(shí)結(jié)果集替換當(dāng)前結(jié)果集,進(jìn)入步驟5。步驟4-4,判斷操作請(qǐng)求中是否存在未訪問的條件(dimt,kt):是,進(jìn)入步驟4-5;否則,進(jìn)入步驟4-7。步驟4-5,取出一個(gè)未訪問的條件(dimt,kt),判斷該條件中的維度值kt是否是當(dāng)前文檔對(duì)應(yīng)維度的維度值集合的子集,其中當(dāng)前文檔對(duì)應(yīng)維度為該條件所包含的維度ID對(duì)應(yīng)的維度:是,返回步驟4-4;否則,進(jìn)入步驟4-6。步驟4-6,將臨時(shí)結(jié)果集中該文檔標(biāo)記為失效,并返回步驟4-3。步驟4-7,找到維度層次樹T中從樹根節(jié)點(diǎn)到維度di的每個(gè)維度值所在的路徑,將這些路徑上的所有節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計(jì)量fdoc域加1,返回步驟4-3。瀏覽操作支持單維度的單關(guān)鍵詞瀏覽,瀏覽操作的模式下,步驟4至步驟6流程圖如圖4所示,步驟4-1,先根據(jù)瀏覽指令收集搜索詞和維度約束(若未指定,則維度約束為默認(rèn)的維度),并生成對(duì)應(yīng)的操作請(qǐng)求,操作請(qǐng)求包括若干條件。此處條件為瀏覽條件,每個(gè)瀏覽條件都是一個(gè)維度約束,構(gòu)成方式為(dimi,ki)。dimi為操作請(qǐng)求中第i個(gè)維度約束的維度ID,ki為對(duì)應(yīng)的維度值。步驟4-2,利用當(dāng)前結(jié)果集Rcurr生成的副本來替換臨時(shí)結(jié)果集Rtemp;步驟4-3,判斷臨時(shí)結(jié)果集Rtemp是否存在未訪問的文檔:是,根據(jù)臨時(shí)結(jié)果集Rtemp從文檔概要集Dall中取出一個(gè)未訪問的文檔所對(duì)應(yīng)的文檔概要,進(jìn)入步驟4-4;否則,進(jìn)入步驟5;步驟4-4,判斷操作請(qǐng)求中是否存在未訪問的條件:是,進(jìn)入步驟4-5;否則,進(jìn)入步驟4-6;步驟4-5,取出一個(gè)未訪問的條件(dimt,kt),判斷該條件中的維度值kt是否為當(dāng)前文檔對(duì)應(yīng)維度的維度值集合的子集,其中當(dāng)前文檔對(duì)應(yīng)維度為該條件所包含的維度ID對(duì)應(yīng)的維度:是,返回步驟4-4;否則,進(jìn)入步驟4-6;步驟4-6,將臨時(shí)結(jié)果集中該文檔標(biāo)記為失效,保留當(dāng)前的維度層次樹,并返回步驟4-3。其中,步驟4-3至4-6與過濾操作中對(duì)應(yīng)部分類似,圖4中已省略。步驟5,根據(jù)臨時(shí)結(jié)果集Rtemp中有效文檔的文檔ID個(gè)數(shù)更新文檔列表的分頁(yè)信息,將頁(yè)碼K設(shè)為1,并進(jìn)入步驟6。步驟6,將臨時(shí)結(jié)果集Rtemp中的有效文檔按分頁(yè)信息劃分,獲取對(duì)應(yīng)第K頁(yè)的文檔概要,并將每個(gè)文檔概要構(gòu)建成一條列表項(xiàng),將N個(gè)列表項(xiàng)用于更新文檔列表中顯示窗口的內(nèi)容,返回步驟3,其中N為預(yù)設(shè)值。步驟6的具體步驟如下:步驟6-1,將臨時(shí)結(jié)果集Rtemp中的有效文檔按分頁(yè)信息劃分,并獲取對(duì)應(yīng)第K頁(yè)的文檔概要;步驟6-2,將每個(gè)文檔概要di制成一個(gè)列表項(xiàng),其中對(duì)于每個(gè)文檔概要di,將每個(gè)維度值集合置于一行,以適當(dāng)?shù)姆指舴指?,從而得到具有多行值的列表?xiàng)。步驟6-3,更新文檔列表的顯示窗口中的內(nèi)容,顯示所獲得的N個(gè)列表項(xiàng),返回步驟3。本發(fā)明方法通過“過濾”和“瀏覽”幫助用戶查看搜索結(jié)果集,起到了導(dǎo)航的作用;而文檔的多維度化使的用戶可以在維度上按層展開結(jié)果集,查看分布信息和文檔概要,加速了用戶獲取所需信息的速度。