本發(fā)明涉及信息處理
技術(shù)領(lǐng)域:
,特別涉及一種數(shù)據(jù)檢索方法及系統(tǒng)。
背景技術(shù):
:現(xiàn)有的社交網(wǎng)絡系統(tǒng)(比如微信系統(tǒng),或即時通信系統(tǒng))都具有關(guān)系鏈的檢索功能,具體地,社交網(wǎng)絡系統(tǒng)可以根據(jù)用戶輸入的關(guān)鍵字檢索某一個鏈接的文章被該用戶好友的分享情況,并將分享情況展示給用戶?,F(xiàn)有的社交網(wǎng)絡系統(tǒng)一般采用優(yōu)質(zhì)網(wǎng)頁數(shù)據(jù)對象(goodobject,簡稱gob)檢索系統(tǒng)實現(xiàn)上述檢索功能,具體地,社交網(wǎng)絡系統(tǒng)以項(term)到消息標識的倒排數(shù)據(jù)結(jié)構(gòu)儲存用戶與分享的文章之間的關(guān)系,這樣社交網(wǎng)絡系統(tǒng)在檢索用戶分享文章的信息時,會將用戶標識和鏈接標識作為項,分別查找得到用戶標識和鏈接標識對應的消息標識的第一列表和第二列表,然后對第一列表和第二列表進行求交操作得到鏈接標識,及用戶標識和消息標識的對應關(guān)系。由于要對第一列表和第二列表進行求交操作,如果兩個列表的項比較多,則數(shù)據(jù)檢索的計算量就比較大。技術(shù)實現(xiàn)要素:本發(fā)明實施例提供一種數(shù)據(jù)檢索方法及系統(tǒng),實現(xiàn)了在數(shù)據(jù)檢索系統(tǒng)儲存的第一對應關(guān)系列表或第二對應關(guān)系列表中直接查找到消息標識。本發(fā)明實施例提供一種數(shù)據(jù)檢索方法,包括:接收數(shù)據(jù)檢索請求,所述數(shù)據(jù)檢索請求中包括第一用戶標識和第一鏈接標識;如果所述第一鏈接標識在所述第一用戶標識對應的鏈接標識的范圍內(nèi),在預置的第一對應關(guān)系列表中,查找所述第一鏈接標識對應的第一消息標識;其中,所述第一對應關(guān)系列表包括鏈接標識與消息標識的對應關(guān)系;根據(jù)所述第一消息標識顯示對應文章的用戶分享信息。本發(fā)明實施例提供一種數(shù)據(jù)檢索系統(tǒng),包括:第一請求接收單元,用于接收數(shù)據(jù)檢索請求,所述數(shù)據(jù)檢索請求中包括第一用戶標識和第一鏈接標識;第一查找單元,用于如果所述第一鏈接標識在所述第一用戶標識對應的鏈接標識的范圍內(nèi),在預置的第一對應關(guān)系列表中,查找所述第一鏈接標識對應的第一消息標識;其中,所述第一對應關(guān)系列表包括鏈接標識與消息標識的對應關(guān)系;第一結(jié)果顯示單元,用于根據(jù)所述第一消息標識顯示對應的文章的用戶分享信息。在本實施例的一個方面,數(shù)據(jù)檢索系統(tǒng)中以第一對應關(guān)系列表儲存鏈接標識與消息標識的對應關(guān)系,這樣數(shù)據(jù)檢索系統(tǒng)確定數(shù)據(jù)檢索請求中的第一鏈接標識與第一用戶標識相關(guān)聯(lián),則直接在第一對應關(guān)系列表中查找到第一鏈接標識對應的第一消息標識,從而得到用戶分享文章的情況。本實施例中的方法可以不用執(zhí)行求交操作,而是可以直接查找得到最終結(jié)果,相對于現(xiàn)有技術(shù)中的求交操作,數(shù)據(jù)檢索的計算量較少。本發(fā)明實施例還提供一種數(shù)據(jù)檢索方法,包括:接收數(shù)據(jù)檢索請求,所述數(shù)據(jù)檢索請求中包括第一用戶標識和第一鏈接標識;如果所述第一用戶標識在所述第一鏈接標識對應的用戶標識的范圍內(nèi),在預置的第二對應關(guān)系列表中,查找所述第一用戶標識對應的第一消息標識;其中,所述第二對應關(guān)系列表包括用戶標識與消息標識的對應關(guān)系;根據(jù)所述第一消息標識顯示對應文章的用戶分享信息。本發(fā)明實施例還提供一種數(shù)據(jù)檢索系統(tǒng),包括:第二請求接收單元,接收數(shù)據(jù)檢索請求,所述數(shù)據(jù)檢索請求中包括第一用戶標識和第一鏈接標識;第二查找單元,用于如果所述第一用戶標識在所述第一鏈接標識對應的用戶標識的范圍內(nèi),在預置的第二對應關(guān)系列表中,查找所述第一用戶標識對應的第一消息標識;其中,所述第二對應關(guān)系列表包括用戶標識與消息標識的對應關(guān)系;第二結(jié)果顯示單元,用于根據(jù)所述第一消息標識顯示對應文章的用戶分享信息。在本實施例的另一方面,數(shù)據(jù)檢索系統(tǒng)中以第二對應關(guān)系列表儲存用戶 標識與消息標識的對應關(guān)系,這樣數(shù)據(jù)檢索系統(tǒng)確定數(shù)據(jù)檢索請求中的第一用戶標識與第一鏈接標識相關(guān)聯(lián),則直接在第二對應關(guān)系列表中查找到第一用戶標識對應的第一消息標識,從而得到用戶分享文章的情況。本實施例中的方法可以不用執(zhí)行求交操作,而是可以直接查找得到最終結(jié)果,相對于現(xiàn)有技術(shù)中的求交操作,數(shù)據(jù)檢索的計算量較少。附圖說明為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實施例一提供的一種數(shù)據(jù)檢索方法的流程圖;圖2是本發(fā)明實施例二提供的一種數(shù)據(jù)檢索方法的流程圖;圖3是本發(fā)明實施例一中數(shù)據(jù)檢索系統(tǒng)儲存數(shù)據(jù)的示意圖;圖4是本發(fā)明實施例二中數(shù)據(jù)檢索系統(tǒng)儲存數(shù)據(jù)的示意圖;圖5是本發(fā)明實施例三提供的數(shù)據(jù)檢索方法應用于的社交網(wǎng)絡系統(tǒng)的結(jié)構(gòu)示意圖;圖6是本發(fā)明實施例三提供的一種數(shù)據(jù)檢索方法的示意圖;圖7是本發(fā)明實施例四提供的一種數(shù)據(jù)檢索系統(tǒng)的結(jié)構(gòu)示意圖;圖8是本發(fā)明實施例四提供的另一種數(shù)據(jù)檢索系統(tǒng)的結(jié)構(gòu)示意圖;圖9是本發(fā)明實施例五提供的一種數(shù)據(jù)檢索系統(tǒng)的結(jié)構(gòu)示意圖;圖10是本發(fā)明實施例五提供的另一種數(shù)據(jù)檢索系統(tǒng)的結(jié)構(gòu)示意圖;圖11是本發(fā)明實施例六提供的一種數(shù)據(jù)檢索系統(tǒng)的結(jié)構(gòu)示意圖。具體實施方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”、“第三”“第四”等(如果存在)是用于區(qū)別類似的對象,而不必用于描述特定的順 序或先后次序。應該理解這樣使用的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本發(fā)明的實施例例如能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤4送?,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排它的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設備固有的其它步驟或單元。本發(fā)明實施例一提供一種數(shù)據(jù)檢索方法,主要是應用于社交網(wǎng)絡系統(tǒng)中比如微信系統(tǒng),微博系統(tǒng)或即時通信系統(tǒng)(比如qq系統(tǒng)等)等,在社交網(wǎng)絡系統(tǒng)中可以包括客戶端和服務器,在服務器中裝載數(shù)據(jù)檢索系統(tǒng),本實施例的方法是服務器的數(shù)據(jù)檢索系統(tǒng)所執(zhí)行的方法,流程圖如圖1所示,包括:步驟101,接收數(shù)據(jù)檢索請求,數(shù)據(jù)檢索請求中包括第一用戶標識和第一鏈接標識,這里第一用戶標識是唯一標識某一個用戶的信息,比如微信號,微博號或即時通信號等;第一鏈接標識是唯一標識某一個文章鏈接的信息??梢岳斫?,用戶可以通過社交網(wǎng)絡系統(tǒng)中包括的客戶端發(fā)起數(shù)據(jù)檢索流程,具體地,用戶可以在客戶端顯示的搜索界面選擇至少一個文章鏈接,且可以選擇該用戶的用戶標識,和/或,與該用戶相關(guān)的至少一個用戶標識,以發(fā)起本實施例的數(shù)據(jù)檢索請求,并在數(shù)據(jù)檢索請求中添加用戶選擇的信息;這樣服務器的數(shù)據(jù)檢索系統(tǒng)會接收到客戶端發(fā)送的數(shù)據(jù)檢索請求,并執(zhí)行如下步驟102到104。其中,在數(shù)據(jù)檢索請求中的第一用戶標識和第一鏈接標識可以分別為一個,或分別為多個。步驟102,判斷第一鏈接標識是否在第一用戶標識對應的鏈接標識的范圍內(nèi),如果是,則執(zhí)行步驟103,說明該第一用戶標識對應用戶通過客戶端分享了第一鏈接標識所標識鏈接的文章;如果不是,則結(jié)束流程。需要說明的是,當某一用戶通過客戶端分享某一鏈接的文章時,本實施例的數(shù)據(jù)檢索系統(tǒng)會接收到該用戶對某一鏈接的文章的分享請求,在分享請求中包括該某一鏈接的第一鏈接標識和該用戶的第一用戶標識,且還可以包括用戶的評論信息;則數(shù)據(jù)檢索系統(tǒng)會將該鏈接的文章的信息儲存成第一用戶標識對應的一條消息,且還可以將用戶的評論信息儲存到該條消息中,并 生成該條消息的第一消息標識來唯一標識該條消息,且將該第一鏈接標識和第一消息標識儲存到第一對應關(guān)系列表中,并將該第一鏈接標識與第一用戶標識關(guān)聯(lián)。因此,在執(zhí)行本步驟102時,數(shù)據(jù)檢索系統(tǒng)可以查找數(shù)據(jù)檢索系統(tǒng)中儲存的與第一用戶標識關(guān)聯(lián)的鏈接標識中是否包括第一鏈接標識,如果有,則執(zhí)行步驟103。因此,本實施例中,數(shù)據(jù)檢索系統(tǒng)中不僅需要儲存第一對應關(guān)系列表,還需要儲存與用戶標識關(guān)聯(lián)的鏈接標識的信息。在具體實現(xiàn)過程中:(1)第一對應關(guān)系列表可以包括多個數(shù)據(jù)塊,每個數(shù)據(jù)塊包括頭部和值兩部分。其中頭部的結(jié)構(gòu)可以如下表1所示,包括數(shù)據(jù)長度(datalength)和下一數(shù)據(jù)塊(next)在文件中的偏移(offset)數(shù)據(jù),且還可以包括預留(reserve)數(shù)據(jù),這里數(shù)據(jù)長度用于指示該數(shù)據(jù)塊的長度,下一數(shù)據(jù)塊在文件中的偏移數(shù)據(jù)用于指示該數(shù)據(jù)塊的下一數(shù)據(jù)塊的位置信息。表18bytesnextoffset8bytesdatalength16bytesreserve每個數(shù)據(jù)塊的值的結(jié)構(gòu)可以如下表2所示,包括鏈接標識及對應的消息標識,其中鏈接標識可以用文檔標識(documentidentity,簡稱docid)來表示,消息標識用推特標識(tweetidentity,簡稱tid)來表示,該tid主要是指用戶通過社交網(wǎng)絡系統(tǒng)的客戶端發(fā)表的一條消息的標識,比如微博消息的標識,微信消息的標識。表28bytestida8bytesdocida8bytestidb8bytesdocidb(2)本實施例中,數(shù)據(jù)檢索系統(tǒng)可以通過用戶標識索引查找到與用戶標識關(guān)聯(lián)的鏈接標識的信息。其中,用戶標識索引的結(jié)構(gòu)可以如下述表3所示,包括用戶標識和關(guān)聯(lián)信息在文件中的偏移數(shù)據(jù),這里用戶標識可以用用戶識別號碼(useridentificationnumber,簡稱uin)來表示,關(guān)聯(lián)信息在文件中的偏移數(shù)據(jù)用于標識與該用戶標識關(guān)聯(lián)的鏈接標識的信息的位置信息。表38bytesuin8bytesoffset步驟103,在預置的第一對應關(guān)系列表中,查找上述第一鏈接標識對應的第一消息標識。其中,第一對應關(guān)系列表包括鏈接標識與消息標識的對應關(guān)系。步驟104,根據(jù)第一消息標識顯示對應文章的用戶分享信息,用戶分享信息具體可以包括用戶的評論信息,分享該文章的用戶數(shù)等信息。在一個具體的實施例中,為了進一步地減少數(shù)據(jù)檢索的工作量,如果上述數(shù)據(jù)檢索請求中包括的第一用戶標識有多個,則在執(zhí)行步驟102之前,數(shù)據(jù)檢索系統(tǒng)可以先使用過濾器過濾多個第一用戶標識中的至少一個第二用戶標識得到剩余的第三用戶標識,第二用戶標識為未對應任何鏈接標識的用戶標識;則在執(zhí)行步驟102時,數(shù)據(jù)檢索系統(tǒng)會判斷第一鏈接標識是否在第三用戶標識對應的鏈接標識的范圍內(nèi)。具體地,數(shù)據(jù)檢索系統(tǒng)中儲存的過濾器的數(shù)據(jù)可以包括:過濾器索引和過濾器值,其中,過濾器索引的結(jié)構(gòu)可以如下表4所示,包括鏈接標識和過濾器在文件中的偏移數(shù)據(jù),其中過濾器在文件中的偏移數(shù)據(jù)用于指示過濾器的位置信息,且一個鏈接標識對應一個過濾器。表48bytesdocid8bytesoffset過濾器值的結(jié)構(gòu)可以如下表5所示,包括多個數(shù)據(jù)塊,每個數(shù)據(jù)塊中包括數(shù)據(jù)長度和過濾策略數(shù)據(jù),其中數(shù)據(jù)長度用于指示過濾策略數(shù)據(jù)的長度,過濾策略數(shù)據(jù)是指過濾用戶標識的策略數(shù)據(jù),可以由用戶預置。這里過濾器可以是布隆過濾器(bloomfilter,簡稱bf)。表54byteslengthxbytesbfdataa4byteslengthxbytesbfdatab另外,需要說明的是,本實施例中數(shù)據(jù)檢索系統(tǒng)在儲存第一對應關(guān)系列表和與用戶標識關(guān)聯(lián)的鏈接標識的信息時,都是儲存于該數(shù)據(jù)檢索系統(tǒng)的永久性存儲器(比如磁盤)中,而過濾器的數(shù)據(jù)可以儲存在暫時性存儲器(比 如內(nèi)存)中??梢姡诒緦嵤├姆椒ㄖ?,數(shù)據(jù)檢索系統(tǒng)中以第一對應關(guān)系列表儲存鏈接標識與消息標識的對應關(guān)系,這樣數(shù)據(jù)檢索系統(tǒng)確定數(shù)據(jù)檢索請求中的第一鏈接標識與第一用戶標識相關(guān)聯(lián),則直接在第一對應關(guān)系列表中查找到第一鏈接標識對應的第一消息標識,從而得到用戶分享某一鏈接的文章的情況。本實施例中的方法可以不用執(zhí)行求交操作,而是可以直接查找得到最終結(jié)果,相對于現(xiàn)有技術(shù)中的求交操作,數(shù)據(jù)檢索的計算量較少。本發(fā)明實施例二提供一種數(shù)據(jù)檢索方法,主要是應用于社交網(wǎng)絡系統(tǒng)中,在社交網(wǎng)絡系統(tǒng)中可以包括客戶端和服務器,在服務器中裝載數(shù)據(jù)檢索系統(tǒng),本實施例的方法是服務器的數(shù)據(jù)檢索系統(tǒng)所執(zhí)行的方法,流程圖如圖2所示,包括:步驟201,接收數(shù)據(jù)檢索請求,數(shù)據(jù)檢索請求中包括第一用戶標識和第一鏈接標識,這里第一用戶標識是唯一標識某一個用戶的信息,比如微信號,微博號或即時通信號等;第一鏈接標識是唯一標識某一個文章鏈接的信息。可以理解,用戶可以通過社交網(wǎng)絡系統(tǒng)中包括的客戶端發(fā)起數(shù)據(jù)檢索流程,具體地,用戶可以在客戶端顯示的搜索界面選擇至少一個文章鏈接,且可以選擇該用戶的用戶標識,和/或,與該用戶相關(guān)的至少一個用戶標識,以發(fā)起本實施例的數(shù)據(jù)檢索請求,并在數(shù)據(jù)檢索請求中添加用戶選擇的信息;這樣服務器的數(shù)據(jù)檢索系統(tǒng)會接收到客戶端發(fā)送的數(shù)據(jù)檢索請求,并執(zhí)行如下步驟202到204。其中,在數(shù)據(jù)檢索請求中的第一用戶標識和第一鏈接標識可以分別為一個,或分別為多個。步驟202,判斷第一用戶標識是否在第一鏈接標識對應的用戶標識的范圍內(nèi),如果是,則執(zhí)行步驟203,說明該第一用戶標識對應用戶通過客戶端分享了第一鏈接標識所標識鏈接的文章;如果不是,則結(jié)束流程。需要說明的是,當某一用戶通過客戶端分享某一鏈接的文章時,本實施例的數(shù)據(jù)檢索系統(tǒng)會接收到該用戶對某一鏈接的文章的分享請求,在分享請求中包括該某一鏈接的第一鏈接標識和該用戶的第一用戶標識,且還可以包括用戶的評論信息;則數(shù)據(jù)檢索系統(tǒng)會將該鏈接的文章的信息儲存成第一用戶標識對應的一條消息,且還可以將用戶的評論信息儲存到該條消息中,并 生成該條消息的第一消息標識來唯一標識該條消息,且將該第一用戶標識和第一消息標識儲存到第二對應關(guān)系列表中,并將該第一用戶標識與第一鏈接標識關(guān)聯(lián)。因此,在執(zhí)行本步驟202時,數(shù)據(jù)檢索系統(tǒng)可以查找數(shù)據(jù)檢索系統(tǒng)中儲存的與第一鏈接標識關(guān)聯(lián)的用戶標識中是否包括第一用戶標識,如果有,則執(zhí)行步驟203。因此,本實施例中,數(shù)據(jù)檢索系統(tǒng)中不僅需要儲存第二對應關(guān)系列表,還需要儲存與鏈接標識關(guān)聯(lián)的用戶標識的信息。在具體實現(xiàn)過程中:(1)第二對應關(guān)系列表可以包括多個數(shù)據(jù)塊,每個數(shù)據(jù)塊包括頭部和值兩部分。其中頭部的結(jié)構(gòu)可以如上述表1所示,包括數(shù)據(jù)長度和下一數(shù)據(jù)塊在文件中的偏移數(shù)據(jù),且還可以包括預留數(shù)據(jù);每個數(shù)據(jù)塊的值的結(jié)構(gòu)可以如下表6所示,包括用戶標識及對應的消息標識,這里用戶標識可以用uin來表示,消息標識可以用tid來表示。表68bytestida8bytesuina8bytestidb8bytesuinb(2)本實施例中,數(shù)據(jù)檢索系統(tǒng)可以通過鏈接標識索引查找到與鏈接標識關(guān)聯(lián)的用戶標識的信息。其中,鏈接標識索引的結(jié)構(gòu)可以如下述表7所示,包括鏈接標識和關(guān)聯(lián)信息在文件中的偏移數(shù)據(jù),這里鏈接標識可以用docid來表示,關(guān)聯(lián)信息在文件中的偏移數(shù)據(jù)用于標識與該鏈接標識關(guān)聯(lián)的用戶標識的信息的位置信息。表78bytesdocid8bytesoffset步驟203,在預置的第二對應關(guān)系列表中,查找上述第一用戶標識對應的第一消息標識。其中,第二對應關(guān)系列表包括用戶標識與消息標識的對應關(guān)系。步驟204,根據(jù)第一消息標識顯示對應文章的用戶分享信息,用戶分享信息具體可以包括用戶評論信息,分享該文章的用戶數(shù)等信息。在一個具體的實施例中,為了進一步地減少數(shù)據(jù)檢索的工作量,如果上述數(shù)據(jù)檢索請求中包括的第一用戶標識有多個,則在執(zhí)行步驟202之前,數(shù)據(jù) 檢索系統(tǒng)可以先使用過濾器過濾多個第一用戶標識中的至少一個第二用戶標識得到剩余的第三用戶標識,第二用戶標識為未對應任何鏈接標識的用戶標識;則在執(zhí)行步驟202時,數(shù)據(jù)檢索系統(tǒng)會判斷第三用戶標識是否在第一鏈接標識對應的用戶標識的范圍內(nèi)。具體地,本實施例的過濾器的結(jié)構(gòu)可以如上述表5中所述,在此不進行贅述。在這種情況下,數(shù)據(jù)檢索系統(tǒng)中儲存的標識索引的結(jié)構(gòu)可以如下表8所示,包括鏈接標識、關(guān)聯(lián)信息在文件中的偏移數(shù)據(jù)和過濾器在文件中的偏移數(shù)據(jù),這里過濾器在文件中的偏移數(shù)據(jù)用于標識與該鏈接標識對應的過濾器的數(shù)據(jù)的位置信息,鏈接標識可以用docid來表示。表88bytesdocid8bytesoffset8bytesbfoffset另一種情況下,本實施例中的過濾器的結(jié)構(gòu)也可以如上述實施例一中所述,包括過濾器索引和過濾器值,在此不進行贅述。在這種情況下,直接可以通過第一鏈接標識就可以定位到對應過濾器的位置,則數(shù)據(jù)檢索系統(tǒng)中儲存的標識索引的結(jié)構(gòu)可以如上述表7所示,而不用包括過濾器在文件中的偏移數(shù)據(jù)。另外,需要說明的是,本實施例中數(shù)據(jù)檢索系統(tǒng)在儲存第二對應關(guān)系列表和與鏈接標識關(guān)聯(lián)的用戶標識的信息時,都是儲存于該數(shù)據(jù)檢索系統(tǒng)的永久性存儲器(比如磁盤)中,而過濾器的數(shù)據(jù)可以儲存在暫時性存儲器(比如內(nèi)存)中??梢姡诒緦嵤├姆椒ㄖ?,數(shù)據(jù)檢索系統(tǒng)中以第二對應關(guān)系列表儲存用戶標識與消息標識的對應關(guān)系,這樣數(shù)據(jù)檢索系統(tǒng)確定數(shù)據(jù)檢索請求中的第一用戶標識與第一鏈接標識相關(guān)聯(lián),則直接在第二對應關(guān)系列表中查找到第一用戶標識對應的第一消息標識,從而得到用戶分享文章的情況。本實施例中的方法可以不用執(zhí)行求交操作,而是可以直接查找得到最終結(jié)果,相對于現(xiàn)有技術(shù)中的求交操作,數(shù)據(jù)檢索的計算量較少。需要說明的是,本實施例二與上述實施例一相比,數(shù)據(jù)檢索系統(tǒng)所采用的檢索方法類似,都是從對應關(guān)系列表中可以直接查找到最終結(jié)果,不同的是,上述實施例一中,數(shù)據(jù)檢索系統(tǒng)儲存的數(shù)據(jù)結(jié)構(gòu)是用戶標識到鏈接標識 與消息標識的對應關(guān)系的倒排數(shù)據(jù)結(jié)構(gòu),具體可以如圖3所示,這樣通過用戶標識可以找到對應的消息標識。而在實施例二中,數(shù)據(jù)檢索系統(tǒng)儲存的數(shù)據(jù)結(jié)構(gòu)是鏈接標識到用戶標識與文章標識的對應關(guān)系的倒排數(shù)據(jù)結(jié)構(gòu),具體可以如圖4所示,這樣通過鏈接標識可以找到對應的消息標識。其中由于一個用戶所分享的文章數(shù)量,相比一篇文章被分享的用戶數(shù)量較小,則用戶標識對應的鏈接標識與消息標識的數(shù)據(jù),會比鏈接標識對應的用戶標識與消息標識的數(shù)據(jù)少很多,一般情況下,幾乎所有用戶標識對應的鏈接標識與消息標識的數(shù)據(jù)只要一個4kb的數(shù)據(jù)塊就可以存放,因此,采用實施例一中的方法,數(shù)據(jù)檢索系統(tǒng)中儲存的數(shù)據(jù)量要小。本發(fā)明實施例三以一個具體的實施例說明本實施例一中所述的數(shù)據(jù)檢索方法,在本實施例的方法適用于社交網(wǎng)絡系統(tǒng),如圖5所示,本實施例的社交網(wǎng)絡系統(tǒng)包括社交網(wǎng)絡客戶端和社交網(wǎng)絡服務器,在社交網(wǎng)絡服務器中裝載數(shù)據(jù)檢索系統(tǒng)。(1)用戶通過社交網(wǎng)絡客戶端發(fā)起本實施例的數(shù)據(jù)檢索流程。具體地,用戶可以在社交網(wǎng)絡客戶端顯示的文章搜索界面中輸入關(guān)鍵字并點擊提交,則社交網(wǎng)絡客戶端會向文章服務器發(fā)送文章搜索請求,這樣文章服務器會根據(jù)關(guān)鍵字搜索相關(guān)的文章信息,并將文章的鏈接信息發(fā)送給社交網(wǎng)絡客戶端進行顯示。這樣用戶可以選擇一個或多個鏈接,且可以選擇該用戶的用戶標識,或與該用戶相關(guān)的其它用戶標識,并提交,這樣社交網(wǎng)絡客戶端會向社交網(wǎng)絡服務器發(fā)送上述實施例一中所述的數(shù)據(jù)檢索請求,并由社交網(wǎng)絡服務器中的數(shù)據(jù)檢索系統(tǒng)執(zhí)行上述實施例一中所述的方法。其中文章服務器是社交網(wǎng)絡系統(tǒng)所支撐的一個服務器。(2)數(shù)據(jù)檢索系統(tǒng)接收到數(shù)據(jù)檢索請求,例如在數(shù)據(jù)檢索請求中包括的第一用戶標識為uin1,第一鏈接標識為docid1。參考圖6所示,數(shù)據(jù)檢索系統(tǒng)會查找到該uin1所屬的哈希(hash)桶即哈希索引,并根據(jù)哈希索引中的哈希列表偏移確定哈希列表所在的位置;然后查找到哈希列表,并根據(jù)哈希列表中uin1的關(guān)聯(lián)信息的偏移確定與uin1關(guān)聯(lián)的鏈接標識的信息的位置;再查找到與該uin1關(guān)聯(lián)的信息,具體可以包括最大 docid,最小docid,鏈接標識所在磁盤標識符(diskid),所在文件的標識(fileid)及對應關(guān)系偏移等。如果上述docid1在最大docid與最小docid的范圍內(nèi),且在與uin關(guān)聯(lián)的鏈接標識的信息中匹配到該docid1,則數(shù)據(jù)檢索系統(tǒng)確定docid1在uin1對應的鏈接標識的范圍內(nèi),并根據(jù)其中的對應關(guān)系偏移確定鏈接標識和消息標識的第一對應關(guān)系的值的位置,然后根據(jù)該位置查找到第一對應關(guān)系的值即tid+doc的值;從tid+doc的值中取出docid1對應的tid值。(3)數(shù)據(jù)檢索系統(tǒng)可以將最終得到的tid值發(fā)送給文章服務器,由文章服務器根據(jù)該tid值得到對應文章的用戶分享信息,并將用戶分享信息發(fā)送給社交網(wǎng)絡客戶端進行顯示。本發(fā)明實施例四提供一種數(shù)據(jù)檢索系統(tǒng),本實施例的系統(tǒng)是上述實施例一所述的數(shù)據(jù)檢索系統(tǒng),其結(jié)構(gòu)示意圖如圖7所示,具體可以包括:第一請求接收單元10,用于接收數(shù)據(jù)檢索請求,所述數(shù)據(jù)檢索請求中包括第一用戶標識和第一鏈接標識;在數(shù)據(jù)檢索請求中的第一用戶標識和第一鏈接標識可以分別為一個,或分別為多個。第一查找單元11,用于如果所述第一請求接收單元10接收的數(shù)據(jù)檢索請求中包括的第一鏈接標識在所述第一用戶標識對應的鏈接標識的范圍內(nèi),在預置的第一對應關(guān)系列表中,查找所述第一鏈接標識對應的第一消息標識;其中,所述第一對應關(guān)系列表包括鏈接標識與消息標識的對應關(guān)系。第一結(jié)果顯示單元12,用于根據(jù)所述第一查找單元11查找的第一消息標識顯示對應文章的用戶分享信息??梢姡诒緦嵤├臄?shù)據(jù)檢索系統(tǒng)中以第一對應關(guān)系列表儲存鏈接標識與消息標識的對應關(guān)系,這樣當?shù)谝徊檎覇卧?1確定數(shù)據(jù)檢索請求中的第一鏈接標識與第一用戶標識相關(guān)聯(lián),則直接在第一對應關(guān)系列表中查找到第一鏈接標識對應的第一消息標識,從而得到用戶分享文章的情況。本實施例中的系統(tǒng)可以不用執(zhí)行求交操作,而是可以直接查找得到最終結(jié)果,相對于現(xiàn)有技術(shù)中的求交操作,數(shù)據(jù)檢索的計算量較少。參考圖8所示,在一個具體的實施例中,數(shù)據(jù)檢索系統(tǒng)除了可以包括如圖 7所示的結(jié)構(gòu)外,還可以包括第一過濾單元13和第一對應關(guān)系儲存單元14,其中:當所述第一請求接收單元10接收的數(shù)據(jù)檢索請求中包括的第一用戶標識有多個,第一過濾單元13,用于使用過濾器過濾所述多個第一用戶標識中的至少一個第二用戶標識得到剩余的第三用戶標識,所述第二用戶標識為未對應任何鏈接標識的用戶標識;這樣所述第一查找單元11,具體用于如果所述第一鏈接標識在所述第一過濾單元13過濾得到的第三用戶標識對應的鏈接標識的范圍內(nèi),在預置的第一對應關(guān)系列表中,查找所述第一鏈接標識對應的第一消息標識,減少了數(shù)據(jù)檢索的工作量。其中,過濾器的數(shù)據(jù)包括:過濾器索引和過濾器值,其中,所述過濾器索引中包括鏈接標識和所述過濾器在文件中的偏移數(shù)據(jù),所述過濾器值中包括多個數(shù)據(jù)塊,每個數(shù)據(jù)塊中包括數(shù)據(jù)長度和過濾策略數(shù)據(jù)。第一對應關(guān)系儲存單元14,用于接收到用戶對某一鏈接的文章的分享請求,所述分享請求中包括所述某一鏈接的第一鏈接標識和所述用戶的第一用戶標識;將所述某一鏈接的文章的信息儲存成所述第一用戶標識對應的一條消息,并生成所述一條消息的第一消息標識,將所述第一鏈接標識和第一消息標識儲存到所述第一對應關(guān)系列表中,將所述第一鏈接標識與所述第一用戶標識關(guān)聯(lián);其中,所述第一對應關(guān)系列表中包括多個數(shù)據(jù)塊,每個數(shù)據(jù)塊包括頭部和值,所述頭部包括數(shù)據(jù)長度和下一數(shù)據(jù)塊在文件中的偏移數(shù)據(jù),每個數(shù)據(jù)塊的值包括鏈接標識及對應的消息標識。這樣第一查找單元11會在第一對應關(guān)系儲存單元14儲存的第一對應關(guān)系列表中查找到對應的第一消息標識。本實施例中的第一對應關(guān)系儲存單元14在將所述第一鏈接標識與所述第一用戶標識關(guān)聯(lián)時,可以通過用戶標識索引來關(guān)聯(lián),其中用戶標識索引的結(jié)構(gòu)可以如上述實施例一中所述,在此不進行贅述。本發(fā)明實施例五提供一種數(shù)據(jù)檢索系統(tǒng),本實施例的系統(tǒng)是上述實施例二所述的數(shù)據(jù)檢索系統(tǒng),其結(jié)構(gòu)示意圖如圖9所示,具體可以包括:第二請求接收單元20,接收數(shù)據(jù)檢索請求,所述數(shù)據(jù)檢索請求中包括第 一用戶標識和第一鏈接標識;;在數(shù)據(jù)檢索請求中的第一用戶標識和第一鏈接標識可以分別為一個,或分別為多個。第二查找單元21,用于如果所述第二請求接收單元20接收的數(shù)據(jù)檢索請求中包括的第一用戶標識在所述第一鏈接標識對應的用戶標識的范圍內(nèi),在預置的第二對應關(guān)系列表中,查找所述第一用戶標識對應的第一消息標識;其中,所述第二對應關(guān)系列表包括用戶標識與消息標識的對應關(guān)系。第二結(jié)果顯示單元22,用于根據(jù)所述第二查找單元21查找的第一消息標識顯示對應文章的用戶分享信息。在本實施例的數(shù)據(jù)檢索系統(tǒng)中以第二對應關(guān)系列表儲存用戶標識與消息標識的對應關(guān)系,這樣數(shù)據(jù)檢索系統(tǒng)的第二查找單元21確定數(shù)據(jù)檢索請求中的第一用戶標識與第一鏈接標識相關(guān)聯(lián),則直接在第二對應關(guān)系列表中查找到第一用戶標識對應的第一消息標識,從而得到用戶分享文章的情況。本實施例中的系統(tǒng)可以不用執(zhí)行求交操作,而是可以直接查找得到最終結(jié)果,相對于現(xiàn)有技術(shù)中的求交操作,數(shù)據(jù)檢索的計算量較少。參考圖10所示,在一個具體的實施例中,數(shù)據(jù)檢索系統(tǒng)除了可以包括如圖9所示的結(jié)構(gòu)外,還可以包括第二過濾單元23和第二對應關(guān)系儲存單元24,其中:第二對應關(guān)系儲存單元24,用于接收到某一用戶對某一鏈接的文章的分享請求,所述分享請求中包括所述某一鏈接的第一鏈接標識和所述某一用戶的第一用戶標識;將所述某一鏈接的文章的信息儲存成所述第一用戶標識對應的一條消息,并生成所述一條消息的第一消息標識,將所述第一用戶標識和第一消息標識儲存到所述第二對應關(guān)系列表中,且將所述第一用戶標識與第一鏈接標識關(guān)聯(lián);其中,所述第二對應關(guān)系列表中包括多個數(shù)據(jù)塊,每個數(shù)據(jù)塊包括頭部和值,所述頭部包括數(shù)據(jù)長度和下一數(shù)據(jù)塊在文件中的偏移數(shù)據(jù),每個數(shù)據(jù)塊的值包括用戶標識及對應的消息標識。本實施例中的第二對應關(guān)系儲存單24在將所述第一用戶標識與第一鏈接標識關(guān)聯(lián)時,可以通過用戶標識索引來關(guān)聯(lián),其中用戶標識索引的結(jié)構(gòu)可以如上述實施例二中所述,可以有如表7和表8中所示的兩種結(jié)構(gòu),在此不進行贅述。當?shù)诙埱蠼邮諉卧?0接收的數(shù)據(jù)檢索請求中包括的第一用戶標識有多個;則第二過濾單元23,用于使用過濾器過濾所述多個第一用戶標識中的至少一個第二用戶標識得到剩余的第三用戶標識,所述第二用戶標識為未對應任何鏈接標識的用戶標識;這樣第二查找單元21,具體用于如果所述第二過濾單元23過濾得到的第三用戶標識在所述第一鏈接標識對應的用戶標識的范圍內(nèi),在預置的第二對應關(guān)系列表中,查找所述第一用戶標識對應的第一消息標識,減少了數(shù)據(jù)檢索的工作量。其中,所述過濾器的數(shù)據(jù)包括:過濾器索引和過濾器值,其中,所述過濾器索引中包括鏈接標識和所述過濾器在文件中的偏移數(shù)據(jù),所述過濾器值中包括多個數(shù)據(jù)塊,每個數(shù)據(jù)塊中包括數(shù)據(jù)長度和過濾策略數(shù)據(jù)。在這種情況下,第二對應關(guān)系儲存單24關(guān)聯(lián)信息時所使用的用戶標識索引的結(jié)構(gòu)可以如上述表7中所示的結(jié)構(gòu)。另一種情況下,所述過濾器的數(shù)據(jù)包括過濾器值,所述過濾器值包括多個數(shù)據(jù)塊,每個數(shù)據(jù)塊中包括數(shù)據(jù)長度和過濾策略數(shù)據(jù)。在這種情況下,第二對應關(guān)系儲存單24關(guān)聯(lián)信息時所使用的用戶標識索引的結(jié)構(gòu)可以如上述表8中所示的結(jié)構(gòu)。本發(fā)明實施例五本發(fā)明實施例還提供一種數(shù)據(jù)檢索系統(tǒng),其結(jié)構(gòu)示意圖如圖11所示,該數(shù)據(jù)檢索系統(tǒng)可因配置或性能不同而產(chǎn)生比較大的差異,可以包括一個或一個以上中央處理器(centralprocessingunits,cpu)30(例如,一個或一個以上處理器)和存儲器31,一個或一個以上存儲應用程序321或數(shù)據(jù)322的存儲介質(zhì)32(例如一個或一個以上海量存儲設備)。其中,存儲器31和存儲介質(zhì)32可以是短暫存儲或持久存儲。存儲在存儲介質(zhì)32的程序可以包括一個或一個以上模塊(圖示沒標出),每個模塊可以包括對數(shù)據(jù)檢索系統(tǒng)中的一系列指令操作。更進一步地,中央處理器30可以設置為與存儲介質(zhì)32通信,在數(shù)據(jù)檢索系統(tǒng)上執(zhí)行存儲介質(zhì)32中的一系列指令操作。數(shù)據(jù)檢索系統(tǒng)還可以包括一個或一個以上電源33,一個或一個以上有線或無線網(wǎng)絡接口34,一個或一個以上輸入輸出接口35,和/或,一個或一個以上操作系統(tǒng)323,例如windowsservertm,macosxtm,unixtm,linuxtm, freebsdtm等等。上述方法實施例中所述的由數(shù)據(jù)檢索系統(tǒng)所執(zhí)行的步驟可以基于該圖11所示的數(shù)據(jù)檢索系統(tǒng)的結(jié)構(gòu)。本領(lǐng)域普通技術(shù)人員可以理解上述實施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲于一計算機可讀存儲介質(zhì)中,存儲介質(zhì)可以包括:只讀存儲器(rom)、隨機存取存儲器ram)、磁盤或光盤等。以上對本發(fā)明實施例所提供的數(shù)據(jù)檢索方法及系統(tǒng)進行了詳細介紹,本文中應用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實施方式及應用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應理解為對本發(fā)明的限制。當前第1頁12