信息檢索方法和裝置的制造方法
【技術領域】
[0001] 本發(fā)明涉及數(shù)據(jù)處理領域,具體而言,涉及一種信息檢索方法和裝置。
【背景技術】
[0002] 隨著社交平臺的普及,越來越多的檢索需要在關聯(lián)的好友、粉絲等所擁有的社交 網絡信息(如簽名、微博、發(fā)表的文章等)中進行?,F(xiàn)有技術在進行檢索時,需要對發(fā)起檢索 者所關聯(lián)的每個好友與屬于該好友的所有文檔的關系鏈下發(fā)給檢索平臺,檢索平臺對待檢 索的關鍵詞與每個好友的文檔取交集,然后再對多個好友的交集結果進行取并集的運算, 從而得到包括待檢索的關鍵詞的所有社交網絡信息。
[0003] 但是,在發(fā)起檢索者的好友較多導致關系鏈較長時,或者取交集的操作較多時,檢 索平臺進行檢索會增加耗時,導致檢索效率較低。
[0004] 針對現(xiàn)有技術中進行檢索時檢索效率較低的問題,目前尚未提出有效的解決方 案。
【發(fā)明內容】
[0005] 本發(fā)明實施例提供了一種信息檢索方法和裝置,以至少解決現(xiàn)有技術中進行檢索 時檢索效率較低的技術問題。
[0006] 根據(jù)本發(fā)明實施例的一個方面,提供了一種信息檢索方法,包括:獲取第一檢索請 求攜帶的第一請求用戶標識、與所述第一請求用戶標識具有關聯(lián)關系的第一關聯(lián)用戶標識 以及所述第一關聯(lián)用戶標識所表示的第一關聯(lián)用戶發(fā)布的第一社交網絡信息的標識,以及 第二檢索請求所攜帶的第二請求用戶標識、與所述第二請求用戶標識具有關聯(lián)關系的第二 關聯(lián)用戶標識以及所述第二關聯(lián)用戶標識所表示的第二關聯(lián)用戶發(fā)布的第二社交網絡信 息的標識;根據(jù)所述第一請求用戶標識和所述第一關聯(lián)用戶標識生成第一集合,其中,所述 第一集合中的每個成員包括所述第一請求用戶標識、一個所述第一關聯(lián)用戶標識以及所述 一個所述第一關聯(lián)用戶標識所表示的第一關聯(lián)用戶發(fā)布的一條第一社交網絡信息的標識; 從所述第一社交網絡信息和所述第二社交網絡信息中查找與所述第一檢索請求攜帶的檢 索關鍵詞匹配的社交網絡信息,作為第三社交網絡信息;以及從所述第一集合中選擇作為 檢索結果的成員,其中,所述作為檢索結果的成員中的所述第一社交網絡信息的標識所表 示的第一社交網絡信息為所述第三社交網絡信息中的一個。
[0007] 根據(jù)本發(fā)明實施例的另一方面,還提供了一種信息檢索裝置,包括:獲取單元,用 于獲取第一檢索請求攜帶的第一請求用戶標識、與所述第一請求用戶標識具有關聯(lián)關系的 第一關聯(lián)用戶標識以及所述第一關聯(lián)用戶標識所表示的第一關聯(lián)用戶發(fā)布的第一社交網 絡信息的標識,以及第二檢索請求所攜帶的第二請求用戶標識、與所述第二請求用戶標識 具有關聯(lián)關系的第二關聯(lián)用戶標識以及所述第二關聯(lián)用戶標識所表示的第二關聯(lián)用戶發(fā) 布的第二社交網絡信息的標識;第一生成單元,用于根據(jù)所述第一請求用戶標識和所述第 一關聯(lián)用戶標識生成第一集合,其中,所述第一集合中的每個成員包括所述第一請求用戶 標識、一個所述第一關聯(lián)用戶標識以及所述一個所述第一關聯(lián)用戶標識所表示的第一關聯(lián) 用戶發(fā)布的一條第一社交網絡信息的標識;查找單元,用于從所述第一社交網絡信息和所 述第二社交網絡信息中查找與所述第一檢索請求攜帶的檢索關鍵詞匹配的社交網絡信息, 作為第三社交網絡信息;選擇單元,用于從所述第一集合中選擇作為檢索結果的成員,其 中,所述作為檢索結果的成員中的所述第一社交網絡信息的標識所表示的第一社交網絡信 息為所述第三社交網絡信息中的一個。
[0008] 在本發(fā)明實施例中,進行檢索時先根據(jù)第一請求用戶的標識、第一關聯(lián)用戶的標 識得到第一集合,從第一集合中查找同時存在于第三社交網絡信息中的社交網絡信息,由 于將現(xiàn)有技術中的每個關聯(lián)用戶與其發(fā)布的社交網絡信息的集合簡化為第一集合中的成 員,并且該成員能夠表示其所表示的社交網絡信息所屬的第一關聯(lián)用戶的標識、與該關聯(lián) 用戶的標識具有關聯(lián)關系的第一請求用戶標識,就不需要逐個將每個關聯(lián)用戶所發(fā)布的社 交網絡信息與第三社交網絡信息比較來獲取檢索結果,減少了比較的過程,從而解決了現(xiàn) 有技術中進行檢索時檢索效率較低的技術問題,進而達到了提高檢索效率的技術效果。
【附圖說明】
[0009] 此處所說明的附圖用來提供對本發(fā)明的進一步理解,構成本申請的一部分,本發(fā) 明的示意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中:
[0010] 圖1是根據(jù)本發(fā)明實施例的硬件結構示意圖;
[0011] 圖2是根據(jù)本發(fā)明實施例的信息檢索方法的流程圖;
[0012] 圖3是根據(jù)本發(fā)明實施例的信息檢索方法中索引階段的流程圖;
[0013] 圖4是根據(jù)本發(fā)明實施例的信息檢索方法中檢索階段的流程圖;
[0014] 圖5是根據(jù)本發(fā)明實施例的信息檢索裝置的示意圖;以及
[0015] 圖6是根據(jù)本發(fā)明實施例的服務器的示意圖。
【具體實施方式】
[0016] 為了使本技術領域的人員更好地理解本發(fā)明方案,下面將結合本發(fā)明實施例中的 附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是 本發(fā)明一部分的實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術 人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應當屬于本發(fā)明保護的范 圍。
[0017] 需要說明的是,本發(fā)明的說明書和權利要求書及上述附圖中的術語"第一"、"第 二"等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用 的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本發(fā)明的實施例能夠以除了在這里圖示或 描述的那些以外的順序實施。此外,術語"包括"和"具有"以及他們的任何變形,意圖在于 覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產品或設備不必限 于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產 品或設備固有的其它步驟或單元。
[0018] 實施例1
[0019] 根據(jù)本發(fā)明實施例,提供了一種可以通過本申請裝置實施例執(zhí)行的方法實施例, 需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系 統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處 的順序執(zhí)行所示出或描述的步驟。
[0020] 根據(jù)本發(fā)明實施例,提供了 一種信息檢索方法。
[0021] 可選地,在本實施例中,上述信息檢索方法可以應用于如圖1所示的終端101和服 務器102構成的硬件環(huán)境中。如圖1所示,終端101通過網絡與服務器102進行連接,向服務 器102發(fā)送待檢索關鍵詞,以及終端101的信息等,服務器102接收到待檢索關鍵詞之后, 根據(jù)終端101所提交的信息進行待檢索關鍵詞的匹配,查找到與待檢索關鍵詞匹配的內容 后,向終端101返回匹配結果。上述網絡包括但不限于:廣域網、城域網或局域網,終端101 可以是手機,也可以是PC、筆記本或平板電腦。本發(fā)明實施例的信息檢索方法可以應用在終 端101上的微博、空間等社交網絡平臺的搜索,搜索的內容包括但不限于日志、微博、說說、 相冊和分孚等。
[0022] 圖2是根據(jù)本發(fā)明實施例的信息檢索方法的流程圖。如圖所示,該信息檢索方法 包括如下步驟:
[0023] 步驟S202,獲取第一檢索請求攜帶的第一請求用戶標識、與第一請求用戶標識具 有關聯(lián)關系的第一關聯(lián)用戶標識以及第一關聯(lián)用戶標識所表示的第一關聯(lián)用戶發(fā)布的第 一社交網絡信息的標識,以及第二檢索請求所攜帶的第二請求用戶標識、與第二請求用戶 標識具有關聯(lián)關系的第二關聯(lián)用戶標識以及第二關聯(lián)用戶標識所表示的第二關聯(lián)用戶發(fā) 布的第二社交網絡信息的標識。
[0024] 可選地,服務器102可以同時處理多個檢索請求,每個發(fā)出檢索請求的用戶都可 能與多個用戶具有關聯(lián)關系,這些與發(fā)出檢索請求的用戶具有關聯(lián)關系的用戶為關聯(lián)用 戶。每個關聯(lián)用戶都可能發(fā)布過一條或者多條社交網絡信息,該社交網絡信息可以是一條 或者多條說說、微博、日志、相冊和分享。例如,第一請求用戶發(fā)起第一檢索請求,第二請求 用戶發(fā)起了第二檢索請求。其中,第一檢索請求所攜帶的第一請求用戶標識為UIN1,與第一 請求用戶具有關聯(lián)關系的第一關聯(lián)用戶包括第一關聯(lián)用戶標識分別為UIN2和UIN3的關聯(lián) 用戶。第二檢索請求攜帶的第二請求用戶標識為UIN4,與UIN4具有關聯(lián)關系的第二關聯(lián) 用戶標識包括UIN3和UIN5。其中,關聯(lián)用戶UIN2發(fā)布的社交網絡信息的標識為D0C_2_a、 D0C_2_b。關聯(lián)用戶UIN3發(fā)布的社交網絡信息的標識為D0C_3_a、D0C_3_b,關聯(lián)用戶UIN5 發(fā)布的社交網絡信息的標識為D0C_5_a。
[0025] 可選地,可以通過不同的步驟來分別獲取"第一請求用戶標識、第一關聯(lián)用戶標識 以及第一社交網絡信息的標識",以及獲取"第二請求用戶標識、第二關聯(lián)用戶標識以及第 二社交網絡信息的標識"。當然,本實施例對此不做限定,例如,也可以通過同一個步驟來獲 取"第一請求用戶標識、第一關聯(lián)用戶標識以及第一社交網絡信息的標識",以及"第二請求 用戶標識、第二關聯(lián)用戶標識以及第二社交網絡信息的標識"。
[0026] 步驟S204,根據(jù)第一請求用戶標識和第一關聯(lián)用戶標識生成第一集合,其中,第一 集合中的每個成員包括第一請求用戶標識、一個第一關聯(lián)用戶標識以及一個第一關聯(lián)用戶 標識所表不的第一關聯(lián)用戶發(fā)布的一條第一社交網絡信息的標識。
[0027] 也就是說第一請求用戶標識與每個關聯(lián)用戶的每一條社交網絡信息都形成一個 第一集合的成員。
[0028] 表 1
[0029]
[0030] 具體地,如表1所示,第一請求用戶標識UIN1所關聯(lián)的第一關聯(lián)用戶標識包括 UIN2和UIN3,UIN2關聯(lián)的社交網絡信息的標識為D0C_2_a、D0C_2_b,UIN3關聯(lián)的社交網絡 信息的標識為D0C_3_a、D0C_3_b,那么,UIN1、UIN2和D0C_2_a作為第一集合的一個成員,可 以表示為UINl_UIN2_D0C_2_a ;UIN1、UIN2和D0C_2_b作為第一集合的又一個成員,表示為 UINl_UIN2_D0C_2_b ;UIN1、UIN3和D0C_3_a也作為第一集合的一個成員,可表示為UIN1_ UIN3_D0C_3_a ;UIN1、UIN3 和 D0C_3_b 也是第一集合的一個成員,表示為 UIN1_UIN3_D0C_3_ b ; 即 UINl_UIN2_D0C_2_a,UINl_UIN2_D0C_2_b,UINl_UIN3_D0C_3_a,UIN1_UIN3_D0C_3_ b構成了第一集合。每個成員都可以作為其所指示的社交網絡信息的標識,從而使得每條 社交網絡信息的標識都建立了發(fā)起檢索用戶、與發(fā)起檢索用戶具有關聯(lián)關系的用戶以及社 交網絡信息的關系,從而通過社交網絡信息的標識就能找到該社交網絡信息所屬的關聯(lián)用 戶,以及與該關聯(lián)用戶具有關聯(lián)關系的發(fā)起檢索用戶。
[0031] 步驟S206,從第一社交網絡信息和第二社交網絡信息中查找與第一檢索請求攜帶 的檢索關鍵詞匹配的社交網絡信息,作為第三社交網絡信息。
[0032]