一種搜索的方法、裝置和系統(tǒng)的制作方法
【技術領域】
[0001] 本發(fā)明涉及搜索的技術領域,特別是涉及一種搜索的方法、一種搜索的裝置和一 種搜索的系統(tǒng)。
【背景技術】
[0002] 隨著網(wǎng)絡的迅速發(fā)展,網(wǎng)絡信息急劇增加。用戶為了在海量的網(wǎng)絡信息中尋找所 需的網(wǎng)絡信息,通常使用搜索引擎進行搜索。
[0003] 搜索引擎指自動從因特網(wǎng)搜集信息,經(jīng)過一定整理以后,提供給用戶進行查詢的 系統(tǒng)。網(wǎng)絡信息浩瀚萬千,而且毫無秩序,所有的網(wǎng)絡信息像汪洋上的一個個小島,網(wǎng)頁鏈 接是這些小島之間縱橫交錯的橋梁,而搜索引擎,則為用戶繪制一幅一目了然的信息地圖, 供用戶隨時查閱。
[0004] 但是,網(wǎng)絡信息增長的速度和人們獲取所需信息能力之間的矛盾越來越突出,過 量的網(wǎng)絡信息使得用戶在搜索網(wǎng)絡信息的時候要進行繁瑣的人工過濾,耗費大量時間和精 力,網(wǎng)絡信息的搜索效率很低。
【發(fā)明內容】
[0005] 本發(fā)明實施例所要解決的技術問題是提供一種搜索的方法,用以較少用戶時間和 精力的耗費,提高網(wǎng)絡信息的搜索效率。
[0006] 相應的,本發(fā)明實施例還提供了一種搜索的裝置和一種搜索的系統(tǒng),用以保證上 述方法的實現(xiàn)及應用。
[0007] 為了解決上述問題,本發(fā)明實施例公開了一種搜索的方法,包括:
[0008] 當接收到第一用戶提交的第一查詢詞串時,以所述第一查詢詞串進行搜索,獲得 匹配的網(wǎng)絡信息;
[0009] 查找與所述第一用戶具有相同或相似查詢意圖的第二用戶;其中,所述第二用戶 具有社區(qū)信息;
[0010] 判斷所述第一查詢詞串是否滿足預設的保密條件;當所述第一查詢詞串滿足預設 的保密條件時,對所述第二用戶的社區(qū)信息進行保密處理;
[0011] 將所述網(wǎng)絡信息和進行保密處理之后的第二用戶的社區(qū)信息合成第一搜索結果。
[0012] 本發(fā)明實施例還公開了一種搜索的裝置,包括:
[0013] 網(wǎng)絡信息搜索模塊,用于在接收到第一用戶提交的第一查詢詞串時,以所述第一 查詢詞串進行搜索,獲得匹配的網(wǎng)絡信息;
[0014] 用戶查找模塊,用于查找與所述第一用戶具有相同或相似查詢意圖的第二用戶; 其中,所述第二用戶具有社區(qū)信息;
[0015] 保密條件判斷模塊,用于判斷所述第一查詢詞串是否滿足預設的保密條件;
[0016] 保密處理模塊,用于在所述第一查詢詞串滿足預設的保密條件時,對所述第二用 戶的社區(qū)信息進行保密處理;
[0017] 第一搜索結果合成模塊,用于將所述網(wǎng)絡信息和進行保密處理之后的第二用戶的 社區(qū)信息合成第一搜索結果。
[0018] 本發(fā)明實施例還公開了一種搜索的系統(tǒng),所述的系統(tǒng)包括服務器和第一客戶端, 第一用戶在所述第一客戶端登錄;
[0019] 其中,所述服務器包括:
[0020] 網(wǎng)絡信息搜索模塊,用于在接收到第一用戶提交的第一查詢詞串時,以所述第一 查詢詞串進行搜索,獲得匹配的網(wǎng)絡信息;
[0021] 用戶查找模塊,用于查找與所述第一用戶具有相同或相似查詢意圖的第二用戶; 其中,所述第二用戶具有社區(qū)信息;
[0022] 保密條件判斷模塊,用于判斷所述第一查詢詞串是否滿足預設的保密條件;
[0023] 保密處理模塊,用于在所述第一查詢詞串滿足預設的保密條件時,對所述第二用 戶的社區(qū)信息進行保密處理;
[0024] 第一搜索結果合成模塊,用于將所述網(wǎng)絡信息和進行保密處理之后的第二用戶的 社區(qū)信息合成第一搜索結果;
[0025] 第一搜索結果返回模塊,用于將所述第一搜索結果返回第一用戶;
[0026] 所述第一客戶端包括:
[0027] 第一查詢詞串提交模塊,用于向所述服務器提交第一查詢詞串;
[0028] 第一搜索結果接收模塊,用于接收所述服務器返回的第一搜索結果;
[0029] 第一搜索結果展示模塊,用于展示所述第一搜索結果。
[0030] 與現(xiàn)有技術相比,本發(fā)明實施例包括以下優(yōu)點:
[0031] 本發(fā)明實施例中以第一用戶提交的第一查詢詞串進行搜索,獲得匹配的網(wǎng)絡信 息,以及查找與第一用戶具有相同或相似查詢意圖的第二用戶,在判斷滿足預設的保密條 件時進行保密處理,并將網(wǎng)絡信息和第二用戶的社區(qū)信息合成搜索結果,使得在第一用戶 涉及隱私等保密需求時,通過分析搜索日志來篩選用戶的社區(qū)好友中,與用戶有相同需求 的第二用戶,使第一用戶可以基于社區(qū)信息與篩選到的第二用戶就相同的需求進行互動交 流,并對第二用戶的社區(qū)信息進行保密,則第一用戶可以直接獲得第二用戶在先整理過的 信息,第二用戶人工整理的信息比機械返回的信息更加有效,并且提高了社區(qū)信息的安全 性,避免了第一用戶重復對海量的網(wǎng)絡信息進行繁瑣的人工過濾,減少了第一用戶時間和 精力的耗費,也減少了用戶設備和網(wǎng)站的系統(tǒng)資源消耗,也減少了網(wǎng)絡帶寬的占用,大大提 高了信息獲取的效率、質量和容量。
[0032] 本發(fā)明實施例在第二用戶的社區(qū)信息被第一用戶觸發(fā)時,建立第一用戶與第二用 戶的通訊連接,使得第一用戶和第二用戶在社區(qū)信息匿名或公開的情形下進行通訊,大大 提高了通訊方式的靈活性,也大大提高了通訊的安全性。
【附圖說明】
[0033] 圖1是本發(fā)明的一種搜索的方法實施例1的步驟流程圖;
[0034] 圖2是本發(fā)明的一種搜索的方法實施例2的步驟流程圖;
[0035] 圖3是本發(fā)明的一種搜索的裝置實施例1的結構框圖;
[0036] 圖4是本發(fā)明的一種搜索的裝置實施例2的結構框圖;
[0037] 圖5是本發(fā)明的一種搜索的系統(tǒng)實施例1的結構框圖;
[0038] 圖6是本發(fā)明的一種搜索的系統(tǒng)實施例2的結構框圖。
【具體實施方式】
[0039] 為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結合附圖和具體實 施方式對本發(fā)明作進一步詳細的說明。
[0040] 參照圖1,示出了本發(fā)明的一種搜索的方法實施例1的步驟流程圖,具體可以包括 如下步驟:
[0041] 步驟101,當接收到第一用戶提交的第一查詢詞串時,以所述第一查詢詞串進行搜 索,獲得匹配的網(wǎng)絡信息;
[0042] 應用本發(fā)明實施例,第一用戶可以在第一客戶端登錄,第一用戶可以可以通過第 一客戶端向服務器提交第一查詢詞串,請求搜索與該第一查詢詞串匹配的網(wǎng)絡信息。
[0043] 本發(fā)明實施例中,當接收到第一用戶提交的第一查詢詞串時,則可以根據(jù)該第一 查詢詞串在索引庫中快速檢出網(wǎng)絡信息,進行網(wǎng)絡信息與查詢的相關度評價,對將要輸出 的結果進行排序。
[0044] 以搜索引擎為例進行說明,搜索引擎的搜索流程分為二個部分,一是前端用戶請 求過程,二是后端制作數(shù)據(jù)過程。
[0045] 一、前端用戶請求過程:
[0046] 1.接收請求:接收用戶在搜索引擎輸入的查詢詞串;
[0047] 2.查詢詞分析:對查詢詞串進行分詞處理;
[0048] 3.檢索:根據(jù)分詞結果,從預先制作的倒排索引中,查找與分詞結果相關的候選 的網(wǎng)絡信息;
[0049] 4.排序:針對候選的網(wǎng)絡信息,根據(jù)內容相關性、時效性等維度進行排序;
[0050] 5.展現(xiàn):將排序后的網(wǎng)頁在搜索引擎頁面展現(xiàn)出來。
[0051] 二、后端制作數(shù)據(jù)過程:
[0052] 1.網(wǎng)頁抓?。翰捎门老x技術,通過網(wǎng)頁間的鏈接關系,抓取互聯(lián)網(wǎng)的網(wǎng)絡信息并 保存。
[0053] 2.索引制作:對已抓取保存的網(wǎng)絡信息進行分析,例如對網(wǎng)頁標題和頁面文本進 行分詞處理,根據(jù)分詞結果制作倒排索引,供前端用戶請求過程使用。
[0054] 步驟102,查找與所述第一用戶具有相同或相似查詢意圖的第二用戶;其中,所述 第二用戶可以具有社區(qū)信息;
[0055]用戶所發(fā)出的每個搜索請求背后都可能隱含著潛在的查詢意圖,本發(fā)明實施中, 可以根據(jù)查詢詞串查找出第一用戶背后的查詢意圖,然后針對不同的搜索意圖,匹配符合 第一用戶的查詢意圖的第二用戶。
[0056] 在具體實現(xiàn)中,所述第一用戶與所述第二用戶之間可以具有社區(qū)好友關系,則本 發(fā)明實施例中可以關聯(lián)社交賬戶,例如即時通訊工具用戶、各類型的網(wǎng)站(如論壇、貼吧、 門戶網(wǎng)站等等)注冊用戶等等,關聯(lián)社交賬戶可以得到第一用戶的社區(qū)好友關系,在第一 用戶的好友用戶中查找匹配第二用戶。
[0057] 需要說明的是,社區(qū)好友關系可以包括一級或多級好友關系,例如,一級好友關系 的用戶可以為當前用戶的好友用戶,二級好友用戶可以為當前用戶的好友用戶各自對應的 好友用戶等等,本發(fā)明實施例對此不加以限制。
[0058] 當然,所述第一用戶與所述第二用戶之間可以具有非社區(qū)好友關系,即第二用戶 相對于第一用戶而言可以為陌生用戶,則本發(fā)明實施例中可以在全局范圍內查找匹配的第 二用戶。
[0059] 其中,所述第二用戶可以具有社區(qū)信息,社區(qū)可以是若干社會群體或社會組織聚 集在某一個領域里所形成的一個生活上相互關聯(lián)的大集體,例如論壇、微博、貼吧、門戶網(wǎng) 站、即時通訊系統(tǒng)等等,即社區(qū)信息可以包括用戶頭像、用戶名稱、用戶ID、通訊地址等等。
[0060] 在本發(fā)明的一種優(yōu)選實施例中,步驟102可以包括如下子步驟:
[0061] 子步驟S11,分別獲取所述第一用戶的第一查詢意圖信息以及所述第二用戶的第 二查詢意圖信息;
[0062] 第一查詢意圖信息可以為標識第一用戶查詢意圖的信息,第二查詢意圖信息可以 為標識第二用戶查詢意圖的信息。
[0063] 在本發(fā)明實施例的一種優(yōu)選示例中,所述第一查詢意圖信息可以包括第一特征向 量,所述第二查詢意圖信息可以包括第二特征向量;其中,第一特征向量可以為標識第一用 戶查詢意圖的向量信息,第二特征向量可以為標識第二用戶查詢意圖的向量信息;所述第 一特征向量可以根據(jù)所述第一查詢詞串進行確定,所述第二特征向量可以根據(jù)所述第二查 詢詞串進行確定,其中,所述第二查詢詞串可以為所述第二用戶在先提交的查詢詞串。
[0064] 在本示例中,可以通過對查詢詞串、搜索結果和搜索日志進行分析,查找代表查詢 詞串的查詢意圖的特征,計算得到特征值,從而將查詢詞串表示為特征向量。
[0065] 查詢詞串的查詢意圖相關的特征向量可以分為三大類,第一類可以為查詢詞串本 身的特征向量,第二類可以為與查詢詞串的分詞關聯(lián)的特征向量,第三類可以為與查詢詞 串匹配的網(wǎng)絡信息關聯(lián)的特征向量,這些特征向量都可以用于表示查詢詞串的查詢意圖。 [0066] 則在具體實現(xiàn)中,所述第一特征向量可以包括以下至少一種:第一查詢詞串、與第 一查詢詞串的分詞關聯(lián)的特征向量、與第一查詢詞串匹配的網(wǎng)絡信息關聯(lián)的特征向量;[0067] 所述第二特征向量可以包括以下至少一種:第二查詢詞串、與第二查詢詞串的分 詞關聯(lián)的特征向量、與第二查詢詞串匹配的網(wǎng)絡信息關聯(lián)的特征向量。
[0068] 在本發(fā)明實施的一種優(yōu)選示例中,所述與第一查詢詞串的分詞關聯(lián)的特征向量可 以包括以下至少一種:第一查詢詞串的同義詞串、第一查詢詞串的分詞、第一查詢詞串的分 詞的詞性、第一查詢詞串的分詞的同義詞、第一查詢詞串的分詞的重要度;
[0069] 所述與第一查詢詞串匹配的網(wǎng)絡信息關聯(lián)的特征向量可以包括以下至少一種:
[0070] 與第一查詢詞串匹配的網(wǎng)絡信息的標題、與第一查詢詞串匹配的網(wǎng)絡信息的網(wǎng)頁 標識、與第一查詢詞串匹配的網(wǎng)絡信息的歷史點擊信息、與第一查詢詞串關聯(lián)的其他查詢 詞串;
[0071] 所述與第二查詢詞串的分詞關聯(lián)的特征向量可以包括以下至少一種:
[0072] 第二查詢詞串的同義詞串、第二查詢詞串的分詞、第二查詢詞串的分詞的詞性、第 二查詢詞串的分詞的同義詞、第二查詢詞串的分詞的重要度;
[0073] 所述與第二查詢詞串匹配的網(wǎng)絡信息關聯(lián)的特征向量可以包括以下至少一種:
[0074] 與第二查詢詞串匹配的網(wǎng)絡信息的標題、與第二查詢詞串匹配的網(wǎng)絡信息的網(wǎng)頁 標識、與第二查詢詞串匹配的網(wǎng)絡信息的歷史點擊信息、與第二查詢詞串關聯(lián)的其他查詢 詞串。
[0075] 第一 /第二特征向量的示例可以如下:
[0076] 1、查詢詞串本身;
[0077] 例如,用戶提交的查詢詞串"海淀婦幼"本身。
[0078] 2、查詢詞串的問乂詞串;
[0079] 本示例中,可以在預先制作好的同義詞字典中找到查詢詞串的同義詞串。例如, "海淀婦幼保健院"和"海淀婦幼"是同義詞,"新天龍八部"和"天龍八部鐘漢良版"是同義 詞(這類同義詞會隨著實際變化,總是和最新一版的天龍八部是同義詞)。
[0080] 3、查詢詞串的分詞term;
[0081] 本示例中,可以對查詢詞進行分詞,獲得分詞后的term。例如,對查詢詞串"海淀 婦幼建檔"分詞后的te