專利名稱:索引庫的建立方法、檢索方法和索引庫的更新方法
技術(shù)領(lǐng)域:
本發(fā)明涉及檢索技術(shù)領(lǐng)域,具體而言,涉及一種索引庫的建立方法、檢索方法和索 引庫的更新方法。
背景技術(shù):
檢索引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,在 對信息進(jìn)行組織和處理后,為用戶提供搜索服務(wù)的系統(tǒng)。從使用者的角度看,檢索引擎提供一個(gè)包含搜索框的頁面,在搜索框輸入詞語,通 過瀏覽器提交給檢索引擎后,檢索引擎就會返回與用戶輸入的內(nèi)容相關(guān)的信息列表。檢索引擎有各種各樣的形式,包括新聞檢索引擎,Blog檢索引擎,雜志期刊檢索引 擎,購物檢索引擎,專業(yè)檢索引擎,兒童檢索引擎,企業(yè)內(nèi)部檢索引擎,電子商務(wù)檢索引擎, 旅游檢索引擎等。目前,互聯(lián)網(wǎng)上的檢索引擎都是面向所有用戶的,每個(gè)用戶搜索獲得的信息內(nèi)容 都一樣。然而,當(dāng)一個(gè)公司或企業(yè)提供搜索服務(wù)時(shí),他們希望對部分信息資源進(jìn)行保護(hù),也 就是只對部分用戶開放。特別企業(yè)內(nèi)部搜索,每個(gè)部門的人只能搜索到屬于這個(gè)部門范圍 的信息資源,而不能跨部門,跨權(quán)限的獲取信息?,F(xiàn)在的檢索引擎還不具備這個(gè)功能,不能 滿足公司,企業(yè)和個(gè)人多樣化的需求。為了解決上述問題,已經(jīng)出現(xiàn)一些與權(quán)限檢索相關(guān)的技術(shù)及應(yīng)用,用于對受控內(nèi) 容的檢索提供給有償用戶使用,如基于訪問控制列表的權(quán)限檢索引擎技術(shù)。該技術(shù)主要是 利用ACL(Access ControlList)創(chuàng)建檢索權(quán)限控制列表,在權(quán)限檢索時(shí)利用檢索的資源庫 與ACL相結(jié)合的查詢算法檢索出符合權(quán)限條件的資源。關(guān)聯(lián)字段采用多字段方式,因此在 數(shù)據(jù)更新及權(quán)限更新時(shí)既需要進(jìn)行多字段更新也需要更新ACL相關(guān)信息,導(dǎo)致整體更新執(zhí) 行效率不高,對檢索效率也有很大影響,因此不適合執(zhí)行實(shí)時(shí)更新。針對相關(guān)的權(quán)限檢索技術(shù)更新效率不高的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
針對相關(guān)的權(quán)限檢索技術(shù)更新效率不高的問題而提出本發(fā)明,為此,本發(fā)明的主 要目的在于提供一種索引庫的建立方法、檢索方法和索引庫的更新方法,以解決上述問題 至少之一。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種索引庫的建立方法,其包 括在索引庫中為每一個(gè)資源單元建立一個(gè)權(quán)限索引字段,其中,一個(gè)權(quán)限索引字段由多個(gè) 權(quán)限信息構(gòu)成。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種檢索方法,其包括根據(jù) 用戶的信息獲取索引庫中與該用戶的權(quán)限對應(yīng)的資源單元,其中,預(yù)先在索引庫中為每一 個(gè)資源單元建立一個(gè)權(quán)限索引字段,一個(gè)權(quán)限索引字段由多個(gè)權(quán)限信息構(gòu)成;在獲取的資 源單元中進(jìn)行檢索。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的又一方面,提供了一種索引庫的更新方法,其包 括根據(jù)待更新的權(quán)限信息在索引庫中更新與該權(quán)限信息對應(yīng)的權(quán)限索引字段,其中,預(yù)先 在索引庫中為每一個(gè)資源單元建立一個(gè)權(quán)限索引字段,一個(gè)權(quán)限索引字段由多個(gè)權(quán)限信息 構(gòu)成。根據(jù)本發(fā)明,使用了包括了多個(gè)權(quán)限信息的權(quán)限索引字段來對資源單元的使用進(jìn) 行分類,并在權(quán)限信息發(fā)生改變時(shí),只需對單個(gè)權(quán)限索引字段進(jìn)行更新,從而實(shí)現(xiàn)了快速更 新的目標(biāo),使權(quán)限檢索庫在數(shù)據(jù)更新時(shí)盡可能快速的完成,使數(shù)據(jù)更新與權(quán)限更新基本達(dá) 到同步,并在更新時(shí)減少系統(tǒng)資源的消耗,減少對檢索引擎工作效率的影響。
此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā) 明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中圖1是根據(jù)本發(fā)明實(shí)施例的為索引字段存儲示意圖;圖2是根據(jù)本發(fā)明實(shí)施例的檢索方法的流程圖;圖3是根據(jù)本發(fā)明實(shí)施例的檢索方法的詳細(xì)流程圖。
具體實(shí)施例方式下文中將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。需要說明的是,在不沖突的 情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。方法實(shí)施例根據(jù)本發(fā)明的實(shí)施例,提供了一種索引庫的建立方法,也就是,在索引庫中為每一 個(gè)資源單元建立一個(gè)權(quán)限索引字段,其中,所述權(quán)限索引字段由多個(gè)權(quán)限信息構(gòu)成。圖1是根據(jù)本發(fā)明實(shí)施例的為索引字段存儲示意圖。如圖1所示,可以將一個(gè)索 引字段作為權(quán)限索引字段,構(gòu)成該權(quán)限索引字段的權(quán)限信息可以包括用戶的標(biāo)識、用戶的 IP地址,或用戶的帳號。優(yōu)選的,上述多個(gè)權(quán)限信息可以以字符串拼接的方式構(gòu)成權(quán)限索引字段。例如,在檢索引擎創(chuàng)建檢索索引庫時(shí),為每一個(gè)資源單元建立一個(gè)獨(dú)立的權(quán)限索 引字段,該權(quán)限索引字段保存所有需要執(zhí)行權(quán)限驗(yàn)證的權(quán)限信息,如用戶的部門id,用戶的 IP地址,用戶的賬號等,這些權(quán)限信息按照字符串拼接的方式保存在本字段中,例如172. 18. 19. Γ 172. 18. 19. 255_123456_0RGN01,192. 18. 19. Γ 192. 18. 19. 255_654 321_0RGN02在檢索時(shí),通過特定的檢索語句加上特定的檢索算法根據(jù)上述權(quán)限索引字段來過 濾權(quán)限范圍之外的數(shù)據(jù)。上述檢索算法可以是通用的多分類檢索算法,例如可以把每個(gè)用戶權(quán)限信息看作 一個(gè)資源分類,來實(shí)現(xiàn)資源的多分類檢索,這時(shí),檢索算法為提取索引值與權(quán)限索引字段 中的權(quán)限信息作對比,如對比成功,則將與該權(quán)限索引字段對應(yīng)的資源放入檢索結(jié)果中返 回給用戶。在權(quán)限數(shù)據(jù)或權(quán)限信息更新時(shí),則可以直接更新上述權(quán)限索引字段。根據(jù)本發(fā)明的實(shí)施例,還提供了 一種檢索方法。
圖2是根據(jù)本發(fā)明實(shí)施例的檢索方法的流程圖。如圖2所示,根據(jù)本發(fā)明實(shí)施例 的檢索方法包括S202,根據(jù)用戶的信息獲取索引庫中與該用戶的權(quán)限對應(yīng)的資源單元,其中,預(yù)先 在上述索引庫中為每一個(gè)資源單元建立一個(gè)權(quán)限索引字段,上述權(quán)限索引字段由多個(gè)權(quán)限 信息構(gòu)成;S204,在獲取的上述資源單元中進(jìn)行檢索。優(yōu)選的,根據(jù)用戶的信息獲取索引庫中與該用戶的權(quán)限對應(yīng)的資源單元包括將 上述用戶的信息與上述索引庫中的每一個(gè)權(quán)限索引字段進(jìn)行比較;在上述用戶的信息與上 述權(quán)限索引字段中的一個(gè)或多個(gè)權(quán)限信息相同時(shí),則獲取該權(quán)限索引字段所對應(yīng)的資源單兀。相應(yīng)的,上述多個(gè)權(quán)限信息以字符串拼接的方式構(gòu)成上述權(quán)限索引字段。相應(yīng)的,上述權(quán)限信息可以包括用戶的標(biāo)識、用戶的IP地址,或用戶的帳號。圖3是根據(jù)本發(fā)明實(shí)施例的檢索方法的詳細(xì)流程圖。如圖3所示。在檢索引擎創(chuàng) 建或者更新內(nèi)容資源索引庫的索引信息時(shí),將用戶權(quán)限信息按照字符串拼接的方式存入檢 索引擎的權(quán)限字段。用戶在做檢索時(shí),將用戶權(quán)限信息放入檢索查詢請求中,檢索引擎通過 權(quán)限字段對比用戶的權(quán)限信息,如果用戶權(quán)限信息與索引保存的權(quán)限信息符合則將此條資 源信息作為可被檢索的對象,然后按照用戶的其他檢索條件過濾檢索資源,最終返回滿足 用戶權(quán)限信息的檢索資源結(jié)果。根據(jù)本發(fā)明的實(shí)施例,還提供了一種索引庫的更新方法。該索引庫的更新方法包括根據(jù)待更新的權(quán)限信息在索引庫中更新與該權(quán)限信息 對應(yīng)的權(quán)限索引字段,其中,預(yù)先在上述索引庫中為每一個(gè)資源單元建立一個(gè)權(quán)限索引字 段,上述權(quán)限索引字段由多個(gè)權(quán)限信息構(gòu)成。對于上述根據(jù)待更新的權(quán)限信息在索引庫中更新與該權(quán)限信息對應(yīng)的權(quán)限索引 字段,可以首先在索引庫中查找包含有所述權(quán)限信息的權(quán)限索引字段;然后,根據(jù)待更新的 權(quán)限信息在索引庫中更新與該查找出的權(quán)限索引字段。根據(jù)待更新的權(quán)限信息在索引庫中更新與該權(quán)限信息對應(yīng)的權(quán)限索引字段可以 包括將上述待更新的權(quán)限信息增加到上述權(quán)限索引字段中;或者從上述權(quán)限索引字段中 刪除上述待更新的權(quán)限信息。同樣,上述多個(gè)權(quán)限信息以字符串拼接的方式構(gòu)成上述權(quán)限索引字段。下面將結(jié)合實(shí)例對本發(fā)明實(shí)施例的實(shí)現(xiàn)過程進(jìn)行詳細(xì)描述。 在提供給訂閱機(jī)構(gòu)的讀報(bào)系統(tǒng)的應(yīng)用中,該應(yīng)用的數(shù)據(jù)使用有以下特點(diǎn)1、數(shù)據(jù)量大,需要進(jìn)行全文檢索2、不同機(jī)構(gòu)訂閱的報(bào)紙不同,按照用戶的權(quán)限提供相應(yīng)報(bào)刊數(shù)據(jù)的檢索服務(wù)。3、每天都有大量的報(bào)紙數(shù)據(jù)需要更新,讓用戶及時(shí)閱讀到已訂閱的內(nèi)容。在用戶訂閱報(bào)紙資源時(shí),將機(jī)構(gòu)ID更新到檢索庫的權(quán)限索引字段中,如果有多個(gè) 機(jī)構(gòu)都訂閱了該資源,則在索引庫中與該資源對應(yīng)的權(quán)限索引字段保存為多個(gè)機(jī)構(gòu)ID,如 ORGIDl, 0RGID2...,并且這些權(quán)限信息以字符串形式保存到該權(quán)限索引字段中。當(dāng)機(jī)構(gòu)ORGIDl的用戶檢索報(bào)紙內(nèi)容時(shí),檢索條件將ORGIDl傳遞給檢索引擎,檢索 引擎將所有權(quán)限索引字段中包含了 “0RGID1”的資源作為檢索源,然后對該檢索源進(jìn)行檢索,從而機(jī)構(gòu)ID為ORGIDl的用戶只能檢索到標(biāo)記了 ORGIDl的所有資源,實(shí)現(xiàn)權(quán)限檢索功能。當(dāng)該資源被新的機(jī)構(gòu)0RGID3訂閱后,檢索引擎會根據(jù)該待更新的權(quán)限信息 0RGID3來更新權(quán)限索引字段。例如,將該待更新的權(quán)限信息0RGID3增加到對應(yīng)的權(quán)限索
引字段中,使該權(quán)限索引字段更新成為ORGIDl,0RGID2,0RGID3......,例如,更新后的權(quán)限
索引字段為0RGID1_0RGID2_0RGID3。由于只需要更新權(quán)限索引字段,從而使得更新速度很 快,在訂閱成功后0RGID3的用戶很快就能檢索到本機(jī)構(gòu)訂閱的數(shù)據(jù)。當(dāng)該資源被機(jī)構(gòu)0RGID3退訂時(shí),檢索引擎會根據(jù)待更新的權(quán)限信息0RGID3來更 新與其對應(yīng)的權(quán)限索引字段。例如,從該權(quán)限索引字段中刪除該待更新的權(quán)限信息0RGID3, 以使該權(quán)限索引字段更新成為0RGID1,0RGID2,.......同樣,當(dāng)已經(jīng)訂閱的機(jī)構(gòu)報(bào)紙有內(nèi)容更新時(shí),新入檢索庫的內(nèi)容資源會直接在權(quán) 限字段上打上訂閱機(jī)構(gòu)的標(biāo)記,因此新入庫的數(shù)據(jù)可以實(shí)時(shí)的被有權(quán)限用戶檢索到。根據(jù)本發(fā)明,使用了包括了多個(gè)權(quán)限信息的權(quán)限索引字段來對資源單元的使用進(jìn) 行分類,并在權(quán)限信息發(fā)生改變時(shí),只需對單個(gè)權(quán)限索引字段進(jìn)行更新,從而實(shí)現(xiàn)了快速更 新的目標(biāo),使權(quán)限檢索庫在數(shù)據(jù)更新時(shí)盡可能快速的完成,使數(shù)據(jù)更新與權(quán)限更新基本達(dá) 到同步,并在更新時(shí)減少系統(tǒng)資源的消耗,減少對檢索引擎工作效率的影響。需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的 計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不 同于此處的順序執(zhí)行所示出或描述的步驟。顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用 的計(jì)算裝置來實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成 的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來實(shí)現(xiàn),從而,可以將它們存儲 在存儲裝置中由計(jì)算裝置來執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們 中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的 硬件和軟件結(jié)合。以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技 術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修 改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種索引庫的建立方法,其特征在于,包括在索引庫中為每一個(gè)資源單元建立一個(gè)權(quán)限索引字段,其中,所述一個(gè)權(quán)限索引字段 由多個(gè)權(quán)限信息構(gòu)成。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述多個(gè)權(quán)限信息以字符串拼接的方式 構(gòu)成所述一個(gè)權(quán)限索引字段。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述權(quán)限信息包括用戶的標(biāo)識、用 戶的IP地址,或用戶的帳號。
4.一種檢索方法,其特征在于,包括根據(jù)用戶的信息獲取索引庫中與該用戶的權(quán)限對應(yīng)的資源單元,其中,預(yù)先在所述索 引庫中為每一個(gè)資源單元建立一個(gè)權(quán)限索引字段,所述一個(gè)權(quán)限索引字段由多個(gè)權(quán)限信息 構(gòu)成;在獲取的所述資源單元中進(jìn)行檢索。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)用戶的信息獲取索引庫中與該用戶 的權(quán)限對應(yīng)的資源單元包括將所述用戶的信息與所述索引庫中的每一個(gè)權(quán)限索引字段進(jìn)行比較;在所述用戶的信息與所述權(quán)限索引字段中的一個(gè)或多個(gè)權(quán)限信息相同時(shí),獲取該權(quán)限 索引字段所對應(yīng)的資源單元。
6.根據(jù)權(quán)利要求4或5所述的方法,其特征在于,所述多個(gè)權(quán)限信息以字符串拼接的方 式構(gòu)成所述一個(gè)權(quán)限索引字段。
7.根據(jù)權(quán)利要求4或5所述的方法,其特征在于,所述權(quán)限信息包括用戶的標(biāo)識、用 戶的IP地址,或用戶的帳號。
8.一種索引庫的更新方法,其特征在于,包括根據(jù)待更新的權(quán)限信息在索引庫中更新與該權(quán)限信息對應(yīng)的權(quán)限索引字段,其中,預(yù) 先在所述索引庫中為每一個(gè)資源單元建立一個(gè)權(quán)限索引字段,所述一個(gè)權(quán)限索引字段由多 個(gè)權(quán)限信息構(gòu)成。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,根據(jù)待更新的權(quán)限信息在索引庫中更新 與該權(quán)限信息對應(yīng)的權(quán)限索引字段的步驟包括將所述待更新的權(quán)限信息增加到所述權(quán)限索引字段中;或者從所述權(quán)限索引字段中刪除所述待更新的權(quán)限信息。
10.根據(jù)權(quán)利要求8或9所述的方法,其特征在于,所述多個(gè)權(quán)限信息以字符串拼接的 方式構(gòu)成所述一個(gè)權(quán)限索引字段。
全文摘要
本發(fā)明公開了一種索引庫的建立方法、檢索方法和索引庫的更新方法,其中,該索引庫的建立方法包括在索引庫中為每一個(gè)資源單元建立一個(gè)權(quán)限索引字段,其中,一個(gè)權(quán)限索引字段由多個(gè)權(quán)限信息構(gòu)成。根據(jù)本發(fā)明,使用了包括了多個(gè)權(quán)限信息的權(quán)限索引字段來對資源單元的使用進(jìn)行分類,并在權(quán)限信息發(fā)生改變時(shí),只需對單個(gè)權(quán)限索引字段進(jìn)行更新,從而實(shí)現(xiàn)了快速更新的目標(biāo),使權(quán)限檢索庫在數(shù)據(jù)更新時(shí)盡可能快速的完成。
文檔編號G06F17/30GK102110104SQ20091024357
公開日2011年6月29日 申請日期2009年12月28日 優(yōu)先權(quán)日2009年12月28日
發(fā)明者孫賡, 閆進(jìn)兵 申請人:北京方正阿帕比技術(shù)有限公司, 北大方正集團(tuán)有限公司