專利名稱:文件的組織、檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信領(lǐng)域,尤其涉及一種文件的組織方法, 一種文件的檢索方 法, 一種文件組織模塊及一種文件檢索系統(tǒng)。
背景技術(shù):
現(xiàn)在電信行業(yè),尤其是海外電信行業(yè),用戶的消費(fèi)及金額相關(guān)信息都要求 在帳單上顯示提供給用戶,同時(shí)在帳單上可刊登或插頁(yè)廣告,以告之用戶新的 活動(dòng)、新的優(yōu)惠政策,或進(jìn)行其他的市場(chǎng)宣傳。帳單在轉(zhuǎn)換打印或通過(guò)工具展 現(xiàn)之前,是以文件的形式存儲(chǔ)在存儲(chǔ)模塊上,這類文件稱為帳單文件,帳單文件具有以下特點(diǎn) AI、文件??; A2、文件數(shù)量多; A3、查找定位一個(gè)文件效率j氐; A4 、修改每一個(gè)文件的內(nèi)容效率低;A5、占用的存儲(chǔ)空間大。 ' 一方面,文件數(shù)量太多,浪費(fèi)了文件系統(tǒng)的存儲(chǔ)節(jié)點(diǎn)(存儲(chǔ)空間); 另一方面,大量的文件進(jìn)行查找定位時(shí),效率低,在具體應(yīng)用時(shí),在業(yè)務(wù) 運(yùn)營(yíng)支撐系統(tǒng)(Business Operation Support System, BOSS )中,帳單文件由于查 找定位效率低,使得帳單文件的打印(展現(xiàn))與重打印速度慢,降低了用戶對(duì) 帳單業(yè)務(wù)的體驗(yàn)滿意度。發(fā)明內(nèi)容本發(fā)明實(shí)施例所要解決的技術(shù)問(wèn)題在于,提供了一種文件的組織方法,一 種文件的檢索方法, 一種文件組織模塊及一種文件檢索系統(tǒng),可解決由于文件 數(shù)量太多,造成的存儲(chǔ)空間浪費(fèi)的問(wèn)題以及文件定位效率低的問(wèn)題。為了解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提出了一種文件的組織方法,包括獲得至少一個(gè)文件集合;將所述每一個(gè)文件集合中的所有文件合并到 一個(gè)存儲(chǔ)節(jié)點(diǎn)下; 建立用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件的索引。 本發(fā)明實(shí)施例還提供了一種文件的檢索方法,包括 接收對(duì)存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文件進(jìn)行讀取的讀取請(qǐng)求; 接收對(duì)存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文件進(jìn)行讀取的讀取請(qǐng)求; 根據(jù)所述讀取請(qǐng)求,獲得用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文 件的索引以及所述文件集合;輸出所述文件集合中與所述索引對(duì)應(yīng)的文件。相應(yīng)地,本發(fā)明實(shí)施例還提供了一種文件組織模塊,該文件組織模塊包括 獲取子模塊,獲得至少一個(gè)文件集合;合并子模塊,將所述每一個(gè)文件集合中的所有文件合并到一個(gè)存儲(chǔ)節(jié)點(diǎn)下; 索引建立子模塊,建立用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件的索引。 相應(yīng)地,本發(fā)明實(shí)施例還提供了一種文件;險(xiǎn)索系統(tǒng),包括 存儲(chǔ)模塊,該存儲(chǔ)模塊對(duì)應(yīng)至少一個(gè)存儲(chǔ)節(jié)點(diǎn),存儲(chǔ)有用于檢索所述存儲(chǔ) 節(jié)點(diǎn)下合并的文件集合中的文件的索引以及所述文件集合;總控模塊,接收對(duì)存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文件進(jìn)行讀取的讀取請(qǐng) 求,并根據(jù)該讀取請(qǐng)求輸出對(duì)應(yīng)的控制信息;文件檢索模塊,根據(jù)所述總控模塊的控制信息,從存儲(chǔ)模塊中獲得用于檢 索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文件的索引以及所述文件集合,輸出所 述索引及文件集合;輸出模塊,輸出所述文件集合中與所述索引對(duì)應(yīng)的文件。 本發(fā)明實(shí)施例通過(guò)獲得至少一個(gè)文件集合,并將所述每一個(gè)文件集合中的 所有文件合并到一個(gè)存儲(chǔ)節(jié)點(diǎn)下,建立用于^r索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件的 索引,從而解決由于文件凄t量太多,造成的存儲(chǔ)空間浪費(fèi)的問(wèn)題;并在上述構(gòu) 造的文件與索引存儲(chǔ)關(guān)系的基礎(chǔ)上,接收對(duì)存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文 件進(jìn)行讀取的讀取請(qǐng)求,并根據(jù)用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的 文件的索引,查找并輸出所述讀取請(qǐng)求對(duì)應(yīng)的文件,可解決文件定位效率低的 問(wèn)題,提高了用戶的體驗(yàn)滿意度。 ,
圖1是本發(fā)明實(shí)施例的文件的組織方法的示意圖;圖2是本發(fā)明實(shí)施例建立的文件存儲(chǔ)結(jié)構(gòu)示意圖; 圖3是本發(fā)明實(shí)施例的文件的檢索方法的示意圖; 圖4是本發(fā)明實(shí)施例的文件組織模塊的示意圖; 圖5是本發(fā)明實(shí)施例的文件檢索系統(tǒng)的示意圖。
具體實(shí)施方式
本發(fā)明實(shí)施例提供了一種文件的組織方法, 一種文件的檢索方法, 一種文 件組織模塊及一種文件檢索系統(tǒng),可解決由于文件數(shù)量太多,造成的存儲(chǔ)空間 浪費(fèi)的問(wèn)題以及文件定位效率低的問(wèn)題。下面結(jié)合附圖,對(duì)本發(fā)明實(shí)施例進(jìn)行詳細(xì)說(shuō)明。圖1是本發(fā)明實(shí)施例的文件的組織方法的示意圖,該方法主要包括如下流程101, 對(duì)文件進(jìn)行分類,得到至少一個(gè)文件集合,每一個(gè)文件集合與每一個(gè) 分類結(jié)果對(duì)應(yīng),即形成某一類或幾類的文件集合,具體實(shí)現(xiàn)時(shí),可采用"^合希(hash) 算法對(duì)文件進(jìn)行分類,但不僅限于此;102, 為各類文件集合建立目錄結(jié)構(gòu),該目錄結(jié)構(gòu)中的目錄文件與每一類文 件集合相對(duì)應(yīng),具體實(shí)現(xiàn)時(shí),可采用hash算法為各類文件集合建立目錄結(jié)構(gòu), 但不僅限于此;103, 獲得上述各類文件集合,將每一類文件集合中的所有文件合并到一個(gè) 存儲(chǔ)節(jié)點(diǎn)下;104, 建立用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件的索引,在具體實(shí)現(xiàn)時(shí),索 引組織可采用B+樹(shù)的形式,在下面的內(nèi)容中也同樣適用本說(shuō)明。上述步驟建立出的文件存儲(chǔ)結(jié)構(gòu)可如圖2所示,其中包括總的目錄結(jié)構(gòu)f(y)、 目錄結(jié)構(gòu)下的目錄中的文件f(x)、索引(idx文件)、打包壓縮節(jié)點(diǎn)(.tar.gz)、合 并的文件(編號(hào)從1.256900到1.659900,編號(hào)從1.348699到1.648699等)。作為一種實(shí)施方式,上述103、 104步驟之間還可以包括將合并后的每個(gè)存儲(chǔ)節(jié)點(diǎn)下的文件進(jìn)行打包壓縮。另外,上述IOI、 102步驟可根據(jù)實(shí)際情況選擇適用。作為一種實(shí)施方式,當(dāng)要添加、刪除或修改所述建立的文件的存儲(chǔ)結(jié)構(gòu)中 的文件時(shí),可根據(jù)所述文件的添加、刪除或修改操作,更新該文件對(duì)應(yīng)的索引(idx文件),對(duì)該索? 1進(jìn)行維護(hù)。作為一種實(shí)施方式,上述文件可以是帳單文件,或其他類型的文件。 實(shí)施如圖1所示的本發(fā)明實(shí)施例的文件的組織方法,通過(guò)對(duì)文件進(jìn)行分類、建立目錄結(jié)構(gòu)、在一存儲(chǔ)節(jié)點(diǎn)下合并、建立索引等操作,可解決由于文件數(shù)量太多,造成的存儲(chǔ)空間浪費(fèi)的問(wèn)題。圖3是本發(fā)明實(shí)施例的文件的檢索方法的示意圖,該方法基于圖1所示建 立的文件的存儲(chǔ)結(jié)構(gòu),參照?qǐng)D3,該方法主要包括301,總控模塊接收帳單展現(xiàn)處理模塊的對(duì)存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的 帳單文件進(jìn)行讀耳又的讀取請(qǐng)求,具體實(shí)現(xiàn)時(shí),該讀取請(qǐng)求可以是帳單文件的打 印請(qǐng)求或重打印請(qǐng)求,但不僅限于此;302, 總控模塊判斷所述讀取請(qǐng)求是否在已有的請(qǐng)求隊(duì)列中,若是,則直接 將請(qǐng)求隊(duì)列號(hào)通知文件輸出模塊,然后文件輸出模塊直接將帳單文件以文件流 的方式傳給帳單展現(xiàn)處理模塊,完成帳單展現(xiàn),否則執(zhí)行步驟303;需要說(shuō)明的是,本發(fā)明實(shí)施例所設(shè)定的請(qǐng)求隊(duì)列可實(shí)現(xiàn)最近使用的帳單文 件在請(qǐng)求隊(duì)列中緩存,以快速調(diào)度出該帳單文件到帳單展現(xiàn)處理模塊中進(jìn)行處 理,而請(qǐng)求隊(duì)列中長(zhǎng)期不使用的帳單文件可定時(shí)清除,具體實(shí)現(xiàn)時(shí),可設(shè)定一 時(shí)間,當(dāng)超過(guò)該設(shè)定時(shí)間時(shí)清除該帳單文件以節(jié)約請(qǐng)求隊(duì)列資源;303, 總控模塊根據(jù)所述讀取請(qǐng)求,控制文件檢索模塊從存儲(chǔ)模塊中獲得用 于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的帳單文件的索引以及所述文件集 合,具體實(shí)現(xiàn)時(shí),總控模塊在進(jìn)行所述控制時(shí)產(chǎn)生對(duì)所述文件;險(xiǎn)索;f莫塊的控制 信息中包括所述讀取請(qǐng)求及索引鍵值,文件檢索模塊即可根據(jù)索引鍵值檢索出 所述索引及文件集合;304, 文件檢索模塊將獲得的所述索引及文件集合傳送給文件輸出模塊;305, 文件輸出模塊讀入文件檢索模塊傳來(lái)的文件集合及索引,根據(jù)索引選 取文件集合中對(duì)應(yīng)的帳單文件;306, 文件輸出模塊將所述帳單文件以文件流的方式傳給帳單展現(xiàn)處理模 塊,從而帳單展現(xiàn)處理模塊可觸發(fā)對(duì)所述帳單文件進(jìn)行打印或重打印操作,完 成帳單展現(xiàn)。作為一種實(shí)施方式,當(dāng)所述文件檢索模塊未從存儲(chǔ)模塊中獲得所述索引以及文件集合時(shí),上述本發(fā)明實(shí)施例的文件的檢索方法還可以包括如下流程307, 總控模塊獲得文件檢索模塊返回的獲得結(jié)果信息,該獲得結(jié)果信息指 示所述文件檢索模塊未從所述存儲(chǔ)模塊中獲得所述索引以及文件集合;308, 總控模塊控制文件生成模塊生成所述用戶的帳單文件;309,總控模塊同時(shí)控制文件組織模塊進(jìn)行圖1所示的將所述生成的帳單文 件進(jìn)行組織處理;310, 總控模塊將所述生成的帳單文件對(duì)應(yīng)的索引發(fā)送到文件檢索模塊;311, 文件生成模塊將生成的所述用戶的帳單文件發(fā)送到文件組織模塊,文 件組織才莫塊即可根據(jù)圖1所示的文件的組織方法的流程對(duì)生成的帳單文件進(jìn)行 處理;312,文件組織模塊將處理后的帳單文件發(fā)送到存儲(chǔ)模塊進(jìn)行存儲(chǔ)。在312之后,文件檢索模塊即可從所述存儲(chǔ)模塊獲得上述生成的帳單文件, 加總控模塊在310發(fā)送的索引,文件檢索模塊即可執(zhí)行304的對(duì)應(yīng)功能,完成 帳單展現(xiàn)。 ,作為一種實(shí)施方式,當(dāng)所述帳單文件以壓縮包形式存在時(shí),即各文件集合 被打包壓縮時(shí),上述步驟305具體為文件輸出模塊讀入文件檢索模塊傳來(lái)的文件集合及索引(該文件集合中的 帳單文件以壓縮包形式存在)后,解壓縮所述文件集合中與所述索引對(duì)應(yīng)的帳 單文件,然后以所述解壓縮得到的帳單文件進(jìn)行306的處理,為提高效率,此 處可根據(jù)索引進(jìn)行索引對(duì)應(yīng)帳單文件的部分解壓縮,而不需要對(duì)所述文件集合 全部進(jìn)行解壓縮。實(shí)施如圖3所示的本發(fā)明實(shí)施例的文件的檢索方法,通過(guò)接收對(duì)存儲(chǔ)節(jié)點(diǎn) 下合并的文件集合中的文件進(jìn)行讀取的讀取請(qǐng)求,根據(jù)用于檢索所述存儲(chǔ)節(jié)點(diǎn) 下合并的文件集合中的文件的索引,獲得并輸出所述讀取請(qǐng)求對(duì)應(yīng)的文件,可 文件定位效率低的問(wèn)題;采用了總控與模塊調(diào)度機(jī)制,更能實(shí)現(xiàn)按需的快速調(diào) 度,提高了用戶的體驗(yàn)滿意度。相應(yīng)地,下面對(duì)本發(fā)明實(shí)施例的才莫塊及系統(tǒng)進(jìn)行說(shuō)明。圖4是本發(fā)明實(shí)施例的文件組織模塊的示意圖,參照該圖,該文件組織模 塊包括有分類子模塊41、目錄建立子模塊42、獲取子模塊43、合并子模塊44、索引建立子模塊45,各子模塊的功能如下述分類子模塊41,用于對(duì)文件進(jìn)行分類,得到至少一個(gè)文件集合,每一個(gè)文 件集合與每一個(gè)分類結(jié)果對(duì)應(yīng),即形成某一類或幾類的文件集合;目錄建立子模塊42,用于為分類子模塊41分類處理所得各類文件集合建立 目錄結(jié)構(gòu),該目錄結(jié)構(gòu)中的目錄文件與每一類文件集合相對(duì)應(yīng);在具體實(shí)現(xiàn)時(shí),所述分類子^^塊41的分類處理或目錄建立子^t塊42的建 立目錄結(jié)構(gòu)的處理采用的算法可以是hash算法;獲取子模塊43,用于獲得所述分類子模塊41分類處理所得的各類文件集合;合并子模塊44,用于將獲取子模塊43獲得的每一類文件集合中的所有文件 合并到一個(gè)存儲(chǔ)節(jié)點(diǎn)下;索引建立子模塊45,建立用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件的索引,在 具體實(shí)現(xiàn)時(shí),索引組織可采用B+樹(shù)的形式,在下面的內(nèi)容中也同樣適用本說(shuō)明。上述各功能單元執(zhí)行對(duì)應(yīng)功能,建立出的文件存儲(chǔ)結(jié)構(gòu)可仍如圖2所示。作為一種實(shí)施方式,所述合并子模塊44中的合并的每一類文件集合中的所 有文件可由 一打包壓縮子模塊進(jìn)行打包壓縮。另外,上述分類子模塊41、目錄建立子模塊42可根據(jù)實(shí)際情況選擇采用。作為一種實(shí)施方式,當(dāng)要添加、刪除或修改所述建立的文件的存儲(chǔ)結(jié)構(gòu)中 的文件時(shí),可根據(jù)所述文件的添加、刪除或修改操作,由索引維護(hù)子模塊更新 該文件對(duì)應(yīng)的索引(idx文件),對(duì)該索引進(jìn)行維護(hù)。作為一種實(shí)施方式,上述文件可以是帳單文件,或其他類型的文件。實(shí)施如圖4所示的本發(fā)明實(shí)施例的文件組織模塊,通過(guò)由不同子模塊對(duì)文 件進(jìn)行分類、建立目錄結(jié)構(gòu)、在一存儲(chǔ)節(jié)點(diǎn)下合并、建立索引等操作,可解決 由于文件數(shù)量太多,造成的存儲(chǔ)空間浪費(fèi)的問(wèn)題。在上述本發(fā)明實(shí)施例的文件組織模塊構(gòu)造的文件的存儲(chǔ)結(jié)構(gòu)的基礎(chǔ)上,本 發(fā)明實(shí)施例還提供了 一種存儲(chǔ)模塊,存儲(chǔ)有上述構(gòu)造的文件的存儲(chǔ)結(jié)構(gòu)。圖5是本發(fā)明實(shí)施例的文件檢索系統(tǒng)的示意圖,參照該圖,該系統(tǒng)主要包 括存儲(chǔ)模塊51、總控模塊52、文件檢索模塊53、文件生成模塊54、文件組織 模塊55、文件輸出模塊56,各模塊功能如下述存儲(chǔ)模塊51,該存儲(chǔ)模塊51對(duì)應(yīng)至少一個(gè)存儲(chǔ)節(jié)點(diǎn),存儲(chǔ)有用于檢索所述 存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的帳單文件的索引以及所述文件集合,該存儲(chǔ)模塊51中的帳單文件的存儲(chǔ)結(jié)構(gòu)可仍如圖2所示,此處不再贅述;總控模塊52中的接收子模塊,接收帳單展現(xiàn)處理模塊的對(duì)存儲(chǔ)模塊51中 存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的帳單文件進(jìn)行讀取的讀取請(qǐng)求,該讀取請(qǐng)求可 以是對(duì)帳單文件的打印請(qǐng)求或重打印請(qǐng)求;總控模塊52中的控制子模塊,判斷所述讀取請(qǐng)求對(duì)應(yīng)的帳單文件是否在請(qǐng) 求隊(duì)列,若是,則輸出用于控制將所述讀取請(qǐng)求對(duì)應(yīng)的帳單文件輸出的第一控 制信息,該第一控制信息中攜帶有請(qǐng)求隊(duì)列號(hào),否則,輸出用于控制所述文件 檢索模塊53從存儲(chǔ)模塊51中獲得用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中 的帳單文件的索引以及所述文件集合的第二控制信息,該第二控制信息中包括 有所述讀取請(qǐng)求及索引鍵值,文件檢索模塊53即可根據(jù)索引鍵值檢索出所述索 引及文件集合;文件輸出模塊56,根據(jù)所述第一控制信息,直接將帳單文件以文件流的方 式傳給帳單展現(xiàn)處理模塊,帳單展現(xiàn)處理模塊中可包括帳單展現(xiàn)處理程序;文件檢索模塊53,根據(jù)所述第二控制信息,從存儲(chǔ)模塊51中獲得用于^f企索 所述存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的帳單文件的索引以及所述文件集合,并將 獲得的所述索引及文件集合傳送給文件輸出模塊56;文件輸出模塊56,讀入文件檢索模塊53傳來(lái)的文件集合及索引,根據(jù)索引 選取文件集合中對(duì)應(yīng)的帳單文件,并將所述帳單文件以文件流的方式傳給帳單 展現(xiàn)處理模塊,從而帳單展現(xiàn)處理模塊觸發(fā)根據(jù)所述帳單文件進(jìn)行的打印或重 打印操作,完成帳單展現(xiàn);總控模塊52中的控制子模塊,在獲得文件檢索模塊53返回的獲得結(jié)果信 息后,該獲得結(jié)果信息指示所述文件檢索模塊53從存儲(chǔ)模塊51中未獲得所述 索引以及所述文件集合,向文件生成模塊54發(fā)送用于控制生成所迷用戶的帳單 文件的第三控制信息;文件生成模塊54,根據(jù)所述總控模塊52的第三控制信息生成所述用戶的帳 單文件,該文件生成模塊54中可包括文件生成程序;文件組織模塊55,根據(jù)所述總控模塊52的第四控制信息,將所述文件生成 模塊54生成的帳單文件進(jìn)行組織處理后存放到所述存儲(chǔ)模塊51中,文件組織 模塊55即可根據(jù)圖4所示的文件組織模塊的功能對(duì)生成的帳單文件進(jìn)行處理, 并將處理后的帳單文件發(fā)送到存儲(chǔ)模塊51進(jìn)行存儲(chǔ);文件檢索模塊53即可從所述存儲(chǔ)模塊51獲得上述生成的帳單文件,加總 控模塊52發(fā)送的索引,文件檢索模塊53即可獲得用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合 并的文件集合中的帳單文件的索引以及所述文件集合,并將獲得的所述索引及 文件集合傳送給文件輸出模塊56,從而完成帳單展現(xiàn)。作為一種實(shí)施方式,當(dāng)所述帳單文件以壓縮包形式存在時(shí),即各文件集合 被打包壓縮時(shí),上述文件輸出模塊56具體包括壓縮流處理模塊,讀入文件檢索模塊53傳來(lái)的文件集合及索引(該文件集 合中的帳單文件以壓縮包形式存在)后,解壓縮所述文件集合中與所述索引對(duì) 應(yīng)的帳單文件;輸出模塊,將所述壓縮流處理模塊解壓縮得到的所述帳單文件以文件流的 方式傳給帳單展現(xiàn)處理模塊。作為一種實(shí)施方式,上述文件檢索系統(tǒng)可應(yīng)用于BOSS中的帳單展現(xiàn)子系 統(tǒng)中。值得說(shuō)明的是,上述文件生成模塊54、文件組織模塊55可根據(jù)實(shí)際情況選 擇采用,當(dāng)不采用文件組織模塊55時(shí),可采用固定的格式組織上述帳單文件。實(shí)施如圖5所示的本發(fā)明實(shí)施例的文件檢索系統(tǒng),通過(guò)不同模塊接收對(duì)存 儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文件進(jìn)行讀取的讀取請(qǐng)求,根據(jù)用于檢索所述存 儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文件的索引,獲得并輸出所述讀取請(qǐng)求對(duì)應(yīng)的文 件,可文件定位效率低的問(wèn)題;采用了總控與模塊調(diào)度機(jī)制,更能實(shí)現(xiàn)按需的 快速調(diào)度,提高了用戶的體驗(yàn)滿意度。流程,是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可存儲(chǔ)于一計(jì)算 機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。 其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤(pán)、只讀存儲(chǔ)記憶體(Read-Only Memory, ROM)或隨機(jī)存儲(chǔ)記憶體(RandomAccess Memory, RAM)等。以上所述是本發(fā)明的具體實(shí)施方式
,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技 術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這 些改進(jìn)和潤(rùn)飾也視為本發(fā)明的保護(hù)范圍。
權(quán)利要求
1、一種文件的組織方法,其特征在于,包括獲得至少一個(gè)文件集合;將所述每一個(gè)文件集合中的所有文件合并到一個(gè)存儲(chǔ)節(jié)點(diǎn)下;建立用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件的索引。
2、 如權(quán)利要求1所述的文件的組織方法,其特征在于,該方法還包括 對(duì)文件進(jìn)行分類,得到所述至少一個(gè)文件集合,所述每一個(gè)文件集合與所述每一個(gè)分類結(jié)果對(duì)應(yīng)。
3、 如權(quán)利要求1所述的文件的組織方法,其特征在于,該方法還包括: 為所述至少一個(gè)文件集合建立目錄結(jié)構(gòu),所述每一個(gè)目錄結(jié)構(gòu)中的目錄文件與所述每一個(gè)文件集合對(duì)應(yīng)。
4、 如權(quán)利要求2或3所述的文件的組織方法,其特征在于,該方法采用哈 希算法進(jìn)行分類或建立目錄結(jié)構(gòu)。
5、 如權(quán)利要求1至3中任一項(xiàng)所迷的文件的組織方法,其特征在于,該方 法還包括打包壓縮所述合并的文件。
6、 如權(quán)利要求1至3中任一項(xiàng)所述的文件的組織方法,其特征在于,該方 法還包括根據(jù)所述文件的添加、刪除或修改操作,更新該文件對(duì)應(yīng)的索引。
7、 一種文件的檢索方法,其特征在于,包括 接收對(duì)存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文件進(jìn)行讀取的讀取請(qǐng)求; 根據(jù)所述讀取請(qǐng)求,獲得用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文件的索引以及所述文件集合;輸出所述文件集合中與所述索引對(duì)應(yīng)的文件。
8、 如權(quán)利要求7所述的文件的檢索方法,其特征在于,所述方法還包括 判斷所述讀取請(qǐng)求對(duì)應(yīng)的文件是否在請(qǐng)求隊(duì)列,若是,則將該請(qǐng)求隊(duì)列中所述讀取請(qǐng)求對(duì)應(yīng)的文件輸出。
9、 如權(quán)利要求7所述的文件的檢索方法,其特征在于,所述方法還包括 當(dāng)未獲得所述索引以及所述文件集合時(shí),生成所述文件,并將該生成的文件對(duì)應(yīng)索引輸出;將所述生成的文件進(jìn)行組織處理并進(jìn)行存儲(chǔ),獲得該存儲(chǔ)的文件。
10、 如權(quán)利要求7所述的文件的檢索方法,其特征在于,當(dāng)所述文件以壓 縮包形式存在時(shí),所述輸出所述文件集合中與所述索引對(duì)應(yīng)的文件具體包括解壓縮所述文件集合中與所述索引對(duì)應(yīng)的文件; 輸出所述解壓縮得到的文件。
11、 如權(quán)利要求7至9中任一項(xiàng)所述的文件的檢索方法,其特征在于,所 述文件為帳單文件。
12、 一種文件組織模塊,其特征在于,該文件組織模塊包括 獲取子模塊,獲得至少一個(gè)文件集合;合并子模塊,將所述每一個(gè)文件集合中的所有文件合并到一個(gè)存儲(chǔ)節(jié)點(diǎn)下; 索引建立子模塊,建立用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件的索引。
13、 如權(quán)利要求12所迷的文件組織模塊,其特征在于,該文件組織模塊還 包括分類子模塊,對(duì)文件進(jìn)行分類,得到所述至少一個(gè)文件集合,所述每一個(gè) 文件集合與所述每一個(gè)分類結(jié)果對(duì)應(yīng)。
14、 如權(quán)利要求12所述的文件組織模塊,其特征在于,該文件組織模塊還包括目錄建立子模塊,為所述至少一個(gè)文件集合建立目錄結(jié)構(gòu),所述每一個(gè)目 錄結(jié)構(gòu)中的目錄文件與所述每一個(gè)文件集合對(duì)應(yīng)。
15、 一種文件^r索系統(tǒng),其特征在于,包括存儲(chǔ)模塊,該存儲(chǔ)模塊對(duì)應(yīng)至少一個(gè)存儲(chǔ)節(jié)點(diǎn),存儲(chǔ)有用于檢索所述存儲(chǔ) 節(jié)點(diǎn)下合并的文件集合中的文件的索引以及所述文件集合;總控模塊,接收對(duì)存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文件進(jìn)行讀取的讀取請(qǐng) 求,并才艮據(jù)該讀取請(qǐng)求輸出對(duì)應(yīng)的控制信息;文件檢索模塊,根據(jù)所述總控模塊的控制信息,從存儲(chǔ)模塊中獲得用于檢 索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件集合中的文件的索引以及所述文件集合,輸出所 述索引及文件集合;文件輸出模塊,輸出所述文件集合中與所述索引對(duì)應(yīng)的文件。
16、 如權(quán)利要求15所述的文件檢索系統(tǒng),其特征在于,所述總控模塊包括 接收子模塊,接收所述讀取請(qǐng)求;控制子模塊,判斷所述讀取請(qǐng)求對(duì)應(yīng)的文件是否在請(qǐng)求隊(duì)列,若是,則輸 出用于控制將該請(qǐng)求隊(duì)列中所述讀耳義請(qǐng)求對(duì)應(yīng)的文件輸出的第一控制信息,否 則,輸出用于控制所述文件檢索模塊從存儲(chǔ)模塊中獲得用于檢索所述存儲(chǔ)節(jié)點(diǎn) 下合并的文件集合中的文件的索引以及所述文件集合的第二控制信息。
17、 如權(quán)利要求15所述的文件檢索系統(tǒng),其特征在于,該系統(tǒng)還包括 文件生成模塊,當(dāng)所述文件檢索模塊未獲得所述索引以及所述文件集合時(shí),根據(jù)所述總控模塊的第三控制信息生成所述文件;文件組織模塊,將所述文件生成模塊生成的文件進(jìn)行組織處理后存儲(chǔ)到所 述存儲(chǔ)模塊中。
18、 如權(quán)利要求15所述的文件檢索系統(tǒng),其特征在于,當(dāng)所迷文件以壓縮 包形式存在時(shí),所述文件輸出模塊包括壓縮流處理模塊,解壓縮所述文件集合中與所述索引對(duì)應(yīng)的文件;和user—c@askother. com(309)進(jìn)行通訊,用戶B (102)與問(wèn)答系統(tǒng)上的10. 10. 10. 1: :8080 (310)進(jìn)行通訊,用戶C (103)與問(wèn)答系統(tǒng)上的80000 (311)和80001 (312)進(jìn)行通訊。 在這個(gè)例子中,ask@askother. corn是問(wèn)答系統(tǒng)上的一個(gè)公共通訊地址,用于所有電子郵件 用戶的提交問(wèn)題,而80000是問(wèn)答系統(tǒng)上的一個(gè)公共通訊地址,用于所有短消息用戶的提 交問(wèn)題。當(dāng)用戶A (101)發(fā)送提問(wèn)到問(wèn)答系統(tǒng)的通訊地址ask@askother.com (307)時(shí),因?yàn)?該地址是專門(mén)用于提交問(wèn)題的,因此問(wèn)答系統(tǒng)知道這是一個(gè)提問(wèn),因此會(huì)將此問(wèn)題轉(zhuǎn)交給 問(wèn)題分析模塊(112);當(dāng)用戶A(101)發(fā)送信息到問(wèn)答系統(tǒng)的通訊地址user—b@askother. com(308) 時(shí),査找此路由表可以知道該信息需要轉(zhuǎn)發(fā)給用戶B (102),因此問(wèn)答系統(tǒng)將此信 息轉(zhuǎn)發(fā)到用戶B( 102);當(dāng)用戶A( 101 )發(fā)送信息到問(wèn)答系統(tǒng)的通訊地址user—c@askother. com(309) 時(shí),査找此路由表可以知道該信息需要轉(zhuǎn)發(fā)給用戶C (102),因此問(wèn)答系統(tǒng)將此信 息轉(zhuǎn)發(fā)到用戶C (103)。由于用戶B是一個(gè)互聯(lián)網(wǎng)絡(luò)瀏覽器用戶,當(dāng)用戶B (102)發(fā)送信 息到問(wèn)答系統(tǒng)的通訊地址10. 10. 10. 1: :8080 (310)時(shí),其信息的內(nèi)容包含足夠的信息供問(wèn) 答系統(tǒng)判斷需要將此消息轉(zhuǎn)發(fā)到與之交互的那個(gè)用戶,或者這個(gè)信息是一個(gè)提問(wèn)信息。因 此,在路由表中,為用戶B設(shè)置的表項(xiàng)中并沒(méi)有明確的目的用戶及其地址(316)。當(dāng)用戶C(103)發(fā)送提問(wèn)到問(wèn)答系統(tǒng)的通訊地址80000 (311)時(shí),因?yàn)樵摰刂芬彩菍iT(mén)用于提交問(wèn) 題的,因此問(wèn)答系統(tǒng)知道這是一個(gè)提問(wèn),因此會(huì)將此問(wèn)題轉(zhuǎn)交給問(wèn)題分析模塊(112);當(dāng)用 戶C (103)發(fā)送提問(wèn)到問(wèn)答系統(tǒng)的通訊地址80001 (312)時(shí),査找此路由表可以知道該信 息需要轉(zhuǎn)發(fā)給用戶A (101),因此問(wèn)答系統(tǒng)將此信息轉(zhuǎn)發(fā)到用戶A (101)對(duì)應(yīng)的地址 user—a@hotmail. com (318)。當(dāng)交互雙方不再針對(duì)對(duì)應(yīng)于某一通訊地址的問(wèn)題進(jìn)行交互時(shí),此通訊地址變得無(wú)效或 用作其他用途。在本實(shí)施例中,如果交互雙方在一定時(shí)間內(nèi)沒(méi)有任何交互,則對(duì)應(yīng)的路由 關(guān)系將會(huì)被刪除。舉例來(lái)說(shuō),如果用戶C (103)和用戶A (101)之間在一定時(shí)間后(比如 30分鐘)沒(méi)有任何交互,如果用戶C (103)仍然發(fā)送信息到地址80001 (312),這些信息 將不再轉(zhuǎn)發(fā)到用戶A (101)的地址user—a@hotmail.com (318)。本實(shí)施例中,當(dāng)相互交換的兩個(gè)用戶之間采用不同的通訊協(xié)議時(shí),用戶接口模塊還包 含協(xié)議轉(zhuǎn)換部分,以保證采用不同接入方式的用戶之間也可以順利交互。上述提問(wèn)用戶與 問(wèn)題解答用戶之間針對(duì)當(dāng)前問(wèn)題的交互,均通過(guò)對(duì)應(yīng)的通訊地址發(fā)送到問(wèn)答系統(tǒng)并轉(zhuǎn)發(fā)到 對(duì)方。在圖1所示的實(shí)施例中,用戶A (101)作為一個(gè)提問(wèn)用戶,利用不同的通訊地址通過(guò)
全文摘要
本發(fā)明實(shí)施例公開(kāi)了一種文件的組織方法,包括獲得至少一個(gè)文件集合,并將所述每一個(gè)文件集合中的所有文件合并到一個(gè)存儲(chǔ)節(jié)點(diǎn)下,建立用于檢索所述存儲(chǔ)節(jié)點(diǎn)下合并的文件的索引。本發(fā)明實(shí)施例還公開(kāi)了一種文件的檢索方法以及模塊、系統(tǒng)。采用本發(fā)明實(shí)施例,可解決由于文件數(shù)量太多,造成的存儲(chǔ)空間浪費(fèi)的問(wèn)題,且簡(jiǎn)單易行。
文檔編號(hào)G06F17/30GK101226546SQ20081002623
公開(kāi)日2008年7月23日 申請(qǐng)日期2008年2月1日 優(yōu)先權(quán)日2008年2月1日
發(fā)明者楊文滔, 竇克剛 申請(qǐng)人:華為技術(shù)有限公司