專利名稱:一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于信息管理技術(shù)領(lǐng)域,特別是涉及一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄 管理海量信息的方法。
背景技術(shù):
Internet/Intranet技術(shù)的發(fā)展帶來(lái)了信息應(yīng)用業(yè)務(wù)的迅速發(fā)展、信息化工作環(huán) 境的不斷完善和多類型信息的關(guān)聯(lián)化應(yīng)用的趨勢(shì),當(dāng)今國(guó)內(nèi)外企業(yè)已經(jīng)開(kāi)始進(jìn)入 依賴信息作為發(fā)展動(dòng)力的時(shí)代。如今,需要企業(yè)進(jìn)行管理的數(shù)據(jù)正在以指數(shù)級(jí)速 度增長(zhǎng),以收集、整理中國(guó)城市各種綜合信息為主體的大型網(wǎng)站為例,每天收集 來(lái)自全國(guó)數(shù)萬(wàn)個(gè)地區(qū)的各種類型的大量信息。這些龐大的海量信息是當(dāng)今大型商 業(yè)網(wǎng)站需要面對(duì)的一個(gè)現(xiàn)實(shí)。任何一個(gè)企業(yè)都在面對(duì)其企業(yè)數(shù)據(jù)庫(kù)由于規(guī)模擴(kuò)大 產(chǎn)生的沉重負(fù)擔(dān),提高海量數(shù)據(jù)訪問(wèn)能力和業(yè)務(wù)分析能力的要求也變得越來(lái)越迫 切。
一般認(rèn)為海量信息是以Terabyte (1000Gb)的信息為最低限度,實(shí)際上對(duì)海 量信息的存儲(chǔ)和管理應(yīng)可以達(dá)到Petabyte (1000TB)的規(guī)?;蛘吒?,比如無(wú)限 擴(kuò)充等。
信息組織是對(duì)信息資源進(jìn)行序化和優(yōu)化的過(guò)程。從網(wǎng)絡(luò)信息特征可知,對(duì)其 進(jìn)行組織優(yōu)化極為重要,常用的組織方式主要有四種即文件方式、數(shù)據(jù)倉(cāng)庫(kù)方 式、主題樹方式和超媒體方式。
主題樹方式提供了一個(gè)基于樹瀏覽的、簡(jiǎn)單易用的信息檢索與利用界面,適 用于建立專業(yè)性或示范性的網(wǎng)絡(luò)信息資源體系。但由于確定一個(gè)完整系統(tǒng)的范疇 體系有一定的難度,加之要保證目錄結(jié)構(gòu)的清晰,每一目錄下的條目不宜過(guò)多,所以不適合建立大型綜合性信息資源系統(tǒng)。國(guó)外許多著名的搜索引擎工具都采用 這種方式組織信息資源。
在現(xiàn)階段,盡管有多種海量信息的管理方法,但關(guān)于海量信息的組織管理, 目前還存在許多需要解決的技術(shù)困難。
發(fā)明內(nèi)容
本發(fā)明為了解決現(xiàn)有技術(shù)中的不足,特別涉及一種利用多維結(jié)構(gòu)樹構(gòu)成的目 錄管理海量信息的方法,利用該方法可以簡(jiǎn)單、方便地形成結(jié)構(gòu)清晰、意義明確、 目錄名稱屬性含有遺傳信息、每層目錄數(shù)量可控、可擴(kuò)展性強(qiáng)的樹狀結(jié)構(gòu)目錄, 同時(shí)目標(biāo)信息存放在相應(yīng)地名的相應(yīng)分類目錄下,提高了搜索和識(shí)別速度,增加 了信息容量。
本發(fā)明的技術(shù)方案如下
一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的方法,該方法包括如下步
驟
1)、構(gòu)建帶遺傳信息的地名結(jié)構(gòu)樹,該地名結(jié)構(gòu)樹只有一個(gè)根;地名結(jié)構(gòu)樹 中的分段代碼信息由2個(gè)字符、數(shù)字或符號(hào)組成;
地名結(jié)點(diǎn)信息包含其祖先的全部信息, 一個(gè)完整的結(jié)點(diǎn)代碼信息是分段代碼 信息的集合,代碼信息的執(zhí)行是按照從左到右的順序執(zhí)行,且代碼信息中包含有
縱向和橫向的位置關(guān)系;
所述的代碼信息是由一張2維表構(gòu)成的,每個(gè)分段代碼是表里的一個(gè)數(shù)據(jù)點(diǎn), 每個(gè)父結(jié)點(diǎn)的子結(jié)點(diǎn)數(shù)量《99,分段代碼的數(shù)量《99,每個(gè)分段代碼包含其在分 段代碼信息集合中的位置,位置小的分段代碼為兄長(zhǎng)。
2)、從地名結(jié)構(gòu)樹中獲取所需的地名信息集合,以文件方式保存到服務(wù)器上; 對(duì)于所述集合,至少包含一個(gè)地名結(jié)點(diǎn)代碼,結(jié)點(diǎn)代碼可以任意排列;其屮給定 一個(gè)結(jié)點(diǎn)代碼,可以得到一個(gè)包含祖先結(jié)點(diǎn)的分支,以及得到分支上任意一個(gè)結(jié) 點(diǎn)左邊的兄結(jié)點(diǎn)代碼信息。3)、計(jì)算機(jī)信息讀取程序從存放在磁盤的文件里讀取地名信息集合中包含的 地名信息,根據(jù)樹結(jié)點(diǎn)代碼屬性形成樹狀結(jié)構(gòu)地名目錄;計(jì)算機(jī)信息讀取程序從 存放在磁盤的文件里讀取地名信息集合里的一個(gè)地名結(jié)點(diǎn)代碼信息,判斷結(jié)點(diǎn)代 碼長(zhǎng)度是否小于等于第一級(jí)目錄設(shè)置的長(zhǎng)度,如果是,該結(jié)點(diǎn)代碼為第一級(jí)目錄 的名稱屬性,第二級(jí)目錄的名稱屬性定義為root;否則,從結(jié)點(diǎn)代碼中取與第一
級(jí)目錄設(shè)置的長(zhǎng)度相等數(shù)量的代碼,作為第一級(jí)目錄的名稱屬性,剩余的代碼為
第二級(jí)目錄的名稱屬性;
地名目錄有一個(gè)并且只能有一個(gè)虛擬的根目錄,虛擬的根目錄名稱屬性出現(xiàn) 在所有第一級(jí)地名目錄的名稱屬性中。
4)、將包含有分類信息的文件保存到服務(wù)器上,計(jì)算機(jī)信息讀取程序從存放 在磁盤的文件里讀取該分類信息,在相應(yīng)的地名目錄下形成樹狀分類目錄;分類 信息文件至少包含信息分類名稱和工作分類名稱;
分類目錄屬于一個(gè)確定的地名,且目錄位置具有明確的含義,任何地名下分 類目錄的構(gòu)建方式是相同的。
5)、客戶端提交的目標(biāo)信息存放在對(duì)應(yīng)于確定地名下的對(duì)應(yīng)分類目錄中。目 標(biāo)信息以文件方式唯一地存放在相應(yīng)的分類目錄中,且目標(biāo)信息具有確定的信息 分類,時(shí)間屬性和確定的工作分類。
從以上方案可以看出,本發(fā)明提供的一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海 量信息的方法具有以下效果
1、 具有信息遺傳特征的結(jié)構(gòu)樹使得目錄具有可控性、規(guī)律性,大大提高了 査找和識(shí)別信息的速度;
2、 以地名作為目標(biāo)信息的存放目錄,大大提高了對(duì)信息的管理容量;同時(shí) 由于地名目錄屬性、分類目錄屬性等包含在目標(biāo)信息里,因此提高了信息的精確 管理度;
3、 由于地名結(jié)構(gòu)樹和分類結(jié)構(gòu)樹具有無(wú)限層的功能,對(duì)應(yīng)的樹狀目錄也同樣具有無(wú)限分層的功能,因此可以對(duì)地名以及分類進(jìn)行最小粒度的細(xì)分,同時(shí)由 于地名結(jié)構(gòu)樹的獨(dú)有特征,在進(jìn)行地名擴(kuò)充時(shí),簡(jiǎn)單、實(shí)用、速度快。
圖1為本發(fā)明利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的方法的處理流程圖。
圖2為本發(fā)明多維結(jié)構(gòu)樹構(gòu)成的樹狀目錄的示例圖。
具體實(shí)施例方式
下面參照附圖結(jié)合具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。 以8層地名結(jié)構(gòu)以及分類、時(shí)間、工作類型等屬性為例,詳細(xì)說(shuō)明多維結(jié)構(gòu)
樹構(gòu)成的目錄管理海量信息的方法。
圖1是根據(jù)本發(fā)明利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的方法的處理流程圖。
步驟IOI、構(gòu)建地名結(jié)構(gòu)樹。指定一個(gè)地名結(jié)構(gòu)的根,本例以現(xiàn)實(shí)中物理存在 的地名結(jié)構(gòu)為原形,創(chuàng)建地名結(jié)構(gòu)樹,其根為太陽(yáng),結(jié)點(diǎn)代碼為bb,只有一個(gè)分 段代碼,并且必須是分段代碼集合中的第一個(gè)。
步驟102、從地名結(jié)構(gòu)樹中獲取所需的地名信息集合。
可以根據(jù)需要從任何結(jié)點(diǎn)提取地名信息,本例從根開(kāi)始提取信息,提取的內(nèi) 容為"萬(wàn)壽路街道"下屬的全部居委會(huì)信息。
步驟103、讀取集合中包含的地名信息,根據(jù)樹結(jié)點(diǎn)代碼屬性逐層形成樹狀結(jié) 構(gòu)目錄。比如本例中讀取翠微路社區(qū)居委會(huì)的結(jié)點(diǎn)代碼信息bbbbbbbbbbbbbbbb, 其對(duì)應(yīng)的樹狀結(jié)構(gòu)目錄為
bbbbbbbbbbbb/ bbbb/
該目錄共8層,每層包含2個(gè)字符,為一個(gè)完整的分段代碼。 第一級(jí)目錄取6層,本例中6層表示地級(jí)城市以上的級(jí)別為第一級(jí)目錄,之 后的為第2級(jí)目錄,如果代碼總長(zhǎng)度只到第6層,則第2級(jí)目錄名稱屬性規(guī)定用root代替。
圖2是本例所展示的是8層地名結(jié)構(gòu)樹,太陽(yáng)-->地球-->亞洲-〉中國(guó)-->北京 市--〉海淀區(qū)-->萬(wàn)壽路街道-->翠微路社區(qū)居委會(huì)。
翠微路社區(qū)居委會(huì)的結(jié)點(diǎn)代碼為bbbbbbbbbbbbbbbb,由8個(gè)分段代碼組成, 其樹狀結(jié)構(gòu)目錄對(duì)應(yīng)的地名含義為
海淀區(qū)/翠微路社區(qū)居委會(huì)。
步驟104、讀取分類、工作類型、時(shí)間信息,在對(duì)應(yīng)的地名目錄下創(chuàng)建目錄。 圖2中的bbbbbbbbbbbb/bbbb/info—city/work—dnbfbd,2007-8-l是在地名"翠微 路社區(qū)居委會(huì)"下的分類目錄; info一city為分類名稱; work_dnbfbd為工作類型; 2007-8-1為目標(biāo)信息的創(chuàng)建日期。
步驟105、從目標(biāo)信息中提取地名信息、分類、工作類型、創(chuàng)建日期屬性,并 把目標(biāo)信息以文件的方式存放在由這些屬性信息構(gòu)建的目錄下。
經(jīng)過(guò)以上的步驟,就可以得到利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的方法。
以上,僅以8層地名結(jié)構(gòu)為例,對(duì)本發(fā)明利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海 量信息的方法進(jìn)行了詳細(xì)的說(shuō)明,但是本發(fā)明所提供的方法同樣使用于其它領(lǐng) 域,在其它領(lǐng)域的實(shí)現(xiàn)方法和以上所述的方法基本一致,這里不再贅述。
以上所述,僅為本發(fā)明的具體實(shí)施例而已,并非用以限定本發(fā)明的保護(hù)范圍。
權(quán)利要求
1、一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的方法,其特征在于包括如下步驟1)、構(gòu)建帶遺傳信息的地名結(jié)構(gòu)樹,該地名結(jié)構(gòu)樹只有一個(gè)根;2)、從地名結(jié)構(gòu)樹中獲取所需的地名信息集合,以文件方式保存到服務(wù)器上;3)、計(jì)算機(jī)信息讀取程序從存放在磁盤的文件里讀取地名信息集合中包含的地名信息,根據(jù)樹結(jié)點(diǎn)代碼屬性形成樹狀結(jié)構(gòu)地名目錄;4)、將包含有分類信息的文件保存到服務(wù)器上,計(jì)算機(jī)信息讀取程序從存放在磁盤的文件里讀取該分類信息,在相應(yīng)的地名目錄下形成樹狀分類目錄;5)、客戶端提交的目標(biāo)信息存放在對(duì)應(yīng)于確定地名下的對(duì)應(yīng)分類目錄中。
2、 根據(jù)權(quán)利要求1所述的一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的 方法,其特征在于所述步驟l)的地名結(jié)構(gòu)樹中的分段代碼信息由2個(gè)字符、 數(shù)字或符號(hào)組成;地名結(jié)點(diǎn)信息包含其祖先的全部信息, 一個(gè)完整的結(jié)點(diǎn)代碼信息是分段代碼 信息的集合,代碼信息的執(zhí)行是按照從左到右的順序執(zhí)行,且代碼信息中包含有 縱向和橫向的位置關(guān)系;所述的代碼信息是由一張2維表構(gòu)成的,每個(gè)分段代碼是表里的一個(gè)數(shù)據(jù)點(diǎn), 每個(gè)父結(jié)點(diǎn)的子結(jié)點(diǎn)數(shù)量《99,分段代碼的數(shù)量《99,每個(gè)分段代碼包含其在分 段代碼信息集合中的位置,位置小的分段代碼為兄長(zhǎng)。
3、根據(jù)權(quán)利要求1所述的一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的方 法,其特征在于所述的結(jié)構(gòu)樹的形成過(guò)程如下給定一個(gè)根結(jié)點(diǎn)代碼,若結(jié)點(diǎn)代碼信息只包含一個(gè)分段代碼,則該分段代碼 必須是分段代碼信息集合中的第一個(gè);給定一個(gè)父結(jié)點(diǎn),獲取一個(gè)子結(jié)點(diǎn)分段代碼,父結(jié)點(diǎn)代碼加上分段代碼就得到一個(gè)子結(jié)點(diǎn)代碼;其中每一個(gè)地名結(jié)點(diǎn)代碼信息包含其祖先的信息。
4、根據(jù)權(quán)利要求1所述的一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的方法,其特征在于所述步驟2)中,對(duì)于所述集合,至少包含一個(gè)地名結(jié)點(diǎn)代碼, 結(jié)點(diǎn)代碼可以任意排列;其中給定一個(gè)結(jié)點(diǎn)代碼,可以得到一個(gè)包含祖先結(jié)點(diǎn)的分支,以及得到分支上任意一個(gè)結(jié)點(diǎn)左邊的兄結(jié)點(diǎn)代碼信息。
5、根據(jù)權(quán)利要求1所述的一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的 方法,其特征在于所述步驟3)包括計(jì)算機(jī)信息讀取程序從存放在磁盤的文件里讀取地名信息集合里的一個(gè)地 名結(jié)點(diǎn)代碼信息,判斷結(jié)點(diǎn)代碼長(zhǎng)度是否小于等于第一級(jí)目錄設(shè)置的長(zhǎng)度,如果是,該結(jié)點(diǎn)代碼為第一級(jí)目錄的名稱屬性,第二級(jí)目錄的名稱屬性定義為root;否則,從結(jié)點(diǎn)代碼中取與第一級(jí)目錄設(shè)置的長(zhǎng)度相等數(shù)量的代碼,作為第級(jí)目錄的名稱屬性,剩余的代碼為第二級(jí)目錄的名稱屬性;地名目錄有一個(gè)并且只能有一個(gè)虛擬的根目錄,虛擬的根目錄名稱屬性出現(xiàn) 在所有第一級(jí)地名目錄的名稱屬性中。
6、根據(jù)權(quán)利要求1所述的一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的方 法,其特征在于所述步驟4)中分類信息文件至少包含信息分類名稱和工作分 類名稱;分類目錄屬于一個(gè)確定的地名,且目錄位置具有明確的含義,任何地名下分 類目錄的構(gòu)建方式是相同的。
7、根據(jù)權(quán)利要求1所述的一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的 方法,其特征在于所述步驟5)中的目標(biāo)信息以文件方式唯一地存放在相應(yīng)的 分類目錄中,且目標(biāo)信息具有確定的信息分類,時(shí)間屬性和確定的工作分類。
全文摘要
本發(fā)明屬于信息管理技術(shù)領(lǐng)域,特別是涉及一種利用多維結(jié)構(gòu)樹構(gòu)成的目錄管理海量信息的方法。該方法包括構(gòu)建帶遺傳信息的地名結(jié)構(gòu)樹,該地方結(jié)構(gòu)樹只有一個(gè)根;從地名結(jié)構(gòu)樹中獲取所需的地名信息集合,以文件方式保存到服務(wù)器上;計(jì)算機(jī)信息讀取程序從存放在磁盤的文件里讀取地名信息集合中包含的地名信息,根據(jù)樹結(jié)點(diǎn)代碼屬性形成樹狀結(jié)構(gòu)地名目錄;將包含有分類信息的文件保存到服務(wù)器上,計(jì)算機(jī)信息讀取程序從存放在磁盤的文件里讀取該分類信息,在相應(yīng)的地名目錄下形成樹狀分類目錄;客戶端提交的目標(biāo)信息存放在對(duì)應(yīng)于確定地名下的對(duì)應(yīng)分類目錄中。利用該方法可以提高搜索和識(shí)別速度,增加了信息容量。
文檔編號(hào)G06F17/30GK101226552SQ20081005739
公開(kāi)日2008年7月23日 申請(qǐng)日期2008年2月1日 優(yōu)先權(quán)日2008年2月1日
發(fā)明者趙文銀 申請(qǐng)人:北京乾坤化物數(shù)字技術(shù)有限公司