亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

面向光盤庫的全文檢索系統(tǒng)的制作方法

文檔序號(hào):8512516閱讀:440來源:國(guó)知局
面向光盤庫的全文檢索系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種面向光盤庫的全文檢索系統(tǒng),屬于計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002]日益增長(zhǎng)的存儲(chǔ)需要使得人們對(duì)超大容量存儲(chǔ)設(shè)備的需求也相應(yīng)的提高。目前基于光盤的存儲(chǔ)設(shè)備有光盤塔、光盤庫和光盤鏡服務(wù)器,而其中光盤庫顯得尤為重要。光盤庫是一種帶有自動(dòng)換盤機(jī)構(gòu)(機(jī)械手)的光盤網(wǎng)絡(luò)共享設(shè)備。光盤庫一般由放置光盤的光盤架、自動(dòng)換盤機(jī)構(gòu)(機(jī)械手)和驅(qū)動(dòng)器三部分組成。近年來,由于單張光盤的存儲(chǔ)容量大大增加,光盤庫相較于常見的存儲(chǔ)設(shè)備如磁盤陣?yán)⒋艓斓绕鋬r(jià)格性能優(yōu)勢(shì)逐漸顯露出來。目前關(guān)于光盤庫的數(shù)據(jù)管理多是基于光盤庫上的數(shù)據(jù)庫來操作的,對(duì)于某些數(shù)據(jù),通過光盤上的數(shù)據(jù)庫進(jìn)行管理確實(shí)比較方便。但是對(duì)于某些文件數(shù)據(jù),特別是需要進(jìn)行全文檢索的文件數(shù)據(jù),用光盤上的數(shù)據(jù)庫來管理,就相當(dāng)于在檢索引擎和數(shù)據(jù)之間增加了一層數(shù)據(jù),造成檢索上的不方便。所以對(duì)于需要進(jìn)行全文檢索的數(shù)據(jù),直接以文件形式存儲(chǔ)在光盤庫中是合理高效的,因而本發(fā)明以此形式實(shí)現(xiàn)光盤庫的數(shù)據(jù)存儲(chǔ)。
[0003]全文檢索技術(shù),就是以數(shù)據(jù)諸如文字,聲音,圖像等為主要內(nèi)容,以檢索文獻(xiàn)資料的內(nèi)容而不是外表特征的一種檢索技術(shù)。與其他搜索引擎相比,全文搜索引擎的顯著特點(diǎn)是它能夠以文中任何一個(gè)有檢索意義的詞作為檢索入口,而且取得的檢索結(jié)果是原始文獻(xiàn),而不是文獻(xiàn)線索。目前有許多高效的全文檢索引擎,但是這些引擎基于的存儲(chǔ)介質(zhì)大多都是磁盤,而在大數(shù)據(jù)存儲(chǔ)的今天,亟需一種由光盤庫作為存儲(chǔ)介質(zhì)的檢索引擎所構(gòu)成的全文檢索系統(tǒng)。本發(fā)明實(shí)現(xiàn)了面向光盤庫的全文檢索系統(tǒng)。
[0004]綜上所述,本發(fā)明不僅在光盤庫數(shù)據(jù)管理和全文檢索數(shù)據(jù)存儲(chǔ)介質(zhì)上做了創(chuàng)新,還將兩者結(jié)合,實(shí)現(xiàn)了基于光盤庫的全文檢索系統(tǒng)。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的是為了解決現(xiàn)有光盤庫管理系統(tǒng)無法實(shí)現(xiàn)光盤庫全文檢索的問題,提出一種面向光盤庫的全文檢索系統(tǒng)。
[0006]本發(fā)明的目的是通過下述技術(shù)方案實(shí)現(xiàn)的。
[0007]一種面向光盤庫的全文檢索系統(tǒng),包括文件數(shù)據(jù)存儲(chǔ)模塊、文件索引建立模塊、關(guān)鍵詞檢索模塊、文件信息讀取模塊。其中,
[0008]文件數(shù)據(jù)存儲(chǔ)模塊包含文件容量計(jì)算模塊、光盤分配模塊、數(shù)據(jù)存入模塊;
[0009]文件索引建立模塊包含文件讀取模塊、文件信息分詞模塊、磁盤索引文件建立模塊;
[0010]關(guān)鍵詞檢索模塊包括含關(guān)鍵詞獲取模塊、關(guān)鍵詞處理模塊、磁盤檢索模塊、檢索結(jié)果輸出申吳塊。
[0011]文件數(shù)據(jù)存儲(chǔ)模塊通過文件容量計(jì)算模塊統(tǒng)計(jì)所要存入光盤庫的總文件大小,以此確定分配光盤的數(shù)量。再通過光盤分配模塊對(duì)文件進(jìn)行分配,確定每個(gè)文件要存入的光盤編號(hào),最后通過數(shù)據(jù)存入模塊將文件存入對(duì)應(yīng)的光盤中。
[0012]文件索引建立模塊通過文件讀取模塊獲得存入光盤庫中的文件,再通過文件信息分詞模塊對(duì)文件內(nèi)容進(jìn)行分詞處理,最后通過磁盤索引文件建立模塊在磁盤上建立這些文件的索引文件。
[0013]關(guān)鍵詞檢索模塊通過關(guān)鍵詞獲取模塊獲得用戶輸入的關(guān)鍵詞,再利用關(guān)鍵詞處理模塊實(shí)現(xiàn)對(duì)關(guān)鍵詞的識(shí)別和拆分處理,最后通過磁盤檢索模塊對(duì)各個(gè)關(guān)鍵詞進(jìn)行檢索,獲得關(guān)鍵詞檢索結(jié)果,并通過檢索結(jié)果輸出模塊根據(jù)關(guān)鍵詞在文件中出現(xiàn)頻率的遞減順序輸出文件路徑。
[0014]文件信息讀取模塊根據(jù)關(guān)鍵詞檢索模塊得到的文件路徑,讀取相應(yīng)文件內(nèi)容。
[0015]一種面向光盤庫的全文檢索方法,先將文件存入光盤庫中,再通過讀取光盤庫文件的操作在磁盤上建立文件的索引信息。通過關(guān)鍵詞檢索時(shí),只需對(duì)磁盤上的索引文件進(jìn)行操作即可按照關(guān)鍵詞出現(xiàn)頻率遞減的順序顯示相關(guān)的文件路徑,并通過文件路徑讀取文件內(nèi)容。
[0016]所述將文件數(shù)據(jù)存儲(chǔ)到光盤庫,步驟如下:
[0017]步驟I從磁盤或其它存儲(chǔ)介質(zhì)上讀取要存入的文件數(shù)據(jù)。
[0018]步驟2計(jì)算這些將要存入的文件數(shù)據(jù)總的容量大小M0
[0019]步驟3將文件總?cè)萘砍悦繌埞獗P的總?cè)萘縨,得到所需要的空白光盤數(shù)量η。
[0020]步驟4對(duì)于空白光盤數(shù)量η,在光盤庫中找到η張空白光盤,若光盤庫中沒有足夠的η張空白光盤,則提醒存儲(chǔ)容量不足。
[0021]步驟5將文件總?cè)萘繙p去η張空白光盤的總?cè)萘浚玫轿募璧氖S嗳萘縄。
[0022]步驟6搜索光盤庫中已經(jīng)寫入數(shù)據(jù)但是未寫滿的光盤,查看是否有剩余容量大于文件所需的剩余容量I的光盤。
[0023]步驟7若找到剩余容量大于文件所需的剩余容量I的光盤,分配該光盤上的空間給文件,并更新該光盤的剩余容量;若沒有,則分配一張新的空白光盤,并更新該光盤的剩余容量。若既沒有剩余容量大于文件所需的剩余容量的光盤,也沒有剩余的空白光盤,則提醒存儲(chǔ)容量不足。
[0024]步驟8根據(jù)分配給文件的光盤編號(hào),使用光盤庫中的機(jī)械換盤器找到對(duì)應(yīng)編號(hào)的光盤。
[0025]步驟9使用光盤庫中的光盤驅(qū)動(dòng)器驅(qū)動(dòng)找到的光盤,為光盤數(shù)據(jù)的寫入做準(zhǔn)備。
[0026]步驟10將文件數(shù)據(jù)通過光驅(qū)寫入到光盤中。
[0027]所述在磁盤上直接建立光盤文件的倒排索引,步驟如下:
[0028]步驟I在磁盤上存放索引文件的位置對(duì)索引文件執(zhí)行讀操作,以判斷磁盤上的索引文件是否已經(jīng)存在;
[0029]步驟2若磁盤上的索引文件不存在,則先在磁盤上指定位置建立磁盤索引文件的初始哈希表,索引文件內(nèi)容為空。
[0030]步驟3讀取新存入光盤的文件,獲得文件的相關(guān)信息,這些信息包括文件存放的光盤編號(hào)、文件的編號(hào)、文件的內(nèi)容。
[0031]步驟4對(duì)文件的內(nèi)容進(jìn)行分詞處理,將文件的內(nèi)容劃分成單詞的集合,保存每個(gè)單詞的相關(guān)信息,包括單詞在文件中出現(xiàn)的位置和頻率。
[0032]步驟5將文件所包含的單詞集合、各單詞的相關(guān)信息以及為文件在光盤上的路徑做為索引的內(nèi)容鏈接到磁盤索弓I文件的哈希表上。
[0033]所述通過磁盤索引文件直接檢索關(guān)鍵詞所在文件信息,步驟如下:
[0034]步驟I獲取用戶輸入的用于檢索的關(guān)鍵詞。
[0035]步驟2對(duì)關(guān)鍵詞進(jìn)行分詞解析,得到多個(gè)關(guān)鍵詞,確定用戶要檢索的信息。
[0036]步驟3對(duì)每個(gè)關(guān)鍵詞采取同樣的操作,依次通過磁盤上的索引文件檢索包含該關(guān)鍵詞的文件相關(guān)的索引信息。
[0037]步驟4文件的索引信息包含關(guān)鍵詞出現(xiàn)的頻度,依據(jù)關(guān)鍵詞出現(xiàn)的頻度將與關(guān)鍵詞相關(guān)的多個(gè)文件路徑輸出,供用戶選擇。
[0038]所述根據(jù)檢索結(jié)果讀取光盤庫信息文件,步驟如下:
[0039]步驟I用戶選擇檢索到的文件路徑用于讀取。
[0040]步驟2使用光盤庫的機(jī)械換盤器找到文件路徑對(duì)應(yīng)的光盤。
[0041]步驟3使用光盤庫的光盤驅(qū)動(dòng)器驅(qū)動(dòng)光盤數(shù)據(jù)的讀取。
[0042]有益效果
[0043]本發(fā)明實(shí)現(xiàn)面向光盤庫的全文檢索系統(tǒng)。該系統(tǒng)的實(shí)現(xiàn)方法是在文件數(shù)據(jù)存入后再建立相應(yīng)的索引,節(jié)省了數(shù)據(jù)存入的時(shí)間,且只需在磁盤上建立索引而不需要在光盤上建立索引,節(jié)省了光盤的存儲(chǔ)容量。在檢索時(shí)只需操作磁盤上的索引文件,檢索速度快。本發(fā)明直接以文件的形式將數(shù)據(jù)存入光盤庫中,直接對(duì)光盤庫的文件進(jìn)行操作而并不是通過數(shù)據(jù)庫文件進(jìn)行存儲(chǔ)和檢索,降低了數(shù)據(jù)存儲(chǔ)和光盤庫操作的復(fù)雜性。
【附圖說明】
[0044]圖1是本發(fā)明利用磁盤索引文件實(shí)現(xiàn)的基于光盤庫的全文檢索系統(tǒng)的結(jié)構(gòu)示意圖;
[0045]圖2是本發(fā)明利用基于光盤庫的全文檢索系統(tǒng)在磁盤上直接建立文件索引的方法流程圖;
[0046]圖3是本發(fā)明利用基于光盤庫的全文檢索系統(tǒng)通過磁盤索引文件直接查詢與關(guān)鍵詞相關(guān)的文件信息的方法流程圖;
[0047]圖中標(biāo)號(hào),100-全文檢索系統(tǒng)、110-文件數(shù)據(jù)存儲(chǔ)模塊、120-文件索引建立模塊、130-關(guān)鍵詞檢索模塊、140-文件信息讀取模塊、ml-文件容量計(jì)算模塊、m2-光盤分配模塊、m3-數(shù)據(jù)存入模塊、m4-文件讀取模塊、m5-文件信息分詞模塊、m6-磁盤索引文件建立模塊、m7-關(guān)鍵詞獲取模塊、m8-關(guān)鍵詞處理模塊、m9_磁盤檢索模塊、mlO-檢索結(jié)果輸出模塊、200-光盤庫、210-機(jī)械換盤器、220-光盤驅(qū)動(dòng)器、230-光盤、240-光盤上的索引文件、300-磁盤存儲(chǔ)器、310-磁盤上的索引文件、X-光盤庫管理系統(tǒng)。
【具體實(shí)施方式】
[0048]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明做詳細(xì)說明。
[0049]一種面向光盤庫的全文檢索系統(tǒng),包括文件數(shù)據(jù)存儲(chǔ)模塊110、文件索引建立模塊120、關(guān)鍵詞檢索模塊130、文件信息讀取模塊140。
[0050]其中文件數(shù)據(jù)存儲(chǔ)模110塊包含文件容量計(jì)算模塊ml、光盤分配模塊m2、數(shù)據(jù)存入模塊m3 ;
[0051]文件索引建立模塊120包含文件讀取模塊m4、文件信息分詞模塊m5、磁盤索引文件建立模塊m6 ;
[0052]關(guān)鍵詞檢索模塊130包括關(guān)鍵詞獲取模塊m7、關(guān)鍵詞處理模塊m8、磁盤檢索模塊m9、檢索結(jié)果輸出模塊mlO。
[0053]文件數(shù)據(jù)存儲(chǔ)模塊110通過文件容量計(jì)算模塊統(tǒng)計(jì)所要存入光盤庫的總文件大小,以此確定分配光盤的數(shù)量。再通過光盤分配模塊對(duì)文件進(jìn)行分配,確定每個(gè)文件要存入的光盤編號(hào),最后通過數(shù)據(jù)
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1