專利名稱:圖書機讀目錄的轉(zhuǎn)換方法
技術領域:
本發(fā)明涉及利用計算機技術,對圖書機讀目錄進行自動化二次加工,建立特色資源庫的裝備及其方法。
背景技術:
“CNMARC”全稱“中國機讀目錄格式”。緣于上個世紀80年代末90年代初,我國圖書館的書目數(shù)據(jù)大多以FOX系列的數(shù)據(jù)庫格式進行管理。因此館與館之間書目數(shù)據(jù)不能共享,要進行交流,必須將書目數(shù)據(jù)的格式統(tǒng)一,即將原數(shù)據(jù)庫的數(shù)據(jù)改進或轉(zhuǎn)化成能相互交流的統(tǒng)一格式。出于這種考慮,文化部于1996年2月6日發(fā)布中國機讀目錄格式,并于同年7月實施這種國家標準格式,是一種線性數(shù)據(jù)庫。
在圖書館信息化管理中,基于國家標準的MARC記錄已成為實體書本的衍生,是一種虛擬的圖書,替代實體成為信息自動化管理的主體。每條MARC存儲1K字節(jié)左右的信息,記錄一本實體圖書的各種屬性和基本內(nèi)容。大中型圖書館幾十萬甚至上百萬數(shù)量級的印刷圖書資源,在計算機里表現(xiàn)為這種MARC記錄的數(shù)據(jù)庫,成為一個虛擬的電子資源庫。因為在格式上的統(tǒng)一性,可實現(xiàn)在網(wǎng)絡上的聯(lián)機查詢和書目的交換。
然而,這種線性關系的Marc格式記錄在實際的使用中存在一些問題不易于發(fā)布。如果從Marc庫中提取出某學科、某主題、某類型的特定的Marc記錄組成特色Marc庫,這時,這些特色Marc庫里的Marc記錄,因為是線性格式,就存在發(fā)布困難的問題。當前圖書館行業(yè)發(fā)布Marc記錄庫主要是依賴聯(lián)機檢索系統(tǒng),簡稱“OPAC”,OPAC只是按照位置順序?qū)arc庫里的全部Marc記錄逐條檢索,不適合也無法單獨發(fā)布特色庫資源。這時尋找一種通用的易于發(fā)布各種特色Marc庫資源的方法就成了必需;檢索速度慢。因為Marc記錄是線性格式,記錄間存放位置沒有嚴格的關于檢索點的索引關系,檢索的速度相對于關系型數(shù)據(jù)庫(可設置各種索引)較慢,當返回滿足條件的記錄數(shù)越多,這種現(xiàn)象越明顯。OPAC為了彌補這方面缺陷,常有最大返回行數(shù)設置;檢索點少。同樣,因為Marc格式記錄是線性格式,為了檢索只能設置了一些最常用的檢索點,如出版社、主題、作者、題名等,這些檢索點并不能滿足全部要求,例如要檢索所有關于專利文獻的資料,105字段的a子字段中內(nèi)容特征代碼k表示專利文獻,但對于Marc記錄,因為105不是檢索點,所以OPAC不能直接檢索105字段的a子字段中的內(nèi)容特征代碼。
目前圖書館對印刷型書刊的CNMARC書目進行二次篩選、加工,來創(chuàng)建特色資源庫,圖書館信息管理員通過OPAC檢索到滿足要求的記錄,或者用編目工具檢索滿足要求的Marc記錄,將Marc記錄逐條翻譯,添加到關系型數(shù)據(jù)庫中,形成關系型特色庫,這是一種手工轉(zhuǎn)換模式。實踐表明,這種傳統(tǒng)作業(yè)模式使得特色資源的開發(fā)工作為此作出了高昂的費用和大量的作業(yè)時間,成為圖書館行業(yè)深層次資源開發(fā)工作的桎梏,圖書館行業(yè)迫切需要能實現(xiàn)自動化作業(yè)的新技術的出現(xiàn)。
目前圖書館行業(yè)主要問題是對現(xiàn)有的館藏資源的深層次的開發(fā)利用不夠,圖書館工作重心正在轉(zhuǎn)向信息資源的二三次加工利用上,特色數(shù)據(jù)庫信息資源的建設成為當前迫切的需要,尤其目前高等院校圖書館充分利用館藏資源的優(yōu)勢,開發(fā)特色專業(yè)的信息資源,包括科研成果、學術論文、專利成果、及針對特定需求的各類專題、專業(yè)數(shù)據(jù)庫、并使其標準化和規(guī)范化,推向市場,提供更高水平的信息服務。這種特色館藏已成為衡量圖書館信息服務水平的重要性指標。
當前圖書館特色資源主要是印刷型書籍的CNMARC信息轉(zhuǎn)換而來,信息管理員通過搜尋得到滿足要求的CNMARC記錄,再將CNMARC逐條翻譯,手工存放到關系型特色庫中。因此圖書館行業(yè)迫切需要有便捷的自動轉(zhuǎn)換工具的出現(xiàn)來提高作業(yè)的效率,使管理人員從重復的勞動和內(nèi)部工作中解脫出來,為讀者提供更豐富、更深層次的信息服務。
圖書機讀目錄轉(zhuǎn)換系統(tǒng)的應用,使得館藏資源二、三次加工利用實現(xiàn)了全面的自動化。只要通過計算機簡單的操作就能實現(xiàn)特色資源建庫作業(yè)的任務。這一技術必將替代手工作業(yè),成為推動圖書館行業(yè)進一步快速健康發(fā)展的工具。
發(fā)明內(nèi)容
圖書機讀目錄轉(zhuǎn)換系統(tǒng)作為一種自動建庫工具,是基于CNMARC這種國家標準上實現(xiàn)的,在圖書館行業(yè)可以作為一種通用作業(yè)工具使用。在從線性Marc庫到關系性數(shù)據(jù)庫的轉(zhuǎn)化中,解決了線性Marc不易于發(fā)布、檢索速度慢、檢索點少的缺點,同時把圖書信息管理員從繁重的手工工作中解脫出來,從而為讀者提供更豐富、更深層次的信息服務。同時,從圖書館行業(yè)發(fā)展來看,這一系統(tǒng)的出現(xiàn)為目前圖書館行業(yè)良好發(fā)展提供了一個支持平臺,基于這種自動化管理,圖書館對信息資源的深層次特色資源的開發(fā),變得輕松、快速。
本發(fā)明采用下述技術方案實現(xiàn)上述目標圖書機讀目錄的轉(zhuǎn)換方法,其特征在于包含以下步驟。
a、對中國機讀目錄格式的字段、子字段、指示符和定長信息進行編碼,生成編碼結果;b、指定某個關系型數(shù)據(jù)庫作為轉(zhuǎn)換的輸出庫,選擇輸出庫中的某個表作為輸出表,對輸出表的結構進行分析,生成輸出表的分析結果;c、根據(jù)步驟b產(chǎn)生的輸出表的分析結果和步驟a產(chǎn)生的編碼結果,生成機讀目錄元數(shù)據(jù)與輸出表字段連接關系表;d、根據(jù)步驟a的編碼結果,通過選擇元數(shù)據(jù)和判別方法、設計關鍵字和權值,生成條件判斷表;e、讀取一條機讀目錄,生成基于字段元數(shù)據(jù)的分析結果;f、根據(jù)步驟d生成的條件判斷表,查詢步驟e生成的字段元數(shù)據(jù)分析結果,取得對應元數(shù)據(jù)值,根據(jù)查詢返回的值與關鍵字的關系進行條件判斷和計算有效權值;g、根據(jù)步驟f生成的判斷結果,比較總權值乘以模糊度同有效權值關系,返回條件判別結果;h、根據(jù)步驟c生成的字段連接關系表,結合步驟e生成的字段元數(shù)據(jù)的分析結果,返回對應的元數(shù)據(jù)值,生成已連接元數(shù)據(jù)的元數(shù)據(jù)值表;i、參見步驟b生成的輸出表的分析結果和步驟c生成的字段連接關系表,將步驟h生成的已連接元數(shù)據(jù)值表,保存元數(shù)據(jù)值到特色庫中;j、判斷機讀目錄記錄是否轉(zhuǎn)換結束,如果結束,則轉(zhuǎn)換結束;否則,返回到步驟e,進行下一條機讀目錄的轉(zhuǎn)換。
上述圖書機讀目錄轉(zhuǎn)換系統(tǒng)的輸入裝置可以是微電腦用的輸入鍵盤和鼠標,輸出顯示設備可以是微電腦顯示器,內(nèi)存16M和磁盤32M。
以上是中國圖書機讀目錄從線型轉(zhuǎn)化為關系型的全部步驟,對于圖書館的圖書信息管理員來說,在對機讀目錄格式進行拆分、編碼,并將編碼結果存貯在轉(zhuǎn)換系統(tǒng)之后,應用機讀目錄轉(zhuǎn)換方法的操作步驟如下
①、指定某個關系型數(shù)據(jù)庫作為轉(zhuǎn)換的輸出庫,選擇輸出庫中的某個表作為輸出表,然后系統(tǒng)對指定的輸出表的結構進行分析;②、根據(jù)步驟①產(chǎn)生的輸出表的分析結果和系統(tǒng)已存貯的編碼結果生成機讀目錄元數(shù)據(jù)與輸出表字段的連接關系表;③、根據(jù)系統(tǒng)已存貯的編碼結果,通過選擇元數(shù)據(jù)和判別方法、設計關鍵字和權值,生成條件判斷表;④、在系統(tǒng)進行了①②和③基礎上自動讀取一條機讀目錄自動完成轉(zhuǎn)換,進行自動循環(huán)機讀目錄讀取和轉(zhuǎn)換。
轉(zhuǎn)換完成自生成的輸出庫屬于關系型數(shù)據(jù)庫,關系型數(shù)據(jù)庫具有易于發(fā)布、檢索速度快,可按各個字段檢索,這是大家出認的關系型數(shù)據(jù)庫的優(yōu)點。
圖1、機讀目錄轉(zhuǎn)化系統(tǒng)結構框圖。
圖2、機讀目錄轉(zhuǎn)化方法流程圖。
圖3、機讀目錄元數(shù)據(jù)與輸出表字段的連接圖,其中表1為機讀目錄字段分析表,表2為元數(shù)據(jù)連接關系表。
圖4、機讀目錄的判定條件設置流程,其中表3為判定條件設置表。
圖5、輸出表的字段邏輯結構。
圖6、輸出表的字段分析結果,與圖3表1相對應。
圖7、機讀目錄元數(shù)據(jù)與輸出表字段的連接關系,與圖3表2相對應。
圖8、有標記位的輸出表字段分析結果。
圖9、元數(shù)據(jù)的條件關系表,與圖4表3相對應。
圖10、一條中國機讀目錄樣例。
圖11、字段元數(shù)據(jù)值。
圖12、基于元數(shù)據(jù)的條件項判斷結果。
圖13、已連接元數(shù)據(jù)值表。
圖14、特色庫當中的一條記錄。
Marc,中國機讀目錄格式的簡稱。
Marc字段、子字段、指示符和定長信息是中國機讀目錄格式不同的功能單位。一條機讀目錄有若干個字段組成;一個字段一般由若干個子字段和兩個指示符組成;或者一個字段由字長信息組成;子字段分為固定長度子字段和非固定長度子字段,固定長度子字段有固定長度,由若干個定長信息組成,可以把固定長度子字段劃分若干個定長信息,非固定長度子字段是不可劃分的。
元數(shù)據(jù),是對中國機讀目錄格式中,字段、子字段、指示符和定長信息的統(tǒng)稱。
編碼規(guī)則字段元數(shù)據(jù)編碼格式為“CN###Field”,“###”表示字段號、例如“CN001 Field”表示001字段。
子字段元數(shù)據(jù)編碼格式為“CN###%”,“###”表示字段號,“%”表示字段號,例如“CN100a”表示100字段的a子字段。
指示符號元數(shù)據(jù)編碼格式為“CN###%”,“###”表示字段號,“%”表示1或2,例如“CN1001”表示100字段的第1指示符。
定長信息的編碼(省略)。
輸出庫,是保存經(jīng)轉(zhuǎn)換系統(tǒng)處理后的元數(shù)據(jù)值的關系型數(shù)據(jù)庫。
輸出表,是輸出庫具體保存元數(shù)據(jù)值的表。
具體實施例方式
圖1所示為本發(fā)明所說的系統(tǒng)硬件至少的配置,其中轉(zhuǎn)換控制器的CPU至少是奔II芯片及其相配套的主板,內(nèi)存至少16兆,以及相適應的顯示器、鍵盤和鼠標。
在圖2流程圖中,引用記號“S1”指示“輸出庫結構分析、與機讀目錄元數(shù)據(jù)的連接登記”步驟,該步驟對輸出庫結構進行分析,在此基礎上配置輸出庫字段與機讀目錄元數(shù)據(jù)的連接關系?!癝2”指示“指定檢索判斷條件項”,該步驟設置檢索條件,滿足此檢索條件的機讀目錄才能被轉(zhuǎn)換?!癝3”指示“指定機讀目錄存放的路徑”,該步驟指定機讀目錄庫存放的位置。引用“S4”指示“讀取、分析一條機讀目錄”,該步驟從“S3”步驟指定的位置取得一條機讀目錄,并分析此機讀目錄,根據(jù)機讀目錄格式,拆分為字段元數(shù)據(jù)組?!癝5”指示條件判斷處理步驟,判斷各條件項是否成立?!癝6”指示條件滿足判斷步驟,當有效權值大于等于總權值乘以模糊度時,條件有效,當有效權值小于總權值乘以模糊度時,條件無效?!癝7”指示當“S6”條件滿足時,根據(jù)“S1”配置的輸出表字段與機讀目錄字段的連接關系,取得對應的元數(shù)據(jù)值?!癝8”指示把在“S7”取得的相應元數(shù)據(jù)值保存到對應輸出表字段?!癝9”指示一個目錄結構語句判斷步驟,該步驟判別“S3”步驟指定的路徑上,機讀目錄記錄是否結束。如果結束,則終止;否則,跳回到步驟“S4”。
圖3說明前敘的圖2中的“S1”步驟輸出庫結構分析與機讀目錄元數(shù)據(jù)的連接登記的細節(jié)。在圖3中,引用記號“S11”指示指定輸出庫和輸出庫的連接屬性步驟,該步驟指定輸出庫的路徑、連接用戶名、密碼等屬性?!癝12”指示指定輸出表步驟,該步驟指定要輸出元數(shù)據(jù)值到庫中的表。“S13”指示分析輸出表結構步驟,該步驟對輸出庫中的輸出表進行結構分析,包括字段名、必備性、類型、長度、默認值、允許零長度屬性。引用符號“S14”指示字段登記,該步驟登記字段各個屬性到表1字段名、必備性、類型、長度、默認值、允許零長度,標記位暫為空,表1指示輸出庫字段屬性表,該表包括輸出表的各字段屬性?!癝15”指示指定輸出表字段與機讀目錄元數(shù)據(jù)連接步驟,該步驟配置輸出表字段與機讀目錄元數(shù)據(jù)的連接關系?!癝16”指示登記連接關系步驟,該步驟把在“S15”配置的連接關系登記到表2,同時在表1中設置標記位。表2指示字段連接關系表,格式字段引用編號元數(shù)據(jù),字段引用編號對應表1中的標號列中的某個數(shù)字表示,元數(shù)據(jù)表示機讀目錄元數(shù)據(jù)的唯一標記。
圖4說明前敘的圖2中的“S2”步驟指定檢索判斷條件項的細節(jié)。在圖4中引用記號“S21”指示選擇基于條件判斷的元數(shù)據(jù)并登記元數(shù)據(jù)到表3的元數(shù)據(jù)列。表3表示用于登記條件判斷的表。引用記號“S22”指示登記判別方法步驟,該步驟登記條件判別方式到表3的判別方式列。引用記號“S23”指示登記關鍵字步驟,該步驟登記關鍵字到表3的關鍵字列。引用記號“S24”指示設置權值步驟,該步驟登記權值到表3的權值列。引用記號“S25”指示是否設置多重條件。引用記號“S26”指示設置模糊度。
參考圖2、圖3和圖4詳細描述各步驟的操作。
已有設計好的關系型數(shù)據(jù)庫,例如“示例庫”,“示例庫”中有“示例表”。
在圖3的“S11”步驟中指定“示例庫”為輸出庫,同時登記“示例庫”的連接屬性,如連接密碼、用戶名等。在“S12”中指定“示例表”為輸出表。圖5表示輸出表“示例表”的邏輯結構。此例的輸出庫采用“Access”格式,“Access”格式的關系型數(shù)據(jù)庫與其他格式的關系型數(shù)據(jù)庫,如“SQL Server”,“Oracle”,轉(zhuǎn)化非常方便。
接著,在“S13”步驟中分析輸出表“示例表”的邏輯結構,并在“S14”步驟中,登記到表1中。表1的格式編號指示登記輸出表中字段屬性時產(chǎn)生的表示字段的唯一數(shù)字表示;字段名指示輸出表中字段名稱;必備性指示輸出表中的字段是否必備,邏輯表示(是/否);類型指示輸出表中的字段的類型,數(shù)字表示,如字符型為10;長度指示輸出表中的字段的允許的最長長度,數(shù)字表示;默認值指示輸出表中的字段的默認值,如沒有則為空;允許零長度指示輸出表中的字段是否用“NULL”填入,邏輯表示(是/否);標記位在“S14”步驟全部為空,在后面的“S16“步驟中修改。“S14”步驟的登記結果,在圖6中表示。例如“示例表”中的字段“F005”,登記結果為編號---470、字段名---F005、必備性---false、類型---10、長度---50、默認值---(空)、允許零長度---false、標記位---。
在“S15”步驟中指定輸出表字段與機讀目錄元數(shù)據(jù)連接關系,并在“S16”步驟中,登記連接關系到表2中。登記結果在圖7中顯示。表2的格式“字段引用編號”的值對應步驟“S14”中登記的結果圖6的編號列中的某個數(shù)字表示,如圖7中連接關系項字段引用編號---470、元數(shù)據(jù)---CN005Field,字段引用編號為470,對應圖6中的第三項字段名為F005的數(shù)字表示470;“元數(shù)據(jù)”指示表示元數(shù)據(jù)的關鍵字,如圖7中連接關系項字段引用編號---470、元數(shù)據(jù)---CN005Field,CN005Field是字段元數(shù)據(jù)005的關鍵字。又如如圖7中連接關系項字段引用編號---483、元數(shù)據(jù)---CN100Date,CN100Date指示100字段的日期定長信息元數(shù)據(jù),483指示“示例表”的字段“記錄生成日期”的數(shù)字表示,通過這條連接關系項,表示要把100字段的日期定長信息存放到“示例表”的字段“記錄生成日期”中去。
同時在“S16”步驟中修改在“S14”步驟生成的圖6中的標記位信息。具體步驟如下CN001Field指示字段元數(shù)據(jù)001,字段001表示機讀目錄格式中唯一標識的流水號;在圖7中檢索元數(shù)據(jù)值為CN001Field的連接項,找到第一項,對應的字段引用編號為469;在圖6中檢索編號為469的項,找到第二項,修改第二項的標記為true。標記位作用,在保存機讀目錄元數(shù)據(jù)時,對具有標記位標記的字段進行檢索,判斷輸出庫中是否有相同信息。修改后結果在圖8中顯示。
在圖4的“S21”中登記元數(shù)據(jù)關鍵字,“S22”中登記條件判別方法,“S23”中登記條件關鍵字,“S24”中登記條件權值。登記后的結構保存在表3中,表3的格式元數(shù)據(jù)指示元數(shù)據(jù)的關鍵詞;判別方式指示條件判別方式,有7種方式有(用數(shù)字1表示)、包含(用數(shù)字2表示)、相等(用數(shù)字3表示)、不相等(用數(shù)字4表示)、大于等于(用數(shù)字5表示)、小于(用數(shù)字6表示)、介于(用數(shù)字7表示);關鍵字指示檢索判斷時的關鍵詞語;權值指示條件項的權;元數(shù)據(jù)值指示在機讀目錄記錄中取得的對應的元數(shù)據(jù)值;滿足,邏輯型,指示條件項是否成立。結果在圖9中顯示。例如,圖9中,條件項元數(shù)據(jù)---CN100Date、判別方式---5、關鍵字---2000、權值---1,CN100Date表示字段100的生成日期字長信息元數(shù)據(jù),5表示判別方法大于等于,2000表示檢索關鍵字,權為1,這條條件項表示檢索滿足條件生成日期大于(等于)2000年的機讀目錄。又如,圖9中,條件項元數(shù)據(jù)---CN210C、判別方式---3、關鍵字---科技出版社、權值---1,CN210C表示字段210的子字段出版、發(fā)行者名稱,3表示判別方法相等,科技出版社表示檢索關鍵詞,權為1,這條條件項表示檢索滿足條件出版社為科技出版社的機讀目錄。
在“S26”步驟中設置模糊度。如設置模糊度為0.4。
在“S3”中指定機讀目錄存放的路徑。
在“S4”步驟讀取一條機讀目錄,樣例在圖10中顯示。分析此記錄,以字段元數(shù)據(jù)為基礎,進行拆分,結果在圖11中顯示。圖11格式Marc字段指示Marc字段名稱(000字段表示頭標區(qū));Marc字段值指示Marc機讀目錄中Marc字段對應的值。例如,字段項Marc字段---005、Marc字段值---20020610154816.5,表示005字段的值為20020610154816.5。又如,字段項Marc字段---100、Marc字段值---a20020604g2002 em yochiy0120 ea,表示100字段的值為a20020604g2002 em yochiy0120 ea。
在“S5”步驟中進行條件判斷處理。該步驟處理過程根據(jù)的圖9條件關系表,由元數(shù)據(jù)列的元數(shù)據(jù)名,通過元數(shù)據(jù)名稱規(guī)則,從圖11中,取得對應的元數(shù)據(jù)值,存放到圖12的元數(shù)據(jù)值列中,比較圖12中的關鍵字列與元數(shù)據(jù)值列是否滿足判別方式列中的關系,如果滿足條件,圖12中的滿足列填是,否則填否。該步驟處理后的結果在圖12中顯示。例如,圖12中的第一項,“字段名稱---CN100Date、判別方式---5、關鍵字---2000、權值---1、元數(shù)據(jù)值---20020604、滿足---是”,CN100Date表示字段100的時間定長信息,根據(jù)元數(shù)據(jù)名稱規(guī)則,從圖11取得返回值為20020604,存放到元數(shù)據(jù)值列中,列關鍵字中的值等于2000,所以此條條件項成立,在滿足列中填是;又如,圖12中的第二項,“字段名稱---CN210C、判別方式---3、關鍵字---科技出版社、權值---1、元數(shù)據(jù)值---滿足---否”,CN210C表示字段210的出版者信息,根據(jù)元數(shù)據(jù)名稱規(guī)則,從圖11取得返回值為百花文藝出版社,存放到元數(shù)據(jù)值列中,列關鍵字中的值百花文藝出版社不為科技出版社,所以此條條件項不成立,在滿足列中填“否“。
“S6“步驟比較判斷結果,比較有效權值同(總權*模糊度)關系,當有效權值大于等于(總權*模糊度)時,當前記錄滿足條件;當有效權值小于(總權*模糊度)時,當前記錄不滿足條件??倷嗟挠嬎惴椒ɑ跅l件項不同的字段名稱,將對應的權值進行累加。例如,在“S26”中模糊度設置為0.4,圖12中有3個條件項,第二條件項“CN210C 3科技出版社 1”與第三條件項“CN210C 3百花文藝出版社1”的元數(shù)據(jù)名稱相同,是“或”關系,指示檢索出版社為科技出版社或百花文藝出版社,這兩個條件項表示CN210C權值為1。圖12的總權為2(CN210C權為1,CN100Date權為1),有效權值為2(第一條滿足,權1;第二條不滿足,第三條滿足,第二、第三條滿足“或”關系,只要有一條滿足,就指定基于的字段滿足),總權*模糊度=0.8,有效權2大于0.8,當前記錄滿足條件。
“S7“步驟根據(jù)圖7的連接關系表,由元數(shù)據(jù)列中的元數(shù)據(jù)名,根據(jù)元數(shù)據(jù)的命名規(guī)則,從圖11的字段元數(shù)據(jù)表中,返回對應的元數(shù)據(jù)值,結果在圖13中顯示。圖13表的格式元數(shù)據(jù)—指示元數(shù)據(jù)名,元數(shù)據(jù)值—指示存放返回的元數(shù)據(jù)值。例如,圖7中的字段引用編號為479項,元數(shù)據(jù)為CN606Field,根據(jù)命名規(guī)則,從圖11的字段元數(shù)據(jù)中取得的元數(shù)據(jù)為606的Marc字段的元數(shù)據(jù)值為“oa古典文學x作品y中國x漢語x英語j對照讀物02CT3S026848a古典文學”存放到圖13中,元數(shù)據(jù)為CN606Field、元數(shù)據(jù)值為oa古典文學x作品y中國x漢語x英語j對照讀物。
“S8”步驟根據(jù)圖13,圖7和圖8,利用圖8的列名“編號”和圖7列名“字段引用編號”,圖7列名“元數(shù)據(jù)”和圖13列名“元數(shù)據(jù)”的對應關系,分別把元數(shù)據(jù)值放入到輸出表對應的字段。例如,一個元數(shù)據(jù)的存放步驟根據(jù)圖8,要存放F001字段,查到對應的字段編號為469,再由圖7,查詢字段引用編號為469,取得對應的元數(shù)據(jù)為CN001 Field,再根據(jù)圖13,查詢元數(shù)據(jù)列為CN001Field的項,取得對應的元數(shù)據(jù)值為012002046211,結合圖8的F001字段的屬性,把012002046211存放到輸出庫的輸出表示圖8的F001字段。
“S9”判斷是否到結束。如沒到結束,返回到S4,轉(zhuǎn)換下一條記錄,S8步驟完成在特色庫中添加一條記錄如圖14所示。
權利要求
1.圖書機讀目錄的轉(zhuǎn)換方法,其特征在于包含以下步驟。a、對中國機讀目錄格式的字段、子字段、指示符和定長信息進行編碼,生成編碼結果;b、指定某個關系型數(shù)據(jù)庫作為轉(zhuǎn)換的輸出庫,選擇輸出庫中的某個表作為輸出表,對輸出表的結構進行分析,生成輸出表的分析結果;c、根據(jù)步驟b產(chǎn)生的輸出表的分析結果和步驟a產(chǎn)生的編碼結果,生成機讀目錄元數(shù)據(jù)與輸出表字段連接關系表;d、根據(jù)步驟a的編碼結果,通過選擇元數(shù)據(jù)和判別方法、設計關鍵字和權值,生成條件判斷表;e、讀取一條機讀目錄,生成基于字段元數(shù)據(jù)的分析結果;f、根據(jù)步驟d生成的條件判斷表,查詢步驟e生成的字段元數(shù)據(jù)分析結果,取得對應元數(shù)據(jù)值,根據(jù)查詢返回的值與關鍵字的關系進行條件判斷和計算有效權值;g、根據(jù)步驟f生成的判斷結果,比較總權值乘以模糊度同有效權值關系,返回條件判別結果;h、根據(jù)步驟c生成的字段連接關系表,結合步驟e生成的字段元數(shù)據(jù)的分析結果,返回對應的元數(shù)據(jù)值,生成已連接元數(shù)據(jù)的元數(shù)據(jù)值表;i、參見步驟b生成的輸出表的分析結果和步驟c生成的字段連接關系表,將步驟h生成的已連接元數(shù)據(jù)值表,保存元數(shù)據(jù)值到特色庫中;j、判斷機讀目錄記錄是否轉(zhuǎn)換結束,如果結束,則轉(zhuǎn)換結束;否則,返回到步驟e,進行下一條機讀目錄的轉(zhuǎn)換。
2.根據(jù)權利要求1所述的圖書機讀目錄的轉(zhuǎn)換方法,其特征是圖書館的圖書信息管理員應用機讀目錄轉(zhuǎn)換方法的操作步驟如下①、指定某個關系型數(shù)據(jù)庫作為轉(zhuǎn)換的輸出庫,選擇輸出庫中的某個表作為輸出表,然后系統(tǒng)對指定的輸出表的結構進行分析;②、根據(jù)步驟①產(chǎn)生的輸出表的分析結果和系統(tǒng)已存貯的編碼結果生成機讀目錄元數(shù)據(jù)與輸出表字段的連接關系表;③、根據(jù)系統(tǒng)已存貯的編碼結果,通過選擇元數(shù)據(jù)和判別方法、設計關鍵字和權值,生成條件判斷表;④、在系統(tǒng)進行了①②和③基礎上自動讀取一條機讀目錄自動完成轉(zhuǎn)換,進行自動循環(huán)機讀目錄讀取和轉(zhuǎn)換。
全文摘要
圖書機讀目錄的轉(zhuǎn)換方法,通過對機讀目錄格式進行分析和編碼,建立輸出庫的輸出表,生成輸出表的結構分析,產(chǎn)生機讀目錄元數(shù)據(jù)與輸出表字段連接關系表,選擇元數(shù)據(jù)和判別方法、設計關鍵字和權值產(chǎn)生條件判斷表,讀取一條機讀目錄,生成字段元數(shù)據(jù),取得對應元數(shù)據(jù)值,比較總權植乘以模糊度同有效權值關系,根據(jù)比較結果產(chǎn)生已連接元數(shù)據(jù)的值并保存在特色數(shù)據(jù)庫中,本系統(tǒng)能自動讀取機讀目錄,自動進行線型轉(zhuǎn)換成關系型的循環(huán),轉(zhuǎn)換完成后生成的關系型數(shù)據(jù)庫具有易于發(fā)布、檢索速度快,可按各個字段檢索的優(yōu)點。
文檔編號G06F17/30GK1588362SQ20041006644
公開日2005年3月2日 申請日期2004年9月16日 優(yōu)先權日2004年9月16日
發(fā)明者盧利華 申請人:盧利華