專利名稱:建立書刊文獻(xiàn)數(shù)據(jù)庫的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于應(yīng)用于圖書和期刊的數(shù)據(jù)庫系統(tǒng)領(lǐng)域,具體涉及一種建立書刊文獻(xiàn)數(shù)據(jù)庫的方法。
背景技術(shù):
目前,公知的書刊文獻(xiàn)數(shù)據(jù)庫都是獨(dú)立于紙本圖書之外的系統(tǒng)。流行的電子書技術(shù)和解決方案也是關(guān)注對已經(jīng)出版的圖書期刊等內(nèi)容的處理,而與傳統(tǒng)出版的生產(chǎn)環(huán)節(jié)是相互脫節(jié)的。同時(shí),為了防止用戶的版權(quán)盜用,電子書普遍采用嚴(yán)苛的限制手段,諸如特制的文件格式、必須在線閱讀等等不便措施,不能滿足讀者通過利用電子書刊實(shí)現(xiàn)從閱讀圖書到使用圖書的愿望。
發(fā)明內(nèi)容
本發(fā)明克服上述現(xiàn)有的書刊文獻(xiàn)數(shù)據(jù)庫的不足,提供一種依托書刊發(fā)行而同步建立的書刊文獻(xiàn)數(shù)據(jù)庫方法。
本發(fā)明的技術(shù)內(nèi)容一種建立書刊文獻(xiàn)數(shù)據(jù)庫的方法,包括(1)在書刊出版生產(chǎn)環(huán)節(jié),根據(jù)樣書制作書刊全文電子檔案;(2)采用數(shù)據(jù)文本匯整工具匯整書刊文本數(shù)據(jù),作為數(shù)據(jù)庫中一個(gè)子數(shù)據(jù)庫;(3)針對全文電子檔案和子數(shù)據(jù)庫設(shè)定配置文件;(4)設(shè)置數(shù)據(jù)庫管理系統(tǒng);(5)將書刊全文電子檔案、書刊文本數(shù)據(jù)及對應(yīng)的配置文件,連同數(shù)據(jù)庫管理系統(tǒng)一起打包封裝到安裝文件制作光盤;(6)光盤隨書刊同步發(fā)售或獨(dú)立發(fā)行,通過安裝光盤建立書刊數(shù)據(jù)庫。
安裝不同書刊數(shù)據(jù)庫光盤時(shí),如果數(shù)據(jù)庫管理系統(tǒng)相同,無需更新數(shù)據(jù)庫管理系統(tǒng),僅累加子數(shù)據(jù)庫的數(shù)據(jù);如果數(shù)據(jù)庫管理系統(tǒng)不同,采用另一個(gè)統(tǒng)一的數(shù)據(jù)庫管理系統(tǒng)進(jìn)行整合。
累加多個(gè)子數(shù)據(jù)庫時(shí),數(shù)據(jù)庫管理系統(tǒng)可自動運(yùn)行索引建檔工具,通過全部重新建立索引和累進(jìn)式建立索引,形成單一的索引檔案,將新舊子庫的數(shù)據(jù)內(nèi)容自動累加整合在一個(gè)數(shù)據(jù)庫內(nèi)。
原文全書電子檔案可采用可加密的通用文件格式,例如MS Word和AdobePDF等文件格式。在電子檔案制作過程中,設(shè)定文檔的閱讀密碼。同時(shí),電子檔案與其內(nèi)容相同的數(shù)據(jù)庫數(shù)據(jù)對應(yīng)存放。相關(guān)的閱讀密碼和全文電子檔案與數(shù)據(jù)的對應(yīng)關(guān)系可加密寫入上述數(shù)據(jù)庫配置文件。
進(jìn)一步可包括自動解密的流程(1)打開MS Word或Acrobat Reader,MS Word或Acrobat Reader對加密過的MS Word或PDF文件會彈出一個(gè)密碼對話框;(2)遍歷當(dāng)前Windows系統(tǒng)的各個(gè)窗口,找到打開含密碼文件的MS Word或PDF文件,進(jìn)而遍歷其子窗口序列,獲取密碼對話框窗口的Windows句柄;(3)得到密碼對話框窗口中填寫密碼的輸入框的句柄,將解密后的密碼添入該輸入框,并觸發(fā)密碼對話框窗口的提交按鈕。
所述數(shù)據(jù)文本匯整工具可以是XML編輯器,全文數(shù)據(jù)庫的所有數(shù)據(jù)庫數(shù)據(jù)可采用XML格式存放,字段在XML中定義。
本發(fā)明的技術(shù)效果為出版行業(yè)在書刊出版的生產(chǎn)環(huán)節(jié)中納入書刊文獻(xiàn)數(shù)據(jù)庫光盤的制作,其光盤可以隨書刊同步發(fā)售或獨(dú)立發(fā)行,書刊文獻(xiàn)數(shù)據(jù)庫主要依托書刊文獻(xiàn)數(shù)據(jù)庫光盤的發(fā)行由讀者安裝而建立。同時(shí),讀者在安裝不同種圖書或不同期刊物的光盤時(shí),將新舊不同子數(shù)據(jù)庫的數(shù)據(jù)內(nèi)容自動累加整合在一個(gè)數(shù)據(jù)庫內(nèi)。針對出版社而言,通過出售不同的圖書光盤,也即不同的子庫,可以將新舊圖書的數(shù)據(jù)內(nèi)容自動累加整合在一個(gè)數(shù)據(jù)庫內(nèi)。讀者購買的該出版社的圖書越多,其書刊數(shù)據(jù)庫中累加的子庫也就越多,數(shù)據(jù)量也越豐富。
在原文數(shù)據(jù)提供方面,數(shù)據(jù)所有者可選擇采用通用的文件格式發(fā)布原文檔案,但進(jìn)行檔案加密,以防止不當(dāng)流傳。唯在用戶使用書刊數(shù)據(jù)庫調(diào)閱的時(shí)候,系統(tǒng)可以自動解密,不需要讀者用戶干預(yù),不會使用戶感到不便。
圖1是本發(fā)明書刊文獻(xiàn)數(shù)據(jù)庫的數(shù)據(jù)庫光盤制作示意圖;圖2是本發(fā)明書刊文獻(xiàn)數(shù)據(jù)庫示意圖;圖3是本發(fā)明書刊文獻(xiàn)數(shù)據(jù)庫的原文自動解密示意圖;圖4是本發(fā)明書刊文獻(xiàn)數(shù)據(jù)庫界面示意圖。
具體實(shí)施例方式
參考圖1,本發(fā)明在書刊出版的生產(chǎn)環(huán)節(jié)中納入書刊文獻(xiàn)數(shù)據(jù)庫光盤的制作。數(shù)據(jù)庫光盤制作系統(tǒng)是由一組軟件工具所組成,并輔助以高速掃描儀和文字自動光學(xué)辨識等相關(guān)電子文件制作的支持軟硬件。
具體實(shí)施方式
如下(1)在新書刊出版之前,首先根據(jù)樣書樣稿高速掃描形成TIFF圖形檔案,并完成電子書刊的制作,例如Adobe PDF格式的電子書。對雜志期刊,可采用作者投稿的原格式,例如MS Word格式或Adobe PDF格式,并且同步設(shè)定電子文件的閱讀密碼。
(2)對書刊數(shù)據(jù)庫光盤中所包括的書刊數(shù)據(jù)本身的封裝是透過XML編輯器完成的。采用XML編輯器將所要封裝的數(shù)據(jù)按照約定的XML格式寫入XML編輯器內(nèi),包括條目名稱、作者、內(nèi)文、發(fā)布日期等,形成統(tǒng)一的經(jīng)過格式校驗(yàn)的,符合書刊數(shù)據(jù)庫要求的XML文本。利用編輯器匯整數(shù)據(jù),能夠保證數(shù)據(jù)的格式統(tǒng)一,正確入庫。
(3)參考圖1,將數(shù)據(jù)的命名和分類命名,以及電子檔案的密碼設(shè)定到配置文件內(nèi)。配置文件可加密存放,并將在數(shù)據(jù)庫光盤安裝時(shí)自動分析配置文件的內(nèi)容,將光盤中的書刊內(nèi)容放置在書刊數(shù)據(jù)庫為所要安裝的內(nèi)容提供的位置中。
(4)設(shè)置數(shù)據(jù)庫管理系統(tǒng),參考圖2,數(shù)據(jù)庫管理系統(tǒng)包括主模塊,負(fù)責(zé)控制其它模塊,協(xié)調(diào)各模塊之間的通訊;Acrobat包(Acrobat Wrapper),實(shí)現(xiàn)加密的PDF格式原文全書電子檔案的自動解密;檢索引擎(Search Engine),是系統(tǒng)的數(shù)據(jù)中心,作用是存儲管理數(shù)據(jù),并提供分字段的全文檢索功能;檢索引擎連接包(Search Engine Connection Wrapper),負(fù)責(zé)主模塊與檢索引擎的通訊,包括數(shù)據(jù)的增刪改查等操作;圖形用戶接口(GUI),是系統(tǒng)的顯示接口模塊,封裝了所有的菜單,工具條,對話框,控制按鈕等;嵌入式IE(Embedded IE)模塊,內(nèi)嵌了一個(gè)Internet Explorer,使得書刊數(shù)據(jù)庫系統(tǒng)可以方便地顯示各類數(shù)據(jù),圖形及多媒體信息;XML分析器(XML Parser)模塊,用來方便存取各種系統(tǒng)配置文件及數(shù)據(jù)文件;網(wǎng)絡(luò)登入(WebLogin)模塊,用于實(shí)現(xiàn)自動在線數(shù)據(jù)更新,含數(shù)據(jù)下載和上傳,并可在數(shù)據(jù)提供方用戶授權(quán)的基礎(chǔ)上自動登錄數(shù)據(jù)服務(wù)網(wǎng)站;解密(Decryption)模塊,用于數(shù)據(jù)文件的加解密操作。
(5)參考圖3,在書刊文獻(xiàn)數(shù)據(jù)庫內(nèi)還包括原文自動解開閱讀密碼的技術(shù),其工作流程為首先打開MS Word或Acrobat Reader,MS Word或Acrobat Reader對加密過的MS Word或PDF文件會彈出一個(gè)密碼對話框。登入模塊遍歷當(dāng)前Windows系統(tǒng)的各個(gè)窗口,找到打開含密碼文件的MS Word或PDF文件,進(jìn)而遍歷其子窗口序列,獲取密碼對話框窗口的Windows句柄。之后,登入模塊得到密碼對話框窗口中填寫密碼的輸入框的句柄,將解密后的密碼添入該輸入框,并觸發(fā)密碼對話框窗口的提交按鈕,從而完成密碼的自動登入過程。在這期間,文件監(jiān)控器一直監(jiān)控MS Word或Acrobat Reader的各種異常行為,即使通過Windows核心的消息機(jī)制關(guān)閉其它異常信息窗口,保證登入動作的順利完成。該技術(shù)包括的模塊如下,以PDF檔案自動解密為例主動解密主模塊,負(fù)責(zé)與其他模塊的通訊,完成自動解密的整個(gè)流程;RSA模塊,實(shí)現(xiàn)RSA算法,實(shí)現(xiàn)非對稱的加解密動作;密鑰生成模塊,負(fù)責(zé)生成系統(tǒng)公鑰,并協(xié)助用戶生成私鑰;Acrobat密碼登入模塊實(shí)現(xiàn)打開加密PDF文件的功能,自動登入Acrobat并解密。
(6)參考圖1,在XML文本數(shù)據(jù)和加密的電子檔案,以及配置文件和數(shù)據(jù)庫管理軟件群備妥后,利用打包工具,將書刊全文電子檔案、書刊文本數(shù)據(jù)及對應(yīng)的配置文件,連同數(shù)據(jù)庫管理軟件系統(tǒng)一起打包封裝,根據(jù)作業(yè)流程進(jìn)行測試和病毒掃描殺毒,至此,完成書刊數(shù)據(jù)庫母盤(Mother CD)的制作。
(7)光盤隨書刊同步發(fā)售或獨(dú)立發(fā)行,通過安裝光盤建立書刊數(shù)據(jù)庫。參考圖4,書刊文獻(xiàn)數(shù)據(jù)庫系統(tǒng)功能區(qū)放置文件、命令、查看和幫助等系統(tǒng)使用功能;數(shù)據(jù)庫功能區(qū)放置全文檢索窗口,分字段控制選單等。在檢索結(jié)果與條目瀏覽區(qū)內(nèi),在瀏覽模式下,放置子庫的名稱;在檢索模式下,排列檢索結(jié)果。在分類與分庫管理區(qū)內(nèi),提供各個(gè)子庫的清單,可以任意單選或復(fù)選不同的子數(shù)據(jù)庫,進(jìn)行內(nèi)容的全文檢索。圖書數(shù)據(jù)內(nèi)容瀏覽區(qū)用于呈現(xiàn)多媒體數(shù)據(jù)內(nèi)容。在安裝不同書刊數(shù)據(jù)庫光盤時(shí),數(shù)據(jù)庫管理系統(tǒng)自動運(yùn)行索引建檔工具,通過全部重新建立索引和累進(jìn)式建立索引,形成單一的索引檔案,將新舊子庫的數(shù)據(jù)內(nèi)容自動累加整合在一個(gè)數(shù)據(jù)庫內(nèi)。以圖書為例,通過多個(gè)光盤安裝,可以在書刊數(shù)據(jù)庫內(nèi)建立多重子庫。一張光盤的內(nèi)容即可以包括一個(gè)或多個(gè)子庫的數(shù)據(jù),假設(shè)任意一個(gè)子庫的數(shù)據(jù)為K(i),則一個(gè)光盤中既有數(shù)據(jù)也有數(shù)據(jù)庫管理系統(tǒng)軟件,可標(biāo)記為K(i)M,其中M表示書刊數(shù)據(jù)庫管理系統(tǒng)。如果每本圖書的數(shù)據(jù)看作是一個(gè)子庫,由多個(gè)數(shù)據(jù)子庫所組成的書刊數(shù)據(jù)庫,可以標(biāo)記為K(books)=K(1),K(2),...,K(m),...,K(n),...,數(shù)據(jù)庫管理系統(tǒng)標(biāo)記為M,則安裝任意光盤K(m)M,都將安裝完整的數(shù)據(jù)庫管理系統(tǒng)和K(books)的一個(gè)子庫K(m)。在用戶取得并安裝第二張數(shù)據(jù)庫光盤K(n)M后,將在用戶端建立一個(gè)新的書刊數(shù)據(jù)庫系統(tǒng),(K(m)+K(n))M。通過多書刊數(shù)據(jù)庫光盤的安裝,理想狀態(tài)下用戶擁有的書刊數(shù)據(jù)庫為K(books)M,其眾多子庫的命名可由文件表控制。
對書刊數(shù)據(jù)庫管理系統(tǒng)而言,如果某一出版社的數(shù)據(jù)庫管理系統(tǒng)M相同,則無需更新安裝M。對不同的出版社而言,數(shù)據(jù)庫管理系統(tǒng)M可能不同,具有微小的差異,必要時(shí)可以采用彼此共通的數(shù)據(jù)庫管理系統(tǒng)進(jìn)行整合,從而達(dá)到匯整多個(gè)不同的書刊數(shù)據(jù)庫的數(shù)據(jù)資源。
權(quán)利要求
1.一種建立書刊文獻(xiàn)數(shù)據(jù)庫的方法,包括(1)在書刊出版生產(chǎn)環(huán)節(jié),根據(jù)樣書制作書刊全文電子檔案;(2)采用數(shù)據(jù)文本匯整工具匯整書刊文本數(shù)據(jù),作為數(shù)據(jù)庫中一個(gè)子數(shù)據(jù)庫;(3)針對全文電子檔案和子數(shù)據(jù)庫設(shè)定配置文件;(4)設(shè)置數(shù)據(jù)庫管理系統(tǒng);(5)將書刊全文電子檔案、書刊文本數(shù)據(jù)及對應(yīng)的配置文件,連同數(shù)據(jù)庫管理系統(tǒng)軟件群組一起打包封裝到安裝文件制作光盤;(6)光盤隨書刊同步發(fā)售或獨(dú)立發(fā)行,通過安裝光盤建立書刊數(shù)據(jù)庫。
2.如權(quán)利要求1所述的建立書刊文獻(xiàn)數(shù)據(jù)庫的方法,其特征在于安裝多個(gè)不同書刊數(shù)據(jù)庫光盤時(shí),如果數(shù)據(jù)庫管理系統(tǒng)相同,無需更新數(shù)據(jù)庫管理系統(tǒng),僅累加子數(shù)據(jù)庫的數(shù)據(jù);如果數(shù)據(jù)庫管理系統(tǒng)不同,采用另一個(gè)統(tǒng)一的數(shù)據(jù)庫管理系統(tǒng)進(jìn)行整合。
3.如權(quán)利要求2所述的建立書刊文獻(xiàn)數(shù)據(jù)庫的方法,其特征在于累加多個(gè)子數(shù)據(jù)庫時(shí),數(shù)據(jù)庫管理系統(tǒng)自動運(yùn)行索引建檔工具,通過全部重新建立索引和累進(jìn)式建立索引,形成單一的索引檔案,將新舊子庫的數(shù)據(jù)內(nèi)容自動累加整合在一個(gè)數(shù)據(jù)庫內(nèi)。
4.如權(quán)利要求1、2或3所述的建立書刊文獻(xiàn)數(shù)據(jù)庫的方法,其特征在于原文全書電子檔案采用可加密的通用文件格式,在電子檔案制作過程中,設(shè)定文檔的閱讀密碼,同時(shí),電子檔案與其內(nèi)容相同的數(shù)據(jù)庫數(shù)據(jù)對應(yīng)存放,相關(guān)的閱讀密碼和全文電子檔案與數(shù)據(jù)的對應(yīng)關(guān)系可加密寫入上述數(shù)據(jù)庫配置文件。
5.如權(quán)利要求4所述的建立書刊文獻(xiàn)數(shù)據(jù)庫的方法,其特征在于進(jìn)一步包括自動解密的流程(1)打開MS Word或Acrobat Reader,MS Word或Acrobat Reader對加密過的MS Word或PDF文件會彈出一個(gè)密碼對話框;(2)遍歷當(dāng)前Windows系統(tǒng)的各個(gè)窗口,找到打開含密碼文件的MS Word或PDF文件,進(jìn)而遍歷其子窗口序列,獲取密碼對話框窗口的Windows句柄;(3)得到密碼對話框窗口中填寫密碼的輸入框的句柄,將解密后的密碼添入該輸入框,并觸發(fā)密碼對話框窗口的提交按鈕。
6.如權(quán)利要求1所述的建立書刊文獻(xiàn)數(shù)據(jù)庫的方法,其特征在于所述數(shù)據(jù)文本匯整工具是XML編輯器,全文數(shù)據(jù)庫的所有數(shù)據(jù)庫數(shù)據(jù)采用XML格式存放,字段在XML中定義。
7.如權(quán)利要求1或6所述的建立書刊文獻(xiàn)數(shù)據(jù)庫的方法,其特征在于所述子數(shù)據(jù)庫由文件表控制。
全文摘要
本發(fā)明提供了一種建立書刊文獻(xiàn)數(shù)據(jù)庫的方法,屬于應(yīng)用于書刊的數(shù)據(jù)庫系統(tǒng)領(lǐng)域。該方法包括在書刊出版生產(chǎn)環(huán)節(jié),根據(jù)樣書制作書刊全文電子檔案,采用數(shù)據(jù)文本匯整工具匯整書刊文本數(shù)據(jù),作為數(shù)據(jù)庫中一個(gè)子數(shù)據(jù)庫,設(shè)定相關(guān)配置文件,設(shè)置數(shù)據(jù)庫管理系統(tǒng),將書刊全文電子檔案、書刊文本數(shù)據(jù)及對應(yīng)的配置文件,連同數(shù)據(jù)庫管理系統(tǒng)軟件一起打包封裝制作成光盤,光盤隨書刊同步發(fā)售或獨(dú)立發(fā)行,通過讀者安裝光盤建立書刊數(shù)據(jù)庫。在書刊出版的生產(chǎn)環(huán)節(jié)中納入書刊文獻(xiàn)數(shù)據(jù)庫光盤的制作,使書刊文獻(xiàn)數(shù)據(jù)庫依托書刊文獻(xiàn)數(shù)據(jù)庫光盤的發(fā)行而建立。同時(shí),讀者在安裝不同種圖書或不同期刊物的光盤時(shí),將新舊子庫的數(shù)據(jù)內(nèi)容自動累加整合在一個(gè)數(shù)據(jù)庫內(nèi)。
文檔編號G06F17/30GK1627306SQ20031011738
公開日2005年6月15日 申請日期2003年12月12日 優(yōu)先權(quán)日2003年12月12日
發(fā)明者趙鋒, 王宏源 申請人:王宏源