亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于xml的數(shù)字資源標(biāo)識方法和裝置的制造方法

文檔序號:9350058閱讀:331來源:國知局
一種基于xml的數(shù)字資源標(biāo)識方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)字出版和文獻(xiàn)檢索信息服務(wù)領(lǐng)域。
【背景技術(shù)】
[0002]目前,互聯(lián)網(wǎng)上的資源數(shù)量越來越多,為了方便用戶能發(fā)現(xiàn)并訪問資源,需要對網(wǎng)上的數(shù)字資源進(jìn)行唯一性標(biāo)識,并提供統(tǒng)一有效的標(biāo)識解析服務(wù)系統(tǒng)。信息服務(wù)和信息安全已經(jīng)成為國家戰(zhàn)略,特別是數(shù)字出版資源的需求更為迫切。現(xiàn)在,數(shù)字出版在向碎片化知識出版和按需出版轉(zhuǎn)型,需要對不同粒度的知識碎片進(jìn)行標(biāo)識,需要支持對不同來源、粒度、載體的知識按內(nèi)容體系實(shí)現(xiàn)動態(tài)聚合,這些都需要基于對出版的不同知識單元進(jìn)行唯一性標(biāo)識,并且能夠基于標(biāo)識實(shí)現(xiàn)一定程度的內(nèi)容解析,才能使得數(shù)字資源標(biāo)識在資源發(fā)現(xiàn)、傳播和使用中價(jià)值最大化。
[0003]數(shù)字對象標(biāo)識(DOI)是目前國際上最常用的出版資源數(shù)字對象唯一標(biāo)識體系,由國際數(shù)字對象標(biāo)識符基金會(IDF)以加盟方式進(jìn)行統(tǒng)一管理和服務(wù)。DOI編碼由前綴和后綴組成,前綴是機(jī)構(gòu)代碼由IDF分配,后綴由出版機(jī)構(gòu)自己設(shè)計(jì)、編碼,但需確保在出版機(jī)構(gòu)內(nèi)該編碼唯一,例如,DOI 碼:10.13862/j.cnk1.cn43-1446.r.2015.03.021,表示由出版機(jī)構(gòu)CNKI (前綴碼10.13862)注冊的一篇期刊文獻(xiàn)的DOI碼。通過編碼解析,DOI碼只能夠準(zhǔn)確定位到這個(gè)出版物,但是解析時(shí)除了出版機(jī)構(gòu)自己外,解析系統(tǒng)不知道該數(shù)字資源是什么或者有什么內(nèi)容,主要原因是后綴編碼完全由出版機(jī)構(gòu)設(shè)計(jì),沒有相互之間能夠理解的通用結(jié)構(gòu)。隨著數(shù)字出版和網(wǎng)絡(luò)應(yīng)用的發(fā)展,這種只能定位,不同提供更多結(jié)構(gòu)信息的編碼模式已經(jīng)不能滿足要求了。

【發(fā)明內(nèi)容】

[0004]針對上述問題,本發(fā)明提出一種基于XML的數(shù)字資源標(biāo)識方法和裝置。
[0005]本發(fā)明的第一個(gè)目的是提出一種基于XML的數(shù)字資源標(biāo)識方法,簡稱XMLD0I,包括:通過XML描述將數(shù)字資源編碼結(jié)構(gòu)化,每部分編碼對應(yīng)一個(gè)XML描述項(xiàng),能夠被計(jì)算機(jī)理解,知道這段編碼代表什么含義。這樣出版機(jī)構(gòu)先要提交符合統(tǒng)一標(biāo)準(zhǔn)的XML編碼定義文件,再按定義格式注冊數(shù)字資源編碼,使用時(shí),系統(tǒng)先讀取XML編碼定義文件,再解析數(shù)字資源標(biāo)識編碼。
[0006]本方法中數(shù)字資源標(biāo)識編碼采用分層結(jié)構(gòu)化設(shè)計(jì),為滿足當(dāng)前大規(guī)模數(shù)據(jù)技術(shù)對知識挖掘的需求,將編碼通過分層結(jié)構(gòu)化賦予更多含義,以利于后續(xù)資源定位和應(yīng)用。XMLDOI編碼分為三部分:唯一標(biāo)識部分IDSegment,外部特征標(biāo)識部分ExtSegment,內(nèi)容特征標(biāo)識部分IntSegment,在每一部分中通過多個(gè)編碼項(xiàng)描述相應(yīng)的編碼內(nèi)容,編碼項(xiàng)有保留編碼項(xiàng)和出版機(jī)構(gòu)自定義編碼項(xiàng)。唯一標(biāo)識部分標(biāo)識該數(shù)字資源在全球的唯一性,由機(jī)構(gòu)編碼和機(jī)構(gòu)內(nèi)唯一代碼兩個(gè)保留編碼項(xiàng)組成,外部特征標(biāo)識部分通過多個(gè)編碼項(xiàng),描述該資源的各種外部特征,內(nèi)容特征標(biāo)識部分通過多個(gè)編碼項(xiàng),描述該資源的主要內(nèi)容,除唯一性標(biāo)識部分必須存在以外,外部特征和內(nèi)容特征只需要保證一項(xiàng)以上存在。
[0007]本方法保持與DOI或其他常用編碼模式兼容,通過在數(shù)字資源外部特征部分增加保留編碼項(xiàng)IDFDOI實(shí)現(xiàn),出版機(jī)構(gòu)還可以自定義其他編碼數(shù)據(jù)項(xiàng)。
[0008]本發(fā)明的第二個(gè)目的是提出一種基于XML的數(shù)字資源標(biāo)識裝置,包括兩部分:數(shù)字資源標(biāo)識注冊管理子系統(tǒng)和數(shù)字資源標(biāo)識解析服務(wù)子系統(tǒng)。標(biāo)識注冊管理子系實(shí)現(xiàn)對出版機(jī)構(gòu)注冊管理和數(shù)字資源標(biāo)識注冊管理,包括出版機(jī)構(gòu)管理模塊、標(biāo)識分配管理模塊、數(shù)字資源注冊模塊、數(shù)字資源檢索模塊、數(shù)字資源挖掘模塊、第三方注冊管理模塊。
[0009]標(biāo)識解析服務(wù)子系統(tǒng)實(shí)現(xiàn)對數(shù)字資源標(biāo)識的不同粒度解析和服務(wù),包括標(biāo)識多重解析模塊、解析策略管理模塊、第三方編碼解析模塊、系統(tǒng)管理模塊。
【附圖說明】
[0010]圖1是數(shù)字資源標(biāo)識XML定義文件結(jié)構(gòu)示意圖
[0011]圖2是數(shù)字資源標(biāo)識裝置功能模塊圖
[0012]圖3是數(shù)字資源標(biāo)識裝置訪問接口圖
【具體實(shí)施方式】
[0013]下面結(jié)合附圖對本發(fā)明的實(shí)施方式進(jìn)行詳細(xì)描述。
[0014]本發(fā)明的第一個(gè)目的是提出一種基于XML的數(shù)字資源標(biāo)識方法,XMLD0I。本方法通過采用XML語言描述將數(shù)字資源編碼結(jié)構(gòu)化,每部分編碼對應(yīng)一個(gè)XML描述項(xiàng),能夠被計(jì)算機(jī)理解,知道這段編碼代表什么含義。這樣出版機(jī)構(gòu)先要提交符合統(tǒng)一標(biāo)準(zhǔn)的XML編碼定義文件,再按定義格式注冊數(shù)字資源編碼,使用時(shí),系統(tǒng)先讀取XML編碼定義文件,再解析數(shù)字資源標(biāo)識編碼。
[0015]圖1是本方法中數(shù)字資源標(biāo)識XML定義文件結(jié)構(gòu)示意圖,如圖1所示,本方法對數(shù)字資源編碼采用分層結(jié)構(gòu)化設(shè)計(jì),將編碼通過分層結(jié)構(gòu)化在多個(gè)編碼項(xiàng)上賦予語義,以利于后續(xù)資源定位和應(yīng)用。XMLDOI編碼采用標(biāo)準(zhǔn)的XML定義文件模式,將編碼分為三部分:唯一標(biāo)識部分IDSegment,外部特征標(biāo)識部分ExtSegment,內(nèi)容特征標(biāo)識部分IntSegment,在每一部分中通過多個(gè)編碼項(xiàng)描述相應(yīng)的編碼內(nèi)容,編碼項(xiàng)有保留編碼項(xiàng)和出版機(jī)構(gòu)自定義編碼項(xiàng)。
[0016]唯一標(biāo)識部分IDSegment的編碼項(xiàng)共同描述了該數(shù)字資源在全球的唯一性,由機(jī)構(gòu)編碼和機(jī)構(gòu)內(nèi)唯一代碼兩個(gè)保留編碼項(xiàng)組成。機(jī)構(gòu)編碼在出版機(jī)構(gòu)通過本裝置注冊時(shí)統(tǒng)一分配,保證機(jī)構(gòu)編碼的唯一性,機(jī)構(gòu)內(nèi)唯一代碼是指出版機(jī)構(gòu)注冊出版內(nèi)容時(shí),在本機(jī)構(gòu)內(nèi)按自定義規(guī)則分配的唯一代碼,這兩部分編碼組合在一起,實(shí)現(xiàn)對出版內(nèi)容的準(zhǔn)確定位。
[0017]外部特征標(biāo)識部分通過多個(gè)保留編碼項(xiàng),定義該資源的各種外部特征,包括:編碼項(xiàng)Language定義該資源使用的語言;編碼項(xiàng)Type定義該資源的出版載體類型;編碼項(xiàng)KScale定義資源的知識粒度,例如刊、文、章、節(jié)、段、定義、圖片;編碼項(xiàng)Author定義資源的作者;編碼項(xiàng)Date定義資源的出版時(shí)間;編碼項(xiàng)CopyrightPub定義資源版權(quán)當(dāng)前的所屬機(jī)構(gòu);編碼項(xiàng)IDFDOI定義資源的DOI編碼,保持與DOI編碼的兼容。除這些保留編碼項(xiàng)以夕卜,出版機(jī)構(gòu)可以根據(jù)需要,設(shè)計(jì)一些自定義編碼項(xiàng)和下級編碼項(xiàng)。
[0018]內(nèi)容特征標(biāo)識部分通過多個(gè)保留編碼項(xiàng),描述該資源的主要內(nèi)容,包括:編碼項(xiàng)Title定義資源的標(biāo)題;編碼項(xiàng)Keywords定義資源的關(guān)鍵詞序列;編碼項(xiàng)Domain定義資源所屬的研究領(lǐng)域。除這些保留編碼項(xiàng)以外,出版機(jī)構(gòu)可以根據(jù)需要,設(shè)計(jì)一些自定義編碼項(xiàng)和下級編碼項(xiàng)。
[0019]本發(fā)明的第二個(gè)目的是提出一種基于XML的數(shù)字資源標(biāo)識裝置20,本裝置功能模塊如圖2所示,包括兩部分:數(shù)字資源標(biāo)識注冊管理子系統(tǒng)21和數(shù)字資源標(biāo)識解析服務(wù)子系統(tǒng)22。標(biāo)識注冊管理子系實(shí)現(xiàn)對出版機(jī)構(gòu)注冊管理和數(shù)字資源標(biāo)識注冊管理,包括出版機(jī)構(gòu)管理模塊216、標(biāo)識分配管理模塊211、數(shù)字資源注冊模塊212、數(shù)字資源檢索模塊213、數(shù)字資源挖掘模塊214、第三方注冊管理模塊215。
[0020]出版機(jī)構(gòu)管理模塊216實(shí)現(xiàn)對出版機(jī)構(gòu)注冊,分配唯一的機(jī)構(gòu)編碼,對出版機(jī)構(gòu)信息進(jìn)行編輯和管理。
[0021]標(biāo)識分配管理模塊211按數(shù)字資源標(biāo)識方法,為成功注冊的出版機(jī)構(gòu)分配資源標(biāo)識碼段,并對分配機(jī)制和分配結(jié)果進(jìn)行合法性檢測和管理。
[0022]數(shù)字資源注冊模塊212接收出版機(jī)構(gòu)對數(shù)字資源的標(biāo)識注冊請求,對資源進(jìn)行重復(fù)性檢測,合格后注冊標(biāo)識碼,返回注冊成功信息。
[0023]數(shù)字資源檢索模塊213為出版機(jī)構(gòu)和作者、讀者提供對已注冊數(shù)字資源的查詢,促進(jìn)數(shù)字資源的直接使用、傳播
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1