本發(fā)明涉及文獻(xiàn)信息處理和圖譜分析的相關(guān)技術(shù)領(lǐng)域,具體涉及一種基于圖譜分析制作學(xué)科信息動(dòng)態(tài)框架的方法。
背景技術(shù):
學(xué)科信息動(dòng)態(tài)分析,就是按照科學(xué)發(fā)展與創(chuàng)新,對文獻(xiàn)信息的需求規(guī)律,利用綜合性或核心合集的數(shù)字文獻(xiàn)資源,將所在學(xué)科最新的各類文獻(xiàn)信息(包括:期刊、專利、會(huì)議等類型文獻(xiàn))進(jìn)行檢索、分析、梳理、整合,成為本學(xué)科的研究新動(dòng)態(tài)和前沿信息,用來指導(dǎo)和支撐研究的理論基礎(chǔ)和搭建研究框架。
網(wǎng)絡(luò)時(shí)代信息浩如煙海,作為一名學(xué)者,如何快速準(zhǔn)確的了解學(xué)科研究現(xiàn)狀,如何能夠做出開題報(bào)告;作為一名學(xué)科教研者,如何快速準(zhǔn)確的了解學(xué)科研究的最新進(jìn)展,如何獲取本學(xué)科的核心層研究論文,如何在撰寫項(xiàng)目申請書時(shí)寫出課題的獨(dú)特性和新穎性;要做好上述工作,前提是需要對當(dāng)前學(xué)科信息動(dòng)態(tài)分析的最新信息進(jìn)行細(xì)分和準(zhǔn)確的研究。
學(xué)科信息動(dòng)態(tài)分析的最新信息,揭示了學(xué)科研究的最新主題和發(fā)展趨勢,為所在學(xué)科的教學(xué)與科研提供有效信息資源,為學(xué)者降低由于“信息迷航”和“認(rèn)知過載”造成的困擾,提供主動(dòng)思維的線索,特別有助于論文選題、科研立項(xiàng)、學(xué)科教研等基礎(chǔ)工作。利用更加科學(xué)的分析方法,有利于在細(xì)分和準(zhǔn)確的研究當(dāng)前學(xué)科信息動(dòng)態(tài)分析的最新信息過程中,提高效率節(jié)省時(shí)間,便于確定研究方向,提升資料分析的針對性和準(zhǔn)確性。
技術(shù)實(shí)現(xiàn)要素:
針對上述的問題,本發(fā)明提出了一種基于圖譜分析制作學(xué)科信息動(dòng)態(tài)框架的方法,主要利用圖譜分析工具,對檢索命中的相關(guān)研究文獻(xiàn)進(jìn)行可視化分析,從而揭示了研究文獻(xiàn)的外表特征和內(nèi)容特征。其中,外表特征包括:時(shí)域、區(qū)域分布;發(fā)文數(shù)量和被引頻次排前的作者和機(jī)構(gòu);被引高頻次文獻(xiàn)分布;核心期刊分布。內(nèi)容特征主要是導(dǎo)出了研究文獻(xiàn)的聚類圖和聚類表,形成學(xué)科信息動(dòng)態(tài)分析的具體內(nèi)容。
本發(fā)明采用的技術(shù)方案是,一種基于圖譜分析制作學(xué)科信息動(dòng)態(tài)框架的方法,其特征在于,其方法步驟如下:
步驟一、選擇數(shù)據(jù)源,命中相關(guān)文獻(xiàn):選擇文獻(xiàn)來源的數(shù)據(jù)庫資源,根據(jù)研究主題,選擇綜合性或引文數(shù)據(jù)庫(核心合集庫)。國內(nèi)的數(shù)據(jù)庫,主要有中國知網(wǎng)(CNKI)、中文社會(huì)科學(xué)引文索引(CSSCI)等;國外的數(shù)據(jù)庫主要有Web of Science平臺(tái)上的核心合集數(shù)據(jù)庫SCI、SSCI等。制定檢索策略,篩選命中相關(guān)文獻(xiàn);確定檢索詞,建立檢索式,調(diào)整檢索策略,篩選命中的相關(guān)文獻(xiàn)。
步驟二、數(shù)據(jù)采集與數(shù)據(jù)導(dǎo)入準(zhǔn)備:在綜合數(shù)據(jù)庫中,導(dǎo)出篩選后的相關(guān)文獻(xiàn)的題錄格式,保存為txt純文本格式,再進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換;在引文數(shù)據(jù)庫中,導(dǎo)出篩選后的相關(guān)文獻(xiàn)的“全記錄與引用參考文獻(xiàn)”,保存為txt純文本格式。
步驟三、數(shù)據(jù)導(dǎo)入,形成可視化圖表:將步驟二獲得的數(shù)據(jù)導(dǎo)入CiteSpace軟件,設(shè)置研究的時(shí)間尺度為若干年,時(shí)間區(qū)間設(shè)置為1年,再根據(jù)分析需要分別選擇其中的分析項(xiàng)目、數(shù)據(jù)抽取對象和路徑,具體如下:
將數(shù)據(jù)導(dǎo)入CiteSpace中,根據(jù)需要設(shè)置時(shí)間尺度,選擇主題詞來源(Term Source),網(wǎng)絡(luò)節(jié)點(diǎn) (Node Types) 選擇作者(Author)、國家(Country)或機(jī)構(gòu)(Institution),設(shè)置數(shù)據(jù)抽取對象閾值,選擇算法,運(yùn)行軟件后,形成作者、國家-地區(qū)、機(jī)構(gòu)的合作網(wǎng)絡(luò)圖與被引頻次和中心度表。
將數(shù)據(jù)導(dǎo)入CiteSpace中,根據(jù)需要設(shè)置時(shí)間尺度,選擇主題詞來源(Term Source),網(wǎng)絡(luò)節(jié)點(diǎn) (Node Types)選擇被引作者(Cited Author)、被引期刊(Cited Journal),設(shè)置數(shù)據(jù)抽取對象閾值,選擇算法,運(yùn)行軟件后,分別形成作者或期刊的共被引分析圖、被引頻次和中心度表。
將數(shù)據(jù)導(dǎo)入CiteSpace中,根據(jù)需要設(shè)置時(shí)間尺度,選擇主題詞來源(Term Source)、主題詞類型(Term Type),網(wǎng)絡(luò)節(jié)點(diǎn) (Node Types)選擇主題(Term)或關(guān)鍵詞(Keyword),設(shè)置數(shù)據(jù)抽取對象閾值,選擇算法,運(yùn)行軟件后,分別形成主題或關(guān)鍵詞的共現(xiàn)分析圖、被引頻次和中心度表。再選擇引用突現(xiàn)歷史(citation burst history),形成關(guān)鍵詞突現(xiàn)圖。
將數(shù)據(jù)導(dǎo)入CiteSpace中,根據(jù)需要設(shè)置時(shí)間尺度,選擇分析源(Term Source),主題詞類型(Term Type),網(wǎng)絡(luò)節(jié)點(diǎn) (Node Types)選擇被引文獻(xiàn)(Cited Reference),設(shè)置數(shù)據(jù)抽取對象閾值,選擇算法,運(yùn)行軟件后,形成文獻(xiàn)共被引分析圖、研究熱點(diǎn)變遷的圖、被引文獻(xiàn)的被引頻次和中心度表。選擇引用突現(xiàn)歷史(citation burst history),形成被引文獻(xiàn)突現(xiàn)圖。在這基礎(chǔ)上選擇聚類和聚類標(biāo)簽,形成研究熱點(diǎn)聚類圖和高頻詞表。
步驟四、學(xué)科信息動(dòng)態(tài)分析制作:基于步驟三得到的圖譜和表格進(jìn)一步分析,分成外部特征分析和內(nèi)部特征分析,展現(xiàn)學(xué)科領(lǐng)域的熱點(diǎn)與發(fā)展趨勢及研究內(nèi)容。其中外部特征的分析,包括時(shí)域分布和地域分布、發(fā)文數(shù)量和被引頻次排前的作者分布、被引高頻次文獻(xiàn)分布、核心期刊分布,清晰地顯示了研究熱點(diǎn)和研究領(lǐng)域,有助于關(guān)注該學(xué)科熱點(diǎn)研究持續(xù)的可行性;內(nèi)部特征主要包括聚類圖表中的被引高頻次文獻(xiàn)和高頻詞的描述,有助于學(xué)者深入了解該學(xué)科的研究熱點(diǎn),開拓研究高峰分化期凸顯詞的可研空間。將有效的聚類號(hào)所對應(yīng)的高頻詞綜合分析,形成研究熱點(diǎn)分析,將其代表作對應(yīng)的相關(guān)論點(diǎn)和論述進(jìn)行梳理整合,形成學(xué)科信息動(dòng)態(tài)分析的具體內(nèi)容。不同的學(xué)者可以綜合相關(guān)主題的聚類代表作所研究的熱點(diǎn)與論述,得出相關(guān)研究結(jié)論與啟示。
本發(fā)明的有益效果是:利用本發(fā)明的方法所構(gòu)成的學(xué)科信息動(dòng)態(tài),具有鮮明的系統(tǒng)性、時(shí)效性、準(zhǔn)確性等特點(diǎn),有效地解決了以下由于沒有框架規(guī)范的學(xué)科信息動(dòng)態(tài)分析制作所存在的問題:(1)由于文獻(xiàn)來源選擇的不妥,而直接影響學(xué)科信息動(dòng)態(tài)分析的文獻(xiàn)保障;(2)由于缺乏可視化工具導(dǎo)出的客觀數(shù)據(jù),而造成學(xué)科研究的偏向和信息動(dòng)態(tài)的不清;(3)由于沒有采用圖譜的數(shù)據(jù)處理,形成對文獻(xiàn)代表作歸類的隨意性,而直接影響學(xué)科信息動(dòng)態(tài)分析的質(zhì)量。利用圖譜工具構(gòu)建的信息動(dòng)態(tài)分析方法,使得學(xué)科信息動(dòng)態(tài)分析內(nèi)容更全面、主題更清晰、思路更快捷。
具體實(shí)施方式
下面結(jié)合具體的實(shí)施例對本發(fā)明所述的一種基于圖譜分析制作學(xué)科信息動(dòng)態(tài)框架的方法做進(jìn)一步說明,但是本發(fā)明的保護(hù)范圍并不限于此。
一種基于圖譜分析制作學(xué)科信息動(dòng)態(tài)框架的方法,其方法步驟如下:
步驟一、選擇數(shù)據(jù)源,命中相關(guān)文獻(xiàn)
1.1選擇文獻(xiàn)來源的數(shù)據(jù)庫資源
根據(jù)研究主題,選擇綜合性或引文數(shù)據(jù)庫(核心合集庫)。例如國內(nèi)的數(shù)據(jù)庫,主要有中國知網(wǎng)(CNKI)、中文社會(huì)科學(xué)引文索引(CSSCI)等;國外的數(shù)據(jù)庫主要有Web of Science平臺(tái)上的核心合集數(shù)據(jù)庫SCI、SSCI等。
1.2制定檢索策略,篩選命中相關(guān)文獻(xiàn);確定檢索詞,建立檢索式,調(diào)整檢索策略,篩選命中的相關(guān)文獻(xiàn)。
步驟二、數(shù)據(jù)采集與數(shù)據(jù)導(dǎo)入準(zhǔn)備
在綜合數(shù)據(jù)庫中,導(dǎo)出篩選后的相關(guān)文獻(xiàn)的題錄格式,保存為txt純文本格式,再進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換。
在引文數(shù)據(jù)庫中,導(dǎo)出篩選后的相關(guān)文獻(xiàn)的“全記錄與引用參考文獻(xiàn)”,保存為txt純文本格式。
步驟三、數(shù)據(jù)導(dǎo)入,形成可視化圖表
數(shù)據(jù)導(dǎo)入CiteSpace,將研究的時(shí)間尺度設(shè)置為若干年,時(shí)間區(qū)間設(shè)置為1年,再根據(jù)分析需要分別選擇其中的分析項(xiàng)目、數(shù)據(jù)抽取對象和路徑。
3.1外部特征
3.1.1作者、國家和機(jī)構(gòu)的合作網(wǎng)絡(luò)圖表
將數(shù)據(jù)導(dǎo)入CiteSpace中,根據(jù)需要設(shè)置時(shí)間尺度,選擇主題詞來源(Term Source),網(wǎng)絡(luò)節(jié)點(diǎn) (Node Types) 選擇作者(Author)、國家(Country)或機(jī)構(gòu)(Institution),設(shè)置數(shù)據(jù)抽取對象閾值,選擇算法,運(yùn)行軟件后,形成作者、國家-地區(qū)、機(jī)構(gòu)的合作網(wǎng)絡(luò)圖與被引頻次和中心度表。
3.1.2作者與期刊的共被引圖表
將數(shù)據(jù)導(dǎo)入CiteSpace中,根據(jù)需要設(shè)置時(shí)間尺度,選擇主題詞來源(Term Source),網(wǎng)絡(luò)節(jié)點(diǎn) (Node Types)選擇被引作者(Cited Author)、被引期刊(Cited Journal),設(shè)置數(shù)據(jù)抽取對象閾值,選擇算法,運(yùn)行軟件后,分別形成作者或期刊的共被引分析圖、被引頻次和中心度表。
3.2內(nèi)部特征
3.2.1主題、關(guān)鍵詞圖表
將數(shù)據(jù)導(dǎo)入CiteSpace中,根據(jù)需要設(shè)置時(shí)間尺度,選擇主題詞來源(Term Source)、主題詞類型(Term Type),網(wǎng)絡(luò)節(jié)點(diǎn) (Node Types)選擇主題(Term)或關(guān)鍵詞(Keyword),設(shè)置數(shù)據(jù)抽取對象閾值,選擇算法,運(yùn)行軟件后,分別形成主題或關(guān)鍵詞的共現(xiàn)分析圖、被引頻次和中心度表。再選擇引用突現(xiàn)歷史(citation burst history),形成關(guān)鍵詞突現(xiàn)圖。
3.2.2文獻(xiàn)共被引分析圖、研究主題遷移圖、聚類圖與文獻(xiàn)被引頻次和中心度表
將數(shù)據(jù)導(dǎo)入CiteSpace中,根據(jù)需要設(shè)置時(shí)間尺度,選擇分析源(Term Source),主題詞類型(Term Type),網(wǎng)絡(luò)節(jié)點(diǎn) (Node Types)選擇被引文獻(xiàn)(Cited Reference),設(shè)置數(shù)據(jù)抽取對象閾值,選擇算法,運(yùn)行軟件后,形成文獻(xiàn)共被引分析圖、研究熱點(diǎn)變遷的圖、被引文獻(xiàn)的被引頻次和中心度表。選擇引用突現(xiàn)歷史(citation burst history),形成被引文獻(xiàn)突現(xiàn)圖。在這基礎(chǔ)上選擇聚類和聚類標(biāo)簽,形成研究熱點(diǎn)聚類圖和高頻詞表。
步驟四、學(xué)科信息動(dòng)態(tài)分析制作:基于對圖譜和表格的分析,展現(xiàn)學(xué)科領(lǐng)域的熱點(diǎn)與發(fā)展趨勢及研究內(nèi)容。其中外部特征的分析,包括時(shí)域分布和地域分布、發(fā)文數(shù)量和被引頻次排前的作者分布、被引高頻次文獻(xiàn)分布、核心期刊分布,清晰地顯示了研究熱點(diǎn)和研究領(lǐng)域,有助于關(guān)注該學(xué)科熱點(diǎn)研究持續(xù)的可行性;內(nèi)部特征主要包括聚類圖表中的被引高頻次文獻(xiàn)和高頻詞的描述,有助于學(xué)者深入了解該學(xué)科的研究熱點(diǎn),開拓研究高峰分化期凸顯詞的可研空間。學(xué)科信息動(dòng)態(tài)制作,將有效的聚類號(hào)所對應(yīng)的高頻詞綜合分析,形成研究熱點(diǎn)分析,將其代表作對應(yīng)的相關(guān)論點(diǎn)和論述進(jìn)行梳理整合,形成學(xué)科信息動(dòng)態(tài)分析的具體內(nèi)容。不同的學(xué)者可以綜合相關(guān)主題的聚類代表作所研究的熱點(diǎn)與論述,得出相關(guān)研究結(jié)論與啟示。