本發(fā)明涉及計(jì)算機(jī)評估技術(shù)領(lǐng)域,尤其涉及一種基于大數(shù)據(jù)的文獻(xiàn)參考價(jià)值評估系統(tǒng)和方法。
背景技術(shù):
隨著科學(xué)技術(shù)的發(fā)展,從事科學(xué)研究的人員數(shù)量越來越多,研究成果通過以論文、書刊、文章等形式進(jìn)行呈現(xiàn),由于互聯(lián)網(wǎng)的便利,在互聯(lián)網(wǎng)上這些研究人員產(chǎn)生了數(shù)以億計(jì)的研究數(shù)據(jù),這些數(shù)據(jù)統(tǒng)稱為大數(shù)據(jù)。當(dāng)人們在使用這些大數(shù)據(jù)時(shí),往往會淹沒在這些數(shù)據(jù)海洋中,往往花費(fèi)很長的時(shí)間仍然難以找到自己需要的參考文獻(xiàn),第一,是由于這些文獻(xiàn)的數(shù)量太龐大;第二,是因?yàn)檫@些文獻(xiàn)沒有一個價(jià)值評價(jià)標(biāo)準(zhǔn);往往人們只能通過標(biāo)題對文獻(xiàn)內(nèi)容有一定的了解,在花費(fèi)大量時(shí)間閱讀后發(fā)現(xiàn)文獻(xiàn)并沒有什么參考價(jià)值,這給閱讀者帶來很不好的體驗(yàn),而往往閱讀文獻(xiàn)的時(shí)間遠(yuǎn)遠(yuǎn)大于檢索文獻(xiàn)的時(shí)間。
技術(shù)實(shí)現(xiàn)要素:
基于背景技術(shù)存在的技術(shù)問題,本發(fā)明提出了一種基于大數(shù)據(jù)的文獻(xiàn)參考價(jià)值評估系統(tǒng)和方法;
本發(fā)明提出的一種基于大數(shù)據(jù)的文獻(xiàn)參考價(jià)值評估系統(tǒng),包括:
大數(shù)據(jù)獲取模塊,用于獲取目標(biāo)文獻(xiàn)本體信息和目標(biāo)文獻(xiàn)被操作次數(shù);
大數(shù)據(jù)內(nèi)部分析模塊,用于根據(jù)目標(biāo)文獻(xiàn)本體信息計(jì)算目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1;
大數(shù)據(jù)外部分析模塊,用于根據(jù)目標(biāo)文獻(xiàn)被操作次數(shù)計(jì)算目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2;
大數(shù)據(jù)加權(quán)分析模塊,用于根據(jù)預(yù)設(shè)權(quán)值對目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1和目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2進(jìn)行加權(quán)求和計(jì)算,得到目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)z=ω1z1+ω2z2,ω1+ω2=1;
大數(shù)據(jù)展示模塊,用于可視化展示目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1、目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2和目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)z。
優(yōu)選地,所述大數(shù)據(jù)獲取模塊,具體用于:獲取目標(biāo)文獻(xiàn)本體信息,所述目標(biāo)文獻(xiàn)本體信息包括:作者信息、研究領(lǐng)域、新穎度,所述新穎度表示所述目標(biāo)文獻(xiàn)與大數(shù)據(jù)網(wǎng)絡(luò)中其他文章的相似度;
優(yōu)選地,所述作者信息,包括:姓名、職業(yè)、職稱、畢業(yè)院校、學(xué)歷、發(fā)表論文數(shù)量、獲獎信息中一種或多種。
優(yōu)選地,所述大數(shù)據(jù)獲取模塊,具體用于:獲取目標(biāo)文獻(xiàn)被操作信息,所述目標(biāo)文獻(xiàn)被操作次數(shù)包括:文獻(xiàn)被閱讀次數(shù)、文獻(xiàn)被引用次數(shù)、文獻(xiàn)被發(fā)表次數(shù)中一者或多者。
優(yōu)選地,所述大數(shù)據(jù)內(nèi)部分析模塊,具體用于:目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1=al+bm+cn,a+b+c=1,其中,l表示作者信息分值,m表示研究領(lǐng)域分值,n表示新穎度分值,a、b、c表示比例系數(shù)。
優(yōu)選地,所述大數(shù)據(jù)外部分析模塊,具體用于:目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2=ir+js+kt,i+j+k=1,r表示文獻(xiàn)被閱讀次數(shù)、s文獻(xiàn)被引用次數(shù)、t文獻(xiàn)被發(fā)表次數(shù),i、j、k表示比例系數(shù)。
一種基于大數(shù)據(jù)的文獻(xiàn)參考價(jià)值評估方法,包括:
s1、獲取目標(biāo)文獻(xiàn)本體信息和目標(biāo)文獻(xiàn)被操作次數(shù);
s2、根據(jù)目標(biāo)文獻(xiàn)本體信息計(jì)算目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1;
s3、根據(jù)目標(biāo)文獻(xiàn)被操作次數(shù)計(jì)算目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2;
s4、根據(jù)預(yù)設(shè)權(quán)值對目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1和目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2進(jìn)行加權(quán)求和計(jì)算,得到目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)z=ω1z1+ω2z2,ω1+ω2=1;
s5、可視化展示目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1、目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2和目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)z。
優(yōu)選地,步驟s1中,所述目標(biāo)文獻(xiàn)本體信息,具體包括:作者信息、研究領(lǐng)域、新穎度,所述新穎度表示所述目標(biāo)文獻(xiàn)與大數(shù)據(jù)網(wǎng)絡(luò)中其他文章的相似度;
優(yōu)選地,所述作者信息,包括:姓名、職業(yè)、職稱、畢業(yè)院校、學(xué)歷、發(fā)表論文數(shù)量、獲獎信息中一種或多種。
優(yōu)選地,步驟s1中,所述目標(biāo)文獻(xiàn)被操作次數(shù),具體包括:文獻(xiàn)被閱讀次數(shù)、文獻(xiàn)被引用次數(shù)、文獻(xiàn)被發(fā)表次數(shù)中一者或多者。
優(yōu)選地,步驟s2,具體包括:目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1=al+bm+cn,a+b+c=1,其中,l表示作者信息分值,m表示研究領(lǐng)域分值,n表示新穎度分值,a、b、c表示比例系數(shù)。
優(yōu)選地,步驟s3,具體包括:目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2=ir+js+kt,i+j+k=1,r表示文獻(xiàn)被閱讀次數(shù)、s文獻(xiàn)被引用次數(shù)、t文獻(xiàn)被發(fā)表次數(shù),i、j、k表示比例系數(shù)。
本發(fā)明通過獲取目標(biāo)文獻(xiàn)本體信息和目標(biāo)文獻(xiàn)被操作次數(shù),根據(jù)目標(biāo)文獻(xiàn)本體信息按照預(yù)設(shè)比例計(jì)算目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù),根據(jù)目標(biāo)文獻(xiàn)被操作次數(shù)和目標(biāo)文獻(xiàn)被操作次數(shù)按照預(yù)設(shè)比例計(jì)算目標(biāo)文獻(xiàn)的外部分?jǐn)?shù),再根據(jù)預(yù)設(shè)權(quán)值對目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)和目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)進(jìn)行加權(quán)求和計(jì)算,得到目標(biāo)文獻(xiàn)可參考分?jǐn)?shù),然后將這些內(nèi)部分?jǐn)?shù)、外部分?jǐn)?shù)、目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)向閱讀者展示,如此,從文獻(xiàn)本體內(nèi)容、其他閱讀者對文獻(xiàn)的操作、結(jié)合文獻(xiàn)本體內(nèi)容和其他閱讀者對文獻(xiàn)的操作三個方面對文獻(xiàn)進(jìn)行評估,在閱讀者打開文獻(xiàn)之前,向閱讀者展示這三個方面的評估分?jǐn)?shù),給閱讀者提供閱讀及引用的參考價(jià)值,方便閱讀者從大數(shù)據(jù)庫中找到自己需要的參考文獻(xiàn),節(jié)省大量時(shí)間,提高檢索和閱讀效率,提升用戶體驗(yàn)。
附圖說明
圖1為本發(fā)明提出的一種基于大數(shù)據(jù)的文獻(xiàn)參考價(jià)值評估系統(tǒng)的模塊示意圖;
圖2為本發(fā)明提出的一種基于大數(shù)據(jù)的文獻(xiàn)參考價(jià)值評估方法的流程示意圖。
具體實(shí)施方式
參照圖1,本發(fā)明提出的一種基于大數(shù)據(jù)的文獻(xiàn)參考價(jià)值評估系統(tǒng),包括:
大數(shù)據(jù)獲取模塊,用于獲取目標(biāo)文獻(xiàn)本體信息和目標(biāo)文獻(xiàn)被操作次數(shù)。
其中,所述目標(biāo)文獻(xiàn)本體信息包括:作者信息、研究領(lǐng)域、新穎度,所述新穎度表示所述目標(biāo)文獻(xiàn)與大數(shù)據(jù)網(wǎng)絡(luò)中其他文章的相似度,所述作者信息,包括:姓名、職業(yè)、職稱、畢業(yè)院校、學(xué)歷、發(fā)表論文數(shù)量、獲獎信息中一種或多種。
其中,所述目標(biāo)文獻(xiàn)被操作次數(shù)包括:文獻(xiàn)被閱讀次數(shù)、文獻(xiàn)被引用次數(shù)、文獻(xiàn)被發(fā)表次數(shù)中一者或多者。
在具體方案中,通過網(wǎng)絡(luò)爬蟲獲取文獻(xiàn)本體信息和目標(biāo)文獻(xiàn)被操作次數(shù),目標(biāo)文獻(xiàn)本體信息包括文獻(xiàn)作者的姓名、職業(yè)、職稱、畢業(yè)院校、學(xué)歷、發(fā)表論文數(shù)量和獲獎信息,文獻(xiàn)研究領(lǐng)域和研究方向以及文獻(xiàn)的新穎度,目標(biāo)文獻(xiàn)被操作次數(shù)包括其他閱讀者對文獻(xiàn)被閱讀次數(shù)、其他閱讀者引用文獻(xiàn)的次數(shù)、文獻(xiàn)被發(fā)表次數(shù)。
大數(shù)據(jù)內(nèi)部分析模塊,與大數(shù)據(jù)獲取模塊連接,用于根據(jù)目標(biāo)文獻(xiàn)本體信息計(jì)算目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1,目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1=al+bm+cn,a+b+c=1,其中,l表示作者信息分值,m表示研究領(lǐng)域分值,n表示新穎度分值,a、b、c表示比例系數(shù)。
在具體方案中,文獻(xiàn)作者的學(xué)術(shù)成就和出版物數(shù)量體現(xiàn)出一篇文獻(xiàn)的影響力,文獻(xiàn)作者的影響力越大,該作者的文獻(xiàn)影響力越大,文獻(xiàn)的選題、確定研究領(lǐng)域和研究方向,是研究的開始,直接影響研究文獻(xiàn)的價(jià)值,由于每一篇文獻(xiàn)都是在前人研究成果基礎(chǔ)上的,所以文獻(xiàn)的新穎度(獨(dú)創(chuàng)性),文獻(xiàn)在觀點(diǎn)上或在方法上,是否有所突破是否有所創(chuàng)造是文獻(xiàn)優(yōu)劣的生命線。
大數(shù)據(jù)外部分析模塊,與大數(shù)據(jù)獲取模塊連接,用于根據(jù)目標(biāo)文獻(xiàn)被操作次數(shù)計(jì)算目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2,目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2=ir+js+kt,i+j+k=1,r表示文獻(xiàn)被閱讀次數(shù)、s文獻(xiàn)被引用次數(shù)、t文獻(xiàn)被發(fā)表次數(shù),i、j、k表示比例系數(shù);
在具體方案中,文獻(xiàn)被閱讀次數(shù)、文獻(xiàn)被引用次數(shù)、文獻(xiàn)被發(fā)表次數(shù)從閱讀者和使用者角度體現(xiàn)出一篇文獻(xiàn)的價(jià)值,文獻(xiàn)被閱讀次數(shù)、文獻(xiàn)被引用次數(shù)和文獻(xiàn)被發(fā)表次數(shù)越多,說明所述文獻(xiàn)的影響力越大,從而體現(xiàn)出文獻(xiàn)的價(jià)值。
大數(shù)據(jù)加權(quán)分析模塊,分別與大數(shù)據(jù)內(nèi)部分析模塊和大數(shù)據(jù)外部分析模塊連接,用于根據(jù)預(yù)設(shè)權(quán)值對目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1和目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2進(jìn)行加權(quán)求和計(jì)算,得到目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)z=ω1z1+ω2z2,ω1+ω2=1;
在具體方案中,綜合目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)、目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)和預(yù)設(shè)權(quán)值對目標(biāo)文獻(xiàn)進(jìn)行加權(quán)求和計(jì)算,從內(nèi)部分?jǐn)?shù)和外部分?jǐn)?shù)的重要性出發(fā),進(jìn)行加權(quán)求和計(jì)算,得到目標(biāo)文獻(xiàn)可參考分?jǐn)?shù),給閱讀者和使用者一個參考。
大數(shù)據(jù)展示模塊,分別與大數(shù)據(jù)內(nèi)部分析模塊、大數(shù)據(jù)外部分析模塊連接和大數(shù)據(jù)加權(quán)分析模塊連接,用于可視化展示目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1、目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2和目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)z。
在具體方案中,通過柱狀圖、雷達(dá)圖、曲線圖、曲線圖展示目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1、目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2和目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)z。
參照圖2,本發(fā)明提出的一種基于大數(shù)據(jù)的文獻(xiàn)參考價(jià)值評估方法,包括:
步驟s1,獲取目標(biāo)文獻(xiàn)本體信息和目標(biāo)文獻(xiàn)被操作次數(shù);
本步驟中,所述目標(biāo)文獻(xiàn)本體信息,具體包括:作者信息、研究領(lǐng)域、新穎度,所述新穎度表示所述目標(biāo)文獻(xiàn)與大數(shù)據(jù)網(wǎng)絡(luò)中其他文章的相似度;其中,所述作者信息,包括:姓名、職業(yè)、職稱、畢業(yè)院校、學(xué)歷、發(fā)表論文數(shù)量、獲獎信息中一種或多種。
本步驟中,所述目標(biāo)文獻(xiàn)被操作次數(shù),具體包括:文獻(xiàn)被閱讀次數(shù)、文獻(xiàn)被引用次數(shù)、文獻(xiàn)被發(fā)表次數(shù)中一者或多者。
在具體方案中,通過網(wǎng)絡(luò)爬蟲獲取文獻(xiàn)本體信息和目標(biāo)文獻(xiàn)被操作次數(shù),目標(biāo)文獻(xiàn)本體信息包括文獻(xiàn)作者的姓名、職業(yè)、職稱、畢業(yè)院校、學(xué)歷、發(fā)表論文數(shù)量和獲獎信息,文獻(xiàn)研究領(lǐng)域和研究方向以及文獻(xiàn)的新穎度,目標(biāo)文獻(xiàn)被操作次數(shù)包括其他閱讀者對文獻(xiàn)被閱讀次數(shù)、其他閱讀者引用文獻(xiàn)的次數(shù)、文獻(xiàn)被發(fā)表次數(shù)。
步驟s2,根據(jù)目標(biāo)文獻(xiàn)本體信息計(jì)算目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1,目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1=al+bm+cn,a+b+c=1,其中,l表示作者信息分值,m表示研究領(lǐng)域分值,n表示新穎度分值,a、b、c表示比例系數(shù)。
在具體方案中,文獻(xiàn)作者的學(xué)術(shù)成就和出版物數(shù)量體現(xiàn)出一篇文獻(xiàn)的影響力,文獻(xiàn)作者的影響力越大,該作者的文獻(xiàn)影響力越大,文獻(xiàn)的選題、確定研究領(lǐng)域和研究方向,是研究的開始,直接影響研究文獻(xiàn)的價(jià)值,由于每一篇文獻(xiàn)都是在前人研究成果基礎(chǔ)上的,所以文獻(xiàn)的新穎度(獨(dú)創(chuàng)性),文獻(xiàn)在觀點(diǎn)上或在方法上,是否有所突破是否有所創(chuàng)造是文獻(xiàn)優(yōu)劣的生命線。
步驟s3,根據(jù)目標(biāo)文獻(xiàn)被操作次數(shù)計(jì)算目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2,目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2=ir+js+kt,i+j+k=1,r表示文獻(xiàn)被閱讀次數(shù)、s文獻(xiàn)被引用次數(shù)、t文獻(xiàn)被發(fā)表次數(shù),i、j、k表示比例系數(shù)。
在具體方案中,文獻(xiàn)被閱讀次數(shù)、文獻(xiàn)被引用次數(shù)、文獻(xiàn)被發(fā)表次數(shù)從閱讀者和使用者角度體現(xiàn)出一篇文獻(xiàn)的價(jià)值,文獻(xiàn)被閱讀次數(shù)、文獻(xiàn)被引用次數(shù)和文獻(xiàn)被發(fā)表次數(shù)越多,說明所述文獻(xiàn)的影響力越大,從而體現(xiàn)出文獻(xiàn)的價(jià)值。
步驟s4,根據(jù)預(yù)設(shè)權(quán)值對目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1和目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2進(jìn)行加權(quán)求和計(jì)算,得到目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)z=ω1z1+ω2z2,ω1+ω2=1;
在具體方案中,綜合目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)、目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)和預(yù)設(shè)權(quán)值對目標(biāo)文獻(xiàn)進(jìn)行加權(quán)求和計(jì)算,從內(nèi)部分?jǐn)?shù)和外部分?jǐn)?shù)的重要性出發(fā),進(jìn)行加權(quán)求和計(jì)算,得到目標(biāo)文獻(xiàn)可參考分?jǐn)?shù),給閱讀者和使用者一個參考。
步驟s5,可視化展示目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1、目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2和目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)z。
在具體方案中,通過柱狀圖、雷達(dá)圖、曲線圖、曲線圖展示目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)z1、目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)z2和目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)z
本實(shí)施方式通過獲取目標(biāo)文獻(xiàn)本體信息和目標(biāo)文獻(xiàn)被操作次數(shù),根據(jù)目標(biāo)文獻(xiàn)本體信息按照預(yù)設(shè)比例計(jì)算目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù),根據(jù)目標(biāo)文獻(xiàn)被操作次數(shù)和目標(biāo)文獻(xiàn)被操作次數(shù)按照預(yù)設(shè)比例計(jì)算目標(biāo)文獻(xiàn)的外部分?jǐn)?shù),再根據(jù)預(yù)設(shè)權(quán)值對目標(biāo)文獻(xiàn)的內(nèi)部分?jǐn)?shù)和目標(biāo)文獻(xiàn)的外部分?jǐn)?shù)進(jìn)行加權(quán)求和計(jì)算,得到目標(biāo)文獻(xiàn)可參考分?jǐn)?shù),然后將這些內(nèi)部分?jǐn)?shù)、外部分?jǐn)?shù)、目標(biāo)文獻(xiàn)可參考分?jǐn)?shù)向閱讀者展示,如此,從文獻(xiàn)本體內(nèi)容、其他閱讀者對文獻(xiàn)的操作、結(jié)合文獻(xiàn)本體內(nèi)容和其他閱讀者對文獻(xiàn)的操作三個方面對文獻(xiàn)進(jìn)行評估,在閱讀者打開文獻(xiàn)之前,向閱讀者展示這三個方面的評估分?jǐn)?shù),給閱讀者提供閱讀及引用的參考價(jià)值,方便閱讀者從大數(shù)據(jù)庫中找到自己需要的參考文獻(xiàn),節(jié)省大量時(shí)間,提高檢索和閱讀效率,提升用戶體驗(yàn)。
以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。