基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法和系統(tǒng)與流程

文檔序號(hào)：12157979閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法和系統(tǒng)與流程

技術(shù)特征：

1.一種基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，包括：

采集待評(píng)估的數(shù)據(jù)文件；

對(duì)采集的數(shù)據(jù)文件的類型進(jìn)行劃分，并確定每個(gè)類型的數(shù)據(jù)文件在整個(gè)數(shù)據(jù)文件中所占的比例；

利用預(yù)設(shè)的處理方法對(duì)所述數(shù)據(jù)文件的一致性進(jìn)行處理。

2.根據(jù)權(quán)利要求1所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，所述數(shù)據(jù)文件按照類型劃分為非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)。

3.根據(jù)權(quán)利要求2所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，所述預(yù)設(shè)處理方法利用下述公式來對(duì)所述數(shù)據(jù)文件的一致性進(jìn)行處理：

$<mrow> <mi>f</mi> <mo>=</mo> <mfrac> <mn>3</mn> <mn>2</mn> </mfrac> <mrow> <mo>(</mo> <msup> <mi>q</mi> <mn>2</mn> </msup> <mo>+</mo> <msup> <mi>p</mi> <mn>2</mn> </msup> <mo>+</mo> <msup> <mi>h</mi> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mo>-</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> </mrow>$

其中，所述f為數(shù)據(jù)文件的一致性得分，取值范圍為[0，1]；所述q、p和h分別表示非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)在整個(gè)數(shù)據(jù)文件中的比例，其中，q+p+h＝1。

4.根據(jù)權(quán)利要求3所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，所述f值與所述數(shù)據(jù)文件的評(píng)估價(jià)值成正比。

5.根據(jù)權(quán)利要求1所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，所述數(shù)據(jù)文件為包含多個(gè)數(shù)據(jù)文件集合的數(shù)據(jù)包或者為單個(gè)的文檔。

6.根據(jù)權(quán)利要求2所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，所述非結(jié)構(gòu)化數(shù)據(jù)是指沒有固定結(jié)構(gòu)的數(shù)據(jù)，包括辦公文檔、文本、圖片、各類報(bào)表、圖像和音頻、視頻信息。

7.根據(jù)權(quán)利要求2所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，所述半結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)具有隱含結(jié)構(gòu)但又不是以二維表之類的形式存在的數(shù)據(jù)。

8.根據(jù)權(quán)利要求7所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，所述半結(jié)構(gòu)化數(shù)據(jù)包括存儲(chǔ)員工的簡(jiǎn)歷、類似XML、HTML、JSON等文件。

9.根據(jù)權(quán)利要求2所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，所述結(jié)構(gòu)化數(shù)據(jù)是指?jìng)鹘y(tǒng)的關(guān)系數(shù)據(jù)模型、行數(shù)據(jù)，存儲(chǔ)于數(shù)據(jù)庫，可用二維表結(jié)構(gòu)表示的數(shù)據(jù)。

10.根據(jù)權(quán)利要求9所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，所述結(jié)構(gòu)化數(shù)據(jù)包括存儲(chǔ)于csv，excel的數(shù)據(jù)和二維表。

11.根據(jù)權(quán)利要求1至10任一項(xiàng)所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，通過R語言和手動(dòng)操作來確定每個(gè)類型的數(shù)據(jù)文件在整個(gè)數(shù)據(jù)文件中所占的比例。

12.根據(jù)權(quán)利要求1至10任一項(xiàng)所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法，其特征在于，通過網(wǎng)絡(luò)爬蟲來從網(wǎng)絡(luò)中采集所述數(shù)據(jù)文件。

13.一種基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，包括：

數(shù)據(jù)采集模塊，采集待評(píng)估的數(shù)據(jù)文件；

類型劃分模塊，對(duì)采集的數(shù)據(jù)文件的類型進(jìn)行劃分，并確定每個(gè)類型的數(shù)據(jù)文件在整個(gè)數(shù)據(jù)文件中所占的比例；

一致性處理模塊，利用預(yù)設(shè)的處理方法對(duì)所述數(shù)據(jù)文件的一致性進(jìn)行處理。

14.根據(jù)權(quán)利要求13所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，所述類型劃分模塊按照類型將所述數(shù)據(jù)文件劃分為非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)。

15.根據(jù)權(quán)利要求14所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，所述一致性處理模塊通過利用下述公式來對(duì)所述數(shù)據(jù)文件的一致性進(jìn)行處理：

16.根據(jù)權(quán)利要求15所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，所述f值與所述數(shù)據(jù)文件的評(píng)估價(jià)值成正比。

17.根據(jù)權(quán)利要求13所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，所述數(shù)據(jù)文件為包含多個(gè)數(shù)據(jù)文件集合的數(shù)據(jù)包或者為單個(gè)的文檔。

18.根據(jù)權(quán)利要求14所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，所述非結(jié)構(gòu)化數(shù)據(jù)是指沒有固定結(jié)構(gòu)的數(shù)據(jù)，包括辦公文檔、文本、圖片、各類報(bào)表、圖像和音頻、視頻信息。

19.根據(jù)權(quán)利要求14所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，所述半結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)具有隱含結(jié)構(gòu)但又不是以二維表之類的形式存在的數(shù)據(jù)。

20.根據(jù)權(quán)利要求19所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，所述半結(jié)構(gòu)化數(shù)據(jù)包括存儲(chǔ)員工的簡(jiǎn)歷、類似XML、HTML、JSON等文件。

21.根據(jù)權(quán)利要求14所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，所述結(jié)構(gòu)化數(shù)據(jù)是指?jìng)鹘y(tǒng)的關(guān)系數(shù)據(jù)模型、行數(shù)據(jù)，存儲(chǔ)于數(shù)據(jù)庫，可用二維表結(jié)構(gòu)表示的數(shù)據(jù)。

22.根據(jù)權(quán)利要求21所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，所述結(jié)構(gòu)化數(shù)據(jù)包括存儲(chǔ)于csv，excel的數(shù)據(jù)和二維表。

23.根據(jù)權(quán)利要求13至22任一項(xiàng)所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，所述類型劃分模塊通過R語言和手動(dòng)操作來確定每個(gè)類型的數(shù)據(jù)文件在整個(gè)數(shù)據(jù)文件中所占的比例。

24.根據(jù)權(quán)利要求13至22任一項(xiàng)所述的基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估系統(tǒng)，其特征在于，所述數(shù)據(jù)采集模塊通過網(wǎng)絡(luò)爬蟲來從網(wǎng)絡(luò)中采集所述數(shù)據(jù)文件。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

文件系統(tǒng)一致性相關(guān)技術(shù)

分布式系統(tǒng)數(shù)據(jù)一致性相關(guān)技術(shù)

產(chǎn)品一致性控制文件相關(guān)技術(shù)

數(shù)據(jù)庫一致性相關(guān)技術(shù)

數(shù)據(jù)一致性解決方案相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于一致性的數(shù)據(jù)文件價(jià)值評(píng)估方法和系統(tǒng)與流程