亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于HDFS系統(tǒng)的文件合并方法及裝置與流程

文檔序號:12664089閱讀:來源:國知局

技術(shù)特征:

1.一種基于HDFS系統(tǒng)的文件合并方法,其特征在于,包括:

根據(jù)預(yù)設(shè)的生成待合并文件的時(shí)間區(qū)間,以及所述時(shí)間區(qū)間與包括所述待合并文件的待合并集合的映射關(guān)系,確定所述待合并集合;

合并確定的待合并集合中的待合并文件,并將生成的合并后文件存儲(chǔ)至合并后集合中;

將所述映射關(guān)系更新為所述時(shí)間區(qū)間與所述合并后集合的映射關(guān)系。

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,該方法還包括:

若所述待合并文件中小文件的占比不小于預(yù)設(shè)占比門限值,或者所述待合并文件中小文件的數(shù)量不小于預(yù)設(shè)數(shù)量門限值,或者所述映射關(guān)系中的文件集合為所述待合并集合,則對所述待合并文件進(jìn)行合并操作;其中,所述小文件為所占空間小于預(yù)設(shè)門限值的文件,其中,所述預(yù)設(shè)門限值為根據(jù)所述數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)的大小確定的。

3.根據(jù)權(quán)利要求1所述的方法,其特征在于,合并確定的待合并集合中的待合并文件,包括:

根據(jù)Spark集群的計(jì)算核的數(shù)目,確定讀取所述待合并文件的分區(qū)的個(gè)數(shù);

根據(jù)確定的分區(qū)的個(gè)數(shù),對所述待合并文件進(jìn)行讀??;

分別針對每一分區(qū)中的待合并文件執(zhí)行并發(fā)合并操作。

4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述時(shí)間區(qū)間為以小時(shí)為單位劃分得到的。

5.根據(jù)權(quán)利要求1所述的方法,其特征在于,該方法還包括:

檢測所述映射關(guān)系是否為所述時(shí)間區(qū)間與所述合并后集合的映射關(guān)系;若是,則刪除所述待合并文件。

6.一種基于HDFS系統(tǒng)的文件合并裝置,其特征在于,包括:

讀取模塊,用于根據(jù)預(yù)設(shè)的生成待合并文件的時(shí)間區(qū)間,以及所述時(shí)間區(qū)間與包括所述待合并文件的待合并集合的映射關(guān)系,確定所述待合并集合;

合并模塊,用于合并確定的待合并集合中的待合并文件,并將生成的合并后文件存儲(chǔ)至合并后集合中;

更新模塊,用于將所述映射關(guān)系更新為所述時(shí)間區(qū)間與所述合并后集合的映射關(guān)系。

7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述合并模塊還用于:

若所述待合并文件中小文件的占比不小于預(yù)設(shè)占比門限值,或者所述待合并文件中小文件的數(shù)量不小于預(yù)設(shè)數(shù)量門限值,或者所述映射關(guān)系中的文件集合為所述待合并集合,則對所述待合并文件進(jìn)行合并操作;其中,所述小文件為所占空間小于預(yù)設(shè)門限值的文件,其中,所述預(yù)設(shè)門限值為根據(jù)所述數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)的大小確定的。

8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述合并模塊還用于:

確定讀取所述待合并文件的分區(qū)的個(gè)數(shù),其中,所述分區(qū)的個(gè)數(shù)為根據(jù)Spark集群的計(jì)算核的數(shù)目確定的;

根據(jù)確定的分區(qū)的個(gè)數(shù),對所述待合并文件進(jìn)行讀取;

分別針對每一分區(qū)中的待合并文件執(zhí)行并發(fā)合并操作。

9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述時(shí)間區(qū)間為以小時(shí)為單位劃分得到的。

10.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述更新模塊還用于:

檢測所述映射關(guān)系是否為所述時(shí)間區(qū)間與所述合并后集合的映射關(guān)系;若是,則刪除所述待合并文件。

當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1