文件自動分類方法及系統(tǒng)的制作方法
【專利摘要】一種文件自動分類方法,該方法包括步驟:讀取用戶文件的文件大??;當(dāng)文件大小未超過設(shè)定值時,判定該用戶文件應(yīng)該使用全文件分塊方法進行分塊,傳送至全文件分塊服務(wù)器;當(dāng)文件大小超過設(shè)定值時,讀取該用戶文件的文件頭數(shù)據(jù),從中提取文件類型;根據(jù)提取的文件類型,分析該用戶文件應(yīng)該使用固定長度分塊、可變長度分塊還是滑動塊分塊方法進行分塊,傳送至對應(yīng)的固定長度分塊服務(wù)器、可變長度分塊服務(wù)器或者滑動塊分塊服務(wù)器。本發(fā)明還提供一種文件自動分類系統(tǒng)。本發(fā)明可以自動分析出文件適合的分塊方法。
【專利說明】文件自動分類方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種文件管理方法及系統(tǒng),尤其是涉及一種云存儲中的文件自動分類方法及系統(tǒng)。
【背景技術(shù)】
[0002]在重復(fù)數(shù)據(jù)刪除過程中,文件分塊有四種主流方法,包括全文件分塊、固定長度分塊(FSP )、可變長度分塊(CDC)及滑動塊分塊(SB )。四種分塊方法處理對應(yīng)類型的文件各有優(yōu)勢:全文件分塊適用于較小的電子書、低清晰度個人照片等;固定長度分塊適用于高清晰度照片、電影、音樂等;可變長度分塊適用于光盤鏡像、系統(tǒng)備份等;滑動塊分塊適用于經(jīng)常編輯的WorcUExcel、代碼源文件、視頻剪輯等。四種分塊方法各有優(yōu)缺點,目前沒有任何一種分塊方法能適合所有情況。我們無法得知用戶一定會存儲何種文件,因此不能快速得到最合適的分塊方法。
【發(fā)明內(nèi)容】
[0003]鑒于以上內(nèi)容,有必要提供一種文件自動分類方法,可以自動分析出文件適合的分塊方法。
[0004]鑒于以上內(nèi)容,還有必要提供一種文件自動分類系統(tǒng),可以自動分析出文件適合的分塊方法。
[0005]所述文件自動分類方法包括:第一讀取步驟:當(dāng)分配服務(wù)器接收到用戶存儲的文件之后,讀取該用戶文件的文件大??;第一分析步驟:當(dāng)該用戶文件的文件大小小于或等于設(shè)定值時,判定該用戶文件應(yīng)該使用全文件分塊方法進行分塊,然后執(zhí)行第一傳送步驟;第一傳送步驟:將該用戶文件傳送至全文件分塊服務(wù)器;第二讀取步驟:當(dāng)該用戶文件的文件大小大于設(shè)定值時,讀取該用戶文件的文件頭數(shù)據(jù);提取步驟:從讀取的文件頭數(shù)據(jù)中提取該用戶文件的文件類型;第二分析步驟:根據(jù)提取的文件類型,分析該用戶文件應(yīng)該使用固定長度分塊、可變長度分塊還是滑動塊分塊方法進行分塊;及第二傳送步驟:根據(jù)第二分析步驟的分析結(jié)果將該用戶文件傳送至對應(yīng)的固定長度分塊服務(wù)器、可變長度分塊服務(wù)器或者滑動塊分塊服務(wù)器。
[0006]所述文件自動分類系統(tǒng)包括:讀取模塊,用于當(dāng)分配服務(wù)器接收到用戶存儲的文件之后,讀取該用戶文件的文件大?。环治瞿K,用于當(dāng)該用戶文件的文件大小小于或等于設(shè)定值時,判定該用戶文件應(yīng)該使用全文件分塊方法進行分塊;傳送模塊,用于當(dāng)判定該用戶文件應(yīng)該使用全文件分塊方法進行分塊時,將該用戶文件傳送至全文件分塊服務(wù)器;所述讀取模塊,還用于當(dāng)該用戶文件的文件大小大于設(shè)定值時,讀取該用戶文件的文件頭數(shù)據(jù);提取模塊,用于從讀取的文件頭數(shù)據(jù)中提取該用戶文件的文件類型;所述分析模塊,還用于根據(jù)提取的文件類型,分析該用戶文件應(yīng)該使用固定長度分塊、可變長度分塊還是滑動塊分塊方法進行分塊;及所述傳送模塊,還用于根據(jù)分析模塊的分析結(jié)果將該用戶文件傳送至對應(yīng)的固定長度分塊服務(wù)器、可變長度分塊服務(wù)器或者滑動塊分塊服務(wù)器。[0007]相較于現(xiàn)有技術(shù),所述的文件自動分類方法及系統(tǒng),能夠在進行重復(fù)數(shù)據(jù)刪除之
前,根據(jù)文件大小和文件類型分析出用戶文件適合使用的分塊方法,將用戶文件自動分類,
傳送至相應(yīng)的分塊服務(wù)器中進一步處理,從而達到提高效率以及負(fù)載均衡的作用。
【專利附圖】
【附圖說明】
[0008]圖1是本發(fā)明文件自動分類系統(tǒng)較佳實施例的運行環(huán)境圖。
[0009]圖2是本發(fā)明文件自動分類系統(tǒng)較佳實施例的功能模塊圖。
[0010]圖3是本發(fā)明文件自動分類方法較佳實施例的流程圖。
[0011]圖4A是執(zhí)行文件分塊和重復(fù)數(shù)據(jù)刪除過程之后存儲的文件索引列表較佳實施例
的示意圖。
[0012]圖4B是采用可變長度分塊方法分塊的存儲文件列表較佳實施例的示意圖。
[0013]主要元件符號說明
[0014]
【權(quán)利要求】
1.一種文件自動分類方法,其特征在于,該方法包括: 第一讀取步驟:當(dāng)分配服務(wù)器接收到用戶存儲的文件之后,讀取該用戶文件的文件大小; 第一分析步驟:當(dāng)該用戶文件的文件大小小于或等于設(shè)定值時,判定該用戶文件應(yīng)該使用全文件分塊方法進行分塊,然后執(zhí)行第一傳送步驟; 第一傳送步驟:將該用戶文件傳送至全文件分塊服務(wù)器; 第二讀取步驟:當(dāng)該用戶文件的文件大小大于設(shè)定值時,讀取該用戶文件的文件頭數(shù)據(jù); 提取步驟:從讀取的文件頭數(shù)據(jù)中提取該用戶文件的文件類型; 第二分析步驟:根據(jù)提取的文件類型,分析該用戶文件應(yīng)該使用固定長度分塊、可變長度分塊還是滑動塊分塊方法進行分塊;及 第二傳送步驟:根據(jù)第二分析步驟的分析結(jié)果將該用戶文件傳送至對應(yīng)的固定長度分塊服務(wù)器、可變長度分塊服務(wù)器或者滑動塊分塊服務(wù)器。
2.如權(quán)利要求1所述的文件自動分類方法,其特征在于,在所述第一讀取步驟中,利用fstat O函數(shù)讀取該用戶文件的文件屬性,該文件屬性中包括文件大小。
3.如權(quán)利要求1所述的文件自動分類方法,其特征在于,在所述第二讀取步驟中,利用read O函數(shù)讀取該用戶文件的 前十六位數(shù)據(jù),即為文件頭。
4.如權(quán)利要求1所述的文件自動分類方法,其特征在于,在所述第二分析步驟中: 當(dāng)該用戶文件的文件類型為較大且不經(jīng)常變動的文件時,使用固定長度分塊方法進行分塊; 當(dāng)該用戶文件的文件類型為較大且經(jīng)常少量修改的文件時,使用可變長度分塊方法進行分塊; 當(dāng)該用戶文件的文件類型為經(jīng)常批量修改的文件時,使用滑動塊分塊方法進行分塊。
5.一種文件自動分類系統(tǒng),其特征在于,該系統(tǒng)包括: 讀取模塊,用于當(dāng)分配服務(wù)器接收到用戶存儲的文件之后,讀取該用戶文件的文件大小; 分析模塊,用于當(dāng)該用戶文件的文件大小小于或等于設(shè)定值時,判定該用戶文件應(yīng)該使用全文件分塊方法進行分塊; 傳送模塊,用于當(dāng)判定該用戶文件應(yīng)該使用全文件分塊方法進行分塊時,將該用戶文件傳送至全文件分塊服務(wù)器; 所述讀取模塊,還用于當(dāng)該用戶文件的文件大小大于設(shè)定值時,讀取該用戶文件的文件頭數(shù)據(jù); 提取模塊,用于從讀取的文件頭數(shù)據(jù)中提取該用戶文件的文件類型; 所述分析模塊,還用于根據(jù)提取的文件類型,分析該用戶文件應(yīng)該使用固定長度分塊、可變長度分塊還是滑動塊分塊方法進行分塊;及 所述傳送模塊,還用于根據(jù)分析模塊的分析結(jié)果將該用戶文件傳送至對應(yīng)的固定長度分塊服務(wù)器、可變長度分塊服務(wù)器或者滑動塊分塊服務(wù)器。
6.如權(quán)利要求5所述的文件自動分類系統(tǒng),其特征在于,所述讀取模塊利用fstatO函數(shù)讀取該用戶文件的文件屬性,該文件屬性中包括文件大小。
7.如權(quán)利要求5所述的文件自動分類系統(tǒng),其特征在于,所述讀取模塊利用readO函數(shù)讀取該用戶文件的前十六位數(shù)據(jù),即為文件頭。
8.如權(quán)利要求5所述的文件自動分類系統(tǒng),其特征在于: 當(dāng)該用戶文件的文件類型為較大且不經(jīng)常變動的文件時,使用固定長度分塊方法進行分塊; 當(dāng)該用戶文件的文件類型為較大且經(jīng)常少量修改的文件時,使用可變長度分塊方法進行分塊; 當(dāng)該 用戶文件的文件類型為經(jīng)常批量修改的文件時,使用滑動塊分塊方法進行分塊。
【文檔編號】G06F17/50GK103778268SQ201210410185
【公開日】2014年5月7日 申請日期:2012年10月24日 優(yōu)先權(quán)日:2012年10月24日
【發(fā)明者】柴智權(quán), 李大鵬, 林海洪, 李忠一 申請人:鴻富錦精密工業(yè)(深圳)有限公司, 鴻海精密工業(yè)股份有限公司