一種文件名稱(chēng)識(shí)別及文件清理方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文件名稱(chēng)的識(shí)別技術(shù)領(lǐng)域,特別涉及一種文件名稱(chēng)識(shí)別及文件清理方法及裝置。
【背景技術(shù)】
[0002]隨著智能手機(jī)以及手機(jī)軟件的發(fā)展,手機(jī)中生成的文件夾越來(lái)越多,手機(jī)中存儲(chǔ)的文件也越來(lái)越多,通常情況下,用戶(hù)會(huì)對(duì)手機(jī)進(jìn)行垃圾文件清理以及檢索文件及文件夾等。為了提高垃圾文件的清理效率、文件夾的檢索效率等,通常需要識(shí)別電子設(shè)備中的文件的名稱(chēng)對(duì)應(yīng)的正則表達(dá)式。
[0003]正則表達(dá)式,又稱(chēng)正規(guī)表示法、常規(guī)表示法是計(jì)算機(jī)科學(xué)中的一個(gè)概念。正則表達(dá)式使用單個(gè)字符串來(lái)描述、匹配一系列符合某個(gè)句法規(guī)則的字符串。在實(shí)際應(yīng)用中,用戶(hù)可以根據(jù)給定的一個(gè)正則表達(dá)式和一個(gè)字符串,判斷給定的字符串是否符合給定的正則表達(dá)式的過(guò)濾邏輯;還可以通過(guò)給定的正則表達(dá)式,從給定的字符串中獲得用戶(hù)想要的特定部分。
[0004]目前,主要通過(guò)人工的方式識(shí)別電子設(shè)備中的文件的名稱(chēng)對(duì)應(yīng)的正則表達(dá)式,具體過(guò)程如下:人工的對(duì)電子設(shè)備中的每一文件的名稱(chēng)進(jìn)行判斷,判斷預(yù)設(shè)的正則表達(dá)式模板庫(kù)中是否存在與該文件的名稱(chēng)相匹配的正則表達(dá)式模板;如果是,則人工根據(jù)匹配的正則表達(dá)式模板,識(shí)別該文件的名稱(chēng)對(duì)應(yīng)的正則表達(dá)式。例如,需要確定正則表達(dá)式的文件名稱(chēng)為“3548795”,首先人工的在預(yù)設(shè)的正則表達(dá)式模板庫(kù)中確定與該文件名稱(chēng)相匹配的正則表達(dá)式模板,假設(shè)匹配到的正則表達(dá)式模板為[0-9] {s% },表示字符串的長(zhǎng)度;進(jìn)一步人工識(shí)別文件名稱(chēng)“3548795”對(duì)應(yīng)的正則表達(dá)式為“ [0_9] {7} ”。
[0005]但是,電子設(shè)備中的文件較多,進(jìn)而文件的名稱(chēng)也較多,應(yīng)用上述人工的方式識(shí)別電子設(shè)備中的文件的名稱(chēng),消耗時(shí)間較長(zhǎng),效率較低。
【發(fā)明內(nèi)容】
[0006]本發(fā)明實(shí)施例的目的在于提供一種文件名稱(chēng)識(shí)別方法及裝置,以實(shí)現(xiàn)電子設(shè)備中的文件名稱(chēng)的自動(dòng)識(shí)別。
[0007]本發(fā)明實(shí)施例的另一個(gè)目的在于提供一種文件清理方法及裝置,以實(shí)現(xiàn)電子設(shè)備中的文件名稱(chēng)的自動(dòng)識(shí)別和文件清理。
[0008]為達(dá)到上述目的,本發(fā)明實(shí)施例公開(kāi)了一種文件名稱(chēng)識(shí)別方法,應(yīng)用于電子設(shè)備,包括:
[0009]確定待處理文件集合,所述待處理文件集合中包含至少一個(gè)文件;
[0010]獲得所述待處理文件集合中包含的每一文件的名稱(chēng)對(duì)應(yīng)的字符串;
[0011]針對(duì)所獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,分別執(zhí)行正則表達(dá)式識(shí)別操作,其中,所述正則表達(dá)式識(shí)別操作包括:
[0012]檢測(cè)預(yù)設(shè)的正則表達(dá)式模板庫(kù)中是否存在與該字符串相匹配的正則表達(dá)式模板,所述預(yù)設(shè)的正則表達(dá)式模板庫(kù)中包含至少一個(gè)正則表達(dá)式模板;
[0013]如果存在,將檢測(cè)到的正則表達(dá)式模板,確定為與該字符串對(duì)應(yīng)的文件的名稱(chēng)的正則表達(dá)式模板;
[0014]根據(jù)確定的正則表達(dá)式模板,識(shí)別與該字符串對(duì)應(yīng)的文件的名稱(chēng)的正則表達(dá)式。
[0015]較佳的,所述確定待處理文件集合,包括:
[0016]分別將所述電子設(shè)備中的每一文件夾下的所有文件,確定為待處理文件集合。
[0017]較佳的,所述確定待處理文件集合,包括:
[0018]分別檢測(cè)所述電子設(shè)備中每一文件夾的名稱(chēng)是否符合預(yù)設(shè)的第一字符串匹配規(guī)則;
[0019]分別將檢測(cè)到的符合所述第一字符串匹配規(guī)則的文件夾的名稱(chēng)對(duì)應(yīng)的文件夾下的所有文件,確定為待處理文件集合。
[0020]較佳的,所述確定待處理文件集合,包括:
[0021]分別檢測(cè)所述電子設(shè)備中每一文件夾的名稱(chēng)是否符合預(yù)設(shè)的第二字符串匹配規(guī)則;
[0022]將檢測(cè)到的所有符合所述第二字符串匹配規(guī)則的文件夾的名稱(chēng)對(duì)應(yīng)的文件夾下的所有文件,確定為待處理文件集合。
[0023]較佳的,所述確定待處理文件集合,包括:
[0024]分別判斷所述電子設(shè)備中的每一文件夾下的文件數(shù)量是否大于或等于預(yù)設(shè)的第一閾值;
[0025]如果是,將該文件夾下的所有文件,確定為待處理文件集合。
[0026]較佳的,在所述針對(duì)所獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,分別執(zhí)行正則表達(dá)式識(shí)別操作之前,還包括:
[0027]確定與所述待處理文件集合中的文件的名稱(chēng)對(duì)應(yīng)的字符串匹配的、所述正則表達(dá)式模板庫(kù)中的正則表達(dá)式模板的種類(lèi)N ;
[0028]所述針對(duì)所獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,分別執(zhí)行正則表達(dá)式識(shí)別操作,包括:
[0029]在所述N小于或等于預(yù)設(shè)的第二閾值的情況下,針對(duì)所獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,分別執(zhí)行正則表達(dá)式識(shí)別操作。
[0030]較佳的,在所述N小于或等于預(yù)設(shè)的第二閾值的情況下,針對(duì)所獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,分別執(zhí)行正則表達(dá)式識(shí)別操作之前,還包括:
[0031]檢測(cè)是否存在與所述N類(lèi)正則表達(dá)式模板中的任意一類(lèi)正則表達(dá)式模板匹配的、所述待處理文件集合中包含的文件的名稱(chēng)對(duì)應(yīng)的字符串的數(shù)量大于或等于預(yù)設(shè)的第三閾值;
[0032]所述在所述N小于或等于預(yù)設(shè)的第二閾值的情況下,針對(duì)所獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,分別執(zhí)行正則表達(dá)式識(shí)別操作,包括:
[0033]在所述N小于或等于預(yù)設(shè)的第二閾值、且檢測(cè)到存在與所述N類(lèi)正則表達(dá)式模板中的任意一類(lèi)正則表達(dá)式模板匹配的、所述待處理文件集合中包含的文件的名稱(chēng)對(duì)應(yīng)的字符串的數(shù)量大于或等于預(yù)設(shè)的第三閾值的情況下,針對(duì)所獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,分別執(zhí)行正則表達(dá)式識(shí)別操作;
[0034]所述將檢測(cè)到的正則表達(dá)式模板,確定為與該字符串對(duì)應(yīng)的文件的名稱(chēng)的正則表達(dá)式模板,包括:
[0035]判斷與檢測(cè)到的正則表達(dá)式模板匹配的、所述待處理文件集合中包含的文件的名稱(chēng)對(duì)應(yīng)的字符串的數(shù)量是否大于或等于預(yù)設(shè)的第四閾值;
[0036]如果是,將檢測(cè)到的正則表達(dá)式模板,確定為與該字符串對(duì)應(yīng)的文件的名稱(chēng)的正則表達(dá)式模板。
[0037]較佳的,在所述針對(duì)所獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,分別執(zhí)行正則表達(dá)式識(shí)別操作之前,還包括:
[0038]檢測(cè)是否存在與所述正則表達(dá)式模板庫(kù)中的任意一個(gè)正則表達(dá)式模板匹配的、所述待處理文件集合中包含的文件的名稱(chēng)對(duì)應(yīng)的字符串大于或等于預(yù)設(shè)的第五閾值;
[0039]所述針對(duì)所獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,分別執(zhí)行正則表達(dá)式識(shí)別操作,包括:
[0040]在檢測(cè)到存在與所述正則表達(dá)式模板庫(kù)中的任意一個(gè)正則表達(dá)式模板匹配的、所述待處理文件集合中包含的文件的名稱(chēng)對(duì)應(yīng)的字符串的數(shù)量大于或等于預(yù)設(shè)的第五閾值的情況下,針對(duì)所獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,分別執(zhí)行正則表達(dá)式識(shí)別操作;
[0041]所述將檢測(cè)到的正則表達(dá)式模板,確定為與該字符串對(duì)應(yīng)的文件的名稱(chēng)的正則表達(dá)式模板,包括:
[0042]判斷與檢測(cè)到的正則表達(dá)式模板匹配的、所述待處理文件集合中包含的文件的名稱(chēng)對(duì)應(yīng)的字符串的數(shù)量是否大于或等于預(yù)設(shè)的第六閾值;
[0043]如果是,將檢測(cè)到的正則表達(dá)式模板,確定為與該字符串對(duì)應(yīng)的文件的名稱(chēng)的正則表達(dá)式模板。
[0044]為達(dá)到上述目的,本發(fā)明實(shí)施例公開(kāi)了一種文件清理方法,應(yīng)用于電子設(shè)備,包括:
[0045]確定待處理文件集合,所述待處理文件集合中包含至少一個(gè)文件;
[0046]獲得所述待處理文件集合中包含的每一文件的名稱(chēng)對(duì)應(yīng)的字符串;
[0047]針對(duì)所獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,分別執(zhí)行正則表達(dá)式識(shí)別操作,其中,所述正則表達(dá)式識(shí)別操作包括:
[0048]檢測(cè)預(yù)設(shè)的正則表達(dá)式模板庫(kù)中是否存在與該字符串相匹配的正則表達(dá)式模板,所述預(yù)設(shè)的正則表達(dá)式模板庫(kù)中包含至少一個(gè)正則表達(dá)式模板;
[0049]如果存在,將檢測(cè)到的正則表達(dá)式模板,確定為與該字符串對(duì)應(yīng)的文件的名稱(chēng)的正則表達(dá)式模板;
[0050]根據(jù)確定的正則表達(dá)式模板,識(shí)別與該字符串對(duì)應(yīng)的文件的名稱(chēng)的正則表達(dá)式;[0051 ] 將識(shí)別出的正則表達(dá)式與預(yù)設(shè)的用于文件清理的正則表達(dá)式庫(kù)中的正則表達(dá)式相匹配;
[0052]將匹配的正則表達(dá)式對(duì)應(yīng)的文件刪除。
[0053]為達(dá)到上述目的,本發(fā)明實(shí)施例公開(kāi)了一種文件名稱(chēng)識(shí)別裝置,應(yīng)用于電子設(shè)備,包括:第一集合確定模塊、第一字符串獲得模塊、第一檢測(cè)模塊、第一模板確定模塊和第一正則表達(dá)式識(shí)別模塊,其中,
[0054]所述第一集合確定模塊,用于確定待處理文件集合,所述待處理文件集合中包含至少一個(gè)文件;
[0055]所述第一字符串獲得模塊,用于獲得所述第一集合確定模塊確定的待處理文件集合中包含的每一文件的名稱(chēng)對(duì)應(yīng)的字符串;
[0056]所述第一檢測(cè)模塊,用于針對(duì)所述第一字符串獲得模塊獲得的每一文件的名稱(chēng)所對(duì)應(yīng)的字符串,檢測(cè)預(yù)設(shè)的正則表達(dá)式模板庫(kù)中是否存在與該字符串相匹配的正則表達(dá)式模板,所述預(yù)設(shè)的正則表達(dá)式模板庫(kù)中包含至少一個(gè)正則表達(dá)式模板;
[0057]所述第一模板確定模塊,用于將所述第一檢測(cè)模塊檢測(cè)到的正則表達(dá)式模板,確定為該字符串對(duì)應(yīng)的文件的名稱(chēng)的正則表達(dá)式模板;
[0058]所述第一正則表達(dá)式識(shí)別模塊,用于根據(jù)所述第一模板確定模塊確定的正則表達(dá)式模板,識(shí)別與該字符串對(duì)應(yīng)的文件的名稱(chēng)的正則表達(dá)式。
[0059]較佳的,所述第一集合確定模塊,具體用于:
[0060]分別將所述電子設(shè)備中的每一文件夾下的所有文件,確定為待處理文件集合。
[0061]較佳的,所述第一集合確定模塊,具體用于:
[0062]分別檢測(cè)所述電子設(shè)備中每一文件夾的名稱(chēng)是否符合預(yù)設(shè)的第一字符串匹配規(guī)則;
[0063]分別將檢測(cè)到的符合所述第一字符串匹配規(guī)則的文件夾的名稱(chēng)對(duì)應(yīng)的文件夾下的所有文件,確定為待處理文件集合。
[0064]較佳的,所述第一集合確定模塊,具體用于:
[0065]分別檢測(cè)所述電子設(shè)備中每一文件夾的名稱(chēng)是否符合預(yù)設(shè)的第二字符串匹配規(guī)則;
[0066]將檢測(cè)到的所有符合所述第二字符串匹配規(guī)則的文件夾的名稱(chēng)對(duì)應(yīng)的文件夾下的所有文件,確定為待處理文件集合。
[0067]較佳的,所述第一集合確定模塊,具體用于:
[0068]分別判斷所述電子設(shè)備中的每一文件夾下的文件數(shù)量是否大于或等于預(yù)設(shè)的第一閾值;
[0069]如果是,將該文件夾下的所有文件,確定為待處理文件集合。
[0070