1.一種基于語法形式的腳本類文件格式識(shí)別方法,其特征在于,包括:
獲取并分析同類腳本類文件的語法特點(diǎn);所述腳本類文件包括腳本文件以及具有語法定義的文件;
針對分析后的語法特點(diǎn)提取至少一個(gè)識(shí)別點(diǎn),所述識(shí)別點(diǎn)為每種腳本類文件獨(dú)有的區(qū)別特征;
將所述至少一個(gè)識(shí)別點(diǎn)在待測試用例中進(jìn)行評估測試,判斷是否為可用的識(shí)別點(diǎn),若是,則將可用的識(shí)別點(diǎn)轉(zhuǎn)換成識(shí)別規(guī)則并加入格式識(shí)別引擎完成識(shí)別;否則重復(fù)以上步驟直至提取到可用的識(shí)別點(diǎn);
所述可用的識(shí)別點(diǎn)為評估測試結(jié)果中準(zhǔn)確率和誤報(bào)率達(dá)到預(yù)定閾值范圍的識(shí)別點(diǎn)。
2.一種基于語法形式的腳本類文件格式識(shí)別系統(tǒng),其特征在于,包括:
分析模塊,用于獲取并分析腳本類文件的語法特點(diǎn);所述腳本類文件包括腳本文件以及具有語法定義的文件;
提取模塊,用于針對分析后的語法特點(diǎn)提取至少一個(gè)識(shí)別點(diǎn),所述識(shí)別點(diǎn)為每種腳本類文件獨(dú)有的區(qū)別特征;
測試模塊,用于將所述至少一個(gè)識(shí)別點(diǎn)在待測試用例中進(jìn)行評估測試,判斷是否為可用的識(shí)別點(diǎn),若是,則將可用的識(shí)別點(diǎn)轉(zhuǎn)換成識(shí)別規(guī)則并加入格式識(shí)別引擎完成識(shí)別;否則重復(fù)以上步驟直至提取到可用的識(shí)別點(diǎn);
所述可用的識(shí)別點(diǎn)為評估測試結(jié)果中準(zhǔn)確率和誤報(bào)率達(dá)到預(yù)定閾值范圍的識(shí)別點(diǎn)。