1.一種應(yīng)用于海量數(shù)據(jù)全文檢索系統(tǒng)的測試工具,其特征在于,包括順序?qū)懭?讀取模塊、隨機寫入/讀取模塊、循環(huán)寫入/讀取模塊、語種識別模塊、關(guān)鍵字檢索對比模塊、刪除模塊和并發(fā)模塊;每個模塊單獨連接海量數(shù)據(jù)全文檢索系統(tǒng)。
2.如權(quán)利要求1所述的一種應(yīng)用于海量數(shù)據(jù)全文檢索系統(tǒng)的測試工具,其特征在于,所述的順序?qū)懭?讀取模塊用于在全文檢索系統(tǒng)中,順序?qū)懭牒妥x取不同文件塊大小、不同文件大小的數(shù)據(jù);
隨機寫入/讀取模塊用于在全文檢索系統(tǒng)中,隨機寫入和讀取不同文件塊大小、不同文件大小的數(shù)據(jù);
循環(huán)寫入/讀取模塊用于對全文檢索系統(tǒng),進行長時間大壓力地循環(huán)寫入或循環(huán)讀取不同的數(shù)據(jù)文件;
語種識別模塊用于對全文檢索系統(tǒng)中寫入文件的語種進行識別;
關(guān)鍵字檢索對比模塊用于對全文檢索系統(tǒng)中,寫入的原始文件與檢索結(jié)果進行對比,得出關(guān)鍵字檢索的準(zhǔn)確率,并統(tǒng)計關(guān)鍵字檢索使用的時間;
刪除模塊用于刪除指定全文檢索系統(tǒng)中的文件;
并發(fā)模塊用于模擬多用戶同時對全文檢索系統(tǒng)進行并發(fā)操作。
3.應(yīng)用權(quán)利要求1所述的一種應(yīng)用于海量數(shù)據(jù)全文檢索系統(tǒng)的測試工具的測試方法,其特征在于,具體步驟如下:
步驟一、針對某個事件的海量數(shù)據(jù),利用順序?qū)懭?讀取模塊將海量數(shù)據(jù)順序?qū)懭肴臋z索系統(tǒng),并順序讀取不同文件塊大小和不同文件大小的數(shù)據(jù);
步驟二、制定用于對全文檢索系統(tǒng)進行檢索測試的關(guān)鍵參數(shù)和測試命令;
測試命令為:
./Texttest[-i][-r][-s][-l][-t][-T][-K][-L][-F file1 file2...][-f path][-o file];
Texttest:工具名稱;
-i:讀寫模式,0順序?qū)懀?順序讀,2隨機寫,3隨機讀;
-r:指定測試文件塊大小;
-s:指定測試文件大?。?/p>
-l:循環(huán)次數(shù);
-t:文件存儲操作與關(guān)鍵字檢索操作的間隔時間;
-T:并發(fā)進程數(shù)量;
-K:指定測試關(guān)鍵字,使用”括起來;
-L:輸出識別到的語種類型;
-F:(file1file2...)指定并發(fā)線程下測試的文件名,與-T配合使用;
-f:(path)輸入文件的存儲路徑;
-o:(file)輸出結(jié)果文件的存儲路徑及名稱;
步驟三、通過調(diào)整測試命令中不同的參數(shù),對全文檢索系統(tǒng)中的海量數(shù)據(jù)進行不同的檢索測試;
測試包括以下七條:
1)、利用順序?qū)懭?讀取模塊,對海量數(shù)據(jù)進行順序?qū)懭牒妥x取,實現(xiàn)全文檢索系統(tǒng)的順序讀寫性能測試;
2)、利用隨機寫入/讀取模塊,對海量數(shù)據(jù)進行隨機寫入和讀取,實現(xiàn)全文檢索系統(tǒng)的隨機讀寫性能測試;
3)、利用語種識別模塊,對海量數(shù)據(jù)進行語種識別,實現(xiàn)據(jù)全文檢索系統(tǒng)文件內(nèi)容的語種識別能力測試;
4)、利用關(guān)鍵字檢索對比模塊,對海量數(shù)據(jù)進行檢索,實現(xiàn)全文檢索系統(tǒng)文件內(nèi)容的關(guān)鍵字檢索性能測試;
5)、利用關(guān)鍵字檢索對比模塊,將海量數(shù)據(jù)與檢索結(jié)果進行對比,實現(xiàn)全文檢索系統(tǒng)文件內(nèi)容的關(guān)鍵字檢索準(zhǔn)確率測試;
6)、利用關(guān)鍵字檢索對比模塊和并發(fā)模塊,模擬多用戶同時對海量數(shù)據(jù)進行并發(fā)操作,實現(xiàn)全文檢索系統(tǒng)多進程并發(fā)關(guān)鍵字檢索性能測試;
7)、利用循環(huán)寫入/讀取模塊進行全文檢索系統(tǒng)的穩(wěn)定性測試;
步驟四、針對全文檢索系統(tǒng)的每一條性能測試,利用測試命令測試完成后,將測試結(jié)果輸出到自定義文件中。
4.如權(quán)利要求3所述的一種應(yīng)用于海量數(shù)據(jù)全文檢索系統(tǒng)的測試方法,其特征在于,所述步驟四中,檢索測試中對七條測試性能用一條,兩條,三條,四條,五條,六條或七條測試命令完成。