1.一種數(shù)據(jù)查詢方法,其特征在于,包括:
接收到數(shù)據(jù)查詢請求后,提取所述數(shù)據(jù)查詢請求中的關(guān)鍵字;
使用預(yù)先建立的索引文件,查詢與所述關(guān)鍵字具有索引關(guān)系的數(shù)據(jù)分片;其中,所述數(shù)據(jù)分片中包含至少一個數(shù)據(jù)單元;
在所述數(shù)據(jù)分片中,查詢包含所述關(guān)鍵字的數(shù)據(jù)單元。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)查詢方法,其特征在于,所述索引文件的建立步驟包括:
將數(shù)據(jù)文件分割為多個數(shù)據(jù)分片;
對所述數(shù)據(jù)分片進行分詞操作,獲得多個單詞;
對所述多個單詞進行去重操作后,建立去重后的單詞與對應(yīng)數(shù)據(jù)分片的索引關(guān)系。
3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)查詢方法,其特征在于,所述數(shù)據(jù)分片內(nèi)包含多個數(shù)據(jù)單元;相應(yīng)地,所述對所述數(shù)據(jù)分片進行分詞操作,獲得多個單詞,包括:
并行獲取每個所述數(shù)據(jù)分片,并按照以下步驟并行處理每個所述數(shù)據(jù)分片:
依次讀取所述數(shù)據(jù)分片的各個數(shù)據(jù)單元,對所述數(shù)據(jù)單元進行分詞操作后,獲得與所述數(shù)據(jù)分片對應(yīng)的多個單詞。
4.根據(jù)權(quán)利要求2所述的數(shù)據(jù)查詢方法,其特征在于,所述使用預(yù)先建立的索引文件,查詢與所述關(guān)鍵字具有索引關(guān)系的數(shù)據(jù)分片,包括:
在預(yù)先建立的索引文件中,查詢與所述關(guān)鍵字相同的單詞;
確定與所述單詞具有索引關(guān)系的數(shù)據(jù)分片。
5.根據(jù)權(quán)利要求1所述的數(shù)據(jù)查詢方法,其特征在于,預(yù)先建立的索引文件為一個,且所述索引文件是多個數(shù)據(jù)文件的索引文件;所述數(shù)據(jù)查詢請求中包含數(shù)據(jù)文件標識;
相應(yīng)地,在所述提取所述數(shù)據(jù)查詢請求中的關(guān)鍵字時,還包括:
提取所述數(shù)據(jù)查詢請求中的數(shù)據(jù)文件標識;
在所述使用預(yù)先建立的索引文件,查詢與所述關(guān)鍵字具有索引關(guān)系的數(shù)據(jù)分片之后,及所述在所述數(shù)據(jù)分片中,查詢包含所述關(guān)鍵字的數(shù)據(jù)單元之前,還包括:
在所述數(shù)據(jù)分片中,選擇與所述數(shù)據(jù)文件標識對應(yīng)的數(shù)據(jù)分片。
6.根據(jù)權(quán)利要求1所述的數(shù)據(jù)查詢方法,其特征在于,預(yù)先建立的索引文件為多個,且不同的索引文件對應(yīng)不同的數(shù)據(jù)文件;所述數(shù)據(jù)查詢請求中包含數(shù)據(jù)文件標識;
相應(yīng)地,在所述提取所述數(shù)據(jù)查詢請求中的關(guān)鍵字時,還包括:
提取所述數(shù)據(jù)查詢請求中的數(shù)據(jù)文件標識;
所述使用預(yù)先建立的索引文件,查詢與所述關(guān)鍵字具有索引關(guān)系的數(shù)據(jù)分片,包括:
在多個所述索引文件中,選擇與所述數(shù)據(jù)文件標識對應(yīng)的索引文件;
使用確定出的所述索引文件,查詢與所述關(guān)鍵字具有索引關(guān)系的數(shù)據(jù)分片。
7.一種數(shù)據(jù)查詢裝置,其特征在于,包括:
關(guān)鍵字提取單元,用于接收到數(shù)據(jù)查詢請求后,提取所述數(shù)據(jù)查詢請求中的關(guān)鍵字;
數(shù)據(jù)分片查詢單元,用于使用預(yù)先建立的索引文件,查詢與所述關(guān)鍵字具有索引關(guān)系的數(shù)據(jù)分片;其中,所述數(shù)據(jù)分片中包含至少一個數(shù)據(jù)單元;
數(shù)據(jù)單元查詢單元,用于在所述數(shù)據(jù)分片中,查詢包含所述關(guān)鍵字的數(shù)據(jù)單元。
8.根據(jù)權(quán)利要求7所述的數(shù)據(jù)查詢裝置,其特征在于,還包括:索引文件建立單元,用于建立索引文件;
其中,在建立索引文件方面,所述索引文件建立單元具體用于:
將數(shù)據(jù)文件分割為多個數(shù)據(jù)分片;
對所述數(shù)據(jù)分片進行分詞操作,獲得多個單詞;
對所述多個單詞進行去重操作后,建立去重后的單詞與對應(yīng)數(shù)據(jù)分片的索引關(guān)系。
9.根據(jù)權(quán)利要求8所述的數(shù)據(jù)查詢裝置,其特征在于,所述數(shù)據(jù)分片內(nèi)包含多個數(shù)據(jù)單元;相應(yīng)地,在所述對所述數(shù)據(jù)分片進行分詞操作,獲得多個單詞的方面,所述索引文件建立單元具體用于:
并行獲取每個所述數(shù)據(jù)分片,并按照以下步驟并行處理每個所述數(shù)據(jù)分片:
依次讀取所述數(shù)據(jù)分片的各個數(shù)據(jù)單元,對所述數(shù)據(jù)單元進行分詞操作后,獲得與所述數(shù)據(jù)分片對應(yīng)的多個單詞。
10.根據(jù)權(quán)利要求8所述的數(shù)據(jù)查詢裝置,其特征在于,在所述使用預(yù)先建立的索引文件,查詢與所述關(guān)鍵字具有索引關(guān)系的數(shù)據(jù)分片的方面,所述數(shù)據(jù)分片查詢單元具體用于:
在預(yù)先建立的索引文件中,查詢與所述關(guān)鍵字相同的單詞;
確定與所述單詞具有索引關(guān)系的數(shù)據(jù)分片。
11.根據(jù)權(quán)利要求7所述的數(shù)據(jù)查詢裝置,其特征在于,預(yù)先建立的索引文件為一個,且所述索引文件是多個數(shù)據(jù)文件的索引文件;所述數(shù)據(jù)查詢請求中包含數(shù)據(jù)文件標識;
相應(yīng)地,該裝置還包括:
數(shù)據(jù)文件標識提取單元,用于在所述提取所述數(shù)據(jù)查詢請求中的關(guān)鍵字時,提取所述數(shù)據(jù)查詢請求中的數(shù)據(jù)文件標識;
數(shù)據(jù)分片選擇單元,用于在所述使用預(yù)先建立的索引文件,查詢與所述關(guān)鍵字具有索引關(guān)系的數(shù)據(jù)分片之后,及所述在所述數(shù)據(jù)分片中,查詢包含所述關(guān)鍵字的數(shù)據(jù)單元之前,在所述數(shù)據(jù)分片中,選擇與所述數(shù)據(jù)文件標識對應(yīng)的數(shù)據(jù)分片。
12.根據(jù)權(quán)利要求7所述的數(shù)據(jù)查詢裝置,其特征在于,預(yù)先建立的索引文件為多個,且不同的索引文件對應(yīng)不同的數(shù)據(jù)文件;所述數(shù)據(jù)查詢請求中包含數(shù)據(jù)文件標識;
相應(yīng)地,該裝置還包括:
數(shù)據(jù)文件標識提取單元,用于在所述提取所述數(shù)據(jù)查詢請求中的關(guān)鍵字時,提取所述數(shù)據(jù)查詢請求中的數(shù)據(jù)文件標識;
在所述使用預(yù)先建立的索引文件,查詢與所述關(guān)鍵字具有索引關(guān)系的數(shù)據(jù)分片的方面,所述數(shù)據(jù)分片查詢單元具體用于:
在多個所述索引文件中,選擇與所述數(shù)據(jù)文件標識對應(yīng)的索引文件;
使用選擇出的所述索引文件,查詢與所述關(guān)鍵字具有索引關(guān)系的數(shù)據(jù)分片。