1.一種數(shù)據(jù)處理方法,其特征在于,包括:
獲取地標(biāo)文字序列,將所述地標(biāo)文字序列劃分為至少一個(gè)分詞;
將所述至少一個(gè)分詞中每一個(gè)分詞進(jìn)行角色標(biāo)注,并獲得角色標(biāo)注序列,所述角色標(biāo)注用于指示所述分詞所屬的語(yǔ)義類別;
對(duì)所述角色標(biāo)注序列中的特定角色標(biāo)注分詞進(jìn)行相應(yīng)的數(shù)據(jù)處理。
2.如權(quán)利要求1所述的方法,其特征在于,所述將所述至少一個(gè)分詞中每一個(gè)分詞進(jìn)行角色標(biāo)注,并獲得角色標(biāo)注序列,包括:
針對(duì)每一個(gè)所述分詞,查找角色詞表,判斷所述角色詞表中是否存在與所述分詞匹配的登錄詞;
若所述角色詞表中存在與所述分詞匹配的登錄詞,則將與所述分詞匹配的登錄詞對(duì)應(yīng)的角色確定為所述分詞的角色,并進(jìn)行角色標(biāo)注;
將每一個(gè)進(jìn)行角色標(biāo)注的所述分詞組成角色標(biāo)注序列。
3.如權(quán)利要求2所述的方法,其特征在于,若與所述分詞匹配的登錄詞對(duì)應(yīng)的角色包括至少兩個(gè);
所述將與所述分詞匹配的登錄詞對(duì)應(yīng)的角色確定為所述分詞的角色,包括:
獲取所述分詞在所述地標(biāo)文字序列中的前一個(gè)分詞的角色和所述分詞在所述地標(biāo)文字序列中的后一個(gè)分詞的角色;
根據(jù)所述前一個(gè)分詞的角色和所述后一個(gè)分詞的角色,從所述至少兩個(gè)角色中選擇一個(gè)角色確定為所述分詞的角色。
4.如權(quán)利要求2所述的方法,其特征在于,所述方法還包括:
若所述角色詞表中不存在與所述分詞匹配的登錄詞,利用預(yù)先建立的模型參數(shù)以及所述分詞在所述地標(biāo)文字序列中的位置參數(shù)進(jìn)行計(jì)算,獲得所述分詞的角色,并進(jìn)行角色標(biāo)注。
5.如權(quán)利要求4所述的方法,其特征在于,所述獲取地標(biāo)文字序列,將所 述地標(biāo)文字序列劃分為至少一個(gè)分詞之前,還包括:
獲取角色標(biāo)準(zhǔn)集,所述角色標(biāo)準(zhǔn)集中包括預(yù)設(shè)數(shù)量的標(biāo)準(zhǔn)角色標(biāo)注序列;
將所述角色標(biāo)準(zhǔn)集中的所述標(biāo)準(zhǔn)角色標(biāo)注序列作為模型訓(xùn)練的輸入,并獲得所述模型參數(shù)。
6.如權(quán)利5所述的方法,其特征在于,所述方法還包括:
利用所述模型參數(shù),挖掘新增詞匯,并將所述新增詞匯以及所述新增詞匯對(duì)應(yīng)的角色添加進(jìn)所述角色標(biāo)準(zhǔn)集中;
將包含所述新增詞匯的角色標(biāo)準(zhǔn)集確定為所述角色詞表。
7.如權(quán)利要求1所述的方法,其特征在于,若所述角色標(biāo)注序列中包括類別詞角色標(biāo)注分詞;
所述對(duì)所述角色標(biāo)注序列中的特定角色標(biāo)注分詞進(jìn)行相應(yīng)的數(shù)據(jù)處理,包括:
選取所述角色標(biāo)注序列中的類別詞角色標(biāo)注分詞,并根據(jù)所述類別詞角色標(biāo)注分詞確定所述地標(biāo)文字序列中的層次關(guān)系。
8.如權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述角色標(biāo)注序列中的特定角色標(biāo)注分詞進(jìn)行相應(yīng)的數(shù)據(jù)處理,包括:
從所述角色標(biāo)注序列中查找與預(yù)設(shè)角色匹配的角色標(biāo)注分詞,并根據(jù)所述角色標(biāo)注分詞提取所述地標(biāo)文字序列中的關(guān)鍵詞。
9.一種數(shù)據(jù)處理裝置,其特征在于,包括:
劃分模塊,用于獲取地標(biāo)文字序列,將所述地標(biāo)文字序列劃分為至少一個(gè)分詞;
標(biāo)注模塊,用于將所述至少一個(gè)分詞中每一個(gè)分詞進(jìn)行角色標(biāo)注,并獲得角色標(biāo)注序列,所述角色標(biāo)注用于指示所述分詞所屬的語(yǔ)義類別;
數(shù)據(jù)處理模塊,用于對(duì)所述角色標(biāo)注序列中的特定角色標(biāo)注分詞進(jìn)行相應(yīng)的數(shù)據(jù)處理。
10.如權(quán)利要求9所述的裝置,其特征在于,所述標(biāo)注模塊包括:
查找單元,用于針對(duì)每一個(gè)所述分詞,查找角色詞表,判斷所述角色詞表中是否存在與所述分詞匹配的登錄詞;
標(biāo)注單元,用于若所述角色詞表中存在與所述分詞匹配的登錄詞,則將與所述分詞匹配的登錄詞對(duì)應(yīng)的角色確定為所述分詞的角色,并進(jìn)行角色標(biāo)注;
組成單元,用于將每一個(gè)進(jìn)行角色標(biāo)注的所述分詞組成角色標(biāo)注序列。
11.如權(quán)利要求10所述的裝置,其特征在于,若與所述分詞匹配的登錄詞對(duì)應(yīng)的角色包括至少兩個(gè);所述標(biāo)注單元包括:
獲取子單元,用于獲取所述分詞在所述地標(biāo)文字序列中的前一個(gè)分詞的角色和所述分詞在所述地標(biāo)文字序列中的后一個(gè)分詞的角色;
選擇子單元,用于根據(jù)所述前一個(gè)分詞的角色和所述后一個(gè)分詞的角色,從所述至少兩個(gè)角色中選擇一個(gè)角色確定為所述分詞的角色。
12.如權(quán)利要求10所述的裝置,其特征在于,所述標(biāo)注模塊還包括:
計(jì)算單元,用于若所述角色詞表中不存在與所述分詞匹配的登錄詞,利用預(yù)先建立的模型參數(shù)以及所述分詞在所述地標(biāo)文字序列中的位置參數(shù)進(jìn)行計(jì)算,獲得所述分詞的角色,并進(jìn)行角色標(biāo)注。
13.如權(quán)利要求12所述的裝置,其特征在于,所述裝置還包括:
獲取模塊,用于獲取角色標(biāo)準(zhǔn)集,所述角色標(biāo)準(zhǔn)集中包括預(yù)設(shè)數(shù)量的標(biāo)準(zhǔn)角色標(biāo)注序列;
模型訓(xùn)練模塊,用于將所述角色標(biāo)準(zhǔn)集中的所述標(biāo)準(zhǔn)角色標(biāo)注序列作為模型訓(xùn)練的輸入,并獲得所述模型參數(shù)。
14.如權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括:
挖掘模塊,用于利用所述模型參數(shù),挖掘新增詞匯,并將所述新增詞匯以及所述新增詞匯對(duì)應(yīng)的角色添加進(jìn)所述角色標(biāo)準(zhǔn)集中;
確定模塊,用于將包含所述新增詞匯的角色標(biāo)準(zhǔn)集確定為所述角色詞表。
15.如權(quán)利要求9所述的裝置,其特征在于,若所述角色標(biāo)注序列中包括類別詞角色標(biāo)注分詞;
所述數(shù)據(jù)處理模塊具體用于選取所述角色標(biāo)注序列中的類別詞角色標(biāo)注分詞,并根據(jù)所述類別詞角色標(biāo)注分詞確定所述地標(biāo)文字序列中的層次關(guān)系。
16.如權(quán)利要求9所述的裝置,其特征在于,所述數(shù)據(jù)處理模塊具體用于從所述角色標(biāo)注序列中查找與預(yù)設(shè)角色匹配的角色標(biāo)注分詞,并根據(jù)所述角色標(biāo)注分詞提取所述地標(biāo)文字序列中的關(guān)鍵詞。