亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種數(shù)據(jù)處理方法及裝置與流程

文檔序號(hào):11829691閱讀:來(lái)源:國(guó)知局

技術(shù)特征:

1.一種數(shù)據(jù)處理方法,其特征在于,包括:

獲取地標(biāo)文字序列,將所述地標(biāo)文字序列劃分為至少一個(gè)分詞;

將所述至少一個(gè)分詞中每一個(gè)分詞進(jìn)行角色標(biāo)注,并獲得角色標(biāo)注序列,所述角色標(biāo)注用于指示所述分詞所屬的語(yǔ)義類別;

對(duì)所述角色標(biāo)注序列中的特定角色標(biāo)注分詞進(jìn)行相應(yīng)的數(shù)據(jù)處理。

2.如權(quán)利要求1所述的方法,其特征在于,所述將所述至少一個(gè)分詞中每一個(gè)分詞進(jìn)行角色標(biāo)注,并獲得角色標(biāo)注序列,包括:

針對(duì)每一個(gè)所述分詞,查找角色詞表,判斷所述角色詞表中是否存在與所述分詞匹配的登錄詞;

若所述角色詞表中存在與所述分詞匹配的登錄詞,則將與所述分詞匹配的登錄詞對(duì)應(yīng)的角色確定為所述分詞的角色,并進(jìn)行角色標(biāo)注;

將每一個(gè)進(jìn)行角色標(biāo)注的所述分詞組成角色標(biāo)注序列。

3.如權(quán)利要求2所述的方法,其特征在于,若與所述分詞匹配的登錄詞對(duì)應(yīng)的角色包括至少兩個(gè);

所述將與所述分詞匹配的登錄詞對(duì)應(yīng)的角色確定為所述分詞的角色,包括:

獲取所述分詞在所述地標(biāo)文字序列中的前一個(gè)分詞的角色和所述分詞在所述地標(biāo)文字序列中的后一個(gè)分詞的角色;

根據(jù)所述前一個(gè)分詞的角色和所述后一個(gè)分詞的角色,從所述至少兩個(gè)角色中選擇一個(gè)角色確定為所述分詞的角色。

4.如權(quán)利要求2所述的方法,其特征在于,所述方法還包括:

若所述角色詞表中不存在與所述分詞匹配的登錄詞,利用預(yù)先建立的模型參數(shù)以及所述分詞在所述地標(biāo)文字序列中的位置參數(shù)進(jìn)行計(jì)算,獲得所述分詞的角色,并進(jìn)行角色標(biāo)注。

5.如權(quán)利要求4所述的方法,其特征在于,所述獲取地標(biāo)文字序列,將所 述地標(biāo)文字序列劃分為至少一個(gè)分詞之前,還包括:

獲取角色標(biāo)準(zhǔn)集,所述角色標(biāo)準(zhǔn)集中包括預(yù)設(shè)數(shù)量的標(biāo)準(zhǔn)角色標(biāo)注序列;

將所述角色標(biāo)準(zhǔn)集中的所述標(biāo)準(zhǔn)角色標(biāo)注序列作為模型訓(xùn)練的輸入,并獲得所述模型參數(shù)。

6.如權(quán)利5所述的方法,其特征在于,所述方法還包括:

利用所述模型參數(shù),挖掘新增詞匯,并將所述新增詞匯以及所述新增詞匯對(duì)應(yīng)的角色添加進(jìn)所述角色標(biāo)準(zhǔn)集中;

將包含所述新增詞匯的角色標(biāo)準(zhǔn)集確定為所述角色詞表。

7.如權(quán)利要求1所述的方法,其特征在于,若所述角色標(biāo)注序列中包括類別詞角色標(biāo)注分詞;

所述對(duì)所述角色標(biāo)注序列中的特定角色標(biāo)注分詞進(jìn)行相應(yīng)的數(shù)據(jù)處理,包括:

選取所述角色標(biāo)注序列中的類別詞角色標(biāo)注分詞,并根據(jù)所述類別詞角色標(biāo)注分詞確定所述地標(biāo)文字序列中的層次關(guān)系。

8.如權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述角色標(biāo)注序列中的特定角色標(biāo)注分詞進(jìn)行相應(yīng)的數(shù)據(jù)處理,包括:

從所述角色標(biāo)注序列中查找與預(yù)設(shè)角色匹配的角色標(biāo)注分詞,并根據(jù)所述角色標(biāo)注分詞提取所述地標(biāo)文字序列中的關(guān)鍵詞。

9.一種數(shù)據(jù)處理裝置,其特征在于,包括:

劃分模塊,用于獲取地標(biāo)文字序列,將所述地標(biāo)文字序列劃分為至少一個(gè)分詞;

標(biāo)注模塊,用于將所述至少一個(gè)分詞中每一個(gè)分詞進(jìn)行角色標(biāo)注,并獲得角色標(biāo)注序列,所述角色標(biāo)注用于指示所述分詞所屬的語(yǔ)義類別;

數(shù)據(jù)處理模塊,用于對(duì)所述角色標(biāo)注序列中的特定角色標(biāo)注分詞進(jìn)行相應(yīng)的數(shù)據(jù)處理。

10.如權(quán)利要求9所述的裝置,其特征在于,所述標(biāo)注模塊包括:

查找單元,用于針對(duì)每一個(gè)所述分詞,查找角色詞表,判斷所述角色詞表中是否存在與所述分詞匹配的登錄詞;

標(biāo)注單元,用于若所述角色詞表中存在與所述分詞匹配的登錄詞,則將與所述分詞匹配的登錄詞對(duì)應(yīng)的角色確定為所述分詞的角色,并進(jìn)行角色標(biāo)注;

組成單元,用于將每一個(gè)進(jìn)行角色標(biāo)注的所述分詞組成角色標(biāo)注序列。

11.如權(quán)利要求10所述的裝置,其特征在于,若與所述分詞匹配的登錄詞對(duì)應(yīng)的角色包括至少兩個(gè);所述標(biāo)注單元包括:

獲取子單元,用于獲取所述分詞在所述地標(biāo)文字序列中的前一個(gè)分詞的角色和所述分詞在所述地標(biāo)文字序列中的后一個(gè)分詞的角色;

選擇子單元,用于根據(jù)所述前一個(gè)分詞的角色和所述后一個(gè)分詞的角色,從所述至少兩個(gè)角色中選擇一個(gè)角色確定為所述分詞的角色。

12.如權(quán)利要求10所述的裝置,其特征在于,所述標(biāo)注模塊還包括:

計(jì)算單元,用于若所述角色詞表中不存在與所述分詞匹配的登錄詞,利用預(yù)先建立的模型參數(shù)以及所述分詞在所述地標(biāo)文字序列中的位置參數(shù)進(jìn)行計(jì)算,獲得所述分詞的角色,并進(jìn)行角色標(biāo)注。

13.如權(quán)利要求12所述的裝置,其特征在于,所述裝置還包括:

獲取模塊,用于獲取角色標(biāo)準(zhǔn)集,所述角色標(biāo)準(zhǔn)集中包括預(yù)設(shè)數(shù)量的標(biāo)準(zhǔn)角色標(biāo)注序列;

模型訓(xùn)練模塊,用于將所述角色標(biāo)準(zhǔn)集中的所述標(biāo)準(zhǔn)角色標(biāo)注序列作為模型訓(xùn)練的輸入,并獲得所述模型參數(shù)。

14.如權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括:

挖掘模塊,用于利用所述模型參數(shù),挖掘新增詞匯,并將所述新增詞匯以及所述新增詞匯對(duì)應(yīng)的角色添加進(jìn)所述角色標(biāo)準(zhǔn)集中;

確定模塊,用于將包含所述新增詞匯的角色標(biāo)準(zhǔn)集確定為所述角色詞表。

15.如權(quán)利要求9所述的裝置,其特征在于,若所述角色標(biāo)注序列中包括類別詞角色標(biāo)注分詞;

所述數(shù)據(jù)處理模塊具體用于選取所述角色標(biāo)注序列中的類別詞角色標(biāo)注分詞,并根據(jù)所述類別詞角色標(biāo)注分詞確定所述地標(biāo)文字序列中的層次關(guān)系。

16.如權(quán)利要求9所述的裝置,其特征在于,所述數(shù)據(jù)處理模塊具體用于從所述角色標(biāo)注序列中查找與預(yù)設(shè)角色匹配的角色標(biāo)注分詞,并根據(jù)所述角色標(biāo)注分詞提取所述地標(biāo)文字序列中的關(guān)鍵詞。

當(dāng)前第2頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1