的指針形式 時(shí),該單元格的前一個(gè)單元格即為與該單元格相鄰的,且位于該單元格左下方對(duì)角線方向 的單元格(以下簡(jiǎn)稱對(duì)角相鄰單元格);獲取所述左側(cè)相鄰單元格的替換錯(cuò)誤類型的數(shù)目 (以下簡(jiǎn)稱第四數(shù)目);計(jì)算所述第三數(shù)目和所述第四數(shù)目之和,并將該和值作為該單元格 對(duì)應(yīng)的替換錯(cuò)誤類型的數(shù)目。例如,參閱圖4所示,第三行第四列的單元格,該單元格對(duì)應(yīng) 的識(shí)別元素為"是",該單元格對(duì)應(yīng)的標(biāo)準(zhǔn)元素為"plus",則所述識(shí)別元素相對(duì)于所述標(biāo)準(zhǔn) 元素的插入錯(cuò)誤類型的數(shù)目為1,所述對(duì)角相鄰單元格(第二行第三列)對(duì)應(yīng)的替換錯(cuò)誤類 型的數(shù)目為1,因此,第三行第四列的單元格對(duì)應(yīng)的替換錯(cuò)誤類型的數(shù)目為2 (1+1)。
[0061] 相應(yīng)的,當(dāng)所述錯(cuò)誤類型為刪除錯(cuò)誤類型時(shí),針對(duì)每一個(gè)單元格,均執(zhí)行如下操 作:計(jì)算該單元格對(duì)應(yīng)的刪除錯(cuò)誤類型的數(shù)目,并獲取該單元格對(duì)應(yīng)的識(shí)別元素相對(duì)于標(biāo) 準(zhǔn)元素的刪除錯(cuò)誤類型的數(shù)目(以下簡(jiǎn)稱第五數(shù)目),其中,該數(shù)目為1或者0 ;根據(jù)所述替 換錯(cuò)誤類型對(duì)應(yīng)的回溯指針形式,即當(dāng)所述回溯指針形式為指向下方的指針形式時(shí),該單 元格的前一個(gè)單元格即為與該單元格相鄰的,且位于該單元格下方的單元格(以下簡(jiǎn)稱下 方相鄰單元格);獲取所述下方相鄰單元格的插入錯(cuò)誤類型的數(shù)目(以下簡(jiǎn)稱第六數(shù)目); 計(jì)算所述第五數(shù)目和所述第六數(shù)目之和,并將該和值作為該單元格對(duì)應(yīng)的刪除錯(cuò)誤類型的 數(shù)目。例如,參閱圖4所示,第三行第四列的單元格,該單元格對(duì)應(yīng)的識(shí)別元素為"是",該單 元格對(duì)應(yīng)的標(biāo)準(zhǔn)元素為"plus",則所述識(shí)別元素相對(duì)于所述標(biāo)準(zhǔn)元素的刪除錯(cuò)誤類型的數(shù) 目為1,所述下方相鄰單元格(第二行第四列)對(duì)應(yīng)的刪除錯(cuò)誤類型的數(shù)目為2,因此,第三 行第四列的單元格對(duì)應(yīng)的插入錯(cuò)誤類型的數(shù)目為3 (1+2)。
[0062] 步驟a3:將計(jì)算得到的每一個(gè)單元格對(duì)應(yīng)的每一種錯(cuò)誤類型的數(shù)目添加至所述 二維網(wǎng)格中的相應(yīng)單元格中。
[0063] 步驟a4 :選取所述二維網(wǎng)格中位于最后一行且最后一列的單元格,確定選取的單 元格對(duì)應(yīng)的所有錯(cuò)誤類型中,數(shù)目最小的錯(cuò)誤類型;將確定的錯(cuò)誤類型的數(shù)目作為所述字 符序列和標(biāo)準(zhǔn)識(shí)別結(jié)果序列之間的最小編輯距離。
[0064] 本發(fā)明實(shí)施例中,參閱圖4所示,選取所述二維網(wǎng)格中位于最后一行最后一列的 單元格(即圖4中的第六行第六列),所述最后一行最后一列的單元格中包含插入錯(cuò)誤類型 的數(shù)目,替換錯(cuò)誤類型的數(shù)目和刪除錯(cuò)誤類型的數(shù)目;所述識(shí)別率確定裝置從所述插入錯(cuò) 誤類型的數(shù)目,替換錯(cuò)誤類型的數(shù)目和刪除錯(cuò)誤類型的數(shù)目中選取數(shù)目最小的錯(cuò)誤類型; 將選取得到的數(shù)目最小的錯(cuò)誤類型確定為所述字符序列和標(biāo)準(zhǔn)識(shí)別結(jié)果序列之間的最小 編輯距離。
[0065] 可選的,若將錯(cuò)誤類型的數(shù)目視為懲罰,則可以采用如下邏輯關(guān)系確定所述最小 編輯距離:
[0066]
[0067]
[0068] 步驟230 :根據(jù)計(jì)算得到的最小編輯距離,獲取所述字符序列和所述標(biāo)準(zhǔn)識(shí)別結(jié) 果序列的最優(yōu)對(duì)齊結(jié)果。
[0069] 本發(fā)明實(shí)施例中,所述識(shí)別率確定裝置根據(jù)計(jì)算得到的最小編輯距離,獲取所述 最小編輯距離對(duì)應(yīng)的回溯指針形式,以及每一個(gè)單元格的回溯指針形式;根據(jù)獲取的回溯 指針形式,確定字符序列和標(biāo)準(zhǔn)元素之間的最優(yōu)對(duì)齊結(jié)果。
[0070] 可選的,參閱圖6所示,所述識(shí)別率確定裝置確定字符序列和標(biāo)準(zhǔn)元素之間的最 優(yōu)對(duì)齊結(jié)果,包括:
[0071] 步驟bl :針對(duì)所述二維網(wǎng)格中的每一個(gè)單元格,均執(zhí)行如下操作:確定該單元格 對(duì)應(yīng)的所有錯(cuò)誤類型中,數(shù)目最小的錯(cuò)誤類型;將確定的錯(cuò)誤類型的數(shù)目確定為該單元格 對(duì)應(yīng)的最小數(shù)目;獲取所述確定的錯(cuò)誤類型對(duì)應(yīng)的回溯指針。
[0072] 本發(fā)明實(shí)施例中,參閱圖4所示,針對(duì)所述二維網(wǎng)格中的每一個(gè)單元格,均執(zhí)行相 同的操作,即:確定該單元格對(duì)應(yīng)的所有錯(cuò)誤類型中,數(shù)目最小的錯(cuò)誤類型,如圖4所示,在 第六行第六列的單元格中,所有錯(cuò)誤類型中數(shù)目最小的錯(cuò)誤類型為刪除錯(cuò)誤類型,刪除錯(cuò) 誤類型對(duì)應(yīng)的回溯指針形式為指向下方的指針。
[0073] 進(jìn)一步的,當(dāng)存在任意一單元格的所有錯(cuò)誤類型中,至少有兩個(gè)錯(cuò)誤類型的數(shù)目 相等且最小時(shí),所述識(shí)別率確定裝置可以從所述數(shù)目相等且最小的錯(cuò)誤類型中任意選取一 個(gè)錯(cuò)誤類型,并獲取選取的錯(cuò)誤類型對(duì)應(yīng)的回溯指針。例如,當(dāng)?shù)谌械谒牧械膯卧裰校?所有錯(cuò)誤類型中數(shù)目最小的錯(cuò)誤數(shù)目最小的錯(cuò)誤類型為插入錯(cuò)誤類型和替換錯(cuò)誤類型,所 述識(shí)別率確定裝置可以選取插入錯(cuò)誤類型,并獲取所述插入錯(cuò)誤類型對(duì)應(yīng)的回溯指針;所 述識(shí)別率確定裝置也可以選取替換錯(cuò)誤類型,并獲取所述替換錯(cuò)誤類型對(duì)應(yīng)的回溯指針。
[0074] 步驟b2 :自所述二維網(wǎng)格中最小編輯距離對(duì)應(yīng)的單元格起,根據(jù)每一個(gè)單元格中 獲取的回溯指針的指向,確定所述字符序列對(duì)應(yīng)的每一個(gè)識(shí)別元素與所述標(biāo)準(zhǔn)識(shí)別結(jié)果對(duì) 應(yīng)的每一個(gè)標(biāo)準(zhǔn)元素之間的對(duì)齊關(guān)系組。
[0075] 本發(fā)明實(shí)施例中,由于每一個(gè)單元格分別對(duì)應(yīng)字符序列中的一個(gè)元素,以及標(biāo)準(zhǔn) 識(shí)別結(jié)果序列中的一個(gè)元素,因此,根據(jù)獲取的回溯指針即能夠確定每一個(gè)單元格對(duì)應(yīng)的 字符序列中的元素相對(duì)于該單元格對(duì)應(yīng)的標(biāo)準(zhǔn)識(shí)別結(jié)果序列中的元素是否相同,以及當(dāng)任 意一單元格對(duì)應(yīng)的字符序列中的元素相對(duì)于該任意一單元格對(duì)應(yīng)的標(biāo)準(zhǔn)識(shí)別結(jié)果序列中 的元素不同時(shí),該任意一單元格對(duì)應(yīng)的字符序列中的元素相對(duì)于該任意一單元格對(duì)應(yīng)的標(biāo) 準(zhǔn)識(shí)別結(jié)果序列中的元素的錯(cuò)誤類型。
[0076] 例如,參閱圖7所示,為本發(fā)明實(shí)施例中,基于所述圖4生成的對(duì)應(yīng)關(guān)系組,該對(duì)應(yīng) 關(guān)系組中的每一個(gè)對(duì)應(yīng)關(guān)系中均包含一個(gè)標(biāo)準(zhǔn)元素以及一個(gè)識(shí)別元素。
[0077] 采用上述技術(shù)方案,根據(jù)二維網(wǎng)格,確定每一個(gè)識(shí)別元素相對(duì)于每一個(gè)標(biāo)準(zhǔn)元素 的錯(cuò)誤類型,以及每一個(gè)錯(cuò)誤類型的累加數(shù)目;根據(jù)二維表格的每一個(gè)單元格中最小數(shù)目 的錯(cuò)誤類型,確定標(biāo)準(zhǔn)識(shí)別結(jié)果序列的每一個(gè)標(biāo)準(zhǔn)元素與所述字符串序列的識(shí)別元素之間 的對(duì)應(yīng)關(guān)系,進(jìn)而采用最優(yōu)回溯對(duì)齊方法,得到更加準(zhǔn)確的最優(yōu)對(duì)應(yīng)關(guān)系組,便于后續(xù)統(tǒng)計(jì) 語音識(shí)別的錯(cuò)誤率,保證了最終獲得的語音識(shí)別錯(cuò)誤率的準(zhǔn)確性。
[0078] 步驟240 :根據(jù)所述字符序列和所述標(biāo)準(zhǔn)識(shí)別結(jié)果序列的最優(yōu)對(duì)齊結(jié)果,確定所 述字符序列相對(duì)于所述標(biāo)準(zhǔn)識(shí)別結(jié)果序列的識(shí)別率;其中,所述識(shí)別率包括表音字符識(shí)別 錯(cuò)誤率和中文識(shí)別錯(cuò)誤率。
[0079] 本發(fā)明實(shí)施例中,所述識(shí)別率確定裝置根據(jù)所述對(duì)齊關(guān)系組中每一個(gè)對(duì)齊關(guān)系對(duì) 應(yīng)的錯(cuò)誤類型的數(shù)目,確定所述字符序列相對(duì)于所述標(biāo)準(zhǔn)識(shí)別結(jié)果序列的識(shí)別率。其中,所 述識(shí)別率包含中文識(shí)別錯(cuò)誤率和表音字符識(shí)別錯(cuò)誤率。
[0080] 可選的,所述識(shí)別率確定裝置確定中文識(shí)別錯(cuò)誤率的過程,包括:從所述對(duì)齊關(guān)系 組中選取中文對(duì)應(yīng)關(guān)系;其中,所述中文對(duì)應(yīng)關(guān)系包含中文標(biāo)準(zhǔn)元素;計(jì)算選取的對(duì)應(yīng)關(guān) 系中所有識(shí)別錯(cuò)誤的對(duì)應(yīng)關(guān)系的數(shù)目,與中文標(biāo)準(zhǔn)元素的總數(shù)目的比值,將所述比值確定 為所述字符序列相對(duì)于所述標(biāo)準(zhǔn)識(shí)別結(jié)果序列的中文識(shí)別錯(cuò)誤率。例如,參閱圖7所示,中 文識(shí)別錯(cuò)誤的對(duì)應(yīng)關(guān)系為"錢"和空格,中文標(biāo)準(zhǔn)元素的總數(shù)目為4個(gè),因此,中文識(shí)別錯(cuò)誤 率為 1/4(1 + 4)。
[0081] 可選的,所述識(shí)別率確定裝置確定中文識(shí)別錯(cuò)誤率的過程,包括:從所述對(duì)齊關(guān)系 組中選取表音字符對(duì)應(yīng)關(guān)系;其中,所述表音字符對(duì)應(yīng)關(guān)系包含表音字符標(biāo)準(zhǔn)元素;計(jì)算 選取的對(duì)應(yīng)關(guān)系中所有識(shí)別錯(cuò)誤的對(duì)應(yīng)關(guān)系的錯(cuò)誤類型的數(shù)目,與表音字符標(biāo)準(zhǔn)元素的總 數(shù)目的比值,將所述比值確定為所述字符序列相對(duì)于所述標(biāo)準(zhǔn)識(shí)別結(jié)果序列的表音字符識(shí) 別錯(cuò)誤率。例如,參閱圖7所示,表音字符識(shí)別錯(cuò)誤的對(duì)應(yīng)關(guān)系為"發(fā)"和"plus","是"和 "plus",表音字符標(biāo)準(zhǔn)元素的總數(shù)目為2個(gè),因此,表音字符識(shí)別錯(cuò)誤率為100% (2 + 2)。
[0082] 進(jìn)一步的,所述識(shí)別率確定裝置能夠根據(jù)所述表音字符識(shí)別結(jié)果和中文識(shí)別結(jié) 果,確定總識(shí)別率。例如,參閱圖7所示,中文識(shí)別錯(cuò)誤的數(shù)目為1,表音字符識(shí)別錯(cuò)誤的數(shù) 目為2,標(biāo)準(zhǔn)元素?cái)?shù)目為6,則總識(shí)別錯(cuò)誤率為50% (3 + 6)。
[0083] 進(jìn)一步的,所述識(shí)別率還包括類型錯(cuò)誤率;所述識(shí)別率確定裝置針對(duì)所述對(duì)齊關(guān) 系組中每一種錯(cuò)誤類型,均執(zhí)行如下操作:獲取所述對(duì)齊關(guān)系組中該錯(cuò)誤類型的總數(shù)目; 獲取所述對(duì)應(yīng)關(guān)系組中所有錯(cuò)誤類型的總數(shù)目;計(jì)算該錯(cuò)誤類型的總數(shù)目和所有錯(cuò)誤類型 的總數(shù)目之間的比值,將所述比值確定為該錯(cuò)誤類型的類型錯(cuò)誤率。
[0084] 采用本發(fā)明實(shí)施例技術(shù)方案,將識(shí)別得到的字符串和標(biāo)準(zhǔn)識(shí)別結(jié)果中的中文字符 (和數(shù)字)和表音單詞作為評(píng)測(cè)單元,在計(jì)算最小編輯距離后,回溯產(chǎn)生字符串和標(biāo)準(zhǔn)識(shí)別 結(jié)果的最優(yōu)對(duì)齊對(duì)應(yīng)關(guān)系組,進(jìn)而能夠分別計(jì)算得到中文字符和數(shù)字的錯(cuò)誤率、表音單詞 錯(cuò)誤率以及總體錯(cuò)誤率,將一個(gè)表音單詞視為一個(gè)整體,避免了將單詞中的每一個(gè)字符作 為一個(gè)元素進(jìn)行處理時(shí)造成的計(jì)算結(jié)果錯(cuò)誤率增加的問題,提高了計(jì)算結(jié)果的準(zhǔn)確性。
[0085] 基于上述技術(shù)方案,參閱圖8所示,本發(fā)明實(shí)施例還提供一種識(shí)別率確定裝置,包 括獲取單元80,序列生成單元81,計(jì)算單元82,最優(yōu)對(duì)齊結(jié)果確定單元83,以及識(shí)別率確定 單元84,其中:
[0086] 獲取單元80,用于獲取對(duì)語音進(jìn)行識(shí)別得到的字符串和所述語音對(duì)應(yīng)的標(biāo)準(zhǔn)識(shí)別 結(jié)果;其中,所述標(biāo)準(zhǔn)識(shí)別結(jié)果中包含字符類型