語音識別處理方法及裝置與流程

文檔序號：12368765閱讀：301來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及自然語言處理
技術(shù)領(lǐng)域：
，尤其涉及一種語音識別處理方法及裝置。
背景技術(shù)：
：隨著科技的發(fā)展，移動終端的出現(xiàn)，大大地方便了人們的生活。例如人們可以使用智移動終端與家人或者朋友通過電話聯(lián)系、或者短信聯(lián)系，極大地方便了人們的溝通與交流。近年來，隨著移動終端的智能化，進(jìn)一步方便了人們的使用。例如現(xiàn)有的好多智能的移動終端增加了語音識別的功能，當(dāng)用戶在使用不方便的時候，可以通過語音對移動終端發(fā)出執(zhí)行某操作的命令，移動終端通過對用戶的語音進(jìn)行識別。從而執(zhí)行相關(guān)的操作。在實(shí)現(xiàn)本發(fā)明過程中，發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題：移動終端對語音的識別準(zhǔn)確度較低，例如當(dāng)用戶的語音為“打電話給王小明”，而移動終端對語音的識別結(jié)果可能為“打電話給王小萌”，從而導(dǎo)致移動終端無法找到“王小明”的電話，從而無法執(zhí)行相關(guān)的操作。因此，現(xiàn)有的移動終端對語音的識別效率較低。技術(shù)實(shí)現(xiàn)要素：鑒于上述問題，提出了本發(fā)明實(shí)施例的一種語音識別處理方法及裝置。本發(fā)明實(shí)施例提供一種語音識別處理方法，所述方法包括：解析用戶的語音信息中的用戶關(guān)鍵詞；檢測預(yù)設(shè)信息庫中是否存在與所述用戶關(guān)鍵詞匹配的用戶標(biāo)識；當(dāng)不存在時，獲取所述用戶關(guān)鍵詞對應(yīng)的拼音字符串；根據(jù)所述拼音字符串，從所述預(yù)設(shè)信息庫中識別與所述拼音字符串讀音相似的至少一個用戶標(biāo)識，作為語音識別處理的結(jié)果。進(jìn)一步可選地，如上所述的方法中，所述解析用戶的語音信息中的用戶關(guān)鍵詞，具體包括：對所述用戶的所述語音信息進(jìn)行識別，得到文字信息；對所述文字信息進(jìn)行解析，獲取所述文字信息中的所述用戶關(guān)鍵詞。進(jìn)一步可選地，如上所述的方法中，根據(jù)所述拼音字符串，從所述預(yù)設(shè)信息庫中識別與所述拼音字符串讀音相似的至少一個用戶標(biāo)識，具體包括：計(jì)算所述預(yù)設(shè)信息庫中每個所述用戶標(biāo)識的拼音與所述拼音字符串之間的最小編輯距離；將所述預(yù)設(shè)信息庫中所有的所述用戶標(biāo)識按照所述最小編輯距離從小到大的順序進(jìn)行排序，得到用戶標(biāo)識列表；按照從前向后的順序從所述用戶標(biāo)識列表中篩選至少一個所述用戶標(biāo)識。進(jìn)一步可選地，如上所述的方法中，計(jì)算所述預(yù)設(shè)信息庫中每個所述用戶標(biāo)識的拼音與所述拼音字符串之間的最小編輯距離，具體包括：對于所述預(yù)設(shè)信息庫中的每個所述用戶標(biāo)識，計(jì)算所述用戶標(biāo)識的拼音中聲母、韻母與聲調(diào)分別與所述拼音字符串中的聲母、韻母與聲調(diào)之間的最小編輯距離；根據(jù)所述用戶標(biāo)識的拼音中所述聲母對應(yīng)的最小編輯距離、所述韻母對應(yīng)的最小編輯距離以及所述聲調(diào)對應(yīng)的最小編輯距離，得到所述用戶標(biāo)識的拼音與所述拼音字符串之間的最小編輯距離。進(jìn)一步可選地，如上所述的方法中，根據(jù)所述用戶標(biāo)識的拼音中所述聲母對應(yīng)的最小編輯距離、所述韻母對應(yīng)的最小編輯距離以及所述聲調(diào)對應(yīng)的最小編輯距離，得到所述用戶標(biāo)識的拼音與所述拼音字符串之間的最小編輯距離，具體包括：將所述用戶標(biāo)識的拼音中所述聲母對應(yīng)的最小編輯距離、所述韻母對應(yīng)的最小編輯距離以及所述聲調(diào)對應(yīng)的最小編輯距離相加，得到所述用戶標(biāo)識的拼音與所述拼音字符串之間的最小編輯距離；或者將所述用戶標(biāo)識的拼音中所述聲母對應(yīng)的最小編輯距離與預(yù)設(shè)的聲母權(quán)重的乘積、所述韻母對應(yīng)的最小編輯距離與預(yù)設(shè)的韻母權(quán)重的乘積以及所述聲調(diào)對應(yīng)的最小編輯距離與預(yù)設(shè)的聲調(diào)權(quán)重的乘積相加，得到所述用戶標(biāo)識的拼音與所述拼音字符串之間的最小編輯距離。進(jìn)一步可選地，如上所述的方法中，根據(jù)所述拼音字符串，從所述預(yù)設(shè)信息庫中獲取與所述拼音字符串讀音相似的至少一個用戶標(biāo)識，作為語音識別處理的結(jié)果之后，還包括：向所述用戶顯示至少一個所述用戶標(biāo)識；進(jìn)一步地，所述方法還包括：接收所述用戶從至少一個所述用戶標(biāo)識中選擇的目標(biāo)用戶標(biāo)識；根據(jù)所述目標(biāo)用戶標(biāo)識進(jìn)行相應(yīng)的處理。本發(fā)明實(shí)施例還提供一種語音識別處理裝置裝置，所述裝置包括：解析模塊，用于解析用戶的語音信息中的用戶關(guān)鍵詞；檢測模塊，用于檢測預(yù)設(shè)信息庫中是否存在與所述用戶關(guān)鍵詞匹配的用戶標(biāo)識；獲取模塊，用于當(dāng)不存在時，獲取所述用戶關(guān)鍵詞對應(yīng)的拼音字符串；識別模塊，用于根據(jù)所述拼音字符串，從所述預(yù)設(shè)信息庫中識別與所述拼音字符串讀音相似的至少一個用戶標(biāo)識，作為語音識別處理的結(jié)果。進(jìn)一步可選地，如上所述的裝置中，所述解析模塊，具體用于：對所述用戶的所述語音信息進(jìn)行識別，得到文字信息；對所述文字信息進(jìn)行解析，獲取所述文字信息中的所述用戶關(guān)鍵詞。進(jìn)一步可選地，如上所述的裝置中，所述識別模塊，具體包括：計(jì)算單元，用于計(jì)算所述預(yù)設(shè)信息庫中每個所述用戶標(biāo)識的拼音與所述拼音字符串之間的最小編輯距離；排序單元，用于將所述預(yù)設(shè)信息庫中所有的所述用戶標(biāo)識按照所述最小編輯距離從小到大的順序進(jìn)行排序，得到用戶標(biāo)識列表；篩選單元，用于按照從前向后的順序從所述用戶標(biāo)識列表中篩選至少一個所述用戶標(biāo)識。進(jìn)一步可選地，如上所述的裝置中，所述計(jì)算單元，具體用于：對于所述預(yù)設(shè)信息庫中的每個所述用戶標(biāo)識，計(jì)算所述用戶標(biāo)識的拼音中聲母、韻母與聲調(diào)分別與所述拼音字符串中的聲母、韻母與聲調(diào)之間的最小編輯距離；根據(jù)所述用戶標(biāo)識的拼音中所述聲母對應(yīng)的最小編輯距離、所述韻母對應(yīng)的最小編輯距離以及所述聲調(diào)對應(yīng)的最小編輯距離，得到所述用戶標(biāo)識的拼音與所述拼音字符串之間的最小編輯距離。進(jìn)一步可選地，如上所述的裝置中，所述計(jì)算單元，具體用于：將所述用戶標(biāo)識的拼音中所述聲母對應(yīng)的最小編輯距離、所述韻母對應(yīng)的最小編輯距離以及所述聲調(diào)對應(yīng)的最小編輯距離相加，得到所述用戶標(biāo)識的拼音與所述拼音字符串之間的最小編輯距離；或者將所述用戶標(biāo)識的拼音中所述聲母對應(yīng)的最小編輯距離與預(yù)設(shè)的聲母權(quán)重的乘積、所述韻母對應(yīng)的最小編輯距離與預(yù)設(shè)的韻母權(quán)重的乘積以及所述聲調(diào)對應(yīng)的最小編輯距離與預(yù)設(shè)的聲調(diào)權(quán)重的乘積相加，得到所述用戶標(biāo)識的拼音與所述拼音字符串之間的最小編輯距離。進(jìn)一步可選地，如上所述的裝置中，還包括：顯示模塊，用于向所述用戶顯示至少一個所述用戶標(biāo)識；進(jìn)一步地，所述裝置還包括：接收模塊，用于接收所述用戶從至少一個所述用戶標(biāo)識中選擇的目標(biāo)用戶標(biāo)識；處理模塊，用于根據(jù)所述目標(biāo)用戶標(biāo)識進(jìn)行相應(yīng)的處理。本發(fā)明實(shí)施例的語音識別處理裝置方法及裝置，通過解析用戶的語音信息中的用戶關(guān)鍵詞；檢測預(yù)設(shè)信息庫中是否存在與用戶關(guān)鍵詞匹配的用戶標(biāo)識；當(dāng)不存在時，獲取用戶關(guān)鍵詞對應(yīng)的拼音字符串；根據(jù)拼音字符串，從預(yù)設(shè)信息庫中識別與拼音字符串讀音相似的至少一個用戶標(biāo)識，作為語音識別處理的結(jié)果，可以優(yōu)化語音識別處理的結(jié)果，提高語音識別處理結(jié)果的精準(zhǔn)度，提高語音識別處理的效率，從而可以進(jìn)一步增強(qiáng)移動終端用戶使用便利性和體驗(yàn)度。上述說明僅是本發(fā)明技術(shù)方案的概述，為了能夠更清楚了解本發(fā)明的技術(shù)手段，而可依照說明書的內(nèi)容予以實(shí)施，并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂，以下特舉本發(fā)明的具體實(shí)施方式。附圖說明通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述，各種其他的優(yōu)點(diǎn)和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的，而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中，用相同的參考符號表示相同的部件。在附圖中：圖1為本發(fā)明實(shí)施例的語音識別處理方法的流程圖。圖2為本發(fā)明實(shí)施例的語音識別處理方法一示例圖。圖3為本發(fā)明實(shí)施例的語音識別處理方法二示例圖。圖4為本發(fā)明實(shí)施例的語音識別處理方法三示例圖。圖5為本發(fā)明實(shí)施例的語音識別處理方法四示例圖。圖6為本發(fā)明實(shí)施例的語音識別處理方法五示例圖。圖7為本發(fā)明實(shí)施例的語音識別處理裝置實(shí)施例一的結(jié)構(gòu)圖。圖8為本發(fā)明實(shí)施例的語音識別處理裝置實(shí)施例二的結(jié)構(gòu)圖。具體實(shí)施方式下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例，然而應(yīng)當(dāng)理解，可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反，提供這些實(shí)施例是為了能夠更透徹地理解本公開，并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。圖1為本發(fā)明實(shí)施例的語音識別處理方法的流程圖。如圖1所示，本實(shí)施例的語音識別處理方法，具體可以包括如下步驟：100、解析用戶的語音信息中的用戶關(guān)鍵詞；101、檢測預(yù)設(shè)信息庫中是否存在與用戶關(guān)鍵詞匹配的用戶標(biāo)識；當(dāng)不存在時，執(zhí)行步驟102；否則執(zhí)行步驟103；102、獲取用戶關(guān)鍵詞對應(yīng)的拼音字符串；執(zhí)行步驟104；103、將與用戶關(guān)鍵詞匹配的用戶標(biāo)識作為語音識別處理的結(jié)果，結(jié)束。104、根據(jù)拼音字符串，從預(yù)設(shè)信息庫中識別與拼音字符串讀音相似的至少一個用戶標(biāo)識，作為語音識別處理的結(jié)果。本實(shí)施例的語音識別處理方法的執(zhí)行主體為語音識別處理裝置，具體地，該語音識別處理裝置在使用時可以安裝在移動終端上。在本實(shí)施例中，主要對用戶的語音信息中的用戶關(guān)鍵詞進(jìn)行識別，例如用戶的語音信息“打電話給王小明”中的“王小明”，用戶的語音信息“發(fā)信息給張曉麗”中的“張曉麗”，或者用戶的語音信息中的“發(fā)視頻給美洋洋”中的“美洋洋”；具體地用戶的關(guān)鍵詞可以為用戶的名稱，或者也可以為用戶的昵稱之類的用戶標(biāo)識。由于這些用戶關(guān)鍵詞用于標(biāo)識用戶本次操作的目的用戶。當(dāng)然，用戶的具體操作的目的端也不是目的用戶，具體可以為目的用戶王小明的移動終端、張曉麗的移動終端或者美洋洋的移動終端。具體地，本實(shí)施例的預(yù)設(shè)信息庫可以為通訊錄，例如具體可以為用戶的移動終端本地的通訊錄，或者用戶的即時通訊中的通訊錄。本實(shí)施例的技術(shù)方案在實(shí)施時，當(dāng)用戶不方便使用手來操作移動終端的時候，可以通過語音向移動終端發(fā)送命令，然后由移動終端中的語音識別處理裝置解析用戶的語音信息中的用戶關(guān)鍵詞；然后檢測預(yù)設(shè)信息庫如通訊錄中是否存在與用戶關(guān)鍵詞匹配的用戶標(biāo)識，該識別過程可以認(rèn)為是初次的語音識別的處理過程。例如，可以將解析得到的關(guān)鍵詞“王小明”、“張曉麗”、或者“美洋洋”分別與通訊錄中的所有用戶標(biāo)識一一對比，看通訊錄中是都存在于用戶關(guān)鍵詞一樣的用戶標(biāo)識。此時對應(yīng)的步驟100具體可以包括如下兩個步驟：(a1)對用戶的語音信息進(jìn)行識別，得到文字信息；(a2)對文字信息進(jìn)行解析，獲取文字信息中的用戶關(guān)鍵詞?；蛘咭部梢圆挥脤⒂脩舻恼Z音信息直接識別為文字信息，而是直接得到用戶的語音信息中的所有字符的拼音；從語音信息中的所有字符的拼音中獲取用戶關(guān)鍵詞的拼音，然后檢測預(yù)設(shè)信息庫如通訊錄中是否存在于用戶關(guān)鍵詞的拼音相同的用戶標(biāo)識；如存在，將與用戶關(guān)鍵詞匹配的用戶標(biāo)識作為語音識別處理的結(jié)果。否則，獲取用戶關(guān)鍵詞對應(yīng)的拼音字符串，根據(jù)拼音字符串，從通訊庫中識別與拼音字符串讀音相似的至少一個用戶標(biāo)識，作為語音識別處理的結(jié)果，該步驟可以作為第二次的語音識別處理過程，用作對初次的語音識別處理過程的補(bǔ)充，因?yàn)槌醮蔚恼Z音識別處理過程較為粗糙，有可能導(dǎo)致無法獲取到準(zhǔn)確的語音識別處理結(jié)果，經(jīng)過第二次的語音識別處理過程，根據(jù)獲取的用戶關(guān)鍵詞的拼音字符串，從通訊庫中識別與拼音字符串讀音相似的至少一個用戶標(biāo)識，作為第二次語音識別處理的結(jié)果，本實(shí)施例的語音識別處理方法，通過解析用戶的語音信息中的用戶關(guān)鍵詞；檢測預(yù)設(shè)信息庫中是否存在與用戶關(guān)鍵詞匹配的用戶標(biāo)識；當(dāng)不存在時，獲取用戶關(guān)鍵詞對應(yīng)的拼音字符串；根據(jù)拼音字符串，從預(yù)設(shè)信息庫中識別與拼音字符串讀音相似的至少一個用戶標(biāo)識，作為語音識別處理的結(jié)果，可以優(yōu)化語音識別處理的結(jié)果，提高語音識別處理結(jié)果的精準(zhǔn)度，提高語音識別處理的效率。進(jìn)一步可選地，在上述實(shí)施例的技術(shù)方案的基礎(chǔ)上，其中的步驟104“根據(jù)拼音字符串，從預(yù)設(shè)信息庫中識別與拼音字符串讀音相似的至少一個用戶標(biāo)識”，具體可以包括如下步驟：(b1)計(jì)算預(yù)設(shè)信息庫中每個用戶標(biāo)識的拼音與拼音字符串之間的最小編輯距離；其中編輯距離(EditDistance)是指兩個字串之間，由一個轉(zhuǎn)成另一個所需的最少編輯操作次數(shù)。許可的編輯操作包括將一個字符替換成另一個字符，插入一個字符，刪除一個字符。而且編輯距離越小，兩個串的相似度越大。例如將kitten編輯轉(zhuǎn)成sitting，需要的最小編輯距離為3，具體編輯處理過程如下：sitten(k→s)sittin(e→i)sitting(→g)編輯距離的概念由俄羅斯科學(xué)家VladimirLevenshtein在1965年提出，編輯距離的算法使用了動態(tài)規(guī)劃的算法策略，該問題具備最優(yōu)子結(jié)構(gòu)，最小編輯距離包含子最小編輯距離，具體采用下列的公式：d[i,j]=0i=0orj=0min(d[i-1,j]+1,d[i,j-1]+1,d[i-1,j-1])xi=yjmin(d[i-1,j]+1,d[i,j-1]+1,d[i-1,j-1]+1)xi≠yj]]>其中d[i-1,j]+1代表字符串s2插入一個字母的編輯距離，d[i,j-1]+1代表字符串s1刪除一個字母的編輯距離；其中min(d[i-1,j]+1、d[i,j-1]+1、d[i-1,j-1])表示取三者中的最小編輯距離。當(dāng)xi＝y(tǒng)j時，不需要代價(jià)，所以和上一步d[i-1,j-1]代價(jià)相同，否則+1，接著d[i,j]是以上三者中最小的一項(xiàng)。例如要計(jì)算cafe和coffee的編輯距離。例如具體編輯處理過程，可以進(jìn)行如下的操作：cafe→cofe→coffe→coffee。具體地，可以先創(chuàng)建一個如圖2所示的6×8的表(cafe長度為4，coffee長度為6，各加2)。接著，在圖2所示的表格中填入數(shù)字，得到圖3所示的表格。按照上述最小編輯距離的計(jì)算公式，從圖3所示表格的3,3格開始，開始計(jì)算，取以下三個值的最小值：(1)如果最下方的字符等于最左方的字符，則為左下方的數(shù)字。否則為左下方的數(shù)字+1。對于3,3格來說，下方字符“c”與左方字符“c”相同，所以為0。(2)左方數(shù)字+1，例如對于3,3格來說為2；(3)下方數(shù)字+1，例如對于3,3格來說為2。經(jīng)上述處理，對圖3中的3,3格進(jìn)行最小編輯處理后的結(jié)果如圖4所示。然后依次對圖3中的每一個格進(jìn)行處理，得到圖5所示的處理結(jié)果。最后，可以取右上角，得最終編輯距離為3，圖5中標(biāo)記的路線為編輯距離的最佳路徑，需要一個替換、兩個插入操作，即：cafe→cofe→coffe→coffee。本實(shí)施例中的用戶標(biāo)識的拼音與拼音字符串之間的最小編輯距離可以理解為：將用戶標(biāo)識的拼音編輯到拼音字符串，需要的最小編輯次數(shù)，作為最小編輯距離。(b2)將預(yù)設(shè)信息庫中所有的用戶標(biāo)識按照最小編輯距離從小到大的順序進(jìn)行排序，得到用戶標(biāo)識列表；(b3)按照從前向后的順序從用戶標(biāo)識列表中篩選至少一個用戶標(biāo)識。具體地，計(jì)算出預(yù)設(shè)信息庫如通訊錄中所有的用戶標(biāo)識對應(yīng)的最小編輯距離之后，可以按照最小編輯距離由小到達(dá)的順序，將通訊錄中的所有的用戶標(biāo)識進(jìn)行排序，得到用戶標(biāo)識列表。由于最小編輯距離越小，表示通訊錄中該用戶標(biāo)識的拼音編輯為用戶關(guān)鍵詞對應(yīng)的拼音字符串的最小編輯距離越小，通訊錄中該用戶標(biāo)識的拼音與用戶關(guān)鍵詞對應(yīng)的拼音字符串越相似。這樣，按照從前向后的順序從用戶標(biāo)識列表中篩選至少一個用戶標(biāo)識，亦即從用戶標(biāo)識列表中獲取與用戶關(guān)鍵詞對應(yīng)的拼音字符串相似度最大的至少一個用戶標(biāo)識。其中至少一個用戶標(biāo)識的數(shù)量，可以根據(jù)用戶的需求預(yù)先設(shè)置，例如可以為1、也可以為2或者3或者5、或者其他正整數(shù)N。也就是說從用戶標(biāo)識列表中獲取與用戶關(guān)鍵詞對應(yīng)的拼音字符串相似度最大的前N個用戶標(biāo)識。本實(shí)施例中，通過采用拼音來計(jì)算編輯距離，例如，對于漢字來說，如果直接計(jì)算兩個漢字字符串的相近程度是不準(zhǔn)確的，比如“王小明”和“王小萌”、“王小強(qiáng)”的編輯距離都是1，即均只需一步替換操作。但是這個結(jié)果是不準(zhǔn)確的，從讀音來看，很明顯“王小萌”與“王小明”更接近，所以本實(shí)施例中需要在更小的級別上來計(jì)算在讀音時的相似度，即通過拼音來計(jì)算漢字讀音的相似度。對于拼音來說，一個拼音包含三部分：聲母、韻母和聲調(diào)，“明”的拼音為“ming2”，“萌”的拼音為“meng2”，“強(qiáng)”的拼音為“qiang2”，但是如果直接使用上述最小編輯距離算法來計(jì)算兩個拼音的相近程度，會導(dǎo)致不合理的對齊(即聲母、韻母和聲調(diào)沒有分別對齊)，本實(shí)施例中，可以將聲母、韻母、以及聲調(diào)分別對其計(jì)算各自的相似度。其中是沒有聲母的拼音，可以采用一個特殊字符表示其沒有聲母。比如“奧”，聲母部分可以用“@”代替，即拼音可以表示為“@ao4”，便于對齊并進(jìn)行計(jì)算。例如，步驟(b1)“計(jì)算預(yù)設(shè)信息庫中每個用戶標(biāo)識的拼音與拼音字符串之間的最小編輯距離”，具體可以包括：(c1)對于預(yù)設(shè)信息庫中的每個用戶標(biāo)識，計(jì)算用戶標(biāo)識的拼音中聲母、韻母與聲調(diào)分別與拼音字符串中的聲母、韻母與聲調(diào)之間的最小編輯距離；(c2)根據(jù)用戶標(biāo)識的拼音中聲母對應(yīng)的最小編輯距離、韻母對應(yīng)的最小編輯距離以及聲調(diào)對應(yīng)的最小編輯距離，得到用戶標(biāo)識的拼音與拼音字符串之間的最小編輯距離。其中步驟(c2)根據(jù)用戶標(biāo)識的拼音中聲母對應(yīng)的最小編輯距離、韻母對應(yīng)的最小編輯距離以及聲調(diào)對應(yīng)的最小編輯距離，得到用戶標(biāo)識的拼音與拼音字符串之間的最小編輯距離，具體可以包括如下兩種情況：第一種情況、將用戶標(biāo)識的拼音中聲母對應(yīng)的最小編輯距離、韻母對應(yīng)的最小編輯距離以及聲調(diào)對應(yīng)的最小編輯距離相加，得到用戶標(biāo)識的拼音與拼音字符串之間的最小編輯距離；第二種情況、將用戶標(biāo)識的拼音中聲母對應(yīng)的最小編輯距離與預(yù)設(shè)的聲母權(quán)重的乘積、韻母對應(yīng)的最小編輯距離與預(yù)設(shè)的韻母權(quán)重的乘積以及聲調(diào)對應(yīng)的最小編輯距離與預(yù)設(shè)的聲調(diào)權(quán)重的乘積相加，得到用戶標(biāo)識的拼音與拼音字符串之間的最小編輯距離。第一種情況中，默認(rèn)拼音中聲母、韻母以及聲調(diào)的權(quán)重都相同，直接將用戶標(biāo)識的拼音中聲母對應(yīng)的最小編輯距離、韻母對應(yīng)的最小編輯距離以及聲調(diào)對應(yīng)的最小編輯距離相加，作為用戶標(biāo)識的拼音與拼音字符串之間的最小編輯距離。當(dāng)預(yù)設(shè)信息庫如通訊錄中相似讀音的用戶標(biāo)識較多的時候，可能導(dǎo)致識別結(jié)果的準(zhǔn)確度較差。在第二種情況中，考慮到語音識別的時候聲母更容易出錯，所以對聲母的錯誤要包容些，預(yù)設(shè)的聲母權(quán)重可以取小一些，即可以將預(yù)設(shè)的聲母權(quán)重、預(yù)設(shè)的韻母權(quán)重和預(yù)設(shè)的聲調(diào)權(quán)重設(shè)置不同的值。例如，計(jì)算兩個拼音字符串“l(fā)iu2de2hua2”和“wang2he4hui2”的最小編輯距離，可以把拼音分成三部分：聲母、韻母和聲調(diào)，分別計(jì)算三者的最小編輯距離，最后求和。具體地，可以參考上述圖2-圖5的最小編輯距離的計(jì)算方式，得到圖6所示的最小編輯距離計(jì)算過程。如圖6所示，從右上角可以看出，聲母、韻母和聲調(diào)的最小編輯距離分別為：聲母的最小編輯距離：C_dis＝2韻母的最小編輯距離：V_dis＝2聲調(diào)的最小編輯距離：T_dis＝1那么，如圖6所示，最終的兩個拼音字符串編輯距離為：2+2+1＝5。具體地，在計(jì)算最小編輯距離時，要將聲母、韻母以及聲調(diào)分別對齊進(jìn)行計(jì)算，從而增加計(jì)算結(jié)果的準(zhǔn)確性。另外，上述操作中對替換、插入、刪除三個操作的代價(jià)值都是1，也可以通過調(diào)節(jié)取不同的值。并且，聲母，韻母、聲調(diào)的編輯距離計(jì)算也可以取不同的權(quán)值，因?yàn)樵谧R別的時候聲母更容易出錯，所以對聲母的錯誤要包容些，例如聲母、韻母和聲調(diào)的權(quán)重可以分別為：預(yù)設(shè)的聲母權(quán)重：C_weight＝0.2預(yù)設(shè)的韻母權(quán)重：V_weight＝0.4預(yù)設(shè)的聲調(diào)權(quán)重：T_weight＝0.4那么，最終的最小編輯距離為：C_weight*C_dis+V_weight*V_dis+T_weight*T_dis＝0.2*2+0.4*2+0.4*1＝1.6。同理，在最終的最小編輯距離計(jì)算時，需要將聲母，韻母、聲調(diào)對齊，分別計(jì)算之后，再求和，得到整體的最小編輯距離。在上述實(shí)施例的步驟104“根據(jù)拼音字符串，從預(yù)設(shè)信息庫中獲取與拼音字符串讀音相似的至少一個用戶標(biāo)識，作為語音識別處理的結(jié)果”之后，還可以包括如下步驟：(d1)向用戶顯示至少一個用戶標(biāo)識；(d2)接收用戶從至少一個用戶標(biāo)識中選擇的目標(biāo)用戶標(biāo)識；(d3)根據(jù)目標(biāo)用戶標(biāo)識進(jìn)行相應(yīng)的處理。例如，具體可以通過移動終端的顯示屏顯示至少一個用戶標(biāo)識，這樣，當(dāng)用戶看到至少一個用戶標(biāo)識，可以從其中選擇一個作為做出要進(jìn)行處理的目標(biāo)用戶標(biāo)識。然后根據(jù)目標(biāo)用戶標(biāo)識撥打電話、發(fā)送短信息或者發(fā)送視頻信息等等其他相應(yīng)的處理。上述實(shí)施例的語音識別處理方法，通過采用上述技術(shù)方案，可以優(yōu)化語音識別處理的結(jié)果，提高語音識別處理結(jié)果的精準(zhǔn)度，提高語音識別處理的效率，從而可以進(jìn)一步增強(qiáng)移動終端用戶使用便利性和體驗(yàn)度。圖7為本發(fā)明實(shí)施例的語音識別處理裝置實(shí)施例一的結(jié)構(gòu)圖。如圖7所示，本實(shí)施例的語音識別處理裝置，具體可以包括：解析模塊10、檢測模塊11、獲取模塊12和識別模塊13。其中解析模塊10用于解析用戶的語音信息中的用戶關(guān)鍵詞；檢測模塊11用于檢測預(yù)設(shè)信息庫中是否存在與解析模塊10解析得到的用戶關(guān)鍵詞匹配的用戶標(biāo)識；獲取模塊12用于當(dāng)檢測模塊11檢測不存在時，獲取用戶關(guān)鍵詞對應(yīng)的拼音字符串；識別模塊13用于根據(jù)獲取模塊12獲取的拼音字符串，從預(yù)設(shè)信息庫中識別與拼音字符串讀音相似的至少一個用戶標(biāo)識，作為語音識別處理的結(jié)果。本實(shí)施例的語音識別處理裝置，通過采用上述模塊實(shí)現(xiàn)語音識別的處理與上述相關(guān)方法實(shí)施例的實(shí)現(xiàn)機(jī)制以及技術(shù)效果相同，詳細(xì)可以參考上述相關(guān)方法實(shí)施例的記載，在此不再贅述。圖8為本發(fā)明實(shí)施例的語音識別處理裝置實(shí)施例二的結(jié)構(gòu)圖。如圖8所示，本實(shí)施例的語音識別處理裝置，在上述圖7所示實(shí)施例的技術(shù)方案的基礎(chǔ)上，進(jìn)一步更加詳細(xì)地描述本發(fā)明的技術(shù)方案。本實(shí)施例的語音識別處理裝置中，解析模塊10具體用于：對用戶的語音信息進(jìn)行識別，得到文字信息；對文字信息進(jìn)行解析，獲取文字信息中的用戶關(guān)鍵詞。如圖8所示，本實(shí)施例的語音識別處理裝置中，識別模塊13具體包括：計(jì)算單元131、排序單元132和篩選單元133。其中計(jì)算單元131用于計(jì)算預(yù)設(shè)信息庫中每個用戶標(biāo)識的拼音與獲取模塊12獲取的拼音字符串之間的最小編輯距離；排序單元132用于根據(jù)計(jì)算單元131的計(jì)算結(jié)果，將預(yù)設(shè)信息庫中所有的用戶標(biāo)識按照最小編輯距離從小到大的順序進(jìn)行排序，得到用戶標(biāo)識列表；篩選單元133用于根據(jù)排序單元132排序得到的用戶標(biāo)識列表，按照從前向后的順序從用戶標(biāo)識列表中篩選至少一個用戶標(biāo)識。進(jìn)一步可選地本實(shí)施例的語音識別處理裝置中，計(jì)算單元131具體用于：對于預(yù)設(shè)信息庫中的每個用戶標(biāo)識，計(jì)算用戶標(biāo)識的拼音中聲母、韻母與聲調(diào)分別與獲取模塊12獲取的拼音字符串中的聲母、韻母與聲調(diào)之間的最小編輯距離；根據(jù)用戶標(biāo)識的拼音中聲母對應(yīng)的最小編輯距離、韻母對應(yīng)的最小編輯距離以及聲調(diào)對應(yīng)的最小編輯距離，得到用戶標(biāo)識的拼音與拼音字符串之間的最小編輯距離。進(jìn)一步可選地本實(shí)施例的語音識別處理裝置中，計(jì)算單元131具體用于：將用戶標(biāo)識的拼音中聲母對應(yīng)的最小編輯距離、韻母對應(yīng)的最小編輯距離以及聲調(diào)對應(yīng)的最小編輯距離相加，得到用戶標(biāo)識的拼音與拼音字符串之間的最小編輯距離；或者將用戶標(biāo)識的拼音中聲母對應(yīng)的最小編輯距離與預(yù)設(shè)的聲母權(quán)重的乘積、韻母對應(yīng)的最小編輯距離與預(yù)設(shè)的韻母權(quán)重的乘積以及聲調(diào)對應(yīng)的最小編輯距離與預(yù)設(shè)的聲調(diào)權(quán)重的乘積相加，得到用戶標(biāo)識的拼音與拼音字符串之間的最小編輯距離。進(jìn)一步可選地本實(shí)施例的語音識別處理裝置中，還包括：顯示模塊14、接收模塊15和處理模塊16。其中顯示模塊14用于向用戶顯示篩選單元133得到的至少一個用戶標(biāo)識；接收模塊15用于接收用戶從顯示模塊14顯示的至少一個用戶標(biāo)識中選擇的目標(biāo)用戶標(biāo)識；處理模塊16用于根據(jù)接收模塊15接收的目標(biāo)用戶標(biāo)識進(jìn)行相應(yīng)的處理。本實(shí)施例的語音識別處理裝置，通過采用上述模塊實(shí)現(xiàn)語音識別的處理與上述相關(guān)方法實(shí)施例的實(shí)現(xiàn)機(jī)制以及技術(shù)效果相同，詳細(xì)可以參考上述相關(guān)方法實(shí)施例的記載，在此不再贅述。上述說明示出并描述了本申請的若干優(yōu)選實(shí)施例，但如前所述，應(yīng)當(dāng)理解本申請并非局限于本文所披露的形式，不應(yīng)看作是對其他實(shí)施例的排除，而可用于各種其他組合、修改和環(huán)境，并能夠在本文所述發(fā)明構(gòu)想范圍內(nèi)，通過上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識進(jìn)行改動。而本領(lǐng)域人員所進(jìn)行的改動和變化不脫離本申請的精神和范圍，則都應(yīng)在本申請所附權(quán)利要求的保護(hù)范圍內(nèi)。當(dāng)前第1頁1 2 3

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3