專利名稱:語音識別裝置和語音識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音識別技術(shù)領(lǐng)域,具體而言,涉及一種語音識別裝置和語音識別方法。
背景技術(shù):
在數(shù)據(jù)庫多維立方體查詢時需要各種語音命令(有限的幾個命令),但是在嘈雜的環(huán)境下通過現(xiàn)有的語音識別,可能把一個不相關(guān)的發(fā)音(噪音和其他的人的聲音)翻譯為語首命令。在語音命令識別中,算法只是在語法樹中找到發(fā)音最相似的問題,但是在現(xiàn)實生活中經(jīng)常出現(xiàn)不在命令范圍內(nèi)的發(fā)音(噪音和其他人的聲音)等,這時有相當(dāng)大的風(fēng)險會把背景聲音識別為命令。因此,需要一種新的語音識別技術(shù),能夠通過二次識別語音數(shù)據(jù),減少將噪音識別為語音命令的風(fēng)險,提高執(zhí)行命令的準確度。
發(fā)明內(nèi)容
本發(fā)明正是基于上述問題,提出了一種語音識別技術(shù),能夠通過二次識別語音數(shù)據(jù),減少將噪音識別為語音命令的風(fēng)險,提高執(zhí)行命令的準確度。有鑒于此,本發(fā)明提出了一種語音識別裝置,包括:語音識別單元,用于識別用戶語音生成語音數(shù)據(jù);第一查詢單元,用于根據(jù)所述語音數(shù)據(jù)在第一語音識別庫中查詢相匹配的第一語音指令;第一判斷單元,用于判斷所述第一語音指令的置信度是否大于第一閾值;第二查詢單元,用于在所述第一判斷單元的判斷結(jié)果為否的情況下,根據(jù)所述語音數(shù)據(jù)在第二語音識別庫中查詢相匹配的第二語音指令;計算單元,用于通過預(yù)設(shè)算法計算所述第一語音指令與所述第二語音指令的相似性;第二判斷單元,用于判斷所述相似性是否大于第二閾值,若小于,則判定所述語音數(shù)據(jù)為噪音數(shù)據(jù);指令執(zhí)行單元,用于在所述第一判斷單元或所述第二判斷單元的判斷結(jié)果為是的情況下,執(zhí)行所述第一語音指令。在該技術(shù)方案中,在第一語音識別庫中查詢到第一語音指令后,可以確定第一語音指令的置信度,即語音數(shù)據(jù)與第一語音指令的相似度,相似度越高,置信度越高,反之亦然,當(dāng)置信度低于第一閾值時,則認為語音數(shù)據(jù)是噪音數(shù)據(jù)的可能性較大,從而在第二語音識別庫中查詢第二語音指令,然后計算第一語音指令與第二語音指令的相似性,如果該相似性大于第二閾值,則認為第一語音指令與第二語音指令差距較小,在較大程度上可以判定第一語音指令是準確的,如果該相似性小于第二閾值,說明第一語音指令與第二語音指令差距較大,第一語音指令很大可能由噪音數(shù)據(jù)錯誤生成,即判定上述語音數(shù)據(jù)為噪音數(shù)據(jù)。通過二次識別語音數(shù)據(jù),可以準確地判斷語音數(shù)據(jù)是否是噪音數(shù)據(jù),從而降低將噪音識別為語音命令的風(fēng)險,提高執(zhí)行命令的準確度。在上述技術(shù)方案中,優(yōu)選地,所述計算單元通過余弦相似性比較算法、修正的余弦相似性比較算法或相關(guān)相似性比較算法計算所述第一語音指令與所述第二語音指令的相似性。在上述技術(shù)方案中,優(yōu)選地,所述第二語音識別庫中的詞匯數(shù)據(jù)量大于所述第一語音識別庫中的詞匯數(shù)據(jù)量。在該技術(shù)方案中,第一語音識別庫可以是一個較小的語法庫,比如指令語法庫,在其中查詢語音數(shù)據(jù)只能僵硬地生成語音指令數(shù)據(jù),第二語音識別庫可以是一個較大的語法庫,比如自然語法庫,在其中查詢語音數(shù)據(jù)可以比較準確地生成相應(yīng)的語音指令。根據(jù)一條語音數(shù)據(jù)在指令語法庫中進行查詢可以生成一條指令,如果該指令的置信度小于第一閾值,則根據(jù)該語音數(shù)據(jù)在自然語法庫中查詢可以生成一段語句(不一定是指令),這段語句相對于上述指令更接近于該語音數(shù)據(jù),當(dāng)該語句與該指令的相似性大于第二閾值時,則可以判定該指令接近于語音數(shù)據(jù),可以執(zhí)行,如果小于第二閾值,則指令很大可能由噪音數(shù)據(jù)錯誤生成,即判定上述語音數(shù)據(jù)為噪音數(shù)據(jù)。在上述任一技術(shù)方案中,優(yōu)選地,還包括:設(shè)置單元,用于根據(jù)接收到的設(shè)置指令設(shè)置所述第一閾值和/或所述第二閾值。在該技術(shù)方案中,用戶可以根據(jù)具體情況設(shè)置第一閾值和/或第二閾值。在上述任一技術(shù)方案中,優(yōu)選地,還包括:顯示單元,用于在所述第二判斷單元判定所述語音數(shù)據(jù)為噪音數(shù)據(jù)時,顯示所述第一語音指令與所述第二語音指令。在該技術(shù)方案中,若第一語音指令與第二語音指令的相似度小于第二閾值,則可以顯示第一語音指令與第二語音指令,以便用戶人工判斷語音數(shù)據(jù)是否的確為噪音。本發(fā)明還提出了一種語音識別方法,包括:步驟202,識別用戶語音生成語音數(shù)據(jù),根據(jù)所述語音數(shù)據(jù)在第一語音識別庫中查詢相匹配的第一語音指令;步驟204,判斷所述第一語音指令的置信度是否大于第一閾值,若大于,則執(zhí)行所述第一語音指令,若小于,則根據(jù)所述語音數(shù)據(jù)在第二語音識別庫中查詢相匹配的第二語音指令;步驟206,通過預(yù)設(shè)算法計算所述第一語音指令與所述第二語音指令的相似性,并判斷所述相似性是否大于第二閾值,若大于,則執(zhí)行所述第一語音指令,若小于,則判定所述語音數(shù)據(jù)為噪音數(shù)據(jù)。在該技術(shù)方案中,在第一語音識別庫中查詢到第一語音指令后,可以確定第一語音指令的置信度,即語音數(shù)據(jù)與第一語音指令的相似度,相似度越高,置信度越高,反之亦然,當(dāng)置信度低于第一閾值時,則認為語音數(shù)據(jù)是噪音數(shù)據(jù)的可能性較大,從而在第二語音識別庫中查詢第二語音指令,然后計算第一語音指令與第二語音指令的相似性,如果該相似性大于第二閾值,則認為第一語音指令與第二語音指令差距較小,在較大程度上可以判定第一語音指令是準確的,如果該相似性小于第二閾值,說明第一語音指令與第二語音指令差距較大,第一語音指令很大可能由噪音數(shù)據(jù)錯誤生成,即判定上述語音數(shù)據(jù)為噪音數(shù)據(jù)。通過二次識別語音數(shù)據(jù),可以準確地判斷語音數(shù)據(jù)是否是噪音數(shù)據(jù),從而降低將噪音識別為語音命令的風(fēng)險,提高執(zhí)行命令的準確度。在上述技術(shù)方案中,優(yōu)選地,所述步驟206包括:通過余弦相似性比較算法、修正的余弦相似性比較算法或相關(guān)相似性比較算法計算所述第一語音指令與所述第二語音指令的相似性。在上述技術(shù)方案中,優(yōu)選地,所述第二語音識別庫中的詞匯數(shù)據(jù)量大于所述第一語音識別庫中的詞匯數(shù)據(jù)量。在該技術(shù)方案中,第一語音識別庫可以是一個較小的語法庫,比如指令語法庫,在其中查詢語音數(shù)據(jù)只能僵硬地生成語音指令數(shù)據(jù),第二語音識別庫可以是一個較大的語法庫,比如自然語法庫,在其中查詢語音數(shù)據(jù)可以比較準確地生成相應(yīng)的語音指令。根據(jù)一條語音數(shù)據(jù)在指令語法庫中進行查詢可以生成一條指令,如果該指令的置信度小于第一閾值,則根據(jù)該語音數(shù)據(jù)在自然語法庫中查詢可以生成一段語句(不一定是指令),這段語句相對于上述指令更接近于該語音數(shù)據(jù),當(dāng)該語句與該指令的相似性大于第二閾值時,則可以判定該指令接近于語音數(shù)據(jù),可以執(zhí)行,如果小于第二閾值,則指令很大可能由噪音數(shù)據(jù)錯誤生成,即判定上述語音數(shù)據(jù)為噪音數(shù)據(jù)。在上述任一技術(shù)方案中,優(yōu)選地,還包括:根據(jù)接收到的設(shè)置指令設(shè)置所述第一閾值和/或所述第二閾值。在該技術(shù)方案中,用戶可以根據(jù)具體情況設(shè)置第一閾值和/或第二閾值。在上述任一技術(shù)方案中,優(yōu)選地,還包括:在判定所述語音數(shù)據(jù)為噪音數(shù)據(jù)時,顯示所述第一語音指令與所述第二語音指令。在該技術(shù)方案中,若第一語音指令與第二語音指令的相似度小于第二閾值,則可以顯示第一語音指令與第二語音指令,以便用戶人工判斷語音數(shù)據(jù)是否的確為噪音。通過以上技術(shù)方案,可以通過二次識別語音數(shù)據(jù),減少將噪音識別為語音命令的風(fēng)險,提高執(zhí)行命令的準確度。
圖1示出了根據(jù)本發(fā)明的實施例的語音識別裝置的框圖;圖2示出了根據(jù)本發(fā)明的實施例的語音識別方法的流程圖;圖3示出了根據(jù)本發(fā)明的實施例的語音識別方法的具體流程圖。
具體實施例方式為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點,下面結(jié)合附圖和具體實施方式
對本發(fā)明進行進一步的詳細描述。需要說明的是,在不沖突的情況下,本申請的實施例及實施例中的特征可以相互組合。在下面的描述中闡述了很多具體細節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可以采用其他不同于在此描述的其他方式來實施,因此,本發(fā)明的保護范圍并不受下面公開的具體實施例的限制。圖1示出了根據(jù)本發(fā)明的實施例的語音識別裝置的框圖。如圖1所示,根據(jù)本發(fā)明的實施例的語音識別裝置100包括:語音識別單元102,用于識別用戶語音生成語音數(shù)據(jù);第一查詢單元104,用于根據(jù)語音數(shù)據(jù)在第一語音識別庫中查詢相匹配的第一語音指令;第一判斷單元106,用于判斷第一語音指令的置信度是否大于第一閾值;第二查詢單元108,用于在第一判斷單元106的判斷結(jié)果為否的情況下,根據(jù)語音數(shù)據(jù)在第二語音識別庫中查詢相匹配的第二語音指令;計算單元110,用于通過預(yù)設(shè)算法計算第一語音指令與第二語音指令的相似性;第二判斷單元112,用于判斷相似性是否大于第二閾值,若小于,則判定語音數(shù)據(jù)為噪音數(shù)據(jù);指令執(zhí)行單元114,用于在第一判斷單元106或第二判斷單元112的判斷結(jié)果為是的情況下,執(zhí)行第一語音指令。在第一語音識別庫中查詢到第一語音指令后,可以確定第一語音指令的置信度,即語音數(shù)據(jù)與第一語音指令的相似度,相似度越高,置信度越高,反之亦然,當(dāng)置信度低于第一閾值時,則認為語音數(shù)據(jù)是噪音數(shù)據(jù)的可能性較大,從而在第二語音識別庫中查詢第二語音指令,然后計算第一語音指令與第二語音指令的相似性,如果該相似性大于第二閾值,則認為第一語音指令與第二語音指令差距較小,在較大程度上可以判定第一語音指令是準確的,如果該相似性小于第二閾值,說明第一語音指令與第二語音指令差距較大,第一語音指令很大可能由噪音數(shù)據(jù)錯誤生成,即判定上述語音數(shù)據(jù)為噪音數(shù)據(jù)。通過二次識別語音數(shù)據(jù),可以準確地判斷語音數(shù)據(jù)是否是噪音數(shù)據(jù),從而降低將噪音識別為語音命令的風(fēng)險,提高執(zhí)行命令的準確度。優(yōu)選地,計算單元110通過余弦相似性比較算法、修正的余弦相似性比較算法或相關(guān)相似性比較算法計算第一語音指令與第二語音指令的相似性。優(yōu)選地,第二語音識別庫中的詞匯數(shù)據(jù)量大于第一語音識別庫中的詞匯數(shù)據(jù)量。第一語音識別庫可以是一個較小的語法庫,比如指令語法庫,在其中查詢語音數(shù)據(jù)只能僵硬地生成語音指令數(shù)據(jù),第二語音識別庫可以是一個較大的語法庫,比如自然語法庫,在其中查詢語音數(shù)據(jù)可以比較準確地生成相應(yīng)的語音指令。根據(jù)一條語音數(shù)據(jù)在指令語法庫中進行查詢可以生成一條指令,如果該指令的置信度小于第一閾值,則根據(jù)該語音數(shù)據(jù)在自然語法庫中查詢可以生成一段語句(不一定是指令),這段語句相對于上述指令更接近于該語音數(shù)據(jù),當(dāng)該語句與該指令的相似性大于第二閾值時,則可以判定該指令接近于語音數(shù)據(jù),可以執(zhí)行,如果小于第二閾值,則指令很大可能由噪音數(shù)據(jù)錯誤生成,即判定上述語音數(shù)據(jù)為噪音數(shù)據(jù)。優(yōu)選地,還包括:設(shè)置單元116,用于根據(jù)接收到的設(shè)置指令設(shè)置第一閾值和/或第二閾值。用戶可以根據(jù)具體情況設(shè)置第一閾值和/或第二閾值。優(yōu)選地,還包括:顯示單元118,用于在第二判斷單元112判定所述語音數(shù)據(jù)為噪音數(shù)據(jù)時,顯示所述第一語音指令與所述第二語音指令。若第一語音指令與第二語音指令的相似度小于第二閾值,則可以顯示第一語音指令與第二語音指令,以便用戶人工判斷語音數(shù)據(jù)是否的確為噪音。圖2示出了根據(jù)本發(fā)明的實施例的語音識別方法的流程圖。如圖2所示,根據(jù)本發(fā)明的實施例的語音識別方法包括:步驟202,識別用戶語音生成語音數(shù)據(jù),根據(jù)語音數(shù)據(jù)在第一語音識別庫中查詢相匹配的第一語音指令;步驟204,判斷第一語音指令的置信度是否大于第一閾值,若大于,則執(zhí)行第一語音指令,若小于,則根據(jù)語音數(shù)據(jù)在第二語音識別庫中查詢相匹配的第二語音指令;步驟206,通過預(yù)設(shè)算法計算第一語音指令與第二語音指令的相似性,并判斷相似性是否大于第二閾值,若大于,則執(zhí)行第一語音指令,若小于,則判定語音數(shù)據(jù)為噪音數(shù)據(jù)。在第一語音識別庫中查詢到第一語音指令后,可以確定第一語音指令的置信度,即語音數(shù)據(jù)與第一語音指令的相似度,相似度越高,置信度越高,反之亦然,當(dāng)置信度低于第一閾值時,則認為語音數(shù)據(jù)是噪音數(shù)據(jù)的可能性較大,從而在第二語音識別庫中查詢第二語音指令,然后計算第一語音指令與第二語音指令的相似性,如果該相似性大于第二閾值,則認為第一語音指令與第二語音指令差距較小,在較大程度上可以判定第一語音指令是準確的,如果該相似性小于第二閾值,說明第一語音指令與第二語音指令差距較大,第一語音指令很大可能由噪音數(shù)據(jù)錯誤生成,即判定上述語音數(shù)據(jù)為噪音數(shù)據(jù)。通過二次識別語音數(shù)據(jù),可以準確地判斷語音數(shù)據(jù)是否是噪音數(shù)據(jù),從而降低將噪音識別為語音命令的風(fēng)險,提高執(zhí)行命令的準確度。優(yōu)選地,步驟206包括:通過余弦相似性比較算法、修正的余弦相似性比較算法或相關(guān)相似性比較算法計算第一語音指令與第二語音指令的相似性。優(yōu)選地,第二語音識別庫中的詞匯數(shù)據(jù)量大于第一語音識別庫中的詞匯數(shù)據(jù)量。第一語音識別庫可以是一個較小的語法庫,比如指令語法庫,在其中查詢語音數(shù)據(jù)只能僵硬地生成語音指令數(shù)據(jù),第二語音識別庫可以是一個較大的語法庫,比如自然語法庫,在其中查詢語音數(shù)據(jù)可以比較準確地生成相應(yīng)的語音指令。根據(jù)一條語音數(shù)據(jù)在指令語法庫中進行查詢可以生成一條指令,如果該指令的置信度小于第一閾值,則根據(jù)該語音數(shù)據(jù)在自然語法庫中查詢可以生成一段語句(不一定是指令),這段語句相對于上述指令更接近于該語音數(shù)據(jù),當(dāng)該語句與該指令的相似性大于第二閾值時,則可以判定該指令接近于語音數(shù)據(jù),可以執(zhí)行,如果小于第二閾值,則指令很大可能由噪音數(shù)據(jù)錯誤生成,即判定上述語音數(shù)據(jù)為噪音數(shù)據(jù)。優(yōu)選地,還包括:根據(jù)接收到的設(shè)置指令設(shè)置第一閾值和/或第二閾值。用戶可以根據(jù)具體情況設(shè)置第一閾值和/或第二閾值。優(yōu)選地,還包括:在判定語音數(shù)據(jù)為噪音數(shù)據(jù)時,顯示第一語音指令與第二語音指令。若第一語音指令與第二語音指令的相似度小于第二閾值,則可以顯示第一語音指令與第二語音指令,以便用戶人工判斷語音數(shù)據(jù)是否的確為噪音。圖3示出了根據(jù)本發(fā)明的實施例的語音識別方法的具體流程圖。如圖3所示,根據(jù)本發(fā)明的實施例的語音識別方法具體包括:步驟302,識別用戶語音,得到語音數(shù)據(jù),并根據(jù)該語音數(shù)據(jù)在指令語法庫中查詢相應(yīng)的語音指令;步驟304,判斷語音指令的置信度是否大于第一閾值,若大于,則進入步驟312 ;步驟306,若小于,則根據(jù)語音數(shù)據(jù),在自然語法庫中查詢相應(yīng)的自然語句,其中,自然語法庫包含指令語法庫,即通過自然語法庫查詢到的自然語句,相對于通過指令語法庫查詢到的語音指令更接近于語音數(shù)據(jù);步驟308,通過余弦算法計算語音指令與自然語句的相似度;步驟310,判斷相似度是否大于第二閾值,其中,第一閾值和第二閾值在一定程度上反映了語音識別的準確性,閥值的準確性可以通過采集大量的實驗數(shù)據(jù)進行合理的設(shè)置;步驟312,若相似度大于第二閾值,說明語音指令和自然語句接近,判定語音指令是準確地,執(zhí)行語音指令;步驟314,若相似度小于第二閾值,說明說明語音指令和自然語句差距較大,判定語音指令是根據(jù)噪聲數(shù)據(jù)誤生成的,拒絕執(zhí)行語音指令。具體地,比如指令語法庫包含以下命令集合:NoCommand= “系統(tǒng)沒能明白您說的話”;
ClearCommand= “清空,,;OpenHelpCommand= “語法幫助”;OpenHelpCommand2= “打開語法幫助”;CloseHelpCommand= “關(guān)閉語法幫助”;PreTalkCommand= “ 上一個”;NextTalkCommand= “下一個”;PrePageCommand= “ 向前一頁”;NextPageCommand= “ 向后一頁”;RemoveOneCommand= “刪除”;ExportHiStoryCommand= “導(dǎo)出歷史記錄”;OkComniand= “確認”;CancelCommandl= “取消,,;BackCommand= “返回”;其中,第一閾值為0.7,第二閾值為0.8。當(dāng)采集到用戶所在環(huán)境中的一句話為:“吃飽了”,在指令語法庫中查詢到的最接近的語音命令為:“取消”。經(jīng)過判斷,該語音指令的置信度為0.3,小于第一閾值,則在自然語法庫中進一步查詢,得到最接近的單詞是“知道了”,從發(fā)音上分析:實際發(fā)音chi bao le,與查詢到的發(fā)音zhi dao Ie更為接近,然后通過余弦算法計算“知道了”和“取消”的相似性值為0.5,小于第二閾值,顯然“取消”和“知道了”的差別較大,從而可以判斷所識別到發(fā)音是一個噪音,拒絕執(zhí)行命令。以上結(jié)合附圖詳細說明了本發(fā)明的技術(shù)方案,考慮到相關(guān)技術(shù)中,在數(shù)據(jù)庫多維立方體查詢時需要各種語音命令,但是在嘈雜的環(huán)境下通過現(xiàn)有的語音識別,可能把一個不相關(guān)的發(fā)音(噪音)翻譯為語音命令。通過本發(fā)明的技術(shù)方案,能夠通過二次識別語音數(shù)據(jù),減少將噪音識別為語音命令的風(fēng)險,提高執(zhí)行命令的準確度。在本發(fā)明中,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對重要性。術(shù)語“多個”指兩個或兩個以上,除非另有明確的限定。以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
1.一種語音識別裝置,其特征在于,包括: 語音識別單元,用于識別用戶語音生成語音數(shù)據(jù); 第一查詢單元,用于根據(jù)所述語音數(shù)據(jù)在第一語音識別庫中查詢相匹配的第一語音指令; 第一判斷單元,用于判斷所述第一語音指令的置信度是否大于第一閾值; 第二查詢單元,用于在所述第一判斷單元的判斷結(jié)果為否的情況下,根據(jù)所述語音數(shù)據(jù)在第二語音識別庫中查詢相匹配的第二語音指令; 計算單元,用于通過預(yù)設(shè)算法計算所述第一語音指令與所述第二語音指令的相似性; 第二判斷單元,用于判斷所述相似性是否大于第二閾值,若小于,則判定所述語音數(shù)據(jù)為噪音數(shù)據(jù); 指令執(zhí)行單元,用于在所述第一判斷單元或所述第二判斷單元的判斷結(jié)果為是的情況下,執(zhí)行所述第一語音指令。
2.根據(jù)權(quán)利要求1所述的語音識別裝置,其特征在于,所述計算單元通過余弦相似性比較算法、修正的余弦相似性比較算法或相關(guān)相似性比較算法計算所述第一語音指令與所述第二語音指令的相似性。
3.根據(jù)權(quán)利要求1所述的語音識別裝置,其特征在于,所述第二語音識別庫中的詞匯數(shù)據(jù)量大于所述第一語音識別庫中的詞匯數(shù)據(jù)量。
4.根據(jù)權(quán)利要求1至3中任一項所述的語音識別裝置,其特征在于,還包括:` 設(shè)置單元,用于根據(jù)接收到的設(shè)置指令設(shè)置所述第一閾值和/或所述第二閾值。
5.根據(jù)權(quán)利要求1至3中任一項所述的語音識別裝置,其特征在于,還包括: 顯示單元,用于在所述第二判斷單元判定所述語音數(shù)據(jù)為噪音數(shù)據(jù)時,顯示所述第一語音指令與所述第二語音指令。
6.一種語音識別方法,其特征在于,包括: 步驟202,識別用戶語音生成語音數(shù)據(jù),根據(jù)所述語音數(shù)據(jù)在第一語音識別庫中查詢相匹配的第一語音指令; 步驟204,判斷所述第一語音指令的置信度是否大于第一閾值,若大于,則執(zhí)行所述第一語音指令,若小于,則根據(jù)所述語音數(shù)據(jù)在第二語音識別庫中查詢相匹配的第二語音指令; 步驟206,通過預(yù)設(shè)算法計算所述第一語音指令與所述第二語音指令的相似性,并判斷所述相似性是否大于第二閾值,若大于,則執(zhí)行所述第一語音指令,若小于,則判定所述語音數(shù)據(jù)為噪音數(shù)據(jù)。
7.根據(jù)權(quán)利要求6所述的語音識別方法,其特征在于,所述步驟206包括:通過余弦相似性比較算法、修正的余弦相似性比較算法或相關(guān)相似性比較算法計算所述第一語音指令與所述第二語音指令的相似性。
8.根據(jù)權(quán)利要求6所述的語音識別方法,其特征在于,所述第二語音識別庫中的詞匯數(shù)據(jù)量大于所述第一語音識別庫中的詞匯數(shù)據(jù)量。
9.根據(jù)權(quán)利要求6至8中任一項所述的語音識別方法,其特征在于,還包括:根據(jù)接收到的設(shè)置指令設(shè)置所述第一閾值和/或所述第二閾值。
10.根據(jù)權(quán)利要求6至8中任一項所述的語音識別方法,其特征在于,還包括:在判定所述語音數(shù)據(jù)為噪音數(shù)據(jù)時, 顯示所述第一語音指令與所述第二語音指令。
全文摘要
本發(fā)明提供了一種語音識別裝置包括語音識別單元,識別用戶語音生成語音數(shù)據(jù);第一查詢單元,在第一語音識別庫中查詢相匹配的第一語音指令;第一判斷單元,判斷第一語音指令的置信度是否大于第一閾值;第二查詢單元,在判定小于的情況下,在第二語音識別庫中查詢相匹配的第二語音指令;計算單元,計算第一語音指令與第二語音指令的相似性;第二判斷單元,判斷相似性是否大于第二閾值,若小于,則判定語音數(shù)據(jù)為噪音數(shù)據(jù);指令執(zhí)行單元,在第一判斷單元或第二判斷單元大于的情況下,執(zhí)行第一語音指令。本發(fā)明還提出了一種語音識別方法。通過本發(fā)明的技術(shù)方案,通過二次識別語音數(shù)據(jù),減少將噪音識別為語音命令的風(fēng)險,提高執(zhí)行命令的準確度。
文檔編號G10L15/26GK103106900SQ20131006284
公開日2013年5月15日 申請日期2013年2月28日 優(yōu)先權(quán)日2013年2月28日
發(fā)明者王杰 申請人:用友軟件股份有限公司