一種語音命令處理方法以及系統(tǒng)的制作方法
【專利摘要】本發(fā)明實(shí)施例公開了一種語音命令處理方法以及系統(tǒng),用于提高用戶語音命令輸入的響應(yīng)效率,改善用戶體驗(yàn)。本發(fā)明實(shí)施例包括:獲取用于業(yè)務(wù)請(qǐng)求的語音命令;根據(jù)語音命令,提取語音特征序列;根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)語音命令進(jìn)行解碼,確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別;確定與業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò);根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行二次解碼,確定語音命令的完整內(nèi)容。
【專利說明】一種語音命令處理方法以及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通訊和計(jì)算機(jī)【技術(shù)領(lǐng)域】,尤其是涉及一種語音命令處理方法以及系統(tǒng)。
【背景技術(shù)】
[0002]在現(xiàn)有語音命令控制系統(tǒng)中,系統(tǒng)接收用戶輸入的語音命令信號(hào)并提取相應(yīng)的聲學(xué)特征序列;隨后系統(tǒng)在預(yù)設(shè)的命令詞解碼網(wǎng)絡(luò)中搜索相應(yīng)于所述聲學(xué)特征序列的最優(yōu)路徑,獲取用戶命令內(nèi)容。所述預(yù)設(shè)的命令詞解碼網(wǎng)絡(luò)通常由系統(tǒng)支持的所有語音命令及相應(yīng)的語音命令參數(shù)確定。也就是說對(duì)用戶的語音輸入,系統(tǒng)需要在一個(gè)完整的命令詞解碼網(wǎng)絡(luò)內(nèi)計(jì)算所有可能路徑的概率,確定最優(yōu)的識(shí)別結(jié)果。顯然隨著語音命令控制系統(tǒng)支持的語音響應(yīng)功能日益增多,解碼網(wǎng)絡(luò)規(guī)模也日漸擴(kuò)大,在所述命令詞解碼網(wǎng)絡(luò)內(nèi)解碼的運(yùn)行效率也會(huì)受到一定影響。
[0003]特別是對(duì)用戶簡單的操作命令,如“打電話給張三”等,由于系統(tǒng)依然需要對(duì)所有語音命令及相關(guān)參數(shù)解碼,從而耽誤了時(shí)間,大大影響了用戶體驗(yàn);可一并參考圖1所示的一種現(xiàn)有命令詞解碼網(wǎng)絡(luò)的詞級(jí)示意圖,對(duì)用戶的語音命令輸入,系統(tǒng)需要從起始節(jié)點(diǎn)開始,逐幀計(jì)算所述提取的聲學(xué)特征序列和所有語音命令及相關(guān)參數(shù)對(duì)應(yīng)模型的相似度;如對(duì)“打電話給張三”的語音命令輸入,系統(tǒng)需要在“打電話”命令相關(guān)的路徑、“導(dǎo)航到”命令相關(guān)的路徑、“點(diǎn)播”命令相關(guān)的路徑及其他命令相關(guān)的路徑構(gòu)成的空間內(nèi)計(jì)算聲學(xué)特征序列的相似度。該傳統(tǒng)系統(tǒng)在整體網(wǎng)絡(luò)內(nèi)解碼的方式容易導(dǎo)致系統(tǒng)響應(yīng)較慢,特別是對(duì)具有小規(guī)模語音參數(shù)的命令輸入,其解碼時(shí)間容易超過用戶預(yù)期,進(jìn)而影響用戶體驗(yàn)。比如,對(duì)于用戶語音輸入“打電話給張三”的解碼,系統(tǒng)分別將其和導(dǎo)航業(yè)務(wù)相關(guān)的命令參數(shù)(如一百萬興趣點(diǎn)(POI,Point of Interest)數(shù)據(jù))以及電話業(yè)務(wù)相關(guān)的命令參數(shù)(如一千個(gè)人名參數(shù))以及音樂業(yè)務(wù)相關(guān)的命令參數(shù)(如兩千首歌)分別進(jìn)行匹配,其系統(tǒng)的響應(yīng)時(shí)間大約統(tǒng)計(jì)為一百萬POI詞條加一千個(gè)人名以及兩千首歌的解碼時(shí)間,影響了對(duì)命令的快速響應(yīng)。此外在這種基于大規(guī)模解碼網(wǎng)絡(luò)解碼的方式下,由于混淆詞匯增多,其識(shí)別率可能也會(huì)受到一定的影響。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例提供了一種語音命令處理方法以及系統(tǒng),用于提高用戶語音命令輸入的響應(yīng)效率,改善用戶體驗(yàn)。
[0005]本發(fā)明第一方面提供一種語音命令處理方法,其中,可包括:
[0006]獲取用于業(yè)務(wù)請(qǐng)求的語音命令;
[0007]根據(jù)所述語音命令,提取語音特征序列;
[0008]根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行解碼,確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別;
[0009]確定與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò);
[0010]根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容。
[0011]優(yōu)選地,所述根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行解碼,確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別,包括:
[0012]在預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)內(nèi),搜索并確定與所述語音特征序列具有最大相似度的第一解碼路徑;
[0013]根據(jù)所述第一解碼路徑確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別。
[0014]優(yōu)選地,所述根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容,包括:
[0015]在確定的與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi),選擇并確定與所述語音特征序列具有最大相似度的第二解碼路徑;
[0016]根據(jù)所述第二解碼路徑確定所述語音命令的完整內(nèi)容。
[0017]優(yōu)選地,所述在確定的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)對(duì)語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容,包括:
[0018]獲取經(jīng)過預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)解碼后的語音命令中關(guān)鍵詞所對(duì)應(yīng)的語音段信息;
[0019]獲取與所述語音命令中命令參數(shù)部分對(duì)應(yīng)的語音信號(hào);
[0020]確定所述業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)應(yīng)的業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò);
[0021]在所述業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò)內(nèi)對(duì)所述語音信號(hào)進(jìn)行解碼,選擇并確定與所述語音特征序列具有最大相似度的第三解碼路徑;
[0022]根據(jù)所述第三解碼路徑確定所述語音信號(hào)所對(duì)應(yīng)的語音命令參數(shù)。
[0023]根據(jù)所述語音段信息和所述語音命令參數(shù),確定所述語音命令的完整內(nèi)容。
[0024]本發(fā)明第二方面提供一種語音命令處理系統(tǒng),其中,包括:
[0025]獲取模塊,用于獲取用于業(yè)務(wù)請(qǐng)求的語音命令;
[0026]提取模塊,用于根據(jù)所述語音命令,提取語音特征序列;
[0027]第一解碼模塊,用于根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行解碼,確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別;
[0028]確定模塊,用于確定與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò);
[0029]第二解碼模塊,用于根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)解碼后的語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容。
[0030]優(yōu)選地,所述第一解碼模塊,具體用于在預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)內(nèi),搜索并確定具有與所述語音特征序列最大相似度的第一解碼路徑;根據(jù)所述第一解碼路徑確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別。
[0031]優(yōu)選地,所述第二解碼模塊,具體用于在確定的與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi),選擇并確定與所述語音特征序列具有最大相似度的第二解碼路徑,所述業(yè)務(wù)解碼網(wǎng)絡(luò)為包含業(yè)務(wù)相關(guān)命令關(guān)鍵詞和命令參數(shù)的解碼網(wǎng)絡(luò);根據(jù)所述第二解碼路徑確定所述語音命令的完整內(nèi)容。
[0032]優(yōu)選地,所述第二解碼模塊,具體用于獲取經(jīng)過預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)解碼后的語音命令中命令關(guān)鍵詞所對(duì)應(yīng)的語音段信息;獲取與所述語音命令中命令參數(shù)部分對(duì)應(yīng)的語音信號(hào);在所述業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò)內(nèi)對(duì)所述語音信號(hào)進(jìn)行解碼,選擇并確定與所述語音特征序列具有最大相似度的第三解碼路徑;根據(jù)所述第三解碼路徑確定所述語音信號(hào)所對(duì)應(yīng)的語音命令參數(shù);根據(jù)所述語音段信息和所述語音命令參數(shù),確定所述語音命令的完整內(nèi)容。
[0033]從以上技術(shù)方案可以看出,本發(fā)明實(shí)施例提供的一種語音命令處理方法以及系統(tǒng),具有以下優(yōu)點(diǎn):對(duì)獲取的用于業(yè)務(wù)請(qǐng)求的語音命令進(jìn)行首次解碼,確定該請(qǐng)求的業(yè)務(wù)類另IJ,其后根據(jù)所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行二次解碼,從而確定語音命令的完整內(nèi)容;在與業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)進(jìn)行二次解碼,可實(shí)現(xiàn)對(duì)語音命令的快速響應(yīng),特別是提高了用于支持多種參數(shù)規(guī)模不等語音命令控制系統(tǒng)的實(shí)用性,也提高了詞匯識(shí)別率。
【專利附圖】
【附圖說明】
[0034]為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0035]圖1為本發(fā)明實(shí)施例提供的一種語音命令處理方法的流程示意圖;
[0036]圖2為本發(fā)明實(shí)施例提供的語音命令處理方法的另一流程示意圖;
[0037]圖3為本發(fā)明實(shí)施例提供的語音命令處理方法的另一流程示意圖;
[0038]圖4為本發(fā)明實(shí)施例提供的語音命令處理方法的另一流程示意圖;
[0039]圖5為本發(fā)明實(shí)施例中采用的解碼網(wǎng)絡(luò)搜索示意圖;
[0040]圖6為本發(fā)明實(shí)施例中對(duì)一種業(yè)務(wù)的響應(yīng)示意圖;
[0041]圖7a為本發(fā)明實(shí)施例中一種業(yè)務(wù)相關(guān)的業(yè)務(wù)類別網(wǎng)絡(luò)解碼示意圖;
[0042]圖7b為本發(fā)明實(shí)施例中一種業(yè)務(wù)相關(guān)的業(yè)務(wù)網(wǎng)絡(luò)解碼示意圖;
[0043]圖8為本發(fā)明實(shí)施例中一種業(yè)務(wù)相關(guān)的業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò)示意圖;
[0044]圖9為本發(fā)明實(shí)施例提供的一種語音命令處理系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0045]本發(fā)明實(shí)施例提供了一種語音命令處理方法以及系統(tǒng),用于提高用戶語音命令輸入的響應(yīng)效率,改善用戶體驗(yàn)。
[0046]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0047]以下分別進(jìn)行詳細(xì)說明。
[0048]請(qǐng)參考圖1,圖1為本發(fā)明實(shí)施例提供的一種語音命令處理方法的流程示意圖,其中,所述語音命令處理方法包括:
[0049]步驟101、獲取用于業(yè)務(wù)請(qǐng)求的語音命令;
[0050]其中,所述語音命令包括與命令關(guān)鍵詞部分相對(duì)應(yīng)的語音信號(hào)和命令參數(shù)部分相對(duì)應(yīng)的語音信號(hào);
[0051]可以理解的是,所述語音命令為用戶輸入的語音命令,所述語音命令用于業(yè)務(wù)請(qǐng)求,如“打電話給張三”、“點(diǎn)播歌曲《朋友》”等。
[0052]步驟102、根據(jù)所述語音命令,提取語音特征序列;
[0053]步驟103、根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行解碼,確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別;
[0054]可以理解的是,所述根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行解碼后,可以確定所述語音命令的命令關(guān)鍵詞。
[0055]步驟104、確定與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò);
[0056]其中,確定與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)的一種可選實(shí)施方式為:根據(jù)確定出來的當(dāng)前請(qǐng)求的業(yè)務(wù)類別,在預(yù)置的業(yè)務(wù)類別與業(yè)務(wù)解碼網(wǎng)絡(luò)的關(guān)系對(duì)應(yīng)表中查找,獲取并確定出與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)。
[0057]可以理解的是,業(yè)務(wù)類別與業(yè)務(wù)解碼網(wǎng)絡(luò)的關(guān)系對(duì)應(yīng)表是預(yù)先設(shè)置在語音命令處理系統(tǒng)中的;在本實(shí)施方式中,所述業(yè)務(wù)類別可以包括電話通訊業(yè)務(wù)、歌曲點(diǎn)播業(yè)務(wù)、以及地方導(dǎo)航業(yè)務(wù)等業(yè)務(wù)中的至少一個(gè)。
[0058]另外,本發(fā)明實(shí)施例還可以使用可擴(kuò)展標(biāo)記語言(Extensible Markup Language,XML)配置文件的方式來記錄業(yè)務(wù)類別與業(yè)務(wù)解碼網(wǎng)絡(luò),或者,本發(fā)明實(shí)施例還可以由確定的業(yè)務(wù)類別攜帶的業(yè)務(wù)參數(shù),生成并確定出與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò),此處不作具體限定。
[0059]步驟105、根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)解碼后的語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容。
[0060]由上述可知,本發(fā)明實(shí)施例提供的一種語音命令處理方法,對(duì)獲取的用于業(yè)務(wù)請(qǐng)求的語音命令進(jìn)行首次解碼,確定該請(qǐng)求的業(yè)務(wù)類別,其后根據(jù)所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行二次解碼,從而確定語音命令的完整內(nèi)容;在與業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)進(jìn)行二次解碼,可實(shí)現(xiàn)對(duì)語音命令的快速響應(yīng),特別是提高了用于支持多種參數(shù)規(guī)模不等語音命令控制系統(tǒng)的實(shí)用性,也提高了詞匯識(shí)別率。
[0061]可選地,請(qǐng)參考圖2,圖2為本發(fā)明實(shí)施例提供的一種語音命令處理方法的流程示意圖,其中,根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行解碼,確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別(步驟103),可以包括:
[0062]步驟1031、在預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)內(nèi),搜索并確定與所述語音特征序列具有最大相似度的第一解碼路徑;
[0063]步驟1032、根據(jù)所述第一解碼路徑確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別。
[0064]其中,根據(jù)與所述語音特征序列具有最大相似度的第一解碼路徑確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別,也就是確定了所述語音命令的業(yè)務(wù)類型,可以針對(duì)性地縮小了解碼空間,提高了解碼效率;本發(fā)明實(shí)施例中,所述最大相似度的第一解碼路徑可以認(rèn)為是該實(shí)施方式中確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別的最優(yōu)路徑。
[0065]可選地,請(qǐng)參考圖3,圖3為本發(fā)明實(shí)施例提供的一種語音命令處理方法的流程示意圖,在一種可實(shí)施方式中,根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)解碼后的語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容(步驟105),可以具體包括:
[0066]步驟1051-a、在確定的與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi),選擇并確定與所述語音特征序列具有最大相似度的第二解碼路徑;
[0067]可以理解的是,該實(shí)施方式中,所述業(yè)務(wù)解碼網(wǎng)絡(luò)為包含業(yè)務(wù)相關(guān)命令關(guān)鍵詞和命令參數(shù)的解碼網(wǎng)絡(luò);
[0068]步驟1052-a、根據(jù)所述第二解碼路徑確定所述語音命令的完整內(nèi)容;
[0069]本實(shí)施方式中,由于該業(yè)務(wù)解碼網(wǎng)絡(luò)包含了所述語音命令中對(duì)應(yīng)的命令關(guān)鍵詞和命令參數(shù),即所述步驟1051-a與所述步驟1052-a是對(duì)所述語音命令的整體進(jìn)行解碼,因此,該二次解碼的結(jié)果是語音命令的完整內(nèi)容。
[0070]可以理解的是,利用與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)以及與所述語音特征序列具有最大相似度的第二解碼路徑,對(duì)所述語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容,更加有針對(duì)性地縮小了解碼空間,提高了解碼效率,所述最大相似度的第二解碼路徑可以認(rèn)為是該實(shí)施方式中確定所述語音命令的完整內(nèi)容的最優(yōu)路徑。
[0071]另需要說明的是,本發(fā)明實(shí)施例中,第一次解碼過程使用的解碼路徑為第一解碼路徑,第二次解碼過程使用的解碼路徑為第二解碼路徑,所述第一解碼路徑和所述第二解碼路徑均是為了表示當(dāng)前處理方法中,與述語音特征序列具有最大相似度的解碼路徑,所述第一解碼路徑和所述第二解碼路徑可以相同,也可以不同,本發(fā)明實(shí)施例對(duì)此不作具體限定。
[0072]可選地,請(qǐng)參考圖4,圖4為本發(fā)明實(shí)施例提供的一種語音命令處理方法的流程示意圖,在另一種可實(shí)施方式中,根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)解碼后的語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容(步驟105),可以具體包括:
[0073]步驟1051-b、獲取經(jīng)過預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)解碼后的語音命令中命令關(guān)鍵詞所對(duì)應(yīng)的語音段信息;
[0074]步驟1052-b、獲取與所述語音命令中命令參數(shù)部分對(duì)應(yīng)的語音信號(hào);
[0075]步驟1053-b、確定與所述業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)應(yīng)的業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò);
[0076]步驟1054-b、在所述業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)對(duì)所述語音信號(hào)進(jìn)行解碼,選擇并確定與所述語音特征序列具有最大相似度的第三解碼路徑;
[0077]步驟1055-b、根據(jù)所述第三解碼路徑確定所述語音信號(hào)所對(duì)應(yīng)的語音命令參數(shù);
[0078]步驟1056-b、根據(jù)所述語音段信息和所述語音命令參數(shù),確定所述語音命令的完整內(nèi)容。
[0079]本實(shí)施方式中,根據(jù)業(yè)務(wù)解碼網(wǎng)絡(luò),對(duì)語音命令中命令參數(shù)部分對(duì)應(yīng)的語音信號(hào)進(jìn)行解碼,得到的語音命令參數(shù)與所述命令關(guān)鍵詞所對(duì)應(yīng)的語音段信息結(jié)合得到語音命令的完整內(nèi)容。
[0080]可以理解的是,利用與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)以及與所述語音特征序列具有最大相似度的第三解碼路徑,對(duì)所述語音命令中命令參數(shù)部分對(duì)應(yīng)的語音信號(hào)進(jìn)行解碼,確定所述語音命令的完整內(nèi)容,更加有針對(duì)性地縮小了解碼空間,提高了解碼效率,所述最大相似度的第三解碼路徑可以認(rèn)為是該實(shí)施方式中確定所述語音命令的完整內(nèi)容的最優(yōu)路徑。
[0081]另需要說明的是,本發(fā)明實(shí)施例中,第二次解碼過程的一種可實(shí)施方式中使用的解碼路徑為第二解碼路徑,另一種可實(shí)施方式中使用的解碼路徑為第三解碼路徑,所述第二解碼路徑和所述第三解碼路徑均是為了表示在對(duì)語音命令進(jìn)行第二次解碼的過程中,與述語音特征序列具有最大相似度的解碼路徑,所述第二解碼路徑和所述第三解碼路徑可以相同,也可以不同,本發(fā)明實(shí)施例對(duì)此不作具體限定。
[0082]由上述可知,本發(fā)明實(shí)施例提供的一種語音命令處理方法,對(duì)獲取的用于業(yè)務(wù)請(qǐng)求的語音命令進(jìn)行首次解碼,確定該請(qǐng)求的業(yè)務(wù)類別,其后根據(jù)所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行二次解碼,從而確定語音命令的完整內(nèi)容;在與業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)進(jìn)行二次解碼,可實(shí)現(xiàn)對(duì)語音命令的快速響應(yīng),特別是提高了用于支持多種參數(shù)規(guī)模不等語音命令控制系統(tǒng)的實(shí)用性,也提高了詞匯識(shí)別率。
[0083]為了更好地理解本發(fā)明提供的一種語音命令處理方法,以下以一應(yīng)用場(chǎng)景為例子進(jìn)行具體說明:
[0084]首先,可進(jìn)行系統(tǒng)初始化,生成語音命令業(yè)務(wù)類別的解碼網(wǎng)絡(luò)及各命令相關(guān)參數(shù)的解碼網(wǎng)絡(luò)。所述語音命令業(yè)務(wù)類別的解碼網(wǎng)絡(luò)用于對(duì)諸如“打電話”,“導(dǎo)航到”,“點(diǎn)播”,“打開”,“搜索”等操作命令的識(shí)別,而命令相關(guān)參數(shù)的解碼網(wǎng)絡(luò)是根據(jù)各命令要求訂制而成,比如對(duì)“打電話”業(yè)務(wù),系統(tǒng)可能根據(jù)系統(tǒng)預(yù)存的聯(lián)系人名構(gòu)建,還可進(jìn)一步包含數(shù)字識(shí)別網(wǎng)絡(luò)等;其次,接收用戶輸入的語音命令,提取語音特征序列,所述語音命令用于業(yè)務(wù)請(qǐng)求;接著,使用業(yè)務(wù)類別解碼網(wǎng)絡(luò)解碼確定業(yè)務(wù)類別;然后,確定出與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò);最后,在所述業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)的搜索最優(yōu)路徑,確定語音命令內(nèi)容。
[0085]請(qǐng)結(jié)合參考圖5,圖5為本發(fā)明實(shí)施例中采用的解碼網(wǎng)絡(luò)搜索示意圖。系統(tǒng)首先在業(yè)務(wù)類別解碼網(wǎng)絡(luò)內(nèi)確定單一的業(yè)務(wù)類型,隨后從該業(yè)務(wù)類型相關(guān)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)確定最優(yōu)路徑。比如對(duì)“打電話給張三”的輸入,系統(tǒng)首先在業(yè)務(wù)類別解碼網(wǎng)絡(luò)內(nèi)解碼確定業(yè)務(wù)類型,比如“打電話”業(yè)務(wù),隨后獲取該業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò),并在所述業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)確定完整的語音命令內(nèi)容。這種分級(jí)處理的方式大大減少了解碼搜索代價(jià),提高了解碼效率。
[0086]如圖6所示,圖6為本發(fā)明實(shí)施例中對(duì)“打電話”業(yè)務(wù)的響應(yīng)示意圖,顯然對(duì)用戶輸入的語音命令,系統(tǒng)首先確認(rèn)業(yè)務(wù)類型為“打電話”業(yè)務(wù),隨后對(duì)業(yè)務(wù)相關(guān)的一千人名解碼,確定命令參數(shù),獲取完整的解碼結(jié)果。該系統(tǒng)的響應(yīng)時(shí)間為一千詞條的響應(yīng)時(shí)間,且由于解碼在受限的一千人名解碼空間內(nèi)開展,其識(shí)別準(zhǔn)確率也得到進(jìn)一步的提高。
[0087]本發(fā)明實(shí)施例中,首先根據(jù)用戶輸入的語音命令確定可能的業(yè)務(wù)類型,具體的系統(tǒng)在如圖7a所示的業(yè)務(wù)類別解碼空間內(nèi)搜索最優(yōu)路徑,選擇具有最大相似度的解碼路徑為最優(yōu)結(jié)果,其中,圖示吸收模型用于模擬非語音命令的其他語音信號(hào)的分布;在獲取業(yè)務(wù)類型后,系統(tǒng)選擇確定的業(yè)務(wù)類型相關(guān)的業(yè)務(wù)解碼網(wǎng)絡(luò)作為新的解碼網(wǎng)絡(luò),并在所述業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)選擇具有最大路徑相似度的結(jié)果作為解碼結(jié)果,如圖7b所示,為“打電話”業(yè)務(wù)相關(guān)的業(yè)務(wù)網(wǎng)絡(luò)解碼示意圖。
[0088]如上所述系統(tǒng)在分級(jí)解碼框架下,分別在業(yè)務(wù)類別解碼網(wǎng)絡(luò)內(nèi)及業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)對(duì)語音命令進(jìn)行二次解碼。進(jìn)一步的,為了提高系統(tǒng)的解碼效率,本案還提出了一種新的算法:
[0089]在業(yè)務(wù)類別解碼網(wǎng)絡(luò)內(nèi)對(duì)用戶語音信號(hào)解碼,獲取最優(yōu)路徑及命令關(guān)鍵詞所對(duì)應(yīng)的語音段信息;獲取語音命令中命令參數(shù)部分對(duì)應(yīng)的語音信號(hào)作為新的語音命令輸入,由于在業(yè)務(wù)類別解碼網(wǎng)絡(luò)解碼時(shí),語音命令參數(shù)部分的語音信號(hào)被吸收模型吸收了,因此將其作為新的語音命令輸入;獲取業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)應(yīng)的業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò);在所述業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò)內(nèi)對(duì)所述新的語音命令輸入進(jìn)行解碼,獲取語音命令參數(shù);根據(jù)語音段信息及語音命令參數(shù)確定語音命令完整內(nèi)容。在該實(shí)施方式下,業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò)僅包含語音命令參數(shù),避免了對(duì)語音命令的重復(fù)解碼,提高了解碼效率。如圖8所示,為“打電話”業(yè)務(wù)相關(guān)的業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò)示意圖。
[0090]由上述可知,本發(fā)明實(shí)施提供的語音命令處理方法,實(shí)現(xiàn)了對(duì)用戶語音信號(hào)的分級(jí)處理,通過簡單高效的解碼方法首先確定業(yè)務(wù)命令類型,隨后在業(yè)務(wù)相關(guān)的解碼空間內(nèi)對(duì)具體命令內(nèi)容解碼,實(shí)現(xiàn)了對(duì)不同規(guī)模語音命令的同步支持響應(yīng),提高了系統(tǒng)效率和識(shí)別準(zhǔn)確率。
[0091]為便于更好的實(shí)施本發(fā)明實(shí)施例的技術(shù)方案,本發(fā)明實(shí)施例還提供用于實(shí)施上述語音命令處理方法的相關(guān)系統(tǒng)。其中名詞的含義與上述語音命令處理方法中相同,具體實(shí)現(xiàn)細(xì)節(jié)可以參考方法實(shí)施例中的說明。
[0092]請(qǐng)參考圖9,圖9為本發(fā)明實(shí)施例提供的一種語音命令處理系統(tǒng)的結(jié)構(gòu)示意圖,其中,所述語音命令處理系統(tǒng)包括獲取模塊901、提取模塊902、第一解碼模塊903、確定模塊904和第二解碼模塊905:
[0093]所述獲取模塊901,用于獲取用于業(yè)務(wù)請(qǐng)求的語音命令;
[0094]其中,所述語音命令包括與命令關(guān)鍵詞部分相對(duì)應(yīng)的語音信號(hào)和命令參數(shù)部分相對(duì)應(yīng)的語音信號(hào);
[0095]可以理解的是,所述語音命令為用戶輸入的語音命令,所述語音命令用于業(yè)務(wù)請(qǐng)求,如“打電話給張三”、“點(diǎn)播歌曲《朋友》”等。
[0096]所述提取模塊902,用于根據(jù)所述語音命令,提取語音特征序列;
[0097]所述第一解碼模塊903,用于根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行解碼,確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別;
[0098]可以理解的是,所述根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行解碼后,可以確定所述語音命令的命令關(guān)鍵詞。
[0099]所述確定模塊904,用于確定與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò);
[0100]所述第二解碼模塊905,用于根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)解碼后的語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容。
[0101]其中,確定與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)的一種可選實(shí)施方式為:根據(jù)確定出來的當(dāng)前請(qǐng)求的業(yè)務(wù)類別,在預(yù)置的業(yè)務(wù)類別與業(yè)務(wù)解碼網(wǎng)絡(luò)的關(guān)系對(duì)應(yīng)表中查找,獲取并確定出與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)。
[0102]可以理解的是,業(yè)務(wù)類別與業(yè)務(wù)解碼網(wǎng)絡(luò)的關(guān)系對(duì)應(yīng)表是預(yù)先設(shè)置在語音命令處理系統(tǒng)中的;在本實(shí)施方式中,所述業(yè)務(wù)類別可以包括電話通訊業(yè)務(wù)、歌曲點(diǎn)播業(yè)務(wù)、以及地方導(dǎo)航業(yè)務(wù)等業(yè)務(wù)中的至少一個(gè)。
[0103]另外,本發(fā)明實(shí)施例還可以使用可擴(kuò)展標(biāo)記語言XML配置文件的方式來記錄業(yè)務(wù)類別與業(yè)務(wù)解碼網(wǎng)絡(luò),或者,本發(fā)明實(shí)施例還可以由確定的業(yè)務(wù)類別攜帶的業(yè)務(wù)參數(shù),生成并確定出與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò),此處不作具體限定。
[0104]由上述可知,本發(fā)明實(shí)施例提供的一種語音命令處理系統(tǒng),對(duì)獲取的用于業(yè)務(wù)請(qǐng)求的語音命令進(jìn)行首次解碼,確定該請(qǐng)求的業(yè)務(wù)類別,其后根據(jù)所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行二次解碼,從而確定語音命令的完整內(nèi)容;在與業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)進(jìn)行二次解碼,可實(shí)現(xiàn)對(duì)語音命令的快速響應(yīng),特別是提高了用于支持多種參數(shù)規(guī)模不等語音命令控制系統(tǒng)的實(shí)用性,也提高了詞匯識(shí)別率。
[0105]可選地,在某些實(shí)施方式中,所述第一解碼模塊903,可具體用于在預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)內(nèi),搜索并確定具有與所述語音特征序列最大相似度的第一解碼路徑;根據(jù)所述第一解碼路徑確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別。
[0106]其中,根據(jù)與所述語音特征序列具有最大相似度的第一解碼路徑確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別,也就是確定了所述語音命令的業(yè)務(wù)類型,可以針對(duì)性地縮小了解碼空間,提高了解碼效率;本發(fā)明實(shí)施例中,所述最大相似度的第一解碼路徑可以認(rèn)為是該實(shí)施方式中確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別的最優(yōu)路徑。
[0107]可選地,在某些實(shí)施方式中,所述第二解碼模塊905,可具體用于在確定的與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi),選擇并確定與所述語音特征序列具有最大相似度的第二解碼路徑,所述業(yè)務(wù)解碼網(wǎng)絡(luò)為包含業(yè)務(wù)相關(guān)命令關(guān)鍵詞和命令參數(shù)的解碼網(wǎng)絡(luò);根據(jù)所述第二解碼路徑確定所述語音命令的完整內(nèi)容。
[0108]本實(shí)施方式中,由于該業(yè)務(wù)解碼網(wǎng)絡(luò)包含了所述語音命令中對(duì)應(yīng)的命令關(guān)鍵詞和命令參數(shù),即所述第二解碼模塊905是對(duì)所述語音命令的整體進(jìn)行解碼,因此,該二次解碼的結(jié)果是語音命令的完整內(nèi)容。
[0109]可以理解的是,利用與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)以及與所述語音特征序列具有最大相似度的第二解碼路徑,對(duì)所述語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容,更加有針對(duì)性地縮小了解碼空間,提高了解碼效率,所述最大相似度的第二解碼路徑可以認(rèn)為是該實(shí)施方式中確定所述語音命令的完整內(nèi)容的最優(yōu)路徑。
[0110]進(jìn)一步可選地,在另一實(shí)施方式下,所述第二解碼模塊905,可具體用于獲取經(jīng)過預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)解碼后的語音命令中命令關(guān)鍵詞所對(duì)應(yīng)的語音段信息;獲取與所述語音命令中命令參數(shù)部分對(duì)應(yīng)的語音信號(hào);在所述業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò)內(nèi)對(duì)所述語音信號(hào)進(jìn)行解碼,選擇并確定與所述語音特征序列具有最大相似度的第三解碼路徑;根據(jù)所述第三解碼路徑確定所述語音信號(hào)所對(duì)應(yīng)的語音命令參數(shù);根據(jù)所述語音段信息和所述語音命令參數(shù),確定所述語音命令的完整內(nèi)容。
[0111]本實(shí)施方式中,根據(jù)業(yè)務(wù)解碼網(wǎng)絡(luò),對(duì)語音命令中命令參數(shù)部分對(duì)應(yīng)的語音信號(hào)進(jìn)行解碼,得到的語音命令參數(shù)與所述命令關(guān)鍵詞所對(duì)應(yīng)的語音段信息結(jié)合得到語音命令的完整內(nèi)容。
[0112]可以理解的是,利用與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)以及與所述語音特征序列具有最大相似度的第三解碼路徑,對(duì)所述語音命令中命令參數(shù)部分對(duì)應(yīng)的語音信號(hào)進(jìn)行解碼,確定所述語音命令的完整內(nèi)容,更加有針對(duì)性地縮小了解碼空間,提高了解碼效率,所述最大相似度的第三解碼路徑可以認(rèn)為是該實(shí)施方式中確定所述語音命令的完整內(nèi)容的最優(yōu)路徑。
[0113]另需要說明的是,本發(fā)明實(shí)施例中,第一次解碼過程使用的解碼路徑為第一解碼路徑,第二次解碼過程使用的解碼路徑為第二解碼路徑或第三解碼路徑,所述第一解碼路徑、所述第二解碼路徑和所述第三解碼路徑均是為了表示當(dāng)前處理方法中,與述語音特征序列具有最大相似度的解碼路徑,所述第一解碼路徑、所述第二解碼路徑和所述第三解碼路徑可以相同,也可以不同,本發(fā)明實(shí)施例對(duì)此不作具體限定。
[0114]所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng)及系統(tǒng)中的各功能模塊的具體工作過程和應(yīng)用場(chǎng)景,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。
[0115]由上述可知,本發(fā)明實(shí)施例提供的一種語音命令處理系統(tǒng),對(duì)獲取的用于業(yè)務(wù)請(qǐng)求的語音命令進(jìn)行首次解碼,確定該請(qǐng)求的業(yè)務(wù)類別,其后根據(jù)所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行二次解碼,從而確定語音命令的完整內(nèi)容;在與業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi)進(jìn)行二次解碼,可實(shí)現(xiàn)對(duì)語音命令的快速響應(yīng),特別是提高了用于支持多種參數(shù)規(guī)模不等語音命令控制系統(tǒng)的實(shí)用性,也提高了詞匯識(shí)別率。
[0116]所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。
[0117]在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
[0118]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
[0119]另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
[0120]所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(ROM,Read-OnlyMemory)、隨機(jī)存取存儲(chǔ)器(RAM, Random Access Memory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0121]以上對(duì)本發(fā)明所提供的一種語音命令處理方法以及系統(tǒng)進(jìn)行了詳細(xì)介紹,對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明實(shí)施例的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
【權(quán)利要求】
1.一種語音命令處理方法,其特征在于,包括: 獲取用于業(yè)務(wù)請(qǐng)求的語音命令; 根據(jù)所述語音命令,提取語音特征序列; 根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行解碼,確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別; 確定與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò); 根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行解碼,確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別包括: 在預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)內(nèi),搜索并確定與所述語音特征序列具有最大相似度的第一解碼路徑; 根據(jù)所述第一解碼路徑確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容,包括: 在確定的與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi),選擇并確定與所述語音特征序列具有最大相似度的第二解碼路徑,所述業(yè)務(wù)解碼網(wǎng)絡(luò)為包含業(yè)務(wù)相關(guān)命令關(guān)鍵詞和命令參數(shù)的解碼網(wǎng)絡(luò); 根據(jù)所述第二解碼路徑確定所述語音命令的完整內(nèi)容。
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容,包括: 獲取經(jīng)過預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)解碼后的語音命令中命令關(guān)鍵詞所對(duì)應(yīng)的語音段信息; 獲取與所述語音命令中命令參數(shù)部分對(duì)應(yīng)的語音信號(hào); 確定與所述業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)應(yīng)的業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò); 在所述業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò)內(nèi)對(duì)所述語音信號(hào)進(jìn)行解碼,選擇并確定與所述語音特征序列具有最大相似度的第三解碼路徑; 根據(jù)所述第三解碼路徑確定所述語音信號(hào)所對(duì)應(yīng)的語音命令參數(shù)。 根據(jù)所述語音段信息和所述語音命令參數(shù),確定所述語音命令的完整內(nèi)容。
5.一種語音命令處理系統(tǒng),其特征在于,包括: 獲取模塊,用于獲取用于業(yè)務(wù)請(qǐng)求的語音命令; 提取模塊,用于根據(jù)所述語音命令,提取語音特征序列; 第一解碼模塊,用于根據(jù)預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)對(duì)所述語音命令進(jìn)行解碼,確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別; 確定模塊,用于確定與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò); 第二解碼模塊,用于根據(jù)確定的業(yè)務(wù)解碼網(wǎng)絡(luò)對(duì)解碼后的語音命令進(jìn)行二次解碼,確定所述語音命令的完整內(nèi)容。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述第一解碼模塊,具體用于在預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)內(nèi),搜索并確定具有與所述語音特征序列最大相似度的第一解碼路徑;根據(jù)所述第一解碼路徑確定當(dāng)前請(qǐng)求的業(yè)務(wù)類別。
7.根據(jù)權(quán)利要求5或6所述的系統(tǒng),其特征在于,所述第二解碼模塊,具體用于在確定的與所述業(yè)務(wù)類別相對(duì)應(yīng)的業(yè)務(wù)解碼網(wǎng)絡(luò)內(nèi),選擇并確定與所述語音特征序列具有最大相似度的第二解碼路徑,所述業(yè)務(wù)解碼網(wǎng)絡(luò)為包含業(yè)務(wù)相關(guān)命令關(guān)鍵詞和命令參數(shù)的解碼網(wǎng)絡(luò);根據(jù)所述第二解碼路徑確定所述語音命令的完整內(nèi)容。
8.根據(jù)權(quán)利要求5或6所述的系統(tǒng),其特征在于,所述第二解碼模塊,具體用于獲取經(jīng)過預(yù)置的業(yè)務(wù)類別解碼網(wǎng)絡(luò)解碼后的語音命令中命令關(guān)鍵詞所對(duì)應(yīng)的語音段信息;獲取與所述語音命令中命令參數(shù)部分對(duì)應(yīng)的語音信號(hào);在所述業(yè)務(wù)參數(shù)解碼網(wǎng)絡(luò)內(nèi)對(duì)所述語音信號(hào)進(jìn)行解碼,選擇并確定與所述語音特征序列具有最大相似度的第三解碼路徑;根據(jù)所述第三解碼路徑確定所述語音信號(hào)所對(duì)應(yīng)的語音命令參數(shù);根據(jù)所述語音段信息和所述語音命令參數(shù),確定所述語音命令的完整內(nèi)容。
【文檔編號(hào)】G10L15/02GK104282301SQ201310287147
【公開日】2015年1月14日 申請(qǐng)日期:2013年7月9日 優(yōu)先權(quán)日:2013年7月9日
【發(fā)明者】陳盛, 何婷婷, 劉俊峰, 馬冰 申請(qǐng)人:安徽科大訊飛信息科技股份有限公司