語音識(shí)別方法、語音識(shí)別系統(tǒng)和語音識(shí)別設(shè)備的制作方法
【專利摘要】發(fā)明提出了一種語音識(shí)別方法、一種語音識(shí)別系統(tǒng)和一種語音識(shí)別設(shè)備,其中,語音識(shí)別方法,包括:獲取語音字符串;根據(jù)所述語音字符串創(chuàng)建語法分析樹,所述語法分析樹用于判斷所述語音字符串是否能夠被初次識(shí)別以及解析所述語音字符串中的至少一個(gè)詞元的詞元屬性信息;根據(jù)所述初次識(shí)別的結(jié)果創(chuàng)建語義分析樹,所述語音分析樹根據(jù)解析的所述詞元屬性信息獲取預(yù)存儲(chǔ)屬性信息以創(chuàng)建語音識(shí)別結(jié)果。通過本發(fā)明的技術(shù)方案,實(shí)現(xiàn)了對(duì)語音信息的語音和語義的準(zhǔn)確分析,同時(shí)解決了混淆音造成的語音識(shí)別錯(cuò)誤等問題,增強(qiáng)了人機(jī)語音交互設(shè)備的智能化,提升了用戶的使用體驗(yàn)。
【專利說明】語音識(shí)別方法、語音識(shí)別系統(tǒng)和語音識(shí)別設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語音識(shí)別【技術(shù)領(lǐng)域】,具體而言,涉及一種語音識(shí)別方法、一種語音識(shí)別系統(tǒng)和一種語音識(shí)別設(shè)備。
【背景技術(shù)】
[0002]隨著計(jì)算機(jī)處理能力的迅速提高,語音識(shí)別技術(shù)得到了飛速發(fā)展,器技術(shù)的應(yīng)用正在日益改變?nèi)祟惖纳a(chǎn)和生活方式,被廣泛應(yīng)用于諸如語音輸入系統(tǒng)、語音控制系統(tǒng)和智能對(duì)話查詢系統(tǒng)等領(lǐng)域。
[0003]語音識(shí)別技術(shù)是通過識(shí)別和解析過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù),其具體過程包括:
[0004](1)采集和預(yù)處理步驟:未知語音經(jīng)過話筒變換成電信號(hào)后加在識(shí)別系統(tǒng)的輸入端,經(jīng)過預(yù)處理過程對(duì)電信號(hào)進(jìn)行降噪和濾波等處理,以初步提高信噪比;
[0005](2)識(shí)別步驟:對(duì)經(jīng)過預(yù)處理的電信號(hào)進(jìn)行識(shí)別處理,根據(jù)用戶的語音特定建立語音模型,根據(jù)語音模型對(duì)電信號(hào)進(jìn)行分析,抽取電信號(hào)中包括的語音特征,在此基礎(chǔ)上建立語音識(shí)別所需的模板。而計(jì)算機(jī)在識(shí)別過程中需要根據(jù)語音識(shí)別的模型,將計(jì)算機(jī)中預(yù)存儲(chǔ)的語音模板和輸入的語音特征進(jìn)行匹配,按照預(yù)定的匹配策略找出最優(yōu)的匹配模板;
[0006](3)后處理步驟:根據(jù)模板的映射表和定義獲知語音特征對(duì)應(yīng)的文本信息。
[0007]其中,識(shí)別步驟作為語音識(shí)別的重要步驟通常有以下幾個(gè)指標(biāo)作為衡量標(biāo)準(zhǔn):
[0008](1)詞匯表范圍:語音設(shè)備能夠識(shí)別的單詞或詞組的范圍;
[0009](2)說話人限制:語音設(shè)備能夠識(shí)別指定語音、語調(diào)和音色的語音信息;
[0010](3)訓(xùn)練要求:語音設(shè)備是否經(jīng)過大量語音信號(hào)的識(shí)別訓(xùn)練過程;
[0011](4)識(shí)別率:語音設(shè)備能夠平均正確識(shí)別的百分?jǐn)?shù),取決于前三個(gè)參數(shù)。
[0012]相關(guān)技術(shù)中,針對(duì)上述語音識(shí)別參數(shù)而言存在以下問題:
[0013](1)將連續(xù)的語音信息分解為詞、音素等單位,語音識(shí)別過程較慢因此要求用戶語速不能過快;
[0014](2)語音信息量大,受用戶發(fā)出語音指令的方式影響,會(huì)對(duì)識(shí)別過程產(chǎn)生影響甚至誤判;
[0015](3)單個(gè)字母或詞、字的語音特性受上下文影響,會(huì)影響語音識(shí)別的誤判;
[0016](4)語音的混淆音影響,具體地,如同音字、前后鼻音、平敲舌音和混淆音,都會(huì)影響語音識(shí)別的誤判;
[0017](5)環(huán)境噪聲和干擾對(duì)語音識(shí)別過程產(chǎn)生嚴(yán)重影響。
[0018]因此,如何設(shè)計(jì)語音識(shí)別方案提高識(shí)別過程的準(zhǔn)確率和識(shí)別效率成為亟待解決的技術(shù)問題。
【發(fā)明內(nèi)容】
[0019]本發(fā)明正是基于上述技術(shù)問題至少之一,提出了一種新的語音識(shí)別方案和一種語音識(shí)別設(shè)備。
[0020]有鑒于此,本發(fā)明提出了一種語音識(shí)別方法,包括:獲取語音字符串;根據(jù)所述語音字符串創(chuàng)建語法分析樹,所述語法分析樹用于判斷所述語音字符串是否能夠被初次識(shí)別以及解析所述語音字符串中的至少一個(gè)詞元的詞元屬性信息;根據(jù)所述初次識(shí)別的結(jié)果創(chuàng)建語義分析樹,所述語音分析樹根據(jù)解析的所述詞元屬性信息獲取預(yù)存儲(chǔ)屬性信息以創(chuàng)建語音識(shí)別結(jié)果。
[0021]在該技術(shù)方案中,通過創(chuàng)建語法分析樹對(duì)語音字符串進(jìn)行初步分析,后根據(jù)初步分析結(jié)果創(chuàng)建語義分析樹,提高了語音識(shí)別過程的準(zhǔn)確率和效率,具體地,如待識(shí)別的語音過程中包括實(shí)體信息,如“暢捷通的地址在哪里”,其中,通過語法分析模板和語義分析模板識(shí)別第一個(gè)為實(shí)體信息“暢捷通”,第二個(gè)為屬性信息“地址”,第三個(gè)為屬性信息“在哪里”,根據(jù)預(yù)定義的語法規(guī)則和語義規(guī)則,系統(tǒng)解析出語音信息為簡(jiǎn)單的實(shí)體和實(shí)體屬性信息,其中,實(shí)體信息和全部屬性信息構(gòu)成了識(shí)別過程中生成的語法分析樹和語義分析樹的節(jié)點(diǎn),最后通過完成語法分析樹和語義分析樹的創(chuàng)建和映射,其中,映射過程即為識(shí)別的屬性信息與預(yù)存儲(chǔ)屬性信息的匹配過程,最后,實(shí)體信息和匹配結(jié)果共同構(gòu)成語音識(shí)別結(jié)果。
[0022]值得指出的是,在屬性信息的查詢和匹配過程中,采用分布式solr系統(tǒng)作為硬件系統(tǒng)進(jìn)行查詢和匹配,以及預(yù)存儲(chǔ)屬性信息的存儲(chǔ),在solr系統(tǒng)查詢結(jié)束后,根據(jù)指定數(shù)據(jù)輸出格式顯示語音識(shí)別結(jié)果。
[0023]在上述技術(shù)方案中,優(yōu)選地,根據(jù)所述語音字符串創(chuàng)建語法分析樹,包括以下具體步驟:將所述語音字符串根據(jù)分隔符以及獲取順序劃分為包括至少一個(gè)字符串的隊(duì)列;根據(jù)所述隊(duì)列的讀取規(guī)則將所述至少一個(gè)字符串發(fā)送至語法棧;根據(jù)所述預(yù)定語法規(guī)則遍歷所述語法棧中的所述至少一個(gè)字符串,將符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串中的任一字符串合并為一個(gè)可識(shí)別元素,將不符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串作為不可識(shí)別元素,其中,可識(shí)別元素中的字符串作為所述詞元。
[0024]在該技術(shù)方案中,通過根據(jù)預(yù)定的語法規(guī)則對(duì)語音信息進(jìn)行初步識(shí)別,實(shí)現(xiàn)了對(duì)語音信息的初步劃分,區(qū)分了可識(shí)別元素和不可識(shí)別元素,將可識(shí)別元素合并為詞元,為后續(xù)創(chuàng)建語義分析樹提供了軟件基礎(chǔ)。
[0025]在上述技術(shù)方案中,優(yōu)選地,根據(jù)所述初次識(shí)別的結(jié)果創(chuàng)建語義分析樹,包括以下具體步驟:在遍歷所述語法棧后,對(duì)所述詞元進(jìn)行屬性信息分析;根據(jù)所述屬性信息根據(jù)遍歷順序與所述屬性信息對(duì)應(yīng)的所述詞元?jiǎng)?chuàng)建所述語義分析樹。
[0026]在該技術(shù)方案中,通過對(duì)詞元屬性進(jìn)行分析,實(shí)現(xiàn)了快速創(chuàng)建語義分析樹的過程,提升了語音識(shí)別的效率和識(shí)別性,具體地,語義分析樹的創(chuàng)建過程需要根據(jù)預(yù)定的語義規(guī)則進(jìn)行,實(shí)現(xiàn)了語法信息與實(shí)體信息、屬性信息的動(dòng)態(tài)綁定,并且根據(jù)遍歷順序創(chuàng)建的語義分析樹,對(duì)于語法和語義的操作可以充分拓展,更符合用戶的語音識(shí)別要求,增強(qiáng)了識(shí)別過程的邏輯性。
[0027]在上述技術(shù)方案中,優(yōu)選地,根據(jù)所述屬性信息根據(jù)遍歷順序與所述屬性信息對(duì)應(yīng)的所述詞元?jiǎng)?chuàng)建所述語義分析樹,包括以下具體步驟:判斷所述詞元是否包括詞元屬性定義,包括:在判定所述詞元包括詞元屬性定義時(shí),判斷所述語義分析樹中的所述屬性信息是否具備相同所述詞元屬性定義;在判定所述語義分析樹中的所述屬性信息具備相同所述詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⒕邆湎嗤鲈~元屬性定義的所述屬性信息合并至總屬性信息文檔,所述總屬性信息文檔作為所述語音識(shí)別結(jié)果提示給用戶,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
[0028]在上述技術(shù)方案中,優(yōu)選地,判斷所述詞元是否包括詞元屬性定義,還包括以下具體步驟:在判定所述詞元不包括詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⑺鰧傩孕畔⒁约八鰧傩孕畔?duì)應(yīng)的詞元信息合并至總屬性信息文檔,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
[0029]根據(jù)本發(fā)明的另一方面,還提出了一種語音識(shí)別系統(tǒng),包括:獲取單元,用于獲取語音字符串;創(chuàng)建單元,用于根據(jù)所述語音字符串創(chuàng)建語法分析樹,所述語法分析樹用于判斷所述語音字符串是否能夠被初次識(shí)別以及解析所述語音字符串中的至少一個(gè)詞元的詞元屬性信息;所述創(chuàng)建單元還用于,根據(jù)所述初次識(shí)別的結(jié)果創(chuàng)建語義分析樹,所述語音分析樹根據(jù)解析的所述詞元屬性信息獲取預(yù)存儲(chǔ)屬性信息以創(chuàng)建語音識(shí)別結(jié)果。
[0030]在該技術(shù)方案中,通過創(chuàng)建語法分析樹對(duì)語音字符串進(jìn)行初步分析,后根據(jù)初步分析結(jié)果創(chuàng)建語義分析樹,提高了語音識(shí)別過程的準(zhǔn)確率和效率,具體地,如待識(shí)別的語音過程中包括實(shí)體信息,如“暢捷通的地址在哪里”,其中,通過語法分析模板和語義分析模板識(shí)別第一個(gè)為實(shí)體信息“暢捷通”,第二個(gè)為屬性信息“地址”,第三個(gè)為屬性信息“在哪里”,根據(jù)預(yù)定義的語法規(guī)則和語義規(guī)則,系統(tǒng)解析出語音信息為簡(jiǎn)單的實(shí)體和實(shí)體屬性信息,其中,實(shí)體信息和全部屬性信息構(gòu)成了識(shí)別過程中生成的語法分析樹和語義分析樹的節(jié)點(diǎn),最后通過完成語法分析樹和語義分析樹的創(chuàng)建和映射,其中,映射過程即為識(shí)別的屬性信息與預(yù)存儲(chǔ)屬性信息的匹配過程,最后,實(shí)體信息和匹配結(jié)果共同構(gòu)成語音識(shí)別結(jié)果。
[0031]值得指出的是,在屬性信息的查詢和匹配過程中,采用分布式solr系統(tǒng)作為硬件系統(tǒng)進(jìn)行查詢和匹配,以及預(yù)存儲(chǔ)屬性信息的存儲(chǔ),在solr系統(tǒng)查詢結(jié)束后,根據(jù)指定數(shù)據(jù)輸出格式顯示語音識(shí)別結(jié)果。
[0032]在上述技術(shù)方案中,優(yōu)選地,包括:劃分單元,用于將所述語音字符串根據(jù)分隔符以及獲取順序劃分為包括至少一個(gè)字符串的隊(duì)列;發(fā)送單元,用于根據(jù)所述隊(duì)列的讀取規(guī)則將所述至少一個(gè)字符串發(fā)送至語法棧;合并單元,用于根據(jù)所述預(yù)定語法規(guī)則遍歷所述語法棧中的所述至少一個(gè)字符串,將符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串中的任一字符串合并為一個(gè)可識(shí)別元素,將不符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串作為不可識(shí)別元素,其中,可識(shí)別元素中的字符串作為所述詞元。
[0033]在該技術(shù)方案中,通過根據(jù)預(yù)定的語法規(guī)則對(duì)語音信息進(jìn)行初步識(shí)別,實(shí)現(xiàn)了對(duì)語音信息的初步劃分,區(qū)分了可識(shí)別元素和不可識(shí)別元素,將可識(shí)別元素合并為詞元,為后續(xù)創(chuàng)建語義分析樹提供了軟件基礎(chǔ)。
[0034]在上述技術(shù)方案中,優(yōu)選地,包括:分析單元,用于在遍歷所述語法棧后,對(duì)所述詞元進(jìn)行屬性信息分析;所述創(chuàng)建單元還用于,根據(jù)所述屬性信息根據(jù)遍歷順序與所述屬性信息對(duì)應(yīng)的所述詞元?jiǎng)?chuàng)建所述語義分析樹。
[0035]在該技術(shù)方案中,通過對(duì)詞元屬性進(jìn)行分析,實(shí)現(xiàn)了快速創(chuàng)建語義分析樹的過程,提升了語音識(shí)別的效率和識(shí)別性,具體地,語義分析樹的創(chuàng)建過程需要根據(jù)預(yù)定的語義規(guī)則進(jìn)行,實(shí)現(xiàn)了語法信息與實(shí)體信息、屬性信息的動(dòng)態(tài)綁定,并且根據(jù)遍歷順序創(chuàng)建的語義分析樹,對(duì)于語法和語義的操作可以充分拓展,更符合用戶的語音識(shí)別要求,增強(qiáng)了識(shí)別過程的邏輯性。
[0036]在上述技術(shù)方案中,優(yōu)選地,包括:判斷單元,用于判斷所述詞元是否包括詞元屬性定義,所述判斷單元還用于,在判定所述詞元包括詞元屬性定義時(shí),判斷所述語義分析樹中的所述屬性信息是否具備相同所述詞元屬性定義;所述合并單元還用于,在判定所述語義分析樹中的所述屬性信息具備相同所述詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⒕邆湎嗤鲈~元屬性定義的所述屬性信息合并至總屬性信息文檔,所述總屬性信息文檔作為所述語音識(shí)別結(jié)果提示給用戶,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
[0037]在上述技術(shù)方案中,優(yōu)選地,所述合并單元還用于,在判定所述詞元不包括詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⑺鰧傩孕畔⒁约八鰧傩孕畔?duì)應(yīng)的詞元信息合并至總屬性信息文檔,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
[0038]根據(jù)本發(fā)明的第三方面,還提出了一種語音識(shí)別設(shè)備,其特征在于,包括:如上述任一項(xiàng)所述的語音識(shí)別系統(tǒng)。
[0039]通過以上技術(shù)方案,提出了一種新的語音識(shí)別方案和一種語音識(shí)別設(shè)備,通過創(chuàng)建語法分析樹對(duì)語音字符串進(jìn)行初步分析,后根據(jù)初步分析結(jié)果創(chuàng)建語義分析樹,提高了語音識(shí)別過程的準(zhǔn)確率和效率。
【專利附圖】
【附圖說明】
[0040]圖1示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的語音識(shí)別方法的示意流程圖;
[0041]圖2示出了根據(jù)本發(fā)明的實(shí)施例的語音識(shí)別系統(tǒng)的示意框圖;
[0042]圖3示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的語音識(shí)別方法的示意流程圖。
【具體實(shí)施方式】
[0043]為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點(diǎn),下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)描述。需要說明的是,在不沖突的情況下,本申請(qǐng)的實(shí)施例及實(shí)施例中的特征可以相互組合。
[0044]在下面的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可以采用其他不同于在此描述的其他方式來實(shí)施,因此,本發(fā)明的保護(hù)范圍并不受下面公開的具體實(shí)施例的限制。
[0045]圖1示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的語音識(shí)別方法的示意流程圖。
[0046]如圖1所示,根據(jù)本發(fā)明的實(shí)施例的一種語音識(shí)別方法,包括:步驟102,獲取語音字符串;步驟104,根據(jù)所述語音字符串創(chuàng)建語法分析樹,所述語法分析樹用于判斷所述語音字符串是否能夠被初次識(shí)別以及解析所述語音字符串中的至少一個(gè)詞元的詞元屬性信息;步驟106,根據(jù)所述初次識(shí)別的結(jié)果創(chuàng)建語義分析樹;步驟108,所述語音分析樹根據(jù)解析的所述詞元屬性信息獲取預(yù)存儲(chǔ)屬性信息以創(chuàng)建語音識(shí)別結(jié)果。
[0047]在該技術(shù)方案中,通過創(chuàng)建語法分析樹對(duì)語音字符串進(jìn)行初步分析,后根據(jù)初步分析結(jié)果創(chuàng)建語義分析樹,提高了語音識(shí)別過程的準(zhǔn)確率和效率,具體地,如待識(shí)別的語音過程中包括實(shí)體信息,如“暢捷通的地址在哪里”,其中,通過語法分析模板和語義分析模板識(shí)別第一個(gè)為實(shí)體信息“暢捷通”,第二個(gè)為屬性信息“地址”,第三個(gè)為屬性信息“在哪里”,根據(jù)預(yù)定義的語法規(guī)則和語義規(guī)則,系統(tǒng)解析出語音信息為簡(jiǎn)單的實(shí)體和實(shí)體屬性信息,其中,實(shí)體信息和全部屬性信息構(gòu)成了識(shí)別過程中生成的語法分析樹和語義分析樹的節(jié)點(diǎn),最后通過完成語法分析樹和語義分析樹的創(chuàng)建和映射,其中,映射過程即為識(shí)別的屬性信息與預(yù)存儲(chǔ)屬性信息的匹配過程,最后,實(shí)體信息和匹配結(jié)果共同構(gòu)成語音識(shí)別結(jié)果。
[0048]值得指出的是,在屬性信息的查詢和匹配過程中,采用分布式solr系統(tǒng)作為硬件系統(tǒng)進(jìn)行查詢和匹配,以及預(yù)存儲(chǔ)屬性信息的存儲(chǔ),在solr系統(tǒng)查詢結(jié)束后,根據(jù)指定數(shù)據(jù)輸出格式顯示語音識(shí)別結(jié)果。
[0049]在上述技術(shù)方案中,優(yōu)選地,根據(jù)所述語音字符串創(chuàng)建語法分析樹,包括以下具體步驟:將所述語音字符串根據(jù)分隔符以及獲取順序劃分為包括至少一個(gè)字符串的隊(duì)列;根據(jù)所述隊(duì)列的讀取規(guī)則將所述至少一個(gè)字符串發(fā)送至語法棧;根據(jù)所述預(yù)定語法規(guī)則遍歷所述語法棧中的所述至少一個(gè)字符串,將符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串中的任一字符串合并為一個(gè)可識(shí)別元素,將不符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串作為不可識(shí)別元素,其中,可識(shí)別元素中的字符串作為所述詞元。
[0050]在該技術(shù)方案中,通過根據(jù)預(yù)定的語法規(guī)則對(duì)語音信息進(jìn)行初步識(shí)別,實(shí)現(xiàn)了對(duì)語音信息的初步劃分,區(qū)分了可識(shí)別元素和不可識(shí)別元素,將可識(shí)別元素合并為詞元,為后續(xù)創(chuàng)建語義分析樹提供了軟件基礎(chǔ)。
[0051]在上述技術(shù)方案中,優(yōu)選地,根據(jù)所述初次識(shí)別的結(jié)果創(chuàng)建語義分析樹,包括以下具體步驟:在遍歷所述語法棧后,對(duì)所述詞元進(jìn)行屬性信息分析;根據(jù)所述屬性信息根據(jù)遍歷順序與所述屬性信息對(duì)應(yīng)的所述詞元?jiǎng)?chuàng)建所述語義分析樹。
[0052]在該技術(shù)方案中,通過對(duì)詞元屬性進(jìn)行分析,實(shí)現(xiàn)了快速創(chuàng)建語義分析樹的過程,提升了語音識(shí)別的效率和識(shí)別性,具體地,語義分析樹的創(chuàng)建過程需要根據(jù)預(yù)定的語義規(guī)則進(jìn)行,實(shí)現(xiàn)了語法信息與實(shí)體信息、屬性信息的動(dòng)態(tài)綁定,并且根據(jù)遍歷順序創(chuàng)建的語義分析樹,對(duì)于語法和語義的操作可以充分拓展,更符合用戶的語音識(shí)別要求,增強(qiáng)了識(shí)別過程的邏輯性。
[0053]在上述技術(shù)方案中,優(yōu)選地,根據(jù)所述屬性信息根據(jù)遍歷順序與所述屬性信息對(duì)應(yīng)的所述詞元?jiǎng)?chuàng)建所述語義分析樹,包括以下具體步驟:判斷所述詞元是否包括詞元屬性定義,包括:在判定所述詞元包括詞元屬性定義時(shí),判斷所述語義分析樹中的所述屬性信息是否具備相同所述詞元屬性定義;在判定所述語義分析樹中的所述屬性信息具備相同所述詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⒕邆湎嗤鲈~元屬性定義的所述屬性信息合并至總屬性信息文檔,所述總屬性信息文檔作為所述語音識(shí)別結(jié)果提示給用戶,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
[0054]在上述技術(shù)方案中,優(yōu)選地,判斷所述詞元是否包括詞元屬性定義,還包括以下具體步驟:在判定所述詞元不包括詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⑺鰧傩孕畔⒁约八鰧傩孕畔?duì)應(yīng)的詞元信息合并至總屬性信息文檔,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
[0055]圖2示出了根據(jù)本發(fā)明的實(shí)施例的語音識(shí)別系統(tǒng)的示意框圖。
[0056]如圖2所示,根據(jù)本發(fā)明的實(shí)施例的語音識(shí)別系統(tǒng)200,包括:獲取單元202,用于獲取語音字符串;創(chuàng)建單元204,用于根據(jù)所述語音字符串創(chuàng)建語法分析樹,所述語法分析樹用于判斷所述語音字符串是否能夠被初次識(shí)別以及解析所述語音字符串中的至少一個(gè)詞元的詞元屬性信息;所述創(chuàng)建單元還用于,根據(jù)所述初次識(shí)別的結(jié)果創(chuàng)建語義分析樹,所述語音分析樹根據(jù)解析的所述詞元屬性信息獲取預(yù)存儲(chǔ)屬性信息以創(chuàng)建語音識(shí)別結(jié)果。
[0057]在該技術(shù)方案中,通過創(chuàng)建語法分析樹對(duì)語音字符串進(jìn)行初步分析,后根據(jù)初步分析結(jié)果創(chuàng)建語義分析樹,提高了語音識(shí)別過程的準(zhǔn)確率和效率,具體地,如待識(shí)別的語音過程中包括實(shí)體信息,如“暢捷通的地址在哪里”,其中,通過語法分析模板和語義分析模板識(shí)別第一個(gè)為實(shí)體信息“暢捷通”,第二個(gè)為屬性信息“地址”,第三個(gè)為屬性信息“在哪里”,根據(jù)預(yù)定義的語法規(guī)則和語義規(guī)則,系統(tǒng)解析出語音信息為簡(jiǎn)單的實(shí)體和實(shí)體屬性信息,其中,實(shí)體信息和全部屬性信息構(gòu)成了識(shí)別過程中生成的語法分析樹和語義分析樹的節(jié)點(diǎn),最后通過完成語法分析樹和語義分析樹的創(chuàng)建和映射,其中,映射過程即為識(shí)別的屬性信息與預(yù)存儲(chǔ)屬性信息的匹配過程,最后,實(shí)體信息和匹配結(jié)果共同構(gòu)成語音識(shí)別結(jié)果。
[0058]值得指出的是,在屬性信息的查詢和匹配過程中,采用分布式solr系統(tǒng)作為硬件系統(tǒng)進(jìn)行查詢和匹配,以及預(yù)存儲(chǔ)屬性信息的存儲(chǔ),在solr系統(tǒng)查詢結(jié)束后,根據(jù)指定數(shù)據(jù)輸出格式顯示語音識(shí)別結(jié)果。
[0059]在上述技術(shù)方案中,優(yōu)選地,包括:劃分單元206,用于將所述語音字符串根據(jù)分隔符以及獲取順序劃分為包括至少一個(gè)字符串的隊(duì)列;發(fā)送單元208,用于根據(jù)所述隊(duì)列的讀取規(guī)則將所述至少一個(gè)字符串發(fā)送至語法棧;合并單元210,用于根據(jù)所述預(yù)定語法規(guī)則遍歷所述語法棧中的所述至少一個(gè)字符串,將符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串中的任一字符串合并為一個(gè)可識(shí)別元素,將不符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串作為不可識(shí)別元素,其中,可識(shí)別元素中的字符串作為所述詞元。
[0060]在該技術(shù)方案中,通過根據(jù)預(yù)定的語法規(guī)則對(duì)語音信息進(jìn)行初步識(shí)別,實(shí)現(xiàn)了對(duì)語音信息的初步劃分,區(qū)分了可識(shí)別元素和不可識(shí)別元素,將可識(shí)別元素合并為詞元,為后續(xù)創(chuàng)建語義分析樹提供了軟件基礎(chǔ)。
[0061]在上述技術(shù)方案中,優(yōu)選地,包括:分析單元212,用于在遍歷所述語法棧后,對(duì)所述詞元進(jìn)行屬性信息分析;所述創(chuàng)建單元還用于,根據(jù)所述屬性信息根據(jù)遍歷順序與所述屬性信息對(duì)應(yīng)的所述詞元?jiǎng)?chuàng)建所述語義分析樹。
[0062]在該技術(shù)方案中,通過對(duì)詞元屬性進(jìn)行分析,實(shí)現(xiàn)了快速創(chuàng)建語義分析樹的過程,提升了語音識(shí)別的效率和識(shí)別性,具體地,語義分析樹的創(chuàng)建過程需要根據(jù)預(yù)定的語義規(guī)則進(jìn)行,實(shí)現(xiàn)了語法信息與實(shí)體信息、屬性信息的動(dòng)態(tài)綁定,并且根據(jù)遍歷順序創(chuàng)建的語義分析樹,對(duì)于語法和語義的操作可以充分拓展,更符合用戶的語音識(shí)別要求,增強(qiáng)了識(shí)別過程的邏輯性。
[0063]在上述技術(shù)方案中,優(yōu)選地,包括:判斷單元214,用于判斷所述詞元是否包括詞元屬性定義,所述判斷單元還用于,在判定所述詞元包括詞元屬性定義時(shí),判斷所述語義分析樹中的所述屬性信息是否具備相同所述詞元屬性定義;所述合并單元還用于,在判定所述語義分析樹中的所述屬性信息具備相同所述詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⒕邆湎嗤鲈~元屬性定義的所述屬性信息合并至總屬性信息文檔,所述總屬性信息文檔作為所述語音識(shí)別結(jié)果提示給用戶,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
[0064]在上述技術(shù)方案中,優(yōu)選地,所述合并單元還用于,在判定所述詞元不包括詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⑺鰧傩孕畔⒁约八鰧傩孕畔?duì)應(yīng)的詞元信息合并至總屬性信息文檔,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
[0065]圖3示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的語音識(shí)別方法的示意流程圖。
[0066]如圖3,如圖1所示,根據(jù)本發(fā)明的實(shí)施例的一種語音識(shí)別方法,包括:步驟302,語音識(shí)別與糾錯(cuò);步驟304,實(shí)體識(shí)別和屬性識(shí)別;步驟306,創(chuàng)建語法分析樹;步驟308,創(chuàng)建語義分析樹;步驟310,數(shù)據(jù)查詢并顯示。
[0067]具體地,語音識(shí)別與糾錯(cuò)包括:當(dāng)用戶輸入語音信息時(shí),首先經(jīng)過語音識(shí)別模塊糾錯(cuò)后轉(zhuǎn)換為一個(gè)字符串,然后經(jīng)過實(shí)體/屬性識(shí)別模塊識(shí)別出所要查詢的實(shí)體或者屬性,識(shí)別結(jié)果包括實(shí)體信息和屬性信息。
[0068]創(chuàng)建語法分析樹包括:模塊讀入以上的結(jié)果后,首先把input字符串以空格切分生成一個(gè)隊(duì)列input Queue,然后根據(jù)語法規(guī)則以shift-reduce算法解析input參數(shù),然后生成一個(gè)初始的語法樹。
[0069]其中,Shift-reduce算法維護(hù)了一個(gè)語法棧grammar Stack,保存了目前所匹配到的語法規(guī)則,算法分為兩個(gè)步驟不停的循環(huán),分別shift步驟和reduce步驟:
[0070]shift步驟,從input Queue取出頭部詞元,壓入grammar Stack棧;
[0071]Reduce步驟,根據(jù)配置的語法規(guī)則遍歷grammar Stack,若匹配到某條語法規(guī)則,則把右邊重寫為左邊,放回gra_ar Stack中原來位置。
[0072]若在input Queue全部都讀完后,grammar Stack只剩余一個(gè)元素,且根節(jié)點(diǎn)為<S>說明解析成功,否則解析失敗,表示系統(tǒng)無法理解該輸入所表示的意思。
[0073]在上面的語法分析樹中,每個(gè)子樹對(duì)應(yīng)一條語法規(guī)則,子樹的根節(jié)點(diǎn)對(duì)應(yīng)該條語法規(guī)則左半部分的非終結(jié)符,child節(jié)點(diǎn)對(duì)應(yīng)語法規(guī)則的右半部分,該條語法規(guī)則對(duì)應(yīng)的信息data綁定在根節(jié)點(diǎn)上。
[0074]注意,當(dāng)以shift-reduce算法解析input時(shí),每次碰到實(shí)體詞元時(shí),會(huì)從entities屬性中取出對(duì)應(yīng)的實(shí)體信息,然后合并到該條語法規(guī)則的data, info參數(shù)中,此步驟稱之為“實(shí)體信息注入”。
[0075]創(chuàng)建語義分析樹的步驟包括:樹中的每個(gè)中間節(jié)點(diǎn)綁定了語法規(guī)則定義的附加信息和實(shí)體識(shí)別后的實(shí)體信息。在這一步,對(duì)初始的語法樹進(jìn)行語義操作,使之完善成最終的“信息樹”。
[0076]該算法是一遞歸算法,采用深度優(yōu)先規(guī)則,首先依次對(duì)各個(gè)子樹進(jìn)行語義操作,當(dāng)所有子樹都完善后,再對(duì)根數(shù)進(jìn)行語義操作。
[0077]目前有兩種創(chuàng)建語義分析樹的操作,分別是:
[0078](1) combine (合并操作):把所有子節(jié)點(diǎn)綁定的data, info屬性合并到父節(jié)點(diǎn)的data, info 屬性中;
[0079](2) disambiguate (消歧義操作):若父節(jié)點(diǎn)的data中指定了 entity Type屬性,那么遍歷所有一級(jí)子節(jié)點(diǎn)的data屬性,若子節(jié)點(diǎn)中含有以非entity Type為前綴的屬性名,則把該屬性從data中刪去;
[0080]當(dāng)新增語義操作時(shí),需要提供:
[0081](1)語義名稱(semanteme,字符串類型,全局保持唯一);
[0082](2)實(shí)現(xiàn)了 operate (tree)接口的一個(gè)語義處理器。并配置在配置文件semanteme, config 中。
[0083]當(dāng)系統(tǒng)初始化時(shí),會(huì)讀取semanteme, config配置文件,然后生成一個(gè)語義映射表semantMap保存在內(nèi)存中,semantMap的key為語義名稱,value為對(duì)應(yīng)的處理器。
[0084]當(dāng)最終的語法樹生成后,句法分析模塊宣告結(jié)束,此時(shí)處理的最終信息都保存在根節(jié)點(diǎn)的data屬性中,把該data保存的數(shù)據(jù)返回給下一個(gè)數(shù)據(jù)查詢模塊即可
[0085]下面是對(duì)初始語法樹執(zhí)行語義操作,從而生成最終完善的信息語法樹的具體算法:
[0086]檢查根節(jié)點(diǎn),若是葉子節(jié)點(diǎn),直接返回,否則轉(zhuǎn)2);
[0087]取出根節(jié)點(diǎn)的data, acts列表(語義列表),然后根據(jù)semantMap映射表,對(duì)根節(jié)點(diǎn)的所有一級(jí)子節(jié)點(diǎn)依次執(zhí)行data, acts所指定的語義操作。
[0088]另外,對(duì)于根據(jù)本發(fā)明的語音識(shí)別方案的影響提出一些解決辦法,包括:
[0089](1)對(duì)于實(shí)體信息的識(shí)別,通過trie樹插入實(shí)體信息的內(nèi)容。
[0090]trie樹插入內(nèi)容包括:
[0091](i)客戶/聯(lián)系人名稱以及對(duì)應(yīng)的全拼,葉子節(jié)點(diǎn)綁定對(duì)應(yīng)實(shí)體的id信息和type信息;
[0092](ii)所有實(shí)體的枚舉屬性值,葉子節(jié)點(diǎn)綁定對(duì)應(yīng)的屬性名;
[0093](iii)地址屬性,根據(jù)全國(guó)省市區(qū)列表,把所有的省市區(qū)分名稱分別插入trie樹,葉子節(jié)點(diǎn)綁定其上級(jí)和下級(jí)信息。
[0094](2)實(shí)體/屬性模糊識(shí)別處理。
[0095]在插入實(shí)體名稱到trie樹中時(shí),同時(shí)把其全拼也插入到trie樹種,然后在葉子節(jié)點(diǎn)綁定其真實(shí)信息,對(duì)于姓名類的字符串,若姓名在去除了姓之后長(zhǎng)度大于1,則把姓名去除了姓之后的全拼插入到trie樹種,這樣的話當(dāng)進(jìn)行識(shí)別時(shí),若沒有識(shí)別到結(jié)果,則把輸入字符串轉(zhuǎn)化為全拼模式再次進(jìn)行識(shí)別即可。
[0096]另外,對(duì)地址屬性的識(shí)別,采取把省市區(qū)信息全部插入trie樹的策略,在提示語音識(shí)別結(jié)果后,把緊鄰的地址屬性視為同一個(gè)地址即可。
[0097](3)保持trie樹的數(shù)據(jù)與solr系統(tǒng)的數(shù)據(jù)一致性
[0098]由于solr系統(tǒng)的數(shù)據(jù)的經(jīng)常變動(dòng),因此要保持trie樹和solr系統(tǒng)的數(shù)據(jù)的一致性,在此,實(shí)體識(shí)別模塊提供一個(gè)對(duì)外的增刪改接口供S0lr系統(tǒng)的模塊調(diào)用,當(dāng)solr系統(tǒng)的數(shù)據(jù)變動(dòng)時(shí),會(huì)調(diào)用該接口通知trie樹進(jìn)行數(shù)據(jù)同步。
[0099]以上結(jié)合附圖詳細(xì)說明了本發(fā)明的技術(shù)方案,考慮到如何設(shè)計(jì)語音識(shí)別方案提高識(shí)別過程的準(zhǔn)確率和識(shí)別效率的技術(shù)問題。因此,本發(fā)明提出了一種新的語音識(shí)別方案和一種語音識(shí)別設(shè)備,通過根據(jù)語音字符串創(chuàng)建單詞查找樹,實(shí)現(xiàn)了快速和準(zhǔn)確查找,由于識(shí)別效率高且速度快,故識(shí)別過程受到環(huán)境噪聲影響極小。
[0100]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種語音識(shí)別方法,其特征在于,包括: 獲取語音字符串; 根據(jù)所述語音字符串創(chuàng)建語法分析樹,所述語法分析樹用于判斷所述語音字符串是否能夠被初次識(shí)別以及解析所述語音字符串中的至少一個(gè)詞元的詞元屬性信息; 根據(jù)所述初次識(shí)別的結(jié)果創(chuàng)建語義分析樹,所述語音分析樹根據(jù)解析的所述詞元屬性信息獲取預(yù)存儲(chǔ)屬性信息以創(chuàng)建語音識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的語音識(shí)別方法,其特征在于,根據(jù)所述語音字符串創(chuàng)建語法分析樹,包括以下具體步驟: 將所述語音字符串根據(jù)分隔符以及獲取順序劃分為包括至少一個(gè)字符串的隊(duì)列; 根據(jù)所述隊(duì)列的讀取規(guī)則將所述至少一個(gè)字符串發(fā)送至語法棧; 根據(jù)所述預(yù)定語法規(guī)則遍歷所述語法棧中的所述至少一個(gè)字符串,將符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串中的任一字符串合并為一個(gè)可識(shí)別元素,將不符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串作為不可識(shí)別元素,其中,可識(shí)別元素中的字符串作為所述詞元。
3.根據(jù)權(quán)利要求2所述的語音識(shí)別方法,其特征在于,根據(jù)所述初次識(shí)別的結(jié)果創(chuàng)建語義分析樹,包括以下具體步驟: 在遍歷所述語法棧后,對(duì)所述詞元進(jìn)行屬性信息分析; 根據(jù)所述屬性信息根據(jù)遍歷順序與所述屬性信息對(duì)應(yīng)的所述詞元?jiǎng)?chuàng)建所述語義分析樹。
4.根據(jù)權(quán)利要求3所述的語音識(shí)別方法,其特征在于,根據(jù)所述屬性信息根據(jù)遍歷順序與所述屬性信息對(duì)應(yīng)的所述詞元?jiǎng)?chuàng)建所述語義分析樹,包括以下具體步驟: 判斷所述詞元是否包括詞元屬性定義,包括: 在判定所述詞元包括詞元屬性定義時(shí),判斷所述語義分析樹中的所述屬性信息是否具備相同所述詞元屬性定義; 在判定所述語義分析樹中的所述屬性信息具備相同所述詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⒕邆湎嗤鲈~元屬性定義的所述屬性信息合并至總屬性信息文檔,所述總屬性信息文檔作為所述語音識(shí)別結(jié)果提示給用戶,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
5.根據(jù)權(quán)利要求4所述的語音識(shí)別方法,其特征在于,判斷所述詞元是否包括詞元屬性定義,還包括以下具體步驟: 在判定所述詞元不包括詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⑺鰧傩孕畔⒁约八鰧傩孕畔?duì)應(yīng)的詞元信息合并至總屬性信息文檔,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
6.一種語音識(shí)別系統(tǒng),其特征在于,包括: 獲取單元,用于獲取語音字符串; 創(chuàng)建單元,用于根據(jù)所述語音字符串創(chuàng)建語法分析樹,所述語法分析樹用于判斷所述語音字符串是否能夠被初次識(shí)別以及解析所述語音字符串中的至少一個(gè)詞元的詞元屬性信息; 所述創(chuàng)建單元還用于,根據(jù)所述初次識(shí)別的結(jié)果創(chuàng)建語義分析樹,所述語音分析樹根據(jù)解析的所述詞元屬性信息獲取預(yù)存儲(chǔ)屬性信息以創(chuàng)建語音識(shí)別結(jié)果。
7.根據(jù)權(quán)利要求6所述的語音識(shí)別系統(tǒng),其特征在于,包括: 劃分單元,用于將所述語音字符串根據(jù)分隔符以及獲取順序劃分為包括至少一個(gè)字符串的隊(duì)列; 發(fā)送單元,用于根據(jù)所述隊(duì)列的讀取規(guī)則將所述至少一個(gè)字符串發(fā)送至語法棧; 合并單元,用于根據(jù)所述預(yù)定語法規(guī)則遍歷所述語法棧中的所述至少一個(gè)字符串,將符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串中的任一字符串合并為一個(gè)可識(shí)別元素,將不符合所述預(yù)定語法規(guī)則的所述至少一個(gè)字符串作為不可識(shí)別元素,其中,可識(shí)別元素中的字符串作為所述詞元。
8.根據(jù)權(quán)利要求7所述的語音識(shí)別系統(tǒng),其特征在于,包括: 分析單元,用于在遍歷所述語法棧后,對(duì)所述詞元進(jìn)行屬性信息分析; 所述創(chuàng)建單元還用于,根據(jù)所述屬性信息根據(jù)遍歷順序與所述屬性信息對(duì)應(yīng)的所述詞元?jiǎng)?chuàng)建所述語義分析樹。
9.根據(jù)權(quán)利要求8所述的語音識(shí)別系統(tǒng),其特征在于,包括: 判斷單元,用于判斷所述詞元是否包括詞元屬性定義,所述判斷單元還用于,在判定所述詞元包括詞元屬性定義時(shí),判斷所述語義分析樹中的所述屬性信息是否具備相同所述詞元屬性定義; 所述合并單元還用于,在判定所述語義分析樹中的所述屬性信息具備相同所述詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⒕邆湎嗤鲈~元屬性定義的所述屬性信息合并至總屬性信息文檔,所述總屬性信息文檔作為所述語音識(shí)別結(jié)果提示給用戶,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
10.根據(jù)權(quán)利要求9所述的語音識(shí)別系統(tǒng),其特征在于,所述合并單元還用于,在判定所述詞元不包括詞元屬性定義時(shí),根據(jù)遍歷順序?qū)⑺鰧傩孕畔⒁约八鰧傩孕畔?duì)應(yīng)的詞元信息合并至總屬性信息文檔,其中,所述屬性信息即為所述語義分析樹的節(jié)點(diǎn)。
11.一種語音識(shí)別設(shè)備,其特征在于,包括:如權(quán)利要求6至10中任一項(xiàng)所述的語音識(shí)別系統(tǒng)。
【文檔編號(hào)】G10L15/28GK104485106SQ201410742635
【公開日】2015年4月1日 申請(qǐng)日期:2014年12月8日 優(yōu)先權(quán)日:2014年12月8日
【發(fā)明者】李陽 申請(qǐng)人:暢捷通信息技術(shù)股份有限公司