處理語音文本的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息處理技術(shù)領(lǐng)域,特別涉及一種處理語音文本的方法及裝置。
【背景技術(shù)】
[0002]隨著信息處理技術(shù)的不斷發(fā)展,以自然語言進行人機交互成為現(xiàn)實。實現(xiàn)人機交互的關(guān)鍵是要準(zhǔn)確理解用戶發(fā)出的自然語言指令并進行相應(yīng)的操作。用戶在發(fā)出自然語言指令后,該指令被轉(zhuǎn)換為語音文本,如何處理語音文本,成為人們關(guān)注的問題。
[0003]現(xiàn)有技術(shù)有兩種處理語音文本的方式,第一種方式:對語音文本進行詞匯映射,得到映射結(jié)果;通過規(guī)則卡位提取映射結(jié)果中的位置參數(shù),得到卡位提取結(jié)果;將卡位提取結(jié)果和預(yù)設(shè)規(guī)則進行匹配,得到一個匹配規(guī)則;根據(jù)得到的一個匹配規(guī)則對語音文本進行處理。其中,規(guī)則卡位是根據(jù)正則規(guī)則獲得的指定位置。第二種方式:對語音文本進行命名實體映射,得到第一映射結(jié)果;對命名實體映射的結(jié)果進行詞匯映射,得到第二映射結(jié)果;將第二映射結(jié)果和預(yù)設(shè)規(guī)則進行匹配,得到一個匹配規(guī)則;根據(jù)得到的一個匹配規(guī)則對語音文本進行處理。
[0004]在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:
[0005]正則規(guī)則不夠靈活,不適用于實際的語言環(huán)境。命名實體規(guī)則對于比較固定的語言環(huán)境以及不適宜建立實體命名庫的場景,不能充分發(fā)揮作用。因此,現(xiàn)有技術(shù)提供的兩種處理語音文本的方式均具有一定的局限性,導(dǎo)致語音文本的處理方式不夠優(yōu)化。
【發(fā)明內(nèi)容】
[0006]為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實施例提供了一種處理語音文本的方法及裝置。所述技術(shù)方案如下:
[0007]一方面,提供了一種處理語音文本的方法,所述方法包括:
[0008]對語音文本進行命名實體映射,得到第一映射結(jié)果;
[0009]對所述第一映射結(jié)果進行詞匯映射,得到第二映射結(jié)果;
[0010]將所述第二映射結(jié)果與包括正則規(guī)則的預(yù)設(shè)規(guī)則進行匹配,如果得到一個匹配規(guī)貝U,則根據(jù)得到的一個匹配規(guī)則對所述語音文本進行處理。
[0011]另一方面,提供了一種處理語音文本的裝置,所述裝置包括:
[0012]第一映射模塊,用于對語音文本進行命名實體映射,得到第一映射結(jié)果;
[0013]第二映射模塊,用于對所述第一映射結(jié)果進行詞匯映射,得到第二映射結(jié)果;
[0014]匹配模塊,用于將所述第二映射結(jié)果與包括正則規(guī)則的預(yù)設(shè)規(guī)則進行匹配;
[0015]第一處理模塊,用于當(dāng)?shù)玫揭粋€匹配規(guī)則時,根據(jù)得到的一個匹配規(guī)則對所述語音文本進行處理。
[0016]本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:
[0017]通過對語音文本進行命名實體映射,得到第一映射結(jié)果;對第一映射結(jié)果進行詞匯映射,得到第二映射結(jié)果;之后將第二映射結(jié)果與包括正則規(guī)則的預(yù)設(shè)規(guī)則進行匹配,并根據(jù)得到的一個匹配規(guī)則對語音文本進行處理,從而將正則規(guī)則和命名實體規(guī)則的配置格式統(tǒng)一,使處理語音文本技術(shù)既適用于實際的語言環(huán)境,又適用于固定的語言環(huán)境,擴大了處理語音文本技術(shù)的適用范圍,從而使語音文本的處理方式得到了優(yōu)化。
【附圖說明】
[0018]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0019]圖1是本發(fā)明實施例一提供的處理語音文本的方法流程圖;
[0020]圖2是本發(fā)明實施例二提供的處理語音文本的方法流程圖;
[0021]圖3是本發(fā)明實施例三提供的第一種處理語音文本的裝置結(jié)構(gòu)示意圖;
[0022]圖4是本發(fā)明實施例三提供的第二種處理語音文本的裝置結(jié)構(gòu)示意圖;
[0023]圖5是本發(fā)明實施例三提供的第三種處理語音文本的裝置結(jié)構(gòu)示意圖;
[0024]圖6是本發(fā)明實施例四提供的處理語音文本的終端結(jié)構(gòu)示意圖。
【具體實施方式】
[0025]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進一步地詳細(xì)描述。
[0026]實施例一
[0027]本發(fā)明實施例提供了一種處理語音文本的方法,參見圖1,方法流程包括如下步驟:
[0028]101:對語音文本進行命名實體映射,得到第一映射結(jié)果;
[0029]102:對第一映射結(jié)果進行詞匯映射,得到第二映射結(jié)果;
[0030]進一步地,對第一映射結(jié)果進行詞匯映射之前,包括:
[0031]將第一映射結(jié)果中的一至多個命名實體依次展開為映射前對應(yīng)的語音文本,得到至少兩個第三映射結(jié)果;
[0032]對第一映射結(jié)果進行詞匯映射,包括:
[0033]將每個第三映射結(jié)果中未被映射為命名實體的語音文本進行詞匯映射,得到第二映射結(jié)果。
[0034]103:將第二映射結(jié)果與包括正則規(guī)則的預(yù)設(shè)規(guī)則進行匹配,如果得到一個匹配規(guī)貝U,則根據(jù)得到的一個匹配規(guī)則對語音文本進行處理。
[0035]進一步地,將第二映射結(jié)果與包括正則規(guī)則的預(yù)設(shè)規(guī)則進行匹配之后,還包括:
[0036]如果得到至少兩個匹配規(guī)則,則對得到的所有匹配規(guī)則依次進行匹配寬度消岐處理、匹配加權(quán)值消岐處理、匹配密度消岐處理、命中數(shù)量消岐處理以及命名實體權(quán)值消岐處理中的至少一種消岐處理,直至得到一個消岐后的匹配規(guī)則;
[0037]根據(jù)得到的一個消岐后的匹配規(guī)則對語音文本進行處理。
[0038]進一步地,匹配寬度消岐處理,包括:
[0039]確定每個匹配規(guī)則對應(yīng)的第二映射結(jié)果的匹配寬度,將匹配寬度最大的匹配規(guī)則作為經(jīng)過匹配寬度消岐處理的匹配規(guī)則。
[0040]進一步地,匹配加權(quán)值消岐處理,包括:
[0041]按照預(yù)先設(shè)置的詞匯與命名實體的加權(quán)值確定每個待進行匹配加權(quán)值消岐處理的匹配規(guī)則的加權(quán)值;
[0042]將加權(quán)值最大的匹配規(guī)則作為經(jīng)過匹配加權(quán)值消岐處理的匹配規(guī)則;
[0043]其中,待進行匹配加權(quán)值消岐處理的匹配規(guī)則為經(jīng)過匹配寬度消岐處理的匹配規(guī)則。
[0044]進一步地,匹配密度消岐處理,包括:
[0045]確定每個待進行匹配密度消岐處理的匹配規(guī)則與第二映射結(jié)果的匹配比重,將匹配比重最大的匹配規(guī)則作為經(jīng)過匹配密度消岐處理的匹配規(guī)則;
[0046]其中,每個待進行匹配密度消岐處理的匹配規(guī)則為經(jīng)過匹配寬度消岐處理的匹配規(guī)則。
[0047]進一步地,命中數(shù)量消岐處理,包括:
[0048]確定每個待進行命中數(shù)量消岐處理的匹配規(guī)則的參數(shù)命中數(shù)量,參數(shù)為命名實體、詞匯和位置參數(shù)中的一個;
[0049]將參數(shù)命中數(shù)量最大的匹配結(jié)果作為經(jīng)過命中數(shù)量消岐處理的匹配規(guī)則;
[0050]其中,每個待進行命中數(shù)量消岐處理的匹配規(guī)則為經(jīng)過匹配寬度消岐處理的匹配規(guī)則。
[0051]進一步地,命名實體權(quán)值消岐處理,包括:
[0052]確定每個待進行命名實體權(quán)值消岐處理的匹配規(guī)則中命名實體的權(quán)重值,將命名實體的權(quán)重值最大的匹配規(guī)則作為經(jīng)過命名實體權(quán)值消岐處理的匹配規(guī)則;
[0053]其中,每個待進行命名實體權(quán)值消岐處理的匹配規(guī)則為經(jīng)過匹配寬度消岐處理的匹配規(guī)則。
[0054]本實施例提供的方法,通過對語音文本進行命名實體映射,得到第一映射結(jié)果;對第一映射結(jié)果進行詞匯映射,得到第二映射結(jié)果;之后將第二映射結(jié)果與包括正則規(guī)則的預(yù)設(shè)規(guī)則進行匹配,并根據(jù)得到的一個匹配規(guī)則對語音文本進行處理,從而將正則規(guī)則和命名實體規(guī)則的配置格式統(tǒng)一,使處理語音文本技術(shù)既適用于實際的語言環(huán)境,又適用于固定的語言環(huán)境,擴大了處理語音文本技術(shù)的適用范圍,從而使語音文本的處理方式得到了優(yōu)化。
[0055]實施例二
[0056]本發(fā)明實施例提供了一種處理語音文本的方法,結(jié)合上述實施例一的內(nèi)容,參見圖2,方法流程包括:
[0057]201:對語音文本進行命名實體映射,得到第一映射結(jié)果;
[0058]具體地,對語音文本進行命名實體映射,包括但不限于:建立命名實體庫;在語音文本中查找能夠被識別為命名實體庫中的命名實體的語音本文,并用命名實體替換查找到的語音文本。需要說明的是,命名實體是從網(wǎng)上大量的信息中搜集的,并且命名實體的識別是使用各個領(lǐng)域獨立字典樹的實現(xiàn)方式,即能夠支持到命名實體全部重合或部分重合的情況下找出所有的命名實體。
[0059]為了便于理解,以語音文本為“我想聽第一次”,命名實體用中文大括號【】表示為例進行說明。建立的命名實體中語音文本“我想”及“第一次”都對應(yīng)命名實體【歌名】;在語音文本中查找到語音文本“我想”及“第一次”都能夠被識別為命名實體庫中的【歌名】,用命名實體【歌名】替換查找到的語音文本“我想”及“第一次”后得到第一映射結(jié)果,即【歌名】聽【歌名】。
[0060]202:將第一映射結(jié)果中的一至多個命名實體依次展開為映射前對應(yīng)的語音文本,得到至少兩個第三映射結(jié)果;
[0061]針對該步驟,由于命名實體可能和詞匯重疊,則將第一映射結(jié)果中的一至多個命名實體依次展開為映射前對應(yīng)的語音文本,得到至少兩個第三映射結(jié)果,從而增加了映射結(jié)果,避免命名實體和詞匯重疊的情況下不能準(zhǔn)確處理語音文本。
[0062]需要說明的是,如果第一映射結(jié)果中沒有命名實體部分重疊的情況,并且第一映射結(jié)果中一共有η個命名實體,則將一至多個命名實體依次展開為映射前對應(yīng)的語音文本后得到2~η個第三映射結(jié)果。
[0063]為了便于理解,仍以語音文本為“我想聽第一次”為例進行說明。其中,語音文本對應(yīng)的第一映射結(jié)果為【歌名】聽【歌名】。將【歌名】聽【歌名】中的兩個命名實體依次展開為映射前對應(yīng)的語音文本,得到【歌名】聽【歌名】、我想聽【歌名】、【歌名】聽第一次、我想聽第一次,這四個第三映射結(jié)果。
[0064]203:將每個第三映射結(jié)果中未被映射為命名實體的語音文本進行詞匯映射,得到第二映射結(jié)果;
[0065]針對該步驟,進行詞匯映射中的詞匯是人工配置的,將日常語言中表達相同含義的語音文本映射為相同的詞匯。由于相同含義的語音文本在實際的語言環(huán)境中可能對應(yīng)不同的語音文本,將未被映射為命名實體的語音文本進行詞匯映射,可以減少重復(fù)匹配的工作量。關(guān)于將每個第三映射結(jié)果中未被映射為命名實體的語音文本進行詞匯映射的方式,本實施例不作具體限定。
[0066]為了便于理解,以上述步驟202中的第三映射結(jié)果為例進行說明。其中,“我想聽”映射到詞匯〈播放 &g