專利名稱:自然語言處理裝置及方法
技術(shù)領域:
本發(fā)明涉及處理自然語言的自然語言處理裝置及方法,具體而言,涉及在處理過程中簡化用戶所作選擇和確認的自然語言處理裝置及方法。
背景技術(shù):
已往,利用諸如自動翻譯、語音識別、文件檢索、文件處理等自然語言處理的系統(tǒng)已得到實用化。
作為已往這種系統(tǒng)的例子,圖1示出了已有技術(shù)語音翻譯裝置的處理過程的主要流程。
在該語音翻譯裝置的處理過程中,步驟S101輸入語音,步驟S102識別語音,在步驟S103由用戶確認該語音識別的結(jié)果。若用戶認可語音識別的結(jié)果,則在步驟S104機器翻譯識別結(jié)果,如果不認可,則回到步驟S101再執(zhí)行語音識別。
在步驟S105,用戶對在步驟S104機器翻譯的結(jié)果進行確認,需要時在步驟S106實施編輯,最后在步驟S107產(chǎn)生合成語音,并結(jié)束該處理過程。
這樣,在步驟S101,用戶首先自己發(fā)話向語音翻譯裝置輸入語音。在步驟S102語音翻譯裝置對輸入的語音進行識別,顯示其結(jié)果。在語音識別處理中可能引起誤識別,故經(jīng)常進行所謂用戶確認識別結(jié)果的處理。
作為步驟S103中確認識別結(jié)果的方法,常用在識別處理中顯示多個得分高的上層候選句再請用戶從它們中加以選擇的方法。然而,若顯示的句中未包含自身講的語句時,則再次輸入語音。如果經(jīng)用戶確認確定了用戶輸入語音的句,則在步驟S104將該句翻譯成目的語言。
通常,翻譯處理也會出現(xiàn)輸出中包含其它錯誤結(jié)果的可能性,為了保證翻譯準確度,在步驟S105要進行用戶確認翻譯結(jié)果的作業(yè)。因而,如果翻譯結(jié)果不正確,則在步驟S106編輯成恰當?shù)哪康恼Z言表述。
然后,在步驟S107根據(jù)翻譯結(jié)果產(chǎn)生合成語音加以輸出,并結(jié)束該語音識別處理過程。
但是,在使用已有技術(shù)自然語言處理的系統(tǒng)中,不能說已備有適合用戶的界面(接口)。例如,在上述結(jié)構(gòu)的語音翻譯裝置中,存在下面2個問題。
第一個問題是處理的自然語言的多樣性和處理準確度的問題。用現(xiàn)有的機器翻譯要想對多樣的輸入句作高準確度翻譯是非常困難的。一般的機器翻譯存在作為原語言的輸入句要處理的體裁越多,翻譯的準確度就越低的問題。另外,對輸入句的句型或詞匯加以限制雖能提高翻譯準確度,但是,強制輸入帶有這種限制會增加用戶負擔。而且,在輸入句上存在意思或修飾關(guān)系等的多義性或狀況依存性等情況下,其翻譯結(jié)果一般有多個。
為了唯一地指定翻譯結(jié)果,可在翻譯裝置側(cè)自動選擇或請用戶選擇恰當?shù)暮蜻x句,但前者可能選擇不同的候選句,而后者若用戶不詳細了解目的語言將難作選擇。作為后者的應用,采用的方法是,將翻譯結(jié)果再次翻譯成原語言,向用戶提示再翻譯結(jié)果,讓用戶選擇、確認,這種方法在再翻譯過程中會產(chǎn)生錯誤。另外,采用展現(xiàn)句結(jié)構(gòu)樹等內(nèi)部表現(xiàn)或翻譯處理過程記錄等來代替提示翻譯結(jié)果的方法,用戶必須知道查找方式。因此,用戶進行選擇和確認是困難的。
上述問題不僅表現(xiàn)在機器翻譯處理上,而且可以說表現(xiàn)在借助自然語言應用諸如數(shù)據(jù)庫檢索、表現(xiàn)支持等自然語言處理的所有裝置上。
第二個問題是用戶確認作業(yè)的問題。如果從用戶確認作業(yè)出發(fā)觀察一下上述處理過程,則用戶需要對語音識別結(jié)果、機器翻譯結(jié)果進行2次確認作業(yè),故確認次數(shù)多,麻煩。
這可以說是對利用自然語言處理的多個模塊進行組合的系統(tǒng)的一般情形。例如,考慮采用假名漢字變換輸入日語并用機器翻譯將其譯為英語的情況下,用戶用假名輸入日語,確認變換后的漢字,首先生成正確假名漢字混合的日語。然后將其作為輸入進行日英翻譯,其結(jié)果再由用戶確認。
而且,在機器翻譯情況下,當用戶不習慣于目的語言時,存在的問題是確認該翻譯結(jié)果是極困難的。
本發(fā)明的揭示本發(fā)明是鑒于上述情況進行的,其目的在于提供一種能保持處理準確度同時能減少確認作業(yè)的自然語言處理裝置及方法。
本發(fā)明的自然語言處理裝置,包含輸入自然語言的輸入手段、對上述輸入手段輸入的自然語言進行變換的變換手段、對上述變換手段變換后的自然語言進行確認的確認手段,以及對上述確認手段確認后的自然語言進行處理的處理手段;輸出上述處理手段處理過的自然語言的輸出手段。
本發(fā)明的自然語言處理裝置包含輸入自然語言的輸入手段、對自然語言進行處理的一個或兩個以上的處理手段、對自然語言處理結(jié)果進行確認的一個或兩個以上的確認手段,以及輸出處理后自然語言的輸出手段,其中,采用的結(jié)果是按照第1處理手段及確認其結(jié)果的第1確認手段的順序處理后的結(jié)果,在上述第1處理手段之前設置第2處理手段和第2確認手段,所述第2處理手段將輸入上述輸入手段的自然語言變換為可高準確度處理的形式,所述第2確認手段確認所述第2處理手段的結(jié)果,從而進行省略對第1處理手段結(jié)果進行確認的提前確認。
本發(fā)明的自然語言處理裝置具有輸入自然語言的輸入手段;用第2語言的表現(xiàn)及第3語言的表現(xiàn)將輸入所述輸入手段的第1語言變換為一對一對應于所述第2語言表現(xiàn)的變換手段;對所述變換手段變換的所述第3語言的表現(xiàn)進行確認的確認手段;根據(jù)所述確認手段確認的結(jié)果對輸入所述輸入手段的自然語言實施處理的處理手段;輸出經(jīng)所述處理手段處理的自然語言的輸出手段。
本發(fā)明的自然語言處理方法包含輸入自然語言的輸入過程、對所述輸入過程輸入的自然語言進行變換的變換過程/對所述變換過程變換的自然語言進行確認的確認過程,以及對所述確認過程確認的自然語言實施處理的處理過程;輸出經(jīng)所述自然語言處理過程處理的自然語言的輸出過程。
本發(fā)明的自然語言處理方法包含輸入自然語言的輸入過程;對自然語言進行處理的一個或兩個以上的處理過程;對自然語言處理結(jié)果進行確認的一個或兩個以上的確認過程;輸出處理后自然語言的輸出過程,其中,采用的結(jié)果是按照第1處理過程及確認其結(jié)果的第1確認過程的順序處理后的結(jié)果,在上述第1處理過程之前設置第2處理過程和第2確認過程,所述第2處理過程將輸入上述輸入過程的自然語言變換為可高準確度處理的形式,所述第2確認過程確認所述第2處理過程的結(jié)果,從而進行省略對第1處理過程結(jié)果進行確認的提前確認。
本發(fā)明的自然語言處理裝置具有輸入自然語言的輸入過程;用第2語言的表現(xiàn)及第3語言的表現(xiàn)將在所述輸入過程輸入的第1語言變換為一對一對應于所述第2語言表現(xiàn)的變換過程;對所述變換過程變換的所述第3語言的表現(xiàn)進行確認的確認過程;根據(jù)所述確認過程確認的結(jié)果對在所述輸入過程輸入的自然語言實施處理的處理過程;輸出經(jīng)所述處理過程處理的自然語言的輸出過程。
這樣,在本發(fā)明中,不是將用戶輸入的句(除句外還包括短語和子句,以下也一樣)直接用于自然語言處理,而在其間加有“表現(xiàn)變換處理”和“確認/選擇等待”。另外,上述自然語言處理與表現(xiàn)變換處理同時進行,并對這樣生成的“自然語言處理結(jié)果和表現(xiàn)變換處理結(jié)果對”進行確認/選擇。也即,進行表現(xiàn)變換處理,將輸入的句變換為能對后續(xù)的自然語言進行高準確度處理的句,使得接近用戶的意圖。表現(xiàn)變換處理可不在機器翻譯處理前進行,而與機器翻譯處理同時進行。
在“確認等待”和“機器翻譯”之間,也可插入“再變換處理”。該處理在“表現(xiàn)變換”內(nèi)不改變文句的意思和微細差別,只是作部分語序等的改變。這樣,供給用戶的文句能夠比較接近輸入的文句,供給翻譯處理的文句可為適合于處理的句。
表現(xiàn)翻譯變換處理可不在機器翻譯處理前進行,而與機器翻譯處理同時進行。此時,每一翻譯處理預先備有對應的表現(xiàn)變換處理,從而某句中用某個翻譯處理時也用相應的表現(xiàn)變換處理。于是,生成翻譯結(jié)果與表現(xiàn)變換處理的對。然后,進行“確認/選擇”,提示該對或只提示表現(xiàn)變換結(jié)果。
本發(fā)明分成準確度可保證的處理和不能保證的處理,對于連續(xù)多個功能模塊的處理也可將準確度不能保證部分的處理加以匯總處理,之后,用戶進行確認作業(yè),因而減少了用戶的確認次數(shù)。也即,在上述處理過程中,在一次確定語音識別結(jié)果后,不進行機器翻譯,而進行語音識別結(jié)果照原樣保持多個可能性的機器翻譯處理,用戶僅對其結(jié)果進行確認。
附圖的簡單說明圖1為已有技術(shù)語音翻譯裝置處理過程的主要流程圖;圖2為表示翻譯裝置主要結(jié)構(gòu)的框圖;圖3為表示一例模板的示意圖;圖4為表示對譯辭典的一例示意圖;圖5為表示表現(xiàn)變換規(guī)則一例的示意圖;圖6為對于“バツグを買いたいのですが、見せていただけないでしようか?”(想買個包,能讓看看嗎?)變換結(jié)果的說明圖;圖7為表示翻譯裝置處理過程的流程圖;圖8為翻譯裝置處理過程且為帶有再變換處理的流程圖;圖9為表示語音翻譯裝置主要結(jié)構(gòu)的框圖;圖10為表示語音翻譯裝置外觀的立體圖;
圖11為表示語音翻譯裝置處理過程的流程圖;圖12為語音翻譯裝置中處理例的說明圖;圖13為表示對譯模板例的示意圖;圖14為表示輸入和輸出例的示意圖;圖15為表示輸入和輸出例的示意圖;圖16為表示附加注解的模板例的示意圖;圖17為表示相對于輸入“すいません”的輸出例的示意圖;圖18為表示相對于輸入“~が、~”的輸出例的示意圖;圖19A為表示使用提前確認前的示意圖;圖19B為表示使用提前確認后的示意圖;圖20A為表示使用遲后確認前的示意圖;圖20B為表示使用遲后確認后的示意圖;圖21A為表示使用提前和遲后確認前的示意圖;圖21B為表示使用提前確認后的示意圖;圖21C為表示使用提前和遲后確認后的示意圖;圖22A為表示語音翻譯的示意圖;圖22B為表示對圖22A使用提前確認的示意圖;圖22C為表示對圖22B使用遲后確認的示意圖;圖22D為表示對圖22C使用遲后和綜合確認的示意圖。
實施發(fā)明用的最佳形態(tài)下面參照
本發(fā)明較佳結(jié)構(gòu)例。
首先說明利用自然語言處理進行機器翻譯的翻譯裝置,作為本發(fā)明第1實施例。
翻譯裝置如圖2所示,包含顯示表現(xiàn)變換、機器翻譯等結(jié)果的顯示部1;接受輸入的輸入部2;對表現(xiàn)形式進行變換的表現(xiàn)變換部3;變換為其它語言的機器翻譯部4;控制該翻譯裝置各部分的控制部5。
顯示部1例如由液晶顯器等構(gòu)成,并根據(jù)控制部的指令顯示表現(xiàn)變換、機器翻譯等。
輸入部2例如由多個按鈕或觸摸面板等構(gòu)成。用戶可用它們對顯示部顯示的信息進行選擇或進行系統(tǒng)動作的選擇。輸入部2也接受翻譯對象句的輸入。然后,輸入部2將用戶輸入的結(jié)果傳送給控制部5。
表現(xiàn)變換部3例如由CPU、ROM、RAM等構(gòu)成,并通過控制部5接受用戶輸入輸入部2的結(jié)果。然后,將從控制部5獲取的輸入結(jié)果變換為機器翻譯部4要處理的形式。表現(xiàn)變換部3將變換結(jié)果傳送給控制部5。
機器翻譯部4,與表現(xiàn)變換部3一樣也是例如由CPU、ROM、RAM等構(gòu)成,并通過控制部5接受表現(xiàn)變換部3的變換結(jié)果。機器翻譯部4將從控制部5接收到的變換結(jié)果翻譯成其它語言,然后將翻譯成其它語言的結(jié)果傳送給控制部5。
控制部5,與表現(xiàn)變換部3及機器翻譯部4一樣,也是由如CPU、ROM、RAM等構(gòu)成,并進行數(shù)據(jù)傳送控制,例如將輸入輸入部2的數(shù)據(jù)傳送給表現(xiàn)變換部3,將表現(xiàn)變換部3的變換結(jié)果傳送給機器翻譯部4??刂撇?還利用控制信號對該翻譯裝置的各部分進行控制。
表現(xiàn)變換部3、機器翻譯部4及控制部5,除了如上述那樣獨立構(gòu)成外,也可由同一CPU、ROM、RAM構(gòu)成的控制塊內(nèi)的功能塊構(gòu)成。
接著,說明該翻譯裝置中利用自然語言的機器翻譯。
在該翻譯裝置中,對翻譯方法、翻譯前語言(原語言)或翻譯后語言(目的語言)沒有特別限制。但在下面的說明中,假定采用對譯模板,采用替換模板上的語句生成翻譯結(jié)果的方法作為翻譯方法。而且,原語言取日語,目的語言取英語。
對譯模板由日語部分和將其譯為英語的英語部分構(gòu)成。在圖3所示的對譯模板例中,分別有如下對應關(guān)系“X please.”對應于“X《物》を下さい?!?;“1 want to go to X.”對應于“私はX《場所》に行きたい?!保弧癢ould you showY X?”對應于“X《物》をY《人》に見せてください?!保弧癝1,but S2.”對應于“S1《句》しかしS2《句》”;“S1,and S2.”對應于“S1《句》そしてS2《句》”;“S1.So S2.”對應于“S1《句》だからS2《句》”;“Thank you.”對應于“すいません(=ありがとう)”;“I am sorry.”對應于“すいません(=謝る)”;“Excuse me.”對應于“すいません(=呼びかけ)”;“X go byY.”對應于“X《人》がY《乘り物を》を使う(=XがYに乘る)”;“X consumeY.”對應于“X《人》がYを使う(=XがYを消費する)”。
在對譯模板中,日語部分為日語的句、子句、短語、單詞等。下面為簡單起見,將它們統(tǒng)稱為句。日語部分的一部分也可用變量表示,而且也可指定該變量應滿足的屬性。例如,在圖3的1中的“X《物》を下さい”中,“X《物》”中的X是變量,這里可代入具有屬性“物”的詞。各詞的屬性記載在下文的對譯辭典中。
對譯模板的英語部分是日語部分的對應翻譯。在日語部分包含變量情況下,英語部分的對應部分也包含變量。例如,圖3的1中的日語部分“X《物》を下さい”中包含變量,則其英語部分“X please”的對應部分也包含變量。
對譯辭典記載有日語的詞、與該日語詞對應的英語語詞、和應滿足的屬性。作為對譯語辭典的例子如圖4所示,列舉對應關(guān)系有,英語“I”及屬性“人”對應于日語“私”;英語“apple”及屬性“物”對應于日語“リンゴ”;英語“London”及屬性“地方”對應于英語“ロンドン”。
下面,說明表現(xiàn)變換部3中的表現(xiàn)變換處理。
表現(xiàn)變換部3通過控制部5接受用戶輸入到輸入部2的句。然后進行變換使得能對該句進行高準確度的變換。在本實施例中,表現(xiàn)變換部3將用戶用日語輸入的日語句進行變換,使日語與對譯模板的日語部分匹配。
作為表現(xiàn)變換部3中的變換,除了11變換外,還可考慮m1變換或1n變換、或作為它們進一步組合的nm變換等。
這里,11變換就是對一個輸入文句變換結(jié)果為一個的變換。m1變換就是對m個輸入文句變換結(jié)果為一個的變換。1n變換就是對一個輸入文句、變換結(jié)果為n個的變換。
表現(xiàn)變換,一般可考慮融合、分割、插入、刪除、置換、順序替換。
如上所述,表現(xiàn)變換規(guī)則以變換后請求用戶選擇、確認為前提,故候選對象為多個也沒關(guān)系,也可作若干細微差別發(fā)生變化的變換。
下面,作為主要變換規(guī)則,說明句末用變換規(guī)則、復合句分解用規(guī)則、多義表達用規(guī)則、空缺要素補充規(guī)則,及順序交換規(guī)則。
句末用變換規(guī)則,是在對于一個意圖存在多個表現(xiàn)且主要表現(xiàn)在句末差別情況下使這些多個表現(xiàn)對應于單個表現(xiàn)的規(guī)則。
作為句末用變換規(guī)則,例如在用日語表達委托的情況下,將“してください”、“してもらえませんか”、“していただけないでしようか”、“してほしいのですが”等多個表現(xiàn)置換為“してください”單一表現(xiàn)。這就是上述用m1變換的例子。
如果按照圖5的變換規(guī)則,則句末用變換規(guī)則有如下各對應關(guān)系,“~て下さい”對應于“~てもらえませんか”;“~て下さい”對應于“~ていただけないでしようか”;“~たい”對應于“~たいのです”;“~たい”對應于“~たいのですが”。
復合句分解用規(guī)則,因接續(xù)助詞或接續(xù)詞產(chǎn)生多義性,故這種情況下生成多個置換成單義接續(xù)詞的交替部分。復合句分解規(guī)則是用上述1n變換進行分割的例子。作為多義的復合句,如“~が、~”可順向連接也可反向連接。
若用圖5變換規(guī)則,則復合句用變換規(guī)則有如下各對應關(guān)系,“~。しかし、~”對應于“~が《接續(xù)詞》~”;“~。そして、~”對應于“~が《接續(xù)詞》~”;“~。だから、~”對應于“~が《接續(xù)詞》~”;“~。だから~”對應于“~て~”;“~。そして~”對應于“~て~”;“~。しかし~”對應于“~て~”。
多義表達用規(guī)則,對多義表達生成多個置換為單義表達的候選對象。這是用1n變換進行置換的例子。多義表達如“すいません”,當向人表達感謝時、打招呼時或表示歉意時都可使用。
按照圖5的變換規(guī)則,作為多義表達用規(guī)則有下面各對應關(guān)系,“すいません(=ありがとう)”對應于“すいません”;“すいません(=謝る)”對應于“すいまん”;“すいまん(=呼びかけ)”對應于“すいまん”;“Xを使う(=Xに乘る)”對應于“Xを使う”;“Xを使う(=Xを消費する)”對應于“Xを使う”。
空缺要素補充規(guī)則是一種作英翻譯時處理中將空缺要素用于輸入句的情況下進行該要素補充的規(guī)則。例如是翻譯“これを見せてください”時補充“私に”的規(guī)則。補充詞的缺省例如記載在對譯模板中。這就是進行插入的例子。
按照圖5的變換規(guī)則,作為空缺要素補充規(guī)則有下面各對應關(guān)系,“(これを)見せてください”對應于“見せてください”;“(あれを)見せてください”對應于“見せてください”;“(それを)見せてください”對應于“見せてください”。
順序交換規(guī)則,是一種在不改變意思范圍內(nèi)替換語序用的規(guī)則。例如輸入句為“それを私に下さい”、模板上為“XをYに下さい”的情況下,替換輸入句中“それを”和“私に”,變換為“私にそれを下さい”,使能與模板匹配。這是進行順序替換的例子。
按照圖5的變換規(guī)則,順序交換規(guī)則有下面各對應關(guān)系,“XがYを”對應于“YをXが”;“XがYに”對應于“YにXが”;“XがYにZを”對應于“XがZをYに”;“XがYにZを”對應于“YにXがZを”;“XがYにZを”對應于“YにZをXが”;“XがYにZを”對應于“ZをXがYに”;“XがYにZを”對應于“ZをYにXが”。
即使對所輸入的句或詞實施這些變換也不能與對譯模板中日語部分匹配的語句,用某種適當?shù)某叨冗M行最佳匹配,再請用戶對該結(jié)果獲得的N層候選對象進行選擇,或顯示“該輸入不能處理”的消息。
一旦表現(xiàn)變換部3對所輸入句的表現(xiàn)進行變換,其結(jié)果就提示給用戶進行確認、選擇。
也即,請用戶確認表現(xiàn)變換部3的變換結(jié)果是否符合其意圖。變換結(jié)果為多個的情況下,提示這些結(jié)果,請用戶選擇符合其意圖的那個。
作為確認、選擇的方法有每當使用上述變換規(guī)則時進行的方法、全部使用后只進行一次的方法,以及某次使用時進行的方法等。
表現(xiàn)變換規(guī)則中如順序交換規(guī)則,是在文句含義基本不變情況下進行的。這種規(guī)則是在用戶進行確認、選擇后使用的,可進行再變換。也即,在句的含義大致不變的情況下,可對確認、選擇后的變換候選對象進行再次變換的再變換。
通過增加這樣的再變換處理,可在確認、選擇時用與輸入句相同的語序進行,并將適合于處理的句提供給翻譯處理。
下面,對表現(xiàn)變換部3中進行的表現(xiàn)變換處理進行舉例說明。
作為這里處理的例子,列出圖6所示輸入“バツグを買いたいのですが、見せていただけないでしようか?”(想買個包,能讓看看嗎?)時的變換過程。在該例中,假定每使用一個規(guī)則就進行確認、選擇,但在其它時間也可進行確認、選擇。
首先,在步驟S1,從控制部5將“バツグを買いたいのですが、見せていただけないでしようか?”的輸入句送入表現(xiàn)變換部3。
在步驟S2,表現(xiàn)變換部3用復合句分解用的“~が~”項目將輸入句分解成2個句,再補上單義接續(xù)詞。由于接續(xù)詞可能是順接、反接或原因,故補充3種接續(xù)詞“しかし”、“そして”及“だから”。
這樣一來,上述輸入文句被變換成3種句“バツグを買いたいのです。しかし、見せていただけないでしようか?”、“バツグを買いたいのです。そして、見せていただけないでしようか?”及“バツグを買いたいのです。だから、見せていただけないでしようか?”。然后,這3種句顯示在顯示部1上。
用戶從顯示部1提示的這3種句選擇第3個句“バツグを買いたいのです。だから、見せていただけないでしようか?”。
在步驟S3,表現(xiàn)變換部3對所選擇的第3個句使用文末變換用規(guī)則,變換成簡單并符合用戶意圖的表現(xiàn)。通過使用文末變換用規(guī)則,“~たいのです”變?yōu)椤啊郡ぁ?;“~ていただけないでしようか?”變?yōu)椤啊窍陇丹ぁ薄R布?,上述?個句變換為“バツグを買いたい。だから、見せてください”。
在步驟S4,表現(xiàn)變換部3對該句使用空缺要素補充規(guī)則,補充英譯時空缺的要素。使用圖5所示變換規(guī)則,對“バツグを買いたい”補充“私は”,對“見せてください”補充“それを”和“私に”。
在步驟S5,表現(xiàn)變換部3將輸入句變換為最后的“(私は)バツグを買いたい。だから、(それを)(私に)見せてください?!?。該句由于與對譯模板中日語部分匹配,故能獲得比最初輸入句準確度高的翻譯。
上述例中,在翻譯的原語言內(nèi)進行表現(xiàn)變換,故用戶能方便進行確認、選擇。
此外,考慮從日語翻譯成德語的情況,用機器作自動翻譯時,通常英德翻譯的準確度比日德翻譯的高。因而,在用戶除了日語外還熟悉英語的情況下,也可以實現(xiàn)這樣的系統(tǒng)結(jié)構(gòu),即先從日語翻譯成英語進行表現(xiàn)變換,在用戶確認該結(jié)果后再翻譯成德語。
下面,參照圖7所示流程說明翻譯裝置中機器翻譯的處理過程。
在第一步驟S11,進行輸入等待,等待用戶對輸入部2輸入句子。一旦句子輸入到輸入部2,所輸入的句通過控制部5送入表現(xiàn)變換部3。
在步驟S12,表現(xiàn)部3在原語言內(nèi)變換輸入的句。在接著的步驟S13,將步驟S12中變換過的句顯示在顯示部1上,等待用戶確認、選擇。
在步驟S14,用機器翻譯部4對步驟S13中確認,選擇的文句進行翻譯處理。在步驟S14將翻譯結(jié)果顯示在顯示部1上,并結(jié)束該處理過程。
這樣一來,用戶輸入的句不是直接經(jīng)受自然語言處理,即上述例情況下,不是直接經(jīng)受機器翻譯處理,而且其間增添“表現(xiàn)變換處理”和“確認、選擇等待”。
表現(xiàn)變換處理將輸入文句變換為接近用戶意圖的句,同時變換成能高準確度執(zhí)行后續(xù)自然語言處理的文句。該處理以表現(xiàn)變換后請用戶確認、選擇為前提,故變換準確度末必高就可以了,且變換結(jié)果生成多個也沒關(guān)系。
在上述處理過程中,如圖8所示,在步驟S12的原語言內(nèi)變換處理后續(xù)的步驟S13的確認、選擇等待的下面,還可進行步驟S21的再變換處理。其它過程與圖7所示的處理過程相同,故附加同一標號。
這樣一來,在“確認、選擇等待”與“機器翻譯”之間也可插入“再變換處理”。這種處理在“表現(xiàn)變換”內(nèi)不改變句的含義或細微差別,例如只是進行替換部分語序的變換。于是,提示給用戶的能夠是比較接近輸入句的句子,且送給翻譯處理的能夠是適合于處理的句。
下面,說明利用自然語言處理進行語音翻譯的語音翻譯裝置作為本發(fā)明第2實施例。
首先,說明語音翻譯裝置的構(gòu)成。為了簡單起見,在語音翻譯裝置中與上述翻譯裝置相同部分附加同一標號。
如圖9所示,語音翻譯裝置包含顯示各種信息的顯示部1;接受輸入的輸入部2;變換句表現(xiàn)的表現(xiàn)變換部3;翻譯句的機器翻譯部4;進行語音識別處理的語音識別部7;生成合成語音的語音合成部8;對該語音翻譯裝置各部分進行控制的控制部5。
顯示部1例如用液晶顯示器等構(gòu)成,并根據(jù)控制部5的指令顯示各種信息。
輸入部2例如用多個按鈕或觸摸面板等構(gòu)成,用戶利用它對顯示在顯示部1的信息進行選擇,或?qū)εc系統(tǒng)動作有關(guān)的菜單進行選擇,并將用戶產(chǎn)生的輸入結(jié)果傳送給控制部5。
語音識別部7例如用拾音器、AD變換器、運算部、存儲部等構(gòu)成,用拾音器輸入用戶發(fā)出的語音,對輸入的語音進行AD變換,變成數(shù)字信號,進行識別處理。也即,語音識別部7識別用戶發(fā)音的內(nèi)容,并將對應于發(fā)音內(nèi)容的識別結(jié)果輸出給控制部。
語音合成部8例如用運算部、存儲部、DA變換部、揚聲器等構(gòu)成,從控制部5接受經(jīng)機器翻譯部3翻譯過的句,生成合成語音,從揚聲器輸出。
圖10示出語音合成裝置外觀的一例,在大致平坦的正方體形的殼體20的前面,具有構(gòu)成顯示部1的大致矩形的液晶顯示器21、構(gòu)成輸入部2的各種按鈕22、將語音輸入語音識別部7的拾音器24,以及輸出語音合成部8的合成語音的揚聲器25。
下面,參照圖11所示流程說明語音合成裝置中的處理過程。
語音翻譯裝置中的處理過程將語音輸入的日語作為原語言,翻譯成英語作為目的語言,并輸出英語的合成語音。
在第一步驟S31中,用戶以語音輸入日語,在接著的步驟S32,語音識別部7進行識別處理。
在步驟S33,將語音識別部7來的語音識別結(jié)果用表現(xiàn)變換部3變換為日語的其它表現(xiàn)。然后在步驟S34將變換結(jié)果顯示在顯示器1,用戶進行確認、選擇。此時,顯示器1顯示的并不是語音識別結(jié)果本身,而是顯示表示相同意思內(nèi)容、意圖的其它句。
該處理就是相當于上述翻譯裝置中原語言內(nèi)變換的處理。其不同點在于,在翻譯裝置中對一個輸入句實施處理,與此相反,在該語音翻譯裝置中對作為語音識別結(jié)果獲得的多個候選句實施變換處理。
在步驟S35,由于步驟S34中用戶產(chǎn)生的確認、選擇的結(jié)果選擇再輸入時,作為“YES”(是)返回步驟S1。不選擇再輸入時,作為“NO”(否)進入步驟S36。
在步驟S36,將用戶確認的句作為對象,在機器翻譯部4中進行機器翻譯變換,并輸出英語句。此時,用戶選擇再輸入,則再次進行語音輸入。最后,在步驟S37,語音合成部8以機器翻譯部4輸出的英語翻譯結(jié)果為基礎進行語音合成,輸出英語合成語音。然后結(jié)束該處理。
在本實施例中,機器翻譯限定在能確保處理語體的翻譯準確度的范圍內(nèi)。于是,將語音識別結(jié)果得到的各種語體輸入變換為上述范圍內(nèi)語體產(chǎn)生的表現(xiàn)。然后用戶確認其內(nèi)容,雖然與用戶輸入的句不同,但可確認其意思內(nèi)容、意圖相同。因而,能確保將其作為輸入。
此外,根據(jù)本實施例,可維持高準確度的語音翻譯結(jié)果,同時用戶可只作一次確認。
下面,參照圖12說明語音翻譯裝置中處理的具體例。
首先,在語音翻譯裝置中,用戶輸入“大英博物館に行きたいのですが?!钡恼Z音。語音識別部7對該輸入進行語音識別處理,并以例如識別得分高的多個候選句的形態(tài)輸出,作為識別結(jié)果。具體而言,對于諸如假名等的輸入,輸出3個候選句“大英博物館に行きたいのですが?!薄ⅰ按笥⒉┪镳^に行つてみたい。”及“大英博物館に行つたのですが。”。
下面,表現(xiàn)變換部3對所獲得的語音識別結(jié)果進行表現(xiàn)變換處理。在此例情況下,由于“大英博物館に行きたいのですが?!迸c“大英博物館に行つてみたい?!焙x非常接近,故變換成1個表現(xiàn)“大英博物館に行きたい?!薄H缓蟆按笥⒉┪镳^に行つたのですが?!弊儞Q成“大英博物館に行つた?!?。這兩個句顯示在顯示部1的液晶顯示器上。
用戶從所顯示的句中選擇接近自身語音含義內(nèi)容、意圖的句“大英博物館に行きたい?!薄H缓?,機器翻譯部4機器翻譯所選擇的句,生成英文“I want to goto the British museum.”,語音合成部8對其進行語音合成,輸出英語語音。
在此實施例中,也可以進一步增加應用得分的處理。
即,語音識別處理中,在一般利用嵌入馬爾可夫模型進行識別處理的過程,對識別結(jié)果的選句評分,并對該值進行比較,從而輸出最有可能的候選句作為1個或多個識別結(jié)果。此外,圖5所示的表現(xiàn)變換規(guī)則,以語料庫數(shù)據(jù)(corpus data)為基礎,利用對規(guī)則使用次數(shù)作統(tǒng)計等技術(shù),就能給出各規(guī)則使用頻度的得分。
因此,當產(chǎn)生表現(xiàn)變換結(jié)果時,對這兩個得分分別進行適當加權(quán)并加以累計,就能使用它們。
在此實施例,組合語音識別與機器翻譯的語音翻譯裝置中,推遲語音識別中的確認,與表現(xiàn)變換處理的變換結(jié)果的確認合并,減少了確認次數(shù)。但本發(fā)明并不限定于這種組合。
例如,在組合假名漢字變換與自然語言信息檢索的情況下,也可取這樣的結(jié)構(gòu),即不確認對假名輸入的漢字變換的結(jié)果,將其推遲,并進行表現(xiàn)變換,從若干個漢字變換候選對象中直接提取關(guān)鍵字,并將該結(jié)果提示給用戶供確認、選擇。此外,作為后續(xù)處理也可采用表現(xiàn)支援等。
下面,說明本發(fā)明第3實施例。
該實施例雖采用上述翻譯裝置,但表現(xiàn)變換部3只進行句末表現(xiàn)置換、簡化等簡單處理,機器翻譯部4除了進行從原語言變換為目的語言外,還在原語言內(nèi)變換為其它表現(xiàn)。
本實施例雖不依賴翻譯方法,但在下面的說明中采用對譯模板的方式加以說明。且原語言為日語,而目的語言為英語。
圖13示出對譯模板的例子。對譯模板具有原語言的日語部分和將其翻譯成目的語言英語的目的語言部分,此外還具有記載變換為原語言其它表現(xiàn)的所謂“原語言內(nèi)的變換”的部分。
在圖13的對譯模板中,作為多義變換有如下各對應關(guān)系,“Thank you.”及“すいません(=ありがとう)”對應于“すいません”;“I’m sorry.”及“すいません(=謝る)”對應于“すいません”;“Excuse me.”及“すいません(=呼びかけ)”對應于“すいません”;“X use Y.”及(言い換えなし)對應于“XがYを使う”;“X go by Y.”及“XがYで行く”對應于“XがYを使う”;“X consume Y.”及“XがYを消費する”對應于“XがYを使う”。
在圖13的對譯模板中,作為空缺要素補充有如下各對應關(guān)系,“X use Y.”及“私はXを使う。”對應于“Xを使う”;“X go by Y.”及“私はXで行く?!睂凇癤を使う”;“X consume Y.”及“私はXを消費する”對應于“Xを使う”。
在圖13所示的對譯模板中,作為復合句展開有如下各對應關(guān)系,“S1,butS2.”及“S1、しかし S2”對應于“S1 が、S2”;“S1,but S2.”及“S1、そしてS2”對應于“S1 か、S2”;“S1,but S2.”及“S1。S2”對應于“S1 か、S2”。
在圖13的對譯模板中,日語部分和英語部分與前述對譯模板例的相同。
在該對譯模板中,“原語言內(nèi)的變換”部分是用日語表達的與英語部分一一對應的表現(xiàn)。所謂“一一對應的表現(xiàn)”就是,在日語部分為多義情況下通過變換或注釋變?yōu)閱瘟x的表現(xiàn);在日語部分存在空缺要素情況下對其加以補充的表現(xiàn)。
例如,在圖13中,日語部分的“すいません”多義有3種,故其英譯文也有3種,但是,在“原語言內(nèi)的變換”部分中用日語預先寫有分別對應的非多義性的表現(xiàn)。例如,在“I’m sorry.”預先寫有“すいません(=謝る)”;在“Thankyou.”預先寫有“すいません(=ありがとう)”;在“Excuse me.”預先寫有“すいません(=呼びかけ)”。
例如,對于日語部分的“Xを見せてください”的英譯文必須補充相當于“誰に”的詞,即補充空缺要素。如果補充“私に”,則英語部分變成取“Please showme X.”,則在“原語言內(nèi)的變換”部分寫成“Xを私に見せてください”,預先補充“私に”。
下面,就機器翻譯、變換處理而言,一旦有用戶輸入,就在輸入與對譯模板的日語部分間取匹配。在匹配前可對輸入進行句末表現(xiàn)等的變換,因而能減少模板數(shù)。作為句末表現(xiàn)的變換,可列舉如將“~します”的輸入變換為“~する”。
如果取得模板匹配,據(jù)此可作成英譯文,與此同時,也可作成日語的變換。如圖14所示,在輸入為“これに見せてください”情況下,對圖13的模板10取得匹配,據(jù)此作成英譯文和變換。但是,這里假定是按照“これを彼に見せてあげてください”進行的。
然后,提示輸入變換結(jié)果“これを私に見せてください”及英譯文結(jié)果“Pleaseshow me this.”及其后的英譯文和變換對,供用戶確認。另外,也可以只提供變換結(jié)果。用戶可查看變換部分,確認英譯文是否正確。
通過查看該變換結(jié)果,用戶可獲知與自己意圖不同的翻譯,并丟棄該變換結(jié)果。
又,如圖15所示,輸入為“鐵道を使う”情況下,在圖13的對譯模板中有3種與輸入匹配的模板。分別對這些生成英譯文和變換。對它們進行提示,供用戶選擇最佳的變換、英譯文。
具體而言,生成變換結(jié)果“私は鐵道を使う”及英譯文結(jié)果“I use thetrain.”;變換結(jié)果“私は鐵道で行く”及英譯文結(jié)果“I go by train.”;變換結(jié)果“私は電車を消費する”及英譯文結(jié)果“I consume the train.”。
用戶根據(jù)變換結(jié)果可選擇第2個變換結(jié)果“私は鐵道で行く”及英譯文結(jié)果“I go by train.”。
在模板系統(tǒng)下,設有含義屬性的制約等,這樣可減少匹配模板的數(shù)量,但由于制約不夠,故存在多個模板的匹配。在本實施例中,即使在上述情況下,用戶也能選擇確認適合的翻譯結(jié)果。
所謂“同時進行表現(xiàn)變換和機器翻譯”的這種方法,由于表現(xiàn)變換用的數(shù)據(jù)和機器翻譯用的數(shù)據(jù)處于同一位置,故具有即使數(shù)據(jù)量增加也容易兼容的優(yōu)點。
此第3實施例也能通過對第1實施例作以下變形來實現(xiàn)。
第1實施例翻譯裝置的表現(xiàn)變換部3生成N個最佳候選對象,在該階段不進行選擇、確認,而是將它們傳送給翻譯部4,以此延期確認。于是,生成N個由翻譯結(jié)果和表現(xiàn)變換結(jié)果對構(gòu)成的候選對象。對這些候選對象進行選擇、確認。
示出以下那樣的變形例進一步說明“與表現(xiàn)變換同時進行的機器翻譯”。
如果來看一看圖13的變換、翻譯用模板的“原語言內(nèi)的變換”部分,就會發(fā)現(xiàn)有進行變換的部分和添加簡單注釋的部分。
如圖16所示,若將它們分開并分別記載于不同的欄中,則不管是處理上或模板編制上都有優(yōu)點。
也即,作為處理上的優(yōu)點是,若能將“變換”與注釋分開,則在不進行變換而是僅添加注釋的情況下能容易地進行判別。僅添加注釋的情況與要變換的情況相比,能以更簡單的處理完成。
作為模板編制上的優(yōu)點是,在僅添加注釋的情況下,可減少描述所需要的工作。
有時會出現(xiàn)這種情況,即作業(yè)中有時沒有想到進行適當?shù)淖儞Q而只是添加注釋。若預先將變換與注釋分開,則在這種情況下可方便地先描述好注釋,并在后來想到時描述變換。
作為表現(xiàn)上的優(yōu)點是,由于將注釋與變換結(jié)果分開,故有時分別生成注釋和變換結(jié)果作為原語言內(nèi)變換的結(jié)果。因此,能分別顯示上述兩者,提高了表現(xiàn)的自由度。
如圖16所示,在將“變換”與注釋分開加以描述的模板的例子中,雖然在“原語言內(nèi)的變換”和“注釋”欄中存在空欄,但這分別表示沒有變換和不添加注釋。
例如,若與圖13相比,就“すいません”的變換而言,對于圖13中“すいません(=謝る)”那樣的變換,在圖16中不進行,而是代替以添加注釋“謝るときの表現(xiàn)”。
也即,對于圖13中原語言“すいません”中作為多義用變換的“すいません(=謝る)”、“すいません(=ありがとう)”、“すいません(=呼びかけ)”分別對應于圖16中作為注釋的“謝るときの表現(xiàn)”、“感謝の表現(xiàn)”、“呼びかけの表現(xiàn)”,原語言內(nèi)的變換為空白。
對于圖13中原語言“XがYを使う”、“Xを使う”,與圖16中原語言內(nèi)變換相同,但注釋為空白。
對于圖13中作為原語言“S1 が、S2”復合句展開的“S1。しかし S2”、“S1.そしてS2”、“S1。S2?!保瑘D16中原語言內(nèi)的變換相同,但是作為注釋,分別對應于“逆説を表す”(否定表述)、“順接を表す”(肯定表述)和“并列を表す”(并列表述)。
在原語言內(nèi)處理時,分別生成“變換”和注釋。因而,在顯示變換結(jié)果、翻譯結(jié)果階段,兩者都顯示。
圖17表示對輸入的一例輸出。輸入為“すいません”,故與圖16中模板的1、2、3匹配并加以輸出。
也即,對于圖16中的1,變成變換為“すいません”;注釋為“謝るときの表現(xiàn)”;英譯文為“I’m sorry.”。圖16中的2變成變換為“すいません”;注釋為“感謝の表現(xiàn)”;英譯文為“Thank you.”。圖16中的3變成變換為“すいません”;注釋為“呼びかけの表現(xiàn)”;英譯文為“Excuse me.”。
圖18表示對于輸入的另一例輸出。輸入為“~が、~”,故與圖16中模板的11、12、13匹配。這里,“~”表示某種適當?shù)牟顒e。
也即,對于圖16的11變成變換為“~。しかし~?!?;注釋為“逆說を表す”;英譯文為“~,but~.”。對于圖16的12變成變換為“~。そして~?!?;注釋為“順接を表す”;注釋為“~,and~.”。對于圖16的13變成變換為“~。そして~?!?;注釋為“并列を表す”;注釋為“~?!!边@里,英譯文中的“~”為表述上述差別“~”的英譯文。
在圖17和18中,用不同的項目顯示“變換”和注釋,但也可將它們顯示成“變換(注釋)”(例如,“すいません(謝るときの表現(xiàn))”)。
下面,說明提前和遲后確認帶來的確認次數(shù)的減少。
減少確認次數(shù)的技術(shù)中不限定應用于語音翻譯裝置,可用于具有多個“處理→結(jié)果確認”過程的任何自然語言處理系統(tǒng)。
減少確認次數(shù)用的操作定義為下面的“提前確認”和“遲后確認”。
提前確認就是,在第1處理P1前增加第2處理P2和對第2處理P2的結(jié)果進行確認的第2確認C2,該第2處理P2將輸入變換為能在第1處理P1中高準確度處理的形式,從而省略第1處理P1后的第1確認C1。
遲后確認就是,將第1處理P1后的第1確認C1移到其后的第i處理Pi之后?;蛘?,與后面的第j確認Cj合并,從而減少了確認次數(shù)。
這里的確認,就是當處理結(jié)果存在多個的情況下,也即存在多個選擇條的情況下,用戶從中選擇適合的條。如果選擇條都不合適,用戶就選擇“不正確”。
處理結(jié)果為1個的情況下,意味著用戶確認它是否正確。下面,確認也采用同樣的含義。
先說明“提前確認”。提前確認用于具有至少1組處理和確認的系統(tǒng)。
例如,在圖19A所示采用提前確認之前狀態(tài)中,示出了第1處理P1和對應于它的第1確認C1。
圖19B示出采用后的狀態(tài),與上述相比,采用了提前確認,在第1處理P1之前增加了第2處理P2和對其結(jié)果進行確認的第2確認C2,代替并刪除了對第1處理P1結(jié)果進行確認的第1確認C1。圖中的空白框表示刪除后的第1確認C1。
第2處理P2將輸入變換為能在第1處理P1中高準確度處理的形式,其處理內(nèi)容取決于第1處理P1。
例如,在提前確認“采用前”的系統(tǒng)中,因輸入包含多義性,故會出現(xiàn)處理后要確認(或處理準確度下降)的情況。此時,提前確認所需的第2處理P2進行將輸入的多義性在數(shù)量上加以展開的處理。
例如,對于圖5所示的“多義性表達規(guī)則”或“復合句分解規(guī)則”,第2處理P2進行將輸入的多義性在數(shù)量上加以展開的處理。
利用這種提前確認,即使是用戶難以確認結(jié)果的處理(如機器翻譯),也能夠在處理前確認,而不在處理后確認。
下面說明“遲后確認”。遲后確認用于具有至少兩組處理和確認的系統(tǒng)。
例如,在圖20A所示提前確認采用前的狀態(tài)中,示出前面的第1處理P1和第1確認C1,以及后面的第2處理P2和第2確認C2。
圖20B表示采用后的狀態(tài),采用了遲后確認,與上述相比,將確認前面第1處理P1結(jié)果的第1確認C1移到后面的第2處理P2之后,或與后面處理的第2確認C2合并進行一次確認。圖中的空白框表示刪除后的第1確認C1。
在第1處理P1輸出結(jié)果為多個的情況下,將這些結(jié)果全部傳送給第2處理P2,在第2處理P2中對從第1處理P1送來的結(jié)果一個一個處理。然后,用戶確認該結(jié)果。
下面,說明提前和遲后確認的組合。提前和遲后確認的組合用于具有2組以上處理和確認該處理結(jié)果的確認的系統(tǒng)。
例如,在圖21A的提前和遲后確認組合采用前狀態(tài)中,示出第1處理P1、第1確認C1、第2處理P2和第2確認C2。
如果對第2確認C2采用提前確認,則如圖21B所示狀態(tài)。也即在第2處理P2之前增加第3處理P3,作為“將輸入變換為能在第2處理P2中高準確度處理的形式的處理”,還可接著增加對第3處理P3的結(jié)果進行確認的第3確認C3,進而刪除第2確認C2。圖中的空白框表示刪除后的第2確認C2。
接著,在圖21B所示的對第2確認P2采用提前確認的狀態(tài)中,如果對第1確認C1采用提前確認,則如圖21C所示,第1確認C1與第3處理P3后的第3確認C3合并。這樣一來,確認次數(shù)從2次減少到1次。圖中的空白框表示移動后的第1確認C1的位置。
在該實施例中,也可以將它們置換為將2個處理合并為一個的處理,以便為“→第1處理P1→第3處理P3”那樣連續(xù)處理。
某些第2處理P2的內(nèi)容,用戶確認處理結(jié)果有困難。這包括例如第2處理P2為翻譯處理的情況。
即使對這樣的系統(tǒng)僅僅采用遲后并加以合并的確認,也會因確認仍然困難而使合并無意義。然而,按照本實施例如果將提前和遲后確認組合起來,則由于在第2處理P2之前進行確認,故能使確認變得容易,合并才有意義。
下面,說明將“提前”和“遲后”確認應用于語音翻譯的具體例子。
已往的語音翻譯系統(tǒng)有作成圖22A所示的形態(tài)。也即按照語音翻譯R1、識別結(jié)果確認C4、機器翻譯T1、翻譯結(jié)果確認C5的順序進行處理。
在圖22A所示的已有技術(shù)的語音翻譯系統(tǒng)中,對“翻譯結(jié)果確認C5”采用提前確認。也即,如圖22B所示,在機器翻譯處理T1之前增加表現(xiàn)變換處理T2和對其結(jié)果進行確認的變換結(jié)果確認C6作為“將輸入變換為能在機器翻譯中高準確度處理形式的處理”,代替并刪除翻譯結(jié)果確認C5。
這里,若對照圖21B,則表現(xiàn)變換T2相當于第2處理C2,變換結(jié)果確認C6相當于第3確認C3。圖中的空白框表示刪除后的翻譯結(jié)果確認C5。
在圖22B所示對識別結(jié)果確認C4采用提前確認的狀態(tài)中,如圖22C所示,對“識別結(jié)果確認C4”采用遲后確認。也即,將“識別結(jié)果確認C4”移到“表現(xiàn)變換T2”之后,與“變換結(jié)果確認C6”合并,進行1次確認。這相當于實施例2的形態(tài)。
這里,后續(xù)于語音識別R1的空白框表示有經(jīng)移動的識別結(jié)果確認C4的位置。
如圖22D所示,對此進一步采用遲后確認,能同時進行表現(xiàn)變換和機器翻譯。也即,對圖22C中的“識別結(jié)果確認C4+變換結(jié)果確認C6”采用遲后確認,移到機器翻譯處理T1后面。于是,由于連續(xù)進行“→表現(xiàn)變換T2→機器翻譯T1→”這樣2個處理,故能置換成將兩者合在一起的處理(同時進行表現(xiàn)變換和機器翻譯的處理)。
“表現(xiàn)變換T2+機器翻譯T1”處理的輸出包含著原語言的變換結(jié)果和目的語言的翻譯結(jié)果。因此,用戶確認處理結(jié)果與已有方法中確認翻譯結(jié)果是不同的,是很容易進行的。
如上所述,上述實施例將輸入的自然語言變換為另一表現(xiàn),用戶對其選擇、確認后再施以處理。當具有多個自然語言處理和結(jié)果確認時,進一步進行提前、遲后確認,從而減少了用戶的確認次數(shù)。也即,進行提前確認和遲后確認。前者在某個處理前,將輸入變換為能在上述處理中高準確度處理的形式,增加其變換結(jié)果的確認,從而將省略對上述處理的確認;后者將某個處理后的確認與其后導入的對于確認提前所用處理進行的確認合并,從而減少了確認次數(shù)。
如上所述,本發(fā)明將輸入變換成一個一個表現(xiàn),提示給用戶進行選擇、確認。因此,能盡可能減少用戶的確認操作,并能提供準確度高的自然語言處理。
按照本發(fā)明所提供的自然語言處理裝置,能以盡可能少的確認操作、盡可能接近所希望輸出的形態(tài),獲得保證準確度的輸出結(jié)果。
在已往的翻譯中,由于翻譯語言的選擇、確認實質(zhì)上不可能,因此如果翻譯單元的準確度不高,也即,如果不能輸出唯一正確的解答,就不實用,但在本發(fā)明的翻譯中,由于能適合翻譯結(jié)果選擇、確認,故即使翻譯單元的準確度不那么高,也是實用的。
權(quán)利要求
1.一種自然語言處理裝置,其特征在于,包含輸入自然語言的輸入手段;對所述輸入手段輸入的自然語言進行變換的變換手段;對所述變換手段變換后的自然語言進行確認的確認手段;對所述確認手段確認后的自然語言實施處理的處理手段;將所述處理手段處理過的自然語言加以輸出的輸出手段。
2.如權(quán)利要求1所述的自然語言處理裝置,其特征在于,所述變換手段在同一語言內(nèi)將某個表現(xiàn)變換成至少另一表現(xiàn)。
3.如權(quán)利要求1所述的自然語言處理裝置,其特征在于,所述處理手段的處理準確度得到保證。
4.如權(quán)利要求2所述的自然語言處理裝置,其特征在于,所述處理手段用模板進行處理。
5.如權(quán)利要求1所述的自然語言處理裝置,其特征在于,所述輸入手段輸入第1語言,所述處理手段將第1語言翻譯成第2語言,所述輸出手段輸出經(jīng)所述處理手段翻譯過的第2語言。
6.如權(quán)利要求5所述的自然語言處理裝置,其特征在于,所述變換手段將所述輸入手段輸入的所述第1語言變換為第1語言的另一表現(xiàn)。
7.如權(quán)利要求5所述的自然語言處理裝置,其特征在于,所述變換手段將所述輸入手段輸入的所述第1語言變換為第3語言。
8.如權(quán)利要求1所述的自然語言處理裝置,其特征在于,所述變換手段對所述輸入手段輸入的自然語言的表現(xiàn)而言,將多個表現(xiàn)變換成單一表現(xiàn)。
9.如權(quán)利要求1所述的自然語言處理裝置,其特征在于,所述變換手段對所述輸入手段輸入的自然語言的表現(xiàn)而言,將多義表現(xiàn)變換成多個單義表現(xiàn)。
10.如權(quán)利要求1所述的自然語言處理裝置,其特征在于,所述變換手段用融合、分割、刪除、置換、順序替換中的至少一種對所述輸入手段輸入的自然語言表現(xiàn)進行變換。
11.如權(quán)利要求1所述的自然語言處理裝置,其特征在于,所述輸入手段用語音輸入自然語言。
12.如權(quán)利要求11所述的自然語言處理裝置,其特征在于,所述確認手段對所述輸入手段用語音輸入的自然語言只確認一次。
13.如權(quán)利要求1所述的自然語言處理裝置,其特征在于,所述輸入手段用文字輸入自然語言。
14.如權(quán)利要求13所述的自然語言處理裝置,其特征在于,所述確認手段對所述輸入手段用文字輸入的自然語言只確認一次。
15.如權(quán)利要求1所述的自然語言處理裝置,其特征在于,所述第1語言輸入所述輸入手段,所述變換手段將輸入所述輸入手段的第1語言變換成第2語言的第2表現(xiàn),同時變換成與所述第2表現(xiàn)一對一對應的第1語言的第1表現(xiàn),所述確認手段用所述第1表現(xiàn)進行確認。
16.如權(quán)利要求15所述的自然語言處理裝置,其特征在于,所述處理手段根據(jù)所述變換手段的變換及所述確認手段的確認將所述第1語言翻譯成第2語言,所述輸出手段輸出所述處理手段翻譯后的所述第2語言。
17.一種自然語言處理裝置,其特征在于,包含輸入自然語言的輸入手段;對自然語言進行處理的一個或兩個以上的處理手段;對自然語言處理結(jié)果進行確認的一個或兩個以上的確認手段;輸出處理后自然語言的輸出手段;在第1處理手段之前設置第2處理手段和第2確認手段,所述第2處理手段將輸入所述輸入手段的自然語言變換為可高準確度處理的形式,所述第2確認手段確認所述第2處理手段的結(jié)果,從而進行省略對第1處理手段結(jié)果進行確認的提前確認。
18.如權(quán)利要求17所述的自然語言處理裝置,其特征在于,所述第1處理手段可以是機器翻譯處理、假名漢字變換處理、自然語言的信息檢索處理,或自然語言的表現(xiàn)變換處理。
19.如權(quán)利要求17所述的自然語言處理裝置,其特征在于,所述第2處理手段可以是機器翻譯處理、假名漢字變換處理、自然語言的信息檢索處理,或自然語言的表現(xiàn)變換處理。
20.如權(quán)利要求17所述的自然語言處理裝置,其特征在于,在所述第2處理手段之前設有第3處理手段和對其結(jié)果進行確認的第3確認手段,并將所述第3確認手段移到所述第2處理手段或其后的處理手段的后面,或與所述第2確認手段或其后的確認手段合并,從而進行遲后確認。
21.如權(quán)利要求20所述的自然語言處理裝置,其特征在于,所述第2確認手段與所述第3確認手段合并的單元按數(shù)值給出處理結(jié)果,并提示所述數(shù)值。
22.如權(quán)利要求20所述的自然語言處理裝置,其特征在于,所述第1處理手段進行機器翻譯,所述第3處理手段進行語音識別。
23.如權(quán)利要求20所述的自然語言處理裝置,具有對輸入所述輸入手段的自然語言進行語音識別的語音識別處理手段、對所述語音識別處理手段的識別結(jié)果進行確認的識別結(jié)果確認手段,對所述識別結(jié)果確認手段確認的結(jié)果實施機器翻譯的機器翻譯手段、以及對所述機器翻譯手段的翻譯結(jié)果進行確認的翻譯結(jié)果確認手段,其特征在于,在所述機器翻譯處理手段之前添加變換表現(xiàn)的表現(xiàn)變換手段和對該變換結(jié)果進行確認的表現(xiàn)變換確認手段,從而所述翻譯結(jié)果確認手段進行提前確認,省略所述機器翻譯處理手段后面的所述翻譯結(jié)果確認手段。
24.如權(quán)利要求23所述的自然語言處理裝置,其特征在于,進行所述識別結(jié)果確認手段與其后表現(xiàn)變換結(jié)果確認手段合并的所述識別結(jié)果確認手段遲后確認。
25.一種自然語言處理裝置,其特征在于,具有輸入自然語言的輸入手段;用第2語言的表現(xiàn)及第3語言的表現(xiàn)將輸入所述輸入手段的第1語言變換為一對一對應于所述第2語言表現(xiàn)的表現(xiàn)的變換手段;對所述變換手段變換的所述第3語言的表現(xiàn)進行確認的確認手段;根據(jù)所述確認手段確認的結(jié)果對輸入所述輸入手段的自然語言實施處理的處理手段;輸出經(jīng)所述處理手段處理的自然語言的輸出手段。
26.如權(quán)利要求25所述的自然語言處理裝置,其特征在于,在所述變換手段中,所述第2語言是作為翻譯的目的語言的語言,所述第3語言的表現(xiàn)通過對所述第1語言的表現(xiàn)進行變換后獲得。
27.一種自然語言處理方法,其特征在于,包含輸入自然語言的輸入過程;對所述輸入過程輸入的自然語言進行變換的變換過程;對所述變換過程變換的自然語言進行確認的確認過程;對所述確認過程確認的自然語言實施處理的處理過程;輸出經(jīng)所述自然語言處理過程處理的自然語言的輸出過程。
28.如權(quán)利要求所述的自然語言處理方法,其特征在于,所述變換過程在同一語言內(nèi)將某個表現(xiàn)變換成至少另一表現(xiàn)。
29.如權(quán)利要求27所述的自然語言處理方法,其特征在于,在所述輸入過程輸入第1語言,所述變換過程將在所述輸入過程輸入的第1語言變換成第2語言的第2表現(xiàn),同時變換成與所述第2表現(xiàn)一對一對應的第1語言的第1表現(xiàn),所述確認過程用所述第1表現(xiàn)進行確認。
30.如權(quán)利要求29所述的自然語言處理方法,其特征在于,所述處理過程根據(jù)所述變換過程的變換及所述確認過程的確認將所述第1語言翻譯成第2語言,所述輸出過程輸出所述處理過程翻譯后的所述第2語言。
31.一種自然語言處理方法,其特征在于,包含輸入自然語言的輸入過程;對自然語言進行處理的一個或兩個以上的處理過程;對自然語言處理結(jié)果進行確認的一個或兩個以上的確認過程;輸出處理后自然語言的輸出過程;在第1處理過程之前設置第2處理過程和第2確認過程,所述第2處理過程將在所述輸入過程輸入的自然語言變換為可高準確度處理的形式,所述第2確認過程確認第2處理過程的結(jié)果,從而進行省略對第1處理過程結(jié)果進行確認的確認提前確認。
32.如權(quán)利要求31所述的自然語言處理方法,其特征在于,在所述第2處理過程之前設有第3處理過程和對其結(jié)果進行確認的第3確認過程,并將所述第3確認過程移到所述第2處理過程或其后的處理過程的后面,或與后面的第2確認過程或其后的確認過程合并,從而進行遲后確認。
33.一種自然語言處理方法,其特征在于,具有輸入自然語言的輸入過程;用第2語言的表現(xiàn)及第3語言的表現(xiàn)將在所述輸入過程輸入的第1語言變換為一對一對應于所述第2語言表現(xiàn)的表現(xiàn)的變換過程;對所述變換過程變換的所述第3語言的表現(xiàn)進行確認的確認過程;根據(jù)所述確認過程確認的結(jié)果對在所述輸入過程輸入的自然語言實施處理的處理過程;輸出經(jīng)所述處理過程處理的自然語言的輸出過程。
全文摘要
一種自然語言處理裝置,包含:輸入自然語言的輸入部;變換自然語言表現(xiàn)的表現(xiàn)變換部;為確認表現(xiàn)變換部變換的句而進行顯示的顯示部;對經(jīng)確認的句進行機器翻譯的機器翻譯部;對上述各部進行控制的控制部。該裝置能提供減少用戶確認操作的自然語言處理。
文檔編號G06F17/28GK1275223SQ99801490
公開日2000年11月29日 申請日期1999年8月31日 優(yōu)先權(quán)日1998年8月31日
發(fā)明者淺野康治, 廣江厚夫, 島川真人, 加賀美徹也, 小林惠理香 申請人:索尼株式會社