根據(jù)現(xiàn)有的單語言過程構(gòu)造多語言過程的制作方法
【專利摘要】通過重新使用與不同的錨語言相關(guān)聯(lián)的現(xiàn)有語言學(xué)組件連同在錨語言和一種或者多種語言之間進(jìn)行翻譯的機(jī)器翻譯組件,而生成能夠接受使用一種或者多種語言的語言學(xué)輸入的過程。語言學(xué)輸入被引導(dǎo)至機(jī)器翻譯組件,該機(jī)器翻譯組件將這樣的輸入從其語言翻譯成錨語言。然后利用那些現(xiàn)有的語言學(xué)組件來啟動(dòng)響應(yīng)處理并生成輸出??蛇x地,輸出被引導(dǎo)通過機(jī)器翻譯組件。語言辨識(shí)器可以起初接收語言學(xué)輸入,并辨識(shí)提供這樣的語言學(xué)輸入所用的語言,以選擇合適的機(jī)器翻譯組件。包括機(jī)器翻譯組件和與錨語言相關(guān)聯(lián)的語言學(xué)組件的混合過程也可以用作啟動(dòng)構(gòu)造,隨著時(shí)間過去從啟動(dòng)構(gòu)造創(chuàng)建單語言過程。
【專利說明】根據(jù)現(xiàn)有的單語言過程構(gòu)造多語言過程
【背景技術(shù)】
[0001]傳統(tǒng)地,計(jì)算設(shè)備的用戶被迫對(duì)在那些計(jì)算設(shè)備上執(zhí)行的過程以由那些過程所規(guī)定的方式提供輸入。因此,例如,為了完成在計(jì)算設(shè)備上執(zhí)行的電子表格應(yīng)用程序中的計(jì)算,用戶被迫以電子表格應(yīng)用程序所規(guī)定的方式輸進(jìn)用戶期望進(jìn)行計(jì)算的值和公式。作為另一個(gè)示例,為了在計(jì)算設(shè)備上執(zhí)行的字處理應(yīng)用程序中選擇不同的字體,用戶被迫經(jīng)由由字處理應(yīng)用提供的機(jī)制來選擇排版信息。雖然這樣的機(jī)制對(duì)于頻繁地與這樣的在計(jì)算設(shè)備上執(zhí)行的應(yīng)用程序交互的用戶來說可能變成第二天性,但是它們與用戶傳統(tǒng)上彼此通信的方式有所不同。
[0002]隨著計(jì)算設(shè)備的處理能力日益增強(qiáng),在那些計(jì)算設(shè)備上執(zhí)行的更多數(shù)量的應(yīng)用程序已經(jīng)被設(shè)計(jì)成接受由用戶更自然地提供的輸入。例如,一種日益普遍的輸入機(jī)制是要用戶說出或者以其它方式在語言學(xué)上輸進(jìn)他們?cè)噲D使應(yīng)用程序執(zhí)行什么,而且應(yīng)用程序可以隨后解譯這樣的語言學(xué)輸入(linguistic input)并且相應(yīng)地響應(yīng)。通過給應(yīng)用程序提供響應(yīng)語言學(xué)輸入的能力,這樣的應(yīng)用程序的程序設(shè)計(jì)員正提供用戶更容易學(xué)習(xí)和利用的應(yīng)用程序。
[0003]遺憾的是,語言學(xué)輸入依賴于由用戶說出的語言。因此,被設(shè)計(jì)成接受用一種語言提供的語言學(xué)輸入的應(yīng)用程序?qū)⒉荒芾斫庥昧硪环N不同語言提供的語言學(xué)輸入。由于世界各地的用戶所說的語言多種多樣,且由于它們之間的相當(dāng)大的語言學(xué)差異,期望使其應(yīng)用程序接受語言學(xué)輸入的應(yīng)用程序開發(fā)者被迫對(duì)這樣的應(yīng)用程序?qū)⒅С值牟煌Z言的每一種語言都創(chuàng)建那些應(yīng)用程序的不同版本。
[0004]更值得注意的是,創(chuàng)建可以接受語言學(xué)輸入的應(yīng)用程序的過程會(huì)是費(fèi)時(shí)且昂貴的。例如,大量的時(shí)間和資源投入可以針對(duì)訓(xùn)練這樣的應(yīng)用程序的語言理解組件以便能夠準(zhǔn)確地從由用戶提供的語言學(xué)輸入中譯解用戶的意圖。并且,正是這樣的語言理解組件隨后必須針對(duì)應(yīng)用開發(fā)者期望他們的應(yīng)用程序支持的每種語言來被重新創(chuàng)建。
【發(fā)明內(nèi)容】
[0005]在一個(gè)實(shí)施例中,用錨語言(anchor language)操作并且代表大量的時(shí)間和資源投入的現(xiàn)有應(yīng)用程序的語言學(xué)組件可以被重新使用,以創(chuàng)建能夠接受用除了這樣的錨語言之外的其它語言的語言學(xué)輸入的應(yīng)用程序。機(jī)器翻譯技術(shù)(其通過計(jì)算設(shè)備提供用于從用一種語言接收的輸入到用另一種不同語言的輸入的翻譯)可以與現(xiàn)有應(yīng)用程序的這樣的語言學(xué)組件相耦合,以便重新使用那些語言學(xué)組件,而同時(shí)使得能接受用除了錨語言之外的其它語言的輸入。
[0006]在另一個(gè)實(shí)施例中,代表在多種語言和現(xiàn)有語言學(xué)組件的錨語言之間進(jìn)行翻譯的能力的多個(gè)機(jī)器翻譯組件可以被打包到單個(gè)應(yīng)用程序中,由此為這樣的應(yīng)用程序提供接收用多種多樣不同語言的語言學(xué)輸入的能力。語言辨識(shí)組件可以起初接收語言學(xué)輸入,并且可以由此辨識(shí)提供這樣的語言學(xué)輸入所用的語言。合適的機(jī)器翻譯組件可以隨后基于這樣的語言辨識(shí)而被選擇。
[0007]在另外的實(shí)施例中,包括與錨語言相關(guān)聯(lián)的現(xiàn)有語言學(xué)組件和用于在其它語言和這樣的錨語言之間進(jìn)行翻譯的機(jī)器翻譯組件的混合應(yīng)用可以充當(dāng)從其開始開發(fā)與本國(guó)語言相關(guān)聯(lián)的語言學(xué)組件的起始點(diǎn),由此排除對(duì)于機(jī)器翻譯組件的需要。
[0008]本概要被提供來以簡(jiǎn)要形式介紹概念的選擇,這些概念還將在下面的詳細(xì)說明中進(jìn)行描述。本概要既不打算標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不打算用來限制所要求保護(hù)的主題的范圍。
[0009]從以下參考附圖進(jìn)行的詳細(xì)說明中,另外的特征和優(yōu)點(diǎn)將變得明顯。
【專利附圖】
【附圖說明】
[0010]當(dāng)與附圖協(xié)同考慮時(shí),以下的詳細(xì)說明可被最好地理解,其中:
圖1是能夠接收語言學(xué)輸入的示范性計(jì)算設(shè)備的方框圖;
圖2是示范性混合過程的方框圖,其包括與錨語言相關(guān)聯(lián)的語言學(xué)組件和用于在錨語言和其它語言之間進(jìn)行翻譯的機(jī)器翻譯組件;
圖3是混合過程到本國(guó)語言過程的示范性轉(zhuǎn)換的方框圖;
圖4是混合過程的示范性創(chuàng)建的流程圖,所述混合過程包括與錨語言相關(guān)聯(lián)的語言學(xué)組件和用于在錨語言和其它語言之間進(jìn)行翻譯的機(jī)器翻譯組件;
圖5是混合過程的示范性操作的流程圖,所述混合過程包括與錨語言相關(guān)聯(lián)的語言學(xué)組件和用于在錨語言和其它語言之間進(jìn)行翻譯的機(jī)器翻譯組件;以及圖6是混合過程到本國(guó)語言過程的示范性轉(zhuǎn)換的流程圖。
【具體實(shí)施方式】
[0011]下文的描述涉及能夠接受用一種或者多種語言進(jìn)行語言學(xué)輸入的過程的有效生成,這是通過重新使用與不同的錨語言相關(guān)聯(lián)的現(xiàn)有語言學(xué)組件連同可以在錨語言和一種或者多種其它語言之間進(jìn)行翻譯的機(jī)器翻譯組件來進(jìn)行的。語言學(xué)輸入可以被引導(dǎo)至機(jī)器翻譯組件,其可以將這樣的輸入從其被提供所用的無論何種語言翻譯成現(xiàn)有語言學(xué)組件與之相關(guān)聯(lián)的錨語言。那些現(xiàn)有語言學(xué)組件隨后可以被利用來響應(yīng)于語言學(xué)輸入而啟動(dòng)處理,并且生成合適的輸出。可選地,輸出可以被引導(dǎo)至機(jī)器翻譯組件,以便被翻譯回與接收輸入所用的相同的語言,以便呈現(xiàn)給用戶??梢岳枚鄠€(gè)機(jī)器翻譯組件來接受來自多種不同語言的語言學(xué)輸入,而且語言辨識(shí)組件可以起初接收這樣的語言學(xué)輸入并可以辨識(shí)提供這樣的語言學(xué)輸入所用的語言,由此而選擇合適的機(jī)器翻譯組件。包括機(jī)器翻譯組件和與錨語言相關(guān)聯(lián)的語言學(xué)組件的混合過程也可以用作為啟動(dòng)構(gòu)造,可以隨著時(shí)間過去而從所述啟動(dòng)構(gòu)造創(chuàng)建單語言過程。
[0012]本文描述的技術(shù)聚焦于語言學(xué)輸入,諸如口語輸入。然而,雖然為了便于參考而做出這樣的舉例說明和描述,但是本文描述的技術(shù)并不被如此限制。特別地,所描述的技術(shù)對(duì)于基于語言的任何種類的輸入都是同等適用的。因此,下文的舉例說明和描述只打算是說明性的,而不打算把下文描述的技術(shù)限制在所描述的具體語言學(xué)輸入。
[0013]雖然不是必需的,但是下文的描述將是在由具有計(jì)算能力的設(shè)備執(zhí)行的指令的一般上下文中。這樣的計(jì)算設(shè)備既包含傳統(tǒng)的計(jì)算機(jī)又包含具有計(jì)算能力(諸如由中央處理單元所提供的那些)的消費(fèi)者電子設(shè)備。因此,下文的描述將是在能夠由這樣的計(jì)算設(shè)備執(zhí)行的、諸如程序模塊那樣的計(jì)算機(jī)可執(zhí)行指令的一般上下文中。更具體地,除非另外地指明,否則描述將參考由一個(gè)或者多個(gè)計(jì)算設(shè)備或者外圍設(shè)備執(zhí)行的操作的動(dòng)作和符號(hào)化表示。同樣地,將理解的是,這樣的有時(shí)被稱為正由計(jì)算機(jī)執(zhí)行的動(dòng)作和操作包括由處理單元對(duì)于電信號(hào)的操縱,電信號(hào)代表采用結(jié)構(gòu)化形式的數(shù)據(jù)。此操縱對(duì)數(shù)據(jù)進(jìn)行變換,或者將其保持在存儲(chǔ)器的存儲(chǔ)單元中,其以本領(lǐng)域技術(shù)人員充分理解的方式重新配置或者以其它方式更改計(jì)算設(shè)備或者外圍設(shè)備的操作。在其中保持?jǐn)?shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)是具有由數(shù)據(jù)的格式定義的特定屬性的物理位置。
[0014]一般地,程序模塊包括執(zhí)行具體任務(wù)或者實(shí)現(xiàn)具體抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。而且,本領(lǐng)域技術(shù)人員將意識(shí)到的是,計(jì)算設(shè)備不必被限制為常規(guī)的個(gè)人計(jì)算機(jī)和常規(guī)的個(gè)人電子設(shè)備,而是可以包括能夠計(jì)算的其它設(shè)備,包括手持型設(shè)備、多處理器系統(tǒng)、其它基于微處理器或者可編程消費(fèi)者電子裝置、網(wǎng)絡(luò)PC、小型計(jì)算機(jī)、大型計(jì)算機(jī)等等。相似地,計(jì)算設(shè)備不必被限制為孤立的設(shè)備,因?yàn)樗鰴C(jī)制也可以在分布式計(jì)算環(huán)境中實(shí)踐,在那里由通過通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊既可以位于本地記憶存儲(chǔ)設(shè)備中又可以位于遠(yuǎn)程記憶存儲(chǔ)設(shè)備中。
[0015]參考圖1,圖示出示范性計(jì)算設(shè)備100,其可以包括但不限于:一個(gè)或者多個(gè)中央處理單元(CPU) 120、系統(tǒng)存儲(chǔ)器130和系統(tǒng)總線121,系統(tǒng)總線121將各種系統(tǒng)組件(包括系統(tǒng)存儲(chǔ)器)耦合到處理單元120。系統(tǒng)總線121可以是總線結(jié)構(gòu)的數(shù)種類型中的任一種,包括存儲(chǔ)器總線或者存儲(chǔ)器控制器、外圍總線和使用多種多樣的總線架構(gòu)的任一種的本地總線。計(jì)算設(shè)備100可以包括外圍設(shè)備,其可以使用戶150能夠與計(jì)算設(shè)備相交互。這樣的外圍設(shè)備可以包括用于將信息從計(jì)算設(shè)備100呈現(xiàn)給用戶150 (諸如用戶反饋152)的外圍設(shè)備,并且可以包括用于使用戶150能夠?qū)⑿畔⒑椭噶钐峁┙o計(jì)算設(shè)備100(諸如用戶輸入151)的外圍設(shè)備。可以使計(jì)算設(shè)備100能夠?yàn)橛脩舫尸F(xiàn)信息的外圍設(shè)備可以包括圖形硬件,圖形硬件包括但不限于圖形硬件接口 190和顯示設(shè)備191,其可以由計(jì)算設(shè)備利用來將視覺的圖形用戶界面呈現(xiàn)給用戶??梢允褂?jì)算設(shè)備100能夠?yàn)橛脩舫尸F(xiàn)信息的附加的外圍設(shè)備也可以包括一個(gè)或者多個(gè)揚(yáng)聲器189以及其它類似的、在圖1中沒有明顯示出的外圍設(shè)備,揚(yáng)聲器189可以將來自計(jì)算設(shè)備100的聽覺信息提供給該計(jì)算設(shè)備的用戶。這樣的外圍設(shè)備可以經(jīng)由連接到系統(tǒng)總線121的外圍接口 180通信地耦合到計(jì)算設(shè)備100。可以使用戶能夠?yàn)橛?jì)算設(shè)備100提供信息的外圍設(shè)備可以包括鼠標(biāo)182、鍵盤181、話筒184、移動(dòng)檢測(cè)器185或者在圖1中沒有明顯圖示的其它設(shè)備,諸如軌跡板、附屬平板、多觸摸輸入設(shè)備等等。以上描述的外圍設(shè)備可以經(jīng)由外圍接口 180通信地耦合到計(jì)算設(shè)備100的系統(tǒng)總線121,并且通常包括硬件方面和軟件方面兩者,以便使能它們的功能性。同樣,雖然在圖1中僅示出了它們的硬件表示,但是下文中對(duì)于這樣的外圍設(shè)備的參考打算包括被利用于這樣的外圍設(shè)備的恰當(dāng)操作的硬件和軟件方面兩者。
[0016]計(jì)算設(shè)備100也典型地包含計(jì)算機(jī)可讀介質(zhì),其可以包括任何可以被計(jì)算設(shè)備100訪問的可用介質(zhì),并且包括易失性和非易失性介質(zhì)以及可拆卸和不可拆卸介質(zhì)兩者。作為示例而不是限制,計(jì)算機(jī)可讀介質(zhì)可包括計(jì)算機(jī)存儲(chǔ)介質(zhì)、通信介質(zhì)或者其組合。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括以任何方法或者技術(shù)實(shí)現(xiàn)的用于存儲(chǔ)信息的介質(zhì),信息是諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或者其它數(shù)據(jù)。通信介質(zhì)典型地將計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊、或其它數(shù)據(jù)具體化為諸如載波或其它輸送機(jī)制那樣的調(diào)制的數(shù)據(jù)信號(hào),并且包括任何信息傳遞介質(zhì)。
[0017]系統(tǒng)存儲(chǔ)器130包括具有易失性和/或非易失性存儲(chǔ)器形式的計(jì)算機(jī)存儲(chǔ)介質(zhì),諸如只讀存儲(chǔ)器(R0M)131和隨機(jī)訪問存儲(chǔ)器(RAM)132。基本輸入/輸出系統(tǒng)133 (B1S)(包含諸如在啟動(dòng)期間有助于在計(jì)算設(shè)備100內(nèi)的元件之間轉(zhuǎn)移信息的基本例程)典型地存儲(chǔ)在ROM 131中。RAM 132典型地包含對(duì)于處理單元120來說可立即訪問的和/或當(dāng)前正由處理單元120操作的數(shù)據(jù)和/或程序模塊。作為示例但不是限制,圖1圖示出操作系統(tǒng)134、其它程序模塊135和程序數(shù)據(jù)136。
[0018]計(jì)算設(shè)備100也可以包括其它可拆卸/不可拆卸、易失性/非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)。僅作為示例,圖1圖示出從非易失性磁介質(zhì)中讀取或者寫入到非易失性磁介質(zhì)的硬盤驅(qū)動(dòng)機(jī)141。其它可以與示范性計(jì)算設(shè)備一同使用的可拆卸/不可拆卸、易失性/非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)包括但不限于:盒式磁帶、閃速存儲(chǔ)器卡、數(shù)字多功能盤、數(shù)字錄像帶、固態(tài)RAM、固態(tài)ROM等等。硬盤驅(qū)動(dòng)機(jī)141典型地通過諸如非易失性存儲(chǔ)器接口 140那樣的接口連接到系統(tǒng)總線121。
[0019]以上討論的和在圖1中圖示的驅(qū)動(dòng)機(jī)及其相關(guān)聯(lián)的計(jì)算機(jī)存儲(chǔ)介質(zhì)提供了對(duì)于計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊和用于計(jì)算設(shè)備100的其它數(shù)據(jù)的存儲(chǔ)。例如,在圖1中,硬盤驅(qū)動(dòng)機(jī)141被圖示為存儲(chǔ)操作系統(tǒng)144、其它程序模塊145和程序數(shù)據(jù)146。要留意的是,這些組件既可以與操作系統(tǒng)134、其它程序模塊135和程序數(shù)據(jù)136相同,又可以與其不同。此處給予操作系統(tǒng)144、其它程序模塊145和程序數(shù)據(jù)146不同的標(biāo)號(hào),以舉例說明最低限度它們是不同的副本(copy )。
[0020]計(jì)算設(shè)備100可以在聯(lián)網(wǎng)環(huán)境中使用到一個(gè)或者多個(gè)遠(yuǎn)程計(jì)算機(jī)的邏輯連接進(jìn)行操作。計(jì)算設(shè)備100不受限于任何特定的網(wǎng)絡(luò)或者聯(lián)網(wǎng)的協(xié)議。因此,為了舉例說明的簡(jiǎn)單起見,圖1中示出的計(jì)算設(shè)備100經(jīng)由一般網(wǎng)絡(luò)連接171連接到網(wǎng)絡(luò)172,網(wǎng)絡(luò)連接171可以是局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)或者其它網(wǎng)絡(luò)。計(jì)算設(shè)備100通過網(wǎng)絡(luò)接口或者適配器170連接到一般網(wǎng)絡(luò)連接171,網(wǎng)絡(luò)接口或者適配器170進(jìn)而又連接到系統(tǒng)總線121。在聯(lián)網(wǎng)環(huán)境中,相對(duì)于計(jì)算設(shè)備100或者其一部分或外圍設(shè)備所描繪的程序模塊可以被存儲(chǔ)在通過一般網(wǎng)絡(luò)連接171通信地耦合到計(jì)算設(shè)備100的一個(gè)或者多個(gè)其它計(jì)算設(shè)備的存儲(chǔ)器中。將意識(shí)到的是,所示出的網(wǎng)絡(luò)連接是示范性的,并且可以使用建立計(jì)算設(shè)備之間的通信鏈接的其它手段。
[0021]轉(zhuǎn)向圖2,其中所示出的系統(tǒng)200圖示可以重新使用現(xiàn)有基礎(chǔ)設(shè)施來用一種或者多種語言有效地提供現(xiàn)有語言學(xué)理解能力的示范性過程,所述一種或者多種語言不同于在其中創(chuàng)建現(xiàn)有基礎(chǔ)設(shè)施的語言。在一個(gè)實(shí)施例中,在計(jì)算設(shè)備(諸如示范性計(jì)算設(shè)備100)上執(zhí)行的現(xiàn)有應(yīng)用或者過程可能能夠接受語言學(xué)輸入,并且可選地生成用創(chuàng)建應(yīng)用或者過程所用的錨語言的語言學(xué)輸出。當(dāng)在本文中使用時(shí),術(shù)語“語言學(xué)輸入”是指任何這樣形式的輸入,即:以單詞或短語將被用于人類間交流的方式來包括單詞或短語。例如,在家庭娛樂計(jì)算設(shè)備上運(yùn)行的應(yīng)用可能已經(jīng)被編程來接受、理解并且響應(yīng)于英語的口語命令,從而使用戶能夠搜索和選擇將由這樣的家庭娛樂計(jì)算設(shè)備呈現(xiàn)的娛樂內(nèi)容。作為另一個(gè)示例,在智能電話計(jì)算設(shè)備上執(zhí)行的應(yīng)用可能已經(jīng)被編程來接受、理解和響應(yīng)于包括由用戶詢問的問題的英語口語輸入。雖然“語言學(xué)輸入”典型地將由用戶以口語形式提供,但是本文中利用和定義的術(shù)語“語言學(xué)輸入”不被如此限制。事實(shí)上,本文描述的機(jī)制同樣適用于以如下形式提供的“語言學(xué)輸入”,即以文本、手勢(shì)、凝視、手語(sign language)、和其它通過其可以把本文所定義的“語言學(xué)輸入”提供給計(jì)算設(shè)備的相似機(jī)制。
[0022]這樣的應(yīng)用或者過程可以包括現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220,諸如在圖2中所圖示的基礎(chǔ)設(shè)施,其可以代表負(fù)責(zé)對(duì)用錨語言提供的語言學(xué)輸入進(jìn)行理解并且對(duì)其起作用的計(jì)算機(jī)可執(zhí)行指令。正如本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到的,在現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220內(nèi)所包含的組件和過程可以代表時(shí)間和資源的大量投入。此外,這樣的基礎(chǔ)設(shè)施對(duì)于創(chuàng)建其的語言而言是獨(dú)一無二的。例如,如果現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220是被設(shè)計(jì)成接受用英語提供的語言學(xué)輸入并且對(duì)其起作用的應(yīng)用的一部分,那么這樣的基礎(chǔ)設(shè)施將不能對(duì)用另一種語言(諸如法語)提供的輸入起作用。因此,如果包括現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220的應(yīng)用或者過程的開發(fā)者試圖發(fā)布例如這樣的應(yīng)用或者過程的法語版本,則該開發(fā)者將需要再次把大量的時(shí)間和資源投入到現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220的面向法語的版本中。對(duì)于要在世界范圍內(nèi)使用的應(yīng)用或者過程而言,這樣的單語言的限制可導(dǎo)致對(duì)于大量語言從零開始重復(fù)創(chuàng)建單語言應(yīng)用基礎(chǔ)設(shè)施。為了避免時(shí)間和資源的這樣的大量投入,現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220可以在機(jī)器翻譯組件的幫助下被重新利用。更具體地,且正如將在下文中詳細(xì)描述的,機(jī)器翻譯組件可以將輸入和可選地將輸出從應(yīng)用或者過程的用戶的本國(guó)語言翻譯成現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220的錨語言,由此使現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220能夠?qū)⒄Z言學(xué)服務(wù)提供給用與錨語言不同的本國(guó)語言操作的應(yīng)用或者過程。通過重新使用現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220,應(yīng)用或者過程的開發(fā)者可以生成用其它語言的等效版本,而不用投入典型地對(duì)于用那些其它語言重新創(chuàng)建現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220的類似版本所需要的、大量的時(shí)間和資源。為了簡(jiǎn)明且便于參考,在本文中利用術(shù)語“錨語言”來意指創(chuàng)建初始語言學(xué)基礎(chǔ)設(shè)施所用的語言,初始語言學(xué)基礎(chǔ)設(shè)施將被重新使用。在本文中利用術(shù)語“本國(guó)語言”來意指將輸入提供給應(yīng)用或者過程所用的語言和預(yù)期要用來提供來自應(yīng)用或者過程的任何輸出的語言。
[0023]圖2所示出的系統(tǒng)200將現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220圖示為:其將在現(xiàn)有計(jì)算設(shè)備上執(zhí)行的且接受來自用戶(諸如用戶150)的語言學(xué)輸入的應(yīng)用或者過程中被利用。特別地,且如由圖2的系統(tǒng)200所示出的,由用戶150生成的語言學(xué)輸入可以起初由對(duì)用戶150所提供的語言學(xué)輸入是合適的輸入識(shí)別組件211接收。例如,如果由用戶150提供的語言學(xué)輸入是口語輸入,那么輸入識(shí)別組件211可以是語音識(shí)別組件,其能夠?qū)⒋碛脩艨谡Z輸入的音頻信息轉(zhuǎn)換成文本信息。作為另一個(gè)示例,如果由用戶150提供的語言學(xué)輸入是經(jīng)由手語的輸入,那么輸入識(shí)別組件211可以是手語識(shí)別組件,其能夠?qū)⒋碛脩羰终Z輸入的圖像信息轉(zhuǎn)換成文本信息。
[0024]可以將代表用戶語言學(xué)輸入的文本信息提供給語言理解組件221。語言理解組件221可能能夠接受這樣的文本格式的語言學(xué)輸入,并且連同對(duì)話管理器222和知識(shí)源223一起,來諸如在識(shí)別將被執(zhí)行的、適當(dāng)?shù)捻憫?yīng)性處理的上下文中,從該語言學(xué)輸入中推導(dǎo)出含義。例如,如果用戶已經(jīng)說出指令去顯示所給出的電視演出的可得到劇集的全部,則語言理解組件221連同對(duì)話管理器222和知識(shí)源223 —起可以將這樣的語言學(xué)輸入解譯為搜索并顯示結(jié)果(search-and-display-results)請(qǐng)求,以及由用戶具體說明的名稱將是搜索參數(shù)且它是標(biāo)題的詳述。相似地,作為另一個(gè)示例,如果用戶已經(jīng)詢問具體城市的中期預(yù)報(bào)(extended forecast),則語言理解組件221連同對(duì)話管理器222和知識(shí)源223 —起可以將這樣的語言學(xué)輸入解譯為對(duì)于氣象學(xué)信息的事實(shí)的請(qǐng)求,并且由用戶提供的名稱是定義其氣象學(xué)信息被請(qǐng)求的地理區(qū)域的城市的名稱。
[0025]如所指示的,語言理解組件221、對(duì)話管理器222和知識(shí)源223可以代表大量的時(shí)間和資源投入。更具體地,語言理解單元221、對(duì)話管理器222和知識(shí)源223可能已經(jīng)通過接收來自用戶的語言學(xué)輸入并確定且著手進(jìn)行響應(yīng)性處理的多次迭代而被構(gòu)建和細(xì)化。這樣的多次迭代可以試圖改正可能在先前的迭代中已經(jīng)次最優(yōu)地實(shí)施的語言理解組件221、對(duì)話管理器222和知識(shí)源223的一些方面。例如,用戶可以利用不同的單詞和語言學(xué)風(fēng)格來詢問相同的信息,并且語言理解組件221、對(duì)話管理器222和知識(shí)源223可以通過各種迭代和細(xì)化來計(jì)及日益增多的這樣的不同單詞和語言學(xué)風(fēng)格,以便能夠有意義地響應(yīng)范圍更廣的用戶和更為多種多樣的輸入。
[0026]在一個(gè)實(shí)施例中,語言理解組件221、對(duì)話管理器222和知識(shí)源223可以基于它們?cè)谄渲斜焕玫木唧w上下文而進(jìn)一步被細(xì)化。例如,在家庭娛樂計(jì)算設(shè)備上提供對(duì)娛樂內(nèi)容的訪問的應(yīng)用可以接收針對(duì)這樣的娛樂內(nèi)容的語言學(xué)輸入,且語言理解組件221、對(duì)話管理器222和知識(shí)源223可被聚焦于考慮這樣的上下文。繼續(xù)這樣的示例,如果添加新的電視演出,其名稱包括之前不是現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220的一部分的單詞或者術(shù)語,則可以把基礎(chǔ)設(shè)施更新成包含這樣的單詞或者術(shù)語,以及用戶對(duì)它們的發(fā)音和其它演講方式(delivery),以使得如果用戶請(qǐng)求這樣的新電視演出,則現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施將能夠認(rèn)知這樣的請(qǐng)求。相似地,作為另一個(gè)示例,在智能電話計(jì)算設(shè)備中提供個(gè)人助理服務(wù)的應(yīng)用可以接收針對(duì)典型地由這樣的個(gè)人助理服務(wù)執(zhí)行的有限一組動(dòng)作的語言學(xué)輸入,且語言理解組件221、對(duì)話管理器222和知識(shí)源223可被聚焦于考慮這樣的上下文。繼續(xù)這樣的另一個(gè)示例,如果現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220的一次迭代沒有恰當(dāng)?shù)赝茢嗷蛘邲]有有效地處理請(qǐng)求來為指定的用戶創(chuàng)建文本消息,則可以更新現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220的后續(xù)迭代以便基于用戶的語言學(xué)輸入更容易地識(shí)別這樣的請(qǐng)求且對(duì)其進(jìn)行響應(yīng)。
[0027]一旦語言理解組件221、對(duì)話管理器222和知識(shí)源223已經(jīng)啟動(dòng)了響應(yīng)處理的執(zhí)行,輸出(就任何合適的輸出而言)可以被引導(dǎo)到語言生成組件224,其可以與對(duì)話管理器222和知識(shí)源223合作地以語言學(xué)的方式提供輸出。與語言理解組件221、對(duì)話管理器222和知識(shí)源223相似,語言生成組件224也可以代表大量的時(shí)間和資源投入,并且可能已經(jīng)作為多次迭代的結(jié)果而被生成,該多次迭代試圖改進(jìn)用戶的語言學(xué)感知,由語言生成組件224在提供響應(yīng)性輸出時(shí)利用。
[0028]在一個(gè)實(shí)施例中,由語言生成組件224提供的輸出可以被引導(dǎo)至輸出產(chǎn)生組件212,從而以可由用戶150感知的形式生成。例如,文本到語音(text-to-speech)組件可以是能夠以口語格式產(chǎn)生語言學(xué)輸出的輸出產(chǎn)生組件。正如本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到的,可以同樣地利用其它類型的輸出產(chǎn)生組件。
[0029]如所指示的,現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220可以代表大量的時(shí)間和資源投入。遺憾的是,現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220典型地是在諸如像英語那樣的單語言的上下文中創(chuàng)建的。因此,用另一種不同的語言(諸如法語)提供語言學(xué)輸入的用戶將不能利用這樣的應(yīng)用。然而在一個(gè)實(shí)施例中,可以使用機(jī)器翻譯技術(shù)來在其它語言和錨語言(最初在其上下文內(nèi)創(chuàng)建現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220)之間進(jìn)行翻譯,而不重新創(chuàng)建用這樣的其它語言的、與現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220的那些組件類似的組件。圖2的系統(tǒng)200圖示出這樣的混合應(yīng)用,其可以包括用錨語言的現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220以及在本國(guó)語言和錨語言之間進(jìn)行翻譯的機(jī)器翻譯組件,由此提供用一種或者多種本國(guó)語言的語言學(xué)理解功能性,而同時(shí)重新使用用錨語言的現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220和節(jié)省重新創(chuàng)建用那些其它的本國(guó)語言的類似基礎(chǔ)設(shè)施的時(shí)間和開支。
[0030]首先,由用戶利用與創(chuàng)建現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220所用的錨語言不同的本國(guó)語言提供的語言學(xué)輸入可以被引導(dǎo)至語言辨識(shí)組件230。例如,外國(guó)用戶250可以用本國(guó)語言提供輸入。這樣的輸入可以被引導(dǎo)至語言辨識(shí)組件230,其可以利用已知技術(shù)來辨識(shí)正由外國(guó)用戶250用以提供語言學(xué)輸入的語言。一旦辨識(shí)出由外國(guó)用戶250提供的語言學(xué)輸入的語言,則輸入可以被引導(dǎo)至輸入識(shí)別組件241、261和271中合適的一個(gè)。例如,如果外國(guó)用戶250提供法語的語言學(xué)輸入,則語言辨識(shí)組件230可以將這樣的語言學(xué)輸入辨識(shí)為法語,并且可以將其引導(dǎo)至法語輸入識(shí)別組件。輸入識(shí)別組件241、261和271的每個(gè)都可以相對(duì)于這樣的輸入識(shí)別組件與之相關(guān)聯(lián)且它們操作于其上下文中的語言來執(zhí)行類似的功能。這樣的功能也類似于輸入識(shí)別組件211,其操作在上文中已經(jīng)進(jìn)行了詳細(xì)描述。
[0031]一旦由外國(guó)用戶250所提供的語言學(xué)輸入已經(jīng)轉(zhuǎn)換成基于文本的語言學(xué)輸入,而該基于文本的語言學(xué)輸入是用外國(guó)用戶250提供語言學(xué)輸入所用的語言,則可以將基于文本的語言學(xué)輸入提供給機(jī)器翻譯組件去翻譯成錨語言,由此使現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220能夠被重新使用。取決于基于由語言辨識(shí)組件230執(zhí)行的語言辨識(shí),選擇了輸入識(shí)別組件241、261和271的哪一個(gè),來自機(jī)器翻譯組件240、260和270中的合適的機(jī)器翻譯組件可被提供以由輸入識(shí)別組件241、261和271中被選擇的輸入識(shí)別組件生成的基于文本的語言學(xué)輸入。
[0032]一旦機(jī)器翻譯組件(諸如機(jī)器翻譯組件240、260和270)中的一個(gè)已經(jīng)將語言學(xué)輸入翻譯成錨語言,則可以將所翻譯的輸入以和上文所詳細(xì)描述的相同方式提供給語言理解組件221,因?yàn)樗g的輸入是用與上文描述中的輸入相同的錨語言。附加地,如果現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220諸如經(jīng)由語言生成組件224生成輸出,則將所翻譯的輸入提供給語言理解組件221的機(jī)器翻譯組件也可以接收由語言生成組件224所生成的輸出,并且可以將其翻譯回本國(guó)語言以呈現(xiàn)給外國(guó)用戶250。更具體地,且正如本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到的,機(jī)器翻譯技術(shù)可以是雙向的,從一個(gè)應(yīng)用翻譯到另一個(gè)應(yīng)用,且反之亦然。因此,在接收到由語言生成組件224所生成的輸出后,機(jī)器翻譯組件240、260和270中合適的一個(gè)可以從語言生成組件224用以提供這樣的輸出的錨語言翻譯為本國(guó)語言,即起初由外國(guó)用戶250利用以便提供輸入的語言。
[0033]輸出由機(jī)器翻譯組件240、260和270中的一個(gè)翻譯后,該輸出可以被提供給對(duì)應(yīng)的輸出產(chǎn)生組件242、262和272,其可以以與上文詳細(xì)描述的輸出產(chǎn)生組件212相類似的方式操作。正如本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到的,如果輸出產(chǎn)生組件只不過是非?;镜奈谋镜秸Z音組件,那么可能不需要特定于具體語言的輸出產(chǎn)生組件。然而,這樣的非?;镜奈谋镜秸Z音組件可能不能準(zhǔn)確地用言辭表達(dá)語言學(xué)輸出的某些方面,并且可能不能適應(yīng)(accommodate)利用獨(dú)特聲音的語言。因此,圖2的系統(tǒng)200示出語言特定的輸出產(chǎn)生組件242,262和272,由此使每個(gè)輸出產(chǎn)生組件都能夠修改成適合與其相關(guān)聯(lián)的語言的再現(xiàn)。
[0034]圖2的系統(tǒng)200圖示其中單組計(jì)算機(jī)可執(zhí)行指令可以接受來自說多種不同語言的外國(guó)用戶的輸入的實(shí)施例;多語言混合應(yīng)用。作為示例,如果現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220是英語應(yīng)用或者過程的一部分,則圖2的系統(tǒng)200圖示其中單組計(jì)算機(jī)可執(zhí)行指令可以同等地接受法語、中文和阿拉伯語的輸入的實(shí)施例。法語輸入可以同樣由語言辨識(shí)組件230來辨識(shí),并且可被引導(dǎo)至例如輸入識(shí)別組件241,并且隨后引導(dǎo)至對(duì)應(yīng)的機(jī)器翻譯組件240,其可以在法語和錨語言(在本示例中即英語)之間進(jìn)行翻譯。相似地,中文輸入可以同樣由語言辨識(shí)組件230來辨識(shí),并且隨著本示例的繼續(xù),其可被引導(dǎo)至輸入識(shí)別組件261,并且隨后引導(dǎo)至機(jī)器翻譯組件260,機(jī)器翻譯組件260可以運(yùn)作來在中文和英語之間進(jìn)行翻譯。再次作為一個(gè)示例,阿拉伯語輸入照樣可以被引導(dǎo)至輸入識(shí)別組件271和機(jī)器翻譯組件270。
[0035]然而,在另一個(gè)實(shí)施例中,每單個(gè)應(yīng)用或者過程可以被引導(dǎo)至僅僅一種具體語言;單語言混合應(yīng)用。在這樣的實(shí)施例中,可以移除語言辨識(shí)組件230,除了一個(gè)以外的所有機(jī)器翻譯組件和相關(guān)聯(lián)的輸入識(shí)別和輸出產(chǎn)生組件也可以被移除。例如,如果要利用為說英語的人構(gòu)造的現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220來為說法語的人構(gòu)造某個(gè)應(yīng)用,則這樣的應(yīng)用可以包括單個(gè)輸入識(shí)別組件和單個(gè)機(jī)器翻譯組件,單個(gè)輸入識(shí)別組件可以接受法語輸入并且將其轉(zhuǎn)換成法語的基于文本的語言學(xué)輸入,而單個(gè)機(jī)器翻譯組件可以將法語的基于文本的語言學(xué)輸入翻譯成英語的基于文本的語言學(xué)輸入,以便將其提供給語言理解組件221。相似地,單個(gè)機(jī)器翻譯組件可以將英語輸出(就任何由現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220產(chǎn)生的英語輸出而言)翻譯成法語,并且將所翻譯的法語輸出提供給單個(gè)法語輸出產(chǎn)生組件。以這樣的方式,可以減小應(yīng)用或者過程的復(fù)雜度和大小,但是每個(gè)這樣的單語言應(yīng)用或者過程僅可以在一種語言的上下文中操作。
[0036]正如本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到的,諸如在圖2的系統(tǒng)200中所圖示的那些的機(jī)器翻譯組件在本領(lǐng)域是眾所周知的,并且是繼續(xù)研究和改進(jìn)的主題。但是,在一個(gè)實(shí)施例中,打算的是可以對(duì)諸如以上文詳細(xì)描述的方式利用的機(jī)器翻譯組件進(jìn)行調(diào)節(jié),以便在應(yīng)用或者過程的具體上下文中提供更好的準(zhǔn)確度。例如,被設(shè)計(jì)用于為用戶提供對(duì)娛樂內(nèi)容的訪問的應(yīng)用——諸如將在家庭娛樂計(jì)算設(shè)備中執(zhí)行的應(yīng)用——可以包括機(jī)器翻譯組件,機(jī)器翻譯組件可以被修改成包括對(duì)于娛樂應(yīng)用的措詞(verbiage)相關(guān)性,其可以不是現(xiàn)成的機(jī)器翻譯組件的一部分并且可以不斷地發(fā)展,諸如由新電視演出或者電影所利用的術(shù)語。相似地,同樣可以修改語言理解組件221、對(duì)話管理器222、知識(shí)源223和語言生成組件224,以解決隨著機(jī)器翻譯組件的引入而可能引發(fā)的具體問題。例如,錨語言中的某些單詞、術(shù)語或者短語,與在相關(guān)語言中會(huì)是同義詞的其它單詞、術(shù)語或者短語相比,可被機(jī)器翻譯組件更準(zhǔn)確地翻譯。在這樣的情況下,那些單詞、術(shù)語和短語可以得到現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220的優(yōu)惠待遇。
[0037]在一個(gè)實(shí)施例中,由圖2的系統(tǒng)200圖示的混合應(yīng)用——其中機(jī)器翻譯組件被用來在本國(guó)語言和錨語言之間進(jìn)行翻譯,由此促進(jìn)用錨語言的現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施的重新利用——可以被用作為從其開始生成用與錨語言不同的本國(guó)語言的單語言應(yīng)用或者過程的起始點(diǎn)。轉(zhuǎn)向圖3,圖中所示出的系統(tǒng)300圖示從混合應(yīng)用或者過程示范性地創(chuàng)建非混合的單語言應(yīng)用或者過程。首先,如由圖3的系統(tǒng)300所圖示的,輸入可以由輸入識(shí)別組件311用本國(guó)語言接收,并且隨后可以被提供給機(jī)器翻譯組件310,以便翻譯成錨語言用于供給現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220,諸如以上文詳細(xì)描述的方式。
[0038]如之前所指示的,對(duì)于用戶的輸入的某些術(shù)語、單詞、短語和其它語言學(xué)成分,可以修改機(jī)器翻譯組件310、現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220或者它們的某種組合,從而更準(zhǔn)確地對(duì)那些語言學(xué)成分進(jìn)行解譯和響應(yīng)。在一個(gè)實(shí)施例中,不是修改機(jī)器翻譯組件310或者現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220來計(jì)及這樣的改進(jìn),而是可以創(chuàng)建用本國(guó)語言的新語言理解組件321和同樣用本國(guó)語言的新對(duì)話管理器322、新知識(shí)源323和新語言生成324,以便致力于這樣的修改和改進(jìn)。隨著時(shí)間的過去,通過后續(xù)的迭代,語言理解組件321、對(duì)話管理器322、知識(shí)源323和語言生成組件324可以不斷地被改進(jìn),并且擴(kuò)展成最終能夠在不憑借現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220的情況下操作。在這樣的情況下,同樣將不再需要機(jī)器翻譯組件310,且因此用于本國(guó)語言的新應(yīng)用或者過程可以不再是混合的,諸如那些在上文中詳細(xì)描述的。替代地,這樣的用于本國(guó)語言的新應(yīng)用或者過程可以包括輸入識(shí)別組件310、語言理解組件321、對(duì)話管理器322、知識(shí)源323、語言生成組件324和輸出生成組件312,它們?nèi)伎梢灾苯佑帽緡?guó)語言操作。以這樣的方式,重新使用現(xiàn)有應(yīng)用基礎(chǔ)設(shè)施220的混合應(yīng)用或者過程可能已經(jīng)充當(dāng)權(quán)宜措施或者臨時(shí)構(gòu)造,非混合的單語言應(yīng)用或者過程可以通過后續(xù)迭代從所述權(quán)宜措施或者臨時(shí)架構(gòu)生成,在迭代期間,用本國(guó)語言的單語言組件基于現(xiàn)實(shí)世界的利用和反饋而被開發(fā)和細(xì)化。
[0039]轉(zhuǎn)向圖4,圖中所示出的流程圖400圖示出示范性的一系列步驟,通過這些步驟,用錨語言的現(xiàn)有應(yīng)用的語言學(xué)組件可以被重新利用,以便用與錨語言不同的一種或者多種本國(guó)語言提供語言學(xué)功能性。例如,在一個(gè)實(shí)施例中,圖4所示出的流程圖400的示范性步驟可以通過某種服務(wù)而被執(zhí)行,所述服務(wù)可以被提供給應(yīng)用或者過程開發(fā)者,以使得他們能夠有效地創(chuàng)建他們的應(yīng)用或者過程的、可以接受來自一種或者多種本國(guó)語言的語言學(xué)輸入的版本,本國(guó)語言與那些開發(fā)者最初用以創(chuàng)建他們的應(yīng)用或者過程的錨語言不同。如所示出的,在步驟410,用錨語言的現(xiàn)有單語言過程或者應(yīng)用可以被用作為起始點(diǎn),諸如要被提供給服務(wù)的輸入。隨后,在步驟420,在接收到或者能訪問來自步驟410的現(xiàn)有單語言過程時(shí),可以安裝語言辨識(shí)組件,其可以接受用除錨語言之外的其它語言的輸入,而且其可以辨識(shí)這樣的用以提供輸入的語言,并且選擇合適的機(jī)器翻譯組件。如之前所指示的,在一個(gè)實(shí)施例中,如果要?jiǎng)?chuàng)建的混合應(yīng)用或者過程將僅僅接受除錨語言之外的單語言的輸入,那么步驟420可以是可選的,因?yàn)閮H僅可以利用一個(gè)機(jī)器翻譯組件,即用于在錨語言和混合應(yīng)用或者過程將被引導(dǎo)至的單一其它語言之間進(jìn)行翻譯的機(jī)器翻譯組件。
[0040]在步驟430,可以安裝一個(gè)或者多個(gè)機(jī)器翻譯組件,其可以在錨語言和一種或者多種本國(guó)語言之間進(jìn)行翻譯,其中,來自步驟410的單語言過程是在錨語言的上下文中創(chuàng)建的,而本國(guó)語言與可用以接受輸入并且可選地可用以提供輸出的錨語言不同。如果在步驟430安裝了多個(gè)機(jī)器翻譯組件,則在步驟430安裝的機(jī)器翻譯組件可以在錨語言和那些本國(guó)語言之間進(jìn)行翻譯,本國(guó)語言可由在步驟420所安裝的語言辨識(shí)組件辨識(shí)。
[0041]隨后,在步驟440,可以安裝對(duì)應(yīng)于在步驟430所安裝的機(jī)器翻譯組件的輸入識(shí)別和輸出生成組件。如之前所指示的,輸入識(shí)別組件可以接受多種多樣形式的語言學(xué)輸入,諸如口語語言學(xué)輸入的音頻,并可以識(shí)別這樣的形式,且將它們轉(zhuǎn)換成基于文本的語言學(xué)輸入。然后可以將這樣的基于文本的語言學(xué)輸入提供給諸如像機(jī)器翻譯組件的另外的過程。同樣如之前所指示的,諸如在步驟440安裝的那些的輸入識(shí)別組件可以是語言特定的,因?yàn)楸辉O(shè)計(jì)來識(shí)別用一種語言的語言學(xué)輸入的輸入識(shí)別組件將僅能夠準(zhǔn)確地識(shí)別用那一種語言的、這樣的語言學(xué)輸入。因此,就這樣的組件在其上下文中操作的語言而言,在步驟440安裝的輸入識(shí)別組件可對(duì)應(yīng)于在步驟430安裝的機(jī)器翻譯組件。所以,如果在步驟430安裝了用于特定的一組語言的機(jī)器翻譯組件,那么在步驟440,可以安裝用于那些相同語言的輸入識(shí)別組件。
[0042]同樣如之前所指示的,輸出生成組件可以接受基于文本的語言學(xué)輸出,并且可以以用戶可接受的方式,諸如像通過說出語言學(xué)輸出,來生成該輸出。雖然有可能的是,輸出生成組件可以是語言中性的(neutral),但是這樣的輸出生成組件可以是次最優(yōu)的。因此,在一個(gè)實(shí)施例中,打算的是,在步驟440可以安裝語言特定的輸出生成組件,其對(duì)應(yīng)于同樣在步驟440安裝的輸入識(shí)別組件的語言。
[0043]隨后,在步驟450,在步驟430安裝的機(jī)器翻譯組件可以與在步驟440安裝的輸入識(shí)別和輸出生成組件以如下方式通信地耦合,即:接受用特定語言的語言學(xué)輸入的輸入識(shí)別組件與可以在這樣的語言和錨語言之間進(jìn)行翻譯的機(jī)器翻譯組件通信地耦合,并且以如下方式通信地耦合,即:生成用特定語言的語言學(xué)輸出的輸出生成組件與可以在該語言和錨語言之間進(jìn)行翻譯的機(jī)器翻譯組件通信地耦合。在步驟460,在步驟430安裝的機(jī)器翻譯組件可以與步驟410的現(xiàn)有單語言過程或者應(yīng)用的語言學(xué)組件通信地耦合。特別地,在步驟430安裝的機(jī)器翻譯組件可以為這樣的現(xiàn)有單語言過程或者應(yīng)用的語言學(xué)組件提供語言學(xué)輸入,該語言學(xué)輸入被從用以提供這樣的語言學(xué)輸入的本國(guó)語言翻譯成錨語言。相似地,在步驟430安裝的機(jī)器翻譯組件可以可選地從現(xiàn)有單語言應(yīng)用或者過程的這樣的語言學(xué)組件接收用錨語言的語言學(xué)輸出,機(jī)器翻譯組件然后可以將其翻譯成本國(guó)語言。
[0044]如由圖2中的系統(tǒng)200所圖示的,由步驟420至步驟460所執(zhí)行的安裝和通信耦合可以將現(xiàn)有的單語言應(yīng)用或者過程——諸如在步驟410的那個(gè)輸入——變換成混合應(yīng)用或者過程,其可以接受來自與錨語言不同的一種或者多種本國(guó)語言的輸入、并且可以可選地用那些相同的本國(guó)語言提供輸出。因此,在圖4中示出的流程圖400的相關(guān)處理可以在步驟470結(jié)束。
[0045]轉(zhuǎn)向圖5,圖中所示出的流程圖500可以圖示出示范性的一系列步驟,其可以由混合應(yīng)用或者過程執(zhí)行,混合應(yīng)用或者過程可以在重新使用用與一種或者多種本國(guó)語言不同的錨語言的語言學(xué)組件的同時(shí),接受用那些本國(guó)語言的輸入并且可選地提供用那些本國(guó)語言的輸出。首先,在步驟510,如所示出的,可以接收用本國(guó)語言的語言學(xué)輸入。隨后,在步驟515,可以辨識(shí)在步驟510用以接收語言學(xué)輸入的本國(guó)語言。那個(gè)辨識(shí)然后可以在步驟520被利用來選擇輸入識(shí)別組件,在步驟510接收的語言學(xué)輸入可以被引導(dǎo)至該輸入識(shí)別組件。特別地,在步驟520選擇的輸入識(shí)別組件可以是被設(shè)計(jì)成識(shí)別用本國(guó)語言(如在步驟550所辨識(shí)的)的輸入的輸入識(shí)別組件。然后在步驟525,所選擇的輸入識(shí)別組件可以識(shí)別來自步驟510的語言學(xué)輸入,并且將其轉(zhuǎn)換成基于文本的語言學(xué)輸入。
[0046]在步驟530,可以將基于文本的語言學(xué)輸入提供給能夠在步驟510所接收的語言學(xué)輸入的本國(guó)語言(如在步驟515所辨識(shí)的)和錨語言之間進(jìn)行翻譯的機(jī)器翻譯組件。在步驟535,機(jī)器翻譯組件可以將基于文本的語言學(xué)輸入從最初用以提供這樣的語言學(xué)輸入的本國(guó)語言翻譯成錨語言。隨后,在步驟540,可以將現(xiàn)在用錨語言的已翻譯文本提供給最初用錨語言生成的現(xiàn)有應(yīng)用或者過程的語言學(xué)組件。那些現(xiàn)有語言學(xué)組件(如先前所指示的,其可以代表大量的時(shí)間和資源投入)然后可以處理在步驟540用錨語言提供的輸入,并且可以生成合適的響應(yīng)。
[0047]在步驟545,來自現(xiàn)有語言學(xué)組件的響應(yīng)可以用錨語言接收,并且在步驟550可以被從錨語言翻譯成在步驟510用以接收語言學(xué)輸入的本國(guó)語言。在步驟555,可以將已翻譯的響應(yīng)提供給與本國(guó)語言相關(guān)聯(lián)的輸出產(chǎn)生組件。例如,如先前所指示的,這樣的輸出產(chǎn)生組件可以是能用言辭表達(dá)已翻譯的響應(yīng)的文本到語音(text-to-speech)組件。如本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到的,這樣的文本到語音組件可以是語言特定的,以便捕獲特定口語語言的細(xì)微差別,并且提供更準(zhǔn)確的輸出來讓用戶接收。因此,在步驟555,可以被選擇的輸出產(chǎn)生組件可以是用所需的語言提供輸出的輸出產(chǎn)生組件,在步驟510接收的語言學(xué)輸入用該所需的語言接收。在步驟560,可以由輸出產(chǎn)生組件生成輸出,并且將其提供給用戶。相關(guān)處理然后可以在步驟565結(jié)束。
[0048]轉(zhuǎn)向圖6,圖中所示出的流程圖600圖示出示范性的一系列步驟,其可以被執(zhí)行來創(chuàng)建可以接受用本國(guó)語言的輸入并且可選地提供用本國(guó)語言的輸出的單語言過程,這樣的單語言過程可以從混合過程創(chuàng)建,所述混合過程正重新使用最初用錨語言創(chuàng)建的現(xiàn)有語言學(xué)組件,連同用來在錨語言和本國(guó)語言之間進(jìn)行翻譯的機(jī)器翻譯組件。首先,在步驟610,可能已經(jīng)諸如像通過圖4的流程圖400的步驟創(chuàng)建這樣的混合過程。隨后,作為混合過程的執(zhí)行的一部分,可以諸如在步驟650接收用本國(guó)語言的語言學(xué)輸入。在步驟620,混合過程可以識(shí)別語言學(xué)輸入,并且諸如以上文詳細(xì)描述的方式,將其轉(zhuǎn)換成基于文本的語言學(xué)輸
,。
[0049]在步驟625,可以做出用本國(guó)語言的語言理解組件是否可以恰當(dāng)?shù)靥幚碓诓襟E620生成的基于文本的語言學(xué)輸入的確定。如果這樣的用本國(guó)語言操作的語言理解組件不能恰當(dāng)?shù)靥幚磉@樣的語言學(xué)輸入,則處理可以進(jìn)行到以上詳細(xì)描述的步驟530至555。隨后,在步驟530至555的執(zhí)行之后,處理可以返回到步驟630,其中可以利用關(guān)于被接收進(jìn)入由步驟530至555執(zhí)行的處理中的語言學(xué)輸入的信息來改進(jìn)用本國(guó)語言實(shí)施的語言理解組件、對(duì)話管理器和其它相似的語言學(xué)組件。處理然后可以以步驟645繼續(xù)進(jìn)行,其中可以將由步驟530至555生成的響應(yīng)用本國(guó)語言呈現(xiàn)給或者輸出給用戶。
[0050]然而如果在步驟625,確定用本國(guó)語言的語言處理組件可以合適地處理語言學(xué)輸入,則處理可以替代地進(jìn)行到步驟635,其中可以將基于文本的語言學(xué)輸入提供給用本國(guó)語言的語言理解組件,而不需要在本國(guó)語言和錨語言之間的任何機(jī)器翻譯。隨后,在步驟640,可以接收來自語言生成組件的響應(yīng),語言生成組件像語言理解組件那樣在本國(guó)語言的上下文內(nèi)操作。在步驟645,如先前所指示的,這樣的本國(guó)語言響應(yīng)可以輸出給用戶。在一個(gè)實(shí)施例中,在步驟650,可以做出關(guān)于正由混合過程重新利用的用錨語言的現(xiàn)有語言學(xué)組件是否實(shí)際上仍在被利用的檢查。如果在步驟650,確定這樣的錨語言語言學(xué)組件仍在被利用,那么處理可以返回到步驟615來接收進(jìn)一步的語言學(xué)輸入。然而,如果在步驟650確定在錨語言的上下文中操作的語言學(xué)組件不再被利用,那么在一個(gè)實(shí)施例中,在步驟655,那些語言學(xué)組件可以從混合應(yīng)用或者過程中丟棄,僅留下在本國(guó)語言的上下文中操作的單語言應(yīng)用或者過程,如在步驟660所圖示的。
[0051]正如可以從上文的描述中看到的,已經(jīng)介紹了重新使用現(xiàn)有語言學(xué)組件去處理這樣的語言的語言學(xué)輸入和可選的輸出的機(jī)制,即:該語言不同于現(xiàn)有語言學(xué)組件在其上下文中操作的語言,所述重新使用是通過利用機(jī)器翻譯組件來在這樣的語言和現(xiàn)有組件的語言之間進(jìn)行翻譯而進(jìn)行的??紤]到本文所描述的主題的許多可能的變型,我們要求將所有像這樣的實(shí)施例作為我們的發(fā)明,即:可歸入以下的權(quán)利要求及其等同物的范圍之內(nèi)的實(shí)施例。
【權(quán)利要求】
1.一種提供語言學(xué)服務(wù)的方法,包括如下步驟: 接收來自用戶的用第一語言的語言學(xué)輸入; 通過識(shí)別所接收的語言學(xué)輸入,生成用第一語言的基于文本的語言學(xué)輸入; 利用機(jī)器翻譯來將基于文本的語言學(xué)輸入從第一語言翻譯成與第一語言不同的第二語H ; 將所翻譯的用第二語言的基于文本的語言學(xué)輸入提供給提供語言學(xué)服務(wù)的預(yù)先存在的組件,其在第二語言的上下文中操作; 從所述預(yù)先存在的組件接收響應(yīng)于該語言學(xué)輸入的輸出,所述輸出用第二語言提供; 利用機(jī)器翻譯來將用第二語言的輸出翻譯成第一語言; 按照所翻譯的用第一語言的輸出,生成能由用戶接收的輸出。
2.權(quán)利要求1的方法,其中所述語言學(xué)輸入通過由用戶以第一語言說出而由用戶輸入。
3.權(quán)利要求1的方法,其中生成能由用戶接收的輸出包括利用文本到語音組件。
4.權(quán)利要求1的方法,進(jìn)一步包括如下步驟:從所接收的語言學(xué)輸入辨識(shí)第一語言;以及基于所辨識(shí)的第一語言,選擇用來執(zhí)行生成基于文本的語言學(xué)輸入的輸入識(shí)別組件和機(jī)器翻譯組件。
5.權(quán)利要求4的方法,進(jìn)一步包括利用至少兩個(gè)機(jī)器翻譯組件的步驟,其中的至少一個(gè)被用來將基于文本的語言學(xué)輸入從第一語言翻譯成第二語言。
6.權(quán)利要求1的方法,進(jìn)一步包括利用提供語言學(xué)服務(wù)的組件的步驟,該提供語言學(xué)服務(wù)的組件在第一語言的上下文中操作,而且與在第二語言的上下文中操作的提供語言學(xué)服務(wù)的組件相類似。
7.權(quán)利要求6的方法,其中在第二語言的上下文中操作的提供語言學(xué)服務(wù)的組件和機(jī)器翻譯充當(dāng)用于生成在第一語言的上下文中操作的提供語言學(xué)服務(wù)的組件的起始點(diǎn)。
8.權(quán)利要求1的方法,其中所述機(jī)器翻譯被修改成計(jì)及特定于由計(jì)算機(jī)可執(zhí)行指令提供的功能性的語言學(xué)元素。
9.如權(quán)利要求1的方法,其中所述預(yù)先存在的組件被修改以計(jì)及特定于由計(jì)算機(jī)可執(zhí)行指令提供的功能性的語言學(xué)元素。
10.一種或者多種計(jì)算機(jī)可讀介質(zhì),其包括用于執(zhí)行權(quán)利要求1的步驟的計(jì)算機(jī)可執(zhí)行指令。
【文檔編號(hào)】G10L15/26GK104412260SQ201380036928
【公開日】2015年3月11日 申請(qǐng)日期:2013年5月1日 優(yōu)先權(quán)日:2012年5月10日
【發(fā)明者】R.薩里卡亞, D.博伊斯, F.A.塞利伊爾馬斯, A.K.德奧拉斯, D.Z.哈卡尼-圖爾, D.R.希拉德, G.圖爾, F.A.阿勒瓦 申請(qǐng)人:微軟公司