專利名稱:關(guān)于自動(dòng)語言翻譯的方法和裝置的制作方法
發(fā)明的領(lǐng)域本發(fā)明一般涉及自動(dòng)語言翻譯,特別涉及用于翻譯按照嚴(yán)格的語法組合的受約束的語言結(jié)構(gòu)。
發(fā)明的背景自從運(yùn)輸工具的改進(jìn)開始明顯地降低越境貿(mào)易的不便和費(fèi)用的時(shí)候起,通用的交流工具的客觀需要就已經(jīng)被認(rèn)識(shí)。例如,在1960年,國際(社會(huì))曾作出努力企圖使世界語作為通用語言。當(dāng)著此項(xiàng)努力最終失敗了時(shí),遍及世界的一百萬到一千五百萬的大量的流利的演說家以及此項(xiàng)努力的廣度表明了問題的嚴(yán)重性。世界語沒有成功因?yàn)樗刃枰邮苄碌恼Z法又需接受新的詞匯,對(duì)于想要成為演說家的人而言后者具有更大的挑戰(zhàn)性。
當(dāng)前,信息能夠在世界范圍更為流暢自如和快速地傳播,這增大了對(duì)于通用交流工具的需求。最新的努力已最大程度地集中在語言間的自動(dòng)翻譯上。當(dāng)前在使用的系統(tǒng)通常都存儲(chǔ)了、在源和目標(biāo)語言中的,幾百萬個(gè)常用單詞,短語及組合,對(duì)于精度和強(qiáng)度依賴于待譯文本的狀況。按照定義這種系統(tǒng)是不完備的,因?yàn)闆]有一個(gè)系統(tǒng)能夠存儲(chǔ)每個(gè)可能的單詞組合,并且它們的用途也隨其設(shè)計(jì)者和使用者的語言風(fēng)格而變。對(duì)人而言檢查和修改輸出的譯文幾乎總是必要的。此外這些系統(tǒng)還在一個(gè)時(shí)刻翻譯一個(gè)詞(并因此而工作緩慢),以及對(duì)每一種目標(biāo)語言需要一個(gè)分別的獨(dú)立的數(shù)據(jù)庫。而且,因?yàn)樗鼈兊某绦蛟O(shè)計(jì)成去識(shí)別特殊的語言特性以及從一種語言到另一種語言的其特定的變換,所以每一種翻譯必須單獨(dú)地進(jìn)行。換言之,對(duì)于多重翻譯所需的時(shí)間是分別完成每一種翻譯的時(shí)間的和。
因?yàn)樵S許多多的理由,翻譯是困難的,包括在語言之間缺乏一對(duì)一的詞的對(duì)應(yīng),在每一種語言中都存在同音異義詞,以及天然的語法有特異性的這個(gè)事實(shí);它們不遵從一組嚴(yán)格的,將會(huì)使得直接的詞到詞的替代易于實(shí)現(xiàn)的規(guī)則。許多人工智能研究的努力已經(jīng)朝向?qū)@些特性風(fēng)格的計(jì)算機(jī)式的“理解”,以及他們的有限的成績表明該問題的復(fù)雜性。
發(fā)明本發(fā)明提供一種人造的語法用以表示在天然語法中所傳達(dá)的思想和信息。但在結(jié)構(gòu)格式上適合于自動(dòng)翻譯。按照本發(fā)明,句子按加的被條理化的自然詞匯表的固定系列規(guī)則來構(gòu)成。在易于被詞匯表的本國講者理解的意義上,該語法是清晰的,但是在它的表達(dá)復(fù)雜概念的能力方面是復(fù)雜的,因?yàn)榫渥邮前凑展潭ǖ囊?guī)則從條理化的詞匯表產(chǎn)生,它們能夠容易地從一種語言翻譯為另一種。優(yōu)先地,詞匯表被表示為一系列物理上或邏輯上有差別的數(shù)據(jù)庫。每一個(gè)數(shù)據(jù)庫包含表示按照語法中所定義的形式分類所表示的項(xiàng)目。翻譯即是在參考句子的詞條和在一種或多種目標(biāo)語言中的對(duì)應(yīng)詞條之間的直接的查尋。
不同于天然的語法,本發(fā)明采用有限的(雖然可變化和可擴(kuò)展)專門詞匯,一組嚴(yán)謹(jǐn)?shù)男问椒诸愐约坝糜诰渥訕?gòu)造的有限的和嚴(yán)謹(jǐn)?shù)囊?guī)則。開始于來自四個(gè)形式類中的一個(gè)的一個(gè)詞通過反復(fù)應(yīng)用四個(gè)擴(kuò)展規(guī)則能夠構(gòu)成句子,四個(gè)擴(kuò)展規(guī)則管理能夠組合來自不同的類的詞匯的方法。產(chǎn)生的“句子”,雖然不像他們想要表達(dá)的自然語言的句子,仍然能夠準(zhǔn)確地和易理解地表達(dá)自然語言句子的含意的全部內(nèi)容。本發(fā)明使用比學(xué)習(xí)新詞匯表相對(duì)容易的一種新語法,特別是被高度限制到一種精確規(guī)則不多的語法。結(jié)果,在熟悉這種語法之后,用戶能夠容易地利用本發(fā)明所描述的方法組合句子。
因此,利用本發(fā)明,一個(gè)自然語言的句子被翻譯或分解成(典型地)本發(fā)明的較簡單的語法但保留了原文的詞匯。雖然可能以某種程度的自動(dòng)化完成此事,本發(fā)明的所有的益處幾乎都是用發(fā)明的易于學(xué)習(xí)和應(yīng)用的語法通過人工開發(fā)而直接實(shí)現(xiàn)的一無論是基本的翻譯還是直接的組合。并且,因?yàn)榉g即是來自不同語言的同義的詞條的簡單替代,輸入句子的多重語言翻譯幾乎是立刻就被完成的。
翻譯的輸出結(jié)果由目標(biāo)語言的本國講者來理解就如同原文作者理解輸入的原文那樣地容易。因此,用本發(fā)明的語法方式,通過簡明的符合語法的語言進(jìn)行會(huì)話是可能的。將這些語句傳給會(huì)話者用于翻譯和應(yīng)答,并翻譯應(yīng)答者的應(yīng)答。例如,一個(gè)出生在美國沒有德語知識(shí)的商人能夠與出生在德國的談話者進(jìn)行會(huì)議,利用一臺(tái)按照本發(fā)明的膝上型計(jì)算機(jī)作為翻譯設(shè)備,經(jīng)由計(jì)算機(jī)交換想法。的確,同一想法可以同時(shí)地被傳遞給多個(gè)每一個(gè)講不同語言的對(duì)話者。同樣也可以同時(shí)地和多重地翻譯他們的個(gè)別的應(yīng)答。通信者能夠用本國語言通過電子郵件交換信息,按照本發(fā)明的語法簡單地將信息公式化,擁有實(shí)現(xiàn)了本發(fā)明的電子郵件系統(tǒng)的講不同語言的收件人接收翻譯為本國語言的信息,并且他們的答復(fù)在答復(fù)者收到回件時(shí)自動(dòng)地被翻譯為原先發(fā)送者的語言。在此種方式中,每個(gè)通信人只接觸到他或她的本國的語言。
即使在要求最終用本來語言輸出的情況中采用本發(fā)明也是有益的,因?yàn)閷?duì)這種格式的翻譯是易于實(shí)現(xiàn)的。例如,新聞報(bào)導(dǎo)者可能用本發(fā)明的語法中的詞匯發(fā)稿一個(gè)故事,以便傳遞給許許多多服務(wù)于不同國家的聽眾的局。在送到不同的局時(shí)該故事立刻被翻譯為適當(dāng)?shù)恼Z言,在那里它還可能進(jìn)一步被加工成適合于向聽眾通信的形式。如果進(jìn)一步的翻譯被要求時(shí)所需要的專長就性質(zhì)來說主要是編輯,比起例如對(duì)真正的語言翻譯而言需要較少的專門訓(xùn)練,的確,通訊媒體已經(jīng)雇用人員從事類似的編輯和校訂取自電信服務(wù)的原始新聞材料的工作。
按照本發(fā)明,句子是由“語言單元”組成的,每個(gè)單元可以是一個(gè)或幾個(gè)詞,來自所允許的形式類。這些類是“主題”或名詞性詞,其含有,例如,人,地點(diǎn),物品,動(dòng)作或思想的意義;“連接詞”表示兩個(gè)(或多個(gè))名詞性詞之間的關(guān)系;“描述詞”修飾一個(gè)或多個(gè)名詞性詞的狀態(tài);以及“邏輯連接詞”形成名詞性詞組。在全部四類中的所有詞條的清單提供出本發(fā)明的全部專用詞匯。為了按照本發(fā)明構(gòu)造一個(gè)句子,來自諸形式類的詞條與被按照下面詳細(xì)說明的四條擴(kuò)展規(guī)則組合,這些規(guī)則能夠以逐級(jí)方式明確地被采用以產(chǎn)生句子,但是更具體地講,一旦用戶習(xí)慣了該語法,句子被憑感覺構(gòu)造并且,如果必要的話,再接著做檢驗(yàn)使適合擴(kuò)展規(guī)則。
因此,本發(fā)明克服了前面提出過的曾經(jīng)阻礙真正強(qiáng)大的翻譯系統(tǒng)出現(xiàn)的三個(gè)障礙。通過代之以一個(gè)固定的語法克服了不同語法的特殊的實(shí)況,以及一對(duì)一的對(duì)應(yīng)問題通過一個(gè)特定的且有限的數(shù)據(jù)庫完成尋址。同音異義詞的處理方式是將一個(gè)詞的不同含義作明確的標(biāo)號(hào)并要求對(duì)指定的意義作明確的選擇。這些能力允許本發(fā)明方便地和廉價(jià)地應(yīng)用于許多語言,即使是外國的語言;反過來,現(xiàn)有的系統(tǒng)由于在其設(shè)計(jì)中的固有的費(fèi)用幾乎都是專用性地指向主要的語言。
有代表性的硬件裝置包括一系列的邏輯上物理上性質(zhì)不同的電子的數(shù)據(jù)庫,在其中存儲(chǔ)詞匯表,一個(gè)計(jì)算機(jī)的存儲(chǔ)部分用來接收用參考語言和按本發(fā)明構(gòu)成的語言表示的輸入;以及分析手段(一般是一個(gè)按照所存儲(chǔ)的計(jì)算機(jī)指令操作的處理器)用于(ⅰ)按輸入尋址數(shù)據(jù)庫以檢索與其對(duì)應(yīng)的在目標(biāo)語言中的詞條,以及(ⅱ)通過用等價(jià)的目標(biāo)詞條代替輸入來翻譯句子。
附圖的簡要說明下面的發(fā)明說明參考附圖,其中
圖1圖示說明本發(fā)明的擴(kuò)展規(guī)則的使用,以及圖2本發(fā)明采用的硬件系統(tǒng)的示意圖表示。
一個(gè)原理性實(shí)施例的詳細(xì)說明本發(fā)明有的系統(tǒng)利用一種詞典和一組強(qiáng)制性的語法規(guī)則。該詞典包括被分為四類的語言單元,每類語言單元是(1)單詞,比如“狗”或“政府”,或(2)詞的組合,比如“停車場”或“總理”;或(3)專有名稱;或(4)本發(fā)明獨(dú)有的釋義的詞;或(5)具有多重意義的詞的一種形式。在后面的情況中,詞的每種釋義表示一種不同的語言單元,不同的釋義可以表示為不同形式類中詞條。為了自動(dòng)化的目標(biāo),每個(gè)釋義是有區(qū)別的,例如用出現(xiàn)在詞的未尾處的句點(diǎn)的數(shù)目(來區(qū)別)。對(duì)于第一(人為設(shè)計(jì)的)釋義的詞條不帶句點(diǎn)被列表,表示第二釋義的詞條被列表時(shí)在其未尾處帶一個(gè)句點(diǎn),如此等等。換句話說,不同的詞意能夠數(shù)字地被識(shí)別,例如,用下標(biāo)。
發(fā)明所獨(dú)有的詞可能組成總詞典的很小的一部分,并且這些詞中沒有一個(gè)是對(duì)于發(fā)明特殊的或與它所依據(jù)的天然語言相異的。而發(fā)明中特有的詞是在含義上被擴(kuò)展了,以限制在詞典中名詞的總數(shù)。例如,在推薦的增補(bǔ)中,詞“利用”被擴(kuò)展含有為達(dá)到主要的預(yù)定的目的而使用某件物品的含義,因此在句子“杰克利用書”中該詞含有讀的意思。詞“在…上”可以被用來包含時(shí)間的意義(例如(我玩球)在昨天)。但是,如果希望使用方便,發(fā)明的專有詞能夠被統(tǒng)統(tǒng)去掉因而詞典被擴(kuò)大了。
本發(fā)明將所提供的詞匯的整個(gè)詞典分為四類“事件”或名詞性詞其意指例如,人,地點(diǎn),物品,活動(dòng)或思想,在這里用碼T來識(shí)別;“連接詞”接定兩個(gè)(或多個(gè))名詞性詞之間的關(guān)系(包括具體被稱作前置詞和連詞的詞,以及用行動(dòng)、存在、或存在的狀態(tài)來表示的描述關(guān)系的詞匯),在這里用C標(biāo)識(shí);“描述詞”修飾一個(gè)或多個(gè)名詞性詞的狀態(tài)(包括具體被稱作形容詞,副詞和不及物動(dòng)詞的詞),此處用D標(biāo)識(shí);建立名詞性詞組的“邏輯連接詞”此處用C標(biāo)識(shí)。名詞性詞,連接詞和描述詞的推薦表分別陳列在后面附錄1-3中。推薦的邏輯連接詞是“和”和“或”。
自然,詞典不能和沒有包含可能的專有名稱的表;代之以,專有名稱,像其它發(fā)明識(shí)別不了的詞一樣,被退回到角括號(hào)(angleGracket)內(nèi)以表示翻譯不進(jìn)行。系統(tǒng)也不識(shí)別動(dòng)詞時(shí)態(tài);在現(xiàn)在時(shí)態(tài)中連接詞被表示為短語,因?yàn)闀r(shí)態(tài)易于從上下內(nèi)容理解。但是,時(shí)態(tài)仍然可以通過指明時(shí)間、日和/或日期來表示。
按照本發(fā)明的句子是由詞典中的詞匯根據(jù)四項(xiàng)擴(kuò)展規(guī)則來構(gòu)成的。最基本的句子產(chǎn)生自下列的三種結(jié)構(gòu)之一(這些結(jié)構(gòu)的任一種能夠從T詞匯按照隨后要陳述的擴(kuò)展規(guī)則產(chǎn)生)。這些結(jié)構(gòu),其表示為攜帶信息所考慮的最小的可能的詞組,是更復(fù)雜語句的組件。其結(jié)構(gòu)的簡單性便于立即翻譯為會(huì)話,自然語句;因此即使是按照本發(fā)明的復(fù)雜句子,通過對(duì)更基本的句子成份的組件分析易于轉(zhuǎn)換成自然語言的等價(jià)物(利用后面描述的最佳表達(dá)式來簡化過程)。
基本結(jié)構(gòu)1(BS1)通過在名詞性詞后放置一個(gè)描述詞形成結(jié)構(gòu)TD而被形成。BS1語句例如“狗棕色”和“帳單游泳”易于翻譯為英語句子“狗是棕色的”(或短語“棕色的狗”)和“游泳的帳單”。
BS2通過在兩個(gè)名詞性詞之間放置一個(gè)連接詞形成TCT結(jié)構(gòu)而被形成。BS2語句例如“狗吃食物”易于翻譯成英語等價(jià)物。
BS3是通過在兩個(gè)名詞性詞之間放置一個(gè)邏輯連接詞構(gòu)成一個(gè)用TCT…表示的系列而被形成,該系列能夠是一個(gè)簡單的連接,例如“Bob和Ted或者是復(fù)合結(jié)構(gòu)例如”Bob和Ted和A1和Jill或“紅或蘭或綠”。
包括一個(gè)或多個(gè)在上面陳列的基本結(jié)構(gòu)的句子可以利用下列的規(guī)則作擴(kuò)展。
規(guī)則Ⅰ對(duì)一個(gè)名詞性詞,加一個(gè)描述詞(T→TD)按照規(guī)則1,任何來自名詞類的語言單元能夠被擴(kuò)展進(jìn)入由一個(gè)表自描述詞類的新條目跟隨的初始條目中,該新條目修飾初始條目,例如,“狗”變成“狗大的”。像本發(fā)明的所有規(guī)則一樣,規(guī)則1沒有將其應(yīng)用限制于一個(gè)弧立的名詞性詞(雖然這就是BS1句子如何被形成的);代之以,它能被應(yīng)用于任意的名詞性詞而不管在其較大語句中的位置。因此,按照規(guī)則1,TD1→(TD2)D1,例如,“狗大的”變成“(狗棕色)大的”(對(duì)應(yīng)于英語句子,“棕色的狗是大的”)。
在連續(xù)形容的情況中加的秩序可能是或可能不是重要的,由于這些形容詞是獨(dú)立地修飾T;例如,在“(狗大的)綜色”中,形容詞“大的”區(qū)別這條狗與其它的狗,而綜色可能描述被認(rèn)為是聽者不了解的別的方面的特點(diǎn)。在D詞為一個(gè)不及物動(dòng)詞的場會(huì),加的秩序幾乎總是重要的。例如,按照規(guī)則1,通過加描述詞“快”擴(kuò)展TD句子“狗跑”(對(duì)應(yīng)于“狗跑著”或“跑著的狗”),構(gòu)成“(狗快)跑”(對(duì)應(yīng)于“快速的狗跑著”)。為了表述“狗跑得快”,必須用描述詞“跑”以“(狗跑)快”的形式擴(kuò)展TD句“狗快”。
將規(guī)則1應(yīng)用到結(jié)構(gòu)BS2產(chǎn)生TCT→(TD)CT。例如,“狗吃食物”變成“(狗大)吃食物”。規(guī)則1也能應(yīng)用于TCT型組合的名詞性詞,因此BS3型的結(jié)構(gòu)變成TCT→(TCT)D。例如,“母親和父親”變成“(母親和父親)開車”。在此方式中,多重的名詞性詞能夠被合并,為著修飾的目的,或者連續(xù)地或者交替地。還應(yīng)該指出,具有及物意義的動(dòng)詞,例如開車,被作為連接詞以及描述詞包括入數(shù)據(jù)庫中。另一個(gè)例子是動(dòng)詞“傾覆”,該詞能是不及物的(“船傾覆”)以及及物的(“船長傾覆船”)。
規(guī)則Ⅱa對(duì)于名詞性詞,加一個(gè)連接詞和另一個(gè)名詞性詞(T→TCT)。
按照規(guī)則Ⅱa,任何來自名詞類的語言單元能夠用一個(gè)被兩個(gè)名詞性詞條包圍的連接詞來代替,其中一個(gè)名詞性詞條是初始的語言單元。例如,“房屋”變成“山丘上的房屋”。將擴(kuò)展規(guī)則Ⅱa應(yīng)用到BS1產(chǎn)生TD→(TCT)D;例如,“黑暗的房屋”變成“(山丘上的房屋)黑暗的”或“山丘上的房屋是黑暗的”。
規(guī)則Ⅱa能夠被用來加一個(gè)及物動(dòng)詞和它的賓語。例如,組合詞“母親和父親”能被擴(kuò)展為“(母親和父親)駕駛小汽車”。
規(guī)則Ⅱb對(duì)一個(gè)名詞性詞,加一個(gè)邏輯連接詞和另一個(gè)名詞性詞(T→TCT)。
按照規(guī)則Ⅱb,任何來自名詞類的語言單元能夠用一個(gè)被兩個(gè)名詞性詞,其中一個(gè)是初始語言單元,包圍著的連接詞來代替。例如“狗”變成“狗和貓”。
再者,為了規(guī)則Ⅱa和規(guī)則Ⅱb的目的,名詞性詞能是一個(gè)包括兩個(gè)或多個(gè)名詞性詞通過一個(gè)連接詞連接的組合。例如,擴(kuò)展“(約翰和比爾)去市場”滿足規(guī)則Ⅱa,接下來應(yīng)用規(guī)則Ⅰ,這個(gè)句子能被進(jìn)一步擴(kuò)展為“((約翰和比爾)去市場)一起”。
規(guī)則Ⅲ 對(duì)一個(gè)描述詞,加一個(gè)邏輯連接詞和另一個(gè)描述詞(D→DCD)。
按照規(guī)則Ⅲ ,一個(gè)描述詞能夠用一個(gè)由兩個(gè)描述詞,其中一個(gè)是初始的,包圍著的邏輯連接詞所替換。例如“大的”變成“大的和棕色的”。應(yīng)用規(guī)則3到BS1產(chǎn)生TD→T(DCD)。例如“狗大的”(等同于“狗是大的”,或“大的狗”)變成“狗(大的和棕色的)”(等同于“狗是大的和棕色的”或“大的和棕色的狗”)。
應(yīng)用這些規(guī)則去形成按照本發(fā)明可接受的句子的方法顯示在圖1中。由一個(gè)名詞性詞例如貓,出現(xiàn)在110處,開始,通過遵循擴(kuò)散規(guī)則Ⅰ,Ⅱa和Ⅱb能夠形成三個(gè)基本結(jié)構(gòu)中的任何一個(gè),正如在112、114、116處所顯示的,分別產(chǎn)生“貓有條紋的”(BS1),“在長沙發(fā)上的貓”(BS2)或“貓和仆人”(BS3)。在118和119處重復(fù)應(yīng)用擴(kuò)展規(guī)則Ⅱa產(chǎn)生TC1T1→(T1C1T1)C2T2型或“((貓?jiān)谏嘲l(fā)上)吃老鼠)”以及(TC1T1)C2T2→((TC1T1)C2T2)C3T2型或“(((貓?jiān)陂L沙發(fā)上)吃老鼠)帶尾巴)”。擴(kuò)展規(guī)則Ⅰ能夠在任意點(diǎn)上應(yīng)用于T語言單元,如像在122處所顯示的(修飾初始T,貓,產(chǎn)生“(快樂的貓?jiān)陂L沙發(fā)上”)和在124處(修飾“吃老鼠”)。規(guī)則Ⅲ也能被應(yīng)用,如在126處顯示的(進(jìn)一步修飾貓產(chǎn)生“(((快樂和帶條紋的貓)在長沙發(fā)上)”)和在128處顯示的(進(jìn)一步修飾“吃老鼠”)。
擴(kuò)展規(guī)則Ⅰ能夠被反復(fù)地應(yīng)用如在112、130處所顯示的以進(jìn)一步修飾初始T(雖然,正如在130處所強(qiáng)調(diào)的,描述詞不一定是形容詞)。擴(kuò)展規(guī)則Ⅱa適合于表現(xiàn)修飾過的T的行為(如在132處所顯示的),并且規(guī)則Ⅰ能夠被用于修飾新引入的T(如在134處顯示的)。規(guī)則Ⅰ還能被用于修飾一個(gè)由規(guī)則Ⅱb形成的復(fù)合的主語,(在本發(fā)明的廣義上講),如在136所顯示的。
語言單元被組合時(shí)的順序能夠強(qiáng)烈地影響含義。例如擴(kuò)展TC1T1→(TC1T1)C2T2能夠取多種形式。結(jié)構(gòu)“貓發(fā)現(xiàn)(球在長沙發(fā)上)”傳遞的意思不同于“貓發(fā)現(xiàn)球(在長發(fā)上)”。在前句中球明確地在長沙發(fā)上,而在后一句中行為發(fā)生在長沙發(fā)上。句子“(約翰想要小汽車)快些”表示行為應(yīng)該快些完成,而“約翰想要(小汽車快些)”意思是小汽車應(yīng)開快些。
前面所說的擴(kuò)展規(guī)則的更多的精心結(jié)構(gòu)的例子出現(xiàn)在附錄4中,它們說明本發(fā)明在表示自然語言論述中的實(shí)用性。
本發(fā)明的有代表性的硬件裝置示于圖2中。正如圖中所表示的,系統(tǒng)包括一個(gè)主雙向總線200,所有系統(tǒng)的部件通過總線通信。實(shí)現(xiàn)發(fā)明的主系列指令以及下面討論的數(shù)據(jù)庫保存大容量的存儲(chǔ)器件202(比如硬盤或光存儲(chǔ)單元)上以及在工作期間保存在主系統(tǒng)的存儲(chǔ)器204中。這些指令的執(zhí)行和本發(fā)明功能的實(shí)現(xiàn)是通過中央處理器(CPU)206完成的。
用戶通過鍵盤210和位置敏感器件(例如鼠標(biāo))212與系統(tǒng)聯(lián)系。兩者中任一器件的輸出都能用來指示信息或選擇顯示屏214的特定區(qū)域以控制要由系統(tǒng)完成的功能。
主存儲(chǔ)器204包含一組模塊,其控制CPU206的工作以及它的其它硬件組件的相互關(guān)系。操作系統(tǒng)220控制低級(jí)的、基本的系統(tǒng)功能的執(zhí)行比如存儲(chǔ)器分配,文件管理和大容量存儲(chǔ)器件20的操作。實(shí)現(xiàn)一系列存儲(chǔ)指令分析模塊225在較高的水平上控制由本發(fā)明實(shí)現(xiàn)的主要功能的執(zhí)行,就像在下面討論的那樣;以及定義用戶接口230的指令允許在顯示屏214上直接的人-機(jī)對(duì)話。用戶接口230在顯示屏214上生成字詞和圖形畫面,提示用戶操作,并接受來自鍵盤210和/或位置敏感器件212的用戶命令。
主存儲(chǔ)器204還包括一個(gè)限定一系列有能力存儲(chǔ)本發(fā)明的語言單元的數(shù)據(jù)庫的部分,象征性地用參考數(shù)字2351,2352,2352,2354表示。這些數(shù)據(jù)庫235可能是在實(shí)際上有差別的(也即在存儲(chǔ)器件202上在不同的存儲(chǔ)區(qū)和作為分別的文件存儲(chǔ))或者是在邏輯上有差別的(即以一個(gè)結(jié)構(gòu)表的形式存儲(chǔ)在單一的存儲(chǔ)區(qū),該表可以像多元數(shù)據(jù)庫那樣被編址),每個(gè)數(shù)據(jù)庫包含至少在兩種語言中的相應(yīng)于一個(gè)特定類的全部語言單元。換言之,每個(gè)數(shù)據(jù)庫被組織成一個(gè)表,表的每一列列出在單一語言中一特殊類的所有語言單元,因此每一行包含了在系統(tǒng)有能力翻譯的各種語言中表示的同一語言單元。在所說明的實(shí)施中,名詞性詞被包含在數(shù)據(jù)庫2351中,并且這個(gè)數(shù)據(jù)庫在單種語言(英語)中的內(nèi)容的代表性例子-即在這個(gè)將會(huì)是多列工作數(shù)據(jù)庫中的一列的內(nèi)容列出在附錄1中;連接詞被包含在數(shù)據(jù)庫2352中,它的作為例子的一列展示在附錄2中;描述詞包含在數(shù)據(jù)庫2353中,它的作為例子的一列展示在附錄3中;而邏輯連接詞(最簡單地為,“和”和“或”)包含在數(shù)據(jù)庫2354中。
輸入緩沖器240經(jīng)由鍵盤從用戶那里接收一個(gè)輸入句子,此句子最好是按照本發(fā)明構(gòu)造并按下面的說明格式化。在此情況下,分析模塊225初步地檢查該輸入句有關(guān)結(jié)構(gòu)性能,接下去,模塊225以重復(fù)的方式處理該輸入句的語言單元,尋址數(shù)據(jù)庫以找出在給定語言中對(duì)應(yīng)于每個(gè)語言單元的詞條,以及在目標(biāo)語言中對(duì)應(yīng)的詞條。分析模塊225通過利用來自目標(biāo)語言的詞條代替輸入的詞條翻譯該句。譯文輸入到一個(gè)輸出緩沖器245內(nèi),該緩沖器的內(nèi)容在顯示屏214上顯示。
必須了解到雖然主存儲(chǔ)器204的模塊已被分別地說明過,這僅僅為著表達(dá)清楚起見;只要系統(tǒng)完成所有必需的功能,它們?cè)谙到y(tǒng)內(nèi)如何分布以及編程的結(jié)構(gòu)都不是重要的。
為了簡化由模塊225進(jìn)行的方便的分析,輸入句最好用特征的,易于處理的格式構(gòu)造,此格式既便于單個(gè)語言單元的直接的識(shí)別,也便于簡單地確認(rèn)單元系列具有符合本發(fā)明的擴(kuò)展原則的語言句的資格。在一種逼近中(“照片形式”),一個(gè)句子的每個(gè)語言單元出現(xiàn)于一個(gè)分別的行中。如果已經(jīng)做了擴(kuò)展,用一個(gè)星號(hào)(*)來標(biāo)志該處發(fā)生過擴(kuò)展;也即是*被用來將基本的語言結(jié)構(gòu)連接在一起以形成一個(gè)較大的句子。例如,從圖1中的詞條抽取。
貓 帶條紋的*發(fā)現(xiàn)*球 紅色表示132步和134步的結(jié)果。
另一方面,句子能夠被表示為代數(shù)的(“風(fēng)景”)格式其中擴(kuò)展是通過將擴(kuò)展詞括在括號(hào)中來識(shí)別(貓 帶條紋的)發(fā)現(xiàn)(球 紅色)
在任一情況中,用戶的輸入彼處理成字符串,并用標(biāo)準(zhǔn)的串-分析程序,模塊225識(shí)別分別的語言單元和擴(kuò)展點(diǎn)。然后將這些與對(duì)應(yīng)于允許的擴(kuò)展規(guī)則的樣板相比較以確認(rèn)句子,接下去進(jìn)行數(shù)據(jù)庫查找和翻譯。如果句子不能符合發(fā)明的規(guī)則,模塊225通過顯示屏214提醒用戶。
按照這些表示格式的任一種,在英語中的復(fù)數(shù)則通過在單數(shù)名詞的末尾加“/S”來標(biāo)注(例如“nation/s”)。在其它語言中,形成復(fù)數(shù)的最通用的方法被使用;例如,在法語中,和在英語中一樣加“/S”;但在意大利語中加“/i”,數(shù)字被數(shù)字地表示。
另一方面,分析模塊225能夠被配置成可處理非格式化的輸入語句。為實(shí)現(xiàn)這一點(diǎn),模塊225在數(shù)據(jù)庫235中查找每個(gè)輸入詞(或者,如果適當(dāng)?shù)脑?,詞組)并且建立一個(gè)用組成句子的語言類表示的句子的表達(dá)式-也即用每個(gè)單元的語言的類符號(hào)代替該單元。然后模塊225評(píng)定產(chǎn)生的類語句能否按照所允許的擴(kuò)展規(guī)則被生成,并且如果能,將語言單元分組以便于查找和翻譯。提供的輸出或者以對(duì)應(yīng)于輸入的非結(jié)構(gòu)性格式或者以上面陳述的格式中的一種的方式給出。推薦后一種方式,因?yàn)樵谝环N語言中的詞串很難與完全通過替代而產(chǎn)生的另一語言中的詞串在意義上相對(duì)應(yīng);一般地以隔離語言單元和突出擴(kuò)展的方式表示的輸出較易理解。
本發(fā)明可以加進(jìn)附加的特點(diǎn)以簡化操作。例如,如上面所指出的,具有多重意義的詞通過尾隨的句點(diǎn)來區(qū)分;自然,按照該詞的一個(gè)具體的含義的句點(diǎn)的數(shù)目代表一種任意的選擇。因此,一個(gè)附加的數(shù)據(jù)庫能夠包括一個(gè)名義詞的字典,詞的每個(gè)含義的發(fā)明認(rèn)可的格式置于各個(gè)定義的旁邊。當(dāng)用戶選擇定義中的某一個(gè)時(shí)用戶接口230判讀用戶在其上的點(diǎn)擊,并將該詞的適當(dāng)?shù)木幋a輸入進(jìn)輸入緩沖器240。
類似地,因?yàn)榻?jīng)濟(jì)和操作速度的考慮限制了數(shù)據(jù)庫的總的期望的大小,數(shù)據(jù)庫235之一能夠被設(shè)置成一個(gè)近義詞詞典,對(duì)于一個(gè)不識(shí)別的輸入詞它給出最接近的本發(fā)明識(shí)別的語言單元,在操作中,當(dāng)緊隨由分析模塊225為在數(shù)據(jù)庫中定位一個(gè)詞作的不成功的努力之后,模塊225能夠被編程以查閱近義詞詞典數(shù)據(jù)庫235并返回一個(gè)詞的清單,事實(shí)上,這些詞確定出現(xiàn)在語言單元數(shù)據(jù)庫中。
模塊225還能包括某些應(yīng)用即識(shí)別和修正(例如,由用戶認(rèn)可之后)在句子結(jié)構(gòu)上常常作出的錯(cuò)誤。例如,本發(fā)明通常用動(dòng)詞“有”表示一個(gè)指名的人的所有權(quán),因此句子“Paul’s計(jì)算機(jī)是快速的”被表示為(用代數(shù)格式表示)“Paul有(計(jì)算機(jī)快速的)”或“(計(jì)算機(jī)Paul的)快速的”;如果人是非指名的,可以用普通的物主代詞(例如“(計(jì)算機(jī)我的)快速的”)。因此,模塊225能夠被配置成能識(shí)別諸如“Paul’s”的結(jié)構(gòu)且返回符合本發(fā)明的適當(dāng)?shù)慕Y(jié)構(gòu)。
所以,應(yīng)該看出前面所述表示了一種對(duì)于多種語言之間翻譯的簡便的和快速的方法。文中采用的術(shù)語和表達(dá)式是作為說明的術(shù)語而不作限制來使用的,并且,在應(yīng)用此類術(shù)語和表達(dá)式時(shí),不存在排斥任何與所顯示和說明的特征或它的部分內(nèi)容相等同的東西的傾向。但是它承認(rèn)在本發(fā)明的權(quán)利要求的領(lǐng)域之內(nèi)各種不同的改進(jìn)是可能的。例如,本發(fā)明的各種模塊能夠利用適當(dāng)?shù)能浖绦?,或者作為硬件電路,或者作為混合的硬?軟件組合在通用計(jì)算機(jī)上被完成。
附錄1附錄1名詞性詞男演員地址廣告建議非洲下午年齡目的空氣飛機(jī)機(jī)場阿爾及利亞高度鋁大使總量動(dòng)物足踝回答蟻房間欲望蘋果任命杏四月建筑師阿根廷爭論手臂軍隊(duì)到達(dá)藝術(shù)藝術(shù)家亞洲雅典人八月嬸母澳大利亞澳地利作者權(quán)力崩落附錄1第二頁寶貝背背包包面包師陽臺(tái)球香蕉繃帶銀行大麥谷倉桶籃子洗澡浴衣澡盆電池海灘豆熊胡須床臥室蜜蜂牛肉啤酒甜菜開始行為比利時(shí)鐘帶利益斜料自行車帳單臺(tái)球鳥出生生日氣泡毛毯血短外套船身體附錄1第三頁玻利維亞炸彈骨書邊瓶底部碗箱男孩手鐲腦剎車黃銅巴西面包早餐呼吸磚橋掃帚兄弟刷子建筑物保加利亞子彈公共汽車屠夫黃油蝴蝶鈕扣卷心菜船艙咖啡蛋糕駱駝?wù)障駲C(jī)營加拿大運(yùn)河蠟燭手杖首都首領(lǐng)小汽車卡片紙板貨物附錄1第4頁木匠地毯胡蘿卜現(xiàn)金貓牛菜花地窖墓地鏈椅子臉頰乳酪化學(xué)櫻桃國際象棋胸膛小雞孩子智利下頦中國巧克力圣誕節(jié)教堂雪茄香煙園公民鐘衣服云丁香俱樂部煤外套蟑螂可可咖啡衣領(lǐng)哥倫比亞彩色梳子舒適比賽計(jì)算機(jī)音樂會(huì)附錄1第5頁條件連接會(huì)話烹調(diào)銅復(fù)制件開塞鉆谷物價(jià)值棉花長沙發(fā)國家勇氣堂兄弟母牛粉碎機(jī)鶴奶油木籠罪行古巴黃瓜杯子簾捷克斯洛伐克損壞跳舞危險(xiǎn)日期女兒天死亡債務(wù)十二月決定度丹麥牙醫(yī)出發(fā)沙漠甜點(diǎn)心腹瀉字典消化餐廳午餐方向附錄1第6頁疾病盤距離文件狗驢門拉夢(mèng)衣服司機(jī)鼓鴨灰塵鷹耳賺地震厄瓜多爾教育鱔魚蛋埃及肘電學(xué)電梯端敵人能量發(fā)動(dòng)機(jī)工程師英格蘭入口信封埃塞俄比亞歐洲原諒展覽出口費(fèi)用輸出眼臉工廠下落家庭農(nóng)場附錄1第7頁父親二月渡口圖手指指甲芬蘭火魚拳頭跳蚤洪水地板粉化槽飛食物腳足球森林叉狐貍法國星期五朋友蛙前部水果葬禮游戲花園大蒜汽油量規(guī)德國禮物女孩玻璃眼鏡手套膠山羊上帝金鵝政府附錄1第8頁葡萄葡萄柚草希臘組警衛(wèi)客人指導(dǎo)槍體育冰雹頭發(fā)理發(fā)師半錘子手手帕港口收獲(帶邊的)帽子他頭健康心臟后跟這里高速路洞孔假日荷蘭蜜蜂馬賽馬醫(yī)院旅館小時(shí)房屋饑餓丈夫我冰冰激凌冰島思想輸入印度印度尼西亞附錄1第9頁通知墨水昆蟲保險(xiǎn)翻譯員發(fā)明伊朗伊拉克愛爾蘭鐵島以色列它意大利一月日本寶石職業(yè)笑話約旦果汁七月六月肯尼亞鑰匙腎種類國王廚房膝小刀科威特帶子梯子湖泊羔羊語言律師領(lǐng)導(dǎo)葉子皮黎巴嫩腿檸檬信利比里亞圖書館附錄1第10頁利比亞許可證生命光燈泡閃電石灰亞麻布獅嘴唇液體肝起居室龍蝦鎖看織機(jī)愛運(yùn)氣行李午餐肺機(jī)器雜志魔術(shù)處女郵件馬來西亞馬耳他男人地圖進(jìn)行市場婚姻火柴墊子五月肉醫(yī)學(xué)會(huì)議公成員紀(jì)念物金屬墨西哥中部牛奶附錄1第11頁分鐘錯(cuò)誤星期一錢猴子月月亮早晨摩洛哥蚊母親山鼠口電影磨菇芥末釘子指甲銼姓名自然頸項(xiàng)練針鄰居尼泊爾荷蘭新西蘭報(bào)紙尼加拉瓜尼日利亞夜晚笨蛋中午北美洲北極挪威鼻十一月數(shù)目護(hù)士螺帽橡樹槳燕麥?zhǔn)罗k公室附錄1第12頁油橄欖蔥頭橙礦石牛包疼痛繪畫一對(duì)巴基斯坦薄烤餅恐慌褲子紙降落傘雙親停車部分鷓鴣?zhàn)o(hù)照豌豆和平梨農(nóng)民筆鉛筆人民胡椒波斯秘魯藥劑學(xué)菲律賓醫(yī)生鋼琴畫豬鴿子枕頭飛行員針?biāo)蓸涔苤参锲脚_(tái)玩玩牌附錄1第13頁快樂梅袋毒藥波蘭警官搬運(yùn)工葡萄牙郵局明信片壹土豆粉末監(jiān)獄問題性質(zhì)錢包四分之一王后問題兔無線電破布雨雨衣鼠剃刀接收電唱機(jī)冰箱宗教裂縫餐館結(jié)果稻米環(huán)危險(xiǎn)江河火箭滾動(dòng)屋頂房間根繩索橡皮羅馬尼亞俄羅斯附錄1第14頁銹馬鞍悲哀安全安全帶水手鹽沙子星斯六醬油沙特阿拉伯香腸尺度圍巾學(xué)校科學(xué)剪刀蘇格蘭螺釘海洋自己九月形狀她羊襯衫鞋肩邊簽名絲銀姊妹位置尺寸皮膚skis天空雪橇嗅覺煙蛇雪肥皂短襪蘇打士兵附錄1第15頁解決兒子歌聲音湯南非南美洲南極蘇聯(lián)空間西班牙香料匙春天樓梯印章星淀粉站大塊肉片鋼枝條證券市場胃石頭貯存暴風(fēng)雨故事火爐街道學(xué)生地下鐵道糖夏天太陽星期日驚奇沼澤瑞典瑞士敘利亞桌尾巴裁縫味覺稅荼附錄1第16頁教師電話電視帳篷試驗(yàn)泰國劇場他們小偷大腿事物渴線咽喉拇指雷聲星期四票帶子虎時(shí)間時(shí)間表錫疲勞烤面包煙草今天腳趾化妝西紅柿明天舌工具牙齒牙刷頂部毛巾城鎮(zhèn)玩具訓(xùn)練樹旅行麻煩真理星期二突尼斯火雞附錄1第17頁電視節(jié)目打字機(jī)雨傘叔叔聯(lián)邦烏拉圭我們預(yù)防注射蔬菜天鵝絨委內(nèi)瑞拉犧牲者觀察鄉(xiāng)村醋小提琴聲音待者墻戰(zhàn)爭浪費(fèi)手表水我天氣婚禮星期三星期重量小麥那里誰妻子風(fēng)窗冬季婦女木材羊毛詞工作年昨天你南斯拉夫附錄2第1頁能夠大約在…上橫過害怕在…后反對(duì)允許回答阻止到達(dá)問在…上烘烤是因?yàn)樽兂稍凇伴_始在…后面相信賭背叛在…中間譴責(zé)打擾打破拿來燃燒但是買叫被叫傾覆捕獲搬運(yùn)捉住原因改變爬高關(guān)閉烹調(diào)計(jì)算附錄2第2頁切割涉及減少打破釋放討論向下飲驅(qū)趕落下吃檢查說明發(fā)現(xiàn)結(jié)束固定為了對(duì)于忘記從…時(shí)來自油炸給進(jìn)入穿過走向懸掛恨有聽幫助打打獵如果在…里在…前面為了…目的包括增加殺死親吻知道學(xué)習(xí)離開喜歡住進(jìn)尋找附圖2第3頁用…制成做遇見多于移動(dòng)靠近需要占據(jù)屬于…的在…上方外面支付玩準(zhǔn)備印允許證明拉推放置讀減少拒絕記住重復(fù)騎烤說看賣送縫刮射將要唱微笑講偷刺停止學(xué)習(xí)取教扔至附錄2第4頁觸翻譯試關(guān)開在…下理解直到利用估價(jià)訪問想要洗滌當(dāng)…時(shí)贏和…一起為…工作寫附錄3第1頁附錄3描述詞國外缺席的再同意活的所有的幾乎單獨(dú)也總是憤怒的另一任何爭論人造的自動(dòng)的有用的向后的壞的害羞的美麗的開始黑的盲的金黃色的蘭色的沸騰的鉆孔的生來的勇敢的破的褐色的燃燒顛覆仔細(xì)小心的改變便宜的清潔的清澈的冷的控訴繼續(xù)正確的附錄3第2頁咳嗽瘋狂的呼喊好奇的潮濕的危險(xiǎn)的黑暗的死的聾的減少深的不完美的不同的困難的臟的下降溺死干的早的東方的容易的空的足夠的貴重的終止極端的遠(yuǎn)的快的肥胖的少數(shù)的第一平的飛行的禁止的外國的易碎的自由的新鮮的有趣的奇特的高興的好的告別綠色的灰的生長的犯罪的附錄3第3頁掛發(fā)生快樂的硬的健康的重的饑餓的違法的重要的增加聰明的有趣的妒忌吻大小最后的遲的笑懶的左邊的法律的長的惡劣的可能平均的更多的很多的無言的彼此的我的神經(jīng)的中性的決不新的其次的好的北方的不現(xiàn)在常常同意老的開我們的許可的粉紅色的玩附錄3第4頁清貧窮的便攜的可能的先前的安靜的紅色的休息富的正確的熟練的圓周運(yùn)行不愉快的安全的短的有病的類似的就座睡慢的慢慢地小的微笑柔軟的一些有時(shí)酸的南方的特殊的站立強(qiáng)壯的甜蜜的游泳談話告訴感謝在那里厚的薄的思考疲倦的一起太多透明的旅行丑陋的附錄3第5頁上樓焦急等待走溫暖的弱小西邊的濕的白色的為什么焦急的錯(cuò)誤的黃色的年青的你的附錄4第1頁附錄4扎伊爾的衛(wèi)生官員說到目前已有97人死于Ebola病毒。吉恩-特木芬(Jean Tamfun),曾在1976年幫助鑒別該病毒的病毒學(xué)家,批評(píng)政府的隔離區(qū)和路障是無效的,星期六位于Kikwith區(qū)的隔離區(qū)正式地被撤消。
衛(wèi)生官員/扎伊爾的*說*人97*死亡*因?yàn)?名叫ebola的病毒吉恩-特木芬是*在扎伊爾的病毒學(xué)家他幫助*科學(xué)地鑒別*名叫ebola的病毒*在1976年吉恩特木芬批評(píng)*扎伊爾的政府他說*隔離區(qū)**和*路障無效的政府結(jié)束*隔離區(qū)在*名叫kikwith的區(qū)域*在星期六
權(quán)利要求
1.一個(gè)將信息從初始語言翻譯為第二語言的方法,方法包括a.提供用參考和目標(biāo)語言表示的名詞性詞、連接詞、描述詞和邏輯連接詞的數(shù)據(jù)庫的參考和目標(biāo)組,每個(gè)名詞性詞數(shù)據(jù)庫包括一系列的名詞詞條,每個(gè)連接詞數(shù)據(jù)庫包括一系列的連接詞詞條,每個(gè)詞條指明至少兩個(gè)名詞性的詞之間的關(guān)系,每個(gè)描述詞數(shù)據(jù)庫包括一系列的描述名詞性詞的描述詞詞條,而每個(gè)邏輯連接詞數(shù)據(jù)庫包括一系列建立組的詞條,數(shù)據(jù)庫的參考組的詞條與數(shù)據(jù)庫的目標(biāo)組的詞條相對(duì)應(yīng);b.在參考語言中產(chǎn)生的句子包括許多來自數(shù)據(jù)庫參考組的詞條;c.利用參考詞條尋址數(shù)據(jù)庫的目標(biāo)組以檢索與其對(duì)應(yīng)的目標(biāo)詞條;以及d.通過用目標(biāo)詞條代替參考詞條翻譯句子。
2.權(quán)利要求1的方法,其中語句是通過從名詞性詞的數(shù)據(jù)庫選擇一個(gè)條目并應(yīng)用下列規(guī)則中的至少一條擴(kuò)展該語句而產(chǎn)生的。a.對(duì)一個(gè)名詞性詞條,加一個(gè)來自描述詞數(shù)據(jù)庫的描述詞詞條;b.對(duì)一個(gè)名詞性詞條,加一個(gè)來自連接詞數(shù)據(jù)庫的連接詞詞條和另一個(gè)來自名詞性詞數(shù)據(jù)庫的名詞性詞條;c.對(duì)一個(gè)名詞性詞條,加一個(gè)來自邏輯連接詞數(shù)據(jù)庫的邏輯連接詞和另一個(gè)來自名詞性詞數(shù)據(jù)庫的名詞性詞條;d.對(duì)一個(gè)描述詞詞條,加一個(gè)來自邏輯-連接詞數(shù)據(jù)庫的邏輯-連接詞和另外一個(gè)來自描述詞數(shù)據(jù)庫的描述詞詞條。
3.權(quán)利要求1的方法,其中名詞性詞條給人、地、物、動(dòng)作或思想命名。
4.權(quán)利要求3的方法,其中名詞性詞條包括在后面附錄1中列出的詞匯。
5.權(quán)利要求1的方法,其中連接詞詞條表示動(dòng)作、存在或存在的狀態(tài)。
6.權(quán)利要求5的方法,其中連接詞詞條包括在后面附錄2中列出的詞匯。
7.權(quán)利要求1的方法,其中描述詞詞條說明名詞性詞條的性質(zhì),數(shù)量,狀態(tài)或類型。
8.權(quán)利要求7的方法,其中描述詞詞條包括列在后面附錄3中的詞匯。
9.權(quán)利要求1的方法,其中邏輯-連接詞數(shù)據(jù)庫由詞條和、或組成。
10.用來將信息從第一語言翻譯為第二語言的裝置,該裝置包括a.第一數(shù)據(jù)庫裝置包括一系列的參考和至少一種目標(biāo)語言中的名詞性詞條;b.第二數(shù)據(jù)庫裝置包括一系列在參考語言和至少一種目標(biāo)語言中的連接詞詞條,該連接詞詞條的每條指定至少兩個(gè)名詞性詞條之間的關(guān)系。c.第三數(shù)據(jù)庫裝置包括一系列的在參考語言和至少一種目標(biāo)語言中的描述詞詞條,該描述詞詞條說明名詞性詞條;d.第四數(shù)據(jù)庫裝置,包括一系列建成組的詞條;e.用于接收參考語言的輸入的裝置,該輸入包括來自數(shù)據(jù)庫裝置的詞條;f.用來(ⅰ)根據(jù)輸入尋址數(shù)據(jù)庫的目標(biāo)組以檢索與其對(duì)應(yīng)的目標(biāo)詞條和(ⅱ)通過用目標(biāo)詞條代替輸入翻譯語句的分析裝置;
11.權(quán)利要求10的裝置,其中分析裝置被配置成能確保輸入符合按照下列擴(kuò)展規(guī)則構(gòu)造的語句a.對(duì)一個(gè)名詞性詞條,加一個(gè)來自第三數(shù)據(jù)庫裝置的描述詞詞條;b.對(duì)一個(gè)名詞性詞條,加一個(gè)來自第二數(shù)據(jù)庫裝置的連接詞詞條和另一個(gè)來自第一數(shù)據(jù)庫裝置的名詞性詞條;c.對(duì)一個(gè)名詞性詞條,加一個(gè)來自第四數(shù)據(jù)庫裝置的詞條和另一個(gè)來自第一數(shù)據(jù)庫的名詞性詞條;以及d.對(duì)一個(gè)描述詞詞條,加一個(gè)來自第四數(shù)據(jù)庫裝置的詞條和另一個(gè)來自第三數(shù)據(jù)庫裝置的描述詞詞條。
12.權(quán)利要求10的裝置,其中名詞性詞條為人、地、物、動(dòng)作或思想命名。
13.權(quán)利要求12的裝置,其中第一數(shù)據(jù)庫裝置包括在后面附錄1中列出的詞匯。
14.權(quán)利要求10的裝置,其中連接詞詞條表示行動(dòng)、存在或存在的狀態(tài)。
15.權(quán)利要求14的裝置,其中第二數(shù)據(jù)庫裝置包括在后面附錄2中列出的詞匯。
16.權(quán)利要求10的裝置,其中描述詞詞條說明名詞性詞條的性質(zhì)、數(shù)量、狀態(tài)或類型。
17.權(quán)利要求16的裝置,其中第三數(shù)據(jù)庫裝置包括在后面附錄3中列出的詞匯。
18.權(quán)利要求10的裝置,其中第四數(shù)據(jù)庫裝置由詞條和、或組成。
19.權(quán)利要求10的裝置進(jìn)一步包括用于識(shí)別的近義詞匯,對(duì)一個(gè)與數(shù)據(jù)庫詞條中任何一個(gè)都不匹配的輸入詞,識(shí)別一個(gè)在意義上最接近輸入詞的數(shù)據(jù)庫詞條。
20.權(quán)利要求10的裝置進(jìn)一步包括用于顯示譯文的裝置。
全文摘要
語言翻譯通過按照強(qiáng)制性的語法和構(gòu)造成允許一種語言中的語言單元直接替代另一種語言中的對(duì)應(yīng)的語言單元的詞匯表來表示天然語言句子而被完成。最好是,詞匯表被表示成一系列物理上和邏輯上有區(qū)別的數(shù)據(jù)庫,每個(gè)包含的詞條表示一種按語法定義的形式類。翻譯即是在參考語言的詞條和在一種和多種目標(biāo)語言的對(duì)應(yīng)詞條之間的直接的查尋。
文檔編號(hào)G06F17/28GK1237254SQ97199304
公開日1999年12月1日 申請(qǐng)日期1997年10月28日 優(yōu)先權(quán)日1996年10月31日
發(fā)明者S·克里斯蒂 申請(qǐng)人:沃德斯特里姆公司