亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

自動翻譯器及其方法和用于編寫該方法的記錄媒體的制作方法

文檔序號:6654829閱讀:255來源:國知局
專利名稱:自動翻譯器及其方法和用于編寫該方法的記錄媒體的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及自動翻譯器、由該自動翻譯器所使用的自動翻譯方法和用于編寫該自動翻譯方法的記錄媒體。
更具體地說,本發(fā)明使英語句子<=>中文句子的翻譯更正確、自然。
因為在將英語翻譯為中文或?qū)⒅形姆g為英語時,通過特定的算法將中文語言的獨特語法屬性考慮在內(nèi)了。本發(fā)明已通過本申請人于2003年3月開發(fā)的演示程序(應(yīng)用了特定的算法)得到了完全證實。
背景技術(shù)
總體上看,近年來通過各種方式開發(fā)了許多機器翻譯器,其將每種語言的詞典、語言的語法存儲在計算機存儲裝置中并編成程序,以便執(zhí)行將一種語言翻譯成另一種語言的指令。
舉例來說,過去在韓國注冊的一份專利,“Machine Translator utilizing Doorframeof which including Protector and Syntax Nod(注冊號10-0329109)”——這里讓我們稱之為MTD——具有下面的翻譯過程。
MTD的用戶將需要翻譯成目標(biāo)語言的原始句子輸入之后,MTD將原始的句子分析成詞素單位,然后確定單詞的詞性。
接下來,其搜索那些本身具有確定含義的單詞,例如習(xí)慣用語、復(fù)合名詞或復(fù)合詞,并將這些單詞重新分類,然后加上保護器標(biāo)記,以便在這一過程之后不再進行分析。
并且在原始句子具有重要詞類作用的單詞,例如動詞、連詞、關(guān)系詞、符號,也加上保護器標(biāo)記,以便在這一過程之后不再進行分析。現(xiàn)在,MTD對保護器之間的局部句子結(jié)構(gòu)進行分析,檢查其是否是名詞短語或介詞短語,如果是,則標(biāo)上適當(dāng)?shù)木渥咏Y(jié)構(gòu)標(biāo)記。
接下來,由局部句子結(jié)構(gòu)和保護器所組成的原始門框?qū)⒃奸T框數(shù)據(jù)庫與標(biāo)有保護器標(biāo)記的單詞(動詞、連詞、關(guān)系詞、符號等)相匹配,以便選擇相互對應(yīng)的翻譯門框。翻譯門框數(shù)據(jù)庫已具有與標(biāo)有保護器標(biāo)記的原始單詞有聯(lián)系的譯詞?,F(xiàn)在,將標(biāo)有適當(dāng)句子結(jié)構(gòu)標(biāo)記的名詞短語和介詞短語翻譯成目標(biāo)語言的字詞,這樣MTD就完成了原始句子的翻譯。
上述MTD機器翻譯器適合英語<=>韓語翻譯,并且在某些語法領(lǐng)域可以用于英語<=>中文翻譯,在這些領(lǐng)域,英語和中文語言具有相同的句法模式。但MTD有嚴重的問題。
這些問題的根源在于這樣的事實,即中文語法具有英語語法所沒有的某些特殊屬性。因此,MTD對于英語<=>中文翻譯無法產(chǎn)生有利的效果?,F(xiàn)在,讓我們來考慮一下中文語法的某些特殊屬性。
首先,離合詞(中文動詞的一種,中文語法中的雙音節(jié)或三音節(jié)動詞)是非常獨特的動詞。當(dāng)中文譯句中存在離合詞并且原始的英語句子是過去時態(tài)時,將離合詞分成兩部分,并且應(yīng)在兩者之間插入“了”字(該中文字表示句子是過去時態(tài))。同時,如果在原始的英語句子中存在頻率副詞作為句子的元素,則對應(yīng)的中文譯詞應(yīng)緊跟在“了”字后面。當(dāng)原始英語句子不是過去時態(tài)時,應(yīng)將英語頻率副詞對應(yīng)的中文譯詞插入離合詞的兩個分開的字詞之間,不需要加“了”字。
MTD機器翻譯器不能處理這種中文句法結(jié)構(gòu)。
第二,當(dāng)中文的句子具有程度補語作為句子的元素時,中文語言的語法具有特殊的屬性。當(dāng)中文譯句中存在程度補語時,應(yīng)在翻譯出的中文動詞與程度補語的中文譯詞之間插入“得”字(中文句子中用來表達動詞的程度的中文字)。
MTD機器翻譯器不能處理這種中文句法結(jié)構(gòu)。
第三,當(dāng)中文的句子具有結(jié)果補語作為句子的元素時,中文語言具有特殊的屬性。當(dāng)中文譯句中存在結(jié)果補語時,結(jié)果補語應(yīng)緊跟在翻譯出的中文動詞之后。
MTD機器翻譯器不能處理這種中文句法結(jié)構(gòu)。
第四,當(dāng)中文句子是被動語態(tài)結(jié)構(gòu)時,中文語言的語法具有特殊的屬性。當(dāng)將英語句子中的被動語態(tài)(句子結(jié)構(gòu)是“be+過去分詞”)翻譯為中文時,中文譯句也屬于被動語態(tài)結(jié)構(gòu)。但中文語言的被動語態(tài)句子結(jié)構(gòu)分成兩種模式。
一種模式是如果屬于被動語態(tài)結(jié)構(gòu)的中文動詞支配生物/事物的動作或?qū)ζ洚a(chǎn)生影響,則應(yīng)在該中文動詞的前面加上中文的“被”字(這個字在中文中表示句子是被動語態(tài))。另一種模式是如果屬于被動語態(tài)結(jié)構(gòu)的中文動詞不支配生物/事物的動作,也不對其產(chǎn)生影響,則不應(yīng)在該中文動詞的前面加上中文的“被”字。
MTD機器翻譯器不能處理這種中文句法結(jié)構(gòu)。
第五,當(dāng)原始的英語句子是形容詞短語句子時,中文語言的語法具有特殊的屬性。(英語的形式是“be+形容詞”。)原因是中文語言在中文形容詞短語句子的結(jié)構(gòu)中不使用英語單詞“be”(在中文語言中為“是”)的中文譯詞。當(dāng)將英語中的形容詞短語句子翻譯成中文時,精確的機器翻譯器應(yīng)刪除原始英語單詞“be”的中文譯詞,并且應(yīng)根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯句。
MTD機器翻譯器不能處理這種中文句法結(jié)構(gòu)。
如上所述,在英語<=>中文的機器翻譯中,應(yīng)考慮中文語法的五個特殊屬性。

發(fā)明內(nèi)容
本發(fā)明解決了過去和目前在英語<=>中文機器翻譯中所存在的中文語法的五個特殊屬性的問題。
為了獲得解決上述五個問題的解決方案,本申請人開發(fā)了本發(fā)明的自動翻譯器。
該自動翻譯器由下列各項所組成(1)詞庫(100)其具有4個對應(yīng)的詞典數(shù)據(jù)庫。每個數(shù)據(jù)庫均以字母順序排列,并且根據(jù)英語和中文語言的詞典編輯系統(tǒng)記錄了英語單詞和中文譯詞的全部信息。
(2)裝置(200)其將輸入的原始句子的單詞分析成詞素單位。
(3)裝置(300)其針對包含詞性的基本句子元素排列裝置(200)的結(jié)果,并且根據(jù)詞庫的詞典數(shù)據(jù)庫將原始的英語單詞翻譯成中文的字詞。
(4)裝置(400)——調(diào)節(jié)性翻譯模塊其檢查在(300)的結(jié)果中是否存在復(fù)合詞、習(xí)慣用語、俗語。如果存在,則該裝置將它們的基本句子元素調(diào)節(jié)成調(diào)節(jié)性句子元素,如果需要,轉(zhuǎn)換它們的詞性(在該過程中,創(chuàng)建新轉(zhuǎn)換的詞類)。并且該裝置根據(jù)第一、第二、第三詞典數(shù)據(jù)庫將原始的英語單詞翻譯為中文字詞。
(5)裝置(500)——特定翻譯模塊其檢查(300)的結(jié)果、(400)的結(jié)果,并通過特定句子元素的鏈接指針檢查所輸入的原始句子。如果兩者之間存在鏈接數(shù)據(jù),則特定句子元素的鏈接指針檢查單詞的數(shù)據(jù)是否標(biāo)有辨別因子。如果是,則特定句子元素的鏈接指針和辨別因子指示,單詞應(yīng)由5個(特殊)特定翻譯模塊之一來控制。該裝置(500)具有5個(特殊)特定翻譯模塊(501~505),由特定句子元素的鏈接指針和辨別因子共同激活。并且該裝置重新檢查每個特定翻譯模塊的結(jié)果并根據(jù)中文語言的詞序規(guī)則重新排列中文譯詞和詞序。
(6)裝置(600)——一般翻譯模塊其檢查(500)的結(jié)果,并根據(jù)中文語法的特殊翻譯狀況刪除最終中文譯句中不需要的中文譯詞,并插入最終中文譯句中需要的特殊中文字詞。其重新檢查第二次翻譯的中文字詞(其由特定翻譯模塊(500)再次轉(zhuǎn)換而來)是否與詞庫的詞序規(guī)則有聯(lián)系。如果是,該裝置根據(jù)中文語言的詞序規(guī)則重新構(gòu)造第二次翻譯的中文字詞的詞序。
(7)裝置(700)其輸出完整的中文譯句。
與裝置(500)(即特定翻譯模塊)鏈接的特定句子元素的鏈接指針與5個(特殊)特定翻譯模塊(501~505)相互配合。
第一特定翻譯模塊(501)通過特定句子元素的鏈接指針和辨別因子檢查原始英語句子翻譯出的中文動詞是否屬于離合詞——中文語法的一種動詞。如果其屬于離合詞,則該模塊通過特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否是過去時態(tài)。
如果檢查結(jié)果是過去時態(tài),則該模塊將“了”字插入翻譯出的中文動詞的兩個分開的字詞之間。同時,該模塊檢查原始的英語句子是否具有頻率副詞。如果具有,則該模塊將英語頻率副詞的中文譯詞緊跟在“了”字的后面。如果原始的英語句子不是過去時態(tài),則放置英語頻率副詞的中文譯詞即可,不需要加“了”字。
第二特定翻譯模塊(502)通過特定句子元素的鏈接指針和辨別因子檢查中文譯詞是否存在作為句子元素的程度補語。如果存在,則特定句子元素的鏈接指針和辨別因子檢查程度補語是否伴隨原始英語句子翻譯出的中文動詞。如果是,該模塊將中文字“得”緊跟在翻譯出的中文動詞后面。并且在“得”字的后面,該模塊緊接著插入程度補語的中文譯詞。
第三特定翻譯模塊(503)通過特定句子元素的鏈接指針和辨別因子來檢查中文譯詞中是否存在作為句子元素的結(jié)果補語。如果存在,則特定句子元素的鏈接指針和辨別因子檢查結(jié)果補語是否伴隨著原始英語句子翻譯出的中文動詞。如果是,該模塊在翻譯出的中文動詞后面緊接著插入結(jié)果補語的中文譯詞。
第四特定翻譯模塊(504)通過特定句子元素的鏈接指針和辨別因子檢查原始的英語句子結(jié)構(gòu)是否是“be+過去分詞”。如果是,則該模塊檢查原始英語句子翻譯出的中文動詞是否支配生物/事物的動作或?qū)ζ涫┘佑绊?。如果是,則將中文字“被”加在翻譯出的中文動詞前面。并且該模塊根據(jù)中文語法重新檢查英語介詞(其緊跟在英語動詞的后面)的中文譯詞是否適合翻譯出的中文動詞。因為該英語介詞中文譯詞在中文語言中具有一些特殊的翻譯狀況。接下來,該模塊根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞。
第五特定翻譯模塊(505)通過特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否是形容詞短語句子。如果是,則該模塊刪除原始英語單詞“be”的中文譯詞,然后根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞。
詞庫中的每個英語單詞具有與詞素單位(共同特征)、基本句子元素(共同特征)、調(diào)節(jié)性句子元素(獨立特征)、特定句子元素(獨立特征)相關(guān)的數(shù)據(jù)。尤其是特定句子元素在第一、第二、第三詞典數(shù)據(jù)庫中標(biāo)有辨別因子。辨別因子檢查英語單詞中的特定句子元素的信息,并在特定翻譯模塊中通過特定句子元素的鏈接指針來激活。辨別因子和特定句子元素的鏈接指針將具有特定句子元素的英語單詞和中文譯詞指派給對應(yīng)的第一至第五特定翻譯模塊。
并且其幫助5個特定翻譯模塊(501-505)將原始的英語句子翻譯為正確的、自然的中文譯句。
詞庫的第一詞典數(shù)據(jù)庫存儲了常見單詞的信息。詞庫的第二、第三詞典數(shù)據(jù)庫存儲了復(fù)合詞、習(xí)慣用語、俗語的信息。第四詞典數(shù)據(jù)庫存儲了術(shù)語的信息。
將原始的英語句子翻譯成中文句子時,
1)如果翻譯出的中文動詞(其選自詞庫)屬于離合詞,則特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否是過去時態(tài),并檢查原始的英語句子是否具有頻率副詞。
2)如果檢查發(fā)現(xiàn)中文譯詞是程度補語,則特定句子元素的鏈接指針和辨別因子檢查該程度補語本身是否伴隨著原始英語句子翻譯出的中文動詞。
3)如果檢查發(fā)現(xiàn)中文譯詞是結(jié)果補語,則特定句子元素的鏈接指針和辨別因子檢查該結(jié)果補語本身是否伴隨著原始英語句子翻譯出的中文動詞。
4)如果原始的英語句子結(jié)構(gòu)是“be+過去分詞”,則特定句子元素的鏈接指針和辨別因子檢查原始英語句子翻譯出的中文動詞是否支配生物/事物的動作或?qū)ζ涫┘佑绊?。接下來,特定句子元素的鏈接指針和辨別因子根據(jù)中文語法重新檢查英語介詞(其緊跟在英語動詞后面)的中文譯詞——該中文譯詞是否適合翻譯出的中文動詞。因為英語介詞的中文譯詞在中文語法中具有一些特殊的翻譯狀況。
5)如果原始的英語句子結(jié)構(gòu)是形容詞短語句子,則特定句子元素的鏈接指針和辨別因子刪除原始英語單詞“be”的中文譯詞,然后根據(jù)中文語法的詞序規(guī)則重新構(gòu)造中文譯詞。
如上所述用于編寫該自動翻譯方法的記錄媒體由下列各項所組成(1)詞庫(100)其具有4個對應(yīng)的詞典數(shù)據(jù)庫。每個數(shù)據(jù)庫均以字母順序排列,并且根據(jù)英語和中文語言的詞典編輯系統(tǒng)記錄了英語單詞和中文譯詞的全部信息。
(2)裝置(200)其將輸入的原始句子的單詞分析成詞素單位。
(3)裝置(300)其針對包含詞性的基本句子元素排列(200)的結(jié)果,并且根據(jù)詞典數(shù)據(jù)庫將原始的英語單詞翻譯成中文的字詞。
(4)裝置(400)——調(diào)節(jié)性翻譯模塊其檢查在(300)的結(jié)果中是否存在復(fù)合詞、習(xí)慣用語、俗語。如果存在,則該裝置將它們的基本句子元素調(diào)節(jié)成調(diào)節(jié)性句子元素,如果需要,轉(zhuǎn)換它們的詞性(在該過程中,創(chuàng)建新轉(zhuǎn)換的詞類)。并且該裝置根據(jù)詞典數(shù)據(jù)庫將原始的英語單詞翻譯為中文字詞。
(5)裝置(500)——特定翻譯模塊其檢查(300)的結(jié)果、(400)的結(jié)果,并通過特定句子元素的鏈接指針檢查所輸入的原始句子。如果兩者之間存在鏈接數(shù)據(jù),則特定句子元素的鏈接指針檢查單詞的數(shù)據(jù)是否標(biāo)有辨別因子。如果是,則特定句子元素的鏈接指針和辨別因子指示單詞應(yīng)由5個(特殊)特定翻譯模塊之一來控制。該模塊(500)具有5個(特殊)特定翻譯模塊,由特定句子元素的鏈接指針和辨別因子共同激活。并且該裝置(500)重新檢查每個特定翻譯模塊的結(jié)果并根據(jù)中文語言的詞序規(guī)則重新排列中文譯詞和詞序。
(6)裝置(600)——一般翻譯模塊其檢查(500)的結(jié)果,并根據(jù)中文語法的特殊翻譯狀況刪除最終中文譯句中不需要的中文譯詞,并插入最終中文譯句中需要的特殊中文字詞。其重新檢查第二次翻譯出的中文字詞(其由特定翻譯模塊再次轉(zhuǎn)換而來)是否與詞庫的詞序規(guī)則有聯(lián)系。如果是,該裝置根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞的詞序。
(7)裝置(700)其輸出完整的中文譯句。
與裝置(500)鏈接的特定句子元素的鏈接指針與5個(特殊)特定翻譯模塊(501~505)相互配合。
第一特定翻譯模塊(501)通過特定句子元素的鏈接指針與辨別因子檢查原始英語句子翻譯出的中文動詞是否屬于離合詞。如果是屬于離合詞,該模塊檢查原始的英語句子是否是過去時態(tài)。如果檢查結(jié)果是過去時態(tài),則該模塊在翻譯出的中文動詞的兩個分開的字詞之間插入“了”字。同時,該模塊檢查原始的英語句子是否具有頻率副詞。如果具有,則該模塊通過特定句子元素的鏈接指針和辨別因子將英語頻率副詞的中文譯詞緊跟在“了”字后面。如果原始的英語句子不是過去時態(tài),則放置英語頻率副詞的中文譯詞即可,不需要加“了”字。
第二特定翻譯模塊(502)通過特定句子元素的鏈接指針和辨別因子檢查中文譯詞是否存在作為句子元素的程度補語。如果存在,則特定句子元素的鏈接指針和辨別因子檢查程度補語是否伴隨原始英語句子翻譯出的中文動詞。如果是,該模塊將中文字“得”緊跟在翻譯出的中文動詞后面。并且在“得”字的后面,該模塊緊接著插入程度補語的中文譯詞。
第三特定翻譯模塊(503)通過特定句子元素的鏈接指針和辨別因子來檢查中文譯詞中是否存在作為句子元素的結(jié)果補語。如果存在,則特定句子元素的鏈接指針和辨別因子檢查結(jié)果補語是否伴隨著原始英語句子翻譯出的中文動詞。如果是,該模塊在翻譯出的中文動詞后面緊接著插入結(jié)果補語的中文譯詞。
第四特定翻譯模塊(504)通過特定句子元素的鏈接指針和辨別因子檢查原始的英語句子結(jié)構(gòu)是否是“be+過去分詞”。如果是,則該模塊檢查原始英語句子翻譯出的中文動詞是否支配生物/事物的動作或?qū)ζ涫┘佑绊憽H绻侵浠蚴┘佑绊?,則將中文字“被”加在翻譯出的中文動詞前面。接下來,該模塊通過特定句子元素的鏈接指針和辨別因子根據(jù)中文語法重新檢查英語介詞(其緊跟在英語動詞后面)的中文譯詞——該中文譯詞是否適合翻譯出的中文動詞。因為英語介詞的中文譯詞在中文語法中具有一些特殊的翻譯狀況。接下來,該模塊根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞。
第五特定翻譯模塊(505)通過特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否是形容詞短語句子。如果是,則該模塊刪除原始英語單詞“be”的中文譯詞,然后根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞。
詞庫中的每個英語單詞具有與詞素單位(共同特征)、基本句子元素(共同特征)、調(diào)節(jié)性句子元素(獨立特征)、特定句子元素(獨立特征)相關(guān)的數(shù)據(jù)。尤其是特定句子元素在第一、第二、第三詞典數(shù)據(jù)庫中標(biāo)有辨別因子。
辨別因子檢查英語單詞中的特定句子元素的信息,并在在特定翻譯模塊中通過特定句子元素的鏈接指針來激活。
辨別因子和特定句子元素的鏈接指針將具有特定句子元素的英語單詞和中文譯詞指派給對應(yīng)的第一至第五特定翻譯模塊。并且其幫助5個特定翻譯模塊(501-505)將原始的英語句子翻譯為正確的、自然的中文譯句。
詞庫的第一詞典數(shù)據(jù)庫存儲了常見字詞的信息。詞庫的第二、第三詞典數(shù)據(jù)庫存儲了復(fù)合詞、習(xí)慣用語、俗語的信息。第四詞典數(shù)據(jù)庫存儲了術(shù)語的信息。
將原始的英語句子翻譯成中文句子時,1)如果翻譯出的中文動詞(其選自詞庫)屬于離合詞,則特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否是過去時態(tài),并檢查原始的英語句子是否具有頻率副詞。
2)如果檢查發(fā)現(xiàn)中文譯詞是程度補語,則特定句子元素的鏈接指針和辨別因子檢查該程度補語本身是否伴隨著原始英語句子翻譯出的中文動詞。
3)如果檢查發(fā)現(xiàn)中文譯詞是結(jié)果補語,則特定句子元素的鏈接指針和辨別因子檢查該結(jié)果補語本身是否伴隨著原始英語句子翻譯出的中文動詞。
4)如果原始的英語句子結(jié)構(gòu)是“be+過去分詞”,則特定句子元素的鏈接指針和辨別因子檢查原始英語句子翻譯出的中文動詞是否支配生物/事物的動作或?qū)ζ涫┘佑绊?。接下來,特定句子元素的鏈接指針和辨別因子根據(jù)中文語法重新檢查英語介詞(其緊跟在英語動詞后面)的中文譯詞——該中文譯詞是否適合翻譯出的中文動詞。因為英語介詞的中文譯詞在中文語法中具有一些特殊的翻譯狀況。
5)如果原始的英語句子結(jié)構(gòu)是形容詞短語句子,則特定句子元素的鏈接指針和辨別因子刪除原始英語單詞“be”的中文譯詞,然后根據(jù)中文語法的詞序規(guī)則重新構(gòu)造中文譯詞。
本發(fā)明的自動翻譯方法由以下各項所組成階段(S100)具有詞庫。
階段(S200)將所輸入的原始句子的單詞分析成詞素單位。
階段(S300)其針對包含詞性的基本句子元素排列(200)的結(jié)果,并且根據(jù)詞典數(shù)據(jù)庫將原始的英語單詞翻譯成中文的字詞。
階段(S400)檢查在(300)的結(jié)果中是否存在復(fù)合詞、習(xí)慣用語、俗語。如果存在,則該階段將它們的基本句子元素調(diào)節(jié)成調(diào)節(jié)性句子元素,如果需要,轉(zhuǎn)換它們的詞性(在該過程中,創(chuàng)建新轉(zhuǎn)換的詞類)。并且該階段根據(jù)詞典數(shù)據(jù)庫將原始的英語單詞翻譯為中文字詞。
階段(S500)檢查(300)的結(jié)果、(400)的結(jié)果,并通過特定句子元素的鏈接指針檢查所輸入的原始句子。如果兩者之間存在鏈接數(shù)據(jù),則特定句子元素的鏈接指針檢查單詞的數(shù)據(jù)是否標(biāo)有辨別因子。如果是,則特定句子元素的鏈接指針和辨別因子指示單詞應(yīng)由5個(特殊)特定翻譯模塊之一來控制。并且該階段重新檢查每個特定翻譯模塊的結(jié)果并根據(jù)中文語言的詞序規(guī)則重新排列中文譯詞和詞序。
階段(S600)檢查(500)的結(jié)果,并根據(jù)中文語法的特殊翻譯狀況刪除最終中文譯句中不需要的中文譯詞,并插入最終中文譯句中需要的特殊中文字詞。并且該階段重新檢查第二次翻譯出的中文字詞(其由特定翻譯模塊再次轉(zhuǎn)換而來)是否與詞庫的詞序規(guī)則有聯(lián)系。如果是,則該階段根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞。
階段(S700)輸出完整的中文譯句。
在裝置的階段(S500)中與裝置(500)鏈接的特定句子元素的鏈接指針和辨別因子檢查原始英語句子翻譯出的中文動詞是否屬于離合詞。如果其屬于離合詞,則通過第一特定翻譯模塊來控制翻譯出的中文動詞。在第一特定翻譯模塊中,辨別因子和特定句子元素的鏈接指針檢查原始的英語句子是否是過去時態(tài)。如果檢查結(jié)果是過去時態(tài),則該模塊在翻譯出的中文動詞的兩個分開的字詞之間插入“了”字。同時,特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否具有頻率副詞。如果具有,則第一特定翻譯模塊將英語頻率副詞的中文譯詞緊跟在“了”字之后。如果原始的英語句子不是過去時態(tài),則放置英語頻率副詞的中文譯詞即可,不需要加“了”字。(S501)在裝置的階段(S500)中如果檢查發(fā)現(xiàn)中文譯詞是程度補語,則第二特定翻譯模塊通過特定句子元素的鏈接指針和辨別因子檢查該程度補語本身是否伴隨著原始英語句子翻譯出的中文動詞。如果是,則該模塊在翻譯出的動詞后面緊接著插入中文字“得”。并且在“得”字的后面,該模塊緊接著插入程度補語的中文譯詞。(S502)在裝置的階段(S500)中如果檢查發(fā)現(xiàn)中文譯詞是結(jié)果補語,則第三特定翻譯模塊通過特定句子元素的鏈接指針和辨別因子檢查該結(jié)果補語本身是否伴隨著原始英語句子翻譯出的中文動詞。如果是,該模塊在翻譯出的中文動詞后面緊接著插入結(jié)果補語的中文譯詞。(S503)在裝置的階段(S500)中如果原始的英語句子結(jié)構(gòu)是“be+過去分詞”,則在第四特定翻譯模塊中,特定句子元素的鏈接指針和辨別因子檢查原始英語句子翻譯出的中文動詞是否支配生物/事物的動作或?qū)ζ涫┘佑绊?。如果是,則將中文字“被”加在翻譯出的中文動詞前面。接下來,該模塊根據(jù)中文語法重新檢查英語介詞(其緊跟在英語動詞的后面)的中文譯詞——該中文譯詞是否適合翻譯出的中文動詞。因為英語介詞的中文譯詞在中文語法中具有一些特殊的翻譯狀況。接下來,其根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞。(S504)
在裝置的階段(S500)中在第五特定翻譯模塊中,特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否是形容詞短語句子。如果是,則該模塊刪除原始英語單詞“be”的中文譯詞,然后根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞?!?S505)在裝置的階段(S500)中,特定句子元素的鏈接指針、辨別因子和每個特定翻譯模塊是三位一體的。


下文參照附圖詳細說明了通過該自動(機器)翻譯器的操作來實際翻譯示例句子的情況(演示程序,于2003年3月開發(fā))。
圖1本發(fā)明的自動翻譯器的系統(tǒng)組成。
圖2作為該自動翻譯器的組成單元的特定翻譯模塊裝置的框圖。
圖3顯示了該自動翻譯器中的翻譯過程的流程圖。
圖4顯示了5個特定翻譯模塊(501-505)的功能。
圖5本發(fā)明的操作的第一例子,顯示了離合詞動詞結(jié)構(gòu)的翻譯過程。圖5至圖9是本申請人從本發(fā)明的演示結(jié)果中引用的。
圖6本發(fā)明的操作的第二例子,顯示了程度補語句法結(jié)構(gòu)的翻譯過程。
圖7本發(fā)明的操作的第三例子,顯示了結(jié)果補語句法結(jié)構(gòu)的翻譯過程。
圖8本發(fā)明的操作的第四例子,顯示了被動語態(tài)句法結(jié)構(gòu)的翻譯過程。
圖9本發(fā)明的操作的第五例子,顯示了形容詞短語句子句法結(jié)構(gòu)的翻譯過程。
具體實施例方式
現(xiàn)在,讓我們來觀察一下本發(fā)明的自動翻譯器的操作。當(dāng)用戶輸入原始的英語句子“I have not chatted with him once.”(參照圖5)時,該句子便出現(xiàn)在了用于翻譯的活動窗口的輸入空間中。(參照圖3/S100)用戶輸入該英語句子并點擊活動窗口中的翻譯菜單之后,該自動翻譯器將會立即顯示中文譯句。讓我們觀察一下該自動翻譯器的翻譯過程。
首先,用于分析詞素單位的裝置(200)將所輸入的原始英語句子的每一個單詞分析成詞素單位。用于排列基本句子元素的裝置(300)將原始英語句子的每個詞素單位逐一與詞庫中的詞典數(shù)據(jù)庫匹配。同時,該裝置將其排列并定義成代詞、名詞、動詞、否定詞、助詞、形容詞、介詞、副詞、冠詞、連詞、關(guān)系詞、敘述詞、分詞、動名詞、數(shù)詞等。(S300)用于調(diào)整調(diào)節(jié)性句子元素的裝置(400)首先檢查在(300)的結(jié)果中是否存在復(fù)合詞、習(xí)慣用語、俗語。如果存在,則該裝置將它們的基本句子元素調(diào)節(jié)成調(diào)節(jié)性句子元素,接下來,該裝置將它們與詞庫中的詞典數(shù)據(jù)庫匹配。同時,如果需要,該裝置(400)轉(zhuǎn)換并調(diào)整它們的詞性。在這一過程中,創(chuàng)建了新轉(zhuǎn)換的詞類,調(diào)整并重新定義了所輸入的原始句子中的時態(tài)、主語、短語動詞、介詞短語、名詞短語、副詞短語的特征。(S400)接下來,裝置(500),即特定翻譯模塊,通過特定句子元素的鏈接指針檢查裝置(400)的結(jié)果,確定所輸入的原始英語單詞中是否存在辨別因子。通過特定句子元素的鏈接指針來激活的辨別因子檢查原始英語單詞的調(diào)節(jié)性句子元素的特征,如果需要,重新排列特定句子元素的調(diào)節(jié)性句子元素。然后,辨別因子和特定句子元素的的鏈接指針指示,由5個特殊的特定翻譯模塊之一來控制具有特定句子元素的單詞。該過程顯示了原始英語單詞的每個特定句子元素的功能意義。該過程將原始的英語單詞翻譯成正確的、自然的中文譯句。
所輸入的原始英語句子“I have not chatted with him once.”通過裝置(200)、(300)、(400)和詞典數(shù)據(jù)庫,然后相關(guān)的數(shù)據(jù)就到達了裝置(500)。
在(200)、(300)、(400)的過程中,將原始英語句子中的單詞“I”翻譯成中文字“我”,單詞“have”和“not”翻譯成中文字“有”和“沒”,單詞“chatted”翻譯成中文詞“閑談”,“with”翻譯為中文字“跟”,“him”翻譯成中文字“他”,并且“once”翻譯成中文詞“一次”。
特定句子元素的鏈接指針檢查原始英語句子的全部相關(guān)數(shù)據(jù),并發(fā)現(xiàn)動詞“chatted”標(biāo)有“離合詞”的辨別因子。該辨別因子和特定句子元素的鏈接指針決定應(yīng)在第一特定翻譯模塊(501)中執(zhí)行該單詞的下一個過程。第一特定翻譯模塊參照單詞數(shù)據(jù)檢查動詞“chatted”,并發(fā)現(xiàn)動詞“chatted”是過去時態(tài)動詞。同時,在第一特定翻譯模塊中,特定句子元素的鏈接指針和辨別因子在詞典數(shù)據(jù)庫中檢查動詞“chatted”并發(fā)現(xiàn)其正確、自然的中文譯詞不是“閑談”,而是離合詞“聊天兒”。
接著,特定句子元素的鏈接指針和辨別因子在離合詞“聊天兒”之間插入“了”字(該中文字表示句子是過去時態(tài))。
于是,翻譯出的中文動詞就成了“聊了天兒”。
在該過程之后,在第一特定翻譯模塊中,特定句子元素的鏈接指針和辨別因子識別出原始英語句子具有頻率副詞“once”。特定句子元素的鏈接指針和辨別因子檢查詞典數(shù)據(jù)庫并發(fā)現(xiàn)翻譯出的中文頻率副詞是“一次”。接下來,該模塊在“聊了天兒”之間插入詞語“一次”。于是,翻譯出的中文動詞和翻譯出的中文副詞就形成了“聊了一次天兒”。第一特定翻譯模塊將原始英語句子中的單詞“chatted”和“once”翻譯成了中文譯詞“聊了一次天兒”。
該結(jié)果在中文語言中是非常正確、自然的。
將該自動翻譯器的第一特定翻譯模塊中的特定句子元素的鏈接指針和辨別因子編成程序,以檢查原始英語句子翻譯出的中文動詞是否屬于離合詞。并且用于檢查原始英語句子是否具有頻率副詞。
當(dāng)特定句子元素的鏈接指針找不到標(biāo)有辨別因子的單詞時,特定翻譯模塊(500)就完成了原始英語句子的特定句子元素的翻譯過程。
在該過程之后,便將所輸入的原始英語句子“I have not chatted with him once.”翻譯成了“我有沒聊了一次天兒跟他”。一般翻譯模塊(600)接收并檢查(500)的結(jié)果,并根據(jù)中文語法的特殊翻譯狀況刪除最終中文譯句中不需要的中文譯詞,并插入最終中文譯句中需要的特殊中文字詞。接下來,該模塊檢查(500)的每個結(jié)果是否與詞庫中的詞序規(guī)則有聯(lián)系。如果是,則該模塊根據(jù)中文語言中的詞序規(guī)則重新構(gòu)造中文譯詞。
這個過程中,在最終的中文譯句中刪除了翻譯出的中文字“有”。并且根據(jù)中文語言的詞序規(guī)則,將原始英語句子中的單詞“with him”對應(yīng)的中文譯詞“跟他”緊跟在中文字“沒”后面。
一般翻譯模塊(600)的過程建立了最終中文譯句“我沒跟他聊了一次天兒”。(S600)
最后,裝置(700)輸出完整的中文譯句。自動翻譯器在計算機屏幕上的輸出空間顯示“我沒跟他聊了一次天兒”。
這是一個正確、自然的中文句子。并且這種技術(shù)算法在此之前并不存在。
從輸入原始英語句子直至對調(diào)節(jié)性句子元素進行調(diào)節(jié)的連續(xù)過程(S100-S400)都是一樣的。
因此,下面將對照5張圖解釋裝置(500)——特定翻譯模塊——如何操作和控制原始英語單詞的特定句子元素及5個特定翻譯模塊(501-505)的過程(參照圖5、6、7、8、9)。
所輸入的原始英語句子“He always answers correctly.”(參照圖6)通過裝置(200)、(300)、(400)的過程進行分析、排列和調(diào)節(jié),并且通過對應(yīng)的詞典數(shù)據(jù)庫與中文譯詞匹配。
“he”對應(yīng)于“他”,“always”對應(yīng)于“總是”,“answers”對應(yīng)于“回答”,“correctly”對應(yīng)于“正確地”。
當(dāng)將裝置(_400)的結(jié)果傳達到裝置(500)時,特定句子元素的鏈接指針檢查原始英語句子中的每個單詞及中文譯詞——“He always answers correctly”/他總是回答正確地。
在該過程中,檢查每個單詞是否標(biāo)有辨別因子。當(dāng)該過程發(fā)現(xiàn)單詞“correctly”標(biāo)有辨別因子時,特定句子元素的鏈接指針激活單詞“correctly”的該辨別因子。該辨別因子和特定句子元素的鏈接指針開始通過詞典數(shù)據(jù)庫來檢查單詞“correctly”的特征。
其發(fā)現(xiàn)英語單詞“correctly”的中文譯詞在中文語法中應(yīng)視為程度補語。
現(xiàn)在,單詞“correctly”的辨別因子和特定句子元素的鏈接指針指示,該原始英語單詞必須由第二特定翻譯模塊(502)來處理。其決定,根據(jù)中文語法,第一次翻譯出的對應(yīng)中文詞“正確地”是不正確的。在第二特定翻譯模塊中,辨別因子和特定句子元素的鏈接指針通過詞典數(shù)據(jù)庫來重新檢查單詞“correctly”,并發(fā)現(xiàn)正確、自然的中文詞不是“正確地”,而是“對”。
第二特定翻譯模塊通過特定句子元素的鏈接指針和辨別因子來檢查第二次翻譯出的中文字“對”是否伴隨著原始英語動詞“answers”翻譯出的中文動詞“回答”。結(jié)果是肯定的,在第二特定翻譯模塊中,特定句子元素的鏈接指針和辨別因子將特殊的中文字“得”緊跟在翻譯出的中文動詞“回答”后面插入,并且緊跟在“得”字后面,放置第二次翻譯出的中文字“對”,作為中文語言的程度補語。
現(xiàn)在,裝置(500)檢查中文語言的詞序規(guī)則,并將原始的英語句子“He alwaysanswers correctly.”翻譯成中文譯句“他總是回答得對”。
一般翻譯模塊(600)接收并檢查裝置(500)的結(jié)果,并且沒有找到需要重新排列結(jié)果的線索。
現(xiàn)在,該模塊建立最終的中文譯句“他總是回答得對”。(S600)最后,裝置(700)輸出完整的中文譯句。自動翻譯器在計算機屏幕上的輸出空間顯示“他總是回答得對”。(S700)這是一個正確、自然的中文句子。并且這種技術(shù)算法在此之前并不存在。
所輸入的原始英語句子“I translated it into English wrongly”(參照圖7)通過裝置(200)、(300)、(400)的過程進行分析、排列和調(diào)節(jié),并且通過詞典數(shù)據(jù)庫與中文譯詞匹配。
“I”對應(yīng)于“我”,“translated”對應(yīng)于“翻譯”,“it”對應(yīng)于“那個”,“into”對應(yīng)于“成”,“English”對應(yīng)于“英語”,并且“wrongly”對應(yīng)于“錯誤地”。
當(dāng)將裝置(400)的結(jié)果傳達到裝置(500)時,特定句子元素的鏈接指針檢查原始英語句子中的每個單詞及中文譯詞——I translated it into English wrongly./我翻譯那個成英語錯誤地。
在該過程中,通過特定句子元素的鏈接指針檢查每個單詞是否標(biāo)有辨別因子。當(dāng)其發(fā)現(xiàn)單詞“wrongly”標(biāo)有辨別因子時,特定句子元素的鏈接指針激活單詞“wrongly”的該辨別因子。該辨別因子和特定句子元素的鏈接指針開始通過詞典數(shù)據(jù)庫來檢查單詞“wrongly”的特征。其發(fā)現(xiàn),英語單詞的“wrongly”中文譯詞在中文語言中應(yīng)視為結(jié)果補語。
現(xiàn)在,單詞“wrongly”的辨別因子和特定句子元素的鏈接指針指示,該原始英語單詞必須由第三特定翻譯模塊(503)來處理。其決定,根據(jù)中文語法,第一次翻譯出的中文詞“錯誤地”是不正確的。在第三特定翻譯模塊中,其通過詞典數(shù)據(jù)庫來重新檢查單詞“correctly”,并發(fā)現(xiàn)正確、自然的中文詞不是“錯誤地”,而是“錯了”。
第三特定翻譯模塊通過特定句子元素的鏈接指針和辨別因子來重新檢查第二次翻譯出的中文詞“錯了”是否伴隨著原始英語動詞“translated”翻譯出的中文動詞“翻譯”作為結(jié)果補語。結(jié)果是肯定的,第三特定翻譯模塊根據(jù)中文的詞序規(guī)則緊跟在中文動詞“翻譯”后面插入中文譯詞“錯了”。
一般翻譯模塊(600)接收(500)的結(jié)果并根據(jù)中文語法的特殊翻譯狀況檢查中文譯句是否需要刪除或插入特殊的中文字詞。接著,該模塊重新檢查每一個中文譯詞是否與詞典數(shù)據(jù)庫的詞序規(guī)則有聯(lián)系。如果是,該模塊根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞的詞序。
這時,一般翻譯模塊的裝置根據(jù)中文語言的詞序規(guī)則檢查(500)的結(jié)果并決定應(yīng)將中文字“把”插在詞語“那個”前面,并且在詞語“把那個”后面緊跟中文動詞“翻譯”。該模塊(600)建立最終的中文譯句“我把那個翻譯錯了成英語”。(S600)最后,裝置(700)輸出完整的中文譯句。自動翻譯器在計算機屏幕上的輸出空間顯示“我把那個翻譯錯了成英語”。(S700)這是一個正確、自然的中文句子。并且這種技術(shù)算法在此之前并不存在。
所輸入的原始英語句子“He is besieged with visitors from abroad.”(參照圖8)通過裝置(200)、(300)、(400)的過程進行分析、排列和調(diào)節(jié),并且通過詞典數(shù)據(jù)庫與中文譯詞匹配。
“He”對應(yīng)于“他”,并且“is”對應(yīng)于“是”,“besieged”對應(yīng)于“包圍了”,“with”對應(yīng)于“跟”,“visitors”對應(yīng)于“客人”,“from”對應(yīng)于“從”,并且“abroad”對應(yīng)于“外國”。
當(dāng)將裝置(400)的結(jié)果傳達到裝置(500)時,特定句子元素的鏈接指針檢查原始英語句子中的每個單詞及中文譯詞——“He is besieged with visitors from abroad.”/他是包圍了跟客人從外國。
在該過程中,檢查每個單詞是否標(biāo)有辨別因子。當(dāng)其發(fā)現(xiàn)原始英語句子是被動語態(tài)的結(jié)構(gòu)“be+過去分詞”并標(biāo)有被動語態(tài)的辨別因子時,該辨別因子和特定句子元素的鏈接指針開始通過詞典數(shù)據(jù)庫來檢查原始英語句子的特征。
現(xiàn)在,該辨別因子和特定句子元素的鏈接指針指示,該原始英語句子必須由第四特定翻譯模塊(504)來處理。在第四特定翻譯模塊中,其搜索單詞數(shù)據(jù)“isbesieged”,并檢查原始英語句子翻譯出的中文動詞“包圍了”是否支配生物/事物的動作或?qū)ζ涫┘佑绊?。結(jié)果是肯定的。其決定將中文字“被”加在翻譯出的中文動詞前面。該模塊將第一次翻譯出的中文短語動詞“包圍了”轉(zhuǎn)換成“被包圍了”。
辨別因子和特定句子元素的鏈接指針應(yīng)根據(jù)中文語法重新檢查英語介詞(其緊跟在英語動詞后面)的中文譯詞——該中文譯詞是否適合翻譯出的中文動詞。
因此,該辨別因子和特定句子元素的鏈接指針根據(jù)中文語法重新檢查英語介詞“with”第一次翻譯出的中文字“跟”是否適合翻譯出的中文動詞“被包圍了”。因為英語介詞的中文譯詞在中文語法中具有一些特殊的翻譯狀況。結(jié)果是否定的,其決定,根據(jù)中文語法的特殊翻譯狀況,正確、自然的中文譯詞不是“跟”,而是“與”。
接著,在第四特定翻譯模塊中,其根據(jù)中文語言的詞序規(guī)則,決定應(yīng)在與“withvisitors”對應(yīng)的介詞短語“與客人”后面緊跟翻譯出的中文短語動詞“被包圍了”。第四特定翻譯模塊重建中文譯句“他是與客人被包圍了從外國”。
接收并檢查(500)的結(jié)果的一般翻譯模塊(600)刪除與“is”對應(yīng)的中文譯詞。因為在最終的中文譯句中,英語單詞“is”的中文譯詞是不需要的。并且,該模塊重新檢查每一個中文譯詞是否與詞典數(shù)據(jù)庫的詞序規(guī)則有聯(lián)系。并且結(jié)果是這樣的對應(yīng)于“from abroad”的介詞短語“從外國”與詞典數(shù)據(jù)庫的詞序規(guī)則有聯(lián)系。因此,該模塊如下重新構(gòu)造詞序在“與客人”后面緊跟與“from abroad”對應(yīng)的介詞短語“從外國”。
該模塊建立最終的中文譯句“他與客人從外國被包圍了”。(S600)最后,裝置(700)輸出完整的中文譯句。自動翻譯器在計算機屏幕上的輸出空間顯示“他與客人從外國被包圍了”。(S700)
這是一個正確、自然的中文句子。并且這種技術(shù)算法在此之前并不存在。
所輸入的原始英語句子“He is sensitive to light.”(參照圖9)通過裝置(200)、(300)、(400)的過程進行分析、排列和調(diào)節(jié),并且通過詞庫的對應(yīng)詞典數(shù)據(jù)庫與中文譯詞匹配。
“He”對應(yīng)于“他”,“is”對應(yīng)于“是”,“sensitive”對應(yīng)于“敏感”,“to”對應(yīng)于“對”,并且“l(fā)ight”對應(yīng)于“光”。
現(xiàn)在,特定句子元素的鏈接指針檢查原始英語句子中的每個單詞和中文譯詞———He is sensitive to light./他是敏感對光。
在該過程中,檢查每個單詞是否標(biāo)有辨別因子。當(dāng)特定句子元素的鏈接指針發(fā)現(xiàn)標(biāo)有辨別因子的單詞時,其激活該辨別因子。
特定句子元素的鏈接指針和(用語“is sensitive”的)辨別因子將該句子結(jié)構(gòu)確認為“be+形容詞”。該用語的辨別因子和特定句子元素的鏈接指針指示,該原始英語句子必須由第五特定翻譯模塊(505)來處理。
在第五特定翻譯模塊中,該用語的辨別因子和特定句子元素的鏈接指針尋找單詞數(shù)據(jù)“is sensitive”,并且該模塊根據(jù)中文語言的詞序規(guī)則刪除原始英語單詞“be”的中文譯詞,然后重新構(gòu)造中文譯句。
現(xiàn)在,原始的英語句子“He is sensitive to light.”翻譯成了中文句子“他敏感對光”。
接下來,接收和檢查(500)的結(jié)果的一般翻譯模塊(600)的過程決定,根據(jù)中文語法的特殊狀況刪除最終中文譯句中不需要的字詞的過程及插入最終中文譯句中需要的特殊中文字詞的過程是不需要的。接著,該模塊重新檢查中文譯詞是否與詞庫的詞序規(guī)則有聯(lián)系。結(jié)果是這樣的根據(jù)中文語言的詞序規(guī)則,翻譯出的中文介詞短語“對光”(其對應(yīng)于“to light”)的后面應(yīng)緊跟翻譯出的中文形容詞“敏感”(其對應(yīng)于“sensitive”)。因此,該模塊重新構(gòu)造詞序并建立最終的中文譯句“他對光敏感”。(S600)最后,裝置(700)輸出完整的中文譯句。自動翻譯器在計算機屏幕上的輸出空間顯示“他對光敏感”(S700)。
這是一個正確、自然的中文句子。并且這種技術(shù)算法在此之前并不存在。
可在本發(fā)明的概念和范圍內(nèi)對上文詳細解釋的本發(fā)明進行更改和改造。此類更改和改造屬于本申請人在本專利范圍內(nèi)所提出的權(quán)利要求。
權(quán)利要求
1.一種自動翻譯器,其由以下各項組成(1)詞庫(100)其具有4個對應(yīng)的詞典數(shù)據(jù)庫;每個數(shù)據(jù)庫均以字母順序排列,并且根據(jù)英語和中文語言的詞典編輯系統(tǒng)記錄了英語單詞和中文譯詞的全部信息;(2)裝置(200)其將輸入的原始句子的單詞分析成詞素單位;(3)裝置(300)其針對包含詞性的基本句子元素排列裝置(200)的結(jié)果,并且根據(jù)詞典數(shù)據(jù)庫將原始的英語單詞翻譯成中文的字詞;(4)裝置(400)——調(diào)節(jié)性翻譯模塊其檢查在(300)的結(jié)果中是否存在復(fù)合詞、習(xí)慣用語、俗語;如果存在,則該裝置將它們的基本句子元素調(diào)節(jié)成調(diào)節(jié)性句子元素,如果需要,轉(zhuǎn)換它們的詞性(在該過程中,創(chuàng)建新轉(zhuǎn)換的詞類);并且該裝置根據(jù)詞典數(shù)據(jù)庫將原始的英語單詞翻譯為中文字詞;(5)裝置(500)——特定翻譯模塊其檢查(300)的結(jié)果、(400)的結(jié)果,并通過特定句子元素的鏈接指針檢查所輸入的原始句子;如果兩者之間存在鏈接數(shù)據(jù),則特定句子元素的鏈接指針檢查單詞的數(shù)據(jù)是否標(biāo)有辨別因子;如果是,則特定句子元素的鏈接指針和辨別因子指示單詞應(yīng)由5個(特殊)特定翻譯模塊之一來控制;特定翻譯模塊的裝置(500)具有5個(特殊)特定翻譯模塊(501-505),由特定句子元素的鏈接指針和辨別因子共同激活;并且該裝置重新檢查每個(特殊)特定翻譯模塊的結(jié)果并根據(jù)中文語言的詞序規(guī)則重新排列中文譯詞和詞序;(6)裝置(600)——般翻譯模塊其檢查(500)的結(jié)果,并根據(jù)中文語法的特殊翻譯狀況刪除最終中文譯句中不需要的中文譯詞,并插入最終中文譯句中需要的特殊中文字詞;并且該裝置重新檢查第二次翻譯出的中文字詞(其由特定翻譯模塊再次轉(zhuǎn)換而來)是否與詞庫的詞序規(guī)則有聯(lián)系;如果是,則該裝置根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞;(7)裝置(700)其輸出完整的中文譯句;與裝置(500)(即特定翻譯模塊)鏈接的特定句子元素的鏈接指針與5個(特殊)特定翻譯模塊(501~505)相互配合;第一特定翻譯模塊(501)通過特定句子元素的鏈接指針與辨別因子檢查原始英語句子翻譯出的中文動詞是否屬于離合詞;如果其屬于離合詞,則該模塊通過特定句子元素的鏈接指針與辨別因子檢查原始的英語句子是否是過去時態(tài);結(jié)果是肯定的,該模塊將“了”字插入翻譯出的中文動詞的雙音節(jié)或三音節(jié)(其也分成兩部分)詞之間;同時,該模塊通過特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否具有頻率副詞;如果具有,則該模塊通過特定句子元素的鏈接指針和辨別因子將英語頻率副詞的中文譯詞緊跟在“了”字后面;如果原始的英語句子不是過去時態(tài),則放置英語頻率副詞的中文譯詞即可,不需要加“了”字;第二特定翻譯模塊(502)通過特定句子元素的鏈接指針和辨別因子檢查中文譯詞是否存在作為句子元素的程度補語;如果存在,則特定句子元素的鏈接指針和辨別因子檢查程度補語是否伴隨原始英語句子翻譯出的中文動詞;如果是,則該模塊在翻譯出的中文動詞后面緊接著插入中文字“得”(在中文句子中表示動詞的程度的中文字);并且該模塊將程度補語的中文譯詞緊跟在“得”字之后;第三特定翻譯模塊(503)通過特定句子元素的鏈接指針和辨別因子來檢查中文譯詞中是否存在作為句子元素的結(jié)果補語;如果存在,則特定句子元素的鏈接指針和辨別因子檢查結(jié)果補語是否伴隨著原始英語句子翻譯出的中文動詞;如果是,該模塊在翻譯出的中文動詞后面緊接著插入結(jié)果補語的中文譯詞;第四特定翻譯模塊(504)通過特定句子元素的鏈接指針和辨別因子檢查原始的英語句子結(jié)構(gòu)是否是“be+過去分詞”;如果是,該模塊通過特定句子元素的鏈接指針和辨別因子檢查原始英語句子翻譯出的中文動詞是否支配生物/事物的動作或?qū)ζ洚a(chǎn)生影響;如果是,則將中文字“被”加在翻譯出的中文動詞前面;接下來,該模塊通過特定句子元素的鏈接指針和辨別因子根據(jù)中文語法重新檢查英語介詞(其緊跟在英語動詞后面)的中文譯詞——該中文譯詞是否適合翻譯出的中文動詞;因為英語介詞的中文譯詞在中文語法中具有一些特殊的翻譯狀況;接下來,該模塊根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞;第五特定翻譯模塊(505)通過特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否是形容詞短語句子;如果是,則該模塊通過特定句子元素的鏈接指針和辨別因子刪除原始英語單詞“be”的中文譯詞,然后根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞;詞庫中的每個英語單詞具有與詞素單位(共同特征)、基本句子元素(共同特征)、調(diào)節(jié)性句子元素(獨立特征)、特定句子元素(獨立特征)相關(guān)的數(shù)據(jù);尤其是特定句子元素在第一、第二、第三詞典數(shù)據(jù)庫中標(biāo)有辨別因子;辨別因子檢查英語單詞中的特定句子元素的信息,并在特定翻譯模塊中通過特定句子元素的鏈接指針來激活;辨別因子和特定句子元素的鏈接指針將與其鏈接的英語單詞指派給將原始英語句子翻譯成正確、自然的中文譯句的第一至第五特定翻譯模塊;詞庫的第一詞典數(shù)據(jù)庫存儲了常見字詞的信息;詞庫的第二、第三詞典數(shù)據(jù)庫存儲了復(fù)合詞、習(xí)慣用語、俗語的信息;第四詞典數(shù)據(jù)庫存儲了術(shù)語的信息。
2.如權(quán)利要求1所述的自動翻譯器,其包括詞庫(100)中的4個詞典數(shù)據(jù)庫;其以字母順序排列并記錄了英語單詞和中文譯詞的全部信息;尤其是第一、第二、第三詞典數(shù)據(jù)庫記錄了與英語單詞和中文字詞兩方面的特定句子元素的字詞數(shù)據(jù)有關(guān)的全部信息;通過詞庫(100),使用與裝置(500)鏈接的特定句子元素的鏈接指針來檢查每個中文譯詞和原始英語句子的每個單詞;通過詞庫(100),特定句子元素的鏈接指針檢查每個翻譯出的中文動詞和原始英語句子的每個動詞是否標(biāo)有離合詞的辨別因子;如果標(biāo)有,則特定句子元素的鏈接指針和該離合詞辨別因子檢查原始的英語句子是否是過去時態(tài);同時,其檢查原始的英語句子是否具有頻率副詞;這是第一特定翻譯模塊(501)的過程;通過該詞庫(100),特定句子元素的鏈接指針檢查每個中文譯詞和每個輸入的原始英語單詞是否標(biāo)有程度補語的辨別因子;如果標(biāo)有,則特定句子元素的鏈接指針和該辨別因子檢查該中文譯詞(程度補語)是否伴隨原始英語句子翻譯出的中文動詞;這是第二特定翻譯模塊(502)的過程;通過該詞庫(100),特定句子元素的鏈接指針檢查每個中文譯詞和每個輸入的原始英語單詞是否標(biāo)有結(jié)果補語的辨別因子;如果標(biāo)有,則特定句子元素的鏈接指針和該辨別因子檢查該中文譯詞(結(jié)果補語)是否伴隨原始英語句子翻譯出的中文動詞;這是第三特定翻譯模塊(503)的過程;通過該詞庫(100),特定句子元素的鏈接指針檢查中文譯詞和原始英語單詞是否標(biāo)有被動語態(tài)的辨別因子;結(jié)果是肯定的,特定句子元素的鏈接指針和該辨別因子檢查原始英語句子翻譯出的中文動詞是否支配生物/事物的動作或?qū)ζ洚a(chǎn)生影響;并且其檢查緊跟在英語動詞后面的英語介詞的中文譯詞在中文語言中是否正確;這是第四特定翻譯模塊(504)的過程;通過該詞庫(100),特定句子元素的鏈接指針檢查每個翻譯出的中文短語和每個原始英語短語是否標(biāo)有“be+形容詞”的辨別因子;如果是,則特定句子元素的鏈接指針和該辨別因子刪除原始英語單詞“be”的中文譯詞,然后根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞;這是第五特定翻譯模塊(505)的過程。
3.一種用于編寫自動翻譯方法的記錄媒體,其由以下各項所組成(1)詞庫(100)其具有4個對應(yīng)的詞典數(shù)據(jù)庫;每個數(shù)據(jù)庫均以字母順序排列,并且根據(jù)英語和中文語言的詞典編輯系統(tǒng)記錄了英語單詞和中文譯詞的全部信息;(2)裝置(200)其將輸入的原始句子的單詞分析成詞素單位;(3)裝置(300)其針對包含詞性的基本句子元素排列(200)的結(jié)果,并且根據(jù)詞典數(shù)據(jù)庫將原始的英語單詞翻譯成中文的字詞;(4)裝置(400)——調(diào)節(jié)性翻譯模塊其檢查在(300)的結(jié)果中是否存在復(fù)合詞、習(xí)慣用語、俗語;如果存在,則該裝置將它們的基本句子元素調(diào)節(jié)成調(diào)節(jié)性句子元素,如果需要,轉(zhuǎn)換它們的詞性(在該過程中,創(chuàng)建新轉(zhuǎn)換的詞類);并且該裝置根據(jù)第一、第二、第三詞典數(shù)據(jù)庫將原始的英語單詞翻譯為中文字詞;(5)裝置(500)——特定翻譯模塊其檢查(300)的結(jié)果、(400)的結(jié)果,并通過特定句子元素的鏈接指針檢查所輸入的原始句子;如果兩者之間存在鏈接數(shù)據(jù),則該裝置檢查單詞的數(shù)據(jù)是否標(biāo)有辨別因子;如果是,則特定句子元素的鏈接指針和辨別因子指示單詞應(yīng)由5個(特殊)特定翻譯模塊之一來控制;該裝置重新檢查每個(特殊)特定翻譯模塊的結(jié)果并根據(jù)詞典數(shù)據(jù)庫重新排列中文譯詞和詞序;特定翻譯模塊的裝置(500)具有5個(特殊)特定翻譯模塊(501-505),由特定句子元素的鏈接指針和辨別因子共同激活;通過該裝置(500)的過程,根據(jù)詞庫將原始英語單詞的數(shù)據(jù)翻譯成正確、自然的中文字詞;(6)裝置(600)——般翻譯模塊其檢查(500)的結(jié)果,并根據(jù)中文語法的特殊翻譯狀況刪除最終中文譯句中不需要的中文譯詞,并插入最終中文譯句中需要的特殊中文字詞;現(xiàn)在,該模塊重新檢查第二次翻譯出的中文字詞(其由特定翻譯模塊再次轉(zhuǎn)換而來)是否與詞庫的詞序規(guī)則有聯(lián)系;如果是,該模塊根據(jù)中文語言的詞序規(guī)則重新構(gòu)造第二次翻譯出的中文字詞的詞序;(7)裝置(700)其輸出完整的中文譯句;裝置(500)——特定句子元素的鏈接指針與該裝置鏈接——具有5個(特殊)特定翻譯模塊;第一特定翻譯模塊(501)通過特定句子元素的鏈接指針與辨別因子檢查原始英語句子翻譯出的中文動詞是否屬于離合詞;如果是屬于離合詞,該模塊檢查原始的英語句子是否是過去時態(tài);如果檢查結(jié)果是過去時態(tài),則該模塊在翻譯出的中文動詞的兩個分開的字詞之間插入“了”字;接下來,該模塊檢查原始的英語句子是否具有頻率副詞;如果具有,則該模塊將英語頻率副詞的中文譯詞緊跟在“了”字的后面;如果原始的英語句子不是過去時態(tài),則放置英語頻率副詞中文譯詞即可,不需要加“了”字;第二特定翻譯模塊(502)通過特定句子元素的鏈接指針和辨別因子檢查中文譯詞是否存在作為句子元素的程度補語;如果存在,則特定句子元素的鏈接指針和辨別因子檢查程度補語是否伴隨原始英語句子翻譯出的中文動詞;如果是,該模塊將中文字“得”緊跟在翻譯出的中文動詞后面;并且該模塊將程度補語的中文譯詞緊跟在“得”字之后;第三特定翻譯模塊(503)通過特定句子元素的鏈接指針和辨別因子來檢查中文譯詞中是否存在作為句子元素的結(jié)果補語;如果存在,則特定句子元素的鏈接指針和辨別因子檢查結(jié)果補語是否伴隨著原始英語句子翻譯出的中文動詞;如果是,則該模塊在翻譯出的中文動詞后面緊接著插入結(jié)果補語的中文譯詞;第四特定翻譯模塊(504)通過特定句子元素的鏈接指針和辨別因子檢查原始的英語句子結(jié)構(gòu)是否是“be+過去分詞”;如果是,則該模塊檢查原始英語句子翻譯出的中文動詞是否支配生物/事物的動作或?qū)ζ涫┘佑绊?;如果是,則將中文字“被”(這個字在中文中表示被動語態(tài))加在該翻譯出的中文動詞前面;現(xiàn)在,該模塊通過特定句子元素的鏈接指針和辨別因子根據(jù)中文語法重新檢查英語介詞(其緊跟在英語動詞后面)的中文譯詞——該中文譯詞是否適合翻譯出的中文動詞;因為英語介詞的中文譯詞在中文語法中具有一些特殊的翻譯狀況;接下來,該模塊根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞;第五特定翻譯模塊(505)通過特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否是形容詞短語句子;如果是,則該模塊刪除原始英語單詞“be”的中文譯詞,然后根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞;詞庫中的每個英語單詞具有與詞素單位(共同特征)、基本句子元素(共同特征)、調(diào)節(jié)性句子元素(獨立特征)、特定句子元素(獨立特征)相關(guān)的數(shù)據(jù);尤其是特定句子元素在第一、第二、第三詞典數(shù)據(jù)庫中標(biāo)有辨別因子;辨別因子檢查英語單詞中的特定句子元素的信息,并在5個(特殊)特定翻譯模塊中通過特定句子元素的鏈接指針來激活;辨別因子和特定句子元素的鏈接指針將與其鏈接的英語單詞指派給將原始英語句子翻譯成正確、自然的中文譯句的第一至第五特定翻譯模塊;詞庫的第一對應(yīng)詞典數(shù)據(jù)庫存儲了常見字詞的信息;第二、第三詞典數(shù)據(jù)庫存儲了復(fù)合詞、習(xí)慣用語、俗語的信息;第四詞典數(shù)據(jù)庫存儲了術(shù)語的信息。
4.如權(quán)利要求3所述的記錄媒體,其包括詞庫(100),其以字母順序排列并記錄了英語單詞和中文譯詞的全部信息;尤其是第一、第二、第三詞典數(shù)據(jù)庫記錄了與英語單詞和中文字詞兩方面的特定句子元素的字詞數(shù)據(jù)有關(guān)的全部信息;通過詞庫(100),在特定翻譯模塊(500)的過程中,使用與裝置(500)鏈接的特定句子元素的鏈接指針來檢查每個中文譯詞和原始英語句子的每個單詞;通過詞庫(100),特定句子元素的鏈接指針檢查每個翻譯出的中文動詞和原始英語句子的每個動詞是否標(biāo)有離合詞的辨別因子;如果標(biāo)有,則特定句子元素的鏈接指針和該離合詞辨別因子檢查原始的英語句子是否是過去時態(tài);同時,其檢查原始的英語句子是否具有頻率副詞;這是第一特定翻譯模塊(501)的過程;通過詞庫(100),特定句子元素的鏈接指針檢查每個中文譯詞和每個輸入的原始英語單詞是否標(biāo)有程度補語的辨別因子;如果標(biāo)有,則特定句子元素的鏈接指針和該辨別因子檢查該中文譯詞(程度補語)是否伴隨原始英語句子翻譯出的中文動詞;這是第二特定翻譯模塊(502)的過程;通過詞庫(100),特定句子元素的鏈接指針檢查每個中文譯詞和每個輸入的英語單詞是否標(biāo)有結(jié)果補語的辨別因子;如果標(biāo)有,則特定句子元素的鏈接指針和該辨別因子檢查該中文譯詞(結(jié)果補語)是否伴隨原始英語句子翻譯出的中文動詞;這是第三特定翻譯模塊(503)的過程;通過詞庫(100),特定句子元素的鏈接指針檢查中文譯詞和原始英語單詞是否標(biāo)有被動語態(tài)的辨別因子;結(jié)果是肯定的,特定句子元素的鏈接指針和該辨別因子檢查原始英語句子翻譯出的中文動詞是否支配生物/事物的動作或?qū)ζ洚a(chǎn)生影響;并且其檢查緊跟在英語動詞后面的英語介詞的中文譯詞在中文語言中是否正確;這是第四特定翻譯模塊(504)的過程;通過詞庫(100),特定句子元素的鏈接指針檢查每個翻譯出的中文短語和每個原始英語短語是否標(biāo)有“be+形容詞”的辨別因子;如果是,則特定句子元素的鏈接指針和該辨別因子刪除原始英語單詞“be”的中文譯詞,然后根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞;這是第五特定翻譯模塊(505)的過程。
5.一種自動翻譯方法,其由以下各階段所組成階段(S100)具有詞庫;階段(S200)將所輸入的原始句子的單詞分析成詞素單位;階段(S300)其針對包含詞性的基本句子元素排列(200)的結(jié)果,并根據(jù)詞典數(shù)據(jù)庫將英語單詞翻譯成中文的字詞;階段(S400)檢查在(300)的結(jié)果中是否存在復(fù)合詞、習(xí)慣用語、俗語;如果存在,則該裝置(400)將它們的基本句子元素調(diào)節(jié)成調(diào)節(jié)性句子元素,如果需要,轉(zhuǎn)換它們的詞性(在該過程中,創(chuàng)建新轉(zhuǎn)換的詞類);并且該裝置根據(jù)詞典數(shù)據(jù)庫將原始的英語單詞翻譯為中文字詞;階段(S500)檢查(300)的結(jié)果、(400)的結(jié)果,并通過特定句子元素的鏈接指針檢查所輸入的原始句子;如果兩者之間存在鏈接數(shù)據(jù),則該裝置(500)檢查單詞的數(shù)據(jù)是否標(biāo)有辨別因子;如果是,則特定句子元素的鏈接指針和辨別因子指示單詞應(yīng)由5個(特殊)特定翻譯模塊之一來控制;該裝置重新檢查每個(特殊)特定翻譯模塊的結(jié)果并根據(jù)中文語言的詞序規(guī)則重新排列中文譯詞和詞序;階段(S600)檢查(500)的結(jié)果,并根據(jù)中文語法的特殊翻譯狀況刪除最終中文譯句中不需要的中文譯詞,并插入最終中文譯句中需要的特殊中文字詞;并且該階段重新檢查第二次翻譯出的中文字詞(其由特定翻譯模塊再次轉(zhuǎn)換而來)是否與詞庫的詞序規(guī)則有聯(lián)系;如果是,該階段根據(jù)中文語法的詞序規(guī)則重新構(gòu)造第二次翻譯出的中文字詞的詞序;階段(S700)輸出完整的中文譯句;并且階段(S500)由以下各階段所組成階段(S501)特定句子元素的鏈接指針和辨別因子檢查原始英語句子翻譯出的中文動詞是否屬于離合詞——中文語法中的一種動詞;如果是屬于離合詞,則第一特定翻譯模塊檢查原始的英語句子是否是過去時態(tài);結(jié)果是過去時態(tài),第一特定翻譯模塊在翻譯出的中文動詞的兩個分開的字詞之間插入“了”字(該中文字表示句子是過去時態(tài));接下來,第一特定翻譯模塊通過特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否具有頻率副詞;如果具有,則該模塊將英語頻率副詞的中文譯詞緊跟在“了”字的后面;如果英語句子不是過去時態(tài),則放置英語頻率副詞的中文譯詞即可,不需要加“了”字;階段(S502)如果檢查發(fā)現(xiàn)中文譯詞是程度補語,則第二特定翻譯模塊通過特定句子元素的鏈接指針和辨別因子檢查該程度補語是否伴隨著原始英語句子翻譯出的中文動詞;如果是,則該模塊將中文字“得”緊跟在翻譯出的中文動詞后面;并且該模塊將程度補語的中文譯詞緊跟在“得”字之后;階段(S503)如果檢查發(fā)現(xiàn)中文譯詞是結(jié)果補語,則第三特定翻譯模塊通過特定句子元素的鏈接指針和辨別因子檢查該結(jié)果補語是否伴隨著原始英語句子翻譯出的中文動詞;如果是,則該模塊在翻譯出的中文動詞后面緊接著插入結(jié)果補語的中文譯詞;階段(S504)特定句子元素的鏈接指針和辨別因子檢查原始的英語句子結(jié)構(gòu)是否是“be+過去分詞”;如果是,則第四特定翻譯模塊檢查原始英語句子翻譯出的中文動詞是否支配生物/事物的動作或?qū)ζ涫┘佑绊?;如果是,則在該翻譯出的中文動詞前面加上中文字“被”(這個字在中文中表示被動語態(tài));接下來,該模塊根據(jù)中文語法重新檢查英語介詞(其緊跟在英語動詞的后面)的中文譯詞——該中文譯詞是否適合翻譯出的中文動詞;因為英語介詞的中文譯詞在中文語法中具有一些特殊的翻譯狀況;接下來,該模塊根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞;階段(S505)特定句子元素的鏈接指針和辨別因子檢查原始的英語句子是否是形容詞短語句子;如果是,則第五特定翻譯模塊刪除原始英語單詞“be”的中文譯詞,然后根據(jù)中文語言的詞序規(guī)則重新構(gòu)造中文譯詞;在裝置的階段(S500)中,特定句子元素的鏈接指針、辨別因子和每個特定翻譯模塊是三位一體的。
全文摘要
本發(fā)明涉及自動翻譯器、由該自動翻譯器所使用的自動翻譯方法和用于編寫該自動翻譯方法的記錄媒體。本發(fā)明使句子的翻譯(英語句子<=>中文句子)更正確、自然。因為在將英語翻譯為中文及將中文翻譯為英語時,通過特定的算法將中文語法的特殊屬性考慮在內(nèi)了。特定算法是本發(fā)明的主要概念。本發(fā)明的自動翻譯器由以下各項所組成1)詞庫(100);2)分析裝置(200);3)排列裝置(300);4)裝置(400)-調(diào)節(jié)性翻譯模塊;5)裝置(500)-特定翻譯模塊;6)裝置(600)-一般翻譯模塊;7)裝置(700)-其輸出完整的中文譯句。與裝置(500)(即特定翻譯模塊)鏈接的特定句子元素的鏈接指針與5個(特殊)翻譯模塊(501~505)相互配合。通過1)、2)、3)、4)、5)、6)、7)的過程和第一特定翻譯模塊(501)至第五特定翻譯模塊(505),可使句子的翻譯(英語句子<=>中文句子)更正確、自然。本發(fā)明已通過本申請人于2003年3月開發(fā)的演示程序(應(yīng)用了特定的算法)得到了完全證實。
具體實施方式
和圖5、6、7、8、9中的所有示例句子都是從演示程序引用的。
文檔編號G06F17/28GK1910574SQ200580002031
公開日2007年2月7日 申請日期2005年1月3日 優(yōu)先權(quán)日2004年1月6日
發(fā)明者李仁燮 申請人:李仁燮
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1