專利名稱::一種機器翻譯方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種機器翻譯方法及系統(tǒng)。
背景技術(shù):
:語言是人類相互交流中使用最廣泛的工具,然而,不同民族、不同國家之間常常使用著不同的語言,這阻礙了人們直接進行意思交換,而需要借助于翻譯來達成不同語言之間的相互意思傳遞。隨著世界各國人民之間的交流的日益頻繁,單純依靠人力翻譯顯然無法滿足人們相互交流的需要,機器翻譯應(yīng)運而生。機器翻譯一直被認為是突破語言障礙的主要途徑,然而,現(xiàn)今的機器翻譯尚無法成為一種可信的信息交流工具。在相當多的情況下,機器翻譯系統(tǒng)的譯文不知所云,令人無法得知對方真實表達的意思。機器翻譯的質(zhì)量亟待提高。
發(fā)明內(nèi)容有鑒于上述背景,本發(fā)明的目的是提供一種機器翻譯方法和系統(tǒng),能夠得到高質(zhì)量的譯文,從而使機器翻譯真正成為一種可信的語言交流工具。為了解決上述技術(shù)問題,本發(fā)明采用了如下技術(shù)方案一種機器翻譯方法,包括獲取待翻譯的第一語種的語句;識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組;翻譯所述第一語種的語句的主語詞組、謂語詞組和賓語詞組為第二語種的主語詞組、謂語詞組和賓語詞組;按照所述第二語種的語言表達方式排布所述第二語種的主語詞組、謂語詞組和賓語詞組,形成為第二語種的語句。所述的方法,還包括識別所述第一語種的語句中是否包含連接詞,以及翻譯該連接詞為第二語種的連接詞。所述的方法,識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組的方式是識別所述語句的主語詞組、謂語詞組和賓語詞組是否標記有詞組標記符。所述的方法,還包括識別所述第一語種的語句的主語詞組是否包括主語修飾語,識別所述第一語種的語句的謂語詞組是否包括謂語修飾語,識別所述第一語種的語句的賓語詞組是否包括賓語修飾語。所述的方法,識別所述主語修飾語、謂語修飾語或賓語修飾語的方式是識別主語詞組、謂語詞組或賓語詞組中是否標記有修飾語標記符。所述的方法,還包括識別所述第一語種的語句是否包含問句。所述的方法,識別所述第一語種的語句是否包含問句的方式是識別主語詞組、謂語詞組或賓語詞組后面是否有提問標記符。所述的方法,識別后的所述第一語種的語句按如下格式順序排列主語、主語的提問標識符、主語修飾語、謂語、謂語的提問標記符、謂語修飾語、賓語、賓語的提問標識符、賓語修飾語;當所述主語、主語的提問標識符、主語修飾語、謂語、謂語的提問標記符、謂語修飾語、賓語、賓語的提問標識符、賓語修飾語中的一種或多種缺失時,在排列時相應(yīng)置空。所述的方法,所述主語修飾語、謂語修飾語、賓語修飾語在排列時,分別位于一括號內(nèi)。所述的方法,在獲取待翻譯的第一語種的語句之前,還可以包括接收從輸入接口輸入的第一語種的自然語句;識別第一語種的每一個自然語句是否包含主語詞組、謂語詞組和賓語詞組,如果不是,則將該語句補充成包括主語詞組、謂語詞組和賓語詞組的完整結(jié)構(gòu),形成為待翻譯的第一語種的語句。也可以包括下述標記過程的一種或多種為第一語種的主語詞組、謂語詞組和賓語詞組標記上詞組標記符;為第一語種的主語詞組中的主語修飾語、謂語詞組中的謂語修飾語之間、賓語詞組中的賓語修飾語標記上修飾語標記符;對包含問句的第一語種的語句,為被提問的主語詞組、謂語詞組或賓語詞組標記上提問標記符。本發(fā)明還公開了一種機器翻譯系統(tǒng),包括獲取單元,用于獲取待翻譯的第一語種的語句;識別單元,用于識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組;翻譯單元,用于翻譯所述第一語種的語句的主語詞組、謂語詞組和賓語詞組為第二語種的主語詞組、謂語詞組和賓語詞組;成形單元,用于按照所述第二語種的語言表達方式排布所述第二語種的主語詞組、謂語詞組和賓語詞組,形成為第二語種的語句。所述的系統(tǒng),所述識別單元還用于識別所述第一語種的語句中的連接詞,所述翻譯單元還用于翻譯所述第一語種的語句中的連接詞。所述的系統(tǒng),識別單元識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組的方式是識別所述語句的主語詞組、謂語詞組和賓語詞組是否標記有詞組標記符。所述的系統(tǒng),識別單元還用于識別所述第一語種的語句的主語詞組是否包括主語修飾語,識別所述第一語種的語句的謂語詞組是否包括謂語修飾語,識別所述第一語種的語句的賓語詞組是否包括賓語修飾語。所述的系統(tǒng),識別單元識別所述主語修飾語、謂語修飾語或賓語修飾語的方式是識別主語詞組中是否標記有修飾語標記符、識別謂語詞組中是否標記有修飾語標記符、識別賓語詞組中是否標記有修飾語標記符。所述的系統(tǒng),識別單元還用于識別所述第一語種的語句是否包含問句。所述的系統(tǒng),識別單元識別所述第一語種的語句是否包含問句的方式是識別主語詞組、謂語詞組或賓語詞組后面是否有提問標記符。所述的系統(tǒng),還包括排列單元,用于將識別后的所述第一語種的語句按如下格式順序排列主語、主語的提問標識符、主語修飾語、謂語、謂語的提問標記符、謂語修飾語、賓語、賓語的提問標識符、賓語修飾語;當所述主語、主語的提問標識符、主語修飾語、謂語、謂語的提問標記符、謂語修飾語、賓語、賓語的提問標識符、賓語修飾語中的一種或多種缺失時,在排列時相應(yīng)置空。所述的系統(tǒng),所述排列單元還用于將所述主語修飾語、謂語修飾語、賓語修飾語分別放置于一括號內(nèi)。所述的系統(tǒng),還包括預(yù)處理單元,用于接收從輸入接口輸入的第一語種的自然語句;以及識別第一語種的每一個自然語句是否包含主語詞組、謂語詞組和賓語詞組,如果不是,則將該語句補充成包括主語詞組、謂語詞組和賓語詞組的完整結(jié)構(gòu),形成為待翻譯的第一語種的語句。排列單元還可以用來進行如下標記操作的一種或多種為第一語種的主語詞組、謂語詞組和賓語詞組分別標記上詞組標記符;為第一語種的主語詞組中的主語修飾語、謂語詞組中的謂語修飾語之間、賓語詞組中的賓語修飾語標記上修飾語標記符;對包含問句的第一語種的語句,為被提問的主語詞組、謂語詞組或賓語詞組標記上提問標記符。本發(fā)明的方法和系統(tǒng),通過識別第一語種格式語句中的主語詞組、謂語詞組和賓語詞組,再相應(yīng)的將其翻譯成第二語種的主語詞組、謂語詞組和賓語詞組并按第二語種的語言表達方式進行排布,使得翻譯能夠符合語義邏輯,從而得到高質(zhì)量的譯文,真正使機器翻譯方法和系統(tǒng)成為一種可信的實用翻譯工具。圖1描述了自然語言的差異性和共通性;圖2描述了本發(fā)明的基本發(fā)明原理;_圖3描述了本發(fā)明示例中的語義邏輯表達式分別如何對應(yīng)于符號學觀點和語言學觀點;圖4描述了本發(fā)明示例中的由自然語言到符號語言句型的轉(zhuǎn)換過程;圖5描述了本發(fā)明示例中從一個語種到另一語種的轉(zhuǎn)換流程;圖6描述了本發(fā)明示例中一個語種到另一語種的轉(zhuǎn)換實例;圖7描述了本發(fā)明具體實施方式的機器翻譯方法的流程。具體實施例方式下面對照附圖并結(jié)合具體實施方式對本發(fā)明進行進一步詳細說明。1.發(fā)明原理21世紀的人類已經(jīng)進入到信息社會,信息社會的基本特征是網(wǎng)絡(luò)互聯(lián)、語言互通、資源共享和協(xié)同工作。語言互通(人與人互通、人與機互通)是資源共享、協(xié)同工作的基礎(chǔ),對信息社會的發(fā)展和完善起著關(guān)鍵的作用。審視機器翻譯的目標,應(yīng)當看到,由于語言之間的差別涉及到語言文化、社會背景上的差異,這使得自然語言具有極大的不規(guī)則性,在這種現(xiàn)實的情況下,建立窮盡一切自然語言不規(guī)則性的邏輯模型從而達到機器的全自動翻譯是不現(xiàn)實的。因此,將機器翻譯關(guān)注的重點放在某些受限領(lǐng)域是一個更現(xiàn)實的目標。從目前來看,對翻譯最迫切的需求來自于互聯(lián)網(wǎng)的即時通訊,例如國際聊天、電子郵件、翻譯摘要、外語寫作草稿生成、商務(wù)信息服務(wù)等等。這些即時通訊著重的是語義的邏輯性,即在這些領(lǐng)域中,更關(guān)注于信息的內(nèi)容,而對信息的表達形式,例如用詞精美、結(jié)構(gòu)嚴謹?shù)鹊确矫娌⒎顷P(guān)注重點。把握"語言的本質(zhì)是邏輯語義的表達"這一核心,本發(fā)明借助于符號語言學的觀點,透視語言的本質(zhì)特征,抽取語言的共性,從而構(gòu)建出一個人機共識的中間語言模型,作為語義通訊的協(xié)議,這一協(xié)議在本發(fā)明中被稱為語際通訊協(xié)議或互聯(lián)語(InterlanguageProtocol,簡稱ILP)。以ILP為中間語言模型的翻譯,稱為ILP格式化翻譯。如圖1所示,從符合語言學的觀點看,信息交流時表達的對象具有客觀性,這些對象的結(jié)構(gòu)、功能,無論是使用何種語言的人們來看,都是相同的。由此,客觀對象在人腦中反映的概念(客觀對象的主觀印象)具有共通性。自然語言間的真正差異在于采用何種符號來對這些概念進行表達,也即用符號表達一個共通的概念具有任意性,這種任意性的符號最終導致的不同自然語言表達同一客觀對象上的不規(guī)則性。例如,數(shù)字"1",從發(fā)音的角度,在英語中是[wAn],在漢語中則是[yi]。從文字的角度,在英語中是"one",在漢語中則是"一"。然而,不管其符號表達形式如何變化,其表達的概念都是相同的,代表著數(shù)量只有一個。如圖2所示,從概念的共通性出發(fā),可以看到,這種共通性的核心在于語義的邏輯——各語素之語義的關(guān)系。通過構(gòu)建統(tǒng)一的語義表達式來表達共同的概念,可使自然語言之間具有共通的語法。由此,通過規(guī)范化的IL符號語言,使得對同一對象具有規(guī)則性的表達。從表1中可以看到如何由自然語言通過統(tǒng)一的語義邏輯表達式而表達同一事物。表l<table>tableseeoriginaldocumentpage9</column></row><table>如圖3所示,從語言學觀點看,語言一般由語義、語法、語素組成,最終形成語句或文字;而從符號學觀點,語言一般由符號語言的圖標、編碼或文字組成,形成最終表達的合邏輯的信息。兩者之間可以通過語義邏輯表達式相聯(lián)系。語義邏輯表達式的功能是表達一組合邏輯的信息一語義,而不顧及自然語句所附帶的語言藝術(shù)或個性特色。這樣,人類語言有了共同的語法,使各種自然語言的語義能夠互相傳遞并在邏輯上昜于互相理解。作為通用語法,應(yīng)能描述任意的邏輯過程。如圖4所示,從最底層的應(yīng)用來說,自然語言的句型是無限的、不可窮舉的,而在抽取語義邏輯之后,邏輯語言句型就成為有限類的,最終,通過設(shè)計,可以由邏輯語言句型設(shè)計出唯一的符號語言句型(IL)。借助人工智能有關(guān)知識表示的原理(每個語句都是描寫一個"微型場景"的劇本),參考計算機語言的基本邏輯功能,可以得出下列的句型范式。它像一個二維表格,邏輯功能上包含了計算機語言的4種基本的語句,所以也像計算機語言那樣能表達任何邏輯思維。將二維表格線性化,便得出句型的結(jié)構(gòu)范式。這就是體系中的統(tǒng)一的、唯一的句式,也是本發(fā)明的語義通訊協(xié)議(ILP)的語法框架。在IL體系中,唯一的句型范式是:連結(jié)詞基本句其中,連接詞主要用于連接多個基本句,例如中文中的"因為……所以……"等。基本句的框架是主語詞組謂語詞組賓語詞組其中,主語詞組、謂語詞組和賓語詞組的構(gòu)成分別為主語詞組的構(gòu)成為主語([]提問;修飾)謂語詞組的構(gòu)成為謂語({}提問;修飾)賓語詞組的構(gòu)成為賓語((?)提問;修飾/補語)最終的句型范式是連結(jié)詞主語([廣問;修飾)謂語({}提問;修飾)賓語((?)提問;修飾)其中,主語詞組、謂語詞組和賓語詞組一般的詞性如下,另對于這三種詞組,其可能也包括修飾語,也即主語詞組包括主語和主語修飾語;謂語詞組包括謂語和謂語修飾語;賓語詞組包括賓語和賓語修飾語。,對于問句,包括了對主語詞組、謂語詞組或賓語詞組的提問,具體格式如表2。主語詞組冠詞*單形容詞*主語([]提問;修飾短語)謂語詞組助動詞*單副詞*動詞({}提問;修飾短語)賓語詞組冠詞'單形容詞*賓語((?)提問;修飾短語)上述的基本句型具有計算機語言基本邏輯功能,可表達4種邏輯語句*敘述句甲=A;乙〕B;*祈使句使丙二C;丁+Ae(進入)F;庚J(作用于)f(X);*疑問句比是什么({});X是((?))Y;M作用于((?l如何)N*判斷句如果事件X是真,則做事F(X);否則轉(zhuǎn)做事G(y).表2連接詞Conjunction主語Subject謂語Predicate賓語Object基本句m對主語提問;[]Inquirytosubject;{}對謂語提問;{}Inquirytopredicate;()對賓語提問;()Inquirytoobject;Basicsentenc對主語修飾Decoratestosubject對謂語修飾Decoratestopredicate對賓語修飾/補語Decorates/10Complementtotheobject連接詞Conjunction主語Subject謂語Predicate賓語Object基本句[]對主語提問;[]Inquirytosubject;{}對謂語提問;{}hupiirytopredicate;()對賓語提問;15()Inquirytoobject;Basicsentenc6對主語修飾Decoratestosubject對謂語修飾Decoratestopredicate對賓語修飾/補語Decorates/Complementtolheobj經(jīng)O下面我們首先給出本文中的一些名詞與其簡稱的對照K一互聯(lián)語("語際語,,)Interlanguage亂一自然語言NaturalLanguageILP_語際協(xié)議InterLanguageProtocol(語義通訊協(xié)議)NIL—IL格式化的自然語言ENIL—IL格式化的英語如圖5所示,在進行互聯(lián)語通訊時,首先通過計算機的輔助將A語轉(zhuǎn)換成IL格式的A語,然后,通過IL語的語際協(xié)議,可以將IL格式的A語轉(zhuǎn)換為IL格式的B語,最后由IL格式的B語可以變換到B語。如圖6所示,實現(xiàn)自然語言間的自動翻譯之最大障礙是語法和句法的自動識別和轉(zhuǎn)換,采用人機共識的中間語言可以避開這個障礙。我們通過計算機輔助(IL格式化輔助軟件)不難實現(xiàn)完整化一將自然語言中省略/或缺的部分補齊。規(guī)格化一IL句型符合多數(shù)語言的語法規(guī)則和句型。人機互動,容易將輸入句子IL格式化;將復合句分拆成獨立句子。標簽化一按照通用語法的要求,系統(tǒng)對所有句子成分加蓋語法標簽。結(jié)構(gòu)化一所有句子成分在上述的IL句型范式中定位、定格。2.發(fā)明實現(xiàn)如圖7,由以上原理,本發(fā)明具體實施方式的機器翻譯方法,包括1)獲取待翻譯的第一語種的語句;2)如果該第一語種的語句不是基本句,識別所述第一語種的語句是否有連接詞;3)識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組;4)翻譯所述第一語種的語句的主語詞組、謂語詞組和賓語詞組為第二語種的主語詞組、謂語詞組和賓語詞組;5)按照所述第二語種的語言表達方式排布所述第二語種的主語詞組、謂語詞組和賓語詞組,形成為第二語種的語句。該方法主要是通過識別出一個語句中的主語詞組、謂語詞組和賓語詞組,從而能夠在翻譯時按照語義邏輯進行翻譯。識別時的一種便利的識別方式是通過語句中的各種標記符進行識別。例如,通過主語詞組、謂語詞組和賓語詞組的詞組標記符而識別出主語詞組、謂語詞組和賓語詞組。如前文所述,三種詞組可能都包含修飾語,同樣的,對于主語和主語修飾語,謂語和謂語修飾語,賓語和賓語修飾語,可以通過修飾語標記符來進行識別。另外,對于問句,可以通過提問標記符來進行識別。上述的幾種標記符可以采用各種符號,例如,詞組標記符可以采用下劃線,修飾語標記符可以采用括號,問句標記符可以采用問號。當然,以上幾種標記符也同樣可以采用其他的符號來進行標記。相應(yīng)的,本發(fā)明具體實施方式的翻譯系統(tǒng),包括-獲取單元,用于獲取待翻譯的第一語種的語句;識別單元,用于識別第一語種的語句是否有連接詞,以及識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組;翻譯單元,用丁翻譯第一語種的語句的主語詞組、謂語詞組和賓語詞組為第二語種的主語詞組、謂語詞組和賓語詞組;成形單元,用于按照第二語種的語言表達方式排布所述第二語種的主語詞組、謂語詞組和賓語詞組,形成為第二語種的語句。在獲取單元獲取待翻譯的第一語種的語句之前,也可以通過預(yù)處理單元進行一些預(yù)處理。在從輸入接口接收到輸入的第一語種的自然語句后,對其進行預(yù)處理,預(yù)處理主要包括識別該自然語句是否包含主語詞組、謂語詞組和賓語詞組,如果不是,則將該語句補充成包括主語詞組、謂語詞組和賓語詞組的完整結(jié)構(gòu);為第一語種的主語詞組、謂語詞組和賓語詞組標記上詞組標記符;為第一語種的主語詞組中的主語修飾語、謂語詞組中的謂語修飾語、賓語詞組中的賓語修飾語標記上修飾語標記符;對包含問句的第一語種的語句,為被提問的主語詞組、謂語詞組或賓語詞組標記上提問標記符。例如,如圖6所示,該圖中,第一語種為中文,第二語種為英文?,F(xiàn)在,需要將一句中文的自然語句"昨天在會上發(fā)言的是你嗎?"翻譯成英文。首先,可以通過計算機的輔助輸入系統(tǒng)(預(yù)處理單元)進行預(yù)處理,形成為"咋天在會t發(fā)言的(那個人)是(「])邇",可以看到,首先,該句為基本句,沒有連接詞;其次,主語詞組中只有修飾語,而沒有主語,經(jīng)過處理后,被補充完成,即"那個人",整個語句中,"昨天在會上發(fā)言的那個人"是主語詞組,"是"是謂語詞組,"你"是賓語詞組,謂語詞組和賓語詞組都沒有修飾語,其中,由于是對謂語提問,因此,在謂語詞組后還標記有提問標記符。而在主語詞組中,包括幾個主語修飾語,分別是"昨天"、"在會上"、"發(fā)言的",識別后的第一語種的語句,按照前述的IL范式語句排布"那個人(昨天,在會上,發(fā)言}是{<>}你",在這個句式中,按主語、主語的提問標識符(此例缺)、主語的修飾語、謂語、謂語的提問標識符、謂語的修飾語(此例缺)、賓語、賓語的提問標識符(此例缺)、賓語的修飾語(此例缺)順序排布,位于修飾語標記符"{}"中的主語修飾語"昨天,在會上,發(fā)言"放在主語"那個人"之后,謂語的提問標記符"?"放在被提問的謂語"是"之后。根據(jù)這個范式句型,第一語種(中文)的語句被翻譯為第二語種(英文)的語句"That{gavespeechinmeeting,yesterday}were{<>}you",最后,按照英文的語言表達方式對其進行排布,得到"Werethatyouwhogavespeechinthemeetingyesterday',從翻譯后的語句可以看到,整個語句的語義邏輯表達是非常清晰的。3.效果對比以上是對發(fā)明原理和具體實現(xiàn)的描述,下面,我們通過幾個示例來對比現(xiàn)有技術(shù)和本發(fā)明的效果。從這些示例中,可以清楚的看到利用本發(fā)明的翻譯方法和系統(tǒng),盡管在語法上仍然可能有一些錯誤,但在語義表達上,是符合語義邏輯的,用戶從翻譯后的語句中可以得到原始語句想表達的邏輯含義。表3<table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table><table>tableseeoriginaldocumentpage16</column></row><table>以上兩表,表3是Google翻譯效果(2008年9月30日),10例中只有3例正確;而表4則是本發(fā)明(2008年9月30日)的翻譯效果,可以看到其邏輯沒有錯誤,只是一些單詞的錯誤。下面我們以一段文字的翻譯來比較Google翻譯與本發(fā)明翻譯的效果。其中,對譯錯之處,進行了涂黑標記。待翻譯文字-語言障礙是世界級的難題。演進了幾千年的人類文明還未能讓任何國際人群可直接交換意向。ILC為解決語言互通問題,創(chuàng)建了全新的語言互通體系IL,提出以語言互通協(xié)議ILP為核心、以人/機共識的互聯(lián)語言(Inter-language)為基礎(chǔ)的全球通譯網(wǎng)絡(luò)系統(tǒng)。該系統(tǒng)為突破雙重語言障礙提供了最為簡易有效的方法和工具。該系統(tǒng)能使不同國度、不同民族的人群直接(不經(jīng)第三者翻譯)借助于計算機與手機等工具,用本土文字直接溝通國際信息,進行全球化協(xié)同工作。語言互通是信息內(nèi)容自動處理的前提和基礎(chǔ),其突破性進展將促成社會信息化的新躍進,并引發(fā)新一輪的信息技術(shù)革命。Google翻譯引擎〖譯錯處涂上灰色3(2008年9月30日)C>E中/英Thelanguagebarrierisaworld-classproblem.Forthousandsofyearstheevolutionofhumancivilizationhasnotallowedanyinternationalgroupscanbedirectlyexchangedintention.IIXtoresolvetheissueofinteroperabilitylanguage,thelanguageofcreationofanewexchangesystemILlanguageinteroperabilityagreementtoILPatthecore,thepeople/consensusontheInternetlanguage(Inter-language)-basedglobalnetwork-translationsystem.Thesystemforthedoublelanguagebarrierbreakthroughprovidethemostsimpleandeffectivemethodsandtools.Thesystemenablesdifferentcountry,differentethnicgroupsdirectly(notthroughathirdpartytranslation)throughtheuseofcomputersandmobilephonesandothertoolstocommunicatedirectlywiththelocallanguageofinternationalinformationforglobalizationtoworktogether.Languageexchangeinformationautomaticallywiththeprerequisiteandbasisforitsbreakthroughinthedevelopmentoftheinformationsocietywillleadtoanewleapforward,andtriggeranewroundoftheinformationtechnologyrevolution-E〉C英/中:語言障礙,是一個世界級的問題。千百年來的演變是人類文明^3Si^任何國際團體,可直接交換意向。國際法來解決問題,互通語言,語言創(chuàng)造了新的匯率制度黨總書記,語言互通協(xié)議,以進為核心的人/共識,對網(wǎng)絡(luò)語言(跨語言)-基于全球網(wǎng)絡(luò)翻譯制度。該系統(tǒng)為雙語言障礙的突破提供了最簡單和有效的方法和工具。該系統(tǒng)使不同國家,不同族群的直接(不通過第三方翻譯),通過使用電腦和手機等工具直接溝通,與當?shù)卣Z言的國際信息全球化一道工作。語言自動交換信息與前提和基礎(chǔ),它的突破,在信息社會的發(fā)展將導致新的飛躍,并引發(fā)新一輪的信息技術(shù)革命。本發(fā)明的翻譯(2008年9月30日)語言障礙是世界級的難題。人類文明(演進了幾千年)還未能做到任何國際人群能夠交換(直接地)意向。ILC創(chuàng)建了(為語言的通信)全新的IL體系(語言互相通訊),提出系統(tǒng)(全球翻譯網(wǎng)絡(luò));這系統(tǒng)的核心是語言互相通訊的協(xié)議ILP、這系統(tǒng)的基礎(chǔ)是互聯(lián)網(wǎng)語言Inter-language(人/機共識)。該系統(tǒng)提供了(為突破雙重的語言障礙)最簡易/有效的方法/工具。該系統(tǒng)能做到不同民族的人群用本土文字,借助工具(計算機與手機等),直接進行(不用第三者的翻譯)國際通訊,進行全球的協(xié)同工作。語言的互相通訊是前提和基礎(chǔ)(自動地處理信息的內(nèi)容),其突破性的進展將促成新躍進(社會信息化的),并,引發(fā)新的信息技術(shù)革命。該系統(tǒng)能做到:不同民族的人群用本國文字,借助工具(計算機與手機等),直接進行(不用第三者的翻譯)國際通訊,進行全球的協(xié)同工作。C>E(中翻英)Thelanguagebarrieristheworld-classdifficultproblem.Thehumanculture(evolutionseveralmillenniums)havenotbeenabletoachieve:Anyinternationalcrowdcanexchange(directly)theintention.IIXfounded(forlanguagecorrespondence)thebrand-newsystem(languagemutuallycommunication),proposesthesystem(globaltranslationnetwork);ThissystemcoreislanguagecommunicationagreementILP,thissystemfoundationismutuallyInternetlanguageInter—language(human/machinemutualrecognition).Thissystemhasprovided(forbreakthroughduallanguagebarrier)thesimplest/effectivemethod/tool.Thissystemcanachieve:Thedifferentnationality'scrowdwithourcountrywriting,withtheaidofthetool(computerandhandsetandsoon),carriesondirectly(doesnotusethirdparty'stranslation)theinternationalcommunication,carriesonglobalthejointoperation.Thelanguagethecommunicationismutuallythepremiseandthefoundation(automaticallyprocessinformationcontent),itsunprecedentedprogresswillfacilitateleapsforwardnewly(socialinformationization),and,willinitiatetherecentinformationtechnologyrevolution.E>C(英翻中)語言MM是國際水平的困難的問題。人類文化(演變幾個千年)未能達到所有國際人群能交換(直接地)意圖。ILC建立了(為語言書信)全新的IL系統(tǒng)(相互語言通信),提出系統(tǒng)(全球性翻譯網(wǎng)絡(luò));這個系統(tǒng)核心是語言通信協(xié)議ILP,這個系統(tǒng)基礎(chǔ)i!S^互聯(lián)網(wǎng)語言中間語言(人或機器互相承認)。這個系統(tǒng)提供了(為突破雙重語言障隘)最簡單或有效的方法或工具。這個系統(tǒng)可能達到另外國籍的人群以我們的國家文字,在工具的幫助下(計算機和手機等等),直接地1M(不使用第三方翻譯)國際通信,繼續(xù)全球性聯(lián)合作戰(zhàn)。相互通信(在語言之間)是前提和基礎(chǔ)(自動地處理信息內(nèi)容),它史無前例的進展將促進社會informationization最近今后飛躍,并且,將創(chuàng)始最近信息技術(shù)革命。由以上對比可以看到,利用本發(fā)明的翻譯方法和系統(tǒng),翻譯后的語句更符合語義邏輯,大大提高了譯文的質(zhì)量。下面我們也提供本發(fā)明翻譯系統(tǒng)在多種語言之間的多方轉(zhuǎn)譯的效果。可以看到本發(fā)明能在各種語言之間基本正確傳遞語義,其翻譯效果已達到現(xiàn)有的機譯系統(tǒng)未能達到的境界。中文原稿c語言的互相通訊是前提和基礎(chǔ)(自動地處理信息的內(nèi)容),其突破性的進展將促成新躍進(社會信息化的),并且,引發(fā)新的信息技術(shù)革命。IL系統(tǒng)能做到:不同民族的人群用本國文字,借助工具(計算機與手機等),直接進行(不用第三者的翻譯)國際通訊,進行全球的協(xié)同工作。1.C—E(中文/英文)Thelanguagemutualcommunicationisthepremiseandthefoundation(automaticallyprocessinformationcontent),itsunprecedentedprogresswillfacilitateleapsforwardnewly(socialinformationization),and,'initiatestherecentinformationtechnologyrevolution.Thesystemcanachieve:Thedifferentnationality'scrowdwithourcountrywriting,withtheaidofthetool(computerandhandsetandsoon),carriesondirectly(doesnotusethirdparty'stranslation)theinternationalcommunication,carriesonglobalthejointoperation,2.E_F(英文/法文)Lacommunicationmutuelledelangueestleslieuxetlabase(automatiquementcontenude1,informationdeprocessus),sonprogrfessanspr6c6dentfaciliteradessautsenavantnouvellement(informationizationsocial),et,desinitioslarevolutionr6cervtedetechnologiede1,information.systfemede1,peutr6aliser:LafouledeIelnationalit6diff6renteavecnotre6crituredepays,dil,aidedel,outil(ordinateuretcombin6etainsidesuite),continuedirectement(n,emploiepaslatraductiondutiers)lacommunicationinternationale,continueglobal1,operationcommune-3.F—E(法文/英文)Themutualcommunicationoflanguageistheplacesandthebase(automaticallycontainedinformationofprocess),itsprogresswithoutprecedentwillfacilitatejumpsaheadlately(informationizationsocial),and,initiatestherecentrevolutionoftechnologyinformation.ThesystemofITcanrealize:Thecrowdofnationalitydifferentwithourwritingfromcountry,usingthetool(computerandcombinedandsoon),directlycontinues(thetranslationofthethirddoesnotemploy)theinternationalcommunication,continuestotalthecommonoperation.4.C一S(中文/西班牙文)Lacomunicaci6nmutuadelalenguaeslapremisaylafundaci6n(automciticainentecontenidodeinformaci6ndeproceso),suprogresosinprecedentefacilitardsaltosadelantenuevamente(informationizationsocial),y,losiniciadoslarevoluci6nrecientedelatecnologiadelainformaci6n,Elsistemadepuedealcanzar:Lamuchedumbredeladiversanacionalidadconnuestraescrituradelpais,conlaayudadelaherramienta(computadoraymicrotel6fonoyasisucesivamente),continiiadirectamente(noutilizalatraducci6ndelosterceros)lacomunicaci6ninternacional,continilagloballaoperaci6ncomiin.5.S—E(西班牙文/英文)Themutualcommunicationofthelanguageisthepremiseandthefoundation(automaticallycontainedofprocessinformation),itsprogresswithoutprecedentwillfacilitatejumpsaheadagain(informationizationsocial),and,theinitiatestherecentrevolutionofthetechnologyoftheinformation*TheILsystemcanreach:Thecrowdofthediversenationalitywithourwritingofthecountry,withtheaidofthetool(computerandmicrotelephoneandsoon),directlycontinues(itdoesnotusethetranslationofthethirdparties)theinternationalcommunication,continuesglobalthecommonoperation-c中文原稿語言的互相通訊是前提和基礎(chǔ)(自動地處理信息的內(nèi)容),其突破性的進展將促成新躍進(社會信息化的),并且,引發(fā)新的信息技術(shù)革命。IL系統(tǒng)能做到:不同民族的人群用本國文字,借助工具(計算機與手機等),直接進行(不用第三者的翻譯)國際通訊,進行全球的協(xié)同工作。6.C—S(中文/西班牙文)Lacomunicaci6nmutuadelalenguaeslapremisaylafimdaci6n(autonwiticamenteconteriidodeinformacicindeproceso),suprogresosinprecedentefacilitardsaltosadelantenuevamente(informationizationsocial),y,losiniciadoslarevoluci6nrecientedelatecnologiadelainformaci6n,Elsistemadepuedealcanzar:Lamuchedumbredeladiversanacionalidadconnuestraescrituradelpais,conlaayudadelaherramienta(computadoraymicrotel6fonoyasisucesivamente),contimiadirectamente(noutilizalatraducci6ndelosterceros)lacomunicaci6ninternacional,continiiagloballaoperaci6ncomiin.7.S^E(西班牙文/英文)Themutualcommunicationofthelanguageisthepremiseandthefoundation(automaticallycontainedofprocessinformation),itsprogresswithoutprecedentwillfacilitatejumpsaheadagain(inforaationizationsocial),and,theinitiatestherecentrevolutionofthetechnologyoftheinformation-TheILsystemcanreach:Thecrowdofthediversenationalitywithourwritingofthecountry,withtheaidofthetool(computerandmicrotel印honeandsoon),directlycontinues(itdoesnotusethetranslationofthethirdparties)theinternationalcommunication,continuesglobalthecommonoperation*8.E~C(英文/中文)語言的相互通信是前提,并且基礎(chǔ)(自動地包含處理信息),它的沒有先例的進展向前將促進躍遷再(informationization社交),禾B,發(fā)起信息的技術(shù)的最近革命。工L系統(tǒng)可能到達不同的國籍的人群與我們的國家的文字的,在工具的幫助下(計算機和microtel印hone等等),直接地繼續(xù)(它不使用第三方的翻譯)國際通信,繼續(xù)全球性共同的操作。9.E-A(英文/阿拉伯文)—_^cJ〕"(j<、、、加(J^_c3_'一'ija_^(4_j^LjLu2j"—tj_I3ijSl_^SIl_^j;《Cil_。j_^產(chǎn)l_kill(j_。i~<J~jl:cA;i_ud^^_;1一、人《'_JiaJlyU:i_3_^LiSJl'_ub&j(j_3jjj^,_^Jlji^jj>■ijj*^J1一U'^j2_^1^_^UJi'10.A—E(阿拉伯文/英文)Mutuallanguageofcommunicationisthepremiseandthebasis(thecontentoftheinformationautomatically),andtheunprecedentedprogressandfacilitatetheachievementofthenewlyleaps(SocialInformatics),andinitiatedtherecentrevolutionininformationtechnology.ThesystemcanachieveII:differentnationalities'sthecrowdwithourwriting,withtheassistanceofatool(computer,telephone,etc.),andcarriesondirectly(doesnotusethird-partytranslation(internationalcommunication,andaglobalco-operation-11.C一E-A--E~C(中文/英文/阿拉伯文/英文/中文)語言的相互溝通是前提和基礎(chǔ)(信息內(nèi)容自動),以及前所未有的進展,并促進實現(xiàn)新跨越(社會信息),并發(fā)起了近年來信息技術(shù)革命。該系統(tǒng)可實現(xiàn)一不同國籍的觀眾與我們的寫作的協(xié)助下,一個工具(電腦,電話等),并進行直接(不使用第三方翻譯)國際交流,并有一個全球性合作。以下是以四種文字(IL符號語言、中文、英文、法文)表達的利用本發(fā)明翻譯系統(tǒng)進行的交易過程,從中可以看到,利用本發(fā)明的翻譯系統(tǒng),交易雙方都能明了對方的邏輯表達,從而使得交易可以正常的進行。其中,第一種文字為符號語言。&:[HL符號語言2工0100.MP3(ILC-102,BC-24516272829).KChines3我要100臺MP3(ILC-102,條紋碼-24516272829).〖English〗Iwant100MP3(ILC-102,barcode-24516272829)?!糉rench〗Jeveux100MP3(ILC-102,barrecode-24516272829.)〖IL符號語言〗I<3>Jc^({}).〖Chines2你能提供({}).KEnglish2Youcanprovide({*})(§):〖IL符號語言〗工〕100.MP3(IT-234).I0({}).〖Chines〗我有100.MP3(IL-234)。你要({}).〖English〗Ihave100MP3.(IT-234).Youwan"{})〖French〗J'ai100MP3(IT-234).Vousvoulez({})〖IL符號語言〗I,*/二〇.〖Chines3其價格是甚么((?)).KEnglish〗what([*])isit,priceKFrench〗cequi([7])estsonprix.<g):〖IL符號語言〗=$30usd〖ChinesU價格是30美元?!糆nglish〗Thepriceis30U.S.dollars.〖French〗Leprixestde30dollars.A:〖IL符號語言〗L多/「({})80%.〖Chines〗把價格可否({})降到80%.〖French〗Vouspouvezfournir({})〖English〗Thepricecan({})droppedto80%.〖French〗Leprixpeutle({})achirt6d80%.§:90%,LI".〖Chines390%吧,請你考慮?!糆nglish〗90%ofit,youmayconsider,〖French〗90%delui,Vousp加tconsidSrer.〖IL符號語言〗JEJc^({}T)..〖Chines3你交({})何時)貨.[[English!!Youhandover({*})when)'goods,〖French〗Vousremettez({7}quand)mardmndises.想nL符號語言H2007.06.29,士Uc^Shenzhen.〖Chines22007年06月29日。交付地點是深圳。〖English2June29,2007,DeliverylocationsisShenzhen,〖French〗29juin200—7.EmplacementsdelivraisonestShenzhen.IHL符號語言2<S>ZZHongKong工0.〖Chines2,交付地點是香港,觀,我要;麗,我不要?!糆nglish2#theplacef/朋Iwill仍力ery/se,IdonotofdeliveryisHongKong:take;wanttotake.〖French〗lelieudelivraisonestdeHongKong:Warsjevaisprendre;5"j."o",jeneveuxpasprendre.通過以上的實例說明,我們可以明顯的看出,本發(fā)明的翻譯方法及系統(tǒng),由于從語義邏輯出發(fā),借助于語義邏輯表達式的構(gòu)建,從而能夠生成高質(zhì)量的譯文,從而使機器翻譯真正成為一種可信的實用翻譯工具。以上內(nèi)容是結(jié)合具體的優(yōu)選實施方式對本發(fā)明所作的進一步詳細說明,但這只是為便于理解而舉的實例,不應(yīng)認為本發(fā)明的具體實施只局限于這些說明。對于本發(fā)明所屬
技術(shù)領(lǐng)域:
的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,可以做出各種可能的等同改變或替換,這些改變或替換都應(yīng)屬于本發(fā)明的保護范圍。權(quán)利要求1.一種機器翻譯方法,其特征在于,包括獲取待翻譯的第一語種的語句;識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組;翻譯所述第一語種的語句的主語詞組、謂語詞組和賓語詞組為第二語種的主語詞組、謂語詞組和賓語詞組;按照所述第二語種的語言表達方式排布所述第二語種的主語詞組、謂語詞組和賓語詞組,形成為第二語種的語句。2.如權(quán)利要求1所述的方法,其特征在于還包括識別所述第一語種的語句中是否包含連接詞,以及翻譯該連接詞為第二語種的連接詞。3.如權(quán)利要求1所述的方法,其特征在于,識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組的方式是識別所述語句的主語詞組、謂語詞組和賓語詞組是否標記有詞組標記符。4.如權(quán)利要求1或2或3所述的方法,其特征在于還包括識別所述第一語種的語句的主語詞組是否包括主語修飾語,識別所述第一語種的語句的謂語詞組是否包括謂語修飾語,識別所述第一語種的語句的賓語詞組是否包括賓語修飾語;識別所述主語修飾語、謂語修飾語或賓語修飾語的方式是識別主語詞組、謂語詞組或賓語詞組中是否標記有修飾語標記符。5.如權(quán)利要求4所述的方法,其特征在于還包括識別所述第一語種的語句是否包含問句;識別所述第一語種的語句是否包含問句的方式是識別主語詞組、謂語詞組或賓語詞組后面是否有提問標記符。6.如權(quán)利要求5所述的方法,其特征在于,識別后的所述第一語種的語句按如下格式順序排列主語、主語的提問標識符、主語修飾語、謂語、謂語的提問標記符、謂語修飾語、賓語、賓語的提問標識符、賓語修飾語;當所述主語、主語的提問標識符、主語修飾語、謂語、謂語的提問標記符、謂語修飾語、賓語、賓語的提問標識符、賓語修飾語中的一種或多種缺失時,在排列時相應(yīng)置空。7.如權(quán)利要求6所述的方法,其特征在于在獲取待翻譯的第一語種的語句之前,還包括接收從輸入接口輸入的第一語種的自然語句;識別第一語種的每一個自然語句是否包含主語詞組、謂語詞組和賓語詞組,如果不是,則將該語句補充成包括主語詞組、謂語詞組和賓語詞組的完整結(jié)構(gòu),形成為待翻譯的第一語種的語句;為第一語種的主語詞組、謂語詞組和賓語詞組標記上詞組標記符;為第一語種的主語詞組中的主語修飾語、謂語詞組中的謂語修飾語之間、賓語詞組中的賓語修飾語標記上修飾語標記符;對包含問句的第一語種的語句,為被提問的主語詞組、謂語詞組或賓語詞組標記上提問標記符。8.—種機器翻譯系統(tǒng),其特征在于,包括獲取單元,用于獲取待翻譯的第一語種的語句;識別單元,用于識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組;以及識別所述第一語種的語句中的連接詞;翻譯單元,用于翻譯所述第一語種的語句的主語詞組、謂語詞組和賓語詞組為第二語種的主語詞組、謂語詞組和賓語詞組;以及翻譯所述第一語種的語句中的連接詞;成形單元,用于按照所述第二語種的語言表達方式排布所述第二語種的主語詞組、謂語詞組和賓語詞組,形成為第二語種的語句。9.如權(quán)利要求8所述的系統(tǒng),其特征在于,識別單元識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組的方式是識別所述語句的主語詞組、謂語詞組和賓語詞組是否標記有詞組標記符。10.如權(quán)利要求8或9所述的系統(tǒng),其特征在于識別單元還用于識別所述第一語種的語句的主語詞組是否包括主語修飾語,識別所述第一語種的語句的謂語詞組是否包括謂語修飾語,識別所述第一語種的語句的賓語詞組是否包括賓語修飾語;識別單元識別所述主語修飾語、謂語修飾語或賓語修飾語的方式是識別主語詞組中是否標記有修飾語標記符、識別謂語詞組中是否標記有修飾語標記符、識別賓語詞組中是否標記有修飾語標記符;以及用于識別所述第一語種的語句是否包含問句;識別單元識別所述第一語種的語句是否包含問句的方式是識別主語詞組、謂語詞組或賓語詞組后面是否有提問標記符。11.如權(quán)利要求10所述的系統(tǒng),其特征在于,還包括排列單元,用于將識別后的所述第一語種的語句按如下格式順序排列主語、主語的提問標識符、主語修飾語、謂語、謂語的提問標記符、謂語修飾語、賓語、賓語的提問標識符、賓語修飾語;當所述主語、主語的提問標識符、主語修飾語、謂語、謂語的提問標記符、謂語修飾語、賓語、賓語的提問標識符、賓語修飾語中的一種或多種缺失時,在排列時相應(yīng)置空。12.如權(quán)利要求11所述的系統(tǒng),其特征在于還包括預(yù)處理單元,用于接收從輸入接口輸入的第一語種的自然語句;以及識別第一語種的每一個自然語句是否包含主語詞組、謂語詞組和賓語詞組,如果不是,則將該語句補充成包括主語詞組、謂語詞組和賓語詞組的完整結(jié)構(gòu),形成為待翻譯的第一語種的語句;以及為第一語種的主語詞組、謂語詞組和賓語詞組分別標記上詞組標記符;以及為第一語種的主語詞組中的主語修飾語、謂語詞組中的謂語修飾語之間、賓語詞組中的賓語修飾語標記上修飾語標記符;以及對包含問句的第一語種的語句,為被提問的主語詞組、謂語詞組或賓語詞組標記上提問標記符。全文摘要本發(fā)明公開了一種機器翻譯方法及系統(tǒng),包括獲取待翻譯的第一語種的語句;識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組;翻譯所述第一語種的語句的主語詞組、謂語詞組和賓語詞組為第二語種的主語詞組、謂語詞組和賓語詞組;按照所述第二語種的語言表達方式排布所述第二語種的主語詞組、謂語詞組和賓語詞組,形成為第二語種的語句。本發(fā)明的方法和系統(tǒng),通過識別第一語種格式語句中的主語詞組、謂語詞組和賓語詞組,再相應(yīng)的將其翻譯成第二語種的主語詞組、謂語詞組和賓語詞組并按第二語種的語言表達方式進行排布,使得翻譯能夠符合語義邏輯,從而得到高質(zhì)量的譯文,真正使機器翻譯方法和系統(tǒng)成為一種可信的實用翻譯工具。文檔編號G06F17/28GK101593174SQ20091010596公開日2009年12月2日申請日期2009年3月11日優(yōu)先權(quán)日2009年3月11日發(fā)明者林勛準申請人:林勛準