亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

機器翻譯方法和系統(tǒng)的制作方法

文檔序號:6585687閱讀:241來源:國知局

專利名稱::機器翻譯方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及機器翻譯方法和系統(tǒng),尤其涉及基于形式化處理的機器翻譯方法和系統(tǒng)。
背景技術(shù)
:將文本從一種語言翻譯成另一種語言一般是一項需要有經(jīng)驗的翻譯的乏味工作。在出現(xiàn)計算機不久以后,研究人員就開始利用計算機來幫助進(jìn)行自然語言的翻譯。最早的機器翻譯(MT)系統(tǒng)取決于大的雙語詞典,其中記錄了對應(yīng)于一個或多個目標(biāo)語言(TL)同義詞的源語言(SL)詞匯。很快,顯然由于詞典的句法和語法規(guī)則是如此復(fù)雜,以至于專家不能開發(fā)出一個可描述的綜合規(guī)則集,從而放棄了機器翻譯。機器翻譯系統(tǒng)一般分為直接翻譯、基于轉(zhuǎn)換的翻譯或基于中間語言的翻譯。在直接翻譯方法中,源語言和目標(biāo)語言之間沒有中間表現(xiàn)形式。源語言文本被"直接"處理以將其轉(zhuǎn)換為目標(biāo)文本。這種處理基本上是一種字對字的翻譯,同時進(jìn)行一些調(diào)整。但是由于忽略句子內(nèi)部結(jié)構(gòu)的所有方面而導(dǎo)致的明顯缺陷使得目前的任何機器翻譯系統(tǒng)都不采用這種方法。在基于轉(zhuǎn)換的翻譯方法中,來自對源文本的不同分析界別的信息被轉(zhuǎn)換成生成的目標(biāo)文本級別。例如,通過設(shè)置在詞法級、語法級或由語法構(gòu)建而成的結(jié)構(gòu)級等的對應(yīng)關(guān)系來實現(xiàn)轉(zhuǎn)換。但是轉(zhuǎn)換方法只適用于特定的語言對,因此必須費心地生成每個語言對?;谥虚g語言的翻譯方法的基礎(chǔ)是假設(shè)能夠定義一種合適的中間表達(dá)形式,使源文本能夠映射到該中間表達(dá)形式,而中間表達(dá)形式再映射到目標(biāo)文本。但在是否能夠產(chǎn)生一種真正的語言獨立中間表達(dá)形式是不清楚的。當(dāng)前的基于中間語言的系統(tǒng)對其所宣稱的中間表達(dá)形式的普遍性少有信心。機器翻譯專家董振東先生在《機器翻譯漫談》一文中說"近20年左右,機器翻譯研究的方法真可謂花樣翻新,令人目不暇接。有基于規(guī)則的,基于知識的,基于語料庫的,基于統(tǒng)計和語料庫的,基于例子的,基于對話的等等。從另一種角度,還有直接法、轉(zhuǎn)換法、中間語言法等等。但其中哪一種也未能在翻譯質(zhì)量上取得實質(zhì)性的突破。"自然語言是非形式化(即,一個形式表示兩個或更多意義)的符號系統(tǒng)。對非形式化的源語言進(jìn)行形式化(即,一個形式表示一個意義)處理是高質(zhì)量的機器翻譯的基礎(chǔ)?,F(xiàn)有的機器翻譯方法未能在翻譯質(zhì)量上取得實質(zhì)性突破的根本原因是未能對非形式化的源語言進(jìn)行形式化處理。
發(fā)明內(nèi)容本發(fā)明的目的在于解決上述問題,提出了一種機器翻譯方法,使得翻譯質(zhì)量取得了實質(zhì)性突破。本發(fā)明的另一目的是提出了一種機器翻譯系統(tǒng)。本發(fā)明的技術(shù)方案為本發(fā)明揭示了一種把非形式化的源語言翻譯成形式化的目標(biāo)語言的機器翻譯方法,該方法包括步驟一對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段;步驟二以自動方式把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言——以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段。根據(jù)本發(fā)明的機器翻譯方法的一實施例,在步驟一中,使用替代標(biāo)記進(jìn)行預(yù)處理——預(yù)先使用替代標(biāo)記把一個初始語段分解成若干個子語段,接著對這些子語段分別進(jìn)行形式化處理。根據(jù)本發(fā)明的機器翻譯方法的一實施例,步驟一是以交互方式對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,以交互方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以交互方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。根據(jù)本發(fā)明的機器翻譯方法的一實施例,以交互方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果在存儲器里存在最前的n,個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),運用一個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記,然后,使用者確認(rèn)或修改,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段并標(biāo)注這個固定語段的意義標(biāo)記,然后,處理器切分和標(biāo)注下一個同定語段。根據(jù)本發(fā)明的機器翻譯方法的一實施例,步驟一是以自動方式對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,以自動方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以自動方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。根據(jù)本發(fā)明的機器翻譯方法的一實施例,以自動方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果,在存儲器里,存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),查出存儲器里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,處理器就進(jìn)行回溯。根據(jù)本發(fā)明的機器翻譯方法的一實施例,以自動方式組合并標(biāo)注非固定語段的過程進(jìn)一步包括存儲器里的非固定語段模式包含成分語段的語法屬性標(biāo)記、語義屬性標(biāo)記和組合語段的組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記;處理器查出存儲器里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式,運用這個非固定語段模式組合一個非固定語段并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,然后,處理器組合和標(biāo)注下一個非固定語段,依此類推,直到整個初始語段構(gòu)成的一個非固定語段;如果處理器查出在存儲器里不存在可以運用的非固定語段模式,處理器就進(jìn)行回溯。根據(jù)本發(fā)明的機器翻譯方法的一實施例,在步驟二中,處理器查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段,目標(biāo)語言的固定語段帶有意義標(biāo)記;在使用者點擊目標(biāo)語言的固定語段的意義標(biāo)記以后顯示器顯示固定語段的意義特征,在使用者點擊關(guān)系標(biāo)記以后顯示器顯示關(guān)系標(biāo)記所代表的關(guān)系。本發(fā)明還揭示了一種把非形式化的源語言翻譯成非形式化的目標(biāo)語言的機器翻譯方法,該方法包括步驟一對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段;步驟二以自動方式把形式化的源語言轉(zhuǎn)換成非形式化的目標(biāo)語言——首先,以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段,然后,以自動方式運用非固定語段轉(zhuǎn)換規(guī)則逐層把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段。根據(jù)本發(fā)明的機器翻譯方法的一實施例,在步驟一中,使用替代標(biāo)記進(jìn)行預(yù)處理一預(yù)先使用替代標(biāo)記把一個初始語段分解成若干個子語段,接著對這些子語段分別進(jìn)行形式化處理。根據(jù)本發(fā)明的機器翻譯方法的一實施例,步驟一是以交互方式對非形式化的源語言進(jìn)行形式化處理進(jìn)一步包括對于非形式化的源語言的初始語段,首先,以交互方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以交互方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。根據(jù)本發(fā)明的機器翻譯方法的一實施例,以交互方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果在存儲器里存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),運用一個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記,然后,使用者確認(rèn)或修改,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段并標(biāo)注這個固定語段的意義標(biāo)記,然后,處理器切分和標(biāo)注下一個固定語段。根據(jù)本發(fā)明的機器翻譯方法的一實施例,步驟一是以自動方式對非形式化的源語言進(jìn)行形式化處理,進(jìn)一步包括對于非形式化的源語言的初始語段,首先,以自動方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以自動方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。根據(jù)本發(fā)明的機器翻譯方法的一實施例,以自動方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果,在存儲器里,存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),查出存儲器里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,處理器就進(jìn)行回溯。根據(jù)本發(fā)明的機器翻譯方法的一實施例,以自動方式組合并標(biāo)注非固定語段的過程進(jìn)一步包括存儲器里的非固定語段模式包含成分語段的語法屬性標(biāo)記、語義屬性標(biāo)記和組合語段的組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記;處理器查出存儲器里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式,運用這個非固定語段模式組合一個非固定語段并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,然后,處理器組合和標(biāo)注下一個非固定語段,依此類推,直到整個初始語段構(gòu)成的一個非固定語段;如果處理器查出在存儲器里不存在可以運用的非固定語段模式,處理器就進(jìn)行回溯。根據(jù)本發(fā)明的機器翻譯方法的一實施例,步驟二進(jìn)一步包括處理器查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段;處理器查找非固定語段轉(zhuǎn)換規(guī)則列表得到匹配的非固定語段轉(zhuǎn)換規(guī)則,目標(biāo)語言的非固定語段的規(guī)則是根據(jù)源語言的非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記或關(guān)系詞用源語言的非固定語段的成分的譯文、目標(biāo)語言的關(guān)系詞構(gòu)成的,運用匹配的非固定語段轉(zhuǎn)換規(guī)則把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的非固定語段,通過遞歸執(zhí)行此步驟逐層轉(zhuǎn)換所有的非固定語段,其中對形式化的源語言的當(dāng)前非固定語段來說,首先把當(dāng)前非固定語段的各個成分分別轉(zhuǎn)換成非形式化的目標(biāo)語言,然后運用匹配的非固定語段轉(zhuǎn)換規(guī)則把當(dāng)前非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言,返回當(dāng)前非固定語段的轉(zhuǎn)換結(jié)果供上一層次的非固定語段調(diào)用,直到把作為初始數(shù)據(jù)的非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言。本發(fā)明又揭示了一種把非形式化的源語言翻譯成形式化的目標(biāo)語言的機器翻譯系統(tǒng),該系統(tǒng)包括源語言形式化處理模塊,該模塊對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段;形式化目標(biāo)語言轉(zhuǎn)換模塊,該模塊連接在源語言形式化處理模塊之后,以自動方式把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言——以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,該系統(tǒng)還包括一個連接在源語言形式化處理模塊之前的替代模塊,該模塊使用替代標(biāo)記進(jìn)行預(yù)處理——預(yù)先使用替代標(biāo)記把一個初始語段分解成若干個子語段,接著對這些子語段分別進(jìn)行形式化處理。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,源語言形式化處理模塊以交互方式對非形式化的源語言進(jìn)行形式化處理,該模塊進(jìn)一步包括交互方式固定語段切分單元,該單元以交互方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段;交互方式非固定語段組合單元,該單元連接在交互方式固定語段切分單元之后,以交互方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,交互方式固定語段切分單元以交互方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果在存儲器里存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),運用一個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記,然后,使用者確認(rèn)或修改,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段并標(biāo)注這個固定語段的意義標(biāo)記,然后,處理器切分和標(biāo)注下一個固定語段。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,源語言形式化處理模塊以自動方式對非形式化的源語言進(jìn)行形式化處理,該模塊進(jìn)一步包括自動方式固定語段切分單元,該單元以自動方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段;自動方式非固定語段組合單元,該單元連接在自動方式固定語段切分單元之后,以自動方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,自動方式固定語段切分單元以自動方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果,在存儲器里,存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),查出存儲器里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,處理器就進(jìn)行回溯。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,自動方式非固定語段組合單元以自動方式組合并標(biāo)注非固定語段的過程進(jìn)一步包括存儲器里的非固定語段模式包含成分語段的語法屬性標(biāo)記、語義屬性標(biāo)記和組合語段的組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記;處理器查出存儲器里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式,運用這個非固定語段模式組合一個非固定語段并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,然后,處理器組合和標(biāo)注下一個非固定語段,依此類推,直到整個初始語段構(gòu)成的一個非固定語段;如果處理器查出在存儲器里不存在可以運用的非固定語段模式,處理器就進(jìn)行回溯。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,形式化目標(biāo)語言轉(zhuǎn)換模塊進(jìn)一步包括自動方式固定語段轉(zhuǎn)換單元,該單元查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段,目標(biāo)語言的固定語段帶有意義標(biāo)記;標(biāo)記點擊單元,該單元在使用者點擊目標(biāo)語言的固定語段的意義標(biāo)記以后顯示固定語段的意義特征,在使用者點擊關(guān)系標(biāo)記以后顯示關(guān)系標(biāo)記所代表的關(guān)系。本發(fā)明又揭示了一種把非形式化的源語言翻譯成非形式化的目標(biāo)語言的機器翻譯系統(tǒng),該系統(tǒng)包括源語言形式化處理模塊,該模塊對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段;非形式化目標(biāo)語言轉(zhuǎn)換模塊,該模塊連接在源語言形式化處理模塊之后,以自動方式把形式化的源語言轉(zhuǎn)換成非形式化的目標(biāo)語言——首先,以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段,然后,以自動方式運用非固定語段轉(zhuǎn)換規(guī)則逐層把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,該系統(tǒng)還包括一個連接在源語言形式化處理模塊之前的替代模塊,該模塊使用替代標(biāo)記進(jìn)行預(yù)處理——預(yù)先使用替代標(biāo)記把一個初始語段分解成若干個子語段,接著對這些子語段分別進(jìn)行形式化處理。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,源語言形式化處理模塊以交互方式對非形式化的源語言進(jìn)行形式化處理,該模塊進(jìn)一步包括交互方式固定語段切分單元,該單元以交互方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段;交互方式非固定語段組合單元,該單元連接在交互方式固定語段切分單元之后,以交互方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,交互方式固定語段切分單元以交互方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記,形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果在存儲器里存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),運用一個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記,然后,使用者確認(rèn)或修改,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段并標(biāo)注這個固定語段的意義標(biāo)記,然后,處理器切分和標(biāo)注下一個固定語段。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,源語言形式化處理模塊以自動方式對非形式化的源語言進(jìn)行形式化處理,該模塊進(jìn)一步包括自動方式固定語段切分單元,該單元以自動方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段;自動方式非固定語段組合單元,該單元連接在自動方式固定語段切分單元之后,以自動方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,自動方式固定語段切分單元以自動方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果,在存儲器里,存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),查出存儲器里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,處理器就進(jìn)行回溯。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,自動方式非固定語段組合單元以自動方式組合并標(biāo)注非固定語段的過程進(jìn)一步包括存儲器里的非固定語段模式包含成分語段的語法屬性標(biāo)記、語義屬性標(biāo)記和組合語段的組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記;處理器查出存儲器里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式,運用這個非固定語段模式組合一個非固定語段并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,然后,處理器組合和標(biāo)注下一個非固定語段,依此類推,直到整個初始語段構(gòu)成的一個非固定語段;如果處理器查出在存儲器里不存在可以運用的非固定語段模式,處理器就進(jìn)行回溯。根據(jù)本發(fā)明的機器翻譯系統(tǒng)的一實施例,非形式化目標(biāo)語言轉(zhuǎn)換模塊進(jìn)一步包括自動方式固定語段轉(zhuǎn)換單元,該單元查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段;自動方式非固定語段轉(zhuǎn)換單元,該單元連接在自動方式固定語段轉(zhuǎn)換單元之后,查找非固定語段轉(zhuǎn)換規(guī)則列表得到匹配的非固定語段轉(zhuǎn)換規(guī)則,其中目標(biāo)語言的非固定語段的規(guī)則是根據(jù)源語言的非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記或關(guān)系詞用源語言的非固定語段的成分的譯文、目標(biāo)語言的關(guān)系詞構(gòu)成的,運用匹配的非固定語段轉(zhuǎn)換規(guī)則把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的非固定語段,通過遞歸執(zhí)行此步驟逐層轉(zhuǎn)換所有的非固定語段,其中對形式化的源語言的當(dāng)前非固定語段來說,首先把當(dāng)前非固定語段的各個成分分別轉(zhuǎn)換成非形式化的目標(biāo)語言,然后運用匹配的非固定語段轉(zhuǎn)換規(guī)則把當(dāng)前非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言,返回當(dāng)前非固定語段的轉(zhuǎn)換結(jié)果供上一層次的非固定語段調(diào)用,直到把作為初始數(shù)據(jù)的非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言。本發(fā)明對比現(xiàn)有技術(shù)有如下的有益效果本發(fā)明的技術(shù)方案主要是先以交互方式或自動方式對非形式化的源語言進(jìn)行形式化處理,然后以自動方式把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言或非形式化的目標(biāo)語言。對比現(xiàn)有技術(shù),本發(fā)明具有如下的三個特點1、既可以以交互方式對非形式化的源語言進(jìn)行形式化處理,又可以以自動方式對非形式化的源語言進(jìn)行形式化處理;既可以以自動方式把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言,又可以以自動方式把形式化的源語言轉(zhuǎn)換成非形式化的目標(biāo)語言。2、用于對源語言進(jìn)行形式化處理的非固定語段模式和用于把源語言轉(zhuǎn)換成目標(biāo)語言的非固定語段轉(zhuǎn)換規(guī)則相互獨立。這樣,既可以在不牽涉非固定語段轉(zhuǎn)換規(guī)則的情況下修改、補充非固定語段模式,又可以在不牽涉非固定語段模式的情況下修改、補充非固定語段轉(zhuǎn)換規(guī)則。這一特點使機器翻譯系統(tǒng)具有易擴充性。3、對源語言進(jìn)行形式化處理是把源語言轉(zhuǎn)換成各種目標(biāo)語言的共同基礎(chǔ)。這一特點十分有利于"一對多"(例如英語轉(zhuǎn)換成漢語/日語/法語/德語/俄語)機器翻譯系統(tǒng)的研發(fā)。圖1是使用替代標(biāo)記進(jìn)行預(yù)處理的實現(xiàn)示意圖。圖2是以交互方式切分固定語段并標(biāo)注標(biāo)記的漢語實例的實現(xiàn)示意圖。圖3是以交互方式組合非固定語段并標(biāo)注標(biāo)記的實現(xiàn)示意圖。圖4是以自動方式切分固定語段并標(biāo)注標(biāo)記的漢語實例的實現(xiàn)示意圖。圖5是以自動方式組合非固定語段并標(biāo)注標(biāo)記的實現(xiàn)示意圖。圖6是把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言的實現(xiàn)示意圖。圖7是把形式化的源語言轉(zhuǎn)換成非形式化的目標(biāo)語言的實現(xiàn)示意圖。圖8是機器翻譯系統(tǒng)的第一實施例的原理圖。圖9是機器翻譯系統(tǒng)的第二實施例的原理圖。圖10是機器翻譯系統(tǒng)的第三實施例的原理圖。圖11是機器翻譯系統(tǒng)的第四實施例的原理圖。具體實施例方式下面結(jié)合附圖和實施例對本發(fā)明作進(jìn)一步的描述。一、和遍i圣誠白條一輔你l本實施例的機器翻譯方法是將非形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言,主要包括兩個步驟,第一步驟是對于非形式化的源語言的初始語段,首先,以交互方式逐個切分固定語段(標(biāo)注固定語段標(biāo)記)并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以交互方式逐層組合非固定語段(標(biāo)注組合標(biāo)記)并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。第二步驟是自動運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換為目標(biāo)語言的語段,從而將非形式化的源語言轉(zhuǎn)換為形式化的目標(biāo)語言。標(biāo)記的說明在詳細(xì)介紹本實施例的第一步驟之前,首先對下文中經(jīng)常提到的七種標(biāo)記(固定語段標(biāo)記、意義標(biāo)記、組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記)進(jìn)行說明。(1)固定語段標(biāo)記是表示固定語段的標(biāo)記。一般而言,詞、詞組、成語、典故、俗語、格言、人名、地名等都可以作為固定語段。字符串(即兩個空格之間的若干個字母)、漢字、假名都是文字單元(即,具有獨立的形體的文字片段)。若干個文字單元構(gòu)成一個固定語段。例如,固定語段的下劃線用作固定語段標(biāo)記。一個文字單元構(gòu)成的固定語段的固定語段標(biāo)記可省略。下面是固定語段標(biāo)記的一個示例TheGreatStBernardPassisthehighestmountainpassinEurope.圣伯納德大山口是歐洲最高的山口。(2)意義標(biāo)記是使形式相同意義不同的固定語段成為形式不同意義不同的固定語段的標(biāo)記。例如,將固定語段的右上角的數(shù)字用作意義標(biāo)記。下面是意義標(biāo)記的一個示例research1research2(3)組合標(biāo)記表示若干個語段組合成一個語段的標(biāo)記。例如可以是括號式組合t示記,如{[({[({[()]})]})]}示例為「(算術(shù)運算)(邏輯運算)l組合標(biāo)記也可以是橫線式組合標(biāo)記,如____示例為魅遂鵬遂__(4)核心成分標(biāo)記表示核心成分的標(biāo)記,核心成分的對象包含組合成的語段的對象或與組合成的語段的對象同一??梢詫⒑诵某煞忠环降男翘栍米骱诵某煞謽?biāo)記,例如[(^^遮*)0£^遮*)]魅遂鵬遂_^_^_核心成分的對象包含組合成的對象或與組合成的語段的對象同一。可以用兩種核心成分標(biāo)記表示兩種核心成分如果核心成分的對象包含組合成的語段的對象,核心成分一方的星號用作核心成分標(biāo)記;如果核心成分的對象與組成的語段的對象同一,核心成分一方的#號用作核心成分標(biāo)記。示例如下clevermancleverJohn_^_^themanwhowrotethisbookJohn,whowrotethisbook__^_^_(5)關(guān)系標(biāo)記表示組合成的語段的各個成分的關(guān)系。例如可將成分之間的數(shù)字用作關(guān)系標(biāo)記,示例如下「(算術(shù)4運算*)21(邏輯4運算算術(shù)運算邏菊運算4氺4氺21以下是用數(shù)字122表示不同的關(guān)系1表示非核心成分的對象承受核心成分的對象2表示非核心成分的對象領(lǐng)有核心成分的對象3表示非核心成分的對象限定核心成分的對象4表示非核心成分的對象是核心成分的對象的屬性5表示非核心成分的對象是核心成分的對象的方式6表示非核心成分的對象是核心成分的對象的目的7表示非核心成分的對象是核心成分的對象的結(jié)果8表示非核心成分的對象是核心成分的對象的手段9表示非核心成分的對象是核心成分的對象的時間表示非核心成分的對象是核心成分的對象的處所11表示非核心成分的對象是核心成分的對象的起點12表示非核心成分的對象是核心成分的對象的方向13表示非核心成分的對象是核心成分的對象的材料14表示非核心成分的對象是核心成分的對象的條件15表示非核心成分的對象是核心成分的對象的原因16表示非核心成分的對象是核心成分的對象的頻度17表示非核心成分的對象是核心成分的對象的范圍18表示非核心成分的對象是核心成分的對象的程度19表示左邊的成分的對象是右邊的成分的對象的主體20表示核心成分的對象是非核心成分的對象的主體21表示各成分的對象具有聯(lián)合關(guān)系22表示各成分的對象具有選擇關(guān)系(6)語法屬性標(biāo)記是在第二個步驟中涉及到的標(biāo)記,是表示語段的語法屬性的標(biāo)記。通常將大寫拉丁字母用作語法屬性標(biāo)記。下面是基于英語用于英語的語法屬性標(biāo)記名詞N、及物動詞VT、不及物動詞VI、連系動詞LV、情態(tài)動詞MV、形容詞A、一般副詞AD、疑問副詞IAD、關(guān)系副詞RAD、名詞性代詞NP、形容詞性代詞AP、疑問代詞IP、關(guān)系代詞RP、數(shù)詞NUM、冠詞ART、介詞P、并列連詞CC、從屬連詞SC;限定動詞FV、不定式INF、-ING分詞ING、-ED分詞ED;主動AC、被動PA;句S、定語從句ATC、狀語從句ADC、名詞性從句NC。下面是基于漢語用于漢語的語法屬性標(biāo)記名詞M、及物動詞JD、不及物動詞BJD、連系動詞LD、情態(tài)動詞QD、形容詞X、一般副詞F、疑問副詞YF、名詞性代詞MD、形容詞性代詞XD、疑問代詞YD、數(shù)詞S、介詞J、并列連詞BL、從屬連詞CL;句JU、定語從句DC、狀語從句ZC、名詞性從句MC。(7)語義屬性標(biāo)記也是在第二個步驟中涉及到的標(biāo)記,是表示語段的語義屬性的標(biāo)記,通常將小寫拉丁字母用作語義屬性標(biāo)記。下面是基于英語用于英語的語義屬性標(biāo)記人hu、生物li、物體ob、物質(zhì)su、事物th、時間ti、處所pl、單位un、具體行為ca、抽象行為aa、狀態(tài)co、心理活動ma、具體性質(zhì)cc、抽象性質(zhì)ac、頻度fr、程度de、否定ne。下面是基于漢語用于漢語的語義屬性標(biāo)記人re、生物sw、物體wt、物質(zhì)wz、事物ww、時間sj、處所cs、單位dw、具體行為jw、抽象行為cw、狀態(tài)zt、心理活動xh、具體性質(zhì)jx、抽象性質(zhì)cx、頻度pd、程度cd、否定fd。替代在上述的第一個步驟中,預(yù)先使用替換標(biāo)記把一個初始語段分解成若干個子語段,接著針對這些子語段分別進(jìn)行后續(xù)的形式化處理。這里所說的替換標(biāo)記是表示替代的標(biāo)記,例如可以用帶圈的數(shù)字作為替代標(biāo)記,如算術(shù)運算和邏輯運算=下面是使用替代標(biāo)記進(jìn)行預(yù)處理的實例第一步計算機在屏幕上顯示電子計算機以驚人的速度完成算術(shù)運算和邏輯運算第二步使用者在屏幕上選中電子計算機以驚人的速度完成算術(shù)運算和邏輯運算第三步使用者按"替代"功能鍵第四步計算機在屏幕上顯示算術(shù)運算和邏輯運算=電子計算機以驚人的速度完成①然后,對"算術(shù)運算和邏輯運算"、"電子計算機以驚人的速度完成①"這兩個子語段分別進(jìn)行形式化處理??梢?,使用替代標(biāo)記進(jìn)行預(yù)處理使對結(jié)構(gòu)復(fù)雜的語段進(jìn)行形式化處理變得比較方便。圖1示出了使用替代標(biāo)記進(jìn)行預(yù)處理的實現(xiàn),請同時參見圖l,下面是以一個具體的實例來說明使用替代標(biāo)記進(jìn)行預(yù)處理的過程。第一步以String類型保存被輸入的作為數(shù)據(jù)的語段"電子計算機以驚人的速度完成算術(shù)運算和邏輯運算"。進(jìn)行數(shù)據(jù)初始化,形成一個節(jié)點對應(yīng)一個文字單元的節(jié)點數(shù)組(Array)。替代符號列表為空。第二步使用者選中"算術(shù)運算和邏輯運算"。第三步使用者按"替代"功能鍵。第四步更新節(jié)點數(shù)組——第14個節(jié)點對應(yīng)"算術(shù)運算和邏輯運算",其容量為9個文字單元。用符號"①"代表被選中的語段,在屏幕上顯示更新后的作為數(shù)據(jù)的語段。以奪互方式對源i吾言講行形式化處理在第一步驟中,本實施例是以交互方式對源語言進(jìn)行形式化處理,包含了以交互方式切分固定語段并標(biāo)注標(biāo)記的過程以及以交互方式組合非固定語段并標(biāo)注標(biāo)記的過程。下面分別就上述的這兩個過程進(jìn)行詳細(xì)的描述。以奪互方式切分固定i吾段并標(biāo)灃標(biāo)記的過禾呈以交互方式切分固定語段并標(biāo)注標(biāo)記的過程詳述如下存儲裝置里的固定語段模式包含固定語段及其意義標(biāo)記(形式相同意義不同的固定語段帶有意義標(biāo)記);計算機依次判斷,在存儲裝置里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果在存儲裝置里,存在最前的n個文字單元開頭的固定語段但不存在最前的n+l個文字單元開頭的固定語段,計算機就把最前的n個文字單元切分為固定語段(標(biāo)注固定語段標(biāo)記),運用一個固定語段模式(固定語段模式的實例為methods1、dataprocessingautomatic1)標(biāo)注這個固定語段的意義標(biāo)記,然后,使用者確認(rèn)或修改,依此類推,直到最后一個固定語段;如果計算機查出在存儲裝置里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段(標(biāo)注固定語段標(biāo)記)并標(biāo)注這個固定語段的意義標(biāo)記,然后,計算機切分和標(biāo)注下一個固定語段。下面以一個實例來說明上述的以交互方式切分固定語段并標(biāo)注標(biāo)記。設(shè)ABCDEFGHIJKLMNOPQRSTUVWXYZ是一個語段(A、B、C......X、Y、Z是文字單元)。計算機依次判定,在存儲裝置里,存在A開頭的固定語段,存在AB開頭的固定語段,存在ABC開頭的固定語段,不存在ABCD開頭的固定語段,于是計算機把ABC切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注ABC的意義標(biāo)記,然后,使用者確認(rèn)或修改,依此類推,直到最后一個固定語段。之所以將ABC切分為一個同定語段,是因為在存儲裝置里,存在A開頭的固定語段,存在AB開頭的固定語段,存在ABC開頭的固定語段,不存在ABCD開頭的固定語段,所以,A開頭的固定語段可能是A,可能是AB,可能是ABC,不可能是ABCD,不可能是其他A開頭的語段(ABCDE、ABCDEF……)。計算機把A、AB、ABC三者中最長(文字單元最多)的ABC切分為固定語段。計算機判定在存儲裝置里不存在L開頭的固定語段,于是使用者切分L開頭的固定語段LMNO(標(biāo)注固定語段標(biāo)記)并標(biāo)注LMNO的意義標(biāo)記,計算機自動存儲這個新的固定語段模式,然后,計算機切分和標(biāo)注下一個固定語段。在使用者確認(rèn)或修改意義標(biāo)記的步驟中,先由計算機顯示各個可以運用的固定語段模式及其意義特征。例如degree1[3stepinaprocess]degree[astepinadirecthereditarylineofdescent]degree3[relativesocialorofficialrank]degree4[relativeintensityoramount]degree5[theextentofastateofbeingoranaction]degree6[aunitdivisionofatemperaturescale]degree7[aplanarunitofangularmeasure]degree8[aunitoflatitudeorlongitude]degree9[anacademictitle]degree10[aclassificationofaspecificcrime]degree11[aclassificationoftheseverityofaninjury]degree12[aformusedinthecomparisonofadjectivesandadverbs]degree13[anoteofadiatonicscale]然后由使用者選擇并點擊一個意義標(biāo)記。以奪互方式切分固定i吾段并標(biāo)灃標(biāo)記的英i吾實例Computerscienceisthebranchofsciencethatisconcernedwithmethodsrelatingtodataprocessingperformedbyautomaticmeans.計算機依次判定,在存儲裝置里,存在computer開頭的固定語段(第一個文字單兀是computer的固定語段,例如computer,computerassistedinstruction,computergraphics),存在computerscience開頭的固定語段(第一個文字單元是computer第二個文字單兀是science的固定語段,例如computerscience,computerscienceandtechnology,computersciencedepartment),不存在computerscienceis開頭的固定語段(第一個文字單元是computer第二個文字單元是science第二個文字單元是is的固定語段),于是計算機把computerscience切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注computerscience的意義標(biāo)記,然后,使用者確認(rèn)。21計算機依次判定,在存儲裝置里,存在is開頭的固定語段,不存在isthe開頭的固定語段,于是計算機把is切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注is的意義標(biāo)記,然后,使用者確認(rèn)。計算機依次判定,在存儲裝置里,存在the開頭的固定語段,不存在thebranch開頭的固定語段,于是計算機把the切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注the的意義標(biāo)記,然后,使用者確認(rèn)。計算機依次判定,在存儲裝置里,存在branch開頭的固定語段,不存在branchof開頭的固定語段,于是計算機把branch切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注branch的意義標(biāo)記,然后,使用者確認(rèn)。計算機依次判定,在存儲裝置里,存在of開頭的固定語段,不存在ofscience開頭的固定語段,于是計算機把of切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注of的意義標(biāo)記,然后,使用者確認(rèn)。計算機依次判定,在存儲裝置里,存在science開頭的固定語段,不存在sciencethat開頭的固定語段,于是計算機把science切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注science的意義標(biāo)記,然后,使用者確認(rèn)。Computerscienceis1thebranch3ofscience1"*......之所以將computerscience作為固定語段,是因為在存儲裝置里,存在computer開頭的固定語段,存在computerscience開頭的固定語段,不存在computerscienceis開頭的固定語段,所以,computer開頭的固定語段可能是computer,可能是computerscience,不可會g是computerscienceis,不可會g是其他computer開頭的i吾段(computerscienceisthe,computerscienceisthebranch,computerscienceisthebranchof......)。計算機把computer,computerscience二者中最長(文字單元最多)的computerscience切分為固定語段。以奪互方式切分固定i吾段并標(biāo)灃標(biāo)記的漢i吾實例圖2示出了以交互方式切分固定語段并標(biāo)注標(biāo)記的漢語實例的實現(xiàn)過程,請參見圖2,其中粗實線表示不存在固定語段,細(xì)實線箭頭表示存在固定語段,虛線箭頭表示不存在以此開頭的固定語段。計算機科學(xué)是研究用自動化工具完成數(shù)據(jù)處理的方法的一門科學(xué)。計算機依次判定,在存儲裝置里,存在計開頭的固定語段(第一個文字單元是計的固定語段,例如計、計劃、計算機、計量單位、計算機輔助設(shè)計),存在計算開頭的固定語段(第一個文字單元是計第二個文字單元是算的固定語段,例如計算、計算機、計算機輔助設(shè)計),存在計算機開頭的固定語段(第一個文字單元是計第二個文字單元是算第三個文字單元是機的固定語段,例如計算機、計算機安全、計算機輔助設(shè)計),存在計算機科開頭的固定語段(第一個文字單元是計第二個文字單元是算第三個文字單元是機第四個文字單元是科的固定語段,例如計算機科學(xué)、計算機科學(xué)技術(shù)、計算機科學(xué)家),存在計算機科學(xué)開頭的固定語段(第一個文字單元是計第二個文字單元是算第三個文字單元是機第四個文字單元是科第五個文字單元是學(xué)的固定語段,例如計算機科學(xué)、計算機科學(xué)技術(shù)、計算機科學(xué)家),不存在計算機科學(xué)是開頭的固定語段(第一個文字單元是計第二個文字單元是算第三個文字單元是機第四個文字單元是科第五個文字單元是學(xué)第六個文字單元是是的固定語段),于是計算機把計算機科學(xué)切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注計算機科學(xué)的意義標(biāo)記,然后,使用者確認(rèn)。計算機依次判定,在存儲裝置里,存在是開頭的固定語段,不存在是研開頭的固定語段,于是計算機把是切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注是的意義標(biāo)記,然后,使用者確認(rèn)。計算機依次判定,在存儲裝置里,存在研開頭的固定語段,存在研究開頭的固定語段,不存在研究用開頭的固定語段,于是計算機把研究切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注研究的意義標(biāo)記,然后,使用者確認(rèn)。計算機依次判定,在存儲裝置里,存在用開頭的固定語段,不存在用自開頭的固定語段,于是計算機把用切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注用的意義標(biāo)記,然后,使用者確認(rèn)。計算機依次判定,在存儲裝置里,存在自開頭的固定語段,存在自動開頭的固定語段,存在自動化開頭的固定語段,不存在自動化工開頭的固定語段,于是計算機把自動化切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注自動化的意義標(biāo)記,然后,使用者確認(rèn)。計算機科學(xué)是皿1用1自動化……......之所以將"計算機科學(xué)"作為固定語段,是因為在存儲裝置里,存在計開頭的固定語段,存在計算開頭的固定語段,存在計算機開頭的固定語段,存在計算機科開頭的固定語段,存在計算機科學(xué)開頭的固定語段,不存在計算機科學(xué)是開頭的固定語段,所以,計開頭的固定語段可能是計,可能是計算,可能是計算機,可能是計算機科,可能是計算機科學(xué),不可能是計算機科學(xué)是,不可能是其他計開頭的語段(計算機科學(xué)是研、計算機科學(xué)是研究、計算機科學(xué)是研究用……)。計算機把計、計算、計算機、計算機科、計算機科學(xué)五者中最長(文字單元最多)的計算機科學(xué)切分為固定語段。以奪互方式飽合非固定i吾段并標(biāo)灃標(biāo)記的過禾呈以交互方式組合非固定語段并標(biāo)注標(biāo)記的過程詳述如下以交互方式逐層逐個按組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記的順序標(biāo)注非固定語段的標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。lU柯材會目絲醇i鵬射示射示iff白嫂你l第一步計算機在屏幕上顯示請組合一個非固定語段第二步使用者用鼠標(biāo)在屏幕上點擊第一層第一個非固定語段的第一個字符和最^個字符。第三步計算機在屏幕上顯示第一層第一個非固定語段的組合標(biāo)記。第四步計算機在屏幕上顯示請標(biāo)注核心成分標(biāo)記第五步使用者用鼠標(biāo)在屏幕上點擊核心成分標(biāo)記的位置。第六步計算機在屏幕上顯示核心成分標(biāo)記。第七步計算機在屏幕上顯示請選擇關(guān)系標(biāo)記1表示非核心成分的對象承受核心成分的對象2表示非核心成分的對象領(lǐng)有核心成分的對象3表示非核心成分的對象限定核心成分的對象4表示非核心成分的對象是核心成分的對象的屬性5表示非核心成分的對象是核心成分的對象的方式6表示非核心成分的對象是核心成分的對象的目的7表示非核心成分的對象是核心成分的對象的結(jié)果8表示非核心成分的對象是核心成分的對象的手段9表示非核心成分的對象是核心成分的對象的時間10表示非核心成分的對象是核心成分的對象的處所11表示非核心成分的對象是核心成分的對象的起點12表示非核心成分的對象是核心成分的對象的方向13表示非核心成分的對象是核心成分的對象的材料14表示非核心成分的對象是核心成分的對象的條件15表示非核心成分的對象是核心成分的對象的原因16表示非核心成分的對象是核心成分的對象的頻度17表示非核心成分的對象是核心成分的對象的范圍18表示非核心成分的對象是核心成分的對象的程度19表示左邊的成分的對象是右邊的成分的對象的主體20表示核心成分的對象是非核心成分的對象的主體21表示各成分的對象具有聯(lián)合關(guān)系22表示各成分的對象具有選擇關(guān)系第八步使用者用鼠標(biāo)在屏幕上點擊合適的關(guān)系標(biāo)記。第九步計算機在屏幕上顯示關(guān)系標(biāo)記。第十步計算機在屏幕上顯示請組合一個非固定語段第十一步使用者用鼠標(biāo)在屏幕上點擊第一層第二個非固定語段的第一個字符和最后一個字符。......lU柯材會目絲醇i鵬射示射示iff白條i吾糊初始語段methodsrelatingtodataprocessingperformedbyautomaticmeans第一層組合methods1relatingtodataprocessingperformed1by2automatic1means1_4氺第二層組合methods1relatingtodataprocessihgperformed1by2automatic1means1_4承^_第三層組合methods1relatingtodataprocessinoperformed1by2automatic1means1_4氺^_^_2^_第四層組合methods1relatingtodataprocessingperformed1by2automatic1means1_4氺^_^_2^_^_以奪互方式飽合非固定i吾段并標(biāo)灃標(biāo)記的實現(xiàn),圖3示出了以交互方式組合非固定語段并標(biāo)注標(biāo)記的實現(xiàn)過程。下面的說明請同時參見圖3。第一步在程序界面上顯示初始語段,提示"請組合非固定語段"。第二步接受鼠標(biāo)的兩次點擊,獲得非固定語段的第一個字符和最后一個字符,給從第一個字符到最后一個字符的字符串標(biāo)注橫線式組合標(biāo)記,提示"請標(biāo)注核心成分標(biāo)記"。第三步如果使用者點擊核心成分標(biāo)記的位置,程序就標(biāo)注核心成分標(biāo)記;如果使用者點擊核心成分標(biāo)記,程序就刪除核心成分標(biāo)記。第四步使用者用鼠標(biāo)右鍵點擊非固定語段的橫線式組合標(biāo)記,程序彈出包含"關(guān)系標(biāo)記列表"和"取消非固定語段"兩項內(nèi)容的右鍵菜單。如果使用者在右鍵菜單里點擊一個關(guān)系標(biāo)記,程序就標(biāo)注這個關(guān)系標(biāo)記;如果使用者在右鍵菜單里選擇"取消非固定語段",程序就刪除這個非固定語段的橫線式組合標(biāo)記。第五步重復(fù)第二步到第四步,直到整個初始語段構(gòu)成的一個非固定語段。第六步生成節(jié)點列表。25把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段。把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言的實例例子1:英語到漢語的翻譯非形式化的英語methodsrelatingtodataprocessingperformedbyautomaticmeans形式化的英語methods1relatingtodataprocessingperformed1by2automatic1means1_4氺^_承20_(以交互方式對源語言進(jìn)行形式化處理的結(jié)果)作為以自動方式對源語言進(jìn)行形式化處理的結(jié)果的形式化的源語言有語法屬性標(biāo)記和語義屬性標(biāo)記。例如methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob_4_^NobVTEDPAaa20NaaNth(以自動方式對源語言進(jìn)行形式化處理的結(jié)果)首先,以自動方式刪除語法屬性標(biāo)記和語義屬性標(biāo)記。例如methods1relatingtodataprocessingperformed1by2automatic1means1420(形式化的源語言的語法屬性標(biāo)記和語義屬性標(biāo)記可以不刪除)然后,以自動方式運用固定語段轉(zhuǎn)換規(guī)則把英語的固定語段轉(zhuǎn)換成漢語的語段固定語段轉(zhuǎn)換規(guī)則<table>tableseeoriginaldocumentpage27</column></row><table>使用者點擊關(guān)系標(biāo)記以后,計算機顯示關(guān)系。例如使用者點擊關(guān)系標(biāo)記4以后,機顯示4表示非核心成分的對象是核心成分的對象的屬性例子2:漢語到英語的翻譯非形式化的漢語計算機輔助教學(xué)通常包含學(xué)生和計算機的對話形式化的漢語i十覚和,輔助教學(xué)鵬M學(xué)牛和4計覚機的3對話1619和4[各成分的對象具有聯(lián)合關(guān)系]的3[非核心成分的對象施行核心成分的對象]27首先以自動方式把漢語的固定語段轉(zhuǎn)換成英語的語段computerassistedinstructionusuallyinvolve2studentand1computerof14dialogue__^_1___^_involve2[containasapart]and1[theobjectsoftheelementsjointogether]of14[theobjectofthenon_keyelementexecutestheobjectofthekeyelement]護U纖原結(jié)斜免成U涵服i吾舗敘見圖6以上述的英語到漢語翻譯的實例示出了把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言的實現(xiàn)過程。下面的描述請同時參見圖6。第一步刪除形式化的源語言的語法屬性標(biāo)記和語義屬性標(biāo)記。第二步查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非同定語段。目標(biāo)語言的固定語段帶有意義標(biāo)記。第三步在使用者點擊目標(biāo)語言的固定語段的意義標(biāo)記以后顯示固定語段的意義特征。在使用者點擊關(guān)系標(biāo)記以后顯示關(guān)系標(biāo)記所代表的關(guān)系。從源i吾言到l形式化的目標(biāo)i吾言的機器翻譯的應(yīng)用1從源語言到形式化的目標(biāo)語言的機器翻譯可以用于手機等網(wǎng)絡(luò)終端設(shè)備。例如在手機的存儲裝置里存儲從源語言到形式化目標(biāo)語言機器翻譯系統(tǒng)。甲是母語是漢語、完全不懂英語的使用者;乙是母語是英語、完全不懂漢語的使用者。甲把非形式化的漢語輸入自己的手機,甲和自己的手機以交互方式對非形式化的漢語進(jìn)行形式化處理,甲的手機以自動方式把形式化的漢語轉(zhuǎn)換成形式化的英語,然后,甲的手機把形式化的英語發(fā)送給乙,乙在自己的手機上閱讀形式化的英語;乙把非形式化的英語輸入自己的手機,乙和自己的手機以交互方式對非形式化的英語進(jìn)行形式化處理,乙的手機以自動方式把形式化的英語轉(zhuǎn)換成形式化的漢語,然后,乙的手機把形式化的漢語發(fā)送給甲,甲在自己的手機上閱讀形式化的漢語。(具有從源語言到形式化目標(biāo)語言機器翻譯功能的手機所連接的電腦也具有從源語言到形式化目標(biāo)語言機器翻譯功能)母語不同的使用者可以使用手機在互聯(lián)網(wǎng)上各自用母語進(jìn)行絕對準(zhǔn)確(沒有任何歧義)的信息交流(即時交談、電子郵件等)。具有從源語言到形式化目標(biāo)語言機器翻譯功能的手機不但能夠消除互聯(lián)網(wǎng)的語言障礙,增進(jìn)各國人民的相互了解與合作,而且能夠促進(jìn)各種語言的相互借鑒共同發(fā)展,保持世界文化的多樣性。2從源語言到形式化的目標(biāo)語言的機器翻譯可以用于互聯(lián)網(wǎng)知識庫和知識推理搜索引擎在其存儲裝置里存儲用形式化的語言表示的普通知識和專業(yè)知識并且存儲以交互方式或自動方式對非形式化的源語言進(jìn)行形式化處理然后以自動方式把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言的機器翻譯系統(tǒng)。例如在互聯(lián)網(wǎng)知識庫里用形式化的英語全面而充分地表示普通知識和專業(yè)知識。母語是漢語/日語/法語/德語/俄語的科學(xué)技術(shù)工作者用非形式化的漢語/日語/法語/德語/俄語在互聯(lián)網(wǎng)發(fā)表論文。作者和知識推理搜索引擎以交互方式對非形式化的漢語/日語/法語/德語/俄語的論文摘要進(jìn)行形式化處理,然后,知識推理搜索引擎以自動方式把形式化的漢語/日語/法語/德語/俄語轉(zhuǎn)換成形式化的英語,然后,知識推理搜索引擎把形式化的英語的論文摘要存入互聯(lián)網(wǎng)知識庫。知識推理搜索引擎根據(jù)使用者提出的某個專題,從互聯(lián)網(wǎng)知識庫搜索出關(guān)于這個專題的知以,進(jìn)行知識推理以延伸、擴展或重組知識,輸出形式化的英語的推理結(jié)果,啟迪使用者作出新的發(fā)現(xiàn)和發(fā)明。知識推理搜索引擎可以根據(jù)使用者的需要,以自動方式把形式化的英語的推理結(jié)果轉(zhuǎn)換成形式化的漢語/日語/法語/德語/俄語的推理結(jié)果。知識推理搜索引擎能夠大大加快科學(xué)技術(shù)的發(fā)展。人類正處于以互聯(lián)網(wǎng)和搜索引擎為特征的信息時代初級階段;人類將進(jìn)入以互聯(lián)網(wǎng)知識庫和知識推理搜索引擎為特征的信息時代高級階段。3從源語言到形式化的目標(biāo)語言的機器翻譯可以用于專家系統(tǒng)。例如在專家系統(tǒng)的知識庫里用形式化的英語全面而充分地表示普通知識和專業(yè)知識。母語是漢語/日語/法語/德語/俄語的專家用非形式化的漢語/日語/法語/德語/俄語向?qū)<蚁到y(tǒng)輸入知識。然后,專家和專家系統(tǒng)以交互方式對非形式化的漢語/日語/法語/德語/俄語進(jìn)行形式化處理,然后,專家系統(tǒng)以自動方式把形式化的漢語/日語/法語/德語/俄語轉(zhuǎn)換成形式化的英語,然后,專家系統(tǒng)把用形式化的英語表示的知識存入知識庫。母語是漢語/日語/法語/德語/俄語的使用者用非形式化的漢語/日語/法語/德語/俄語向?qū)<蚁到y(tǒng)提出問題,然后,使用者和專家系統(tǒng)以交互方式對非形式化的漢語/日語/法語/德語/俄語進(jìn)行形式化處理,然后,專家系統(tǒng)以自動方式把形式化的漢語/日語/法語/德語/俄語轉(zhuǎn)換成形式化的英語,然后,專家系統(tǒng)進(jìn)行知識推理,用形式化的英語作出解答。專家系統(tǒng)可以根據(jù)使用者的需要,以自動方式把形式化的英語的解答轉(zhuǎn)換成形式化的漢語/日語/法語/德語/俄語的解答。4從源語言到形式化的目標(biāo)語言的機器翻譯可以用于自動程序設(shè)計。例如母語是漢語/日語/法語/德語/俄語的使用者把用非形式化的漢語/日語/法語/德語/俄語設(shè)計的程序輸入計算機,然后,使用者和計算機以交互方式對非形式化的漢語/日語/法語/德語/俄語進(jìn)行形式化處理,然后,計算機以自動方式把形式化的漢語/日語/法語/德語/俄語轉(zhuǎn)換成形式化的英語,然后,計算機以自動方式把形式化的英語轉(zhuǎn)換成程序設(shè)計語言。二、機器翻譯方法的第二實施例本實施例的機器翻譯方法是將非形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言,主要包括兩個步驟,第一步驟是對于非形式化的源語言的初始語段,首先,以自動方式逐個切分固定語段(標(biāo)注固定語段標(biāo)記)并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以自動方式逐層組合非固定語段(標(biāo)注組合標(biāo)記)并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。第二步驟是自動運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換為目標(biāo)語言的語段,從而將非形式化的源語言轉(zhuǎn)換為形式化的目標(biāo)語言。其中本實施例的標(biāo)記的說明、替代都和第一實施例相同,在此不再贅沭,以下重點說明本實施例和上述第一實施例的區(qū)別所在。IU自云力材麵i吾豁對亍総仆細(xì)在第一步驟中,本實施例是以自動方式對源語言進(jìn)行形式化處理,包含了以自動方式切分固定語段并標(biāo)注標(biāo)記的過程以及以自動方式組合非固定語段并標(biāo)注標(biāo)記的過程。下面分別就上述的這兩個過程進(jìn)行詳細(xì)的描述。IU自云力材t刀,分醇鵬射示射示iP鍾禾罕存儲裝置里的固定語段模式包含固定語段及其意義標(biāo)記(形式相同意義不同的固定語段帶有意義標(biāo)記)、語法屬性標(biāo)記、語義屬性標(biāo)記;計算機依次判斷,在存儲裝置里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果,在存儲裝置里,存在最前的n個文字單元開頭的固定語段,不存在最前的n+l個文字單元開頭的固定語段,計算機就把最前的n個文字單元切分為固定語段(標(biāo)注固定語段標(biāo)記),查出存儲裝置里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,依此類推,直到最后一個固定語段;如果計算機查出在存儲裝置里不存在剩余語段的最前的1個文字單元開頭的固定語段,計算機就回溯。在上述過程中,計算機通過固定語段自動切分和標(biāo)注時的回溯改正固定語段自動切分和標(biāo)注中的錯誤。對于上述過程中提及的"固定語段模式",其實例如下methods1dataprocessingautomatic1NthNaaAac以自動方式切分固定i吾段并標(biāo)灃標(biāo)記的實例英語的例子methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob漢語的例子計算機科學(xué)是皿1用1自動化MwwLDztJDcwJDcwXcx以自動方式切分固定語段并標(biāo)注標(biāo)記的實現(xiàn)圖4示出了以自動方式切分固定語段并標(biāo)注標(biāo)記的實現(xiàn)過程,在圖4中粗實線表示不存在固定語段,虛線表示不存在以此開頭的固定語段,細(xì)實線表示存在固定語段。請結(jié)合圖4參考下面的描述。第一步獲得作為初始數(shù)據(jù)的語段計算機科學(xué)是研究用自動化工具完成數(shù)據(jù)處理的方法的一門科學(xué)。第二步查找第一個文字單元是計的固定語段一有(存在計開頭的固定語段)一在第一個文字單元是計的固定語段里查找第二個文字單元是算的固定語段一有(存在計算開頭的固定語段)一在第一個文字單元是計第二個文字單元是算的固定語段里查找第三個文字單元是機的固定語段一有(存在計算機開頭的固定語段)一在第一個文字單元是計第二個文字單元是算第三個文字單元是機的固定語段里查找第四個文字單元是科的固定語段一有(存在計算機科開頭的固定語段)一在第一個文字單元是計第二個文字單元是算第三個文字單元是機第四個文字單元是科的固定語段里查找第五個文字單元是學(xué)的固定語段一有(存在計算機科學(xué)開頭的固定語段)一在第一個文字單元是計第二個文字單元是算第三個文字單元是機第四個文字單元是科第五個文字單元是學(xué)的固定語段里查找第六個文字單元是是的固定語段一沒有(不存在計算機科學(xué)是開頭的固定語段)一把計算機科學(xué)切分為固定語段。第三步查出計算機科學(xué)這個固定語段的標(biāo)記組(意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記)列表,選擇累計運用次數(shù)最多的一個標(biāo)記組對計算機科學(xué)這個固定語段進(jìn)行標(biāo)注。第四步用一個節(jié)點把計算機科學(xué)這個固定語段及其標(biāo)記組(意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記)存儲于數(shù)據(jù)列表。依此逐個切分和標(biāo)注固定語段,直到最后一個固定語段。如果查出在固定語段列表里不存在剩余語段的最前的1個文字單元開頭的固定語段,就回溯。IU自云力材會目絲醇i鵬射示射示iP鍾禾罕存儲裝置里的非固定語段模式包含成分語段的語法屬性標(biāo)記、語義屬性標(biāo)記和組合語段的組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記;計算機查出存儲裝置里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式,運用這個非固定語段模式組合一個非固定語段(標(biāo)注組合標(biāo)記)并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,然后,計算機組合和標(biāo)注下一個非固定語段,依此類推,直到整個初始語段構(gòu)成的一個非固定語段;如果計算機查出在存儲裝置里不存在可以運用的非固定語段模式,計算機就回溯。其中計算機通過非固定語段自動組合和標(biāo)注時的回溯改正非固定語段自動組合和標(biāo)注中的錯誤或固定語段自動切分和標(biāo)注中的錯誤。固定語段自動切分和標(biāo)注中的錯誤往往通過非固定語段自動組合和標(biāo)注時的回溯才能改正。上述過程中的非固定語段模式的實例如下闊^固定語段模式的實例模式一模式二…relatingto...............NthPNaa^_Nth模式三…by2...............VTEDPAaaPNobNaaVTEDPAaaAacNob4氺Nob模式四^_氺20_VTEDPAaaNaaIU自云力材會目絲醇鵬射示射示iff白嫂你l下面以一個英語的例子來說明以自動方式組合非固定語段并標(biāo)注標(biāo)記的過程。初始語段methodsrelatingtodataprocessingperformedbyautomaticmeansNthPNaaVTEDPAaaPAacNob第一層組合計算機查出存儲裝置里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式(上述的模式二),運用這個非固定語段模式組合一個非固定語段(標(biāo)注組合標(biāo)記)并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記。methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob_4_^Nob第二層組合計算機查出存儲裝置里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式(上述的模式三),運用這個非固定語段模式組合一個非固定語段(標(biāo)注組合標(biāo)記)并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記。methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob4氺Nob^_VTEDPAaa第三層組合計算機查出存儲裝置里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式(上述的模式四),運用這個非固定語段模式組合一個非固定語段(標(biāo)注組合標(biāo)記)并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記。methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob_4氺Nob^_VTEDPAaa^__Naa第四層組合計算機查出存儲裝置里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式(上述的模式一),運用這個非同定語段模式組合一個非固定語段(標(biāo)注組合標(biāo)記)并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記。methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob_4氺Nob^_VTEDPAaa^_2^_Naa^_NthIU自云力材會目絲醇i鵬射示射示iff白嫂現(xiàn)'圖5示出了以自動方式組合非固定語段并標(biāo)注標(biāo)記的實現(xiàn)過程。以下結(jié)合圖5給出了實現(xiàn)過程的詳細(xì)描述。第一步查出各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式,運用這個非固定語段模式組合一個非固定語段(標(biāo)注組合標(biāo)記)并給這個非固定語段標(biāo)注核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記。第二步用一個節(jié)點把這個非固定語段及其標(biāo)記組(核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記)存儲于數(shù)據(jù)列表。保存成分語段的引用(子節(jié)點)和組合語段的引用(父節(jié)點)。依此逐個組合和標(biāo)注非固定語段,直到整個作為初始數(shù)據(jù)的語段構(gòu)成的一個非固定語段。如果查出在非固定語段模式列表里不存在可以運用的非固定語段模式,就回溯。對于本實施例的第二個步驟,即把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言(包括其實現(xiàn)以及應(yīng)用),已經(jīng)在上述的第一個實施例中詳細(xì)描述,因此在此不再贅述。三、機器翻譯方法的第三實施例本實施例的機器翻譯方法是將非形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言,主要包括兩個步驟,第一步驟是對于非形式化的源語言的初始語段,首先,以交互方式逐個切分固定語段(標(biāo)注固定語段標(biāo)記)并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以交互方式逐層組合非固定語段(標(biāo)注組合標(biāo)記)并標(biāo)注非同定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。第二步驟是自動運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換為目標(biāo)語言的語段,然后以自動方式運用非固定語段轉(zhuǎn)換規(guī)則逐層把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段,從而將非形式化的源語言轉(zhuǎn)換為非形式化的目標(biāo)語言。其中本實施例的標(biāo)記的說明、替代、以奪互方式對源語言講行形式化處理(包括,i材t刀側(cè)斜吾肖射示射示iP扁柳層乂拽材會目絲,鵬射示射示iffffiii^l都和第一實施例相同,在此不再贅述,以下重點說明本實施例和上述第一實施例的區(qū)別所在。換句話說,本實施例的第一個步驟和第一實施例的第一個步驟是完全一樣的,因此下面是對本實施例第二個步驟的詳細(xì)描述。護U纖原i吾諧械,i涵服i吾舗討禾罕以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段,然后,以自動方式運用非固定語段轉(zhuǎn)換規(guī)則(即,根據(jù)源語言的非固定語段的核心成分標(biāo)記和關(guān)系標(biāo)記或關(guān)系詞用源語言的非固定語段的成分的譯文和目標(biāo)語言的關(guān)系詞構(gòu)成目標(biāo)語言的非固定語段的規(guī)則)逐層把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段。護U纖原i吾諧械,i涵服i吾剖嫂你l以下是以形式化的英語轉(zhuǎn)換成非形式化的漢語為例來說明把形式化的源語言轉(zhuǎn)換成非形式化的目標(biāo)語言的過程。非形式化的英語methodsrelatingtodataprocessingperformedbyautomaticmeans形式化的英語methods1relatingtodataprocessingperformed1by2automatic1means1_4氺氺20(以交互方式對源語言進(jìn)行形式化處理的結(jié)果)以自動方式運用固定語段轉(zhuǎn)換規(guī)則把英語的固定語段轉(zhuǎn)換成漢語的語段固定語段轉(zhuǎn)換規(guī)則<table>tableseeoriginaldocumentpage34</column></row><table>methods1—方法dataprocessing-數(shù)據(jù)處理performed1—被執(zhí),行automatic1—自動3means1—工具1以自動方式運用非固定語段轉(zhuǎn)換規(guī)則逐層把英語的非固定語段轉(zhuǎn)換成漢語的語段非固定語段轉(zhuǎn)換規(guī)則(、代表英語成分,b/、relatingto是英語關(guān)系詞,*是核心成分標(biāo)記,4、1是關(guān)系標(biāo)記;一代表轉(zhuǎn)換;R、……a代表英語成分的漢語譯文,的、被s、皿工是漢語關(guān)系詞)規(guī)則一…4......*—"..漢的......漢規(guī)則二*."by2......-—被5……漢…漢規(guī)則三氺…1......—規(guī)則四relatingto......—有關(guān)i......漢白勺...漢第一層轉(zhuǎn)換automatic1means1—automatic1^勺means1漢—自動3的工具、規(guī)則一)第二層轉(zhuǎn)換performed1by2automatic1means1—被5automatic1meanslRperformed1皿3的工具1被執(zhí)行(規(guī)則二)第三層轉(zhuǎn)換dataprocessingperformed1by2automatic1means1—performed1by2automatic1means1漢的dataprocessing漢一被5自動3的工具1被執(zhí)行的數(shù)據(jù)處理(規(guī)則三)第四層轉(zhuǎn)換methods1relatingtodataprocessingperformed1by2automatic1means1—有關(guān)1dataprocessingperformed1by2automatic1means1漢白勺methods1漢—^^1f皮5直的工具1被執(zhí)行的數(shù)據(jù)處理的方法(規(guī)則四)非形式化的漢語皿1被5^^3的工具1被執(zhí),行的數(shù)據(jù)處理的方法把形式化的源i吾言轉(zhuǎn)換成非形式化的目標(biāo)i吾言的實現(xiàn),圖7示出了把形式化的源語言轉(zhuǎn)換成非形式化的目標(biāo)語言的實現(xiàn)過程。請結(jié)合圖7參考下面的實現(xiàn)過程的詳細(xì)描述。第一步查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段。目標(biāo)語言的固定語段帶有意義標(biāo)記。第二步查找非固定語段轉(zhuǎn)換規(guī)則列表得到匹配的非固定語段轉(zhuǎn)換規(guī)則,運用匹配的非固定語段轉(zhuǎn)換規(guī)則(即,根據(jù)源語言的非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記或關(guān)系詞用源語言的非固定語段的成分的譯文、目標(biāo)語言的關(guān)系詞構(gòu)成目標(biāo)語言的非固定語段的規(guī)則)把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段。通過遞歸執(zhí)行此步驟逐層轉(zhuǎn)換所有的非固定語段。就形式化的源語言的一個當(dāng)前非固定語段而言首先,把它的各個成分分別轉(zhuǎn)換成非形式化的目標(biāo)語言;然后,運用匹配的非固定語段轉(zhuǎn)換規(guī)則把當(dāng)前非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言;返回當(dāng)前非固定語段的轉(zhuǎn)換結(jié)果供上一層次的非固定語段調(diào)用,直到把最高層次的非固定語段(作為初始數(shù)據(jù)的非固定語段)轉(zhuǎn)換成非形式化的目標(biāo)L口口o第三步輸出非形式化的目標(biāo)語言。雄i吾擁,i涵服i吾舗和遍i圣,ffl從源語言到非形式化的目標(biāo)語言的機器翻譯可以用于互聯(lián)網(wǎng)終端設(shè)備。例如在用作互聯(lián)網(wǎng)終端設(shè)備并且連接電腦的手機的存儲裝置里存儲從源語言到非形式化目標(biāo)語言機器翻譯系統(tǒng)。甲是母語是漢語、完全不懂英語的使用者;乙是母語是英語、完全不懂漢語的使用者。甲把非形式化的漢語輸入自己的手機,甲和自己的手機以交互方式對非形式化的漢語進(jìn)行形式化處理,甲的手機以自動方式把形式化的漢語轉(zhuǎn)換成非形式化的英語,然后,甲的手機把非形式化的英語發(fā)送給乙,乙在自己的手機上閱讀非形式化的英語;乙把非形式化的英語輸入自己的手機,乙和自己的手機以交互方式對非形式化的英語進(jìn)行形式化處理,乙的手機以自動方式把形式化的英語轉(zhuǎn)換成非形式化的漢語,然后,乙的手機把非形式化的漢語發(fā)送給甲,甲在自己的手機上閱讀非形式化的漢語。(具有從源語言到非形式化目標(biāo)語言機器翻譯功能的手機所連接的電腦也具有從源語言到非形式化目標(biāo)語言機器翻譯功能)使用者可以使用手機把母語正確(而且沒有任何詞匯歧義)地翻譯成任何一種自己完全不懂的外語。具有從源語言到非形式化目標(biāo)語言機器翻譯功能的手機能夠消除互聯(lián)網(wǎng)的語言障礙,增進(jìn)各國人民的相互了解與合作。四、析,器翻譯方法的第四實施例本實施例的機器翻譯方法是將非形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言,主要包括兩個步驟,第一步驟是對于非形式化的源語言的初始語段,首先,以自動方式逐個切分固定語段(標(biāo)注固定語段標(biāo)記)并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以自動方式逐層組合非固定語段(標(biāo)注組合標(biāo)記)并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。第二步驟是自動運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換為目標(biāo)語言的語段,然后以自動方式運用非固定語段轉(zhuǎn)換規(guī)則逐層把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段,從而將非形式化的源語言轉(zhuǎn)換為非形式化的目標(biāo)語言。其中本實施例的標(biāo)記的說明、替代、以自動方式對源語言進(jìn)行形式化處理(包括以自動方式切分固定i吾段并標(biāo)灃標(biāo)記的過禾呈以及以自動方式飽合非固定i吾段并標(biāo)灃標(biāo)記Miilil都和第二實施例相同,在此不再贅述,以下重點說明本實施例和上述第二實施例的區(qū)別所在。換句話說,本實施例的第一個步驟和第二實施例的第一個步驟是完全一樣的,因此下面是對本實施例第二個步驟的詳細(xì)描述。護U纖原i吾諧械,i涵服i吾舗討禾罕以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段,然后,以自動方式運用非固定語段轉(zhuǎn)換規(guī)則(即,根據(jù)源語言的非固定語段的核心成分標(biāo)記和關(guān)系標(biāo)記或關(guān)系詞用源語言的非固定語段的成分的譯文和目標(biāo)語言的關(guān)系詞構(gòu)成目標(biāo)語言的非固定語段的規(guī)則)逐層把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段。'王o非形式化的英語methodsrelatingtodataprocessingperformedbyautomaticmeans形式化的英語methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob_4_^NobVTEDPAaa20NaaNth(以自動方式對源語言進(jìn)行形式化處理的結(jié)果)以自動方式運用固定語段轉(zhuǎn)換規(guī)則把英語的固定語段轉(zhuǎn)換成漢語的語段固定語段轉(zhuǎn)換規(guī)則英語漢語法語德語日語methods1方法***************dataprocessing數(shù)據(jù)處理***************performed1***************automatic1自動3***************m6肌s1工具1***************methods1—方法dataprocessing—數(shù)據(jù)處王串.performed1—被執(zhí)行automatic1—自云力3means1—工具1以自動方式運用非固定語段轉(zhuǎn)換規(guī)則逐層把英語的非固定語段轉(zhuǎn)換成漢語的語段非固定語段轉(zhuǎn)換規(guī)則(、代表英語成分,b/、relatingto是英語關(guān)系詞,*是核心成分標(biāo)記,4、1是關(guān)系標(biāo)記;一代表轉(zhuǎn)換;R、……a代表英語成分的漢語譯文,的、被s、皿工是漢語關(guān)系詞)規(guī)則一…4......*—"..漢的......漢規(guī)則二*."by2......-—被5……漢…漢規(guī)則三氺…1......—規(guī)則四relatingto......—有關(guān)i......漢白勺...漢第一層轉(zhuǎn)換automatic1means1—automatic1^勺means1漢—自動3的工具、規(guī)則一:第二層轉(zhuǎn)換performed1by2automatic1means1—被5automatic1means1漢performed皿3的工具1被執(zhí)行(規(guī)則二)第三層轉(zhuǎn)換dataprocessingperformed1by2automatic1means1—performed1by2auto腿tic1means1漢的dataprocessing漢一被5自動3的工具1被執(zhí)行的數(shù)據(jù)處理(規(guī)則三)第四層轉(zhuǎn)換methods1relatingtodat抑rocessingperformed1by2automatic1means1—有關(guān)Mataprocessingperformed1by2automatic1means1漢的methods1漢一有關(guān)1被5自的工具1被執(zhí)行的數(shù)據(jù)處理的方法(規(guī)則四)非形式化的漢語皿1被5^^3的工具1被執(zhí),行的數(shù)據(jù)處理的方法而把形式化的源i吾言轉(zhuǎn)換成非形式化的目標(biāo)i吾言的實現(xiàn),以及從源i吾言到l非形式化的目標(biāo)語言的機器翻譯的應(yīng)用均在上述的第三實施例中說明,在此不再贅述。在描述了關(guān)于機器翻譯方法的上述四個實施例之后,本發(fā)明分別針對上述的四個有關(guān)方法的實施例,提供了關(guān)于機器翻譯系統(tǒng)的四個實施例。由于這四個系統(tǒng)的實施例的技術(shù)實現(xiàn)細(xì)節(jié)和對應(yīng)的方法實施例相同,因此對于這些系統(tǒng)實施例下面不提供對其具體實施技術(shù)的詳細(xì)描述。五、機器翻譯系統(tǒng)的第一實施例圖8示出了機器翻譯系統(tǒng)的第一實施例的原理。請參見圖8,本實施例的機器翻譯系統(tǒng)至少包括兩個模塊源語言形式化處理模塊10和與之連接的形式化目標(biāo)語言轉(zhuǎn)換模塊12。對于源語言形式化處理模塊IO,對于非形式化的源語言的初始語段,首先,以交互方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以交互方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。對于形式化目標(biāo)語言轉(zhuǎn)換模塊12,自動運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換為目標(biāo)語言的語段,從而將非形式化的源語言轉(zhuǎn)換為形式化的目標(biāo)L口口o對于本實施例的機器翻譯系統(tǒng)中涉及的標(biāo)記,和機器翻譯方法的第一實施例中詳細(xì)記載的標(biāo)記相同。較佳的,本實施例還可以設(shè)置一個替換標(biāo)記模塊,替換標(biāo)記模塊連接在源語言形式化處理模塊10之前,在源語言形式化處理模塊10之前預(yù)先使用替換標(biāo)記把一個初始語段分解成若干個子語段,針對這些子語段分別進(jìn)行后續(xù)的源語言形式化處理模塊10的處理。替換標(biāo)記模塊的具體運作過程和機器翻譯方法的第一實施例中詳細(xì)記載的替換標(biāo)記相同。對于源語言形式化處理模塊10而言,其內(nèi)部至少包括了交互式切分固定語段單元100以及與之連接的交互式組合非固定語段單元102。對于交互式切分固定語段單元100來說,存儲器的固定語段模式包含固定語段及其意義標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記,由處理器依次判斷在存儲器里是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推,如果在存儲器里存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就將最前的n個文字單元切分為固定語段,標(biāo)注固定語段標(biāo)記,運用一個固定語段模式標(biāo)注該固定語段的意義標(biāo)記,其中n為自然數(shù),然后由使用者確認(rèn)或修改,依此類推直到最后一個固定語段;其中如果在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段,標(biāo)注固定語段標(biāo)記并標(biāo)注這個固定語段的意義標(biāo)記,然后由處理器繼續(xù)切分和標(biāo)注下一個固定語段。而其內(nèi)部實現(xiàn)的具體細(xì)節(jié)、實例等均已在機器翻譯方法的第一實施例中說明。對于交互式組合非固定語段單元102來說,以交互方式逐層逐個按組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記的順序標(biāo)注非固定語段的標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。而交互式組合非固定語段單元102具體的實現(xiàn)細(xì)節(jié)、實例等均已在機器翻譯方法的第一實施例中說明。形式化目標(biāo)語言轉(zhuǎn)換模塊12進(jìn)一步包括依次連接的標(biāo)記刪除單元120、固定語段轉(zhuǎn)換單元122以及標(biāo)記點擊單元124。標(biāo)記刪除單元120刪除形式化的源語言的語法屬性標(biāo)記和語義屬性標(biāo)記。固定語段轉(zhuǎn)換單元122查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段,其中目標(biāo)語言的固定語段帶有意義標(biāo)記。標(biāo)記點擊單元124在使用者點擊目標(biāo)語言的固定語段的意義標(biāo)記以后顯示固定語段的意義特征,在使用者點擊關(guān)系標(biāo)記以后顯示關(guān)系標(biāo)記所代表的關(guān)系。這三個單元具體的實現(xiàn)細(xì)節(jié)以及形式化目標(biāo)語言轉(zhuǎn)換模塊12的實例,均已在機器翻譯方法的第一實施例中說明。A、和遍i圣碰白條二輔你l圖9示出了機器翻譯系統(tǒng)的第二實施例的原理。請參見圖9,本實施例的機器翻譯系統(tǒng)至少包括兩個模塊源語言形式化處理模塊20和與之連接的形式化目標(biāo)語言轉(zhuǎn)換模塊22。對于源語言形式化處理模塊20,對于非形式化的源語言的初始語段,首先,以自動方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以自動方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。對于形式化目標(biāo)語言轉(zhuǎn)換模塊22,自動運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換為目標(biāo)語言的語段,從而將非形式化的源語言轉(zhuǎn)換為形式化的目標(biāo)L口口o對于本實施例的機器翻譯系統(tǒng)中涉及的標(biāo)記,和機器翻譯方法的第二實施例中詳細(xì)記載的標(biāo)記相同。較佳的,本實施例還可以設(shè)置一個替換標(biāo)記模塊,替換標(biāo)記模塊連接在源語言形式化處理模塊20之前,在源語言形式化處理模塊20之前預(yù)先使用替換標(biāo)記把一個初始語段分解成若干個子語段,針對這些子語段分別進(jìn)行后續(xù)的源語言形式化處理模塊20的處理。替換標(biāo)記模塊的具體運作過程和機器翻譯方法的第二實施例中詳細(xì)記載的替換標(biāo)記相同。對于源語言形式化處理模塊20而言,其內(nèi)部至少包括了自動式切分固定語段單元200以及與之連接的自動式組合非固定語段單元202。對于自動式切分固定語段單元200來說,存儲器的固定語段模式包含固定語段及其意義標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記,由處理器依次判斷在存儲器里是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推,如果在存儲器里存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就將最前的n個文字單元切分為固定語段,標(biāo)注固定語段標(biāo)記,運用一個固定語段模式標(biāo)注該固定語段的意義標(biāo)記,其中n為自然數(shù),然后由使用者確認(rèn)或修改,依此類推直到最后一個固定語段;其中如果在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段,標(biāo)注固定語段標(biāo)記并標(biāo)注這個固定語段的意義標(biāo)記,然后由處理器繼續(xù)切分和標(biāo)注下一個固定語段。而其內(nèi)部實現(xiàn)的具體細(xì)節(jié)、實例等均已在機器翻譯方法的第二實施例中說明。對于自動式組合非固定語段單元202來說,以自動方式逐層逐個按組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記的順序標(biāo)注非固定語段的標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。而自動式組合非固定語段單元202具體的實現(xiàn)細(xì)節(jié)、實例等均已在機器翻譯方法的第二實施例中說明。形式化目標(biāo)語言轉(zhuǎn)換模塊22進(jìn)一步包括依次連接的自動方式標(biāo)記刪除單元220、自動方式固定語段轉(zhuǎn)換單元222以及標(biāo)記點擊單元224。自動方式標(biāo)記刪除單元220以自動方式刪除作為以自動方式對源語言進(jìn)行形式化處理的結(jié)果的形式化的源語言的語法屬性標(biāo)記和語義屬性標(biāo)記(自動方式標(biāo)記刪除單元220可以不設(shè)置)。自動方式固定語段轉(zhuǎn)換單元222查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段,其中目標(biāo)語言的固定語段帶有意義標(biāo)記。標(biāo)記點擊單元224在使用者點擊目標(biāo)語言的固定語段的意義標(biāo)記以后顯示固定語段的意義特征,在使用者點擊關(guān)系標(biāo)記以后顯示關(guān)系標(biāo)記所代表的關(guān)系。這三個單元具體的實現(xiàn)細(xì)節(jié)以及形式化目標(biāo)語言轉(zhuǎn)換模塊22的實例,均已在機器翻譯方法的第二實施例中說明。七'、和遍i圣碰白勺m翻圖IO示出了機器翻譯系統(tǒng)的第三實施例的原理。請參見圖IO,本實施例的機器翻譯系統(tǒng)至少包括兩個模塊源語言形式化處理模塊30和與之連接的非形式化目標(biāo)語言轉(zhuǎn)換模塊32。對于源語言形式化處理模塊30,對于非形式化的源語言的初始語段,首先,以交互方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以交互方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。對于非形式化目標(biāo)語言轉(zhuǎn)換模塊32,以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段,然后以自動方式運用非固定語段轉(zhuǎn)換規(guī)則逐層把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段,從而將非形式化的源語言轉(zhuǎn)換為非形式化的目標(biāo)語言。對于本實施例的機器翻譯系統(tǒng)中涉及的標(biāo)記,和機器翻譯方法的第三實施例中詳細(xì)記載的標(biāo)記相同。較佳的,本實施例還可以設(shè)置一個替換標(biāo)記模塊,替換標(biāo)記模塊連接在源語言形式化處理模塊30之前,在源語言形式化處理模塊30之前預(yù)先使用替換標(biāo)記把一個初始語段分解成若干個子語段,針對這些子語段分別進(jìn)行后續(xù)的源語言形式化處理模塊30的處理。替換標(biāo)記模塊的具體運作過程和機器翻譯方法的第三實施例中詳細(xì)記載的替換標(biāo)記相同。對于源語言形式化處理模塊30而言,其內(nèi)部至少包括了交互式切分固定語段單元300以及與之連接的交互式組合非固定語段單元302。對于交互式切分固定語段單元300來說,存儲器的固定語段模式包含固定語段及其意義標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記,由處理器依次判斷在存儲器里是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推,如果在存儲器里存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就將最前的n個文字單元切分為固定語段,標(biāo)注固定語段標(biāo)記,運用一個固定語段模式標(biāo)注該固定語段的意義標(biāo)記,其中n為自然數(shù),然后由使用者確認(rèn)或修改,依此類推直到最后一個固定語段;其中如果在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段,標(biāo)注固定語段標(biāo)記并標(biāo)注這個固定語段的意義標(biāo)記,然后由處理器繼續(xù)切分和標(biāo)注下一個固定語段。而其內(nèi)部實現(xiàn)的具體細(xì)節(jié)、實例等均已在機器翻譯方法的第三實施例中說明。對于交互式組合非固定語段單元302來說,以交互方式逐層逐個按組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記的順序標(biāo)注非固定語段的標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。而交互式組合非固定語段單元302具體的實現(xiàn)細(xì)節(jié)、實例等均已在機器翻譯方法的第三實施例中說明。非形式化目標(biāo)語言轉(zhuǎn)換模塊32進(jìn)一步包括固定語段轉(zhuǎn)換單元320以及與之連接的非固定語段轉(zhuǎn)換單元322。固定語段轉(zhuǎn)換單元320查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段,其中目標(biāo)語言的固定語段帶有意義標(biāo)記。非固定語段轉(zhuǎn)換單元322查找非固定語段轉(zhuǎn)換規(guī)則列表得到匹配的非固定語段轉(zhuǎn)換規(guī)則,運用匹配的非固定語段轉(zhuǎn)換規(guī)則把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段,通過遞歸執(zhí)行此步驟逐層轉(zhuǎn)換所有的非固定語段,其中對形式化的源語言的當(dāng)前非固定語段來說,首先把當(dāng)前非固定語段的各個成分分別轉(zhuǎn)換成非形式化的目標(biāo)語言,然后運用匹配的非固定語段轉(zhuǎn)換規(guī)則把當(dāng)前非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言,返回當(dāng)前非固定語段的轉(zhuǎn)換結(jié)果供上一層次的非固定語段調(diào)用,直到把最高層次的非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言,最后輸出非形式化的目標(biāo)語言。這兩個單元具體的實現(xiàn)細(xì)節(jié)以及非形式化目標(biāo)語言轉(zhuǎn)換模塊32的實例,均已在機器翻譯方法的第三實施例中說明。八、和遍i圣碰白條隨翻圖11示出了機器翻譯系統(tǒng)的第四實施例的原理。請參見圖ll,本實施例的機器翻譯系統(tǒng)至少包括兩個模塊源語言形式化處理模塊40和與之連接的非形式化目標(biāo)語言轉(zhuǎn)換模塊42。對于源語言形式化處理模塊40,對于非形式化的源語言的初始語段,首先,以自動方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以自動方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。對于非形式化目標(biāo)語言轉(zhuǎn)換模塊42,以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段,然后以自動方式運用非固定語段轉(zhuǎn)換規(guī)則逐層把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段,從而將非形式化的源語言轉(zhuǎn)換為非形式化的目標(biāo)語言。對于本實施例的機器翻譯系統(tǒng)中涉及的標(biāo)記,和機器翻譯方法的第四實施例中詳細(xì)記載的標(biāo)記相同。較佳的,本實施例還可以設(shè)置一個替換標(biāo)記模塊,替換標(biāo)記模塊連接在源語言形式化處理模塊40之前,在源語言形式化處理模塊40之前預(yù)先使用替換標(biāo)記把一個初始語段分解成若干個子語段,針對這些子語段分別進(jìn)行后續(xù)的源語言形式化處理模塊40的處理。替換標(biāo)記模塊的具體運作過程和機器翻譯方法的第四實施例中詳細(xì)記載的替換標(biāo)記相同。對于源語言形式化處理模塊40而言,其內(nèi)部至少包括了自動式切分固定語段單元400以及與之連接的自動式組合非固定語段單元402。對于自動式切分固定語段單元400來說,存儲器的固定語段模式包含固定語段及其意義標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記,由處理器依次判斷在存儲器里是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推,如果在存儲器里存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的同定語段,處理器就將最前的n個文字單元切分為固定語段,標(biāo)注固定語段標(biāo)記,運用一個固定語段模式標(biāo)注該固定語段的意義標(biāo)記,其中n為自然數(shù),然后由使用者確認(rèn)或修改,依此類推直到最后一個固定語段;其中如果在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段,標(biāo)注固定語段標(biāo)記并標(biāo)注這個固定語段的意義標(biāo)記,然后由處理器繼續(xù)切分和標(biāo)注下一個固定語段。而其內(nèi)部實現(xiàn)的具體細(xì)節(jié)、實例等均已在機器翻譯方法的第四實施例中說明。對于自動式組合非固定語段單元402來說,以自動方式逐層逐個按組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記的順序標(biāo)注非固定語段的標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。而自動式組合非固定語段單元402具體的實現(xiàn)細(xì)節(jié)、實例等均已在機器翻譯方法的第四實施例中說明。非形式化目標(biāo)語言轉(zhuǎn)換模塊42進(jìn)一步包括固定語段轉(zhuǎn)換單元420以及與之連接的非固定語段轉(zhuǎn)換單元422。固定語段轉(zhuǎn)換單元420查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段,其中目標(biāo)語言的固定語段帶有意義標(biāo)記。非固定語段轉(zhuǎn)換單元422查找非固定語段轉(zhuǎn)換規(guī)則列表得到匹配的非固定語段轉(zhuǎn)換規(guī)則,運用匹配的非固定語段轉(zhuǎn)換規(guī)則把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段,通過遞歸執(zhí)行此步驟逐層轉(zhuǎn)換所有的非固定語段,其中對形式化的源語言的當(dāng)前非固定語段來說,首先把當(dāng)前非固定語段的各個成分分別轉(zhuǎn)換成非形式化的目標(biāo)語言,然后運用匹配的非固定語段轉(zhuǎn)換規(guī)則把當(dāng)前非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言,返回當(dāng)前非固定語段的轉(zhuǎn)換結(jié)果供上一層次的非固定語段調(diào)用,直到把最高層次的非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言,最后輸出非形式化的目標(biāo)語言。這兩個單元具體的實現(xiàn)細(xì)節(jié)以及非形式化目標(biāo)語言轉(zhuǎn)換模塊42的實例,均已在機器翻譯方法的第四實施例中說明。上述實施例是提供給本領(lǐng)域普通技術(shù)人員來實現(xiàn)或使用本發(fā)明的,本領(lǐng)域普通技術(shù)人員可在不脫離本發(fā)明的發(fā)明思想的情況下,對上述實施例做出種種修改或變化,因而本發(fā)明的保護范圍并不被上述實施例所限,而應(yīng)該是符合權(quán)利要求書提到的創(chuàng)新性特征的最大范圍。4權(quán)利要求一種把非形式化的源語言翻譯成形式化的目標(biāo)語言的機器翻譯方法,該方法包括步驟一對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段;步驟二以自動方式把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言——以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段。2.根據(jù)權(quán)利要求l所述的機器翻譯方法,其特征在于在步驟一中,使用替代標(biāo)記進(jìn)行預(yù)處理——預(yù)先使用替代標(biāo)記把一個初始語段分解成若干個子語段,接著對這些子語段分別進(jìn)行形式化處理。3.根據(jù)權(quán)利要求1所述的機器翻譯方法,其特征在于步驟一是以交互方式對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,以交互方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以交互方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。4.根據(jù)權(quán)利要求3所述的機器翻譯方法,其特征在于以交互方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果在存儲器里存在最前的n,個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),運用一個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記,然后,使用者確認(rèn)或修改,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段并標(biāo)注這個固定語段的意義標(biāo)記,然后,處理器切分和標(biāo)注下一個固定語段。5.根據(jù)權(quán)利要求1所述的機器翻譯方法,其特征在于步驟一是以自動方式對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,以自動方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以自動方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。6.根據(jù)權(quán)利要求5所述的機器翻譯方法,其特征在于以自動方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果,在存儲器里,存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),查出存儲器里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,處理器就進(jìn)行回溯。7.根據(jù)權(quán)利要求5所述的機器翻譯方法,其特征在于以自動方式組合并標(biāo)注非固定語段的過程進(jìn)一步包括存儲器里的非固定語段模式包含成分語段的語法屬性標(biāo)記、語義屬性標(biāo)記和組合語段的組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記;處理器查出存儲器里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式,運用這個非固定語段模式組合一個非固定語段并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,然后,處理器組合和標(biāo)注下一個非固定語段,依此類推,直到整個初始語段構(gòu)成的一個非固定語段;如果處理器查出在存儲器里不存在可以運用的非固定語段模式,處理器就進(jìn)行回溯。8.根據(jù)權(quán)利要求1所述的機器翻譯方法,其特征在于在步驟二中,處理器查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段,目標(biāo)語言的固定語段帶有意義標(biāo)記;在使用者點擊目標(biāo)語言的固定語段的意義標(biāo)記以后顯示器顯示固定語段的意義特征,在使用者點擊關(guān)系標(biāo)記以后顯示器顯示關(guān)系標(biāo)記所代表的關(guān)系。9.一種把非形式化的源語言翻譯成非形式化的目標(biāo)語言的機器翻譯方法,該方法包括步驟一對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段;步驟二以自動方式把形式化的源語言轉(zhuǎn)換成非形式化的目標(biāo)語言——首先,以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段,然后,以自動方式運用非固定語段轉(zhuǎn)換規(guī)則逐層把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段。10.根據(jù)權(quán)利要求9所述的機器翻譯方法,其特征在于在步驟一中,使用替代標(biāo)記進(jìn)行預(yù)處理——預(yù)先使用替代標(biāo)記把一個初始語段分解成若干個子語段,接著對這些子語段分別進(jìn)行形式化處理。11.根據(jù)權(quán)利要求9所述的機器翻譯方法,其特征在于步驟一是以交互方式對非形式化的源語言進(jìn)行形式化處理進(jìn)一步包括對于非形式化的源語言的初始語段,首先,以交互方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以交互方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。12.根據(jù)權(quán)利要求11所述的機器翻譯方法,其特征在于以交互方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果在存儲器里存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),運用一個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記,然后,使用者確認(rèn)或修改,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段并標(biāo)注這個固定語段的意義標(biāo)記,然后,處理器切分和標(biāo)注下一個固定語段。13.根據(jù)權(quán)利要求9所述的機器翻譯方法,其特征在于步驟一是以自動方式對非形式化的源語言進(jìn)行形式化處理,進(jìn)一步包括對于非形式化的源語言的初始語段,首先,以自動方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,以自動方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。14.根據(jù)權(quán)利要求13所述的機器翻譯方法,其特征在于以自動方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果,在存儲器里,存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),查出存儲器里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,處理器就進(jìn)行回溯。15.根據(jù)權(quán)利要求13所述的機器翻譯方法,其特征在于以自動方式組合并標(biāo)注非固定語段的過程進(jìn)一步包括存儲器里的非固定語段模式包含成分語段的語法屬性標(biāo)記、語義屬性標(biāo)記和組合語段的組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記;處理器查出存儲器里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式,運用這個非固定語段模式組合一個非固定語段并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,然后,處理器組合和標(biāo)注下一個非固定語段,依此類推,直到整個初始語段構(gòu)成的一個非固定語段;如果處理器查出在存儲器里不存在可以運用的非固定語段模式,處理器就進(jìn)行回溯。16.根據(jù)權(quán)利要求9所述的機器翻譯方法,其特征在于步驟二進(jìn)一步包括處理器查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段;處理器查找非固定語段轉(zhuǎn)換規(guī)則列表得到匹配的非固定語段轉(zhuǎn)換規(guī)則,目標(biāo)語言的非固定語段的規(guī)則是根據(jù)源語言的非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記或關(guān)系詞用源語言的非固定語段的成分的譯文、目標(biāo)語言的關(guān)系詞構(gòu)成的,運用匹配的非固定語段轉(zhuǎn)換規(guī)則把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的非固定語段,通過遞歸執(zhí)行此步驟逐層轉(zhuǎn)換所有的非固定語段,其中對形式化的源語言的當(dāng)前非固定語段來說,首先把當(dāng)前非固定語段的各個成分分別轉(zhuǎn)換成非形式化的目標(biāo)語言,然后運用匹配的非固定語段轉(zhuǎn)換規(guī)則把當(dāng)前非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言,返回當(dāng)前非固定語段的轉(zhuǎn)換結(jié)果供上一層次的非固定語段調(diào)用,直到把作為初始數(shù)據(jù)的非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言。17.—種把非形式化的源語言翻譯成形式化的目標(biāo)語言的機器翻譯系統(tǒng),該系統(tǒng)包括源語言形式化處理模塊,該模塊對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段;形式化目標(biāo)語言轉(zhuǎn)換模塊,該模塊連接在源語言形式化處理模塊之后,以自動方式把形式化的源語言轉(zhuǎn)換成形式化的目標(biāo)語言——以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段。18.根據(jù)權(quán)利要求17所述的機器翻譯系統(tǒng),其特征在于該系統(tǒng)還包括一個連接在源語言形式化處理模塊之前的替代模塊,該模塊使用替代標(biāo)記進(jìn)行預(yù)處理——預(yù)先使用替代標(biāo)記把一個初始語段分解成若干個子語段,接著對這些子語段分別進(jìn)行形式化處理。19.根據(jù)權(quán)利要求17所述的機器翻譯系統(tǒng),其特征在于源語言形式化處理模塊以交互方式對非形式化的源語言進(jìn)行形式化處理,該模塊進(jìn)一步包括交互方式固定語段切分單元,該單元以交互方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段;交互方式非固定語段組合單元,該單元連接在交互方式固定語段切分單元之后,以交互方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。20.根據(jù)權(quán)利要求19所述的機器翻譯系統(tǒng),其特征在于交互方式固定語段切分單元以交互方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果在存儲器里存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),運用一個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記,然后,使用者確認(rèn)或修改,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段并標(biāo)注這個固定語段的意義標(biāo)記,然后,處理器切分和標(biāo)注下一個固定語段。21.根據(jù)權(quán)利要求17所述的機器翻譯系統(tǒng),其特征在于源語言形式化處理模塊以自動方式對非形式化的源語言進(jìn)行形式化處理,該模塊進(jìn)一步包括自動方式固定語段切分單元,該單元以自動方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段;自動方式非固定語段組合單元,該單元連接在自動方式固定語段切分單元之后,以自動方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。22.根據(jù)權(quán)利要求21所述的機器翻譯系統(tǒng),其特征在于自動方式固定語段切分單元以自動方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果,在存儲器里,存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),查出存儲器里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,處理器就進(jìn)行回溯。23.根據(jù)權(quán)利要求21所述的機器翻譯系統(tǒng),其特征在于自動方式非固定語段組合單元以自動方式組合并標(biāo)注非固定語段的過程進(jìn)一步包括存儲器里的非固定語段模式包含成分語段的語法屬性標(biāo)記、語義屬性標(biāo)記和組合語段的組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記;處理器查出存儲器里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式,運用這個非固定語段模式組合一個非固定語段并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,然后,處理器組合和標(biāo)注下一個非固定語段,依此類推,直到整個初始語段構(gòu)成的一個非固定語段;如果處理器查出在存儲器里不存在可以運用的非固定語段模式,處理器就進(jìn)行回溯。24.根據(jù)權(quán)利要求17所述的機器翻譯系統(tǒng),其特征在于形式化目標(biāo)語言轉(zhuǎn)換模塊進(jìn)一步包括自動方式固定語段轉(zhuǎn)換單元,該單元查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段,目標(biāo)語言的固定語段帶有意義標(biāo)記;標(biāo)記點擊單元,該單元在使用者點擊目標(biāo)語言的固定語段的意義標(biāo)記以后顯示固定語段的意義特征,在使用者點擊關(guān)系標(biāo)記以后顯示關(guān)系標(biāo)記所代表的關(guān)系。25.—種把非形式化的源語言翻譯成非形式化的目標(biāo)語言的機器翻譯系統(tǒng),該系統(tǒng)包括源語言形式化處理模塊,該模塊對非形式化的源語言進(jìn)行形式化處理——對于非形式化的源語言的初始語段,首先,逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段,然后,逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段;非形式化目標(biāo)語言轉(zhuǎn)換模塊,該模塊連接在源語言形式化處理模塊之后,以自動方式把形式化的源語言轉(zhuǎn)換成非形式化的目標(biāo)語言——首先,以自動方式運用固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的語段,然后,以自動方式運用非固定語段轉(zhuǎn)換規(guī)則逐層把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的語段。26.根據(jù)權(quán)利要求25所述的機器翻譯系統(tǒng),其特征在于該系統(tǒng)還包括一個連接在源語言形式化處理模塊之前的替代模塊,該模塊使用替代標(biāo)記進(jìn)行預(yù)處理——預(yù)先使用替代標(biāo)記把一個初始語段分解成若干個子語段,接著對這些子語段分別進(jìn)行形式化處理。27.根據(jù)權(quán)利要求25所述的機器翻譯系統(tǒng),其特征在于源語言形式化處理模塊以交互方式對非形式化的源語言進(jìn)行形式化處理,該模塊進(jìn)一步包括交互方式固定語段切分單元,該單元以交互方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段;交互方式非固定語段組合單元,該單元連接在交互方式固定語段切分單元之后,以交互方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。28.根據(jù)權(quán)利要求27所述的機器翻譯系統(tǒng),其特征在于交互方式固定語段切分單元以交互方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記,形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果在存儲器里存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),運用一個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記,然后,使用者確認(rèn)或修改,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段并標(biāo)注這個固定語段的意義標(biāo)記,然后,處理器切分和標(biāo)注下一個固定語段。29.根據(jù)權(quán)利要求25所述的機器翻譯系統(tǒng),其特征在于源語言形式化處理模塊以自動方式對非形式化的源語言進(jìn)行形式化處理,該模塊進(jìn)一步包括自動方式固定語段切分單元,該單元以自動方式逐個切分固定語段并標(biāo)注固定語段的意義標(biāo)記,直到最后一個固定語段;自動方式非固定語段組合單元,該單元連接在自動方式固定語段切分單元之后,以自動方式逐層組合非固定語段并標(biāo)注非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記,直到整個初始語段構(gòu)成的一個非固定語段。30.根據(jù)權(quán)利要求29所述的機器翻譯系統(tǒng),其特征在于自動方式固定語段切分單元以自動方式切分并標(biāo)注固定語段的過程進(jìn)一步包括存儲器里的固定語段模式包含固定語段及其意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,其中形式相同意義不同的固定語段帶有意義標(biāo)記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果,在存儲器里,存在最前的n個文字單元開頭的固定語段而不存在最前的n+l個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數(shù),查出存儲器里的各個可以運用的固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標(biāo)注這個固定語段的意義標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,處理器就進(jìn)行回溯。31.根據(jù)權(quán)利要求29所述的機器翻譯系統(tǒng),其特征在于自動方式非固定語段組合單元以自動方式組合并標(biāo)注非固定語段的過程進(jìn)一步包括存儲器里的非固定語段模式包含成分語段的語法屬性標(biāo)記、語義屬性標(biāo)記和組合語段的組合標(biāo)記、核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記;處理器查出存儲器里的各個可以運用的非固定語段模式,按累計運用次數(shù)從多到少的選擇順序選擇其中的一個非固定語段模式,運用這個非固定語段模式組合一個非固定語段并標(biāo)注這個非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記、語法屬性標(biāo)記、語義屬性標(biāo)記,然后,處理器組合和標(biāo)注下一個非固定語段,依此類推,直到整個初始語段構(gòu)成的一個非固定語段;如果處理器查出在存儲器里不存在可以運用的非固定語段模式,處理器就進(jìn)行回溯。32.根據(jù)權(quán)利要求25所述的機器翻譯系統(tǒng),其特征在于非形式化目標(biāo)語言轉(zhuǎn)換模塊進(jìn)一步包括自動方式固定語段轉(zhuǎn)換單元,該單元查找固定語段轉(zhuǎn)換規(guī)則列表得到匹配的固定語段轉(zhuǎn)換規(guī)則,運用匹配的固定語段轉(zhuǎn)換規(guī)則把源語言的固定語段轉(zhuǎn)換成目標(biāo)語言的固定語段或非固定語段;自動方式非固定語段轉(zhuǎn)換單元,該單元連接在自動方式固定語段轉(zhuǎn)換單元之后,查找非固定語段轉(zhuǎn)換規(guī)則列表得到匹配的非固定語段轉(zhuǎn)換規(guī)則,其中目標(biāo)語言的非固定語段的規(guī)則是根據(jù)源語言的非固定語段的核心成分標(biāo)記、關(guān)系標(biāo)記或關(guān)系詞用源語言的非固定語段的成分的譯文、目標(biāo)語言的關(guān)系詞構(gòu)成的,運用匹配的非固定語段轉(zhuǎn)換規(guī)則把源語言的非固定語段轉(zhuǎn)換成目標(biāo)語言的非固定語段,通過遞歸執(zhí)行此步驟逐層轉(zhuǎn)換所有的非固定語段,其中對形式化的源語言的當(dāng)前非固定語段來說,首先把當(dāng)前非固定語段的各個成分分別轉(zhuǎn)換成非形式化的目標(biāo)語言,然后運用匹配的非固定語段轉(zhuǎn)換規(guī)則把當(dāng)前非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言,返回當(dāng)前非固定語段的轉(zhuǎn)換結(jié)果供上一層次的非固定語段調(diào)用,直到把作為初始數(shù)據(jù)的非固定語段轉(zhuǎn)換成非形式化的目標(biāo)語言。全文摘要本發(fā)明揭示了機器翻譯方法和系統(tǒng),使用者可以把母語正確(而且沒有任何詞匯歧義)地翻譯成任何一種自己完全不懂的外語。機器翻譯方法包括以交互方式或自動方式對非形式化源語言進(jìn)行形式化處理和以自動方式把形式化源語言轉(zhuǎn)換成形式化目標(biāo)語言或非形式化目標(biāo)語言兩個步驟。機器翻譯系統(tǒng)包括交互方式或自動方式源語言形式化處理模塊和自動方式形式化目標(biāo)語言或非形式化目標(biāo)語言轉(zhuǎn)換模塊。源語言形式化處理模塊和目標(biāo)語言轉(zhuǎn)換模塊相互獨立,這一特點使本發(fā)明具有易擴充性。對源語言進(jìn)行形式化處理是把源語言翻譯成各種目標(biāo)語言的共同基礎(chǔ),這一特點使本發(fā)明特別適合“一對多”機器翻譯。文檔編號G06F17/28GK101739395SQ20091024794公開日2010年6月16日申請日期2009年12月31日優(yōu)先權(quán)日2009年12月31日發(fā)明者程光遠(yuǎn)申請人:程光遠(yuǎn)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1