亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

英漢翻譯機器的制作方法

文檔序號:6560832閱讀:208來源:國知局
專利名稱:英漢翻譯機器的制作方法
一種基于模板匹配替換通用算法的英漢翻譯機器,屬于G06F15/38類計算機科學技術領域。
實現(xiàn)機器翻譯的現(xiàn)有技術方案主要是先對源語言的句子進行文法分析,然后構(gòu)造該句子在源語言中的句法樹,再將源語言句法樹轉(zhuǎn)換為目標語言中的句法樹,最后利用目標語言句法樹構(gòu)造目標語言中的翻譯結(jié)果。發(fā)明專利95119554.9提出了一種比較有效的算法對該方案進行技術實現(xiàn)?,F(xiàn)在市場上已經(jīng)能夠買到多種機器翻譯產(chǎn)品,比較著名的有東方快車和金山快譯等,但它們對不太符合文法結(jié)構(gòu)的句子,例如“It never gets as cold there as it doeshere”,翻譯質(zhì)量較差,東方快車2000將它翻譯為“當它這里做,它從來不作為寒冷得到在那里”,金山快義2000將它翻譯為“不決變和它在這里做同樣在那里冷”。
本發(fā)明的目的是提供一種英漢翻譯機器,該翻譯機器除了能夠翻譯符合文法結(jié)構(gòu)的句子外,同時還能夠較好地翻譯不太符合文法結(jié)構(gòu)的句子。
本發(fā)明的目的是通過以下方法實現(xiàn)的英漢翻譯機器的硬件含有邏輯運算部件、存儲部件、視頻顯示部件和輸入部件,其特征在于本翻譯機內(nèi)采用具有任意常項和任意變項的模板匹配替換通用算法,這個通用算法的執(zhí)行流程是(1)從輸入部件輸入或者從存儲部件讀取要翻譯的源語言中的句子,并將它顯示在視頻顯示部件上;(2)啟動執(zhí)行算法的功能選項,將句子分解并表示為以源語言中的詞匯、標點等為基本單元的信息屬性結(jié)構(gòu),記錄“句子長度變量”=基本單元的數(shù)目;(3)對句子中的每個基本單元進行形態(tài)分析,并記錄它的所有詞類代碼和每個詞類在目標語言中的所有可能含義,并令“規(guī)則計數(shù)變量”=1;(4)如果規(guī)則計數(shù)變量大于模板翻譯規(guī)則庫的規(guī)則總數(shù),則進入(8);否則從模板翻譯規(guī)則庫中取出規(guī)則計數(shù)變量所指向的模板翻譯規(guī)則作為當前規(guī)則,然后取出該規(guī)則的源語言模板作為當前源語言模板,記錄“源語言模板長度變量”=它所包含的常項和變項的總數(shù),如果源語言模板長度變量大于句子長度變量,令規(guī)則計數(shù)變量=規(guī)則計數(shù)變量+1,返回(4);否則,令句子“匹配起始位置變量”=1,“匹配終止位置變量”=匹配起始位置變量+源語言模板長度變量-1,然后進入(5);(5)令“當前匹配位置變量”=匹配起始位置變量,進入(6);(6)將當前匹配位置變量在句子所指的項記為“句子匹配項”,將“當前匹配位置變量-匹配起始位置變量+1”的值在源語言模板中所指的項記為“模板匹配項”,判定句子匹配項是否與模板匹配項匹配,判定標準是a.如果這兩項都是常項,那么只需通過形態(tài)分析看它們在源語言中是否為同一個詞匯的不同形態(tài),是則匹配成功,否則匹配失?。籦.如果句子匹配項為常項,而模板匹配項為變項,則看句子匹配項具有的所有可能類型代碼中是否存在被模板匹配項所包含的代碼,存在則匹配成功,不存在則匹配失??;c.如果句子匹配項為變項,模板匹配項也為變項,則當句子匹配項被模板匹配項所包含時,匹配成功,否則匹配失?。籨.如果句子匹配項為變項,而模板匹配項為常項,則匹配失?。蝗绻鶕?jù)該標準判定結(jié)果為匹配成功,那么當當前匹配位置變量=匹配終止位置變量時,進入(7),當當前匹配位置變量<匹配終止位置變量時,令當前匹配位置變量=當前匹配位置變量+1,返回(6);否則令匹配起始位置變量=匹配起始位置變量+1,匹配終止位置變量=匹配終止位置變量+1,如果匹配終止位置變量≤句子長度變量,則返回(5),否則令規(guī)則計數(shù)變量=規(guī)則計數(shù)變量+1,返回(4);(7)此時句子中對應于從匹配起始位置變量到匹配終止位置變量的項與當前源語言模板完全匹配,記錄“當前源語言模板的類型代碼”,以及句子中對應于從匹配起始位置變量到匹配終止位置變量的項與當前源語言模板中變項相對應的所有項,將這些項在目標語言中的意義對應代入當前源語言模板的所有目標語言模板,并把得到的結(jié)果作為當前源語言模板的類型代碼在目標語言中的翻譯結(jié)果集;然后將句子中對應于從匹配起始位置變量到匹配終止位置的所有項用當前源語言模板的類型代碼替換,并記錄得到的結(jié)果為新的句子狀態(tài),令句子長度變量=句子長度變量-源語言模板長度變量+1,顯然代碼替換后句子對應于匹配起始位置變量的項變?yōu)楫斍霸凑Z言模板的類型代碼;如果句子長度變量=1,則進入(8);如果句子長度變量>1,當匹配終止位置變量不超過句子長度變量時,返回(5),當匹配終止位置變量超過句子長度變量時,令規(guī)則計數(shù)變量=規(guī)則計數(shù)變量+1,返回(4);(8)將句子的各項在目標語言中的翻譯結(jié)果集取出,此時翻譯結(jié)果集的個數(shù)恰好與句子長度變量相等,而且如果匹配完全成功,則翻譯結(jié)果集只有一個,句子長度變量等于1;將這些翻譯結(jié)果集中的字符串按順序連接起來,得到最終翻譯結(jié)果集,進入(9);(9)直接將最終翻譯結(jié)果集中的第一個翻譯結(jié)果顯示在視頻顯示部件上作為在(1)中輸入的句子最終翻譯結(jié)果,或者將最終翻譯結(jié)果集中的字符串優(yōu)化排序后,將最可能的字符串作為在(1)中輸入的句子最終翻譯結(jié)果;也可將最終翻譯結(jié)果集中的部分或所有字符串列舉在某個選擇框中,由用戶去選擇在(1)中輸入的句子的最終翻譯結(jié)果。
關于本發(fā)明的概念說明(1)常項是指任何一種自然語言的基本符號、標點符號和基本詞匯,比如英語中的26個字母,標點和所有單詞都是常項。變項是指任何一種自然語言的詞類代碼和結(jié)構(gòu)代碼,比如英語中的動詞代碼可記為“VERB”,名詞代碼可記為“NOUN”,代詞代碼可記為“PRON”,句子代碼可記為“S”。模板是指任何一種自然語言中由常項和變項構(gòu)成的具有一定認知結(jié)構(gòu)并符合語言習慣的一個符號串,比如英語中的詞組“give R toR”(中文解釋為“把R給R”,其中R指名詞NOUN或代詞PRON)。(2)模板翻譯規(guī)則都用下列形式來描述(一般情況下n=1)源語言模板→源語言模板類型代碼(集)目標語言模板1;目標語言模板2;…目標語言模板n;例如give R to R→VI把R給R;(其中VI是不及物動詞代碼,R指名詞或代詞)(3)句子狀態(tài)由帶有信息屬性結(jié)構(gòu)常項和變項構(gòu)成的序列來刻畫。常項可以是單詞、標點或其它特殊符號,變項可以是常項或模板的類型代碼(常項和模板都可以具有多個類型代碼)。信息屬性結(jié)構(gòu)主要包括形態(tài)特征,類型代碼,以及每個類型代碼在目標語言中的意義集合。例如單詞study和hard的結(jié)構(gòu)如下study{VERB學習,研究;NOUN學習,書房;}hard{ADJ堅硬的,困難的;ADV努力地,猛烈地;}在進行模板匹配時,通用算法將根據(jù)模板中的變量類型的要求自動確定study為VERB類型還是NOUN類型;在進行模板替換時,通用算法根據(jù)已經(jīng)確定的study的類型代碼選擇其中文意義進行替換,從而實現(xiàn)多類型代碼的自動消岐。例如“study hard”與模板翻譯規(guī)則“VIADV→VIADV VI;”進行匹配時,“study”將被確定為VERB類型,“hard”將被確定為ADV類型(ADV是副詞類型代碼),所以模板替換后的結(jié)果將是
VI{VI努力地學習,努力地研究,猛烈地學習,猛烈地研究;}本發(fā)明的優(yōu)點是它不僅對翻譯不符合文法結(jié)構(gòu)的句子具有很大優(yōu)勢,而且它幾乎使機器翻譯系統(tǒng)的實現(xiàn)轉(zhuǎn)換成為一件在文本文件中輸入和組織模板翻譯規(guī)則的簡單工作,從而能夠極大地提高機器翻譯系統(tǒng)的開發(fā)效率和翻譯質(zhì)量。
下面結(jié)合附圖,將對本發(fā)明作進一步的詳細描述。
1、附

圖1是對采用具有任意常項和任意變項的模板匹配替換通用算法的執(zhí)行流程的示意圖。圖中的步驟1~9對應于前面所述通用算法的執(zhí)行流程的(1)~(9)流程。
2、翻譯實例如果要翻譯的英文句子是It never gets as cold there as it does here.那么下面3條模板翻譯規(guī)則將被使用1)VI as ADJ ADV1 as R AUX ADV2→VIADV1 VI象T ADV2一樣ADJDE;(其中ADV1和ADV2代表副詞,ADJDE表示將對應形容詞在中文意義中的“的”字自動去掉,AUX表示助動詞)2)R ADV VI→SR ADV VI;3)S.→SS。對于該英文句子,基于模板匹配替換通用算法的翻譯過程如下(1)將句子分解為基本單元并進行形態(tài)分析,然后記錄句子長度變量SentenceLength=基本單元的數(shù)目,即It{PRON它;}never{adv從來沒有,決不;}get{VI變得;VT得到;V_Person=1}as{CONJ當時,如同,因為;PREP作為,當做;ADV同樣地;}cold{ADJ冷的,寒冷的,冷淡的;NOUN冷,寒冷,傷風,感冒;}there{ADV在那里;PRON那里;}as{CONJ當時,如同,因為;PREP作為,當做;ADV同樣地;}it{PRON它;}do{AUX做;VT做;VI做;V_Person=1}here{ADV在這里;PRON這里;}.{標點。;}置句子長度變量SentenceLength=11。其中V_Person=1表示動詞第三人稱單數(shù),CONJ表示連詞類型代碼。令規(guī)則計數(shù)變量k=1;(2)取出第k=1條規(guī)則,用“VI as ADJ ADV1 as R AUX ADV2”與句子進行匹配運算,此時源語言模板長度變量SourceLength=8,匹配起始位置變量StartPos=1,匹配終止位置變量EndPos=StartPos+SourceLength-1=8;(3)令當前匹配位置變量ComparePos=StartPos=1,因句子的第一項It{PRON他;}不具有不及物動詞類型,所以匹配失敗,執(zhí)行匹配起始位置變量StartPos=StartPos+1,匹配終止位置變量EndPos=EndPos+1,當前匹配位置變量ComparePos=StartPos;直到StartPos=3,EndPos=10時,通過執(zhí)行7次ComparePos=ComparePos+1運算,驗證句子的第3到10項,即“get”,“as”,“cold”,“there”,“as”,“it”,do”,“here”,都與源語言模板的對應項,即“VT”,“as”,“ADJ”,“ADV1”,“as”,“R”,“AUX”,“ADV2”,匹配成功,且此時ComparePos=EndPos=10,所以“get as cold there as it do here”與整個源語言模板“VI as ADJ ADV1as R AUX ADV2”匹配成功,用“VI as ADJ ADV1 as R AUX ADV2”的目標模板將“get as cold there as it do here”替換為當前源語言模板的類型代碼,即VI{VI在那里變得象它在這里一樣冷,在那里變得象它在這里一樣冷淡,在那里變得象它在這里一樣寒冷;}置句子長度變量SentenceLength=SentenceLength-SourceLength+1=11-8+1=4。簡記新的句子狀態(tài)為It never VI.因此時匹配終止位置變量EndPos>句子長度變量SentenceLength,所以不在繼續(xù)用“VI as ADJ ADV1 as R AUX ADV2”與句子進行匹配。令規(guī)則計數(shù)變量k=k+1=2。(4)取出第k=2條規(guī)則,用“R ADV VI”與句子進行匹配運算,此時源語言模板長度變量SourceLength=3,匹配起始位置變量StartPos=1,匹配終止位置變量EndPos=StartPos+SourceLength-1=3;(5)令當前匹配位置變量ComparePos=StartPos=1,因句子的第1項He{PRON他;}可以與R成功匹配,所以執(zhí)行當前匹配位置變量ComparePos=ComparePos+1=2,因句子第2項never可以與ADV成功匹配,所以仍然執(zhí)行當前匹配位置變量ComparePos=ComparePos+1=3,因句子第3項VI可以與VI成功匹配,且ComparePos=EndPos=3,所以模板匹配成功,用“R ADV VI”的目標模板將“R ADV VI”替換為當前源語言模板的類型代碼,即S{S它從來沒有在那里變得象它在這里一樣冷,
它從來沒有在那里變得象它在這里一樣冷淡,它決不在那里變得象它在這里一樣冷,它決不在那里變得象它在這里一樣冷淡,它從來沒有在那里變得象它在這里一樣寒冷,它決不在那里變得象它在這里一樣寒冷;}置句子長度變量SentenceLength=SentenceLength-SourceLength+1=4-3+1=2。簡記新的句子狀態(tài)為S.因此時匹配終止位置變量EndPos>句子長度變量SentenceLength,所以不在繼續(xù)用“R ADV VI”與句子進行匹配。令規(guī)則計數(shù)變量k=k+1=3。(6)取出第k=3條規(guī)則,用“S.”與句子進行匹配運算,此時源語言模板長度變量SourceLength=2,匹配起始位置變量StartPos=1,匹配終止位置變量EndPos=StartPos+SourceLength-1=2;因句子的第一項和第二項都與源語言模板的對應項成功匹配,所以模板匹配成功,用“S.”的目標模板將“S.”替換為當前源語言模板的類型代碼,即S{S(它從來沒有在那里變得象它在這里一樣冷。),(它從來沒有在那里變得象它在這里一樣冷淡。),(它決不在那里變得象它在這里一樣冷。),(它決不在那里變得象它在這里一樣冷淡。),(它從來沒有在那里變得象它在這里一樣寒冷。),(它決不在那里變得象它在這里一樣寒冷。);}置句子長度變量SentenceLength=SentenceLength-SourceLength+1=2-2+1=1。簡記新的句子狀態(tài)為S(7)因SentenceLength=1,所以不需再做其它匹配運算,且所有可能的翻譯結(jié)果保存在句子的當前狀態(tài)中,將它們另存到結(jié)果集Result中,并顯示Result中最可能的翻譯結(jié)果,或者列舉部分或所有翻譯結(jié)果由用戶選擇。翻譯完成。發(fā)明人已經(jīng)用VC++6.0將該算法編程在586型計算機上實現(xiàn)。
權(quán)利要求
1.一種英漢翻譯機器,它的硬件含有邏輯運算部件、存儲部件、視頻顯示部件和輸入部件,其特征在于本翻譯機內(nèi)采用具有任意常項和任意變項的模板匹配替換通用算法。
2.根據(jù)權(quán)利要求1所規(guī)定的英漢翻譯機器,其特征在于,其中所說的具有任意常項和任意變項的模板匹配替換通用算法的執(zhí)行流程是(1)從輸入部件輸入或者從存儲部件讀取要翻譯的源語言中的句子,并將它顯示在視頻顯示部件上;(2)啟動執(zhí)行算法的功能選項,將句子分解并表示為以源語言中的詞匯、標點等為基本單元的信息屬性結(jié)構(gòu),記錄“句子長度變量”=基本單元的數(shù)目;(3)對句子中的每個基本單元進行形態(tài)分析,并記錄它的所有詞類代碼和每個詞類在目標語言中的所有可能含義,并令“規(guī)則計數(shù)變量”=1;(4)如果規(guī)則計數(shù)變量大于模板翻譯規(guī)則庫的規(guī)則總數(shù),則進入(8);否則從模板翻譯規(guī)則庫中取出規(guī)則計數(shù)變量所指向的模板翻譯規(guī)則作為當前規(guī)則,然后取出該規(guī)則的源語言模板作為當前源語言模板,記錄“源語言模板長度變量”=它所包含的常項和變項的總數(shù),如果源語言模板長度變量大于句子長度變量,令規(guī)則計數(shù)變量=規(guī)則計數(shù)變量+1,返回(4);否則,令句子“匹配起始位置變量”=1,“匹配終止位置變量”=匹配起始位置變量+源語言模板長度變量-1,然后進入(5);(5)令“當前匹配位置變量”=匹配起始位置變量,進入(6);(6)將當前匹配位置變量在句子所指的項記為“句子匹配項”,將“當前匹配位置變量-匹配起始位置變量+1”的值在源語言模板中所指的項記為“模板匹配項”,判定句子匹配項是否與模板匹配項匹配,判定標準是a.如果這兩項都是常項,那么只需通過形態(tài)分析看它們在源語言中是否為同一個詞匯的不同形態(tài),是則匹配成功,否則匹配失??;b.如果句子匹配項為常項,而模板匹配項為變項,則看句子匹配項具有的所有可能類型代碼中是否存在被模板匹配項所包含的代碼,存在則匹配成功,不存在則匹配失?。籧.如果句子匹配項為變項,模板匹配項也為變項,則當句子匹配項被模板匹配項所包含時,匹配成功,否則匹配失敗;d.如果句子匹配項為變項,而模板匹配項為常項,則匹配失?。蝗绻鶕?jù)該標準判定結(jié)果為匹配成功,那么當當前匹配位置變量=匹配終止位置變量時,進入(7),當當前匹配位置變量<匹配終止位置變量時,令當前匹配位置變量=當前匹配位置變量+1,返回(6);否則令匹配起始位置變量=匹配起始位置變量+1,匹配終止位置變量=匹配終止位置變量+1,如果匹配終止位置變量≤句子長度變量,則返回(5),否則令規(guī)則計數(shù)變量=規(guī)則計數(shù)變量+1,返回(4);(7)此時句子中對應于從匹配起始位置變量到匹配終止位置變量的項與當前源語言模板完全匹配,記錄“當前源語言模板的類型代碼”,以及句子中對應于從匹配起始位置變量到匹配終止位置變量的項與當前源語言模板中變項相對應的所有項,將這些項在目標語言中的意義對應代入當前源語言模板的所有目標語言模板,并把得到的結(jié)果作為當前源語言模板的類型代碼在目標語言中的翻譯結(jié)果集;然后將句子中對應于從匹配起始位置變量到匹配終止位置的所有項用當前源語言模板的類型代碼替換,并記錄得到的結(jié)果為新的句子狀態(tài),令句子長度變量=句子長度變量-源語言模板長度變量+1,顯然代碼替換后句子對應于匹配起始位置變量的項變?yōu)楫斍霸凑Z言模板的類型代碼;如果句子長度變量=1,則進入(8);如果句子長度變量>1,當匹配終止位置變量不超過句子長度變量時,返回(5),當匹配終止位置變量超過句子長度變量時,令規(guī)則計數(shù)變量=規(guī)則計數(shù)變量+1,返回(4);(8)將句子的各項在目標語言中的翻譯結(jié)果集取出,此時翻譯結(jié)果集的個數(shù)恰好與句子長度變量相等,而且如果匹配完全成功,則翻譯結(jié)果集只有一個,句子長度變量等于1;將這些翻譯結(jié)果集中的字符串按順序連接起來,得到最終翻譯結(jié)果集,進入(9);(9)直接將最終翻譯結(jié)果集中的第一個翻譯結(jié)果顯示在視頻顯示部件上作為在(1)中輸入的句子最終翻譯結(jié)果,或者將最終翻譯結(jié)果集中的字符串優(yōu)化排序后,將最可能的字符串作為在(1)中輸入的句子最終翻譯結(jié)果;也可將最終翻譯結(jié)果集中的部分或所有字符串列舉在某個選擇框中,由用戶去選擇在(1)中輸入的句子的最終翻譯結(jié)果。
全文摘要
一種基于模板匹配替換通用算法的英漢翻譯機器。其特征是采用任意常項和任意變項的模板匹配替換通用算法,在對源語言的句子進行翻譯時,只需利用該算法將句子與模板翻譯規(guī)則庫的規(guī)則按順序進行,匹配成功一部分,則翻譯一部分,如果整個句子完全匹配成功,就可以獲得高質(zhì)量的翻譯結(jié)果。本發(fā)明除了能夠高質(zhì)量地翻譯符合文法結(jié)構(gòu)的句子外,同時還能夠較好地翻譯不太符合文法結(jié)構(gòu)的句子。
文檔編號G06F17/27GK1272655SQ0010923
公開日2000年11月8日 申請日期2000年6月19日 優(yōu)先權(quán)日2000年6月19日
發(fā)明者李玉鑒(鑑) 申請人:李玉鑒(鑑)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1