專利名稱:漢語發(fā)音符號/漢字變換裝置及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及將從鍵盤輸入的漢語發(fā)音符號變換成與其對應(yīng)的漢字后輸出的裝置及方法,特別是涉及適合于漢語用的文字處理機(jī)或桌面系統(tǒng)等使用的裝置及方法。
漢語是用漢字書寫表現(xiàn)的。有幾種用符號表示漢字發(fā)音的方法。其具有代表性的方法是中國政府于1958年公布的拼音(pinyin)法,以及在此之前就使用的、現(xiàn)在臺灣仍在使用的注音(ZhuYin)法。
一個(gè)漢字的發(fā)音可分為相當(dāng)于子音的聲母(ShengMu)和相當(dāng)于母音的韻母(YunMu),以及表示抑抵的四聲(SiSheng)或聲調(diào)(ShengDiao)。韻母和聲母合在一起就是該漢字的讀音。在漢字的發(fā)音中,也有的漢字沒有抑抵。一個(gè)漢字的發(fā)音由一個(gè)以下(一個(gè)或零個(gè))聲母和一個(gè)韻母(根據(jù)需要,還可用聲調(diào))來表示。
聲調(diào)有以下四種一聲(YiSheng或1Sheng)是平坦的高音,用“-”表示。
二聲(ErSheng或2Sheng)從低音上升到高音。用“/”表示。
三聲(ShanSheng或3Sheng)從高音到低音,再到高音。用“∨”表示。
四聲(SiSheng或4Sheng)從高音下降以低音。用“\”表示。
例如用拼音法書寫“中國”這兩個(gè)漢字時(shí),則寫作“ZhongGuo′”。其中“Zh”和“G”是聲母,“ong”和“uo”是韻母。另外,用拼音法書寫“日本”這兩個(gè)漢字時(shí),寫作“RiBen”。其中“R”及“B”是聲母,“i”及“en”是韻母。
漢字文字處理過去從來只允許輸入拼音符號。因拼音法是一種較新的方法,因此雖然知道注音法,但不知道拼音法的人仍然很多。因此,要使更多的人能使用漢語文字處理機(jī),就必須允許按注音法輸入才行。
另外,拼音法的書寫方法是以北京話作為普通話確定的。在遼闊的中國,有的口音與北京話的聲調(diào)不同。在不同的地區(qū),甚至聲韻也與北京話不同。因此,不會說作為普通話的北京話的人或者不熟悉北京話的人,就很難正確地輸入聲韻和聲調(diào),經(jīng)常錯(cuò)誤地輸入。即使是會說北京話的人,不僅要一邊想到聲調(diào)的區(qū)別,一邊發(fā)音,而且還必須一邊聯(lián)想或考慮聲調(diào),一邊進(jìn)行文字處理機(jī)的輸入操作,不僅輸入操作繁雜,而且有時(shí)不能輸入正確的聲調(diào)。
以往的漢語字處理機(jī),只有當(dāng)正確地輸入聲韻和聲調(diào)時(shí),才能輸出與其對應(yīng)的正確的漢字,如果輸入錯(cuò)了,就得不到正確的漢字。
本發(fā)明的目的是漢語發(fā)音符號/漢字交換裝置中,使用包括拼音書寫法和注音書寫法在內(nèi)的多種書寫方法中的任何一種,都可以輸入發(fā)音。
本發(fā)明的另一個(gè)目的是即使不輸入聲調(diào),或者即使聲調(diào)輸入錯(cuò)了,也能獲得包括所要求的漢字在內(nèi)的候選漢字。
本發(fā)明的再一個(gè)目的是如果發(fā)音多少有點(diǎn)正確,就能檢出與包括該發(fā)音部分的發(fā)音相對應(yīng)的候選漢字。
本發(fā)明的第一個(gè)特征是本發(fā)明的漢語發(fā)音符號/漢字變換裝置是一種可以按照多種漢語發(fā)音表示方法進(jìn)輸入的輸入裝置,上述輸入裝置中分別設(shè)有可能輸入的數(shù)據(jù)變換成與該輸入數(shù)據(jù)表示的發(fā)音相對應(yīng)的音碼的多種變換表以及能夠?qū)⒁舸a與其所表示的發(fā)音的漢字相互對應(yīng)存儲的詞典,還有能利用上述幾種變換表中的任意一種,將從上述輸入裝置輸入的數(shù)據(jù)變換成音碼,并從上述的詞典中檢索出與所變換成的音碼相對應(yīng)的漢字碼的控制裝置。
為了采用樂于使用的輸入方式,本發(fā)明的裝置還設(shè)有能夠從幾種表示法中任選一種輸入方式的選擇裝置。然后利用該方式選擇裝置選定的與表示法相對應(yīng)的變換表,將輸入的數(shù)據(jù)變換成音碼。
還可以根據(jù)上述輸入裝置輸入的數(shù)據(jù),自動判斷表示方法,根據(jù)判斷的結(jié)果,選擇應(yīng)該使用的變換表。
還可以將上述輸入裝置設(shè)置成一種能夠?qū)⑤斎氲穆曇糇儞Q成電信號的裝置、以及根據(jù)聲音電信號識別發(fā)音、并將輸入的聲音變換成音碼的聲音識別裝置。
本發(fā)明的裝置用于漢語文字處理機(jī)時(shí),還設(shè)有將所檢出的漢字碼變換成表示該漢字碼所示的漢字的顯示數(shù)據(jù)的裝置,以及根據(jù)顯示數(shù)據(jù)顯示漢字的裝置。
該裝置還設(shè)有從所顯示的候選漢字中選下任意一個(gè)漢字的指定輸入裝置,以及存儲表示所指定的漢字的漢字碼的存儲器。
為了適用于更現(xiàn)代的文字處理機(jī),將上述各變換表設(shè)計(jì)成能夠?qū)蝹€(gè)漢字的輸入數(shù)據(jù)變換成音碼。與此對應(yīng),上述的詞典是將一個(gè)漢字或數(shù)個(gè)漢字構(gòu)成的單詞的音碼串與漢字碼相對應(yīng)存儲的構(gòu)成的。由上述輸入裝置輸入的一系列輸入數(shù)據(jù),按單個(gè)漢字分區(qū),并變換成音碼。經(jīng)過變換后的一個(gè)或幾個(gè)音碼排列成單詞單元,構(gòu)成音碼串。再從上述詞典中檢出與該音碼串相對應(yīng)的漢字碼。
本發(fā)明是建立在能使一個(gè)音碼對應(yīng)于一個(gè)發(fā)音(漢字的讀音)的見解基礎(chǔ)上的。即使存在拼音符號表示法、注音符號表示法等多種表示方法,如果用這些符號表示法表示的發(fā)音是同一個(gè)音的話,就必然可以收斂成一個(gè)音碼。因此,作為漢字(或單詞)詞典,只要有用音碼能進(jìn)行檢索的裝置就夠了。這樣一來,按照本發(fā)明,可以用多種表示法中的任意一種輸入發(fā)音,所輸入的發(fā)音就會轉(zhuǎn)換成具有這個(gè)發(fā)音的漢字。
在本發(fā)明的實(shí)施狀態(tài)下,即使輸入的聲調(diào)不正確,或發(fā)音符號多少有些錯(cuò)誤,也能獲得包括所要求的漢字在內(nèi)的候選漢字。因此,在本發(fā)明的裝置中還備有對構(gòu)成音碼的某一個(gè)或數(shù)個(gè)比特進(jìn)行掩蔽篩選的裝置。于是,采用上述控制裝置,對與輸入數(shù)據(jù)相對應(yīng)的音碼和上述詞典中的音碼進(jìn)行篩選、加以比較,從上述詞典中檢出與輸入數(shù)據(jù)相對應(yīng)的音碼一致的音碼。
本實(shí)施狀態(tài)的特征,根據(jù)下述本發(fā)明的第二個(gè)特征的觀點(diǎn),便能夠充分了解。
本發(fā)明的第二個(gè)特征是,漢語發(fā)音符號/漢字變換裝置具有將輸入的表示漢語發(fā)音的數(shù)據(jù)變換成與該碼相對應(yīng)的音碼用的變換裝置,使音碼與表示具有用該音碼表示的發(fā)音的漢字的漢字碼相互對應(yīng)存儲的詞典,通過掩蔽篩選選出構(gòu)成音碼的某一個(gè)或數(shù)個(gè)比特的掩蔽篩選裝置。利用上述篩選裝置選出后,對從上述變換裝置獲得的音碼與上述詞典中的音碼相互比較,從上述詞典中檢出與從上述變換裝置中獲得的音碼相一致的音碼,再從上述詞典中讀出與一致的音碼相對應(yīng)的漢字碼的控制裝置。
在某一種輸入方式下,在上述音碼的結(jié)構(gòu)中含有表示聲母的字節(jié)、表示韻母的字節(jié)和表示聲調(diào)的字節(jié)。在這種情況下,上述的篩選裝置作為掩蔽表示聲母的字節(jié)、表示韻母的字節(jié)或表示聲調(diào)的字節(jié)的裝置之用。
上述篩選裝置應(yīng)理解為包括使音碼原樣不動地直接通過的裝置。
根據(jù)需要,還可設(shè)置選擇是否使用篩選裝置,或在幾種篩選裝置中任選一種檢索方式的篩選裝置。
如上所述的本發(fā)明的第一個(gè)特征,還可設(shè)置按照多種表示法可輸入漢語發(fā)音的輸入裝置。這時(shí),上述變的裝置可分別設(shè)置能夠利用上述輸入裝置輸入的多種表示方法,而且備有能將按照各種表示法輸入的數(shù)據(jù)變換成與由該輸入數(shù)據(jù)表示的發(fā)音對應(yīng)的音碼用的數(shù)種變換表。
還可以設(shè)置根據(jù)聲音輸入信號識別發(fā)音、并輸出與該音相對應(yīng)的音碼的聲音識別裝置,用來代替上述輸入裝置和變換裝置。
為了適用于更現(xiàn)代化的文字處理機(jī),可設(shè)置將讀出的漢字碼變換成表示該漢字的顯示數(shù)據(jù)裝置、根據(jù)顯示數(shù)據(jù)顯示漢字的裝置、從所顯示的候選漢字中指定任意一個(gè)字的指定裝置,以及將表示所指定的漢字的漢字碼存儲起來的存儲器。
再者,上述變換裝置的結(jié)構(gòu)是將單個(gè)漢字的輸入數(shù)據(jù)變換成音碼,與對應(yīng),上述詞典的結(jié)構(gòu)能夠?qū)⒂蓡蝹€(gè)漢字或數(shù)個(gè)漢字構(gòu)成的單詞的音碼串與漢字碼對應(yīng)存儲。于是,一系列的輸入數(shù)據(jù)按各單個(gè)漢字的區(qū)位劃分,并變換成音碼,變換后的一個(gè)或數(shù)個(gè)音碼排列成單詞單元,構(gòu)成音碼排列。從上述詞典中檢出與該音碼排列相對應(yīng)的漢字碼。
如果采用本發(fā)明,在進(jìn)行篩選后,對表示輸入數(shù)據(jù)的音碼與詞典中的音碼進(jìn)行比較。不管是否一致,音碼部分(一個(gè)或數(shù)個(gè)字節(jié))經(jīng)過由篩選出器進(jìn)行掩蔽篩選,被掩蔽的部分則不作為比較處理的對象。
因此,在不管聲調(diào)如何的情況下,使用適當(dāng)?shù)暮Y選器,不管聲調(diào)是否一致,甚至即使無聲調(diào)輸入,用其他部分(聲韻)也能獲得與輸入數(shù)據(jù)相對應(yīng)的音碼一致、與音碼相對應(yīng)的一個(gè)或數(shù)個(gè)候選漢字。這樣,即使不輸入聲調(diào),或者即使聲調(diào)輸入錯(cuò)了,也能輸入包括所要求的漢字(單詞)在內(nèi)的候選漢字(單詞)。
篩選器的種類可任意設(shè)定。因此,還可以只在聲母一致的條件下或只在韻母一致的條件下檢索漢字。即如果發(fā)音多少有些正確,就能獲得與包括該音在內(nèi)的發(fā)音相對應(yīng)的候選漢字(單詞)。
本發(fā)明還提供分別與具有第一個(gè)及第二個(gè)特征在的裝置相對應(yīng)的漢語發(fā)音符號/漢字變換方法。
具有第一個(gè)特征的方法是事先準(zhǔn)備好可按照多種表示法輸入漢語發(fā)音,且能將按照可輸入的多種符號表示法分別輸入的數(shù)據(jù)變換成與該輸入的數(shù)據(jù)表示的發(fā)言相對應(yīng)的音碼用的變換表,以及使音符與表示具有該音符所示的發(fā)音的漢字的漢字碼互相對應(yīng)存儲的詞典。利用上述多種變換表中的任意一種,將輸入數(shù)據(jù)變換成音碼,再從上述詞典中檢出與變換后的音碼相對應(yīng)的漢字碼。
具有第二個(gè)特征的方法是事先準(zhǔn)備好將音碼與表示具有該音碼所示的發(fā)音的漢字的漢字碼互相對應(yīng)存儲的詞典,將所輸入的表示漢語發(fā)音的數(shù)據(jù)變換成與該音相對應(yīng)的音碼,對構(gòu)成音碼的某一個(gè)或n個(gè)字節(jié)進(jìn)行掩蔽篩選后,對于由變換獲得的音碼與上述詞典中的音碼進(jìn)行互相比較,從上述詞典中檢出與由變換獲得的音碼一致的音碼,再從上述詞典中讀出與一致的音碼相對應(yīng)的漢字碼。
本發(fā)明的其它特征及優(yōu)點(diǎn),在下面參照附圖對實(shí)施例的說明過程中便可明了。
圖1是表示漢語發(fā)音符號/漢字變換裝置的電路結(jié)構(gòu)方框圖。
圖2是該裝置的主要部分的硬件結(jié)構(gòu),或是從機(jī)能觀點(diǎn)看的結(jié)構(gòu)方框圖。
圖3表示拼音/音碼變換表之一側(cè)。
圖4表示注音/音碼變換表之一側(cè)。
圖5a表示音碼的數(shù)據(jù)格式化,圖5b表示用來表示聲調(diào)的編碼。
圖6是表示輸入、編輯處理順序的程序方框圖。
圖7表示鍵數(shù)據(jù)緩沖存儲器中存儲起來的鍵輸入數(shù)據(jù)的式樣。
圖8表示音符排列緩沖存儲器中存儲起來的音符的式樣。
圖9至圖11是表示漢字檢索處理順序和程度方框圖。
圖12表示詞典的結(jié)構(gòu)。
圖13表示音符排列/漢字符對應(yīng)表之一側(cè)。
圖14表示漢字符緩沖存儲器。
圖15表示音符經(jīng)過選出后被變換的式樣。
圖16表示利用選出器檢索漢字的式樣。
圖17表示漢字檢索裝置的硬件結(jié)構(gòu),或是表示著眼于漢字檢索處理功能的方框圖。
圖1表示漢語發(fā)音符號/漢字變換裝置的結(jié)構(gòu)。通常該裝置是作為漢語文字處理機(jī)、桌面處理系統(tǒng)的一部分實(shí)現(xiàn)的。
漢語發(fā)音符號/漢字變換裝置由下列各部分構(gòu)成包括中央處理裝置(CPU)在內(nèi)的計(jì)算機(jī)10;輸入發(fā)音符號、各種方式及其它功能用的鍵盤20;存儲詞典及各種變換表的存儲裝置30;顯示所變換成的漢字及其它信息或數(shù)據(jù)用的顯示裝置14;以及控制裝置12。
計(jì)算機(jī)10可以使用市售的通用計(jì)算機(jī).計(jì)算機(jī)10用來編制程序,以便執(zhí)行后面所述的輸入、編輯處理及漢字檢索處理。
在該實(shí)施例中,可輸入的發(fā)音符號表示方法有拼音法和注音法。另外,允許采用包含聲調(diào)的完整的發(fā)音符號表示方法以及除去聲調(diào)只用音韻進(jìn)行的發(fā)音符號的表示方法。
鍵盤20上設(shè)有用拼音法輸入發(fā)音符號用的拼音鍵21;用注音法輸入發(fā)音符號用的注音鍵22;選擇輸入的發(fā)音符號是采用拼音法還是采用注音法用的輸入方式鍵23;選擇想用含有聲調(diào)的完整的發(fā)言符號檢索漢字(將其稱為第一種狀態(tài))還是采用除去聲調(diào)只使用音韻的發(fā)音符號檢索漢字(將其稱為第二種狀態(tài))用的變換方式鍵24;以及發(fā)出應(yīng)將輸入的發(fā)音符變換成漢字的指令用的變換鍵、空格鍵(需要時(shí))及輸入其它功能用的功能鍵25。
由鍵盤20輸入的表示發(fā)音符號的數(shù)據(jù)(或符號)被變換成對應(yīng)的音碼(YinCode)。為了進(jìn)行這種符號變換,在存儲裝置30中設(shè)有拼音/音碼變換表31注音/音符變換表32。因?yàn)橛迷摪l(fā)音符號或用其它發(fā)音符表示被輸入的發(fā)音符,所以為了一旦要將變換成的音碼反過來變換成表示拼音符或注音符號的數(shù)據(jù)(或符號),在存儲裝置30中設(shè)有音碼/拼音表33及音碼/注音表34。另外,在存儲裝置30中還設(shè)有根據(jù)變換后的音碼檢索出表示與其相對應(yīng)漢字符號(漢字符)用的詞典35,以及存儲變換后的漢字符用的變換后的數(shù)據(jù)區(qū)36。存儲裝置30由半導(dǎo)體存儲器(ROM或RAM)、磁存儲器(軟盤或硬盤)或由它們的組合來實(shí)現(xiàn)。例如,變換表31-34存儲在ROM(只讀存儲器)、軟盤或硬盤中,詞典35存儲在軟盤或硬盤中,變換后的數(shù)據(jù)區(qū)設(shè)定的RAM(隨機(jī)存取存儲器)中。
作為顯示裝置14,最一般的是采用CRT(陰極射線管)顯示裝置,但也可采用等離子顯示裝置或液晶顯示裝置。在顯示控制裝置12中裝有字符發(fā)生器13。字符發(fā)生器13是用來將表示拼音或注音的數(shù)據(jù),以及漢字符變換成顯示數(shù)據(jù)(光點(diǎn)數(shù)據(jù))的裝置。
圖2是將圖1所示的結(jié)構(gòu)按照其功能及處理程序排列而成的。轉(zhuǎn)換電路15,編輯處理裝置16及漢字檢索處理裝置17,實(shí)際上是由計(jì)算機(jī)10實(shí)現(xiàn)的。另外,也可使發(fā)音符號/漢字變換裝置具有如圖2所示的硬件結(jié)構(gòu)。
轉(zhuǎn)換電路15根據(jù)通過輸入方式鍵23進(jìn)行選擇輸入,選擇拼音鍵21或注音鍵22。用拼音鍵21或注音鍵22輸入的表示拼音或注音符號的數(shù)據(jù)被輸送給編輯處理裝置16。轉(zhuǎn)換電路15還可以自動識別是拼音鍵輸入還是注音鍵輸入,以便選擇該輸入。
漢語單詞有用一個(gè)漢字構(gòu)成的,也有用數(shù)個(gè)(通常是二個(gè)或三個(gè))漢字構(gòu)成的。編輯處理裝置16將輸入的表示拼音符號或注音符號的數(shù)據(jù)列全都分成表示一個(gè)漢字的數(shù)據(jù)。用輸入方式鍵23,參照所選擇的變換表31或32,將被分開的各個(gè)數(shù)據(jù)變換成音符。如果有來自包含功能鍵25的變換鍵的輸入時(shí),由至此所輸入的數(shù)據(jù)構(gòu)成的音碼列,由編輯處理裝置16輸送給漢字檢索處理裝置17。編輯處理裝置16將輸入的表示拼音符號或注音符號的數(shù)據(jù)輸送給顯示控制裝置12,所以在顯示裝置14的圖象上,由輸入的拼音符號或注音符號構(gòu)成文字,按照輸入的順序依次顯示。這時(shí)不需要逆變換表33、34。編輯處理裝置16將輸入數(shù)據(jù)變換成音碼后,進(jìn)行拼音符號或注音符號的顯示時(shí),要使用逆變換表33、34。在使用注音符號(或拼音符號)來顯示用拼音符號(或注音符號輸入的數(shù)據(jù)時(shí),使用這些逆變換表33、34特別有效。因此,只知道拼音符號的操作人員能知道注音符號,只知道注意符號的操作人員能知道拼音符號,所以很是方便。
漢字檢索處理裝置17根據(jù)接收到的音碼列,按照變換狀態(tài)鍵24的選擇,檢索詞典35,讀出表示具有音碼列所示發(fā)音的一個(gè)或數(shù)個(gè)漢字的漢字符,并輸送給顯示控制裝置12。顯示裝置12從字符發(fā)生器13讀出顯示接收到的漢字符所示漢字用的顯示數(shù)據(jù),根據(jù)該數(shù)據(jù),在顯示裝置14的顯示圖象上顯示出一個(gè)或數(shù)個(gè)漢字(候選漢字)。操作人員觀察該顯示結(jié)果,利用功能鍵25,確認(rèn)所顯示的漢字,或選擇任意一個(gè)漢字,然后將表示被確認(rèn)或被選擇的漢字的漢字符置于交換后的數(shù)據(jù)區(qū)中。
圖3表示拼音/音碼變換表之一側(cè),圖4表示注音/音碼變換表之一例。
對應(yīng)于一種發(fā)音,雖然有拼音法或注音法之類的各種發(fā)音符號表示法;但這些符號必須對應(yīng)于一種發(fā)音。對于一種發(fā)音,由一種音符(Yincode)來擔(dān)任。一個(gè)拼音符號必定對應(yīng)于一個(gè)音碼,一個(gè)注音符號也必定對應(yīng)于一個(gè)音碼。表示一個(gè)音的拼音符號與表示該同一個(gè)音的注音符號共同對應(yīng)于一個(gè)音碼。這樣,即使輸入發(fā)音用的發(fā)音符號環(huán)境污染地有多種,但同一個(gè)音去都用同一個(gè)音碼表示。不管是用拼音法輸入,還是用注音法輸入,如果是同一個(gè)音,則會變換成同一個(gè)音碼,因此在裝置內(nèi)部,能夠統(tǒng)一地把音碼作為表示發(fā)音的唯一符號。因此不必為第一種發(fā)音符號環(huán)境污染地分別準(zhǔn)備一種詞典(例如拼音法用的詞典及注音法用的詞典),為所有的字符表示法準(zhǔn)備一種通用的音碼檢索的詞典就足夠了。
例如,圖3中第1行所示的用拼音字符表示的發(fā)音與圖4中第1行的用注音字符表示的發(fā)音是相同的,都對應(yīng)于同一音碼52F8(16進(jìn)制碼)。其它行的發(fā)音也一樣。為了容易理解,在圖3及圖4中,最左側(cè)一欄中分別是拼音符號和注音符號。在變換表中,這些符號當(dāng)然是用二進(jìn)制數(shù)據(jù)表示的。
圖5a表示音碼的格式。在本實(shí)施例中,音碼由兩個(gè)二進(jìn)制字節(jié)構(gòu)成。前一個(gè)字節(jié)主要表示韻母,后一個(gè)字節(jié)主要表示聲母。前一個(gè)字節(jié)中的最前方的(f)的數(shù)據(jù)“0”及后一個(gè)字節(jié)中的最前方的(7)的數(shù)據(jù)“1”是用來分隔構(gòu)成一個(gè)音碼的上一個(gè)字節(jié)和下一個(gè)字節(jié)的,同時(shí)也用來分隔其它數(shù)據(jù)的(特別是音碼列中的音碼)。
前一個(gè)字節(jié)中的最后的位(第8位)表示聲調(diào)的有無。因?yàn)橛械陌l(fā)音無聲調(diào)。用“0”表示無聲調(diào),用“1”表示有聲調(diào)。后一個(gè)字節(jié)中的最后的兩位(第0-1位)表示聲調(diào)。如圖5b所示,一聲、二聲、三聲、四聲分別用“00”、“01”、“10”、“11”表示。
上一個(gè)字節(jié)的中間六位(第9-e位)表示韻母,下一個(gè)字節(jié)的中間五位(第2-6位)表示聲母。韻音有37種,聲母有24種,因此這么多的位數(shù)已經(jīng)足夠了。
在后面所述的漢字檢索處理中使用篩選程序。該篩選程序也是由兩個(gè)二進(jìn)制字節(jié)構(gòu)成,其第0位,第1位及第8位設(shè)定為“0”,其它各位設(shè)定為“1”。該過濾程序用16進(jìn)制表示則為“FEFC”。
圖6表示用計(jì)算機(jī)10進(jìn)行輸入,編輯處理的順序,或者表示編輯處理裝置16的動作情況。在計(jì)算機(jī)10或編輯處理裝置16中,設(shè)有如圖7所示的鍵數(shù)據(jù)緩沖存儲器,以及如圖8所示的音碼串緩沖存儲器。
首先,利用輸入方式鍵23,判斷設(shè)定的是拼音法還是注音法中的哪一種方式(步41),如果是選擇了拼音法,則選擇拼音碼變換表31(步42)。如果是選擇了注音法,則選擇注音/音碼變換表32(步43)。
接著,利用變換方式鍵24,判斷選擇的是第一方式還是第二方式(步44)。如果選擇的是第一方式,則不需要進(jìn)行任何處理,但若選擇是第二方式,則應(yīng)在篩選程序(由寄存儲器或存儲區(qū)位實(shí)施)中設(shè)定“FEFC”(步45)。選擇第一方式,也可以設(shè)定全部各位均由1構(gòu)成的數(shù)據(jù)“FFFF”作為篩選程序。
由拼音鍵21或注音鍵22每次輸入的表示發(fā)音符號的字符或符號的數(shù)據(jù),都存儲于鍵數(shù)據(jù)緩沖存器中(步47)。如圖7所示,輸入一個(gè)字符后,便在該字符后段存入一個(gè)終端符號數(shù)據(jù)“φ”。這是因?yàn)楸硎景l(fā)言符號的數(shù)據(jù)是可變稱度的數(shù)據(jù),所以有必要明確表示該數(shù)據(jù)的終端。在圖7中,列出了按照第二方式輸入的用拼音符號表示的“Zhong”的發(fā)音的式樣。
需要判斷是否輸完一個(gè)漢字的鍵數(shù)據(jù)(步48)。這種判斷有多種方法。其一是在輸入一個(gè)漢字的鍵數(shù)據(jù)終了時(shí),由操作人員按下空格鍵。如果有空格鍵的輸入,即可斷定一個(gè)漢字業(yè)已輸入終了。其二是,在第一方式的情況下使用有效數(shù)據(jù)。在輸入了發(fā)音符號后,由操作人員用1、2、3、4數(shù)字輸入聲調(diào)。例如,“Zhong”的發(fā)音是一個(gè)具有一聲聲調(diào)的音,則輸入“Zhong1”。如果有數(shù)字鍵輸入,即可斷定一個(gè)漢字的數(shù)據(jù)來已輸入終了。其三是,通過劃分音節(jié)的自動識別方式進(jìn)行判斷。按拼音法書寫發(fā)音時(shí),有一定的規(guī)則,所以利用這個(gè)規(guī)則就能斷定在所輸入的鍵數(shù)據(jù)串的什么地方是一個(gè)漢字符號的終端。用注音法書寫時(shí),同樣有一定的規(guī)則,因而也可以利用這個(gè)規(guī)則。
總之,輸入了一個(gè)漢字的鍵數(shù)據(jù)后,先根據(jù)所選擇的拼音/音碼變換表31或注音/音符變換表32,將所輸入的鍵數(shù)據(jù)(拼音符號或注音符號)變換成與其對應(yīng)的音碼。再將該音碼存入音碼串緩沖存儲器中(步49)。
上述步驟47的處理反復(fù)進(jìn)行,直至一個(gè)漢字的鍵數(shù)據(jù)完全輸入終了為止(步48)。步47-49的處理反復(fù)進(jìn)行,直至按下變換鍵為止(步46)。于是,等到有為換鍵輸入后,音符串緩沖存儲器中存儲的音碼串,就過渡到從圖9開始的漢字檢索處理(步50)。
例如,用拼音法以第二方式輸入“ZhongGuo”時(shí),鍵輸入數(shù)據(jù)“Zhong”變換成音碼“52f8”,“Guo”變換成音碼“66b4”,結(jié)果獲得音碼串525866b4”。
在指定了第二方式之后,也可以輸入包含聲調(diào)的發(fā)音。例如,可以輸入“Zhong1Guo2”。這時(shí)產(chǎn)生“53f867b5”這樣的音碼串。因?yàn)橹付ǖ氖堑诙绞?,所以設(shè)定篩選程序“FEFC”(步45),結(jié)果執(zhí)行后面將更詳細(xì)說明的第二方式的檢索。
從圖9至圖11特別列出了第二方式的漢字檢索處理順序。由于將篩選程序設(shè)定為“FFFF”,所以這種處理方式同樣適用于第一方式的漢字檢索處理。另外,該處理最好由圖1所示的計(jì)算機(jī)10或圖2所示的漢字檢索處理裝置17執(zhí)行。
在說明該漢字檢索處理之前,先參照圖12及圖13說明詞典35的結(jié)構(gòu)。如圖12所示,詞典35右設(shè)有索引表Ⅰ、索引表Ⅱ及音串/漢字符對照表。
如圖13所示,音碼串/漢字符對照表中,存儲著音碼串和漢字符對照表,該漢字符是表示構(gòu)成具有由該音碼串表示的發(fā)音的單詞的一個(gè)或數(shù)個(gè)漢字的。為了容易理解,圖13中列出了漢字本身,用來代替漢字碼,但實(shí)際上請理解為存儲的是用二進(jìn)制數(shù)據(jù)表示的符號。
“中國人”這個(gè)單詞是由三個(gè)漢字構(gòu)成的,所以音碼串由6位構(gòu)成。由兩個(gè)漢字構(gòu)成的單詞(例如“中國”)對應(yīng)于四個(gè)碼串。一個(gè)漢字時(shí),對應(yīng)兩位音碼串,這樣,開頭的一個(gè)漢字(上例中的“中”)相同的單詞都靠近排列,而且,構(gòu)成單詞的音碼串的位數(shù)多者,采用以相對地址的值小的方式進(jìn)行。在圖13中,在音符串的最后一定要有表示“0000”的符號“φ”。
有時(shí)一個(gè)音有兩個(gè)以上的漢字。例如,相對地址為102及103的音碼串都是“53f8”,它們對應(yīng)于漢字“中”、“忠”等。
用l表示音碼串/漢字碼對照表中的相對地址。另外,相對地址l的音碼串用YO(l,1)、YO(l,2)……φ表示。YO(l,1)、YO(l,2)等,一般用YO(l,c)(c=1,2、……)表示。相對地址l的漢字符用KA(l)(可變長)表示。
在音碼串/漢字碼對照表中存入盡可能多的(如有可能,幾乎是在中國使用的全部)單詞。這些單詞的排列順序,除上述規(guī)則外,是任意的。因此,任意的一對音碼串與漢字碼可以分配在任意的存儲區(qū)。將音碼串/漢字碼對照表中排列的單詞數(shù)為M。
再回到圖12,索引表Ⅰ及索引表Ⅱ是用來按照音碼串的表示數(shù)值大小的順序就能檢索任意排列的音碼串/漢字碼對照表中的音碼串的一種對照表。
在索引表Ⅰ中,有N個(gè)IndexⅠ(i)(索引Ⅰ(i)),按一定的順序排列。IndexⅠ(i)是指示索引表Ⅱ中對應(yīng)要素所在的指針(指示索引表Ⅱ的相對地址)。N是音碼串/漢字碼對照表中不同音碼串的個(gè)數(shù)。如上所述,一個(gè)音碼串有可能對應(yīng)兩個(gè)以上的單詞,所以一般來說,N≤M成立。
在索引表Ⅱ中有M個(gè)存儲區(qū),在各存儲區(qū)中存儲著三種要素F1(K)、F2(K)、F3(K)。F3(K)是指向與碼串/漢字碼對照表中相對應(yīng)的音碼串的指針(指示對照表的相對地址)。F2(K)所指是那些與它在同一存儲區(qū)中的F3(K)所指、但卻與存在于索引表Ⅱ中其他存儲區(qū)的所存的F3(K)所指的音碼串相同的相對地址。因此采用這種方式音碼串53f8才有可能檢索到單詞“中”、“忠”兩個(gè)漢字。如果在別處及有同樣的音碼串,則置F2(K)=φ。F1(K)指示索引表Ⅱ中具有指示在上位含有與該F1(K)位于同一存儲區(qū)中的F3(K)所指示的音碼串相同的音碼串(即比F3(K)所指示的音碼串長的音碼串)的F3(K)的其它存儲場所(的相對地址)。因此,檢索“中國”時(shí),才能自動檢索到雖然含有“中國”但漢字?jǐn)?shù)目卻比它多的“中國人”。
索引表Ⅰ中的Index(i)按照表示音碼串/漢字碼對照表中音碼串的數(shù)值從小到大的順序排序。因此,即使音碼串/漢字碼對照表中的音碼串的排列是任意的,但通過索引表Ⅰ查看時(shí),所看到的音碼串/漢字碼對照表中的音碼串宛如按照表示它的數(shù)值從小到大的順序排列。
從圖9至圖11所示的漢字檢索處理采用對分法檢索(binarysearch或dichotomizing)。
在進(jìn)行這種漢字檢索處理時(shí),使用若干個(gè)變數(shù)。這些變數(shù)是START(開始)、END(終止)、find(搜索)等。變數(shù)START及END用來從索引表Ⅰ中選擇數(shù)據(jù)。find用來指示存儲所檢到的漢字碼的漢字碼緩沖存儲器(參見圖14)中的存儲區(qū)。這些變數(shù)是作為在寄存器或在存儲區(qū)中存儲的數(shù)據(jù)實(shí)現(xiàn)的。
從輸入、編輯處理(圖6)或編輯處理裝置16輸送到漢字檢索處理或漢字檢索處理裝置17中的輸入音碼串,用X(1)、X(2)、X(3)……φ表示。例如,按照拼音字符表示法輸入“ZhongGuo2”時(shí),輸入音碼串為“53f86765φ”。即X(1)=53f8,X(2)=67b5用音碼計(jì)數(shù)碼C用來表示構(gòu)成輸入音碼串的各個(gè)音碼在輸入音碼串中的第n個(gè)位置。例如,X(1)寫作X(C)(C=1)。
在圖9中,首先使音碼計(jì)數(shù)碼C初始化(C=1,步51)。從而,輸入音碼串的頭一個(gè)音碼即被指定為X(1)。
接著使變數(shù)START為0,END為(N-1),find為0,都分別予以初始化(步52)。
用變數(shù)START和END算出索引表Ⅰ的相對地址為(START+END)/2,將它置作i(步54)。這是求出索引表Ⅰ的相對地址中恰好位于中央的相對地址的處理。對分檢索法就是這樣將一系列相對地址(一般說來是一群項(xiàng)目)分成兩個(gè)部分,選擇其中的某一部分,將所選擇的部分再分成兩份,直至到達(dá)(檢出)目的物的相對地址(項(xiàng)目)的一種檢索方法。
利用算出來的相對地址,從索引表Ⅰ中選取數(shù)據(jù),讀出存儲在具有相對地址i的存儲區(qū)位中的Index(i)。將該Index(i)置作k(步55)。
接著,將Index(i)=k作為相對地址用,再從索引表Ⅱ中選取數(shù)據(jù),讀出具有該相對地址的存儲區(qū)中存儲要素F1(K)、F2(K)、F3(K),將它們分別置作為l1、l2、l3(步56)。
參照圖10,將從索引表Ⅱ中讀出的第三個(gè)要素F3(K)=l3用作相對地址,從音碼串/漢字碼對照表中選取數(shù)據(jù),讀出具有該相對地址的存儲區(qū)中存儲的音碼YO(l3,C)。在選擇了第二方式時(shí),設(shè)定FILTER(篩選程序)=FEFC(圖6,步45)。進(jìn)行篩選程序和讀出的音碼YO(l3,C)rAND邏輯運(yùn)算。另外,利用輸入音碼的音碼計(jì)數(shù)碼C,對指定的音碼X(C)和篩選程序進(jìn)行ABD邏輯運(yùn)算。比較這兩個(gè)AND邏輯運(yùn)算的結(jié)果是否相等,哪一個(gè)大(步63、64)。
如上所述,通過索引表Ⅰ,檢查音碼串漢字碼對照表,在音碼串/漢字碼對照表中,將音碼串按照其代表數(shù)值從小到大排列。因此FILTERANDX(C)<FILTERANDYO(l3,C)式1表示式1成立,就是說輸入的音碼X(C)比搜索出來的音符YP(l3,C)小,即應(yīng)該搜索出來的X(C)是存儲在比YO(l3,C)的相對地址小的存儲區(qū)。為了更接近X(C),必須從相對地址更小的存儲區(qū)選取數(shù)據(jù)。即必須從索引表Ⅰ的上半部分選取數(shù)據(jù)。這里,用i代入變數(shù)EBD(步67),經(jīng)過步53,返回步54。
FILTERANDX(C)<FILTERANDYO(l3,C)式2正式2的情況下,用i代入變數(shù)START(步68),同樣返回步54。
這樣,按照對分探索法,在音符列/漢字符對照表中搜索與輸入音符X(C)一致的音符。
接著FILTERANDX(C)<FILTERANDYO(l3,C)式2如果式3成立,則要尋找的音碼X(C),在對照表中所存儲的存儲區(qū)便能找到。
假設(shè)C=1,為了查看下一個(gè)第二個(gè)(C=2)的輸入音碼X(C)是否與對照表中音碼串中的第二個(gè)音碼YO(l3,C)一致,使音碼計(jì)算碼C增量(步66)。
如果C增量后式3成立,則根據(jù)式1或式2兩者中哪一式成立,再按照對分檢索法進(jìn)行探索(步64、67、68)。C=1時(shí)所謂式3成立,就是說在對照表中找到的YO(l3,C)的附近存在著要找的音碼串,因此故意不用對分法,也可以在其附近找出。另外,如后面所述,也可以利用要素F1(K)進(jìn)行檢索。
一邊找出式3成立的音碼YO(l3,C),一邊使音碼計(jì)數(shù)碼C增量的結(jié)果,對輸入音碼串中的全部音符檢索完畢,接著使X(C)=φ后(步61),檢驗(yàn)一下YO(l3,C)=φ在對照表中的音碼串的音碼中是否也成立(步69)。這時(shí)如果是“YES”(是),便是找到了與輸入音碼串一致的音碼。多至圖11所示的處理程序。如果音碼YO(l3,C)ijφ時(shí),則要找的音碼串存在于比該存儲區(qū)的相對地址大的位置處,因此再在相對地址更大的存儲區(qū)繼續(xù)檢索(步70)。理所當(dāng)然,找到全部含有輸入音碼串的音碼串之后,(就像隨著找到了“中國”,也就找到了“中國人”),作為要尋找的音碼串理應(yīng)就在其附近,因此,如果使對照表中的相對地址一個(gè)接一個(gè)地增加,理應(yīng)立刻找到所要尋找的音碼串。
再者,當(dāng)X(C)不是φ,而讀出的音碼YO(l3,C)已經(jīng)是φ時(shí)(就像尋找“中國”時(shí)找到了“中”那樣)(步62),移至相對地址更小的存儲區(qū)檢索(步65)。在這種情況下,要尋找的文字碼串也應(yīng)存在于所到在的存儲區(qū)很近的地方,因此通過使對照表的相對地址一個(gè)一個(gè)地增值下去,就能迅速地找到所要找的文字碼串。
下面參照圖15說明FILTER=FEFC的含義。例如,對具有“Zhong”這個(gè)韻的一聲一四揚(yáng)中的任意一個(gè)音碼和FITET=FEFC進(jìn)行AND運(yùn)算后,變換成忽視聲調(diào)的表示“Zhong”韻的音碼。因此,在第二方式下進(jìn)行漢字檢索時(shí),能看到與聲調(diào)無關(guān)而韻相同的全部漢字。其式樣示于圖16中。不管輸入含有聲調(diào)的“Zhong1Fuo2”,還是輸入無聲調(diào)的“ZhongGuo”,使該輸入音碼通過篩選程序,有關(guān)“中國”這個(gè)單詞的式3成立,便找到了該單詞。這意味著通過步63、64處理過程中的篩選程序。
在第一方式下,不一定必須使用篩選程序,可以直接比較輸入音碼對照表中的音碼,但若使用FILTER=FFFF,步63、64,可直接使用式1-式3。
找到與輸入音碼串一致(通過過濾程序)的音碼串后(步69),參照圖11,使高數(shù)find增值,指定漢字碼村沖存儲器中的存儲區(qū),對照所檢出的音碼串,從音碼串/漢字碼對照表中讀出存儲的漢字碼KA(l3),根據(jù)漢字碼緩沖存儲器中的變數(shù)find,存入指定的存儲區(qū)(步71)。
接著利用索引表Ⅱ中的第二個(gè)要素F2(K),根據(jù)指示對照表中發(fā)音相同的音碼串的索引表中的其它存儲區(qū)的要素F3(K),僅供參考照表中選到數(shù)據(jù)。這時(shí),使變數(shù)find增值,給被存儲的發(fā)音相同的漢字碼指定的存儲區(qū)后,存入漢字碼緩沖存儲器中(步73)。利用要素F2(K),依次讀出經(jīng)過連接指令連接的發(fā)音楨的漢字碼,并存入漢字碼緩沖存儲器中(反復(fù)進(jìn)行步73、74)。因此,便能在“中”字處附加上“忠”字等漢字作為候選字一并檢出。
如果F2(K)=l2=φ(步72),利用要素F1(K)=l1,檢索含有輸入音碼串、且比它更長的音碼串。利用由要素F1(K)所指的索引表Ⅱ中的其它(第二個(gè))存儲區(qū)中存儲的要素F3(K),從對照表中讀出被選取的漢字碼,使變數(shù)find增值后,存入漢字碼緩沖存儲器中(步76)。根據(jù)第二個(gè)存儲區(qū)中的要素F1(K),如果還有其它的被下達(dá)了連接指令的存儲區(qū),同樣,再根據(jù)上述的其它存儲區(qū)的要素F3(K),讀出被選取的漢字碼,并存入漢字碼緩沖存儲器(步75-77)如果F1(K)=l1=φ,則全部處理結(jié)束(步75)。
另外,反復(fù)進(jìn)行對分檢索,終于達(dá)到STATT+1>END時(shí),表示沒找到與輸入音碼串相當(dāng)?shù)囊舸a串,于是漢字檢索處理終了(步53)。
圖17是表示實(shí)現(xiàn)上述處理的硬件結(jié)構(gòu),即表示漢字檢索處理裝置17的結(jié)構(gòu)。
音碼串/漢字碼對照表81圖12或圖13所示的對照表相同。檢索讀出電路82,從該對照表中,或是參照輸入音碼串,依次讀出音碼串。在篩選程序寄存器83A中存入數(shù)據(jù)FFF,在過篩選程序寄存器83B中存入數(shù)據(jù)FEFC。根據(jù)由變換方式鍵24進(jìn)行的變換方式的選擇結(jié)果,轉(zhuǎn)換開關(guān)84在第一方式狀態(tài)時(shí)選擇寄存器83?A,在第二方式狀態(tài)時(shí)選擇寄存器83B,將其中存儲的篩選程序數(shù)據(jù)輸送給AND電路85、86。
輸入音碼串被輸送給AND電路85,從對照表81讀出的音碼串被輸送給AND電路86。在AND電路85、86中,分別輸入音碼串、進(jìn)行音碼串的篩選,它們的輸出數(shù)據(jù)在比較電路87中進(jìn)行比較。比較電路87只在兩個(gè)輸入數(shù)據(jù)一致時(shí)才輸出一致信號。由該一致信號起動門電路88。另外,一致信號被送給檢索讀出電路82。檢索讀出電路82從對照表中讀出與一致的音碼對應(yīng)的全部漢字碼,并輸送到門電路88,所以該漢字碼通過選通電路88,存入漢字碼緩沖存儲器89中。
在上述實(shí)施例中,有第一種方式和第二種方式之分,利用篩選程序FFFF及FEFC,進(jìn)行含聲調(diào)的和所徊聲調(diào)的漢字檢索,但也還可以利用另外的篩選程序進(jìn)行其它狀態(tài)的漢字檢索。例如,如果使用16進(jìn)制表達(dá)的篩選程序OOFC,就能檢索具有聲母與輸入音碼一致的音碼的全部漢字。
另外,作為輸入裝置,不限于鍵盤,也可利用輸入發(fā)音的裝置。在這種情況下,可利用將表示發(fā)音的電信號變換成與對應(yīng)的音碼的聲音識別裝置。
權(quán)利要求
1.漢語發(fā)音符號/漢字變換裝置,具有可按數(shù)種符號表示法輸入漢語發(fā)音的輸入裝置;針對用上述輸入裝置可以輸入的多種符號表示法分別設(shè)置的多種變換表,用來將按照各種符號表示法輸入的數(shù)據(jù)變換成與由該輸入數(shù)據(jù)表示的發(fā)音對應(yīng)的音碼;使音碼與表示具有該音碼所示音的漢字的漢字碼互相對應(yīng)存儲的詞典;以及利用上述數(shù)種變換表中的任意一種,將由上述輸入裝置輸入的輸入數(shù)據(jù)變換成音碼,從上述詞典中檢索與交換后的音碼相對應(yīng)的漢字碼的控制裝置。
2.根據(jù)權(quán)利要求1所述的裝置,還具有選擇多種符號表示法中的某一種用的輸入方式選擇裝置,上述控制裝置利用與由上述輸入方式選擇裝置選擇的符號表示相關(guān)的變換表,將輸入數(shù)據(jù)變換成音碼。
3.根據(jù)權(quán)利要求1所述的裝置,其上述控制裝置根據(jù)從上述輸入裝置輸入的輸入數(shù)據(jù),判斷符號表示法,根據(jù)該判斷結(jié)果選擇應(yīng)該使用的變換表。
4.根據(jù)權(quán)利要求1所述的裝置,其上述輸入裝置由將輸入聲音變換成電信號的裝置、以及根據(jù)聲音電信號識別發(fā)音、并將輸入的聲音變換成音碼的聲音識別裝置結(jié)構(gòu)。
5.根據(jù)權(quán)利要求1所述的裝置,還具有將檢索到的漢字符,變換成表示該漢字碼所示漢字的顯示數(shù)據(jù)的裝置,以及根據(jù)顯示數(shù)據(jù)顯示漢字的裝置。
6.根據(jù)權(quán)利要求5所述的裝置,還具有從顯示出來的候選漢字中提定任意一個(gè)漢字的指定輸入裝置,以及存儲表示所指下的漢字的漢字碼的存儲器。
7.根據(jù)權(quán)利要求1所述的裝置,其上述各變換表是用來將單個(gè)漢字的輸入數(shù)據(jù)變換成音碼,上述詞典是將由一個(gè)漢字或數(shù)個(gè)漢字構(gòu)成的單詞的音碼串與漢字符對應(yīng)存儲用的,上述控制裝置將從上述輸入裝置輸入的輸入數(shù)據(jù)分成一個(gè)個(gè)的漢字,并變換成音碼,將變換后的音碼排列在單詞單元中,作成音碼串,再從上述詞典中檢索與該音符列對應(yīng)的漢字碼。
8.根據(jù)權(quán)利要求1所述的裝置,還具有將構(gòu)成音碼的給定的一個(gè)或數(shù)個(gè)字節(jié)進(jìn)行掩蔽篩選的選裝置,上述控制裝置利用上述篩選裝置對與輸入數(shù)據(jù)對應(yīng)的音碼和上述詞典中的音碼經(jīng)過篩選后進(jìn)行比較,再從上述詞典中尋找出與輸入數(shù)據(jù)對應(yīng)的音碼一致的音碼。
9.漢語發(fā)音符號/漢字變換裝置具有將輸入表示漢語發(fā)音的數(shù)據(jù)變換成與該音對應(yīng)的音碼的變換裝置;將音碼與表示具有該音碼所示音的漢字的漢字碼互相對應(yīng)存儲的詞典;將構(gòu)成音碼的某一個(gè)或數(shù)個(gè)字節(jié)進(jìn)行掩蔽篩選的篩選裝置;用上述篩選裝置對從上述變換裝置獲得的音碼和上述詞典中的音碼進(jìn)行篩選,互相比較,從上述詞典中檢索與從上述變換裝置獲得的音碼一致的音碼,再從上述詞典中讀出與一致的音碼相對應(yīng)的漢字碼的控制裝置。
10.根據(jù)權(quán)利要求9所述的裝置,其上述音碼包括表示聲母字節(jié)、表示韻母的字節(jié)、以及表示聲調(diào)的字節(jié)。
11.根據(jù)權(quán)利要求10所述的裝置,其上篩選濾裝置是用來篩選表示聲母的字節(jié)、表示韻母的字節(jié)或表示聲調(diào)的字節(jié)的裝置。
12.根據(jù)權(quán)利要求9所述的裝置,其上述篩選裝置含有使音碼直接通過的功能。
13.根據(jù)權(quán)利要求9所述的裝置,還具有按照多種符號表示法可輸入漢語發(fā)音的輸入裝置,上述變換裝置是針對使用上述輸入裝置可輸入的多種符號表示法準(zhǔn)備的,而且備有多種變換表,用來將按照各種符號表示法輸入的數(shù)據(jù)變換成與由該輸入數(shù)據(jù)表示的音對應(yīng)的音碼。
14.根據(jù)權(quán)利要求9所述的裝置,其上述變換裝置是一種根據(jù)聲音輸入信號識別發(fā)音,并輸出與該音對應(yīng)的音碼的聲音識別裝置。
15.根據(jù)權(quán)利要求9所述的裝置,還具有選擇是否使用篩選裝置,或選擇多種篩選裝置中的某一種的檢索方式選擇裝置。
16.根據(jù)權(quán)利要求13所述的裝置,還具有選擇數(shù)種符號表示法中的某一種用的輸入方式選擇裝置,上述變換裝置利用與由上述輸入方式選擇裝置的符號表示法相關(guān)的變換表,將輸入數(shù)據(jù)變換成音碼。
17.根據(jù)權(quán)利要求9所述的裝置,還具有將讀出的漢字碼變換成表示該漢字碼所示漢字的顯示數(shù)據(jù)的裝置,以及根據(jù)顯示數(shù)據(jù)顯示漢字的裝置。
18.根據(jù)權(quán)利要求17所述的裝置,還具有從所顯示的候選漢字中指定任意一個(gè)的指定輸入裝置,以及存儲表示被指定的漢字的漢字符的存儲器。
19.根據(jù)權(quán)利要求9所述的裝置,其上述變換裝置是將單個(gè)漢字的輸入數(shù)據(jù)變換成音碼的一種裝置,上述詞典是對應(yīng)存儲由一個(gè)漢字或數(shù)個(gè)漢字構(gòu)成的單詞的音碼串和漢字碼用的,上述控制裝置是用來控制將輸入數(shù)據(jù)分成單個(gè)漢字、并變換成音碼的上述變換裝置,將變換后的音碼排列成單詞單元,作成音碼串,再從上述詞典中檢索與該音碼串相對應(yīng)的漢字碼。
20.漢語發(fā)言符號/漢字變換方法可根據(jù)數(shù)種符號表示法輸入漢語發(fā)音,針對可輸入的多種符號表示法,預(yù)先準(zhǔn)備了多種變換表,用來將按照各種符號表示法輸入的數(shù)據(jù)變換成與該輸入數(shù)據(jù)所示的音相對應(yīng)的音碼,以及使音碼與表示具有該音碼所示音的漢字的漢字碼互相對應(yīng)存儲的詞典,利用上述多種變換表中的某一種表,將輸入數(shù)據(jù)變換成音碼,再從上述詞典中檢索與變換后的音碼相對應(yīng)的漢字碼。
21.漢語發(fā)音符號/漢字變換方法,預(yù)先準(zhǔn)備了詞典,該詞典是將音碼與表示具有該音碼所示音的漢字的漢字碼互相對應(yīng)存儲用的,將表示輸入的漢語發(fā)音的數(shù)據(jù)變換成與該音相對應(yīng)的音碼,在將構(gòu)成音碼的某一個(gè)或數(shù)個(gè)字節(jié)進(jìn)行掩蔽篩選之后,對通過變換獲得的音碼與上述詞典中的音碼進(jìn)行互相比較,從上述詞典中檢出與通過變換獲得的音碼相一致的音碼,再從上述詞典中讀出與一致音碼相對應(yīng)的漢字碼。
全文摘要
本發(fā)明為漢語發(fā)音符號/漢字變換裝置,允許用拼音符號表示法及注音符號表示法輸入。用拼音法輸入的數(shù)據(jù)使用拼音/音碼變換表,用注音法輸入的數(shù)據(jù)使用注音/音碼變換表,分別變換成對應(yīng)的音碼。在詞典中對應(yīng)于音碼串存儲著漢字碼。從輸入數(shù)據(jù)作成音碼串。通過篩選程序掩蔽篩選音碼中的某些字節(jié),比較該輸入音碼列的各音碼與詞典中的音碼串的音碼。通過比較,從詞典中讀出與一致的音碼串相對應(yīng)的漢字碼,顯示出與該漢字碼相對應(yīng)的單詞。
文檔編號G06F3/01GK1071522SQ92111509
公開日1993年4月28日 申請日期1992年10月14日 優(yōu)先權(quán)日1991年10月14日
發(fā)明者仲興國 申請人:歐姆龍株式會社