亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

面向詞的中文文字處理輸入裝置的制作方法

文檔序號(hào):6407670閱讀:157來源:國(guó)知局
專利名稱:面向詞的中文文字處理輸入裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明是一種帶有語法和語義分析處理、面向詞(特別是四字詞、三字詞、二字詞)的中文文字處理輸入裝置。
隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展和微型計(jì)算機(jī)應(yīng)用的普及,計(jì)算機(jī)、特別是微型計(jì)算機(jī)越來越多的被用于作文字處理工作,而不再局限于做科學(xué)計(jì)算。近年來,專門用于文字處理的微型計(jì)算機(jī)更是得到了極大的發(fā)展。例如,在國(guó)內(nèi)四通2401、2402、文豪、卡西歐等中英文打字機(jī)的知名度幾乎已經(jīng)是家喻戶曉。
但是,無論是用于文字處理的通用微型計(jì)算機(jī),還是專門用于文字處理的電腦打字機(jī),當(dāng)用于做中文的文字處理時(shí),都無一例外的遇到了一個(gè)“瓶頸”問題,即中文的輸入問題。
為了解決中文漢字輸入的“瓶頸”問題,不少中外科學(xué)工作者充分的發(fā)揮了他們的聰明才智,提出了難以數(shù)計(jì)的解決方案。
早期,有人仿照中文機(jī)械打字機(jī)的原理設(shè)計(jì)了專用的中文大鍵盤,后來又有人設(shè)計(jì)出了規(guī)模較小的中型中文鍵盤,但都因無法很好的解決與計(jì)算機(jī)、特別是與通用微型計(jì)算機(jī)的接口,而逐漸的被人們淡忘了。
目前比較流行的解決方案都是建立在通用計(jì)算機(jī)(特別是微型計(jì)算機(jī))鍵盤上的漢字編碼方案。這些漢字編碼方案大多以漢“字”為編碼單元,一些編碼方案(如五筆字型等)在漢“字”的編碼間隙中插入“詞”的編碼,作為提高輸入速度的一種輔助手段。
現(xiàn)有中文輸入技術(shù)存在下列缺點(diǎn)1.漢字編碼以“字”為主,不符合一般人以“詞”為主的習(xí)慣。就目前各種文章,特別是報(bào)刊文章來看,文章中95%以上的字都是以詞的形式出現(xiàn)的,而不是以單個(gè)字的形式出現(xiàn);
2.符合一般人“語句→讀音→漢字”思維習(xí)慣的漢語拼音或同一類型的漢字編碼方案,碼位長(zhǎng)、重碼率高,輸入速度低。例如,用全拼漢字編碼方案輸入漢字,一般人每分鐘只能輸入約30個(gè)以字;
3.無重碼的流水碼(電報(bào)碼、國(guó)標(biāo)碼等),漢字的編碼與漢字的讀音和字形均無直接的聯(lián)系,一般人難以記憶和使用;
4.重碼率低的字型碼等編碼方案使用“語句→漢字→編碼”的思維方式,不符合一般人“語句→讀音→漢字”的思維習(xí)慣,而且構(gòu)成漢字編碼的各個(gè)“字根”及組字規(guī)則均為設(shè)計(jì)者的個(gè)人思維習(xí)慣,不符合大多數(shù)人的習(xí)慣,記憶信息多,需經(jīng)過學(xué)習(xí)和專門的訓(xùn)練才能掌握和使用;
5.有重碼的漢字編碼方案在遇到重碼時(shí)必須由操作人員控制選擇,因而大大降低了輸入的速度;
6.現(xiàn)有的漢字編碼方案輸入時(shí)的編碼(外碼)一般都在3個(gè)以上,而漢字的機(jī)內(nèi)表示碼(內(nèi)碼)僅有兩個(gè)字節(jié);與機(jī)內(nèi)僅有一個(gè)字節(jié)表示、輸入時(shí)的編碼也僅有1個(gè)的西文相比,輸入時(shí)的碼位過長(zhǎng),因而漢字的輸入速度遠(yuǎn)遠(yuǎn)的低于西文的輸入速度。
本發(fā)明的目的,在于采用符合一般人“語句→讀音→漢字”思維習(xí)慣的漢語拼音編碼方案,特別是一種簡(jiǎn)便易學(xué)的漢語拼音編碼方案,以詞為主,兼顧詞詞、詞字、字詞、字字的組合體,及單個(gè)漢字,由代碼轉(zhuǎn)換器(程序)自動(dòng)完成拼音編碼(外碼)到漢字內(nèi)碼的轉(zhuǎn)換、并依據(jù)語法和語義分析自動(dòng)完成重碼處理,大大提高中文的輸入效率,解決中文漢字輸入的“瓶頸”問題。
本發(fā)明在代碼轉(zhuǎn)換器中設(shè)置代碼表、四字詞庫(kù)、三字詞庫(kù)、二字詞庫(kù)、字庫(kù)、語法規(guī)則數(shù)據(jù)、語義數(shù)據(jù)、代碼檢查器、字詞檢索器、語法語義分析器、操作員選擇器、掩碼遞歸處理器。
字庫(kù),由字庫(kù)索引和字庫(kù)體構(gòu)成,字庫(kù)體由漢字的內(nèi)碼構(gòu)成,字庫(kù)索引由漢語拼音編碼和該漢語拼音編碼對(duì)應(yīng)的漢字在字庫(kù)體中的起始地址指針構(gòu)成;
由詞庫(kù)索引和詞庫(kù)體構(gòu)成的四字詞庫(kù)、三字詞庫(kù)、二字詞庫(kù),詞庫(kù)體由構(gòu)成詞的各個(gè)漢字的內(nèi)碼及詞的詞性構(gòu)成,詞庫(kù)索引由詞的編碼和該編碼對(duì)應(yīng)的詞在詞庫(kù)中的起始地址指針構(gòu)成,詞的編碼由構(gòu)成詞的各個(gè)漢字的編碼構(gòu)成;
語法規(guī)則數(shù)據(jù)由詞的接續(xù)關(guān)系構(gòu)成;語義數(shù)據(jù)由多意字用例構(gòu)成。
在使用時(shí),代碼檢查器查找代碼表,檢查由編碼結(jié)束字符標(biāo)明的編碼串中各編碼的合法性;字詞檢索器依四字詞庫(kù)、三字詞庫(kù)、二字詞庫(kù)、字庫(kù)的優(yōu)先級(jí)次序查詢?cè)~庫(kù)或字庫(kù);字詞檢索器沒有從詞庫(kù)和字庫(kù)中找到詞和字時(shí),掩碼遞歸處理器掩去編碼串中最后一個(gè)漢字的編碼,用剩余的部分作為新的編碼串遞歸調(diào)用代碼轉(zhuǎn)換器(不包括代碼檢查器),直至找到詞或字,而后檢查是否有被掩去的編碼,如果有則以被掩去的編碼作為新的編碼串遞歸調(diào)用代碼轉(zhuǎn)換器(不包括代碼檢查器),直至所有的編碼均被轉(zhuǎn)換;字詞檢索器找到重碼時(shí),語法語義分析器依語法規(guī)則數(shù)據(jù)分析處理重碼詞或字,如果還有重碼,依語義數(shù)據(jù)分析處理重碼;經(jīng)過語法語義分析仍有重碼時(shí),操作員選擇器將各重碼詞或字提交操作員選擇。如果是第一個(gè)重碼詞或字,操作員無需選擇,繼續(xù)后面的輸入,由操作員選擇器自動(dòng)完成選擇。
此外,本發(fā)明采用漢語拼音的首字母和末字母構(gòu)成一種僅有兩個(gè)字母的簡(jiǎn)化的漢語拼音編碼,以縮短碼長(zhǎng),方便記憶,提高輸入速度。
本發(fā)明具有下列顯著優(yōu)點(diǎn)1.以詞為主,兼顧詞詞、詞字、字詞、字字組合體及單個(gè)漢字,符合一般人以詞為主的習(xí)慣,便于記憶;
2.采用漢語拼音編碼方案,符合一般人“語句→讀音→漢字”的思維方式,易被一般人接受和使用;
3.通過語法和語義分析自動(dòng)進(jìn)行重碼處理,降低了操作員人工選擇的工作量,極大的提高了中文的輸入速度;
4.采用雙字母簡(jiǎn)化漢語拼音編碼,使?jié)h字的輸入編碼的碼長(zhǎng)與機(jī)內(nèi)表示的碼長(zhǎng)一致,大大縮短了漢字的輸入碼長(zhǎng),同時(shí)有利于平卷舌音掌握不好的使用者(特別是南方人)掌握和使用,提高了中文的輸入效率。
附圖
是本發(fā)明實(shí)施例的代碼轉(zhuǎn)換器程序流程圖。
下面結(jié)合附圖的實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明。
(一).輸入鍵盤上制有與漢語拼音聲母字母和韻母字母對(duì)應(yīng)的字母鍵及編碼結(jié)束字符鍵(如空格鍵、回車鍵等);
(二).漢字的漢語拼音編碼由漢語拼音的首字母和漢語拼音的末字母構(gòu)成,漢語拼音‘a(chǎn)’、‘e'、‘o’的漢語拼音編碼為‘a(chǎn)a’、‘ee’、‘oo’;
A.漢語拼音的首字母包括a,b,c,d,e,f,g,h,j,k,l,m,n,o,p,q,r,s,t,w,x,y,z,共23個(gè);
B.漢語拼音的末字母包括a,e,g,i,n,o,r,u,共8個(gè);
(三).代碼轉(zhuǎn)換器包括A.代碼表,由漢語拼音的首字母和漢語拼音的末字母構(gòu)成;
B.字庫(kù),由字庫(kù)索引和字庫(kù)體構(gòu)成,字庫(kù)體由漢字的內(nèi)碼構(gòu)成,字庫(kù)索引由漢語拼音編碼和該漢語拼音編碼對(duì)應(yīng)的漢字在字庫(kù)體中的起始地址指針構(gòu)成;
C.由詞庫(kù)索引和詞庫(kù)體構(gòu)成的四字詞庫(kù)、三字詞庫(kù)、二字詞庫(kù),詞庫(kù)體由構(gòu)成詞的各個(gè)漢字的內(nèi)碼及詞的詞性構(gòu)成,詞庫(kù)索引由詞的編碼和該編碼對(duì)應(yīng)的詞在詞庫(kù)中的起始地址指針構(gòu)成,詞的編碼由構(gòu)成詞的各個(gè)漢字的編碼構(gòu)成;
D.語法規(guī)則數(shù)據(jù),由詞的接續(xù)關(guān)系構(gòu)成;
E.語義數(shù)據(jù),由多意字的用例構(gòu)成;
F.代碼檢查器、字詞檢索器、語法語義分析器、操作員選擇器、掩碼遞歸處理器;
(四).在使用狀態(tài)A.代碼檢查器查找代碼表,檢查由編碼結(jié)束字符標(biāo)明的編碼串中各編碼的合法性,遇到非法代碼,報(bào)警后結(jié)束代碼轉(zhuǎn)換器的工作;
B.字詞檢索器依四字詞庫(kù)、三字詞庫(kù)、二字詞庫(kù)、字庫(kù)的優(yōu)先級(jí)次序查詢?cè)~庫(kù)或字庫(kù),找到唯一的字或詞,則返回該字或詞的內(nèi)碼;
C.字詞檢索器沒有從詞庫(kù)和字庫(kù)中找到詞和字時(shí),掩碼遞歸處理器掩去編碼串中最后一個(gè)漢字的編碼,用剩余的部分作為新的編碼串遞歸調(diào)用代碼轉(zhuǎn)換器(不包括代碼檢查器),直至找到詞或字;
而后檢查是否有被掩去的編碼,如果有則以被掩去的全部編碼作為新的編碼串遞歸調(diào)用代碼轉(zhuǎn)換器(不包括代碼檢查器),直至所有的編碼均被轉(zhuǎn)換;
D.字詞檢索器找到重碼時(shí),語法語義分析器依語法規(guī)則數(shù)據(jù)分析處理重碼詞或字;如果還有重碼,依語義數(shù)據(jù)分析處理重碼;找到唯一的詞或字,則返回該詞或字的內(nèi)碼;
E.語法語義分析器處理后仍有重碼時(shí),操作員選擇器將各重碼詞或字提交操作員選擇,操作員選定則返回該詞或字的內(nèi)碼,否則中止代碼轉(zhuǎn)換器的工作。如果是第一個(gè)重碼詞或字,操作員無需選擇,繼續(xù)進(jìn)行后面的輸入,而由操作員選擇器自動(dòng)進(jìn)行選擇。
為了提高中文的輸入速度,減少代碼轉(zhuǎn)換器的時(shí)間消耗,本發(fā)明的代碼轉(zhuǎn)換器還可以包括詞庫(kù)和字庫(kù)重排器,代碼轉(zhuǎn)換器每完成一個(gè)詞或字的代碼轉(zhuǎn)換時(shí),詞庫(kù)和字庫(kù)重排器將該詞或字移到詞庫(kù)或字庫(kù)中同碼詞或字的首位。
此外,在該實(shí)施例中,(一).詞的詞性包括普通名詞,人物名詞,時(shí)間名詞,地點(diǎn)名詞,人稱代詞,指示代詞,數(shù)詞,量詞,動(dòng)詞,形容詞,副詞,介詞,嘆詞,其它;
(二).語法規(guī)則數(shù)據(jù)的詞的接續(xù)關(guān)系包括A.普通名詞后續(xù)動(dòng)詞、形容詞、普通名詞、或副詞;
B.人物名詞和人稱代詞后續(xù)動(dòng)詞、形容詞、副詞;
C.指示代詞后續(xù)動(dòng)詞、形容詞、副詞、量詞;
D.數(shù)詞后續(xù)量詞、數(shù)詞、時(shí)間名詞;
E.動(dòng)詞后續(xù)普通名詞、人物名詞、地點(diǎn)名詞、人稱代詞;
F.形容詞后續(xù)普通名詞、人物名詞;
G.副詞后續(xù)動(dòng)詞、形容詞、副詞;
H.介詞后續(xù)各類名詞、各類代詞;
I.嘆詞不在兩個(gè)漢字的中間;
在本實(shí)施例中,語義數(shù)據(jù)采用了高頻多意字的用例。多意字的詞性很復(fù)雜,只用上述語法規(guī)則難以適當(dāng)?shù)剡x取,同時(shí)高頻多意字又具有影響效果大的特點(diǎn),因而需采取專門的方法。有了高頻多意字的用例,就可以根據(jù)它來指定這些字除了由它們的詞性所限定的常規(guī)接續(xù)關(guān)系外,還可以同哪些詞性的字詞接續(xù),從而實(shí)現(xiàn)正確的選取。在本實(shí)施例中,給出了下列高頻多意字的用例愛、把、便、被、邊、成、出、大、得、的、對(duì)、到、多、發(fā)、該、給、個(gè)、敢、過、后、會(huì)、好、進(jìn)、將、開、肯、了、來、里、老、能、起、請(qǐng)、前、去、讓、人、上、所、下、想、完、小、一、愿、要、于、欲、著。
高頻多意字的用例數(shù)據(jù)由這些字的非常規(guī)接續(xù)關(guān)系構(gòu)成。上述多意字的用例如下愛+動(dòng)詞、數(shù)詞+把、便+動(dòng)詞、被+動(dòng)詞、動(dòng)詞+邊、動(dòng)詞+成、動(dòng)詞+出、大+形容詞、大+動(dòng)詞、得+動(dòng)詞、動(dòng)詞+得、得+形容詞、代詞+的、動(dòng)詞+的、的+名詞、名詞+的、形容詞+的、數(shù)詞+對(duì)、動(dòng)詞+到、數(shù)詞+多、多+形容詞、多+量詞、多+動(dòng)詞、數(shù)詞+發(fā)、發(fā)+形容詞、該+動(dòng)詞、給+動(dòng)詞、動(dòng)詞+給、動(dòng)詞+個(gè)、敢+動(dòng)詞、動(dòng)詞+過、動(dòng)詞+后、會(huì)+動(dòng)詞、好+動(dòng)詞、動(dòng)詞+好、動(dòng)詞+進(jìn)、將+動(dòng)詞、動(dòng)詞+開、肯+動(dòng)詞、動(dòng)詞+了、形容詞+了、來+動(dòng)詞、數(shù)詞+來、來+量詞、名詞+里、老+動(dòng)詞、能+動(dòng)詞、數(shù)詞+起、動(dòng)詞+起、請(qǐng)+動(dòng)詞、動(dòng)詞+前、動(dòng)詞+去、去+動(dòng)詞、讓+動(dòng)詞、數(shù)詞+人、動(dòng)詞+上、名詞+上、所+動(dòng)詞、數(shù)詞+所、數(shù)詞+下、動(dòng)詞+下、名詞+下、想+動(dòng)詞、動(dòng)詞+完、小+動(dòng)詞、一+名詞、一+動(dòng)詞、愿+動(dòng)詞、要+動(dòng)詞、形容詞+于、動(dòng)詞+于、欲+動(dòng)詞、動(dòng)詞+著、數(shù)詞+著。
權(quán)利要求
1.面向詞的中文文字處理輸入裝置,包括輸入鍵盤和代碼轉(zhuǎn)換器,其特征在于(一).輸入鍵盤上制有與漢語拼音聲母字母和韻母字母對(duì)應(yīng)的字母鍵及編碼結(jié)束字符鍵;(二).漢字的漢語拼音編碼由漢語拼音的首字母和漢語拼音的末字母構(gòu)成,漢語拼音‘a(chǎn)’、‘e’、‘o’的漢語拼音編碼為‘a(chǎn)a’、‘ee’、‘oo’;A.漢語拼音的首字母包括a,b,c,d,e,f,g,h,j,k,l,m,n,o,p,q,r,s,t,w,x,y,z,共23個(gè);B.漢語拼音的末字母包括a,e,g,i,n,o,r,u,共8個(gè);(三).代碼轉(zhuǎn)換器包括A.代碼表,由漢語拼音的首字母和漢語拼音的末字母構(gòu)成;B.字庫(kù),由字庫(kù)索引和字庫(kù)體構(gòu)成,字庫(kù)體由漢字的內(nèi)碼構(gòu)成,字庫(kù)索引由漢語拼音編碼和該漢語拼音編碼對(duì)應(yīng)的漢字在字庫(kù)體中的起始地址指針構(gòu)成;C.由詞庫(kù)索引和詞庫(kù)體構(gòu)成的四字詞庫(kù)、三字詞庫(kù)、二字詞庫(kù),詞庫(kù)體由構(gòu)成詞的各個(gè)漢字的內(nèi)碼及詞的詞性構(gòu)成,詞庫(kù)索引由詞的編碼和該編碼對(duì)應(yīng)的詞在詞庫(kù)中的起始地址指針構(gòu)成,詞的編碼由構(gòu)成詞的各個(gè)漢字的編碼構(gòu)成;D.語法規(guī)則數(shù)據(jù),由詞的接續(xù)關(guān)系構(gòu)成;E.語義數(shù)據(jù),由多意字的用例構(gòu)成;F.代碼檢查器、字詞檢索器、語法語義分析器、操作員選擇器、掩碼遞歸處理器;(四).在使用狀態(tài)A.代碼檢查器查找代碼表,檢查由編碼結(jié)束字符標(biāo)明的編碼串中各編碼的合法性,遇到非法代碼,報(bào)警后結(jié)束代碼轉(zhuǎn)換器的工作;B.字詞檢索器依四字詞庫(kù)、三字詞庫(kù)、二字詞庫(kù)、字庫(kù)的優(yōu)先級(jí)次序查詢?cè)~庫(kù)或字庫(kù),找到唯一的字或詞,則返回該字或詞的內(nèi)碼;C.字詞檢索器沒有從詞庫(kù)和字庫(kù)中找到詞和字時(shí),掩碼遞歸處理器掩去編碼串中最后一個(gè)漢字的編碼,用剩余的部分作為新的編碼串遞歸調(diào)用代碼轉(zhuǎn)換器(不包括代碼檢查器),直至找到詞或字;而后檢查是否有被掩去的編碼,如果有則以被掩去的全部編碼作為新的編碼串遞歸調(diào)用代碼轉(zhuǎn)換器(不包括代碼檢查器),直至所有的編碼均被轉(zhuǎn)換;D.字詞檢索器找到重碼時(shí),語法語義分析器依語法規(guī)則數(shù)據(jù)分析處理重碼詞或字;如果還有重碼,依語義數(shù)據(jù)分析處理重碼;找到唯一的詞或字,則返回該詞或字的內(nèi)碼;E.語法語義分析器處理后仍有重碼時(shí),操作員選擇器將各重碼詞或字提交操作員選擇,操作員選定則返回該詞或字的內(nèi)碼,否則中止代碼轉(zhuǎn)換器的工作。
2.如權(quán)利要求1所述的面向詞的中文文字處理輸入裝置,其特征在于(一).詞的詞性包括普通名詞,人物名詞,時(shí)間名詞,地點(diǎn)名詞,人稱代詞,指示代詞,數(shù)詞,量詞,動(dòng)詞,形容詞,副詞,介詞,嘆詞,其它;(二).語法規(guī)則數(shù)據(jù)的詞的接續(xù)關(guān)系包括A.普通名詞后續(xù)動(dòng)詞、形容詞、普通名詞、或副詞;B.人物名詞和人稱代詞后續(xù)動(dòng)詞、形容詞、副詞;C.指示代詞后續(xù)動(dòng)詞、形容詞、副詞、量詞;D.數(shù)詞后續(xù)量詞、數(shù)詞、時(shí)間名詞;E.動(dòng)詞后續(xù)普通名詞、人物名詞、地點(diǎn)名詞、人稱代詞;F.形容詞后續(xù)普通名詞、人物名詞;G.副詞后續(xù)動(dòng)詞、形容詞、副詞;H.介詞后續(xù)各類名詞、各類代詞;I.嘆詞不在兩個(gè)漢字的中間。
3.如權(quán)利要求1或2所述的面向詞的中文文字處理輸入裝置,其特征在于代碼轉(zhuǎn)換器還包括詞庫(kù)和字庫(kù)重排器,代碼轉(zhuǎn)換器每完成一個(gè)詞或字的代碼轉(zhuǎn)換時(shí),詞庫(kù)和字庫(kù)重排器將該詞或字移到詞庫(kù)或字庫(kù)中同碼詞或字的首位。
全文摘要
本發(fā)明是一種帶有語法和語義分析處理、面向詞(特別是四字詞、三字詞、二字詞)的中文文字處理輸入裝置。在代碼轉(zhuǎn)換器中設(shè)置代碼表、四字詞庫(kù)、三字詞庫(kù)、二字詞庫(kù)、字庫(kù)、語法規(guī)則數(shù)據(jù)、語義數(shù)據(jù)、代碼檢查器、字詞檢索器、語法語義分析器、操作員選擇器、掩碼遞歸處理器。漢語拼音編碼由漢語拼音的首字母和末字母構(gòu)成;語法規(guī)則數(shù)據(jù)由詞的接續(xù)關(guān)系構(gòu)成;語義數(shù)據(jù)由多意字用例構(gòu)成。本發(fā)明大大提高了中文輸入效率、簡(jiǎn)便易學(xué)。
文檔編號(hào)G06F3/023GK1101439SQ9410057
公開日1995年4月12日 申請(qǐng)日期1994年1月26日 優(yōu)先權(quán)日1994年1月26日
發(fā)明者郭軍, 藺志青 申請(qǐng)人:郭軍
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1