專利名稱:簡式漢語拼音文字——一種漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明系漢語拼音文字,現(xiàn)在作為漢字的輸入法投入實用;因此它是一種“漢字輸入法”,屬于電子計算機中文信息處理的技術(shù)領(lǐng)域。
現(xiàn)有的“漢字輸入法”很多,據(jù)有關(guān)資料表明目前,漢字編碼方案的總數(shù)已達上千種,已經(jīng)在計算機上實現(xiàn)實際使用的也有上百種。但是實際被用戶廣泛使用的漢字輸入方法非常有限,大約為十幾種,其中又以使用拼音進行漢字輸入的用戶為最多。
漢字編碼方案主要可以劃分為音碼、形碼、音形結(jié)合碼三大類。
音碼的編碼以漢字拼音為基礎(chǔ),對于熟悉拼音的用戶不需要專門學(xué)習(xí)或僅需很少的時間進行學(xué)習(xí)。但音碼的缺點也是顯而易見的,主要是漢字輸入時同碼過多,很多情況下需要翻頁,另外全拼編碼的冗余度很大,平均編碼長度高,從而大大限制了漢字輸入速度。音碼容易掌握的優(yōu)點也被實際工作的低效率所掩蓋。盡管人們設(shè)計了多種改進方案,始終未能達到令人滿意的程度。
形碼的編碼則是以漢字書寫形狀為基礎(chǔ),抓住漢字的字形特征進行編碼,由于漢字形狀特征與英文字母沒有直接的聯(lián)系,所以掌握一種形碼的難度相對于音碼要大得多。盡管近年來新研制的許多形碼在編碼上都盡量考慮到易學(xué)易記,但由于漢字字形結(jié)構(gòu)的復(fù)雜性,往往無法使用幾條簡短的規(guī)則嚴格地制定字形拆分標準,而其中最令人頭痛的恐怕就是漢字拆分的二義性問題。對專業(yè)打字員來說,形碼的輸入速度比較高,但由于“難學(xué)易忘”的特點,始終無法做到真正意義上的普及。
信息化時代要求一種“漢字輸入法”既能夠做到全民普及,同時又能夠達到高效率。沒有“效率”的普及將會失去普及的意義,不能“普及”的效率實際上也不會有真正的效率。事實已經(jīng)證明了這一點。因此,簡單易學(xué)和輸入速度之間的矛盾已成了問題的焦點。本發(fā)明力圖解決的正是這個問題。
本發(fā)明的作者認為現(xiàn)行編碼有一個共同的特征,它們都是作為方塊字的代碼而存在,其本身不具備可讀性和可逆性。例如,aps、apl,這是“五筆字型”對兩個方塊字所作的編碼,誰能直接看出它們代表哪兩個方塊字嗎?恐怕不能!所以,人們只能臨時根據(jù)方塊字分拆規(guī)則給出編碼,而不能直接去學(xué)習(xí)和記憶編碼,更無法直接去認識和閱讀編碼;同樣,現(xiàn)在的音碼也存在這個問題,例如niu、ma,這是漢語拼音方案中的兩個音節(jié),有誰能說出與之對應(yīng)的是哪兩個方塊字嗎?恐怕也不能!--這就是沒有可讀性和可逆性的具體體現(xiàn),這也正是“漢字編碼”的通病-難以學(xué)習(xí)、難以記憶,難以做到真正意義上的普及和大眾化--之所以產(chǎn)生的根本原因。
本發(fā)明的作者還認為要克服現(xiàn)行編碼所存在的弊病,唯一方法是設(shè)計一個具有文字性質(zhì)的系統(tǒng)的符號體系,把漢字輸入法、漢字注音法和漢語的拼音文字結(jié)合起來考慮,只有這樣才能真正解決問題。本發(fā)明就是根據(jù)這個指導(dǎo)思想而產(chǎn)生的。
所以,本發(fā)明,即“簡式漢語拼音文字”(以下簡稱“拼音文字”),其實質(zhì)與通常所說的“漢字編碼”是不同的,正如其名稱所表明的那樣,它是一個可以獨立記錄漢語(以普通話為標準音)的文字系統(tǒng),凡是方塊字能夠加以記錄的,這個文字系統(tǒng)都能夠完全的、無條件的加以記錄。因此,它與方塊字系統(tǒng)的詞匯體系具有對應(yīng)性,“拼音文字”系統(tǒng)的詞匯輸入鍵盤后,通過電腦程序的即時轉(zhuǎn)換,與之相應(yīng)的方塊字系統(tǒng)的詞匯就出現(xiàn)在屏幕上,正如“編碼”輸入后馬上顯示出方塊字一樣。因為它是一個可以獨立存在的漢語文字體系,所以它本身具有非常清晰、明確的可讀性和互逆性,這也是“拼音文字”與編碼的本質(zhì)區(qū)別之一。
現(xiàn)將本發(fā)明的主要內(nèi)容公開于下。
在普通話語音系統(tǒng)中,不計聲調(diào)變化,約有434個音節(jié)。這些音節(jié)在《漢語拼音方案》中又是由21個聲母和38個韻母拼合而成。作為注音方案,它已可謂簡單明了。然而作為“拼音文字”的音節(jié)拼式,它還是過于煩瑣冗長的。為此本發(fā)明制訂了簡式漢語拼音方案。它包括漢語基礎(chǔ)字母表、漢語元音表、漢語輔音表和漢語音節(jié)表?,F(xiàn)詳細描述如下漢語的基礎(chǔ)字母表與英文字母表一樣字母排列順序和字母名稱讀音都一樣。但是,為了使這個國際字母表能夠更好地適應(yīng)漢語的語音及其拼式需要,本發(fā)明還將選用êü
等5個字母進入拼式。這正如德文的 ü,捷克文的
和世界語的
ǔ等字母一樣。不過,本發(fā)明并不主張把新增的5個字母列入字母表。見下表
漢語元音表就內(nèi)容而言是直接反映我們漢語語音成分的,就形式而言是直接表現(xiàn)“拼音文字”拼寫樣式的。因此,它既不等同于任何其它一種語言的元音表,也不等同于任何其它一種漢語拼音方案的元音拼式。在《漢語拼音方案》中,它甚至也不是被叫成元音,而是被稱作韻母。韻母中又可分成韻頭、韻腹、韻尾。而在本發(fā)明的漢語元音表中,元音可分成單字母元音(單元音)和多字母元音(組合元音或稱多元音)。見下表單元音 (n、i、u)組合元音a[阿] an[昂]au[奧]ai[哀] ia[呀]ua[蛙]e[安兒]en[恩] ie[耶]ue[彎]ê[鵝] ei[欸]i[衣] in[因]iu[又] ui[威]o[喔] on[] ou[歐] uo[窩]u[烏] un[溫]ü[迂]本發(fā)明認為元音i、u、ü同時兼具輔音性質(zhì),即可以作聲母。因此,當其作為輔音使用時分別寫成y、w、v。
另外值得指出的是,本發(fā)明中的所有字母都是音素字母,在拼式中都有其固定的而且是唯一的讀音。不過字母n是個例外,它在組合元音中根據(jù)國際慣例發(fā)成鼻音[η]。
漢語輔音表與《漢語拼音方案》中的聲母表差不多。所不同的是,在本發(fā)明中將z、c、s和zh、ch、sh合寫成了單一的z、c、s(注本發(fā)明并無意取消zh、ch、sh與z、c、s之間在語音上的區(qū)別,但是也無意強調(diào)它們之間在語音上的區(qū)別)。其主要目的是為了方便語音教學(xué),同時也使音節(jié)拼式更趨簡潔易學(xué)并使查字典更加容易。此外,本表增添了
三個字母,依次相當于jü、qü、xü。采用這種寫法可使拼式簡短明了,而且也有國際先例。在詞典編序時,它們可分別附于g、c、s之后。見下表b[玻]p[坡]m[摸]f[佛]d[得]t[特]n[訥]l[勒]g[哥]k[科]h[喝]j[基]q[欺]x[希]z[知;資]c[嗤;雌]s[詩;思]r[日]y[醫(yī)]w[巫]v[雨]
(注元音表、輔音表中方括號內(nèi)的漢字僅作臨時注音用。)下面介紹漢語音節(jié)表,它提供了300多個音節(jié)拼式。其中,最長的音節(jié)拼式為4字母,最短的為1字母。這個音節(jié)表基本上準確地反映了漢語音節(jié)在“拼音文字”字符上的表現(xiàn)形式,同時也基本上反映了漢語語音的全貌。值得指出的是,該表主要是屬于字符學(xué)方面的。本發(fā)明認為,字符學(xué)上的拼寫音節(jié)與語音學(xué)上的理論音節(jié)總是有些出入。換言之,語音學(xué)上的幾個相近音節(jié)在字符學(xué)中有可能表現(xiàn)為同一個拼式,而語音學(xué)中的一個音節(jié)在字符學(xué)中也有可能表現(xiàn)為不同的幾個拼式。其原因在于前者主要是為了節(jié)約拼式。因為拼式過多勢必造成字母不夠用的現(xiàn)象,而且要是語音上的細微差別都在拼式上一一反映出來,也會增加學(xué)習(xí)難度,從而給學(xué)習(xí)者帶來不必要的困難。后者主要是作為區(qū)分同音詞的手段。這現(xiàn)象在各種語文中都不同程度地存在著,在英語中也不例外。而在本發(fā)明中主要存在的是前一現(xiàn)象。如輔音表中的z、c、s和zh、ch、sh的合寫即屬這一現(xiàn)象。
因此,原《漢語拼音方案》中有400多“音節(jié)”,而本發(fā)明中只有300多“音節(jié)”也就不足為奇了。事實上,在實際運用中音節(jié)拼式比上述數(shù)目要稍多一些。原因是方言特有的音節(jié)進入語文;非漢語者特有的音節(jié)隨著外來詞進入語文。
方塊漢字字符是一種奇妙的混合體。它既是構(gòu)形學(xué)的基本單位,又是構(gòu)詞學(xué)中的基本單位,同時也是語音學(xué)中的基本單位之一。我們且了解一下漢字字符集合的總體情況。
據(jù)專家分析,漢字字符合計有6萬個左右。其中絕大部分系古體字符、異體字符,有效字符則在1萬上下。在這1萬左右字符中,很大一部分是專用字符,包括譯音專用字符,人、地名專用字符,等等。此外,還有一部分是構(gòu)詞能力很小或者在語文環(huán)境中非常罕用的字符。我們且稱上述字符為“第二級字符”,其余的則稱為“第一級字符”。
本發(fā)明認為,第一級字符是整個方塊漢字體系的基干,也是研究的主要對象。分類工作就是針對第一級字符進行的。
分類的基礎(chǔ)是方塊字的“義”(包括語法意義)。對漢字進行分類有多種方法可根據(jù)方塊字的讀音分,可根據(jù)方塊字的字形分,也可根據(jù)方塊字的含義分。在本發(fā)明中基本上是根據(jù)方塊字的含義分的,并以漢語單音節(jié)詞的義項作為分類的基本單位。這樣,一方面避免了方塊字字形的糾纏,一方面又沒有脫離方塊字符這種固定單位。因為,漢語的單音節(jié)詞必定是一個方塊字,而一個方塊字并非就是一個單音節(jié)詞,這就使分類對象的數(shù)目局限在一定范圍內(nèi)。同時,用義項作為分類的基本單位可擺脫因字符的多義性帶來的麻煩。這種既能利用方塊字符又不會受制于方塊字符的分類法,是唯一可行的方法。過去,曾有人試圖以“詞”為基本單位進行分類,但沒能成功。因為“詞”已然突破了“方塊字”的界限,從而使得分類對象多無盡數(shù)。另外,這做法也已遠離了為漢字分類這個問題。
本發(fā)明以字典中的義項為單位,把第一級字符分成300多組同義或近義字,然后按邏輯歸納為30多類,并逐一制定邏輯義符。見下表
上表是邏輯分類的成果。它不是主觀預(yù)定的產(chǎn)物,而是由成千方塊字符所擁有的上萬義項中分析歸納出來的。邏輯分類的直接目的是便于系統(tǒng)地區(qū)分同音字,所以在歸類的同時也適當考慮到了語音這個因素(分類的具體程序參見附件二)。
詞性在漢語中是客觀存在的,諸如名詞、代詞、動詞和介詞等等,但它沒有從方塊字符中得到體現(xiàn)。因此,方塊字符在記錄漢語時有不夠靈活、準確之處。例如衣、食、雨,等等,通常都是作名詞使用,但是在特定的場合,尤其是在文言文中,它們還可作動詞使用。另外,在現(xiàn)代漢語中,這種現(xiàn)象也是普遍存在的,比如“經(jīng)濟”,它既是名詞又是形容詞,這種例子不勝枚舉。如果這種實際上普遍存在的詞性變化現(xiàn)象能夠從詞形中反映出來,則對語文的理解和對語文精密度以及用詞的靈活性的提高都會有重大意義。
鑒于上述理由,本發(fā)明為“拼音文字”體系制定了詞性符號,稱之為“語法性詞尾”。如表詞性名詞動詞形容詞副詞符號-o -i -a(-u)-e語法性詞尾有別于慣常所說的詞頭詞尾。按照某些字典的稱呼,常把名詞后面的“-頭”、“-子”等說成詞尾,同時也把名詞前面的“老-”、“阿-”等叫成詞頭。本發(fā)明將繼承這種稱呼。在實際運用中,語法性詞尾總是粘著于詞體,成為整個字符的組成部分,但是不發(fā)音;與此相反,詞頭詞尾則必須發(fā)音,而且-般都是作為構(gòu)詞成分出現(xiàn)。本發(fā)明根據(jù)實際需要,將(-子、-兒)等詞尾分別定型為’z和’e,其余類推。
本發(fā)明認為,漢語“拼音文字”是一個獨立完整的體系。無論是在語音方面還是在語法方面,它都有自己的系統(tǒng)的表現(xiàn)形式。它一方面要盡可能地忠實于原有語文的精神實質(zhì),另一方面又不能拘泥于原有語文的外表形式。當然,人們還可以為漢語建立別種樣式的文字體系,在語音、語法方面同樣也可以擁有其系統(tǒng)的表現(xiàn)形式。但是,要拿任何的另一種體系的具體表現(xiàn)形式來拘束或穿鑿本發(fā)明建立的這個體系,那是肯定不對的。盡管本發(fā)明運用了大量的現(xiàn)成的材料,但這個體系卻是根據(jù)一整套特有的理論創(chuàng)立起來的。這理論,當然也包括語法性詞尾在內(nèi)。
本發(fā)明實際上不是為方塊字而作,是為漢語而作,也就是說它不是建立在方塊字的基礎(chǔ)上,而是建立在漢語基礎(chǔ)上。以下是它的“創(chuàng)制大綱”
1.以普通話為標準語音,根據(jù)具體情況進行極個別的、有限度的調(diào)整,并以二十六個拉丁字母為基礎(chǔ)制定拼音方案。(詳見《簡式漢語拼音方案》)2.介詞、連詞、代詞及部分單音節(jié)副詞的形體,單由簡式拼音構(gòu)成;嘆詞和助詞由簡式拼音+y構(gòu)成;象聲詞由簡式拼音+j構(gòu)成。(簡式拼音,就是指《簡式漢語拼音方案》所制定的音節(jié)拼式)3.上述以外的單音節(jié)詞的形體依次由“簡式拼音”、“邏輯義符”、“語法詞尾”,共三個部分構(gòu)成。前兩部分作為字符的主體,密不可分,具有高度的穩(wěn)定性。
4.多音節(jié)詞的形體,依次由“簡式拼音”、“語法詞尾”,共兩個部分構(gòu)成。
5.成語及諺語等短語和詞組不在本方案的造形之列。
6.外來詞,包括非漢語人地名,其詞形在原則上一律還原。
以上六條,即為“拼音文字創(chuàng)制大綱”,它構(gòu)成了整個“拼音文字”體系的總體框架。下面,將結(jié)合本大綱具體說明“拼音文字”的詞匯定型方法。
首先要指出的是在本發(fā)明中,狹義的“字”的概念是不存在的,所存在的只有“詞”。而“詞”可以分為單音節(jié)詞和多音節(jié)詞。定型是針對于“詞”而言。
本發(fā)明認為,每個單音節(jié)詞必然有個方塊字與之相對應(yīng),但不是每個方塊字都稱得上是單音節(jié)詞。例如蚯、蟋、蚓、蟀,等等,這些方塊字就不是也不能稱其為單音節(jié)詞。本方案對這些方塊字是不加單獨定型的。
根據(jù)“創(chuàng)制大綱”第2條,以下方塊字(單音節(jié)詞)定型如下ni(你)、nin(您)、wo(我)、ta(他)、ze(咱)、zei(這)、na(那)、naa(哪)、sei(誰)以上為代詞。
ay(啊)、yoy(喲)、kaj(喀)、may(嗎)、bay(吧)、ney(呢)、luoy(羅)以上為助詞和象聲詞。
zai(在)、vi(于)、wi(為)、xan(向),bi(比)、qi(其)、gen(更)、hen(很)、gan(剛)……等等。
以上為介詞和副詞。
根據(jù)“創(chuàng)制大綱”第3條,以下方塊字(單音節(jié)詞)定型如下公式單音節(jié)詞=簡式拼音+邏輯義符+語法詞尾舉例baiosa(白) =bai + os +agudo(鴿)=g + ud +0zouovi(走) =zou + ov +iyom(億) =y + om(數(shù)詞無語法性詞尾)maudo(馬) =ma + ud +omauzo(麻) =ma + uz +omaulo(媽) =ma + ul +o這是單音節(jié)詞的定型公式。除了單純用簡式拼音已經(jīng)定型者外,所有漢語單音節(jié)詞,都用這種方式構(gòu)形。
人們也許覺得這種構(gòu)形方式太累贅,但事實將會證明隨便是作為漢字輸入法還是作為文字,它都是十分有效的,甚至也是非常美觀的。而且,以這種方式定型的詞,充其量也不會超過四千條,在漢語詞匯庫中所占比例遠遠不到百分之十;再說,它們的使用頻率比人們想象的要低得多,例如麻煩、麻痹、麻木、麻利、麻臉、麻子、麻雀、麻將等等,將依次寫成mafea,mabia,mamua,malia,malieo, nazo,mac’eo,majano,真正寫mauzo的機會是很少的,其它詞的情況也是如此。
根據(jù)“創(chuàng)制大綱”第4條和第2條,以下方塊字(多音節(jié)詞)定型如下公式 簡式拼音+語法詞尾=多音節(jié)詞舉例 suidau +o =suidauo水稻(名詞)qencu +i =qencui 清除(動詞)qencu +a =qencua 清楚(形容詞)qencu +u =qencuu 清清楚楚(形容詞,重疊)fanfu +e =f8nfue 仿佛(副詞)kaca +j =kacaj 喀嚓(象聲詞)
uhu +y=uhuy嗚呼(嘆詞)ql ai+y=qlaiy 起來(助詞)這是多音節(jié)詞的定型公式。任何一個由兩個或兩個以上的音節(jié)構(gòu)成的詞,都可以用這種方式進行定型。在整個漢語詞匯庫中,它所占的比例是極大的,而這種定型法又是最經(jīng)濟、簡潔的。例如jenlii(經(jīng)歷),jenlio(經(jīng)理);qilino(麒麟),qilini(欺凌);gauxena(高興),xenfena(興奮),kuaihuoa(快活);xezaie(現(xiàn)在),janlaie(將來)……等等??傊?,最末一個字母始終是語法詞尾;它不發(fā)音,但有辨義作用。
非漢語人、地名以及進入漢語使用的非漢語詞匯,統(tǒng)稱為外來詞。根據(jù)“創(chuàng)制大綱”第6條,所有使用拉丁字母的外來詞一般地都將采用其原形,非拉丁字母者則以國際通用的拉丁字母轉(zhuǎn)寫式為準。貫徹“名從主人,按形照轉(zhuǎn)”的國際原則,例如羅馬、華沙、倫敦、莫斯科將定型拼寫為Roma、Warszawa、London、Moskva,其讀音則嚴格按照《簡式漢語拼音方案》拼讀。這樣,既不破壞改變原詞形,以便于國際接軌,又能確保漢語文讀寫統(tǒng)一的原則怎么讀就怎么寫,怎么寫就怎么讀。如Stalin(斯大林)、Lenin(列寧)、Marx(馬克思)、Engels(恩格斯),等等。
參照國際上的一般慣例,姓氏、地名、民族名稱、國家名稱,及自然地理要素,如海洋、河流、湖泊、山脈、島嶼、海角、沙漠等,還有節(jié)氣名稱、干支紀年、年號等等,等等,都屬于專有名詞。專有名詞的定型與普通詞匯定型一樣,所不同的是,凡專有名詞的第一個字母一律用大寫字母。舉例如下Aihuio 璦琿〔縣名,在黑龍江。〕Beijeno北京Canceno長城Donzuo 侗族〔民族名稱〕Ehuio 安徽〔中國省名〕Fujeo 福建〔中國省名〕Guizouo貴州〔中國省名〕Hilonjano 黑龍江〔中國省名〕Jilino 吉林〔中國省名〕
Kanxio康熙〔清圣祖年號〕Qiniko秦Qencauo 清朝Heiko 韓根據(jù)上述方法,本發(fā)明可以對古今漢語的全部詞匯加以定型?!稄埵洗笤~庫》就是這樣建立起來的,它目前擁有近八萬詞匯,幾乎囊括了《現(xiàn)代漢語詞典》中的全部詞條;另外,它還收錄了世界上幾乎所有的國家和大部分國家的首都名稱,也收錄了我國縣級以上的全部行政區(qū)名稱兩千余條。
“創(chuàng)制大綱”第5條指出成語、諺語及歇后語等短語和詞組不在本方案的造形之列。而本發(fā)明考慮到漢字輸入的需要,特為它們開通了“簡縮系統(tǒng)”,成語收錄了八千余條,諺語、歇后語等各收錄了兩千余條。舉例如下abss愛不釋手〔漢語成語〕blbl不倫不類〔漢語成語〕cnly長年累月〔漢語成語〕dqsj大千世界〔漢語成語〕e'vfy 阿諛逢迎〔漢語成語〕yymeh 又要馬兒好,又要馬兒不吃草〔諺語〕rqzd人窮志短,馬瘦毛長〔諺語〕rwyr人外有人,山外有山〔諺語〕ssbt十事半通,不如一事精通〔諺語〕snhcw 十年寒窗無人問,一舉成名天下知〔諺語〕yglbs 一個籬笆三個樁,一個好漢三個幫〔諺語〕lbshz 劉備摔孩子--收買人心〔歇后語〕htgfz 虎頭掛佛珠--假慈悲〔歇后語〕“創(chuàng)制大綱”第6條指出外來詞,包括非漢語人、地名,其詞形在原則上一律還原。這是國際社會的要求,是大勢所趨。例如,英國的首都是London,本方案規(guī)定的實際讀音是“隆冬”。但目前的習(xí)慣寫法是倫敦,人們也會習(xí)慣于寫成Lunduno。因此,本發(fā)明將London定為正式寫法,而把Lunduno作為“容錯碼”存在。當你需要寫出“倫敦”時。既可以輸入London,也允許輸入Lunduno。
本發(fā)明是建立在拼音原理的基礎(chǔ)上,作為漢字的輸入法,有人擔心個別方塊字由于發(fā)音不準或者不認識,從而無法輸入。為了解除這個后顧之憂,本發(fā)明在不違背“創(chuàng)制大綱”原則的前提下,開通了“小字典”系統(tǒng)。舉例如下derenpano〔小字典·單人旁〕suanrenpano 〔小字典·雙人旁〕baugaieo 〔小字典·寶蓋兒〕sediesuio〔小字典·三點水〕jauspano 〔小字典·絞絲旁〕cautoueo 〔小字典·草頭兒〕這樣,當你輸入derenpano的時候,凡是單人旁的方塊字就會出現(xiàn)在顯示框里,你需要哪個就可以挑選哪個。就好象翻查字典一樣,以備不時之需。當然,在實際輸入漢字的過程中,需要翻查“小字典”的現(xiàn)象是極個別的。而且,這種現(xiàn)象將會隨著“拼音文字”的推行和普及而漸漸消失。
本發(fā)明已經(jīng)制作成軟件,并在計算機上進行實際使用。現(xiàn)在簡單介紹如下名稱=拼音文字功能鍵號=2碼元表=AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPpQqRrSsTtUuVvWwXxYyZz’萬能鍵=;最大碼長=12是否自動選擇輸入=N是否執(zhí)行模糊搜索=Y是否使用自定義詞組=N自定義詞組編碼方案=O說明碼元表包括26個大寫拉丁字母和26個小寫拉丁字母,另加一個(’),共計53個碼元。輸入時,字母
、
、
、ê、ü分別采用g’、c’、s’、e’、u’的形式。輸入時,由于執(zhí)行模糊搜索,很多詞匯無需鍵入全碼即能出現(xiàn)。
本輸入法,基本上不存在翻頁。它還有一個特點,許多詞條后面附有注釋,例如輸入labahuao 時,顯示框?qū)@示出 1喇叭花2〔牽牛的通稱〕輸入epeo 時,顯示框?qū)@示出 1暗盤2〔舊時商業(yè)用語〕輸入Zanzouo 時,顯示框?qū)@示出 1漳州2〔福建〕輸入Gonsuno 時,顯示框?qū)@示出 1公孫2〔姓氏〕輸入Canada 時,顯示框?qū)@示出 1加拿大2〔北美洲國家〕輸入leishman 時,顯示框?qū)@示出 1利什曼2〔原生動物,外采詞〕輸入Kanxio 時,顯示框?qū)@示出 1康熙2〔清圣祖年號〕輸入Lisbon 時,顯示框?qū)@示出 1里斯本2〔葡萄牙的首都〕因此,“張氏大詞庫”既是輸入法的碼本又是“拼音文字”的詞典,兩者有機地統(tǒng)一起來。它的實際意義遠遠超出了輸入法本身。(關(guān)于“張氏大詞庫”,請參見附件三)
權(quán)利要求
1.簡式漢語拼音文字-一種漢字輸入法,是一個以普通話為標準音,以二十六個拉丁字母為基礎(chǔ)而制定的漢字輸入法,其特征在于該輸入法是由“簡式拼音”、“邏輯義符”、“語法詞尾”共三部分組成,外來詞,其詞形在原則上一律還原,成語及諺語等短語另行處理。
2.根據(jù)權(quán)利要求1所述的簡式漢語拼音文字-一種漢字輸入法,其特征在于“簡式拼音”是由“漢語基礎(chǔ)字母表”、“漢語元音表”、“漢語輔音標”、“漢語音節(jié)表”四表所組成。
3.根據(jù)權(quán)利要求2所述的簡式漢語拼音文字-一種漢字輸入法,其特征在于與《漢語拼音方案》相比較①在“漢語元音表”中元音可分成單字母元音<單元音>和多字母元音<組合元音>,元音i、u、ü同時兼具輔音性質(zhì),即可以作聲母,當其作為輔音使用時分別寫成y、w、v;②在“漢語輔音表”中將z、c、s和zh、ch、sh合寫成單一的z、c、s,增添了
三個字母,依次相當于jü、qü、xü;③在“漢語音節(jié)表”中,提供了300多個音節(jié)拼式,其中,最長的音節(jié)拼式為4字母,最短的為1字母。
4.根據(jù)權(quán)利要求1所述的簡式漢語拼音文字-一種漢字輸入法,其特征在于“邏輯義符”分類的基礎(chǔ)是以字典的義項為單位,把整個方塊漢字體系的基干分成300多組同義或近義字,然后按邏輯歸納為30多類,并逐一制定邏輯義符。
5.根據(jù)權(quán)利要求1所述的簡式漢語拼音文字-一種漢字輸入法,其特征在于“語法詞尾”中的各詞尾在運用中粘著詞體,成為整個字符的組成部分,但是不發(fā)音。
6.根據(jù)權(quán)利要求書1、2、5所述的簡式漢語拼音文字-一種漢字輸入法,其特征在于介詞、連詞、代詞及部分單音節(jié)副詞的形體,單由簡式拼音構(gòu)成;嘆詞和助詞由簡式拼音加語法性詞尾-y構(gòu)成;象聲詞由簡式拼音加語法性詞尾-j構(gòu)成。
7.根據(jù)權(quán)利要求1、2、4、5所述的簡式漢語拼音文字-一種漢字輸入法,其特征在于,具有權(quán)利要求6所述的特征以外的單音節(jié)詞的形體依次由“簡式拼音”、“邏輯義符”、“語法詞尾”共三部分構(gòu)成,前兩部分作為字符的主體,多音節(jié)詞的形體,依次由“簡式拼音”、“語法詞尾”共兩個部分構(gòu)成。
8.根據(jù)權(quán)利要求1所述的簡式漢語拼音文字-一種漢字輸入法,其特征在于非漢語人、地名以及進入漢語使用的非漢語詞匯,統(tǒng)稱為外來詞,所有外來詞一般都將恢復(fù)原形,例羅馬、華沙、莫斯科將定型拼寫為Roma、Warsaw、Moscow,其讀音則嚴格按照《簡式漢語拼音方案》拼讀。
全文摘要
本發(fā)明是以普通話為標準音,以二十六個拉丁字母為基礎(chǔ)而制定的漢字輸入法,其特征在于該“輸入法”是由“簡式拼音”、“邏輯義符”、“語法詞尾”三部分組成。本輸入法中西文兼容,Ascll通用鍵盤,基本上不存在重碼問題,無須拆碼,但因其具有非常清晰、明確的可讀性和互逆性,在實際學(xué)習(xí)中,好學(xué)、易懂、易用,可廣泛用于各類中文信息處理系統(tǒng)中。
文檔編號G06F3/023GK1233007SQ99101558
公開日1999年10月27日 申請日期1999年1月20日 優(yōu)先權(quán)日1999年1月20日
發(fā)明者張森榮 申請人:張森榮