專利名稱:帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字輸入計(jì)算機(jī)的輸入法。特別是涉及一種漢字輸入計(jì)算機(jī)的帶 聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法。
背景技術(shù):
1946年人類第一臺電腦誕生于美國賓夕法尼亞大學(xué)的莫爾電機(jī)學(xué)院內(nèi)。英文不需 要編碼,是直接輸入計(jì)算機(jī)的文字,當(dāng)仁不讓進(jìn)駐計(jì)算機(jī)。漢字總數(shù)龐大,《中華字?!肥兆?jǐn)?shù)多達(dá)八萬五千字。構(gòu)成漢字的筆劃、讀音、空間 主要三個要素中,讀音和空間是固定的,能夠自由發(fā)展的只有筆劃一個要素。八萬五千個漢 字使得筆劃越來越多,最多的多達(dá)52個筆劃。漢字缺乏和語音的直接聯(lián)系,字形復(fù)雜,同音 字、異體字也很多。學(xué)習(xí)漢字只能靠死記硬背,難學(xué)難認(rèn)。漢字輸入計(jì)算機(jī)的編碼也很復(fù)雜, 需要輸入碼、交換碼、內(nèi)部碼和字形碼。美國兒童4歲就能閱讀,中國兒童平均8歲才能閱 讀。以致造成整個民族智力發(fā)展的滯后,影響了國家的競爭力。1951年,毛澤東指示“文字要在一定的條件下加以改革,要走世界文字共同的拼 音化方向”。漢字拼音化運(yùn)動,一度風(fēng)起云涌,成燎原之勢。1958年國家頒布的《漢語拼音 方案》,過于簡單化,拼式冗長,描述漢字不精確。方塊漢字輸入計(jì)算機(jī)編碼方案可分為1、拼音碼;2、拼形碼;3、音形碼;4、流水碼 (國標(biāo)碼、區(qū)位碼)。隨著計(jì)算機(jī)運(yùn)算能力的飛躍,從音到字的翻譯工作大部分交給了計(jì)算 機(jī)程序來完成,音落文出。例如日本的“拼音變換法”,只要輸入發(fā)音,電腦就可以運(yùn)算出日 文中的漢字,運(yùn)指如飛,打出了一度失去了的方塊漢字自信心。60年代,美國王安輸入法6鍵一字,70年代,臺灣倉頡輸入法5鍵一字,80年代王 碼五筆輸入法4鍵一字,每減少一鍵,意味著漢字輸入速度有了提高,也意味著漢字輸入已 有了實(shí)用性。90年代出現(xiàn)ccdos簡化拼音方案和WPS和四通雙拼方案。1988年周志農(nóng)先 生將雙拼壓縮到26個字母鍵,保證每一個字都是兩個音。漢語是聲、韻、調(diào)三維結(jié)構(gòu),漢語的四聲也是世界獨(dú)一無二的。漢語拼音方案如果 不進(jìn)行標(biāo)調(diào),就不能成為漢語電腦文字。如“我買東西”和“我賣東西”,若不帶聲調(diào),電腦 性能再高,也很難判定是“買”還是“賣”。現(xiàn)有漢語拼音輸入法的標(biāo)調(diào)方法有符號標(biāo)調(diào)、異 拼標(biāo)調(diào)、字母標(biāo)調(diào)、混合標(biāo)調(diào)、數(shù)字標(biāo)調(diào)、大小寫標(biāo)調(diào)等。漢語同音字多,日本的“拼音變換法”在中國遇到難題。有人稱“當(dāng)你想出來閃光 前,請先關(guān)起門看看這個問題231個yi4字怎么打……”。漢字輸入計(jì)算機(jī)的內(nèi)碼有中國大陸的GB碼(6763個漢字)、GBK碼Q1003個漢 字)、GB 18030-2000 (27533 個漢字)、GB 18030-2005 (70244 個漢字)。港、澳、臺地區(qū)的 Big-5碼,外國公司如微軟等的Unicode碼。2011年4月6日,在國家知識產(chǎn)權(quán)局官方網(wǎng)站以“輸入法”為檢索詞,有發(fā)明專利 公告1941件。盡管萬“碼”奔騰,但形碼還是難學(xué)難拆,音碼還是重碼高、打不快。機(jī)器語 言是0和1,沒有語種分別。英語能直接輸入,傳統(tǒng)漢字輸入法卻需多次轉(zhuǎn)換。如果我們能設(shè)計(jì)出輸入碼與內(nèi)碼一致的編碼,直接輸入計(jì)算機(jī)中作為內(nèi)碼并代表漢語,漢語編碼文字 將趕上并超過西方國家。但是,以漢語電腦文字身份出現(xiàn)的編碼,至今仍然沒有成熟。用更 先進(jìn)的輸入法取代相對落后的傳統(tǒng)輸入法,是民族進(jìn)步的必然要求。著名科學(xué)家錢偉長教授指出“好的編碼方案還沒有出來,好的編碼方案應(yīng)該是一 種文字,或者是準(zhǔn)文字”。漢字輸入法是一種文化工具,工具不需要多。由于輸入法太多,讓 人無所適從。國家為什么不統(tǒng)一漢字輸入法呢?實(shí)在也為難,目前面市的各種筆和碼,總是 有較大的缺憾,總是不完美,如其匆促選定,那也坑害百姓,還是慢慢等待吧!
發(fā)明內(nèi)容
本發(fā)明的目的為依據(jù)著名科學(xué)家錢偉長教授“好的編碼方案應(yīng)該是一種文字”的設(shè)想,創(chuàng)制出一種 用兩個拼音字母表征一個帶聲、韻、調(diào)讀音的漢字音節(jié),輸入碼與內(nèi)碼一致并代表漢語的編 碼。計(jì)算機(jī)將一個個帶聲、韻、調(diào)讀音的漢字音節(jié)構(gòu)成的語音翻譯成具體漢字,兩鍵一字。一 個聲韻調(diào)音節(jié)加ι個序號字母的輸入碼有9萬以上字位,能對應(yīng)GB 18030-2000的27533 個漢字,無重碼,準(zhǔn)確率100%。一個聲韻調(diào)音節(jié)加2個序號字母的輸入碼有600萬以上字 位,能對應(yīng)GB 18030-2005的70244個漢字,無重碼,準(zhǔn)確率100%。這種輸入碼構(gòu)成帶聲、 韻、調(diào)讀音的計(jì)算機(jī)內(nèi)碼文字。將計(jì)算機(jī)內(nèi)碼文字增加大寫、分寫、連寫格式等若干規(guī)則的 輸入碼構(gòu)成一種帶聲、韻、調(diào)讀音的漢語計(jì)算機(jī)書面文字。這種輸入碼還能區(qū)分?jǐn)?shù)百個同音 字;字符集為七位ASCII碼或者其最高位編碼字符;若干個奇數(shù)不做聲母的拼音字母表征 若干個特高頻漢字。發(fā)明的目的是這樣實(shí)現(xiàn)的采用聲韻雙拼,奇數(shù)(單數(shù))擊鍵是聲母,偶數(shù)(雙數(shù))擊鍵是韻母。即第1個 拼音字母為聲母,第2個拼音字母為韻母。零聲母音節(jié),補(bǔ)齊一個用來占位的空聲母(本發(fā) 明用字母“O”做為空聲母)。創(chuàng)制能兩鍵準(zhǔn)確表記漢語聲韻調(diào)音節(jié)的字符集。在漢語若干原拼音字母之外,新 增若干同音不同形的新拼音字母;若干原拼音字母和若干新拼音字母與計(jì)算機(jī)鍵盤的按鍵 一一對應(yīng),或者通過計(jì)算機(jī)按鍵的單擊與雙擊實(shí)施區(qū)分而與計(jì)算機(jī)鍵盤的按鍵一一對應(yīng); 一個奇數(shù)擊鍵的原拼音字母或者新拼音字母的聲母或者空聲母,與一個偶數(shù)擊鍵的原拼音 字母或者新拼音字母的韻母相互配成4對同音不同形的編碼,這4對同音不同形的編碼分 別表征漢語的4個聲調(diào),兩鍵輸入一個帶有聲、韻、調(diào)讀音的漢字音節(jié)。若干原、新漢語拼音字母的數(shù)量可參照自然碼雙拼的沈個拉丁字母,亦可參照微 軟雙拼的26個拉丁字母加一個標(biāo)點(diǎn)符號(27個字符)等。本發(fā)明有觀個音符,即增設(shè) “ing”和“U”兩個字母,共有觀個讀音56個拼音字母。大寫字母的輸入方法與現(xiàn)有標(biāo)準(zhǔn)鍵 盤相同,按大寫鎖定鍵或上檔鍵輸入大寫字母。大寫也有音調(diào)的區(qū)分,擊打原拼音字母鍵, 是正常的大寫字母,表征其原為原拼音字母;擊打新拼音字母鍵,則大寫字母的下方多一短 橫,表征其原來為新拼音字母。這種聲韻調(diào)編碼,用觀音56個字符表達(dá)1351個帶聲調(diào)音 節(jié),兩個字母表達(dá)漢語四個聲調(diào),相較已知的各種帶調(diào)音節(jié),拼式最簡短。它解決了漢語聲 調(diào)符號只有四個,多一位碼則浪費(fèi),少一位碼則不足的瓶頸。它音與調(diào)如影隨形,不但閱讀 效率高,也使?jié)h字拼音化成為現(xiàn)實(shí)。
用10個阿拉 伯?dāng)?shù)字做序號字母,以區(qū)分同音字,它不參與拼音。以上全部字符集共有94個字符,其中,56個原拼、新拼音字母和10個阿拉伯?dāng)?shù)字 參與編碼,28個大寫字母只參與書寫。66個參與編碼字符,可以用ASCII碼的52個大、小 寫拉丁字母、10個阿拉伯?dāng)?shù)字,再另選4個其他的字符?;蛘呤褂肁SCII碼閑置的最高位編 碼。全部94個字符均為七位或者八位單字節(jié)編碼圖形字符。在筆記本鍵盤或者臺式機(jī)鍵盤上有56個參與編碼的原拼、新拼音字母的鍵位,或 者在標(biāo)準(zhǔn)鍵盤上以單、雙擊區(qū)分56個原拼、新拼音字母。這樣,28讀音56個字母一一對應(yīng) 到輸入鍵盤的具體按鍵上,當(dāng)一個特定的鍵在鍵盤上被單擊或者被雙擊時,其對應(yīng)的字符 被激活。眾所周知,帶聲、韻、調(diào)讀音的漢字音節(jié)是一個個精確的漢字字音,兩個拼音字母 為一個聲韻調(diào)編碼,計(jì)算機(jī)程序默認(rèn)每輸入兩個拼音字母的編碼表征一個帶有聲、韻、調(diào)讀 音的的漢字音節(jié)。程序?qū)⑵浞g成漢字,拼音變字,兩鍵一字。兩鍵就可直接上屏,不用擇 字,也無須按空格鍵。對新華字典全部1萬余個漢字,其輸入碼為一個帶聲、韻、調(diào)讀音的編碼加一個阿 拉伯?dāng)?shù)字的序號。單擊阿拉伯?dāng)?shù)字時,阿拉伯?dāng)?shù)字位置據(jù)字行的中間,代表1-10 ;雙擊阿拉 伯?dāng)?shù)字時,阿拉伯?dāng)?shù)字位置據(jù)字行的下方(下沉),代表11-20。《新華字典》有1351個帶聲 調(diào)的實(shí)音節(jié),乘以20個序號有2萬7千個字位,經(jīng)過同音字處理,足夠容納新華字典里的1 萬余個漢字,更足夠容納《通用規(guī)范漢字表》全部8300個規(guī)范漢字。對新華字典以外的罕用 漢字,其輸入碼為一個帶聲、韻、調(diào)讀音的編碼加一個原拼音字母或者新拼音字母的序號。 拼音字母的序號為除a、e、λ、3外的48個拼音字母,表征序號為21_68。單詞連寫時,如有 混淆則加隔音符號。1351個帶聲調(diào)的實(shí)音節(jié)乘以(20+48),有九萬一千八百個字位,結(jié)合同 音組設(shè)置,能一一對應(yīng)GB 18030的27533個漢字并且可以互為替代,無重碼,準(zhǔn)確率100%。 一個聲韻調(diào)音節(jié)加2個序號字母的輸入碼則有600萬以上字位,能對應(yīng)GB 18030-2005的 70244個漢字并且可以互為替代,無重碼,準(zhǔn)確率100%。帶聲、韻、調(diào)讀音的計(jì)算機(jī)內(nèi)碼文字,增加大寫、分寫、連寫格式,或者增加單字序 號為“1”時省略序號,或者增加單詞在不相混淆時省略一個至全部序號等若干規(guī)則,表征 GB18030-2000的27533個漢字,則構(gòu)成一種直接輸入計(jì)算機(jī)的帶聲、韻、調(diào)讀音的電腦書面 文字。其中,阿拉伯?dāng)?shù)字不參與拼音,是天然的隔音標(biāo)識,有99%的音調(diào)合一內(nèi)碼輸入碼是 用阿拉伯?dāng)?shù)字定位到字。序號分布在1351個帶聲調(diào)的實(shí)音節(jié)中,高頻字序號靠前,低頻字 序號靠后,常用字平均不到3個,不用專門記,經(jīng)常出現(xiàn),就會記住?,F(xiàn)有拼音輸入法中都帶有擇字框,保留這種擇字框。在擇字框里,分出1-4聲。每 個聲調(diào)一格,保留常用字跳前的規(guī)則,但每個帶聲調(diào)漢字的序號固定不變,當(dāng)前聲調(diào)高亮。 此時可鼠標(biāo)直接擇字,或用4個方向控制4個聲調(diào)的高亮后,輸入選定漢字的序號。在輸入 過程中,“提示”框不停地顯示漢字和聲調(diào)與序號的對應(yīng)式供參考。當(dāng)用戶記得聲調(diào)和序號 時完全可以不必理會這些提示,只有不記得聲調(diào)和序號時才去注意它。實(shí)踐證明,常用字多 打幾次,就能記住序號。當(dāng)同一個帶調(diào)音節(jié)有眾多漢字時,增設(shè)同音組分組容納同音字。同音組的讀音相 同,拼音字母不同。漢字拼音不帶聲調(diào)的理論音節(jié)組合有735個(21*35),實(shí)際音節(jié)只有418 個,其余是不相拼音節(jié)和潛音節(jié),有300余個音節(jié)空置。借用空置音節(jié),特別是不相拼音節(jié)的整體認(rèn)讀可以構(gòu)成若干讀音相同,拼音字母不同的同音組。在GB碼的6763個漢字中有 27個音節(jié)同音字超過20字,只占6. 5%。在300余個空置音節(jié)中指定27個同音組,沒有難度。 例如yi的4組同音組可用yi、oi、wi、fi表示。其中,yi是漢字拼音法定音節(jié), Qi是雙拼輸入法特定零聲母音節(jié),wi、fi是不相拼音節(jié)。又例如bi的3組同音組可用bi、 by、bt表示。其中,bi是漢字拼音法定音節(jié),by的在y漢字拼音中能與i互換,bt是不相 拼音節(jié)。漢字同音字最多的iy4,《新華字典》有72個,分4組,每組不到20個字,可用阿拉 伯?dāng)?shù)字。GBK碼的231個yi4同音字,分4組,每組也不到60個字。用20阿拉伯?dāng)?shù)字加48 個原、新拼音字母做序號,共有272個字位,足夠容納231個yi4同音字。若干個奇數(shù)不做聲母的拼音字母表征若干個特高頻漢字。漢語拼音有21個聲母 及W、Y代聲母,雙拼有“0”做空聲母。聲母、代聲母、空聲母合計(jì)有24個。在奇數(shù)鍵上,a、 e、X、3的8個原、新拼音字母不做聲母,將其作為“的、一、了、是、我、不、在、人、” 8個特高 頻漢字的單字母?,F(xiàn)代漢語中,漢字“的”字約占4%,約有10%的音序電腦漢字是單字母 定位到字。本發(fā)明與現(xiàn)有技術(shù)相比較,具有如下顯而易見的突出實(shí)質(zhì)性特點(diǎn)和顯著優(yōu)點(diǎn)它 用有限的元件(66個字符),兩鍵表達(dá)一個帶聲、韻、調(diào)讀音的漢語精確讀音,較之20世紀(jì) 60年代的美國王安輸入法6鍵一字,70年代,臺灣倉頡輸入法5鍵一字,80年代王碼五筆 4鍵一字之后,開創(chuàng)出21世紀(jì)20年代兩鍵一字的新時代。它三鍵定位GB 18030-2000的 27533個帶聲、韻、調(diào)讀音的漢字,無重碼,準(zhǔn)確率100%,它四鍵有600多萬個字位,能定位 GB18030-2005的70244個帶帶聲、韻、調(diào)讀音的漢字,是一種計(jì)算機(jī)內(nèi)碼文字。它讀寫完全 一致而又不需語法,遠(yuǎn)比英語易學(xué)。它拼式簡短、易于認(rèn)讀,直接輸入計(jì)算機(jī)、是一種帶聲、 韻、調(diào)讀音的精準(zhǔn)書面文字,是著名科學(xué)家錢偉長教授指出的“好的編碼方案”。它保留漢 字一字一音及音形義全部內(nèi)涵,與簡繁漢字互為替代,只有方塊漢字的功成身退,不對現(xiàn)行 的簡繁漢字進(jìn)行改進(jìn)或改造,不但能實(shí)現(xiàn)中國政府1951年推行“漢字拉丁化”拼音文字的 目標(biāo),而且與時俱進(jìn),是單字節(jié)漢語計(jì)算機(jī)編程語言。它字在碼中,不再提筆忘字。它音在 字中,博學(xué)的人不會遇到生僻字不知發(fā)音的難處。它字在話中,會說話就會打字,不存在文 盲問題。中國兒童都學(xué)拼音,只需再用幾天記雙拼和新拼音字母,中國娃娃4歲能閱讀和打 字不是夢。它達(dá)到輸入碼、內(nèi)碼、電腦文合體的境界,與現(xiàn)有方塊漢字相比,如果中國人省下 幾年苦學(xué)方塊漢字的時間,用于學(xué)習(xí)其它的知識和學(xué)問,其導(dǎo)致的社會進(jìn)步與發(fā)展完全不 可估量。
圖1為帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法字符圖。圖2為筆記本鍵盤布局圖。
圖3為臺式機(jī)鍵盤布局圖。圖4為詞句輸入碼示例圖。圖5為一種帶聲、韻、調(diào)讀音的漢語計(jì)算機(jī)書面文字示例圖。圖6為yi4—級同音組編碼示例圖。圖7為yi4 二級同音組編碼示例圖。
圖8為yi4三級同音組編碼示例圖。圖9為單字母高頻漢字對應(yīng)圖。
具體實(shí)施例方式以下結(jié)合附圖,對帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法作進(jìn)一步的闡述。圖1為帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法字符圖。漢語拼音有沈個拉丁字母,圖1新增字母“ 3,,和“ Λ ”,定義為為漢語拼音字母 “ing”和“U”。這觀個拼音字母的小寫,稱為“原拼音字母”。增加觀個同音不同形的新拼 音字母。新拼音字母的字形仿自原拼音字母的大寫和小寫,稱為“新拼音字母”。圖1的1-4行即為觀個大寫字母、觀個“原拼音字母”(原拼)和觀個“新拼音 字母(新拼)”的字符圖。每組字母的排列順序?yàn)榇髮?、原拼、新拼。在觀個新拼音字母中, B、D、N、Q、R、U六個字母為原拼音字母大寫的縮??;“a”為希臘字母“ α,,;“ρ、ζ”為法語字 母手寫體;“i”為小寫的上下翻轉(zhuǎn);“C、f、3、λ”為小寫的左右翻轉(zhuǎn);其余13個字母仿自 拉丁字母小寫,力求易記。由于新增的“新拼音字母”與“原拼音字母”的讀音相同,因而容 易記憶。圖1的第5行為拼音字母化的阿拉伯?dāng)?shù)字0-9。其中,0、1的字形有所更改,目的 是區(qū)別拼音字母I和0。數(shù)字字母僅作序號標(biāo)識,與拼音字母能并擊同時輸入和起隔音功 能。圖2為筆記本鍵盤布局圖。圖2是現(xiàn)有標(biāo)準(zhǔn)筆記本鍵盤經(jīng)過變更而來,它保留標(biāo)準(zhǔn)筆記本鍵盤的全部功能按 鍵,中英文兼容。它有對應(yīng)若干原拼音字母和若干新拼音字母的長方形雙電觸點(diǎn)按鍵。具 體為標(biāo)準(zhǔn)筆記本鍵盤的第1、2行的全部鍵位沒有變動,將第3行的制表定位鍵(Tab)移 至第6行。第3、4、5行保留原標(biāo)準(zhǔn)鍵盤英文字母的排列順序并增加新拼音字母的鍵位。增 加的新拼音字母鍵與原漢語拼音字母鍵合二為一,為長方形雙電觸點(diǎn)按鍵。長方形雙電觸 點(diǎn)按鍵左邊電觸點(diǎn)對應(yīng)原拼音字母,右邊電觸點(diǎn)對應(yīng)新拼音字母。按壓長方形雙電觸點(diǎn)按 鍵左端對應(yīng)若干原拼音字母,按壓長方形雙電觸點(diǎn)按鍵右端對應(yīng)若干新拼音字母。新拼音 字母鍵與原拼音字母鍵位左右相鄰(或者上下相鄰),符合標(biāo)準(zhǔn)鍵盤使用習(xí)慣。第3行⑴ 行)的10個英文字母鍵左側(cè)頂置,右側(cè)與回車鍵相接;第4行(A行)9個英文字母鍵居中 布置,左側(cè)保留被縮小的大寫字母鎖定鍵,右側(cè)與回車鍵相接;第5行(Z行)7個字母鍵后 增加“ Λ ”和“ 3 ”兩個字母鍵,9個字母鍵居中布置,左、右兩側(cè)保留被縮小的上檔鍵。打字 鍵區(qū)的所有標(biāo)點(diǎn)符號鍵的功能上移到筆記本鍵盤的第1行(除Esc鍵外)的功能鍵區(qū)。圖2的筆記本鍵盤布局圖,因?yàn)樵黾恿?“新拼音字母”的鍵位,使圖1中參與編碼 的56個原、新拼音字符和10個數(shù)字字符有一一對應(yīng)的鍵位。當(dāng)一個特定的鍵在鍵盤上被 按下時,其對應(yīng)的字符被激活。中文使用擊打第3、4、5行的長方形按鍵(打字鍵區(qū))的左側(cè)為圖1字符圖中的 原拼音字母;而擊打長方形按鍵右側(cè)為圖1字符圖中的新拼音字符。擊打第2行的數(shù)字鍵 時為圖1字符圖中的數(shù)字字符。單擊第1行功能鍵為相對應(yīng)的標(biāo)點(diǎn)符號(均無須同時按上 檔鍵)。英文使用擊打第3、4、5行的長方形按鍵的左側(cè)為小寫;擊打長方形按鍵右側(cè)為大寫。擊打第1行的功能鍵為相對應(yīng)的標(biāo)點(diǎn)符號。單擊第2行的數(shù)字鍵為數(shù)字字母。圖3為 臺式機(jī)鍵盤布局圖。圖3的打字鍵區(qū)和功能鍵區(qū)的變更與圖2相同,使用方法也一樣。不同的是,圖3 的小鍵盤區(qū)在全屏幕操作狀態(tài)時,0-9的10個數(shù)字鍵可重復(fù)定義為標(biāo)點(diǎn)符號鍵。圖4為詞句輸入碼示例圖。圖4是一句漢語“著名科學(xué)家錢偉長教授說好的編碼方案應(yīng)該是一種文 字……?!笔纠龍D。圖中,奇數(shù)(單數(shù))擊鍵是聲母,偶數(shù)(雙數(shù))擊鍵是韻母。即第1個 拼音字母為聲母,第2個拼音字母為韻母,零聲母音節(jié),補(bǔ)一個空聲母。每一個聲、韻、調(diào)拼 音編碼都是兩個拼音字母。用若干個原拼音字母和若干個同音不同形的新拼音字母相互配 對,構(gòu)成4對同音不同字型的聲、韻、調(diào)編碼。這4對聲韻調(diào)編碼表征漢語拼音的4個聲調(diào)。 圖中,令原拼聲母與原拼韻母的編碼為第1聲調(diào)(陰平);原拼聲母與新拼韻母的編碼為 第2聲調(diào)(陽平);新拼聲母與原拼韻母的編碼為第3聲調(diào)(上聲);新拼聲母與新拼韻母 的編碼為第4聲調(diào)(去聲)。則這段文字的音調(diào)編碼如下著(新/新)名(原/新)科(原/原)學(xué)(原/新)家(原/原)錢(原/新) 偉(新/原)長(原/新)[姓名“錢偉長”加序號]教(新/新)授(新/新)說(原/ 原)好(新/原)的(單字母)編(原/原)碼(新/原)方(原/原)案(新/新)應(yīng) (原/原)該(原/原)是(單字母)一(單字母)種(新/原)文(原/新)字(新/ 新)……。帶聲、韻、調(diào)讀音的編碼與帶聲、韻、調(diào)讀音的漢語計(jì)算機(jī)內(nèi)碼文字兼容,詞句輸入 與單字輸入兼容。一個帶聲、韻、調(diào)讀音的編碼加一個序號字母定位到字,成為一種帶聲、 韻、調(diào)讀音的漢語計(jì)算機(jī)內(nèi)碼文字。序號由10個阿拉伯?dāng)?shù)字及除“a、e、λ、3 ”外的48個 拼音字母構(gòu)成。1351個帶聲調(diào)音節(jié)乘以(20+48),有九萬一千八百個字位。結(jié)合同音組設(shè) 置,能一一對應(yīng)GB 18030的27533個漢字,可以互為替代,從而構(gòu)成一種帶聲、韻、調(diào)讀音的 漢語計(jì)算機(jī)內(nèi)碼文字。對普通人不易分辨的人名、地名、專用術(shù)語等語音,輸入聲韻調(diào)編碼后,添加1個 序號字母定位到具體字。圖4中,除了姓名“錢偉長”需要加序號外,其余均兩鍵一字或者 一鍵一字,不加序號。輸入數(shù)字序號時可以與拼音字母并擊。每輸入兩個拼音字母為一個 聲、韻、調(diào)讀音的編碼,兩次擊鍵一字。連續(xù)輸入后,程序默認(rèn)啟動電腦語音翻譯功能,拼音 變字,兩鍵一字,不用擇字,也無須按空格鍵,直接上屏。圖5為一種帶聲、韻、調(diào)讀音的漢語計(jì)算機(jī)書面文字示例圖。圖5是將一句漢語方塊文字“著名科學(xué)家錢偉長教授說好的編碼方案應(yīng)該是一 種文字……?!弊儞Q成一種帶聲、韻、調(diào)讀音的漢語計(jì)算機(jī)書面文字示例圖。圖5的音調(diào)編碼 與圖4 一樣(參照圖4)。圖5中,一個定位到字的編碼由一個帶聲、韻、調(diào)讀音的編碼加一個序號字母構(gòu) 成。序號字母為10個阿拉伯?dāng)?shù)字及除“a、e、λ、3”外的48個拼音字母。輸入阿拉伯?dāng)?shù) 時,單擊表征序號1-10,阿拉伯?dāng)?shù)字位置據(jù)字行的中間;雙擊表征序號11-20,阿拉伯?dāng)?shù)字 位置據(jù)字行的下方(下沉)。單擊輸入48個拼音字母做序號,表征序號大于20。拼音字母 做序號時,如果出現(xiàn)音節(jié)混淆,加分隔符。高頻字序號靠前,單字序號為1時,省略序號,單詞在不相混淆時省略一個或者全部序號。有大寫、連寫、分寫若干規(guī)則(參照漢語拼音正詞 法等)。這種編碼,帶有字音,便于認(rèn)讀,構(gòu)成一種帶聲、韻、調(diào)讀音的漢語計(jì)算機(jī)書面文字。圖5的漢語,均為常用字,故沒有數(shù)字字母下沉的序號和拼音字母的序號。數(shù)字序 號下沉的范例可參閱圖7的yi4 二級同音組編碼示例圖;拼音字母序號的范例可參閱圖8 的yi4三級同音組編碼示例圖。當(dāng)序號為一時,省略序號。漢語約有1351個帶調(diào)音節(jié),就有約1351個漢字省略序 號。圖5中,令最后兩字“文字”的序號為1、其余字的序號均是不為1,故只有最后兩字“文 字,,省略其序號。大寫規(guī)則參照漢語拼音正詞法等。圖5中,首字“著”字在段前,首字“V”大寫。 “錢”是姓,“偉長”是人名,姓的第一個字母“Q”大寫和人名的第一個字母“W”大寫。大寫 字母的輸入方法與現(xiàn)有標(biāo)準(zhǔn)鍵盤相同,即按大寫鎖定鍵或上檔鍵輸入大寫字母。大寫字母 有音調(diào)的區(qū)分,按下大寫字母鍵或上檔鍵后,擊打原拼字母對應(yīng)鍵,是正常的大寫字母,表 征大寫的原拼字母;而擊打新拼字母對應(yīng)鍵,則大寫字母的下方多一短橫,表征大寫的新拼 字母。這樣,大寫字母同樣能表達(dá)聲調(diào)。圖5的示例圖中,大寫“V”為新拼字母,下方多一 短橫;大寫“Q”為原拼字母,下方無短橫;大寫“W”為新拼字母,下方多一短橫。連寫、分寫若干規(guī)則參照漢語拼音正詞法等。圖5中,“著名、科學(xué)家、偉長、教授、 編碼、方案、應(yīng)該、文字”連寫,“錢、說、好、的、是、一、種”分寫。“的、是、一”是單字母特高頻 字。連寫的單詞,當(dāng)不相混淆時,省略序號。在標(biāo)調(diào)的情況下,漢語同音詞占10. 9%,有89% 的單詞省略全部序號。這種帶聲、韻、調(diào)讀音的漢語計(jì)算機(jī)書面文字,見字知音,便于認(rèn)讀,所有字符與鍵 盤對應(yīng),能將GB 18030-2000的27533個漢字直接輸入計(jì)算機(jī)。顯然,它也能隨時切換為簡 體方塊漢字或者繁體方塊漢字。老一代要知道新一代的電腦文說什麼,切換一下,新一代要 知道老一代的方塊字說什麼,切換一下,方塊字與電腦文并存不是問題。圖6、圖7、圖8的三個示例圖表達(dá)GBK大字符集231個yi4漢字的231個編碼。 令圖6、圖7、圖8中,yi、oi、wi、fi構(gòu)成yi的四個同音不同形的同音組。其中,yi是漢字 拼音法定音節(jié),Qi是雙拼輸入法特定零聲母音節(jié),wi是漢字拼音的非韻母音節(jié)、fi是不相 拼音節(jié)的整體認(rèn)讀。圖6為yi4—級同音組編碼示例圖。圖6的yi4 —級字表同音組編碼定義《通用規(guī)范漢字表》3500個常用字中的28個 yi4同音字,序號為1-7。阿拉伯?dāng)?shù)字居中。漢語yi4為第4聲調(diào),其音調(diào)編碼組合為新拼 聲母與新拼韻母的組合。具體如下yi 義議譯誼抑逸詣oi 億亦易意邑肄翌wi 憶異疫毅屹裔繹fi 藝役益翼臆溢衣圖7為yi4 二級同音組編碼示例圖。圖7的yi4 二級同音組編碼定義新華字典一萬余個(含《通用規(guī)范漢字表》8300 個漢字)中的72個yi4同音字中扣除一級字表的28個yi4同音字后的44個yi4同音字, 序號為8-18。阿拉伯?dāng)?shù)字居中或者下沉。其音調(diào)編碼組合為新拼聲母與新拼韻母的組合。具體如下yi 艾軼弈佚奕熠弋驛乂市浹oi 懿囈薏噫鎰縊刈羿浥悒勛wi 仡嶧懌悒佾殪挹埸呋鷀鍈fi 劓鐿瘞癔翊蜴嗌翳蓺虡螆圖8為yi4三級同音組編碼示例圖。圖8的yi4三級同音組編碼定義GBK大字符集231個yi4漢字中扣除新華字典的 72個yi4同音字以外的所有159個yi4同音字。序號為拼音字母b_v (共44個)。其音調(diào) 編碼組合為新拼聲母與新拼韻母的組合。具體如下yi 釓役識悒……食鐘駅驛Oi 億擬藝劫……玳鯧鯧鵁wi 勛匇暖呋……鯢鵾鹋鵑fi 唱囈圍設(shè)……鵞鶄拽到此,圖6、圖7、圖8定義了 231個yi4漢字。在GBK大字符集中,其它音節(jié)的同 音組都少于231字,可比照yi4同音組處理。例如bi的3組同音組可用bi、by、bt表示。 其中,bi是漢字拼音法定音節(jié),by的y在漢字拼音中能與i互換,bt是不相拼音節(jié)的整體 認(rèn)讀。圖9為單字母高頻漢字對應(yīng)圖。圖9的8個奇數(shù)鍵不做聲母的拼音字母表征8個特高頻漢字。圖中“a、e、3、λ,, 四音的原、新單字母分別表征“的、一、了、是、我、不、在、人、”八個特高頻字。奇數(shù)鍵單擊 “a、e、3、λ”的8個原、新拼音字母按鍵,則會出現(xiàn)對應(yīng)的高頻字。一篇文章,有10%以上 漢字的輸入碼是一個拼音字母定位到字。
權(quán)利要求
1.帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法,其特征在于,在漢語若干原拼音字母之外,新 增若干同音不同形的新拼音字母;若干原拼音字母和若干新拼音字母與計(jì)算機(jī)鍵盤的按鍵 一一對應(yīng),或者通過計(jì)算機(jī)按鍵的單擊與雙擊實(shí)施區(qū)分而與計(jì)算機(jī)鍵盤的按鍵一一對應(yīng); 一個奇數(shù)擊鍵的原拼音字母或者新拼音字母的聲母或者空聲母,與一個偶數(shù)擊鍵的原拼音 字母或者新拼音字母的韻母,相互配成4對同音不同形的編碼,這4對同音不同形的編碼分 別表征漢語的4個聲調(diào),兩鍵輸入一個帶有聲、韻、調(diào)讀音的漢字音節(jié)。
2.如權(quán)利要求1所述的帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法,其特征在于,它的編碼字 符集為七位或者八位的單字節(jié)字符。
3.如權(quán)利要求1所述的帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法,其特征在于,筆記本鍵盤 或者臺式機(jī)鍵盤有對應(yīng)若干原拼音字母與若干新拼音字母的按鍵,特別是有對應(yīng)若干原拼 音字母與若干新拼音字母的長方形雙電觸點(diǎn)按鍵。
4.如權(quán)利要求1所述的帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法,其特征在于,它的擇字框 里,提示漢字的4個聲調(diào),每個帶聲、韻、調(diào)讀音的漢字序號固定不變。
5.如權(quán)利要求1所述的帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法,其特征在于,計(jì)算機(jī)默認(rèn) 兩個漢語原拼音字母或者新拼音字母為一個帶聲、韻、調(diào)讀音的編碼,每輸入兩個漢語原拼 音字母或者新拼音字母的的編碼表征一個帶有聲、韻、調(diào)讀音的漢字音節(jié)。
6.如權(quán)利要求1所述的帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法,其特征在于,一種帶聲、 韻、調(diào)讀音的漢語計(jì)算機(jī)內(nèi)碼文字,由一個帶聲、韻、調(diào)讀音的編碼加一個序號字母,并與GB 18030-2000的27533個漢字一一對應(yīng),可以互為替代的組合編碼構(gòu)成。
7.如權(quán)利要求1所述的帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法,其特征在于,一種帶聲、 韻、調(diào)讀音的漢語計(jì)算機(jī)書面文字,由一個帶聲、韻、調(diào)讀音的編碼加一個序號字母,表征GB 18030-2000的27533個漢字,并且,或者增加大寫、分寫、連寫格式,或者增加單字序號為 “1”者省略序號,或者增加單詞在不相混淆時省略一個至全部序號等若干規(guī)則的組合編碼 構(gòu)成。
8.如權(quán)利要求1所述的帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法,其特征在于,設(shè)置字音相 同,拼音字母不同的同音組分組容納同音字。
9.如權(quán)利要求1所述的帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法,其特征在于,若干個奇數(shù) 鍵不做聲母的拼音字母表征若干個特高頻漢字。
全文摘要
本發(fā)明公開了一種帶聲、韻、調(diào)讀音的漢字內(nèi)碼輸入法,旨在提供一種輸入碼與內(nèi)碼一致并代表漢語的編碼。它利用若干原拼音字母之外新增若干同音不同形的新拼音字母并與鍵盤一一對應(yīng),將原、新拼音字母相互配對,構(gòu)成4對相同讀音不同字型的編碼來表征漢語4個聲調(diào),程序?qū)⒄Z音變字,兩鍵一字。一個帶聲、韻、調(diào)讀音的編碼加一個序號字母的輸入碼定位GB 18030-2000的27533個漢字,無重碼,準(zhǔn)確率100%。它達(dá)到輸入碼、內(nèi)碼、電腦文合體的境界,與現(xiàn)有方塊漢字相比,如果省下幾年苦學(xué)方塊漢字的時間,用于學(xué)習(xí)其它的知識和學(xué)問,其導(dǎo)致的社會進(jìn)步與發(fā)展完全不可估量。
文檔編號G06F3/023GK102141844SQ20111009338
公開日2011年8月3日 申請日期2011年4月7日 優(yōu)先權(quán)日2011年4月7日
發(fā)明者林坤明 申請人:林坤明