專(zhuān)利名稱(chēng):網(wǎng)絡(luò)(因特網(wǎng))漢語(yǔ)輸入技術(shù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種建立在因特網(wǎng)應(yīng)用全面中文化基礎(chǔ)上的漢語(yǔ)輸入技術(shù)。前者指因特網(wǎng)在中國(guó)實(shí)現(xiàn)網(wǎng)址中文化、電郵地址中文化、引擎搜索中文化、網(wǎng)絡(luò)內(nèi)容中文化等全面中文化。具體地說(shuō),該發(fā)明是一種供在因特網(wǎng)領(lǐng)域使用的、簡(jiǎn)單而高效的漢語(yǔ)語(yǔ)句式輸入技術(shù),也可擴(kuò)展到其它須進(jìn)行漢字處理地場(chǎng)合使用。
因特網(wǎng)是從20世紀(jì)60代美國(guó)阿帕網(wǎng)(ARPANET)演變發(fā)展而來(lái)的,阿帕網(wǎng)是美國(guó)國(guó)防部高級(jí)研究計(jì)劃局的一個(gè)項(xiàng)目,這個(gè)項(xiàng)目的設(shè)計(jì)目標(biāo)是在發(fā)生大規(guī)模戰(zhàn)爭(zhēng)時(shí),能夠方便地把不同規(guī)格型號(hào)的計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)連接起來(lái)形成網(wǎng)絡(luò)??傊蛱鼐W(wǎng)是在計(jì)算機(jī)技術(shù)發(fā)展到一定歷史階段的必然產(chǎn)物,它徹底改變了人類(lèi)的傳統(tǒng)社會(huì)生活方式,廣泛應(yīng)用于信息傳遞、商業(yè)貿(mào)易、遠(yuǎn)程教學(xué)、休閑娛樂(lè)等社會(huì)生活的方方面面,高效性、即時(shí)性、交互性是其區(qū)別于傳統(tǒng)模式的最大特色。因特網(wǎng)在世界范圍內(nèi)蓬勃興起,1999年全球有近3億人上網(wǎng);因特網(wǎng)在我國(guó)亦有長(zhǎng)足的發(fā)展,據(jù)統(tǒng)計(jì),中國(guó)截止1999年底網(wǎng)民約900萬(wàn),企業(yè)上網(wǎng)數(shù)量也大幅上升。
網(wǎng)絡(luò)的應(yīng)用均離不開(kāi)人類(lèi)交流所需的基礎(chǔ)工具--語(yǔ)言文字。過(guò)去漢字的輸入和處理問(wèn)題曾制約了計(jì)算機(jī)在我國(guó)的普及和發(fā)展,“五筆字型”等一些漢字輸入法較好地解決了這一“瓶頸”問(wèn)題,但在易學(xué)性和普及性方面還存在著嚴(yán)重不足;中文手寫(xiě)輸入也無(wú)法達(dá)到滿(mǎn)意的輸入速度。特別是在跨入網(wǎng)絡(luò)信息時(shí)代的今天,網(wǎng)絡(luò)應(yīng)用的高效性與漢語(yǔ)輸入的低效率已成為一對(duì)十分尖銳的矛盾,當(dāng)前網(wǎng)上中文信息較少與此不無(wú)關(guān)系。只要你進(jìn)入因特網(wǎng),就會(huì)發(fā)現(xiàn)滿(mǎn)目都是英文,這使非英語(yǔ)國(guó)家的人感到一種文化侵占的味道。據(jù)有關(guān)統(tǒng)計(jì)表明,在因特網(wǎng)上的英語(yǔ)內(nèi)容約占90%,法語(yǔ)占5%,西班牙語(yǔ)占2%,而中文在網(wǎng)上的比例則微乎其微。
到目前為止,國(guó)內(nèi)尚未見(jiàn)提到“因特網(wǎng)應(yīng)用全面中文化”的概念,亦沒(méi)有任何一種專(zhuān)業(yè)用于因特網(wǎng)的漢語(yǔ)輸入技術(shù)出現(xiàn)。
本發(fā)明的目的在于,通過(guò)比較漢、英兩種體系的語(yǔ)言文字,嘗試制定一種構(gòu)架在現(xiàn)有因特網(wǎng)標(biāo)準(zhǔn)之上的、適應(yīng)漢語(yǔ)自身特點(diǎn)的并適合中國(guó)人使用習(xí)慣的中文網(wǎng)址、中文電郵地址、中文引擎搜索等應(yīng)用層面的新標(biāo)準(zhǔn);同時(shí),為最大方便中文在網(wǎng)上的輸入,真正實(shí)現(xiàn)因特網(wǎng)全面中文化,從而提出一種專(zhuān)供在因特網(wǎng)上使用的,針對(duì)因特網(wǎng)上不同輸入類(lèi)型而調(diào)用相應(yīng)的“漢語(yǔ)語(yǔ)句庫(kù)”來(lái)進(jìn)行輸入的,以漢語(yǔ)拼音為基礎(chǔ)并截取其有效部分來(lái)進(jìn)行編碼的,操作高效而簡(jiǎn)單易學(xué)的,極易在因特網(wǎng)上普及的漢語(yǔ)語(yǔ)句式輸入方法。
本發(fā)明通過(guò)以下步驟來(lái)實(shí)施并達(dá)到上述目的。
一.因特網(wǎng)全面中文化
因特網(wǎng)源于美國(guó),所以構(gòu)建INTERNET的協(xié)議和技術(shù)標(biāo)準(zhǔn)都是基于英語(yǔ)語(yǔ)言和美國(guó)文化背景的,符合他們的語(yǔ)法、思維和使用習(xí)慣。如果僅從因特網(wǎng)技術(shù)層面來(lái)看,處于底層(或內(nèi)層)的成熟的協(xié)議和技術(shù)標(biāo)準(zhǔn)仍具有其重要的意義、價(jià)值和不可動(dòng)搖的基礎(chǔ)地位,或者說(shuō),如果要通過(guò)更改因特網(wǎng)底層(或內(nèi)層)的技術(shù)和標(biāo)準(zhǔn)來(lái)適應(yīng)本土化和中文化的要求,那將付出不必要的代價(jià)。但從因特網(wǎng)上層(或外層)的應(yīng)用來(lái)看,它并不符合絕大多數(shù)中國(guó)人的習(xí)慣,比如,現(xiàn)有的網(wǎng)址和電郵地址等,就不符合我們的使用習(xí)慣??傊蛱鼐W(wǎng)應(yīng)用的中文化、本土化工作只能是在堅(jiān)持國(guó)際標(biāo)準(zhǔn)、不破壞現(xiàn)有的技術(shù)標(biāo)準(zhǔn)的前提下的再創(chuàng)造。
1.網(wǎng)址中文化
①網(wǎng)址中文化的
背景技術(shù):
檢索瀏覽信息(BROWSING)是因特網(wǎng)最重要的功能之一,通過(guò)因特網(wǎng)檢
索瀏覽信息即我們常說(shuō)的網(wǎng)絡(luò)訪問(wèn)。早期的網(wǎng)絡(luò)訪問(wèn)是通過(guò)IP地址實(shí)現(xiàn)的。根據(jù)
“TCP/IP”網(wǎng)絡(luò)協(xié)議,INTERNET上的每臺(tái)計(jì)算機(jī)(服務(wù)器)都有唯一的IP地
址,IP地址由一串類(lèi)似180.175.26.10這樣的數(shù)字組成。顯然,這種以數(shù)字表示“網(wǎng)
絡(luò)地址”的方法,很不直觀,難以記憶。為解決這一問(wèn)題,又出現(xiàn)了“域名”,
域名由具有一定意義的英文單詞或英文縮寫(xiě)組成,中間以“.”隔開(kāi)。例如,
http://ww.bol.com.cn中的“bol.com.cn.”。
有的在域名之下還有目錄結(jié)構(gòu),它指出了某個(gè)頁(yè)面的路徑。例如
“Http://www.163.com/it/index-category/0,1182,13,00.html”中的“/it/index-
category/0,1182,13,00.html”。IP地址、域名和目錄結(jié)構(gòu)等幾個(gè)部分組成了一個(gè)完
整的“網(wǎng)址”(URL)。
但是,英文域名要求使用者具有一定的英文基礎(chǔ),否則,26個(gè)英文字母的排列組合比10個(gè)十進(jìn)制數(shù)字更難記憶。
CNNIC(中國(guó)域名管理中心)為中文網(wǎng)站提供了本土化的中文域名注冊(cè)服務(wù)。CNNIC作為世界域名管理中心在中國(guó)的分支機(jī)構(gòu),必須按先前的英文域名的標(biāo)準(zhǔn)和規(guī)范,來(lái)制定中文域名的登記注冊(cè)標(biāo)準(zhǔn),于是就出現(xiàn)了類(lèi)似“主頁(yè).北京在線(xiàn).公司.中國(guó)”令國(guó)人費(fèi)解的中文域名。
中文域名與英文域名實(shí)際是一個(gè)技術(shù)層面上的東西,既可單獨(dú)注冊(cè)中文域名或英文域名,也可兩者一一對(duì)應(yīng)注冊(cè),而且中文域名是完全按英文域名“克隆”出來(lái)的,并不遵循中文的習(xí)慣。中文域名、英文域名和IP地址三者的關(guān)系如下所示
②網(wǎng)址中文化的目的
A.解決網(wǎng)上“文化侵略”的問(wèn)題,增強(qiáng)中文在因特網(wǎng)上的影響力,并最終實(shí)現(xiàn)“文化輸出”。
B.促進(jìn)因特網(wǎng)在中國(guó)的發(fā)展,為中國(guó)大眾上網(wǎng)提供有利條件。③網(wǎng)址中文化的要求
A.遵循現(xiàn)有的互聯(lián)網(wǎng)國(guó)際標(biāo)準(zhǔn)?;ヂ?lián)網(wǎng)的技術(shù)標(biāo)準(zhǔn)雖然是從美國(guó)照搬過(guò)來(lái)的,但經(jīng)過(guò)多年的應(yīng)用和實(shí)踐,已成為世界公認(rèn)的事實(shí)標(biāo)準(zhǔn)。
B.在IP地址、域名(包括中英、文域名)兩個(gè)層次上,構(gòu)建符合漢語(yǔ)習(xí)慣的,方便我國(guó)大眾上網(wǎng)使用的,且具有一定標(biāo)準(zhǔn)的第三個(gè)層次即中文網(wǎng)址層次。這三個(gè)層次的關(guān)系如下圖
④網(wǎng)址中文化的標(biāo)準(zhǔn)
要在因特網(wǎng)現(xiàn)有層次上搭建新的層次,提出新的應(yīng)用技術(shù),就應(yīng)該符合事物的客觀規(guī)律,且具備一定的規(guī)范和標(biāo)準(zhǔn)。
為了提出網(wǎng)址中文化的新標(biāo)準(zhǔn),必須比較研究中、英兩種文字和語(yǔ)言的不同特點(diǎn)。
A.英文是典型的拼音文字,它以a~z 26個(gè)字母拼寫(xiě)單詞,再由單詞組成句子,表達(dá)完整的語(yǔ)意。英文單詞相當(dāng)于中文的字或詞。語(yǔ)句中單詞與單詞之間以空格分開(kāi)。
而漢字是典型的表形文字,每個(gè)字均有一定的意義,再由字組成詞,漢語(yǔ)是以字、詞為單位組合在一起表達(dá)完整語(yǔ)義的。語(yǔ)句中的字與字或詞、詞與字或詞之間均沒(méi)有空格或其它符合隔開(kāi)。漢語(yǔ)的特點(diǎn)是文字簡(jiǎn)煉,字形優(yōu)美,極易從語(yǔ)句中識(shí)斷字、詞之間的相互關(guān)系。
英文域名中的“.”既可看作英文單詞之間的分隔符,也可看作“.”前單詞的縮略號(hào)。中文網(wǎng)址則不必使用這一符號(hào)。
B.其次,英語(yǔ)中對(duì)通常意義的地址的表示與中文有很大區(qū)別。英語(yǔ)是將地名從小到大排列,而漢語(yǔ)是將地名從大到小排列。例如,漢語(yǔ)的“中國(guó)江蘇南京珠江路260號(hào)”在英文中則成了“No.260,Zhujiang Road,Nanjing,China”。網(wǎng)址中文化必須立足漢語(yǔ)的表達(dá)習(xí)慣。
因此,從以上分析可歸納出中文網(wǎng)址的標(biāo)準(zhǔn)為
(國(guó)家名)(省、市名)(市、縣名)(……)機(jī)構(gòu)名/(目標(biāo)路徑)
例如,中國(guó)江蘇南京億迪電子商務(wù)有限公司
括號(hào)中的限定名可全部或部分省略,但為了減少網(wǎng)址名在國(guó)內(nèi)和國(guó)外產(chǎn)生重復(fù)現(xiàn)象,最好保留部分限定語(yǔ)。例如,“中國(guó)南京億迪電子商務(wù)有限公司”和“江蘇南京億迪電子商務(wù)有限公司”等。
2.電郵地址中文化
因特網(wǎng)的另一大用途是傳遞電子郵件(E-mail)?,F(xiàn)代人的名片上不僅印有城市、街道、門(mén)牌、郵編、電話(huà)、傳真、傳呼、手機(jī)等,很多還印上了電子郵件的地址,這已成為一種時(shí)尚。
但我們不難發(fā)現(xiàn),電郵地址幾乎全是由英文表示的。例如,
cgm@publicl.ptt.is.cn
wang.cheng@rayoner.com
@為電子郵件的專(zhuān)用符號(hào),其前面為單位名或個(gè)人名,后面為郵件服務(wù)器的名稱(chēng)。顯然,這種電郵地址的表示方式,同樣不便我們漢語(yǔ)國(guó)家的人們記憶和使用。所以本技術(shù)提出中文電郵地址的標(biāo)準(zhǔn)模式為
郵件服務(wù)器中文名
中文的單位名或人名例如
中國(guó)江蘇公眾信息網(wǎng)
陳恭明
中國(guó)易得商務(wù)網(wǎng)
億迪公司
3.引擎搜索中文化
本技術(shù)提出引擎搜索中文化的標(biāo)準(zhǔn)模式
A.單字或詞搜索
B.多字或詞邏輯搜索
中文邏輯字有“與”和“或”。中文字或詞與邏輯字之間以空格隔開(kāi)。
二.網(wǎng)絡(luò)(因特網(wǎng))漢語(yǔ)輸入技術(shù)
網(wǎng)絡(luò)應(yīng)用中文化解決了網(wǎng)上文化之爭(zhēng),方便了中國(guó)大眾上網(wǎng),但隨之而來(lái)的是,漢字的輸入難問(wèn)題反過(guò)來(lái)成為網(wǎng)絡(luò)中文化的障礙。可以說(shuō),因特網(wǎng)全面中文化呼喚優(yōu)秀的網(wǎng)絡(luò)輸入法出現(xiàn)。
1.因特網(wǎng)領(lǐng)域的漢字輸入特點(diǎn)和不同輸入類(lèi)型
因特網(wǎng)領(lǐng)域的漢字輸入與傳統(tǒng)領(lǐng)域的漢字輸入有很大區(qū)別。因特網(wǎng)上文字處
理總的趨勢(shì)是,愈來(lái)愈專(zhuān)業(yè)化、個(gè)性化。例如,在輸入“英文網(wǎng)址”時(shí),通常會(huì)
鍵入“http://www”、“.com”、“.org”“.cn”、等文字或符號(hào)(“http”是網(wǎng)絡(luò)協(xié)議的
一種即“超文本協(xié)議”,類(lèi)似的還有“ftp”即“文件傳輸協(xié)議”和“telnet”即“遠(yuǎn)
程登錄協(xié)議”;“wwww”是子域名,表示“world wide web即萬(wàn)維網(wǎng)”,常見(jiàn)的還有
“home”、“news”;“org”表示“組織”;“com”表示“公司”;“cn”是“中國(guó)”
英文的縮寫(xiě));輸入“英文電郵地址”時(shí),內(nèi)容都含有“@”這一符號(hào),而且其前面是單位名或人名,后面是郵件服務(wù)器的名稱(chēng);輸入電郵“收件人姓名”時(shí),則從與你常通郵的朋友或熟人等姓名中選擇,如此等等。因特網(wǎng)中文化后也存在著與此相似的特點(diǎn)。
從上可以看出,網(wǎng)上漢字輸入在不同地方有不同的要求和用途,我們稱(chēng)之為不同的輸入類(lèi)型,例如中文網(wǎng)址輸入類(lèi)型、中文電郵地址輸入類(lèi)型、中文姓名輸入類(lèi)型、中文內(nèi)容輸入類(lèi)型,等等。
2.語(yǔ)句庫(kù)的建立和輸入狀態(tài)的轉(zhuǎn)換方式
針對(duì)因特網(wǎng)上漢語(yǔ)輸入的不同類(lèi)型,分別建立各自獨(dú)立的語(yǔ)句庫(kù)。本發(fā)明將漢語(yǔ)的字、詞、句分成兩大類(lèi)型普通庫(kù)和專(zhuān)業(yè)庫(kù)。普通庫(kù)存儲(chǔ)一、二級(jí)漢字和常用詞語(yǔ),作一般輸入之用;專(zhuān)業(yè)庫(kù)可分為中文網(wǎng)址庫(kù)、中文電郵地址庫(kù)、中文姓名庫(kù)、修辭用語(yǔ)庫(kù)、個(gè)人習(xí)慣用語(yǔ)庫(kù)等,作特殊輸入用。
建立幾個(gè)獨(dú)立語(yǔ)句庫(kù)的目的在于,避免因使用一個(gè)字、詞、語(yǔ)句庫(kù)導(dǎo)致詞匯、語(yǔ)句量過(guò)大,而造成重碼率過(guò)高,輸入效率過(guò)低的弊端。
所有專(zhuān)業(yè)語(yǔ)句庫(kù)均可通過(guò)網(wǎng)上下載或人工刪添更新,以保證各專(zhuān)業(yè)語(yǔ)句庫(kù)的開(kāi)放性,也可利用因特網(wǎng)的優(yōu)勢(shì)建立在線(xiàn)動(dòng)態(tài)語(yǔ)句庫(kù)。
在網(wǎng)上進(jìn)行文字輸入具體操作時(shí),隨著網(wǎng)上輸入類(lèi)型的變化,輸入狀態(tài)也隨之變化,而且不同的輸入狀態(tài)調(diào)用不同的語(yǔ)句庫(kù)。這里引進(jìn)一個(gè)“輸入狀態(tài)指針”的概念,輸入狀態(tài)指針總是指向相應(yīng)的輸入類(lèi)型,而且,輸入狀態(tài)是隨著輸入類(lèi)型自動(dòng)轉(zhuǎn)換的。例如
當(dāng)光標(biāo)提示符進(jìn)入中文網(wǎng)址輸入框時(shí),輸入狀態(tài)指針指向網(wǎng)址輸入類(lèi)型,用簡(jiǎn)單高效的編碼方法便可從相關(guān)的網(wǎng)址庫(kù)中輸出所需的中文網(wǎng)址名;當(dāng)光標(biāo)提示符進(jìn)入中文電郵地址輸入框時(shí),輸入狀態(tài)指針指向電郵地址輸入類(lèi)型,便可從電郵地址庫(kù)中輸出所需電郵地址名;當(dāng)光標(biāo)提示符進(jìn)入電郵內(nèi)容書(shū)寫(xiě)框時(shí),輸入狀態(tài)指針又指向普通文字輸入類(lèi)型,則可從普通語(yǔ)句庫(kù)中輸出所要文字。
3.漢語(yǔ)字、詞、句的編碼輸入規(guī)則
本發(fā)明選擇漢語(yǔ)拼音方案為基礎(chǔ)來(lái)進(jìn)行編碼輸入。這是因?yàn)?br>
a.在標(biāo)準(zhǔn)鍵盤(pán)上,漢語(yǔ)拼音與英文字母的聯(lián)系最直接和自然,勿需人為定義難學(xué)難記的新規(guī)則。
b.中國(guó)人從小學(xué)即開(kāi)始學(xué)習(xí)漢語(yǔ)拼音,可以得到我國(guó)廣大網(wǎng)絡(luò)用戶(hù)的認(rèn)可。
但拼音碼的缺點(diǎn)是重碼極多,甚至要翻幾屏去尋找所需要的漢字,詞組輸入相對(duì)單個(gè)漢字而言重碼率略低,但擊鍵次數(shù)過(guò)多,嚴(yán)重影響輸入速度。本發(fā)明為發(fā)揚(yáng)拼音碼的優(yōu)越性而克服其缺陷,提出了以下編碼輸入規(guī)則
①單個(gè)漢字編碼輸入規(guī)則原則拼音前四個(gè)字母(不夠四個(gè)字母的則取全部拼音)+漢字筆劃讀音首字母
(按筆劃順序),但總碼長(zhǎng)不超過(guò)8個(gè)。
本發(fā)明按常規(guī)將漢字筆劃分為6種、(點(diǎn))、一(橫)、丨(豎)、丿(撇)、(捺)、乙(折)?!耙弧笨裳苌?
(提)”;“丨”可衍生出“亅(鉤)”;“乙”又有“”、“乛”、“”、
等幾種形式。
本發(fā)明以6種筆劃為主,兼容
(提)”和“亅(鉤)”。筆劃讀音首字母表單字輸入舉例
因--(YIN)SZHPN 網(wǎng)--WANG)SZPN
大--(DA)HPN 機(jī)--(JI)HSPDPZ
中--(ZHON)SZHS 國(guó)--(GUO)SZHHS
億--(YI)PSZ 迪--(DI)SZHSHD以上括號(hào)內(nèi)為截取單字讀音的拼音字母
②兩字詞的編碼輸入規(guī)則原則每字各取拼音的前兩個(gè)字母(若漢字拼音只有一個(gè)字母,則僅取一個(gè))+
每字首筆劃讀音的第一字母。兩字詞輸入舉例
中國(guó)--ZHGUSS因?yàn)?-YIWESD
輸入--SHRUHP技術(shù)--JISHHH
計(jì)算--JISUDP 機(jī)器--JIQIHS
阿媽--AMAZZ文字--WEZIDD
③三字詞編碼輸入規(guī)則原則前兩字各取拼音的第一個(gè)字母,最后一字取拼音前兩
個(gè)字母(若最后一字拼音只有一個(gè)字母,則僅取一個(gè))。三字詞輸入舉例
因特網(wǎng)--YTWA南京市--NJSH
解放軍--JFJU計(jì)算機(jī)--JSJI
自動(dòng)化--ZDHU膽小鬼--DXGU
④四字詞及四字詞以上的詞組和語(yǔ)句的編碼輸入規(guī)則原則每字各取拼音的首字母。四字詞及四字詞以上的詞組和語(yǔ)句輸入舉例
信息社會(huì)--XXSH
有限公司--YXGS
輸入技術(shù)--SRJS
四個(gè)現(xiàn)代化--SGXDH
我是中國(guó)人--WSZGR
中華人民共和國(guó)--ZHRMGHG
南京億迪電子商務(wù)有限公司--NJYDDZSWYXGS
從上可以看出,單字、兩字詞、四字詞和四字以上的詞或語(yǔ)句之間,不存在編碼重復(fù)現(xiàn)象。單字雖然編碼較長(zhǎng),但采用簡(jiǎn)碼技術(shù)(最少為一級(jí)簡(jiǎn)碼)后,平均擊鍵次數(shù)為3~4次;二字詞通過(guò)采用簡(jiǎn)碼技術(shù)(最少為二級(jí)簡(jiǎn)碼)后,平均擊鍵次數(shù)為2~3次,重碼率極低,三字詞采用簡(jiǎn)碼技術(shù)(最少為三級(jí)簡(jiǎn)碼)后,平均擊鍵次數(shù)為3~4次,幾乎沒(méi)有重碼;四字次或四字以上的詞或語(yǔ)句,碼長(zhǎng)與字?jǐn)?shù)相等,不易產(chǎn)生重碼現(xiàn)象。
總之,本技術(shù)更適合詞組和語(yǔ)句的輸入,對(duì)于單字的輸入速度也比拼音碼有很大的提高,重碼率較低,易學(xué)易用,非常適合在因特網(wǎng)等專(zhuān)業(yè)領(lǐng)域使用。
權(quán)利要求
1.一種網(wǎng)絡(luò)(因特網(wǎng))漢語(yǔ)語(yǔ)句式輸入技術(shù),其特征在于
a.根據(jù)因特網(wǎng)上的文字使用特點(diǎn)、針對(duì)網(wǎng)上不同的輸入類(lèi)型而調(diào)用各自獨(dú)立的“漢語(yǔ)語(yǔ)句庫(kù)”來(lái)進(jìn)行輸入;
b.以漢語(yǔ)拼音為基礎(chǔ)并截取其有效部分來(lái)進(jìn)行編碼,并以漢字筆劃讀音的拼音首字母為補(bǔ)充碼,易學(xué)易用,輸入高效;
本技術(shù)將漢字筆劃分為6種、(點(diǎn))、一(橫)、丨(豎)、丿(撇)、(捺)、乙(折)?!耙弧笨裳苌?br>
提”;“可衍生出”亅(鉤)”;“乙”又有“”“乛”、“”、
等幾種形式。本發(fā)明以6種筆劃為主,兼容
(提)”和“(鉤)”;筆劃讀音首字母表
c.這種輸入法也可在其它須進(jìn)行漢字處理的場(chǎng)合使用。
2.按權(quán)利要求書(shū)1所述的網(wǎng)絡(luò)(因特網(wǎng))漢語(yǔ)輸入技術(shù),其特征在于
a.漢語(yǔ)語(yǔ)句庫(kù)分普通庫(kù)和專(zhuān)業(yè)庫(kù)兩大類(lèi)型;
b.所有專(zhuān)業(yè)語(yǔ)句庫(kù)均可通過(guò)網(wǎng)上下載或人工增刪更新,以保證各專(zhuān)業(yè)語(yǔ)句庫(kù)的開(kāi)放性,也可利用因特網(wǎng)的優(yōu)勢(shì)建立在線(xiàn)動(dòng)態(tài)語(yǔ)句庫(kù);
c.在網(wǎng)上進(jìn)行文字輸入具體操作時(shí),隨著網(wǎng)上輸入類(lèi)型的變化,輸入狀態(tài)也隨之變化,不同的輸入狀態(tài)調(diào)用不同的語(yǔ)句庫(kù),而且輸入狀態(tài)總是隨著輸入類(lèi)型自動(dòng)轉(zhuǎn)換的。
3.按權(quán)利要求書(shū)2所述的網(wǎng)絡(luò)(因特網(wǎng))漢語(yǔ)輸入技術(shù),其特征在于專(zhuān)業(yè)庫(kù)分為中文網(wǎng)址庫(kù)、中文電郵地址庫(kù)、中文姓名庫(kù)、修辭用語(yǔ)庫(kù)、個(gè)人習(xí)慣用語(yǔ)庫(kù),通過(guò)這幾個(gè)專(zhuān)業(yè)庫(kù)搭建因特網(wǎng)的中文平臺(tái)庫(kù),以確保實(shí)現(xiàn)因特網(wǎng)應(yīng)用的中文化。
4.按權(quán)利要求書(shū)1所述的網(wǎng)絡(luò)(因特網(wǎng))漢語(yǔ)輸入技術(shù),其特征在于單字的編碼輸入規(guī)則為拼音前四個(gè)字母(不夠四個(gè)字母的則取全部拼音)+漢字筆劃讀音首字母(按筆劃順序),但總碼長(zhǎng)不超過(guò)8個(gè)。
5.按權(quán)利要求書(shū)1所述的網(wǎng)絡(luò)(因特網(wǎng))漢語(yǔ)輸入技術(shù),其特征在于兩字詞的編碼輸入規(guī)則為每字各取拼音的前兩個(gè)字母(若漢字拼音只有一個(gè)字母,則僅取一個(gè))+每字首筆劃讀音的第一字母。
6.按權(quán)利要求書(shū)1所述的網(wǎng)絡(luò)(因特網(wǎng))漢語(yǔ)輸入技術(shù),其特征在于三字詞的編碼輸入規(guī)則則為前兩字各取拼音的第一個(gè)字母,最后一字取拼音前兩個(gè)字母(若最后一字拼音只有一個(gè)字母,則僅取一個(gè))。
7.按權(quán)利要求書(shū)1所述的網(wǎng)絡(luò)(因特網(wǎng))漢語(yǔ)輸入技術(shù),其特征在于四字詞及四字詞以上的詞組和語(yǔ)句的編碼輸入規(guī)則為每字各取拼音的首字母。
全文摘要
本發(fā)明是建立在因特網(wǎng)應(yīng)用全面中文化基礎(chǔ)上,根據(jù)因特網(wǎng)上的文字使用特點(diǎn),針對(duì)網(wǎng)上不同的輸入類(lèi)型而調(diào)用搭建于因特網(wǎng)中文平臺(tái)庫(kù)中的各自獨(dú)立的“漢語(yǔ)語(yǔ)句庫(kù)”來(lái)進(jìn)行輸入的漢語(yǔ)語(yǔ)句式輸入技術(shù)。它以漢語(yǔ)拼音為基礎(chǔ)并截取其有效部分來(lái)進(jìn)行編碼,以漢字筆劃讀音的拼音首字母為補(bǔ)充碼,輸入高效而易學(xué)易用。
文檔編號(hào)G06F17/30GK1313565SQ0011213
公開(kāi)日2001年9月19日 申請(qǐng)日期2000年3月13日 優(yōu)先權(quán)日2000年3月13日
發(fā)明者陳恭明 申請(qǐng)人:南京億迪電子商務(wù)有限公司