專利名稱:中文拼音及文字匹配方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種中文拼音及文字匹配方法,尤其是一種利用拼音規(guī)則及智能聯(lián)想 的一種中文拼音及文字匹配方法。
背景技術(shù):
電子學(xué)習(xí)類產(chǎn)品飛速發(fā)展的今日,學(xué)習(xí)類消費(fèi)產(chǎn)品所提供的高便捷性,以及內(nèi)建 的巨量語(yǔ)言學(xué)習(xí)資源,使得電子學(xué)習(xí)類消費(fèi)產(chǎn)品愈來(lái)愈受到學(xué)生以及語(yǔ)言學(xué)習(xí)人士的青 睞。其中,中文語(yǔ)言學(xué)習(xí)業(yè)已受到廣泛地關(guān)注。因此,學(xué)習(xí)類消費(fèi)產(chǎn)品,便必須為使用者提 供方便實(shí)用的中文語(yǔ)言學(xué)習(xí)方法,以及快捷清晰的中文文字?jǐn)?shù)據(jù)查詢過(guò)程,方便使用者進(jìn) 行中文語(yǔ)言學(xué)習(xí)。然而,現(xiàn)行的中文文字?jǐn)?shù)據(jù)查詢方法,當(dāng)使用者輸入不完全拼音時(shí),便無(wú)法找到相 關(guān)對(duì)應(yīng)的字詞,使得使用者必須重新輸入正確的拼音才得以找到正確的中文文字,造成使 用上的不便,使用者也無(wú)法快速取得可能的中文文字。
發(fā)明內(nèi)容
本發(fā)明為解決背景技術(shù)中存在的上述技術(shù)問(wèn)題,而提出一種中文拼音及文字匹配 方法。本發(fā)明的技術(shù)解決方案是本發(fā)明為一種中文拼音及文字匹配方法,適用于電子裝 置,其特殊之處在于該方法包含以下步驟1)建立拼音搭配索引表;2)建立拼音對(duì)應(yīng)中文字索引表;3)建立建立拼音音節(jié)索引表;4)接收輸入裝置輸入的不完全拼音;5)根據(jù)分類規(guī)則分析不完全拼音,產(chǎn)生不完全拼音的第一拼音音節(jié)元素;6)利用第一拼音音節(jié)元素比對(duì)拼音音節(jié)索引表中的第二拼音音節(jié)元素,判斷第一 拼音音節(jié)元素,是否屬多個(gè)第二拼音音節(jié)元素的其中之一;7)當(dāng)?shù)诙匆粢艄?jié)元素分別屬第一拼音音節(jié)元素其中之一,則由輸出裝置列出屬 第一拼音音節(jié)元素相關(guān)聯(lián)的拼音數(shù)據(jù),相關(guān)聯(lián)的拼音數(shù)據(jù)根據(jù)拼音搭配索引表,依照其所 對(duì)應(yīng)的中文字?jǐn)?shù)量的多寡進(jìn)行排列;8)接收輸入裝置從相關(guān)聯(lián)的拼音數(shù)據(jù)所選擇的拼音數(shù)據(jù);9)根據(jù)拼音對(duì)應(yīng)中文字索引表,輸出裝置輸出被選擇的拼音數(shù)據(jù)所關(guān)聯(lián)的關(guān)鍵中 文字。上述步驟1)的具體步驟如下從包含所有中文字以及其拼音的中文字及拼音數(shù) 據(jù)庫(kù)中,讀取中文字及中文字拼音數(shù)據(jù),并將具有相同拼音數(shù)據(jù)的中文字予以合并分組后, 統(tǒng)計(jì)其分組內(nèi)的中文字個(gè)數(shù),進(jìn)而建立拼音搭配索引表,拼音搭配索引表包括拼音數(shù)據(jù),及 拼音數(shù)據(jù)所對(duì)應(yīng)的中文字?jǐn)?shù)量。
3
上述步驟2)的具體步驟如下從中文字及拼音數(shù)據(jù)庫(kù)中,讀取中文字及中文字拼 音數(shù)據(jù),并將相同拼音對(duì)不同中文字分組,進(jìn)而建立拼音對(duì)應(yīng)中文字索引表,拼音對(duì)應(yīng)中文 字索引表包括拼音數(shù)據(jù),及拼音數(shù)據(jù)所對(duì)應(yīng)的中文字,中文字的數(shù)量與多個(gè)拼音數(shù)據(jù)所對(duì) 應(yīng)的中文字?jǐn)?shù)量相同。上述步驟3)的具體步驟如下從中文字及拼音數(shù)據(jù)庫(kù)中,讀取中文字及中文字拼 音數(shù)據(jù),并參考分類規(guī)則,分類規(guī)則為聲母表、韻母表以及漢語(yǔ)拼音組合表,將拼音數(shù)據(jù)分 拆成多個(gè)第二拼音音節(jié)元素,并將中文字對(duì)多個(gè)第二拼音音節(jié)元素分組,進(jìn)而建立拼音音 節(jié)索引。上述步驟6)中判斷第一拼音音節(jié)元素,是否屬多個(gè)第二拼音音節(jié)元素的其中之 一時(shí),若否,則返回步驟4)再次接收輸入裝置輸入拼音。6、根根據(jù)權(quán)利要求5所述的一種 漢語(yǔ)拼音及文字匹配方法,其特征在于所述步驟5)中的分類規(guī)則包含聲母表、韻母表以 及漢語(yǔ)拼音組合表。本發(fā)明提供的中文拼音及文字匹配方法,可在使用者輸入不完全拼音時(shí),也可以 找到正確的中文文字,大大提高了使用者利用拼音輸入文字的便利。
圖1為本發(fā)明中文拼音及文字匹配方法的方塊示意圖。
具體實(shí)施例方式參見(jiàn)圖1,該方法適用于電子系統(tǒng),包含下列步驟(SlO)建立拼音搭配索引表,并儲(chǔ)存在電子裝置的儲(chǔ)存單元中本步驟從包含所有中文字以及其拼音的中文字及拼音數(shù)據(jù)庫(kù)中,讀取中文字及中 文字拼音數(shù)據(jù),并將具有相同拼音數(shù)據(jù)的中文字予以合并分組后,統(tǒng)計(jì)其分組內(nèi)的中文字 個(gè)數(shù),進(jìn)而建立拼音搭配索引表,所以拼音搭配索引表包括拼音數(shù)據(jù),及拼音數(shù)據(jù)所對(duì)應(yīng)的 中文字?jǐn)?shù)量;(S20)建立拼音對(duì)應(yīng)中文字索引表,并儲(chǔ)存在儲(chǔ)存單元中本步驟從中文字及拼音數(shù)據(jù)庫(kù)中,讀取中文字及中文字拼音數(shù)據(jù),并將相同拼音 對(duì)不同中文字分組,進(jìn)而建立拼音對(duì)應(yīng)中文字索引表,所以拼音對(duì)應(yīng)中文字索引表包括拼 音數(shù)據(jù),及拼音數(shù)據(jù)所對(duì)應(yīng)的中文字,中文字的數(shù)量與多個(gè)拼音數(shù)據(jù)所對(duì)應(yīng)的中文字?jǐn)?shù)量 相同;(S30)建立拼音音節(jié)索引表,并儲(chǔ)存在儲(chǔ)存單元中本步驟從中文字及拼音數(shù)據(jù)庫(kù)中,讀取中文字及中文字拼音數(shù)據(jù),并參考分類規(guī) 則,分類規(guī)則為聲母表、韻母表以及漢語(yǔ)拼音組合表,將拼音數(shù)據(jù)分拆成多個(gè)第二拼音音節(jié) 元素,并將中文字對(duì)多個(gè)第二拼音音節(jié)元素分組,進(jìn)而建立拼音音節(jié)索引表,其中,聲母表 為一系列的子音如s、f、g、C、e···,韻母表為一系列的元音如a、e、i、o、u···,而漢語(yǔ)拼音組 合表則為一系列拼音的組合如cha、chai、chan、chang···;(S40)接收輸入裝置輸入的不完全拼音;(S50)根據(jù)分類規(guī)則分析不完全拼音,產(chǎn)生不完全拼音的第一拼音音節(jié)元素;(S60)判斷第一拼音音節(jié)元素,是否屬多個(gè)第二拼音音節(jié)元素的其中之一
本步驟利用第一拼音音節(jié)元素比對(duì)拼音音節(jié)索引表中的第二拼音音節(jié)元素;(S70)當(dāng)?shù)诙匆粢艄?jié)元素分別屬第一拼音音節(jié)元素的其中之一,則由輸出裝置 列出屬第一拼音音節(jié)元素相關(guān)聯(lián)的拼音數(shù)據(jù),相關(guān)聯(lián)的拼音數(shù)據(jù)依照其所對(duì)應(yīng)的中文字?jǐn)?shù) 量的多寡進(jìn)行排列,其中,若第二拼音音節(jié)元素不屬于第一拼音音節(jié)元素的其中之一,則前 往步驟S40 ;(S80)接收輸入裝置從相關(guān)聯(lián)的拼音數(shù)據(jù)所選擇的拼音數(shù)據(jù);(S90)輸出裝置輸出被選擇的拼音數(shù)據(jù)所關(guān)聯(lián)的關(guān)鍵中文字本步驟根據(jù)拼音對(duì)應(yīng)中文字索引表及在步驟S80中所被選擇的拼音選項(xiàng),由顯示 裝置列出所相關(guān)連的中文字。本發(fā)明實(shí)施例,如使用者輸入不完全拼音sheg,則此時(shí)先根據(jù)分類規(guī)則分析不完 全拼音,產(chǎn)生不完全拼音的第一拼音音節(jié)元素可能出現(xiàn)的拼音搭配結(jié)果,如S、h、sh、she···。 當(dāng)處理裝置判斷第一拼音音節(jié)元素,屬拼音音節(jié)索引表中的多個(gè)第二拼音音節(jié)元素的其中 之一時(shí),便由輸出裝置列出屬第一拼音音節(jié)元素相關(guān)聯(lián)的拼音數(shù)據(jù),并根據(jù)拼音搭配索引 表,照其所對(duì)應(yīng)的中文字?jǐn)?shù)量的多寡進(jìn)行排列,如下列所示一個(gè)字sheng兩個(gè)字:shasheng shakeng shewang shegen shouheng三個(gè)字:shihuideng sihezhong sihefang shafengjing四個(gè)字shehuifengong再來(lái),接收由輸入裝置從相關(guān)聯(lián)的拼音數(shù)據(jù)所選擇的拼音數(shù)據(jù)后,根據(jù)中文字索 引表,由顯示裝置列出所相關(guān)連的中文字,如下列所示一個(gè)字生繩省勝…兩個(gè)字殺生沙坑奢望舌根守恒…三個(gè)字石灰燈死荷重四合房殺風(fēng)景…四個(gè)字社會(huì)分工…例如選擇了 shihuideng則出現(xiàn)“石灰燈”,選擇了 shakeng則顯示“沙坑”等。如 此,當(dāng)使用者輸入不完全拼音時(shí),便不會(huì)無(wú)法找到相關(guān)對(duì)應(yīng)的字詞,而使得使用者必須重新 輸入正確的拼音,才得以找到正確的中文文字。
權(quán)利要求
一種中文拼音及文字匹配方法,適用于電子裝置,其特征在于該方法包含以下步驟1)建立拼音搭配索引表;2)建立拼音對(duì)應(yīng)中文字索引表;3)建立建立拼音音節(jié)索引表;4)接收輸入裝置輸入的不完全拼音;5)根據(jù)分類規(guī)則分析不完全拼音,產(chǎn)生不完全拼音的第一拼音音節(jié)元素;6)利用第一拼音音節(jié)元素比對(duì)拼音音節(jié)索引表中的第二拼音音節(jié)元素,判斷第一拼音音節(jié)元素,是否屬多個(gè)第二拼音音節(jié)元素的其中之一;7)當(dāng)?shù)诙匆粢艄?jié)元素分別屬第一拼音音節(jié)元素其中之一,則由輸出裝置列出屬第一拼音音節(jié)元素相關(guān)聯(lián)的拼音數(shù)據(jù),相關(guān)聯(lián)的拼音數(shù)據(jù)根據(jù)拼音搭配索引表,依照其所對(duì)應(yīng)的中文字?jǐn)?shù)量的多寡進(jìn)行排列;8)接收輸入裝置從相關(guān)聯(lián)的拼音數(shù)據(jù)所選擇的拼音數(shù)據(jù);9)根據(jù)拼音對(duì)應(yīng)中文字索引表,輸出裝置輸出被選擇的拼音數(shù)據(jù)所關(guān)聯(lián)的關(guān)鍵中文字。
2.根據(jù)權(quán)利要求1所述的一種中文拼音及文字匹配方法,其特征在于所述步驟1)的 具體步驟如下從包含所有中文字以及其拼音的中文字及拼音數(shù)據(jù)庫(kù)中,讀取中文字及中 文字拼音數(shù)據(jù),并將具有相同拼音數(shù)據(jù)的中文字予以合并分組后,統(tǒng)計(jì)其分組內(nèi)的中文字 個(gè)數(shù),進(jìn)而建立拼音搭配索引表,拼音搭配索引表包括拼音數(shù)據(jù),及拼音數(shù)據(jù)所對(duì)應(yīng)的中文字?jǐn)?shù)量。
3.根據(jù)權(quán)利要求2所述的一種中文拼音及文字匹配方法,其特征在于所述步驟2)的 具體步驟如下從中文字及拼音數(shù)據(jù)庫(kù)中,讀取中文字及中文字拼音數(shù)據(jù),并將相同拼音對(duì) 不同中文字分組,進(jìn)而建立拼音對(duì)應(yīng)中文字索引表,拼音對(duì)應(yīng)中文字索引表包括拼音數(shù)據(jù), 及拼音數(shù)據(jù)所對(duì)應(yīng)的中文字,中文字的數(shù)量與多個(gè)拼音數(shù)據(jù)所對(duì)應(yīng)的中文字?jǐn)?shù)量相同。
4.根據(jù)權(quán)利要求3所述的一種中文拼音及文字匹配方法,其特征在于所述步驟3) 的具體步驟如下從中文字及拼音數(shù)據(jù)庫(kù)中,讀取中文字及中文字拼音數(shù)據(jù),并參考分類規(guī) 則,分類規(guī)則為聲母表、韻母表以及漢語(yǔ)拼音組合表,將拼音數(shù)據(jù)分拆成多個(gè)第二拼音音節(jié) 元素,并將中文字對(duì)多個(gè)第二拼音音節(jié)元素分組,進(jìn)而建立拼音音節(jié)索引。
5.根根據(jù)權(quán)利要求1或2或3或4所述的一種中文拼音及文字匹配方法,其特征在 于所述步驟6)中判斷第一拼音音節(jié)元素,是否屬多個(gè)第二拼音音節(jié)元素的其中之一時(shí), 若否,則返回步驟4)再次接收輸入裝置輸入拼音。
6.根根據(jù)權(quán)利要求5所述的一種中文拼音及文字匹配方法,其特征在于所述步驟5) 中的分類規(guī)則包含聲母表、韻母表以及漢語(yǔ)拼音組合表。
全文摘要
本發(fā)明提供一種中文拼音及文字匹配方法,適用電子系統(tǒng),包含建立拼音搭配索引表、拼音對(duì)應(yīng)中文字索引表以及拼音音節(jié)索引表后,接收輸入裝置輸入不完全拼音,并根據(jù)聲母表、韻母表、漢語(yǔ)拼音組合表分析不完全拼音,并比對(duì)各索引表,由輸出裝置列出相關(guān)聯(lián)的拼音數(shù)據(jù)后,接收輸入裝置所選擇的拼音數(shù)據(jù),并輸出被選擇的拼音數(shù)據(jù)所關(guān)聯(lián)的中文字。本發(fā)明可在使用者輸入不完全拼音時(shí),也可以找到正確的中文文字。
文檔編號(hào)G06F17/30GK101986244SQ201010528519
公開(kāi)日2011年3月16日 申請(qǐng)日期2010年11月3日 優(yōu)先權(quán)日2010年11月3日
發(fā)明者黨水朝, 趙黨建, 陳淮琰 申請(qǐng)人:無(wú)敵科技(西安)有限公司