一種字符的轉(zhuǎn)換方法及裝置的制造方法
【專利摘要】本發(fā)明是關(guān)于一種字符的轉(zhuǎn)換方法及裝置,該方法包括:接收待轉(zhuǎn)換文本;在三叉搜索樹中確定與所述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn),所述三叉搜索樹的節(jié)點(diǎn)中預(yù)先存儲(chǔ)有詞語與拼音的對(duì)應(yīng)關(guān)系;在所述目標(biāo)節(jié)點(diǎn)中提取所述待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音;輸出所述待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音。在三叉搜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的過程中,在三叉搜索樹中每查找一次待轉(zhuǎn)換文本對(duì)應(yīng)的節(jié)點(diǎn),均能減少一半的查詢工作量,所以本發(fā)明提供的方案可以快速的查詢到待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn),并在該目標(biāo)節(jié)點(diǎn)中得到待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音,從而提高了查詢效率。
【專利說明】
-種字符的轉(zhuǎn)換方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明實(shí)施例設(shè)及通信技術(shù)領(lǐng)域,更具體的說,設(shè)及字符的轉(zhuǎn)換方法及裝置。
【背景技術(shù)】
[0002] 目前,為了實(shí)現(xiàn)拼音與詞語的相互轉(zhuǎn)換,通常需要預(yù)先建立一個(gè)強(qiáng)大的詞庫,在詞 庫中需要記錄所有的詞語與拼音的對(duì)應(yīng)關(guān)系。其中,詞語至少包括兩個(gè)漢字。
[0003] 在用戶輸入一組拼音時(shí),服務(wù)器需要從頭到尾遍歷整個(gè)詞庫來查詢?cè)撈匆魧?duì)應(yīng)的 詞語,所W服務(wù)器可能需要消耗較長時(shí)間才能夠查詢到該拼音對(duì)應(yīng)的詞語。同理,在用戶輸 入詞語時(shí),服務(wù)器需要從頭到尾遍歷整個(gè)詞庫來查詢?cè)撛~語對(duì)應(yīng)的拼音,所W服務(wù)器同樣 需要消耗較長時(shí)間才能夠查詢到該詞語對(duì)應(yīng)的拼音。所W上述利用詞庫的方式進(jìn)行詞語與 拼音的轉(zhuǎn)換,其查詢效率非常低。
[0004] 因此,如何提高拼音與詞語相互轉(zhuǎn)換的查詢效率,成為目前亟需解決的技術(shù)問題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明提供一種字符的轉(zhuǎn)換方法及裝置,W提高查詢的效率。
[0006] 根據(jù)本發(fā)明實(shí)施例的第一方面,提供一種字符的轉(zhuǎn)換方法,包括:
[0007] 接收待轉(zhuǎn)換文本,所述待轉(zhuǎn)換文本為拼音或詞語;
[000引在=叉捜索樹中確定與所述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn),所述=叉捜索樹的節(jié)點(diǎn) 中預(yù)先存儲(chǔ)有詞語與拼音的對(duì)應(yīng)關(guān)系;
[0009] 在所述目標(biāo)節(jié)點(diǎn)中提取所述待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音;
[0010] 輸出所述待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音。
[0011] 可選的,在所述接收待轉(zhuǎn)換文本的步驟之后,所述方法還包括:
[0012] 判斷所述待轉(zhuǎn)換文本是否可W被拆分成分詞;
[0013] 在所述待轉(zhuǎn)換文本可W被拆分成分詞時(shí),利用分詞算法對(duì)所述待轉(zhuǎn)換文本進(jìn)行拆 分得到分詞結(jié)果,在所述=叉捜索樹中確定與所述分詞結(jié)果中的分詞對(duì)應(yīng)的第一指定節(jié) 點(diǎn),提取所述第一指定節(jié)點(diǎn)中所述分詞對(duì)應(yīng)的詞語或拼音,輸出所述分詞對(duì)應(yīng)的詞語或拼 首;
[0014] 在所述待轉(zhuǎn)換文本不可被拆分成分詞時(shí),觸發(fā)所述在=叉捜索樹中確定與所述待 轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟。
[0015] 可選的,所述在=叉捜索樹中確定與所述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟包 括:
[0016] 在所述待轉(zhuǎn)換文本為一個(gè)詞語時(shí),在詞語=叉捜索樹的根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄 弟節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的首個(gè)漢字的Ascn碼值相同的第二指定節(jié)點(diǎn);
[0017] 在所述第二指定節(jié)點(diǎn)的子節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的其余漢字的Ascn碼 值相同的第=指定節(jié)點(diǎn);
[0018] 將所述第=指定節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),所述一個(gè)詞語至少包括兩個(gè)漢字。
[0019] 可選的,所述在=叉捜索樹中確定與所述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟包 括:
[0020] 在所述待轉(zhuǎn)換文本為至少兩組拼音時(shí),在拼音=叉捜索樹的根節(jié)點(diǎn)和所述根節(jié)點(diǎn) 的兄弟節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的首組拼音相同的第四指定節(jié)點(diǎn);
[0021] 在所述第四指定節(jié)點(diǎn)的子節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的其余組拼音相同的 第五指定節(jié)點(diǎn);
[0022] 將所述第五指定節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),所述至少兩組拼音中的每組拼音均對(duì)應(yīng)一 個(gè)漢字。
[0023] 可選的,所述在=叉捜索樹中確定與所述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟之 前,所述方法還包括:
[0024] 確定與標(biāo)準(zhǔn)詞庫中每個(gè)詞語對(duì)應(yīng)的Ascn碼值;
[0025] 根據(jù)Ascn碼值的大小將所述標(biāo)準(zhǔn)詞庫中每個(gè)詞語的首個(gè)漢字添加到所述S叉捜 索樹的根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中;
[0026] 將所述標(biāo)準(zhǔn)詞庫中每個(gè)詞語的非首個(gè)漢字和拼音添加到所述=叉捜索樹的所述 根節(jié)點(diǎn)的子節(jié)點(diǎn)中,W及所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)中。
[0027] 可選的,所述在=叉捜索樹中確定與所述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟之 前,所述方法還包括:
[0028] 確定標(biāo)準(zhǔn)詞庫中每對(duì)拼音的首字母,其中,每組拼音至少包括一個(gè)拼音,每對(duì)拼音 至少包括兩組拼音,一組拼音對(duì)應(yīng)一個(gè)漢字,一對(duì)拼音對(duì)應(yīng)一個(gè)詞語;
[0029] 根據(jù)首字母的順序?qū)⑺鰳?biāo)準(zhǔn)詞庫中每對(duì)拼音的首組拼音添加到所述=叉捜索 樹的根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中;
[0030] 將所述標(biāo)準(zhǔn)詞庫中每對(duì)拼音的非首組拼音和每對(duì)拼音對(duì)應(yīng)的詞語添加到所述= 叉捜索樹的所述根節(jié)點(diǎn)的子節(jié)點(diǎn)中,W及所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)中。
[0031] 根據(jù)本發(fā)明實(shí)施例的第二方面,提供一種字符的轉(zhuǎn)換裝置,包括:
[0032] 接收模塊,用于接收待轉(zhuǎn)換文本,所述待轉(zhuǎn)換文本為拼音或詞語;
[0033] 第一確定模塊,用于在=叉捜索樹中確定與所述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn),所 述=叉捜索樹的節(jié)點(diǎn)中預(yù)先存儲(chǔ)有詞語與拼音的對(duì)應(yīng)關(guān)系;
[0034] 提取模塊,用于在所述目標(biāo)節(jié)點(diǎn)中提取所述待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音;
[0035] 輸出模塊,用于輸出所述待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音。
[0036] 可選的,所述裝置還包括:
[0037] 判斷模塊,用于判斷所述待轉(zhuǎn)換文本是否可W被拆分成分詞;
[0038] 第一執(zhí)行模塊,用于在所述待轉(zhuǎn)換文本可W被拆分成分詞時(shí),利用分詞算法對(duì)所 述待轉(zhuǎn)換文本進(jìn)行拆分得到分詞結(jié)果,在所述=叉捜索樹中確定與所述分詞結(jié)果中的分詞 對(duì)應(yīng)的第一指定節(jié)點(diǎn),提取所述第一指定節(jié)點(diǎn)中所述分詞對(duì)應(yīng)的詞語或拼音,輸出所述分 詞對(duì)應(yīng)的詞語或拼音;
[0039] 第二執(zhí)行模塊,用于在所述待轉(zhuǎn)換文本不可被拆分成分詞時(shí),觸發(fā)所述第一確定 模塊。
[0040] 可選的,所述第一確定模塊包括:
[0041] 第一確定子模塊,用于在所述待轉(zhuǎn)換文本為一個(gè)詞語時(shí),在詞語=叉捜索樹的根 節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的首個(gè)漢字的ASCII碼值相同的 第二指定節(jié)點(diǎn);
[0042] 第二確定子模塊,用于在所述第二指定節(jié)點(diǎn)的子節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中 的其余漢字的Ascn碼值相同的第S指定節(jié)點(diǎn);
[0043] 第=確定子模塊,用于將所述第=指定節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),所述一個(gè)詞語至少 包括兩個(gè)漢字。
[0044] 可選的,所述第一確定模塊包括:
[0045] 第四確定子模塊,用于在所述待轉(zhuǎn)換文本為至少兩組拼音時(shí),在拼音=叉捜索樹 的根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的首組拼音相同的第四指 定節(jié)點(diǎn);
[0046] 第五確定子模塊,用于在所述第四指定節(jié)點(diǎn)的子節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中 的其余組拼音相同的第五指定節(jié)點(diǎn);
[0047] 第六確定子模塊,用于將所述第五指定節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),所述至少兩組拼音 中的每組拼音均對(duì)應(yīng)一個(gè)漢字。
[004引可選的,所述裝置還包括:
[0049] 第二確定模塊,用于確定與標(biāo)準(zhǔn)詞庫中每個(gè)詞語對(duì)應(yīng)的Ascn碼值;
[0050] 第一添加模塊,用于根據(jù)ASCII碼值的大小將所述標(biāo)準(zhǔn)詞庫中每個(gè)詞語的首個(gè)漢 字添加到所述=叉捜索樹的根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中;
[0051] 第二添加模塊,用于將所述標(biāo)準(zhǔn)詞庫中每個(gè)詞語的非首個(gè)漢字和拼音添加到所述 =叉捜索樹的所述根節(jié)點(diǎn)的子節(jié)點(diǎn)中,W及所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)中。
[0化2] 可選的,所述裝置還包括:
[0053] 第=確定模塊,用于確定標(biāo)準(zhǔn)詞庫中每對(duì)拼音的首字母,其中,每組拼音至少包括 一個(gè)拼音,每對(duì)拼音至少包括兩組拼音,一組拼音對(duì)應(yīng)一個(gè)漢字,一對(duì)拼音對(duì)應(yīng)一個(gè)詞語;
[0054] 第=添加模塊,用于根據(jù)首字母的順序?qū)⑺鰳?biāo)準(zhǔn)詞庫中每對(duì)拼音的首組拼音添 加到所述=叉捜索樹的根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中;
[0055] 第四添加模塊,用于將所述標(biāo)準(zhǔn)詞庫中每對(duì)拼音的非首組拼音和每對(duì)拼音對(duì)應(yīng)的 詞語添加到所述=叉捜索樹的所述根節(jié)點(diǎn)的子節(jié)點(diǎn)中,W及所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié) 點(diǎn)中。
[0056] 與現(xiàn)有技術(shù)相比,本實(shí)施例提供的技術(shù)方案具有W下優(yōu)點(diǎn)和特點(diǎn):
[0057] 在本發(fā)明提供的方案中,在=叉捜索樹的節(jié)點(diǎn)中會(huì)預(yù)先存儲(chǔ)有詞語與拼音的對(duì)應(yīng) 關(guān)系,在接收到待轉(zhuǎn)換文本后,可W在=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)。如 果待轉(zhuǎn)換文本為拼音,那么可W在目標(biāo)節(jié)點(diǎn)中提取與拼音對(duì)應(yīng)的詞語;如果待轉(zhuǎn)換文本為 詞語,那么可W在目標(biāo)節(jié)點(diǎn)中提取與詞語對(duì)應(yīng)的拼音,所W使得拼音與詞語可W相互轉(zhuǎn)換。 在=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的過程中,在=叉捜索樹中每查找一次 待轉(zhuǎn)換文本對(duì)應(yīng)的節(jié)點(diǎn),均能減少一半的查詢工作量,所W本發(fā)明提供的方案可W快速的 查詢到待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn),并在該目標(biāo)節(jié)點(diǎn)中得到待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼 音,從而提高了查詢效率。
【附圖說明】
[0058] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所 需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施 例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可W根據(jù)運(yùn)些附圖獲 得其他的附圖。
[0059] 圖1為本發(fā)明實(shí)施例提供的一種字符的轉(zhuǎn)換方法的流程圖。
[0060] 圖2為本發(fā)明實(shí)施例提供的詞典S叉捜索樹的示意圖。
[0061 ]圖3為本發(fā)明實(shí)施例提供的拼音=叉捜索樹的示意圖。
[0062] 圖4為本發(fā)明實(shí)施例提供的另一種字符的轉(zhuǎn)換方法的流程圖。
[0063] 圖5為本發(fā)明實(shí)施例提供的一種字符的轉(zhuǎn)換裝置的示意圖。
【具體實(shí)施方式】
[0064] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整的描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于 本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0065] 圖1為本發(fā)明實(shí)施例提供的一種字符的轉(zhuǎn)換方法的流程圖。本發(fā)明實(shí)施例提供的 字符的轉(zhuǎn)換方法可W快速的在=叉捜索樹中查詢到待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn),并在該目 標(biāo)節(jié)點(diǎn)中得到待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音,從而提高了查詢效率。該方法包括W下步驟。
[0066] 步驟S11、接收待轉(zhuǎn)換文本。
[0067] 其中,本發(fā)明實(shí)施例提供的方法可W應(yīng)用于可安裝應(yīng)用軟件的終端內(nèi),終端可W 為智能手機(jī)、平板電腦、筆記本電腦或臺(tái)式電腦等設(shè)備。
[0068] 本發(fā)明實(shí)施例適用的應(yīng)用場(chǎng)景非常多。例如,本發(fā)明實(shí)施例可W應(yīng)用在電子書內(nèi), 用于對(duì)電子書內(nèi)的拼音或詞語進(jìn)行相互轉(zhuǎn)換;又如,本發(fā)明實(shí)施例可W應(yīng)用在捜索引擎內(nèi), 用于對(duì)捜索引擎的輸入框內(nèi)的拼音或詞語進(jìn)行相互轉(zhuǎn)換。
[0069] 當(dāng)然,本發(fā)明實(shí)施例并不局限于上述提到的場(chǎng)景中,還可W應(yīng)用在其他需要拼音 或詞語進(jìn)行相互轉(zhuǎn)換的場(chǎng)景中。
[0070] 待轉(zhuǎn)換文本既可W為詞語的拼音的首字母,也可W為詞語的拼音的全拼,還可W 為一個(gè)詞語。其中,一個(gè)詞語至少包括兩個(gè)漢字。
[0071] 步驟S12、在=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)。
[0072] 其中,在執(zhí)行步驟S12之前,為了將詞語轉(zhuǎn)換為拼音,本發(fā)明實(shí)施例需要建立詞語 =叉捜索樹,并將標(biāo)準(zhǔn)詞庫中的詞語和與詞語對(duì)應(yīng)的拼音添加到詞語=叉捜索樹的節(jié)點(diǎn) 中。同理,為了將拼音轉(zhuǎn)換為詞語,本發(fā)明實(shí)施例還需要建立拼音=叉捜索樹,并將標(biāo)準(zhǔn)詞 庫中的拼音和與拼音對(duì)應(yīng)的詞語添加到拼音=叉捜索樹的節(jié)點(diǎn)中。
[0073] 下面介紹建立詞語=叉捜索樹的方式。
[0074] 建立詞語=叉捜索樹的方式包括W下步驟:首先,確定與標(biāo)準(zhǔn)詞庫中每個(gè)詞語對(duì) 應(yīng)的ASCII碼值;然后,根據(jù)ASCII碼值的大小將標(biāo)準(zhǔn)詞庫中每個(gè)詞語的首個(gè)漢字添加到詞 語=叉捜索樹的根節(jié)點(diǎn)和根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中;最后,將標(biāo)準(zhǔn)詞庫中每個(gè)詞語的非首個(gè)漢 字和拼音添加到詞語=叉捜索樹的根節(jié)點(diǎn)的子節(jié)點(diǎn)中,W及根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn) 中。
[0075] 其中,詞語=叉捜索樹的根節(jié)點(diǎn)存儲(chǔ)標(biāo)準(zhǔn)詞庫中每個(gè)詞語的首個(gè)漢字的ASCII碼 值居中的漢字,小于該ASCII碼值的首個(gè)漢字位于根節(jié)點(diǎn)的左側(cè)分支,大于該ASCII碼值的 首個(gè)漢字位于根節(jié)點(diǎn)的右側(cè)分支。
[0076] 為了形象的說明上述建立詞語=叉捜索樹的過程,下面通過舉例說明。
[0077] 請(qǐng)參見表1所示,表1所示的為標(biāo)準(zhǔn)詞庫中存儲(chǔ)的詞語、該詞語的拼音首字母和該 詞語的拼音全拼。
[007引
[0079] 表 1
[0080] 例如,請(qǐng)參見圖2所示,并結(jié)合表1所示,假設(shè)標(biāo)準(zhǔn)詞庫中存儲(chǔ)詞語"中國"、"民族"、 "社會(huì)"、"群體"和"風(fēng)格",W及運(yùn)些詞語的拼音首字母和拼音全拼。假設(shè)標(biāo)準(zhǔn)詞庫中每個(gè)詞 語的首個(gè)漢字的Ascn碼值由大到小的順序?yàn)?群"、"風(fēng)"、"中"、"社"和"民",將標(biāo)準(zhǔn)詞庫的 詞語中首個(gè)漢字的Ascn碼值居中的漢字"中"添加到詞語S叉捜索樹的根節(jié)點(diǎn)中,并將 ASCII碼值大于"中"的"群"和"風(fēng)"添加到根節(jié)點(diǎn)的右側(cè)分支,由于"群"的ASCII碼值大于 "風(fēng)"的ASCII碼值,所W將"群"添加到"風(fēng)"所在節(jié)點(diǎn)的右側(cè)分支。再將ASCII碼值小于"中" 的"民"和"社"添加到根節(jié)點(diǎn)的左側(cè)分支,由于"社"的ASCII碼值大于"民"的ASCII碼值,所 W將"社"添加到"民"所在節(jié)點(diǎn)的右側(cè)分支。最后,將標(biāo)準(zhǔn)詞庫中每個(gè)詞語的非首個(gè)漢字和 拼音''國,z邑,zhon邑邑UO''、"族,mz'minzu''、''格,f邑,fen邑邑e''、''體,qt'qunti''和''會(huì),sh, shehui"分別添加到詞語S叉捜索樹的根節(jié)點(diǎn)的子節(jié)點(diǎn)中,W及根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié) 點(diǎn)中。
[0081] 下面介紹建立拼音=叉捜索樹的方式。
[0082] 建立拼音=叉捜索樹的方式包括W下步驟:首先,確定標(biāo)準(zhǔn)詞庫中每對(duì)拼音的首 字母,其中,每組拼音至少包括一個(gè)拼音,每對(duì)拼音至少包括兩組拼音,一組拼音對(duì)應(yīng)一個(gè) 漢字,一對(duì)拼音對(duì)應(yīng)一個(gè)詞語;然后,根據(jù)首字母的順序?qū)?biāo)準(zhǔn)詞庫中每對(duì)拼音的首組拼音 添加到拼音=叉捜索樹的根節(jié)點(diǎn)和根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中;最后,將標(biāo)準(zhǔn)詞庫中每對(duì)拼音的 非首組拼音和每對(duì)拼音對(duì)應(yīng)的詞語添加到拼音=叉捜索樹的根節(jié)點(diǎn)的子節(jié)點(diǎn)中,W及根節(jié) 點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)中。
[0083] 其中,拼音=叉捜索樹的根節(jié)點(diǎn)存儲(chǔ)標(biāo)準(zhǔn)詞庫中首字母居中的一對(duì)拼音的首組拼 音,字母順序小于該根節(jié)點(diǎn)存儲(chǔ)的首字母的其他對(duì)拼音的首組拼音位于根節(jié)點(diǎn)的左側(cè)分 支,字母順序大于該根節(jié)點(diǎn)存儲(chǔ)的首字母的其他對(duì)拼音的首組拼音位于根節(jié)點(diǎn)的右側(cè)分 支。
[0084] 為了形象的說明上述建立拼音=叉捜索樹的過程,下面通過舉例說明。
[0085] 例如,請(qǐng)參見圖3所示,并結(jié)合表1所示,假設(shè)標(biāo)準(zhǔn)詞庫中存儲(chǔ)詞語"中國"、"民族"、 "社會(huì)"、"群體"和"風(fēng)格",W及運(yùn)些詞語的拼音首字母和拼音全拼。由于標(biāo)準(zhǔn)詞庫中每對(duì)拼 音的首字母由大到小的順序?yàn)閂'、V'、V'、V'和T',所W將首字母居中的V'對(duì)應(yīng)的一 對(duì)拼音Vnti"的首組拼音Vn"添加到拼音S叉捜索樹的根節(jié)點(diǎn)中,由于"zhong"的首字 母的字母順序大于"she"的首字母的字母順序,所W將"zhong"添加到"she"所在節(jié)點(diǎn)的右 側(cè)分支。由于"min"的首字母的字母順序大于吁eng"的首字母的字母順序,所W將"min"添 加到"feng"所在節(jié)點(diǎn)的右側(cè)分支。最后,將標(biāo)準(zhǔn)詞庫中每對(duì)拼音的非首組拼音和每對(duì)拼音 對(duì)應(yīng)的詞語"guo,zg,中國"、"hui,sh,社會(huì)'、"ti,qt,群體"、"zu,mz,民族'和"ge,fg,風(fēng)格' 添加到拼音=叉捜索樹的根節(jié)點(diǎn)的子節(jié)點(diǎn)中,W及根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)中。
[0086] 由于標(biāo)準(zhǔn)詞庫通常包括5至6千個(gè)詞語及其拼音,上述例子僅為說明本發(fā)明實(shí)施例 的原理,所W未將標(biāo)準(zhǔn)詞庫中5至6千個(gè)詞語及其拼音全部寫出來。
[0087] 在=叉捜索樹建立完成W后,便可W在=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目 標(biāo)節(jié)點(diǎn)。下面簡要介紹一下在=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的過程。
[0088] 如果待轉(zhuǎn)換文本為一個(gè)詞語,那么需要利用上述提到的詞語=叉捜索樹進(jìn)行確 定,在詞語=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟為:首先,在待轉(zhuǎn)換文本 為一個(gè)詞語時(shí),在詞語=叉捜索樹的根節(jié)點(diǎn)和根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中確定與待轉(zhuǎn)換文本中的 首個(gè)漢字的Ascn碼值相同的第二指定節(jié)點(diǎn)。然后,在第二指定節(jié)點(diǎn)的子節(jié)點(diǎn)中確定與待轉(zhuǎn) 換文本中的其余漢字的ASCII碼值相同的第S指定節(jié)點(diǎn)。最后,將第S指定節(jié)點(diǎn)確定為目標(biāo) 節(jié)點(diǎn),一個(gè)詞語至少包括兩個(gè)漢字。
[0089] 為了形象的說明上述在詞語=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的 過程,下面通過舉例說明。
[0090] 例如,請(qǐng)參見圖2所示,并結(jié)合表1所示,已經(jīng)預(yù)先建立好詞語=叉捜索樹,標(biāo)準(zhǔn)詞 庫中每個(gè)詞語的首個(gè)漢字的Ascn碼值由大到小的順序?yàn)?群"、"風(fēng)"、"中"、"社"和"民"。假 設(shè)待轉(zhuǎn)換文本為詞語"風(fēng)格",那么先比較"風(fēng)"的Ascn碼值與詞語S叉捜索樹的根節(jié)點(diǎn)存 儲(chǔ)的"中"的ASCII碼值,由于"風(fēng)"的ASCII碼值大于"中"的ASCII碼值,所W繼續(xù)向根節(jié)點(diǎn)的 右兄弟節(jié)點(diǎn)進(jìn)行比較。由于待轉(zhuǎn)換文本中的首個(gè)漢字"風(fēng)"的ASCII碼值與根節(jié)點(diǎn)的右兄弟 節(jié)點(diǎn)存儲(chǔ)的"風(fēng)"的Ascn碼值相同,所W繼續(xù)比較待轉(zhuǎn)換文本中的第二個(gè)漢字"格"的ASCII 碼值與根節(jié)點(diǎn)的右兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)存儲(chǔ)的"格"的ASCII碼值是否相同。由于待轉(zhuǎn)換文本 中的第二個(gè)漢字"格"的ASCII碼值與根節(jié)點(diǎn)的右兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)存儲(chǔ)的"格"的ASCII碼 值相同,所W便可W將根節(jié)點(diǎn)的右兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),W便于可W從目標(biāo) 節(jié)點(diǎn)中提取待轉(zhuǎn)換文本"風(fēng)格"對(duì)應(yīng)的拼音全拼吁engge"和拼音首字母吁g"。
[0091] 如果待轉(zhuǎn)換文本為一個(gè)拼音,那么需要利用上述提到的拼音=叉捜索樹進(jìn)行確 定,在拼音=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟為:首先,在待轉(zhuǎn)換文本 為至少兩組拼音時(shí),在拼音=叉捜索樹的根節(jié)點(diǎn)和根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中確定與待轉(zhuǎn)換文本 中的首組拼音相同的第四指定節(jié)點(diǎn)。在第四指定節(jié)點(diǎn)的子節(jié)點(diǎn)中確定與待轉(zhuǎn)換文本中的其 余組拼音相同的第五指定節(jié)點(diǎn)。將第五指定節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),至少兩組拼音中的每組 拼音均對(duì)應(yīng)一個(gè)漢字。
[0092] 為了形象的說明上述在拼音=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的 過程,下面通過舉例說明。
[0093] 例如,請(qǐng)參見圖3所示,并結(jié)合表1所示,已經(jīng)預(yù)先建立好拼音=叉捜索樹,標(biāo)準(zhǔn)詞 庫中每對(duì)拼音的首字母由大到小的順序?yàn)閂'、V'、V'、V'和T'。假設(shè)待轉(zhuǎn)換文本為拼音 吁engge",那么先比較待轉(zhuǎn)換文本中的首組拼音的首字母吁"與拼音S叉捜索樹的根節(jié)點(diǎn) 存儲(chǔ)的拼音首字母V'的字母順序,由于T'的字母順序小于V'的字母順序,所W繼續(xù)向根 節(jié)點(diǎn)的左兄弟節(jié)點(diǎn)進(jìn)行比較。由于待轉(zhuǎn)換文本中的首組拼音的首字母吁"與根節(jié)點(diǎn)的左兄 弟節(jié)點(diǎn)存儲(chǔ)的拼音首字母"r的字母順序相同,所W繼續(xù)比較待轉(zhuǎn)換文本中的首組拼音 "feng"與根節(jié)點(diǎn)的左兄弟節(jié)點(diǎn)存儲(chǔ)的拼音"feng"是否相同。由于相同,所W繼續(xù)比較較待 轉(zhuǎn)換文本中的第二組拼音"ge"與根節(jié)點(diǎn)的左兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)存儲(chǔ)的拼音是否相同。由于 相同,所W便可W將根節(jié)點(diǎn)的左兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),W便于可W從目標(biāo)節(jié) 點(diǎn)中提取待轉(zhuǎn)換文本吁engge"對(duì)應(yīng)的詞語"風(fēng)格"和拼音首字母吁g"。
[0094] 步驟S13、在目標(biāo)節(jié)點(diǎn)中提取待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音。
[0095] 其中,在=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)W后,便可W在目標(biāo)節(jié) 點(diǎn)中提取待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音。如果待轉(zhuǎn)換文本為詞語,那么便可W在目標(biāo)節(jié)點(diǎn) 中提取待轉(zhuǎn)換文本對(duì)應(yīng)的拼音;如果待轉(zhuǎn)換文本為拼音,那么便可W在目標(biāo)節(jié)點(diǎn)中提取待 轉(zhuǎn)換文本對(duì)應(yīng)的詞語。
[0096] 如果待轉(zhuǎn)換文本為拼音,而且該拼音可W對(duì)應(yīng)多個(gè)詞語,那么需要使用W下步驟 在目標(biāo)節(jié)點(diǎn)中提取待轉(zhuǎn)換文本對(duì)應(yīng)的詞語:首先,在目標(biāo)節(jié)點(diǎn)中含有至少兩組詞語時(shí),確定 目標(biāo)節(jié)點(diǎn)中的每個(gè)詞語的使用頻率。然后,按照使用頻率對(duì)目標(biāo)節(jié)點(diǎn)中的每個(gè)詞語進(jìn)行排 序,得到排序結(jié)果。最后,提取排序結(jié)果中的每個(gè)詞語。
[0097] 其中,如果目標(biāo)節(jié)點(diǎn)中含有至少兩組詞語,那么需要確定出運(yùn)些詞語的使用頻率, 并根據(jù)使用頻率來排序,最終提取出排序后的詞語,從而使得用戶可W看到運(yùn)些詞語按照 使用頻率由高到低進(jìn)行排序后的效果,所W用戶可W快速的定位到使用頻率高的詞語。
[0098] 如果待轉(zhuǎn)換文本為詞語,而且該詞語可W對(duì)應(yīng)至少兩組拼音,那么需要使用W下 步驟在目標(biāo)節(jié)點(diǎn)中提取待轉(zhuǎn)換文本對(duì)應(yīng)的拼音:首先,在目標(biāo)節(jié)點(diǎn)中含有至少兩組拼音時(shí), 確定目標(biāo)節(jié)點(diǎn)中的每組拼音的使用頻率,至少兩組拼音中的每組拼音均對(duì)應(yīng)一個(gè)漢字。然 后,按照使用頻率對(duì)目標(biāo)節(jié)點(diǎn)中的每組拼音進(jìn)行排序,得到排序結(jié)果。最后,提取排序結(jié)果 中的每組拼音。
[0099] 其中,如果目標(biāo)節(jié)點(diǎn)中含有至少兩組拼音,那么需要確定出每組拼音的使用頻率, 并根據(jù)使用頻率來排序,最終提取出排序后的每組拼音,從而使得用戶可W看到運(yùn)些組拼 音按照使用頻率由高到低進(jìn)行排序后的效果,所W用戶可W快速的定位到使用頻率高的拼 音。
[0100] 步驟S14、輸出待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音。
[0101] 其中,在目標(biāo)節(jié)點(diǎn)中提取待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音W后,便可W輸出待轉(zhuǎn)換 文本對(duì)應(yīng)的詞語或拼音,W便于用戶能夠看到待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音。
[0102] 在圖1所示的實(shí)施例中,在=叉捜索樹的節(jié)點(diǎn)中會(huì)預(yù)先存儲(chǔ)有詞語與拼音的對(duì)應(yīng) 關(guān)系,在接收到待轉(zhuǎn)換文本后,可W在=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)。如 果待轉(zhuǎn)換文本為拼音,那么可W在目標(biāo)節(jié)點(diǎn)中提取與拼音對(duì)應(yīng)的詞語;如果待轉(zhuǎn)換文本為 詞語,那么可W在目標(biāo)節(jié)點(diǎn)中提取與詞語對(duì)應(yīng)的拼音,所W使得拼音與詞語可W相互轉(zhuǎn)換。 在=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的過程中,在=叉捜索樹中每查找一次 待轉(zhuǎn)換文本對(duì)應(yīng)的節(jié)點(diǎn),均能減少一半的查詢工作量,所W本發(fā)明提供的方案可W快速的 查詢到待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn),并在該目標(biāo)節(jié)點(diǎn)中得到待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼 音,從而提高了查詢效率。
[0103] 請(qǐng)參見圖4所示,在本發(fā)明的另一些實(shí)施例中,本發(fā)明實(shí)施例提供的方法還可W包 括W下步驟:
[0104] 步驟S15、判斷待轉(zhuǎn)換文本是否可W被拆分成分詞。在待轉(zhuǎn)換文本可W被拆分成分 詞時(shí),觸發(fā)步驟S16;在待轉(zhuǎn)換文本不可被拆分成分詞時(shí),觸發(fā)步驟S12。
[0105] 步驟S16、利用分詞算法對(duì)待轉(zhuǎn)換文本進(jìn)行拆分得到分詞結(jié)果,在=叉捜索樹中確 定與分詞結(jié)果中的分詞對(duì)應(yīng)的第一指定節(jié)點(diǎn),提取第一指定節(jié)點(diǎn)中分詞對(duì)應(yīng)的詞語或拼 音,輸出分詞對(duì)應(yīng)的詞語或拼音。
[0106] 其中,分詞算法存在很多種,例如,分詞算法可W為逆向最大匹配,分詞算法還可 W為正向最大減字,當(dāng)然,也可W為其他的分詞算法,本發(fā)明并不局限分詞算法的種類。
[0107] 在某些情況下,待轉(zhuǎn)換文本中的詞語或句子可能會(huì)非常的長,如果在=叉捜索樹 中確定待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn),那么會(huì)導(dǎo)致查詢效率低下。所W需要利用分詞算法將 較長的詞語或一句話拆分成不可再分的分詞,從而提高在=叉捜索樹中確定到與待轉(zhuǎn)換文 本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的效率。
[0108] 在獲取到待轉(zhuǎn)換文本W(wǎng)后,需要判斷待轉(zhuǎn)換文本是否為可W被拆分成分詞。如果 待轉(zhuǎn)換文本為可W被拆分的詞語,那么便可W利用分詞算法對(duì)待轉(zhuǎn)換文本進(jìn)行拆分得到分 詞結(jié)果,并在=叉捜索樹中確定與分詞結(jié)果中的分詞對(duì)應(yīng)的第一指定節(jié)點(diǎn),提取第一指定 節(jié)點(diǎn)中分詞對(duì)應(yīng)的拼音,輸出分詞對(duì)應(yīng)的拼音。如果待轉(zhuǎn)換文本為不可W被拆分的詞語,那 么便可W觸發(fā)步驟S12,直接在=叉捜索樹中確定與分詞結(jié)果中的分詞對(duì)應(yīng)的第一指定節(jié) 點(diǎn)。
[0109] 同理,如果待轉(zhuǎn)換文本為可W被拆分的拼音,那么便可W利用分詞算法對(duì)待轉(zhuǎn)換 文本進(jìn)行拆分得到分詞結(jié)果,并在=叉捜索樹中確定與分詞結(jié)果中的分詞對(duì)應(yīng)的第一指定 節(jié)點(diǎn),提取第一指定節(jié)點(diǎn)中分詞對(duì)應(yīng)的詞語,最后輸出分詞對(duì)應(yīng)的詞語。
[0110] 圖5為本發(fā)明實(shí)施例提供的一種字符的轉(zhuǎn)換裝置的示意圖。參照?qǐng)D5,該裝置包括 接收模塊11、第一確定模塊12、提取模塊13和輸出模塊14,其中:
[0111] 接收模塊11,用于接收待轉(zhuǎn)換文本,待轉(zhuǎn)換文本為拼音或詞語。
[0112] 第一確定模塊12,用于在=叉捜索樹中確定與待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn),=叉 捜索樹的節(jié)點(diǎn)中預(yù)先存儲(chǔ)有詞語與拼音的對(duì)應(yīng)關(guān)系。
[0113] 提取模塊13,用于在目標(biāo)節(jié)點(diǎn)中提取待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音。
[0114] 輸出模塊14,用于輸出待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音。
[0115] 可選的,本發(fā)明實(shí)施例提供的字符的轉(zhuǎn)換裝置還可W包括W下模塊:判斷模塊,用 于判斷待轉(zhuǎn)換文本是否可W被拆分成分詞。第一執(zhí)行模塊,用于在待轉(zhuǎn)換文本可W被拆分 成分詞時(shí),利用分詞算法對(duì)待轉(zhuǎn)換文本進(jìn)行拆分得到分詞結(jié)果,在=叉捜索樹中確定與分 詞結(jié)果中的分詞對(duì)應(yīng)的第一指定節(jié)點(diǎn),提取第一指定節(jié)點(diǎn)中分詞對(duì)應(yīng)的詞語或拼音,輸出 分詞對(duì)應(yīng)的詞語或拼音。第二執(zhí)行模塊,用于在待轉(zhuǎn)換文本不可被拆分成分詞時(shí),觸發(fā)第一 確定模塊12。
[0116] 可選的,上述第一確定模塊12還可W包括W下子模塊:第一確定子模塊,用于在待 轉(zhuǎn)換文本為一個(gè)詞語時(shí),在=叉捜索樹的根節(jié)點(diǎn)和根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中確定與待轉(zhuǎn)換文本 中的首個(gè)漢字的Ascn碼值相同的第二指定節(jié)點(diǎn)。第二確定子模塊,用于在第二指定節(jié)點(diǎn)的 子節(jié)點(diǎn)中確定與待轉(zhuǎn)換文本中的其余漢字的ASCII碼值相同的第S指定節(jié)點(diǎn)。第S確定子 模塊,用于將第=指定節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),一個(gè)詞語至少包括兩個(gè)漢字。
[0117] 可選的,上述第一確定模塊12還可W包括W下子模塊:第四確定子模塊,用于在待 轉(zhuǎn)換文本為至少兩組拼音時(shí),在=叉捜索樹的根節(jié)點(diǎn)和根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中確定與待轉(zhuǎn)換 文本中的首組拼音相同的第四指定節(jié)點(diǎn)。第五確定子模塊,用于在第四指定節(jié)點(diǎn)的子節(jié)點(diǎn) 中確定與待轉(zhuǎn)換文本中的其余組拼音相同的第五指定節(jié)點(diǎn)。第六確定子模塊,用于將第五 指定節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),至少兩組拼音中的每組拼音均對(duì)應(yīng)一個(gè)漢字。
[0118] 可選的,本發(fā)明實(shí)施例提供的字符的轉(zhuǎn)換裝置還可W包括W下模塊:第二確定模 塊,用于確定與標(biāo)準(zhǔn)詞庫中每個(gè)詞語對(duì)應(yīng)的ASCII碼值。第一添加模塊,用于根據(jù)ASCII碼值 的大小將標(biāo)準(zhǔn)詞庫中每個(gè)詞語的首個(gè)漢字添加到=叉捜索樹的根節(jié)點(diǎn)和根節(jié)點(diǎn)的兄弟節(jié) 點(diǎn)中。第二添加模塊,用于將標(biāo)準(zhǔn)詞庫中每個(gè)詞語的非首個(gè)漢字和拼音添加到=叉捜索樹 的根節(jié)點(diǎn)的子節(jié)點(diǎn)中,W及根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)中。
[0119] 可選的,本發(fā)明實(shí)施例提供的字符的轉(zhuǎn)換裝置還可W包括W下模塊:第=確定模 塊,用于確定標(biāo)準(zhǔn)詞庫中每對(duì)拼音的首字母,其中,每組拼音至少包括一個(gè)拼音,每對(duì)拼音 至少包括兩組拼音,一組拼音對(duì)應(yīng)一個(gè)漢字,一對(duì)拼音對(duì)應(yīng)一個(gè)詞語。第=添加模塊,用于 根據(jù)首字母的順序?qū)?biāo)準(zhǔn)詞庫中每對(duì)拼音的首組拼音添加到=叉捜索樹的根節(jié)點(diǎn)和根節(jié) 點(diǎn)的兄弟節(jié)點(diǎn)中。第四添加模塊,用于將標(biāo)準(zhǔn)詞庫中每對(duì)拼音的非首組拼音和每對(duì)拼音對(duì) 應(yīng)的詞語添加到=叉捜索樹的根節(jié)點(diǎn)的子節(jié)點(diǎn)中,W及根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)中。
[0120] 關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法 的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。
[0121] W上所述,僅為本發(fā)明的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明掲露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述W權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1. 一種字符的轉(zhuǎn)換方法,其特征在于,包括: 接收待轉(zhuǎn)換文本,所述待轉(zhuǎn)換文本為拼音或詞語; 在三叉搜索樹中確定與所述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn),所述三叉搜索樹的節(jié)點(diǎn)中預(yù) 先存儲(chǔ)有詞語與拼音的對(duì)應(yīng)關(guān)系; 在所述目標(biāo)節(jié)點(diǎn)中提取所述待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音; 輸出所述待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音。2. 根據(jù)權(quán)利要求1所述的字符的轉(zhuǎn)換方法,其特征在于,在所述接收待轉(zhuǎn)換文本的步驟 之后,所述方法還包括: 判斷所述待轉(zhuǎn)換文本是否可以被拆分成分詞; 在所述待轉(zhuǎn)換文本可以被拆分成分詞時(shí),利用分詞算法對(duì)所述待轉(zhuǎn)換文本進(jìn)行拆分得 到分詞結(jié)果,在所述三叉搜索樹中確定與所述分詞結(jié)果中的分詞對(duì)應(yīng)的第一指定節(jié)點(diǎn),提 取所述第一指定節(jié)點(diǎn)中所述分詞對(duì)應(yīng)的詞語或拼音,輸出所述分詞對(duì)應(yīng)的詞語或拼音; 在所述待轉(zhuǎn)換文本不可被拆分成分詞時(shí),觸發(fā)所述在三叉搜索樹中確定與所述待轉(zhuǎn)換 文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟。3. 根據(jù)權(quán)利要求1所述的字符的轉(zhuǎn)換方法,其特征在于,所述在三叉搜索樹中確定與所 述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟包括: 在所述待轉(zhuǎn)換文本為一個(gè)詞語時(shí),在詞語三叉搜索樹的根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié) 點(diǎn)中確定與所述待轉(zhuǎn)換文本中的首個(gè)漢字的ASCII碼值相同的第二指定節(jié)點(diǎn); 在所述第二指定節(jié)點(diǎn)的子節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的其余漢字的ASCII碼值相 同的第三指定節(jié)點(diǎn); 將所述第三指定節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),所述一個(gè)詞語至少包括兩個(gè)漢字。4. 根據(jù)權(quán)利要求1所述的字符的轉(zhuǎn)換方法,其特征在于,所述在三叉搜索樹中確定與所 述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟包括: 在所述待轉(zhuǎn)換文本為至少兩組拼音時(shí),在拼音三叉搜索樹的根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄 弟節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的首組拼音相同的第四指定節(jié)點(diǎn); 在所述第四指定節(jié)點(diǎn)的子節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的其余組拼音相同的第五 指定節(jié)點(diǎn); 將所述第五指定節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),所述至少兩組拼音中的每組拼音均對(duì)應(yīng)一個(gè)漢 字。5. 根據(jù)權(quán)利要求1所述的字符的轉(zhuǎn)換方法,其特征在于,所述在三叉搜索樹中確定與所 述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟之前,所述方法還包括: 確定與標(biāo)準(zhǔn)詞庫中每個(gè)詞語對(duì)應(yīng)的ASCII碼值; 根據(jù)ASCII碼值的大小將所述標(biāo)準(zhǔn)詞庫中每個(gè)詞語的首個(gè)漢字添加到所述三叉搜索樹 的根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中; 將所述標(biāo)準(zhǔn)詞庫中每個(gè)詞語的非首個(gè)漢字和拼音添加到所述三叉搜索樹的所述根節(jié) 點(diǎn)的子節(jié)點(diǎn)中,以及所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)中。6. 根據(jù)權(quán)利要求1所述的字符的轉(zhuǎn)換方法,其特征在于,所述在三叉搜索樹中確定與所 述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn)的步驟之前,所述方法還包括: 確定標(biāo)準(zhǔn)詞庫中每對(duì)拼音的首字母,其中,每組拼音至少包括一個(gè)拼音,每對(duì)拼音至少 包括兩組拼音,一組拼音對(duì)應(yīng)一個(gè)漢字,一對(duì)拼音對(duì)應(yīng)一個(gè)詞語; 根據(jù)首字母的順序?qū)⑺鰳?biāo)準(zhǔn)詞庫中每對(duì)拼音的首組拼音添加到所述三叉搜索樹的 根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中; 將所述標(biāo)準(zhǔn)詞庫中每對(duì)拼音的非首組拼音和每對(duì)拼音對(duì)應(yīng)的詞語添加到所述三叉搜 索樹的所述根節(jié)點(diǎn)的子節(jié)點(diǎn)中,以及所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)中。7. -種字符的轉(zhuǎn)換裝置,其特征在于,包括: 接收模塊,用于接收待轉(zhuǎn)換文本,所述待轉(zhuǎn)換文本為拼音或詞語; 第一確定模塊,用于在三叉搜索樹中確定與所述待轉(zhuǎn)換文本對(duì)應(yīng)的目標(biāo)節(jié)點(diǎn),所述三 叉搜索樹的節(jié)點(diǎn)中預(yù)先存儲(chǔ)有詞語與拼音的對(duì)應(yīng)關(guān)系; 提取模塊,用于在所述目標(biāo)節(jié)點(diǎn)中提取所述待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音; 輸出模塊,用于輸出所述待轉(zhuǎn)換文本對(duì)應(yīng)的詞語或拼音。8. 根據(jù)權(quán)利要求7所述的字符的轉(zhuǎn)換裝置,其特征在于,所述裝置還包括: 判斷模塊,用于判斷所述待轉(zhuǎn)換文本是否可以被拆分成分詞; 第一執(zhí)行模塊,用于在所述待轉(zhuǎn)換文本可以被拆分成分詞時(shí),利用分詞算法對(duì)所述待 轉(zhuǎn)換文本進(jìn)行拆分得到分詞結(jié)果,在所述三叉搜索樹中確定與所述分詞結(jié)果中的分詞對(duì)應(yīng) 的第一指定節(jié)點(diǎn),提取所述第一指定節(jié)點(diǎn)中所述分詞對(duì)應(yīng)的詞語或拼音,輸出所述分詞對(duì) 應(yīng)的詞語或拼音; 第二執(zhí)行模塊,用于在所述待轉(zhuǎn)換文本不可被拆分成分詞時(shí),觸發(fā)所述第一確定模塊。9. 根據(jù)權(quán)利要求7所述的字符的轉(zhuǎn)換裝置,其特征在于,所述第一確定模塊包括:第一 確定子模塊,用于在所述待轉(zhuǎn)換文本為一個(gè)詞語時(shí),在詞語三叉搜索樹的根節(jié)點(diǎn)和所述根 節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的首個(gè)漢字的ASCII碼值相同的第二指定節(jié) 占. 第二確定子模塊,用于在所述第二指定節(jié)點(diǎn)的子節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的其 余漢字的ASCII碼值相同的第三指定節(jié)點(diǎn); 第三確定子模塊,用于將所述第三指定節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),所述一個(gè)詞語至少包括 兩個(gè)漢字。10. 根據(jù)權(quán)利要求7所述的字符的轉(zhuǎn)換裝置,其特征在于,所述第一確定模塊包括: 第四確定子模塊,用于在所述待轉(zhuǎn)換文本為至少兩組拼音時(shí),在拼音三叉搜索樹的根 節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的首組拼音相同的第四指定節(jié) 占. 第五確定子模塊,用于在所述第四指定節(jié)點(diǎn)的子節(jié)點(diǎn)中確定與所述待轉(zhuǎn)換文本中的其 余組拼音相同的第五指定節(jié)點(diǎn); 第六確定子模塊,用于將所述第五指定節(jié)點(diǎn)確定為目標(biāo)節(jié)點(diǎn),所述至少兩組拼音中的 每組拼音均對(duì)應(yīng)一個(gè)漢字。11. 根據(jù)權(quán)利要求7所述的字符的轉(zhuǎn)換裝置,其特征在于,所述裝置還包括: 第二確定模塊,用于確定與標(biāo)準(zhǔn)詞庫中每個(gè)詞語對(duì)應(yīng)的ASCII碼值; 第一添加模塊,用于根據(jù)ASCII碼值的大小將所述標(biāo)準(zhǔn)詞庫中每個(gè)詞語的首個(gè)漢字添 加到所述三叉搜索樹的根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中; 第二添加模塊,用于將所述標(biāo)準(zhǔn)詞庫中每個(gè)詞語的非首個(gè)漢字和拼音添加到所述三叉 搜索樹的所述根節(jié)點(diǎn)的子節(jié)點(diǎn)中,以及所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn)中。12.根據(jù)權(quán)利要求7所述的字符的轉(zhuǎn)換裝置,其特征在于,所述裝置還包括: 第三確定模塊,用于確定標(biāo)準(zhǔn)詞庫中每對(duì)拼音的首字母,其中,每組拼音至少包括一個(gè) 拼音,每對(duì)拼音至少包括兩組拼音,一組拼音對(duì)應(yīng)一個(gè)漢字,一對(duì)拼音對(duì)應(yīng)一個(gè)詞語; 第三添加模塊,用于根據(jù)首字母的順序?qū)⑺鰳?biāo)準(zhǔn)詞庫中每對(duì)拼音的首組拼音添加到 所述三叉搜索樹的根節(jié)點(diǎn)和所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)中; 第四添加模塊,用于將所述標(biāo)準(zhǔn)詞庫中每對(duì)拼音的非首組拼音和每對(duì)拼音對(duì)應(yīng)的詞語 添加到所述三叉搜索樹的所述根節(jié)點(diǎn)的子節(jié)點(diǎn)中,以及所述根節(jié)點(diǎn)的兄弟節(jié)點(diǎn)的子節(jié)點(diǎn) 中。
【文檔編號(hào)】G06F17/30GK105955986SQ201610243297
【公開日】2016年9月21日
【申請(qǐng)日】2016年4月18日
【發(fā)明人】謝曉靜
【申請(qǐng)人】樂視控股(北京)有限公司, 樂視網(wǎng)信息技術(shù)(北京)股份有限公司