專利名稱:用于移動電話中檢索多種語言詞匯的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種檢索詞匯的方法,尤其涉及一種用于移動電話中檢索多種語言詞匯的方法。
背景技術(shù):
為了加強移動電話產(chǎn)品外銷的競爭力,移動電話中支援多種語言詞匯的顯示是必要的,一般說來,已知支援多種語言詞匯顯示的移動電話在詞匯的檢索方面有一個顯著的特點,就是按照移動電話中所支援顯示的語言數(shù)目來建立詞匯的檢索資源檔案,也就是要為每一個所支援顯示的語言都建立一個詞匯的檢索資源檔案,舉例來說,一移動電話中共支援中文、英文、德文、法文以及俄文等五種語言的顯示,則需要在該移動電話中建立五個詞匯的檢索資源檔案,當(dāng)該移動電話作詞匯檢索時,首先要辨別移動電話中的顯示設(shè)定為那一種語言,接著再到該語言所對應(yīng)的詞匯的檢索資源檔案中去檢索,最后讀出詞匯的檢索資源檔案中的數(shù)據(jù)。
依據(jù)移動電話中所支援的語言數(shù)目來建立詞匯的檢索資源檔案,對于管理者而言,可以清楚的知道該移動電話共支援了幾種語言的顯示,當(dāng)使用者要求該移動電話再增加支援更多種的語言時,管理者只要再建立相對應(yīng)于新支援語言的詞匯的檢索資源檔案即可。如上述的例子中,該移動電話除了支援中文、英文、德文、法文以及俄文這五種語言外,還要再增加支援日文以及韓文這兩種語言,則管理者需要再建立兩個詞匯的檢索資源檔案于該移動電話之中,檢索的方法如上所述,首先要辨別移動電話中的顯示設(shè)定為那一種語言,接著再到該語言所對應(yīng)的詞匯的檢索資源檔案中去檢索,最后讀出詞匯的檢索資源檔案中的數(shù)據(jù)。
但是,隨著移動電話中所支援的語言數(shù)目的增加,管理者在管理詞匯的檢索資源檔案時的困難度也隨之增加,例如當(dāng)使用者要求更改某一個詞匯的表達方式時,則管理者必須更改該移動電話中所支援顯示的全部語言相對應(yīng)的詞匯的檢索資源檔案,以上例而言,管理者必須開啟中文、英文、德文、法文、俄文、日文以及韓文這七個詞匯的檢索資源檔案,找出每一個檔案中使用者所要求更改的詞匯加以修改,使得管理者在管理詞匯的檢索資源檔案時非常的不方便。
發(fā)明內(nèi)容
因此本發(fā)明的主要目的是提供一種于一移動電話中檢索詞匯的方法,以解決上述問題。
本發(fā)明的申請專利范圍提供一種于一移動電話中檢索詞匯的方法,適用于管理移動電話中多種語言的資源,以特定的格式建立一儲存多種語言詞匯的文字檔,之后再把該文字檔經(jīng)過轉(zhuǎn)碼產(chǎn)生一H檔案及對應(yīng)多種語言的C檔案,由H檔案之中的索引及計算詞匯在C檔案之中的數(shù)組的偏移量即可完成詞匯的檢索。
圖1為BIN檔案結(jié)構(gòu)的示意圖。
圖2為本發(fā)明檢索詞匯方法的流程圖。
具體實施例方式
本發(fā)明是將多種語言所表示的相同意義的詞匯以一特定的格式儲存于一文字檔之中,當(dāng)管理者想增加或刪除一語言所表示的詞匯時,只需要修改該文字檔中的內(nèi)容即可。多種語言所表示的相同意義的詞匯以該特定的格式儲存于該文字檔中的目的,在于方便將各種語言所表示的相同意義的詞匯由該文字檔中分離出來儲存成單一語言表示的詞匯的文字檔。
多種語言所表示的相同意義的詞匯依據(jù)8位元的第二版統(tǒng)一碼(Unicode,version II)編碼,全部儲存在一TEMP01.TXT檔案之中,儲存的格式必需有嚴(yán)格規(guī)定的,為的是方便將各種語言由TEMP01.TXT檔案之中分離出來。在把各種語言從TEMP01.TXT檔案之中分離出來的同時,給予各種不同語言所表示的相同意義的詞匯一索引(index,ID),并儲存于一TEMP02.H檔案之中。
將儲存多種語言的TEMP01.TXT檔案的中分離出來的單一語言表示的詞匯儲存于一TEMP03.TXT檔案之中,TEMP03.TXT檔案之中的內(nèi)容要再轉(zhuǎn)碼為16位元編碼的統(tǒng)一碼(Unicode)形式并儲存于一TEMP04.TXT檔案之中。接著把統(tǒng)一碼形式的TEMP04.TXT檔案之中的內(nèi)容轉(zhuǎn)成二進位碼(binary code)形式并儲存于一TEMP05.BIN檔案之中。其中TEMP05.BIN檔案的結(jié)構(gòu)包含一檔案起始端的字數(shù)偏移量,一語言起始端的字數(shù)偏移量,一詞匯的總數(shù)以及一依據(jù)索引決定的偏移量。之后再把TEMP05.BIN檔案之中的內(nèi)容復(fù)制后儲存于一TEMP06.C檔案之中的一數(shù)組里。
檢索詞匯的時候,只要根據(jù)索引就可以計算出該詞匯在TEMP06.C檔案之中的該數(shù)組的偏移量,其中該詞匯的偏移量等于該檔案起始端的字數(shù)偏移量,該語言起始端的字數(shù)偏移量,該詞匯的總數(shù)以及該依據(jù)索引決定的偏移量的總和。由索引及該詞匯的偏移量就可以找出該詞匯不同語言的表示法。
舉例說明,一移動電話提供中文和英文的詞匯顯示,則將中文及英文所表示的詞匯以一特定的格式儲存于stringsource.TXT檔案之中,此文字檔依據(jù)8位元的第二版統(tǒng)一碼(Unicode,version II)編碼,假設(shè)該特定的格式為每個中文和英文所表示的同意義詞匯以斜線分隔,而不同意義的詞匯就換行儲存,依據(jù)這樣的格式可輕易的將中文及英文這兩種語言由stringsource.TXT檔案之中分離出來,并且轉(zhuǎn)換成16位元編碼的統(tǒng)一碼(Unicode)形式儲存于Chinese.TXT及English.TXT這兩個檔案之中。
在將中文及英文這兩種語言依據(jù)該特定的格式由stringsource.TXT檔案之中分離出來并且轉(zhuǎn)換成16位元編碼的統(tǒng)一碼形式儲存于Chinese.TXT及English.TXT這兩個檔案的同時,會給予每一個以中文及英文所表示的相同意義的詞匯相同的索引(index,ID),并且將該索引儲存于StringID.H檔案之中。接著把以統(tǒng)一碼形式的Chinese.TXT及English.TXT這兩個檔案之中的內(nèi)容分別轉(zhuǎn)成二進位碼(binarycode)形式的Chinese.BIN及English.BIN這兩個檔案之中,而Chinese.BIN及English.BIN這兩檔案的結(jié)構(gòu)請參考圖1。
圖1為BIN檔案結(jié)構(gòu)的示意圖。如圖1所示,Chinese.BIN及English.BIN這兩個檔案之中所儲存的二進位碼的結(jié)構(gòu),包含一檔案起始端的字數(shù)偏移量(0000~0011),一語言起始端的字數(shù)偏移量(0012~0039),一詞匯的總數(shù)(0040~0043)以及一依據(jù)索引決定的偏移量(0044~xxxx),而詳細的結(jié)構(gòu)則如上表所示。接著將Chinese.BIN及English.BIN這兩個檔案之中的內(nèi)容復(fù)制后儲存于Chinese.C及English.C這兩個檔案之中的一數(shù)組里,即完成多種語言的分離及管理。
檢索中文詞匯的時候,只要根據(jù)索引就可以計算出該詞匯在Chinese.C檔案之中的該數(shù)組的偏移量,而檢索英文詞匯的時候,只要根據(jù)索引就可以計算出該詞匯在English.C檔案之中的該數(shù)組的偏移量,其中該詞匯的偏移量等于該檔案起始端的字數(shù)偏移量,該語言起始端的字數(shù)偏移量,該詞匯的總數(shù)以及該依據(jù)索引決定的偏移量的總和,也就是詞匯的偏移量=檔案起始端的字數(shù)偏移量
+語言起始端的字數(shù)偏移量+詞匯的總數(shù)+4*索引由索引及該詞匯的偏移量就可以找出該詞匯不同語言的表示法。
請參考圖2,圖2為本發(fā)明檢索詞匯方法的流程圖,其步驟如下步驟100將多種語言所表示的相同意義的詞匯以一特定的格式儲存于一文字檔之中,該文字檔為8位元的第二版統(tǒng)一碼(Unicode,version II)編碼;步驟110依據(jù)該特定的格式將各種語言所表示的相同意義的詞匯由該文字檔之中分離出來,并將同一種語言所表示之詞匯儲存于同一文字檔之中,該文字檔為16位元的統(tǒng)一碼(Unicode)編碼,并給予各種語言所表示的相同意義的詞匯一索引儲存于一H檔案之中;步驟120將每個儲存同一種語言所表示的詞匯的文字檔轉(zhuǎn)成一結(jié)構(gòu)化的二進位碼(binary code)編碼的檔案,再將此二進位碼檔案的內(nèi)容復(fù)制儲于一C檔案之中的一數(shù)組里;步驟130根據(jù)H檔之中的索引及計算詞匯在C檔的中數(shù)組的偏移量作檢索。
相較于已知技術(shù),本發(fā)明是將多種語言所表示的相同意義的詞匯以一特定的格式儲存于一文字檔之中,當(dāng)管理者想增加或刪除一語言所表示的詞匯時,只需要修改該文字檔中的內(nèi)容即可,因此本發(fā)明提供一個方便而快速維護及檢索多種語言詞匯的方法。
以上所述僅為本發(fā)明的較佳實施例,凡依本發(fā)明申請專利范圍所做的均等變化與修飾,皆應(yīng)屬本發(fā)明專利的涵蓋范圍。
權(quán)利要求
1.一種于一移動電話中檢索詞匯的方法,該移動電話具有一顯示面板,以及一文字檔,該文字檔中儲存有多個詞匯,每一詞匯系以多種語言儲存于該文字檔中,該方法包含依據(jù)該文字檔中詞匯所屬之語言的種類開啟多個檔案;將該文字檔中屬于相同語言的詞匯儲存于同一檔案中,并將該文字檔中屬于不同語言的詞匯儲存于相異的檔案中;對以相異語言表達的同一詞匯給予相同的索引,并對以相同語言表達的相異詞匯給予相異的索引;以及依據(jù)每一詞匯的索引于該多個檔案中的一檔案檢索以相異語言表達的同一詞匯;以及將檢索得到的詞匯顯示于該顯示面板上。
2.如權(quán)利要求1所述的方法,其特征在于,多個詞匯是依據(jù)一預(yù)定格式儲存于該文字檔中。
3.如權(quán)利要求1所述的方法,其特征在于,多個詞匯是依據(jù)第二版統(tǒng)一碼儲存于該文字檔中。
4.如權(quán)利要求3所述的方法,其特征在于,多個詞匯是由第二版統(tǒng)一碼轉(zhuǎn)換成統(tǒng)一碼后儲存于該多個檔案中。
5.如權(quán)利要求4所述的方法,其特征在于,另包含將以統(tǒng)一碼儲存于該多個檔案的詞匯轉(zhuǎn)換成二進位碼。
全文摘要
本發(fā)明提供一種于一移動電話中檢索詞匯的方法,該移動電話具有一顯示面板,以及一文字檔,該文字檔中儲存有多個詞匯,每一詞匯是以多種語言儲存于該文字檔中,該方法包含依據(jù)該文字檔中詞匯所屬的語言的種類開啟多個檔案,將該文字檔中屬于相同語言的詞匯儲存于同一檔案中,對以相異語言表達的同一詞匯給予相同的索引,依據(jù)每一詞匯的索引于該多個檔案中的一檔案檢索以相異語言表達的同一詞匯以及將檢索得到的詞匯顯示于該顯示面板上。
文檔編號H04M1/725GK1505424SQ02150828
公開日2004年6月16日 申請日期2002年11月29日 優(yōu)先權(quán)日2002年11月29日
發(fā)明者劉西雨, 何代水, 蔡世光 申請人:英華達(上海)電子有限公司