專利名稱:利用組合音標查詢單字的裝置與方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種査詢單字的裝置與方法,尤其是一種利用組合音標查詢單 字的裝置與方法。
背景技術(shù):
查詢單字的方法有很多種,如按單字或詞組的拼寫方式進行査詢,也就是 最常見的按字母的排序,逐字輸入以進行查詢的方式。然而,使用者在特定的 情況時,如忘記某個單字的正確拼寫,但大致可記得單字的發(fā)音,此時便需通 過拼音來進行單字的查詢。因而,有通過輸入音標,來進行查詢單字的方法產(chǎn) 生。但目前通過音標來查詢單字的方法,普遍存在下列兩種問題。
第一,缺乏音標多次組合的支持,導致使用者聽取的一些組合拼音的音標 時,檢索不出結(jié)果?,F(xiàn)有的音標查詢的方法中,都只是針對單獨的單字進行檢 索,但英文單字在句子中往往有些時候會產(chǎn)生連讀的效益,或者因為讀的語速 太快,而造成使用者不能正確的將所聽到的多個詞,正確的分辨出每個單字而 個別進行査詢。因此,可能將兩個或兩個以上的單字誤認為一個單字,然后轉(zhuǎn) 換為音標而進行査詢。如此,將造成查詢的結(jié)果不正確,或根本査尋不到相對
應的單字。舉例說明,當使用者聽到"What is up ",由于"is up"在整句的發(fā) 音上屬于較為連續(xù)的發(fā)音,因此聽者很可能將"isup"當作一個單字,而輸入了 [izSp]的音標進行査詢,但卻查詢不到相對應的單字。
第二,缺乏使用者對于發(fā)音的偏好設(shè)定,而導致使用者輸入音標查詢的結(jié) 果大打折扣。當使用者聽到單字發(fā)音時,大腦要將聽到的發(fā)音轉(zhuǎn)換為音標的描 述,而由于每個使用者對于使用音標描述拼音的能力以及對拼音的敏感度不一 樣,所以很可能輸入過程中會引起些微的偏差。例如, 一些人可能無法細分[e] 和[s]的拼音,而造成使用者自身的識別聲音的習慣或敏感度不同,而輸入了錯 誤的音標,因此無法得到真正所要查詢的單字。
因此,如何解決傳統(tǒng)上書法學習所衍生的問題,為一亟待解決的問題。
發(fā)明內(nèi)容
本發(fā)明為解決背景技術(shù)中存在的上述技術(shù)問題,而提出一種利用組合音標 查詢單字的裝置。
本發(fā)明的技術(shù)解決方案是本發(fā)明為一種利用組合音標查詢單字的裝置, 其特殊之處在于該裝置包含音標數(shù)據(jù)庫;輸入模塊,用來輸入音標字符串; 分析模塊,根據(jù)分析長度分解音標字符串,產(chǎn)生分解音標;獲取模塊,根據(jù)分 解音標,從音標數(shù)據(jù)庫中獲取與每一個分解音標相對應的單字;輸出模塊,用 來輸出單字,輸入模塊接入分析模塊,分析模塊接入獲取模塊,獲取模塊接入 輸出模塊,音標數(shù)據(jù)庫與獲取模塊相接。
上述輸入模塊還包含檢查單元,用來在逐字輸入音標字符串時,逐字輸出 音標字符串的正確發(fā)音。
該裝置還包含設(shè)定模塊,用來設(shè)定分析模塊的分析長度。 上述音標數(shù)據(jù)庫還包含設(shè)定表,用來紀錄使用者自訂的發(fā)音偏好。 該裝置還包含句子數(shù)據(jù)庫,用來儲存多個句子,句子數(shù)據(jù)庫與音標數(shù)據(jù)庫 相接。
一種利用組合音標查詢單字的方法,其特殊之處在于包含下列步驟
1) 接收音標字符串;
2) 根據(jù)分析長度分解音標字符串,產(chǎn)生分解音標;
3) 根據(jù)分解音標,從音標數(shù)據(jù)庫中獲取與每一個分解音標相對應的單字;
4) 輸出該單字。
上述步驟l)中接收音標字符串時,逐字接收音標字符串,同時逐字輸出音 標字符串的正確發(fā)音。
上述步驟2)中根據(jù)分析長度分解音標字符串時,當分解完音標字符串時, 將分析長度累加1而重新分解音標字符串,直到分析長度大于音標字符串的字 數(shù)為止。
上述步驟3)和步驟4)之間還包括步驟5)中所獲取出的單字與句子數(shù)據(jù) 庫中的句子互相比對。
本發(fā)明提供的利用組合音標查詢單字的裝置與方法,可支持音標的多次組
合,使用者可對發(fā)音的偏好進行設(shè)定。
圖1為利用組合音標查詢單字的裝置的第一實施例示意圖; 圖2為利用組合音標查詢單字的裝置的第二實施例示意圖; 圖3為利用組合音標査詢單字的方法流程圖。
其中,10-輸入模塊,20-分析模塊,30-獲取模塊,40-音標數(shù)據(jù)庫,42-設(shè)定 表,50-輸出模塊,60-設(shè)定模塊,70-句子數(shù)據(jù)庫;
具體實施例方式
參見圖1,本發(fā)明利用組合音標查詢單字的裝置包含輸入模塊10、分析 模塊20、獲取模塊30、音標數(shù)據(jù)庫40及輸出模塊50。
輸入模塊IO可提供使用者輸入音標字符串,而利用所輸入的音標字符串來 查詢單字。為了讓使用者可準確的輸入,因此輸入模塊10可包含檢査單元(圖 中未示),在使用者逐字輸入音標字符串時,會逐字輸出每一個音標的正確發(fā)音。 并且在使用者輸入完成后,會完整輸出該音標字符串的正確發(fā)音。如此,使用 者可馬上聽到檢查單元所輸出的正確發(fā)音,可讓使用者檢查所輸入的音標是否 與所聽到而要査詢的單字拼音一致。如果不一致,在查詢之前,使用者便可自 行進行修正。
分析模塊20根據(jù)分析長度,分解通過輸入模塊10所輸入的音標字符串, 而產(chǎn)生分解音標。如先前技術(shù)中所提到的,使用者有時會因為沒聽清楚單字的 拼音,而將原本是兩個或兩個以上的單字當作是一個單字,而將多個單字的音 標變成組合音標輸入查詢。如此,會無法査出使用者真正所欲査詢的單字。因 此,本發(fā)明同通過分析模塊20將音標字符串做分解,而產(chǎn)生分解音標。
由分析模塊20所分解出的分解音標,表示有單字與該分解音標相對應。因 此,獲取模塊30根據(jù)分解音標,從音標數(shù)據(jù)庫40中獲取與每一個分解音標相 對應的單字。最后,由輸出模塊50將所査詢到的單字輸出。
參見圖2,在第二實施例中還包含下列組件設(shè)定模塊60、設(shè)定表42及句 子數(shù)據(jù)庫70。
分析模塊20在起初分解音標時,預設(shè)的分析長度可設(shè)為l,表示一次分解
一個音標,而去比對該音標是否有相對應的單字,如果沒有便結(jié)合下一個音標 再去比對是否有相對應的單字,直到音標字符串中的每個音標均比對完成為止。 其中,當分解后的音標比對出有相對應的單字時,該音標即為本發(fā)明所稱的分
解音標。當分析模塊20分解完音標字符串后,設(shè)定模塊60會將分析長度累加1 而讓分析模塊20再重新分解一次音標字符串。也就是說,當分析模塊20分解 出分析長度為1的分解音標之后,設(shè)定模塊會將分析長度設(shè)為2,此時分析模塊 20會一次分解二個音標,同樣比對該音標是否有相對應的單字,如果沒有便結(jié) 合下個音標再去比對是否有相對應的單字,直到音標字符串中的每個音標皆比 對完成。如此重復上述的動作直到分析長度的字數(shù)大于音標字符串的字數(shù)為止。 也就是說,假設(shè)輸入的音標字符串字數(shù)為4,那么當分析模塊20分解完分析長 度為4的分解音標之后,設(shè)定模塊便不會再累加分析長度,而此時也就完成整 個分析的步驟。
舉例說明,當使用者聽到"What is up ",由于"is up"在整句的發(fā)音上屬 于較為連續(xù)的發(fā)音,因此聽者很可能將"isup"當作一個單字,而輸入[izSp]的 音標進行查詢,在傳統(tǒng)技術(shù)上會查詢不到相對應的單字。但由本發(fā)明的分析模 塊20, 一開始分析長度為1, 一次拆解一個音標。首先拆解出的音標為[i],比 對后發(fā)現(xiàn)并無相對應的單字,因此繼續(xù)拆解下一個音標與之結(jié)合為[iz],比對后 有相對應的單字,所以[iz]即為分解音標。繼續(xù)分析未完成的音標字符串,拆解 出[S]比對后發(fā)現(xiàn)并無相對應的單字,因此繼續(xù)拆解下一個音標與之結(jié)合為 [Sp],比對后有相對應的單字,所以[Sp]也為分解音標。
接下來設(shè)定模塊60會將分析長度累加1,而使分析長度為2。同樣的分析 模塊20開始進行分析,此時一次拆解二個音標。首先拆解出的音標為[iz],比對 后發(fā)現(xiàn)有相對應的單字,所以[iz]即為分解音標。繼續(xù)分析未完成的音標字符串, 拆解出[Sp],比對后有相對應的單字,所以[Sp]也為分解音標。
設(shè)定模塊60會再將分析長度累加1,而重復上述步驟,直到完成分析長度 為4之后停止。結(jié)果,由分析模塊20分解音標字符串后,所產(chǎn)生的分解音標為 [iz]和[Sp]。之后,獲取模塊30會根據(jù)該分解音標,由音標數(shù)據(jù)庫40中獲取與 每一個分解音標相對應的單字,也就"is up"。最后由輸出模塊50輸出"isup"而提供使用者參考。
第二實施例中,音標數(shù)據(jù)庫40可包含設(shè)定表42。語言中有一些規(guī)則會使得
非母語系的使用者較難分辨,例如音節(jié)中有所謂的重讀、次重讀的位置,對 于一些使用者可能聽不出哪個音節(jié)是重讀音節(jié)或次重讀音節(jié);在一些語速較快
的句子中,使用者可能區(qū)分不出元音的長音與短音;音標中所謂的清音濁化; 或者一些近似的發(fā)音音標等。
舉例說明,音標中[e ]和[s]為近似的發(fā)音,有些人可能無法細分兩者的差別。 使用者可能聽到"Thank"[翁攻,]和"sank"[摘飾闊不會感覺有所差異,因此 可能所聽到的發(fā)音是[i^^1],卻可能輸入贈l^輔]而進行查詢。如此,所查詢到 的單字并非使用者真正所欲査詢的單字。
而上述問題,可能因每個使用者的程度不同,而有不同的偏差。因此,本 發(fā)明提出設(shè)定表42可用來紀錄使用者自訂的發(fā)音偏好。允許使用者自行對音標 元素做一些規(guī)則的描述,而能夠個性化的進行設(shè)置。通過使用者的個性化規(guī)則, 可大幅減少使用者輸入音標所產(chǎn)生的偏差,而造成錯誤的查詢結(jié)果。簡單說, 設(shè)定表42提供使用者指定那些音標可劃為等同音標,之后當使用者輸入音標字 符串進行查詢時,獲取模塊30由音標數(shù)據(jù)庫40中獲取單字時,會同時參照設(shè) 定表42,根據(jù)設(shè)定表42所記載的使用者發(fā)音偏好,而將所有相對應的單字獲取 出來。
舉例說明,使用者在設(shè)定表42中設(shè)定[e]等于[s],所以當使用者輸入 [s柳歸]音標進行查詢時,獲取模塊30便會將[ls即kl]與[eeer)k]]兩個音標所對
應的單字都獲取,所以得到"sank"與"Thank"兩個單字而提供使用者參考。
再舉例說明,假設(shè)使用者不容易分辨[e]和[S]兩者的差別,所以在設(shè)定表 42中設(shè)定[e]等于[S]。如此,先前所舉的[izSp]例子,在分析長度為l, 一次拆 解一個音標時,會有不同的結(jié)果產(chǎn)生。首先,拆解出的音標為[i],比對后發(fā)現(xiàn) 并無相對應的單字,因此繼續(xù)拆解下一個音標與之結(jié)合為[iz],比對后有相對應 的單字,所以[iz]為分解音標。繼續(xù)分析未完成的音標字符串,拆解出[S],因為 設(shè)定表42中設(shè)定[S]等于[e],因此比對后發(fā)現(xiàn)有相對應的單字,繼續(xù)拆解下一 個音標為[p],所以[S]、 [p]也為分解音標。再由獲取模塊30根據(jù)分解音標由音 標數(shù)據(jù)庫40中獲取相對應的單字,其結(jié)果為"is a pr"。因此,該例子最后輸 出模塊50會輸出兩組單字,分別為"isapr"及"isup"而提供使用者參考。
再介紹句子數(shù)據(jù)庫70,其主要功用是提高輸出單字的準確度。句子數(shù)據(jù)庫 70可用來儲存多個句子。所儲存的句子可為詞組、常用語句等,可用來比對單 字與單字之間的關(guān)聯(lián)性。因此,獲取模塊30除了得到與分解音標相對應的單字 外,會再比對這些單字與句子數(shù)據(jù)庫70中所儲存的句子,如此可增加輸出這些 單字的準確度。
參見圖3,其包含下列步驟
步驟S10:接收音標字符串。當逐字接收音標字符串時,可逐字輸出每一個
音標的正確發(fā)音,且當音標字符串接收完成時,會完整輸出音標字符串的正確 發(fā)音。如此,可讓使用者聽到所輸入的音標字符串的正確發(fā)音,而檢查所輸入 的音標字符串是否符合所欲查詢單字的發(fā)音,而提供使用者做實時的修正。
步驟S20:根據(jù)分析長度分解音標字符串,產(chǎn)生分解音標。分析長度的初始
值可設(shè)定為l,代表一次分解一個音標。而當根據(jù)分析長度為l,而分解完音標 字符串后,可將分析長度累加1而重新分解音標字符串,直到分析長度的字數(shù) 大于音標字符串的字數(shù)為止。因此,可提供多種可能的單字組合,提供使用者參考。
步驟S30:根據(jù)分解音標,從音標數(shù)據(jù)庫中獲取與每一個分解音標相對應的
單字。其中,音標數(shù)據(jù)庫可包含設(shè)定表,而設(shè)定表可用來紀錄使用者自訂發(fā)音 偏好。以滿足各個使用者不同的發(fā)音偏好的需求。
為了提高所擷取的單字準確度,其包含下列步驟提供句子數(shù)據(jù)庫用來儲 存多個句子。所儲存句子的數(shù)量可根據(jù)需求而定,當儲存的句子數(shù)目越多,由 于可參考的例子變多,所以單字的正確率可越高,但同時所需求的內(nèi)存容量也 就越大。所以,可同時考慮內(nèi)存容量而決定所要儲存的句子數(shù)目。
提供句子數(shù)據(jù)庫后,可將步驟S30所獲取出的單字與句子數(shù)據(jù)庫中的句子
互相比對,如此可用來增加單字的準確度。
步驟S40:最后,將步驟S30所獲取的單字輸出,提供使用者參考。
權(quán)利要求
1、一種利用組合音標查詢單字的裝置,其特征在于該裝置包含音標數(shù)據(jù)庫;輸入模塊,用來輸入音標字符串;分析模塊,根據(jù)分析長度分解音標字符串,產(chǎn)生分解音標;獲取模塊,根據(jù)分解音標,從音標數(shù)據(jù)庫中獲取與每一個分解音標相對應的單字;輸出模塊,用來輸出單字,所述輸入模塊接入分析模塊,所述分析模塊接入獲取模塊,所述獲取模塊接入輸出模塊,所述音標數(shù)據(jù)庫與獲取模塊相接。
2、 根據(jù)權(quán)利要求1所述的利用組合音標查詢單字的裝置,其特征在于所 述輸入模塊還包含檢查單元,用來在逐字輸入音標字符串時,逐字輸出音標字 符串的正確發(fā)音。
3、 根據(jù)權(quán)利要求1所述的利用組合音標查詢單字的裝置,其特征在于該 裝置還包含設(shè)定模塊,用來設(shè)定分析模塊的分析長度。
4、 根據(jù)權(quán)利要求1所述的利用組合音標査詢單字的裝置,其特征在于所 述音標數(shù)據(jù)庫還包含設(shè)定表,用來紀錄使用者自訂的發(fā)音偏好。
5、 根據(jù)權(quán)利要求1所述的利用組合音標查詢單字的裝置,其特征在于該 裝置還包含句子數(shù)據(jù)庫,用來儲存多個句子,所述句子數(shù)據(jù)庫與音標數(shù)據(jù)庫相 接。
6、 一種利用組合音標查詢單字的方法,其特征在于包含下列步驟1) 接收音標字符串;2) 根據(jù)分析長度分解音標字符串,產(chǎn)生分解音標;3) 根據(jù)分解音標,從音標數(shù)據(jù)庫中獲取與每一個分解音標相對應的單字;4) 輸出該單字。
7、 根據(jù)權(quán)利要求6所述的利用組合音標查詢單字的方法,其特征在于所 述步驟l)中接收音標字符串時,逐字接收音標字符串,同時逐字輸出音標字符 串的正確發(fā)音。
8、 根據(jù)權(quán)利要求6所述的利用組合音標查詢單字的方法,其特征在于所述步驟2)中根據(jù)分析長度分解音標字符串時,當分解完音標字符串時,將分析長度累加1而重新分解音標字符串,直到分析長度大于音標字符串的字數(shù)為止。
9、根據(jù)權(quán)利要求6所述的利用組合音標査詢單字的方法,其特征在于所述步驟3)和步驟4)之間還包括步驟5)中所獲取出的單字與句子數(shù)據(jù)庫中的 句子互相比對。
全文摘要
本發(fā)明涉及一種利用組合音標查詢單字的裝置與方法,該裝置包含音標數(shù)據(jù)庫;輸入模塊,用來輸入音標字符串;分析模塊,根據(jù)分析長度分解音標字符串,產(chǎn)生分解音標;獲取模塊,根據(jù)分解音標,從音標數(shù)據(jù)庫中獲取與每一個分解音標相對應的單字;輸出模塊,用來輸出單字,輸入模塊接入分析模塊,分析模塊接入獲取模塊,獲取模塊接入輸出模塊,音標數(shù)據(jù)庫與獲取模塊相接。本發(fā)明提供的利用組合音標查詢單字的裝置與方法,可支持音標的多次組合,使用者可對發(fā)音的偏好進行設(shè)定。
文檔編號G09B19/06GK101339567SQ20081015060
公開日2009年1月7日 申請日期2008年8月12日 優(yōu)先權(quán)日2008年8月12日
發(fā)明者剛 劉, 輝 鐘, 陳淮琰 申請人:無敵科技(西安)有限公司