專利名稱:依照語音查詢單詞的系統(tǒng)及方法
技術領域:
本發(fā)明涉及一種單詞查詢系統(tǒng)及其方法。
背景技術:
在外語學習以及運用外語進行交流的過程中,經常需要查詢單詞的含意、用法等信息。例如在閱讀外文數據時,遇到不認識的單詞是很常見的情況,這些單詞通過查字典就很容易解決,更為方便的是,目前出現了品種繁多的電子字典以及計算機軟件,在電子字典或計算機上錄入單詞,就可以很容易的查詢到單詞的相關信息。
“聽說”是外語學習以及用外語進行交流的過程一項非常重要的技能,當進行聽力練習的時候,要求學習者聽到一個句子,就能立刻反應出這句話的含意,句子都是由單詞組成的,如果不知道其中某個單詞的意思,就會影響對整句話的理解。在運用外語交流時也同樣,需要及時反映出所聽到的單詞的母語意思,這樣才能夠真正做到交流無障礙。當我們遇到一些聽不懂的單詞時,通常的解決途徑都是通過字典來查詢其含意,但是此時只知道單詞的發(fā)音而不知道單詞的拼寫,查字典是需要輸入單詞的拼寫的,用戶必須知道單詞的拼寫方法才能查詢。因此有時用戶只能根據單詞發(fā)音,來猜測其拼寫。找到相應的單詞后,將其代入句子中,來驗證這種猜測是否正確,但是有很多單詞僅僅憑借其發(fā)音,是很難正確的判斷其拼寫的,因為有很多單詞都是發(fā)音不規(guī)則的,因此經常會浪費很多時間來猜測并驗證單詞,而最后仍然可能查不到相應單詞的含意。
發(fā)明內容
本發(fā)明解決了背景技術中存在的電子辭典不能通過語音查單詞的技術問題。
本發(fā)明的技術方案是一種依照語音查詢單詞的系統(tǒng),其特殊之處在于該系統(tǒng)包括用于接收音頻數據的接收模塊;負責播放接收到的音頻數據的播放模塊;用來擷取播放過程中的音頻數據的單詞聲音片段作為選定單詞的音頻擷取模塊;用來儲存單詞信息的單詞信息數據庫;將選定單詞與單詞信息中的聲音信息進行比對,并得出比對結果的比對模塊;根據比對結果,顯示輸出相應單詞的注釋信息的輸出顯示模塊。
上述接收模塊還包括用來儲存音頻數據的儲存裝置。
上述音頻播放模塊還包括播放速度調整模塊。
上述單詞信息包括聲音信息及其相應的注釋信息。
上述注釋信息包含單詞的拼寫、釋義、音標、詞性、用法的任意組合。
上述單詞信息數據庫中更儲存單詞聲音信息與注釋信息的對照表。
本發(fā)明還提供一種依照語音查詢單詞的系統(tǒng)的運作方法,其特殊之處在于該方法包括如下步驟1)接收音頻數據;2)播放音頻數據,同時擷取單詞聲音片段,作為選定單詞;3)搜索單詞信息數據庫中與選定單詞相匹配的單詞聲音信息;4)根據比對結果,輸出相應的單詞注釋信息。
上述步驟1)還包含儲存音頻數據的步驟。
上述步驟2)搜索比對是根據相似音標近似比對。
上述步驟4)中,若不存在相匹配的單詞信息,則提示單詞不存在。
本發(fā)明具有如下優(yōu)點本發(fā)明的依照語音查詢單詞的系統(tǒng)及方法,運用語音辨識技術進行單詞查詢,突破了傳統(tǒng)的單詞查詢只能通過單詞的拼寫來進行單向查詢的瓶頸,尤其對于聽力練習過程中,直接通過發(fā)音進行單詞查詢,有效的解決了聽力中的出現的生詞,用較短的時間換取了較大的學習成效。
四
圖1為本發(fā)明系統(tǒng)的模塊架構圖;圖2為本發(fā)明依照語音進行單詞查詢的方法流程圖;圖3為本發(fā)明實施例運作流程圖;圖4~圖7為本發(fā)明一實施例接口示意圖。
五具體實施例方式
請參見圖1,本發(fā)明依照語音查詢單詞的系統(tǒng),包括有接收模塊110,用來接收音頻數據,學習者可以通過網絡下載來取得音頻數據,也可以將聽力練習內容錄制下來,同時接收模塊110,還具有儲存的功能,可以將接收到的音頻數據以時間順序進行儲存。
播放模塊120,其負責將接收到的音頻數據播放出來,在播放時,還可以調整播放速度,為了便于準確的擷取所要查詢的單詞,可以將播放速度放慢。
音頻擷取模塊130,主要負責擷取音頻數據中的聲音片段,在播放的音頻數據中擷取一個單詞的發(fā)音作為選定單詞,可通過音頻擷取按鈕,在正在播放的音頻數據中擷取所需查詢的選定單詞。
單詞信息數據庫140,其主要是用來儲存單詞信息,單詞信息包括聲音信息及其相應的單詞拼寫、釋義、音標、詞性、用法等注釋信息。另外還儲存有一份對照表,對照表中描述了單詞的聲音信息與注釋信息之間的彼此對應關系。
比對模塊150,負責比對擷取到的選定單詞與單詞信息數據庫中聲音信息,得出比對結果,如果比對模塊找到相匹配的聲音信息,則通過檢測對照表的對應關系從單詞信息數據庫140中找到相應的單詞注釋信息;如果經過比對,沒有找到匹配的聲音信息,則得出無此單詞的結論。
輸出顯示模塊160,主要負責將比對模塊150中的比對結果輸出,如果一個聲音信息對應與多個單詞注釋信息時,則將所有的注釋信息顯示出來。
參見圖2,本發(fā)明依照語音進行單詞查詢的方法包含以下步驟步驟210首先接收音頻數據;步驟220播放音頻數據,同時擷取一單詞聲音片段,作為選定單詞;步驟230然后搜索單詞信息數據庫中與該選定單詞相匹配的單詞聲音信息;步驟240最后根據比對結果,輸出相應的單詞注釋信息。
參見圖3,本發(fā)明一實施例運作流程包含以下步驟步驟310首先,在單詞信息數據庫中儲存有單詞信息,單詞信息包括單詞聲音信息以及單詞注釋信息,單詞注釋信息包括有單詞拼寫、釋義、音標、詞性、用法等信息。另外,單詞信息數據庫中還儲存有一對照表,對照表將聲音信息與注釋信息聯系起來。在對照表中一個聲音信息可能對應于一個或多個注釋信息。學習者練習聽力時,都要接收一段音頻數據作為聽力練習內容,取得方式可以從網上下載,也可以通過錄音設備錄制,接收的同時將音頻數據內容以時間為標準進行儲存。
步驟320然后播放錄入的音頻數據,播放時可以由用戶根據需要調節(jié)播放速度,學習者為了便于提取所要查詢的單詞,可以將播放速度放慢。
步驟330然后通過激活音頻擷取模塊,來擷取所需的選定單詞,也就是擷取單詞的發(fā)音。
步驟340接著在單詞信息數據庫中搜索與選定單詞相匹配的聲音信息,在進行比對時,只是進行相似比對,并不要求完全比對,因為并不是每一種語言都有唯一的發(fā)音規(guī)則,有時會由于地域性的差異,或是原始數據講話人發(fā)音的原因,從而導致單詞的發(fā)音與儲存在單詞信息庫中的聲音信息不同的情況,因此這里只做近似的比對。近似比對是根據相似音標規(guī)則表進行的。以英語為例,請參見下表,為相似音標規(guī)則表 根據上表,利用語音辨識技術對相似的發(fā)音做近似的比對,在聲音信息中進行搜索。
步驟350然后判斷是否有相應的聲音信息;步驟360如果有相應的聲音信息,則通過對照表找到相應的注釋信息;步驟370再將找到的注釋信息顯示出來。如果該發(fā)音在單詞信息數據庫中僅有一個發(fā)音與之相同或相似,則直接顯示該單詞,即可得到該單詞、詞性、音標、例句、釋義等相關信息。如果該發(fā)音在發(fā)音數據庫中有多個發(fā)音與之相同或相似,則顯示多個發(fā)音所對應的單詞,即可得到該單詞、詞性、音標、例句、釋義等相關信息。如果沒有找到相應的聲音信息,則顯示單詞不存在(步驟380)。
接下來參見圖4~圖7,為本發(fā)明另一較佳實施例的接口示意圖。圖4為擷取發(fā)音接口,學習者通過錄音按鈕錄下發(fā)音The disagreement among thefamily members healed over with time.當需要對句子中不熟悉的單詞進行查詢時,要將不熟悉的單詞從句子中提取出來,為了準確的擷取發(fā)音,可根據調整速度按鈕來將播放速度放慢。再通過擷取發(fā)音按鈕擷取發(fā)音,以實現準確的擷取。擷取發(fā)音結束后,按下查詢按鈕進行查找相同或是相近的發(fā)音。例如擷取了“healed”的發(fā)音。如果找到相同或是相近發(fā)音的單詞,則顯示出與heal發(fā)音相似的三個單詞,直接選擇所顯示的單詞就可以查到相關的單詞信息。例如點選單詞“heal”,就會顯示“heal”的音標、釋義等單詞信息。學習者就可以根據單詞的釋義來判斷播放的發(fā)音所對應的單詞。如果沒有搜索到相應的單詞,則系統(tǒng)會出現提示,提示學習者是否需要重新擷取發(fā)音,如果學習者選擇了“是”,系統(tǒng)將回到擷取發(fā)音接口,如果學習者選擇了“否”,則結束發(fā)音查詢,退出程序。
權利要求
1.一種依照語音查詢單詞的系統(tǒng),其特征在于該系統(tǒng)包括用于接收音頻數據的接收模塊;負責播放接收到的音頻數據的播放模塊;用來擷取播放過程中的音頻數據的單詞聲音片段作為選定單詞的音頻擷取模塊;用來儲存單詞信息的單詞信息數據庫;將選定單詞與單詞信息中的聲音信息進行比對,并得出比對結果的比對模塊;根據比對結果,顯示輸出相應單詞的注釋信息的輸出顯示模塊。
2.根據權利要求1所述的依照語音查詢單詞的系統(tǒng),其特征在于所述接收模塊還包括用來儲存音頻數據的儲存裝置。
3.根據權利要求1所述的依照語音查詢單詞的系統(tǒng),其特征在于所述音頻播放模塊還包括播放速度調整模塊。
4.根據權利要求1所述的依照語音查詢單詞的系統(tǒng),其特征在于所述單詞信息包括聲音信息及其相應的注釋信息。
5.根據權利要求4所述的依照語音查詢單詞的系統(tǒng),其特征在于所述注釋信息包含單詞的拼寫、釋義、音標、詞性、用法等的任意組合。
6.根據權利要求1所述的依照語音查詢單詞的系統(tǒng),其中所述單詞信息數據庫中更儲存單詞聲音信息與注釋信息的對照表。
7.根據權利要求1所述的依照語音查詢單詞的系統(tǒng)的運作方法,其特征在于該方法包括如下步驟1)接收音頻數據;2)播放音頻數據,同時擷取單詞聲音片段,作為選定單詞;3)搜索單詞信息數據庫中與選定單詞相匹配的單詞聲音信息;4)根據比對結果,輸出相應的單詞注釋信息。
8.根據權利要求7所述的依照語音進行單詞查詢的方法,其特征在于所述步驟1)還包含儲存音頻數據的步驟。
9.根據權利要求7所述的依照語音進行單詞查詢的方法,其特征在于所述步驟2)搜索比對是根據相似音標近似比對。
10.根據權利要求7所述的依照語音進行單詞查詢的方法,其特征在于所述步驟4)中,若不存在相匹配的單詞信息,則提示單詞不存在。
全文摘要
本發(fā)明涉及一種單詞查詢系統(tǒng)及其方法。該系統(tǒng)包括用于接收音頻數據的接收模塊;負責播放接收到的音頻數據的播放模塊;用來擷取播放過程中的音頻數據的單詞聲音片段作為選定單詞的音頻擷取模塊;用來儲存單詞信息的單詞信息數據庫;將選定單詞與單詞信息中的聲音信息進行比對,并得出比對結果的比對模塊;根據比對結果,顯示輸出相應單詞的注釋信息的輸出顯示模塊。本發(fā)明運用語音辨識技術進行單詞查詢,突破了傳統(tǒng)的單詞查詢只能通過單詞的拼寫來進行單向查詢的瓶頸,尤其對于聽力練習過程中,直接通過發(fā)音進行單詞查詢,有效的解決了聽力中出現的生詞,用較短的時間換取了較大的學習成效。
文檔編號G10L15/00GK1542733SQ200310105899
公開日2004年11月3日 申請日期2003年11月7日 優(yōu)先權日2003年11月7日
發(fā)明者陳淮琰, 王敏娟 申請人:無敵科技(西安)有限公司