專利名稱:可攜式電子裝置、語音輸入字典模塊及其數(shù)據(jù)處理方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于一種可攜式電子裝置、用于該可攜式電子裝置的語音輸入字典模塊 及其數(shù)據(jù)處理方法;更詳細(xì)地說,本發(fā)明是關(guān)于一種通過識(shí)別一語音聲波,以查詢單字的可 攜式電子裝置、用于該可攜式電子裝置的語音輸入字典模塊及其數(shù)據(jù)處理方法。
背景技術(shù):
隨著時(shí)代的進(jìn)步,人們與電子產(chǎn)品的互動(dòng)也越來越頻繁?,F(xiàn)今電子產(chǎn)品的功能更 趨向多元化發(fā)展,例如移動(dòng)電話具備電子辭典、GPS、行事歷...等功能。然而,由于單一 電子產(chǎn)品所具備的功能的多元化,也使得電子產(chǎn)品的操控方式也日趨復(fù)雜。以一具備電子 辭典功能的移動(dòng)電話為例,若使用者準(zhǔn)備查詢一英文單字,則該使用者需將該英文單字所 有的英文字母通過移動(dòng)電話的按鈕,以手動(dòng)方式一個(gè)一個(gè)英文字母依序輸入至移動(dòng)電話, 以便其電子辭典功能順利運(yùn)作,倘若該英文單字所包含的英文字母越多時(shí)(例如火山硅肺 癥;Pneumonoultramicroscopicsilicovolcanoconiosis),貝[I使用者將耗費(fèi)更多的時(shí)間于 輸入英文字母這個(gè)動(dòng)作。有鑒于此,要如何將電子辭典功能與語音識(shí)別系統(tǒng)結(jié)合,以語音輸入方式取代傳 統(tǒng)的手動(dòng)輸入方式進(jìn)行單字的查詢,并將其應(yīng)用于各種不同類型的電子產(chǎn)品上,這是語音 識(shí)別系統(tǒng)制造廠商亟待達(dá)成的目標(biāo)。
發(fā)明內(nèi)容
本發(fā)明的一目的在于提供一種語音輸入字典模塊,其包含一字典數(shù)據(jù)庫、一語音 識(shí)別模塊以及一字母序列配對(duì)模塊。該字母序列配對(duì)模塊耦合至該字典數(shù)據(jù)庫以及該語音 識(shí)別模塊。該字典數(shù)據(jù)庫用以儲(chǔ)存多個(gè)單字。該語音識(shí)別模塊用以識(shí)別一語音聲波,以產(chǎn)生 至少一輸入字母。該字母序列配對(duì)模塊則用以自該語音識(shí)別模塊接收該至少一輸入字母, 累加地產(chǎn)生至少一已識(shí)別字母序列,并根據(jù)該至少一已識(shí)別字母序列,自該字典數(shù)據(jù)庫,讀 取以該至少一已識(shí)別字母序列作為起始的至少一單字。本發(fā)明的另一目的在于提供一種可攜式電子裝置。該可攜式電子裝置包含前段所 述的語音輸入字典模塊以及一顯示模塊。語音輸入字典模塊的字母序列配對(duì)模塊耦合至其 字典數(shù)據(jù)庫、語音識(shí)別模塊以及該顯示模塊。該字典數(shù)據(jù)庫儲(chǔ)存多個(gè)單字。該語音識(shí)別模 塊用以識(shí)別一語音聲波,以產(chǎn)生至少一輸入字母。該字母序列配對(duì)模塊則用以自該語音識(shí) 別模塊接收該至少一輸入字母,累加地產(chǎn)生至少一已識(shí)別字母序列,并根據(jù)該至少一已識(shí) 別字母序列,自該字典數(shù)據(jù)庫,讀取以該至少一已識(shí)別字母序列作為起始的至少一單字。該 顯示模塊則自該字母序列配對(duì)模塊接收并顯示該至少一單字。本發(fā)明的又一目的在于提供一種用于一語音輸入字典模塊的數(shù)據(jù)處理方法,適用 于前段所述的語音輸入字典模塊。該數(shù)據(jù)處理方法包含下列步驟(a)識(shí)別一語音聲波,以 產(chǎn)生至少一輸入字母;(b)接收該至少一輸入字母,并根據(jù)該至少一輸入字母累加地產(chǎn)生 至少一已識(shí)別字母序列;以及(c)根據(jù)該至少一已識(shí)別字母序列,自語音輸入字典模塊的字典數(shù)據(jù)庫,讀取以該至少一已識(shí)別字母序列作為起始的至少一單字。本發(fā)明的可攜式電子裝置可通過其語音輸入字典模塊,以識(shí)別一語音聲波的方 式,并同字典數(shù)據(jù)庫儲(chǔ)存的多個(gè)單字,協(xié)助使用者查詢其所需的單字。如此一來,使用本發(fā) 明的可攜式電子裝置的使用者將可直接以語音輸入方式取代繁瑣的手動(dòng)輸入方式來查詢 單字,使得可攜式電子裝置的操作更加的便利。
在參閱附圖及隨后描述的實(shí)施方式后,該技術(shù)領(lǐng)域具有通常知識(shí)者便可了解本發(fā) 明的其它目的,以及本發(fā)明的技術(shù)手段及實(shí)施態(tài)樣,其中圖1是本發(fā)明的第一實(shí)施例的示意圖;圖2是第一實(shí)施例的語音輸入字典模塊的示意圖;圖3A及圖3B是本發(fā)明的第二實(shí)施例的流程圖;以及圖4A至圖4D是第一實(shí)施例的顯示模塊的示意圖。
具體實(shí)施例方式以下將通過實(shí)施例來舉例說明本發(fā)明內(nèi)容,并非用以限制本發(fā)明。本發(fā)明的描述 是關(guān)于一種可攜式電子裝置、使用于可攜式電子裝置的語音輸入字典模塊及其數(shù)據(jù)處理方 法,該可攜式電子裝置可為易于隨時(shí)移動(dòng)攜帶的電子裝置,如移動(dòng)電話、個(gè)人數(shù)字助理裝置 (PDA)...等,但不以前述的裝置為限制。需說明者,以下實(shí)施例及附圖中,與本發(fā)明非直接 相關(guān)的元件已省略而未繪示;且附圖中各元件間的尺寸關(guān)系僅為求容易了解,非用以限制 其實(shí)際比例。圖1是本發(fā)明的第一實(shí)施例的可攜式電子裝置1的示意圖??蓴y式電子裝置1包 含一錄音模塊n、一語音輸入字典模塊13、一手動(dòng)輸入模塊15以及一顯示模塊17。語音輸 入字典模塊13耦合至錄音模塊11、手動(dòng)輸入模塊15以及顯示模塊17。錄音模塊11則包含一啟動(dòng)模塊Ila以及一結(jié)束模塊11b,啟動(dòng)模塊Ila用以致能 錄音模塊11,俾開始錄制使用者的一語音聲波102,并建立語音聲波102的一起始點(diǎn);結(jié)束 模塊lib用以禁能錄音模塊11,以便結(jié)束錄制語音聲波102,以建立語音聲波102的一結(jié)束 點(diǎn)。除此之外,在其它實(shí)施態(tài)樣中,語音聲波102的起始點(diǎn)以及結(jié)束點(diǎn)亦可例如通過一能量 分析模塊分析語音聲波102的能量大小變化而決定。換言之,使用者可通過錄音模塊11的 啟動(dòng)模塊Ila以及結(jié)束模塊lib手動(dòng)建立語音聲波102的起始點(diǎn)以及結(jié)束點(diǎn),或通過一能 量分析模塊自動(dòng)檢測(cè)語音聲波102的起始點(diǎn)及結(jié)束點(diǎn)。手動(dòng)輸入模塊15則可為鍵盤或觸 控屏幕等輸入接口,使得使用者能夠藉其輸入至少一手動(dòng)輸入字母104。當(dāng)語音輸入字典模塊13自錄音模塊11接收語音聲波102之后。語音輸入字典模 塊13將識(shí)別語音聲波102,并根據(jù)識(shí)別結(jié)果產(chǎn)生至少一單字106。顯示模塊17則自語音輸 入字典模塊13接收單字106并顯示單字106。圖2是可攜式電子裝置1的語音輸入字典模塊13的示意圖。語音輸入字典模塊 13包含一語音識(shí)別模塊131、一寄存器133、一字母序列配對(duì)模塊135以及一字典數(shù)據(jù)庫 137。字母序列配對(duì)模塊135耦合至語音識(shí)別模塊131、字典數(shù)據(jù)庫137以及手動(dòng)輸入模塊 15。語音識(shí)別模塊131包含一特征向量抽取模塊131a、一維特比(Viterbi)搜尋模塊131b以及一語音模型庫(Word Model Pool) 131c。語音識(shí)別模塊131接收語音聲波102之后,特征向量抽取模塊131a將分析語音聲 波102,以產(chǎn)生一特征向量132。接著,維特比搜尋模塊131b即根據(jù)特征向量132,通過一維 特比算法語音模型庫1131c進(jìn)行搜尋,以產(chǎn)生至少一輸入字母136。語音模型庫131c儲(chǔ)存 多個(gè)與語者無關(guān)的字母語音模型134。維特比搜尋模塊131b將特征向量132與這些語音 模型134比較,并藉此產(chǎn)生數(shù)量不等(一個(gè)或多個(gè))的輸入字母136。同時(shí),維特比搜尋模 塊131b將根據(jù)特征向量132與這些語音模型134比較的相似度,針對(duì)輸入字母136,標(biāo)志一 機(jī)率分?jǐn)?shù)。接著,字母序列配對(duì)模塊135將根據(jù)前述的機(jī)率分?jǐn)?shù)依序排列前述的輸入字母 136,并將其加入到已識(shí)別字母序列138并暫存至寄存器133中。最后,字母序列配對(duì)模塊135將根據(jù)依序排列的至少一已識(shí)別字母序列138,自該 字典數(shù)據(jù)庫,讀取以至少一已識(shí)別字母序列138作為起始的單字106。需注意的是,當(dāng)語音識(shí)別模塊131接收另一語音聲波后,字母序列配對(duì)模塊135將 由該另一語音聲波所識(shí)別出的另一輸入字母累加至前述的已識(shí)別字母序列138,進(jìn)而產(chǎn)生 新的已識(shí)別字母序列138。換言之,已識(shí)別字母序列138是不同時(shí)間中,已識(shí)別的輸入字母 的排列組合,所屬技術(shù)領(lǐng)域具有通常知識(shí)者應(yīng)可理解將輸入字母進(jìn)行累加的方式,故在此 不再贅述。隨后,字母序列配對(duì)模塊135將根據(jù)前述新的已識(shí)別字母序列138累積的機(jī)率 分?jǐn)?shù)進(jìn)行總合排列,再行暫存于寄存器133中。字母序列配對(duì)模塊135則根據(jù)目前暫存于 寄存器的新的已識(shí)別字母序列138,自該字典數(shù)據(jù)庫,讀取以新的已識(shí)別字母序列138作為 起始的單字106。除此之外,字母序列配對(duì)模塊135亦可自手動(dòng)輸入模塊15接收手動(dòng)輸入字母104, 再依據(jù)前段所述的方式將手動(dòng)輸入字母104累加至?xí)捍嬗诩拇嫫?33中的已識(shí)別字母序列 138。簡(jiǎn)言之,本實(shí)施例中所述的字母輸入方式可通過語音輸入方式、手動(dòng)輸入方式或是語 音輸入方式與手動(dòng)輸入方式的組合完成的。詳細(xì)來說,假設(shè)使用者產(chǎn)生的語音聲波102是英文字母「b」,通過語音識(shí)別模塊 131識(shí)別后,將產(chǎn)生輸入字母「b」以及「d」的結(jié)果。同時(shí),語音識(shí)別模塊13將分別標(biāo)志一機(jī) 率分?jǐn)?shù)至前述輸入字母「b」以及「d」,如表1所示。表 權(quán)利要求
一種語音輸入字典模塊,用于一可攜式電子裝置,該語音輸入字典模塊包含一字典數(shù)據(jù)庫,用以儲(chǔ)存多個(gè)單字;一語音識(shí)別模塊,用以識(shí)別一語音聲波,以產(chǎn)生至少一輸入字母;以及一字母序列配對(duì)模塊,耦合至該字典數(shù)據(jù)庫及該語音識(shí)別模塊,用以自該語音識(shí)別模塊接收該至少一輸入字母,累加地產(chǎn)生至少一已識(shí)別字母序列,并根據(jù)該至少一已識(shí)別字母序列,自該字典數(shù)據(jù)庫,讀取以該至少一已識(shí)別字母序列作為起始之至少一單字。
2.根據(jù)權(quán)利要求1所述的語音輸入字典模塊,其特征在于,該語音識(shí)別模塊還包含 一語音模型庫;以及一維特比搜尋模塊,根據(jù)一特征向量以一維特比算法自該語音模型庫搜尋并產(chǎn)生該至 少一輸入字母。
3.根據(jù)權(quán)利要求2所述的語音輸入字典模塊,其特征在于,該維特比搜尋模塊針對(duì)該 至少一輸入字母,標(biāo)志一機(jī)率分?jǐn)?shù)。
4.根據(jù)權(quán)利要求3所述的語音輸入字典模塊,其特征在于,該字母序列配對(duì)模塊根據(jù) 該機(jī)率分?jǐn)?shù)依序排列該至少一已識(shí)別字母序列,且根據(jù)該依序排列的至少一已識(shí)別字母序 列,自該字典數(shù)據(jù)庫讀取該至少一單字。
5.根據(jù)權(quán)利要求4所述的語音輸入字典模塊,其特征在于,該可攜式電子裝置還包含 一顯示模塊,耦合至該語音輸入字典模塊,該字母序列配對(duì)模塊用以輸出該至少一單字至 該顯示模塊,該顯示模塊顯示該至少一單字。
6.根據(jù)權(quán)利要求1所述的語音輸入字典模塊,其特征在于,該可攜式電子裝置還包含 一手動(dòng)輸入模塊,其中該手動(dòng)輸入模塊用以輸入至少一手動(dòng)輸入字母,并將該至少一手動(dòng) 輸入字母累加至該至少一已識(shí)別字母序列。
7.一種用于一語音輸入字典模塊的數(shù)據(jù)處理方法,該語音輸入字典模塊用于一可攜式 電子裝置,且包含一字典數(shù)據(jù)庫,儲(chǔ)存多個(gè)單字,該數(shù)據(jù)處理方法包含下列步驟(a)識(shí)別一語音聲波,以產(chǎn)生至少一輸入字母;(b)接收該至少一輸入字母,并根據(jù)該至少一輸入字母累加地產(chǎn)生至少一已識(shí)別字母 序列;以及(c)根據(jù)該至少一已識(shí)別字母序列,自該字典數(shù)據(jù)庫,讀取以該至少一已識(shí)別字母序列 作為起始的至少一單字。
8.根據(jù)權(quán)利要求7所述的數(shù)據(jù)處理方法,其特征在于,步驟(a)還包含下列步驟 分析該語音聲波以產(chǎn)生一特征向量;以及根據(jù)該特征向量以一維特比算法自一語音模型庫搜尋并產(chǎn)生該至少一輸入字母。
9.根據(jù)權(quán)利要求8所述的數(shù)據(jù)處理方法,其特征在于,還包含以下步驟 針對(duì)該至少一輸入字母,標(biāo)志一機(jī)率分?jǐn)?shù)。
10.根據(jù)權(quán)利要求9所述的數(shù)據(jù)處理方法,其特征在于,步驟(c)還包含下列步驟 根據(jù)該機(jī)率分?jǐn)?shù)依序排列該至少一已識(shí)別字母序列;以及根據(jù)該依序排列的至少一已識(shí)別字母序列,自該字典數(shù)據(jù)庫讀取該至少一單字。
11.根據(jù)權(quán)利要求7所述的數(shù)據(jù)處理方法,其特征在于,還包含下列步驟 手動(dòng)輸入至少一手動(dòng)輸入字母;以及將該至少一手動(dòng)輸入字母累加至該至少一已識(shí)別字母序列。
12.一種可攜式電子裝置,包含一顯示模塊;以及一語音輸入字典模塊,耦合至該語音輸入字典模塊,具有一字典數(shù)據(jù)庫,用以儲(chǔ)存多個(gè)單字;一語音識(shí)別模塊,用以識(shí)別一語音聲波,以產(chǎn)生至少一輸入字母;以及一字母序列配對(duì)模塊,耦合至該字典數(shù)據(jù)庫以及該語音識(shí)別模塊,用以自該語音識(shí)別 模塊接收該至少一輸入字母,累加地產(chǎn)生至少一已識(shí)別字母序列,根據(jù)該至少一已識(shí)別字 母序列,自該字典數(shù)據(jù)庫,讀取以該至少一已識(shí)別字母序列作為起始的至少一單字,并輸出 該至少一單字;其中,該顯示模塊自該字母序列配對(duì)模塊接收并顯示該至少一單字。
13.根據(jù)權(quán)利要求12所述的可攜式電子裝置,其特征在于,還包含一手動(dòng)輸入模塊, 用以輸入至少一手動(dòng)輸入字母,并將該至少一手動(dòng)輸入字母累加至該至少一已識(shí)別字母序 列。
14.根據(jù)權(quán)利要求12所述的可攜式電子裝置,其特征在于,該語音識(shí)別模塊還包含一語音模型庫;以及一維特比搜尋模塊,根據(jù)一特征向量以一維特比算法自該語音模型庫搜尋并產(chǎn)生該至 少一輸入字母。
15.根據(jù)權(quán)利要求14所述的可攜式電子裝置,其特征在于,該維特比搜尋模塊針對(duì)該 至少一輸入字母,標(biāo)志一機(jī)率分?jǐn)?shù)。
16.根據(jù)權(quán)利要求15所述的可攜式電子裝置,其特征在于,該字母序列配對(duì)模塊根據(jù) 該機(jī)率分?jǐn)?shù)依序排列該至少一已識(shí)別字母序列,且根據(jù)該依序排列的至少一已識(shí)別字母序 列,自該字典數(shù)據(jù)庫讀取該至少一單字。
全文摘要
本發(fā)明是一種可攜式電子裝置、語音輸入字典模塊及其數(shù)據(jù)處理方法。該語音輸入字典模塊包含一字典數(shù)據(jù)庫、一語音識(shí)別模塊以及一字母序列配對(duì)模塊。該字典數(shù)據(jù)庫用以儲(chǔ)存多個(gè)單字。該語音識(shí)別模塊用以識(shí)別一語音聲波,以產(chǎn)生至少一輸入字母。該字母序列配對(duì)模塊耦合至該字典數(shù)據(jù)庫以及該語音識(shí)別模塊,用以自該語音識(shí)別模塊接收該至少一輸入字母,累加地產(chǎn)生至少一已識(shí)別字母序列,并根據(jù)該至少一已識(shí)別字母序列,自該字典數(shù)據(jù)庫,讀取以該至少一已識(shí)別字母序列作為起始之至少一單字。
文檔編號(hào)G10L15/26GK101989284SQ20091015927
公開日2011年3月23日 申請(qǐng)日期2009年8月7日 優(yōu)先權(quán)日2009年8月7日
發(fā)明者何泰軒, 顏坤銘 申請(qǐng)人:賽微科技股份有限公司