專利名稱:用字符特征對應的參數(shù)來發(fā)出不同效果的字音系統(tǒng)及方法
技術領域:
本發(fā)明涉及一種發(fā)出字音的系統(tǒng)及其方法,特別涉及一種根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng)及其方法。
背景技術:
由于科技日益進步,其中,語音合成技術以及語音識別技術已漸漸趨于成熟,可應用的范圍相當廣泛,例如,可用于翻譯機的語音發(fā)音,此外,還可結合手機的短信功能,使之成為“有聲短信”,此功能將是未來趨勢,通過“有聲短信”,使用者不必用眼睛去看屏幕上顯示的字,用聽就能得知信息內容,這對于視障同胞而言,相當方便,最早的有聲字應用于電子翻譯機,使用者只要按下發(fā)音鍵后,系統(tǒng)便會發(fā)出屏幕上所顯示的語句。
然而,使用者按了發(fā)聲鍵后,往往只有單調的發(fā)音,顯得相當無趣,而且,在字里行間,有時候會特別標明底線,或是標示成不同顏色、不同大小的字體,以表示文章中的重點,倘若只有單一聲調的發(fā)音,使用者便無法特別感受到文章中的特別之處,或是特別強調的語句,如此一來,整段文章聽起來將會顯得相當平淡且無趣。
發(fā)明內容
本發(fā)明的主要目的在于提供一種根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng)及其方法,使用者可以利用文字的編輯,來控制不同效果的語音輸出,來解決現(xiàn)有技術所存在的問題。
因此,為達上述目的,本發(fā)明所公開的一種根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng),包含有字音數(shù)據庫、字符特征數(shù)據庫、讀取模塊、處理模塊、語音合成模塊以及播放模塊。
字音數(shù)據庫其中內部存儲有多個字符發(fā)音文件,每個字符發(fā)音文件分別有其對應的字符發(fā)音參數(shù)。
字符特征數(shù)據庫其中內部存儲有多個字符特征發(fā)音文件,每個字符特征發(fā)音文件分別有其對應的字符特征參數(shù)。
讀取模塊其用以讀取一字符串,在字符串中包含有至少一個字符,每個字符分別包含有字符發(fā)音參數(shù)以及字符特征參數(shù)。
處理模塊其根據各個字符分別對應的字符發(fā)音參數(shù)以及字符特征參數(shù),用以從字音數(shù)據庫以及字符特征數(shù)據庫中讀取出對應的字符發(fā)音文件以及字符特征發(fā)音文件。
語音合成模塊其用以合成各個字符分別對應的字符發(fā)音文件以及字符特征發(fā)音文件,合成后以形成播放字音文件。
播放模塊其用以播放各個播放字音文件。
上述根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng),其中還包含有一分析模塊,用以分析字符串的字符分別具有的字符發(fā)音參數(shù)以及字符特征參數(shù)。
上述系統(tǒng),其中還包含有一存儲模塊,用以存儲播放字音文件。
上述系統(tǒng),其中每個字符特征參數(shù)是依照每個字符的字型、顏色或字體大小的特征所編輯的參數(shù)。
上述系統(tǒng),其中每個字符發(fā)音文件和字符特征發(fā)音文件的文件格式分別為「.wav」、「.au」、「.snd」、「.voc」、「.aiff」、「.afc」、「.iff」或「.mat」中的一種文件格式。
另一方面,本發(fā)明的一種根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的方法,包含有下列步驟(A)建立多個字符發(fā)音文件,各個字符發(fā)音文件分別對應有一字符發(fā)音參數(shù);(B)建立多個字符特征發(fā)音文件,各個字符特征發(fā)音文件分別對應有一字符特征參數(shù);(C)讀取一字符串,此字符串包含至少一字符,每個字符分別具有對應的字符發(fā)音參數(shù)以及字符特征參數(shù);(D)根據每個字符分別對應的字符發(fā)音參數(shù)以及字符特征參數(shù),讀取對應的字符發(fā)音文件以及字符特征發(fā)音文件;(E)合成各個字符分別對應的字符發(fā)音文件以及字符特征發(fā)音文件,以形成至少一播放字音文件;以及
(F)播放各個播放字音文件。
上述根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的方法,其中每個字符發(fā)音文件和字符特征發(fā)音文件的文件格式分別為「.wav 」、「.au」、「.snd」、「.voc」、「.aiff」、「.afc」、「.iff」或「.mat」中的一種文件格式。
上述方法,其中每個字符特征參數(shù)是依照每個字符的字型、顏色或字體大小的特征所編輯的參數(shù)。
上述方法,其中在讀取一字符串的步驟之后,還包含有一分析字符串的每個字符分別具有的字符發(fā)音參數(shù)以及字符特征參數(shù)的步驟。
上述方法,其中在合成字符分別對應的字符發(fā)音文件以及字符特征發(fā)音文件,以形成至少一播放字音文件的步驟之后,還包含有一存儲播放字音文件的步驟。
以下在實施方式中詳細說明本發(fā)明的詳細特征以及優(yōu)點,其內容足以使任何本領域技術人員了解本發(fā)明的技術內容并據以實施,且根據本說明書所公開的內容、權利要求保護范圍及附圖,任何本領域技術人員可輕易地理解本發(fā)明相關的目的及優(yōu)點。
圖1為本發(fā)明根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng)框圖;圖2A為本發(fā)明根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的方法流程圖;圖2B為本發(fā)明根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的局部方法流程圖;圖2C為本發(fā)明根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的局部方法流程圖;圖3A為實施例字符發(fā)音參數(shù)對照表;圖3B為實施例字符特征參數(shù)對照表;以及圖3C為本發(fā)明實施例示意圖。
主要附圖標記說明
110讀取模塊120分析模塊130處理模塊140字音數(shù)據庫150字符特征數(shù)據庫160存儲模塊170語音合成模塊180播放模塊具體實施方式
為使對本發(fā)明的目的、構造、特征及其功能有進一步的了解,現(xiàn)配合實施例詳細說明如下。以上關于本發(fā)明內容的說明及以下實施方式的說明是用以舉例與解釋本發(fā)明的原理,并且提供本發(fā)明的專利申請保護范圍進一步的解釋。
請參閱圖1,其為本發(fā)明根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng)框圖,包含有字音數(shù)據庫140、字符特征數(shù)據庫150、讀取模塊110、處理模塊130、語音合成模塊170以及播放模塊180。
字音數(shù)據庫140,可為只讀存儲器(ROM)、硬盤或存儲卡等同等功能的存儲裝置,里面存有多個字符發(fā)音文件,字符發(fā)音文件的文件格式可為「.wav」、「.au」、「.snd」、「.voc」、「.aiff」、「.afc」、「.iff」或「.mat」中的一種文件格式,每個字符發(fā)音文件都有其對應的字符發(fā)音參數(shù),譬如,“今”的字符發(fā)音參數(shù)設定為“001”,而“天”的字符發(fā)音參數(shù)設定為“002”,在字音數(shù)據庫140存有“今”跟“天”的發(fā)音文件。
字符特征數(shù)據庫150,可為只讀存儲器(ROM)、硬盤或存儲卡等同等功能的存儲裝置,用以存儲多個字符特征發(fā)音文件,每個字符特征發(fā)音文件的文件格式可為「.wav」、「.au」、「.snd」、「.voc」、「.aiff」、「.afc」、「.iff」或「.mat」中的一種文件格式,各個字符特征發(fā)音文件分別對應有一字符特征參數(shù),譬如,“成人男音”的發(fā)音文件對應的字符特征參數(shù)為“01”,而“成人女音”的發(fā)音文件對應的字符特征參數(shù)為“02”。
讀取模塊110,用來讀取一字符串,在字符串中包含有一個字符或是多個字符,每個字符分別具有對應的字符發(fā)音參數(shù)以及字符特征參數(shù),各個字符特征參數(shù)是依照每個字符的字型、顏色或字體大小的特征所編輯的參數(shù),即,當使用者在編輯字符串時,字符本身的單字即有一組對應的字符發(fā)音參數(shù),另外,給予字符編輯其它特征的話,字符又會有對應的字符特征參數(shù),例如,“今”本身的字符發(fā)音參數(shù)為“001”,倘若給“今”設定為黑色的話,黑色這個特征又會給予一組字符特征參數(shù)為“01”,剛好對應到字符特征數(shù)據庫150里,設定為“01”的“成人男音”的發(fā)音文件,在字音數(shù)據庫140里的字符發(fā)音文件是為普通的機械音。
處理模塊130,是根據每個字符分別對應的字符發(fā)音參數(shù)以及字符特征參數(shù),用以從字音數(shù)據庫140以及字符特征數(shù)據庫150里讀取出相對應的字符發(fā)音文件以及字符特征發(fā)音文件,譬如黑色的“今”,具有“00101”等參數(shù),“001”為”今”的字符發(fā)音文件參數(shù),處理模塊130根據“001”此參數(shù)可自字音數(shù)據庫140里抓取出“今”的字符發(fā)音文件,而“01”為設定為黑色的字符特征參數(shù),處理模塊130根據“01”此參數(shù)可自字符特征數(shù)據庫150里抓取出對應參數(shù)為“01”的“成人男音”的發(fā)音文件。
語音合成模塊170,用以合成由處理模塊130自字音數(shù)據庫140以及字符特征數(shù)據庫150里讀取出的字符發(fā)音文件以及字符特征發(fā)音文件,以合成形成播放字音文件,例如將機械音的“今”的字符發(fā)音文件,以及“成人男音”的發(fā)音文件合成成為一個由成人男音發(fā)音“今”這個字符的播放字音文件。
播放模塊180,用來播放經由語音合成模塊170合成后的播放字音文件。
此外,此系統(tǒng)還可包含有分析模塊120以及存儲模塊160。
分析模塊120,與處理模塊130相連接,用以分析字符串中各個字符分別具有的字符發(fā)音參數(shù)以及字符特征參數(shù),并將分析結果傳遞給處理模塊130。
存儲模塊160,與語音合成模塊170相連接,用以存儲合成后的播放字音文件。
再請參照圖2A,其為本發(fā)明根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的方法流程圖,而圖2B以及圖2C,為本發(fā)明根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的局部方法流程圖。
首先,建立多個字符發(fā)音文件,各個字符發(fā)音文件分別對應有一字符發(fā)音參數(shù)(步驟210),其中,字符發(fā)音文件的文件格式可為「.wav」、「.au」、「.snd」、「.voc」、「.aiff」、「.afc」、「.iff」或「.mat」中的一種文件格式。
接著,建立多個字符特征發(fā)音文件,各個字符特征發(fā)音文件分別對應有一字符特征參數(shù)(步驟220),其中,字符特征發(fā)音文件的文件格式可為「.wav」、「.au」、「.snd」、「.voc」、「.aiff」、「.afc」、「.iff」或「.mat」中的一種文件格式。
然后,讀取字符串,字符串包含至少一字符,各個字符分別具有對應的字符發(fā)音參數(shù)以及字符特征參數(shù)(步驟230),其中,每個字符特征參數(shù)為依照各個字符的字型、顏色或字體大小的特征所編輯的參數(shù)。
緊接著,分析字符串的各個字符分別具有的字符發(fā)音參數(shù)以及字符特征參數(shù)(步驟232),然后,根據各個字符分別對應的字符發(fā)音參數(shù)以及字符特征參數(shù),讀取對應的各個字符發(fā)音文件以及各個字符特征發(fā)音文件(步驟240),最后,合成各個字符分別對應的字符發(fā)音文件以及字符特征發(fā)音文件,以形成至少一播放字音文件(步驟250),之后可先存儲各個播放字音文件(步驟252),然后,播放各個播放字音文件(步驟260)。
請繼續(xù)參閱圖3A,其為實施例字符發(fā)音參數(shù)對照表,而圖3B為實施例字符特征參數(shù)對照表,而且圖3C為本發(fā)明實施例示意圖。
此實施例中,使用者編輯“今天天氣很好”等六個字,其中,“今”編輯為黑色,“天”編輯為紅色,下一個“天”編輯為藍色,“氣”編輯為粉紅色,“很”字加上底線,“好”字也是加上底線。
如此一來,黑色“今”會產生“00101”的參數(shù),“001”為字符發(fā)音參數(shù),“01”為字符特征參數(shù),以此類推,紅色“天”會產生“00202”的參數(shù),藍色“天”會產生“00203”的參數(shù),粉紅色“氣”會產生“00304”的參數(shù),加底線的“很”會產生“00405”的參數(shù),以及加底線的“好”會產生“00505”的參數(shù)。
根據每個字符具有的字符發(fā)音參數(shù)以及字符特征參數(shù),來抓取出對應的字符發(fā)音文件以及字符特征發(fā)音文件,再將兩者合成而成為最終的播放字音文件,譬如黑色“今”為成人男音發(fā)出“今”音,紅色“天”為成人女音發(fā)出“天”音,藍色“天”為小朋友男音發(fā)出“天”音,粉紅色“氣”為小朋友女音發(fā)出“氣”音,而加底線的“很”跟“好”則為將音量調整放大一倍后發(fā)出。
雖然本發(fā)明了公開上述實施例,但其并非限定本發(fā)明。在不脫離本發(fā)明的精神和范圍內所做的改動,均屬于本發(fā)明的專利保護范圍。關于本發(fā)明所限定的保護范圍請參考本申請的權利要求書。
權利要求
1.一種根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng),其包含有一字音數(shù)據庫,用以存儲多個字符發(fā)音文件,每個所述字符發(fā)音文件分別對應有一字符發(fā)音參數(shù);一字符特征數(shù)據庫,用以存儲多個字符特征發(fā)音文件,每個所述字符特征發(fā)音文件分別對應有一字符特征參數(shù);一讀取模塊,用以讀取一字符串,所述字符串包含至少一字符,每個所述字符分別具有對應的所述字符發(fā)音參數(shù)以及所述字符特征參數(shù);一處理模塊,根據所述字符分別對應的所述字符發(fā)音參數(shù)以及所述字符特征參數(shù),用以從所述字音數(shù)據庫以及所述字符特征數(shù)據庫讀取對應的所述字符發(fā)音文件以及所述字符特征發(fā)音文件;一語音合成模塊,用以合成所述字符分別對應的所述字符發(fā)音文件以及所述字符特征發(fā)音文件,以形成至少一播放字音文件;以及一播放模塊,用以播放所述播放字音文件。
2.如權利要求1所述的根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng),其中還包含有一分析模塊,用以分析所述字符串的所述字符分別具有的所述字符發(fā)音參數(shù)以及所述字符特征參數(shù)。
3.如權利要求1所述的根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng),其中還包含有一存儲模塊,用以存儲所述播放字音文件。
4.如權利要求1所述的根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng),其中每個所述字符特征參數(shù)是依照每個所述字符的字型、顏色或字體大小的特征所編輯的參數(shù)。
5.如權利要求1所述的根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng),其中每個所述字符發(fā)音文件的文件格式為「.wav」、「.au」、「.snd」、「.voc」、「.aiff」、「.afc」、「.iff」或「.mat」中的一利文件格式。
6.如權利要求1所述的根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的系統(tǒng),其中每個所述字符特征發(fā)音文件的文件格式為「.wav」、「.au」、「.snd」、「.voc」、「.aiff」、「.afc」、「.iff」或「.mat」中的一種文件格式。
7.一種根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的方法,其包含有下列步驟建立多個字符發(fā)音文件,每個所述字符發(fā)音文件分別對應有一字符發(fā)音參數(shù);建立多個字符特征發(fā)音文件,每個所述字符特征發(fā)音文件分別對應有一字符特征參數(shù);讀取一字符串,所述字符串包含至少一字符,每個所述字符分別具有對應的所述字符發(fā)音參數(shù)以及所述字符特征參數(shù);根據所述字符分別對應的所述字符發(fā)音參數(shù)以及所述字符特征參數(shù),讀取對應的所述字符發(fā)音文件以及所述字符特征發(fā)音文件;合成所述字符分別對應的所述字符發(fā)音文件以及所述字符特征發(fā)音文件,以形成至少一播放字音文件;以及播放所述播放字音文件。
8.如權利要求7所述的根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的方法,其中每個所述字符發(fā)音文件的文件格式為「.wav」、「.au」、「.snd」、「.voc」、「.aiff」、「.afc」、「.iff」或「.mat」中的一種文件格式。
9.如權利要求7所述的根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的方法,其中每個所述字符特征發(fā)音文件的文件格式為「.wav」、「.au」、「.snd」、「.voc」、「.aiff」、「.afc」、「.iff」或「.mat」中的一種文件格式。
10.如權利要求7所述的根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的方法,其中每個所述字符特征參數(shù)是依照每個所述字符的字型、顏色或字體大小的特征所編輯的參數(shù)。
11.如權利要求7所述的根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的方法,其中在所述讀取一字符串的步驟之后,還包含有一分析所述字符串的每個所述字符分別具有的所述字符發(fā)音參數(shù)以及所述字符特征參數(shù)的步驟。
12.如權利要求7所述的根據字符特征對應的參數(shù)來發(fā)出不同效果的字音的方法,其中在所述合成所述字符分別對應的所述字符發(fā)音文件以及所述字符特征發(fā)音文件,以形成至少一播放字音文件的步驟之后,還包含有一存儲所述播放字音文件的步驟。
全文摘要
一種用字符特征對應的參數(shù)來發(fā)出不同效果的字音系統(tǒng)及其方法,在字音數(shù)據庫里存儲多個字符發(fā)音文件,每個字符發(fā)音文件各自有其對應的字符發(fā)音參數(shù),而在字符特征數(shù)據庫存儲多個字符特征發(fā)音文件,每個字符特征發(fā)音文件各自有其對應的字符特征參數(shù),系統(tǒng)通過讀取模塊讀取包含至少有一個字符的字符串,接著,處理模塊根據每一字符的字符發(fā)音參數(shù)以及字符特征參數(shù),讀取出對應的字符發(fā)音文件以及字符特征發(fā)音文件,最后通過語音合成模塊將字符發(fā)音文件以及字符特征發(fā)音文件合成為播放字音文件,以供播放模塊播放。
文檔編號G10L13/08GK1983387SQ20051012959
公開日2007年6月20日 申請日期2005年12月14日 優(yōu)先權日2005年12月14日
發(fā)明者吳耀宗 申請人:英業(yè)達股份有限公司