專利名稱:一種便攜式漢語聲調(diào)學(xué)習(xí)機(jī)的語音處理方法
技術(shù)領(lǐng)域:
本發(fā)明是漢語聲調(diào)學(xué)習(xí)機(jī)的核心技術(shù)。涉及語音分析的技術(shù)領(lǐng)域。特別是 能供各種人群學(xué)習(xí)漢語聲調(diào)使用,都能準(zhǔn)確提取每次發(fā)音的基頻頻率值并給出 聲調(diào)曲線,這一技術(shù)特點(diǎn),也屬于語音學(xué)這個(gè)技術(shù)領(lǐng)域。
背景技術(shù):
漢語是一種聲調(diào)語言。這也是區(qū)別于印歐語系的突出特點(diǎn)之一。聲調(diào)也是 人們學(xué)習(xí)漢語時(shí)遇到的一個(gè)大難點(diǎn)。要想征服它,只有反復(fù)的發(fā)音練習(xí)這一條 路,沒有別的捷徑。任何民族的任何人都是靠無數(shù)次的反復(fù)模仿大人的語音, 才學(xué)會(huì)說話的,誰都逃脫不了這一學(xué)習(xí)規(guī)律,人們?yōu)榇怂瘜W(xué)習(xí)的時(shí)間又都是 漫長的。但是,成年人沒有幼兒的那種時(shí)間和條件學(xué)習(xí)語言,學(xué)習(xí)效率是他們 的主要矛盾。從目前人們學(xué)習(xí)漢語聲調(diào)的方式看,自己多重復(fù)練習(xí)固然是一方 面,解決學(xué)習(xí)條件又是主要問題。大多是在跟著復(fù)讀完了標(biāo)準(zhǔn)聲調(diào)之后,自己 并不能知道這次復(fù)讀的效果,到底是向標(biāo)準(zhǔn)聲調(diào)靠近了,還是仍有很大差距 到 底存在什么問題,有那個(gè)地方更須要改進(jìn)。這都直接影響到學(xué)習(xí)效果。而這些 問題,學(xué)習(xí)者自己本身不但無法知道,即使有老師在身邊,教師也只能憑剛才 的聽覺印象,籠統(tǒng)說下,不能明確的,具體的提出指導(dǎo)意見,甚至有時(shí)用語言 也很難說清楚該如何改進(jìn)才能達(dá)到滿意的效果。只有茫茫然的反復(fù)練習(xí)。
現(xiàn)代技術(shù)的發(fā)展,為我們以往只憑感覺學(xué)習(xí)的老傳統(tǒng)提供了發(fā)展和完善的 可能性。漢語聲調(diào)學(xué)習(xí)機(jī)正是為人們提供了一個(gè)新的學(xué)習(xí)的方式,它能每次給 出你剛復(fù)讀的聲調(diào)曲線,并和標(biāo)準(zhǔn)的比較,使你一目了然的看到自己的進(jìn)步和不足。它能隨時(shí)在你身旁,絕對(duì)是個(gè)耐心無比的指導(dǎo)老師。你可以試探著各種 方法來使自己的聲調(diào)曲線向標(biāo)準(zhǔn)靠近,使你能盡快掌握漢語的聲調(diào),提高學(xué)習(xí) 效率。
當(dāng)然,就像通過描漢字的紅模子來學(xué)習(xí)寫漢語字一樣,這種技術(shù)只是為人 們提供了一個(gè)學(xué)習(xí)漢語聲調(diào)的紅模子。當(dāng)然,也像對(duì)紅模子的字體書寫標(biāo)準(zhǔn)必 然會(huì)有比較高的要求一樣,這種學(xué)習(xí)機(jī)對(duì)聲調(diào)曲線的準(zhǔn)確度也同樣有嚴(yán)格要求。
有研究表明,人們對(duì)1000hz的聲音,能分辨出2hz的頻率差別,這就為我們?cè)O(shè)
計(jì)學(xué)習(xí)機(jī)中聲調(diào)頻率的提取精度提供了一個(gè)具體的參照標(biāo)準(zhǔn)。這也就告訴人們, 要構(gòu)成一個(gè)聲調(diào)學(xué)習(xí)機(jī),它對(duì)聲調(diào)中時(shí)間及基頻頻率的提取精度應(yīng)該達(dá)到百分 之一以上的量級(jí)。
回憶語音分析處理技術(shù)的發(fā)展歷程,可以說,1952年,,Bdl實(shí)驗(yàn)室搞出的 語音控制英文打字機(jī),是語音處理技術(shù)的成功的第一步。此后,相継發(fā)展了短 時(shí)變換,小波變換,矢量計(jì)算,自相關(guān)計(jì)算等各種語音處理技術(shù),這期間,直 接結(jié)合在漢語應(yīng)用上的,大概始于微軟公司的臺(tái)灣人李幵復(fù),他搞成了一種漢 語聲調(diào)判斷的技術(shù)。其后,在美國的世界民族語言研究院搞出了漢語聲調(diào)提取 器;也有美國和日本的公司各自推出了漢語聲調(diào)的產(chǎn)品。而且這些產(chǎn)品都相繼 銷到了中國。但從國內(nèi)引進(jìn)單位所發(fā)表的文章,或是博士論文,或是著作來看, 都是圍繞著聲調(diào)提取或聲調(diào)判斷方面從事研究和寫文章。既便是沒有引進(jìn)國外 產(chǎn)品的單位,大多也是圍繞在聲調(diào)的判斷這個(gè)方面寫文章(參見文獻(xiàn)1)。產(chǎn)生 這種現(xiàn)象的原因之一,我們認(rèn)為是由于受技術(shù),特別是受國外產(chǎn)品的限制。從 它的說明書,操作手冊(cè)等分析可看出,它們的頻率提取誤差應(yīng)在幾個(gè)赫茲(Hz) 的量級(jí),頻率的提取誤差大,這就必然使聲調(diào)曲線誤差也加大,這對(duì)發(fā)音頻率 比較低,調(diào)域又比較窄的聲調(diào)描述就更顯不妥。用這種技術(shù)制造漢語聲調(diào)學(xué)習(xí)機(jī)就會(huì)對(duì)某些人不適用。這種頻率提取技術(shù)精度不高的原因之一,是受到不確 定原理的限制,這點(diǎn)已被有些用戶所認(rèn)同(參見文獻(xiàn)2)。我們認(rèn)為,能判斷聲 調(diào)和準(zhǔn)確地描述聲調(diào),對(duì)語音處理技術(shù)的要求標(biāo)準(zhǔn)是不同的,對(duì)數(shù)據(jù)處理的精 度要求自然也是不一樣的。這說明,要搞成一個(gè)可供各種人群使用的漢語聲調(diào) 學(xué)習(xí)機(jī),照搬國外產(chǎn)品是不成的,必須在處理技術(shù)上有所突破和創(chuàng)新。
發(fā)明內(nèi)容
本發(fā)明的目的,在于克服目前"漢語聲調(diào)提取器"等各產(chǎn)品存在的缺欠, 提供一種可以突破不確定原理限制,能準(zhǔn)確提取出時(shí)間和基頻的語音處理技術(shù)。 本發(fā)明所提出的處理技術(shù),有以下幾個(gè)方面
1) 不要求必須在線處理數(shù)據(jù),但是,要保證能在, 一個(gè)可接受的, 時(shí)間差后,"馬上"顯示語音數(shù)據(jù)處理結(jié)果,也可稱"立刻"顯現(xiàn)聲調(diào) 曲線。
2) 記錄下語音信號(hào)后,首先經(jīng)過預(yù)處理環(huán)節(jié),其目的在于
A、 對(duì)記錄語音信號(hào)"掐頭""去尾",以去掉非穩(wěn)定的語音信號(hào);
B、 初步分析,以確定使用者聲音頻率的范圍;
C、 通過自我復(fù)制,加大原始語音的數(shù)據(jù)量,以提高基頻的提取精度。
3) 用特定的數(shù)據(jù)處理流程和特定的數(shù)字式瀘波器類型分析數(shù)據(jù)。
4) 把基頻頻率隨時(shí)間的變化值轉(zhuǎn)換成聲調(diào)曲線的對(duì)應(yīng)值。
5) 用不同色彩(或曲線形式)同時(shí)顯示復(fù)讀的和標(biāo)準(zhǔn)的二條聲調(diào)曲 線,并用文字提示主要差別。
具體實(shí)施例方式
本發(fā)明依據(jù)雖然是用聲調(diào)曲線比較的方法來指導(dǎo)練習(xí),但我們處理時(shí) 是以折線形式來代替曲線的,這種處理方法在工程上是通用的,在實(shí)際中也完全 能滿足使用要求。所以說明時(shí),是以如何提取和制作出聲調(diào)折線為目標(biāo)來講解 實(shí)施方法的。
下面結(jié)合
圖1說明本發(fā)明的具體實(shí)施方式
。它分為預(yù)處理,數(shù)據(jù)的運(yùn)算, 結(jié)果的顯示,三個(gè)大環(huán)節(jié)。
現(xiàn)逐個(gè)環(huán)節(jié)說明實(shí)施方式。 1、 預(yù)處理
(a) 掐頭去尾把采集的語音信號(hào),以時(shí)間為橫軸,以聲音幅度為縱軸,
畫出記錄的語音波形圖。若整個(gè)記錄時(shí)間長度為T,則把語音開始和終了 的各百分之五的時(shí)間長度波形去掉,把剩下的語音記錄(90%T)作為數(shù) 據(jù)處理的依據(jù),只從這里提取聲調(diào)信息。
(b) 語音特點(diǎn)粗估因使用者發(fā)音頻率不同,要對(duì)其語音頻率范圍有個(gè)粗 估。先將正式記錄的語音信號(hào)通過帶通濾波器(30-400hz),再用頻譜分析
(FFT)確定其所含頻率成分,取其峰值突出的最低和最高頻率值作為參 照點(diǎn),考慮可能的誤差,記下此二頻率值的中心頻率數(shù)值,供后面處理 步驟中選參數(shù)用。
(c) 把正式語音記錄長度,等分成十等份(份數(shù)可以變,但必須和標(biāo)準(zhǔn)音 聲調(diào)曲線所分的份數(shù)一樣),然后各段自我復(fù)制。
復(fù)制方法為以開始點(diǎn)的幅值和斜率為參照點(diǎn),從該段數(shù)據(jù)終點(diǎn)時(shí)間往 前推,即找到前面某時(shí)刻的幅值與斜率和參照點(diǎn)相同的點(diǎn)(或基本相同 的點(diǎn)),把二點(diǎn)重合,形成一個(gè)閉合的曲線(數(shù)據(jù)列)。如此重復(fù)。而重 復(fù)次數(shù),或達(dá)到的數(shù)據(jù)長度大小,則以對(duì)測(cè)試結(jié)果所希望精度為依據(jù)。2、 數(shù)據(jù)的運(yùn)算
將經(jīng)預(yù)處理環(huán)節(jié)的數(shù)據(jù)列再依次經(jīng)過圖2所示選帶付里葉分析(ZOOM-FFT) 數(shù)據(jù)流程處理。首先讓數(shù)據(jù)系列進(jìn)入乘法器去和剛才記下的中心頻率值的指數(shù)
函數(shù)相乘,(實(shí)際操作中,經(jīng)常是和正弦函數(shù)cos27Tf(rKAt,余弦函數(shù)sin 2TTf(rK,At,分別相乘再相加,式中f(T代表中心頻率,K代表序號(hào),At代表采樣 時(shí)間間隔),這便得到一個(gè)新的復(fù)值序列,它使原頻譜的坐標(biāo)產(chǎn)生平移。再讓其 經(jīng)過數(shù)字低通濾波器,去掉選帶外的頻率成分,再以新的采樣頻率重新對(duì)經(jīng)濾 波后的數(shù)據(jù)列采樣(此新的采樣頻率與細(xì)化倍數(shù)有關(guān),是原來采樣頻率的1/M, 此處M代表原有分析帶寬與新的分析帶寬之比,常稱細(xì)化倍數(shù))。把新采樣得到 的數(shù)據(jù)列送去作付里葉分析(FFT)。則頻譜圖中幅值最大的頻率分量為所求該 時(shí)段基頻頻率值。此時(shí)在負(fù)頻率區(qū)所出現(xiàn)的復(fù)數(shù)結(jié)果都是有效的,因?yàn)檫@個(gè)計(jì) 算過程中所出現(xiàn)的負(fù)頻率成分,實(shí)際上是低于中心頻率的原始頻率。 值得強(qiáng)調(diào)有三點(diǎn), 一是此時(shí)的低通帶寬雖然都是分析帶寬的一半,但由于 使用者不同,要分析的帶寬也不同,使實(shí)際的帶寬值是不一樣的。二是這里的 低通,從我們的經(jīng)驗(yàn)看,無論從使用的角度看,或從制造的角度考慮,使用橢 圓型的高階濾波器為上策;三是要特別要注意,此時(shí)得出的頻率值是在前面處 理過程中,在新頻率坐標(biāo)下的所謂頻率值,并不是真正實(shí)際的基頻頻率值,必 須要重新移頻回去,或是說頻率坐標(biāo)要回到原點(diǎn)后,才是實(shí)際的基頻頻率值。 做過這樣處理后,再記錄下其頻率值及相應(yīng)的時(shí)間點(diǎn),以留作圖及査詢用。
3、 顯示及分析
把剛復(fù)讀后分析出的基頻頻率值,換算成對(duì)應(yīng)的五度標(biāo)調(diào)(或其它標(biāo)調(diào)), 并畫成相應(yīng)的聲調(diào)曲線,同時(shí)用不同顏色在同一畫面顯示出剛得到的及標(biāo)準(zhǔn)的 聲調(diào)曲線。并用文字描述它們的差別(可按要求項(xiàng)目給出差別)。這樣做,既有直觀的形象顯示,又有具體的定量提示,以供學(xué)習(xí)者使用。 4、附加說明
當(dāng)此技術(shù)用來在音樂上確定音高,音程,節(jié)拍等參數(shù)時(shí),可視情況在數(shù)據(jù) 處理上作些簡(jiǎn)化和參數(shù)變更。如在預(yù)處理階段,記錄數(shù)據(jù)可不必分段,直接復(fù)
制來加大數(shù)據(jù)量;此時(shí)的移頻,低通帶寬等參數(shù)也不是隨使用者而變化,而由 使用目的來定。例如,測(cè)某琴鍵音高時(shí),以理論上的音高為移頻頻率值;帶寬 也只能到下一琴鍵音高的一半;而在測(cè)而琴鍵的拍音時(shí),因此時(shí)已接近零頻, 不必移頻了,這時(shí)帶寬也應(yīng)只有幾個(gè)赫茲(Hz)了。當(dāng)然,在顯示部分,也同樣 要作些相應(yīng)改變。
為幫助人們更清楚地了解具體實(shí)施方法,特附以圖面說明之。圖1為說明 實(shí)施方式的結(jié)構(gòu)框架圖,圖2為說明ZOOM-FFT的數(shù)據(jù)處理流程圖。
參考文獻(xiàn)
(1) 宋益丹漢語聲調(diào)實(shí)驗(yàn)研究回望語文研究2006, 1
(2) 游汝杰吳語聲調(diào)的實(shí)驗(yàn)研究第六章復(fù)旦大學(xué)出版社,2001
(3) LiQiHu A Simplified ZOOMFFT algorithm in digital sonar
CHINESE JOURNAL OF ACOUSTICS Vol.18 NO.2
(4) 李德葆、陸秋海實(shí)驗(yàn)?zāi)B(tài)分析及其應(yīng)用第四章科學(xué)出版社200權(quán)利要求
1、一種便攜式漢語聲調(diào)學(xué)習(xí)機(jī)的語音信號(hào)處理方法,其特征在于據(jù)有一般學(xué)習(xí)機(jī)的聲調(diào)復(fù)讀功能外,還同時(shí)能顯示剛復(fù)讀的和標(biāo)準(zhǔn)的二條聲調(diào)曲線,既有形象化的表示差別,又有用文字方式提示二者之間的具體差別。
2、該漢語聲調(diào)學(xué)習(xí)機(jī)的特征在于包括以下步驟(a) 數(shù)據(jù)的預(yù)處理特點(diǎn);(b) 特定的選帶付里葉(Z00M-FFT)分析流程;(c) 結(jié)果的形象顯示及文字提示的二種指導(dǎo)學(xué)習(xí)方法。
3、 根據(jù)權(quán)利要求2所述的漢語聲調(diào)學(xué)習(xí)機(jī)的處理方法,其特征在 于步驟(a)中,是通過自我復(fù)制的方法來增大原始數(shù)據(jù)量的。
4, 根據(jù)權(quán)利要求2所述的漢語聲調(diào)學(xué)習(xí)機(jī)的處理方法,其特征在 于步驟(b)中,所使用的低通濾波器為橢圓型濾波器,而其低通帶 寬又是隨使用者而變化的。
5、根據(jù)權(quán)利要求2所述的漢語聲調(diào)學(xué)習(xí)機(jī)的處理方法,其特征在于 步驟(b)中通過改變移頻頻率值,低通帶寬等參數(shù),可用來測(cè)量音 樂領(lǐng)域的音高,音程,節(jié)拍,以及產(chǎn)生出的低頻拍音周期等參數(shù)。 當(dāng)然,顯示內(nèi)容也要作相應(yīng)改變。
全文摘要
該學(xué)習(xí)機(jī)除有播音員(稱為標(biāo)準(zhǔn)的)讀音可供復(fù)讀外,也馬上顯示剛復(fù)讀音的聲調(diào)曲線。把復(fù)讀的和標(biāo)準(zhǔn)的二條聲調(diào)曲線一起顯示,又有文字提示定量的差別;使你馬上就能知道改進(jìn)的方向和效果,以幫助提高學(xué)習(xí)效率。該語音處理方法,由三部分構(gòu)成信號(hào)的預(yù)處理,包括對(duì)使用者語音特點(diǎn)的界定和數(shù)據(jù)處理前的其它準(zhǔn)備。按選帶分析方法對(duì)信號(hào)作分析及處理結(jié)果顯示。該語音處理方法,是為短促聲音信號(hào)而設(shè)計(jì)的。在更變處理流程和設(shè)定參數(shù)后,它能以相當(dāng)高的精度(可達(dá)到0.1音分或更高精度)用于鋼琴的調(diào)律和判斷節(jié)拍,音程,以及所產(chǎn)生的拍音頻率等參數(shù)。當(dāng)然,它也能用于其他樂器的音高及節(jié)拍等的分析或測(cè)量。
文檔編號(hào)G10L21/00GK101656079SQ20091008900
公開日2010年2月24日 申請(qǐng)日期2009年7月20日 優(yōu)先權(quán)日2009年7月20日
發(fā)明者霍桂馨 申請(qǐng)人:霍桂馨