專利名稱:基于音標的聲音識別的制作方法
基于音標的聲音識別技術(shù)領(lǐng)域
計算機、語音識別、音樂、聲學(xué)。
背景技術(shù):
目前語音識別都是將語音識別為具體的文字,但是由于發(fā)音不準確、口音、多音字 的存在,現(xiàn)有文字與發(fā)音還是有一定的差別,造成語音識別不準確。發(fā)明內(nèi)容
直接將語音識別為音標文字,音標文字完全等于發(fā)音,因此識別準確率高,即使由 于由于發(fā)音不準確,類似與平時使用的存在差錯的文字(火星文字),讀取的人可以自動修 正獲得正確的意思,甚至?xí)в行乱?如文字-什么=神馬)。采用音標還可以實現(xiàn)方言、 任意語言的識別。舉例1、2、3、4分別表示漢語拼音的4個聲調(diào)陰平、陽平、上聲、去聲;a) 中文-早上好;首標_Zao3Shang4Hao3 ;存在差錯的首標_Zhao2SanlHao4; b)平潭方目_早 上好;音標-Za3Xuan4Ho3;存在差錯的音標-ZhanXian4Hou3 ;c)英文-Good Morning ;音 標-GuMoning ;存在差錯的音標-GudMolin。音標識別還可以應(yīng)用于具有節(jié)律的其它聲音識 別,如音樂(樂律)、樂器、環(huán)境聲音(敲門聲、腳步聲)。除了可以應(yīng)用于普通語音錄入,還可 以應(yīng)用于取代手語(手語一般人學(xué)習(xí)難度比較大,再像漫畫那樣把說話內(nèi)容-聲音做個語 言框標在說話人-發(fā)聲位置,會使聲音更加視覺化形象化)、(語言、歌唱-最好與歌詞音標 結(jié)合、演奏)訓(xùn)練和評價評分、聲音的壓縮、重現(xiàn)、變音。
權(quán)利要求
1.基于音標的聲音識別,其特征是將具有節(jié)律的聲音(如語音、歌唱、演奏、環(huán)境聲音)直接識別成音標(樂譜)顯示出來,并且利用人在讀取時具有的自動補正功能,使其具有高準確度識別、廣泛適應(yīng)性、容錯能力。
2.如權(quán)利1,包括將具有節(jié)律的聲音(如語音、歌唱、演奏、環(huán)境聲音)直接識別成音標(樂譜)顯示出來。
3.如權(quán)利1,包括利用人在讀取是具有的自動補正功能,使存在差錯的音標也能被人識別的容錯能力。
4.如權(quán)利1,包括用拉丁字母和數(shù)字(1、2、3、4表示陰平、陽平、上聲、去聲)進行漢語拼音的表示和錄入。
5.如權(quán)利1,包括通過直接識別出有節(jié)律聲音(如語音、歌唱、演奏)成音標(樂譜)(多種音標組合-歌唱-樂譜音標與歌詞音標組合)進行訓(xùn)練和評分評價。
6.如權(quán)利1,包括通過將有節(jié)律的聲音(如語音、歌唱、演奏、環(huán)境聲音)識別成音標 (樂譜),然后再通過音標播放,實現(xiàn)聲音的壓縮、重現(xiàn)、變音。
7.通過將識別出來的聲音(如語音、歌唱、演奏、環(huán)境聲音)內(nèi)容做個語言框,標注在發(fā)聲位置,使聲音更加視覺化和形象性。
全文摘要
基于音標的聲音識別是將具有節(jié)律的聲音(如語音、歌唱、演奏、環(huán)境聲音)直接識別成音標(樂譜)顯示出來,并且利用人在讀取時具有的自動補正功能,使其具有高準確度識別、廣泛適應(yīng)性、容錯能力。
文檔編號G10L15/00GK103065621SQ20131000341
公開日2013年4月24日 申請日期2013年1月6日 優(yōu)先權(quán)日2012年11月20日
發(fā)明者高劍青 申請人:高劍青