一種基于江淮語系的語音識別系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于江淮語系的語音識別系統(tǒng)。本發(fā)明提供的這種基于江淮語系的語音識別系統(tǒng),由訓練模塊、建模模塊和應用端模塊組成。所述訓練模塊通過對輸入的江淮語系訓練語音以及對應的語音文本進行訓練,通過所述建模模塊應用隱馬爾可夫模型(HMM)的工具包進行建模,并利用建立好的模型來完成所述應用端模塊的設計;需要轉換的語音信號直接送入所述應用端模塊,由應用端模塊進行語音識別,并轉換成文本文檔。本系統(tǒng)在實現(xiàn)語音識別的基礎上,更加強化了對江淮大部分地區(qū)方言的識別。
【專利說明】—種基于江淮語系的語音識別系統(tǒng)
【技術領域】
[0001]基于江淮語系的語音識別系統(tǒng),涉及一種語音識別技術,具體的說是將江淮語系的語音識別加入到普通的語音識別系統(tǒng)中去從而實現(xiàn)更寬泛的語音識別。
【背景技術】
[0002]目前我國市場上所研發(fā)的語音識別系統(tǒng)多是基于普通話的識別,涉及到方言的相對較少,即使涉及到方言也是粵語或者閩南語這些相對有代表性的語音。
【發(fā)明內容】
[0003]本發(fā)明為針對上述已有技術中存在的不足之處,提供一種基于江淮語系的語音識別系統(tǒng),即在實現(xiàn)普通話識別的基礎上同時滿足對江淮語系語音的識別,以實現(xiàn)更寬泛的語音識別。其構造方案如下:
[0004]1、一種基于江淮語系的語音識別系統(tǒng),其特征在于,它包括訓練模塊、建模模塊和應用端模塊,所述建模模塊是訓練模塊與應用端模塊連接的橋梁,它們之間按照先訓練(訓練模塊)再建模(建模模塊)最后應用(應用端模塊)的順序進行工作,上述各單元還有以下特征:
[0005](I)所述訓練模塊,由訓練語音、語音對應的轉錄文本和訓練工具組成,用于建立語音與文本之間的聯(lián)系,為建模準備素材,訓練語音由江淮語系語音和普通話語音兩部分組成,它們與轉錄文本之間采用多對一的方式即江淮語系的發(fā)音與普通話發(fā)音對應同一個轉錄文本,由訓練工具通過單音節(jié)綁定一建模一三音節(jié)綁定一建模多次訓練找出語音與文本的對應關系的規(guī)律。
[0006](2)所述建模模塊,通過訓練模塊準備的素材應用隱馬爾可夫模型(HMM)的工具包并配合模糊音識別技術建立準確合理的模型,所謂模糊音識別技術主要是指對江淮地區(qū)方言的一些發(fā)音進行模糊處理,示例如下:
[0007]
c<=>ch zOzh sOsh IOn fOh jOd enOeng inking
[0008](3)所述應用端模塊,由語音識別器和語境二次識別器組成,所述語音識別器根據(jù)建模模塊建立的模型來完成設計,用于對送入語音的首次識別,所述語境二次識別器由大量的詞庫組成,將首次識別后的語音根據(jù)前后文的語境進行二次識別,最后將識別的結果以文本的方式輸出。
[0009]本發(fā)明的有益效果:
[0010]由于江淮語系識別的加入,降低了系統(tǒng)對江淮地區(qū)使用者輸入語音普通話的要求,同時由于引入了語境二次識別器,更大大的提高了識別的準確性。
【專利附圖】
【附圖說明】[0011]圖1為本發(fā)明結構示意圖。
[0012]圖中:1、訓練模塊;2、建模模塊;3、應用端模塊;4、江淮語系訓練語音;5、普通話訓練語音;6、轉錄文本;7、訓練工具;8、語音識別器;9、語境二次識別器;10、語音輸入端;
11、文本輸出端。
【具體實施方式】
[0013]參見圖1,基于江淮語系的語音識別系統(tǒng),包括有語音采集單元1、訓練模塊;2、建模模塊;3應用端模塊。
[0014]訓練模塊I由江淮語系訓練語音4、普通話訓練語音5、轉錄文本6和訓練工具7組成,訓練工具7即為計算機上運行的軟件,而江淮語系訓練語音4、普通話訓練語音5和轉錄文本6也存儲在同一臺計算機上,由訓練工具7同時將它們調用進行多對一訓練,通過單音節(jié)綁定一建模一三音節(jié)綁定一建模多次訓練找出語音與文本的對應關系的規(guī)律,為建模模塊2提供建模素材。
[0015]建模模塊2也即為計算機上運行的軟件,通過對訓練模塊I提供素材的讀取,應用隱馬爾可夫模型(HMM)的工具包并配合模糊音識別技術建立準確合理的模型,用以為應用端模塊3設計語音識別器8。
[0016]應用端模塊3由語音識別器8和語境二次識別器9組成,語音識別器8為根據(jù)建模模塊2提供的模型設計而成的,用于對語音進行一次識別;語境二次識別器9由大量的詞庫組成,通過對一次語音識別后的文檔,根據(jù)前后文的意思再次進行二次識別對識別的結果進行最后確認并輸出文本,
[0017]需要識別的語音由語音輸入端10輸入應用端模塊3,首先由語音識別器8進行一次識別,結果送入語境二次識別器9對應前后文進行二次識別,最后由文本輸出端11輸出文本文檔。
【權利要求】
1.一種基于江淮語系的語音識別系統(tǒng),其特征在于,它包括訓練模塊、建模模塊和應用端模塊,所述建模模塊是訓練模塊與應用端模塊連接的橋梁,它們之間按照先訓練(訓練模塊)再建模(建模模塊)最后應用(應用端模塊)的順序進行工作,上述各單元還有以下特征: (1)所述訓練模塊,由訓練語音、語音對應的轉錄文本和訓練工具組成,用于建立語音與文本之間的聯(lián)系,為建模準備素材,訓練語音與文本之間采用多對一的方式即江淮語系的發(fā)音與普通話發(fā)音對應同一個轉錄文本; (2)所述建模模塊,通過訓練模塊準備的素材應用隱馬爾可夫模型(HMM)的工具包并配合模糊音識別技術建立準確合理的模型; (3)所述應用端模塊,由語音識別器和語境二次識別器組成,語音識別器根據(jù)建模模塊建立的模型來完成設計,用于對送入語音的首次識別,語境二次識別器由大量的詞庫組成,將首次識別后的語音根據(jù)前后文的語境進行二次識別。
【文檔編號】G10L15/06GK103839546SQ201410116258
【公開日】2014年6月4日 申請日期:2014年3月26日 優(yōu)先權日:2014年3月26日
【發(fā)明者】劉亞斌, 許林沖, 陳良 申請人:合肥新濤信息科技有限公司