1.一種確定文本語音單元的方法,其特征在于,包括:
接收待處理文本;
確定所述待處理文本的音素集合;
根據(jù)所述音素集合對所述待處理文本進行字音轉換,得到所述待處理文本的語音符號序列;
確定所述語音符號序列中的各音節(jié)結構;在各音節(jié)結構內(nèi),將聲學層面緊密結合的音素組合在一起擴充為音素串;
根據(jù)所述音素串及所述語音符號序列確定所述待處理文本的語音單元。
2.根據(jù)權利要求1所述的方法,其特征在于,所述確定所述語音符號序列中的各音節(jié)結構包括:
對基本音素進行分類;
確定基于所述分類的音素結構表示形式;
根據(jù)所述音素結構的表示形式,確定音節(jié)結構的表示形式;
根據(jù)所述音節(jié)結構的表示形式確定所述語音符號序列中的各音節(jié)結構。
3.根據(jù)權利要求2所述的方法,其特征在于,所述基本音素的類型包括:輔音頭Ci、介音Cj、元音核Vc、響輔音尾Cs、輔音尾Ct;所述音素串的類型包括:輔音群音素串,和/或依據(jù)音節(jié)結構擴充的音素串;
所述將聲學層面緊密結合的音素組合在一起擴充為音素串包括:
將所述輔音頭Ci、響輔音尾Cs、輔音尾Ct擴充為包含兩個或兩個以上基本音素的音素串;和/或
將一個音節(jié)結構內(nèi)符合預先確定的音素串組成形式的連續(xù)音素組合為一個音素串。
4.根據(jù)權利要求1至3任一項所述的方法,其特征在于,所述方法還包括:
根據(jù)所述音素串在大量文本中出現(xiàn)的頻率對所述音素串進行篩選,得到篩選后的音素串;
所述根據(jù)所述音素串及所述語音符號序列確定所述待處理文本的語音單元包括:
根據(jù)篩選后的音素串及所述語音符號序列確定所述待處理文本的語音單 元。
5.根據(jù)權利要求4所述的方法,其特征在于,所述根據(jù)所述音素串在大量文本中出現(xiàn)的頻率對所述音素串進行篩選,得到篩選后的音素串包括:
獲取所述音素串所在音節(jié)在語法單元中的位置信息,并將內(nèi)容相同位置不同的音素串標記為不同的音素串;
統(tǒng)計各音素串在與待處理文本相同語種的大量文本數(shù)據(jù)中出現(xiàn)的頻率;
根據(jù)所述音素串在大量文本數(shù)據(jù)中出現(xiàn)的頻率對音素串進行篩選,得到篩選后的音素串。
6.根據(jù)權利要求1至3任一項所述的方法,其特征在于,所述方法還包括:
在確定所述語音符號序列中的各音節(jié)結構之前,判斷所述待處理文本的語言類型;
如果所述待處理文本為音節(jié)語言,則將所述語音符號序列中的聲韻母轉換為對應的音素。
7.一種確定文本語音單元的系統(tǒng),其特征在于,包括:
接收模塊,用于接收待處理文本;
音素集合獲取模塊,用于確定所述待處理文本的音素集合;
字音轉換模塊,用于根據(jù)所述音素集合對所述待處理文本進行字音轉換,得到所述待處理文本的語音符號序列;
音節(jié)結構劃分模塊,用于確定所述語音符號序列中的各音節(jié)結構;
擴充模塊,用于在各音節(jié)結構內(nèi),將聲學層面緊密結合的音素組合在一起擴充為音素串;
語音單元提取模塊,用于根據(jù)所述音素串及所述語音符號序列確定所述待處理文本的語音單元。
8.根據(jù)權利要求7所述的系統(tǒng),其特征在于,所述音節(jié)結構劃分模塊包括:
分類單元,用于對基本音素進行分類;
表示形式確定單元,用于確定基于所述分類的音素結構表示形式,并根據(jù)所述音素結構的表示形式,確定音節(jié)結構的表示形式;
音節(jié)結構確定單元,用于根據(jù)所述音節(jié)結構的表示形式確定所述語音符號序列中的各音節(jié)結構。
9.根據(jù)權利要求8所述的系統(tǒng),其特征在于,所述基本音素的類型包括:輔音頭Ci、介音Cj、元音核Vc、響輔音尾Cs、輔音尾Ct;所述音素串的類型包括:輔音群音素串,和/或依據(jù)音節(jié)結構擴充的音素串;
所述擴充模塊,具體用于將所述輔音頭Ci、響輔音尾Cs、輔音尾Ct擴充為包含兩個或兩個以上基本音素的音素串;和/或將一個音節(jié)結構內(nèi)符合預先確定的音素串組成形式的連續(xù)音素組合為一個音素串。
10.根據(jù)權利要求7至9任一項所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:
篩選模塊,用于根據(jù)所述音素串在大量文本中出現(xiàn)的頻率對所述音素串進行篩選,得到篩選后的音素串;
所述語音單元提取模塊根據(jù)所述篩選模塊篩選后的音素串及所述語音符號序列確定所述待處理文本的語音單元。
11.根據(jù)權利要求10所述的系統(tǒng),其特征在于,所述篩選模塊包括:
位置信息獲取單元,用于獲取所述音素串所在音節(jié)在語法單元中的位置信息,并將內(nèi)容相同位置不同的音素串標記為不同的音素串;
統(tǒng)計單元,用于統(tǒng)計各音素串在與待處理文本相同語種的大量文本數(shù)據(jù)中出現(xiàn)的頻率;
篩選單元,用于根據(jù)所述音素串在大量文本數(shù)據(jù)中出現(xiàn)的頻率對音素串進行篩選,得到篩選后的音素串。
12.根據(jù)權利要求7至9任一項所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:
判斷模塊,用于在所述音節(jié)結構劃分模塊確定所述語音符號序列中的各音節(jié)結構之前,判斷所述待處理文本的語言類型;
調整模塊,用于在所述判斷模塊判斷所述待處理文本為音節(jié)語言后,將所述語音符號序列中的聲韻母轉換為對應的音素。