一種口語評測方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種口語評測方法及裝置,屬于語言識別【技術領域】。所述方法包括:當接收到待評測語言時,對待評測語言進行處理,提取語言特征和語種特征;利用語音分析技術,對語音特征進行聲學和語言學分析,得到待評測語言的評分特征,該評分特征包括待評測語言的語音信息數(shù)值矢量、語義信息數(shù)值矢量及語法信息數(shù)值矢量;利用預設語言模型組,對語種特征進行語種分析,得到所述待評測語言的語種,該預設語言模型用于語言識別;將待評測語言的評分特征及待評測語言的語種進行評分,得到對待評測語言的評分。本發(fā)明綜合分析了待測試語言的語種特征和語言特征,對該測試語言進行了評測,提高了語言評測的公平性與準確性。
【專利說明】一種口語評測方法及裝置【技術領域】
[0001]本發(fā)明涉及語言識別【技術領域】,特別涉及一種口語評測方法及裝置。
【背景技術】
[0002]隨著素質教育理念的不斷深入,外語教學越來越注重外語交流能力,而口語表達又是其中最重要且最困難的一個項目,已經受到越來越多的重視。和閱讀、寫作、聽力不同,口語能力的側重點是溝通交際,因此主觀性和開放性較強,對口語能力好壞的評價通常需要人工參與,存在極大的局限性。
[0003]現(xiàn)在技術中,采用計算機自動評分系統(tǒng)解決上述問題,該計算機自動評分系統(tǒng)是利用計算機輔助或者取代人工進行口語練習和口語考試的評分,利用計算機的高效運算,獲得準確性和公平性良好的評分,從而解決或緩解大量的口語評分需求與匱乏的教師資源之間的矛盾。
[0004]發(fā)明人在實現(xiàn)本發(fā)明的過程中,發(fā)現(xiàn)現(xiàn)有技術存在以下技術問題:
[0005]該計算機自動評分系統(tǒng)是基于某單一語言的語音識別技術構建的,容易被學生的一些特殊發(fā)音或回答模式所欺騙,比如用母語作答甚至是隨意瞎說。在這些情況下,由于計算機只會將語音當成目標語言來處理, 因此系統(tǒng)往往也會給出一定的分數(shù),有時甚至會給高分,影響評分的準確性和公平性。
【發(fā)明內容】
[0006]為了解決現(xiàn)有技術的問題,本發(fā)明實施例提供了一種口語評測方法及裝置。所述技術方案如下:
[0007]—方面,提供了一種口語評測方法,所述方法包括:
[0008]當接收到待評測語言時,對所述待評測語言進行處理,提取語言特征和語種特征;
[0009]利用語音分析技術,對所述語音特征進行聲學和語言學分析,得到所述待評測語言的評分特征,所述評分特征包括所述待評測語言的語音信息數(shù)值矢量、語義信息數(shù)值矢量及語法信息數(shù)值矢量;
[0010]利用預設語言模型組,對所述語種特征進行語種分析,得到所述待評測語言的語種,所述預設語言模型用于語言識別;
[0011]將所述待評測語言的評分特征及所述待評測語言的語種進行評分,得到對所述待評測語言的評分。
[0012]可選地,利用語音分析技術,對所述語音特征進行聲學和語言學分析,得到所述待評測語言的評分特征包括:
[0013]利用預設聲學模型以及預設語言模型,對所述語言特征進行語音識別,得到識別文本;
[0014]根據題目信息和所述識別文本,得到所述待評測語言的評分特征。[0015]可選地,所述預設語言模型組包括多個語言模型,每個語言模型對應一個語種,利用預設語言模型組,對所述語種特征進行語種分析,得到所述待評測語言的語種包括:
[0016]對所述語種特征進行序列識別,得到序列識別文本;
[0017]計算序列識別文本與所述多個語言模型的距離;
[0018]將所述序列識別文本與所述多個語言模型的距離進行融合處理,得到所述待評測語言的語種。
[0019]可選地,所述方法還包括:
[0020]對訓練語音數(shù)據進行特征提取處理,得到多個語種特征;
[0021]利用不同語種的語種特征,得到不同語種對應的語言模塊。
[0022]另一方面,提供了一種口語評測裝置,所述裝置包括:
[0023]特征提取模塊,用于當接收到待評測語言時,對所述待評測語言進行處理,提取語言特征和語種特征;
[0024]評分特征獲取模塊,用于利用語音分析技術,對所述語音特征進行聲學和語言學分析,得到所述待評測語言的評分特征,所述評分特征包括所述待評測語言的語音信息數(shù)
值矢量、語義信息數(shù)值矢量及語法信息數(shù)值矢量;
[0025]語種獲取模塊,用于利用預設語言模型組,對所述語種特征進行語種分析,得到所述待評測語言的語種,所述預設語言模型用于語言識別;
[0026]評分獲取模塊,用于將所述待評測語言的評分特征及所述待評測語言的語種進行評分,得到對所述待評測語言的評分。
[0027]可選地,所述評分特征獲取模塊包括:
[0028]識別文本獲取單元,用于利用預設聲學模型以及預設語言模型,對所述語言特征進行語音識別,得到識別文本;
[0029]評分特征獲取單元,用于根據題目信息和所述識別文本,得到所述待評測語言的評分特征;
[0030]可選地,所述語種獲取模塊包括:
[0031]序列識別文本獲取單元,用于對所述語種特征進行序列識別,得到序列識別文本;
[0032]距離計算單元,用于計算序列識別文本與所述多個語言模型的距離;
[0033]語種獲取單元,用于將所述序列識別文本與所述多個語言模型的距離進行融合處理,得到所述待評測語言的語種。
[0034]可選地,所述裝置還包括:
[0035]多個語種特征獲取模塊,用于對訓練語音數(shù)據進行特征提取處理,得到多個語種特征;
[0036]語言模塊獲取模塊,用于利用不同語種的語種特征,得到不同語種對應的語言模塊。
[0037]本發(fā)明實施例提供的技術方案帶來的有益效果是:
[0038]綜合分析了待測試語言的語種特征和語言特征,對該測試語言進行了評測,提高了語言評測的公平性與準確性?!緦@綀D】
【附圖說明】
[0039]為了更清楚地說明本發(fā)明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
[0040]圖1是本發(fā)明實施例提供的口語評測方法流程圖;
[0041]圖2是本發(fā)明實施例提供的口語評測方法流程圖;
[0042]圖3本發(fā)明實施例提供的口語評測示意圖;
[0043]圖4本發(fā)明實施例提供的口語評測示意圖;
[0044]圖5本發(fā)明實施例提供的口語評測示意圖;
[0045]圖6本發(fā)明實施例提供的口語評測示意圖;
[0046]圖7本發(fā)明實施例提供的口語評測示意圖;
[0047]圖8本發(fā)明實施例提供的口語評測示意圖;
[0048]圖9是本發(fā)明實施例提供的口語評測裝置結構示意圖。
【具體實施方式】
[0049]為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明實施方式作進一步地詳細描述。
[0050]圖1是本發(fā)明實施例提供的一種口語評測方法流程圖。參見圖1,該實施例包括:
[0051]101、當接收到待評測語言時,對待評測語言進行處理,提取語言特征和語種特征;
[0052]102、利用語音分析技術,對語音特征進行聲學和語言學分析,得到待評測語言的評分特征,該評分特征包括待評測語言的語音信息數(shù)值矢量、語義信息數(shù)值矢量及語法信息數(shù)值矢量;
[0053]103、利用預設語言模型組,對語種特征進行語種分析,得到待評測語言的語種,該預設語言模型用于語言識別;
[0054]104、將待評測語言的評分特征及待評測語言的語種進行評分,得到對待評測語言的評分。
[0055]本發(fā)明實施例提供的方法,綜合分析了待測試語言的語種特征和語言特征,對該測試語言進行了、準確的評測。
[0056]可選地,利用語音分析技術,對語音特征進行聲學和語言學分析,得到待評測語言的評分特征包括:
[0057]利用預設聲學模型以及預設語言模型,對語言特征進行語音識別,得到識別文本;
[0058]根據題目信息和所述識別文本,得到待評測語言的評分特征。
[0059]可選地,該預設語言模型組包括多個語言模型,每個語言模型對應一個語種,利用預設語言模型組,對語種特征進行語種分析,得到待評測語言的語種包括:
[0060]對該語種特征進行序列識別,得到序列識別文本;
[0061]計算序列識別文本與所述多個語言模型的距離;[0062]將序列識別文本與所述多個語言模型的距離進行融合處理,得所述待評測語言的語種。
[0063]可選地,所述方法還包括:
[0064]對訓練語音數(shù)據進行特征提取處理,得到多個語種特征;
[0065]利用不同語種的語種特征,得到不同語種對應的語言模塊。
[0066]圖2是本發(fā)明實施例提供的口語評測方法流程圖。參見圖2,該實施例包括:
[0067]201、構建預設語言模塊組;
[0068]其中,該預設語言模型組包括多個預設語言模型,每個語言模型對應一個語種。
[0069]模塊的輸入為不同語種訓練數(shù)據的語音特征二。設訓練數(shù)據包含N個語種,分別為I1, I2,, In,各語種的語音特征二組成的樣本集合分別為T1, T2,, Tn,各集合含有的樣本數(shù)分別為h,k2,..., kN。
[0070]分別對各集合中的樣本進行序列識別,得到各語種的序列識別文本集合
S1, S2,, Sn,其中S ==,彳表示語種Ii的第j個訓練樣本的序列
識別文本,匕表示語種Ii的訓練樣本個數(shù)。序列識別文本類似語音識別的識別文本,也是一串有先后順序的符號序列,只是這里的符號可以是一種抽象的符號,而不一定是音素、單詞等有明確聲學或語言學含義的符號。
[0071]本發(fā)明實施例可以只采用一個識別模塊,得到一個序列識別文本輸出,如圖3所
/Jn ο
[0072]本發(fā)明實施例也可以采用多個不同的識別模塊,得到多個序列識別文本輸出,如圖4所示。
[0073]這些不同的識別模塊可以是采用的聲學模型不同,也可以是采用的語言模型不同,還可以是識別參數(shù)設置不同等等。
[0074]本發(fā)明實施例可以使用音素級的語音識別算法進行序列識別,得到以音素為符號單元的序列識別文本。
[0075]其中,音素可以使用下表的44個常用英語音標。
[0076]表1
[0077]
【權利要求】
1.一種口語評測方法,其特征在于,所述方法包括: 當接收到待評測語言時,對所述待評測語言進行處理,提取語言特征和語種特征; 利用語音分析技術,對所述語音特征進行聲學和語言學分析,得到所述待評測語言的評分特征,所述評分特征包括所述待評測語言的語音信息數(shù)值矢量、語義信息數(shù)值矢量及語法信息數(shù)值矢量; 利用預設語言模型組,對所述語種特征進行語種分析,得到所述待評測語言的語種,所述預設語言模型用于語言識別; 將所述待評測語言的評分特征及所述待評測語言的語種進行評分,得到對所述待評測語言的評分。
2.根據權利要求1所述的方法,其特征在于,利用語音分析技術,對所述語音特征進行聲學和語言學分析,得到所述待評測語言的評分特征包括: 利用預設聲學模型以及預設語言模型,對所述語言特征進行語音識別,得到識別文本; 根據題目信息和所述識別文本,得到所述待評測語言的評分特征。
3.根據權利要求1所述的方法,其特征在于,所述預設語言模型組包括多個預設語言模型,每個語言模型對應一個語種,利用預設語言模型組,對所述語種特征進行語種分析,得到所述待評測語言的語種包括: 對所述語種特征進行序列識別,得到序列識別文本; 計算序列識別文本與所述多個語言模型的距離;` 將所述序列識別文本與所述多個語言模型的距離進行融合處理,得到所述待評測語言的語種。
4.根據權利要求3所述的方法,其特征在于,所述方法還包括: 對訓練語音數(shù)據進行特征提取處理,得到多個語種特征; 利用不同語種的語種特征,得到不同語種對應的預設語言模塊。
5.一種口語評測裝置,其特征在于,所述裝置包括: 特征提取模塊,用于當接收到待評測語言時,對所述待評測語言進行處理,提取語言特征和語種特征; 評分特征獲取模塊,用于利用語音分析技術,對所述語音特征進行聲學和語言學分析,得到所述待評測語言的評分特征,所述評分特征包括所述待評測語言的語音信息數(shù)值矢量、語義信息數(shù)值矢量及語法信息數(shù)值矢量; 語種獲取模塊,用于利用預設語言模型組,對所述語種特征進行語種分析,得到所述待評測語言的語種,所述預設語言模型用于語言識別; 評分獲取模塊,用于將所述待評測語言的評分特征及所述待評測語言的語種進行評分,得到對所述待評測語言的評分。
6.根據權利要求5所述的裝置,其特征在于,所述評分特征獲取模塊包括: 識別文本獲取單元,用于利用預設聲學模型以及預設語言模型,對所述語言特征進行語音識別,得到識別文本; 評分特征獲取單元,用于根據題目信息和所述識別文本,得到所述待評測語言的評分特征。
7.根據權利要求5所述的裝置,其特征在于,所述語種獲取模塊包括: 序列識別文本獲取單元,用于對所述語種特征進行序列識別,得到序列識別文本; 距離計算單元,用于計算序列識別文本與所述多個語言模型的距離; 語種獲取單元,用于將所述序列識別文本與所述多個語言模型的距離進行融合處理,得到所述待評測語言的語種。
8.根據權利要求7所述的裝置,其特征在于,所述裝置還包括: 多個語種特征獲取模塊,用于對訓練語音數(shù)據進行特征提取處理,得到多個語種特征; 語言模塊獲取 模塊,用于利用不同語種的語種特征,得到不同語種對應的語言模塊。
【文檔編號】G10L15/02GK103761975SQ201410007034
【公開日】2014年4月30日 申請日期:2014年1月7日 優(yōu)先權日:2014年1月7日
【發(fā)明者】周偉達, 楊曉飛, 朱宏杰, 楊嵩, 梅微星, 袁軍峰 申請人:蘇州思必馳信息科技有限公司