27] 如圖1所示,一種基于語音相似性識別的S-T教學(xué)過程分析方法,其特征在于,包括 以下步驟: 51、 基本屬性描述,包括教學(xué)時間、學(xué)科、學(xué)段、年級、授課教師、教學(xué)內(nèi)容,并設(shè)定抽樣 頻率; 52、 自動抽取數(shù)據(jù)并建立目標(biāo)聲音,分為兩種建立方式,第一是T語音預(yù)先建立,第二是 T語音判斷建立; 53、 自動聲音相似性識別,先與S目標(biāo)聲音進(jìn)行相似識別,如相似標(biāo)記為S,如果不相似 將與T類目標(biāo)語音進(jìn)行相似性判斷,并標(biāo)記為ΤΙ、T2……Τη; 54、 自動參數(shù)計算,在完成教學(xué)過程音頻抽樣和類型標(biāo)記后,根據(jù)所得到的標(biāo)記數(shù)據(jù)進(jìn) 行參數(shù)自動計算,除延用S-T原有算法計算犯\吧、6、1^和01,還增加3行為的詳細(xì)分析; 55、 自動診斷,自動診斷教學(xué)模式、教師與學(xué)生互動特點及教學(xué)流程時間走向。
[0028] 本發(fā)明各個階段的具體實施方法介紹如下: 1、基本屬性描述 該階段的作用是對擬分析教學(xué)過程的基本屬性進(jìn)行描述。不同分析對象的基本屬性值 不同,成為區(qū)別不同教學(xué)過程的重要信息?;緦傩园ń虒W(xué)時間、學(xué)科、學(xué)段、年級、授課 教師、教學(xué)內(nèi)容等。同時為自動抽取數(shù)據(jù),需要確定抽樣時間。這一階段的工作需要人工完 成,因內(nèi)容簡單,可用選單方式實現(xiàn),所以占時較少,無二義性數(shù)據(jù),教師或觀察者都可快速 設(shè)定,這也是整個方案中需要人工參與的不多環(huán)節(jié)。選定并輸入某一教學(xué)過程的各屬性值 后,該教學(xué)過程與后續(xù)的分析數(shù)據(jù)及計算參數(shù)將形成唯一對應(yīng)的關(guān)系。
[0029] 2、自動抽取數(shù)據(jù),建立目標(biāo)聲音 分析中目標(biāo)聲音的建立有兩種方式。
[0030]第一種方式是Τ語音預(yù)先建立,用于現(xiàn)場教學(xué)過程分析。
[0031 ]開始分析前,任課教師輸入簡單語音信息,如:"請拿出書本,翻到20頁。"、"請安 靜,我們開始上課。"等,形成Τ目標(biāo)語音。利用這一目標(biāo)語音,自動根據(jù)聲音的聲學(xué)特點,抽 取Τ目標(biāo)聲音的特征參數(shù)值,如音色、和音、音頻等區(qū)分聲音特征的具體值,并標(biāo)記類型為 "Τ"。而S類語音可能有多個不同目標(biāo)語音,它們將在分析過程中逐步自動生成。確定現(xiàn)場分 析目標(biāo)音頻后,隨教學(xué)活動的開展,便可正式啟動數(shù)據(jù)自動抽樣和標(biāo)識。
[0032]第二種方式是Τ語音判斷建立,用于對已完成并用視頻形式記錄的教學(xué)過程的分 析。
[0033] 啟動分析后,自動以抽取出的第一個抽樣音頻信號為目標(biāo)聲音,根據(jù)聲音的聲學(xué) 特點,抽取目標(biāo)聲音的特征參數(shù)值,由現(xiàn)場人員或教師自己界定行為類型是S還是T,然后開 始下一次自動抽樣和行為識別。在已有目標(biāo)聲音被確認(rèn)為T類目標(biāo)聲音后,當(dāng)有不同的音頻 信號被抽取標(biāo)記為S類第二目標(biāo)聲音,或第三目標(biāo)聲音時,不再人工提示確認(rèn),而自動記為 Si,否則提示人工確定一直到T目標(biāo)聲音確定。視頻分析目標(biāo)音頻確定開始后,則無須任何 人工參與,將以自動抽取并標(biāo)注行為代碼,數(shù)據(jù)抽樣的過程不再需要人工輔助。
[0034] 3、自動聲音相似性識別 目標(biāo)音頻確定后,每個抽樣出的語音數(shù)據(jù)都將與目標(biāo)聲音進(jìn)行相似性識別,先與S目標(biāo) 聲音進(jìn)行相似識別,如相似標(biāo)記為S,如果不相似將與T類目標(biāo)語音進(jìn)行相似性判斷,并標(biāo)記 為T1、T2……Τη。這一過程完全自動進(jìn)行,無須人工參與,進(jìn)行過程如圖2所示。 4、自動參數(shù)計算 在完成教學(xué)過程音頻抽樣和類型標(biāo)記后,根據(jù)所得到的標(biāo)記數(shù)據(jù)進(jìn)行參數(shù)自動計算, 除延用S-T原有算法計算犯\吧、6、1^和01,還增加3行為的詳細(xì)分析: Sc :S行為類型數(shù) PSi:每類S行為發(fā)生率,PSi= NSi/NS, TSi :每類S行為發(fā)生的時間點位置。
[0035] 5、自動診斷 根據(jù)上階段的參數(shù)計算和標(biāo)記數(shù)據(jù),自動診斷教學(xué)模式、教師與學(xué)生互動特點及教學(xué) 流程時間走向等。
[0036] 本發(fā)明基于語音相似性的說話者識別S-T分析方法有以下四個特點: (1)針對現(xiàn)場分析與視頻錄像分析兩種情況,提出目標(biāo)聲音建立的不同方法,較好地支 持教學(xué)現(xiàn)場的分析。另外增加 T類行為的目標(biāo)聲音類型,為詳細(xì)分析T類行為提供可能性。
[0037] (2)利用語音相似性分析方法,判斷說話者與各目標(biāo)語音的相似性,然后確定行為 類型,實現(xiàn)了全自動行為類型標(biāo)記。
[0038] (3)提出針對S類行為的詳細(xì)參數(shù)及計算方法,可以支持深入的教學(xué)過程互動分 析。
[0039] (4)自動標(biāo)記數(shù)據(jù),自動計算參數(shù),自動生成診斷方案,不僅使s-τ分析全過程極大 減少了人工消耗,而且降低了由人工參與帶來的誤差,也使分析過程可能一體化完成。
[0040] 下面結(jié)合一個具體實施例對本發(fā)明的工作流程做詳細(xì)分析: 實施例1:高一年級地理課的分析。
[0041] 第一步:開啟分析系統(tǒng),輸入基本參數(shù),設(shè)置抽樣頻率是30秒一次,開始數(shù)據(jù)抽樣。
[0042] 第二步:提取第一個音頻數(shù)據(jù),人工確定類型為T,全自動分析啟動。自動形成以下 數(shù)據(jù)表:
第三步:自動參數(shù)計算 根據(jù)以上數(shù)據(jù)進(jìn)行參數(shù)計算N=81,NT=43,NS=38。T行為占有率RT=NT/N=43/81=53.08%。 [0043]該數(shù)據(jù)有 27 個連,CH=(27-1 )/81=32 · 09%,S 行為, Sc=13,PSl=0.026,PS2=0.052,PS3=0.105,PS4=0.078,PS5=0.026,PS6=0.052,PS7= 0.078,PS8=0.052,PS9=0.026,PS10=0.131,PS11=0.131,PS12=0.052,PS13=0.184; TSl=30m,TS2=60m,TS3=120m…… 第四步:自動診斷 本例中的教學(xué)模式為混合型(探究型),教學(xué)中學(xué)生交互活動參與較多,13人次參與交 互。
[0044]以上詳細(xì)描述了本發(fā)明的較佳具體實施例。應(yīng)當(dāng)理解,本領(lǐng)域的普通技術(shù)人員無 需創(chuàng)造性勞動就可以根據(jù)本發(fā)明的構(gòu)思做出諸多修改和變化。因此,凡本技術(shù)領(lǐng)域中技術(shù) 人員依本發(fā)明的構(gòu)思在現(xiàn)有技術(shù)的基礎(chǔ)上通過邏輯分析、推理或者有限的實驗可以得到的 技術(shù)方案,皆應(yīng)在由權(quán)利要求書所確定的保護(hù)范圍內(nèi)。
【主權(quán)項】
1. 一種基于語音相似性識別的s-τ教學(xué)過程分析方法,其特征在于,包括以下步驟: si、基本屬性描述,包括教學(xué)時間、學(xué)科、學(xué)段、年級、授課教師、教學(xué)內(nèi)容,并設(shè)定抽樣 頻率; 52、 自動抽取數(shù)據(jù)并建立目標(biāo)聲音,分為兩種建立方式,第一是T語音預(yù)先建立,第二是 T語音判斷建立; 53、 自動聲音相似性識別,先與S目標(biāo)聲音進(jìn)行相似識別,如相似標(biāo)記為S,如果不相似 將與T類目標(biāo)語音進(jìn)行相似性判斷,并標(biāo)記為ΤΙ、T2……Τη; 54、 自動參數(shù)計算,在完成教學(xué)過程音頻抽樣和類型標(biāo)記后,根據(jù)所得到的標(biāo)記數(shù)據(jù)進(jìn) 行參數(shù)自動計算,除延用S-Τ原有算法計算犯\吧、6、1^和01,還增加3行為的詳細(xì)分析; 55、 自動診斷,自動診斷教學(xué)模式、教師與學(xué)生互動特點及教學(xué)流程時間走向。2. 如權(quán)利要求1所述的一種基于語音相似性識別的S-Τ教學(xué)過程分析方法,其特征在 于,所述步驟S3自動聲音相似性識別的具體步驟為:抽樣出的音頻信號與目標(biāo)進(jìn)行相似性 識別,首先判斷是否與Τ目標(biāo)聲音相似,若相似則標(biāo)記為Τ1、Τ2……Τη;若不相似在判斷與哪 個S目標(biāo)聲音相似,并根據(jù)情況標(biāo)記為相似的那個S目標(biāo)聲音。3. 如權(quán)利要求1所述的一種基于語音相似性識別的S-Τ教學(xué)過程分析方法,其特征在 于,所述步驟S2中Τ語音預(yù)先建立目標(biāo)聲音的方法具體為:開始分析前,任課教師輸入簡單 語音信息,形成Τ目標(biāo)語音,利用這一目標(biāo)語音,自動根據(jù)聲音的聲學(xué)特點,抽取Τ目標(biāo)聲音 的特征參數(shù)值,并標(biāo)記類型為"Τ",而S類語音可能有多個不同目標(biāo)語音,它們將在分析過程 中逐步自動生成。4. 如權(quán)利要求1所述的一種基于語音相似性識別的S-Τ教學(xué)過程分析方法,其特征在 于,所述步驟S2中Τ語音判斷建立目標(biāo)聲音的方法具體為:啟動分析后,自動以抽取出的第 一個抽樣音頻信號為目標(biāo)聲音,根據(jù)聲音的聲學(xué)特點,抽取目標(biāo)聲音的特征參數(shù)值,由現(xiàn)場 人員或教師自己界定行為類型是S還是Τ,然后開始下一次自動抽樣和行為識別,在已有目 標(biāo)聲音被確認(rèn)為Τ類目標(biāo)聲音后,當(dāng)有不同的音頻信號被抽取標(biāo)記為S類第二目標(biāo)聲音或第 三目標(biāo)聲音時,不再人工提示確認(rèn),而自動記為Si,否則提示人工確定一直到Τ目標(biāo)聲音確 定。
【專利摘要】本發(fā)明公開了一種基于語音相似性識別的S-T教學(xué)過程分析方法,包括以下步驟:S1、基本屬性描述;S2、自動抽取數(shù)據(jù)并建立目標(biāo)聲音,分為兩種建立方式,第一是T語音預(yù)先建立,第二是T語音判斷建立;S3、自動聲音相似性識別;S4、自動參數(shù)計算;S5、自動診斷,自動診斷教學(xué)模式、教師與學(xué)生互動特點及教學(xué)流程時間走向。本發(fā)明可以支持教學(xué)一線的常規(guī)和廣泛應(yīng)用,實施過程從行為標(biāo)記到最后診斷可以利用智能移動設(shè)備來進(jìn)行,無須利用不同工具和設(shè)備,誤差產(chǎn)生因素減少,提高系統(tǒng)性和效率,是對原有方法實施過程的全新整合,提出了相應(yīng)參數(shù)的計算方法和分析應(yīng)用,可以增加分析的豐富性,降低顆粒度。
【IPC分類】G10L25/51, G10L15/18, G10L15/22, G10L25/27, G10L15/02
【公開號】CN105590632
【申請?zhí)枴緾N201510938665
【發(fā)明人】穆肅, 胡永春
【申請人】廣東德誠網(wǎng)絡(luò)科技有限公司, 華南師范大學(xué)
【公開日】2016年5月18日
【申請日】2015年12月16日