技術(shù)領(lǐng)域
下面的描述涉及神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備和方法以及語音識(shí)別設(shè)備和方法。
背景技術(shù):
相比于以前的語音識(shí)別技術(shù),最新的語音識(shí)別技術(shù)吸引了廣泛的關(guān)注。引起這樣的原因是,當(dāng)實(shí)現(xiàn)語音識(shí)別技術(shù)時(shí),即使在用戶正在駕駛車輛或者執(zhí)行對(duì)于用戶很難使用他或她的手的其他任務(wù)時(shí),除了互聯(lián)網(wǎng)接入或者辦公室或其他服務(wù)的使用能夠滿足各種用戶的需求之外,可通過語音更加方便地操作因特網(wǎng)信息、電子商務(wù)或者各種普適環(huán)境的使用。
語音識(shí)別技術(shù)中的重要的問題是從周圍環(huán)境有效地去除噪聲。由于來自周圍環(huán)境的噪聲引起的訓(xùn)練環(huán)境與實(shí)際語音識(shí)別環(huán)境之間的不匹配是語音識(shí)別系統(tǒng)的語音識(shí)別性能下降的主要原因之一。
技術(shù)實(shí)現(xiàn)要素:
提供本發(fā)明內(nèi)容用于以簡(jiǎn)化的形式來介紹在下面具體實(shí)施方式中進(jìn)一步描述的構(gòu)思的選擇。本發(fā)明內(nèi)容不意在標(biāo)識(shí)要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不意在作為幫助確定要求保護(hù)的主題的范圍而被使用。
在一個(gè)總體方面中,一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備包括:初級(jí)訓(xùn)練器,被構(gòu)造為基于干凈的訓(xùn)練數(shù)據(jù)和與干凈的訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的目標(biāo)數(shù)據(jù),來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練;二級(jí)訓(xùn)練器,被構(gòu)造為基于帶噪訓(xùn)練數(shù)據(jù)和在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布,來執(zhí)行已經(jīng)執(zhí)行初級(jí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。
二級(jí)訓(xùn)練器還可被構(gòu)造為:使用帶噪訓(xùn)練數(shù)據(jù)作為輸入并且使用在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布作為目標(biāo),來執(zhí)行已經(jīng)執(zhí)行初級(jí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。
帶噪訓(xùn)練數(shù)據(jù)可包括:使干凈的訓(xùn)練數(shù)據(jù)失真所得的數(shù)據(jù)或者干凈的訓(xùn)練數(shù)據(jù)與訓(xùn)練噪聲數(shù)據(jù)混合的數(shù)據(jù)。
神經(jīng)網(wǎng)絡(luò)模型可以是基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型。
初始訓(xùn)練器還可被構(gòu)造為:使用執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練以從干凈的訓(xùn)練數(shù)據(jù)獲得目標(biāo)數(shù)據(jù)的第一目標(biāo)函數(shù),來執(zhí)行初級(jí)訓(xùn)練。
二級(jí)訓(xùn)練器還可被構(gòu)造為:使用作為在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布與神經(jīng)網(wǎng)絡(luò)模型的輸出層的激活函數(shù)的組合的第二目標(biāo)函數(shù),來執(zhí)行二級(jí)訓(xùn)練。
二級(jí)訓(xùn)練器還可被構(gòu)造為:使用作為以下兩個(gè)目標(biāo)函數(shù)的加權(quán)和的第二目標(biāo)函數(shù)來執(zhí)行二級(jí)訓(xùn)練:執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練以從干凈的訓(xùn)練數(shù)據(jù)獲得目標(biāo)數(shù)據(jù)的目標(biāo)函數(shù),以及作為在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布與神經(jīng)網(wǎng)絡(luò)模型的輸出層的激活函數(shù)的組合的目標(biāo)函數(shù)。
在另一個(gè)總體方面中,一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法包括:基于干凈的訓(xùn)練數(shù)據(jù)和與干凈的訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的目標(biāo)數(shù)據(jù),來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練;基于帶噪訓(xùn)練數(shù)據(jù)和在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布,來執(zhí)行已經(jīng)執(zhí)行初級(jí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。
二級(jí)訓(xùn)練可包括:使用帶噪訓(xùn)練數(shù)據(jù)作為輸入并且使用在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布作為目標(biāo),來執(zhí)行已經(jīng)執(zhí)行初級(jí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。
帶噪訓(xùn)練數(shù)據(jù)可包括:使干凈的訓(xùn)練數(shù)據(jù)失真所得的數(shù)據(jù)或者干凈的訓(xùn)練數(shù)據(jù)與訓(xùn)練噪聲數(shù)據(jù)混合的數(shù)據(jù)。
神經(jīng)網(wǎng)絡(luò)模型可以是基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型。
執(zhí)行初級(jí)訓(xùn)練的步驟可包括:使用執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練以從干凈的訓(xùn)練數(shù)據(jù)獲得目標(biāo)數(shù)據(jù)的第一目標(biāo)函數(shù),來執(zhí)行初級(jí)訓(xùn)練。
執(zhí)行二級(jí)訓(xùn)練的步驟可包括:使用作為在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布與神經(jīng)網(wǎng)絡(luò)模型的輸出層的激活函數(shù)的組合的第二目標(biāo)函數(shù),來執(zhí)行二級(jí)訓(xùn)練。
執(zhí)行二級(jí)訓(xùn)練的步驟可包括:使用作為以下兩個(gè)目標(biāo)函數(shù)的加權(quán)和的第二目標(biāo)函數(shù)來執(zhí)行二級(jí)訓(xùn)練:執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練以從干凈的訓(xùn)練數(shù)據(jù)獲得目標(biāo)數(shù)據(jù)的目標(biāo)函數(shù),以及作為在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布與神經(jīng)網(wǎng)絡(luò)模型的輸出層的激活函數(shù)的組合的目標(biāo)函數(shù)。
在另一個(gè)總體方面中,一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)在被處理器執(zhí)行時(shí)使得處理器執(zhí)行上述方法的指令。
在另一個(gè)總體方面中,一種語音識(shí)別設(shè)備包括:特征提取器,被構(gòu)造為提取帶噪語音數(shù)據(jù)的特征;音素概率計(jì)算器,被構(gòu)造為使用聲學(xué)模型來計(jì)算與提取的特征對(duì)應(yīng)的音素的概率;其中,聲學(xué)模型是已經(jīng)執(zhí)行了初級(jí)訓(xùn)練和二級(jí)訓(xùn)練的聲學(xué)模型,其中,基于語音訓(xùn)練數(shù)據(jù)和與語音訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的音素序列執(zhí)行初級(jí)訓(xùn)練,并且基于帶噪語音訓(xùn)練數(shù)據(jù)和在聲學(xué)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)語音訓(xùn)練數(shù)據(jù)的輸出類的概率分布執(zhí)行二級(jí)訓(xùn)練。
可使用語音訓(xùn)練數(shù)據(jù)作為輸入并且使用與語音訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的音素序列作為目標(biāo),來執(zhí)行聲學(xué)模型的初級(jí)訓(xùn)練。
可使用帶噪語音訓(xùn)練數(shù)據(jù)作為輸入并且使用在聲學(xué)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)語音訓(xùn)練數(shù)據(jù)的輸出類的概率分布作為目標(biāo),來執(zhí)行聲學(xué)模型的二級(jí)訓(xùn)練。
帶噪語音訓(xùn)練數(shù)據(jù)可包括:使語音訓(xùn)練數(shù)據(jù)失真所得的數(shù)據(jù)或者語音訓(xùn)練數(shù)據(jù)與訓(xùn)練噪聲數(shù)據(jù)混合的數(shù)據(jù)。
聲學(xué)模型可以是基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型。
可使用執(zhí)行聲學(xué)模型的訓(xùn)練以從語音訓(xùn)練數(shù)據(jù)獲得音素的第一目標(biāo)函數(shù),來執(zhí)行聲學(xué)模型的初級(jí)訓(xùn)練。
可使用作為在聲學(xué)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)語音訓(xùn)練數(shù)據(jù)的輸出類的概率分布與聲學(xué)模型的輸出層的激活函數(shù)的組合的第二目標(biāo)函數(shù),來執(zhí)行聲學(xué)模型的二級(jí)訓(xùn)練。
可使用作為以下兩個(gè)目標(biāo)函數(shù)的加權(quán)和的第二目標(biāo)函數(shù)來執(zhí)行聲學(xué)模型的二級(jí)訓(xùn)練:執(zhí)行聲學(xué)模型的訓(xùn)練以從語音訓(xùn)練數(shù)據(jù)獲得音素的目標(biāo)函數(shù),以及作為在聲學(xué)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)語音訓(xùn)練數(shù)據(jù)的輸出類的概率分布與聲學(xué)模型的輸出層的激活函數(shù)的組合的目標(biāo)函數(shù)。
在另一個(gè)總體方面中,一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備包括:初級(jí)訓(xùn)練器,被構(gòu)造為基于干凈的訓(xùn)練數(shù)據(jù)和硬目標(biāo)數(shù)據(jù),來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練;二級(jí)訓(xùn)練器,被構(gòu)造為基于帶噪訓(xùn)練數(shù)據(jù)和在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間獲得的軟目標(biāo)數(shù)據(jù),來執(zhí)行已經(jīng)執(zhí)行初級(jí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。
可通過使干凈的訓(xùn)練數(shù)據(jù)失真或?qū)⒏蓛舻挠?xùn)練數(shù)據(jù)與噪聲進(jìn)行混合,來獲得帶噪訓(xùn)練數(shù)據(jù)。
軟目標(biāo)數(shù)據(jù)可以是在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布。
二級(jí)訓(xùn)練器還可被構(gòu)造為:基于帶噪訓(xùn)練數(shù)據(jù)、軟目標(biāo)數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)模型的輸出層的激活函數(shù),來執(zhí)行二級(jí)訓(xùn)練。
從下面的具體實(shí)施方式、附圖和權(quán)利要求,其他特征和方面將是清楚的。
附圖說明
圖1是示出神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備的示例的示圖。
圖2是示出神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備的另一示例的示圖。
圖3是示出語音識(shí)別設(shè)備的示例的框圖。
圖4是示出神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法的示例的流程圖。
圖5是示出神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法的另一示例的流程圖。
圖6是示出語音識(shí)別方法的示例的流程圖。
圖7是示出計(jì)算帶噪語音數(shù)據(jù)的音素概率的方法的示例的流程圖。
貫穿附圖和具體實(shí)施方式,相同的參考標(biāo)號(hào)表示相同的元件。附圖可不成比例,并且為了清楚、說明和方便,附圖中的元件的相對(duì)大小、比例和描繪可被夸大。
具體實(shí)施方式
提供下面詳細(xì)的描述來幫助讀者獲得對(duì)在此描述的方法、設(shè)備和/或系統(tǒng)的全面理解。然而,在理解了本申請(qǐng)的公開之后,在此描述的方法、設(shè)備和/或系統(tǒng)的各種改變、修改和等同物將是清楚的。例如,在此描述的操作的順序僅是示例,并且不受限于在此闡述的順序,而是除了必須按特定的順序發(fā)生的操作之外,在理解了本申請(qǐng)的公開之后將會(huì)清楚,操作順序可被改變。另外,為了更加清楚和簡(jiǎn)明,本領(lǐng)域已知的特征的描述可被省略。
在此描述的特征可以以不同的形式來實(shí)現(xiàn),并且不被解釋為受限于在此描述的示例。相反,已經(jīng)提供在此描述的示例,僅為了示出實(shí)現(xiàn)在此描述的方法、設(shè)備和/或系統(tǒng)的許多可行方式中的一些,這在理解了本申請(qǐng)的公開之后將是清楚的。
圖1是示出神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備的示例的示圖。
神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100是使用多條件訓(xùn)練(MCT)技術(shù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的設(shè)備。在一個(gè)示例中,神經(jīng)網(wǎng)絡(luò)模型是包括多個(gè)隱藏層的基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型,但這僅是示例,神經(jīng)網(wǎng)絡(luò)模型不受限于此??墒褂玫湫偷姆聪騻鞑ゼ夹g(shù)(例如,梯度下降算法、隨機(jī)梯度下降算法或其他反向傳播技術(shù))來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。
參照?qǐng)D1,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100可包括初級(jí)訓(xùn)練器110和二級(jí)訓(xùn)練器120。
初級(jí)訓(xùn)練器110基于干凈的訓(xùn)練數(shù)據(jù)和與干凈的訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的目標(biāo)數(shù)據(jù)來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練。換言之,初級(jí)訓(xùn)練器110基于干凈的訓(xùn)練數(shù)據(jù)和硬目標(biāo)數(shù)據(jù)來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練。干凈的訓(xùn)練數(shù)據(jù)是不包含噪聲的訓(xùn)練數(shù)據(jù)。在一個(gè)示例中,初級(jí)訓(xùn)練器110使用干凈的訓(xùn)練數(shù)據(jù)作為輸入并且使用與干凈的訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的目標(biāo)數(shù)據(jù)作為目標(biāo),來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練。
在一個(gè)示例中,初級(jí)訓(xùn)練器110使用執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練以從干凈的訓(xùn)練數(shù)據(jù)獲得對(duì)應(yīng)的目標(biāo)數(shù)據(jù)的目標(biāo)函數(shù)(以下,稱為第一目標(biāo)函數(shù)),來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練。例如,第一目標(biāo)函數(shù)可使用主要用于多類分類的交叉熵。這可以通過下面的等式1來表示。
在等式1中,n表示輸入數(shù)據(jù)(即,干凈的訓(xùn)練數(shù)據(jù))的樣本的索引,N表示輸入數(shù)據(jù)的樣本的總數(shù)量,k表示輸出類的索引,K表示輸出類的總數(shù)量,Xn表示干凈的訓(xùn)練數(shù)據(jù)的第n樣本,yk(Xn)表示神經(jīng)網(wǎng)絡(luò)模型的輸出層的激活函數(shù)。當(dāng)針對(duì)Xn的第k輸出類是目標(biāo)類時(shí),tnk具有1值,否則,tnk具有0值。
二級(jí)訓(xùn)練器120基于帶噪訓(xùn)練數(shù)據(jù)和在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布,來執(zhí)行已經(jīng)執(zhí)行初級(jí)網(wǎng)絡(luò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。換言之,二級(jí)訓(xùn)練器120基于帶噪訓(xùn)練數(shù)據(jù)和在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間獲得的軟目標(biāo)數(shù)據(jù),來執(zhí)行已經(jīng)執(zhí)行初級(jí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。其中,軟目標(biāo)數(shù)據(jù)是在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布。在一個(gè)示例中,二級(jí)訓(xùn)練器120使用帶噪訓(xùn)練數(shù)據(jù)作為輸入并且使用在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布作為目標(biāo),來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。帶噪訓(xùn)練數(shù)據(jù)可以是使干凈的訓(xùn)練數(shù)據(jù)失真所得的數(shù)據(jù)或者干凈的訓(xùn)練數(shù)據(jù)與訓(xùn)練噪聲數(shù)據(jù)混合的數(shù)據(jù)。例如,帶噪訓(xùn)練數(shù)據(jù)可以是干凈的訓(xùn)練數(shù)據(jù)與各種噪聲數(shù)據(jù)混合的數(shù)據(jù),或者可以是通過將各種修改(例如,在圖像數(shù)據(jù)情況下的旋轉(zhuǎn)、部分覆蓋、顏色或照明度的改變或者其他修改,以及在語音數(shù)據(jù)情況下的混響或者其他修改)添加到干凈的訓(xùn)練數(shù)據(jù)而生成的失真數(shù)據(jù)。
在一個(gè)示例中,二級(jí)訓(xùn)練器120使用執(zhí)行訓(xùn)練以獲得在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布的目標(biāo)函數(shù)(以下,稱為第二目標(biāo)函數(shù)),來執(zhí)行已經(jīng)執(zhí)行初級(jí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。第二目標(biāo)函數(shù)可以由在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布與神經(jīng)網(wǎng)絡(luò)模型的輸出層的激活函數(shù)的組合組成。
例如,第二目標(biāo)函數(shù)可使用主要用于多類分類的交叉熵。這可以通過下面的等式2來表示。
在等式2中,n表示輸入數(shù)據(jù)(即,帶噪訓(xùn)練數(shù)據(jù))的樣本的索引,N表示輸入數(shù)據(jù)的樣本的總數(shù)量,k表示輸出類的索引,K表示輸出類的總數(shù)量,Xn表示帶噪訓(xùn)練數(shù)據(jù)的第n樣本,yk(Xn)表示神經(jīng)網(wǎng)絡(luò)模型的輸出層的激活函數(shù)。snk表示作為在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布的針對(duì)第n干凈的訓(xùn)練數(shù)據(jù)樣本的第k輸出類的概率分布。
在另一個(gè)示例中,第二目標(biāo)函數(shù)可使用主要用于回歸的歐幾里得距離。這可以通過下面的等式3來表示。
在等式3中,n表示輸入數(shù)據(jù)(即,帶噪訓(xùn)練數(shù)據(jù))的樣本的索引,k表示輸出類的索引,Xn表示帶噪訓(xùn)練數(shù)據(jù)的第n樣本,yk(Xn)表示神經(jīng)網(wǎng)絡(luò)模型的輸出層的激活函數(shù)。snk表示作為在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布的針對(duì)第n干凈的訓(xùn)練數(shù)據(jù)樣本的第k輸出類的概率分布。
在另一個(gè)示例中,第二目標(biāo)函數(shù)可以由等式1的目標(biāo)函數(shù)與等式2的目標(biāo)函數(shù)的加權(quán)和,或者等式1的目標(biāo)函數(shù)與等式3的目標(biāo)函數(shù)的加權(quán)和組成。這可以通過下面的等式4和等式5來表示。
在等式4和等式5中,λ表示權(quán)重,并且可根據(jù)系統(tǒng)的性能和應(yīng)用被設(shè)置為各種值。
目前描述了初級(jí)訓(xùn)練器110和二級(jí)訓(xùn)練器120使用各自的目標(biāo)函數(shù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的示例,但是第一目標(biāo)函數(shù)和第二目標(biāo)函數(shù)可被集成為單個(gè)集成目標(biāo)函數(shù)。
在一個(gè)示例中,集成目標(biāo)函數(shù)可通過下面的等式6來表示。
在等式6中,dn在輸入為干凈的訓(xùn)練數(shù)據(jù)時(shí)具有0值,在輸入為帶噪訓(xùn)練數(shù)據(jù)時(shí)具有1值。λ(dn)表示權(quán)重,且在dn為0時(shí)(即,在輸入為干凈的訓(xùn)練數(shù)據(jù)時(shí))具有0值。λ(dn)可在dn為1時(shí)(即,在輸入為帶噪訓(xùn)練數(shù)據(jù)時(shí))根據(jù)系統(tǒng)的性能和應(yīng)用被設(shè)置為各種值。
在另一個(gè)示例中,集成目標(biāo)函數(shù)可通過下面的等式7來表示。
在等式7中,dn在輸入為干凈的訓(xùn)練數(shù)據(jù)時(shí)具有0值,在輸入為帶噪訓(xùn)練數(shù)據(jù)時(shí)具有1值。λ(dn)表示權(quán)重,且在dn為0時(shí)(即,在輸入為干凈的訓(xùn)練數(shù)據(jù)時(shí))具有0值。λ(dn)可在dn為1時(shí)(即,在輸入為帶噪訓(xùn)練數(shù)據(jù)時(shí))根據(jù)系統(tǒng)的性能和應(yīng)用被設(shè)置為各種值。
圖2是示出神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備的另一示例的示圖。
參照?qǐng)D2,當(dāng)與圖1的神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100相比時(shí),神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200還包括數(shù)據(jù)獲取器210、混合器220、特征提取器230和存儲(chǔ)單元240。
數(shù)據(jù)獲取器210獲取用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的干凈的訓(xùn)練數(shù)據(jù)和訓(xùn)練噪聲數(shù)據(jù)。在一個(gè)示例中,數(shù)據(jù)獲取器210從預(yù)定的數(shù)據(jù)庫(DB)或外部裝置獲取干凈的訓(xùn)練數(shù)據(jù)和訓(xùn)練噪聲數(shù)據(jù)。
混合器220通過將干凈的訓(xùn)練數(shù)據(jù)與訓(xùn)練噪聲數(shù)據(jù)混合來生成帶噪訓(xùn)練數(shù)據(jù)??蛇x擇地,混合器220通過將各種改變(例如,在圖像數(shù)據(jù)情況下的旋轉(zhuǎn)、部分覆蓋、顏色或照明度的改變或者其他修改,以及在語音數(shù)據(jù)情況下的混響或者其他修改)添加到干凈的訓(xùn)練數(shù)據(jù),來生成帶噪訓(xùn)練數(shù)據(jù)。
特征提取器230使用預(yù)定的算法來提取干凈的訓(xùn)練數(shù)據(jù)和帶噪訓(xùn)練數(shù)據(jù)的特征(例如,濾波器組)。只要能夠提取可從干凈的訓(xùn)練數(shù)據(jù)和帶噪訓(xùn)練數(shù)據(jù)識(shí)別出干凈的訓(xùn)練數(shù)據(jù)和帶噪訓(xùn)練數(shù)據(jù)中的每一個(gè)的特征,對(duì)于預(yù)定的算法的類型和功能就沒有限制。
初級(jí)訓(xùn)練器110使用通過特征提取器230提取的干凈的訓(xùn)練數(shù)據(jù)的特征數(shù)據(jù)作為輸入來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練,二級(jí)訓(xùn)練器120使用通過特征提取器230提取的帶噪訓(xùn)練數(shù)據(jù)的特征數(shù)據(jù)作為輸入來執(zhí)行已經(jīng)執(zhí)行初級(jí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。
存儲(chǔ)單元240存儲(chǔ)通過初級(jí)訓(xùn)練器110獲得的神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練結(jié)果以及在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布。
存儲(chǔ)單元240可作為存儲(chǔ)介質(zhì)包括以下項(xiàng)中的任意一個(gè)、或任意兩個(gè)或更多個(gè)的任意組合:閃存、硬盤、多媒體卡(MMC)、MMCmicro、存儲(chǔ)卡(例如,安全數(shù)字(SD)存儲(chǔ)卡或極速數(shù)字(XD)存儲(chǔ)卡)、隨機(jī)存取存儲(chǔ)器(RAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、只讀存儲(chǔ)器(ROM)、電可擦可編程只讀存儲(chǔ)器(EEPROM)、可編程只讀存儲(chǔ)器(PROM)、磁存儲(chǔ)器、磁盤和光盤。
在圖2的示例中,存儲(chǔ)單元240包括在神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200中,但不受限于此。換句話講,存儲(chǔ)單元240可如圖2所示位于神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200的內(nèi)部,或者可以是連接到神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200的分開的外部組件。
以下,將詳細(xì)描述使用由圖1的神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100或圖2的神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200生成的聲學(xué)模型的語音識(shí)別的設(shè)備。
圖3是示出語音識(shí)別設(shè)備的示例的框圖。語音設(shè)別設(shè)備300可以以硬件芯片的形式制造,并安裝在電子裝置中。電子裝置可以是TV、導(dǎo)航單元、車載電子裝置、智能電話、平板PC、智能手表、臺(tái)式計(jì)算機(jī)、膝上型PC或可穿戴裝置,但不受限于此。
參照?qǐng)D3,語音識(shí)別設(shè)備300包括輸入單元310、聲學(xué)模型存儲(chǔ)單元320和計(jì)算器330。
輸入單元310接收將被執(zhí)行語音識(shí)別的帶噪語音數(shù)據(jù)。帶噪語音數(shù)據(jù)是混合有噪聲的語音數(shù)據(jù)。
聲學(xué)模型存儲(chǔ)單元320存儲(chǔ)預(yù)先訓(xùn)練的聲學(xué)模型。聲學(xué)模型可以是通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100或神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200訓(xùn)練的基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型。
在一個(gè)示例中,聲學(xué)模型是作為基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型的使用MCT技術(shù)訓(xùn)練的聲學(xué)模型。例如,聲學(xué)模型是已經(jīng)執(zhí)行了初級(jí)訓(xùn)練和二級(jí)訓(xùn)練的聲學(xué)模型,其中,基于語音訓(xùn)練數(shù)據(jù)和與語音訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的音素序列執(zhí)行初級(jí)訓(xùn)練,并基于帶噪語音訓(xùn)練數(shù)據(jù)和在聲學(xué)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)語音訓(xùn)練數(shù)據(jù)的輸出類的概率分布執(zhí)行二級(jí)訓(xùn)練。訓(xùn)練的帶噪語音訓(xùn)練數(shù)據(jù)可以是通過將語音訓(xùn)練數(shù)據(jù)與訓(xùn)練噪聲數(shù)據(jù)進(jìn)行混合獲得的數(shù)據(jù)。
可使用等式1至等式7的目標(biāo)函數(shù)中的任意一個(gè)來訓(xùn)練聲學(xué)模型。例如,可使用等式1的目標(biāo)函數(shù)來對(duì)聲學(xué)模型執(zhí)行初級(jí)訓(xùn)練,然后可使用等式2至等式5的目標(biāo)函數(shù)中的一個(gè)來對(duì)聲學(xué)模型執(zhí)行二級(jí)訓(xùn)練。在另一個(gè)示例中,可使用等式6和等式7的集成目標(biāo)函數(shù)中的一個(gè)來對(duì)聲學(xué)模型執(zhí)行初級(jí)訓(xùn)練和二級(jí)訓(xùn)練二者。
聲學(xué)模型存儲(chǔ)單元320可作為存儲(chǔ)介質(zhì)包括以下各項(xiàng)中的任意一個(gè)、或任意兩個(gè)或更多個(gè)的任意組合:閃存、硬盤、多媒體卡(MMC)、MMCmicro、存儲(chǔ)卡(例如,SD存儲(chǔ)卡或XD存儲(chǔ)卡)、RAM、SRAM、ROM、EEPROM、PROM、磁存儲(chǔ)器、磁盤和光盤。
在圖3的示例中,聲學(xué)模型存儲(chǔ)單元320包括在語音識(shí)別設(shè)備300中,但不受限于此。換句話講,聲學(xué)模型存儲(chǔ)單元320可如圖3所示位于語音識(shí)別設(shè)備300的內(nèi)部,或者可以是連接到語音識(shí)別設(shè)備300的分開的外部組件。
計(jì)算器330使用存儲(chǔ)在聲學(xué)模型存儲(chǔ)單元320中的聲學(xué)模型來計(jì)算接收的帶噪語音數(shù)據(jù)的音素概率。為了完成這個(gè)操作,計(jì)算器330包括特征提取器331和音素概率計(jì)算器332。
特征提取器331使用預(yù)定的算法來提取接收的帶噪語音數(shù)據(jù)的特征。只要能夠提取可從其他帶噪語音數(shù)據(jù)中識(shí)別出帶噪語音數(shù)據(jù)的特征,對(duì)于預(yù)定的算法的類型和功能就沒有限制。
音素概率計(jì)算器332使用存儲(chǔ)在聲學(xué)模型存儲(chǔ)單元320中的聲學(xué)模型來計(jì)算與通過特征提取器331提取的帶噪語音數(shù)據(jù)的特征對(duì)應(yīng)的音素的概率。
在圖3的示例中,語音識(shí)別設(shè)備300包括輸入單元310和聲學(xué)模型存儲(chǔ)單元320,但是可根據(jù)系統(tǒng)的性能和應(yīng)用省略輸入單元310和聲學(xué)模型存儲(chǔ)單元320。
圖4是示出神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法的示例的流程圖??赏ㄟ^圖1的神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100執(zhí)行圖4的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法。
參照?qǐng)D1和圖4,在操作410中,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100基于干凈的訓(xùn)練數(shù)據(jù)和與干凈的訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的目標(biāo)數(shù)據(jù),來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練。例如,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100使用干凈的訓(xùn)練數(shù)據(jù)作為輸入并且使用與干凈的訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的目標(biāo)數(shù)據(jù)作為目標(biāo),來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練。神經(jīng)網(wǎng)絡(luò)模型可以是包括多個(gè)隱藏層的基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型,但這僅是示例,神經(jīng)網(wǎng)絡(luò)模型不受限于此。
在一個(gè)示例中,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100使用等式1的目標(biāo)函數(shù)(第一目標(biāo)函數(shù))來執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練。
在操作420中,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100基于帶噪訓(xùn)練數(shù)據(jù)和在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布,來執(zhí)行已經(jīng)執(zhí)行初級(jí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。例如,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100使用帶噪訓(xùn)練數(shù)據(jù)作為輸入并且使用在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布作為目標(biāo),來執(zhí)行已經(jīng)執(zhí)行初級(jí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。帶噪訓(xùn)練數(shù)據(jù)可以是使干凈的訓(xùn)練數(shù)據(jù)失真所得的數(shù)據(jù)或者干凈的訓(xùn)練數(shù)據(jù)與訓(xùn)練噪聲數(shù)據(jù)混合的數(shù)據(jù)。例如,帶噪訓(xùn)練數(shù)據(jù)可以是干凈的訓(xùn)練數(shù)據(jù)與各種噪聲數(shù)據(jù)混合的數(shù)據(jù),或者可以是通過將各種修改(例如,在圖像數(shù)據(jù)情況下的旋轉(zhuǎn)、部分覆蓋、顏色或照明度的改變或者其他修改,以及在語音數(shù)據(jù)情況下的混響或者其他修改)添加到干凈的訓(xùn)練數(shù)據(jù)而生成的失真數(shù)據(jù)。
在一個(gè)示例中,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100使用等式2至等式5的目標(biāo)函數(shù)(第二目標(biāo)函數(shù))中的一個(gè),來執(zhí)行已經(jīng)執(zhí)行初級(jí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的二級(jí)訓(xùn)練。
雖然已經(jīng)描述了神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100在初級(jí)訓(xùn)練操作410和二級(jí)訓(xùn)練操作420中使用各自的目標(biāo)函數(shù)(第一目標(biāo)函數(shù)和第二目標(biāo)函數(shù))來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的示例,但是第一目標(biāo)函數(shù)和第二目標(biāo)函數(shù)可被集成為單個(gè)集成目標(biāo)函數(shù)。例如,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備100可使用等式6或等式7的集成目標(biāo)函數(shù),來執(zhí)行初級(jí)訓(xùn)練操作410和二級(jí)訓(xùn)練操作420二者。
圖5是示出神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法的另一個(gè)示例的流程圖??赏ㄟ^圖2的神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200來執(zhí)行圖5的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法。
當(dāng)與圖4的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法相比時(shí),圖5的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法還包括操作510至操作540。圖5中的操作410和操作420與圖4中的操作410和操作420相同,因此將省略它們的重復(fù)的描述。
參照?qǐng)D2和圖5,在操作510中,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200獲取用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的干凈的訓(xùn)練數(shù)據(jù)和訓(xùn)練噪聲數(shù)據(jù)。在一個(gè)示例中,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200從預(yù)定的DB或外部裝置獲取干凈的訓(xùn)練數(shù)據(jù)和訓(xùn)練噪聲數(shù)據(jù)。
在操作520中,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200通過將干凈的訓(xùn)練數(shù)據(jù)和訓(xùn)練噪聲數(shù)據(jù)混合來生成帶噪訓(xùn)練數(shù)據(jù)??蛇x擇地,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200可通過將各種修改(例如,在圖像數(shù)據(jù)情況下的旋轉(zhuǎn)、部分覆蓋、顏色或照明度的改變或者其他修改,以及在語音數(shù)據(jù)情況下的混響或者其他修改)添加到干凈的訓(xùn)練數(shù)據(jù)來生成帶噪訓(xùn)練數(shù)據(jù)。
在操作530中,用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200使用預(yù)定的算法,來提取干凈的訓(xùn)練數(shù)據(jù)和帶噪訓(xùn)練數(shù)據(jù)的特征(例如,濾波器組)。只要能夠提取可從干凈的訓(xùn)練數(shù)據(jù)和帶噪訓(xùn)練數(shù)據(jù)識(shí)別出干凈的訓(xùn)練數(shù)據(jù)和帶噪訓(xùn)練數(shù)據(jù)中的每一個(gè)樣本的特征,對(duì)于預(yù)定的算法的類型和功能就沒有限制。
在操作540中,神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)備200存儲(chǔ)神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練的初級(jí)訓(xùn)練結(jié)果以及在神經(jīng)網(wǎng)絡(luò)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)干凈的訓(xùn)練數(shù)據(jù)的輸出類的概率分布。
圖6是示出語音識(shí)別方法的示例的流程圖。可通過圖3的語音識(shí)別設(shè)備300執(zhí)行圖6的語音識(shí)別方法。
參照?qǐng)D3和圖6,在操作610中,語音識(shí)別設(shè)備300接收將被執(zhí)行語音識(shí)別的帶噪語音數(shù)據(jù)。帶噪語音數(shù)據(jù)是混合有噪聲的語音數(shù)據(jù)。在操作620中,語音識(shí)別設(shè)備300使用預(yù)先訓(xùn)練的聲學(xué)模型來計(jì)算接收的帶噪語音數(shù)據(jù)的音素概率。
聲學(xué)模型可以是作為基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型的使用MCT技術(shù)訓(xùn)練的聲學(xué)模型。例如,聲學(xué)模型可以是已經(jīng)執(zhí)行了初級(jí)訓(xùn)練和二級(jí)訓(xùn)練的聲學(xué)模型,其中,基于語音訓(xùn)練數(shù)據(jù)和與語音訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的音素序列執(zhí)行初級(jí)訓(xùn)練,并基于帶噪語音訓(xùn)練數(shù)據(jù)和在聲學(xué)模型的初級(jí)訓(xùn)練期間計(jì)算的針對(duì)語音訓(xùn)練數(shù)據(jù)的輸出類的概率分布執(zhí)行二級(jí)訓(xùn)練。訓(xùn)練的帶噪語音訓(xùn)練數(shù)據(jù)可以是通過將語音訓(xùn)練數(shù)據(jù)與訓(xùn)練噪聲數(shù)據(jù)進(jìn)行混合獲得的數(shù)據(jù)。
在一個(gè)示例中,使用等式1至等式7的目標(biāo)函數(shù)中的任意一個(gè)來訓(xùn)練聲學(xué)模型。在一個(gè)示例中,使用等式1的目標(biāo)函數(shù)來對(duì)聲學(xué)模型執(zhí)行初級(jí)訓(xùn)練,并使用等式2至等式5的目標(biāo)函數(shù)中的一個(gè)來對(duì)已經(jīng)執(zhí)行了初級(jí)訓(xùn)練的聲學(xué)模型執(zhí)行二級(jí)訓(xùn)練。在另一個(gè)示例中,使用等式6和等式7的集成目標(biāo)函數(shù)中的一個(gè)來對(duì)聲學(xué)模型執(zhí)行初級(jí)訓(xùn)練和二級(jí)訓(xùn)練二者。
圖7是示出計(jì)算帶噪語音數(shù)據(jù)的音素概率的方法的示例的流程圖。圖7的計(jì)算帶噪語音數(shù)據(jù)的音素概率的方法是圖6的操作620的示例。
參照?qǐng)D3和圖7,在操作710中,語音識(shí)別設(shè)備300使用預(yù)定的算法來提取接收的帶噪語音數(shù)據(jù)的特征。只要能夠提取可從帶噪語音數(shù)據(jù)的其他樣本識(shí)別出帶噪語音數(shù)據(jù)的每一個(gè)樣本的特征,對(duì)于預(yù)定的算法的類型和功能就沒有限制。
在操作720中,語音識(shí)別設(shè)備300使用預(yù)先訓(xùn)練的聲學(xué)模型,來計(jì)算與帶噪語音數(shù)據(jù)的提取的特征對(duì)應(yīng)的音素的概率。
通過硬件組件來實(shí)現(xiàn)執(zhí)行本申請(qǐng)中描述的操作的圖1和圖2中的初級(jí)訓(xùn)練器110和二級(jí)訓(xùn)練器120,圖2中的數(shù)據(jù)獲取器210、混合器220、提取器230和存儲(chǔ)單元240,以及圖3中的輸入單元310、聲學(xué)模型存儲(chǔ)單元320、特征提取器331和音素概率計(jì)算器332,其中,硬件組件被構(gòu)造為執(zhí)行本申請(qǐng)中描述的由硬件組件執(zhí)行的操作??杀挥糜谠谶m當(dāng)?shù)那闆r下執(zhí)行本申請(qǐng)中描述的操作的硬件組件的示例包括:控制器、傳感器、生成器、驅(qū)動(dòng)器、存儲(chǔ)器、比較器、算術(shù)邏輯單元、加法器、減法器、乘法器、除法器、積分器以及被配置為執(zhí)行本申請(qǐng)中描述的操作的任意其他電子組件。在其他示例中,執(zhí)行本申請(qǐng)中描述的操作的硬件組件中的一個(gè)或多個(gè)硬件組件通過計(jì)算硬件(例如,通過一個(gè)或多個(gè)處理器或計(jì)算機(jī))來實(shí)現(xiàn)??赏ㄟ^一個(gè)或多個(gè)處理元件(諸如,邏輯門陣列、控制器和算術(shù)邏輯單元、數(shù)字信號(hào)處理器、微型計(jì)算機(jī)、可編程邏輯控制器、現(xiàn)場(chǎng)可編程門陣列、可編程邏輯陣列、微處理器或被構(gòu)造為以定義的方式響應(yīng)并執(zhí)行指令以實(shí)現(xiàn)期望的結(jié)果的任意其他裝置或裝置的組合)來實(shí)現(xiàn)處理器或計(jì)算機(jī)。在一個(gè)示例中,處理器或計(jì)算機(jī)包括存儲(chǔ)由處理器或計(jì)算機(jī)執(zhí)行的指令或軟件的一個(gè)或多個(gè)存儲(chǔ)器,或者連接到存儲(chǔ)由處理器或計(jì)算機(jī)執(zhí)行的指令或軟件的一個(gè)或多個(gè)存儲(chǔ)器。通過處理器或計(jì)算機(jī)實(shí)現(xiàn)的硬件組件可執(zhí)行指令或軟件(諸如,操作系統(tǒng)(OS)和在OS上運(yùn)行的一個(gè)或多個(gè)軟件應(yīng)用),以執(zhí)行本申請(qǐng)中描述的操作。硬件組件還可響應(yīng)于指令或軟件的執(zhí)行來訪問、操控、處理、創(chuàng)建并且存儲(chǔ)數(shù)據(jù)。為了簡(jiǎn)單起見,單數(shù)術(shù)語“處理器”或“計(jì)算機(jī)”可用于本申請(qǐng)中所述的示例的描述,但是在其他的示例中,多個(gè)處理器或計(jì)算機(jī)可被使用,或者一個(gè)處理器或計(jì)算機(jī)可包括多個(gè)處理元件或多種類型的處理元件或二者。例如,單個(gè)硬件組件或者兩個(gè)或更多個(gè)硬件組件可通過單個(gè)處理器、或者兩個(gè)或更多個(gè)處理器、或者一個(gè)處理器和一個(gè)控制器來實(shí)現(xiàn)。一個(gè)或多個(gè)硬件組件可通過一個(gè)或多個(gè)處理器、或者一個(gè)處理器和一個(gè)控制器來實(shí)現(xiàn),一個(gè)或多個(gè)其他硬件組件可通過一個(gè)或多個(gè)其他處理器、或者另一個(gè)處理器和另一個(gè)控制器來實(shí)現(xiàn)。一個(gè)或多個(gè)處理器或者一個(gè)處理器和一個(gè)控制器可實(shí)現(xiàn)單個(gè)硬件組件或者兩個(gè)或更多個(gè)硬件組件。硬件組件可具有任意一個(gè)或多個(gè)不同的處理配置,其示例包括:?jiǎn)蝹€(gè)處理器、獨(dú)立處理器、并行處理器、單指令單數(shù)據(jù)(SISD)多處理、單指令多數(shù)據(jù)(SIMD)多處理、多指令單數(shù)據(jù)(MISD)多處理以及多指令多數(shù)據(jù)(MIMD)多處理。
圖4至圖7所示的執(zhí)行本申請(qǐng)中描述的操作的方法通過計(jì)算硬件(例如,通過一個(gè)或多個(gè)處理器或計(jì)算機(jī))來執(zhí)行,一個(gè)或多個(gè)處理器或計(jì)算機(jī)如上所述地被實(shí)現(xiàn)為執(zhí)行指令或軟件,以執(zhí)行本申請(qǐng)中描述的通過該方法執(zhí)行的操作。例如,單個(gè)操作或者兩個(gè)或更多個(gè)操作可通過單個(gè)處理器或者兩個(gè)或更多個(gè)處理器或者一個(gè)處理器和一個(gè)控制器來執(zhí)行。一個(gè)或多個(gè)操作可通過一個(gè)或多個(gè)處理器或者一個(gè)處理器和一個(gè)控制器來執(zhí)行,并且一個(gè)或多個(gè)其他操作可通過一個(gè)或多個(gè)其他處理器或者另一個(gè)處理器和另一個(gè)控制器來執(zhí)行。一個(gè)或多個(gè)處理器或者一個(gè)處理器和一個(gè)控制器可執(zhí)行單個(gè)操作或者兩個(gè)或更多個(gè)操作。
用于控制計(jì)算硬件(例如,一個(gè)或多個(gè)處理器或計(jì)算機(jī))實(shí)現(xiàn)硬件組件并執(zhí)行如上所述的方法的指令或軟件可被編寫為計(jì)算機(jī)程序、代碼段、指令或它們的任意組合,以單獨(dú)地或共同地指示或配置一個(gè)或多個(gè)處理器或者計(jì)算機(jī)如機(jī)器或?qū)S糜?jì)算機(jī)那樣進(jìn)行操作,以執(zhí)行由硬件組件執(zhí)行的操作和如上所述的方法。在一個(gè)示例中,指令或軟件包括由一個(gè)或多個(gè)處理器或者計(jì)算機(jī)直接執(zhí)行的機(jī)器代碼(諸如,由編譯器生成的機(jī)器代碼)。在另一個(gè)示例中,指令或軟件包括由一個(gè)或多個(gè)處理器或者計(jì)算機(jī)使用解釋器執(zhí)行的高級(jí)代碼。可基于附圖中所示的框圖和流程圖以及說明書(其公開了用于執(zhí)行由硬件組件執(zhí)行的操作和如上所述的方法的算法)中的相應(yīng)描述,使用任意編程語言來編寫指令或軟件。
用于控制計(jì)算硬件(例如,一個(gè)或多個(gè)處理器或者計(jì)算機(jī))實(shí)現(xiàn)硬件組件并且執(zhí)行如上所述的方法的指令或軟件以及任意相關(guān)聯(lián)的數(shù)據(jù)、數(shù)據(jù)文件和數(shù)據(jù)結(jié)構(gòu)可被記錄、存儲(chǔ)或固定在一個(gè)或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,或者可被記錄、存儲(chǔ)或固定在一個(gè)或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上。非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的示例包括:只讀存儲(chǔ)器(ROM)、隨機(jī)存取存儲(chǔ)器(RAM)、閃存、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-R LTH、BD-RE、磁帶、軟盤、磁光數(shù)據(jù)存儲(chǔ)裝置、光學(xué)數(shù)據(jù)存儲(chǔ)裝置、硬盤、固態(tài)盤以及任何其它裝置,其中,該任何其它裝置被配置為:以非暫時(shí)性方式存儲(chǔ)指令或軟件以及任何相關(guān)聯(lián)的數(shù)據(jù)、數(shù)據(jù)文件和數(shù)據(jù)結(jié)構(gòu),并且為一個(gè)或多個(gè)處理器或者計(jì)算機(jī)提供指令或軟件以及任何相關(guān)聯(lián)的數(shù)據(jù)、數(shù)據(jù)文件和數(shù)據(jù)結(jié)構(gòu),使得一個(gè)或多個(gè)處理器或者計(jì)算機(jī)能夠執(zhí)行指令。在一個(gè)示例中,指令或軟件以及任何相關(guān)聯(lián)的數(shù)據(jù)、數(shù)據(jù)文件和數(shù)據(jù)結(jié)構(gòu)分布于聯(lián)網(wǎng)的計(jì)算機(jī)系統(tǒng),使得指令和軟件以及任何相關(guān)聯(lián)的數(shù)據(jù)、數(shù)據(jù)文件和數(shù)據(jù)結(jié)構(gòu)通過一個(gè)或多個(gè)處理器或者計(jì)算機(jī)以分布的形式被存儲(chǔ)、訪問和執(zhí)行。
雖然本公開包括特定的示例,但是在理解了本申請(qǐng)的公開之后將清楚,在不脫離權(quán)利要求和它們的等同物的精神和范圍的情況下,可在這些示例中進(jìn)行形式和細(xì)節(jié)的各種改變。在此描述的示例僅在描述性意義上被考慮,而不是為了限制的目的。每一個(gè)示例中的特征或方面的描述被認(rèn)為可應(yīng)用于其他示例中的相似特征或方面。如果描述的技術(shù)以不同的順序被執(zhí)行,和/或如果描述的系統(tǒng)、架構(gòu)、裝置或電路中的組件以不同方式被組合,和/或被其他組件或它們的等同物替換或補(bǔ)充,則可實(shí)現(xiàn)適當(dāng)?shù)慕Y(jié)果。因此,本公開的范圍不是由具體實(shí)施方式限定,而是由權(quán)利要求和它們的等同物限定,并且在權(quán)利要求和它們的等同物的范圍內(nèi)的所有變化將被解釋為包括在本公開內(nèi)。