亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語(yǔ)音處理裝置及語(yǔ)音處理方法

文檔序號(hào):2827497閱讀:196來源:國(guó)知局
語(yǔ)音處理裝置及語(yǔ)音處理方法
【專利摘要】一種語(yǔ)音處理裝置,包括處理器,該裝置包括:獲取單元,被配置成獲取輸入語(yǔ)音;檢測(cè)單元,被配置成檢測(cè)輸入語(yǔ)音中所包括的聲音時(shí)段和與該聲音時(shí)段的后端相鄰的無(wú)聲時(shí)段;計(jì)算單元,被配置成計(jì)算聲音時(shí)段中所包括的詞的數(shù)量;以及控制單元,被配置成根據(jù)詞的數(shù)量來控制無(wú)聲時(shí)段的長(zhǎng)度。
【專利說明】
語(yǔ)音處理裝置及語(yǔ)音處理方法

【技術(shù)領(lǐng)域】
[0001]本文中所討論的實(shí)施方式涉及一種控制例如輸入信號(hào)的語(yǔ)音處理裝置、語(yǔ)音處理方法以及語(yǔ)音處理程序。

【背景技術(shù)】
[0002]響應(yīng)于信息處理設(shè)備開發(fā)和國(guó)際化的最新進(jìn)展,存在越來越多的機(jī)會(huì)來觀看和收聽第二語(yǔ)言的內(nèi)容以及通過個(gè)人計(jì)算機(jī)中所安裝的電話呼叫應(yīng)用來以第二語(yǔ)言進(jìn)行呼叫。在這些情況下,公開了通過其來控制第二語(yǔ)言的語(yǔ)音信號(hào)(輸入信號(hào)的示例)使得語(yǔ)音信號(hào)易于收聽的方法。在例如日本特許公開公報(bào)第10-133678號(hào)中,公開了一種通過從語(yǔ)音信號(hào)提取聲音時(shí)段并將無(wú)聲時(shí)段加至聲音時(shí)段的后端來使得輸入語(yǔ)音易于理解的技術(shù)。已知用戶通常進(jìn)行重復(fù)性無(wú)聲語(yǔ),在該重復(fù)性無(wú)聲語(yǔ)中,用戶通過無(wú)可聽得見的發(fā)音的內(nèi)部講話回讀用戶所聽到的難以理解的第二語(yǔ)言的詞(例如參見 Sinozuka Katsumasa, "Listening Power in Second language and WorkingMemory^transact1ns N0.40, 2008at Department of English literature, GraduateSchool of Literature, Seijo University)。因此,為了理解第二語(yǔ)言,重要的是確保用于重復(fù)性無(wú)聲語(yǔ)的無(wú)聲時(shí)段。
[0003]當(dāng)加入無(wú)聲時(shí)段以理解輸入語(yǔ)音時(shí),語(yǔ)音處理被延遲。如果例如用戶觀看和收聽內(nèi)容,則視覺/音頻時(shí)間被延長(zhǎng)。當(dāng)用戶進(jìn)行呼叫時(shí),出現(xiàn)了另外的問題:由于語(yǔ)音處理被延遲,因此以正常速度進(jìn)行對(duì)話變得困難。因此,當(dāng)確保用于重復(fù)性無(wú)聲語(yǔ)的無(wú)聲時(shí)段時(shí),期望的是抑制語(yǔ)音處理的延遲。然而,由于在無(wú)聲時(shí)段的長(zhǎng)度與語(yǔ)音處理被延遲的量之間存在比例關(guān)系,因此還未提出一種抑制語(yǔ)音處理的延遲的語(yǔ)音處理裝置。鑒于上述情況,本發(fā)明的目的是提供一種可以抑制語(yǔ)音處理的延遲并且還可以改進(jìn)用戶對(duì)輸入語(yǔ)音的理解的語(yǔ)音處理裝置。


【發(fā)明內(nèi)容】

[0004]根據(jù)實(shí)施方式的一個(gè)方面,語(yǔ)音處理裝置包括處理器,該裝置包括:獲取單元,該獲取單元被配置成獲取輸入語(yǔ)音;檢測(cè)單元,該檢測(cè)單元被配置成檢測(cè)輸入語(yǔ)音中所包括的聲音時(shí)段和與聲音時(shí)段的后端相鄰的無(wú)聲時(shí)段;計(jì)算單元,該計(jì)算單元被配置成計(jì)算聲音時(shí)段中所包括的詞的數(shù)量;以及控制單元,該控制單元被配置成根據(jù)詞的數(shù)量來控制無(wú)聲時(shí)段的長(zhǎng)度。
[0005]將借助于權(quán)利要求中具體指出的要素和組合來實(shí)現(xiàn)和獲得本發(fā)明的目的和優(yōu)點(diǎn)。
[0006]將理解,如所要求保護(hù)的,前述的一般描述和下面的詳細(xì)描述兩者均是示例性的和說明性的,并且不是對(duì)本發(fā)明的限制。
[0007]本公開內(nèi)容中的語(yǔ)音處理裝置可以抑制語(yǔ)音處理的延遲,并且還可以改進(jìn)用戶對(duì)輸入語(yǔ)音的理解。

【專利附圖】

【附圖說明】
[0008]根據(jù)以下結(jié)合附圖進(jìn)行的對(duì)實(shí)施方式的描述,這些和/或其他方面和優(yōu)點(diǎn)將變得明顯且更易于理解,在附圖中:
[0009]圖1是第一實(shí)施方式中的語(yǔ)音處理裝置的功能框圖;
[0010]圖2是實(shí)施方式中的檢測(cè)單元的功能框圖;
[0011]圖3示出了由檢測(cè)單元檢測(cè)的聲音時(shí)段和無(wú)聲時(shí)段;
[0012]圖4示出了作為聲學(xué)特征的示例的音拍(mora)的數(shù)量與詞的數(shù)量之間的關(guān)系;
[0013]圖5示出了聲音時(shí)段中所包括的詞的數(shù)量與用于理解的無(wú)聲時(shí)段的長(zhǎng)度之間的關(guān)系;
[0014]圖6是由語(yǔ)音處理裝置執(zhí)行的語(yǔ)音處理的流程圖;
[0015]圖7示出了輸入語(yǔ)音功率與所提取的功率突變的數(shù)量之間的關(guān)系;
[0016]圖8示出了作為聲學(xué)特征的示例的功率突變的數(shù)量與詞的數(shù)量之間的關(guān)系;
[0017]圖9是第二實(shí)施方式中的語(yǔ)音處理裝置的功能框圖;
[0018]圖10是第三實(shí)施方式中的語(yǔ)音處理裝置的功能框圖;
[0019]圖11是實(shí)施方式中的用作語(yǔ)音處理裝置的計(jì)算機(jī)的硬件結(jié)構(gòu);以及
[0020]圖12是實(shí)施方式中的移動(dòng)終端裝置的硬件結(jié)構(gòu)。

【具體實(shí)施方式】
[0021]將參照附圖來描述實(shí)施方式中的語(yǔ)音處理裝置、語(yǔ)音處理方法以及語(yǔ)音處理程序的示例。這些示例不限制所公開的技術(shù)。
[0022](第一實(shí)施方式)
[0023]圖1是第一實(shí)施方式中的語(yǔ)音處理裝置I的功能框圖。語(yǔ)音處理裝置I包括獲取單元2、檢測(cè)單元3、提取單元4、計(jì)算單元5以及控制單元6。
[0024]獲取單元2為例如有線邏輯硬件電路??商孢x地,獲取單元2可以是通過在語(yǔ)音處理裝置I中執(zhí)行的計(jì)算機(jī)程序來實(shí)現(xiàn)的功能模塊。獲取單元2通過例如有線電路或無(wú)線電路來獲取輸入語(yǔ)音。獲取單元2可以從例如被連接至或置于語(yǔ)音處理裝置I中的麥克風(fēng)(未示出)獲取輸入語(yǔ)音。雖然輸入語(yǔ)音為例如英語(yǔ),但是其可以是另一種語(yǔ)言。雖然輸入語(yǔ)音為例如用戶的第二語(yǔ)言,但是其可以是用戶的母語(yǔ)。如上所述,為了理解第二語(yǔ)言,重要的是確保用于重復(fù)性無(wú)聲語(yǔ)的無(wú)聲時(shí)段。這是因?yàn)?,同樣為了理解母語(yǔ),確保用于重復(fù)性無(wú)聲語(yǔ)的無(wú)聲時(shí)段被假定是有效的(特別是當(dāng)用戶是年長(zhǎng)的講話者或幼兒時(shí))。在第一示例中,為了便于說明,假定用戶的母語(yǔ)是日語(yǔ)而輸入語(yǔ)音為英語(yǔ)。獲取單元2將獲取的輸入語(yǔ)音輸出至檢測(cè)單元3、提取單元4和控制單元6。
[0025]檢測(cè)單元3為例如有線邏輯硬件電路??商孢x地,檢測(cè)單元3可以是通過在語(yǔ)音處理裝置I中執(zhí)行的計(jì)算機(jī)程序來實(shí)現(xiàn)的功能模塊。檢測(cè)單元3從獲取單元2接收輸入語(yǔ)音。檢測(cè)單元3檢測(cè)呼氣時(shí)段(exhalat1n per1d),該呼氣時(shí)段表示輸入語(yǔ)音中所包括的聲音時(shí)段。呼氣時(shí)段從講話者吸氣并開始講話時(shí)開始,持續(xù)到該講話者再次吸氣為止(換言之,呼氣時(shí)段是第一次呼吸與第二次呼吸之間的時(shí)段或者是講話持續(xù)的時(shí)段)。檢測(cè)單元3根據(jù)例如輸入語(yǔ)音中所包括的多個(gè)幀來檢測(cè)平均信噪比(SNR),使得可以將具有滿足指定條件的平均SNR的時(shí)段檢測(cè)為聲音時(shí)段(換言之,呼氣時(shí)段),其中所述SNR是信號(hào)功率與噪聲之比。檢測(cè)單元3還檢測(cè)吸氣時(shí)段(inhalat1n per1d),該吸氣時(shí)段表示與輸入語(yǔ)音中所包括的聲音時(shí)段的后端相鄰的無(wú)聲時(shí)段。檢測(cè)單元3可以將例如具有不滿足指定條件的平均SNR的時(shí)段檢測(cè)為無(wú)聲時(shí)段(換言之,吸氣時(shí)段)。檢測(cè)單元3將所檢測(cè)到的聲音時(shí)段輸出至提取單元4,并且還將聲音時(shí)段和無(wú)聲時(shí)段輸出至控制單元6。
[0026]現(xiàn)在,將詳細(xì)描述檢測(cè)單元3檢測(cè)聲音時(shí)段和無(wú)聲時(shí)段的處理。圖2是實(shí)施方式中的檢測(cè)單元3的功能框圖。檢測(cè)單元3包括音量計(jì)算單元9、噪聲推斷單元10、平均SNR計(jì)算單元11以及時(shí)段確定單元12。然而,檢測(cè)單元3可以不包括音量計(jì)算單元9、噪聲推斷單元10、平均SNR計(jì)算單元11以及時(shí)段確定單元12,這些單元的功能可以通過一個(gè)或更多個(gè)有線邏輯硬件電路來實(shí)現(xiàn)。可替選地,除了通過上述有線邏輯硬件電路來實(shí)現(xiàn)之外,檢測(cè)單元3中所包括的這些單元的功能還可以通過由在語(yǔ)音處理裝置I中執(zhí)行的計(jì)算機(jī)程序?qū)崿F(xiàn)的功能模塊來實(shí)現(xiàn)。
[0027]在圖2中,輸入語(yǔ)音通過檢測(cè)單元3被輸入至音量計(jì)算單元9。音量計(jì)算單元9包括長(zhǎng)度為m的緩沖器或高速緩存(未示出)。音量計(jì)算單元9計(jì)算輸入語(yǔ)音中所包括的每一幀的音量并且將所計(jì)算的音量輸出至噪聲推斷單元10和平均SNR計(jì)算單元11。輸入語(yǔ)音中包括的每一幀的長(zhǎng)度為例如0.2ms。可以根據(jù)下面的等式來計(jì)算每一幀的音量S。

(/+I)*M-1
[0028]S(J ) = y^ c(t)2 (等式 I)
[0029]其中,f為按順序分配給一個(gè)幀的幀號(hào),該幀號(hào)從輸入語(yǔ)音中所包括的聲學(xué)幀的輸入處的第一幀開始(f是等于或大于O的整數(shù)),M為一幀的時(shí)間長(zhǎng)度,t為時(shí)間,c (t)為輸入語(yǔ)音的幅度(電功率)。
[0030]噪聲推斷單元10從音量計(jì)算單元9接收每一巾貞的音量S (f)。噪聲推斷單元10推斷每一幀中的噪聲,并且將所推斷出的噪聲結(jié)果輸出給平均SNR計(jì)算單元11。在通過噪聲推斷單元10針對(duì)每個(gè)噪聲進(jìn)行噪聲推斷時(shí),還可以使用例如以下所描述的第一噪聲推斷方法或第二噪聲推斷方法。
[0031](第一噪聲推斷方法)
[0032]噪聲推斷單元10可以使用下面的等式根據(jù)幀f的音量S(f)、前一幀f-Ι的音量S(f-l)和噪聲水平N(f-l)來推斷幀f的噪聲水平(電功率)N(f)。
[_ ^ --.^-ι)+(ι-?).^ω,(當(dāng)|傘-1)-叫<辦)
I4f-1),(其礎(chǔ)
(等式2)
[0034]其中,α和β均為常數(shù)。它們可以通過實(shí)驗(yàn)來確定。例如,α可以為0.9而β可以為2.0。噪聲電功率的初始值N(f-l)也可以通過實(shí)驗(yàn)來確定。在上述(等式2)中的等式中,如果幀f的音量S (f)相對(duì)于前一幀f-Ι的音量S(f-l)的變化小于固定值β,則更新幀f的噪聲電功率N (f)。如果幀f的音量S (f)相對(duì)于前一幀f-Ι的音量S (f-Ι)的變化等于或大于固定值β,則取前一幀f_l的噪聲電功率N(f-l)作為幀f的噪聲電功率N (f)。噪聲電功率N(f)可以被稱為上述推斷噪聲結(jié)果。
[0035](第二噪聲推斷方法)
[0036]噪聲推斷單元10可以使用下述(等式3)中的等式根據(jù)幀f的音量S(f)與前一幀f-Ι的噪聲電功率N(f-l)之比來更新噪聲水平。
[0037]

【權(quán)利要求】
1.一種語(yǔ)音處理裝置,包括處理器,所述裝置包括: 獲取單元,所述獲取單元被配置成獲取輸入語(yǔ)音; 檢測(cè)單元,所述檢測(cè)單元被配置成檢測(cè)所述輸入語(yǔ)音中所包括的聲音時(shí)段和與所述聲音時(shí)段的后端相鄰的無(wú)聲時(shí)段; 計(jì)算單元,所述計(jì)算單元被配置成計(jì)算所述聲音時(shí)段中所包括的詞的數(shù)量;以及 控制單元,所述控制單元被配置成根據(jù)詞的數(shù)量來控制所述無(wú)聲時(shí)段的長(zhǎng)度。
2.根據(jù)權(quán)利要求1所述的裝置,還包括: 存儲(chǔ)單元,所述存儲(chǔ)單元被配置成存儲(chǔ)根據(jù)用戶的特征的屬性信息; 其中,所述獲取單元還獲取所述屬性信息,并且 其中,所述控制單元根據(jù)詞的數(shù)量和所述屬性信息來控制所述無(wú)聲時(shí)段的長(zhǎng)度。
3.根據(jù)權(quán)利要求2所述的裝置, 其中,所述屬性信息為以下中至少之一:用戶的語(yǔ)言技能測(cè)試得分、用戶學(xué)習(xí)語(yǔ)言的時(shí)間長(zhǎng)度、用戶的年齡和用戶響應(yīng)語(yǔ)音所花費(fèi)的時(shí)間。
4.根據(jù)權(quán)利要求3所述的裝置, 其中,所述獲取單元還獲取從所述用戶輸入的響應(yīng), 其中,用戶響應(yīng)語(yǔ)音所花費(fèi)的時(shí)間是從所述聲音時(shí)段終止到所述用戶輸入響應(yīng)的時(shí)間。
5.根據(jù)權(quán)利要求1所述的裝置,還包括: 提取單元,所述提取單元被配置成提取所述聲音時(shí)段中所包括的聲學(xué)特征; 其中,所述計(jì)算單元根據(jù)所述聲學(xué)特征來計(jì)算所述聲音時(shí)段中所包括的詞的數(shù)量。
6.根據(jù)權(quán)利要求5所述的裝置, 其中,所述聲學(xué)特征為以下之一:所述聲音時(shí)段中所包括的音拍的數(shù)量;以及所述聲音時(shí)段中所包括的功率突變的數(shù)量。
7.根據(jù)權(quán)利要求1所述的裝置, 其中,所述檢測(cè)單元根據(jù)所述輸入語(yǔ)音中所包括的多個(gè)幀來檢測(cè)信號(hào)功率與噪聲之比, 其中,所述檢測(cè)單元將所述信號(hào)功率與噪聲之比等于或大于第一閾值的幀檢測(cè)為所述聲音時(shí)段, 其中,所述檢測(cè)單元將所述信號(hào)功率與噪聲之比小于所述第一閾值的幀檢測(cè)為所述無(wú)聲時(shí)段。
8.根據(jù)權(quán)利要求1所述的裝置, 其中,所述控制單元控制所述無(wú)聲時(shí)段,其中,詞的數(shù)量越大,所述無(wú)聲時(shí)段就越長(zhǎng),以及其中,詞的數(shù)量越小,所述無(wú)聲時(shí)段就越短。
9.根據(jù)權(quán)利要求1所述的裝置, 其中,所述獲取單元獲取包括預(yù)定數(shù)量的詞的語(yǔ)音作為所述輸入語(yǔ)音。
10.根據(jù)權(quán)利要求1所述的裝置,還包括: 識(shí)別單元,所述識(shí)別單元被配置成將所述輸入語(yǔ)音識(shí)別為文本信息; 其中,所述計(jì)算單元根據(jù)所述文本信息來計(jì)算詞的數(shù)量。
11.一種語(yǔ)音處理方法,包括: 獲取輸入語(yǔ)音; 檢測(cè)所述輸入語(yǔ)音中所包括的聲音時(shí)段和與所述聲音時(shí)段的后端相鄰的無(wú)聲時(shí)段; 計(jì)算所述聲音時(shí)段中所包括的詞的數(shù)量;以及 根據(jù)詞的數(shù)量來控制所述無(wú)聲時(shí)段的長(zhǎng)度。
12.根據(jù)權(quán)利要求11所述的方法,還包括: 存儲(chǔ)根據(jù)用戶的特征的屬性信息; 其中,所述獲取為獲取所述屬性信息, 其中,所述控制為根據(jù)所述屬性信息和詞的數(shù)量來控制所述無(wú)聲時(shí)段的長(zhǎng)度。
13.根據(jù)權(quán)利要求12所述的方法, 其中,所述屬性信息為以下中至少之一:用戶的語(yǔ)言技能測(cè)試得分、用戶學(xué)習(xí)語(yǔ)言的時(shí)間長(zhǎng)度、用戶的年齡和用戶響應(yīng)語(yǔ)音所花費(fèi)的時(shí)間。
14.根據(jù)權(quán)利要求13所述的方法, 其中,所述獲取為進(jìn)一步獲取從所述用戶輸入的響應(yīng), 其中,用戶響應(yīng)語(yǔ)音所花費(fèi)的時(shí)間是從所述聲音時(shí)段終止到所述用戶輸入響應(yīng)的時(shí)間。
15.根據(jù)權(quán)利要求14所述的方法,還包括: 提取所述聲音時(shí)段中所包括的聲學(xué)特征; 其中,所述計(jì)算為根據(jù)所述聲學(xué)特征來計(jì)算所述聲音時(shí)段中所包括的詞的數(shù)量。
【文檔編號(hào)】G10L25/78GK104183246SQ201410211542
【公開日】2014年12月3日 申請(qǐng)日期:2014年5月19日 優(yōu)先權(quán)日:2013年5月23日
【發(fā)明者】鹽田千里, 外川太郎, 大谷猛 申請(qǐng)人:富士通株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1