亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于恢復(fù)語(yǔ)音分量的系統(tǒng)和方法與流程

文檔序號(hào):11451780閱讀:271來(lái)源:國(guó)知局
用于恢復(fù)語(yǔ)音分量的系統(tǒng)和方法與流程

相關(guān)申請(qǐng)的交叉引用

本申請(qǐng)要求保護(hù)2014年9月12日提交的美國(guó)臨時(shí)申請(qǐng)no.62/049988的權(quán)益。前述申請(qǐng)的主題出于所有目的通過(guò)引用而并入于此。

本申請(qǐng)總體上涉及音頻處理,并且更具體地,涉及用于恢復(fù)噪聲被抑制的音頻信號(hào)的失真語(yǔ)音分量的系統(tǒng)和方法。



背景技術(shù):

在音頻處理系統(tǒng)中廣泛使用噪聲降低以抑制或消除用于發(fā)送語(yǔ)音的音頻信號(hào)中的不希望噪聲。然而,在噪聲消除和/或抑制之后,與噪聲糾纏在一起的語(yǔ)音在噪聲降低系統(tǒng)中易于被過(guò)度衰減或消除。

有一些大腦的模型解釋了如何利用經(jīng)由反饋機(jī)制感知地取代輸入的內(nèi)部表述來(lái)恢復(fù)聲音。神經(jīng)科學(xué)已經(jīng)描述了稱(chēng)為大腦的收斂發(fā)散區(qū)(cdz)模型的一個(gè)示例性模型,并且嘗試解釋在人類(lèi)語(yǔ)音感知中發(fā)現(xiàn)的頻譜完成和音素恢復(fù)現(xiàn)象等。



技術(shù)實(shí)現(xiàn)要素:

提供本發(fā)明內(nèi)容以通過(guò)簡(jiǎn)化形式介紹選擇的概念,其在下面詳細(xì)描述中進(jìn)一步描述。本發(fā)明內(nèi)容不旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或基本特征,也不是旨在被用作在確定所要求保護(hù)的主題的范圍的輔助。

提供了用于恢復(fù)音頻信號(hào)的失真語(yǔ)音分量的系統(tǒng)和方法。一種示例性方法包括:確定所述音頻信號(hào)中的失真頻率區(qū)和不失真頻率區(qū)。所述失真頻率區(qū)包括所述音頻信號(hào)的存在語(yǔ)音失真的區(qū)域。該方法包括:利用用于完善對(duì)所述失真頻率區(qū)處的所述音頻信號(hào)的預(yù)測(cè)的模型執(zhí)行一次或更多次迭代。所述模型可被設(shè)置成修改所述音頻信號(hào)。

在一些實(shí)施方式中,所述音頻信號(hào)包括通過(guò)對(duì)包括語(yǔ)音的聲學(xué)信號(hào)進(jìn)行噪聲降低或噪聲消除中的至少一種而獲取的噪聲被抑制的音頻信號(hào)。所述聲學(xué)信號(hào)在所述失真頻率區(qū)衰減或消除。

在一些實(shí)施方式中,所述用于完善對(duì)所述失真頻率區(qū)處的所述音頻信號(hào)的的預(yù)測(cè)的模型包括利用干凈的音頻信號(hào)或未損壞的音頻信號(hào)的頻譜包絡(luò)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)。所完善的預(yù)測(cè)可以被用于恢復(fù)所述失真頻率區(qū)中的語(yǔ)音分量。

在一些實(shí)施方式中,所述失真頻率區(qū)處的所述音頻信號(hào)在第一次迭代之前被設(shè)置成零。在執(zhí)行所述迭代中的每一次迭代之前,所述不失真頻率區(qū)處的所述音頻信號(hào)在第一次迭代之前被恢復(fù)至初始值。

在一些實(shí)施方式中,該方法還包括:比較每一次迭代之前和之后的所述不失真頻率區(qū)處的所述音頻信號(hào),以確定差異。在某些實(shí)施方式中,如果所述差異滿(mǎn)足預(yù)定標(biāo)準(zhǔn),則所述方法允許結(jié)束所述一次或更多次迭代。所述預(yù)定標(biāo)準(zhǔn)可以根據(jù)所述音頻信號(hào)的能量的下限和上限來(lái)限定。

根據(jù)本公開(kāi)另一示例性實(shí)施方式,用于恢復(fù)音頻信號(hào)的失真語(yǔ)音分量的方法的步驟被存儲(chǔ)在包括指令的非暫時(shí)性機(jī)器可讀介質(zhì)上,所述指令在通過(guò)一個(gè)或更多個(gè)處理器實(shí)現(xiàn)時(shí)執(zhí)行所述步驟。

根據(jù)結(jié)合附圖的下列描述,本公開(kāi)和方面的其它示例性實(shí)施方式將變得清楚。

附圖說(shuō)明

實(shí)施方式在附圖的圖中通過(guò)示例而非限制的方式進(jìn)行例示,其中,相同標(biāo)記指示相似部件。

圖1是例示可以實(shí)踐本技術(shù)的環(huán)境的框圖。

圖2是例示根據(jù)示例性實(shí)施方式的音頻裝置的框圖。

圖3是例示根據(jù)示例性實(shí)施方式的音頻處理系統(tǒng)的模塊的框圖。

圖4是例示根據(jù)示例性實(shí)施方式的用于恢復(fù)音頻信號(hào)的語(yǔ)音分量的方法的流程圖。

圖5是根據(jù)示例性實(shí)施方式的可用于實(shí)現(xiàn)本技術(shù)的方法的計(jì)算機(jī)系統(tǒng)。

具體實(shí)施方式

本文公開(kāi)的技術(shù)涉及用于恢復(fù)音頻信號(hào)的失真語(yǔ)音分量的系統(tǒng)和方法。本技術(shù)的實(shí)施方式可以利用被設(shè)置成接收和/或提供音頻的任何音頻裝置(諸如蜂窩電話(huà)、可佩戴裝置、電話(huà)聽(tīng)筒、耳機(jī)以及會(huì)議系統(tǒng),但不限于此)來(lái)實(shí)踐。應(yīng)當(dāng)明白,雖然本技術(shù)的一些實(shí)施方式將參照蜂窩電話(huà)的操作來(lái)描述,但本技術(shù)可以利用任何音頻裝置來(lái)實(shí)踐。

音頻裝置可以包括射頻(rf)接收器、發(fā)送器及收發(fā)器、有線(xiàn)和/或無(wú)線(xiàn)電信和/或聯(lián)網(wǎng)裝置、放大器、音頻和/或視頻播放器、編碼器、解碼器、揚(yáng)聲器、輸入部、輸出部,存儲(chǔ)裝置以及用戶(hù)輸入裝置。音頻裝置可以包括輸入裝置,諸如按鈕、開(kāi)關(guān)、按鍵、鍵盤(pán)、軌跡球、滑塊、觸摸屏、一個(gè)或更多個(gè)麥克風(fēng)、陀螺儀、加速度計(jì)、全球定位系統(tǒng)(gps)接收器等。音頻裝置可以包括輸出裝置,諸如led指示器、視頻顯示器、觸摸屏、揚(yáng)聲器等。在一些實(shí)施方式中,移動(dòng)裝置包括可佩戴裝置和手持裝置,諸如有線(xiàn)和/或無(wú)線(xiàn)遙控器、筆記本計(jì)算機(jī)、平板計(jì)算機(jī)、平板電話(huà)、智能電話(huà)、個(gè)人數(shù)字助理、媒體播放器、移動(dòng)電話(huà)等。

在不同實(shí)施方式中,音頻裝置可以在固定和便攜式環(huán)境中工作。固定環(huán)境可以包括住宅和商業(yè)建筑物或結(jié)構(gòu)物等。例如,固定的實(shí)施方式可以包括:客廳、臥室、家庭影院、會(huì)議室、禮堂、商業(yè)場(chǎng)所等。便攜式環(huán)境可以包括:移動(dòng)中的車(chē)輛、移動(dòng)中的人、其它運(yùn)輸工具等。

根據(jù)示例性實(shí)施方式,用于恢復(fù)音頻信號(hào)的失真語(yǔ)音分量的方法包括確定該音頻信號(hào)中的失真頻率區(qū)和不失真頻率區(qū)的步驟。失真頻率區(qū)包括音頻信號(hào)中的存在語(yǔ)音失真的區(qū)域。該方法包括利用用于完善對(duì)失真頻率區(qū)處的音頻信號(hào)的預(yù)測(cè)的模型來(lái)執(zhí)行一次或更多次迭代的步驟。該模型可以被設(shè)置成修改該音頻信號(hào)。

下面參照?qǐng)D1,示出了其中可以實(shí)踐用于恢復(fù)音頻信號(hào)的失真語(yǔ)音分量的方法的環(huán)境100。該示例環(huán)境100可以包括至少可工作以接收音頻信號(hào)的音頻裝置104。音頻裝置104還可工作以處理和/或記錄/存儲(chǔ)所接收的音頻信號(hào)。

在一些實(shí)施方式中,音頻裝置104包括一個(gè)或更多個(gè)聲學(xué)傳感器,例如,麥克風(fēng)。在圖1的示例中,音頻裝置104包括主麥克風(fēng)(m1)106和輔麥克風(fēng)108。在不同實(shí)施方式中,麥克風(fēng)106和108被用于檢測(cè)聲學(xué)音頻信號(hào)(例如,來(lái)自用戶(hù)102的口頭交流)和噪聲110兩者。該口頭交流可以包括關(guān)鍵詞、講話(huà)、唱歌等。

噪聲110是環(huán)境100中存在的不需要的聲音,其可以例如通過(guò)諸如麥克風(fēng)106和108的傳感器檢測(cè)到。在固定環(huán)境中,噪聲源可以包括街道噪聲、環(huán)境噪聲、來(lái)自移動(dòng)裝置的聲音(如音頻)、來(lái)自除了預(yù)定演講者以外的其它實(shí)體的講話(huà)等。噪聲110可以包括混響和回聲。移動(dòng)環(huán)境可能會(huì)遇到某些種類(lèi)的噪聲,這些噪聲是由其操作及其操作環(huán)境引起的,例如,道路、軌道、輪胎/車(chē)輪、風(fēng)扇、刮水片、發(fā)動(dòng)機(jī)、排氣裝置、娛樂(lè)系統(tǒng)、通信系統(tǒng)、競(jìng)爭(zhēng)揚(yáng)聲器、風(fēng)、雨、波浪、其它車(chē)輛、外部等噪聲。由麥克風(fēng)106和108檢測(cè)的聲信號(hào)可以被用于將希望的語(yǔ)音與噪聲110分離。

在一些實(shí)施方式中,音頻裝置104連接至基于云的計(jì)算資源160(也稱(chēng)為計(jì)算云)。在一些實(shí)施方式中,計(jì)算云160包括一個(gè)或更多個(gè)服務(wù)器機(jī)群/集群(包括計(jì)算機(jī)服務(wù)器集合),并且該計(jì)算機(jī)云與網(wǎng)絡(luò)交換機(jī)和/或路由器處于同一位置。計(jì)算云160可工作為通過(guò)網(wǎng)絡(luò)(例如,因特網(wǎng)、移動(dòng)電話(huà)(蜂窩電話(huà))網(wǎng)絡(luò)等)傳送一個(gè)或更多個(gè)服務(wù)。在某些實(shí)施方式中,音頻信號(hào)的至少部分處理在計(jì)算云160中遠(yuǎn)程地執(zhí)行。音頻裝置104可工作為向計(jì)算云160發(fā)送數(shù)據(jù)(例如,記錄的聲信號(hào))、請(qǐng)求計(jì)算服務(wù)并接收計(jì)算結(jié)果。

圖2是示例音頻裝置104的框圖。如圖所示,音頻裝置104包括接收器200、處理器202、主麥克風(fēng)106、輔麥克風(fēng)108、音頻處理系統(tǒng)210以及輸出裝置206。根據(jù)音頻裝置104的工作需要,音頻裝置104可以包括進(jìn)一步的或不同的組件。類(lèi)似地,音頻裝置104可以包括較少的組件來(lái)執(zhí)行與圖2描繪的那些類(lèi)似或等同的功能。例如,音頻裝置104在一些實(shí)施方式中包括單個(gè)麥克風(fēng),而在其它實(shí)施方式中包括兩個(gè)或更多個(gè)麥克風(fēng)。

在不同實(shí)施方式中,接收器200可以被設(shè)置成與諸如因特網(wǎng)、廣域網(wǎng)(wan)、局域網(wǎng)(lan)、蜂窩網(wǎng)絡(luò)等的網(wǎng)絡(luò)通信,以接收音頻信號(hào)。然后,將接收到的音頻信號(hào)轉(zhuǎn)發(fā)至音頻處理系統(tǒng)210。

在不同實(shí)施方式中,處理器202包括硬件和/或軟件,處理器202可工作以執(zhí)行存儲(chǔ)在存儲(chǔ)器(圖2中未例示)中的指令。示例性處理器202使用浮點(diǎn)運(yùn)算、復(fù)數(shù)運(yùn)算以及包括噪聲抑制和恢復(fù)音頻信號(hào)中的失真語(yǔ)音分量的其它運(yùn)算。

音頻處理系統(tǒng)210可被設(shè)置成,經(jīng)由至少一個(gè)麥克風(fēng)(例如,圖1和圖2的示例中的主麥克風(fēng)106和輔麥克風(fēng)108)從聲源接收聲信號(hào),并處理聲信號(hào)分量。示例系統(tǒng)中的麥克風(fēng)106和108間隔開(kāi)一段距離,使得從某些方向碰撞到裝置上的聲波在兩個(gè)或更多個(gè)麥克風(fēng)處表現(xiàn)出不同的能級(jí)。在被麥克風(fēng)106和108接收之后,該聲信號(hào)可以被轉(zhuǎn)換成電信號(hào)。這些電信號(hào)然后可以通過(guò)模數(shù)轉(zhuǎn)換器(未示出)轉(zhuǎn)換成數(shù)字信號(hào)以用于根據(jù)一些實(shí)施方式進(jìn)行處理。

在不同實(shí)施方式中,在麥克風(fēng)106和108是間隔小(例如,隔開(kāi)1至2厘米)的全向麥克風(fēng),可以使用波束形成技術(shù)來(lái)仿真向前和向后的定向麥克風(fēng)響應(yīng)??梢岳梅抡娴南蚯昂拖蚝蟮亩ㄏ螓溈孙L(fēng)來(lái)獲取電平差。該電平差可以被用于在例如時(shí)-頻域中區(qū)分語(yǔ)音和噪聲,這可用于噪聲和/或回聲降低。在一些實(shí)施方式中,一些麥克風(fēng)主要被用于檢測(cè)語(yǔ)音,而其它麥克風(fēng)主要被用于檢測(cè)噪聲。在不同實(shí)施方式中,一些麥克風(fēng)被用于檢測(cè)噪聲和語(yǔ)音兩者。

噪聲降低可以由音頻處理系統(tǒng)210基于麥克風(fēng)間的電平差、級(jí)別顯著性(levelsalience)、音高顯著性(pitchsalience)、信號(hào)類(lèi)型分類(lèi)、揚(yáng)聲器標(biāo)識(shí)來(lái)執(zhí)行。在不同實(shí)施方式中,噪聲降低包括噪聲消除和/或噪聲抑制。

在一些實(shí)施方式中,輸出裝置206是向收聽(tīng)者提供音頻輸出的任何裝置(例如,聲源)。例如,輸出裝置206可以包括揚(yáng)聲器、class-d輸出、耳機(jī)的聽(tīng)筒或音頻裝置104上的聽(tīng)筒(handset)。

圖3是示出根據(jù)示例性實(shí)施方式的音頻處理系統(tǒng)210的模塊的框圖。圖3的音頻處理系統(tǒng)210可以提供圖2的音頻處理系統(tǒng)210的更多細(xì)節(jié)。音頻處理系統(tǒng)210包括頻率分析模塊310、噪聲降低模塊320、語(yǔ)音恢復(fù)模塊330以及重建模塊340。可以從接收器200或麥克風(fēng)106和108接收輸入信號(hào)。

在一些實(shí)施方式中,音頻處理系統(tǒng)210可工作為接收包括一個(gè)或更多個(gè)時(shí)域輸入音頻信號(hào)的音頻信號(hào),在圖3的示例中描繪為從圖1中的主麥克風(fēng)(m1)和輔麥克風(fēng)(m2)接收。輸入的音頻信號(hào)被提供給頻率分析模塊310。

在一些實(shí)施方式中,頻率分析模塊310可工作為接收輸入的音頻信號(hào)。頻率分析模塊310從時(shí)域輸入音頻信號(hào)生成頻率子帶,并輸出頻率子帶信號(hào)。在一些實(shí)施方式中,頻率分析模塊310可工作為計(jì)算或確定所接收的音頻信號(hào)的語(yǔ)音分量,例如,頻譜包絡(luò)和激發(fā)。

在不同實(shí)施方式中,噪聲降低模塊320包括多個(gè)模塊并從頻率分析模塊310接收音頻信號(hào)。噪聲降低模塊320可工作為執(zhí)行音頻信號(hào)中的噪聲降低來(lái)生成噪聲被抑制的信號(hào)。在一些實(shí)施方式中,噪聲降低包括減法噪聲消除或乘法噪聲抑制。通過(guò)示例而非限制的方式,噪聲降低方法在2008年6月30日提交的主題為“systemandmethodforprovidingnoisesuppressionutilizingnullprocessingnoisesubtraction”的美國(guó)專(zhuān)利申請(qǐng)no.12/215,980中和在2007年1月29日提交的主題為“systemandmethodforutilizingomni-directionalmicrophonesforspeechenhancement”的美國(guó)專(zhuān)利申請(qǐng)no.11/699,732(美國(guó)專(zhuān)利no.8,194,880)中進(jìn)行了描述,其出于上述目的通過(guò)引用其全部?jī)?nèi)容而并入于此。噪聲降低模塊320向語(yǔ)音恢復(fù)模塊330提供經(jīng)轉(zhuǎn)換的噪聲被抑制的信號(hào)。在噪聲被抑制的信號(hào)中,因?yàn)樵肼暯档妥儞Q了音頻信號(hào)的頻率,可以消除或過(guò)度衰減一個(gè)或更多個(gè)語(yǔ)音分量。

在一些實(shí)施方式中,語(yǔ)音恢復(fù)模塊330從噪聲降低模塊320接收噪聲抑制信號(hào)。語(yǔ)音恢復(fù)模塊330被設(shè)置成恢復(fù)噪聲被抑制的信號(hào)中的損壞的語(yǔ)音分量。在一些實(shí)施方式中,語(yǔ)音恢復(fù)模塊330包括被訓(xùn)練用于恢復(fù)損壞頻率區(qū)中的語(yǔ)音分量的深度神經(jīng)網(wǎng)絡(luò)(dnn)315。在某些實(shí)施方式中,dnn315被設(shè)置成自動(dòng)編碼器。

在不同實(shí)施方式中,dnn315利用機(jī)器學(xué)習(xí)進(jìn)行訓(xùn)練。dnn315是一種前饋人工神經(jīng)網(wǎng)絡(luò),在其輸入與輸出之間具有超過(guò)一層的隱藏單元。dnn315可以通過(guò)接收干凈音頻信號(hào)或未損壞音頻信號(hào)的頻譜包絡(luò)的一個(gè)或更多個(gè)幀的輸入特征來(lái)訓(xùn)練。在訓(xùn)練過(guò)程中,dnn315可以提取干凈或未損壞的頻譜包絡(luò)的所學(xué)習(xí)的高階頻譜時(shí)間特征。在不同實(shí)施方式中,在語(yǔ)音恢復(fù)模塊330中使用利用干凈或未損壞包絡(luò)的頻譜包絡(luò)訓(xùn)練的dnn315來(lái)完善對(duì)特別適于恢復(fù)失真頻率區(qū)中的語(yǔ)音分量的干凈語(yǔ)音分量的預(yù)測(cè)。通過(guò)示例而非限制的方式,關(guān)于深度神經(jīng)網(wǎng)絡(luò)的示例性方法還在共同受讓的、2015年2月4日提交的主題為“noise-robustmulti-lingualkeywordspottingwithadeepneuralnetworkbasedarchitecture”的美國(guó)專(zhuān)利申請(qǐng)no.14/614,348和2015年6月9日提交的主題為“keyclicksuppression”的美國(guó)專(zhuān)利申請(qǐng)no.14/745,176中進(jìn)行了描述,其全部?jī)?nèi)容通過(guò)引用而并入于此。

在工作期間,語(yǔ)音恢復(fù)模塊330可以向抑制了噪聲的信號(hào)的存在語(yǔ)音失真的頻率區(qū)(失真區(qū))分配零值。在圖3的示例中,噪聲被抑制的信號(hào)進(jìn)一步提供給dnn315的輸入部以接收輸出信號(hào)。輸出信號(hào)包括對(duì)失真區(qū)的初始預(yù)測(cè),這可能不是很準(zhǔn)確。

在一些實(shí)施方式中,為改進(jìn)初始預(yù)測(cè),進(jìn)一步應(yīng)用迭代反饋機(jī)制。輸出信號(hào)350可選地反饋回dnn315的輸入部,以接收輸出信號(hào)的下一次迭代,將初始的噪聲被抑制的信號(hào)保持在輸出信號(hào)的不失真區(qū)。為了防止系統(tǒng)發(fā)散,可以在每次迭代之后將不失真區(qū)的輸出與輸入進(jìn)行比較,并且可以基于輸入的音頻信號(hào)中的能量向所估計(jì)的不失真頻率區(qū)處的能量應(yīng)用上限和下限。在不同實(shí)施方式中,應(yīng)用若干次迭代來(lái)改進(jìn)預(yù)測(cè)的準(zhǔn)確度,直到滿(mǎn)足針對(duì)特定應(yīng)用期望的準(zhǔn)確度水平為止,例如,響應(yīng)于不失真區(qū)處的音頻信號(hào)的差異滿(mǎn)足針對(duì)特定應(yīng)用的預(yù)定義標(biāo)準(zhǔn),不進(jìn)一步迭代。

在一些實(shí)施方式中,重建模塊340可工作為從語(yǔ)音恢復(fù)模塊330接收具有恢復(fù)的語(yǔ)音分量的噪聲被抑制的信號(hào),并將恢復(fù)的語(yǔ)音分量重建成單個(gè)音頻信號(hào)。

圖4是示出根據(jù)示例實(shí)施方式的用于恢復(fù)音頻信號(hào)的失真語(yǔ)音分量的方法400的流程圖。方法400可以利用語(yǔ)音恢復(fù)模塊330來(lái)執(zhí)行。

該方法可以在框402中開(kāi)始,其中,確定音頻信號(hào)中的失真頻率區(qū)和不失真的頻率區(qū)。失真語(yǔ)音區(qū)是例如因噪聲降低而導(dǎo)致存在語(yǔ)音失真的區(qū)域。

在框404中,方法400包括:利用模型來(lái)執(zhí)行一次或更多次迭代,以完善對(duì)失真頻率區(qū)處的音頻信號(hào)的預(yù)測(cè)。該模型可以被設(shè)置成修改該音頻信號(hào)。在一些實(shí)施方式中,該模型包括利用干凈或未損壞信號(hào)的頻譜包絡(luò)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)。在某些實(shí)施方式中,第一次迭代之前,對(duì)失真頻率區(qū)處的音頻信號(hào)的預(yù)測(cè)被設(shè)置成零。在執(zhí)行每次迭代之前,將不失真頻率區(qū)的音頻信號(hào)恢復(fù)至第一次迭代之前的音頻信號(hào)的值。

在框406中,該方法包括:比較每一次迭代之前和之后的不失真區(qū)的音頻信號(hào),以確定差異。

在框408中,如果該差異滿(mǎn)足預(yù)定義標(biāo)準(zhǔn),則停止迭代。

一些示例實(shí)施方式包括語(yǔ)音動(dòng)力學(xué)。針對(duì)語(yǔ)音動(dòng)力學(xué),音頻處理系統(tǒng)210可以被提供有多個(gè)連續(xù)的音頻信號(hào)幀并被訓(xùn)練以輸出相同數(shù)量的幀。在一些實(shí)施方式中包括語(yǔ)音動(dòng)力學(xué)用于強(qiáng)制時(shí)間平滑度并允許恢復(fù)較長(zhǎng)的失真區(qū)域。

使用各種實(shí)施方式來(lái)為許多應(yīng)用提供改進(jìn),如噪聲抑制、帶寬擴(kuò)展、語(yǔ)音編碼以及語(yǔ)音合成。另外,該方法和系統(tǒng)服從于傳感器融合,以使在一些實(shí)施方式中,可以將該方法和系統(tǒng)擴(kuò)展成包括其他非聲學(xué)傳感器信息。關(guān)于傳感器融合的示例性方法還在共同受讓的、2014年11月19日提交的主題為“methodformodelinguserpossessionofmobiledeviceforuserauthenticationframework”的美國(guó)專(zhuān)利申請(qǐng)no.14/548,207和2014年7月14日提交的主題為“selectionofsystemparametersbasedonnon-acousticsensorinformation”的美國(guó)專(zhuān)利申請(qǐng)no.14/331,205中進(jìn)行了描述,其全部?jī)?nèi)容通過(guò)引用而并入于此。

用于恢復(fù)噪聲降低的語(yǔ)音的各種方法還在共同受讓的、2013年1月28日提交的主題為“restorationofnoisereducedspeech”的美國(guó)專(zhuān)利申請(qǐng)no.13/751,907(美國(guó)專(zhuān)利no.8,615,394)中進(jìn)行了描述,其全部?jī)?nèi)容通過(guò)引用而并入于此。

圖5例示了可以用于實(shí)現(xiàn)本發(fā)明的一些實(shí)施方式的示例性計(jì)算機(jī)系統(tǒng)500。圖5的計(jì)算機(jī)系統(tǒng)500可以在諸如計(jì)算系統(tǒng)、網(wǎng)絡(luò)、服務(wù)器或其組合的背景下實(shí)現(xiàn)。圖5的計(jì)算機(jī)系統(tǒng)500包括一個(gè)或更多個(gè)處理器單元510和主存儲(chǔ)器520。主存儲(chǔ)器520部分地存儲(chǔ)用于由處理器單元510執(zhí)行的指令和數(shù)據(jù)。在這個(gè)示例中,主存儲(chǔ)器520在工作中時(shí)存儲(chǔ)可執(zhí)行代碼。圖5的計(jì)算機(jī)系統(tǒng)500還包括:海量數(shù)據(jù)存儲(chǔ)部530、便攜式存儲(chǔ)裝置540、輸出裝置550、用戶(hù)輸入裝置560、圖形顯示系統(tǒng)570以及外圍裝置580。

圖5所示的組件被描繪為經(jīng)由單個(gè)總線(xiàn)590連接。這些組件可以通過(guò)一個(gè)或更多個(gè)數(shù)據(jù)傳輸裝置連接。處理器單元510和主存儲(chǔ)器520經(jīng)由本地微處理器總線(xiàn)連接,而海量數(shù)據(jù)存儲(chǔ)部530、外圍裝置580、便攜式存儲(chǔ)裝置540以及圖形顯示系統(tǒng)570經(jīng)由一個(gè)或更多個(gè)輸入/輸出(i/o)總線(xiàn)連接。

可利用磁盤(pán)驅(qū)動(dòng)器、固態(tài)驅(qū)動(dòng)器或光盤(pán)驅(qū)動(dòng)器來(lái)實(shí)現(xiàn)的海量數(shù)據(jù)存儲(chǔ)部530是用于存儲(chǔ)供處理器單元510使用的數(shù)據(jù)和指令的非易失性存儲(chǔ)裝置。海量數(shù)據(jù)存儲(chǔ)部530存儲(chǔ)用于實(shí)現(xiàn)本公開(kāi)的實(shí)施方式的系統(tǒng)軟件,用于將該軟件加載到主存儲(chǔ)器520中。

便攜式存儲(chǔ)裝置540結(jié)合便攜式非易失性存儲(chǔ)介質(zhì)(諸如閃速驅(qū)動(dòng)器、軟盤(pán)、光盤(pán)、數(shù)字視頻盤(pán)或通用串行總線(xiàn)(usb)存儲(chǔ)裝置)工作,以向圖5的計(jì)算機(jī)系統(tǒng)500輸入并從圖5的計(jì)算機(jī)系統(tǒng)500輸出數(shù)據(jù)和代碼。用于實(shí)現(xiàn)本公開(kāi)的實(shí)施方式的系統(tǒng)軟件存儲(chǔ)在這種便攜式介質(zhì)上,并且經(jīng)由便攜式存儲(chǔ)裝置540輸入至計(jì)算機(jī)系統(tǒng)500。

用戶(hù)輸入裝置560可以提供用戶(hù)接口的一部分。用戶(hù)輸入裝置560可以包括一個(gè)或多個(gè)麥克風(fēng)、用于輸入字母數(shù)字和其它信息的諸如鍵盤(pán)的字母數(shù)字小鍵盤(pán)、或者諸如鼠標(biāo)、軌跡球、觸控筆或光標(biāo)方向鍵的指示裝置。用戶(hù)輸入裝置560還可以包括觸摸屏。另外,如圖5所示的計(jì)算機(jī)系統(tǒng)500包括輸出裝置550。合適的輸出裝置550包括揚(yáng)聲器、打印機(jī)、網(wǎng)絡(luò)接口以及監(jiān)視器。

圖形顯示系統(tǒng)570包括液晶顯示器(lcd)或其它合適的顯示裝置。圖形顯示系統(tǒng)570可設(shè)置成接收文本和圖形信息并處理該信息以輸出至顯示裝置。

外圍裝置580可以包括任何類(lèi)型的計(jì)算機(jī)支持裝置以向計(jì)算機(jī)系統(tǒng)500添加附加功能。

設(shè)置在圖5的計(jì)算機(jī)系統(tǒng)500中的組件是通常在可以適用于本公開(kāi)的實(shí)施方式的計(jì)算機(jī)系統(tǒng)中發(fā)現(xiàn)的那些,并且旨在表示本領(lǐng)域公知的這種計(jì)算機(jī)組件的廣泛類(lèi)別。由此,圖5的計(jì)算機(jī)系統(tǒng)500可以是個(gè)人計(jì)算機(jī)(pc)、手持計(jì)算機(jī)系統(tǒng)、電話(huà)、移動(dòng)計(jì)算機(jī)系統(tǒng)、工作站、平板、平板電話(huà)、移動(dòng)電話(huà)、服務(wù)器、迷你計(jì)算機(jī)、大型計(jì)算機(jī)、可佩戴裝置、或者任何其它計(jì)算機(jī)系統(tǒng)。計(jì)算機(jī)還可以包括不同的總線(xiàn)配置、聯(lián)網(wǎng)平臺(tái)、多處理器平臺(tái)等。可以使用各種操作系統(tǒng),包括unix、linux、windows、macos、palmos、qnxandroid、ios、chrome、tizen以及其它合適的操作系統(tǒng)。

針對(duì)各種實(shí)施方式的處理可以按基于云的軟件來(lái)實(shí)現(xiàn)。在一些實(shí)施方式中,計(jì)算機(jī)系統(tǒng)500被實(shí)現(xiàn)為基于云的計(jì)算環(huán)境,如在計(jì)算云內(nèi)工作的虛擬機(jī)。在其它實(shí)施方式中,計(jì)算機(jī)系統(tǒng)500本身可以包括基于云的計(jì)算環(huán)境,其中,按分布式方式執(zhí)行計(jì)算機(jī)系統(tǒng)500的功能。由此,在被設(shè)置為計(jì)算云時(shí),計(jì)算機(jī)系統(tǒng)500可以包括各種形式的多個(gè)計(jì)算裝置,如下更詳細(xì)描述的那樣。

一般來(lái)說(shuō),基于云的計(jì)算環(huán)境是通常將一大組處理器(如在網(wǎng)絡(luò)服務(wù)器內(nèi))的計(jì)算能力相結(jié)合的資源和/或組合一大組計(jì)算機(jī)存儲(chǔ)器或存儲(chǔ)裝置的存儲(chǔ)容量的資源。提供基于云的資源的系統(tǒng)可以由其所有者專(zhuān)門(mén)使用,或者這種系統(tǒng)可以被在該計(jì)算基礎(chǔ)設(shè)施內(nèi)部署應(yīng)用以獲得大的計(jì)算或存儲(chǔ)資源的益處的外部用戶(hù)訪(fǎng)問(wèn)。

云例如可以由包括諸如計(jì)算機(jī)系統(tǒng)500的多個(gè)計(jì)算裝置的網(wǎng)絡(luò)服務(wù)器的網(wǎng)絡(luò)形成,其中每個(gè)服務(wù)器(或至少其中的多個(gè))提供處理器和/或存儲(chǔ)資源。這些服務(wù)器可以管理由多個(gè)用戶(hù)(例如,云資源客戶(hù)或其他用戶(hù))提供的工作負(fù)載。通常,每個(gè)用戶(hù)有時(shí)顯著地將工作負(fù)載需求放在實(shí)時(shí)變化的云上。這些變化的性質(zhì)和范圍通常取決于與用戶(hù)相關(guān)聯(lián)的業(yè)務(wù)類(lèi)型。

上面參照示例實(shí)施方式對(duì)本技術(shù)進(jìn)行了描述。因此,針對(duì)本示例實(shí)施方式的其它變型例旨在被本公開(kāi)所覆蓋。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1