亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

通信系統(tǒng)中的語音壓縮方法及設(shè)備的制作方法

文檔序號:7570588閱讀:345來源:國知局
專利名稱:通信系統(tǒng)中的語音壓縮方法及設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般涉及語音壓縮技術(shù),尤其涉及一種通過高效帶寬利用和時間壓縮技術(shù)進行語音壓縮的方法和設(shè)備。
對當(dāng)前技術(shù)的大型尋呼系統(tǒng)而言,語音消息尋呼在經(jīng)濟上是不可行的。語音尋呼所需的發(fā)射時間遠(yuǎn)大于信號音,數(shù)字或字母數(shù)字尋呼所需的發(fā)射時間。在當(dāng)前技術(shù)下,與具有不夠理想的語音質(zhì)量再現(xiàn)的信號音,數(shù)字或字母數(shù)字尋呼相比較,語音尋呼服務(wù)在經(jīng)濟上是不可行的。限制語音消息尋呼的另一個因素是帶寬和使用尋呼信道帶寬的現(xiàn)有方法,相比較而言,字母數(shù)字尋呼的增長受限于必須獲取鍵盤輸入設(shè)備以向?qū)ず艚K端發(fā)送字母數(shù)字消息,它或者采用個人鍵盤的形式,或者是以呼入運行中心的呼叫的方式進行。因為主叫方可以簡單地摘起話筒,撥打接入號碼并口述消息,所以語音系統(tǒng)克服了這些入口問題。并且,沒有哪一個現(xiàn)有語音尋呼系統(tǒng)采用了Motorola的新的高速尋呼協(xié)議結(jié)構(gòu),該協(xié)議結(jié)構(gòu)也被稱為FLEXTM。
現(xiàn)有的語音尋呼系統(tǒng)缺乏FLEXTM協(xié)議的許多優(yōu)點,包括高電池節(jié)省率,多信道掃描功能,諸如語音和數(shù)據(jù)模式的混頻,回應(yīng)確認(rèn)尋呼(允許向主叫方回送回執(zhí)),設(shè)置查找功能,系統(tǒng)和頻率重用,這些優(yōu)點尤其在大城市區(qū)域和延伸范圍更為突出,它們通過丟失消息部分的選擇重發(fā)來實現(xiàn)。
關(guān)于涉及語音信號時標(biāo)的尋呼方面,以及諸如口授和語音郵件的其它應(yīng)用, 當(dāng)前的時標(biāo)方法缺少下述理想組合既提供充分良好的話音質(zhì)量,又具有允許設(shè)計者在給定的限制內(nèi)優(yōu)化應(yīng)用的靈活性。因此,需要這樣一種語音通信系統(tǒng),它在經(jīng)濟上是可行的,并且具有在給定配置內(nèi)允許優(yōu)化的靈活性,尤其是在尋呼應(yīng)用方面這種需求更為突出,并希望能進一步保持Motorola的FLEXTM協(xié)議的許多優(yōu)點。
一方面,本發(fā)明包括一種方法,用以在語音通信系統(tǒng)內(nèi)具有給定帶寬的語音通信資源中壓縮多個語音信號。該方法包括下述步驟將語音通信資源子信道化,將多個語音信號中的至少一個放置在一個子信道上,在每一個子信道中壓縮每一個語音信號的時間。在子信道中這些步驟提供了一個壓縮語音信號。
在本發(fā)明的另一方面,使用語音壓縮的通信系統(tǒng)至少具有一個發(fā)送基站和多個選擇呼叫接收性。發(fā)送基站包括一個接收音頻信號的轉(zhuǎn)入設(shè)備,一個處理設(shè)備,采用時標(biāo)壓縮技術(shù)和單邊帶調(diào)制技術(shù)壓縮音頻信號以提供一個處理信號,以及一個用于處理信號的后續(xù)發(fā)送的正交振幅調(diào)制器。多個選擇呼叫接收器的每一個包括一個選擇呼叫接收器模塊以接收所發(fā)送的處理信號,一個處理設(shè)備,采用單邊帶解調(diào)技術(shù)和時標(biāo)擴展技術(shù)解調(diào)所接收的處理信號以提供一個重構(gòu)信號,以及一個放大器以將重構(gòu)信號放大成一個重構(gòu)音頻信號。
在本發(fā)明的另一方面,接收壓縮語音信號的選擇呼叫接收器包括一個選擇呼叫接收器模塊的接收所發(fā)送的處理信號,一個處理設(shè)備,采用單邊帶解調(diào)技術(shù)和時標(biāo)擴展技術(shù)解調(diào)所接收的處理信號以提供一個重構(gòu)信號,以及一個放大器以將重構(gòu)信號放大成一個重構(gòu)音頻信號。
在本發(fā)明的另一方面,在具有預(yù)定帶寬的通信資源上發(fā)送選擇呼叫信號的尋呼基站包括,一個輸入設(shè)備以接收多個音頻信號,一個將通信資源子信道化成預(yù)定數(shù)量的子信道的設(shè)備,每一個子信道的一個振幅壓縮和琥波模塊以壓縮各個音頻信號的振幅并濾波各個音頻信號,一個時間壓縮模塊,為每個子信道壓縮各個音頻信號的時間,以及一個正交振幅調(diào)制器,用于處理信號的后續(xù)傳送。


圖1是根據(jù)本發(fā)明的語音通信系統(tǒng)的框圖;圖2是根據(jù)本發(fā)明的基站發(fā)送器的框圖;圖3是根據(jù)本發(fā)明的基站發(fā)送器的擴展電氣框圖;圖4是根據(jù)本發(fā)明的另一種基站發(fā)送器的擴展電氣框圖;圖5是根據(jù)本發(fā)明的基站發(fā)送器的語音處理,編碼和調(diào)制部分的框圖;圖6是根據(jù)本發(fā)明的6個單邊帶信號發(fā)送器的頻譜分析儀輸出;圖7是根據(jù)本發(fā)明的選擇呼叫接收器的擴展電氣框圖8是根據(jù)本發(fā)明的另一種選擇呼叫接收器的擴展電氣框圖;圖9是根據(jù)本發(fā)明的另一種選擇呼叫接收器的擴展電氣框圖;圖10是示出根據(jù)本發(fā)明的外出信令協(xié)議的傳輸格式的時序圖;圖11是示出根據(jù)本發(fā)明的包括語音幀細(xì)節(jié)的外出信令協(xié)議的傳輸格式的另一個時序圖;圖12是說明根據(jù)本發(fā)明的外出信令協(xié)議的一個控制幀和兩個模擬幀的另一個時序圖;圖13-17說明了根據(jù)本發(fā)明的WSOLA時標(biāo)(壓縮)方法的幾個迭代的時序圖;圖18-22說明了根據(jù)本發(fā)明的WSOLA-SD時標(biāo)(壓縮)方法的幾個迭代的時序圖;圖23-24說明了根據(jù)本發(fā)明的WSOLA-SD時標(biāo)(擴展)方法的迭代的時序圖;圖25說明了根據(jù)本發(fā)明的整個WSOLA-SD時標(biāo)方法的框圖。
參看圖1,在選擇呼叫系統(tǒng)100的框圖中示出了說明本發(fā)明的語音壓縮和擴展技術(shù)的通信系統(tǒng),選擇呼叫系統(tǒng)100包括一個接收音頻信號的輸入設(shè)備,例如電話114(或其它輸入設(shè)備,例如一臺計算機),該輸入設(shè)備啟動基于語音的選擇呼叫以將其傳送到系統(tǒng)100的選擇呼叫接收器中。每一個通過電話114進入的選擇呼叫一般包括(a)至少一個系統(tǒng)中的選擇呼叫接收器的接收器地址,和(b)一個語音消息。啟動的選擇呼叫一般提供給發(fā)送基站或選擇呼叫終端113以進行格式化或排隊。終端113的語音壓縮電路系統(tǒng)101用于壓縮所提供的語音消息的時間長度(這種語音壓縮電路系統(tǒng)101的具體操作在后續(xù)圖2,3和4的描述中討論)。語音壓縮電路系統(tǒng)101最好包括一個處理設(shè)備,采用時標(biāo)技術(shù)和單邊帶調(diào)制技術(shù)壓縮音頻信號以提供處理信號。該選擇呼叫隨后被輸入到選擇呼叫發(fā)送器102,在后者中將其調(diào)制到一個無線頻率信號,由天線103通過無線方式將其發(fā)送。發(fā)送器最好是一個正交振幅調(diào)制發(fā)送器以發(fā)送處理信號。
選擇呼叫接收器112中的天線104接收已調(diào)發(fā)送射頻信號并將其輸入到用以接收處理信號或射頻信號的選擇呼叫接收器模塊或射頻接收器模塊105,在模塊105中解調(diào)射頻信號并恢復(fù)接收器地址和壓縮語音消息。壓縮語音消息隨后被提供給模數(shù)轉(zhuǎn)換器(A/D)115。選擇呼叫接收器112最好包括一個處理設(shè)備,采用單邊帶解調(diào)技術(shù)和時標(biāo)擴展技術(shù)解調(diào)所接收的處理信號以提供一個重構(gòu)信號。壓縮語音信號然后被提供給語音擴展電路106,在電路106中最好將語音消息的時長擴展到所需值(本發(fā)明所采用的這種語音擴展電路系統(tǒng)106的具體操作在后續(xù)圖7和8的描述中討論)。語音消息然后被提供給一個放大器,例如音頻放大器108以將其放大成一個重構(gòu)音頻信號。
解調(diào)的接收器地址從射頻接收器105輸送到解碼器107。如果接收器地址匹配解碼器107中存儲的任一接收器地址,那么可以選擇激活通知設(shè)備111,提供給該選擇呼叫接收器112的用戶一個簡短的感覺(sensory)指示以告知接收到選擇呼叫。該簡短感覺指示可以包括可聞信號,觸覺信號,例如振動,或者可見信號,例如光,或者是這三者的組合。放大的語音消息隨后從音頻放大器108輸送給通知設(shè)備111內(nèi)的音頻揚聲器以播放消息并供用戶檢查。
解碼器107可以包括一個存儲器,所接收的語音消息可以存儲在其中,并由一個或多個控制110的行為重復(fù)調(diào)用以進行檢查。
在本發(fā)明的另一方面,圖1的部分可以等價為一個口述(dictation)設(shè)備,語音郵件系統(tǒng),應(yīng)答機,或者聲跡編輯設(shè)備。通過取消系統(tǒng)100的無線方面,包括取消選擇呼叫發(fā)送器102和射頻接收器105,系統(tǒng)可以從語音壓縮電路系統(tǒng)101經(jīng)過A/D115到語音擴展電路系統(tǒng)106可選地進行硬件化,如虛線所示。這樣,在語音郵件,應(yīng)答機,聲跡編輯或口述系統(tǒng)中,輸入設(shè)備114向帶有語音壓縮電路系統(tǒng)101的終端113供應(yīng)一個聲輸入信號,例如一個話音信號。語音擴展電路系統(tǒng)106和控制110將對語音郵件,應(yīng)答機,口述,聲跡編輯或其它應(yīng)用系統(tǒng)中的輸出話音信號實施監(jiān)聽和操作。本發(fā)明明確地考慮到所聲明的發(fā)明的時標(biāo)技術(shù)除了尋呼之外,還可以有許多其它應(yīng)用。此處公開的尋呼例子僅說明了這些應(yīng)用中的一個。
現(xiàn)在參看圖2,示出了尋呼發(fā)送器102和終端113的框圖,終端113包括一個振幅壓縮和濾波模塊150,它耦合到一個時間壓縮模塊150,后者耦合到選擇呼叫發(fā)送器102并通過天線103發(fā)送消息。參看圖3和4,示出了圖2框圖的一個較低層次框圖。
請記住該壓縮語音尋呼系統(tǒng)非常高效地利用了帶寬,一般能夠支持每25KHz信道上6到30個語音消息,這通過正交振幅(QAM)或單邊帶(SSB)調(diào)制的基本概念和話音信號的時標(biāo)來實現(xiàn)。在第一實施例中,并請參看圖6,壓縮語音信道或語音通信資源最好包括3個相距6250Hz的子信道。每一個子信道包括兩個單邊帶和一個導(dǎo)頻。這兩個單邊帶的每一個可以在第一方法中帶有相同的消息,或者在第二方法中每一邊帶上帶有不同的話音消息或者單個消息在上邊帶和下邊帶上分割。單個子信道實際上具有6250Hz帶寬,每一個邊帶實際占據(jù)3125Hz帶寬。實際話音帶寬實際上是300-2800Hz。可選地,在直接通過信號的I和Q分量發(fā)送兩個獨立信號以生成每一子信道信號的情況下,可以使用正交振幅調(diào)制。在QAM和SSB情況下所需的傳輸帶寬是相同的。
注意到圖2中的模塊150和160可以重復(fù)以供每一個不同的語音信號使用(在25KHz寬的信道中可以多達(dá)6次,在50KHz寬信道中多達(dá)14次),從而允許語音消息的高效和同時傳輸(在示出的例子中多達(dá)6個)。它們隨后可以在加法設(shè)備(未示出,但可參看圖5)中全部累加,并最好在102中作為合成信號處理。單獨的信號(未示出)包含F(xiàn)LEXTM協(xié)議(后面將予以描述)的FM調(diào)制,后者可以可選地在軟件中產(chǎn)生或作為硬件FM信號激勵器的輸出。
在此處示出的例子中,最好由終端113接收到來的話音消息。本系統(tǒng)最好使用時標(biāo)方案或技術(shù)以實現(xiàn)所需的壓縮。本發(fā)明所采用的優(yōu)選壓縮技術(shù)需要與到來消息相關(guān)的特定參數(shù)以提供優(yōu)化的質(zhì)量。時標(biāo)壓縮技術(shù)最好將話音信號處理成一個具有與未壓縮話音相同帶寬特征的信號。(一旦計算出這些參數(shù),采用所需的時標(biāo)壓縮技術(shù)壓縮話音)。然后通過一個數(shù)字編碼器編碼該時標(biāo)壓縮話音以減少需要分配到發(fā)送器的比特數(shù)量。在尋呼系統(tǒng)的情況下,分配到聯(lián)播尋呼系統(tǒng)的多個聯(lián)播現(xiàn)場的發(fā)送器的編碼話音需要再次解碼以進行進一步處理,例如振幅壓縮。在發(fā)送器中采用到來話音信號的振幅壓縮(最好使用音節(jié)壓擴器)以防止信道損傷。
一種稱為基于波形相似性的重疊相加技術(shù)或WSOLA的時標(biāo)技術(shù)將話音編碼成一個具有與未壓縮話音相同帶寬特性的模擬信號。WSOLA的這種特性允許它與SSB或QAM調(diào)制組合,從而達(dá)到的總壓縮是多個QAM或SSB子信道(在我們的例子中是6個話音信道)的帶寬壓縮率和WSOLA的時間壓縮率(一般在1和5之間)的乘積。在本發(fā)明中,采用WSOLA的改進版本,這在后面描述并被稱為“WSOLA-SD”。WSOLA-SD保持了WSOLA的兼容特性,允許與SSB或QAM調(diào)制組合。
最好采用且適應(yīng)差分脈碼調(diào)制編碼器(ADPCM)將話音編碼成數(shù)據(jù),隨后分配給發(fā)送器。在發(fā)送器中,解碼數(shù)字?jǐn)?shù)據(jù)以獲取WSOLA-SD壓縮話音,隨后振幅壓擴該壓縮話音以提供保護,免受信道噪聲的影響。對該信號進行希爾伯特交換以得到一個單邊帶信號。可選地,對該信號進行正交調(diào)制以得到一個QAM信號。然后向該信號中加入導(dǎo)頻,最好將最終信號插值成16KHz抽樣速率并轉(zhuǎn)換成模擬信號,隨后對其進行調(diào)制和發(fā)送。
本發(fā)明可以作為混合模式(語音或數(shù)字)單或雙向通信系統(tǒng)工作,以在前向信道(從基站發(fā)送器發(fā)出)上向選擇呼叫接收器單元傳送模擬語音和/或數(shù)字消息,并從同一個選擇呼叫接收器單元中接收確認(rèn),該選擇呼叫接收器單元在可選的反向信道(進入到基站接收器)上額外具有可選的發(fā)送器。本發(fā)明的系統(tǒng)在前向信道上最好采用類似于FLEXTM(Motorola公司的高速尋呼協(xié)議,美國專利No.5,282,205的主題,在此列出以供參考)的同步幀結(jié)構(gòu)以進行尋址和語音消息發(fā)送。使用兩種類型的幀、控制幀和語音幀??刂茙詈糜糜趯?shù)字?jǐn)?shù)據(jù)尋址并傳遞到便攜式語音單元(PVU)形式的選擇呼叫接收器。語音幀用于將模擬語音消息傳遞給PVU。這兩種幀類型在長度上都與標(biāo)準(zhǔn)FLEXTM幀相同,并且都以標(biāo)準(zhǔn)FLEXTM同步開始。這兩類幀在單個前向信道上時分復(fù)用。本發(fā)明的幀結(jié)構(gòu)將在后面參照圖10,11和12更詳細(xì)地予以討論。
在調(diào)制方面,最好在本發(fā)明的前向信道上使用兩種類型的調(diào)制數(shù)字FM(2值和4值FSK)和AM(帶有導(dǎo)頻的SSB或QAM)。數(shù)字FM調(diào)制用于這兩類幀的同步部分,并用于控制幀的地址和數(shù)據(jù)域。在語音幀的語音消息域中采用AM調(diào)制(每一邊帶可以獨立使用或在單個消息中組合在一起使用)。傳輸?shù)臄?shù)字FM部分支持6400BPS(3200波特碼元)信令傳送。傳輸?shù)腁M部分支持限帶語音(2800Hz),并且一對語音信號需要6.25KHz。該協(xié)議將在后面描述,它通過將一個主速信道劃分成6.25KHz子信道,并通過為獨立消息使用每一子信道和AM邊帶來利用減少的AM帶寬。
本發(fā)明的語音系統(tǒng)最好設(shè)計成工作在25KHz或50KHz前向信道,但其它范圍的頻譜當(dāng)然也在本發(fā)明的考慮之內(nèi)。25KHz前向信道在控制幀期間支持單個FM控制信號,而在語音幀的消息部分期間支持多達(dá)3個AM子信道(6個獨立信號)。50KHz前向信道在控制幀期間支持以時間同步方式工作的兩個FM控制信號,而在語音幀的消息部分期間支持多達(dá)7個AM子信道(14個獨立信號)。當(dāng)然,使用不同大小的帶寬和子信道和信號數(shù)量的其它配置也在本發(fā)明的考慮之內(nèi)。此處公開的例子僅僅用于說明和指示此權(quán)利要求書的潛在的寬廣范圍。
除了通過調(diào)制和頻譜的子信道化實現(xiàn)的頻譜效率,本發(fā)明在另一個實施例中可以使用一種獨立于揚聲器的語音壓縮技術(shù),該語音壓縮技術(shù)利用1到5倍的因子時標(biāo)話音。通過對同一個消息的不同部分或不同消息使用子信道的兩個AM邊帶(可選的,2個QAM分量),每一子信道的總壓縮因子是2到10倍。隨著時間壓縮因子的增長,語音質(zhì)量一般將下降。在本發(fā)明的語音系統(tǒng)中使用的壓縮技術(shù)最好是一種已知的時標(biāo)技術(shù)的改進形式,如前所述,這種時標(biāo)技術(shù)被稱為基于波形相似性的重疊相加技術(shù)(WSOLA)。WSOLA的改進形式獨立于所使用的特定揚聲器或話音,因此將其定名為“WSOLA-SD”,其中“SD”意味著獨立于揚聲器,后面將對其進行討論。
當(dāng)可以使用反向(進入到基站接收器)信道時,本發(fā)明的操作能夠得到改進。頻分單工操作方式是所支持的一種進入操作方式(美國專利No.4,875,038和4,882,579,都已轉(zhuǎn)讓給本發(fā)明的受讓人,Motorola公司,它們說明了在一個進入信道上使用多個確認(rèn)信號,此處列出以供參考)。在頻分單2方式下,為進入的傳輸提供一個單獨的專用信道(通常與一個外出信道成對)。在12.5KHz信道帶寬內(nèi),可以考慮800到9600BPS的進入數(shù)據(jù)速率。
本發(fā)明的系統(tǒng)可以根據(jù)反向信道的可用性工作在多個模式之一。當(dāng)反向信道不可用時,系統(tǒng)最好在尋址和語音消息傳送時都工作在聯(lián)播模式。當(dāng)提供了反向信道時,系統(tǒng)可以工作在目標(biāo)消息模式,因而消息僅在位于便攜式語音單元附近的單個發(fā)送器或某個發(fā)送器的子集中廣播。目標(biāo)消息模式的特征在于,聯(lián)播尋址以定位該便攜式語音單元,便攜式語音單元在反向信道上的響應(yīng)提供了位置,接著是向該便攜式語音單元的本地化消息傳輸。目標(biāo)消息模式操作的優(yōu)點在于,它提供了子信道重用的機會;以及因此這種模式的操作可以在許多大型系統(tǒng)中帶來系統(tǒng)容量的增加。
圖3說明了根據(jù)本發(fā)明的發(fā)送器300的第一實施例的框圖。模擬話音信號被輸入到一個抗混淆低通濾波器301,后者強烈衰減所有超過模數(shù)轉(zhuǎn)換器(ADC)303抽樣速率一倍半的頻率,模數(shù)轉(zhuǎn)換器303進一步耦合到濾波器301。ADC303最好將模擬話音信號轉(zhuǎn)換成數(shù)字信號,以便用數(shù)字處理技術(shù)完成進一步的信號處理。數(shù)字處理是優(yōu)選方法,但同樣的功能可以通過模擬技術(shù)或模擬和數(shù)字技術(shù)的組合來執(zhí)行。
耦合到ADC303的帶通濾波器305強烈衰減低于或高于其截止頻率的頻率。下截止頻率最好是300Hz,它允許有效話音頻率通過,但是衰減會干擾導(dǎo)頻的較低頻率。上截止頻率最好是2800Hz,它允許有效話音頻率通過,但衰減會干擾相鄰傳輸信道的較高頻率。最好耦合到濾波器305的自動增益控制(AGC)塊307均衡不同語音的音量電平。
最好耦合到AGC塊307的時間壓縮塊309縮短了話音信號傳輸所需的時間,同時保持了實質(zhì)上與帶寬濾波器305的輸出相同的信號頻譜。時間壓縮方法最好是WSOLA-SD(后面將予以解釋),但是也可以使用其它方法。振幅壓縮塊311,和接收器700中對應(yīng)的振幅擴展塊720(圖7)形成了壓擴設(shè)備,眾所周知,該壓擴設(shè)備能夠明顯增加所接受話音的信噪比。壓擴率最好是2分貝比1分貝,但是根據(jù)本發(fā)明也可以使用其它比值。在通信系統(tǒng)的特定實例,例如尋呼系統(tǒng)中,設(shè)備301-309可以包括在尋呼終端(圖1的113)中,而圖3中的其余元件可以組成尋呼發(fā)送器(圖1的102)。在這種情況下,一般在尋呼終端和尋呼發(fā)送器之間有一條數(shù)字鏈路。例如,塊309之后的信號可以采用脈碼調(diào)制(PCM)技術(shù)進行編碼,隨后通過PCM解碼來減少尋呼終端和尋呼發(fā)送器間傳送的比特數(shù)量。
在任何情況下,耦合到振幅壓縮塊311的第二帶通濾波器308強烈衰減低于和高于其截止頻率的頻率以消去由AGC307,時間壓縮塊309或振幅壓縮塊311所產(chǎn)生的任何寄生頻率分量。下截止頻率最好是300Hz,它允許有效話音頻率通過,而衰減會干擾導(dǎo)頻的較低頻率。上截止頻率最好是2800Hz,它允許有效話音頻率通過,但衰減會干擾相鄰傳輸信道的較高頻率。
時間壓縮話音樣本最好存儲在緩沖器313中,直至處理完整個話音消息。這允許時間壓縮話音信號隨后作為一個整體進行傳輸。這種緩沖方法最好用于尋呼服務(wù)(它一般不是實時服務(wù))對其它應(yīng)用而言,其它緩沖方法可能更合適。例如,對涉及雙向?qū)崟r通話的應(yīng)用而言,這種類型的緩沖所引起的時延可能是無法忍受的。在該情況下,交織幾個通話的小段更為可取。例如,如果時間壓縮率是3∶1,那么3個定時話音信號通過單個信道傳送。這3個傳輸可以在信道上以150毫秒脈沖串的形式進行交織,其結(jié)果時延將不會再令人厭煩。來自緩沖器313的時間壓縮話音信號被輸送給希爾伯特變換濾波器323,同時輸送給時延塊315,后者具有與希爾伯特變換濾波器相同的時延,但是并不影響該信號。
時延塊315(經(jīng)過加法電路317)和希爾伯特變換濾波器323的輸出分別形成了上邊帶(USB)單邊帶(SSB)信號的同相(I)和正交(Q)分量。時延的輸出和希爾伯特變換的負(fù)(325)輸出分別形成了下邊帶(LSB)單邊帶信號的同相(1)和正交(Q)分量。這樣傳輸可以在上邊帶或下邊帶上進行,如虛線所示。
當(dāng)使用上邊帶傳送一個時間壓縮話音信號時,通過工作在下邊帶的另一個類似的發(fā)送器可以利用下邊帶同時發(fā)送第二時間壓縮話音信號。SSB是優(yōu)選調(diào)制方法,因為它能高效地使用傳輸帶寬并能防止串音。也可以使用雙邊帶振幅調(diào)制(AM)或頻率調(diào)制(FM),但將需要至少兩倍的傳輸帶寬。也可以直接通過I分量發(fā)送一個時間壓縮話音信號,直接通過Q分量發(fā)送第二時間壓縮話音信號,但是在本實施例中,當(dāng)在接收器中發(fā)生多徑接收時,這種方法會導(dǎo)致兩個信號間的串音。
將直流(DC)信號加入到信號的I分量以產(chǎn)生導(dǎo)頻,后者與信號一起發(fā)送,并由接收器(700)用以實際上消除傳輸信道上的增益和相位變化或衰落的影響。信號的I和Q分量分別由數(shù)模轉(zhuǎn)換器(DAC)319和327轉(zhuǎn)換成模擬形式。這兩個信號隨后分別由低通重構(gòu)濾波器321和329濾波以消除由數(shù)模轉(zhuǎn)換處理帶來的寄生頻率分量。正交振幅調(diào)制(QAM)調(diào)制器333將I和Q信號調(diào)制成較低功率值的射頻(RF)載波。其它調(diào)制方法,例如已調(diào)信號的直接數(shù)字合成將完成DAC(319和327),重構(gòu)濾波器(321和329)和QAM調(diào)制器333的相同功能。最后,線性RF放大器335將已調(diào)RF信號放大到所需的功率值,一般是50瓦或更多。然后,將RF功率放大器335的輸出傳送到發(fā)射天線?;兓梢援a(chǎn)生實際上相同的結(jié)果。例如,振幅壓縮可以在時間壓縮之前執(zhí)行,或者完全忽略,而設(shè)備仍將執(zhí)行實際上相同的功能。
圖4說明了根據(jù)本發(fā)明的發(fā)送器400的第二實施例的框圖。在圖4中,使用上邊帶和下邊帶同時發(fā)送同一個時間壓縮信號的不同部分。發(fā)送器400最好包括一個抗混淆濾波器404,一個ADC403,一個帶通濾波器405和一個AGC407,一個時間壓縮塊409,一個振幅壓縮塊411,和一個帶通濾波器408,其連接和配置如圖3所示。圖4的發(fā)送器的操作與圖3相同,直至處理完整個話音消息并將其存儲在緩沖器413中。存儲在緩沖器413中的時間壓縮話音樣本隨后被劃分以在上邊帶或下邊帶上發(fā)送。最好是前半部分時間壓縮話音消息通過一個邊帶發(fā)送,而后半部分時間壓縮話音消息通過另一個邊帶發(fā)送(或者也可以直接在每一個I和Q分量上發(fā)送)。
來自緩沖器413的第一部分時間壓縮話音信號同時輸送給第一希爾伯特變換濾波器423和第一時延塊415,后者具有與希爾伯特變換濾波器423相同的時延,但并不影響信號。第一時延的輸出(通過加法電路417)和第一希爾伯特變換濾波器423的輸出(通過加法電路465)是同相(1)和正交相位(Q)信號分量,當(dāng)連接到QAM調(diào)制器的I和Q輸入時,它們產(chǎn)生的上邊帶信號僅帶有來自第一部分時間壓縮話音樣本的信息。來自緩沖器413的第二時間壓縮話音信號同時輸送給第二希爾伯特變換濾波器461和第二時延塊457,后者具有與希爾伯特變換濾波器461相同的時延,但并不影響信號。第二時延的輸出(通過加法電路459和417)和第二希爾伯特變換濾波器461的負(fù)輸出(463)(再次通過加法電路465)是同相(I)和正交相位(Q)信號分量,當(dāng)連接到QAM調(diào)制器的I和Q輸入時,它們產(chǎn)生的上邊帶信號僅帶有來自第二部分時間壓縮話音樣本的信號。上邊帶和下邊帶信號的I分量與一個DC導(dǎo)頻分量相加(通過加法電路459)生成合成的I分量用于傳輸。上邊帶和下邊帶信號的Q分量相加(通過加法電路465),生成合成的Q分量用于傳輸。應(yīng)當(dāng)理解元件415,423,457,461,417,459,463,465,419,427,421和429形成一個預(yù)處理器,它產(chǎn)生預(yù)處理的I和Q信號分量,當(dāng)連接到QAM調(diào)制器453時,這兩個信號分量產(chǎn)生低電平子信道信號,后者帶有子載波FA并具有兩個單邊帶信號,這兩個信號的每一邊帶上帶有獨立信息。
發(fā)送器400進一步包括DAC419和427,重構(gòu)濾波器421和429,QAM調(diào)制器433和RF功率放大器455,其布局和構(gòu)造如圖3所示。圖4的發(fā)送器的其余部分的操作與圖3相同。
分別在圖3和4中的發(fā)送器300和400中,最好僅有抗混淆濾波器,重構(gòu)濾波器,RF功率放大器和可選的模數(shù)轉(zhuǎn)換器和數(shù)模轉(zhuǎn)換器是獨立的硬件元件。這兩個設(shè)備的其余部分最好是并入軟件中,后者可以在處理器,最好是數(shù)字信號處理器中運行。
圖7說明了根據(jù)本發(fā)明的最好與圖3的發(fā)送器300一起工作的接收器700的框圖。接收天線連接到接收器模塊702。接收器模塊702包括傳統(tǒng)的接收器元件,例如RF放大器,混頻器,帶通濾波器和中頻(IF)放大器(未示出)。QAM解調(diào)器704檢測所接收信號的I和Q分量。模數(shù)轉(zhuǎn)換器(ADC)706將I和Q分量轉(zhuǎn)換成數(shù)字形式以進行進一步處理。數(shù)字處理是優(yōu)選方法,但是相同功能也可以由模擬技術(shù)或模擬與數(shù)字技術(shù)的組合來執(zhí)行。其它的解調(diào)方法,例如sigma-delta轉(zhuǎn)換器或直接數(shù)字解調(diào)也能完成與QAM解調(diào)器704和ADC706的相同的功能。
前饋自動增益控制(AGC)塊708使用與時間壓縮話音信號一起傳送的導(dǎo)頻作為相位和振幅參考信號以實際消除傳輸信道中發(fā)生的振幅和相位失真的影響。前饋自動增益控制的輸出是所接收信號的修正的I和Q分量。修正的Q分量輸送給希爾伯特交換濾波器712,而修正的I分量輸送給時延塊710,后者具有與希爾伯特變換濾波器712相同的時延,但并不影響信號。
如果時間壓縮話音信號在上邊帶上傳送,希爾伯特變換濾波器712的輸出加入(通過加法電路714)到時延塊710的輸出中以產(chǎn)生恢復(fù)的時間壓縮話音信號。如果時間壓縮話音信號在下邊帶上傳送,從時延塊71O的輸出中減去(716)希爾伯特變換濾波器712的輸出以產(chǎn)生恢復(fù)的時間壓縮話音信號。恢復(fù)的時間壓縮話音信號最好存儲在緩沖器718中直至接收完整個消息。也可以采用其它緩沖方法。(參看圖3的討論)振幅擴展塊720與圖3的振幅壓縮塊311一起工作的執(zhí)行壓擴功能。時間擴展塊722與圖3的時間壓縮塊309一起工作,最好將話音重構(gòu)成它本來的時間幀用于傳感器724的音頻輸出,或者重構(gòu)成其它應(yīng)用可能建議的其它時間幀。一種應(yīng)用可選地包括將數(shù)字化語音傳送給計算設(shè)備726,其中接收器到計算機的接口可以是PCMCIA或RS-232接口或本領(lǐng)域中已知的任意型號的接口。時間壓縮方法最好是WSOLA-SD,但是也可以使用其它方法,只要在發(fā)送器和接收器中采用互補的方法。配置中的其它變化可以產(chǎn)生實質(zhì)上相同的結(jié)果。例如,振幅壓縮可以在時間壓縮之后執(zhí)行,或者完全忽略而設(shè)備仍將執(zhí)行實際上相同的功能。
圖8說明了根據(jù)本發(fā)明與圖4的發(fā)送器400一起工作的接收器750的框圖。圖8的接收器包括一根天線,接收器模塊752,一個QAM調(diào)制器754,一個ADC756,一人前饋AGC758,一個時延塊760和一個希爾伯特變換濾波器762,其布局和構(gòu)造如圖7所示。,圖8的接收器的操作直到時延塊760和希爾伯特變換濾波器762的輸出為止都與圖7相同。希爾伯特變換濾波器762的輸出加入到時延塊760的輸出(通過加法電路764)以產(chǎn)生恢復(fù)的時間壓縮話音信號,后者對應(yīng)于在上邊帶上傳送的話音消息的前半部分,從時延塊760的輸出中減去(766)希爾伯特變換濾波器762的輸出以產(chǎn)生恢復(fù)的時間壓縮話音信號,后者對應(yīng)于在下邊帶上傳送的話音消息的后半部分。
這兩個恢復(fù)的時間壓縮話音信號存儲在各自的上邊帶和下邊帶緩沖器768和769中,直至接收完整個消息。然后,對應(yīng)于前半部分消息的信號和對應(yīng)于后半部分消息的信號接著被輸送到振幅擴展塊770。振幅擴展塊770與圖4的振幅壓縮塊411一起工作以執(zhí)行壓擴功能。
圖8的接收器的其余部分的操作與圖7相同。時間擴展塊722與圖4的時間壓縮塊409一起工作,最好將話音重構(gòu)成它本來的時間幀或其它應(yīng)用可能建議或需要的其它時間幀。時間壓縮方法最好是WSOLA-SD,但是也可以使用其它方法,只要在發(fā)送器和接收器中采用互補的方法,其它配置可以產(chǎn)生實質(zhì)上相同的結(jié)果。例如,振幅壓縮可以在時間壓縮之后執(zhí)行,或者完全忽略而設(shè)備仍將執(zhí)行實際上相同的功能。
根據(jù)圖3和4的發(fā)送器的實現(xiàn),圖7和8的許多元件可以以軟件方式實現(xiàn),包括但不限于AGC,單邊帶或QAM解調(diào)器,求和電路,振幅擴展塊,以及時間擴展塊。所有其它元件最好以硬件方式實現(xiàn)。
如果本發(fā)明的話音處理,編碼和調(diào)制部分將在硬件中實現(xiàn),則可以使用圖5的實現(xiàn)方式。例如,圖5的發(fā)送器500包括一系列單邊帶激勵器對(571-576),它們設(shè)置成各自導(dǎo)頻(581-583)的頻率。激勵器571-576和導(dǎo)頻581-583對應(yīng)于不同的語音處理路徑。所有這些信號,包括來自FM信號激勵器577的信號(用于前述同步,地址和數(shù)據(jù)域的數(shù)字FM調(diào)制)將被饋送到一個加法放大器570并隨后發(fā)送,加法放大器570則由線性放大器580放大。FM激勵器577的低電平輸出也線性合并到加法放大器570。線性RF功率放大器580將加法放大器570的合成的輸出信號放大到所需的功率值,通常是50瓦或更大。線性RF功率放大器580的輸出隨后輸送給發(fā)射天線。
也可以使用其它裝置來合并多個子信道信號。例如,在圖4的417和465的輸出中得到的多個數(shù)字基帶I和Q信號可以在頻率上轉(zhuǎn)換成它們各自的子載波偏頻,以數(shù)字形式予以合并,然后轉(zhuǎn)換到模擬形式以調(diào)制到載頻。
參看圖9,示出了根據(jù)本發(fā)明的另一種接收器單元900。在接收器900中額外并入了一個裝置,用于檢測和解碼在FLEXTM信令協(xié)議中使用的FM已調(diào)控制信號。框902是接收器前端和FM后端。一個數(shù)字自動頻率控制器(DAFC)和自動增益控制器(AGC)并入到框902???06包括帶有一個支持芯片950的無線處理器,框911,914和916包括所有輸出設(shè)備???04是在處理器906控制下工作的電池節(jié)能器或電池節(jié)能電路???50是一個線性解碼器,連接著模數(shù)轉(zhuǎn)換器和隨機存取存儲器(RAM)框858。接收器框902最好是一個改進的PM接收器,包括一個附加的如美國專利No.5,239,306中所描述的DAFC(該專利已轉(zhuǎn)讓給本發(fā)明的受讓人,在此列出以供參考),一個AGC,在大部分接收器增益之后但在FM解調(diào)器之前的某個點上提供中頻(IF)輸出。
控制Motorola的FLEXTM協(xié)議兼容尋呼機的同一個處理器應(yīng)該能充分處理本發(fā)明中的所有協(xié)議功能,包括FM解調(diào)信號的地址識別和消息解碼。此外,響應(yīng)于FM已調(diào)地址(和可能的消息指針碼字),處理器906啟動模數(shù)轉(zhuǎn)換和RAM框868的操作???68在線性解碼器框850的輸出中抽樣I(同相)和Q(正交)線性已調(diào)信號中的一個,或者兩者都進行抽樣。借助于地址計數(shù)器將信號樣本直接寫入RAM并響應(yīng)于來自處理器906的控制信號。
如前所述,語音可以作為占據(jù)信道的單語音邊帶的一個SSB信號發(fā)送,或在均分到I或Q信道上發(fā)送。每一個I和Q信號作為兩個模擬單邊帶(SSB)同時占據(jù)相同的RF帶寬。語音帶寬在2.8KHz的量級上,所以如果從I和Q信道信息中恢復(fù)模擬SSB,那么一般每一個模數(shù)轉(zhuǎn)換器都需要大約6.4KHz的信號抽樣率。模數(shù)轉(zhuǎn)換器以8比特精度(盡管最好是多達(dá)10比特)抽樣。模數(shù)轉(zhuǎn)換器進行的直接存儲器存取允許使用速度和功率都不是信道數(shù)據(jù)速率的直接函數(shù)的處理器。也就是說,微處理器可以用以進行直接存儲器存取,但是如果通過微處理器將模數(shù)轉(zhuǎn)換數(shù)據(jù)讀入存儲器,則需要一個速度高得多的處理器。
模數(shù)轉(zhuǎn)換器(A/D),雙端口RAM和地址計數(shù)器組成框868。第二RAMI/O端口可以是串行或并行的,并且工作在每秒6或12K樣本速率。提供第二RAMI/O端口是為了處理器能析取抽樣語音或數(shù)據(jù),處理解調(diào)功能以及擴展壓縮的語音或格式化數(shù)據(jù)?;謴?fù)的語音通過語音處理器914和傳感器916回放,而格式化數(shù)據(jù)可以在顯示設(shè)備911上顯示。
再次參看圖9,通過擴展電氣框圖進一步具體描述本發(fā)明的雙模式通信接收器的接收器操作。天線802截取發(fā)送的信息信號,該信號以FM調(diào)制格式調(diào)制,或者以線性調(diào)制格式(例如SSB)方式調(diào)制。天線802將該信息信號輸送到接收器部分902,尤其輸送到射頻(RF)放大器806的輸入端。該消息信息在任一合適的RF信道,例如在VH P波段和UHF波段上的信道上發(fā)送。RF放大器806放大所接收的信息信號,例如在930MHz尋呼信道頻率上按收的信號中的信息信號,將放大的信息信號輸送到第一混頻器808的輸入端。在本發(fā)明的優(yōu)選實施例中通過頻率合成器或本地振蕩器810產(chǎn)生的第一振蕩信號也輸送到第一混頻器808。第一混頻器808將放大的信息信號和第一振蕩器信號混頻以提供第一中頻,或IF,信號,例如45MHzIF信號,它被輸送到第一IF濾波器812的輸入端。應(yīng)當(dāng)理解也可以使用其它IF頻率,尤其在使用其它尋呼信道頻率時更是如此。IF濾波器812的輸出是一個在信道信息信號,它被輸送到第二轉(zhuǎn)換部分814的輸入端,下面將進一步具體描述第二轉(zhuǎn)換部分814。第二轉(zhuǎn)換部分814通過第二振蕩器信號將在信道信息信號混頻到較低的中頻,例如455KHz,第二振蕩器信號也由合成器810產(chǎn)生,第二轉(zhuǎn)換部分814放大結(jié)果中頻信號以提供適于輸送到FM解調(diào)器部分908或線性輸出部分824的第二IF信號。
接收器部分804以類似于傳統(tǒng)FM接收器的方式工作,但是不同于傳統(tǒng)FM接收器,本發(fā)明的接收器部分804還包括一個自動頻率控制部分816,它連接到第二轉(zhuǎn)換部分814,并且恰當(dāng)?shù)爻闃拥诙蘒F信號以提供一個頻率修正信號,后者輸送到頻率合成器810以維護調(diào)諧到指派信道的接收器。接收器調(diào)諧的維護對以線性調(diào)制格式傳送的QAM(即I和Q分量)和/或SSB信息的正確接收尤其重要。使用頻率合成器以產(chǎn)生第一和第二振蕩器頻率允許接收器在多個工作頻率上選擇操作,這些工作頻率例如通過代碼存儲器編程和/或通過電波接收到的,例如在FLEXTM協(xié)議中的參數(shù)選出。應(yīng)當(dāng)理解,也可以使用其它振蕩器電路,例如可以由來自自動頻率控制部分816的頻率修正信號調(diào)整的固定頻率振蕩器電路。
自動增益控制820也連接到本發(fā)明的雙模式接收器的第二轉(zhuǎn)換部分814。自動增益控制820估計第二IF信號的樣本的能量,并提供一個增益修正信號,后在被輸送到RF放大器806以維持RF放大器806的預(yù)定增益。該增益修正信號也輸送到第二轉(zhuǎn)換部分814以維持第二轉(zhuǎn)換部分814的預(yù)定增益。RF放大器806和第二轉(zhuǎn)換部分814的增益的維護是正確接收以線性調(diào)制格式傳送的高速數(shù)據(jù)信息,并進一步區(qū)分本發(fā)明的雙模式接收器和傳統(tǒng)FM接收器所必需的。
當(dāng)以FM調(diào)制格式傳送消息信息或控制數(shù)據(jù)時,第二IF信號輸送到FM解調(diào)器部分908,下面將更具體地予以解釋。FM解調(diào)器部分908以一種本領(lǐng)域技術(shù)人員眾所周知的方式解調(diào)第二IF信號以提供一個恢復(fù)的數(shù)據(jù)信號,后者是一個對應(yīng)于所接收的以FM調(diào)制格式傳送的地址和消息信息的二進制信息流?;謴?fù)的數(shù)據(jù)信號通過輸入/輸出端口或I/O端口828的輸入端輸送到微機906的輸入端,微機906充當(dāng)解碼器和控制器。微機906提供通信接收器900的完全操作控制,提供了諸如解碼,消息存儲和檢索,顯示控制以及通知等功能,這里僅列出了一些功能。設(shè)備906最好是單芯片微機,例如由Motorola生產(chǎn)的MC68HC05微機,并包括用于操作控制的CPU840。內(nèi)部總線830連接設(shè)備906的每一個操作元件。I/O端口828(在圖9中分解示出)提供了多個控制和數(shù)據(jù)線,提供從外部電路,例如電池節(jié)能器開關(guān)904,音頻處理器914,顯示器911和數(shù)字存儲868到設(shè)備906的通信。通過一個定時裝置,例如定時器834產(chǎn)生通信接收器的操作所需的定時信號,這些操作例如是電池節(jié)能器定時,通知定時和消息存儲和顯示定時。振蕩器832為CPU840的操作提供時鐘,并為定時器834提供參考時鐘。RAM838用于存儲在執(zhí)行控制通信接收器900的操作的不同固件例程時所用的信息,也可以用于存儲短消息,例如數(shù)字消息。ROM836包含用于控制設(shè)備906操作的固件例程,這些例程包括解碼所恢復(fù)的數(shù)據(jù)信號,電池節(jié)能器控制,數(shù)字存儲部分868中的消息存儲和檢索所需的例程,以及尋呼器操作和消息呈現(xiàn)的一般控制。通知產(chǎn)生器842響應(yīng)于解碼FM已調(diào)信令信息提供一個通知信號。代碼存儲器910(未示出)通過I/O端口828連接到微機906。代碼存儲器最好是一個EEPROM(電可擦除編程只讀存儲器),它存儲通信接收器900響應(yīng)的一個或多個預(yù)定地址。
當(dāng)接收到FM已調(diào)信令信息時,由設(shè)備906對其解碼,設(shè)備906以本領(lǐng)域技術(shù)人員眾所周知的方式充當(dāng)解碼器。當(dāng)恢復(fù)數(shù)據(jù)信號中的信息匹配任一存儲的預(yù)定地址,則解碼后續(xù)接收的信息以判定發(fā)向接收器的附加信息是以FM調(diào)制格式調(diào)制的,還是以線性調(diào)整格式調(diào)制。如果附加信息以FM調(diào)制格式發(fā)送,則在微機RAM838,或在數(shù)字存儲部分868中接收并存儲所恢復(fù)的消息信息,這將在后面進一步解釋,并生成一個通知信號發(fā)向通知產(chǎn)生器842。該通知信號被輸送到音頻處理電路914,后者驅(qū)動傳感器916,發(fā)出可聞通知。其它形式的可感通知,諸如觸覺或振動通知,也可以用于通知用戶。
如果待發(fā)送的附加信息是線性調(diào)制格式(諸如SSB或“I和Q”),微機906解碼指針信息。指針信息包括向接收器指示在發(fā)送附加信息的信道帶寬內(nèi)是何種邊帶組合(或何種I和Q分量組合)的信息。設(shè)備906維持以FM調(diào)制格式傳送的信息的監(jiān)控和解碼操作,直至當(dāng)前這批信息結(jié)束,在該時刻掛起對接收器的供電,直至指定的下一批,或者直至由指針識別的那批信息到達(dá),在這期間傳送高速數(shù)據(jù)。設(shè)備906通過I/O端口828產(chǎn)生一個電池節(jié)能控制信號,后者輸送到電池節(jié)能器開關(guān)904以掛起FM解調(diào)器908的供電,并向線性輸出部分824,線性解調(diào)器850、和數(shù)字存儲部分868供電,這將在下面描述。
現(xiàn)在攜帶SSB(或“I和Q”)信息的第二IF輸出信號被耦合到線性輸出部分824。線性輸出部分824的輸出耦合到正交檢波器850,尤其耦合到第三混頻器852的輸入端。第三本地振蕩器還連接到第三混頻器852,它最好在35-150KHz的頻率范圍內(nèi),盡管應(yīng)當(dāng)理解成也可以使用其它頻率。來自線性輸出部分824的信號與第三本地振蕩器信號854混頻,在第三混頻器852的輸出端產(chǎn)生一個第三IF信號,該信號被輸送到第三IF放大器856。第三IF放大器是一個低增益放大器,它在輸入信號中緩沖輸出信號。第三輸出信號被輸送到I信道混頻器858和Q信道混頻器860。I/Q振蕩器862提供第三IF頻率的正交振蕩器信號,后者在I信道混頻器858和Q信道混頻器860中與第三輸出信號混頻,以在混頻器輸出端提供基帶I信道信號和Q信道信號?;鶐信道信號被輸送給低通濾波器864,而基帶Q信號被輸送給低通濾波器866,以提供一對代表壓縮和壓擴語音信號的基帶音頻信號。
該音頻信號被輸送到數(shù)字存儲部分868,尤其輸送到模數(shù)轉(zhuǎn)換器870的輸入端,A/D轉(zhuǎn)換器870以864和866輸出的最高頻率分量的至少兩倍的速率抽樣該信號。抽樣速率最好是每I和Q信道6.4千赫茲。應(yīng)當(dāng)理解,所指出的數(shù)據(jù)抽樣速率僅是示例性的,根據(jù)所接收的音頻消息的帶寬,也可以使用其它抽樣速率。
在傳送高速數(shù)據(jù)的批量期間,微處理器906提供一個計數(shù)允許信號,后者被輸送到地址計數(shù)器872。也允許A/D轉(zhuǎn)換器870抽樣信息碼元對。A/D轉(zhuǎn)換器870產(chǎn)生用于當(dāng)?shù)刂酚嫈?shù)器872提供時鐘的高速樣本時鐘信號,而地址計數(shù)器872則相應(yīng)地產(chǎn)生地址,從而通過從轉(zhuǎn)換器870到RAM874的數(shù)據(jù)線將抽樣語音信號裝入雙端口隨機存取存儲器874。實時高速裝入雙端口RAM874語音信號,由微機906在接收完所有語音信號之后予以處理,因為不再需要微機906實時處理信息,所以所消耗的能量大大減少。微機906通過數(shù)據(jù)線和地址線存取所存儲的信號,在本發(fā)明的優(yōu)選實施例中,它處理信息碼元對,在傳送字母數(shù)字?jǐn)?shù)據(jù)的情況下產(chǎn)生ASCII編碼信息,而在傳送語音的情況下產(chǎn)生數(shù)字抽樣數(shù)據(jù)。數(shù)字語音樣本根據(jù)需要可以存儲成其它格式,例如基于BCD,CVSD,或者2PC的形式和其它類型,在時間壓縮語音信號的情況下,ADC轉(zhuǎn)換器870抽樣的I和Q分量由CPU840通過雙端口874和I/Q828進一步處理,以(1)振幅擴展該音頻信號和(2)時間擴展該信號,如同在圖7和8的接收器的類似操作中所描述的那樣。該語音然后被再次存儲在RAM874中。在雙端口RAM中存儲該ASCII編碼或語音數(shù)據(jù),直至通信接收器用戶要求呈現(xiàn)該信息。用戶通過開關(guān)(未示出)選擇和讀取所存儲的消息,從而恢復(fù)了所存儲的ASCII編碼數(shù)據(jù)。當(dāng)需要讀出所存儲的ASCII編碼消息時,用戶選擇要讀出的消息并開啟讀開關(guān),從而允許微機906恢復(fù)數(shù)據(jù)并在顯示器911,例如一個液晶顯示器上呈現(xiàn)所恢復(fù)的數(shù)據(jù)。如果需要讀出一個語音消息,用戶選擇要讀出的消息并開啟讀開關(guān),從而允許微機906恢復(fù)來自雙端口RAM的數(shù)據(jù),并將所恢復(fù)的數(shù)據(jù)提供給音頻處理器914,后者將數(shù)據(jù)語音信息轉(zhuǎn)換成模擬語音信號,提供給揚聲器916以向用戶播放該語音消息。如前所述,微機906也可以產(chǎn)生一個頻率選擇信號,將該信號輸送到頻率合成器810以允許不同頻率的選擇。
參看圖10,示出了根據(jù)本發(fā)明的優(yōu)選實施例的時序圖,該圖說明了圖1的無線通信系統(tǒng)100所采用的外出信令的FLEXTM編碼格式的特征,并包括了控制幅330的細(xì)節(jié)??刂茙脖粴w到數(shù)字幀一類。信令協(xié)議被進一步劃分成協(xié)議劃分,后者是一個小時310,一個周期320,幀330,430,一個塊340,和一個字350,在每一小時310中傳送多達(dá)15個4分鐘唯一標(biāo)識周期。正常情況下,每一小時傳送全部15個周期320。在每一周期320中傳送多達(dá)128個1.875秒唯一標(biāo)識幀,包括數(shù)字幀330和模擬幀430。正常情況下,傳送全部128個幀。在每一個控制幀330中傳送持續(xù)115毫秒的一個同步和幀信息信號331和11個160毫秒唯一標(biāo)識塊340。在每一控制幀330期間最好使用每秒3200比特(bps)或6400bps的比特率。在同步信號331期間,將每一控制幀330的比特率通知給選擇呼叫無線設(shè)備106。如果比特率是3200bps,如圖10所示,每一塊340中包括16個唯一標(biāo)識32比特字。如果比特率是6400bps,在每一塊340中包括32個唯一標(biāo)識32比特字(未示出)。在每一字中,至少11個比特用于差錯檢測和糾正,而21個比特或更少的比特用于信息,其方式是本領(lǐng)域一般技術(shù)人員所熟知的。每一塊340中的比特和字350以一種交織方式進行傳送以改善協(xié)議的糾錯性能,該交織方式使用本領(lǐng)域一般技術(shù)人員所熟知的技術(shù)。
信息包含在每一控制幀330的信息域中,包括塊信息域(BI)332中的幀結(jié)構(gòu)信息,地址域(AF)333中的一個或多個選擇呼叫地址,和矢量域(VF)334中的一個或多個矢量。矢量域334從矢量邊界334開始。矢量域334中的每一個矢量對應(yīng)地址域333中的一個地址。信息域332,333,334的邊界由塊信息域332定義。根據(jù)下述因子,信息域332,333,334是可變的,即諸如在同步和幀信息域331中包含的系統(tǒng)信息類型,在地址域333中包含的地址數(shù)量,和在矢量域334中包含的矢量的數(shù)量和類型。
參看圖11,根據(jù)本發(fā)明的優(yōu)選實施例示出了一個時序圖,它說明了圖1的無線通信系統(tǒng)所采用的外出信令協(xié)議的傳輸格式的特征,并包括語音幀430的細(xì)節(jié)。此處將語音幀歸到模擬幀一類。協(xié)議劃分的持續(xù)時間小時310,周期320和幀330,430與圖10中的控制幀所描述的相同。每一模擬幀430帶有一個信頭部分435和一個模擬部分440。同步和幀信息信號331中的信息與控制幀330中的同步信號331相同。如上所述,信頭部分435是調(diào)頻的,而幀430的模擬部分440是調(diào)幅的。根據(jù)本發(fā)明的優(yōu)選實施例,信頭部分435和模擬部分440之間存在著一個過渡部分444,該過渡部分包括多達(dá)3個子信道441,442,443的子調(diào)幅導(dǎo)頻。模擬部分440說明了同時傳送的3個子信道441,442,443,每一子信道包括一個上邊帶信號401和一個下邊帶信號402(或者可選的,一個同相和一個正交信號)。在圖11給出的例子中,上邊帶信號401包括一個消息片段415,它是第一模擬消息的第一片段。在下邊帶402中包括4個質(zhì)量評價信號420,422,424,426,4個消息片段410,412,416,418,和一個片段414(在本例中未使用)。410,412這兩段是第一模擬消息的第二片段的段。416,418這兩段是第二模擬消息的第一片段的段。第一和第二模擬消息是壓縮語音消息,它們已被分成片段以包含在320的周期2的幀1430的第一子信道441中。將第一消息的第二片段和第二消息的第一片段每一個都進行分解以包括質(zhì)量評價信號420,426,后者在3個子信道441,442,443的每一個的下邊帶402中的預(yù)定位置重復(fù)。模擬幀中包括的消息的最小段定義成語音增量450,在一個模擬幀430的每一模擬部分440中唯一標(biāo)識了88個語音增量。質(zhì)量評價信號最好作為未調(diào)子載波導(dǎo)頻信號傳送,時長最好是一個語音增量,并且最好在一個幀的模擬部分內(nèi)相隔不超過420毫秒。應(yīng)當(dāng)理解,在兩個質(zhì)量評價信號之間可以存在多于一個消息片段,并且這些消息片段一般是變化的整數(shù)長度的語音增量。
參看圖12,根據(jù)本發(fā)明的優(yōu)選實施例示出了一個時序圖,說明了圖1的無線通信系統(tǒng)所采用的外出信令協(xié)議的一個控制幀330和兩個模擬幀。圖12示出了幀0(圖10)作為控制幀330的例子。示出了4個地址510,511,512,513和4個矢量520,521,522,523。這兩個地址510,511包括一個選擇呼叫無線設(shè)備106的地址,而其它兩個地址512,513用于第二和第三選擇呼叫無線設(shè)備106。每一地址510,511,512,513通過下述方式與一個矢量520,521,522和523唯一相關(guān),即在每一地址內(nèi)包含一個指針,該指針指示相關(guān)矢量的協(xié)議位置(即,矢量從何處開始且有多長)。
在圖12示出的例子中,矢量520,521,522,523還與一個子信道中的消息部分唯一相關(guān)。特別地,矢量520可以指向子信道441(參見圖11)的上邊帶,而矢量522可以指向子信道441和下邊帶。類似地,矢量521可以指向子信道442的兩個邊帶。也就是說,在子信道441的情況下,本例可以示出上邊帶和下邊帶攜帶兩個不同的消息部分。在子信道442的情況下,由上邊帶和下邊帶分別攜帶一個消息部分的兩半。這樣,矢量最好包含有指示接收器應(yīng)當(dāng)查找哪一個子信道(即哪一個射頻)以發(fā)現(xiàn)消息的信息,以及指示是從該子信道恢復(fù)兩個單獨的消息,還是恢復(fù)單個消息的前半部分和后半部分的信息。
分別在上邊帶和下邊帶(或I和Q信道)上同時傳送兩個不同消息的實施例的一種用途在于以下情況,即一個消息是直接語音尋呼消息,而另一個消息是需要在尋呼器中存儲的一個語音信箱消息。
根據(jù)本發(fā)明的優(yōu)選實施例,通過識別在矢量開始的矢量邊界335之后的字350的數(shù)量,及以字為單位的矢量的長度來提供矢量位置。應(yīng)當(dāng)理解,地址和矢量的相對位置是彼此獨立的。其關(guān)系由箭頭示出。每一矢量520,521,522,523通過下述方式與一個消息片段550,551,552,553唯一相關(guān),即在每一矢量內(nèi)包含一個指針,該指針指示相關(guān)矢量的協(xié)議位置(即,該片段從何處開始且有多長)。根據(jù)本發(fā)明的優(yōu)選實施例,該消息片段位置通過下述方式提供,即在消息片段開始處識別幀430的序號(從1到127),子信道441,442,443的序號(從1到3),邊帶401,402(或I或Q)和語音增量450,以及以語音增量450形式給出的消息片段的長度。例如,矢量3522包括指示消息2,片段1522的位置從幀1560的語音增量46450(圖12中未標(biāo)明語音增量450)開始的信息,消息2,片段1552用于具有選擇呼叫地址512的選擇呼叫收發(fā)信機106,而矢量13523包括指示消息9片段1553的位置從幀5561的語音增量0450(圖12中未示出語音增量450)開始的信息、消息9片段1553則用于具有選擇呼叫地址573的選擇呼叫收發(fā)信機106。
應(yīng)當(dāng)理解,雖然根據(jù)本發(fā)明的優(yōu)選實施例描述了語音信號,但是本發(fā)明也可以采納其它模擬信號,例如調(diào)制解調(diào)信號或雙音多頻(DTMF)信號。還應(yīng)當(dāng)理解,在前述幀結(jié)構(gòu)中所采用的塊信息可以用于實現(xiàn)進一步的改進以允許通信系統(tǒng)更大的總吐量和附加特征。例如,向便攜式語音單元發(fā)送的消息可以要求回送給系統(tǒng)的確認(rèn)信號包括標(biāo)識下述發(fā)送器的信息,即它正從該發(fā)送器接收消息。這樣,通過下述方式可以實現(xiàn)聯(lián)播系統(tǒng)中的頻率重用,即通過接通便攜式語音單元所需的一個發(fā)送器向指定的便攜式語音單元發(fā)送消息。此外,一旦系統(tǒng)得知該便攜式語音單元的位置,邏輯上緊接著實現(xiàn)目標(biāo)消息傳遞。
在本發(fā)明的另一方面,前面描述為WSOLA的時標(biāo)技術(shù)在與本發(fā)明一起使用時存在一些不足。因此,開發(fā)了一種改進WSOLA以使其獨立于揚聲器的技術(shù),并將之恰當(dāng)?shù)孛麨椤癢SOLA-SD”。為了進一步理解我們對WSOLA的改進以生成WSOLA-SD,下面給出WSOLA的簡要描述。
與其它技術(shù)相比,一種稱為基于重波形相似性的疊相加技術(shù)(WSOLA)能夠?qū)崿F(xiàn)高質(zhì)量時標(biāo)改進,并且也比其它方法簡單得多。當(dāng)用于加速或放慢話音時,即使使用WSOLA技術(shù)也無法得到質(zhì)量非常好的話音。重構(gòu)的話音包含許多人工產(chǎn)物,例如背景中的回聲,金屬聲和混響。本發(fā)明的這一方面描述了幾種改進以克服該問題并最小化出現(xiàn)的人工產(chǎn)物。必須優(yōu)化WSOLA算法中的許多參數(shù)以達(dá)到給定揚聲器的最佳可能質(zhì)量和所需的壓縮/擴展或時標(biāo)因子。本發(fā)明的這一方面處理這些參數(shù)的確定以及如何將它們并入話音信號的壓縮/擴展或時標(biāo)過程中,從而改善所恢復(fù)的話音或語音信號的質(zhì)量。
WSOLA算法設(shè)x(n)是待改進的輸入話音信號、y(n)是時標(biāo)改進信號,α是時標(biāo)參數(shù)。如果α小于1,則及時擴展該話音信號。如果α大于1,則及時壓縮該話音信號。
參看圖13-17,示出了WSOLA時標(biāo)(壓縮)方法的幾個迭代的時序圖,以比較本發(fā)明的WSOLA-SD的優(yōu)選方法。假定對輸入話音信號進行適當(dāng)?shù)臄?shù)字化并予以存儲,圖13說明了未壓縮話音輸入信號上的WSOLA方法的第一迭代。WSOLA方法需要一個時標(biāo)因子α(本例中我們假定等于2,其中如果α>1,我們需要壓縮,而如果α<1,我們需要擴展)和一個任意的分析段大小(Ss),它獨立于輸入話音特征,尤其獨立于音調(diào)。在WSOLA中重疊段大小So由0.5*Ss計算出,并且是固定的。如圖14所示,每一Ss樣本直接復(fù)制到輸出。設(shè)輸出的上一個樣本的標(biāo)號是1f1。可以以輸出的上一個可用樣本的結(jié)束起Ss/2個樣本來確定一個重疊標(biāo)號O1?,F(xiàn)在需重疊相加的樣本介于O1和1f1之間。查找標(biāo)號(S1)中α*O1確定。在將輸入信號的初始部分復(fù)制到輸出之后、確定在輸入中樣本的移動窗口。該窗口在查找標(biāo)號S1附近確定。設(shè)窗口開始于Si-Loffset,結(jié)束于Si+Hoffset。在第一迭代中,i=1。在該窗口內(nèi),通過下面給定的歸一化互相關(guān)方程確定最佳相關(guān)S0樣本
判定偏移k=m,則歸一化R(k)最大。最佳標(biāo)號Bi由Si+m給出。注意到也可以使用其它方案,例如平均振幅差函數(shù)(AMDF)和其它相關(guān)函數(shù)以發(fā)現(xiàn)最佳匹配波形。開始于B1的S0樣本乘上一個遞增的斜坡函數(shù)(盡管也可以使用其它加權(quán)函數(shù)),并加入到輸出中的上一個S0樣本中。在相加之前,輸出的S0樣本乘上一個遞減的斜坡函數(shù)(盡管這兒也可以使用其它加權(quán)函數(shù))。相加后的結(jié)果樣本將置換輸入的上一個S0樣本。最后,緊隨著前一個最佳匹配S0樣本的下一個S0樣本隨后復(fù)制到輸出的結(jié)尾以供下一次迭代使用。這就結(jié)束了WSOLA的第一迭代。
參看圖15和16的下一次迭代,我們需要計算一個新的重疊標(biāo)號O2,它類似于O1。同樣地,與前一迭代相同,確定一個新的查找標(biāo)號S2和對應(yīng)的查找窗口。在查找窗口中,再次通過前述互相關(guān)方程確定最佳相關(guān)S0樣本,其中確定最佳樣本的開端是B2。開始于B2的S0樣本隨后乘上一個遞增的斜坡函數(shù)并加入到輸出的上一個S0樣本。在相加之前,輸出的S0樣本乘上一個遞減的斜坡函數(shù)。相加后的結(jié)果樣本置換輸入的上一個S0樣本。最后,緊隨前一個最佳匹配S0樣本的下一個S0樣本隨后復(fù)制到輸出的結(jié)尾,以供下一次迭代使用,其中將來的第i次迭代將具有一個重疊標(biāo)號Oi,一個查找標(biāo)號Si,輸出的上一個樣本Ifi,和最佳標(biāo)號Bi。
圖17示出了參照圖13-16描述的前兩次迭代的結(jié)果輸出。應(yīng)當(dāng)注意到在這兩次迭代間的結(jié)果輸出信號上沒有重疊。如果該方法以類似方式繼續(xù),WSOLA方法將時標(biāo)(壓縮)整個話音信號,但是在每一迭代的結(jié)果之間不會出現(xiàn)任何重疊。WSOLA時標(biāo)擴展以類似方式進行。
與本發(fā)明的優(yōu)選方法(WSOLA-SD)相比,VSOLA的幾個缺陷或不足是明顯的。當(dāng)你理解圖18-23所示的WSOLA-SD方法的下面的例子時,必須記住這些缺陷。WSOLA的一個主要缺陷在于,因為不管音調(diào)特征如何,對所有輸入話音都使用一個固定的分析段大小(Ss),所以不能得到時標(biāo)話音的優(yōu)化質(zhì)量。例如,如果Ss對輸入話音信號而言太大了,擴展的結(jié)果話音將包括回聲和混響。進一步,如果Ss對輸入話音信號而言太小了,則擴展的結(jié)果話音聽起來會刺耳。
當(dāng)壓縮率(α)大于2時,WSOLA將導(dǎo)致第二嚴(yán)重缺陷,在該情況下,迭代間的移動窗口的劃分可能引起該方法跳過有效輸入話音分量,從而嚴(yán)重影響了結(jié)果輸出話音的可理解性。因為互相關(guān)函數(shù)的作用,在迭代期間增加移動窗口的大小以彌補非重疊查找窗口會進一步引起跳過一些輸入話音,并進一步引起變化的時標(biāo),這將明顯影響結(jié)果輸出話音。
WSOLA方法的第三缺陷涉及其無法提供給設(shè)計者或用戶話音質(zhì)量的靈活性(對某一給定的時標(biāo)因子(α)而言)和具有給定限制的給定系統(tǒng)的計算的復(fù)雜性。因為在WSOLA方法中重疊程度(f)固定在0.5,所以這尤其明顯。這樣,在需要高質(zhì)量話音再現(xiàn)的應(yīng)用中,假定處理功率和存儲器足夠,本發(fā)明的WSOLA-SD方法可以以增加計算復(fù)雜性為代價使用更高程度的重疊,以提供更高質(zhì)量的話音再現(xiàn)。另一方面,在受限于處理功率,存儲器或其它限制的應(yīng)用中,在WSOLA-SD中可以降低重疊程度,從而在考慮這些特定應(yīng)用限制時,僅犧牲話音質(zhì)量到所需程度。
圖25說明了WSOLA-SD方法的總框圖。在該框圖中,根據(jù)我們正在壓縮還是擴展話音,計算Ss,f和α。WSOLA-SD算法比單獨的WSOLA在重構(gòu)話音質(zhì)量上有了很大改進。WSOLA-SD方法是獨立于揚聲器的,尤其獨立于特盡揚聲器的音調(diào)。因此在確定(14)分析段大小之前已進行了音調(diào)確定12。對給定的f和α而言(可以根據(jù)音調(diào)確定12對其進行改進、提供一個改進的α(16)),WSOLA-SD時標(biāo)(18)該話音。該次時標(biāo)可以是輸入信號的擴展或壓縮??蛇x地,可以通過下述方式得到頻標(biāo)信號,即如果α>1,以因子α內(nèi)插該時標(biāo)信號,或者如果α<1,以因子1/α抽取該時標(biāo)信號。如同在Oppenheim和Schaefer的DiscreteTime Signal Processing中所描述的,內(nèi)插和抽取是眾所周知的數(shù)字信號處理技術(shù)。例如,假定2秒的輸入話音以8KHz進行抽樣,其中信號具有0到4000Hz間的有效頻率分量。假定輸入話音信號以因子2進行時標(biāo)壓縮。結(jié)果信號長度將為1秒,但仍具有0到4000赫茲間的有效頻率分量。該信號以因子α=2進行內(nèi)插(見Oppenheim和Schaefer)。這將導(dǎo)致一個2秒長的信號,但是其頻率分量在0到2000赫茲之間。通過以α=2的因子抽取該頻率壓縮信號,從而返回到時標(biāo)域以得到原始時標(biāo)話音(頻率分量在0-4000赫茲之間)而不損失任何信息內(nèi)容。
參看圖18-22,根據(jù)本發(fā)明示出了WSOLA-SD時標(biāo)(壓縮)方法的幾個迭代的時序圖。假定輸入話音信號經(jīng)過適當(dāng)?shù)臄?shù)字化并予以存儲,圖18說明了WSOLA-SD方法在未壓縮語音輸入信號上的第一迭代。WSOLA-SD方法還需要確定輸入話音信號的發(fā)聲部分的大致音調(diào)周期。下面給出音調(diào)確定和如何從中得到段大小的簡要描述。
1)幀輸入話音進入20ms塊。
2)在每一塊中計算能量。
3)計算每塊的平均能量。
4)確定能量閾值,以每塊平均能量的函數(shù)的形式檢測發(fā)聲話音。
5)通過能量閾值確定至少5塊長的發(fā)聲話音的連續(xù)塊。
6)在步驟5發(fā)現(xiàn)的每一塊連續(xù)語音話音上進行音調(diào)分析。這可以通過多種方法,包括改進的自相關(guān)方法,AMOF或限幅自相關(guān)方法來實現(xiàn)。
7)通過中值濾波器平滑音調(diào)值以在估計中消去差錯。
8)求所有平滑后的音調(diào)值的均值以得到揚聲器音調(diào)的大致估計。
9)因此,下面給出段大小Ss的計算。
如果音調(diào)P大于60個樣本Ss=2*Pitch如果音調(diào)P在40到60個樣本之間Ss=120如果P小于40個樣本Ss=100假定在上述所有例子中抽樣率為8Khz。
使WSOLA-SD具有克服前面在WSOLA描述中所提到的一些缺陷的優(yōu)點的重要因素是重疊程度f。如果在WSOLA-SD中的重疊程度f大于0.5,那么它以更大的復(fù)雜性為代價提供了更高的質(zhì)量。如果WSOLASD的重疊程度小于0.5,那么它以質(zhì)量為代價減少了算法的復(fù)雜性。因此,用戶在設(shè)計和使用他們特定的應(yīng)用時具有更多的靈活性和控制。
再次參看圖18-23,WSOLA-SD方法需要一個時標(biāo)因子α(本例中我們假定它等于α,其中如果α>1我們需要壓縮,而如果α<1,我們需要擴展),以及一個分析段大小(Ss),后者被優(yōu)化到輸入話音特征,即揚聲器的音調(diào)。以f*Ss計算重疊段大小S0,在WSOLA-SD中給定音調(diào)周期和f的情況下它是固定的。在示出的例子中,f大于0.5,以示出較高質(zhì)量的結(jié)果輸出話音。第一Ss樣本直接復(fù)制到輸出。設(shè)上一樣本的標(biāo)號是If1。以從輸出的上一個可用樣本的結(jié)尾開始S0個樣本來確定重疊標(biāo)號O1?,F(xiàn)在如圖19中所示,將重疊相加的樣本在O1和If1之間。在圖18中可以看出,以α*O1確定第一查找標(biāo)號(S1)。在將輸入信號的初始部分復(fù)制到輸出之后、制定輸入話音信號的樣本的移動窗口的位置。該窗口在查找標(biāo)號S1附近確定。在該窗口內(nèi),通過前述互相關(guān)方程確定最佳相關(guān)S0樣本。其中確定的最佳樣本的開端是B1。開始于B1的S0樣本隨后來上一個遞增加斜坡函數(shù)(盡管可以使用其它加權(quán)函數(shù)),并加入到輸出的上一個S0樣本中。在相加之前,輸出的S0樣本乘上一個遞減的斜坡函數(shù)。相加后的結(jié)果樣本將置換輸入中的上一個S0樣本。最后,緊接著前一個最佳匹配S0樣本的下一個Ss-S0樣本被復(fù)制到輸出的結(jié)尾,以供下一次迭代使用。這就結(jié)束了WSOLA-SD的第一迭代。
參看圖20和21的下一次迭代,我們需要計算一個新的重疊標(biāo)號O2,類似于O1。同樣,如同在前一次迭代中一樣確定一個新的查找標(biāo)號S2和對應(yīng)的查找窗口。在查找窗口中,再次通過前述互相關(guān)方程確定最佳相關(guān)S0樣本,其中確定的最佳樣本開始于B2。開始于B2的S0樣本隨后乘上一個遞增的斜坡函數(shù)并加入到輸出的上一個S0樣本中。在相加之前,輸出的S0樣本乘上一個遞減的斜坡函數(shù)。相加后的結(jié)果樣本將置換輸入的上一個S0樣本。最后,緊隨前一個最佳匹配S0樣本的下一個Ss-S0樣本將被復(fù)制到輸出的結(jié)尾以供下次迭代使用。
圖22示出了使用WSOLA-SD方法的兩次迭代的結(jié)果輸出信號,注意到在結(jié)果輸出信號中有一個重疊區(qū)域(Ss-S0),它確保了可理解性的增強,并且與WSOLA方法相比,防止該方法跳過重要的輸入話音分量。
參看圖23和24,根據(jù)本發(fā)明示出了使用WSOLA-SD方法進行時標(biāo)擴展的第i次迭代的例子的輸入時序圖和輸出時序圖。擴展方法的操作實質(zhì)上類似于圖18-22示出的例子。但是重疊標(biāo)號Oi比查找標(biāo)號Si移動得更快。更確切地說,在擴展期間Oi比Si移動得快2倍。分析段大小Ss獨立于輸入話音的音調(diào)周期。重疊程度可以從0到1,但在圖23和24的例子中使用0.7。在該例中,時標(biāo)因子α是擴展率的倒數(shù)。假定擴展率是2,則時標(biāo)因子α=25。重疊段大小S0等于f*Ss或者重疊程度乘上分析段大小。因此,在幾個迭代重疊相加,每一個最佳匹配輸入段上使用一個遞增的斜坡函數(shù),而在每一個輸出重疊段上使用一個遞減的斜坡函數(shù)之后,在相加之前,輸入話音信號將擴展成保留前述WSOLA-SD所有優(yōu)點的輸出話音信號。
通過根據(jù)段的音調(diào)動態(tài)調(diào)整該時刻WSOLA-SD算法中的段大小Ss,可以得到進一步的改善。這通過改進前述方案來實現(xiàn)。如果我們使用短的段大小Ss=100(假定抽樣率為8Khz)用于不發(fā)聲話音聲,那么它們的質(zhì)量將得到改進,對發(fā)聲話音而言,段大小將是Ss=2×Pith。還需要作一些改變以判定該話音段是發(fā)聲的還是不發(fā)聲的。下面描述作了這些改變的方法。
1)幀輸入語音到20ms塊中。
2)在每一塊中計算能量。
3)在每一塊中計算零交點的數(shù)目。
4)計算平均每塊能量。
5)通過該能量閾值和零交點閾值確定至少5塊長的發(fā)聲話音連續(xù)塊。
6)在所有發(fā)聲段上進行語調(diào)分析,確定那些發(fā)聲段的每一個的平均音調(diào)。這可以通過多種方法,包括改進的自相關(guān)方法,AMDF或限幅自相關(guān)方法來實現(xiàn)。
7)未標(biāo)成發(fā)聲話音的段現(xiàn)在被標(biāo)成暫時不發(fā)聲段。
8)取出暫時不發(fā)聲段中至少5個幀的連續(xù)塊進行音調(diào)分析。確定最大和最小相關(guān)系數(shù)的比值。如果比值較大,那么該段被歸成不發(fā)聲一類,而如果比值較小,那么這些段被標(biāo)記成發(fā)聲,并確定那些段的平均音調(diào),以及話音段的開端和結(jié)束。
9)這些歸類的話音段中每一個段大小Ss如下確定。
如果發(fā)聲Ss=2*Pitch如果不發(fā)聲Ss=100(抽樣率假定為8Khz)10)現(xiàn)在完成了WSOLA-SD方法的時標(biāo),但其段大小是變化的。在這里確定每一時刻的處理中所用的輸入話音段的位置。根據(jù)它的位置,在處理中使用已確定的段大小Ss。使用該技術(shù)可以提供較高質(zhì)量的時標(biāo)話音信號。
如果象在我們的通信系統(tǒng)中那樣,對同一個話音輸入信號使用WSOLA-SD進行壓縮,而后用它進行擴展,那么通過幾種技術(shù)在給定的平均時標(biāo)因子的情況下可以進一步改進重構(gòu)話音信號的質(zhì)量。
在感覺測試中可以看出,與具有較低基頻(較高音調(diào)周期)的話音信號相比,在給定的話音質(zhì)量,只有較高基頻(較低音調(diào)周期)的話音信號可以壓縮得更多。例如,孩子和女性說話者一般具有較高基頻。因此,他們的話音可以多壓縮/擴展10%,而不會明顯影響他們的話音質(zhì)量。而男性說話者的話音一般具有較低基頻,他們的話音可以少壓縮/擴展10%。這樣,在具有較高和較低基頻的說話者的數(shù)量大致相等的一般通信系統(tǒng)中,在與前面的壓縮/擴展(時標(biāo))因子相同的情況,可以得到總體改善的再現(xiàn)話音質(zhì)量。
使用本技術(shù)的擴展和壓縮的另一個特征可以帶來進一步改進。例如,注意到話音中的大多數(shù)人工產(chǎn)物是在話音信號的時標(biāo)擴展過程中產(chǎn)生的。話音信號擴展得越多,人工產(chǎn)物就越多。還可以觀察到,如果話音信號回放得比原始話音稍快一些(少于10%),速度上的改變很難察覺,但都可以顯著減少人工產(chǎn)物。這種特性有助于以較小的擴展因子擴展話音信號,因而減少人工產(chǎn)物并改進它的質(zhì)量。例如,如果以時標(biāo)因子3壓縮輸入話音,然后在擴展期間以因子2.7對其進行擴展,這意味著話音將播放得快10%。因為這種話音速率的改變將不被察覺而減少了人工產(chǎn)物,因此在話音的精度不是絕對重要的應(yīng)用中,本發(fā)明的方法中將實現(xiàn)這種改變。
權(quán)利要求
1.在語音通信系統(tǒng)中具有給定帶寬的語音通信資源內(nèi)的一種壓縮多個語音信號的方法,包括如下步驟a)將該語音通信資源子信道化,在每一個子信道上同時放置多個語音信號中的至少一個;以及b)在每一個子信道內(nèi)壓縮每一個語音信號的時間,其中步驟(a)和(b)的結(jié)果提供了一個壓縮語音信號。
2.根據(jù)權(quán)利要求1的方法,其中子信道化的步驟進一步包括通過單邊帶調(diào)制在一個子信道上放置多個語音信號中的信號對的步驟。
3.根據(jù)權(quán)利要求1的方法,其中子信道化的步驟進一步包括下述步驟,即在語音通信資源的每一個子信道內(nèi)多個導(dǎo)頻信號附近調(diào)制多個語音信號的每一個。
4.根據(jù)權(quán)利要求1的方法,其中子信道化的步驟進一步包括使用正交振幅調(diào)制的步驟。
5.根據(jù)權(quán)利要求1的方法,其中壓縮每一個語音信號的時間的步驟進一步包括對語音信號使用時標(biāo)壓縮的步驟。
6.根據(jù)權(quán)利要求1的方法,其中壓縮每一個語音信號的時間的步驟進一步包括對語音信號使用基于波形相似性的重疊相加(WSOLA)的時間壓縮的步驟。
7.根據(jù)權(quán)利要求1的方法,其中壓縮每一個語音信號的時間的步驟進一步包括下述獨立于揚聲器的步驟,即在每一個語音信號中識別音調(diào)周期,并在一個音調(diào)周期中發(fā)送數(shù)據(jù)以改變時標(biāo)因子。
8.根據(jù)權(quán)利要求1的方法,其中壓縮每一個語音信號的時間的步驟包括下述步驟,即對語音信號使用一種改進的基于波形相似性的重疊相加(WSOLA)的依賴揚聲器的時間壓縮技術(shù)。
9.一種在語音通信系統(tǒng)內(nèi)語音通信資源中壓縮多個語音信號的方法,包括以下步驟a)在語音通信資源中通過子信道化語音通信資源和在多個導(dǎo)頻信號附近調(diào)制多個語音信號的每一個來壓縮多個語音信號的帶寬。b)壓縮語音信號的時間,其中步驟(a)和(b)的結(jié)果提供了一個壓縮語音信號,通過發(fā)送器進行傳輸。
10.根據(jù)權(quán)利要求9的方法,其中該方法進一步包括在發(fā)送器中向多個選擇呼叫接收器發(fā)送壓縮語音信號的步驟。
11.根據(jù)權(quán)利要求9的方法,其中該方法進一步包括在多個選擇呼叫接收器中的一個中接收壓縮語音信號并解調(diào)壓縮帶寬信號的步驟。
12.一種使用語音壓縮的通信系統(tǒng),具有至少一個發(fā)送基站和多個選擇呼叫接收器,包括在發(fā)送基站中一個接收音頻信號的輸入設(shè)備;一個處理設(shè)備,通過時標(biāo)壓縮和單邊帶調(diào)制技術(shù)壓縮音頻信號以提供處理信號,以及一個發(fā)送處理信號的處理器;在多個選擇呼叫接收器的每一個中一個接收所發(fā)送的處理信號的選擇呼叫接收器;一個處理設(shè)備,通過單邊帶解調(diào)和時標(biāo)擴展解調(diào)所接收的處理信號以提供一個重構(gòu)信號;以及一個將重構(gòu)信號放大成重構(gòu)音頻信號的放大器。
13.根據(jù)權(quán)利要求12的通信系統(tǒng),其中單邊帶調(diào)制技術(shù)提供了單個消息分割在上邊帶和下邊帶上進行的傳輸。
14.根據(jù)權(quán)利要求12的通信系統(tǒng),其中單邊帶調(diào)制技術(shù)提供了單個消息在上邊帶和下邊帶上重復(fù)的傳輸。
15.根據(jù)權(quán)利要求12的通信系統(tǒng),其中系統(tǒng)進一步包括在發(fā)送器中導(dǎo)頻信號產(chǎn)生器,作為信道失常所導(dǎo)致的失真的振幅和相位參考;在接收器中一個接收器電路,進行檢測,濾波,并響應(yīng)于導(dǎo)頻信號產(chǎn)生器所產(chǎn)生的振幅和相位參考。
16.一種接收壓縮語音信號的選擇呼叫接收器,包括一個接收所發(fā)送的處理信號的選擇呼叫接收器,所發(fā)送的處理信號包括通過時標(biāo)壓縮已進行壓縮的壓縮語音信號;一個處理設(shè)備,通過單邊帶解調(diào)和時標(biāo)擴展解調(diào)所接收的處理信號以提供一個重構(gòu)信號;以及一個將重構(gòu)信號放大成重構(gòu)音頻信號的放大器。
17.根據(jù)權(quán)利要求16的選擇呼叫接收器,其中選擇呼叫接收器進一步包括一個接收器電路,進行檢測,濾波并響應(yīng)于基站的發(fā)送器中導(dǎo)頻信號產(chǎn)生器所產(chǎn)生的振幅和相位參考。
18.一種選擇呼叫尋呼基站,用于在具有預(yù)定帶寬的通信資源上發(fā)送選擇呼叫信號,包括一個接收多個音頻信號的輸入設(shè)備;一個將通信資源子信道化成預(yù)定數(shù)量的子信道的裝置;每個子信道的一個振幅壓縮和濾波模塊,用于壓縮各自的音頻信號的振幅,濾波各自的音頻信號;一個時間壓縮模塊,在每個子信道中壓縮各自的音頻信號的時間;以及一個發(fā)送處理信號的正交振幅調(diào)制發(fā)送器。
19.根據(jù)權(quán)利要求18的選擇呼叫尋呼基站,其中接收多個音頻信號的輸入設(shè)備包括一個尋呼終端,用于從一個計算設(shè)備接收電話消息或數(shù)據(jù)消息。
20.根據(jù)權(quán)利要求18的選擇呼叫尋呼基站,其中振幅壓縮和濾波模塊包括一個抗混淆濾波器,連接到一個模數(shù)轉(zhuǎn)換器,后者連接到一個帶通濾波器,帶通濾波器連接到一個自動增益控制器和限幅電路。
21.根據(jù)權(quán)利要求18的選擇呼叫尋呼基站,其中時間壓縮模塊包括一個處理設(shè)備,通過時標(biāo)壓縮技術(shù)壓縮音頻信號。
22.根據(jù)權(quán)利要求18的選擇呼叫尋呼基站,其中時間壓縮模塊包括一個處理設(shè)備,通過WSOLA時間壓縮技術(shù)壓縮音頻信號。
23.一種接收壓縮語音選擇呼叫信號的選擇呼叫接收器單元,包括一個帶有模數(shù)轉(zhuǎn)換器以提供數(shù)字化的接收信號的接收器;一個數(shù)字信號處理器,用于執(zhí)行單邊帶解調(diào)和至少一個下述功能。濾波導(dǎo)頻,通過前饋環(huán)路執(zhí)行自動增益控制,或解去壓擴數(shù)字化的接收信號以提供一個處理信號;以及一個數(shù)模轉(zhuǎn)換器和重構(gòu)濾波器,將處理信號轉(zhuǎn)換成數(shù)字化的音頻信號;以及一個放大數(shù)字化音頻信號的放大器。
24.一種通信基站,包括一個接收音頻話音信號的終端;一個將音頻話音信號轉(zhuǎn)換成數(shù)字化話音信號的模數(shù)轉(zhuǎn)換器;一個數(shù)字信號處理器,通過執(zhí)行分割數(shù)字化話音信號的功能以及至少一個下述功能來處理數(shù)字化話音信號帶通濾波,自動增益控制,時標(biāo),壓擴或緩沖;以及一個發(fā)送器,帶有至少一個希爾伯特變換濾波器,它連接到一個數(shù)模轉(zhuǎn)換器,后者連接到一個重構(gòu)濾波器,該重構(gòu)濾波器連接到一個正交振幅調(diào)制器,該正交振幅調(diào)制器連接到一個射頻功率放大器。
全文摘要
本發(fā)明包括語音通信系統(tǒng)內(nèi)具有給定帶寬的語音通信資源中一種壓縮多個語音信號的方法。該方法包括下述步驟:將該語音通信資源子信道化(441,442,443),在每一個子信道上放置多個語音信號中的至少一個,在每一個子信道中時標(biāo)(18)每一個話音信號,其中這些步驟提供了一個壓縮語音信號。
文檔編號H04B1/66GK1176718SQ96192202
公開日1998年3月18日 申請日期1996年1月11日 優(yōu)先權(quán)日1995年2月28日
發(fā)明者克里福德·達(dá)那·雷奇, 羅伯特·約翰·施文德曼, 卡茲米爾·斯威克, 威廉姆·約瑟夫·庫尼奇, 蘇尼爾·薩塔姆蒂 申請人:摩托羅拉公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1