專利名稱:經(jīng)由聲音信道的數(shù)據(jù)通信和壓縮的制作方法
技術(shù)領(lǐng)域:
本發(fā)明通常涉及數(shù)據(jù)通信,并且尤其涉及經(jīng)由聲音信道的數(shù)據(jù)通信。
背景技術(shù):
通信技術(shù)中的發(fā)展使共享和/或轉(zhuǎn)送信息更容易且更快??梢越?jīng)由數(shù)據(jù)傳輸系統(tǒng)來傳送大容量的數(shù)據(jù),所述數(shù)據(jù)傳輸系統(tǒng)諸如局域網(wǎng)或廣域網(wǎng)(例如因特網(wǎng))、蜂窩網(wǎng)絡(luò)和/或衛(wèi)星通信系統(tǒng)。這些系統(tǒng)要求復(fù)雜的硬件和/或軟件,并且一般被設(shè)計(jì)來用于高數(shù)據(jù)率和/或長(zhǎng)傳輸范圍。
對(duì)于在近距離的數(shù)據(jù)轉(zhuǎn)送,諸如在個(gè)人計(jì)算機(jī)和個(gè)人數(shù)據(jù)助理(PDA)之間,上述系統(tǒng)可能無法向用戶提供便利的通信介質(zhì)。因此,使用諸如射頻(RF)或紅外(IR)來發(fā)送數(shù)據(jù)的各種通信系統(tǒng)已經(jīng)被開發(fā)出來。然而,這些系統(tǒng)還要求專門的通信硬件,其常??赡苁前嘿F的和/或難以實(shí)際實(shí)現(xiàn)的。此外,可以使用簡(jiǎn)單的電纜連接來轉(zhuǎn)送數(shù)據(jù)。然而,為了使用電纜連接,用戶必須在物理上具有電纜并且進(jìn)行連接以進(jìn)行通信。這對(duì)用戶來說可能是麻煩且不方便的。
另外,隨著電子商務(wù)的增加,欺詐活動(dòng)的機(jī)會(huì)也增加。掌握在做壞事的人手中的被盜用的身份可能會(huì)導(dǎo)致?lián)p害無辜的當(dāng)事人。在最壞的情況下,做壞事的人可能盜取當(dāng)事人的身份以便利用其個(gè)人的信用度(creditworthiness)和財(cái)務(wù)賬戶。結(jié)果,為了防止未經(jīng)授權(quán)的人截取保密信息,已經(jīng)開發(fā)出各種安全措施和加密方案,以便隱藏在當(dāng)事人之間發(fā)送的保密信息。然而,隱藏保密信息只是實(shí)現(xiàn)在電子商務(wù)事務(wù)中高級(jí)別消費(fèi)者信用所需的安全措施的一個(gè)方面。
另一個(gè)方面是認(rèn)證。目前可以通過下列認(rèn)證來執(zhí)行個(gè)人的電子認(rèn)證,通過諸如密碼或個(gè)人識(shí)別號(hào)(PIN)的資料進(jìn)行的認(rèn)證;通過諸如信用卡或類似卡的便攜式物體進(jìn)行的認(rèn)證;和/或通過諸如指紋、DNA或簽名的個(gè)人特征(生物測(cè)定學(xué))進(jìn)行的認(rèn)證。然而,由于當(dāng)前對(duì)電子安全測(cè)量存在依賴,所以對(duì)個(gè)人來說攜帶多個(gè)認(rèn)證對(duì)象或被迫記住多個(gè)密碼是很常見的。從而通過資料進(jìn)行的認(rèn)證對(duì)于被迫記住多個(gè)密碼和/或PIN的個(gè)人來說可能是個(gè)問題。寫下這種信息使個(gè)人易受密碼或PIN代碼被盜竊的攻擊。
因此,需要一種簡(jiǎn)單且用戶界面友好的方法來在近距離傳送和/或認(rèn)證信息。另外,數(shù)據(jù)的最終目的地可能不總是在近距離。例如,個(gè)人可能希望通過電話或移動(dòng)電話來發(fā)送信息,這常常涉及語(yǔ)音壓縮和解壓縮,語(yǔ)音壓縮和解壓縮可能使所述信息顯著地失真。因此,還需要一種用于在近距離以及通過涉及語(yǔ)音壓縮/解壓縮的通信網(wǎng)絡(luò)來傳送和/或認(rèn)證信息的方法。
發(fā)明內(nèi)容
這里公開的實(shí)施例通過提供用于使用聲音進(jìn)行數(shù)據(jù)通信的設(shè)備和方法,來解決上述需要。在一個(gè)方面,一種用于發(fā)送數(shù)字?jǐn)?shù)據(jù)的設(shè)備包括用于把要發(fā)送的數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為一種或多種類型的聲音參數(shù)的裝置,和用于根據(jù)所述一種或多種類型的聲音參數(shù)來產(chǎn)生聲音的裝置。一種用于接收數(shù)字?jǐn)?shù)據(jù)的設(shè)備包括用于從所接收的聲音中提取一種或多種類型的聲音參數(shù)的裝置;和用于把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)的裝置。這兩種設(shè)備中的一種或全部還可以包括用于存儲(chǔ)位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集的裝置;其中所述用于轉(zhuǎn)換的裝置根據(jù)所述一個(gè)或多個(gè)關(guān)系集來進(jìn)行轉(zhuǎn)換。所述用于存儲(chǔ)的裝置可以存儲(chǔ)預(yù)定義一個(gè)或多個(gè)關(guān)系集的查找表。
在另一方面,一種用于發(fā)送數(shù)字?jǐn)?shù)據(jù)的方法包括把要發(fā)送的數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為一種或多種類型的聲音參數(shù),并且根據(jù)所述一種或多種類型的聲音參數(shù)來產(chǎn)生聲音。一種用于接收數(shù)字?jǐn)?shù)據(jù)的方法包括從所接收的聲音中提取一種或多種類型的聲音參數(shù),并且把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)。這兩種方法中的一種或全部還可以包括存儲(chǔ)位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集,并且其中所述轉(zhuǎn)換包括根據(jù)所述一個(gè)或多個(gè)關(guān)系集來進(jìn)行轉(zhuǎn)換。所述存儲(chǔ)可以包括存儲(chǔ)預(yù)定義一個(gè)或多個(gè)關(guān)系集的查找表。
在又一方面,一種用于發(fā)送數(shù)字?jǐn)?shù)據(jù)的設(shè)備包括數(shù)據(jù)編碼器和聲音合成器,所述數(shù)據(jù)編碼器被配置為把所述數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為一種或多種類型的聲音參數(shù),所述聲音合成器與所述數(shù)據(jù)編碼器耦合并且被配置為根據(jù)所述一種或多種類型的聲音參數(shù)來產(chǎn)生聲音。一種用于接收數(shù)字?jǐn)?shù)據(jù)的設(shè)備包括聲音分析器和數(shù)據(jù)解碼器,所述聲音分析器被配置為接收聲音并且從所接收的聲音中提取一種或多種類型的聲音參數(shù),所述數(shù)據(jù)解碼器與所述聲音分析器耦合并且被配置為把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)。這兩種設(shè)備中的一種或全部還可以包括存儲(chǔ)介質(zhì),其被配置為存儲(chǔ)位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集;并且其中所述數(shù)據(jù)編碼器/解碼器被配置為根據(jù)所述一個(gè)或多個(gè)關(guān)系集來進(jìn)行轉(zhuǎn)換。
再一方面,一種用于發(fā)送數(shù)字?jǐn)?shù)據(jù)的機(jī)器可讀介質(zhì)包括用于把要發(fā)送的數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為一種或多種類型的聲音參數(shù)的代碼,和用于根據(jù)所述一種或多種類型的聲音參數(shù)來產(chǎn)生聲音的代碼。一種用于接收數(shù)字?jǐn)?shù)據(jù)的機(jī)器可讀介質(zhì)包括用于從所接收的聲音中提取一種或多種類型的聲音參數(shù)的代碼,和用于把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)的代碼。
在又一方面中,一種用于發(fā)送和接收數(shù)字?jǐn)?shù)據(jù)的設(shè)備包括用于把要發(fā)送的數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為一種或多種類型的聲音參數(shù)的裝置,用于根據(jù)所述一種或多種類型的聲音參數(shù)來產(chǎn)生聲音的裝置,用于從接收的聲音中提取一種或多種類型的聲音參數(shù)的裝置,和用于把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)的裝置。
參考下列附圖來詳細(xì)描述各個(gè)實(shí)施例,其中同樣的附圖標(biāo)記指的是同樣的元件,其中圖1示出了用于使用聲音來發(fā)送數(shù)據(jù)的裝置的一個(gè)實(shí)施例;圖2示出了用于使用聲音來接收數(shù)據(jù)的裝置的一個(gè)實(shí)施例;圖3示出了用于使用聲音來發(fā)送數(shù)據(jù)的過程的一個(gè)實(shí)施例;圖4示出了用于使用聲音來接收數(shù)據(jù)的過程的一個(gè)實(shí)施例;圖5A到5C示出了使用聲音進(jìn)行數(shù)據(jù)通信的例子;圖6示出了用于使用聲音通過無線通信網(wǎng)絡(luò)來發(fā)送數(shù)據(jù)的系統(tǒng)的一個(gè)實(shí)施例;圖7示出了用于使用聲音通過無線通信網(wǎng)絡(luò)來發(fā)送數(shù)據(jù)的過程的一個(gè)實(shí)施例;圖8示出了使用聲音通過PSTN來發(fā)送數(shù)據(jù);和圖9示出了使用聲音通過IP網(wǎng)絡(luò)來發(fā)送數(shù)據(jù)。
具體實(shí)施例方式
下述實(shí)施例允許使用聲音來發(fā)送并接收數(shù)字?jǐn)?shù)據(jù)。通常,把數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換或映射為用于合成聲音的至少一個(gè)聲音參數(shù)。然后使用該(多個(gè))聲音參數(shù)來產(chǎn)生人工聲音。因此,所產(chǎn)生的人工聲音編碼數(shù)字聲音,并且通過發(fā)出該聲音來發(fā)送數(shù)字?jǐn)?shù)據(jù)。當(dāng)恢復(fù)數(shù)據(jù)時(shí),從所接收的聲音中提取有關(guān)的(多個(gè))聲音參數(shù),并且把該(多個(gè))聲音參數(shù)轉(zhuǎn)換回?cái)?shù)字?jǐn)?shù)據(jù)。為了在數(shù)據(jù)和該(多個(gè))參數(shù)之間轉(zhuǎn)換,定義了關(guān)系集,使得具有選擇出來的特性的特定(多個(gè))參數(shù)表示二進(jìn)制位的預(yù)定模式。
如這里所公開的,術(shù)語(yǔ)“聲音”指的是穿過氣體、液體或固體的聲波或壓力波或振動(dòng)。聲音包括超聲、可聽聲和次聲。術(shù)語(yǔ)“可聽聲”指的是位于聲譜內(nèi)的聲音頻率,其近似為20Hz到20kHz。術(shù)語(yǔ)“超聲”指的是位于所述聲譜之上的聲音頻率,而術(shù)語(yǔ)“次聲”指的是位于所述聲譜以下的聲音頻率。術(shù)語(yǔ)“存儲(chǔ)介質(zhì)”表示用于存儲(chǔ)數(shù)據(jù)的一個(gè)或多個(gè)裝置,包括只讀存儲(chǔ)器(ROM)、隨機(jī)存取存儲(chǔ)器(RAM)、磁盤存儲(chǔ)介質(zhì)、光存儲(chǔ)介質(zhì)、快閃存儲(chǔ)裝置和/或其它機(jī)器可讀介質(zhì)。術(shù)語(yǔ)“機(jī)器可讀介質(zhì)”包括但不局限于便攜式或固定存儲(chǔ)裝置、光存儲(chǔ)裝置以及能夠存儲(chǔ)指令和/或數(shù)據(jù)的各種其它裝置。
圖1示出了能夠使用聲音來發(fā)送數(shù)字?jǐn)?shù)據(jù)的發(fā)送裝置100的一個(gè)實(shí)施例,而圖2示出了能夠接收由發(fā)送裝置100發(fā)送的數(shù)據(jù)的接收裝置200的一個(gè)實(shí)施例。發(fā)送裝置100包括數(shù)據(jù)編碼器120,用于把要發(fā)送的數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為至少一個(gè)聲音參數(shù)。然后聲音合成器130根據(jù)來自數(shù)據(jù)編碼器120的所述(多個(gè))聲音參數(shù)來產(chǎn)生聲音。接收裝置200包括聲音分析器210和數(shù)據(jù)解碼器230,其中聲音分析器210用于從所接收的聲音中提取有關(guān)的(多個(gè))聲音參數(shù),數(shù)據(jù)解碼器230用于把由聲音分析器210提取的(多個(gè))參數(shù)轉(zhuǎn)換為數(shù)字?jǐn)?shù)據(jù)。
圖3示出了用于使用聲音來發(fā)送數(shù)字?jǐn)?shù)據(jù)的發(fā)送過程300,而圖4示出了用于使用聲音來接收數(shù)字?jǐn)?shù)據(jù)的接收過程400。為了發(fā)送,把要發(fā)送的數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換或映射(310)為至少一個(gè)在合成聲音中使用的參數(shù)。然后根據(jù)所述(多個(gè))聲音參數(shù)產(chǎn)生聲音(320)并且由此發(fā)射該聲音。這里,數(shù)據(jù)編碼器120可以轉(zhuǎn)換要發(fā)送的數(shù)字?jǐn)?shù)據(jù),并且聲音合成器120可以產(chǎn)生所述聲音。當(dāng)接收到聲音時(shí),所述(多個(gè))聲音參數(shù)被提取出來(方框410),并被轉(zhuǎn)換回?cái)?shù)字?jǐn)?shù)據(jù)(方框420)。這里,聲音分析器210可以提取有關(guān)(多個(gè))參數(shù),并且數(shù)據(jù)解碼器230可以把所述(多個(gè))參數(shù)轉(zhuǎn)換為數(shù)字?jǐn)?shù)據(jù)。
更特別地是,定義了位模式和至少一個(gè)參數(shù)之間的關(guān)系集以把數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為至少一個(gè)聲音參數(shù),以下稱作數(shù)據(jù)符號(hào)。根據(jù)所述關(guān)系集,數(shù)據(jù)編碼器120和數(shù)據(jù)解碼器230分別把數(shù)據(jù)轉(zhuǎn)換為(多個(gè))參數(shù)和從(多個(gè))參數(shù)轉(zhuǎn)換為數(shù)據(jù)。這里,只要數(shù)據(jù)編碼器120和數(shù)據(jù)解碼器230使用相同的關(guān)系集,可以為轉(zhuǎn)換定義任何適當(dāng)?shù)年P(guān)系。同樣,數(shù)據(jù)編碼器120和數(shù)據(jù)解碼器230還可以包括或可以被實(shí)現(xiàn)為處理器(未示出),該處理器使用所述關(guān)系集以在數(shù)字?jǐn)?shù)據(jù)和(多個(gè))參數(shù)之間轉(zhuǎn)換。
另外,發(fā)送裝置100和接收裝置200還可以包括用于存儲(chǔ)所述關(guān)系集的存儲(chǔ)介質(zhì)(未示出)。對(duì)那些本領(lǐng)域內(nèi)技術(shù)人員來說顯而易見的是,所述存儲(chǔ)介質(zhì)的位置不影響發(fā)送裝置100和接收裝置200的操作。因此,在發(fā)送裝置100中,所述存儲(chǔ)介質(zhì)可以作為數(shù)據(jù)編碼器120的一部分來實(shí)現(xiàn),或者可以是位于數(shù)據(jù)編碼器120外部的任何適當(dāng)?shù)拇鎯?chǔ)介質(zhì)。類似地,在接收裝置200中,所述存儲(chǔ)介質(zhì)可以作為數(shù)據(jù)解碼器230的一部分來實(shí)現(xiàn),或者可以是位于數(shù)據(jù)解碼器230外部的任何適當(dāng)?shù)拇鎯?chǔ)介質(zhì)。
在一個(gè)實(shí)施例中,可以利用預(yù)定義參數(shù)和位模式之間的關(guān)系的存儲(chǔ)介質(zhì)中的查找表(LUT)來實(shí)現(xiàn)發(fā)送裝置100和接收裝置200之一或二者。然后可以由數(shù)據(jù)編碼器120使用所述LUT來把所接收的數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為至少一個(gè)參數(shù)。類似地,可以由數(shù)據(jù)解碼器230使用所述LUT來把由聲音解碼器210提取的(多個(gè))參數(shù)轉(zhuǎn)換為數(shù)字?jǐn)?shù)據(jù)。
下面的表1是用于在數(shù)字?jǐn)?shù)據(jù)和一個(gè)參數(shù)之間轉(zhuǎn)換的LUT的例子,其中A、B、C和/或D可以是一個(gè)音調(diào)值或一組音調(diào)值。
如圖所示,所述LUT定義了位模式和音調(diào)值之間的關(guān)系,其常常是用于合成聲音的參數(shù)。因此,例如為了發(fā)送數(shù)字?jǐn)?shù)據(jù)“010001”,則根據(jù)所述LUT來把所述位模式轉(zhuǎn)換為音調(diào)值“BAB”。然后使用表示數(shù)字?jǐn)?shù)據(jù)的音調(diào)值“BAB”來在三個(gè)連續(xù)幀中產(chǎn)生聲音,所述音調(diào)在整個(gè)幀中是恒定的。為了接收數(shù)字?jǐn)?shù)據(jù),可以從所接收的聲音中提取音調(diào)值“BAB”,并且根據(jù)所述LUT把其轉(zhuǎn)換為位模式“010001”。
應(yīng)該注意的是,為了解釋,在所述LUT中使用了一個(gè)參數(shù)。然而,在定義參數(shù)和位模式之間的關(guān)系中也可以使用系統(tǒng)允許的任一數(shù)量的參數(shù)。此外,可以將每個(gè)參數(shù)定義為具有多于或少于四個(gè)與不同位模式對(duì)應(yīng)的不同值,其中每個(gè)值可以表示一個(gè)值或一組值。例如,在表1中的音調(diào)值“A”可以表示音調(diào)的一個(gè)等級(jí),或可以表示在音調(diào)值的某個(gè)范圍內(nèi)的音調(diào)等級(jí)。而且,可以基于在系統(tǒng)中實(shí)現(xiàn)的聲音合成器來使用不同于音調(diào)的參數(shù)類型。基于所述聲音合成器,所使用的一個(gè)或多個(gè)參數(shù)可以用于合成可聽聲以及超聲或次聲。
可以在各種應(yīng)用中使用上述的發(fā)送裝置和/或接收裝置。如在圖5A中所示,可以使用表示數(shù)據(jù)的聲音來將信息從一個(gè)裝置轉(zhuǎn)送、共享和/或交換到另一裝置。所述信息可以包括但不局限于個(gè)人信息;諸如名字、電話號(hào)碼、地址之類的聯(lián)系信息;商業(yè)信息;日歷信息;備忘錄;軟件或其組合。此外,一些裝置可以只利用發(fā)送裝置來實(shí)現(xiàn)為,一些只利用接收裝置實(shí)現(xiàn),而一些利用發(fā)送裝置和接收裝置二者實(shí)現(xiàn)。例如,在實(shí)現(xiàn)發(fā)送裝置100和接收裝置200的裝置的一個(gè)實(shí)施例中,可以組合數(shù)據(jù)編碼器/解碼器120、230,和/或,如果實(shí)現(xiàn)的話,還可以組合所述LUT。因此,由實(shí)現(xiàn)所允許并且取決于通信類型,所述通信可以是單向的或雙向的。
在另一應(yīng)用中,發(fā)送裝置可以是安全令牌,而接收裝置可以是認(rèn)證裝置,如圖5B所示??梢允褂帽硎緮?shù)據(jù)的聲音來執(zhí)行無線認(rèn)證,其中所發(fā)送的數(shù)據(jù)可以包括加密簽名以對(duì)個(gè)人進(jìn)行認(rèn)證。密碼學(xué)在本領(lǐng)域內(nèi)為大家所熟知并且通常是加密保密信息的過程,以至需要有“密鑰”來解密所加密的信息。從而可以使用認(rèn)證裝置來驗(yàn)證個(gè)人的身份以允許在個(gè)人和各個(gè)外部裝置之間的事務(wù)。因此,可以把數(shù)據(jù)從安全令牌發(fā)送到認(rèn)證裝置來對(duì)個(gè)人進(jìn)行驗(yàn)證。應(yīng)該注意的是,在一些認(rèn)證系統(tǒng)中,存在安全令牌和認(rèn)證裝置之間的雙向通信。在這種情況下,利用發(fā)送裝置和接收裝置來實(shí)現(xiàn)安全令牌和認(rèn)證裝置二者。當(dāng)實(shí)現(xiàn)發(fā)送裝置100和接收裝置200這二者時(shí),可以組合數(shù)據(jù)編碼器/解碼器120、230,和/或還可以組合LUT(如果實(shí)現(xiàn))。
因此,雖然可以直接發(fā)送和接收表示數(shù)據(jù)的聲音,然而如圖5C所示也可以經(jīng)由通信網(wǎng)絡(luò)來發(fā)送和接收表示數(shù)據(jù)的聲音。這里,所述通信網(wǎng)絡(luò)可以是能夠發(fā)送聲音的許多網(wǎng)絡(luò)之一。
在一個(gè)應(yīng)用中,可以經(jīng)由語(yǔ)音編碼器或聲音編碼器來把表示數(shù)據(jù)的聲音從一個(gè)裝置發(fā)送到另一裝置??梢酝ㄟ^以一個(gè)設(shè)定的數(shù)據(jù)率采樣并數(shù)字化來簡(jiǎn)單地發(fā)送語(yǔ)音。然而,語(yǔ)音壓縮使得在數(shù)據(jù)率上顯著降低。一般把使用以下技術(shù)的裝置稱作聲音編碼器,所述技術(shù)用于通過提取與人類語(yǔ)音產(chǎn)生模型有關(guān)的參數(shù)來壓縮語(yǔ)音。這種裝置通常包括編碼器或語(yǔ)音合成器,用于分析輸入的語(yǔ)音來提取有關(guān)的參數(shù),以及解碼器或語(yǔ)音合成器,用于使用經(jīng)由傳輸信道接收的參數(shù)來再合成語(yǔ)音。把語(yǔ)音分成時(shí)間塊或分析幀,在此期間計(jì)算參數(shù)。然后對(duì)每個(gè)新的幀更新參數(shù)。
圖6示出了系統(tǒng)600,其中可以經(jīng)由聲音編碼器來把表示數(shù)據(jù)的聲音從裝置610發(fā)送到裝置620。所述系統(tǒng)可以包括無線通信網(wǎng)絡(luò),所述無線通信網(wǎng)絡(luò)包括多個(gè)移動(dòng)站(MS)630和690,也稱作用戶單元或遠(yuǎn)程站或用戶設(shè)備;基站(BS)640;和移動(dòng)交換中心(MSC)或交換機(jī)650。取決于所述配置,系統(tǒng)600還可以包括分組數(shù)據(jù)服務(wù)節(jié)點(diǎn)(PDSN)或網(wǎng)絡(luò)互通功能(IWF)670和因特網(wǎng)協(xié)議(IP)網(wǎng)絡(luò)680,和/或公用交換電話網(wǎng)(PSTN)660。對(duì)于本領(lǐng)域內(nèi)技術(shù)人員應(yīng)當(dāng)理解,可以存在任意數(shù)目的發(fā)送裝置、接收裝置、MS、BS、MSC和PDSN。類似地,MS 630、BS 640、MSC 650、PSTN 660、PDSN 670和IP網(wǎng)絡(luò)680的各種配置和操作為本領(lǐng)域內(nèi)所熟知并且將不論述。
在系統(tǒng)600中,可以用例如發(fā)送裝置100來實(shí)現(xiàn)裝置610,并且可以用例如接收裝置200來實(shí)現(xiàn)裝置620。此外,可以在移動(dòng)站630、690和基站640內(nèi)實(shí)現(xiàn)包括編碼器和解碼器二者的聲音編碼器。參考圖7將要描述系統(tǒng)600的操作。
圖7示出了用于使用聲音來把數(shù)據(jù)從裝置610發(fā)送到裝置620的示例性過程。在圖7中,把要發(fā)送的數(shù)據(jù)轉(zhuǎn)換(710)為至少一個(gè)語(yǔ)音參數(shù)。使用至少一個(gè)語(yǔ)音參數(shù),然后產(chǎn)生(720)人工語(yǔ)音并將其發(fā)射(725)到MS 630。這里,可以例如由數(shù)據(jù)編碼器120根據(jù)定義的關(guān)系集來轉(zhuǎn)換或映射數(shù)據(jù),并且可以由例如聲音合成器130來產(chǎn)生人工語(yǔ)音。此外,采用與在MS 630、690和BS 640中實(shí)現(xiàn)的聲音編碼器同樣的方法來合成人工語(yǔ)音。
在MS 630中的聲音編碼器的編碼器部分編碼(730)所輸入的人工語(yǔ)音。即,分析所輸入的人工語(yǔ)音以提取有關(guān)的一個(gè)或多個(gè)語(yǔ)音參數(shù)。向基站640發(fā)送(735)所述(多個(gè))語(yǔ)音參數(shù)。在基站640中的聲音編碼器的解碼器部分使用所接收的語(yǔ)音參數(shù)來解碼或再合成(740)語(yǔ)音。根據(jù)MSC 650的控制,把再合成的語(yǔ)音發(fā)送到適當(dāng)?shù)哪康牡鼗蜓b置620。
取決于裝置620的配置,可以把所述再合成語(yǔ)音從BS 640轉(zhuǎn)發(fā)或直接發(fā)送(742)到裝置620。作為選擇,可以經(jīng)由MS 690來把再合成的語(yǔ)音從BS 640轉(zhuǎn)發(fā)(744)到裝置690。這里,由BS 640發(fā)送語(yǔ)音參數(shù),由MS 690將語(yǔ)音參數(shù)再合成或解碼(750)為語(yǔ)音,并且發(fā)送(755)到裝置620。仍然作為選擇,還可以使用IP網(wǎng)絡(luò)680經(jīng)由(760)PSTN 660或經(jīng)由(770)PSDN 670來把再合成的語(yǔ)音從BS 640轉(zhuǎn)發(fā)(746和748)到裝置620。
當(dāng)裝置620從MS 690、PSTN 660或IP網(wǎng)絡(luò)680之一接收再合成的語(yǔ)音時(shí),提取(780)有關(guān)的語(yǔ)音參數(shù)并將其轉(zhuǎn)換(790)回?cái)?shù)據(jù)。這里,可以例如由聲音分析器210來提取有關(guān)的語(yǔ)音參數(shù),并且可以例如由數(shù)據(jù)解碼器230使用所定義的關(guān)系集來轉(zhuǎn)換所述參數(shù)。此外,可以采用與在MS 630、690和BS 640中實(shí)現(xiàn)的聲音編碼器同樣的方法來提取有關(guān)的語(yǔ)音參數(shù)。
在另一實(shí)施例中,可以使用電話經(jīng)由PSTN 660來把表示數(shù)字?jǐn)?shù)據(jù)的人工語(yǔ)音從裝置A直接發(fā)送到裝置B,如圖8所示。類似地,可以使用例如如圖9所示的計(jì)算機(jī)經(jīng)由IP網(wǎng)絡(luò)670來把表示數(shù)字?jǐn)?shù)據(jù)的人工語(yǔ)音從裝置A直接發(fā)送到裝置B。這里,所述計(jì)算機(jī)可以是能夠連接到IP網(wǎng)絡(luò)670并且能夠處理聲音的任何裝置。
因此,可以把數(shù)字?jǐn)?shù)據(jù)作為語(yǔ)音參數(shù)來發(fā)送并接收。所述語(yǔ)音參數(shù)的類型取決于用來在語(yǔ)音編碼算法中來再合成語(yǔ)音的語(yǔ)音模型。聲音編碼器常常用合理的保真度來編碼語(yǔ)音的音調(diào)和整個(gè)頻譜形狀。因此,在一個(gè)實(shí)施例中,可以使用音調(diào)和/或頻譜信息來發(fā)送數(shù)據(jù)。另外,還可以使用所述波形的整個(gè)振幅。
更具體地說,語(yǔ)音編碼算法的一個(gè)例子是碼激勵(lì)線性預(yù)測(cè)(CodeExicted Linear Prediction)或CELP語(yǔ)音模型,并且在轉(zhuǎn)讓給本發(fā)明的受讓人的美國(guó)專利No.5,414,796、名為“Variable Rate Vocoder”的專利中描述。CELP或CELP的變形常常用于聲音編碼器。
通常,CELP語(yǔ)音解碼器通過為語(yǔ)音的每個(gè)幀產(chǎn)生“激勵(lì)信號(hào)”來產(chǎn)生再合成的語(yǔ)音。該信號(hào)是所述幀的長(zhǎng)度并且通常接近于光譜上的白色。編碼器根據(jù)可能的激勵(lì)信號(hào)的“密碼本”為每個(gè)幀指定選擇哪個(gè)激勵(lì)信號(hào)。不同的CELP算法具有不同的激勵(lì)密碼本的結(jié)構(gòu)。這些結(jié)構(gòu)一般被選擇來進(jìn)行搜尋所有可能的激勵(lì)信號(hào)的過程,以便找到一個(gè)盡可能計(jì)算上簡(jiǎn)單同時(shí)仍然提供優(yōu)質(zhì)的重構(gòu)語(yǔ)音的好的激勵(lì)信號(hào)。由增益系數(shù)來縮放激勵(lì)信號(hào),所述增益系數(shù)與該幀的原始語(yǔ)音的音量高度相關(guān)。經(jīng)由“音調(diào)濾波器”來傳遞所述縮放的激勵(lì)信號(hào),所述音調(diào)濾波器在語(yǔ)音信號(hào)中引入長(zhǎng)期冗余。該濾波器的“增益”還可以動(dòng)態(tài)地改變以適應(yīng)變化的音調(diào)。然后經(jīng)由線性預(yù)測(cè)編碼(LPC)濾波器來傳遞音調(diào)濾波器的輸出,所述線性預(yù)測(cè)編碼濾波器在語(yǔ)音信號(hào)中引入短期冗余。因此,CELP編碼過程一般試圖選擇激勵(lì)向量、激勵(lì)增益、音調(diào)濾波器參數(shù)和LPC濾波器參數(shù),以使解碼器的LPC濾波器的輸出緊密地匹配原始語(yǔ)音。
如果在系統(tǒng)600中的聲音編碼器實(shí)現(xiàn)是基于CELP語(yǔ)音模型的,那么可以定義位模式和音調(diào)濾波器參數(shù)之間的關(guān)系。還可以定義位模式和LPC濾波器參數(shù)之間的關(guān)系。因此,取決于所定義的關(guān)系,可以把要發(fā)送的所有或部分?jǐn)?shù)據(jù)轉(zhuǎn)換為音調(diào)濾波器參數(shù)、LPC濾波器參數(shù)或它們兩者。
為了解釋,假定音調(diào)濾波器參數(shù)和LPC濾波器參數(shù)二者都用于定義所述關(guān)系。在這種情況下,例如可以在近似20到100個(gè)采樣范圍內(nèi)選擇音調(diào)頻率,該采樣范圍的采樣率大約為8KHz,間隔為大約兩個(gè)采樣。對(duì)于音調(diào)頻率,這導(dǎo)致大約32種可能性,由此允許由音調(diào)參數(shù)來攜帶5比特信息。
此外,假定CELP聲音編碼器實(shí)現(xiàn)具有8個(gè)極點(diǎn)的LPC濾波器,例如可以指定四個(gè)(4)諧振頻率的位置或四(4)對(duì)復(fù)共軛極點(diǎn)以用于把數(shù)字?jǐn)?shù)據(jù)映射到LPC參數(shù)。通常,在大約300到3400Hz的窄頻帶上發(fā)送語(yǔ)音。如果所述諧振頻率間隔為大約250Hz,那么約有十一個(gè)(11)位置可以放置極點(diǎn)。如果選擇4對(duì)極點(diǎn),那么由下列關(guān)系給出了在11個(gè)位置中的4個(gè)極點(diǎn)位置組合的數(shù)目。
11!7!×4!=330]]>這允許由LPC參數(shù)攜帶8比特信息。依照與上述類似的方法,可以把一些位編碼為增益系數(shù)。然而,如果像在上述例子中使用LPC濾波器的極點(diǎn)位置和音調(diào)頻率,那么得到的碼字的長(zhǎng)度將是每聲音編碼器幀為8+5=13比特。
商用系統(tǒng)的聲音編碼器幀一般為大約10到20msec長(zhǎng)。在這種情況下,可以把數(shù)據(jù)編碼為具有大約20msec長(zhǎng)的幀(所述幀以下被稱作“數(shù)據(jù)幀”)的語(yǔ)音參數(shù),以覆蓋聲音編碼器幀大小的范圍。然而,裝置610,620可以不與MS 630、690中的聲音編碼器的成幀同步。因此,可以選擇較大的幀大小以便至少部分地重疊聲音編碼器的語(yǔ)音幀。例如,對(duì)于裝置610、620可以實(shí)現(xiàn)40msec的數(shù)據(jù)幀。如果這樣的話,那么將要由至少一個(gè)聲音編碼器幀來編碼至少20msec的連續(xù)采樣。在接收器端,將要識(shí)別在聲音編碼器幀和數(shù)據(jù)幀之間提供最大重疊的20msec的窗口。
應(yīng)該注意的是,在數(shù)字?jǐn)?shù)據(jù)傳輸開始時(shí),將要發(fā)送同步前導(dǎo)以表明正在發(fā)送數(shù)字?jǐn)?shù)據(jù)。當(dāng)由接收器接收時(shí),同步前導(dǎo)使得接收器檢測(cè)所述數(shù)字?jǐn)?shù)據(jù)傳輸?shù)拈_始。因此,一旦檢測(cè)到前導(dǎo)信號(hào),那么就可以檢測(cè)到在數(shù)據(jù)和聲音編碼器幀之間的最大重疊的位置。可以在將來的幀中使用該信息來估算采樣的最佳窗口以用于解碼所述數(shù)據(jù)幀。
此外,可以把在數(shù)據(jù)幀中攜帶的一些位用作冗余以提供保護(hù)來防止在檢測(cè)音調(diào)和/或LPC諧振頻率中出現(xiàn)的錯(cuò)誤。如果音調(diào)和LPC諧振頻率用于編碼,那么所述音調(diào)/諧振頻率值提供了二維符號(hào)空間,這里稱為“數(shù)據(jù)符號(hào)”。首先使用諸如卷積碼之類的糾錯(cuò)碼來對(duì)用戶數(shù)據(jù)進(jìn)行編碼。然后交織所編碼的比特序列。把所編碼并交織的比特序列分成n比特的組,并且把每個(gè)n比特的組映射到數(shù)據(jù)符號(hào)。在上面的例子中,把一個(gè)13位(5個(gè)來自音調(diào)值并且8個(gè)來自LPC諧振頻率)的組映射到數(shù)據(jù)符號(hào)。
更特別地是,可以使用許多不同的方法來把所編碼的位轉(zhuǎn)換和/或映射到數(shù)據(jù)符號(hào)。例如,可以使用格碼(Trellis code)。作為選擇,可以使用格雷(Gray)映射來把所編碼的位映射到數(shù)據(jù)符號(hào)。在1987年2月第25卷第2期的《IEEE通信雜志》中的“Trellis-codedmodulation with redundant signal set-part IIntroduction”中、以及在1987年2月第25卷第2期的《IEEE通信雜志》中的“Trellis-codedmodulation with redundant signal set-part IIState of the art”中描述了格碼,這兩篇文章均由G.Ungerboeck所著。在1995年McGraw Hill出版的J.Proakis所著的《數(shù)字通信》中描述了格雷映射。
每個(gè)語(yǔ)音幀可以發(fā)送的數(shù)據(jù)量取決于各種因素,諸如幀大小和/或表示語(yǔ)音參數(shù)的位的數(shù)目。例如,如果P位表示音調(diào)濾波器參數(shù),那么可以定義P位或小于P位的位模式以對(duì)應(yīng)于音調(diào)濾波器參數(shù)。
在上面的描述中,給出了具體細(xì)節(jié)以提供對(duì)本發(fā)明的全面的了解。然而,本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)當(dāng)理解可以不依賴于這些具體細(xì)節(jié)來實(shí)施本發(fā)明。此外,可以把數(shù)據(jù)傳輸系統(tǒng)的各個(gè)方面、特征和實(shí)施例描述為可以以流程圖、程序框圖、結(jié)構(gòu)圖或方框圖表述的過程。盡管流程圖可能把操作描述為順序的過程,但是也可以并行或并發(fā)地執(zhí)行許多操作。另外,可以重新布置所述操作的次序。當(dāng)完成過程的操作時(shí)終止該過程。過程可以對(duì)應(yīng)于方法、函數(shù)、步驟、軟件、子例程、子程序等。當(dāng)過程對(duì)應(yīng)于函數(shù)時(shí),其終止對(duì)應(yīng)于所述函數(shù)返回到調(diào)用函數(shù)或主函數(shù)。
此外,可以由硬件、軟件、固件、中間件、微指令或其任何組合來實(shí)現(xiàn)實(shí)施例。當(dāng)采用軟件、固件、中間件或微指令來實(shí)現(xiàn)時(shí),可以把用于執(zhí)行必要任務(wù)的程序代碼或代碼段存儲(chǔ)在存儲(chǔ)介質(zhì)中。處理器可以執(zhí)行必要的任務(wù)。代碼段可以表示步驟、函數(shù)、子程序、程序、例程、子例程、模塊、軟件包、類,或指令、數(shù)據(jù)結(jié)構(gòu)或程序語(yǔ)句的任何組合。可以通過傳送和/或接收信息、數(shù)據(jù)、變?cè)?、參?shù)或存儲(chǔ)內(nèi)容,來把代碼段與另一代碼段或硬件電路耦合??梢越?jīng)由包括存儲(chǔ)器共享、消息傳遞、令牌傳送、網(wǎng)絡(luò)傳輸?shù)热魏芜m當(dāng)?shù)姆椒▉韨鬟f、轉(zhuǎn)發(fā)或發(fā)送信息、變?cè)?、參?shù)、數(shù)據(jù)等。
因此,上述實(shí)施例僅僅是例子,并且不能被理解為限制本發(fā)明。可以容易地把本教導(dǎo)應(yīng)用于其它類型的設(shè)備。本發(fā)明的描述意在是說明性的,而并非限制所述權(quán)利要求的范圍。對(duì)本領(lǐng)域內(nèi)技術(shù)人員來說,許多替換、修改和變化將是顯而易見的。
權(quán)利要求
1.用于發(fā)送數(shù)字?jǐn)?shù)據(jù)的設(shè)備,包括數(shù)據(jù)編碼器,被配置為把所述數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為一種或多種類型的聲音參數(shù);以及聲音合成器,與所述數(shù)據(jù)編碼器耦合并且被配置為根據(jù)所述一種或多種類型的聲音參數(shù)來產(chǎn)生聲音。
2.如權(quán)利要求1所述的設(shè)備,還包括存儲(chǔ)介質(zhì),被配置為存儲(chǔ)位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集;以及其中所述數(shù)據(jù)編碼器被配置為根據(jù)所述一個(gè)或多個(gè)關(guān)系集來把所述數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為所述一種或多種類型的聲音參數(shù)。
3.如權(quán)利要求2所述的設(shè)備,其中所述存儲(chǔ)介質(zhì)包括用于預(yù)定義一個(gè)或多個(gè)關(guān)系集的查找表。
4.如權(quán)利要求1所述的設(shè)備,其中聲音參數(shù)表示一個(gè)值或一組值。
5.如權(quán)利要求1所述的設(shè)備,其中所述一個(gè)或多個(gè)聲音參數(shù)包括語(yǔ)音參數(shù)。
6.用于接收數(shù)字?jǐn)?shù)據(jù)的設(shè)備,包括聲音分析器,被配置為接收聲音并且從所接收的聲音中提取一種或多種類型的聲音參數(shù);以及數(shù)據(jù)解碼器,與所述聲音分析器耦合并且被配置為把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)。
7.如權(quán)利要求6所述的設(shè)備,還包括存儲(chǔ)介質(zhì),被配置為存儲(chǔ)位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集;以及其中所述數(shù)據(jù)解碼器被配置為根據(jù)所述一個(gè)或多個(gè)關(guān)系集來把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)。
8.如權(quán)利要求7所述的設(shè)備,其中所述存儲(chǔ)介質(zhì)包括用于預(yù)定義一個(gè)或多個(gè)關(guān)系集的查找表。
9.如權(quán)利要求6所述的設(shè)備,其中聲音參數(shù)表示一個(gè)值或一組值。
10.如權(quán)利要求6所述的設(shè)備,其中所提取的一個(gè)或多個(gè)聲音參數(shù)包括語(yǔ)音參數(shù)。
11.一種用于發(fā)送數(shù)字?jǐn)?shù)據(jù)的方法,包括把要發(fā)送的數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為一種或多種類型的聲音參數(shù);以及根據(jù)所述一種或多種類型的聲音參數(shù)來產(chǎn)生聲音。
12.如權(quán)利要求11所述的方法,還包括存儲(chǔ)位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集;以及其中轉(zhuǎn)換要發(fā)送的數(shù)字?jǐn)?shù)據(jù)包括根據(jù)所述一個(gè)或多個(gè)關(guān)系集來把所述數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為所述一種或多種類型的聲音參數(shù)。
13.如權(quán)利要求12所述的方法,其中存儲(chǔ)所述一個(gè)或多個(gè)關(guān)系集包括存儲(chǔ)用于預(yù)定義一個(gè)或多個(gè)關(guān)系集的查找表。
14.如權(quán)利要求11所述的方法,其中聲音參數(shù)表示一個(gè)值或一組值。
15.如權(quán)利要求11所述的方法,其中所述一個(gè)或多個(gè)聲音參數(shù)包括語(yǔ)音參數(shù)。
16.一種用于接收數(shù)字?jǐn)?shù)據(jù)的方法,包括從所接收的聲音中提取一種或多種類型的聲音參數(shù);以及把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)。
17.如權(quán)利要求16所述的方法,還包括存儲(chǔ)位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集;以及其中轉(zhuǎn)換所提取的一種或多種類型的聲音參數(shù)包括根據(jù)所述一個(gè)或多個(gè)關(guān)系集來把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)。
18.如權(quán)利要求17所述的方法,其中存儲(chǔ)所述一個(gè)或多個(gè)關(guān)系集包括存儲(chǔ)用于預(yù)定義一個(gè)或多個(gè)關(guān)系集的查找表。
19.如權(quán)利要求16所述的方法,其中聲音參數(shù)表示一個(gè)值或一組值。
20.如權(quán)利要求16所述的方法,其中所提取的一個(gè)或多個(gè)聲音參數(shù)包括語(yǔ)音參數(shù)。
21.用于發(fā)送數(shù)字?jǐn)?shù)據(jù)的設(shè)備,包括用于把要發(fā)送的數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為一種或多種類型的聲音參數(shù)的裝置;以及用于根據(jù)所述一種或多種類型的聲音參數(shù)來產(chǎn)生聲音的裝置。
22.如權(quán)利要求21所述的設(shè)備,還包括用于存儲(chǔ)位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集的裝置;以及其中所述用于轉(zhuǎn)換的裝置根據(jù)所述一個(gè)或多個(gè)關(guān)系集來把所述數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為所述一種或多種類型的聲音參數(shù)。
23.如權(quán)利要求22所述的設(shè)備,其中所述用于存儲(chǔ)的裝置存儲(chǔ)用于預(yù)定義一個(gè)或多個(gè)關(guān)系集的查找表。
24.用于接收數(shù)字?jǐn)?shù)據(jù)的設(shè)備,包括用于從所接收的聲音中提取一種或多種類型的聲音參數(shù)的裝置;以及用于把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)的裝置。
25.如權(quán)利要求24所述的設(shè)備,還包括用于存儲(chǔ)位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集的裝置;以及其中所述用于轉(zhuǎn)換的裝置根據(jù)所述一個(gè)或多個(gè)關(guān)系集來把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)。
26.如權(quán)利要求25所述的設(shè)備,其中所述用于存儲(chǔ)的裝置存儲(chǔ)用于預(yù)定義一個(gè)或多個(gè)關(guān)系集的查找表。
27.用于發(fā)送數(shù)字?jǐn)?shù)據(jù)的機(jī)器可讀介質(zhì),包括用于把要發(fā)送的數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為一種或多種類型的聲音參數(shù)的代碼;以及用于根據(jù)所述一種或多種類型的聲音參數(shù)來產(chǎn)生聲音的代碼。
28.如權(quán)利要求27所述的介質(zhì),還包括位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集;以及其中所述用于轉(zhuǎn)換的代碼根據(jù)所述一個(gè)或多個(gè)關(guān)系集來把所述數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為所述一種或多種類型的聲音參數(shù)。
29.用于接收數(shù)字?jǐn)?shù)據(jù)的機(jī)器可讀介質(zhì),包括用于從所接收的聲音中提取一種或多種類型的聲音參數(shù)的代碼;以及用于把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)的代碼。
30.如權(quán)利要求29所述的介質(zhì),還包括位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集;以及其中所述用于轉(zhuǎn)換的代碼根據(jù)所述一個(gè)或多個(gè)關(guān)系集來把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)。
31.用于發(fā)送和接收數(shù)字?jǐn)?shù)據(jù)的設(shè)備,包括用于把要發(fā)送的數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為一種或多種類型的聲音參數(shù)的裝置;用于根據(jù)所述一種或多種類型的聲音參數(shù)來產(chǎn)生聲音的裝置;用于從所接收的聲音中提取一種或多種類型的聲音參數(shù)的裝置;以及用于把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)的裝置。
32.如權(quán)利要求31所述的設(shè)備,還包括用于存儲(chǔ)位模式和一種或多種類型的聲音參數(shù)之間的一個(gè)或多個(gè)關(guān)系集的裝置;以及其中所述用于轉(zhuǎn)換的裝置根據(jù)所述一個(gè)或多個(gè)關(guān)系集來把所述數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為所述一種或多種類型的聲音參數(shù),并且其中所述用于轉(zhuǎn)換的裝置根據(jù)所述一個(gè)或多個(gè)關(guān)系集來把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為所述數(shù)字?jǐn)?shù)據(jù)。
33.如權(quán)利要求32所述的設(shè)備,其中所述用于存儲(chǔ)的裝置存儲(chǔ)用于預(yù)定義一個(gè)或多個(gè)關(guān)系集的查找表。
全文摘要
公開了一種用于使用聲音進(jìn)行數(shù)據(jù)通信的設(shè)備和方法。通常,用于發(fā)送數(shù)字?jǐn)?shù)據(jù)的設(shè)備包括數(shù)據(jù)編碼器和聲音合成器,所述數(shù)據(jù)編碼器被配置為把數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為一種或多種類型的聲音參數(shù)(310),所述聲音合成器與數(shù)據(jù)編碼器耦合并且被配置為根據(jù)所述一種或多種類型的聲音參數(shù)來產(chǎn)生聲音(320)。用于接收數(shù)字?jǐn)?shù)據(jù)的設(shè)備包括聲音分析器和數(shù)據(jù)解碼器,所述聲音分析器被配置為接收聲音并且從所接收的聲音中提取一種或多種類型的聲音參數(shù),所述數(shù)據(jù)解碼器與聲音分析器耦合并且被配置為把所提取的一種或多種類型的聲音參數(shù)轉(zhuǎn)換為數(shù)字?jǐn)?shù)據(jù)(310)。
文檔編號(hào)G10L13/00GK1701352SQ03825380
公開日2005年11月23日 申請(qǐng)日期2003年9月25日 優(yōu)先權(quán)日2002年9月25日
發(fā)明者威廉·羅伯特·加德納 申請(qǐng)人:高通股份有限公司