專利名稱:一種通過話路傳送信息的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信信息傳輸技術(shù)領(lǐng)域,更確切地說是涉及一種通過話路傳送信息的方法。
背景技術(shù):
在通信領(lǐng)域中,當(dāng)一個呼叫建立并接通后,如果呼叫雙方希望傳送除語音信息之外的其它信息,對于固定終端來說,可以通過雙音多頻(DTMF)或頻移鍵控(FSK)實現(xiàn)信息在話路中的傳輸;對于移動終端來說,則可以通過信令實現(xiàn)信息的傳輸。
對于移動終端來說,語音信號在經(jīng)過空中接口傳送時,要進行語音壓縮和解壓縮,這個過程中,DTMF信號經(jīng)過語音壓縮后會嚴重失真,識別準(zhǔn)確率很低,F(xiàn)SK同樣如此。因此,目前的移動終端不支持通過DTMF及FSK進行的信號發(fā)送和接收。所以說,目前的固定終端與移動終端在建立話路后,兩個終端之間無法直接通過已建立的話路傳輸語音信息之外的信息。
而固定終端在通話后又不支持信令方式的信息傳送,也就是說,移動終端和固定終端在建立通話后,也無法通過信令方式傳輸信息。因此,如果希望固定終端和移動終端之間進行非語音的信息交互,則需要依賴網(wǎng)絡(luò)設(shè)備對所要傳送的信息進行相應(yīng)的轉(zhuǎn)換來實現(xiàn),顯然,這對網(wǎng)絡(luò)側(cè)的依賴較大,并且實現(xiàn)起來比較麻煩,還需要增加網(wǎng)絡(luò)側(cè)的負擔(dān)。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的主要目的在于提供一種通過話路傳送信息的方法,使通話雙方能夠通過話路進行非語音信息的端到端傳送。
為達到以上目的,本發(fā)明的技術(shù)方案是這樣實現(xiàn)的一種通過話路傳送信息的方法,在信息接收端設(shè)置聲音信息識別模塊,該方法進一步包括以下步驟a.信息發(fā)送端將所要發(fā)送的信息轉(zhuǎn)換為聲音信息,并通過話路將該聲音信息傳送到信息接收端;b.信息接收端通過所述聲音信息識別模塊從接收到的聲音信息中識別出相應(yīng)的信息。
該方法可以進一步包括,在信息發(fā)送端設(shè)置用于表達信息的信息基本元素,并設(shè)置與信息基本元素對應(yīng)的音頻信息元,每個音頻信息元對應(yīng)一個聲音信息;所述步驟a為信息發(fā)送端將要發(fā)送的信息轉(zhuǎn)換為相應(yīng)的信息基本元素,并將與該信息基本元素對應(yīng)的音頻信息元所對應(yīng)的聲音信息通過話路發(fā)送給信息接收端。
所述聲音信息識別模塊根據(jù)所述聲音信息與信息基本元素的對應(yīng)關(guān)系設(shè)置;所述步驟b為信息接收端中的聲音信息識別模塊根據(jù)收到的聲音信息識別出相應(yīng)的信息基本元素,并根據(jù)該信息基本元素確定發(fā)送端所發(fā)送的信息。
所述信息基本元素為ASCII字符、或二進制字符,或根據(jù)信息發(fā)送端的按鍵信息設(shè)置。
所述音頻信息元為語音片段;或者為聲音信息轉(zhuǎn)換得到的聲學(xué)特征矢量的測量值;所述音頻信息元所對應(yīng)的聲音信息為根據(jù)所述音頻信息元產(chǎn)生模擬語音片段。
該方法還可以進一步包括在每兩個音頻信息元之間設(shè)置音頻隔離符;步驟a中,所述信息發(fā)送端在發(fā)送音頻信息元所對應(yīng)的聲音信息之前,進一步包括在每兩個音頻信息元之間設(shè)置音頻隔離符;步驟b中,所述信息接收端中的聲音信息識別模塊根據(jù)收到的聲音信息識別出相應(yīng)的信息基本元素包括根據(jù)音頻隔離符從自身收到的聲音信息中分離出與音頻信息元對應(yīng)的聲音信息,并根據(jù)所述聲音信息識別出相應(yīng)的信息基本元素。
該方法還可以進一步包括在信息接收端設(shè)置針對每個音頻信息元所對應(yīng)的聲音信息的聲音模式;步驟b中,所述信息接收端通過聲音信息識別模塊確定相應(yīng)的信息基本元素為信息接收端用該聲音信息與所設(shè)置的聲音模式進行匹配,確定最大匹配的聲音模式,并通過該聲音模式確定相應(yīng)的信息基本元素。
該方法還可以進一步包括根據(jù)信息基本元素與音頻信息元的對應(yīng)關(guān)系確定音頻信息元對應(yīng)聲音信息所對應(yīng)的聲音模式與信息基本元素的對應(yīng)關(guān)系;所述聲音信息識別模塊根據(jù)聲音模式與信息基本元素的對應(yīng)關(guān)系設(shè)置;步驟b中,所述聲音信息識別模塊通過該聲音模式確定相應(yīng)的信息基本元素為直接根據(jù)所述對應(yīng)關(guān)系確定相應(yīng)的信息基本元素。
所述聲音模式為音頻信息元所對應(yīng)的聲音信息的聲學(xué)特征矢量相關(guān)描述值的范圍;步驟b中,所述信息接收端用該聲音信息與所設(shè)置的聲音模式進行匹配為根據(jù)聲音信息得到相應(yīng)的聲學(xué)特征矢量相關(guān)描述值,并用該聲學(xué)特征矢量相關(guān)描述值與所設(shè)置的所有聲音模式進行匹配。
該方法還可以進一步包括設(shè)置用于標(biāo)識信息發(fā)送開始的開始信息元素及相應(yīng)的開始音頻信息元;步驟a中,所述信息發(fā)送端在將要發(fā)送的信息轉(zhuǎn)換為信息基本元素時,進一步包括在所述信息基本元素的最始端設(shè)置開始信息元素;所述信息發(fā)送端通過話路發(fā)送給信息接收端的聲音信息包括所述與開始信息元素對應(yīng)的開始音頻信息元所對應(yīng)的聲音信息;步驟b中,所述信息接收端中的聲音信息識別模塊根據(jù)收到的聲音信息確定相應(yīng)的信息基本元素包括檢測自身收到的信息中是否出現(xiàn)開始信息元素,如果是,則開始識別收到的聲音信息中開始信息元素對應(yīng)的開始音頻信息元之后的聲音信息;否則,繼續(xù)執(zhí)行檢測是否出現(xiàn)開始信息元素的步驟。
該方法可以進一步包括在信息接收端設(shè)置用于執(zhí)行開始信息元素識別的一級識別功能,及用于執(zhí)行信息基本元素識別的二級識別功能;步驟b中,所述檢測是否出現(xiàn)開始信息元素通過啟動一級識別功能實現(xiàn);所述開始識別收到的聲音信息中開始信息元素對應(yīng)的開始音頻信息元之后的聲音信息通過啟動二級識別功能實現(xiàn)。
該方法還可以進一步包括設(shè)置用于表示信息發(fā)送結(jié)束的結(jié)束信息元素及相應(yīng)的結(jié)束音頻信息元;步驟a中,所述信息發(fā)送端在將要發(fā)送的信息轉(zhuǎn)換為信息基本元素時,進一步包括在所述信息基本元素的最末端設(shè)置結(jié)束信息元素;所述信息發(fā)送端通過話路發(fā)送給信息接收端的聲音信息包括所述與結(jié)束信息元素對應(yīng)的結(jié)束音頻信息元所對應(yīng)的聲音信息;步驟b中,所述信息接收端中的聲音信息識別模塊根據(jù)收到的聲音信息識別出相應(yīng)的信息基本元素進一步包括檢測自身收到的信息中是否出現(xiàn)結(jié)束信息元素,如果是,則結(jié)束識別信息基本元素步驟;否則,繼續(xù)執(zhí)行檢測是否出現(xiàn)結(jié)束信息元素的步驟。
所述信息發(fā)送端及信息接收端為電話終端,或網(wǎng)絡(luò)側(cè)通信設(shè)備。
本發(fā)明通過設(shè)置信息基本元素及對應(yīng)的音頻信息元,以及在信息接收端設(shè)置聲音信息識別模塊,信息發(fā)送端將需要發(fā)送的信息生成相應(yīng)的信息基本元素,并根據(jù)該對應(yīng)關(guān)系得到信息基本元素相應(yīng)的音頻信息元,之后通過已經(jīng)建立的話路將音頻信息元對應(yīng)的聲音信息發(fā)送給信息接收端,信息接收端則通過聲音信息識別模塊對接收到的聲音信息進行識別,得到信息基本元素,進而得到用戶需要發(fā)送的信息,從而實現(xiàn)了通話雙方通過已建立的話路發(fā)送信息。所以說,本發(fā)明方案不需要中間的系統(tǒng)設(shè)備的參與,而是完全由通信終端完成終端到終端、設(shè)備到設(shè)備,以及終端到設(shè)備等的信息傳送。
另外,本發(fā)明方案中的信息接收端只需要識別有限的信息基本元素即可實現(xiàn)本發(fā)明的目的,能夠保證信息接收端具有較高的識別效率和準(zhǔn)確性。
圖1為本發(fā)明方案的實現(xiàn)流程圖。
具體實施例方式
下面結(jié)合附圖及具體實施例對本發(fā)明方案作進一步詳細的說明。
參見圖1,本發(fā)明方案通過以下步驟實現(xiàn)步驟101、在信息發(fā)送端設(shè)置信息基本元素及對應(yīng)的音頻信息元,在信息接收端根據(jù)該信息基本元素及對應(yīng)的音頻信息元設(shè)置音頻信息識別模塊。
當(dāng)然,每個音頻信息元對應(yīng)一個具體的聲音信息,也可以直接是一個具體的聲音信息。比如,對于發(fā)送端來說,其所設(shè)置的音頻信息元可以直接是語音片段;也可以是由語音片段或數(shù)字聲音信息轉(zhuǎn)換得到的所謂聲學(xué)特征矢量的一組測量值,比如,該音頻信息元所對應(yīng)的聲音信息的相關(guān)頻率分量信息、音素信息等。對于音頻信息元是聲學(xué)特征矢量描述信息的情況來說,發(fā)送端應(yīng)該根據(jù)該聲學(xué)特征矢量描述信息生成相應(yīng)的聲音信息,具體可以通過聲音生成器等實現(xiàn)。
為便于信息接收端聲音信息識別模塊的識別,還可以進一步設(shè)置音頻隔離符,在每兩個音頻信息元之間設(shè)置該音頻隔離符,使得信息發(fā)送端每發(fā)送完一個音頻信息元所對應(yīng)的聲音信息后,就發(fā)送一個音頻隔離符,之后再發(fā)送下一個音頻信息元所對應(yīng)的聲音信息。信息接收端進行音頻識別時,自動剔除夾雜在其中的音頻隔離符。
信息接收端中,根據(jù)信息基本元素及對應(yīng)的音頻信息元所設(shè)置的音頻信息識別模塊能夠從接收到的聲音信息中識別出相應(yīng)的信息基本元素。具體來說,由于針對每個音頻信息元都可以設(shè)置相應(yīng)的聲音模式,并且在一般情況下,一個音頻信息元的聲音模式可以是該音頻信息元所對應(yīng)的聲音信息的聲學(xué)特征矢量的相關(guān)描述值的范圍,因此可以設(shè)置包含有各個音頻信息元所對應(yīng)的聲音模式的數(shù)據(jù)庫,簡稱聲音模式庫。這樣,接收端的音頻信息識別模塊在收到發(fā)送端發(fā)送來的聲音信息后,用該聲音信息與聲音模式庫里的聲音模式進行匹配,選擇最大匹配的聲音模式作為匹配結(jié)果,并將該聲音模式所對應(yīng)的信息基本元素作為所要確定的信息基本元素。
具體來說,信息接收端中的聲音信息識別模塊首先要從信息發(fā)送端發(fā)送來的聲音信息中提取一段聲音信息,將所提取的這段聲音信息看作與音頻信息元對應(yīng)的聲音信息。當(dāng)然,在設(shè)置了音頻隔離符的情況下,根據(jù)音頻隔離符則可以直接確定與音頻信息元對應(yīng)的聲音信息。在確定對應(yīng)于一個音頻信息元的聲音信息之后,可以先測量出該聲音信息的一組聲學(xué)特征矢量值,然后,根據(jù)該組測量值與聲音模式庫中的所有聲音模式進行匹配,并將聲音模式庫中最大匹配了該組測量值的聲音模式所對應(yīng)的信息基本元素作為音頻信息元所對應(yīng)的信息基本元素。如果音頻信息元是聲學(xué)特征矢量的描述信息,則音頻信息元所對應(yīng)的聲音模式可以直接是該聲學(xué)特征矢量的相關(guān)描述值的范圍,也可以是根據(jù)該聲學(xué)特征矢量描述信息所生成的相應(yīng)聲音信息的聲學(xué)特征矢量的相關(guān)描述值的范圍。其中,可以根據(jù)信息基本元素與音頻信息元的對應(yīng)關(guān)系,在信息接收端直接設(shè)置聲音模式與信息基本元素的對應(yīng)關(guān)系。這樣,信息接收端在根據(jù)接收到的聲音信息確定了相應(yīng)的最大匹配聲音模式后,即可根據(jù)該對應(yīng)關(guān)系確定相應(yīng)的信息基本元素。
當(dāng)從聲音信息中提取的聲音信息沒能有效地匹配到聲音模式庫里的一個聲音模式時,說明本次提取的聲音信息沒有與其對應(yīng)的音頻信息元,這時可以重新從聲音信息中提取一段聲音信息進行相應(yīng)的處理。
總之,可以根據(jù)信息基本元素對應(yīng)的音頻信息元確定相應(yīng)的聲音模式,并根據(jù)該聲音模式和信息基本元素來設(shè)置信息接收端中的音頻信息識別模塊。這樣,接收端在接收到發(fā)送端發(fā)送的聲音信息后,將相應(yīng)的聲音信息轉(zhuǎn)換為聲學(xué)特征矢量描述信息,并根據(jù)該聲學(xué)特征矢量描述信息去匹配相應(yīng)的聲音模式,從而,音頻信息識別模塊能夠根據(jù)最大可能匹配的聲音模式從接收到的音頻信息中識別出信息基本元素。
由于語音識別技術(shù)是公知技術(shù),所以不對該聲音識別技術(shù)本身作過多的描述。本發(fā)明主要在于使用語音識別技術(shù)來完成接收端對發(fā)送端發(fā)送來的聲音信息的識別,以得到發(fā)送端所要傳輸?shù)男畔ⅲ瑥亩鴮崿F(xiàn)以聲音信息作為承載,通過話路對非聲音信息的傳送,也即通過話路實現(xiàn)非聲音信息的傳送。
步驟102~104、信息發(fā)送端與信息接收端建立話路后,在需要發(fā)送信息時,根據(jù)該信息得到信息基本元素序列,并根據(jù)信息基本元素與音頻信息元的對應(yīng)關(guān)系,確定該信息基本元素序列所對應(yīng)的所有音頻信息元,之后再通過已建立的話路將這些音頻信息元所對應(yīng)的聲音信息發(fā)送到接收端。
信息基本元素可以為二進制字符的“0”和“1”,這種情況下,如果希望發(fā)送字母“A”,而“A”的ASCII字符值為16進制的“41”,則發(fā)送端可以將“A”分解為信息基本元素序列“01000001”,這樣,就可以根據(jù)該信息基本元素序列確定相應(yīng)的音頻信息元了。也就是說,在設(shè)置了“0”和“1”分別對應(yīng)的音頻信息元后,就可以根據(jù)該對應(yīng)關(guān)系來確定信息基本元素序列對應(yīng)的音頻信息元,之后通過已經(jīng)建立的話路將這些音頻信息元所對應(yīng)的聲音信息發(fā)送到信息接收端。
如果所設(shè)置的音頻信息元信息是語音片段,則發(fā)送端可以直接發(fā)送該語音片段的數(shù)字聲音信息,當(dāng)然,對于模擬通信的情況來說,則可以是直接播放該語音片段,也即傳送語音片段的模擬聲音信號。
如果所設(shè)置的音頻信息元是由語音片段等聲音信息轉(zhuǎn)換得到的聲學(xué)特征矢量的描述信息,則信息發(fā)送端可以根據(jù)該描述信息產(chǎn)生一個模擬語音片段的聲音信息,并將該模擬語音片段的聲音信息發(fā)送給接收端。
步驟105~106、信息接收端在接收到聲音信息后,通過自身的音頻信息識別模塊從聲音信息中識別出相應(yīng)的信息基本元素,進而根據(jù)識別出的信息基本元素序列得到相應(yīng)的信息。
這里,信息基本元素序列可以直接是要傳送的信息,比如,使用“0”到“9”的數(shù)字字符作為信息基本元素時,信息基本元素序列“88115066”可以直接是要傳送的一個電話號碼信息。
通過上述步驟,即可實現(xiàn)本發(fā)明的目的。
本發(fā)明方案所涉及的音頻信息元實際上可以是音頻信號,該音頻信號所對應(yīng)的信息既可以是諸如語音文件之類的語音信息,也可以是諸如音樂文件之類的音樂信息。如果希望一個音頻信號對應(yīng)的信息是語音信息,可以將該音頻信息元設(shè)置為對應(yīng)一個語音片段。
顯然,上述信息發(fā)送端和信息接收端可以是包括移動終端和固定終端在內(nèi)的所有電話終端,還可以是其它的網(wǎng)絡(luò)側(cè)通信設(shè)備。也就是說,通過本發(fā)明方案的設(shè)置,通信雙方只要能夠建立話路,就可以通過該話路實現(xiàn)信息交互。
上述過程所提的信息基本元素可以是通信終端的按鍵信息,當(dāng)然,也可以是其它的信息。以按鍵信息為例,比如,每個按鍵數(shù)字代表該數(shù)字的原意,也即每個按鍵數(shù)字所對應(yīng)的按鍵信息就是信息基本元素,并設(shè)置各個按鍵信息基本元素所對應(yīng)的音頻信息元。這樣,信息發(fā)送端用戶在需要向信息接收端發(fā)送電話號碼之類的數(shù)字信息時,即可通過輸入按鍵信息來生成信息基本元素,信息發(fā)送端在收到通過按鍵輸入的信息后,對該信息再作相應(yīng)的處理,從而得到與輸入的按鍵信息相對應(yīng)的音頻信息元,而后將音頻信息元所對應(yīng)的聲音信息發(fā)送到信息接收端。信息接收端則通過音頻信息識別模塊從收到的聲音信息中識別出信息基本元素,由于信息基本元素即為按鍵信息,因此,得到信息基本元素即為得到按鍵信息,也就得到信息發(fā)送端所發(fā)送的電話號碼。同樣,通過這種方式可以從信息發(fā)送端向信息接收端傳送其它信息,比如,號碼簿號碼,以及信息接收端要求輸入的諸如接入密碼等信息。
在根據(jù)按鍵設(shè)置信息基本元素時,還可以作進一步的設(shè)置。比如,可以設(shè)置點擊某個按鍵所代表的信息基本元素,快速雙擊某個按鍵所代表的信息基本元素,長時間按住某個按鍵不動所代表的信息基本元素,或者是多個按鍵的組合所代表的信息基本元素等等,并設(shè)置這些特殊按鍵信息基本元素所對應(yīng)的音頻信息元。當(dāng)然,還需要對信息接收端中的音頻信息識別模塊作相應(yīng)的設(shè)置,使其能夠識別出這些特殊的信息基本元素。
信息基本元素還可以設(shè)置為ASCII字符,相應(yīng)地,應(yīng)設(shè)置各個ASCII字符所對應(yīng)的音頻信息元。通過這種方式,信息發(fā)送端則可以快捷地將一個email地址發(fā)送到信息接收端。
當(dāng)然,如前所述,信息基本元素還可以設(shè)置為二進制字符,二進制字符只包括“0”和“1”,因此,設(shè)置信息基本元素所對應(yīng)的音頻信息元即為設(shè)置“0”和“1”所對應(yīng)的音頻信息元。由于通過“0”和“1”可以表達任何信息,因此,通過這種方式,信息發(fā)送端可以向信息接收端發(fā)送任何信息。這種情況下,信息接收端的音頻識別模塊也要能識別出“0”和“1”兩個基本信息元素。
另外,本發(fā)明還可以設(shè)置用于表示信息發(fā)送開始的開始信息元素及相應(yīng)的開始音頻信息元。信息發(fā)送端在發(fā)送信息元之前,首先根據(jù)開始信息元素來發(fā)送開始音頻信息元所對應(yīng)的聲音信息,而后發(fā)送由要發(fā)送信息得到的音頻信息元所對應(yīng)的聲音信息;相應(yīng)地,在信息接收端設(shè)置兩級識別功能,當(dāng)信息接收端在與信息發(fā)送端建立通話后,首先啟動一級識別功能,監(jiān)測收到的聲音信息中是否出現(xiàn)了開始信息基本元素,當(dāng)檢測到開始信息基本元素,開始啟動二級識別功能,對后續(xù)接收到的聲音信息進行二級識別,從而得到要發(fā)送的信息所對應(yīng)的信息基本元素,進而得到要發(fā)送的信息。
這里,由于一級識別功能所識別的信息基本元素僅僅包括開始信息基本元素,因此識別效率會更高,從而,對正常通過該話路進行的語音通信影響較小。由于二級識別功能要識別信息基本元素包括所有可能的信息基本元素,這些信息基本元素集可能較大,因此,在進行語音模式匹配時,處理的效率會較一級識別底。當(dāng)然,也可以適當(dāng)擴大一級識別功能所識別的信息基本元素的數(shù)量,從而實現(xiàn)信息發(fā)送端對信息接收端進行較為復(fù)雜的控制功能。比如,接收端可以有不同的識別方式,發(fā)送端可以通過控制命令,指示接收端啟動相應(yīng)的識別方式。
實際當(dāng)中,可以由某種動物特別的叫聲中截取一個音頻片段來得到開始音頻信息元,比如,從叫驢的冗長叫聲中截取一些人類難以模仿的聲音片段。當(dāng)然,也可以從一些動物的特別的叫聲中截取一些音頻片段來得到其它的音頻信息元。
相應(yīng)地,還可以設(shè)置用于表示信息發(fā)送結(jié)束的結(jié)束信息元素及相應(yīng)的結(jié)束音頻信息元。信息發(fā)送端在結(jié)束發(fā)送信息時,根據(jù)結(jié)束信息元素來發(fā)送結(jié)束音頻信息元所對應(yīng)的聲音信息,信息接收端在識別到接收信息基本元素時則結(jié)束二級識別功能。當(dāng)然,結(jié)束二級識別功能后,識別模塊可以重新回到一級識別狀態(tài)。
以上所述僅為本發(fā)明方案的較佳實施例,并不用以限定本發(fā)明的保護范圍。
權(quán)利要求
1.一種通過話路傳送信息的方法,其特征在于,在信息接收端設(shè)置聲音信息識別模塊,該方法進一步包括以下步驟a.信息發(fā)送端將所要發(fā)送的信息轉(zhuǎn)換為聲音信息,并通過話路將該聲音信息傳送到信息接收端;b.信息接收端通過所述聲音信息識別模塊從接收到的聲音信息中識別出相應(yīng)的信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,該方法進一步包括,在信息發(fā)送端設(shè)置用于表達信息的信息基本元素,并設(shè)置與信息基本元素對應(yīng)的音頻信息元,每個音頻信息元對應(yīng)一個聲音信息;所述步驟a為信息發(fā)送端將要發(fā)送的信息轉(zhuǎn)換為相應(yīng)的信息基本元素,并將與該信息基本元素對應(yīng)的音頻信息元所對應(yīng)的聲音信息通過話路發(fā)送給信息接收端。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述聲音信息識別模塊根據(jù)所述聲音信息與信息基本元素的對應(yīng)關(guān)系設(shè)置;所述步驟b為信息接收端中的聲音信息識別模塊根據(jù)收到的聲音信息識別出相應(yīng)的信息基本元素,并根據(jù)該信息基本元素確定發(fā)送端所發(fā)送的信息。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述信息基本元素為ASCII字符、或二進制字符,或根據(jù)信息發(fā)送端的按鍵信息設(shè)置。
5.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述音頻信息元為語音片段;或者為聲音信息轉(zhuǎn)換得到的聲學(xué)特征矢量的測量值;所述音頻信息元所對應(yīng)的聲音信息為根據(jù)所述音頻信息元產(chǎn)生模擬語音片段。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,該方法進一步包括在每兩個音頻信息元之間設(shè)置音頻隔離符;步驟a中,所述信息發(fā)送端在發(fā)送音頻信息元所對應(yīng)的聲音信息之前,進一步包括在每兩個音頻信息元之間設(shè)置音頻隔離符;步驟b中,所述信息接收端中的聲音信息識別模塊根據(jù)收到的聲音信息識別出相應(yīng)的信息基本元素包括根據(jù)音頻隔離符從自身收到的聲音信息中分離出與音頻信息元對應(yīng)的聲音信息,并根據(jù)所述聲音信息識別出相應(yīng)的信息基本元素。
7.根據(jù)權(quán)利要求3或6所述的方法,其特征在于,該方法進一步包括在信息接收端設(shè)置針對每個音頻信息元所對應(yīng)的聲音信息的聲音模式;步驟b中,所述信息接收端通過聲音信息識別模塊確定相應(yīng)的信息基本元素為信息接收端用該聲音信息與所設(shè)置的聲音模式進行匹配,確定最大匹配的聲音模式,并通過該聲音模式確定相應(yīng)的信息基本元素。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,該方法進一步包括根據(jù)信息基本元素與音頻信息元的對應(yīng)關(guān)系確定音頻信息元對應(yīng)聲音信息所對應(yīng)的聲音模式與信息基本元素的對應(yīng)關(guān)系;所述聲音信息識別模塊根據(jù)聲音模式與信息基本元素的對應(yīng)關(guān)系設(shè)置;步驟b中,所述聲音信息識別模塊通過該聲音模式確定相應(yīng)的信息基本元素為直接根據(jù)所述對應(yīng)關(guān)系確定相應(yīng)的信息基本元素。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述聲音模式為音頻信息元所對應(yīng)的聲音信息的聲學(xué)特征矢量相關(guān)描述值的范圍;步驟b中,所述信息接收端用該聲音信息與所設(shè)置的聲音模式進行匹配為根據(jù)聲音信息得到相應(yīng)的聲學(xué)特征矢量相關(guān)描述值,并用該聲學(xué)特征矢量相關(guān)描述值與所設(shè)置的所有聲音模式進行匹配。
10.根據(jù)權(quán)利要求3所述的方法,其特征在于,該方法進一步包括設(shè)置用于標(biāo)識信息發(fā)送開始的開始信息元素及相應(yīng)的開始音頻信息元;步驟a中,所述信息發(fā)送端在將要發(fā)送的信息轉(zhuǎn)換為信息基本元素時,進一步包括在所述信息基本元素的最始端設(shè)置開始信息元素;所述信息發(fā)送端通過話路發(fā)送給信息接收端的聲音信息包括所述與開始信息元素對應(yīng)的開始音頻信息元所對應(yīng)的聲音信息;步驟b中,所述信息接收端中的聲音信息識別模塊根據(jù)收到的聲音信息確定相應(yīng)的信息基本元素包括檢測自身收到的信息中是否出現(xiàn)開始信息元素,如果是,則開始識別收到的聲音信息中開始信息元素對應(yīng)的開始音頻信息元之后的聲音信息;否則,繼續(xù)執(zhí)行檢測是否出現(xiàn)開始信息元素的步驟。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,該方法進一步包括在信息接收端設(shè)置用于執(zhí)行開始信息元素識別的一級識別功能,及用于執(zhí)行信息基本元素識別的二級識別功能;步驟b中,所述檢測是否出現(xiàn)開始信息元素通過啟動一級識別功能實現(xiàn);所述開始識別收到的聲音信息中開始信息元素對應(yīng)的開始音頻信息元之后的聲音信息通過啟動二級識別功能實現(xiàn)。
12.根據(jù)權(quán)利要求3或10所述的方法,其特征在于,該方法進一步包括設(shè)置用于表示信息發(fā)送結(jié)束的結(jié)束信息元素及相應(yīng)的結(jié)束音頻信息元;步驟a中,所述信息發(fā)送端在將要發(fā)送的信息轉(zhuǎn)換為信息基本元素時,進一步包括在所述信息基本元素的最末端設(shè)置結(jié)束信息元素;所述信息發(fā)送端通過話路發(fā)送給信息接收端的聲音信息包括所述與結(jié)束信息元素對應(yīng)的結(jié)束音頻信息元所對應(yīng)的聲音信息;步驟b中,所述信息接收端中的聲音信息識別模塊根據(jù)收到的聲音信息識別出相應(yīng)的信息基本元素進一步包括檢測自身收到的信息中是否出現(xiàn)結(jié)束信息元素,如果是,則結(jié)束識別信息基本元素步驟;否則,繼續(xù)執(zhí)行檢測是否出現(xiàn)結(jié)束信息元素的步驟。
13.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述信息發(fā)送端及信息接收端為電話終端,或網(wǎng)絡(luò)側(cè)通信設(shè)備。
全文摘要
本發(fā)明公開了一種通過話路傳送信息的方法,該方法首先在信息接收端設(shè)置聲音信息識別模塊,之后,信息發(fā)送端在需要向信息接收端發(fā)送非語音信息時,將所要發(fā)送的信息轉(zhuǎn)換為聲音信息,并通過話路將該聲音信息傳送到信息接收端;信息接收端通過所述聲音信息識別模塊從接收到的聲音信息中識別出相應(yīng)的信息。本發(fā)明方案解決了現(xiàn)有技術(shù)不能通過話路傳遞非語音信息的問題。本發(fā)明實現(xiàn)了通話雙方通過已建立的話路對非語音信息的傳送,且不需要中間系統(tǒng)設(shè)備的參與。
文檔編號H04L12/00GK1756251SQ20041008060
公開日2006年4月5日 申請日期2004年9月29日 優(yōu)先權(quán)日2004年9月29日
發(fā)明者王正偉, 王少見, 覃景繁 申請人:華為技術(shù)有限公司