專利名稱:通信方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及這樣一種通信方法和系統(tǒng),其使用語(yǔ)音識(shí)別技術(shù)來(lái)分析聲音消息以確定其期望目的地。
背景技術(shù):
現(xiàn)有技術(shù)中已知基于移動(dòng)分組的半雙工聲音消息傳送系統(tǒng)。它們俗稱為“一鍵通”(PTT)系統(tǒng),在美國(guó)商業(yè)應(yīng)用已達(dá)多年,由NextelCommunications提供且服務(wù)標(biāo)記為“Direct Connect”。
這種PTT系統(tǒng)也已被研制為在網(wǎng)際協(xié)議(IP)環(huán)境中通過(guò)基于IP的語(yǔ)音(VoIP)系統(tǒng)進(jìn)行操作。具體地,在現(xiàn)有技術(shù)中已知基于VoIP的PTT系統(tǒng)的通用分組無(wú)線業(yè)務(wù)(GPRS)和碼分多路訪問(wèn)(CDMA),例如由Motorola生產(chǎn)的系統(tǒng)(參見http//www.motorola.com/mediacenter/news/detail/0,1958,3069_2512_23,00.html)和Qualccomm生產(chǎn)的系統(tǒng)(參見http//www.qualcomm.com/press/releases/2002/020111_qchat_voip.html)。
如現(xiàn)有技術(shù)中所熟知的,當(dāng)使用PTT系統(tǒng)時(shí),用戶通常使用圖形界面和裝置自帶的用戶控件從其自己的手機(jī)上保持的地址薄列表選擇期望的接收者。然而,還已知的是提供語(yǔ)音撥號(hào)PTT服務(wù),并且提供該功能性的示例性現(xiàn)有技術(shù)的裝置是由CellportSystems Inc.of Boulder公司生產(chǎn)的用于Motorola iDEN i1000和i1000 plus移動(dòng)電話的分組適配器。可以在http//www.cellport.com/adapterguides /nextel_i1000_PAG.pdf上找到用于Cellport分組適配器的用戶指南。如這里所指出的,這種語(yǔ)音撥號(hào)包括在用戶希望發(fā)送的聲音消息被說(shuō)出之前,用戶講預(yù)定碼字,之后是該用戶希望連接的接受者的標(biāo)識(shí)(例如號(hào)碼,但另選地是快速撥號(hào)代碼)。例如,在Cellport系統(tǒng)中,用戶通過(guò)使用語(yǔ)音撥號(hào)而講詞語(yǔ)“Cellport,dial,pound,pound,6284”。所述適配器然后重復(fù)所識(shí)別詞語(yǔ)“pound,pound,6284”,而后進(jìn)行連接處理。用戶然后可以通過(guò)以通常的方式按下PTT按鈕而講其消息。
然而,即使具有該語(yǔ)音撥號(hào)功能性,也仍然存在單獨(dú)的“撥號(hào)階段”,在該階段用戶或者通過(guò)使用通常的圖形界面或者通過(guò)使用語(yǔ)音撥號(hào)界面,而必須選擇期望的接受者,并且直到已完成了該撥號(hào)階段并建立了連接,用戶才可以講其最初的消息。因此,該單獨(dú)的撥號(hào)階段引入了對(duì)用戶能夠講其消息的延遲,而且還使得用戶或者以瀏覽圖形顯示器的方式或者通過(guò)根據(jù)語(yǔ)音撥號(hào)協(xié)議進(jìn)行講話而必須與裝置進(jìn)行附加交互。
發(fā)明內(nèi)容
本發(fā)明旨在通過(guò)從用戶界面除去單獨(dú)的撥號(hào)階段而改善上述操作。更具體地,本發(fā)明利用了語(yǔ)音識(shí)別和相關(guān)技術(shù)來(lái)分析所說(shuō)消息,以識(shí)別該消息的期望接收者,并且通過(guò)網(wǎng)絡(luò)向期望接受者發(fā)送所述消息或者至少其變體(例如,由語(yǔ)音識(shí)別器獲得的消息文本)。這樣允許用戶簡(jiǎn)單地按下其手機(jī)上的PTT按鈕并立即說(shuō)其消息(優(yōu)選地,在其消息內(nèi)包含有期望接受者的某些表示(indication),例如姓名等),而無(wú)需預(yù)先經(jīng)歷單獨(dú)的撥號(hào)階段。
鑒于上述,從第一方面,提供了一種通信方法,包括如下步驟接收包含言語(yǔ)的聲音消息;對(duì)所接收的消息進(jìn)行緩沖;對(duì)所接收的聲音消息進(jìn)行語(yǔ)音識(shí)別處理以識(shí)別其中包含的言語(yǔ);如果可能,根據(jù)所識(shí)別的言語(yǔ)確定所述消息的期望接收者;以及如果確定了期望接收者,則使用由分組交換網(wǎng)絡(luò)提供的半雙工通信服務(wù)將所述消息發(fā)送給確定的期望接收者。
如上所述,本發(fā)明提供的優(yōu)點(diǎn)在于,在用戶可以說(shuō)出消息之前無(wú)需單獨(dú)的撥號(hào)階段。這樣改善了用戶的通信經(jīng)歷,并且使得半雙工通信服務(wù)更宜人并更友好地供用戶使用。
在本發(fā)明的實(shí)施例中,當(dāng)所述確定步驟根據(jù)所識(shí)別的言語(yǔ)確定出一個(gè)或多個(gè)可能的期望接收者時(shí),優(yōu)選地所述方法還包括以下步驟向用戶指明所述一個(gè)或多個(gè)可能的期望接收者;以及從用戶接收選擇信號(hào),該信號(hào)指明應(yīng)該向其發(fā)送所述消息的所述一個(gè)或多個(gè)確定的可能的期望接收者。
這樣,在所述確定步驟已識(shí)別出一個(gè)或多個(gè)潛在的期望消息接受者的情況下,從用戶可以尋求對(duì)所識(shí)別的可能期望接受者的說(shuō)明。優(yōu)選地,為易于進(jìn)行接口,所述指明步驟還包括生成與所述多個(gè)可能的期望接收者相對(duì)應(yīng)的音頻語(yǔ)音提示;以及將所生成的音頻語(yǔ)音提示輸出給用戶。這種進(jìn)一步特征允許來(lái)自用戶裝置的音頻輸出提示。
另外,在本發(fā)明的實(shí)施例中,優(yōu)選地,僅對(duì)所接收的聲音消息的一部分進(jìn)行所述語(yǔ)音識(shí)別處理。這種特征識(shí)別出很可能在消息開始時(shí)指明消息的期望接受者(例如,考慮消息“您好羅杰,今晚想去酒吧嗎”,在第一短語(yǔ)中識(shí)別出期望接受者“羅杰”),因此可以通過(guò)僅進(jìn)行必要的識(shí)別量而節(jié)約了語(yǔ)音識(shí)別器資源。
此外,在本發(fā)明的實(shí)施例中,還包括以下步驟接收生成所述消息的用戶標(biāo)識(shí)的表示;以及根據(jù)用戶標(biāo)識(shí)選擇供所述語(yǔ)音識(shí)別處理使用的基于用戶的語(yǔ)音語(yǔ)法。這樣允許與語(yǔ)音識(shí)別處理一起使用專用于用戶的語(yǔ)法,在所述語(yǔ)法中可以編碼有地址薄數(shù)據(jù)等。
另外,本發(fā)明的實(shí)施例還可以包括下面步驟從用戶接收語(yǔ)音識(shí)別啟動(dòng)信號(hào),其中根據(jù)該信號(hào)的接收而執(zhí)行所述語(yǔ)音識(shí)別和確定步驟。該功能性允許用戶明確地指明何時(shí)消息是至新接受者的消息,并因此應(yīng)該執(zhí)行語(yǔ)音識(shí)別和接受者確定步驟。這樣進(jìn)一步提高了語(yǔ)音識(shí)別器資源的使用效率,并且還改進(jìn)了本發(fā)明的整體操作,因?yàn)閮H對(duì)其中極有可能說(shuō)某種接收者表示(例如姓名等)的消息(通常為線程中的第一消息)執(zhí)行語(yǔ)音識(shí)別和接收者確定步驟,并因此相應(yīng)地極有可能的是能夠確定期望接受者。
通過(guò)下面參照附圖對(duì)本發(fā)明僅以示例方式給出的實(shí)施例的描述,將明確本發(fā)明的進(jìn)一步特征和優(yōu)點(diǎn),其中圖1是本發(fā)明實(shí)施例的體系結(jié)構(gòu)系統(tǒng)框圖;圖2(a)是示出本發(fā)明該實(shí)施例中所涉及的方法步驟的流程圖;以及圖2(b)是繼續(xù)圖2(a)流程圖的流程圖。
具體實(shí)施例方式
下面將參照?qǐng)D1、圖2(a)和圖2(b)來(lái)描述本發(fā)明的實(shí)施例。
本發(fā)明的實(shí)施例提供了一種聲音操縱的一鍵通(PTT)服務(wù)。更具體地,本發(fā)明的實(shí)施例的目的是提供一種一鍵通通信服務(wù),其可以使用在現(xiàn)有技術(shù)中已經(jīng)公知并在本說(shuō)明書的介紹部分中論述的PTT通信技術(shù)中的任一種,并且其增加有這樣的功能性,即,允許一鍵通通信指向期望的接受者或目的地而不經(jīng)歷任何顯式撥號(hào)階段。而且在本發(fā)明的實(shí)施例中,對(duì)所講消息進(jìn)行語(yǔ)音識(shí)別,并應(yīng)用語(yǔ)音語(yǔ)法以確定消息的期望接受者或目的地,然后將消息轉(zhuǎn)發(fā)給如此確定的期望接受者或目的地。
鑒于上述,圖1示出了整個(gè)系統(tǒng)的體系結(jié)構(gòu)框圖,其示出了根據(jù)本發(fā)明實(shí)施例的主要系統(tǒng)組成部分。因此,參照?qǐng)D1,在本發(fā)明的實(shí)施例中,設(shè)置有音頻路由服務(wù)器14,其用于從PTT使能手機(jī)接收由網(wǎng)絡(luò)(未示出)上的PTT通信服務(wù)承載的流式數(shù)字音頻信號(hào),以及調(diào)用線標(biāo)識(shí)符(callingline identifier(CLI))信息。音頻路由服務(wù)器14配備有音頻緩沖器142,該音頻緩沖器是例如RAM、硬盤、光學(xué)存儲(chǔ)介質(zhì)等的數(shù)據(jù)存儲(chǔ)介質(zhì),并用于在其中臨時(shí)存儲(chǔ)任何接收的音頻消息。另外,該實(shí)施例設(shè)置有語(yǔ)音識(shí)別服務(wù)器18,其用于接收來(lái)自音頻路由服務(wù)器處的音頻緩沖器142的數(shù)字音頻以及CLI信息,并且還從地址薄和語(yǔ)法數(shù)據(jù)庫(kù)20接收在語(yǔ)音識(shí)別處理中使用的語(yǔ)音語(yǔ)法和詞匯數(shù)據(jù)。在使用中,語(yǔ)音識(shí)別服務(wù)器18運(yùn)行語(yǔ)音識(shí)別應(yīng)用程序以向從音頻緩沖器412接收的數(shù)字音頻應(yīng)用用戶特定語(yǔ)法,從而識(shí)別其中的任何所講言語(yǔ)以確定期望的接受者。應(yīng)注意的是,由語(yǔ)音識(shí)別服務(wù)器運(yùn)行的語(yǔ)音識(shí)別應(yīng)用程序可以是現(xiàn)有技術(shù)中當(dāng)前已知的任何語(yǔ)音識(shí)別應(yīng)用程序,但優(yōu)選的是獨(dú)立于說(shuō)話者的語(yǔ)音識(shí)別應(yīng)用程序。在優(yōu)先權(quán)日之前可獲得的并且可以由當(dāng)前實(shí)施例中的語(yǔ)音識(shí)別服務(wù)器18使用的合適的語(yǔ)音識(shí)別軟件是來(lái)自1005 Hamilton Court,Menlo Park,CA 94025的Nuance Communications Inc.的Nuance 7。
語(yǔ)音識(shí)別服務(wù)器18還用于將識(shí)別結(jié)果傳送給接受者確定服務(wù)器16,所述識(shí)別結(jié)果優(yōu)選地是一組關(guān)鍵值對(duì)(key-value pair),其表示在所識(shí)別語(yǔ)音中的特定語(yǔ)法時(shí)隙(slot)值以及它們相關(guān)的識(shí)別可信值。接受者確定服務(wù)器用于接收所述關(guān)鍵值對(duì),并根據(jù)由識(shí)別器返回的關(guān)鍵值對(duì)而適當(dāng)?shù)剡M(jìn)行動(dòng)作,這將在后面描述。接受者確定服務(wù)器可以執(zhí)行的一個(gè)可能動(dòng)作是向音頻路由服務(wù)器14傳送以被撥叫號(hào)碼標(biāo)識(shí)符(DNI)形式的地址。另外,接受者確定服務(wù)器16還用于從用戶手機(jī)接收調(diào)用線標(biāo)識(shí)符(CLI)數(shù)據(jù)(稍后描述),并且還向用戶手機(jī)傳送最后候選人名單信息,這也將在后面描述。
返回考慮地址薄和語(yǔ)法數(shù)據(jù)庫(kù)20,其對(duì)于系統(tǒng)的各注冊(cè)用戶存儲(chǔ)語(yǔ)音識(shí)別語(yǔ)法,所述語(yǔ)法將關(guān)于可能接受者姓名的地址薄數(shù)據(jù)及其相應(yīng)的DNI進(jìn)行編碼。對(duì)于各注冊(cè)用戶存儲(chǔ)有單獨(dú)的用戶專用語(yǔ)法。下面顯示了語(yǔ)法的格式示例Names([(bob){return("Bob Smith +447711123456")}(peter jones){return("Peter Jones +447722123456")}(pete){return("Pete Brown +447733123456")}])Phonemes:filler[ph1ph2...ph41]Fillers:filler[Phonemes@-@]EndCall[end callover and out]Overall[( hi+Names:n (it′s Bob)*Fillers)(<action "placecall"><recipient >}*FillersEndCall{<action "endcall">}]撥號(hào)語(yǔ)法的生成可以是任何一種熟知的技術(shù),所述技術(shù)或者使用文本(例如,獲得用戶電話地址薄副本)或者使用用于語(yǔ)音號(hào)碼部分的地址薄和講話輸入的組合以限定姓名發(fā)音。
上面描述涉及的各種服務(wù)器優(yōu)選地包含在提供半雙工PTT通信服務(wù)的網(wǎng)絡(luò)內(nèi)或者形成其一部分。然而,為了更詳細(xì)地描述該實(shí)施例的操作,還有必要描述適用于本發(fā)明的移動(dòng)用戶手機(jī)的具體特征。圖1還示出采用移動(dòng)站A 10形式的手機(jī)。還顯示了移動(dòng)站B 12,但是其可以是如現(xiàn)有技術(shù)中公知的傳統(tǒng)的PTT使能手機(jī)。
因此參考移動(dòng)站A 10,移動(dòng)站A 10設(shè)置有PTT音頻客戶機(jī)A 102,其是控制移動(dòng)站10以提供傳統(tǒng)PTT功能性的合適軟件。即,PTT音頻客戶機(jī)A 102使得移動(dòng)站10能夠以傳統(tǒng)的方式使用PTT服務(wù)。然而,與現(xiàn)有技術(shù)的主要區(qū)別在于,PTT音頻客戶機(jī)A 102用于向音頻路由服務(wù)器14發(fā)送由手機(jī)A產(chǎn)生的數(shù)字化音頻數(shù)據(jù)以及移動(dòng)站10的調(diào)用線標(biāo)識(shí)符。
在移動(dòng)站10內(nèi)還設(shè)置有可視選擇器客戶機(jī)A 104。其是另一軟件程序,用于與網(wǎng)絡(luò)內(nèi)的接受者確定服務(wù)器16進(jìn)行接口,以在首次啟動(dòng)PTT呼叫時(shí)向其發(fā)送移動(dòng)站10的調(diào)用線標(biāo)識(shí)符(CLI),并且在由此確定多于一個(gè)的期望接受者的情況下,還從接受者確定服務(wù)器16接收候選接受者標(biāo)識(shí)符列表??梢曔x擇器客戶機(jī)A 104還用于在移動(dòng)站A的顯示器上顯示給用戶的這種最后候選人名單,以允許用戶選擇期望的接受者。然后將選擇信息發(fā)回給接受者確定服務(wù)器16。
在傳統(tǒng)的移動(dòng)站B 12內(nèi),設(shè)置有PTT音頻客戶機(jī)B 122,其與設(shè)置在移動(dòng)站10中的PTT音頻客戶機(jī)A 102基本相同。PTT音頻客戶機(jī)B 122用于向移動(dòng)站B 12提供傳統(tǒng)的PTT功能性,并且PTT音頻客戶機(jī)B 122與現(xiàn)有技術(shù)之間的僅有區(qū)別在于,PTT音頻客戶機(jī)B 122用于從作為音頻路由服務(wù)器14的一部分的音頻緩沖器142接收PTT消息。在所有其它方面,移動(dòng)站B 12可以是傳統(tǒng)的。
下面將參照?qǐng)D2(a)和圖2(b)來(lái)描述圖1實(shí)施例的操作。
在該實(shí)施例的操作的示例性描述中,假設(shè)移動(dòng)站A不具有任何正進(jìn)行的PTT呼叫,并且希望向移動(dòng)站B發(fā)送PTT消息。即,移動(dòng)站A的當(dāng)前狀態(tài)為至少在PTT超時(shí)時(shí)間(通常為20秒)內(nèi)其沒有向任何其它站發(fā)送或從其接收任何PTT呼叫。鑒于此,在本發(fā)明的實(shí)施例中,為了開始從移動(dòng)站A向移動(dòng)站B的呼叫,在步驟2.2,用戶A按下PTT按鈕。按下移動(dòng)站A上的PTT按鈕導(dǎo)致PTT音頻客戶機(jī)102以及可視選擇器客戶機(jī)104開始運(yùn)行。在步驟2.4,可視選擇器客戶機(jī)104連接至接受者確定服務(wù)器16,并向接受者確定服務(wù)器16發(fā)送移動(dòng)站A的調(diào)用線標(biāo)識(shí)符(CLI)。接下來(lái),(或者幾乎同時(shí)或者在此之前,步驟2.4和2.6的順序并不重要),PTT音頻客戶機(jī)102連接至音頻路由服務(wù)器14,并開始向音頻路由服務(wù)器14流送數(shù)字化音頻。為此,在步驟2.6,移動(dòng)站A的用戶A講出其希望通過(guò)PTT服務(wù)發(fā)送的消息,并且移動(dòng)站A將該消息數(shù)字化和分組化,從而以音頻流的方式流送給音頻路由服務(wù)器14。這種數(shù)字化和分組化在現(xiàn)有技術(shù)中是熟知的。除了使音頻流送給音頻服務(wù)器14之外,PTT音頻客戶機(jī)102還向音頻路由服務(wù)器14發(fā)送移動(dòng)站A的調(diào)用線標(biāo)識(shí)符(CLI)。
在步驟2.8,音頻路由服務(wù)器將所接收的音頻流緩沖在音頻緩沖器142中,并還在步驟2.10,將音頻流的副本轉(zhuǎn)發(fā)給語(yǔ)音識(shí)別服務(wù)器18。同時(shí),音頻路由服務(wù)器14還將移動(dòng)站A的調(diào)用線標(biāo)識(shí)符發(fā)送給語(yǔ)音識(shí)別服務(wù)器18。
接下來(lái),在步驟2.12,語(yǔ)音識(shí)別服務(wù)器18使用接收到的移動(dòng)站A的調(diào)用線標(biāo)識(shí)符以訪問(wèn)地址薄和語(yǔ)法數(shù)據(jù)庫(kù)20,從而從其檢索到存儲(chǔ)在其中用于移動(dòng)站A的特定用戶語(yǔ)法。應(yīng)理解的是,在以CLI為索引的地址薄和語(yǔ)法數(shù)據(jù)庫(kù)20中存儲(chǔ)有語(yǔ)音識(shí)別語(yǔ)法和詞匯,以允許檢索到專用于移動(dòng)站A的語(yǔ)法和詞匯。
接下來(lái),在步驟2.16,語(yǔ)音識(shí)別服務(wù)器18對(duì)從音頻路由服務(wù)器14接收的音頻流進(jìn)行語(yǔ)音識(shí)別處理。應(yīng)注意,語(yǔ)音識(shí)別服務(wù)器18可以在接收音頻流時(shí)對(duì)所接收的音頻流進(jìn)行語(yǔ)音識(shí)別,或者另選地可以在開始識(shí)別之前進(jìn)行等待直到在所述流中檢測(cè)到靜區(qū)(silence)(或者當(dāng)釋放PTT按鈕時(shí)的流的末端)。該選擇將取決于在語(yǔ)音識(shí)別服務(wù)器18中選擇使用的確切的語(yǔ)音識(shí)別軟件。由語(yǔ)音識(shí)別服務(wù)器18進(jìn)行的語(yǔ)音識(shí)別處理起到這樣的作用,其使用用于用戶的引導(dǎo)識(shí)別處理的識(shí)別語(yǔ)法來(lái)識(shí)別包含在從音頻路由服務(wù)器14接收的音頻流內(nèi)的用戶言語(yǔ)。在該實(shí)施例中,語(yǔ)音識(shí)別服務(wù)器然后通過(guò)Nuance NL時(shí)隙(當(dāng)使用前面提及的Nuance 7識(shí)別器時(shí))向接受者確定服務(wù)器返回關(guān)鍵信息,因此例如對(duì)于言語(yǔ)“over andout(結(jié)束并斷開)”,識(shí)別器將返回action=endofcall的關(guān)鍵值對(duì),而對(duì)于“Hi bob,it’s Bob(嗨!鮑勃,我是鮑勃)”,識(shí)別器將返回兩個(gè)關(guān)鍵值對(duì)action=placecall和recipient=“Bob Smith+447711123456”,如由用戶語(yǔ)法所確定的。通過(guò)關(guān)鍵值對(duì),識(shí)別器還提供識(shí)別可信值,其表示導(dǎo)致正確的特定關(guān)鍵值對(duì)的任何特定識(shí)別的可信程度。這種識(shí)別可信值在現(xiàn)有技術(shù)中是熟知的。
在進(jìn)行了識(shí)別并且向接受者確定服務(wù)器輸出了關(guān)鍵值對(duì)和可信值之后,在步驟2.20,由接受者確定服務(wù)器對(duì)返回的關(guān)鍵值對(duì)的可信值進(jìn)行評(píng)價(jià)。這里,可以將可信值與閾值等進(jìn)行比較,并且如果評(píng)價(jià)表明識(shí)別器確信該結(jié)果,則處理可以進(jìn)行到步驟2.22。這里,在步驟2.22,接受者確定服務(wù)器16將從接收關(guān)鍵值對(duì)獲得的、所確定的(一個(gè)或多個(gè))期望接受者的DNI發(fā)送給視頻路由服務(wù)器14,并且還作為確認(rèn)將其發(fā)送給移動(dòng)站A中的可視選擇器客戶機(jī)104。然后,在步驟2.24,音頻路由服務(wù)器通過(guò)使用PTT通信服務(wù),將來(lái)自音頻緩沖器142的緩沖音頻消息發(fā)送給從接受者確定服務(wù)器接收的、由(一個(gè)或多個(gè))DNI標(biāo)識(shí)的接受者。在這種情況下,假設(shè)從接受者確定服務(wù)器接收的(一個(gè)或多個(gè))DNI標(biāo)識(shí)移動(dòng)站B,在這種情況下音頻路由服務(wù)器通過(guò)通常的PTT使能網(wǎng)絡(luò),使來(lái)自音頻緩沖器142的音頻消息流送給移動(dòng)站B中的PTT音頻客戶機(jī)122。同時(shí),在步驟2.26,在移動(dòng)站A處的可視選擇器客戶機(jī)104在移動(dòng)站A的顯示器上向用戶A顯示所確定的(一個(gè)或多個(gè))DNI,作為已正確轉(zhuǎn)發(fā)了消息的確認(rèn)。因此,此時(shí),已經(jīng)由音頻路由服務(wù)器在移動(dòng)站A與移動(dòng)站B之間建立了PTT呼叫,然后可以以傳統(tǒng)的方式繼續(xù)PTT通信。
這里應(yīng)重點(diǎn)注意的是,當(dāng)講了兩個(gè)或更多個(gè)接受者標(biāo)識(shí)符時(shí)(這里考慮消息“皮特,鮑勃,我是大衛(wèi)”,在這種情況下皮特和鮑勃都是期望的接受者),語(yǔ)音識(shí)別服務(wù)器可以確信地識(shí)別兩個(gè)或多個(gè)期望的接受者。由于可以識(shí)別語(yǔ)法,所以可以返回這兩個(gè)或所有的期望接受者DNI,并且由于對(duì)這兩個(gè)或所有的可信識(shí)別,因此可以清楚所述消息期望發(fā)送給兩個(gè)或所有接受者。在這種情況下,接受者確定服務(wù)器控制音頻路由服務(wù)器,以對(duì)每一個(gè)確定的期望接受者(在該示例中為皮特和鮑勃)建立群組PTT呼叫。因此,該特征允許通過(guò)在消息中簡(jiǎn)單地表示各期望接受者(他們是群組呼叫的參與者)的姓名,而呼叫待被動(dòng)態(tài)定義的群組呼叫的組。
返回步驟2.20,如果此處進(jìn)行的評(píng)價(jià)沒有表明有可信結(jié)果,則接受者確定服務(wù)器在步驟2.28進(jìn)行進(jìn)一步評(píng)價(jià),以確定是否有一個(gè)或多個(gè)從語(yǔ)音識(shí)別器返回的非可信結(jié)果。如果是沒有返回關(guān)鍵值對(duì)的情況,則識(shí)別處理失敗。在這種情況下,在步驟2.36,接受者確定服務(wù)器向識(shí)別失敗的移動(dòng)站A處的可視選擇器客戶機(jī)104發(fā)送消息,然后在移動(dòng)站A處向用戶顯示識(shí)別失敗消息。在這種情況下,用戶A然后必須使用傳統(tǒng)的圖形用戶界面來(lái)選擇其消息的期望接受者。
然而,相反地,如果步驟2.28的評(píng)價(jià)表明有一個(gè)或多個(gè)非可信結(jié)果,則邀請(qǐng)用戶確認(rèn)所述一個(gè)或多個(gè)非可信結(jié)果。因此,在步驟2.30,接受者確定服務(wù)器16向移動(dòng)站A處的可視選擇器客戶機(jī)104發(fā)送所述一個(gè)或多個(gè)非可信結(jié)果列表??梢曔x擇器客戶機(jī)104然后在移動(dòng)站A的顯示器上在用戶顯示器上向用戶顯示接收的列表,并且在步驟2.32,用戶從該列表選擇期望的接受者。可視選擇器客戶機(jī)104然后在步驟2.34將選擇信息發(fā)回給接受者服務(wù)器16。接受者確定服務(wù)器接收該選擇信息而后返回步驟2.22,在該步驟,將所選的DNI(或者在選擇多個(gè)期望接受者情況下為多個(gè)DNI)發(fā)送給音頻路由服務(wù)器。處理然后進(jìn)行到步驟2.24,并如前所述地進(jìn)行。
因此,鑒于以上描述,可以看出本發(fā)明的實(shí)施例允許方便的PTT通信,而用戶無(wú)需經(jīng)歷特定撥號(hào)階段并等待隨后連接。在此方面,本發(fā)明利用PTT通信中的固有等待時(shí)間,具體地為其VoIP方案,并且利用該潛在時(shí)間對(duì)消息進(jìn)行語(yǔ)音識(shí)別和隨后的期望接受者確定,從而允許的自動(dòng)接受者或目的地選擇。因此,本發(fā)明提供的改進(jìn)的用戶經(jīng)歷優(yōu)于由現(xiàn)有技術(shù)中已知的傳統(tǒng)PTT通信服務(wù)提供的經(jīng)歷。
應(yīng)理解,可以對(duì)所述實(shí)施例進(jìn)行各種修改以得到其他實(shí)施例。例如,在另一實(shí)施例中,為了開始識(shí)別和接受者確定處理,在移動(dòng)站A處的用戶A必須例如通過(guò)雙擊PTT按鈕而發(fā)送來(lái)自移動(dòng)站A的啟動(dòng)信號(hào)。這種“雙擊”會(huì)致使可視選擇器客戶機(jī)A 104向接受者確定服務(wù)器16發(fā)送啟動(dòng)信號(hào),這又會(huì)向語(yǔ)音識(shí)別服務(wù)器18發(fā)送啟動(dòng)信號(hào)。這種顯式啟動(dòng)操作可有益于防止本發(fā)明在不期望情況下進(jìn)行操作。
作為另一變型例,在另一實(shí)施例中,用戶A可以使用本發(fā)明進(jìn)行群組呼叫。使用PTT進(jìn)行群組呼叫本身在現(xiàn)有技術(shù)中是已知的,其通過(guò)在各用戶地址薄中包括組名以及形成該組一部分的相關(guān)電話號(hào)碼而被包括以在本發(fā)明實(shí)施例中使用。在操作時(shí),用戶A說(shuō)出組名,該組名然后被語(yǔ)音識(shí)別服務(wù)器識(shí)別,并將所存儲(chǔ)的組名應(yīng)用用戶語(yǔ)法以確定該組的DNI。如果識(shí)別出組名,則接受者確定服務(wù)器就將屬于該組的各DNI發(fā)送給音頻路由服務(wù)器14,其然后以傳統(tǒng)的方式連接群組PTT呼叫。
在又一實(shí)施例中,設(shè)置語(yǔ)音識(shí)別服務(wù)器用來(lái)僅識(shí)別消息的前幾秒,以節(jié)約語(yǔ)音識(shí)別器資源。該特征基于這樣的前提,即,對(duì)于大多數(shù)問(wèn)候,都會(huì)在該限制內(nèi)說(shuō)出接受者姓名(考慮問(wèn)候“您好,鮑勃”,“早上好,皮特”等)。為此,在3至5秒之間的識(shí)別器時(shí)限應(yīng)該是足夠的。
對(duì)于在非可信結(jié)果的情況下期望接受者的選擇,在上述實(shí)施例中,描述了可視選擇器客戶機(jī)向用戶顯示最后候選人名單以供可視選擇。然而,在其它實(shí)施例中,接受者確定服務(wù)器可以包括語(yǔ)音合成器程序,其用于生成關(guān)于可用選擇的音頻提示,然后將其路由至手機(jī)上的PTT音頻客戶機(jī)102,以向該用戶進(jìn)行播放。應(yīng)注意,這可以與由可視選擇器客戶機(jī)顯示最后候選人名單同時(shí)進(jìn)行,從而可以由音頻和可視界面呈現(xiàn)這些選擇,或者另選地可以替換可視選擇。為了允許由期望接受者的用戶進(jìn)行口頭選擇(例如,當(dāng)讀取期望接受者時(shí)用戶說(shuō)“是”,并且/或者(可選地)當(dāng)播放非期望接受者姓名時(shí),或者另選地用戶說(shuō)“鮑勃史密斯”以在鮑勃史密斯和鮑勃約翰之間進(jìn)行區(qū)分時(shí)(這在前面簡(jiǎn)稱為“鮑勃”),用戶說(shuō)“否”),PTT音頻客戶機(jī)可以通過(guò)音頻路由服務(wù)器將任何用戶響應(yīng)發(fā)送給語(yǔ)音識(shí)別服務(wù)器以識(shí)別所述響應(yīng)。
最后,作為另一任選特征,在本發(fā)明的其它實(shí)施例中音頻路由服務(wù)器可用于修整被識(shí)別并用于從消息選擇期望接受者的音頻,并且僅發(fā)送消息的沒有用于期望接受者確定的部分。
盡管上面描述著重于本發(fā)明在建立PTT呼叫之前的操作,在另一模式,本發(fā)明的實(shí)施例可以在PTT呼叫期間操作(即,在期望消息在呼叫的兩方或更多方之間來(lái)回傳送時(shí)的PTT超時(shí)期間)以檢測(cè)預(yù)定的“結(jié)束呼叫”短語(yǔ),例如“結(jié)束并斷開”或者“結(jié)束呼叫”,從而操作以關(guān)閉呼叫。在該操作模式,將通過(guò)音頻路由服務(wù)器路由的音頻流復(fù)制到語(yǔ)音識(shí)別服務(wù)器,其對(duì)各個(gè)發(fā)送的消息進(jìn)行語(yǔ)音識(shí)別以檢測(cè)所述預(yù)定的結(jié)束呼叫短語(yǔ)。應(yīng)注意,可以預(yù)定多于一個(gè)的結(jié)束呼叫短語(yǔ),并且語(yǔ)音識(shí)別服務(wù)器可以檢測(cè)所述預(yù)定短語(yǔ)中的任一個(gè)。如果檢測(cè)到這種短語(yǔ),則語(yǔ)音識(shí)別服務(wù)器向關(guān)閉呼叫的音頻路由服務(wù)器發(fā)信號(hào)。同時(shí),語(yǔ)音識(shí)別服務(wù)器可以向接受者確定服務(wù)器16發(fā)信號(hào),其可以向用戶終端處的可視選擇器客戶機(jī)104發(fā)送“呼叫結(jié)束”信號(hào)。在這種情況下,可視選擇器客戶機(jī)104然后在移動(dòng)站10的顯示屏上向用戶顯示“呼叫結(jié)束”消息。同樣地,可以向移動(dòng)終端發(fā)送使用合成或存儲(chǔ)音頻消息的音頻“呼叫結(jié)束”輸出。
在上述實(shí)施例中,移動(dòng)站A和B通過(guò)使用蜂窩式無(wú)線網(wǎng)絡(luò)與服務(wù)器進(jìn)行通信。在另選實(shí)施例中,可以使用非蜂窩式無(wú)線接入網(wǎng)絡(luò),例如無(wú)線LAN、Wi-Fi和Bluetooth。在其他另選實(shí)施例中,可以固定一個(gè)或兩個(gè)終端(例如,個(gè)人計(jì)算機(jī))。
除非上下文清楚要求,否則在整個(gè)說(shuō)明書和權(quán)利要求書中,詞語(yǔ)“包括(comprise,comprising)”等應(yīng)理解為包含,而與排他或窮舉意義相對(duì);也就是說(shuō),意義為“包括但并不限于”。
權(quán)利要求
1.一種通信方法,包括以下步驟接收包含言語(yǔ)的聲音消息;對(duì)所接收的消息進(jìn)行緩沖;對(duì)所接收的聲音消息進(jìn)行語(yǔ)音識(shí)別處理以識(shí)別其中包含的言語(yǔ);如果可能,根據(jù)所識(shí)別的言語(yǔ)確定所述消息的期望接收者;以及如果確定了期望接受者,則使用由分組交換網(wǎng)絡(luò)提供的半雙工通信服務(wù)將所述消息發(fā)送給所確定的期望接收者。
2.根據(jù)權(quán)利要求1所述的方法,其中,當(dāng)所述確定步驟根據(jù)所識(shí)別的言語(yǔ)確定出一個(gè)或多個(gè)可能的期望接收者時(shí),所述方法還包括下面步驟向用戶指明所述一個(gè)或多個(gè)可能的期望接收者;以及從用戶接收選擇信號(hào),該信號(hào)指明應(yīng)該向其發(fā)送所述消息的所確定的所述一個(gè)或多個(gè)可能的期望接受者。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述指明步驟還包括生成與所述一個(gè)或多個(gè)可能的期望接受者相對(duì)應(yīng)的音頻語(yǔ)音提示;以及將所生成的音頻語(yǔ)音提示輸出給用戶。
4.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的方法,其中,當(dāng)所述確定步驟確定出多個(gè)期望接收者時(shí),使用半雙工通信服務(wù)的群組呼叫功能,將所述消息發(fā)送給所確定的各個(gè)接受者。
5.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的方法,其中,僅對(duì)所接收的聲音消息的一部分進(jìn)行所述語(yǔ)音識(shí)別處理。
6.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的方法,還包括以下步驟接收生成所述消息的用戶標(biāo)識(shí)的表示;以及根據(jù)用戶標(biāo)識(shí)選擇供所述語(yǔ)音識(shí)別處理使用的基于用戶的語(yǔ)音語(yǔ)法。
7.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法,還包括以下步驟從用戶接收語(yǔ)音識(shí)別啟動(dòng)信號(hào),其中根據(jù)該信號(hào)的接收而執(zhí)行所述語(yǔ)音識(shí)別和確定步驟。
8.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的方法,還包括以下步驟監(jiān)測(cè)由所述半雙工通信服務(wù)傳輸?shù)南ⅲ粚?duì)所監(jiān)測(cè)的消息進(jìn)行語(yǔ)音識(shí)別處理,以確定其中所包含的相應(yīng)言語(yǔ);以及如果確定在所述消息中的任一個(gè)中包含有預(yù)定言語(yǔ),則發(fā)送所述半雙工通信服務(wù)應(yīng)停止傳輸消息的信號(hào)。
9.一種計(jì)算機(jī)程序或一組計(jì)算機(jī)程序,被設(shè)置成,在被計(jì)算機(jī)系統(tǒng)執(zhí)行時(shí),該計(jì)算機(jī)程序或該組計(jì)算機(jī)程序使得計(jì)算機(jī)程序執(zhí)行前述權(quán)利要求中的任一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其存儲(chǔ)根據(jù)權(quán)利要求9所述的計(jì)算機(jī)程序或者一套計(jì)算機(jī)程序中的任一個(gè)或多個(gè)。
11.一種通信系統(tǒng),包括聲音消息接收裝置,用于接收包含言語(yǔ)的聲音消息;存儲(chǔ)裝置,用于對(duì)所接收的消息進(jìn)行緩沖;語(yǔ)音識(shí)別器,其被設(shè)置成用于對(duì)包含在所接收的消息中的言語(yǔ)進(jìn)行識(shí)別;接收者確定裝置,其被設(shè)置成如果可能,根據(jù)所識(shí)別的言語(yǔ)確定所述消息的期望接收者;以及消息發(fā)送裝置,如果確定了期望接受者,則該消息發(fā)送裝置使用由分組交換網(wǎng)絡(luò)提供的半雙工通信服務(wù)將所述消息發(fā)送給所確定的期望接收者。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),還包括指明裝置,用于向用戶指明所確定的一個(gè)或多個(gè)可能的期望接受者;以及選擇信號(hào)接收裝置,用于從用戶接收選擇信號(hào),該信號(hào)指明應(yīng)該向其發(fā)送所述消息的所確定的所述一個(gè)或多個(gè)可能的期望接收者。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其中,所述指明裝置還包括音頻提示生成裝置,用于生成與所述一個(gè)或多個(gè)可能的期望接收者相對(duì)應(yīng)的音頻語(yǔ)音提示;以及輸出器,用于將所生成的音頻語(yǔ)音提示輸出給用戶。
14.根據(jù)權(quán)利要求11至13中的任一項(xiàng)所述的系統(tǒng),其中,當(dāng)所述接收者確定裝置確定多個(gè)期望接收者時(shí),所述消息發(fā)送裝置還被設(shè)置成使用半雙工通信服務(wù)的群組呼叫功能,將所述消息發(fā)送給所確定的各個(gè)接收者。
15.根據(jù)權(quán)利要求11至14中的任一項(xiàng)所述的系統(tǒng),其中,所述語(yǔ)音識(shí)別器僅對(duì)所接收的聲音消息的一部分進(jìn)行操作。
16.根據(jù)權(quán)利要求11至15中的任一項(xiàng)所述的系統(tǒng),還包括表示接收裝置,用于接收生成所述消息的用戶標(biāo)識(shí)的表示;以及語(yǔ)法選擇裝置,用于根據(jù)用戶標(biāo)識(shí)選擇供所述語(yǔ)音識(shí)別處理使用的基于用戶的語(yǔ)音語(yǔ)法。
17.根據(jù)權(quán)利要求11至16中的任一項(xiàng)所述的系統(tǒng),還包括語(yǔ)音識(shí)別啟動(dòng)信號(hào)接收裝置,用于從用戶接收語(yǔ)音識(shí)別啟動(dòng)信號(hào),其中所述語(yǔ)音識(shí)別器和接收者確定裝置可根據(jù)對(duì)該語(yǔ)音識(shí)別啟動(dòng)信號(hào)的接收而進(jìn)行操作。
18.根據(jù)權(quán)利要求11至17中的任一項(xiàng)所述的系統(tǒng),還包括用于監(jiān)測(cè)由所述半雙工通信服務(wù)傳輸?shù)南⒌难b置;所述語(yǔ)音識(shí)別器還被設(shè)置成對(duì)所監(jiān)測(cè)的消息進(jìn)行語(yǔ)音識(shí)別處理,以確定其中所包含的相應(yīng)言語(yǔ);所述系統(tǒng)還包括信號(hào)發(fā)送裝置,如果確定在所述消息中的任一個(gè)中包含有預(yù)定言語(yǔ),則發(fā)送所述半雙工通信服務(wù)應(yīng)停止傳輸消息的信號(hào)。
全文摘要
用于一鍵通(PTT)通信系統(tǒng)的通信方法和系統(tǒng),其中,使用語(yǔ)音識(shí)別器來(lái)對(duì)通過(guò)PTT通信服務(wù)進(jìn)行傳輸?shù)乃v的消息中的言語(yǔ)進(jìn)行識(shí)別,并且分析所識(shí)別的言語(yǔ)以試圖確定所述消息的期望接受者。如果可以明確地確定期望接受者,則建立PTT呼叫以將所述消息轉(zhuǎn)發(fā)給所確定的接受者。如果確定出多個(gè)潛在的接受者,則向用戶顯示選擇列表以允許用戶選擇期望接受者。
文檔編號(hào)H04M3/523GK1891004SQ200480035970
公開日2007年1月3日 申請(qǐng)日期2004年11月25日 優(yōu)先權(quán)日2003年12月3日
發(fā)明者弗朗西斯·詹姆士·斯卡西爾, 西蒙·帕特里克·亞歷山大·林蘭 申請(qǐng)人:英國(guó)電訊有限公司