專利名稱:音頻流中電話號(hào)碼的處理的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及無線通信系統(tǒng),并且具體涉及用于處理音頻流中電話號(hào)碼的出現(xiàn)的技術(shù)。
背景技術(shù):
無線通信系統(tǒng)在本領(lǐng)域中為人熟知。在這樣的系統(tǒng)中,典型地,系統(tǒng)由無線基礎(chǔ)設(shè)施支持,無線基礎(chǔ)設(shè)施無線地連通一臺(tái)或更多無線通信設(shè)備(或移動(dòng)設(shè)備),例如手機(jī)或便攜式無線設(shè)備。而且,無線基礎(chǔ)設(shè)施和其他網(wǎng)絡(luò)之間的適當(dāng)連接,例如所謂的普通老式電話系統(tǒng)(POTS)或互聯(lián)網(wǎng),允許移動(dòng)設(shè)備的用戶與其他未裝備類似移動(dòng)設(shè)備的用戶群通信。一般來講,這樣的無線系統(tǒng)為其用戶提供便利的手段來與其他運(yùn)動(dòng)中的人通信。
這種移動(dòng)設(shè)備的便攜性在某些方面具有很大優(yōu)勢的同時(shí),也導(dǎo)致了以前未曾見過的困難。例如,在移動(dòng)環(huán)境中(例如遠(yuǎn)離辦公室或住宅),用戶經(jīng)常缺乏記錄語音通信過程中所傳達(dá)信息的能力。在接收用戶正在接聽直接由另一個(gè)用戶提供的(例如在典型的語音談話情況下)或來自存儲(chǔ)設(shè)備的(例如語音郵件系統(tǒng)或電話應(yīng)答機(jī))音頻信號(hào)時(shí),這種情況經(jīng)常發(fā)生,接收用戶需要的電話號(hào)碼出現(xiàn)在音頻流中。除非接收用戶手邊恰好有某種快速記錄電話號(hào)碼的手段以備后用(例如一支鋼筆和紙),接收用戶經(jīng)常不得不努力快速記住這些電話號(hào)碼。在錄音音頻情況下,用戶可以錄音重放并多次聽取電話號(hào)碼以便記住它,盡管這樣可能給用戶帶來不便之處。另外,這樣的多次錄音重放對(duì)用戶來說是額外的時(shí)間費(fèi)用開銷。注意重放音頻的時(shí)機(jī)在典型的實(shí)況轉(zhuǎn)播語音通信中并不是可選的。此外,即使用戶手邊確實(shí)有某種手段來記錄電話號(hào)碼,許多移動(dòng)環(huán)境的性質(zhì)也使它不允許接收用戶從他或她當(dāng)前的行為(例如正在開車、步行在擁擠的街道等)分心以記錄電話號(hào)碼或轉(zhuǎn)移足夠的注意力來記住這些號(hào)碼。
因此,提供一種用于移動(dòng)設(shè)備檢測和處理音頻流中所出現(xiàn)電話號(hào)碼以采集該電話號(hào)碼以備后用的技術(shù)是很有益的。這樣的技術(shù)更適于以自動(dòng)方式或最小限度用戶輸入來工作,同時(shí)仍然考慮用戶干預(yù)以確保所采集電話號(hào)碼的準(zhǔn)確性。
圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例給出的無線通信系統(tǒng)框圖。
圖2是根據(jù)本發(fā)明的一個(gè)實(shí)施例給出的無線通信系統(tǒng)框圖。
圖3是根據(jù)本發(fā)明的一個(gè)實(shí)施例給出的處理音頻流中電話號(hào)碼技術(shù)的數(shù)據(jù)流程圖。
圖4是根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例說明一種方法的流程圖。
具體實(shí)施例方式
本發(fā)明提供一種技術(shù)用于處理出現(xiàn)在通信設(shè)備音頻流中的電話號(hào)碼。特別地,多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn)可以使用語音分析技術(shù)從音頻流中識(shí)別出來。在一個(gè)優(yōu)選實(shí)施例中,音頻流包括接收到的音頻流,盡管本發(fā)明也可用于由通信設(shè)備發(fā)送的音頻流。與多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn)相對(duì)應(yīng)的一個(gè)或更多號(hào)碼模式其后都可以識(shí)別并存儲(chǔ)以備通信設(shè)備的用戶以后使用。在一個(gè)優(yōu)選實(shí)施例中,該出現(xiàn)與相對(duì)應(yīng)的一個(gè)或更多號(hào)碼模式通過過濾以減小誤測音頻流中電話號(hào)碼的可能性。而且,檢測到的號(hào)碼模式可以根據(jù)至少一個(gè)用戶定義規(guī)則擴(kuò)充或變換。以這種方式檢測到(和過濾/擴(kuò)充)的號(hào)碼模式結(jié)果可以向用戶展示,從而允許用戶進(jìn)一步編輯號(hào)碼模式。通過把號(hào)碼模式存儲(chǔ)在永久存儲(chǔ)器中,例如用戶定義的電話號(hào)碼簿,以這種方式采集的電話號(hào)碼可以被重新呼叫任意次數(shù)。而且,音頻流可以連續(xù)存儲(chǔ)以便音頻流中最近接收的部分可用于分析或響應(yīng)用戶發(fā)出的指令進(jìn)行錄音重放。當(dāng)在這部分音頻流中檢測到一個(gè)或更多號(hào)碼模式時(shí),該部分可以在這一個(gè)或更多號(hào)碼模式提供給用戶的同時(shí)重放(即,使它能被聽見),從而允許用戶檢驗(yàn)所采集電話號(hào)碼的準(zhǔn)確性。以這種方式,本發(fā)明提供一種便利可靠的機(jī)制采集音頻流中的電話號(hào)碼。
下面進(jìn)一步結(jié)合圖1-4更充分地描述本發(fā)明的這些和其他優(yōu)點(diǎn)?,F(xiàn)在參見圖1,說明了無線通信系統(tǒng)100的框圖。特別地,該系統(tǒng)100包括經(jīng)由一個(gè)或更多無線信道120-122與無線基礎(chǔ)設(shè)施106無線通信的多個(gè)無線通信設(shè)備(或移動(dòng)設(shè)備)102-104。移動(dòng)設(shè)備102-104,下文參照?qǐng)D2更詳細(xì)說明,可以包括至少能接收音頻流的任意無線通信設(shè)備,例如手機(jī)、雙向無線電對(duì)講機(jī)、無線個(gè)人數(shù)字助理等。盡管本發(fā)明主要應(yīng)用于移動(dòng)設(shè)備,它也可以應(yīng)用于任意類型的通信設(shè)備,包括非移動(dòng)設(shè)備,例如傳統(tǒng)的有線電話和類似的設(shè)備。無線基礎(chǔ)設(shè)施106包括支持這樣的無線通信必要的那些組件,正如本領(lǐng)域中已知的,這些組件的細(xì)節(jié)將隨所應(yīng)用系統(tǒng)100的類型而變化。這樣的典型組件包括基站、資源控制器、代碼轉(zhuǎn)換器、開關(guān)和本領(lǐng)域普通技術(shù)人員都知道的其他各種組件。無線信道120-122同樣由所實(shí)現(xiàn)系統(tǒng)100的性質(zhì)決定。但是一般來講,無線信道120-122可以包括任何無線信道,例如射頻(RF)信道、紅外信道等,支持任何合適的調(diào)制協(xié)議(例如,調(diào)頻、調(diào)幅等)和/或接入?yún)f(xié)議,例如頻分多路復(fù)用(FDM)、時(shí)分多路復(fù)用(TDM)或碼分多路復(fù)用(CDM)協(xié)議。注意可以提供額外的無線信道124,上文描述的類型,以支持移動(dòng)到移動(dòng)的通信,以便移動(dòng)設(shè)備102-104可以互相通信而不受無線基礎(chǔ)設(shè)施的干擾。
如圖1所示,無線基礎(chǔ)設(shè)施106可以支持到其他通信網(wǎng)絡(luò)108-110的連接以便其他類型的通信設(shè)備112-114可以與移動(dòng)設(shè)備102-104通信。例如,正如本領(lǐng)域中已知的,無線基礎(chǔ)設(shè)施106可以支持到所謂普通老式電話系統(tǒng)(POTS)108的連接以便傳統(tǒng)的有線電話機(jī)112可以與移動(dòng)設(shè)備102-104通信。另外,無線基礎(chǔ)設(shè)施106可以支持與計(jì)算機(jī)網(wǎng)絡(luò)110(例如互聯(lián)網(wǎng)、萬維網(wǎng)、專用網(wǎng)、它們的組合等)的連接以便基于計(jì)算機(jī)的平臺(tái)114(例如個(gè)人電腦、筆記本電腦、掌上電腦等)也可以與移動(dòng)設(shè)備102-104通信。使這種基于計(jì)算機(jī)的平臺(tái)能與移動(dòng)設(shè)備通信的技術(shù)在本領(lǐng)域中為人熟知。要進(jìn)一步說明的是,根據(jù)設(shè)計(jì)選擇,除了圖示的網(wǎng)絡(luò)108-110,圖1中沒有顯示的其他網(wǎng)絡(luò)也可以連接到無線基礎(chǔ)設(shè)施106。
參照?qǐng)D2進(jìn)一步說明合乎本發(fā)明的移動(dòng)設(shè)備102-104。特別地,這樣的移動(dòng)設(shè)備包括連接到適當(dāng)顯示設(shè)備204、揚(yáng)聲器206、發(fā)射機(jī)208、接收機(jī)210和其他輸入/輸出設(shè)備212的控制器202。控制器202可以包括能夠操作輸入數(shù)據(jù)和信號(hào)并按照需要提供輸出數(shù)據(jù)和信號(hào)的任何設(shè)備或者設(shè)備組合。這種控制器的各種設(shè)計(jì)在本領(lǐng)域內(nèi)為人熟知。在一個(gè)優(yōu)選實(shí)施例中,控制器202包括能夠保持狀態(tài)信息的設(shè)備,例如微處理器、微控制器、數(shù)字信號(hào)處理器、協(xié)處理器、可編程邏輯、專用集成電路等或它們的組合。在一些實(shí)例中,控制器可以包括一個(gè)或更多存儲(chǔ)器件,例如適用于數(shù)據(jù)或可執(zhí)行指令非永久性或永久性存儲(chǔ)的易失性(例如隨機(jī)存取存儲(chǔ)器)或非易失性(例如電可擦寫可編程只讀存儲(chǔ)器)存儲(chǔ)器。下文描述的各種技術(shù)更適宜用可執(zhí)行指令實(shí)現(xiàn)的軟件代碼段來實(shí)現(xiàn)。正如這里所用,這樣的代碼段可以包括用于執(zhí)行特殊操作的一個(gè)或更多可執(zhí)行指令的任何分組(即鄰接的或非鄰接的)。這樣的代碼段可以根據(jù)設(shè)計(jì)選擇存儲(chǔ)在單個(gè)存儲(chǔ)器件或分配到幾個(gè)存儲(chǔ)器件中。盡管下文描述的特殊操作可以歸結(jié)為單個(gè)這樣的代碼段,本領(lǐng)域普通技術(shù)人員很容易想到這些特殊操作可以以各種不同方式分配到幾個(gè)代碼段中而不損失功能性。
顯示器204可以包括使移動(dòng)設(shè)備用戶可看見數(shù)據(jù)的任何適宜裝置,例如液晶顯示器(LCD)。揚(yáng)聲器206可以包括使移動(dòng)設(shè)備用戶可聽到音頻信號(hào)的任何適宜裝置。支持顯示器204(例如圖像協(xié)處理器)和揚(yáng)聲器206(例如數(shù)模轉(zhuǎn)換器)的其他設(shè)備,盡管圖中沒有顯示,可以根據(jù)設(shè)計(jì)選擇加入到該移動(dòng)設(shè)備中。發(fā)射機(jī)208可以包括本領(lǐng)域中已知的任何合適的無線調(diào)制/放大設(shè)備。同樣地,接收機(jī)210可以包括本領(lǐng)域中已知的任何合適的無線解調(diào)/鑒別設(shè)備。實(shí)際上,發(fā)射機(jī)208與接收機(jī)210的特別配置和操作將取決于系統(tǒng)100支持的無線信道和通信協(xié)議的配置。
最后,其他輸入/輸出設(shè)備212包括向控制器202提供信號(hào)或從控制器202獲得信號(hào)的所有其他裝置。例如,移動(dòng)設(shè)備可以包括擴(kuò)音器、觸摸屏、字母數(shù)字鍵盤、各種按鈕、軟鍵、開關(guān)、撥號(hào)盤或本領(lǐng)域中已知的其他用戶可操作設(shè)備。此外,可以提供一個(gè)數(shù)據(jù)端口以便各種類型的信息,包括音頻流,可以直接輸入到控制器202。同樣地,也可以應(yīng)用各種其他類型的輸出設(shè)備,例如發(fā)光二極管(LED)、報(bào)警器、振蕩器和類似的器件。其他輸入/輸出設(shè)備212的性質(zhì)和外延是設(shè)計(jì)選擇的問題,本發(fā)明不需要在這方面受到限制。在本發(fā)明的一個(gè)實(shí)施例中,其他輸入/輸出設(shè)備212包括用于向控制器提供指令以采集音頻流一部分、請(qǐng)求號(hào)碼模式顯示、請(qǐng)求音頻流的已存儲(chǔ)部分重放以及提供對(duì)所顯示號(hào)碼模式編輯的裝置。
現(xiàn)在參見圖3,提供合乎本發(fā)明實(shí)施例的數(shù)據(jù)流程圖。圖3中說明的各功能模塊300-312更適宜使用傳統(tǒng)的編程技術(shù)以上文描述的代碼段來實(shí)現(xiàn)。如圖所示,音頻流接收段300提供音頻流320作為輸出,音頻流可以來自許多源中的任意一個(gè)。在本發(fā)明范圍內(nèi),音頻流可以包括代表接收自任何源的音頻信號(hào)的任何信息形式。在當(dāng)前的優(yōu)選實(shí)施例中,音頻流由移動(dòng)設(shè)備經(jīng)由無線信道接收,以后向移動(dòng)設(shè)備的用戶展示。但是實(shí)際上,該音頻流可以來自任何源,包括存在于移動(dòng)設(shè)備中的音頻源(例如擴(kuò)音器或數(shù)據(jù)端口)。另外,該音頻流可以是實(shí)時(shí)語音數(shù)據(jù),如在手機(jī)通話情況下,或者可以是存儲(chǔ)的音頻數(shù)據(jù),如在錄音消息重放情況下。無論如何,音頻流320更適宜是適于語音分析段302進(jìn)行語音分析的形式。如果不是適于語音分析的形式,如在一些壓縮音頻格式情況下,可能需要音頻流接收段300或語音分析段302進(jìn)行轉(zhuǎn)換。
語音分析段302實(shí)現(xiàn)本領(lǐng)域內(nèi)已知的語音識(shí)別技術(shù)。特別地,語音分析段302執(zhí)行的語音識(shí)別優(yōu)先包括與說話者無關(guān)的專用語音識(shí)別。就是說,語音分析段特別做出修改以用于識(shí)別電話號(hào)碼相關(guān)語音模式(或數(shù)字發(fā)音)的出現(xiàn),它出現(xiàn)在任意說話人提供的音頻流中。正如這里所用,電話號(hào)碼相關(guān)語音模式包括人類語音發(fā)音的參數(shù)表示法或其他表示法,人類語音發(fā)音一般在說電話號(hào)碼或以別的可聽形式傳送電話號(hào)碼時(shí)發(fā)生。這樣的電話號(hào)碼相關(guān)語音模式可以存儲(chǔ)在合適的永久存儲(chǔ)器中。
例如,電話號(hào)碼典型地以逐字原則說出。因此,電話號(hào)碼“555-123-4567”(北美一般使用10個(gè)數(shù)字)很可能說成“五,五,五,一,二,三,四,五,六,七”而不是“五十五億五千一百二十三萬四千五百六十七”或者“五百五十五,一百二十三,四千五百六十七”。但是,這種主要的逐字規(guī)則也經(jīng)常有例外。例如,電話號(hào)碼“800-555-1000”可以說成“八百,五,五,五,一千”。另一個(gè)例子,最后四位數(shù)字由“3452”構(gòu)成的電話號(hào)碼可以說成“三,四,五,六”或“三十四,五十二”。此外,某些說話者可能使用單個(gè)數(shù)字的其他表達(dá),例如,用英文字母“O”(發(fā)音為“oh”)代替“零”。在當(dāng)前的優(yōu)選實(shí)施例中,提供了上文描述的多個(gè)電話號(hào)碼相關(guān)語音模式類型(例如,“零”、“一”、“二”、“三”、“四”、“五”、“六”、“七”、“八”、“九”、“O”、“三十四”、“五十二”、“八百”、“一千”等)并把它們用作識(shí)別音頻流中號(hào)碼的出現(xiàn)的基本原則。因?yàn)樵谶@種方式下語音識(shí)別的詞匯量受到限制,預(yù)計(jì)可以實(shí)現(xiàn)以與說話者無關(guān)為原則的可靠語音識(shí)別。
在本發(fā)明的一個(gè)實(shí)施例中,語音分析段302是一個(gè)具有兩個(gè)狀態(tài)的狀態(tài)機(jī)。在可以稱為空狀態(tài)的第一狀態(tài)下,語音分析段302在傾聽以尋找數(shù)字發(fā)音的出現(xiàn)。語音分析段302保持在該狀態(tài)直到檢測到一個(gè)數(shù)字發(fā)音,在這時(shí)候它轉(zhuǎn)換到第二狀態(tài),第二狀態(tài)可稱為串內(nèi)狀態(tài)。一旦轉(zhuǎn)換到串內(nèi)狀態(tài),就假設(shè)檢測到的數(shù)字發(fā)音位于一串?dāng)?shù)字發(fā)音的開始。當(dāng)工作于串內(nèi)狀態(tài)時(shí),語音分析段嘗試識(shí)別滿足各種標(biāo)準(zhǔn)的更多數(shù)字發(fā)音的出現(xiàn)以建立一串相關(guān)的數(shù)字發(fā)音。一旦滿足各種標(biāo)準(zhǔn),就輸出與該數(shù)字發(fā)音串相對(duì)應(yīng)的一串檢測到的號(hào)碼模式,且處理返回到空狀態(tài)。在本發(fā)明的各種實(shí)施例中,確定一串?dāng)?shù)字發(fā)音是否已經(jīng)終止可以基于數(shù)字發(fā)音檢測之間經(jīng)過的時(shí)間長度或者在檢測到數(shù)字發(fā)音之后檢測到的許多非數(shù)字發(fā)音。例如,如果檢測到一個(gè)數(shù)字發(fā)音后過了大于兩秒鐘,可以假設(shè)該數(shù)字發(fā)音已經(jīng)終止。另外,除了該技術(shù),為了同樣的目的也可以跟蹤許多非數(shù)字發(fā)音。因此,例如,如果一個(gè)數(shù)字發(fā)音之后發(fā)生多于三個(gè)非數(shù)字發(fā)音,也可以假設(shè)該數(shù)字發(fā)音已經(jīng)終止。根據(jù)語音識(shí)別分析的性質(zhì)可以以各種方式跟蹤非數(shù)字發(fā)音的個(gè)數(shù)。一般來講,這通過識(shí)別語音的基本結(jié)構(gòu)以及對(duì)該結(jié)構(gòu)出現(xiàn)次數(shù)而不是對(duì)數(shù)字發(fā)音計(jì)數(shù)來實(shí)現(xiàn)。例如,非數(shù)字發(fā)音中的音節(jié)可以確定,或者甚至非數(shù)字發(fā)音中的不同音素也可以確定。在任何事件中,都要注意這里描述的閾值僅作為示范。而且,本領(lǐng)域普通技術(shù)人員很容易想到用于確定一串?dāng)?shù)字發(fā)音終止的其他標(biāo)準(zhǔn)也都可以使用,例如,發(fā)音之后出現(xiàn)足夠長時(shí)間無聲。如果滿足某一合適的標(biāo)準(zhǔn),語音分析段302返回到空狀態(tài)并且假設(shè)前面的數(shù)字發(fā)音串已經(jīng)終止。否則,假設(shè)在時(shí)間上緊接(或者通過插入若干非數(shù)字發(fā)音而緊接)的數(shù)字發(fā)音相互關(guān)聯(lián)以形成一個(gè)連續(xù)的數(shù)字發(fā)音串。
一旦檢測到電話號(hào)碼相關(guān)語音模式(或者一串?dāng)?shù)字發(fā)音),就識(shí)別出對(duì)應(yīng)于電話號(hào)碼相關(guān)語音模式的號(hào)碼模式322并把它作為語音分析段302的輸出。例如,當(dāng)檢測到對(duì)應(yīng)于“八百”、“O”、“一”和“五”的語音模式時(shí),提供數(shù)字“800”、“0”、“1”和“5”作為檢測到的號(hào)碼模式串。這串檢測到的號(hào)碼模式322(定義為一個(gè)或更多號(hào)碼模式的串)更適宜作為過濾段304的輸入,該過濾段對(duì)檢測到的號(hào)碼模式串施加一系列規(guī)則或模式以減小把該串錯(cuò)誤地識(shí)別為電話號(hào)碼的可能性。注意這樣的過濾不是必要條件,但是為了減少錯(cuò)誤的發(fā)生它是可取的。
在當(dāng)前的優(yōu)選實(shí)施例中,過濾通過使檢測到的號(hào)碼模式串服從一個(gè)或更多過濾器規(guī)則來實(shí)現(xiàn),即,檢查所檢測到號(hào)碼模式的各種特性以了解該號(hào)碼串是否與期望的或非期望的特性相匹配。這樣的規(guī)則可以是預(yù)配置和靜態(tài)的,也可以是用戶可配置和動(dòng)態(tài)的。在一個(gè)實(shí)施例中,檢測到的各串號(hào)碼模式的長度(就數(shù)字個(gè)數(shù)而言)與電話號(hào)碼的標(biāo)準(zhǔn)長度相比較。例如,在美國和加拿大,電話號(hào)碼典型地包括7個(gè)或10個(gè)數(shù)字。在其他國家,電話號(hào)碼常常具有其他的傳統(tǒng)長度。另外,一些私人交換機(jī)可能接受例如5個(gè)數(shù)字長的號(hào)碼,即電話號(hào)碼“576-1234”可以對(duì)內(nèi)部訪問本地交換的人等效表達(dá)為“6-1234”。因此,一串檢測到的與這樣的傳統(tǒng)長度不匹配的特定號(hào)碼模式不太可能是一個(gè)電話號(hào)碼,因而被忽略。
在另一個(gè)實(shí)施例中,檢查檢測到的各串號(hào)碼模式內(nèi)容并且與基準(zhǔn)模式比較。例如,在美國,號(hào)碼“312”是一個(gè)有效的區(qū)號(hào),而號(hào)碼“311”不是。因此,10個(gè)數(shù)字的號(hào)碼模式“312xxxxxxx”(其中“xxxxxxx”為有效的7個(gè)數(shù)字的任意號(hào)碼)可能是一個(gè)有效的電話號(hào)碼,而10個(gè)數(shù)字的號(hào)碼模式“311xxxxxxx”不是一個(gè)有效的電話號(hào)碼?;趨^(qū)號(hào)的這種規(guī)則可以考慮所有可能的區(qū)號(hào),或者可以僅限于特定用戶可能遇到的那些區(qū)號(hào)。
在另一個(gè)與上述實(shí)施例相關(guān)的實(shí)施例中,在分析音頻流(或者接收語音)時(shí),考慮移動(dòng)設(shè)備注冊(cè)的地點(diǎn)或地區(qū)。例如,如果移動(dòng)設(shè)備在美國運(yùn)行,可以依照上述實(shí)施例使用一套規(guī)則。但是,如果相同的單元現(xiàn)在在另一個(gè)國家運(yùn)行,可以依照上述實(shí)施例使用一套不同的規(guī)則。
過濾段304也可以解決所檢測到號(hào)碼模式串的多義性。例如,如果語音分析段302識(shí)別出發(fā)音“三十五,四十二”,則檢測到的號(hào)碼模式可能是“35”和“42”。但是,如果已知人們有時(shí)候表達(dá)號(hào)碼的方式,該發(fā)音可以同樣認(rèn)為是“305402”或“3542”。為了說明這樣的情況,過濾段304可以包括嘗試解決這種多義性而有利于找到電話號(hào)碼的規(guī)則。例如,如果電話號(hào)碼“800-555-3542”表示為發(fā)音“八百,五,五,五,三十五,四十二”,檢測到的號(hào)碼模式串可能為“800555305402”、“80055535402”、“80055530542”或“8005553542”。在這四種可能的號(hào)碼模式串中,只有最后一個(gè)與有效的10數(shù)字電話號(hào)碼相稱。過濾段304識(shí)別出這些可能性并自動(dòng)解決多義性,有利于選擇可能的與有效電話號(hào)碼匹配(最接近)的結(jié)果。
關(guān)鍵字發(fā)音檢測段(未顯示)也可以包括在內(nèi),或者遠(yuǎn)離語音分析段302或過濾段304存在并與它們協(xié)同工作。本發(fā)明范圍內(nèi)的關(guān)鍵字是指時(shí)常伴隨電話號(hào)碼或其他類型號(hào)碼的非數(shù)字發(fā)音。在電話號(hào)碼相關(guān)語音模式情況下,關(guān)鍵字發(fā)音可以用參數(shù)表示以備語音識(shí)別算法使用。例如,單詞“分機(jī)”在描述電話號(hào)碼時(shí)經(jīng)常使用。單詞“分機(jī)”的出現(xiàn)在時(shí)間上緊接多個(gè)數(shù)字發(fā)音,因此對(duì)語音分析過程來說是一個(gè)暗示,單詞“分機(jī)”前后出現(xiàn)的數(shù)字發(fā)音與同一串號(hào)碼相關(guān)。而且,所得的號(hào)碼模式串可以包括一個(gè)符號(hào)(例如逗號(hào)、破折號(hào)或其他記號(hào))表示單詞“分機(jī)”在這串?dāng)?shù)字發(fā)音中出現(xiàn)的點(diǎn)。相反地,其他類型的關(guān)鍵字常常伴隨除電話號(hào)碼之外的號(hào)碼。例如,像“街道”、“大街”、“車道”、“林蔭大道”等單詞更可能伴隨著居住地址(例如“312主街”)而不是電話號(hào)碼。正如這些,時(shí)間上緊接這種關(guān)鍵字的數(shù)字發(fā)音更不可能是電話號(hào)碼的一部分。相同的原則適用于州名。例如,考慮由“52主街哈佛伊利諾斯州60033”構(gòu)成的音頻流。數(shù)字“52”和“60033”之間出現(xiàn)單詞“街”和“伊利諾斯州”表明該發(fā)音對(duì)應(yīng)于一個(gè)居住地址而不是電話號(hào)碼“526-0033”。
以這種方式使用的更多“關(guān)鍵字”實(shí)際上可以對(duì)應(yīng)于特殊類型的發(fā)音,典型地,它們出現(xiàn)在人們說話暫停時(shí),即所謂的暫停填充。例如,人們敘述電話號(hào)碼時(shí)在號(hào)碼之間插入“啊”或“嗯”的聲音是很常見的。這種類型的發(fā)音不提供任何額外的關(guān)于特定數(shù)字發(fā)音串是否已結(jié)束的理解,從而構(gòu)成語音分析過程在嘗試識(shí)別數(shù)字發(fā)音串時(shí)忽略的發(fā)音類別。例如,可以建立終止標(biāo)準(zhǔn)以使這樣的發(fā)音不對(duì)用來確定一串?dāng)?shù)字發(fā)音何時(shí)結(jié)束的衡量準(zhǔn)則做出貢獻(xiàn)。
如上文所描述,過濾段304幫助確保只檢測到并采集有效的電話號(hào)碼。更進(jìn)一步的處理可能要使用號(hào)碼模式擴(kuò)充段306。擴(kuò)充段306更適于操作過濾段304提供的過濾后的號(hào)碼模式324,它使在說話者省略區(qū)號(hào)或只提供分機(jī)號(hào)碼時(shí)可能出現(xiàn)的部分電話號(hào)碼變得完整。其他擴(kuò)充情況也是可能的。像過濾段304一樣,擴(kuò)充段306更適于使用一系列預(yù)配置或用戶定義的規(guī)則列出各種模式與檢測到的(并且可能已經(jīng)過過濾)號(hào)碼模式比較。如果出現(xiàn)與某一特定規(guī)則模式的匹配,則可以添加一個(gè)額外的號(hào)碼模式到考慮中的號(hào)碼模式,以便使該號(hào)碼模式更完整,從而得到一個(gè)擴(kuò)充號(hào)碼模式326。另外,用戶定義的規(guī)則可以規(guī)定一個(gè)變換以保留號(hào)碼模式中的某部分,丟棄號(hào)碼模式中的另一部分。
例如,在區(qū)號(hào)情況中,擴(kuò)充段可以比較7數(shù)字號(hào)碼模式以確定是否可以在其前添加特定的區(qū)號(hào)。在此,擴(kuò)充段306可以包括出現(xiàn)在指定長度號(hào)碼串(即7數(shù)字電話號(hào)碼的前3個(gè)數(shù)字)內(nèi)的某些前綴的到可能的區(qū)號(hào)的映射(預(yù)配置的或用戶定義的)。例如,可以建立一個(gè)規(guī)則使形式為“576xxxx”的7數(shù)字號(hào)碼模式成為在其前添加區(qū)號(hào)“847”的合適候選號(hào)碼,而不同長度但也以“576”開始的號(hào)碼模式可以根據(jù)另一規(guī)則以不同方式擴(kuò)充。作為本概念的擴(kuò)展,某些電話號(hào)碼前綴在私人交換機(jī)情況下可以省略是眾所周知的。例如,一個(gè)大公司可能有一個(gè)或更多機(jī)構(gòu),它們的所有7數(shù)字電話號(hào)碼都以“576”或“523”前綴開始(在這兩種情況下假設(shè)區(qū)號(hào)都為“847”)。在這些實(shí)例中,用戶可以用5數(shù)字模式表示它們的電話號(hào)碼,即“6-1234”或“3-1000”。5數(shù)字號(hào)碼模式(或者根據(jù)設(shè)計(jì)選擇其他長度)可以通過在其前添加適當(dāng)區(qū)號(hào)和前綴號(hào)碼擴(kuò)充,即“6-1234”變成“847-576-1234”,“3-1000”變成“847-523-1000”。下面的表1提供上述類型映射規(guī)則各種實(shí)例的不完全列表。
號(hào)碼模式擴(kuò)充6xxxxx→ 847 576 xxxx3xxxx → 847 523 xxxx4xxxx → 815 884 xxxx653xxxx → 919 653 xxxx482xxxx → 919 482 xxxx2xx → 919 653 12xx表1在某些實(shí)例中,可能有多個(gè)區(qū)號(hào)或其他額外號(hào)碼模式可以添加到所檢測到號(hào)碼模式的情況。該問題的一種解決方案是不允許存在把特定號(hào)碼模式映射到不同擴(kuò)充結(jié)果的沖突規(guī)則。更適宜地,當(dāng)可能存在多于一個(gè)擴(kuò)充時(shí),提供兩個(gè)結(jié)果,然后向用戶展示供其選擇。同樣的技術(shù)也可以用于一個(gè)號(hào)碼模式有多個(gè)可能結(jié)果的情況(即解決所檢測到號(hào)碼模式中的多義性),多個(gè)可能的結(jié)果與多個(gè)規(guī)則匹配。
在應(yīng)用擴(kuò)充規(guī)則時(shí),擴(kuò)充段306也可以考慮移動(dòng)單元運(yùn)行的地點(diǎn)或注冊(cè)的區(qū)域。例如,在美國,對(duì)于移動(dòng)設(shè)備的注冊(cè)區(qū)號(hào)以外的區(qū)號(hào),擴(kuò)充規(guī)則可以包括添加一個(gè)“1”作為擴(kuò)充號(hào)碼模式的第一個(gè)數(shù)字。相反地,在美國以外運(yùn)行時(shí),可以按照當(dāng)?shù)貞T例添加不同的接入號(hào)碼。
檢測到的(且可能已經(jīng)過過濾和擴(kuò)充)號(hào)碼模式經(jīng)由所檢測到號(hào)碼模式的存儲(chǔ)段308存儲(chǔ)。在一個(gè)優(yōu)選實(shí)施例中,所檢測到號(hào)碼模式的存儲(chǔ)段308把最近檢測到的N個(gè)號(hào)碼模式列表保存到合適的存儲(chǔ)器件中,其中N是用戶可配置的且僅受可利用存儲(chǔ)器的數(shù)量限制。另外,存儲(chǔ)段308可以用于把音頻流330中的一部分存儲(chǔ)到合適的存儲(chǔ)器件中。如圖所示,提供音頻流采集段312發(fā)送音頻流330到由存儲(chǔ)段308實(shí)現(xiàn)的循環(huán)緩沖器中,它可以連續(xù)存儲(chǔ)音頻流330的最后M秒。一旦聽到電話號(hào)碼出現(xiàn)(經(jīng)由未顯示的音頻流重放),移動(dòng)設(shè)備的用戶向音頻流采集段312提供一個(gè)指令。作為響應(yīng),音頻流采集段312指示(未顯示)存儲(chǔ)段308把循環(huán)緩沖器凍結(jié)在其當(dāng)前狀態(tài)。通過設(shè)計(jì)循環(huán)緩沖器的長度來規(guī)定用戶聽到號(hào)碼并輸入必要指令所花時(shí)間的平均長度,有可能確保包含電話號(hào)碼的這部分音頻流存在于緩沖器中。如果需要,當(dāng)前被凍結(jié)緩沖器的內(nèi)容可以存儲(chǔ)到別處的永久存儲(chǔ)器中以便可以繼續(xù)更新循環(huán)緩沖器。以這種方式采集的音頻部分的數(shù)目,以及該采集部分的個(gè)別持續(xù)時(shí)間和累積持續(xù)時(shí)間,必然受合適存儲(chǔ)空間的可利用數(shù)量限制。此外,用戶輸入這些類型指令的方式只受合適輸入設(shè)備的可利用性限制(例如其他輸入/輸出設(shè)備212)。
在本發(fā)明的一個(gè)實(shí)施例中,以這種方式存儲(chǔ)的音頻流部分330可以通過存儲(chǔ)段308(由虛線指示)提供給語音分析段302進(jìn)行上述分析。在這種情況下,音頻流320不必連續(xù)提供給分析段302。更確切地說,只有用戶認(rèn)為相關(guān)的那些音頻流部分在必要的時(shí)候提供給語音分析段302。
當(dāng)存儲(chǔ)了至少一個(gè)號(hào)碼模式(可選地,至少音頻流中的一個(gè)相應(yīng)部分)時(shí),可以應(yīng)用所檢測到號(hào)碼的展示段310。在一個(gè)實(shí)施例中,所檢測到號(hào)碼的展示段310訪問由存儲(chǔ)段308保存的所檢測到號(hào)碼的列表并使這些檢測到的號(hào)碼通過合適的顯示設(shè)備(例如顯示器204)可視。展示段310更適于響應(yīng)來自用戶的指令而顯示該列表,盡管該列表可以在方便的時(shí)候自動(dòng)顯示,例如,在當(dāng)前進(jìn)行的通話結(jié)束時(shí)。相似地,音頻流展示段316可以使存儲(chǔ)下來的音頻流部分330可聽見。在一個(gè)實(shí)施例中,個(gè)別檢測到的號(hào)碼模式在顯示時(shí)可以有指示標(biāo)志(例如圖標(biāo)、圖形符號(hào)等)顯示于此,該指示標(biāo)志代表對(duì)應(yīng)于所檢測到號(hào)碼模式的音頻流已存儲(chǔ)部分。通過選擇指示標(biāo)志(例如,通過按下與標(biāo)記相關(guān)的按鈕、軟鍵、觸摸屏區(qū)域等),與檢測到的號(hào)碼模式相關(guān)的音頻流部分330通過音頻流展示段316而可聽見,以便用戶可以快速檢驗(yàn)檢測到的號(hào)碼模式的準(zhǔn)確性。而且,音頻流部分330可以以連續(xù)循環(huán)方式重放以便用戶在檢驗(yàn)檢測到的號(hào)碼模式的準(zhǔn)確性時(shí)可以多次聽到該部分。
如果用戶基于該顯示確定檢測到的號(hào)碼模式有錯(cuò)誤,可以應(yīng)用編輯段314輸入編輯340到被顯示的號(hào)碼模式。編輯段314允許用戶選擇特定的被顯示號(hào)碼模式(例如通過加重特定的被顯示號(hào)碼模式)并編輯該號(hào)碼模式,它提供編輯340給存儲(chǔ)段308以更新相應(yīng)的已存儲(chǔ)號(hào)碼模式。移動(dòng)設(shè)備中用于接收對(duì)被顯示號(hào)碼的編輯的技術(shù)在本領(lǐng)域內(nèi)為人熟知。另外,編輯段314可以向用戶提供把被顯示號(hào)碼模式(已編輯或其他)轉(zhuǎn)移到永久存儲(chǔ)器的選項(xiàng)。而且,任意傳統(tǒng)的輸入機(jī)制都可以應(yīng)用(例如按鈕、下拉菜單、軟鍵等)以允許用戶表示轉(zhuǎn)移一個(gè)號(hào)碼模式到永久存儲(chǔ)器的要求。
現(xiàn)在參照?qǐng)D4,結(jié)合本發(fā)明的一個(gè)優(yōu)選實(shí)施例給出流程圖。圖4中流程圖說明的過程可以通過上文描述的移動(dòng)設(shè)備中實(shí)現(xiàn)的代碼段來實(shí)現(xiàn)。在模塊402處,掃描(經(jīng)由語音分析)音頻流查找電話號(hào)碼相關(guān)語音模式的出現(xiàn)。如果該出現(xiàn)滿足模塊404的過濾標(biāo)準(zhǔn),則對(duì)應(yīng)于該出現(xiàn)的號(hào)碼模式在模塊406存儲(chǔ)。如果有可能,檢測到的號(hào)碼模式在模塊408進(jìn)行擴(kuò)充,然后在模塊410存儲(chǔ)。不管是否擴(kuò)充了檢測到的號(hào)碼模式,已存儲(chǔ)的號(hào)碼模式自動(dòng)或響應(yīng)用戶指令在模塊412向移動(dòng)設(shè)備的用戶展示。然后在模塊414,用戶可以有選擇地編輯任意被顯示號(hào)碼模式并把所選擇的被顯示號(hào)碼模式永久地保存到存儲(chǔ)器或者呼叫該號(hào)碼,正如用戶選擇目前手機(jī)中普遍可以找到的“發(fā)送”按鈕的情況一樣。
本發(fā)明提供一種技術(shù)用于處理出現(xiàn)在音頻流中的電話號(hào)碼。通過進(jìn)行音頻流的語音識(shí)別分析,可以識(shí)別電話號(hào)碼相關(guān)語音模式的出現(xiàn)并識(shí)別檢測到的相應(yīng)號(hào)碼模式。過濾和擴(kuò)充技術(shù)可以應(yīng)用于檢測到的號(hào)碼模式以減少錯(cuò)誤并確保完整性。提供音頻流相應(yīng)部分的編輯操作和采集/重放以確保準(zhǔn)確性。以這種方式,可以便利且可靠地采集電話號(hào)碼以備移動(dòng)設(shè)備用戶以后使用。
在前述的技術(shù)說明書中,已結(jié)合特定實(shí)施例描述了本發(fā)明。但是,本領(lǐng)域普通技術(shù)人員很容易想到各種修改和變化而不背離權(quán)利要求書闡明的本發(fā)明的范圍。因此,認(rèn)為本說明書和附圖的意義在于說明而非限制,所有這樣的修改都應(yīng)該包括在本發(fā)明范圍內(nèi)。
上文已經(jīng)就特殊實(shí)施例描述了益處、其他優(yōu)勢和問題解決方案。但是,沒有把益處、其他優(yōu)勢、問題解決方案和可能引起益處、其他優(yōu)勢或解決方案發(fā)生或變得更顯著的任意要素解釋為決定性的、要求的或本質(zhì)的特征或者任意或所有權(quán)利要求書的要素。這里所用的詞語“包括、包含”或其任意其他變形都應(yīng)該是非排他性的包含,因此,包括一系列要素的處理、方法、文章或裝置不只包括列出的那些要素,也可能包括其他沒有明確列出的或這樣的處理、方法、文章或裝置所固有的要素。
權(quán)利要求
1.在通信設(shè)備中,一種用于處理音頻流中電話號(hào)碼的方法,該方法包括識(shí)別所述音頻流中多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn);存儲(chǔ)與多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn)相對(duì)應(yīng)的至少一個(gè)檢測到的號(hào)碼模式;和向所述通信設(shè)備的用戶展示所述至少一個(gè)檢測到的號(hào)碼模式。
2.權(quán)利要求1中的方法,所述音頻流包括無線接收到的音頻流。
3.權(quán)利要求1中的方法,進(jìn)一步包括通過添加至少一個(gè)額外號(hào)碼模式到所述至少一個(gè)檢測到的號(hào)碼模式而提供擴(kuò)充號(hào)碼模式;和向用戶展示所述擴(kuò)充號(hào)碼模式。
4.權(quán)利要求3中的方法,進(jìn)一步包括基于檢測到的號(hào)碼模式的一部分、檢測到的號(hào)碼模式的長度、所述通信設(shè)備運(yùn)行地點(diǎn)以及所述通信設(shè)備注冊(cè)區(qū)域中的至少一種來確定所述至少一個(gè)額外號(hào)碼模式。
5.權(quán)利要求1中的方法,進(jìn)一步包括忽略音頻流任意兩個(gè)出現(xiàn)的發(fā)音之間的暫停填充發(fā)音的出現(xiàn)。
6.權(quán)利要求1中的方法,進(jìn)一步包括識(shí)別音頻流中的關(guān)鍵字發(fā)音的出現(xiàn),它在時(shí)間上緊接多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn);和當(dāng)多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn)在時(shí)間上緊接關(guān)鍵字發(fā)音的出現(xiàn)時(shí),存儲(chǔ)與多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn)相對(duì)應(yīng)的所述至少一個(gè)檢測到的號(hào)碼模式。
7.權(quán)利要求1中的方法,進(jìn)一步包括使用戶可聽見該音頻流;響應(yīng)接收自用戶的指令,提供音頻流的已存儲(chǔ)部分;和識(shí)別音頻流已存儲(chǔ)部分中的多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn)。
8.權(quán)利要求7中的方法,進(jìn)一步包括與檢測到的號(hào)碼模式完全同步地展示音頻流的已存儲(chǔ)部分。
9.權(quán)利要求1中的方法,進(jìn)一步包括響應(yīng)接收自用戶的指令,永久地存儲(chǔ)所述檢測到的號(hào)碼模式。
10.權(quán)利要求1中的方法,進(jìn)一步包括響應(yīng)用戶對(duì)于所述至少一個(gè)檢測到的號(hào)碼模式的編輯,提供編輯后的號(hào)碼模式;和響應(yīng)該指令,永久地存儲(chǔ)該編輯后的號(hào)碼模式。
11.一種無線通信設(shè)備,包括處理器;連接到該處理器的顯示器;連接到該處理器的存儲(chǔ)器件;和存儲(chǔ)在該存儲(chǔ)器件中的處理器可執(zhí)行指令,所述處理器可執(zhí)行指令包括語音分析段,用于識(shí)別音頻流中多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn),所述處理器可執(zhí)行指令包括所檢測到號(hào)碼模式的存儲(chǔ)段,用于存儲(chǔ)與所述多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn)相對(duì)應(yīng)的至少一個(gè)檢測到的號(hào)碼模式,所述處理器可執(zhí)行指令包括所檢測到號(hào)碼模式的展示段,用于通過所述顯示器展示所述至少一個(gè)檢測到的號(hào)碼模式。
12.權(quán)利要求11中的無線通信設(shè)備,進(jìn)一步包括無線接收機(jī),連接到所述處理器,所述處理器可執(zhí)行指令包括音頻流接收段,借此通過無線接收機(jī)接收音頻流。
13.權(quán)利要求11中的無線通信設(shè)備,所述處理器可執(zhí)行指令包括號(hào)碼模式擴(kuò)充段,用于添加至少一個(gè)額外號(hào)碼模式到所述至少一個(gè)檢測到的號(hào)碼模式,所述所檢測到號(hào)碼模式的展示段借此展示由所述號(hào)碼模式擴(kuò)充段提供的擴(kuò)充號(hào)碼模式。
14.權(quán)利要求11中的無線通信設(shè)備,所述處理器可執(zhí)行指令包括關(guān)鍵字發(fā)音檢測段,用于識(shí)別關(guān)鍵字發(fā)音的出現(xiàn),由此,當(dāng)多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn)在時(shí)間上緊接所述關(guān)鍵字發(fā)音的出現(xiàn)時(shí),所述所檢測到號(hào)碼模式的存儲(chǔ)段存儲(chǔ)與所述多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn)相對(duì)應(yīng)的所述至少一個(gè)檢測到的號(hào)碼模式。
15.權(quán)利要求11中的無線通信設(shè)備,進(jìn)一步包括用戶激勵(lì)的指令輸入設(shè)備,連接到所述處理器;所述處理器可執(zhí)行指令包括音頻流采集段,響應(yīng)來自所述用戶激勵(lì)指令輸入設(shè)備的指令,所述語音分析段借此操作由所述音頻流采集段提供的已存儲(chǔ)音頻流部分。
16.權(quán)利要求15中的無線通信設(shè)備,進(jìn)一步包括揚(yáng)聲器,連接到所述處理器,所述處理器可執(zhí)行指令包括已存儲(chǔ)音頻流部分展示段,所述所檢測到號(hào)碼的展示段通過顯示器展示所述至少一個(gè)檢測到的號(hào)碼模式,與所述已存儲(chǔ)音頻流展示段通過所述揚(yáng)聲器展示所述已存儲(chǔ)音頻流部分完全同步。
17.一種無線通信設(shè)備,包括音頻流接收無線接收機(jī);電話號(hào)碼相關(guān)語音模式識(shí)別語音分析器,連接到該音頻流接收無線接收機(jī),并操作由該音頻流接收無線接收機(jī)提供的音頻流;所檢測到號(hào)碼模式的過濾元件,連接到該電話號(hào)碼相關(guān)語音模式識(shí)別語音分析器,它操作由該電話號(hào)碼相關(guān)語音模式識(shí)別語音分析器提供的至少一個(gè)檢測到的號(hào)碼模式;和過濾后號(hào)碼模式的擴(kuò)充元件,連接到所述所檢測到號(hào)碼模式的過濾元件。
18.權(quán)利要求17中的無線通信設(shè)備,所述所檢測到號(hào)碼模式的過濾元件進(jìn)一步包括至少一種模式規(guī)則。
全文摘要
使用語音分析技術(shù)識(shí)別音頻流中多個(gè)電話號(hào)碼相關(guān)語音模式中至少一個(gè)的出現(xiàn)。然后識(shí)別與該出現(xiàn)相對(duì)應(yīng)的至少一個(gè)號(hào)碼模式并存儲(chǔ)以便以后向移動(dòng)設(shè)備的用戶展示??梢赃^濾該出現(xiàn)和相應(yīng)號(hào)碼模式以減小誤測的可能性。而且,可以擴(kuò)充所檢測到的號(hào)碼模式以確保完整性。用戶可以編輯并永久保存所得的號(hào)碼模式。在一個(gè)實(shí)施例中,可以存儲(chǔ)音頻流的一部分,然后對(duì)其執(zhí)行語音分析過程。音頻流的被存儲(chǔ)部分可以在把其中檢測到的至少一個(gè)號(hào)碼模式提供給用戶的同時(shí)重現(xiàn)。以這種方式,可以可靠且便利地采集音頻流中的電話號(hào)碼。
文檔編號(hào)G10L15/26GK1682518SQ03821475
公開日2005年10月12日 申請(qǐng)日期2003年9月3日 優(yōu)先權(quán)日2002年9月10日
發(fā)明者詹姆士·T·多布爾 申請(qǐng)人:摩托羅拉公司