本發(fā)明涉及通信技術(shù)領(lǐng)域,特別是涉及一種基于語音服務(wù)的撥號方法和一種基于語音服務(wù)的撥號裝置。
背景技術(shù):
語音服務(wù)是一種自動的業(yè)務(wù)代理,在撥通語音服務(wù)號碼后,語音服務(wù)系統(tǒng)播放有關(guān)菜單的提示音,用戶可以按照聽到的提示音來按壓終端上的相應(yīng)的按鍵向語音服務(wù)系統(tǒng)發(fā)出指令,以進入下一層的語音菜單,在最底層語音菜單中,選擇所需的服務(wù)的按鍵,然后從該系統(tǒng)中獲得相應(yīng)語音服務(wù)。
比如,用戶撥打某電信運營商提供的語音服務(wù)號碼,在電話撥通后,用戶會聽到語音服務(wù)系統(tǒng)發(fā)出的語音菜單“尊敬的用戶您好,業(yè)務(wù)查詢請按1,業(yè)務(wù)咨詢請按2,業(yè)務(wù)辦理請按3,故障申報請按4、投訴建議請按5、寬帶提速介紹請按6……”。
之后,用戶可根據(jù)提示音選擇相應(yīng)的按鍵向電信運營商的語音服務(wù)系統(tǒng)發(fā)出指令,從而獲取對應(yīng)的服務(wù)。
目前,用戶每次獲取語音服務(wù)均需要聽完大部分提示音,才能按壓相應(yīng)的按鍵,而獲取一個語音服務(wù)的過程通常需要按下多個按鍵,操作繁瑣,若用戶中途忘記了關(guān)鍵的提示音,還需要重復(fù)收聽語音菜單,容易浪費語音服務(wù)系統(tǒng)和移動設(shè)備的資源。
技術(shù)實現(xiàn)要素:
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種基于語音服務(wù)的撥號方法和相應(yīng)的一種基于語音服務(wù)的撥號裝置。
依據(jù)本發(fā)明的一個方面,提供了一種基于語音服務(wù)的撥號方法,包括:
在語音服務(wù)號碼的服務(wù)界面中顯示一個或多個服務(wù)入口對象;
當檢測到所述服務(wù)入口對象被觸發(fā)時,查找所述服務(wù)入口對象的撥號路徑信息,所述撥號路徑信息包括按順序排序的一個或多個數(shù)字按鍵;
當接通所述語音服務(wù)號碼時,檢測所接收到的語音數(shù)據(jù)中的一個或多個菜單切換點;
當檢測到所述一個或多個菜單切換點時,按照排序順序觸發(fā)所述一個或多個數(shù)字按鍵,直至所述數(shù)字按鍵觸發(fā)完畢。
可選地,還包括:
當接通所述語音服務(wù)號碼時,顯示正在撥打的提示信息;
當所述數(shù)字按鍵觸發(fā)完畢時,顯示撥打成功的提示信息。
可選地,所述在語音服務(wù)號碼的服務(wù)界面中顯示一個或多個服務(wù)入口對象的步驟包括:
當檢測到撥打某個號碼時,判斷所述號碼是否為語音服務(wù)號碼;若是,則加載所述語音服務(wù)號碼對應(yīng)的服務(wù)界面模板;
在所述服務(wù)界面模板中加載所述語音服務(wù)號碼的一個或多個服務(wù)入口對象。
可選地,所述在所述界面模板中加載所述語音服務(wù)號碼的一個或多個服務(wù)入口對象的步驟包括:
查詢所述語音服務(wù)號碼的一個或多個服務(wù)入口對象的點擊頻率;
按照所述點擊頻率對所述一個或多個服務(wù)入口對象排序;
將排序之后的一個或多個服務(wù)入口對象加載至所述語音服務(wù)號碼。
可選地,所述檢測所接收到的語音數(shù)據(jù)中的一個或多個菜單切換點的步驟包括:
對所述語音數(shù)據(jù)進行語音活動檢測;
當在語音活動檢測中檢測到所述靜音點時,確認檢測到菜單切換點。
可選地,所述檢測所接收到的語音數(shù)據(jù)中的一個或多個菜單切換點的步驟包括:
對所述語音數(shù)據(jù)進行語音識別,以獲得第一文本;
當所述第一文本具有預(yù)設(shè)的菜單切換文本時,確認檢測到菜單切換點。
可選地,還包括:
接通語音服務(wù)號碼;
對所接收到的語音數(shù)據(jù)進行語音識別,以獲得第二文本;
當所述第二文本具有預(yù)設(shè)的菜單切換文本時,判斷所述第二文本中是否具有特征文本組合,所述特征文本組合包括按鍵標識文本和數(shù)字按鍵;
若是,則觸發(fā)每一個數(shù)字按鍵,分別返回執(zhí)行所述對所接收到的語音數(shù)據(jù)進行語音識別,以獲得第二文本的步驟;
若否,則提取上一層的特征文本組合之前的識別文本;
根據(jù)所述識別文本生成服務(wù)入口對象;
將到達所述識別文本及之前所觸發(fā)的數(shù)字按鍵按照順序排序,生成撥號路徑信息。
根據(jù)本發(fā)明的另一方面,提供了一種基于語音服務(wù)的撥號裝置,包括:
服務(wù)入口對象顯示模塊,適于在語音服務(wù)號碼的服務(wù)界面中顯示一個或多個服務(wù)入口對象;
撥號路徑信息查找模塊,適于在檢測到所述服務(wù)入口對象被觸發(fā)時,查找所述服務(wù)入口對象的撥號路徑信息,所述撥號路徑信息包括按順序排序的一個或多個數(shù)字按鍵;
菜單切換點檢測模塊,適于當接通所述語音服務(wù)號碼時,檢測所接收到的語音數(shù)據(jù)中的一個或多個菜單切換點;
數(shù)字按鍵觸發(fā)模塊,適于在檢測到所述一個或多個菜單切換點時,按照排序順序觸發(fā)所述一個或多個數(shù)字按鍵,直至所述數(shù)字按鍵觸發(fā)完畢。
可選地,還包括:
第一提示模塊,適于在接通所述語音服務(wù)號碼時,顯示正在撥打的提示信息;
第二提示模塊,適于在所述數(shù)字按鍵觸發(fā)完畢時,顯示撥打成功的提示信息。
可選地,所述服務(wù)入口對象顯示模塊還適于:
當檢測到撥打某個號碼時,判斷所述號碼是否為語音服務(wù)號碼;若是,則加載所述語音服務(wù)號碼對應(yīng)的服務(wù)界面模板;
在所述服務(wù)界面模板中加載所述語音服務(wù)號碼的一個或多個服務(wù)入口對象。
可選地,所述服務(wù)入口對象顯示模塊還適于:
查詢所述語音服務(wù)號碼的一個或多個服務(wù)入口對象的點擊頻率;
按照所述點擊頻率對所述一個或多個服務(wù)入口對象排序;
將排序之后的一個或多個服務(wù)入口對象加載至所述語音服務(wù)號碼。
可選地,所述菜單切換點檢測模塊還適于:
對所述語音數(shù)據(jù)進行語音活動檢測;
當在語音活動檢測中檢測到所述靜音點時,確認檢測到菜單切換點。
可選地,所述菜單切換點檢測模塊還適于:
對所述語音數(shù)據(jù)進行語音識別,以獲得第一文本;
當所述第一文本具有預(yù)設(shè)的菜單切換文本時,確認檢測到菜單切換點。
可選地,還包括:
撥號模塊,適于接通語音服務(wù)號碼;
語音識別模塊,適于對所接收到的語音數(shù)據(jù)進行語音識別,以獲得第二文本;
特征文本組合判斷模塊,適于在所述第二文本具有預(yù)設(shè)的菜單切換文本時,判斷所述第二文本中是否具有特征文本組合,所述特征文本組合包括按鍵標識文本和數(shù)字按鍵;若是,則調(diào)用按鍵模塊,若否,則調(diào)用識別文本提取模塊;
按鍵模塊,適于觸發(fā)每一個數(shù)字按鍵,分別返回調(diào)用所述語音識別模塊;
識別文本提取模塊,適于提取上一層的特征文本組合之前的識別文本;
服務(wù)入口對象生成模塊,適于根據(jù)所述識別文本生成服務(wù)入口對象;
撥號路徑信息生成模塊,適于將到達所述識別文本及之前所觸發(fā)的數(shù)字按鍵按照順序排序,生成撥號路徑信息。
本發(fā)明實施例識別語音服務(wù)的菜單切換點,按照排序順序觸發(fā)撥號路徑信息的數(shù)字按鍵,實現(xiàn)直達語音服務(wù),大大提高了操作的簡便性,避免重復(fù)收聽語音菜單,減少了語音服務(wù)系統(tǒng)和移動設(shè)備的資源浪費。
本發(fā)明實施例識別出語音服務(wù)的第二文本,通過與特征文本組合的匹配,自動生成撥號路徑信息,無需人工進行重播撥打,大大節(jié)省人工成本。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。
附圖說明
通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
圖1示出了根據(jù)本發(fā)明一個實施例的一種基于語音服務(wù)的撥號方法實施例1的步驟流程圖;
圖2示出了根據(jù)本發(fā)明一個實施例的一種基于語音服務(wù)的撥號方法實施例2的步驟流程圖;
圖3示出了根據(jù)本發(fā)明一個實施例的一種基于語音服務(wù)的撥號裝置實施例1的結(jié)構(gòu)框圖;以及
圖4示出了根據(jù)本發(fā)明一個實施例的一種基于語音服務(wù)的撥號裝置實施例2的結(jié)構(gòu)框圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
參照圖1,示出了根據(jù)本發(fā)明一個實施例的一種基于語音服務(wù)的撥號方法實施例1的步驟流程圖,具體可以包括如下步驟:
步驟101,在語音服務(wù)號碼的服務(wù)界面中顯示一個或多個服務(wù)入口對象;
需要說明的是,本發(fā)明實施例可以應(yīng)用在各種移動設(shè)備中,例如,手機、平板電腦、個人數(shù)字助理、穿戴設(shè)備(如眼鏡、手表等)等等。
該移動設(shè)備的操作系統(tǒng)可以包括Android(安卓)、IOS、Windows Phone、Windows等等,通??梢灾С指鞣N通信工具的運行,包括操作系統(tǒng)自身攜帶的通信工具,第三方的通信工具,該通信工具可以用于撥打號碼、進行通話。
應(yīng)用本發(fā)明實施例,可以預(yù)先采集語音服務(wù)號碼,由于每個語音服務(wù)號碼所屬的運營商各有不同,因此,可以針對每個運營商設(shè)計一個服務(wù)界面。
當檢測到撥打某個號碼時,判斷該號碼是否為語音服務(wù)號碼;若是,則加載語音服務(wù)號碼對應(yīng)的服務(wù)界面模板,在該服務(wù)界面模板中,具有服務(wù)界面的布局信息,如背景圖、運營商名稱、運營商LOGO等等。
在該服務(wù)界面模板中可以加載該語音服務(wù)號碼的一個或多個服務(wù)入口對象,其中,服務(wù)入口對象為語音服務(wù)的標識,如“話費查詢”、“積分查詢”、“流量包辦理”等等,該服務(wù)入口對象可以為圖標、文本,也可以為JSON(JavaScript Object Notation,數(shù)據(jù)交換格式)數(shù)據(jù)等等,本發(fā)明實施例對此不加以限制。
該服務(wù)界面模板可以在移動設(shè)備本地進行查找,若未查找到,則可以向服務(wù)器請求該語音服務(wù)號碼對應(yīng)的服務(wù)界面模板。
進一步而言,為了方便用戶操作,可以查詢該語音服務(wù)號碼的一個或多個服務(wù)入口對象的點擊頻率,該點擊頻率可以為全網(wǎng)用戶的點擊頻率,也可以是當前用戶的點擊頻率,還可以是全網(wǎng)用戶的點擊頻率與當前用戶的點擊頻率的加權(quán)之和,等等。
按照該點擊頻率對所述一個或多個服務(wù)入口對象排序,將排序之后的一個或多個服務(wù)入口對象加載至語音服務(wù)號碼,如將排序前N(N為正整數(shù))個服務(wù)入口對象加載至語音服務(wù)界面的首頁,其他服務(wù)入口對象加載至語音服務(wù)界面的二級及二級以下的菜單。
步驟102,當檢測到所述服務(wù)入口對象被觸發(fā)時,查找所述服務(wù)入口對象的撥號路徑信息;
在具體實現(xiàn)中,用戶可以通過點擊、滑動等操作,觸發(fā)服務(wù)入口對象,即若該服務(wù)入口對象被觸發(fā),則表示用戶需要該服務(wù)入口對象標識的語音服務(wù)。
應(yīng)用本發(fā)明實施例,可以預(yù)先針對服務(wù)入口對象設(shè)置撥號路徑信,撥號路徑信息包括按順序排序的一個或多個數(shù)字按鍵,一個數(shù)字按鍵表示在一個語音菜單中需要觸發(fā)的按鍵。
步驟103,當接通所述語音服務(wù)號碼時,檢測所接收到的語音數(shù)據(jù)中的一個或多個菜單切換點;
在具體實現(xiàn)中,若接聽語音服務(wù)號碼,則語音服務(wù)系統(tǒng)播放在先錄制的語音菜單(即語音數(shù)據(jù)),移動設(shè)備可以檢測語音菜單中的菜單切換點,菜單切換點可以指語音菜單之間切換的節(jié)點。
當然,當接通語音服務(wù)號碼時,可以顯示正在撥打的提示信息,提示用戶正在接入語音服務(wù)的過程。
在本發(fā)明的一種可選實施例中,步驟103可以包括如下子步驟:
子步驟S11,對所述語音數(shù)據(jù)進行語音活動檢測;
子步驟S12,當在語音活動檢測中檢測到所述靜音點時,確認檢測到菜單切換點。
在本發(fā)明實施例中,可以通過語音活動檢測(Voice Activity Detection,VAD)檢測菜單切換點。
語音活動檢測又稱語音端點檢測、語音邊界檢測等等,可以指在噪聲環(huán)境中檢測語音的存在與否,不存在語音的位置可以稱之為靜音點。
語音活動檢測主要包括如下四個步驟:
(1)語音信號的預(yù)處理,如通過普減法進行降噪處理;
(2)一段輸入語音的特征提取,如短時能量、倒譜系數(shù)、語音及噪聲的PSD;同時根據(jù)假設(shè)檢驗計算門限值;
(3)VAD判斷過程,將所提取參數(shù)特征值和門限值比較,根據(jù)比較規(guī) 則得出相應(yīng)的VAD值;
(4)VAD判斷值優(yōu)化過程,通常是根據(jù)語音的相關(guān)性加Hangover算法。
在具體實現(xiàn)中,語音菜單播放完畢之后,會不存在語音信號,若檢測到靜音點,則表示語音菜單播放完畢,可以進行菜單切換。
在本發(fā)明的另一種可選實施例中,步驟103可以包括如下子步驟:
子步驟S21,對所述語音數(shù)據(jù)進行語音識別,以獲得第一文本;
子步驟S22,所述第一文本具有預(yù)設(shè)的菜單切換文本時,確認檢測到菜單切換點。
在本發(fā)明實施例中,可以通過語音識別(Automatic Speech Recognition,ASR)檢測菜單切換點。
語音識別將語音中的詞匯內(nèi)容(即語音數(shù)據(jù))轉(zhuǎn)換為計算機可讀的輸入(即文本信息)。
目前,語音識別技術(shù)通常由語音識別系統(tǒng)實現(xiàn),一種基于統(tǒng)計模式識別方法的語音識別系統(tǒng)由以下幾個基本模塊所構(gòu)成:
1、信號處理及特征提取模塊;該模塊的主要任務(wù)是從語音數(shù)據(jù)中提取特征,供聲學(xué)模型處理。同時,它一般也包括了一些信號處理技術(shù),以盡可能降低環(huán)境噪聲、信道、說話人等因素對特征造成的影響。
2、聲學(xué)模型;語音識別系統(tǒng)多采用基于一階隱馬爾科夫模型進行建模。
3、發(fā)音詞典;發(fā)音詞典包含語音識別系統(tǒng)所能處理的詞匯集及其發(fā)音。發(fā)音詞典實際提供了聲學(xué)模型與語言模型的映射。
4、語言模型;語言模型對語音識別系統(tǒng)所針對的語言進行建模。理論上,包括正則語言,上下文無關(guān)文法在內(nèi)的各種語言模型都可以作為語言模型,但目前各種系統(tǒng)普遍采用的還是基于統(tǒng)計的N元文法及其變體。
5、解碼器;解碼器是語音識別系統(tǒng)的核心之一,其任務(wù)是對輸入的信號,根據(jù)聲學(xué)、語言模型及詞典,尋找能夠以最大概率輸出該信號的詞串。從數(shù)學(xué)角度可以更加清楚的了解上述模塊之間的關(guān)系。
在實際應(yīng)用中,語音菜單中通常以星號鍵“*”、井號鍵“#”作為返回上一層語音菜單、重聽等功能,在最后播放。
因此,可以預(yù)先設(shè)置菜單切換文本,如“星號鍵”、“井號鍵”等,若識別的第一文本與該菜單切換文本匹配,則表示當前層的語音菜單播放完畢,可以進行菜單切換。
當然,上述菜單切換點的檢測方式只是作為示例,在實施本發(fā)明實施例時,可以根據(jù)實際情況設(shè)置其他菜單切換點的檢測方式,本發(fā)明實施例對此不加以限制。另外,除了上述菜單切換點的檢測方式外,本領(lǐng)域技術(shù)人員還可以根據(jù)實際需要采用其它菜單切換點的檢測方式,本發(fā)明實施例對此也不加以限制。
步驟104,當檢測到所述一個或多個菜單切換點時,按照排序順序觸發(fā)所述一個或多個數(shù)字按鍵,直至所述數(shù)字按鍵觸發(fā)完畢。
在具體實現(xiàn)中,若檢測到菜單切換點,則表示當前層的語音菜單播放完畢,可以點擊當前層的語音菜單對應(yīng)的數(shù)字鍵,直至數(shù)字按鍵觸發(fā)完畢。
例如,某個電信運營商提供的流量查詢(語音服務(wù))的撥號路徑信息為“12”,表示第一層語音菜單點擊數(shù)字鍵“1”,第二層語音菜單點擊數(shù)字鍵“2”。
假設(shè)第一層語音菜單為:“尊敬的用戶您好,業(yè)務(wù)查詢請按1,業(yè)務(wù)咨詢請按2,業(yè)務(wù)辦理請按3,故障申報請按4、投訴建議請按5、寬帶提速介紹請按6……”。
則在檢測到菜單切換點時,點擊數(shù)字鍵“1”,進行業(yè)務(wù)查詢的語音菜單。
假設(shè)業(yè)務(wù)查詢的語音菜單為:“話費查詢請按1,流量查詢請按2……”
則在檢測到菜單切換點時,點擊數(shù)字鍵“2”,進行流量查詢。
當然,當數(shù)字按鍵觸發(fā)完畢時,可以顯示撥打成功的提示信息,提示用戶已接入語音服務(wù),可以接聽電話。
本發(fā)明實施例識別語音服務(wù)的菜單切換點,按照排序順序觸發(fā)撥號路徑信息的數(shù)字按鍵,實現(xiàn)直達語音服務(wù),大大提高了操作的簡便性,避免重復(fù)收聽語音菜單,減少了語音服務(wù)系統(tǒng)和移動設(shè)備的資源浪費。
參照圖2,示出了根據(jù)本發(fā)明一個實施例的一種基于語音服務(wù)的撥號方 法實施例2的步驟流程圖,具體可以包括如下步驟:
步驟201,接通語音服務(wù)號碼;
在實際應(yīng)用中,運營商的數(shù)量終端,而且,各運營商的語音服務(wù)的語音菜單也眾多,且在不斷更新中,因此,語音服務(wù)的數(shù)量眾多。
在本發(fā)明實施例中,為節(jié)省人工成本,可以針對不同運營商,接通語音服務(wù)號碼,以制作撥號路徑信息。
步驟202,對所接收到的語音數(shù)據(jù)進行語音識別,以獲得第二文本;
語音識別將語音中的詞匯內(nèi)容(即語音數(shù)據(jù))轉(zhuǎn)換為計算機可讀的輸入(即文本信息)。
目前,語音識別技術(shù)通常由語音識別系統(tǒng)實現(xiàn),一種基于統(tǒng)計模式識別方法的語音識別系統(tǒng)由以下幾個基本模塊所構(gòu)成:
1、信號處理及特征提取模塊;該模塊的主要任務(wù)是從語音數(shù)據(jù)中提取特征,供聲學(xué)模型處理。同時,它一般也包括了一些信號處理技術(shù),以盡可能降低環(huán)境噪聲、信道、說話人等因素對特征造成的影響。
2、聲學(xué)模型;語音識別系統(tǒng)多采用基于一階隱馬爾科夫模型進行建模。
3、發(fā)音詞典;發(fā)音詞典包含語音識別系統(tǒng)所能處理的詞匯集及其發(fā)音。發(fā)音詞典實際提供了聲學(xué)模型與語言模型的映射。
4、語言模型;語言模型對語音識別系統(tǒng)所針對的語言進行建模。理論上,包括正則語言,上下文無關(guān)文法在內(nèi)的各種語言模型都可以作為語言模型,但目前各種系統(tǒng)普遍采用的還是基于統(tǒng)計的N元文法及其變體。
5、解碼器;解碼器是語音識別系統(tǒng)的核心之一,其任務(wù)是對輸入的信號,根據(jù)聲學(xué)、語言模型及詞典,尋找能夠以最大概率輸出該信號的詞串。從數(shù)學(xué)角度可以更加清楚的了解上述模塊之間的關(guān)系。
步驟203,當所述第二文本具有預(yù)設(shè)的菜單切換文本時,判斷所述第二文本中是否具有特征文本組合,若是,則執(zhí)行步驟204,若否,則執(zhí)行步驟205;
在實際應(yīng)用中,語音菜單中通常以星號鍵“*”、井號鍵“#”作為返回上一層語音菜單、重聽等功能,在最后播放。
因此,可以預(yù)先設(shè)置菜單切換文本,如“星號鍵”、“井號鍵”等,若識別的第二文本與該菜單切換文本匹配,則表示當前層的語音菜單播放完畢。
進一步地,檢測第二文本中是否具有特征文本組合,特征文本組合可以表示具有下一層語音菜單,具體可以包括按鍵標識文本和數(shù)字按鍵。
其中,按鍵標識文本為標識按鍵操作的信息,數(shù)字按鍵為標識數(shù)字(按鍵)的信息,如在第二文本“業(yè)務(wù)查詢請按1”中,“請按”為按鍵標識文本,“8”為數(shù)字按鍵。
步驟204,觸發(fā)每一個數(shù)字按鍵,分別返回執(zhí)行步驟202;
如果具有下一層語音菜單,即可以觸發(fā)數(shù)字按鍵,進入下一層語音菜單。
步驟205,提取上一層的特征文本組合之前的識別文本;
若不具有下一層語音菜單,則可以表示當前層的語音菜單為具體的語音服務(wù),上一層的語音菜單為最底層的語音菜單。
在特征文本組合之前的識別文本,可以表示該語音服務(wù)的具體功能。
例如,在“流量查詢請按2”中,特征文本組合為“請按2”,即識別文本為“流量查詢”。
步驟206,根據(jù)所述識別文本生成服務(wù)入口對象;
在具體實現(xiàn)中,可以以該識別文本生成圖標、文本、JSON數(shù)據(jù)等服務(wù)入口對象。
當然,本領(lǐng)域技術(shù)人員也可以通過其他方式生成服務(wù)入口對象,如人工設(shè)計等,本發(fā)明實施例對此不加以限制
步驟207,將到達所述識別文本及之前所觸發(fā)的數(shù)字按鍵按照順序排序,生成撥號路徑信息。
在本發(fā)明實施例中,可以將到達語音服務(wù)之前所出發(fā)的數(shù)字按鍵按照順序排序,即可生成撥號路徑信息。
例如,在第一層語音菜單中,按照“業(yè)務(wù)查詢請按1”觸發(fā)數(shù)字按鍵“1”,在其第二層語音菜單中,按照“流量查詢請按2”觸發(fā)數(shù)字按鍵“2”,到達了具體的語音服務(wù),即撥號路徑信息為“12”。
當然,為了進一步提高撥號路徑信息的準確度,最后可以通過人工進行 校驗,本發(fā)明實施例對此不加以限制。
本發(fā)明實施例識別出語音服務(wù)的第二文本,通過與特征文本組合的匹配,自動生成撥號路徑信息,無需人工進行重播撥打,大大節(jié)省人工成本。
對于方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實施例并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明實施例,某些步驟可以采用其他順序或者同時進行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作并不一定是本發(fā)明實施例所必須的。
參照圖3,示出了根據(jù)本發(fā)明一個實施例的一種基于語音服務(wù)的撥號裝置實施例1的結(jié)構(gòu)框圖,具體可以包括如下模塊:
服務(wù)入口對象顯示模塊301,適于在語音服務(wù)號碼的服務(wù)界面中顯示一個或多個服務(wù)入口對象;
撥號路徑信息查找模塊302,適于在檢測到所述服務(wù)入口對象被觸發(fā)時,查找所述服務(wù)入口對象的撥號路徑信息,所述撥號路徑信息包括按順序排序的一個或多個數(shù)字按鍵;
菜單切換點檢測模塊303,適于當接通所述語音服務(wù)號碼時,檢測所接收到的語音數(shù)據(jù)中的一個或多個菜單切換點;
數(shù)字按鍵觸發(fā)模塊304,適于在檢測到所述一個或多個菜單切換點時,按照排序順序觸發(fā)所述一個或多個數(shù)字按鍵,直至所述數(shù)字按鍵觸發(fā)完畢。
在本發(fā)明的一種可選實施例中,該裝置還可以包括如下模塊:
第一提示模塊,適于在接通所述語音服務(wù)號碼時,顯示正在撥打的提示信息;
第二提示模塊,適于在所述數(shù)字按鍵觸發(fā)完畢時,顯示撥打成功的提示信息。
在本發(fā)明的一種可選實施例中,所述服務(wù)入口對象顯示模塊301還可以適于:
當檢測到撥打某個號碼時,判斷所述號碼是否為語音服務(wù)號碼;若是,則加載所述語音服務(wù)號碼對應(yīng)的服務(wù)界面模板;
在所述服務(wù)界面模板中加載所述語音服務(wù)號碼的一個或多個服務(wù)入口對象。
在本發(fā)明的一種可選實施例中,所述服務(wù)入口對象顯示模塊301還可以適于:
查詢所述語音服務(wù)號碼的一個或多個服務(wù)入口對象的點擊頻率;
按照所述點擊頻率對所述一個或多個服務(wù)入口對象排序;
將排序之后的一個或多個服務(wù)入口對象加載至所述語音服務(wù)號碼。
在本發(fā)明的一種可選實施例中,所述菜單切換點檢測模塊303還可以適于:
對所述語音數(shù)據(jù)進行語音活動檢測;
當在語音活動檢測中檢測到所述靜音點時,確認檢測到菜單切換點。
在本發(fā)明的一種可選實施例中,所述菜單切換點檢測模塊303還可以適于:
對所述語音數(shù)據(jù)進行語音識別,以獲得第一文本;
當所述第一文本具有預(yù)設(shè)的菜單切換文本時,確認檢測到菜單切換點。
參照圖4,示出了根據(jù)本發(fā)明一個實施例的一種基于語音服務(wù)的撥號裝置實施例2的結(jié)構(gòu)框圖,具體可以包括如下模塊:
撥號模塊401,適于接通語音服務(wù)號碼;
語音識別模塊402,適于對所接收到的語音數(shù)據(jù)進行語音識別,以獲得第二文本;
特征文本組合判斷模塊403,適于在所述第二文本具有預(yù)設(shè)的菜單切換文本時,判斷所述第二文本中是否具有特征文本組合,所述特征文本組合包括按鍵標識文本和數(shù)字按鍵;若是,則調(diào)用按鍵模塊404,若否,則調(diào)用識別文本提取模塊405;
按鍵模塊404,適于觸發(fā)每一個數(shù)字按鍵,分別返回調(diào)用所述語音識別 模塊402;
識別文本提取模塊405,適于提取上一層的特征文本組合之前的識別文本;
服務(wù)入口對象生成模塊406,適于根據(jù)所述識別文本生成服務(wù)入口對象;
撥號路徑信息生成模塊407,適于將到達所述識別文本及之前所觸發(fā)的數(shù)字按鍵按照順序排序,生成撥號路徑信息。
對于裝置實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。
在此提供的算法和顯示不與任何特定計算機、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。
在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
類似地,應(yīng)當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權(quán)利要求書由此明確地并入該具體實施方式,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。
本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進行自適應(yīng)性地改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中??梢? 把實施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的基于語音服務(wù)的撥號設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
應(yīng)該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一 個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
本發(fā)明實施例公開了A1、一種基于語音服務(wù)的撥號方法,包括:
在語音服務(wù)號碼的服務(wù)界面中顯示一個或多個服務(wù)入口對象;
當檢測到所述服務(wù)入口對象被觸發(fā)時,查找所述服務(wù)入口對象的撥號路徑信息,所述撥號路徑信息包括按順序排序的一個或多個數(shù)字按鍵;
當接通所述語音服務(wù)號碼時,檢測所接收到的語音數(shù)據(jù)中的一個或多個菜單切換點;
當檢測到所述一個或多個菜單切換點時,按照排序順序觸發(fā)所述一個或多個數(shù)字按鍵,直至所述數(shù)字按鍵觸發(fā)完畢。
A2、如A1所述的方法,還包括:
當接通所述語音服務(wù)號碼時,顯示正在撥打的提示信息;
當所述數(shù)字按鍵觸發(fā)完畢時,顯示撥打成功的提示信息。
A3、如A1所述的方法,所述在語音服務(wù)號碼的服務(wù)界面中顯示一個或多個服務(wù)入口對象的步驟包括:
當檢測到撥打某個號碼時,判斷所述號碼是否為語音服務(wù)號碼;若是,則加載所述語音服務(wù)號碼對應(yīng)的服務(wù)界面模板;
在所述服務(wù)界面模板中加載所述語音服務(wù)號碼的一個或多個服務(wù)入口對象。
A4、如A3所述的方法,所述在所述界面模板中加載所述語音服務(wù)號碼的一個或多個服務(wù)入口對象的步驟包括:
查詢所述語音服務(wù)號碼的一個或多個服務(wù)入口對象的點擊頻率;
按照所述點擊頻率對所述一個或多個服務(wù)入口對象排序;
將排序之后的一個或多個服務(wù)入口對象加載至所述語音服務(wù)號碼。
A5、如A1或A2或A3或A4所述的方法,所述檢測所接收到的語音數(shù)據(jù)中的一個或多個菜單切換點的步驟包括:
對所述語音數(shù)據(jù)進行語音活動檢測;
當在語音活動檢測中檢測到所述靜音點時,確認檢測到菜單切換點。
A6、如A1或A2或A3或A4所述的方法,所述檢測所接收到的語音數(shù)據(jù)中的一個或多個菜單切換點的步驟包括:
對所述語音數(shù)據(jù)進行語音識別,以獲得第一文本;
當所述第一文本具有預(yù)設(shè)的菜單切換文本時,確認檢測到菜單切換點。
A7、如A1或A2或A3或A4所述的方法,還包括:
接通語音服務(wù)號碼;
對所接收到的語音數(shù)據(jù)進行語音識別,以獲得第二文本;
當所述第二文本具有預(yù)設(shè)的菜單切換文本時,判斷所述第二文本中是否具有特征文本組合,所述特征文本組合包括按鍵標識文本和數(shù)字按鍵;
若是,則觸發(fā)每一個數(shù)字按鍵,分別返回執(zhí)行所述對所接收到的語音數(shù)據(jù)進行語音識別,以獲得第二文本的步驟;
若否,則提取上一層的特征文本組合之前的識別文本;
根據(jù)所述識別文本生成服務(wù)入口對象;
將到達所述識別文本及之前所觸發(fā)的數(shù)字按鍵按照順序排序,生成撥號路徑信息。
本發(fā)明實施例還公開了B8、一種基于語音服務(wù)的撥號裝置,包括:
服務(wù)入口對象顯示模塊,適于在語音服務(wù)號碼的服務(wù)界面中顯示一個或多個服務(wù)入口對象;
撥號路徑信息查找模塊,適于在檢測到所述服務(wù)入口對象被觸發(fā)時,查找所述服務(wù)入口對象的撥號路徑信息,所述撥號路徑信息包括按順序排序的一個或多個數(shù)字按鍵;
菜單切換點檢測模塊,適于當接通所述語音服務(wù)號碼時,檢測所接收到的語音數(shù)據(jù)中的一個或多個菜單切換點;
數(shù)字按鍵觸發(fā)模塊,適于在檢測到所述一個或多個菜單切換點時,按照排序順序觸發(fā)所述一個或多個數(shù)字按鍵,直至所述數(shù)字按鍵觸發(fā)完畢。
B9、如B8所述的裝置,還包括:
第一提示模塊,適于在接通所述語音服務(wù)號碼時,顯示正在撥打的提示信息;
第二提示模塊,適于在所述數(shù)字按鍵觸發(fā)完畢時,顯示撥打成功的提示信息。
B10、如B8所述的裝置,所述服務(wù)入口對象顯示模塊還適于:
當檢測到撥打某個號碼時,判斷所述號碼是否為語音服務(wù)號碼;若是,則加載所述語音服務(wù)號碼對應(yīng)的服務(wù)界面模板;
在所述服務(wù)界面模板中加載所述語音服務(wù)號碼的一個或多個服務(wù)入口對象。
B11、如B10所述的裝置,所述服務(wù)入口對象顯示模塊還適于:
查詢所述語音服務(wù)號碼的一個或多個服務(wù)入口對象的點擊頻率;
按照所述點擊頻率對所述一個或多個服務(wù)入口對象排序;
將排序之后的一個或多個服務(wù)入口對象加載至所述語音服務(wù)號碼。
B12、如B8或B9或B10或B11所述的裝置,所述菜單切換點檢測模塊還適于:
對所述語音數(shù)據(jù)進行語音活動檢測;
當在語音活動檢測中檢測到所述靜音點時,確認檢測到菜單切換點。
B13、如B8或B9或B10或B11所述的裝置,所述菜單切換點檢測模塊還適于:
對所述語音數(shù)據(jù)進行語音識別,以獲得第一文本;
當所述第一文本具有預(yù)設(shè)的菜單切換文本時,確認檢測到菜單切換點。
B14、如B8或B9或B10或B11所述的裝置,還包括:
撥號模塊,適于接通語音服務(wù)號碼;
語音識別模塊,適于對所接收到的語音數(shù)據(jù)進行語音識別,以獲得第二文本;
特征文本組合判斷模塊,適于在所述第二文本具有預(yù)設(shè)的菜單切換文本時,判斷所述第二文本中是否具有特征文本組合,所述特征文本組合包括按鍵標識文本和數(shù)字按鍵;若是,則調(diào)用按鍵模塊,若否,則調(diào)用識別文本提 取模塊;
按鍵模塊,適于觸發(fā)每一個數(shù)字按鍵,分別返回調(diào)用所述語音識別模塊;
識別文本提取模塊,適于提取上一層的特征文本組合之前的識別文本;
服務(wù)入口對象生成模塊,適于根據(jù)所述識別文本生成服務(wù)入口對象;
撥號路徑信息生成模塊,適于將到達所述識別文本及之前所觸發(fā)的數(shù)字按鍵按照順序排序,生成撥號路徑信息。