專利名稱:一種基于移動電話的能聽會說的萬能紅外遙控裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及移動電話應(yīng)用。
背景技術(shù):
一般家庭會擁有眾多的家用電器,諸如空調(diào),電視機等等。這些家用電器一般都會配有紅外遙控器來選擇電視節(jié)目或空調(diào)溫度等等。隨著芯片的功能日益強大,移動電話的擴展應(yīng)用越來越多。有人利用移動電話的麥克風(fēng)錄制心臟跳動的聲音來做心臟的功能檢測,等等。隨著移動電話的普及率越來越高,在手機上安裝紅外遙控裝置來替代諸多的家用電器遙控器可以給用戶帶來便捷。如果該遙控器還能聽會說,那么它無疑會提升用戶的體驗。另外,為了實現(xiàn)萬能遙控器的功能,學(xué)習(xí)型遙控器也可以實現(xiàn)“萬能”遙控,但是該遙控器必須包含紅外接收部分,即光電轉(zhuǎn)換放大器,解調(diào)和解碼部分。如果遙控器只含有發(fā)射部分,那么這無疑降低了成本。
發(fā)明內(nèi)容
本發(fā)明的目的是為了使移動電話具有萬能紅外遙控的功能,同時利用移動電話的處理芯片進行語音識別和語音合成來給用戶帶來便捷。為了實現(xiàn)上述目的,本發(fā)明提供了一種基于移動電話的能聽會說的萬能紅外遙控
直ο其特征在于包括該裝置在移動電話上安裝了紅外信號發(fā)生器來發(fā)射紅外遙控信號。該裝置通過移動電話上的麥克風(fēng)來接收語音信號,可以對接收的語音信號進行語音識別,根據(jù)語音識別的結(jié)果來控制紅外信號發(fā)生器。用戶可以通過移動電話下載電視臺目錄,并通過麥克風(fēng)輸入期望電視臺的語音,語音識別的結(jié)果就是從該電視臺目錄中產(chǎn)生。用戶可以通過移動電話更新遙控編碼,并把遙控編碼存儲在移動電話里。該裝置通過移動電話上的揚聲器來播放語音信號,可以通過語音合成軟件和揚聲器將紅外信號所對應(yīng)的文字內(nèi)容轉(zhuǎn)化成語音并播放出來。
圖1是本發(fā)明的實施方式用于發(fā)射紅外遙控信號的示意流程圖。圖2是本發(fā)明的實施方式用于文字轉(zhuǎn)化成語音的示意流程圖。圖3是本發(fā)明的實施方式用于提取說話者語音的特征參數(shù)的示意流程圖。圖4是本發(fā)明的實施方式在移動電話上實現(xiàn)能聽會說的萬能紅外遙控裝置的示意結(jié)構(gòu)圖。
具體實施例方式下面將結(jié)合附圖對本發(fā)明的實施方式進行詳細描述。圖1是本發(fā)明的實施方式用于發(fā)射紅外遙控信號的示意流程圖。該流程開始于步驟101,即把移動電話的鍵盤,觸摸屏或者語音識別的結(jié)果作為鍵碼,產(chǎn)生鍵盤矩陣數(shù)字信號。在步驟102,遙控專用集成電路能產(chǎn)生鍵位掃描脈沖信號,并能譯出按鍵的鍵碼, 再經(jīng)遙控指令編碼器得到某鍵位的遙控指令(遙控編碼脈沖),由38KHz的載波進行脈沖幅度調(diào)制。在步驟103,激勵器對脈沖幅度調(diào)制信號進行激勵。在步驟104,激勵后的脈沖幅度調(diào)制信號激勵紅外二極管發(fā)出紅外遙控信號。圖2是本發(fā)明的實施方式用于文字轉(zhuǎn)化成語音的示意流程圖。該流程開始于步驟201,即用戶需要將選擇的控制命令的文字或電視臺的名稱朗讀出來。在步驟202,將文字所對應(yīng)的拼音標注出來。如果遇到多音字,則根據(jù)前后的相鄰的漢字來決定。在步驟203,每個拼音都對應(yīng)一個LPC參數(shù),將所有拼音的LPC參數(shù)都拼接起來,產(chǎn)生一個拼接后的LPC參數(shù)。在步驟204,利用LPC參數(shù),脈沖序列和白噪聲合成語音。激勵后的脈沖幅度調(diào)制信號激勵紅外二極管發(fā)出紅外遙控信號。流程結(jié)束于步驟205。圖3是本發(fā)明的實施方式用于提取說話者語音的特征參數(shù)的示意流程圖。該流程以基于Window Mobile的手機操作系統(tǒng)的移動電話為例。該流程開始于步驟301,即用戶使用鼠標或鍵盤開始錄制語音。然后,在步驟302,設(shè)置參數(shù)并打開錄音設(shè)備。在步驟303,Windows核心庫處理消息。在步驟304,雙緩存音頻存儲方案是使用兩塊內(nèi)存進行音頻的采集和存儲。當(dāng)某個內(nèi)存裝滿時,系統(tǒng)就會發(fā)出MM_WIM_DATA消息,該消息處理函數(shù)馬上更換另一塊內(nèi)存。這種方案的優(yōu)點在于無需指定固定的錄音時間,只要該消息處理函數(shù)檢測到停止錄音的條件, 就可以自動停止錄音,參見宋坤,劉銳寧,馬文強所著,“Visual C++視頻技術(shù)方案寶典”。當(dāng)某個內(nèi)存裝滿時,系統(tǒng)就會發(fā)出MM_WIM_DATA消息,該消息處理函數(shù)馬上更換另一塊內(nèi)存進行錄音,然后把這一塊內(nèi)存的數(shù)據(jù)讀入緩沖區(qū),再進入步驟305。在步驟305,對緩沖區(qū)內(nèi)的音頻采樣數(shù)據(jù)進行端點檢測和特征提取。端點檢測可以設(shè)置語音結(jié)束的標志。當(dāng)某個內(nèi)存裝滿時,系統(tǒng)就會發(fā)出MM_WIM_DATA消息。如果該消息處理函數(shù)沒有檢測到語音結(jié)束的標志時,那么該消息處理函數(shù)馬上更換另一塊內(nèi)存繼續(xù)錄音,即轉(zhuǎn)回步驟304 ;否則進入步驟305。關(guān)于端點檢測,參見ITU-T Rec. G. 729,Annex B,A silence compression scheme for G. 729 optimized for terminals conforming to ITU-TV. 70.關(guān)于特征提取,采用了線性預(yù)測倒譜系數(shù)(LPCC),參見 L. R. Rabiner 和 B. -H. Juang 所著"Fundamentals of Speech Recognition.,,。流程結(jié)束于步驟305。
圖4是本發(fā)明的實施方式在移動電話上實現(xiàn)能聽會說的萬能紅外遙控裝置的示意結(jié)構(gòu)圖。錄音設(shè)備401用于采集和存儲音頻信號,該產(chǎn)品中采用了 8K采樣率,16位,單聲道的參數(shù)設(shè)置。當(dāng)用戶按壓錄音鍵時,錄音設(shè)備開始錄音。該產(chǎn)品采用了雙緩存音頻存儲方案錄制音頻信號,參見宋坤,劉銳寧,馬文強所著,“Visual C++視頻技術(shù)方案寶典”。端點檢測和特征提取402用于對采樣后的音頻信號進行端點檢測,來確定有效語音信號的起止幀,同時提取每一幀的語音的特征參數(shù)線性預(yù)測倒譜系數(shù),參見 L. R. Rabiner 禾口 B.-H. Juang 所著"Fundamentals of Speech Recognition·,,。提取的特征參數(shù)可以用于語音識別和語音模板的訓(xùn)練。語音識別引擎403用于計算征參數(shù)與合成語音模板的距離,該產(chǎn)品運用了 DTW算法,參見 L· R· Rabiner 禾口 B·-H. Juang 所著 “Fundamentals of Speech Recognition·,,。這里的合成語音模板是利用語音模板404和遙控編碼及電視臺目錄405所對應(yīng)文字拼接的音節(jié)串產(chǎn)生的。語音模板404用于語音識別。該產(chǎn)品使用非特定人的普通話的與上下文有關(guān)的單音節(jié)語音模板,從而可以使用戶無需事先訓(xùn)練即可使用語音輸入功能。用戶界面405用于利用移動互聯(lián)網(wǎng),藍牙,紅外等途徑下載各種家用電器的遙控編碼和電視臺目錄,并可將遙控編碼存儲在移動電話里。在發(fā)送紅外信號時,用戶也可以通過用戶界面405對發(fā)送紅外信號所對應(yīng)的文字內(nèi)容進行語音合成。遙控編碼及電視臺目錄406用于產(chǎn)生將控制信號對應(yīng)的文本內(nèi)容供語音識別弓丨擎403使用,同時建立文字信息與遙控編碼本的對應(yīng)關(guān)系。遙控編碼本407用于用戶界面發(fā)來的指令,語音識別指令轉(zhuǎn)換成遙控編碼。鍵盤矩陣408用于產(chǎn)生鍵盤矩陣數(shù)字信號。遙控專用集成電路409能產(chǎn)生鍵位掃描脈沖信號,并能譯出按鍵的鍵碼,再經(jīng)遙控指令編碼器得到某鍵位的遙控指令(遙控編碼脈沖),由38KHz的載波進行脈沖幅度調(diào)制。激勵器410對脈沖幅度調(diào)制信號進行激勵。紅外發(fā)光二極管411將激勵后的脈沖幅度調(diào)制信號激勵紅外二極管發(fā)出紅外遙控信號。語音合成412將遙控編碼所對應(yīng)的文字內(nèi)容轉(zhuǎn)化成語音。揚聲器413將語音播放出來。雖然以上描述了本發(fā)明的具體實施方式
,但是本技術(shù)領(lǐng)域內(nèi)的熟練技術(shù)人員應(yīng)當(dāng)理解,這些僅是舉例說明,可以對這些實施方式做出多種變更或修改,而不會背離本發(fā)明的原理和實質(zhì)。本發(fā)明的范圍僅由權(quán)利要求書限定。
權(quán)利要求
1.一種基于移動電話的能聽會說的萬能紅外遙控裝置。 其特征在于包括該裝置在移動電話上安裝了紅外信號發(fā)生器來發(fā)射紅外遙控信號。 該裝置通過移動電話上的麥克風(fēng)來接收語音信號。 該裝置通過移動電話上的揚聲器來播放語音信號。
2.根據(jù)權(quán)利要求1的紅外遙控裝置,其特征包括可以對接收的語音信號進行語音識另O,根據(jù)語音識別的結(jié)果來控制紅外信號發(fā)生器。
3.根據(jù)權(quán)利要求1的紅外遙控裝置,其特征包括可以通過語音合成軟件和揚聲器將紅外信號所對應(yīng)的文字內(nèi)容轉(zhuǎn)化成語音并播放出來。
4.根據(jù)權(quán)利要求1的紅外遙控裝置,其特征包括用戶可以通過移動電話更新遙控編碼,并把遙控編碼存儲在移動電話里。
5.根據(jù)權(quán)利要求2的紅外遙控裝置,其特征包括用戶可以通過移動電話下載電視臺目錄,并通過麥克風(fēng)輸入期望電視臺的語音,語音識別的結(jié)果就是從該電視臺目錄中產(chǎn)生。
全文摘要
本發(fā)明提供了一種基于移動電話的能聽會說的萬能紅外遙控裝置。該裝置在移動電話上安裝了紅外信號發(fā)生器來發(fā)射紅外遙控信號。該裝置通過移動電話上的麥克風(fēng)來接收語音信號,可以對接收的語音信號進行語音識別,根據(jù)語音識別的結(jié)果來控制紅外信號發(fā)生器。用戶可以通過移動電話下載電視臺目錄,并通過麥克風(fēng)輸入期望電視臺的語音,語音識別的結(jié)果就是從該電視臺目錄中產(chǎn)生。用戶可以通過移動電話更新遙控編碼,并把遙控編碼存儲在移動電話里。該裝置通過移動電話上的揚聲器來播放語音信號,可以通過語音合成軟件和揚聲器將紅外信號所對應(yīng)的文字內(nèi)容轉(zhuǎn)化成語音并播放出來。
文檔編號H04M1/725GK102469200SQ201010540979
公開日2012年5月23日 申請日期2010年11月11日 優(yōu)先權(quán)日2010年11月11日
發(fā)明者朱建政 申請人:朱建政