本發(fā)明涉及語音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種語音處理方法及裝置。
背景技術(shù):
語音識(shí)別技術(shù)是一種通過機(jī)器正確識(shí)別人類的語音,并將人類語音中的詞匯內(nèi)容轉(zhuǎn)換為相應(yīng)的計(jì)算機(jī)可讀可輸入的文本或命令的高科技技術(shù)。隨著科技的不斷進(jìn)步,語音識(shí)別技術(shù)涉及領(lǐng)域也越來越廣泛。相對(duì)于鍵盤輸入等其他輸入方式,語音識(shí)別技術(shù)更符合用戶日常習(xí)慣,因此,它將成為最重要的人機(jī)交互技術(shù)之一。
然而,現(xiàn)有技術(shù)中語音輸入法,存在最大的問題在于語音處理中的識(shí)別速度不快和準(zhǔn)確度不高,雖然識(shí)別速度不快的問題已逐漸得到解決,但是由于語言的存在相似的詞多以及語言種類多等原因,導(dǎo)致其準(zhǔn)確度不高的問題一直無法解決,影響了用戶的體驗(yàn)效果,無法滿足用戶對(duì)語音輸入的要求。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明提供一種語音處理方法,能夠提升語音處理的準(zhǔn)確度與便捷性,同時(shí)也能夠給用戶良好的體驗(yàn)效果。
本發(fā)明實(shí)施例提供了一種語音處理方法,所述方法包括:接收語音信息;對(duì)所述語音信息進(jìn)行識(shí)別,以將所述語音信息轉(zhuǎn)化為多條文本信息;顯示至少一條文本信息;以及接收選擇信號(hào),以根據(jù)被選擇的文本信息進(jìn)行響應(yīng)。
具體地,所述接收選擇信號(hào),以根據(jù)被選擇的文本信息進(jìn)行響應(yīng)的步驟包括:獲取每一條文本信息中被選擇的文字;對(duì)所述被選擇的文字按預(yù)設(shè)規(guī)則進(jìn)行排序以得到所述被選擇的文本信息。
具體地,比對(duì)所述多條文本信息,以得到經(jīng)由相同語音識(shí)別出的不同的字或詞;分別計(jì)算所述字或詞的權(quán)重得分,并篩選出權(quán)重得分最高的字或詞;顯示包括所有所述權(quán)重得分最高的字或詞的一條文本信息,并突出顯示所述權(quán)重得分最高的字或詞。
具體地,所述顯示至少一條文本信息的步驟還包括:接收對(duì)突出顯示的字或詞的觸發(fā)信號(hào);根據(jù)所述觸發(fā)信號(hào)顯示與突出顯示的字或詞經(jīng)由相同語音識(shí)別出的字或詞;接收所述選擇信號(hào),并用被選擇的字或詞替換所述突出顯示的字或詞以得到所述被選擇的文本信息。
具體地,根據(jù)所述字或詞出現(xiàn)的頻率、時(shí)間、出處的權(quán)威性、是否為常用詞、是否為方言及是否為數(shù)字中的至少一項(xiàng)對(duì)所述字或詞進(jìn)行加權(quán)處理,以得到所述字或詞的權(quán)重得分。
本發(fā)明實(shí)施例還提供一種語音處理裝置,所述裝置包括:接收模塊,用于接收語音信息;語音識(shí)別模塊,用于對(duì)所述語音信息進(jìn)行識(shí)別,以將所述語音信息轉(zhuǎn)化為多條文本信息;顯示模塊,用于顯示至少一條文本信息;以及文本輸入模塊,用于接收選擇信號(hào),以根據(jù)被選擇的文本信息進(jìn)行響應(yīng)。
具體地,所述文本輸入模塊包括:獲取單元,用于獲取每一條文本信息中被選擇的文字;第一文字處理單元,用于對(duì)所述被選擇的文字按預(yù)設(shè)規(guī)則進(jìn)行排序以得到所述被選擇的文本信息。
具體地,所述顯示模塊包括:第二文字處理單元,用于比對(duì)所述多條文本信息,以得到經(jīng)由相同語音識(shí)別出的不同的字或詞,并分別計(jì)算所述字或詞的權(quán)重得分,以篩選出權(quán)重得分最高的字或詞;第一顯示單元,用于顯示包括所有所述權(quán)重得分最高的字或詞的一條文本信息,并突出顯示所述權(quán)重得分最高的字或詞。
具體地,所述文本輸入模塊包括:接收單元,用于接收對(duì)突出顯示的字或詞的觸發(fā)信號(hào);第二顯示單元,用于根據(jù)所述觸發(fā)信號(hào)顯示與突出顯示的字或詞經(jīng)由相同語音識(shí)別出的字或詞;第三文字處理單元,用于接收所述選擇信號(hào),并用被選擇的字或詞替換所述突出顯示的字或詞以得到所述被選擇的文本信息。
具體地,根據(jù)所述字或詞出現(xiàn)的頻率、時(shí)間、出處的權(quán)威性、是否為常用詞、是否為方言及是否為數(shù)字中的至少一項(xiàng)對(duì)所述字或詞進(jìn)行加權(quán)處理,以得到所述字或詞的權(quán)重得分。
本發(fā)明實(shí)施例提供的語音處理方法及裝置,通過在識(shí)別語音信息后,用戶可在顯示的文本信息進(jìn)行點(diǎn)擊選擇確認(rèn),以使得被選擇的文本信息與接收的語音信息一致,提升了語音處理的準(zhǔn)確度與便捷性,同時(shí)也能夠給用戶良好的體驗(yàn)效果。
為讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附圖式,作詳細(xì)說明如下。
附圖說明
圖1示出了一種終端的結(jié)構(gòu)框圖;
圖2為本發(fā)明第一實(shí)施例提供的語音處理方法流程圖;
圖3為本發(fā)明第二實(shí)施例提供的語音處理方法流程圖;
圖4為本發(fā)明第三實(shí)施例提供的語音處理方法流程圖;
圖5為本發(fā)明第四實(shí)施例提供的語音處理裝置的結(jié)構(gòu)框圖;
圖6為本發(fā)明第五實(shí)施例提供的語音處理裝置的結(jié)構(gòu)框圖;
圖7為本發(fā)明第六實(shí)施例提供的語音處理裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
圖1示出了一種終端的結(jié)構(gòu)框圖。本發(fā)明提供的語音處理方法及裝置可以應(yīng)用于如圖1所示的終端,如圖1所示,終端10包括存儲(chǔ)器102、存儲(chǔ)控制器104,一個(gè)或多個(gè)(圖中僅示出一個(gè))處理器106、外設(shè)接口108、射頻模塊110、定位模塊112、攝像模塊114、音頻模塊116、屏幕118以及按鍵模塊120。這些組件通過一條或多條通訊總線/信號(hào)線122相互通訊。
可以理解,圖1所示的結(jié)構(gòu)僅為示意,終端10還可包括比圖1中所示更多或者更少的組件,或者具有與圖1所示不同的配置。圖1中所示的各組件可以采用硬件、軟件或其組合實(shí)現(xiàn)。
存儲(chǔ)器102可用于存儲(chǔ)軟件程序以及模塊,如本發(fā)明實(shí)施例中的語音處理方法及裝置對(duì)應(yīng)的程序指令/模塊,處理器106通過運(yùn)行存儲(chǔ)在存儲(chǔ)控制器104內(nèi)的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,即實(shí)現(xiàn)上述的語音處理方法及裝置。
存儲(chǔ)器102可包括高速隨機(jī)存儲(chǔ)器,還可包括非易失性存儲(chǔ)器,如一個(gè)或者多個(gè)磁性存儲(chǔ)裝置、閃存、或者其他非易失性固態(tài)存儲(chǔ)器。在一些實(shí)例中,存儲(chǔ)器102可進(jìn)一步包括相對(duì)于處理器106遠(yuǎn)程設(shè)置的存儲(chǔ)器,這些遠(yuǎn)程存儲(chǔ)器可以通過網(wǎng)絡(luò)連接至終端10。上述網(wǎng)絡(luò)的實(shí)例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動(dòng)通信網(wǎng)及其組合。處理器106以及其他可能的組件對(duì)存儲(chǔ)器102的訪問可在存儲(chǔ)控制器104的控制下進(jìn)行。
外設(shè)接口108將各種輸入/輸入裝置耦合至CPU以及存儲(chǔ)器102。處理器106運(yùn)行存儲(chǔ)器102內(nèi)的各種軟件、指令以執(zhí)行終端10的各種功能以及進(jìn)行數(shù)據(jù)處理。
在一些實(shí)施例中,外設(shè)接口108,處理器106以及存儲(chǔ)控制器104可以在單個(gè)芯片中實(shí)現(xiàn)。在其他一些實(shí)例中,他們可以分別由獨(dú)立的芯片實(shí)現(xiàn)。
射頻模塊110用于接收以及發(fā)送電磁波,實(shí)現(xiàn)電磁波與電信號(hào)的相互轉(zhuǎn)換,從而與通訊網(wǎng)絡(luò)或者其他設(shè)備進(jìn)行通訊。射頻模塊110可包括各種現(xiàn)有的用于執(zhí)行這些功能的電路元件,例如,天線、射頻收發(fā)器、數(shù)字信號(hào)處理器、加密/解密芯片、用戶身份模塊(SIM)卡、存儲(chǔ)器等等。射頻模塊110可與各種網(wǎng)絡(luò)如互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、無線網(wǎng)絡(luò)進(jìn)行通訊或者通過無線網(wǎng)絡(luò)與其他設(shè)備進(jìn)行通訊。上述的無線網(wǎng)絡(luò)可包括蜂窩式電話網(wǎng)、無線局域網(wǎng)或者城域網(wǎng)。上述的無線網(wǎng)絡(luò)可以使用各種通信標(biāo)準(zhǔn)、協(xié)議及技術(shù),包括但并不限于全球移動(dòng)通信系統(tǒng)(Global System for Mobile Communication,GSM)、增強(qiáng)型移動(dòng)通信技術(shù)(Enhanced Data GSM Environment,EDGE),寬帶碼分多址技術(shù)(wideband code division multiple access,W-CDMA),碼分多址技術(shù)(Code division access,CDMA)、時(shí)分多址技術(shù)(time division multiple access,TDMA),藍(lán)牙,無線保真技術(shù)(Wireless,Fidelity,WiFi)(如美國電氣和電子工程師協(xié)會(huì)標(biāo)準(zhǔn)IEEE 802.11a,IEEE 802.11b,IEEE802.11g和/或IEEE 802.11n)、網(wǎng)絡(luò)電話(Voice over internet protocal,VoIP)、全球微波互聯(lián)接入(Worldwide Interoperability for Microwave Access,Wi-Max)、其他用于郵件、即時(shí)通訊及短消息的協(xié)議,以及任何其他合適的通訊協(xié)議,甚至可包括那些當(dāng)前仍未被開發(fā)出來的協(xié)議。
定位模塊112用于獲取終端10的當(dāng)前位置。定位模塊112的實(shí)例包括但不限于全球衛(wèi)星定位系統(tǒng)(GPS)、基于無線局域網(wǎng)或者移動(dòng)通信網(wǎng)的定位技術(shù)。
攝像模塊114用于拍攝照片或者視頻。拍攝的照片或者視頻可以存儲(chǔ)至存儲(chǔ)器102內(nèi),并可通過射頻模塊110發(fā)送。
音頻模塊116向用戶提供音頻接口,其可包括一個(gè)或多個(gè)麥克風(fēng)、一個(gè)或者多個(gè)揚(yáng)聲器以及音頻電路。音頻電路從外設(shè)接口108處接收聲音數(shù)據(jù),將聲音數(shù)據(jù)轉(zhuǎn)換為電信息,將電信息傳輸至揚(yáng)聲器。揚(yáng)聲器將電信息轉(zhuǎn)換為人耳能聽到的聲波。音頻電路還從麥克風(fēng)處接收電信息,將電信號(hào)轉(zhuǎn)換為聲音數(shù)據(jù),并將聲音數(shù)據(jù)傳輸至外設(shè)接口108中以進(jìn)行進(jìn)一步的處理。音頻數(shù)據(jù)可以從存儲(chǔ)器102處或者通過射頻模塊110獲取。此外,音頻數(shù)據(jù)也可以存儲(chǔ)至存儲(chǔ)器102中或者通過射頻模塊110進(jìn)行發(fā)送。在一些實(shí)例中,音頻模塊116還可包括一個(gè)耳機(jī)播孔,用于向耳機(jī)或者其他設(shè)備提供音頻接口。
屏幕118在終端10與用戶之間提供一個(gè)輸出界面。具體地,屏幕118向用戶顯示視頻輸出,這些視頻輸出的內(nèi)容可包括文字、圖形、視頻、及其任意組合。一些輸出結(jié)果是對(duì)應(yīng)于一些用戶界面對(duì)象??梢岳斫獾模聊?18還可以包括觸控屏幕。觸控屏幕在終端10與用戶之間同時(shí)提供一個(gè)輸出及輸入界面。除了向用戶顯示視頻輸出,觸控屏幕還接收用戶的輸入,例如用戶的點(diǎn)擊、滑動(dòng)等手勢(shì)操作,以便用戶界面對(duì)象對(duì)這些用戶的輸入做出響應(yīng)。檢測(cè)用戶輸入的技術(shù)可以是基于電阻式、電容式或者其他任意可能的觸控檢測(cè)技術(shù)。觸控屏幕顯示單元的具體實(shí)例包括但并不限于液晶顯示器或發(fā)光聚合物顯示器。
按鍵模塊120同樣提供用戶向終端10進(jìn)行輸入的接口,用戶可以通過按下不同的按鍵以使終端10執(zhí)行不同的功能。
第一實(shí)施例
圖2為本發(fā)明第一實(shí)施例提供的語音處理方法的流程圖。本實(shí)施例為語音處理裝置執(zhí)行的語音處理方法。如圖2所示,本實(shí)施例的語音處理方法可包括以下步驟:
步驟S11,接收語音信息。
具體地,運(yùn)行于終端中的語音處理裝置可通過麥克風(fēng)或其他語音輸入設(shè)備接收用戶輸入的語音信息。其中,終端可為個(gè)人電腦、筆記本電腦、平板電腦、電子書、智能手機(jī)及智能手表等具有語音輸入功能的電子設(shè)備,終端還可以為電子書閱讀器、MP3播放器(Moving Picture Experts Group udio Layer III,動(dòng)態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面3)、MP4(Moving Picture Experts Group Audio Layer IV,動(dòng)態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面4)播放器、膝上型便攜計(jì)算機(jī)和臺(tái)式計(jì)算機(jī)等等。當(dāng)然,本領(lǐng)域技術(shù)人員可以理解的是,運(yùn)行于第一終端的語音處理裝置接收的語音信息還可以為第二終端發(fā)送至第一終端的語音信息,或者第一終端通過網(wǎng)絡(luò)服務(wù)器上下載暫存的語音信息,但并不以此為限。
步驟S12,對(duì)語音信息進(jìn)行識(shí)別,以將語音信息轉(zhuǎn)化為多條文本信息。
具體地,語音處理裝置在接收到語音信息后,通過語音識(shí)別技術(shù)對(duì)語音信息進(jìn)行識(shí)別,以將語音信息轉(zhuǎn)化為多條文本信息。具體地,在一實(shí)施方式中,語音處理裝置與云端服務(wù)器通信連接,在將語音信息轉(zhuǎn)化為多條文本信息時(shí),語音處理裝置從云端服務(wù)器存儲(chǔ)的大數(shù)據(jù)庫中獲取與語音信息相關(guān)的字或詞,以組成多條文本信息。其中,大數(shù)據(jù)庫收錄了所有的報(bào)紙、雜志、網(wǎng)站等信息,從而使得大數(shù)據(jù)庫中的詞庫更豐富。當(dāng)然,本領(lǐng)域的技術(shù)人員可以理解的是,與語音信息相關(guān)的字或詞也可以直接存儲(chǔ)在語音處理裝置中。
步驟S13,顯示至少一條文本信息。
具體地,語音處理裝置通過顯示模塊顯示至少一條文本信息,在一實(shí)施方式中,語音處理裝置將語音信息轉(zhuǎn)化得到的多條文本信息均進(jìn)行顯示,但并不限于此,例如,在另一實(shí)施方式中,語音處理裝置也可以將語音信息轉(zhuǎn)化得到的多條文本信息中的一條文本信息進(jìn)行顯示。
步驟S14,接收選擇信號(hào),以根據(jù)被選擇的文本信息進(jìn)行響應(yīng)。
具體地,用戶可以通過點(diǎn)擊文本信息或點(diǎn)擊文本信息中的字或詞進(jìn)行選擇,以得到被選擇的文本信息,從而可以但不限于確認(rèn)用戶輸入的信息為被選擇的文本信息,進(jìn)而能夠使用戶輸入更加便捷,解決了語音處理的準(zhǔn)確度的問題,并能夠增加用戶的體驗(yàn)。
其中,在本實(shí)施例中,用戶還可以觸發(fā)語言按鈕并選擇用戶希望識(shí)別的語音的語言,例如,語言可以但不限于中文(普通話及地方方言如粵語、東北話、四川話等等)、英語、法語、德語及韓語等,從而使得語音處理裝置能夠識(shí)別接收的各種語言的語音信息。
本發(fā)明實(shí)施例提供的語音處理方法,通過在識(shí)別語音信息后,用戶可在顯示的文本信息進(jìn)行點(diǎn)擊選擇確認(rèn),以使得被選擇的文本信息與接收的語音信息一致,提升了語音處理的準(zhǔn)確度與便捷性,同時(shí)也能夠給用戶良好的體驗(yàn)效果。
第二實(shí)施例
圖3為本發(fā)明第二實(shí)施例提供的語音處理方法的流程圖。本實(shí)施例為語音處理裝置執(zhí)行的語音處理方法。如圖3所示,本實(shí)施例的語音處理方法可包括以下步驟:
步驟S21,獲取每一條文本信息中被選擇的文字。
具體地,在本實(shí)施例中,語音處理裝置中的顯示模塊同時(shí)顯示多條文本信息。用戶可在語音處理裝置中顯示的每一文本信息中選擇符合用戶需要的文字,語音處理裝置根據(jù)用戶的選擇獲取每一條文本信息中被選擇的文字。例如,如果一條文本信息中已包括了用戶輸入的語音信息中全部正確的字或詞,則用戶可以通過持續(xù)按壓該文本信息以獲取整條文本信息,但并不限于此。
步驟S22,對(duì)被選擇的文字按預(yù)設(shè)規(guī)則進(jìn)行排序以得到被選擇的文本信息。
具體地,在一實(shí)施方式中,語音處理裝置對(duì)被選擇的文字可以按照時(shí)間規(guī)則進(jìn)行排序以得到被選擇的文本信息,但并不以此為限,例如,語音處理裝置根據(jù)用戶選擇文字的時(shí)間先后進(jìn)行排序,具體地,最先被選擇的文字排在文本信息的最前面,最后被選擇的文字排在文本信息的最后面,從而組成了被選擇的文本信息,以快速準(zhǔn)確地得到用戶需要的文本信息。
在另一實(shí)施方式中,語音處理裝置對(duì)被選擇的文字也可以按照語法規(guī)則進(jìn)行排序以得到被選擇的文本信息,但并不以此為限,例如,語音處理裝置可以根據(jù)用戶選擇文字的詞性、語法以及對(duì)語音信息中的句子的語句結(jié)構(gòu)的預(yù)判將被選擇的文字插入到文本信息中的不同位置,從而組成了被選擇的文本信息,以快速準(zhǔn)確地得到用戶需要的文本信息。
其中,在本實(shí)施例中,用戶還可以觸發(fā)語言按鈕并選擇用戶希望識(shí)別的語音的語言,例如,語言可以但不限于中文(普通話及地方方言如粵語、東北話、四川話等等)、英語、法語、德語及韓語等,從而使得語音處理裝置能夠識(shí)別接收的各種語言的語音信息。
其中,語音處理裝置與云端服務(wù)器通信連接,將語音信息轉(zhuǎn)化為多條文本信息時(shí),語音處理裝置從云端服務(wù)器存儲(chǔ)的大數(shù)據(jù)庫中獲取與語音信息相關(guān)的字或詞,以組成多條文本信息。具體地,大數(shù)據(jù)庫收錄了所有的報(bào)紙、雜志、網(wǎng)站等信息,從而使得大數(shù)據(jù)庫中的詞庫更豐富。當(dāng)然,本領(lǐng)域的技術(shù)人員可以理解的是,與語音信息相關(guān)的字或詞也可以直接存儲(chǔ)在語音處理裝置中。
本發(fā)明實(shí)施例提供的語音處理方法,通過在識(shí)別語音信息后,用戶可在顯示的文本信息中的文字進(jìn)行點(diǎn)擊選擇確認(rèn),并將被選擇的文字進(jìn)行重新排序以得到被選擇的文本信息,保證了被選擇的文本信息與接收的語音信息一致,進(jìn)一步地提升了語音處理的準(zhǔn)確度與便捷性,同時(shí)也能夠給用戶良好的體驗(yàn)效果。
第三實(shí)施例
圖4為本發(fā)明第三實(shí)施例提供的語音處理方法流程圖。本實(shí)施例為語音處理裝置執(zhí)行的語音處理方法。如圖4所示,本實(shí)施例的語音處理方法可包括以下步驟:
步驟S31,比對(duì)多條文本信息,以得到經(jīng)由相同語音識(shí)別出的不同的字或詞。
具體地,在本實(shí)施例中,語音處理裝置在識(shí)別接收到的語音信息后,從云端服務(wù)器中的大數(shù)據(jù)庫中獲取與語音信息相匹配的文本信息,若語音信息中的語句含有詞性相似的字或詞(例如同音字、同音詞或新造詞等不確定性字或詞)的內(nèi)容時(shí),語音處理裝置將會(huì)獲取多條文本信息。語音處理裝置將多條文本信息進(jìn)行比對(duì)得到每一條文本信息,以得到經(jīng)由相同語音識(shí)別出的不同的字或詞,例如,語音處理裝置根據(jù)接收到的語音信息進(jìn)行語音識(shí)別后得到“他執(zhí)導(dǎo)的電影觀眾反映好”、“他指導(dǎo)的電影觀眾反映好”與“他執(zhí)導(dǎo)的電影觀眾反應(yīng)好”等多條文本信息,其中,“執(zhí)導(dǎo)”與“指導(dǎo)”均是由一相同語音識(shí)別出的不同的詞,“反映”與“反應(yīng)”均是由另一相同語音識(shí)別出的不同的詞,但并不以此為限。
步驟S32,分別計(jì)算字或詞的權(quán)重得分,并篩選出權(quán)重得分最高的字或詞。
其中,根據(jù)字或詞出現(xiàn)的頻率、時(shí)間、出處的權(quán)威性、是否為常用詞、是否為方言及是否為數(shù)字中的至少一項(xiàng)對(duì)字或詞進(jìn)行加權(quán)處理,以得到所述字或詞的權(quán)重得分。
具體地,在一實(shí)施方式中,可以根據(jù)字或詞出現(xiàn)的頻率、時(shí)間、出處的權(quán)威性、是否為常用詞、是否為方言及是否為數(shù)字等一項(xiàng)或多項(xiàng)進(jìn)行加權(quán)處理,以得到該字或詞的權(quán)重得分,但并不以此為限,例如在其它實(shí)施例中還可以設(shè)置其它條件進(jìn)行加權(quán)處理。具體地,在本實(shí)施例中,可以將字或詞出現(xiàn)的頻率、時(shí)間、出處的權(quán)威性、是否為常用詞、是否為方言及是否為數(shù)字中的每一項(xiàng)分別預(yù)置一加權(quán)分?jǐn)?shù),當(dāng)字或詞符合上述一項(xiàng)或多項(xiàng)時(shí)將該項(xiàng)加權(quán)分?jǐn)?shù)賦值至該字或詞,并進(jìn)行求和處理得到該字或詞的最終權(quán)重得分,并記錄于權(quán)重得分列表中。具體地,字或詞的權(quán)重得分可以根據(jù)大數(shù)據(jù)庫中信息更新以實(shí)時(shí)更新字或詞的權(quán)重得分,并將更新的字或詞的權(quán)重得分記錄于權(quán)重得分列表中。
步驟S33,顯示包括所有權(quán)重得分最高的字或詞的一條文本信息,并突出顯示權(quán)重得分最高的字或詞。
具體地,在一條文本信息中的一個(gè)字或詞的權(quán)重得分分別高于多條文本信息中經(jīng)由相同語音識(shí)別出的字或詞的權(quán)重得分,則語音處理裝置顯示包含該字或詞的一條文本信息。同時(shí),并對(duì)經(jīng)由相同語音識(shí)別出的字或詞中權(quán)重得分最高的字或詞進(jìn)行突出顯示。
步驟S34,接收對(duì)突出顯示的字或詞的觸發(fā)信號(hào)。
具體地,在一實(shí)施方式中,若用戶對(duì)某一突出顯示的字或詞的使用不滿意,則用戶可以通過對(duì)突出顯示的字或詞的點(diǎn)擊或按壓方式生成觸發(fā)信號(hào),語音處理裝置檢測(cè)到用戶對(duì)突出顯示的字或詞的點(diǎn)擊或按壓方式后,接收到觸發(fā)信號(hào)。
步驟S35,根據(jù)觸發(fā)信號(hào)顯示與突出顯示的字或詞經(jīng)由相同語音識(shí)別出的字或詞。
具體地,語音處理裝置根據(jù)觸發(fā)信號(hào)對(duì)被觸發(fā)的字或詞進(jìn)行下拉菜單方式顯示多個(gè)字或詞,以供用戶進(jìn)行選擇需要的字或詞。
步驟S36,接收選擇信號(hào),并用被選擇的字或詞替換突出顯示的字或詞以得到被選擇的文本信息。
具體地,語音處理裝置根據(jù)接收到的選擇信號(hào),用被選擇的字或詞替換突出顯示的字或詞,從而使得被選擇的文本信息與接收到的語音信息所表達(dá)的意思一致。
具體地,在一實(shí)施方式中,語音處理裝置根據(jù)接收到的語音信息進(jìn)行語音識(shí)別后得到“他執(zhí)導(dǎo)的電影觀眾反映好”、“他指導(dǎo)的電影觀眾反映好”與“他執(zhí)導(dǎo)的電影觀眾反應(yīng)好”等多條文本信息,其中,“執(zhí)導(dǎo)”與“指導(dǎo)”均是由一相同語音識(shí)別出的不同的詞,“反映”與“反應(yīng)”均是由另一相同語音識(shí)別出的不同的詞。語音處理裝置經(jīng)過對(duì)“執(zhí)導(dǎo)”與“指導(dǎo)”進(jìn)行計(jì)算分析后得出“指導(dǎo)”的權(quán)重得分高于“執(zhí)導(dǎo)”的權(quán)重得分,“反映”的權(quán)重得分高于“反應(yīng)”的權(quán)重得分。語音處理裝置篩選出權(quán)重得分最高的“指導(dǎo)”與“反映”的兩個(gè)詞,從而得出文本信息“他指導(dǎo)的電影觀眾反映好”中包含了所有權(quán)重得分最高的字或詞。語音處理裝置將“他指導(dǎo)的電影觀眾反映好”進(jìn)行顯示,并對(duì)“指導(dǎo)”與“反映”進(jìn)行突出顯示,如果用戶在看到文本信息后覺得“指導(dǎo)”不符合語音信息中所要表達(dá)的意思,用戶可以點(diǎn)擊“指導(dǎo)”以向語音處理裝置發(fā)送觸發(fā)信號(hào),語音處理裝置根據(jù)觸發(fā)信號(hào)進(jìn)行下拉菜單方式顯示多個(gè)與“指導(dǎo)”的語音相同的字或詞,例如顯示“執(zhí)導(dǎo)”、“知道”、“之道”、“只到”等詞以供用戶選擇替換。在用戶選擇“執(zhí)導(dǎo)”后,語音處理裝置用“執(zhí)導(dǎo)”替換文本信息中的“指導(dǎo)”,從而得到被選擇的文本信息“他執(zhí)導(dǎo)的電影觀眾反映好”,但并不以此為限。
其中,在本實(shí)施例中,用戶還可以觸發(fā)語言按鈕并選擇用戶希望識(shí)別的語音的語言,例如,語言可以但不限于中文(普通話及地方方言如粵語、東北話、四川話等等)、英語、法語、德語及韓語等,從而使得語音處理裝置能夠識(shí)別接收的各種語言的語音信息。
其中,語音處理裝置與云端服務(wù)器通信連接,將語音信息轉(zhuǎn)化為多條文本信息時(shí),語音處理裝置從云端服務(wù)器存儲(chǔ)的大數(shù)據(jù)庫中獲取與語音信息相關(guān)的字或詞,以組成多條文本信息。具體地,大數(shù)據(jù)庫收錄了所有的報(bào)紙、雜志、網(wǎng)站等信息,從而使得大數(shù)據(jù)庫中的詞庫更豐富。當(dāng)然,本領(lǐng)域的技術(shù)人員可以理解的是,與語音信息相關(guān)的字或詞也可以直接存儲(chǔ)在語音處理裝置中。
本發(fā)明實(shí)施例提供的語音處理方法,通過在識(shí)別語音信息后,用戶可在顯示的文本信息中的字或詞進(jìn)行點(diǎn)擊或按壓后進(jìn)行選擇替換,以得到被選擇的文本信息,保證了被選擇的文本信息與接收的語音信息一致,進(jìn)一步地提升了語音處理的準(zhǔn)確度與便捷性,同時(shí)也能夠給用戶良好的體驗(yàn)效果。
第四實(shí)施例
圖5為本發(fā)明第四實(shí)施例提供的語音處理裝置40的結(jié)構(gòu)框圖。本實(shí)施例提供的語音處理裝置40可用于實(shí)現(xiàn)第一實(shí)施例提供的語音處理方法。如圖5所示,語音處理裝置40包括接收模塊42、語音識(shí)別模塊44、顯示模塊46及文本輸入模塊48。
其中,接收模塊42,用于接收語音信息。
其中,語音識(shí)別模塊44,用于對(duì)語音信息進(jìn)行識(shí)別,以將語音信息轉(zhuǎn)化為多條文本信息。
其中,顯示模塊46,用于顯示至少一條文本信息。
其中,文本輸入模塊48,用于接收選擇信號(hào),以根據(jù)被選擇的文本信息進(jìn)行響應(yīng)。
其中,在本實(shí)施例中,用戶還可以觸發(fā)語言按鈕并選擇用戶希望識(shí)別的語音的語言,例如,語言可以但不限于中文(普通話及地方方言如粵語、東北話、四川話等等)、英語、法語、德語及韓語等,從而使得語音處理裝置40能夠識(shí)別接收的各種語言的語音信息。
其中,語音處理裝置40的語音識(shí)別模塊44與云端服務(wù)器通信連接,將語音信息轉(zhuǎn)化為多條文本信息時(shí),語音處理裝置40從云端服務(wù)器存儲(chǔ)的大數(shù)據(jù)庫中獲取與語音信息相關(guān)的字或詞,以組成多條文本信息。具體地,大數(shù)據(jù)庫收錄了所有的報(bào)紙、雜志、網(wǎng)站等信息,從而使得大數(shù)據(jù)庫中的詞庫更豐富。當(dāng)然,本領(lǐng)域的技術(shù)人員可以理解的是,與語音信息相關(guān)的字或詞也可以直接存儲(chǔ)在語音處理裝置40中。
以上各模塊可以由軟件代碼實(shí)現(xiàn),此時(shí),上述的各模塊可存儲(chǔ)于存儲(chǔ)器內(nèi)。上述各模塊同樣可以由硬件例如集成電路芯片實(shí)現(xiàn)。
本實(shí)施例對(duì)語音處理裝置40的各功能單元實(shí)現(xiàn)各自功能的具體過程,請(qǐng)參見上述圖1至圖4所示實(shí)施例中描述的具體內(nèi)容,在此不再贅述。
本發(fā)明實(shí)施例提供的語音處理裝置40,通過在識(shí)別語音信息后,用戶可在顯示的文本信息進(jìn)行點(diǎn)擊選擇確認(rèn),以使得被選擇的文本信息與接收的語音信息一致,提升了語音處理的準(zhǔn)確度與便捷性,同時(shí)也能夠給用戶良好的體驗(yàn)效果。
第五實(shí)施例
圖6為本發(fā)明第五實(shí)施例提供的語音處理裝置50的結(jié)構(gòu)框圖。本實(shí)施例提供的語音處理裝置50可用于實(shí)現(xiàn)第二實(shí)施例提供的語音處理方法。如圖6所示,語音處理裝置50包括接收模塊52、語音識(shí)別模塊54、顯示模塊56及文本輸入模塊58。其中,文本輸入模塊58包括獲取單元581及第一文字處理單元582。
其中,接收模塊52,用于接收語音信息。語音識(shí)別模塊54,用于對(duì)語音信息進(jìn)行識(shí)別,以將語音信息轉(zhuǎn)化為多條文本信息。顯示模塊56,用于顯示至少一條文本信息。文本輸入模塊58,用于接收選擇信號(hào),以根據(jù)被選擇的文本信息進(jìn)行響應(yīng)。
其中,獲取單元581,用于獲取每一條文本信息中被選擇的文字。
其中,第一文字處理單元582,用于對(duì)被選擇的文字按預(yù)設(shè)規(guī)則進(jìn)行排序以得到被選擇的文本信息。
其中,在本實(shí)施例中,用戶還可以觸發(fā)語言按鈕并選擇用戶希望識(shí)別的語音的語言,例如,語言可以但不限于中文(普通話及地方方言如粵語、東北話、四川話等等)、英語、法語、德語及韓語等,從而使得語音處理裝置50能夠識(shí)別接收的各種語言的語音信息。
其中,語音處理裝置50中的語音識(shí)別模塊54與云端服務(wù)器通信連接,將語音信息轉(zhuǎn)化為多條文本信息時(shí),語音處理裝置50從云端服務(wù)器存儲(chǔ)的大數(shù)據(jù)庫中獲取與語音信息相關(guān)的字或詞,以組成多條文本信息。具體地,大數(shù)據(jù)庫收錄了所有的報(bào)紙、雜志、網(wǎng)站等信息,從而使得大數(shù)據(jù)庫中的詞庫更豐富。當(dāng)然,本領(lǐng)域的技術(shù)人員可以理解的是,與語音信息相關(guān)的字或詞也可以直接存儲(chǔ)在語音處理裝置60中。
以上各模塊可以由軟件代碼實(shí)現(xiàn),此時(shí),上述的各模塊可存儲(chǔ)于存儲(chǔ)器內(nèi)。上述各模塊同樣可以由硬件例如集成電路芯片實(shí)現(xiàn)。
本實(shí)施例對(duì)語音處理裝置50的各功能單元實(shí)現(xiàn)各自功能的具體過程,請(qǐng)參見上述圖1至圖5所示實(shí)施例中描述的具體內(nèi)容,在此不再贅述。
本發(fā)明實(shí)施例提供的語音處理裝置50,通過在識(shí)別語音信息后,用戶可在顯示的文本信息中的文字進(jìn)行點(diǎn)擊選擇確認(rèn),并將被選擇的文字進(jìn)行重新排序以得到被選擇的文本信息,保證了被選擇的文本信息與接收的語音信息一致,進(jìn)一步地提升了語音處理的準(zhǔn)確度與便捷性,同時(shí)也能夠給用戶良好的體驗(yàn)效果。
第六實(shí)施例
圖7為本發(fā)明第六實(shí)施例提供的語音處理裝置60的結(jié)構(gòu)框圖。本實(shí)施例提供的語音處理裝置60可用于實(shí)現(xiàn)第三實(shí)施例提供的語音處理方法。如圖7所示,語音處理裝置60包括接收模塊62、語音識(shí)別模塊64、顯示模塊66及文本輸入模塊68。其中,顯示模塊66包括第二文字處理單元661及第一顯示單元662,文本輸入模塊68進(jìn)一步包括接收單元681、第二顯示單元682及第三文字處理單元683。
其中,接收模塊62,用于接收語音信息。語音識(shí)別模塊64,用于對(duì)語音信息進(jìn)行識(shí)別,以將語音信息轉(zhuǎn)化為多條文本信息。顯示模塊66,用于顯示至少一條文本信息。文本輸入模塊68,用于接收選擇信號(hào),以根據(jù)被選擇的文本信息進(jìn)行響應(yīng)。
其中,第二文字處理單元661,用于比對(duì)多條文本信息,以得到經(jīng)由相同語音識(shí)別出的不同的字或詞,并分別計(jì)算字或詞的權(quán)重得分,以篩選出權(quán)重得分最高的字或詞。
具體地,在本實(shí)施例中,語音處理裝置60在識(shí)別接收到的語音信息后,從云端服務(wù)器中的大數(shù)據(jù)庫中獲取與語音信息相匹配的文本信息,若語音信息中的語句含有詞性相似的字或詞(例如同音字、同音詞或新造詞等不確定性字或詞)的內(nèi)容時(shí),語音處理裝置60將會(huì)獲取多條文本信息。語音處理裝置60將多條文本信息進(jìn)行比對(duì)得到每一條文本信息中不同的字或詞,并對(duì)所有的字或詞進(jìn)行加權(quán)處理得到各字或詞的權(quán)重得分列表,并將權(quán)重得分列表進(jìn)行存儲(chǔ)。
其中,在一實(shí)施方式中,可以根據(jù)字或詞出現(xiàn)的頻率、時(shí)間、出處的權(quán)威性、是否為常用詞、是否為方言及是否為數(shù)字中的至少一項(xiàng)對(duì)字或詞進(jìn)行加權(quán)處理,以得到字或詞的權(quán)重得分,但并不以此為限,例如在其它實(shí)施例中還可以設(shè)置其它條件進(jìn)行加權(quán)處理。具體地,在本實(shí)施例中,可以將字或詞出現(xiàn)的頻率、時(shí)間、出處的權(quán)威性、是否為常用詞、是否為方言及是否為數(shù)字中的每一項(xiàng)分別預(yù)置一加權(quán)分?jǐn)?shù),當(dāng)字或詞符合上述一項(xiàng)或多項(xiàng)時(shí)將該項(xiàng)加權(quán)分?jǐn)?shù)賦值至該字或詞,并進(jìn)行求和處理得到該字或詞的最終權(quán)重得分,并記錄于權(quán)重得分列表中。具體地,字或詞的權(quán)重得分可以根據(jù)大數(shù)據(jù)庫中信息更新以實(shí)時(shí)更新字或詞的權(quán)重得分,并將更新的字或詞的權(quán)重得分記錄于權(quán)重得分列表中。
其中,第一顯示單元662,用于顯示包括所有權(quán)重得分最高的字或詞的一條文本信息,并突出顯示權(quán)重得分最高的字或詞。
其中,接收單元681,用于接收對(duì)突出顯示的字或詞的觸發(fā)信號(hào)。
其中,第二顯示單元682,用于根據(jù)觸發(fā)信號(hào)顯示與突出顯示的字或詞經(jīng)由相同語音識(shí)別出的字或詞。
其中,第三文字處理單元683,用于接收選擇信號(hào),并用被選擇的字或詞替換突出顯示的字或詞以得到被選擇的文本信息。
其中,在本實(shí)施例中,用戶還可以觸發(fā)語言按鈕并選擇用戶希望識(shí)別的語音的語言,例如,語言可以但不限于中文(普通話及地方方言如粵語、東北話、四川話等等)、英語、法語、德語及韓語等,從而使得語音處理裝置60能夠識(shí)別接收的各種語言的語音信息。
其中,語音處理裝置60中的語音識(shí)別模塊64與云端服務(wù)器通信連接,將語音信息轉(zhuǎn)化為多條文本信息時(shí),語音處理裝置60從云端服務(wù)器存儲(chǔ)的大數(shù)據(jù)庫中獲取與語音信息相關(guān)的字或詞,以組成多條文本信息。具體地,大數(shù)據(jù)庫收錄了所有的報(bào)紙、雜志、網(wǎng)站等信息,從而使得大數(shù)據(jù)庫中的詞庫更豐富。當(dāng)然,本領(lǐng)域的技術(shù)人員可以理解的是,與語音信息相關(guān)的字或詞也可以直接存儲(chǔ)在語音處理裝置60中。
以上各模塊可以由軟件代碼實(shí)現(xiàn),此時(shí),上述的各模塊可存儲(chǔ)于存儲(chǔ)器內(nèi)。上述各模塊同樣可以由硬件例如集成電路芯片實(shí)現(xiàn)。
本實(shí)施例對(duì)語音處理裝置60的各功能單元實(shí)現(xiàn)各自功能的具體過程,請(qǐng)參見上述圖1至圖6所示實(shí)施例中描述的具體內(nèi)容,在此不再贅述。
本發(fā)明實(shí)施例提供的語音處理裝置60,通過在識(shí)別語音信息后,用戶可在顯示的文本信息中的字或詞進(jìn)行點(diǎn)擊或按壓后進(jìn)行選擇替換,以得到被選擇的文本信息,保證了被選擇的文本信息與接收的語音信息一致,進(jìn)一步地提升了語音處理的準(zhǔn)確度與便捷性,同時(shí)也能夠給用戶良好的體驗(yàn)效果。
需要說明的是,本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。對(duì)于裝置類實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括要素的過程、方法、物品或者裝置中還存在另外的相同要素。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。
以上,僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實(shí)施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的技術(shù)內(nèi)容做出些許更動(dòng)或修飾為等同變化的等效實(shí)施例,但凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。