亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語(yǔ)音識(shí)別方法及電子裝置的制作方法

文檔序號(hào):2833430閱讀:409來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):語(yǔ)音識(shí)別方法及電子裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明有關(guān)于一種語(yǔ)音識(shí)別方法,更具體地,有關(guān)于一種語(yǔ)音識(shí)別方法及電子裝置。
背景技術(shù)
缺乏足夠計(jì)算功率(c omputing power)處理復(fù)雜任務(wù)是許多消費(fèi)電子裝置所面臨的問(wèn)題,其中,消費(fèi)電子裝置可例如智能電視(smart television)、平板計(jì)算機(jī)(tab letcomputer)及智能手機(jī)等。幸運(yùn)地是,云計(jì)算(cloud computation)的概念已逐步地減輕了此固有限制。具體地,云計(jì)算概念允許消費(fèi)電子裝置作為客戶(hù)端(client)進(jìn)行工作并將復(fù)雜任務(wù)分配給云端的遠(yuǎn)程服務(wù)器(remoteserver)。例如語(yǔ)音識(shí)別(speech recognition)便是這種可分配任務(wù)。然而,遠(yuǎn)程服務(wù)器使用的大多數(shù)語(yǔ)言模型(language model)是為普通用戶(hù)(average user)而設(shè)計(jì)。遠(yuǎn)程服務(wù)器不能或幾乎不會(huì)為每個(gè)獨(dú)立的用戶(hù)而進(jìn)行語(yǔ)言模型優(yōu)化。如果沒(méi)有對(duì)每個(gè)獨(dú)立用戶(hù)的自定義優(yōu)化,消費(fèi)電子裝置可能無(wú)法向其用戶(hù)提供最精確可靠的語(yǔ)音識(shí)別結(jié)果。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種語(yǔ)音識(shí)別方法及電子裝置。本發(fā)明提供一種語(yǔ)音識(shí)別方法,用于電子裝置,該語(yǔ)音識(shí)別方法包括:透過(guò)該電子裝置的用戶(hù)使用情況收集用戶(hù)特定信息,其中,該用戶(hù)特定信息特定用于該用戶(hù);記錄該用戶(hù)的發(fā)言;使遠(yuǎn)程服務(wù)器產(chǎn)生該記錄的發(fā)言的遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果;根據(jù)該收集的用戶(hù)特定信息產(chǎn)生該記錄的發(fā)言的再評(píng)分信息;以及根據(jù)該再評(píng)分信息對(duì)該遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分。本發(fā)明另提供一種語(yǔ)音識(shí)別方法,用于電子裝置,該語(yǔ)音識(shí)別方法包括:記錄該用戶(hù)發(fā)言;從該記錄的發(fā)言中提取噪聲信息;使遠(yuǎn)程服務(wù)器產(chǎn)生該記錄的發(fā)言的遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果;以及根據(jù)該提取的噪聲信息對(duì)該遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分。本發(fā)明再提供一種語(yǔ)音識(shí)別電子裝置,包括:信息收集器,用于透過(guò)該電子裝置的用戶(hù)使用情況收集用戶(hù)特定信息,其中,該用戶(hù)特定信息特定用于該用戶(hù);錄音器,用于記錄該用戶(hù)發(fā)言;以及再評(píng)分信息產(chǎn)生器,耦接于該信息收集器,該再評(píng)分信息產(chǎn)生器用于根據(jù)該收集的用戶(hù)特定信息產(chǎn)生該記錄的發(fā)言的再評(píng)分信息;其中,該電子裝置用于使遠(yuǎn)程服務(wù)器產(chǎn)生該記錄的發(fā)言的遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果,以及根據(jù)該再評(píng)分信息對(duì)該遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分。本發(fā)明還提供一種語(yǔ)音識(shí)別電子裝置,包括:錄音器,用于記錄該電子裝置的用戶(hù)發(fā)言;以及噪聲信息提取器,耦接于該錄音器,且該噪聲信息提取器用于從該記錄的發(fā)言中提取噪聲信息;其中,該電子裝置用于使遠(yuǎn)程服務(wù)器產(chǎn)生該記錄的發(fā)言的遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果;并用于根據(jù)該提取的噪聲信息對(duì)該遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分。
本發(fā)明提供的語(yǔ)音識(shí)別方法可提供相較于“云語(yǔ)音識(shí)別結(jié)果”更為準(zhǔn)確可靠的語(yǔ)音識(shí)別結(jié)果,改進(jìn)用戶(hù)體驗(yàn)。


圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例分布式語(yǔ)音識(shí)別系統(tǒng)的方塊圖;圖2為根據(jù)本發(fā)明另一個(gè)實(shí)施例分布式語(yǔ)音識(shí)別系統(tǒng)的方塊圖;圖3為圖1/圖2的電子裝置執(zhí)行語(yǔ)音識(shí)別方法的流程圖;圖4/圖5為根據(jù)本發(fā)明實(shí)施例的分布式語(yǔ)音識(shí)別系統(tǒng)400/500的方塊圖;圖6為圖4/圖5的電子裝置執(zhí)行語(yǔ)音識(shí)別方法的流程圖;圖7為根據(jù)本發(fā)明一個(gè)實(shí)施例的分布式語(yǔ)音識(shí)別系統(tǒng)的方塊圖;圖8為根據(jù)本發(fā)明一個(gè)實(shí)施例的分布式語(yǔ)音識(shí)別系統(tǒng)的方塊圖;圖9為圖7/圖8的電子裝置執(zhí)行語(yǔ)音識(shí)別方法的流程圖;圖10為根據(jù)本發(fā)明一個(gè)實(shí)施例分布式語(yǔ)音識(shí)別系統(tǒng)的方塊圖;圖11為根據(jù)本發(fā)明一個(gè)實(shí)施例的分布式語(yǔ)音識(shí)別系統(tǒng)的方塊圖;圖12為圖10/圖11的電子裝置執(zhí)行語(yǔ)音識(shí)別方法的流程圖。
具體實(shí)施例方式下面的詳細(xì)描述將介紹本發(fā)明提出的分布式語(yǔ)音識(shí)別系統(tǒng)(distributed speechrecognition system)的若干實(shí)施例,其中的每個(gè)實(shí)施例包括電子裝置和遠(yuǎn)程服務(wù)器。電子裝置可以為消費(fèi)電子裝置,例如智能電視、平板計(jì)算機(jī)、智能手機(jī)或可以向其用戶(hù)提供語(yǔ)音識(shí)別服務(wù)或基于語(yǔ)音識(shí)別的服務(wù)的任何電子裝置。遠(yuǎn)程服務(wù)器可以位于云端并透過(guò)互聯(lián)網(wǎng)與電子裝置進(jìn)行通信。對(duì)于語(yǔ)音識(shí)別,電子裝置和遠(yuǎn)程服務(wù)器具有不同優(yōu)勢(shì);上述多個(gè)實(shí)施例允許這兩個(gè)裝置中的每一個(gè)使用各自?xún)?yōu)勢(shì)來(lái)促進(jìn)語(yǔ)音識(shí)別。例如,遠(yuǎn)程服務(wù)器的優(yōu)勢(shì)之一在于它具有優(yōu)越的計(jì)算功率且可使用復(fù)雜模型處理語(yǔ)音識(shí)別。而另一方面,電子裝置的優(yōu)勢(shì)之一在于它與用戶(hù)距離更近且因此可收集用于增強(qiáng)語(yǔ)音識(shí)別的一些輔助信息(auxiliaryinformation).而由于下述任何一個(gè)原因,遠(yuǎn)程服務(wù)器不能存取這些輔助信息。例如,輔助信息可包括私人性質(zhì)的個(gè)人信息,因而電子裝置避免與遠(yuǎn)程服務(wù)器共享個(gè)人信息。又例如,帶寬限制和云存儲(chǔ)空間限制也可能阻止電子裝置與遠(yuǎn)程服務(wù)器共享這些輔助信息。圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例分布式語(yǔ)音識(shí)別系統(tǒng)100的方塊圖。分布式語(yǔ)音識(shí)別系統(tǒng)100包括電子裝置120和遠(yuǎn)程服務(wù)器140。電子裝置120包括信息收集器(information collector) 122、錄音器 124、再評(píng)分信息產(chǎn)生器(rescoringinformationgenerator) 126 以及結(jié)果再評(píng)分模塊(result rescoring module) 128。遠(yuǎn)程服務(wù)器 140包括遠(yuǎn)程語(yǔ)音識(shí)別器(remote speech recognizer) 142。圖2為根據(jù)本發(fā)明另一個(gè)實(shí)施例分布式語(yǔ)音識(shí)別系統(tǒng)200的方塊圖。分布式語(yǔ)音識(shí)別系統(tǒng)200包括電子裝置220和遠(yuǎn)程服務(wù)器240。圖1和圖2中實(shí)施例的不同點(diǎn)在于圖2中是遠(yuǎn)程服務(wù)器240 (而不是電子裝置220)包括結(jié)果再評(píng)分模塊128。圖3為圖1/圖2的電子裝置120/220執(zhí)行語(yǔ)音識(shí)別方法的流程圖。首先,在步驟310中,信息收集器122透過(guò)電子裝置120/220的用戶(hù)使用情況(user’s usage)收集用戶(hù)特定信息(user-specific information),其中,該用戶(hù)特定信息特定用于該用戶(hù)。電子裝置120/220連接或未連接至互聯(lián)網(wǎng)時(shí)都可執(zhí)行此步驟,收集的用戶(hù)特定信息可包括:用戶(hù)的聯(lián)系人列表(contact list)、用戶(hù)日程表(calendar)中的若干最近事件、若干訂閱的內(nèi)容/服務(wù),若干最近接收/編輯/發(fā)送的消息/郵件、若干最近訪(fǎng)問(wèn)的網(wǎng)址、若干最近使用的應(yīng)用程序、若干最近下載/存取的電子書(shū)/歌曲/視頻、若干社交網(wǎng)絡(luò)服務(wù)(例如臉譜(Facebook)、推持(Twitter)、谷歌+ (Google+)和微博)的使用情況以及用戶(hù)的聲學(xué)特性(acoustic characteristic)等。用戶(hù)特定信息可揭示用戶(hù)的個(gè)人興趣、習(xí)慣、情感、最常用詞語(yǔ)等,因此當(dāng)用戶(hù)發(fā)言(make an utterance)以使分布式語(yǔ)音識(shí)別系統(tǒng)100/200進(jìn)行識(shí)別時(shí),用戶(hù)特定信息可建議(suggest)用戶(hù)可能使用的潛在詞語(yǔ)(potential word)。換句話(huà)說(shuō),用戶(hù)特定信息可包括可用于語(yǔ)音識(shí)別的有價(jià)值信息。在步驟320中,錄音器124記錄用戶(hù)的發(fā)言。由于用戶(hù)想要通過(guò)發(fā)言而不是通過(guò)打字(typing)/手寫(xiě)(writing)的方式向電子裝置120/220輸入字符串(text string),因此用戶(hù)可進(jìn)行發(fā)言。又例如,該發(fā)言可構(gòu)成用戶(hù)對(duì)電子裝置120/220發(fā)出的命令。在步驟330中,電子裝置120/220使遠(yuǎn)程服務(wù)器140/240產(chǎn)生該記錄的發(fā)言的遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果。例如,電子裝置120/220要完成所述操作可通過(guò)發(fā)送記錄的發(fā)言或其壓縮版本至遠(yuǎn)程服務(wù)器140/240,等待一段時(shí)間,然后從遠(yuǎn)程服務(wù)器140/240接收遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果。由于遠(yuǎn)程服務(wù)器140/240除了未為用戶(hù)而進(jìn)行優(yōu)化,具有優(yōu)越的計(jì)算功率并使用復(fù)雜的語(yǔ)音識(shí)別模型,遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果可能是相當(dāng)好的推測(cè)(speculation)。遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果可包括一些連續(xù)文本單元(text unit),這些文本單元中的每個(gè)都可包括單詞或短語(yǔ)并且每個(gè)文本單元都附有一個(gè)置信分?jǐn)?shù)(confidencescore)。置信分?jǐn)?shù)越高,遠(yuǎn)程服務(wù)器140/240越有信心確認(rèn)附有該置信分?jǐn)?shù)的文本單元為準(zhǔn)確的推測(cè)。每個(gè)文本單元可具有一個(gè)以上的替換選擇供使用者或電子裝置120/220從中進(jìn)行選擇,且其中每個(gè)替換選擇都附有一個(gè)置信分?jǐn)?shù)。例如,如果在步驟320中用戶(hù)說(shuō)出“the weathertoday is good”的發(fā)言,則在步驟330中遠(yuǎn)程服務(wù)器140/240可產(chǎn)生下列遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果OThe (5.5) weather (2.3) /whether (2.2) today (4.0) i s (3.8) good (3.2)/gold (0.9) o在步驟340中,再評(píng)分信息產(chǎn)生器126根據(jù)步驟310中收集的用戶(hù)特定信息產(chǎn)生記錄的發(fā)言的再評(píng)分信息。例如,再評(píng)分信息可包括單詞/短語(yǔ)的統(tǒng)計(jì)模型(statisticalmodel),該統(tǒng)計(jì)模型可以幫助分布式語(yǔ)音識(shí)別系統(tǒng)100/200識(shí)別步驟320中記錄的用戶(hù)的發(fā)言的內(nèi)容。再評(píng)分信息產(chǎn)生器126根據(jù)電子裝置120/220產(chǎn)生的記錄的發(fā)言的本地語(yǔ)音識(shí)別結(jié)果或者根據(jù)步驟330中產(chǎn)生的遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果從收集的用戶(hù)特定信息中提取再評(píng)分信息。例如,如果根據(jù)本地/遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果,電子裝置120/220確定記錄的發(fā)言可包括單詞“call”或“dial”,再評(píng)分信息產(chǎn)生器126可提供有關(guān)于用戶(hù)聯(lián)系人列表或最近撥打/接收/錯(cuò)過(guò)的呼叫的信息作為再評(píng)分信息。再評(píng)分信息產(chǎn)生器126也可不參考記錄的發(fā)言而產(chǎn)生再評(píng)分信息。例如,根據(jù)收集的用戶(hù)特定信息所指示,再評(píng)分信息可僅包括用戶(hù)最可能使用的單詞。在步驟350中,電子裝置120/220使結(jié)果再評(píng)分模塊128根據(jù)再評(píng)分信息對(duì)遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分以產(chǎn)生再評(píng)分的語(yǔ)音識(shí)別結(jié)果。“再評(píng)分”用在語(yǔ)音識(shí)別的情境(context)中表示修改(modify)、更正(correct)或者嘗試修改/更正。由于再評(píng)分的語(yǔ)音識(shí)別結(jié)果可受收集的用戶(hù)特定信息影響,而遠(yuǎn)程服務(wù)器140/240可能無(wú)法存取收集的用戶(hù)特定信息,因此有可能再評(píng)分的語(yǔ)音識(shí)別結(jié)果可更準(zhǔn)確表示步驟320中記錄的用戶(hù)的發(fā)言。例如,如果遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果表示遠(yuǎn)程服務(wù)器140/240不確定是否記錄的發(fā)言包括姓名“Johnson"或"Jonathan”,而再評(píng)分信息指示Johnson是用戶(hù)剛錯(cuò)過(guò)其呼叫的聯(lián)系人或者Johnson是用戶(hù)計(jì)劃一會(huì)兒之后見(jiàn)面的人,則結(jié)果再評(píng)分模塊128可相應(yīng)地改變與“Johnson"和"Jonathan”相應(yīng)的置信評(píng)分,或者直接將"Jonathan”從記錄的語(yǔ)音識(shí)別結(jié)果中排除。在圖2中,由于結(jié)果再評(píng)分模塊128位于遠(yuǎn)程服務(wù)器240中,在步驟350中,電子裝置220必須首先發(fā)送再評(píng)分信息至遠(yuǎn)程服務(wù)器240,等待一段時(shí)間,然后再?gòu)倪h(yuǎn)程服務(wù)器240接收再評(píng)分的語(yǔ)音識(shí)別結(jié)果。圖4/圖5為根據(jù)本發(fā)明實(shí)施例的分布式語(yǔ)音識(shí)別系統(tǒng)400/500的方塊圖??梢员镜卣Z(yǔ)音識(shí)別器426來(lái)替代圖1/圖2中所示的再評(píng)分信息產(chǎn)生器126 ;則圖1/圖2的分布式語(yǔ)音識(shí)別系統(tǒng)100/200將改變?yōu)閳D4/圖5的分布式語(yǔ)音識(shí)別系統(tǒng)400/500。本地語(yǔ)音識(shí)別器426可使用本地語(yǔ)音識(shí)別模型;本地語(yǔ)音識(shí)別模型比遠(yuǎn)程語(yǔ)音識(shí)別器所使用的遠(yuǎn)程語(yǔ)音識(shí)別模型更簡(jiǎn)單。圖6為圖4/圖5的電子裝置420/520執(zhí)行語(yǔ)音識(shí)別方法的流程圖。除了前述的步驟310、步驟320以及步驟330之外,圖6的流程圖更包括步驟615、步驟640以及步驟650。在步驟615中,電子裝置420/520使用在步驟310中信息收集器122收集的用戶(hù)特定信息自適應(yīng)(adapt)本地語(yǔ)音識(shí)別模型。如果遠(yuǎn)程服務(wù)器140/240可向本地語(yǔ)音識(shí)別器426提供其統(tǒng)計(jì)模型或一些用戶(hù)個(gè)人信息,本地語(yǔ)音識(shí)別器426也可使用此補(bǔ)充信息(supplementaryinformation)作為步驟615中自適應(yīng)的附加前提(additional basis)。作為步驟615的結(jié)果,自適應(yīng)后的本地語(yǔ)音識(shí)別模型更具有用戶(hù)特定性(user-specific),且因此更適合識(shí)別步驟320中記錄的特定用戶(hù)的發(fā)言。在步驟640中,本地語(yǔ)音識(shí)別器426使用自適應(yīng)后的本地語(yǔ)音識(shí)別模型來(lái)產(chǎn)生記錄的發(fā)言的本地語(yǔ)音識(shí)別結(jié)果。遠(yuǎn)程語(yǔ)音識(shí)別器142接收的記錄的發(fā)言可能為壓縮版本,而本地語(yǔ)音識(shí)別器426接收的記錄的發(fā)言可為原版或未壓縮版本(raw or uncompressedversion)。由于本地語(yǔ)音識(shí)別結(jié)果不能用于對(duì)遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分,可將本地語(yǔ)音識(shí)別結(jié)果稱(chēng)為“再評(píng)分信息”,并且也可將本地語(yǔ)音識(shí)別器426看作再評(píng)分信息產(chǎn)生器。與遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果一樣,本地語(yǔ)音識(shí)別結(jié)果也可包括一些連續(xù)文本單元,這些文本單元中的每個(gè)都可包括單詞或短語(yǔ)并且每個(gè)文本單元都附有一個(gè)置信分?jǐn)?shù)。置信分?jǐn)?shù)越高,本地語(yǔ)音識(shí)別器426越有信心確認(rèn)附有該置信分?jǐn)?shù)的文本單元為準(zhǔn)確的推測(cè)。每個(gè)文本單元也可具有一個(gè)以上的替換選擇,且其中每個(gè)替換選擇都附有一個(gè)置信分?jǐn)?shù)。盡管電子裝置420/520的計(jì)算功率可能不及遠(yuǎn)程服務(wù)器140/240,且本地語(yǔ)音識(shí)別器426的自適應(yīng)本地語(yǔ)音識(shí)別模型可能比遠(yuǎn)程語(yǔ)音識(shí)別器142使用的遠(yuǎn)程語(yǔ)音識(shí)別模型簡(jiǎn)單許多,然而步驟615中執(zhí)行的用戶(hù)特定自適應(yīng)使本地語(yǔ)音識(shí)別結(jié)果有時(shí)可能比遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果更準(zhǔn)確。在步驟650中,電子裝置420/520使結(jié)果再評(píng)分模塊128根據(jù)本地語(yǔ)音識(shí)別結(jié)果對(duì)遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分以產(chǎn)生再評(píng)分的語(yǔ)音識(shí)別結(jié)果。由于再評(píng)分的語(yǔ)音識(shí)別結(jié)果可受收集的用戶(hù)特定信息影響,而遠(yuǎn)程服務(wù)器可能無(wú)法存取收集的用戶(hù)特定信息,因而有可能再評(píng)分的語(yǔ)音識(shí)別結(jié)果可更準(zhǔn)確表示步驟320中記錄的用戶(hù)的發(fā)言。例如,如果遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果為“the (5.5) weapon (0.5) today (4.0) is (3.8)good (3.2) ”,而本地語(yǔ)音識(shí)別結(jié)果為“the(4.4) weather (2.3) tonight (2.1) is (3.4)good(3.6) ”,則再評(píng)分的語(yǔ)音識(shí)別結(jié)果可能是“the weather today is good”從而正確地表示了步驟320中記錄的用戶(hù)發(fā)言。由于圖4/圖5所示的實(shí)施例包括本地語(yǔ)音識(shí)別器426,因此如果遠(yuǎn)程服務(wù)器140/240故障或者網(wǎng)絡(luò)較慢,或者如果本地語(yǔ)音識(shí)別器426在本地語(yǔ)音識(shí)別結(jié)果中具有更高的置信分?jǐn)?shù),電子裝置420/520可跳過(guò)步驟650或跳過(guò)步驟330和步驟650并直接使用步驟640中產(chǎn)生的本地語(yǔ)音識(shí)別結(jié)果作為最終的語(yǔ)音識(shí)別結(jié)果。此種做法可改進(jìn)電子裝置420/520提供的使用語(yǔ)音識(shí)別或基于語(yǔ)音識(shí)別的服務(wù)的用戶(hù)體驗(yàn)。圖7為根據(jù)本發(fā)明一個(gè)實(shí)施例的分布式語(yǔ)音識(shí)別系統(tǒng)700的方塊圖。語(yǔ)音識(shí)別系統(tǒng)700包括電子裝置720和遠(yuǎn)程服務(wù)器140。電子裝置720與圖1所示的電子裝置120的不同之處在于電子裝置720包括噪聲信息提取器722但并不包括信息收集器122和再評(píng)分信息產(chǎn)生器126。圖8為根據(jù)本發(fā)明一個(gè)實(shí)施例的分布式語(yǔ)音識(shí)別系統(tǒng)800的方塊圖。分布式語(yǔ)音識(shí)別系統(tǒng)800包括電子裝置820和遠(yuǎn)程服務(wù)器240。電子裝置820與圖7所示的電子裝置720的不同之處在于電子裝置820不包括結(jié)果再評(píng)分模塊128。對(duì)于語(yǔ)音識(shí)別,電子裝置720/820比遠(yuǎn)程服務(wù)器140/240具有一些優(yōu)勢(shì)。例如,電子裝置720/820的其中一個(gè)優(yōu)勢(shì)在于它距離進(jìn)行語(yǔ)音識(shí)別的環(huán)境更近。因此,電子裝置720/820的可更容易分析辨認(rèn)伴隨用戶(hù)發(fā)言的噪聲。這是由于電子裝置720/820可完好地存取記錄的發(fā)言但僅向遠(yuǎn)程服務(wù)器140/240提供記錄的發(fā)言的壓縮版本。對(duì)于遠(yuǎn)程服務(wù)器140/240而言使用記錄的發(fā)言的壓縮版本進(jìn)行噪聲分析相對(duì)更困難。圖9為圖7/圖8的電子裝置720/820執(zhí)行語(yǔ)音識(shí)別方法的流程圖。除了前述的步驟320以及步驟330之外,圖9的流程圖更包括步驟925和步驟950。在步驟925中,噪聲信息提取器722從記錄的發(fā)言中提取噪聲信息。例如,所提取的噪聲信息可包括信噪比(signal-to-noise ratio, SNR)值,該SNR值指示記錄的發(fā)言受噪聲污染(taint)的程度。在步驟950中,電子裝置720/820使結(jié)果再評(píng)分模塊128根據(jù)提取的噪聲信息對(duì)遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分以產(chǎn)生再評(píng)分的語(yǔ)音識(shí)別結(jié)果。例如,當(dāng)SNR值低時(shí),結(jié)果再評(píng)分模塊128可對(duì)元音(vowel)提供更高的置信分?jǐn)?shù)。又例如,當(dāng)SNR值高時(shí),結(jié)果再評(píng)分模塊128可對(duì)語(yǔ)音巾貞(speech frame)給予更高權(quán)重。由于提取的噪聲信息可影響再評(píng)分的語(yǔ)音識(shí)別結(jié)果,因而再評(píng)分的語(yǔ)音識(shí)別結(jié)果可更準(zhǔn)確地表不步驟320中記錄的用戶(hù)的發(fā)言。在圖8中,由于結(jié)果再評(píng)分模塊128在遠(yuǎn)程服務(wù)器240中,在步驟950中,電子裝置820必須首先發(fā)送提取的噪聲信息至遠(yuǎn)程服務(wù)器240,等待一段時(shí)間,然后再?gòu)倪h(yuǎn)程服務(wù)器240接收再評(píng)分的語(yǔ)音識(shí)別結(jié)果。圖10為根據(jù)本發(fā)明一個(gè)實(shí)施例分布式語(yǔ)音識(shí)別系統(tǒng)1000的方塊圖。語(yǔ)音識(shí)別系統(tǒng)1000包括電子裝置1020和遠(yuǎn)程服務(wù)器140。電子裝置1020與圖4所示的電子裝置420的不同之處在于電子裝置1020包括噪聲信息提取器722但并不包括信息收集器122。圖11為根據(jù)本發(fā)明一個(gè)實(shí)施例的分布式語(yǔ)音識(shí)別系統(tǒng)1100的方塊圖。分布式語(yǔ)音識(shí)別系統(tǒng)1100包括電子裝置1120和遠(yuǎn)程服務(wù)器240。電子裝置1120與圖5所示的電子裝置520的不同之處在于電子裝置1120包括噪聲信息提取器722但并不包括信息收集器122。圖12為圖10/圖11的電子裝置1020/1120執(zhí)行語(yǔ)音識(shí)別方法的流程圖。除了前述的步驟320、步驟925、步驟330、步驟640以及步驟650之外,圖12的流程圖更包括步驟1235。在步驟1235中,電子裝置1020/1120使用噪聲信息提取器722提供的噪聲信息自適應(yīng)本地語(yǔ)音識(shí)別器426使用的本地語(yǔ)音識(shí)別模型。例如,如果所提取的噪聲信息指示記錄的發(fā)言包括許多噪聲,自適應(yīng)后的本地語(yǔ)音識(shí)別模型可能更適合嘈雜的環(huán)境;如果所提取的噪聲信息指示記錄的發(fā)言相對(duì)無(wú)噪聲(noise-free),自適應(yīng)后的本地語(yǔ)音識(shí)別模型可能更適合安靜的環(huán)境。盡管自適應(yīng)后的本地語(yǔ)音識(shí)別模型可能比遠(yuǎn)程語(yǔ)音識(shí)別器142使用的遠(yuǎn)程語(yǔ)音識(shí)別模型簡(jiǎn)單許多,然而在步驟1235中執(zhí)行的基于噪聲的自適應(yīng)操作使步驟640中本地語(yǔ)音識(shí)別器426產(chǎn)生的本地語(yǔ)音識(shí)別結(jié)果有時(shí)可能比遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果更準(zhǔn)確。由于圖10/圖11所示的實(shí)施例包括本地語(yǔ)音識(shí)別器426,因此如果遠(yuǎn)程服務(wù)器140/240故障或者網(wǎng)絡(luò)較慢,或者如果本地語(yǔ)音識(shí)別器426在本地語(yǔ)音識(shí)別結(jié)果中具有更高的置信分?jǐn)?shù),電子裝置1020/1120可跳過(guò)步驟650或跳過(guò)步驟330和步驟650并直接使用步驟640中產(chǎn)生的本地語(yǔ)音識(shí)別結(jié)果作為最終的語(yǔ)音識(shí)別結(jié)果。此種做法可改進(jìn)電子裝置1020/1120提供的使用語(yǔ)音識(shí)別或基于語(yǔ)音識(shí)別的服務(wù)的用戶(hù)體驗(yàn)。在前述實(shí)施例中,電子裝置120/220/420/520/720/820/1020/1120可使用步驟350/650/950中結(jié)果再評(píng)分模塊128所提供的再評(píng)分的語(yǔ)音識(shí)別結(jié)果。電子裝置120/220/420/520/720/820/1020/1120可在屏幕上顯示記錄的語(yǔ)音識(shí)別結(jié)果、呼叫與結(jié)果中包括的姓名對(duì)應(yīng)的電話(huà)號(hào)碼、將結(jié)果添加至編輯文件中、響應(yīng)該結(jié)果而開(kāi)始或控制應(yīng)用程序或者使用結(jié)果作為搜索查詢(xún)(search query)而執(zhí)行網(wǎng)絡(luò)搜索。在前面的具體描述中,本發(fā)明參考特定實(shí)施例來(lái)對(duì)發(fā)明進(jìn)行描述。顯然,在不脫離本發(fā)明精神和后附的權(quán)利要求限定的范圍的前提下可對(duì)本發(fā)明做些許更改。相應(yīng)地,具體實(shí)施方式
和附圖應(yīng)看作為說(shuō)明的目的而非限制目的。
權(quán)利要求
1.一種語(yǔ)音識(shí)別方法,用于電子裝置,該語(yǔ)音識(shí)別方法包括: 透過(guò)該電子裝置的用戶(hù)使用情況收集用戶(hù)特定信息,其中,該用戶(hù)特定信息特定用于該用戶(hù); 記錄該用戶(hù)的發(fā)言; 使遠(yuǎn)程服務(wù)器產(chǎn)生該記錄的發(fā)言的遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果; 根據(jù)該收集的用戶(hù)特定信息產(chǎn)生該記錄的發(fā)言的再評(píng)分信息;以及 根據(jù)該再評(píng)分信息對(duì)該遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分。
2.如權(quán)利要求1所述的語(yǔ)音識(shí)別方法,其特征在于,該再評(píng)分信息包括本地語(yǔ)音識(shí)別結(jié)果,且該產(chǎn)生該再評(píng)分信息的步驟包括: 根據(jù)該收集的用戶(hù)特定信息自適應(yīng)本地語(yǔ)音識(shí)別模型;以及 使用該自適應(yīng)后的本地語(yǔ)音識(shí)別模型產(chǎn)生該記錄的發(fā)言的該本地語(yǔ)音識(shí)別結(jié)果。
3.如權(quán)利要求1所述的語(yǔ)音識(shí)別方法,其特征在于,該語(yǔ)音識(shí)別方法更包括: 避免與該遠(yuǎn)程服務(wù)器共享至少一部分的該收集的用戶(hù)特定信息。
4.如權(quán)利要求1所述的語(yǔ)音識(shí)別方法,其特征在于,該收集的用戶(hù)特定信息包括該遠(yuǎn)程服務(wù)器不能存取的信息。
5.一種語(yǔ)音識(shí)別方法,用于電子裝置,該語(yǔ)音識(shí)別方法包括: 記錄該用戶(hù)發(fā)言; 從該記錄的發(fā)言中提取噪聲信息; 使遠(yuǎn)程服務(wù)器產(chǎn)生該記錄的發(fā)言的遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果;以及 根據(jù)該提取的噪聲信息對(duì)該遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分。
6.如權(quán)利要求5所述的語(yǔ)音識(shí)別方法,其特征在于,該對(duì)該遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分的步驟包括: 使用該提取的噪聲信息自適應(yīng)本地語(yǔ)音識(shí)別模型; 使用該自適應(yīng)后的本地語(yǔ)音識(shí)別模型產(chǎn)生該記錄的發(fā)言的本地語(yǔ)音識(shí)別結(jié)果; 根據(jù)該本地語(yǔ)音識(shí)別結(jié)果對(duì)該遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分。
7.如權(quán)利要求5所述的語(yǔ)音識(shí)別方法,其特征在于,該提取的噪聲信息包括信噪比。
8.一種語(yǔ)音識(shí)別電子裝置,包括: 信息收集器,用于透過(guò)該電子裝置的用戶(hù)使用情況收集用戶(hù)特定信息,其中,該用戶(hù)特定信息特定用于該用戶(hù); 錄音器,用于記錄該用戶(hù)發(fā)言;以及 再評(píng)分信息產(chǎn)生器,耦接于該信息收集器,該再評(píng)分信息產(chǎn)生器用于根據(jù)該收集的用戶(hù)特定信息產(chǎn)生該記錄的發(fā)言的再評(píng)分信息; 其中,該電子裝置用于使遠(yuǎn)程服務(wù)器產(chǎn)生該記錄的發(fā)言的遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果,以及根據(jù)該再評(píng)分信息對(duì)該遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分。
9.如權(quán)利要求8所述的語(yǔ)音識(shí)別電子裝置,其特征在于,該再評(píng)分信息包括本地語(yǔ)音識(shí)別結(jié)果,且該再評(píng)分信息產(chǎn)生器使用本地語(yǔ)音識(shí)別模型并使用該收集的用戶(hù)特定信息自適應(yīng)該本地語(yǔ)音識(shí)別模型,以及使用該自適應(yīng)后的本地語(yǔ)音識(shí)別模型產(chǎn)生該記錄的發(fā)言的該本地語(yǔ)音識(shí)別結(jié)果。
10.如權(quán)利要求8所述的語(yǔ)音識(shí)別電子裝置,其特征在于,該收集的用戶(hù)特定信息包括該電子裝置避免與該遠(yuǎn)程服務(wù)器共享的信息。
11.如權(quán)利要求8所述的語(yǔ)音識(shí)別電子裝置,其特征在于,該收集的用戶(hù)特定信息包括該遠(yuǎn)程服務(wù)器不能存取的信息。
12.—種語(yǔ)音識(shí)別電子裝置,包括: 錄音器,用于記錄該電子裝置的用戶(hù)發(fā)言;以及 噪聲信息提取器,耦接于該錄音器,且該噪聲信息提取器用于從該記錄的發(fā)言中提取噪聲信息; 其中,該電子裝置用于使遠(yuǎn)程服務(wù)器產(chǎn)生該記錄的發(fā)言的遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果;并用于根據(jù)該提取的噪聲信息對(duì)該遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分。
13.如權(quán)利要求12所述的語(yǔ)音識(shí)別電子裝置,其特征在于,該電子裝置更包括本地語(yǔ)音識(shí)別器,耦接于該錄音器和該噪聲信息提取器,該本地語(yǔ)音識(shí)別器具有本地語(yǔ)音識(shí)別模型,且該本地語(yǔ)音識(shí)別器用于根據(jù)該提取的噪聲信息自適應(yīng)該本地語(yǔ)音識(shí)別模型,并用于使用該自適應(yīng)后的本地語(yǔ)音識(shí)別模型產(chǎn)生該記錄的發(fā)言的本地語(yǔ)音識(shí)別結(jié)果;且該電子裝置用于根據(jù)該本地語(yǔ)音識(shí)別結(jié)果對(duì)該遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分。
14.如權(quán)利要求12所述的語(yǔ)音識(shí)別電子裝置,其特征在于,該提取的噪聲信息包括信噪比。
全文摘要
本發(fā)明提供一種語(yǔ)音識(shí)別方法以及電子裝置。其中,所述的語(yǔ)音識(shí)別方法用于電子裝置,該語(yǔ)音識(shí)別方法包括透過(guò)電子裝置的用戶(hù)使用情況收集用戶(hù)特定信息,其中,用戶(hù)特定信息特定用于用戶(hù);記錄用戶(hù)的發(fā)言;使遠(yuǎn)程服務(wù)器產(chǎn)生記錄的發(fā)言的遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果;根據(jù)收集的用戶(hù)特定信息產(chǎn)生記錄的發(fā)言的再評(píng)分信息;以及根據(jù)再評(píng)分信息對(duì)遠(yuǎn)程語(yǔ)音識(shí)別結(jié)果進(jìn)行再評(píng)分。本發(fā)明提供的語(yǔ)音識(shí)別方法可提供相較于“云語(yǔ)音識(shí)別結(jié)果”更為準(zhǔn)確可靠的語(yǔ)音識(shí)別結(jié)果,改進(jìn)用戶(hù)體驗(yàn)。
文檔編號(hào)G10L15/30GK103137129SQ201210388889
公開(kāi)日2013年6月5日 申請(qǐng)日期2012年10月12日 優(yōu)先權(quán)日2011年12月2日
發(fā)明者孫良哲, 鄭堯文, 許肇凌, 林志鴻 申請(qǐng)人:聯(lián)發(fā)科技股份有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1