亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于啟用網(wǎng)絡的設備上的語音識別輸入的方法和系統(tǒng)的制作方法_2

文檔序號:9291753閱讀:來源:國知局
或在啟用網(wǎng)絡的設備上執(zhí)行。接收音頻數(shù)據(jù)可包括 從第二顯示器接收音頻數(shù)據(jù),例如,其中第二顯示器是智能電話、平板計算機、或筆記本計 算機。將接收到的音頻數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)可以在第二顯示器上或在啟用網(wǎng)絡的設備上執(zhí) 行。接收音頻數(shù)據(jù)可包括使用與啟用網(wǎng)絡的設備配對的射頻音頻輸入設備,來接收音頻數(shù) 據(jù),例如,其中射頻音頻輸入設備是智能電話。將接收到的音頻數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)可以在 射頻音頻輸入設備上執(zhí)行。
[0015] 在另一方面,本發(fā)明涉及非暫態(tài)計算機可讀介質(zhì),包括用于導致計算設備實現(xiàn)上 面的方法的指令。
[0016] 在又一方面,本發(fā)明涉及用于啟用網(wǎng)絡的設備輸入數(shù)據(jù)的方法,包括:將啟用網(wǎng)絡 的設備配置為處于接收音頻數(shù)據(jù)的狀態(tài);接收音頻數(shù)據(jù);接收語言類型的指示;確定所述 語言類型不被支持;將接收到的音頻數(shù)據(jù)傳輸?shù)降谝环掌?;從第一服務器接收?jīng)轉(zhuǎn)換的 數(shù)據(jù),經(jīng)轉(zhuǎn)換的數(shù)據(jù)是根據(jù)接收到的音頻數(shù)據(jù)計算處理的;以及,顯示接收到的經(jīng)轉(zhuǎn)換的數(shù) 據(jù)的指示。
[0017] 本發(fā)明的各實現(xiàn)可包括以下中的一項或多項。接收到的音頻數(shù)據(jù)可以對應于導航 命令,并且,顯示接收到的經(jīng)轉(zhuǎn)換的數(shù)據(jù)的指示可包括執(zhí)行所述導航命令。接收到的音頻數(shù) 據(jù)可以對應于要被輸入到表單中的數(shù)據(jù),并且顯示接收到的經(jīng)轉(zhuǎn)換的數(shù)據(jù)的指示可包括將 該數(shù)據(jù)輸入到表單中。接收語言類型的指示可包括:接收對語言類型的選擇;從設置文件 確定語言類型;基于接收到的音頻數(shù)據(jù)檢測語言類型;或?qū)⒁纛l數(shù)據(jù)傳輸?shù)降诙掌鳎?以及,從第二服務器接收語言類型的指示。接收到的經(jīng)轉(zhuǎn)換的數(shù)據(jù)可以是文本數(shù)據(jù),或者可 以是指示文本數(shù)據(jù)的圖像文件。
[0018] 在又一方面,本發(fā)明涉及用于啟用網(wǎng)絡的設備輸入數(shù)據(jù)的方法,包括:將啟用網(wǎng) 絡的設備配置為處于接收音頻數(shù)據(jù)的狀態(tài);接收音頻數(shù)據(jù);接收語言類型的指示;確定所 述語言類型不被支持;將對對應于所述語言類型的語言模塊的請求傳輸?shù)椒掌?;從所?服務器接收所請求的語言模塊;使用接收到的語言模塊來將音頻數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù);以 及,顯示所述文本數(shù)據(jù)的指示。
[0019] 本發(fā)明的各實現(xiàn)可包括以下中的一項或多項。所述語言模塊可以存儲在所述啟用 網(wǎng)絡的設備上,存儲在連接到所述啟用網(wǎng)絡的設備的加密狗上,或者存儲與所述啟用網(wǎng)絡 的設備通信的外部設備上。接收語言類型的指示可包括:接收對語言類型的選擇;從設置 文件確定語言類型;基于接收到的音頻數(shù)據(jù)檢測語言類型;或?qū)⒁纛l數(shù)據(jù)傳輸?shù)降诙?器,以及從第二服務器接收語言類型的指示。
[0020] 在另一方面,本發(fā)明涉及適于被置于與啟用網(wǎng)絡的設備進行信號通信的加密狗設 備,包括:用于接收音頻文件的裝置;用于將音頻文件轉(zhuǎn)換為文本文件的裝置;以及,用于 將文本文件傳輸?shù)絾⒂镁W(wǎng)絡的設備的輸出裝置。
[0021] 本發(fā)明的各實現(xiàn)可包括以下中的一項或多項。接收裝置可以是從由下列各項構(gòu)成 的組中選出的:RF信號接收器、麥克風以及硬件端口。輸出裝置可以是從由下列各項構(gòu)成 的組中選出的:USB端口、RF信號發(fā)射器以及硬件端口。該設備還可以包括用于存儲用戶簡 檔的存儲器,所述用戶簡檔指示用戶語音的音頻特性。
[0022] 本發(fā)明的某些實施例的優(yōu)點可包括以下中的一項或多項。使用該系統(tǒng)和方法,內(nèi) 容回放及其他啟用網(wǎng)絡的設備可以方便地向用戶帳戶注冊并被管理。注冊可以使用帶有很 少或沒有額外的硬件成本的語音識別系統(tǒng)??梢允褂谜Z音識別系統(tǒng)來向啟用網(wǎng)絡的設備中 輸入很多類型的數(shù)據(jù)。語音識別系統(tǒng)可以允許不被支持語言的說話者使用他們的母語來控 制他們的設備??梢酝ㄟ^消除將多個語言組與每一設備一起發(fā)貨的必要性一一只需要一個 或在某些情況下一個也不需要被提供,簡化操作啟用網(wǎng)絡的設備的軟件。根據(jù)隨后的描述, 包括圖形和權(quán)利要求,其他優(yōu)點將變得明晰。
【附圖說明】
[0023] 圖1是根據(jù)本原理的一個實現(xiàn)的示例性系統(tǒng)的框圖。
[0024] 圖2是示出了各種類型的音頻數(shù)據(jù)以及它們的用途的圖示。
[0025] 圖3是示出了根據(jù)本原理的一個實現(xiàn)的示例性方法的流程圖。
[0026] 圖4是示出了根據(jù)本原理的另一實現(xiàn)的示例性方法的流程圖,其中處理不被支持 語言的語音輸入。
[0027] 圖5是示出了根據(jù)本原理的再一個實現(xiàn)的示例性方法的流程圖,其中下載語言模 塊。
[0028] 圖6是示出了將音頻數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)的方式和裝置的圖示。
[0029] 圖7是示出了根據(jù)本原理的另一實現(xiàn)的示例性方法的流程圖,包括處理不被支持 的語言的使用情況的兩種方式。
[0030] 圖8是示出了接收語言類型的指示的方式的圖示。
[0031] 圖9是示出了根據(jù)本原理的加密狗的示例性實現(xiàn)的圖示。
[0032] 圖10-13是示出了根據(jù)本原理的具體但示例性的方法的順序流程圖。
[0033] 圖14示出了示例性計算環(huán)境,例如所公開的第二顯示器、服務器、智能電話、移動 設備、平板計算機、加密狗等等的示例性計算環(huán)境。
[0034] 相同的參考編號通篇表示的相同的元素。
【具體實施方式】
[0035] 圖1是根據(jù)本原理的一個實現(xiàn)的示例性系統(tǒng)10的框圖。在此系統(tǒng)10中,啟用網(wǎng) 絡的設備12通過因特網(wǎng)16連接到服務器18。啟用網(wǎng)絡的設備12 -般是IPTV、媒體播放 器、Biu-ray?播放器等等,并具有用戶界面14,可以在其中輸入以及顯示數(shù)據(jù),例如在表 單46中。用戶界面14可以啟用導航命令以允許用戶在不同的表單周圍移動或選擇不同的 條目,導航命令由箭頭48示意地示出。
[0036] 系統(tǒng)10可以允許通過用戶的語音與用戶有一定程度的交互。這樣做時,啟用網(wǎng)絡 的設備12可以包括話音引擎34,例如以硬件或軟件實現(xiàn)的,其中,音頻數(shù)據(jù)是通過硬件端 口 32、rf端口 44輸入的,例如,使得能夠通過JBluetooth:_^、議或通過其他裝置來進行傳 輸。一個這樣的其他裝置可以是帶有麥克風52的攝像機,嵌入在啟用網(wǎng)絡的設備12內(nèi)或 與其耦合。
[0037]啟用網(wǎng)絡的設備可包括用戶存儲器42,用來將用戶常用的命令存儲為音頻文件或 等同物,使得啟用網(wǎng)絡的設備可以隨著時間的推移"學習"用戶如何提供命令。例如,如果 用戶具有明顯的口音或方言,則用戶存儲器可以存儲命令以及隨后執(zhí)行的動作的記錄,并 可以學習將動作與具有方言或口音的語音命令相關(guān)聯(lián)。在一些情況下,如果系統(tǒng)不可理解 用戶,則它可以提示用戶閱讀一短文,以允許一定程度的學習發(fā)生。用戶存儲器42也可以 不僅存儲語音命令的記錄,而且還存儲在編輯文本之后用戶確定什么是音頻數(shù)據(jù)的正確轉(zhuǎn) 換的記錄。
[0038] 也可以使用其他方式來使得啟用網(wǎng)絡的設備能夠獲取音頻數(shù)據(jù)。例如,加密狗36 可以通過連接38耦合到設備12上的端口。加密狗36可包括麥克風,用于存儲數(shù)據(jù)(例如 有關(guān)用戶的方言、口音或話音模式的信息)的用戶存儲器,以及甚至話音引擎。為清楚起 見,在圖形中未示出這些。加密狗36可以例如被附接到TV上的USB或其他端口,或可以以 無線方式連接。在這樣的系統(tǒng)中,加密狗可以在各設備之間運送,給系統(tǒng)10提供了一定的 靈活性。
[0039] 也可以使用外部設備24來提供語音輸入。外部設備24可以包括話音引擎54以 實現(xiàn)話音引擎34的功能,或者兩種可以一起工作,以將音頻數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)??梢杂?于與用戶存儲器42相同或類似的原因,來使用用戶存儲器56。典型的外部設備24可包括 作為設備28所示出的那些,例如,智能電話、平板計算機、筆記本計算機等等。這樣的設備 可以通過RF、紅外線、有線鏈路等等,與啟用網(wǎng)絡的設備進行通信。其他外部設備24可包括 第二顯示器,該第二顯示器使用如此處引用的申請所描述的代理服務器來與啟用網(wǎng)絡的設 備進行交互。
[0040] 可以理解,在使用話音引擎34或54的情況下,在客戶端側(cè)進行音頻數(shù)據(jù)向文本數(shù) 據(jù)的轉(zhuǎn)換。在一些情況下,可以將音頻數(shù)據(jù)傳輸?shù)椒掌?8以供轉(zhuǎn)換,在這樣的情況下,可 以使用話音引擎19來轉(zhuǎn)換話音。服務器側(cè)的處理提供某些好處,包括計算能力等等的可縮 放性。另外,值得注意的是,盡管與服務器的連接需要諸如布置必要的連接性之類的步驟, 在語音輸入的目的是,例如執(zhí)行設備12的注冊的情況下,對用戶的不便被最小化,因為這 樣的過程一般只執(zhí)行一次,而不會再次執(zhí)行。服務器18也可以包括圖像輸出器21,在文本 數(shù)據(jù)是不被設備12支持的語言類型的情況下,可以使用圖像輸出器21來創(chuàng)建文本數(shù)據(jù)的 圖像。即,圖像可以由文本數(shù)據(jù)構(gòu)成,圖像被發(fā)送以供顯示在用戶界面14上。進一步,為使 得能夠處理一系列的語言,語言服務器22可以使用若干個語言庫23a-23d,其中,每一語言 庫都面向不同的語言,例如中文、韓語、日語等等。
[0041] 無論話音引擎位于哪里,名義系統(tǒng)可以簡單地存儲字母和數(shù)字的音頻數(shù)據(jù),而不 是復雜化的命令或用戶名/密碼組合。如此,啟用網(wǎng)絡的設備可以簡單地具有足夠的存儲 器來存儲字母和數(shù)字的音頻文件,以及一些簡
當前第2頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1