用于啟用網(wǎng)絡(luò)的設(shè)備上的語音識(shí)別輸入的方法和系統(tǒng)的制作方法
【專利說明】用于啟用網(wǎng)絡(luò)的設(shè)備上的語音識(shí)別輸入的方法和系統(tǒng)
[0001] 相關(guān)申請(qǐng)的交叉引用
[0002] 本申請(qǐng)要求2013年3月8日提出的標(biāo)題為"METHOD AND SYSTEM FOR VOICE RECOGNITION INPUT ON NETWORK-ENABLED DEVICES" 的美國專利申請(qǐng)系列 No. 13/790, 426 的優(yōu)先權(quán)。該申請(qǐng)的全部內(nèi)容以引用的方式并入本文中。本申請(qǐng)全文引用了 2010年12月 30 提出的標(biāo)題為 "DEVICE REGISTRATION PROCESS FROM SECOND DISPLAY" 的美國專利申 請(qǐng)系列No. 12/982, 463,后者要求2010年11月10提出的標(biāo)題為"DEVICE REGISTRATION PROCESS FROM 2ndDISPLAY"的美國臨時(shí)專利申請(qǐng)No. 61/412, 312的優(yōu)先權(quán);本申請(qǐng)還全文 引用了 2010年7月27日提出的標(biāo)題為"CONTROL OF IPTV USING SECOND DEVICE"的美國 專利申請(qǐng)系列No. 12/844, 205,所有的這些申請(qǐng)都由本發(fā)明的受讓人擁有。
【背景技術(shù)】
[0003] 因特網(wǎng)向IPTV遞送數(shù)字內(nèi)容持續(xù)增加,就像IPTV本身的流行度持續(xù)增加那樣。至 于許多數(shù)字設(shè)備,特別是網(wǎng)絡(luò)上的那些,IPTV的設(shè)備注冊(cè)會(huì)給用戶帶來許多好處。IPTV的 注冊(cè)的關(guān)鍵好處是與允許對(duì)各種服務(wù)進(jìn)行訪問的用戶帳戶的關(guān)聯(lián)。然而,IPTV設(shè)備的用戶 注冊(cè)是不方便的。用戶需要離開起居室來訪問PC-一這是不方便的,或者直接在IPTV上執(zhí) 行注冊(cè),IPTV -般具有差的輸入界面。例如,在一些系統(tǒng)中,使用遙控器向設(shè)備上的web瀏 覽器輸入注冊(cè)碼。盡管用戶不必離開設(shè)備的位置,但是,大多數(shù)遙控器未被設(shè)計(jì)為用于輸入 大量的數(shù)據(jù)。
[0004] 補(bǔ)救該情況的一個(gè)成功的嘗試是通過允許用戶使用第二顯示器,例如蜂窩電話或 平板計(jì)算機(jī),以通過在對(duì)用戶更加友好的設(shè)備上輸入數(shù)據(jù)來輔助注冊(cè)的執(zhí)行。盡管在許多 情況下十分方便,但是,技術(shù)不太靈光的用戶仍可能在執(zhí)行注冊(cè)IPTV的必要的功能(例如, 下載應(yīng)用、利用他們的設(shè)備配置第二顯示器等等)時(shí)遭到困難。
[0005] 研究表明,IPTV及其他啟用網(wǎng)絡(luò)的(network-enabled)設(shè)備(例如,Blu-ray回放 器)的很高百分比的用戶不注冊(cè)他們的設(shè)備。不僅用戶遺漏掉注冊(cè)的好處,而且網(wǎng)絡(luò)提供 商也遺漏掉接收關(guān)于這樣的用戶的商業(yè)信息,可以使用這些商業(yè)信息來改善服務(wù)以及向消 費(fèi)者做廣告。相應(yīng)地,需要使諸如IPTV之類的設(shè)備的注冊(cè)過程更方便,并由此使用戶能夠 更方便地得到這樣注冊(cè)的好處。此外,還需要改善向這樣的設(shè)備輸入數(shù)據(jù)的總體用戶體驗(yàn)。
【發(fā)明內(nèi)容】
[0006] 在系統(tǒng)和方法的實(shí)現(xiàn)中,用戶可以使用語音命令而并非使用麻煩的設(shè)備或必須導(dǎo) 航到單獨(dú)的注冊(cè)網(wǎng)站,方便地注冊(cè)并管理內(nèi)容回放設(shè)備,例如IPTV。如此,可以更方便地實(shí) 現(xiàn)注冊(cè)。在注冊(cè)之后,可以實(shí)現(xiàn)額外的跟進(jìn)特征,諸如直接選擇用于瀏覽的設(shè)備,與用戶帳 戶相關(guān)聯(lián)的其他設(shè)備的注冊(cè)信息或配置的繼承。
[0007] 系統(tǒng)和方法的實(shí)現(xiàn)可以使用web表單和與設(shè)備和瀏覽器兼容的web技術(shù)來接受用 戶輸入以及服務(wù)器側(cè)腳本語言。可以在各種位置處使用話音(speech)引擎來將語音輸入 轉(zhuǎn)換為文本或數(shù)值數(shù)據(jù)以注冊(cè)IPTV,或?qū)嶋H上任何啟用網(wǎng)絡(luò)的設(shè)備。話音引擎可以以各種 方式接收語音輸入,例如從USB或指定的硬件端口,從耦合到遙控器、IPTV或其他設(shè)備、第 二顯示器等等或嵌入在它們內(nèi)的麥克風(fēng)。所識(shí)別的文本可以向用戶顯示在內(nèi)容回放設(shè)備 上,以確保準(zhǔn)確的轉(zhuǎn)錄。接著,可以將所識(shí)別的文本(例如注冊(cè)信息)自動(dòng)地或人工地提交 到網(wǎng)絡(luò)提供商。
[0008] 在操作方法的一個(gè)示例中,當(dāng)內(nèi)容回放設(shè)備被打開并可以與網(wǎng)絡(luò)進(jìn)行通信(例 如,要么以有線方式要么以無線方式)時(shí),如有必要提示用戶輸入網(wǎng)絡(luò)密碼,并接著被自動(dòng) 地定向到注冊(cè)門戶。如果用戶在注冊(cè)門戶中沒有用戶帳戶,則可以提示他們創(chuàng)建一個(gè)。在 用戶登錄到注冊(cè)門戶之后,提示用戶添加內(nèi)容回放設(shè)備的注冊(cè)碼或其他可標(biāo)識(shí)的代碼,諸 如MAC地址。接著,用戶向音頻輸入設(shè)備說出代碼,逐個(gè)字符地或者一次性地全部說出。與 注冊(cè)(或其他管理)門戶的交互可以完全通過語音或可以通過語音和使用遙控器的人工輸 入的組合來進(jìn)行。一經(jīng)成功注冊(cè),設(shè)備就可以準(zhǔn)備好用于瀏覽和內(nèi)容選擇。用戶還可以使 用先前的配置來填充新內(nèi)容回放設(shè)備的注冊(cè)信息,例如,從先前的配置繼承信息,只需要添 加新設(shè)備的注冊(cè)碼。
[0009] 啟用網(wǎng)絡(luò)的內(nèi)容回放設(shè)備可以呈現(xiàn)許多形式,多個(gè)內(nèi)容回放設(shè)備可以耦合到給定 局域網(wǎng),并可以在給定局域網(wǎng)內(nèi)被選擇。示例性內(nèi)容回放設(shè)備可包括IPTV、DTV、數(shù)字音頻 系統(tǒng)、Blu-ray?播放器、或適當(dāng)?shù)乇慌渲靡员氵B接的更傳統(tǒng)的視頻和音頻系統(tǒng)。在視頻 系統(tǒng)中,內(nèi)容回放設(shè)備包括控制視頻顯示器以在其上呈現(xiàn)內(nèi)容的處理器。
[0010] -方面,本發(fā)明涉及向啟用網(wǎng)絡(luò)的設(shè)備輸入數(shù)據(jù)的方法,包括:將啟用網(wǎng)絡(luò)的設(shè)備 配置為處于接收音頻數(shù)據(jù)的狀態(tài),所述數(shù)據(jù)與附屬于所述啟用網(wǎng)絡(luò)的設(shè)備的服務(wù)、與所述 啟用網(wǎng)絡(luò)的設(shè)備相關(guān)聯(lián)的服務(wù)器、或所述啟用網(wǎng)絡(luò)的設(shè)備的用戶界面的操作相關(guān)聯(lián);接收 音頻數(shù)據(jù);將所接收到的音頻數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù);以及導(dǎo)致所述啟用網(wǎng)絡(luò)的設(shè)備基于所 述文本數(shù)據(jù)來執(zhí)行動(dòng)作,所述文本數(shù)據(jù)表示所述服務(wù)或所述服務(wù)器上的功能,或者表示所 述啟用網(wǎng)絡(luò)的設(shè)備的用戶界面上的操作。
[0011] 本發(fā)明的實(shí)現(xiàn)可包括以下中的一項(xiàng)或多項(xiàng)。接收到的音頻數(shù)據(jù)可以是注冊(cè)數(shù)據(jù), 該方法還可以包括將文本數(shù)據(jù)與用戶帳戶相關(guān)聯(lián),從而,啟用網(wǎng)絡(luò)的設(shè)備被注冊(cè)到該用戶 帳戶。該方法還可以包括基于注冊(cè)數(shù)據(jù)創(chuàng)建用戶帳戶。接收到的音頻數(shù)據(jù)可以是用戶名或 密碼或者這兩者,服務(wù)上的功能可以是登錄到服務(wù)上的用戶帳戶。接收到的音頻數(shù)據(jù)可以 是導(dǎo)航命令,在用戶界面上執(zhí)行操作可包括執(zhí)行該導(dǎo)航命令。該方法還可以包括傳輸導(dǎo)致 啟用網(wǎng)絡(luò)的設(shè)備顯示文本數(shù)據(jù)的信號(hào)。在接收音頻數(shù)據(jù)并將其轉(zhuǎn)換為對(duì)應(yīng)于字符的文本 數(shù)據(jù)之后,所述字符的文本版本可以顯示在所述啟用網(wǎng)絡(luò)的設(shè)備上。該方法還可以包括提 示用戶確認(rèn)所述文本數(shù)據(jù)。該方法還可以包括存儲(chǔ)接收到的音頻數(shù)據(jù),并且如果跟在顯示 提示之后是用戶修改所述文本數(shù)據(jù),則該方法還可以包括將已修改的文本數(shù)據(jù)與接收到的 音頻數(shù)據(jù)相關(guān)聯(lián)。該方法還可以包括:從接收到的音頻數(shù)據(jù)檢測語言類型;如果檢測到的 語言類型不對(duì)應(yīng)于所述啟用網(wǎng)絡(luò)的設(shè)備的支持語言中的一個(gè),那么:執(zhí)行轉(zhuǎn)換步驟,使得文 本數(shù)據(jù)是對(duì)應(yīng)于檢測到的語言類型的形式;創(chuàng)建文本數(shù)據(jù)的鏡像文件;以及將所述圖像文 件傳輸?shù)剿鰡⒂镁W(wǎng)絡(luò)的設(shè)備,供顯示。該方法還可以包括:從接收到的音頻數(shù)據(jù)檢測語 言類型;如果檢測到的語言類型不對(duì)應(yīng)于所述啟用網(wǎng)絡(luò)的設(shè)備的支持語言中的一個(gè),那么: 執(zhí)行轉(zhuǎn)換步驟,使得文本數(shù)據(jù)是對(duì)應(yīng)于檢測到的語言類型的形式;以及將所述文本數(shù)據(jù)傳 輸?shù)剿鰡⒂镁W(wǎng)絡(luò)的設(shè)備,供顯示。該方法還可以包括:從接收到的音頻數(shù)據(jù)檢測語言類 型;如果檢測到的語言類型不對(duì)應(yīng)于所述啟用網(wǎng)絡(luò)的設(shè)備的支持語言中的一個(gè),那么,將對(duì) 應(yīng)于檢測到的語言類型的語言模塊下載到所述啟用網(wǎng)絡(luò)的設(shè)備。該方法還可以包括:提示 用戶輸入語言類型,并且一經(jīng)輸入語言類型,就將對(duì)應(yīng)于所輸入的語言類型的語言模塊下 載到所述啟用網(wǎng)絡(luò)的設(shè)備。
[0012] 在另一方面,本發(fā)明涉及非暫態(tài)計(jì)算機(jī)可讀介質(zhì),包括用于導(dǎo)致計(jì)算設(shè)備實(shí)現(xiàn)上 面的方法的指令。
[0013] 在另一方面,本發(fā)明涉及用于啟用網(wǎng)絡(luò)的設(shè)備輸入數(shù)據(jù)的方法,包括:將啟用網(wǎng)絡(luò) 的設(shè)備配置為處于接收音頻數(shù)據(jù)的狀態(tài);接收音頻數(shù)據(jù);將接收到的音頻數(shù)據(jù)轉(zhuǎn)換為文本 數(shù)據(jù);以及導(dǎo)致所述啟用網(wǎng)絡(luò)的設(shè)備基于使用所述文本數(shù)據(jù)的請(qǐng)求來執(zhí)行動(dòng)作。
[0014] 本發(fā)明的各實(shí)現(xiàn)可包括以下中的一項(xiàng)或多項(xiàng)。請(qǐng)求數(shù)據(jù)的輸入可包括顯示表單以 及提示輸入數(shù)據(jù),該方法還可以包括利用文本數(shù)據(jù)來填充表單并且顯示經(jīng)填充的表單。該 表單可以提示輸入注冊(cè)碼,該方法還可以包括將文本數(shù)據(jù)傳輸?shù)椒?wù)器以執(zhí)行注冊(cè),并且 一經(jīng)從服務(wù)器接收到指示成功注冊(cè)的信號(hào),就顯示成功注冊(cè)的指示。請(qǐng)求數(shù)據(jù)的輸入可包 括接受導(dǎo)航命令的輸入。接收音頻數(shù)據(jù)可包括使用啟用網(wǎng)絡(luò)的設(shè)備上的輸入端口來接收音 頻數(shù)據(jù)。將接收到的音頻數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)可以在啟用網(wǎng)絡(luò)的設(shè)備上執(zhí)行。該方法還可 以包括:在轉(zhuǎn)換之前,確定接收到的音頻數(shù)據(jù)是使用不被支持的語言;以及,下載對(duì)應(yīng)于接 收到的音頻數(shù)據(jù)的語言的語言模塊。輸入端口可以被配置成接受來自移動(dòng)電話、平板計(jì)算 機(jī)、膝上型計(jì)算機(jī)、麥克風(fēng)的音頻數(shù)據(jù)或音頻流,或者可以是USB端口。加密狗可以耦合到 USB端口,接收音頻數(shù)據(jù)可以由耦合到加密狗的麥克風(fēng)執(zhí)行。將接收到的音頻數(shù)據(jù)轉(zhuǎn)換為文 本數(shù)據(jù)可以在加密狗中執(zhí)行。接收音頻數(shù)據(jù)可包括從遙控器接收音頻數(shù)據(jù)。將接收到的音 頻數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)可以在遙控器上