亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于已識(shí)別語(yǔ)音發(fā)起動(dòng)作的視覺(jué)確認(rèn)的制作方法_2

文檔序號(hào):9693191閱讀:來(lái)源:國(guó)知局
6]計(jì)算設(shè)備2的語(yǔ)音激活模塊10可從例如話音識(shí)別模塊8接收來(lái)自在麥克風(fēng)12處檢測(cè)到的音頻數(shù)據(jù)的被轉(zhuǎn)錄的話音的文本字符。語(yǔ)音激活模塊10可分析所轉(zhuǎn)錄的文本以確定其是否包括激活語(yǔ)音發(fā)起動(dòng)作的關(guān)鍵詞或短語(yǔ)。一旦語(yǔ)音激活模塊10識(shí)別到與語(yǔ)音發(fā)起動(dòng)作相對(duì)應(yīng)的單詞或短語(yǔ),則語(yǔ)音激活模塊10使得UID 4在用戶(hù)界面16內(nèi)以第二、不同視覺(jué)格式顯示圖形元素以指示語(yǔ)音發(fā)起動(dòng)作已被成功地識(shí)別。例如,當(dāng)語(yǔ)音激活模塊10確定了與語(yǔ)音發(fā)起動(dòng)作相對(duì)應(yīng)的所轉(zhuǎn)錄的文本中的單詞時(shí),UID 4將該單詞的輸出從第一視覺(jué)格式(其可以是與轉(zhuǎn)錄非命令文本20的其余部分相同的視覺(jué)格式)變成第二、不同視覺(jué)格式。例如,與語(yǔ)音發(fā)起動(dòng)作相對(duì)應(yīng)的關(guān)鍵詞或短語(yǔ)的視覺(jué)特性風(fēng)格不同于并不與語(yǔ)音發(fā)起動(dòng)作相對(duì)應(yīng)的其它單詞,以指示計(jì)算設(shè)備2識(shí)別到語(yǔ)音發(fā)起動(dòng)作。在另一示例中,當(dāng)語(yǔ)音激活模塊10識(shí)別到語(yǔ)音發(fā)起動(dòng)作時(shí),包括在GUI 16中的圖標(biāo)或其它圖像從一個(gè)視覺(jué)格式變體成另一視覺(jué)格式。
[0027]in設(shè)備模塊6可使得UID 4呈現(xiàn)用戶(hù)界面16。用戶(hù)界面16包括在UID 4的各種位置處顯示的圖形指示(例如,元素)。圖1在用戶(hù)界面16內(nèi)將圖標(biāo)24圖示為一個(gè)示例圖形指示。圖1還在用戶(hù)界面16內(nèi)將圖形元素26、28以及40圖示為圖形指示的示例以用于選擇選項(xiàng)或執(zhí)行與在計(jì)算設(shè)備2處執(zhí)行的應(yīng)用相關(guān)的附加功能。UI模塊6可接收將在用戶(hù)界面16處以第一視覺(jué)格式顯示的圖形元素識(shí)別為與語(yǔ)音發(fā)起動(dòng)作相對(duì)應(yīng)或與之相關(guān)聯(lián)的信息作為來(lái)自語(yǔ)音激活模塊10的輸入。響應(yīng)于計(jì)算設(shè)備2將圖形元素識(shí)別為與語(yǔ)音發(fā)起動(dòng)作相關(guān)聯(lián),UI模塊6可以更新用戶(hù)界面16以將圖形元素從第一視覺(jué)格式變成第二視覺(jué)格式。
[0028]UI設(shè)備模塊6可充當(dāng)計(jì)算設(shè)備2的各種組件之間的媒介以基于由UID 4檢測(cè)到的輸入來(lái)進(jìn)行確定并生成由UID 4呈現(xiàn)的輸出。例如,UI模塊6接收音頻數(shù)據(jù)的所轉(zhuǎn)錄的文本字符作為來(lái)自話音識(shí)別模塊8的輸入。UI模塊6使得UID 4在用戶(hù)界面16處以第一視覺(jué)格式來(lái)顯示所轉(zhuǎn)錄的文本字符。UI模塊6接收將文本字符的至少一部分識(shí)別為與來(lái)自語(yǔ)音激活命令10的命令文本相對(duì)應(yīng)的信息?;谠撟R(shí)別信息,UI模塊6顯示與以第二視覺(jué)格式的語(yǔ)音命令或另一圖形元素相關(guān)聯(lián)的文本,所述第二視覺(jué)格式不同于最初用來(lái)顯示命令文本或圖形元素的第一視覺(jué)格式。
[0029]例如,UI模塊6接收將所轉(zhuǎn)錄的文本字符的一部分識(shí)別為與語(yǔ)音發(fā)起動(dòng)作相對(duì)應(yīng)的信息作為來(lái)自語(yǔ)音激活模塊10的輸入。響應(yīng)于語(yǔ)音激活模塊10確定該所轉(zhuǎn)錄的文本部分與語(yǔ)音發(fā)起動(dòng)作相對(duì)應(yīng),UI模塊6改變所轉(zhuǎn)錄的文本字符的一部分的視覺(jué)格式。也就是說(shuō),UI模塊6響應(yīng)于將圖形元素識(shí)別為與語(yǔ)音發(fā)起動(dòng)作相關(guān)聯(lián)而將圖形元素從第一視覺(jué)格式變成第二視覺(jué)格式。UI模塊6可使得UID 4呈現(xiàn)已更新用戶(hù)界面16。例如,⑶I 16包括與語(yǔ)音命令相關(guān)的文本,命令文本22(8卩,“收聽(tīng)”)。響應(yīng)于語(yǔ)音激活模塊10確定“收聽(tīng)”與命令相對(duì)應(yīng),UI設(shè)備4將GUI 16更新成以第二格式顯示命令文本22,該第二格式不同于非命令文本20的其余部分的格式。
[0030]在圖1的示例中,用戶(hù)界面16分叉成兩個(gè)區(qū)域:編輯區(qū)18-A和動(dòng)作區(qū)18-B。編輯區(qū)18-A和動(dòng)作區(qū)18-B可包括諸如所轉(zhuǎn)錄的文本、圖像、對(duì)象、超鏈接、文本的字符、菜單、字段、虛擬按鈕、虛擬鍵等圖形元素。如本文所使用的任何上列圖形元素可以是用戶(hù)界面元素。圖1示出了用于用戶(hù)界面16的僅一個(gè)示例布局??梢杂衅渲杏脩?hù)界面16在布局、區(qū)域數(shù)目、夕卜觀、格式、版本、色彩方案、或其它視覺(jué)特性中的一個(gè)或多個(gè)方面不同的其它示例。
[0031]編輯區(qū)18-A可以是被配置成接收輸入或輸出信息的UI設(shè)備4的區(qū)域。例如,計(jì)算設(shè)備2可接收話音識(shí)別模塊8識(shí)別為話音的語(yǔ)音輸入,并且編輯區(qū)18-A輸出由語(yǔ)音輸入有關(guān)的信息。例如,如圖1中所示,用戶(hù)界面16在編輯區(qū)18-A中顯示非命令文本20。在其它示例中,編輯區(qū)18-A可更新以基于觸摸或基于手勢(shì)的輸入為基礎(chǔ)而顯示的信息。
[0032]動(dòng)作區(qū)18-B可以是被配置成接受來(lái)自用戶(hù)的輸入或者提供計(jì)算設(shè)備2在過(guò)去已采取、當(dāng)前正在采取、或者將采取的動(dòng)作的指示。在某些示例中,動(dòng)作區(qū)18-B包括圖形鍵盤(pán),其包括被顯示為鍵的圖形元素。在某些示例中,在計(jì)算設(shè)備2處于話音識(shí)別模式的同時(shí),動(dòng)作區(qū)18-B將不包括圖形鍵盤(pán)。
[0033]在圖1的示例中,計(jì)算設(shè)備2輸出用戶(hù)界面16以用于顯示,該用戶(hù)界面16包括可以以指示計(jì)算設(shè)備2已識(shí)別到語(yǔ)音發(fā)起動(dòng)作的視覺(jué)格式顯示的至少一個(gè)圖形元素。例如,UI設(shè)備模塊6可生成用戶(hù)界面16并在用戶(hù)界面16中包括圖形元素22和24。1]1設(shè)備模塊6可向UID4發(fā)送信息,該信息包括用于在UID 4的存在敏感顯示器5處顯示用戶(hù)界面16的指令。UID 4可接收該信息并使得UID 4的存在敏感顯示器5呈現(xiàn)用戶(hù)界面16,其包括可改變視覺(jué)格式以提供語(yǔ)音發(fā)起動(dòng)作已被識(shí)別的指示的圖形元素。
[0034]用戶(hù)界面16包括在UID4的各種位置處顯示的一個(gè)或多個(gè)圖形元素。如圖1的示例中所示,在編輯區(qū)18-A和動(dòng)作區(qū)18-B中顯示許多圖形元素。在本示例中,計(jì)算設(shè)備2處于話首識(shí)別t旲式,意味著麥克風(fēng)12被開(kāi)啟以接收首頻輸入且話首識(shí)別t旲塊8被激活。語(yǔ)首激活豐旲塊10在話音識(shí)別模式下也可以是活動(dòng)的以便檢測(cè)語(yǔ)音發(fā)起動(dòng)作。當(dāng)計(jì)算設(shè)備2并未處于話音識(shí)別模式時(shí),話音識(shí)別模塊8和語(yǔ)音是被模塊10可能不是活動(dòng)的。為了指示計(jì)算設(shè)備2處于話音識(shí)別模塊且正在收聽(tīng),可在區(qū)域18-B中顯示單詞“正在收聽(tīng)……”。如圖1中所示,圖標(biāo)24在麥克風(fēng)的圖像中。
[0035]圖標(biāo)24指示計(jì)算設(shè)備2處于話音識(shí)別模式(例如,可接收音頻數(shù)據(jù),諸如口語(yǔ)單詞hUID 4在GUI 16的動(dòng)作區(qū)18-B中顯示使得能夠選擇用戶(hù)正在說(shuō)出的語(yǔ)言的語(yǔ)言元素26,使得話音識(shí)別模塊8可以用正確的語(yǔ)言來(lái)轉(zhuǎn)錄用戶(hù)的話語(yǔ)。GUI 16包括下拉菜單28以提供用以改變?cè)捯糇R(shí)別模塊8用來(lái)轉(zhuǎn)錄音頻數(shù)據(jù)的語(yǔ)言的選項(xiàng)。GUI 16還包括虛擬按鈕30以提供用以取消計(jì)算設(shè)備2的話音識(shí)別模式的選項(xiàng)。如圖1中所示,視覺(jué)按鈕30包括單詞“完成”以指示其結(jié)束話音識(shí)別模式的目的。下拉菜單28和虛擬按鈕30兩者都可以是諸如觸摸目標(biāo)的用戶(hù)交互式圖形元素,其可以基于在UI設(shè)備4處接收到的輸入而被觸發(fā)、轉(zhuǎn)換或者以其他方式與其相交互。例如,當(dāng)用戶(hù)正在說(shuō)話時(shí),用戶(hù)可在虛擬按鈕30的區(qū)域處或附近敲擊用戶(hù)界面16以使計(jì)算設(shè)備2從話音識(shí)別模式轉(zhuǎn)換出來(lái)。
[0036]話音識(shí)別模塊8可轉(zhuǎn)錄用戶(hù)說(shuō)出或者以其他方式輸入到計(jì)算設(shè)備2中的單詞。在一個(gè)示例中,用戶(hù)說(shuō)出“我想要收聽(tīng)爵士樂(lè)...”。直接地或間接地,麥克風(fēng)12可提供與包含向話音識(shí)別模塊8說(shuō)出的單詞的音頻數(shù)據(jù)相關(guān)的信息。話音識(shí)別模塊8可應(yīng)用與所選語(yǔ)言(例如,英語(yǔ),如語(yǔ)言元素26中所示)相對(duì)應(yīng)的語(yǔ)言模型以轉(zhuǎn)錄音頻數(shù)據(jù)。話音識(shí)別模塊8可向UI設(shè)備4提供與轉(zhuǎn)錄相關(guān)的信息,該UI設(shè)備4進(jìn)而又可在編輯區(qū)18-A中在用戶(hù)界面16處輸出非命令文本20的字符。
[0037]話音識(shí)別模塊8可將所轉(zhuǎn)錄的文本提供給語(yǔ)音激活模塊10。語(yǔ)音激活模塊10可以回顧針語(yǔ)音發(fā)起動(dòng)作的所轉(zhuǎn)錄的文本。在一個(gè)示例中,語(yǔ)音激活模塊10可確定短語(yǔ)“我想要收聽(tīng)爵士樂(lè)”中的單詞“收聽(tīng)”指示或描述語(yǔ)音發(fā)起動(dòng)作。該單詞與收聽(tīng)某種東西相對(duì)應(yīng),語(yǔ)音激活模塊10可將其確定為意指收聽(tīng)音頻文件?;谡Z(yǔ)句的場(chǎng)境,語(yǔ)音激活模塊10確定用戶(hù)想要收聽(tīng)爵士樂(lè)。因此,語(yǔ)音激活模塊10可觸發(fā)包括打開(kāi)媒體播放器并使得媒體播放器播放爵士樂(lè)的動(dòng)作。例如,計(jì)算設(shè)備2可播放存儲(chǔ)在可被計(jì)算設(shè)備2訪問(wèn)的存儲(chǔ)器設(shè)備上的被識(shí)別為爵士樂(lè)流派的唱片。
[0038]響應(yīng)于識(shí)別到單詞“收聽(tīng)”指示語(yǔ)音發(fā)起動(dòng)作,語(yǔ)音激活模塊10直接地或間接地為UID 4提供將“收聽(tīng)”識(shí)別為與語(yǔ)音發(fā)起動(dòng)作相對(duì)應(yīng)的信息。UID 4然后改變?cè)谟脩?hù)界面16處顯示的至少一個(gè)圖形元素的視覺(jué)格式以指示語(yǔ)音發(fā)起動(dòng)作已被識(shí)別。如圖1的示例中所示,口語(yǔ)單詞“收聽(tīng)”已被識(shí)別為語(yǔ)音命令。
[0039]圖1圖示出與單詞“我想要”和“爵士樂(lè)”不同的視覺(jué)格式的文本“收聽(tīng)”相關(guān)的圖形元素。圖1圖示出顯示所轉(zhuǎn)錄的文本字符20和語(yǔ)音發(fā)起動(dòng)作文本22(在本文中也稱(chēng)為“命令文本22”)的編輯區(qū)18-A。命令文本22是與被話音識(shí)別模塊8轉(zhuǎn)錄且被語(yǔ)音激活模塊10識(shí)別為語(yǔ)音命令的語(yǔ)音發(fā)起動(dòng)作相對(duì)應(yīng)的圖形元素。命令文本22可在視覺(jué)上不同于文本字符20中的非命令文本。例如,圖1將命令文本22(例如,“LISTEN ΤΟ”)圖示為用大寫(xiě)字母寫(xiě)且?guī)聞澗€,而非命令文本20—般地是小寫(xiě)字母且不帶下劃線(例如,“我想要”和“爵士樂(lè)”)。
[0040]在另一示例中,圖標(biāo)24的視覺(jué)格式可在檢測(cè)到語(yǔ)音發(fā)起動(dòng)作時(shí)改變。在圖1中,圖標(biāo)24在麥克風(fēng)的圖像中。圖標(biāo)24最初可具有此圖像,因?yàn)橛?jì)算設(shè)備2處于話音識(shí)別模式。響應(yīng)于語(yǔ)音激活模塊10確定音頻數(shù)據(jù)包含語(yǔ)音發(fā)起動(dòng)作,UID 4可改變圖標(biāo)24的視覺(jué)格式。例如,UID 4可將圖標(biāo)24變成具有與語(yǔ)音發(fā)起動(dòng)作所請(qǐng)求的動(dòng)作相關(guān)的視覺(jué)格式。在本示例中,圖標(biāo)24可從第一視覺(jué)格式(例如,麥克風(fēng))變成與語(yǔ)音發(fā)起動(dòng)作相關(guān)的視覺(jué)格式(例如,用于播放媒體文件的播放圖標(biāo))。在某些示例中,圖標(biāo)24可經(jīng)歷兩個(gè)視覺(jué)格式之間的動(dòng)畫(huà)變化。
[0041]以這種方式,本公開(kāi)的技術(shù)可使得計(jì)算設(shè)備2能夠更新話音識(shí)別圖形用戶(hù)界面16,其中基于包括語(yǔ)音發(fā)起動(dòng)作的已識(shí)別指示的音頻數(shù)據(jù)而以不同的視覺(jué)格式呈現(xiàn)命令文本22和圖標(biāo)24中的一者或兩者。本公開(kāi)的技術(shù)可使得計(jì)算設(shè)備2能夠提供語(yǔ)音發(fā)起動(dòng)作已被識(shí)別并將要或正在被采取的指示。本技術(shù)可進(jìn)一步使得用戶(hù)能夠驗(yàn)證或確認(rèn)要采取的動(dòng)作是用戶(hù)利用其語(yǔ)音命令想要計(jì)算設(shè)備2采取的動(dòng)作,或者在動(dòng)作不正確的情況下或者由于任何其它原因而取消動(dòng)作。配置有這些特征的計(jì)算設(shè)備2可以為用戶(hù)提供語(yǔ)音發(fā)起動(dòng)作正在或者可被實(shí)現(xiàn)的增加的置信度。這可改善用戶(hù)對(duì)計(jì)算設(shè)備2及其話音識(shí)別特征的總體滿(mǎn)意度。所述技術(shù)可用根據(jù)本公開(kāi)的各種技術(shù)配置的計(jì)算設(shè)備的語(yǔ)音控制來(lái)改善用戶(hù)的體驗(yàn)。
[0042]圖2是圖示出根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面的,用于提供包括已識(shí)別語(yǔ)音發(fā)起動(dòng)作的視覺(jué)指示的圖形用戶(hù)界面的示例計(jì)算設(shè)備2的框圖。下面在圖1的背景內(nèi)描述圖2的計(jì)算設(shè)備2。圖2圖示出計(jì)算設(shè)備2的僅一個(gè)特定示例,并且在其它情況下可使用計(jì)算設(shè)備2的許多其它示例。計(jì)算設(shè)備2的其它示例可包括被包括在示例性計(jì)算設(shè)備2中的組件的子集,或者可包括圖2中未示出的附加組件。
[0043]如圖2的示例中所示,計(jì)算設(shè)備2包括用戶(hù)界面設(shè)備4(“UID4”)、一個(gè)或多個(gè)處理器40、一個(gè)或多個(gè)輸入設(shè)備42、一個(gè)或多個(gè)麥克風(fēng)12、一個(gè)或多個(gè)通信單元44、一個(gè)或多個(gè)輸出設(shè)備46、以及一個(gè)或多個(gè)存儲(chǔ)設(shè)備48。計(jì)算設(shè)備2的存儲(chǔ)設(shè)備48還包括UID模塊6、話音識(shí)別模塊8、語(yǔ)音激話模塊10、應(yīng)用模塊14A-14N(統(tǒng)稱(chēng)為“應(yīng)用模塊14”)、語(yǔ)言數(shù)據(jù)庫(kù)56、以及動(dòng)作數(shù)據(jù)存儲(chǔ)58。一個(gè)或多個(gè)通信信道50可將組件4、40、42、44、46、以及48中的每一個(gè)互連以用于組件間通信(在物理上、在通信上、和/或在操作上)。在某些示例中,通信信道50可包括系統(tǒng)總線、網(wǎng)絡(luò)連接、進(jìn)程間通信數(shù)據(jù)結(jié)構(gòu)、或用于傳遞數(shù)據(jù)的任何其它技術(shù)。
[0044]計(jì)算設(shè)備2的一個(gè)或多個(gè)輸入設(shè)備42可接收輸入。輸入的示例是觸覺(jué)、運(yùn)動(dòng)、音頻、以及視頻輸入。計(jì)算設(shè)備2的輸入設(shè)備42在一個(gè)示例中包括存在敏感顯示器5、觸敏屏幕、鼠標(biāo)、鍵盤(pán)、語(yǔ)音響應(yīng)系統(tǒng)、攝像機(jī)、麥克風(fēng)(諸如麥克風(fēng)12)或用于檢測(cè)來(lái)自人類(lèi)或機(jī)器的輸入的任何其它類(lèi)型的設(shè)備。
[0045]計(jì)算設(shè)備2的一個(gè)或多個(gè)輸出設(shè)備46可生成輸出。輸出的示例是觸覺(jué)、音頻、電磁、以及視頻輸出。在一個(gè)示例中,計(jì)算設(shè)備2的輸出設(shè)備46包括存在敏感顯示器、揚(yáng)聲器、陰極射線管(CRT)監(jiān)視器、液晶顯示器(IXD)、馬達(dá)、致動(dòng)器、電磁體、壓電傳感器、或用于向人類(lèi)或機(jī)器生成輸出的任何其它類(lèi)型的設(shè)備。輸出設(shè)備46可利用聲卡或水平圖形適配卡中的一個(gè)或多個(gè)來(lái)分別產(chǎn)生聽(tīng)覺(jué)或視覺(jué)輸出。
[0046]計(jì)算設(shè)備2的一個(gè)或多個(gè)通信單元44可通過(guò)在一個(gè)或多個(gè)網(wǎng)絡(luò)上發(fā)射和/或接收網(wǎng)絡(luò)信號(hào)而經(jīng)由一個(gè)或多個(gè)網(wǎng)絡(luò)來(lái)與外部設(shè)備通信。通信單元44可連接到任何公共或私用通信網(wǎng)絡(luò)。例如,計(jì)算設(shè)備2可使用通信單元44來(lái)在諸如蜂窩無(wú)線電網(wǎng)絡(luò)的無(wú)線電網(wǎng)絡(luò)上發(fā)射和/或接收無(wú)線電信號(hào)。同樣地,通信單元44可在諸如全球定位系統(tǒng)(GPS)的全球?qū)Ш叫l(wèi)星系統(tǒng)(GNNS)上發(fā)射和/或接收衛(wèi)星信號(hào)。通信單
當(dāng)前第2頁(yè)1 2 3 4 5 6 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1