本申請(qǐng)是申請(qǐng)日為2014年1月6日、申請(qǐng)?zhí)枮?01410005003.4的中國(guó)發(fā)明專利申請(qǐng)“顯示裝置和用于控制顯示裝置的方法”的分案申請(qǐng)。
相關(guān)申請(qǐng)的交叉引用
本申請(qǐng)要求于2013年1月7日在韓國(guó)知識(shí)產(chǎn)權(quán)局提交的韓國(guó)專利申請(qǐng)no.10-2013-0001803的優(yōu)先權(quán),其公開內(nèi)容通過引用的方式全部并入本文。
根據(jù)示例性實(shí)施例的裝置和方法涉及顯示技術(shù),更具體地,涉及配置為根據(jù)用戶語音控制的顯示裝置及其控制方法。
背景技術(shù):
由于電子技術(shù)的進(jìn)步,目前開發(fā)和提供了不用類型的顯示裝置。因此,向用戶提供了更多樣化的功能。例如,電視(tv)現(xiàn)在能夠連接到互聯(lián)網(wǎng)并且提供互聯(lián)網(wǎng)服務(wù),從而使用戶能夠觀看包括數(shù)字廣播頻道的大量廣播。
在有關(guān)技術(shù)中,最近開發(fā)的技術(shù)之一采用語音識(shí)別來以更便利和直觀地控制顯示裝置。tv現(xiàn)在能夠識(shí)別用戶語音并且執(zhí)行與用戶語音相對(duì)應(yīng)的諸如音量調(diào)整或頻道改變等的功能。
然而,雖然有關(guān)技術(shù)的顯示裝置能夠感知用戶語音以提供與感知的語音相對(duì)應(yīng)的功能,但是它們不向用戶提供交互信息。由于當(dāng)用戶首次使用顯示裝置時(shí)他們不知道使用哪些詞來對(duì)顯示裝置執(zhí)行語音控制的這一事實(shí),因此顯示裝置的使用還受到限制。
技術(shù)實(shí)現(xiàn)要素:
示例性實(shí)施例至少解決了上述問題和/或缺點(diǎn)以及上文未描述的其它缺點(diǎn)。此外,示例性實(shí)施例不需要克服上述缺點(diǎn),并且示例性實(shí)施例可以不克服上述問題中的任意一個(gè)。
一個(gè)或多個(gè)示例性實(shí)施例提供了一種顯示裝置,配置為提供可應(yīng)用于該顯示裝置的當(dāng)前情形的語音命令向?qū)?,以及提供了該顯示裝置的控制方法。
根據(jù)示例性實(shí)施例的一個(gè)方案,提供了一種電子裝置,包括:輸出端;語音收集器,配置為收集用戶語音;以及控制器,配置為控制所述輸出端輸出與所述用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)。所述控制器可以進(jìn)一步配置為控制所述輸出端,使得輸出可應(yīng)用于所述電子裝置的當(dāng)前情形的語音命令向?qū)А?/p>
響應(yīng)于輸出與所述用戶語音相對(duì)應(yīng)的所述系統(tǒng)響應(yīng),所述控制器可以進(jìn)一步配置為控制所述輸出端以輸出包括與所述系統(tǒng)響應(yīng)有關(guān)的向?qū)г趦?nèi)的語音命令向?qū)А?/p>
響應(yīng)于輸出通過根據(jù)包括搜索內(nèi)容的命令在內(nèi)的所述用戶語音來執(zhí)行搜索而產(chǎn)生的內(nèi)容列表,所述控制器可以進(jìn)一步配置為控制所述輸出端輸出包括對(duì)所述內(nèi)容列表中包含的所述內(nèi)容進(jìn)行過濾的向?qū)г趦?nèi)的語音命令向?qū)А?/p>
響應(yīng)于輸出通過根據(jù)包括搜索內(nèi)容的命令在內(nèi)的用戶語音來執(zhí)行搜索而產(chǎn)生的內(nèi)容列表,所述控制器可以進(jìn)一步配置為控制所述輸出端輸出用于執(zhí)行所述內(nèi)容列表中包含的特定內(nèi)容的語音命令向?qū)Ш陀糜谳敵鏊鎏囟▋?nèi)容的細(xì)節(jié)的語音命令向?qū)е械闹辽僖粋€(gè)。
響應(yīng)于輸出與包括用于執(zhí)行相應(yīng)應(yīng)用的命令在內(nèi)的用戶語音相對(duì)應(yīng)的應(yīng)用執(zhí)行屏幕,所述控制器可以進(jìn)一步配置為控制所述輸出端輸出包括可應(yīng)用于所述應(yīng)用執(zhí)行屏幕的向?qū)г趦?nèi)的語音命令向?qū)?。輸出所述?yīng)用執(zhí)行屏幕可以包括:在所述電子裝置中包含的屏幕上顯示所述應(yīng)用執(zhí)行屏幕。
所述電子裝置可以是顯示裝置。
所述電子裝置可以另外包括第一通信器,配置為向第一服務(wù)器發(fā)送用戶語音并且從所述第一服務(wù)器接收與所述用戶語音相對(duì)應(yīng)的文本信息;以及第二通信器,配置為向第二服務(wù)器發(fā)送所接收的文本信息。響應(yīng)于從所述第二服務(wù)器接收到與所述文本信息相對(duì)應(yīng)的響應(yīng)信息,所述控制器可以進(jìn)一步配置為控制所述輸出端使得基于所述響應(yīng)信息輸出所述系統(tǒng)響應(yīng)。
根據(jù)另一個(gè)示例性實(shí)施例的一個(gè)方案,提供了一種電子裝置的控制方法,包括:收集用戶語音;向第一服務(wù)器發(fā)送所述用戶語音并且從所述第一服務(wù)器接收與所述用戶語音相對(duì)應(yīng)的文本信息;向第二服務(wù)器發(fā)送所接收的文本信息;以及響應(yīng)于從所述第二服務(wù)器接收到與所述文本信息相對(duì)應(yīng)的響應(yīng)信息,基于所述響應(yīng)信息輸出與所述用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng),并且輸出可應(yīng)用于所述電子裝置的當(dāng)前情形的語音命令向?qū)А?/p>
響應(yīng)于輸出通過根據(jù)包括搜索內(nèi)容的命令在內(nèi)的所述用戶語音來執(zhí)行搜索而產(chǎn)生的內(nèi)容列表,輸出包括對(duì)所述內(nèi)容列表中包含的所述內(nèi)容進(jìn)行過濾的向?qū)г趦?nèi)的語音命令向?qū)А?/p>
響應(yīng)于輸出通過根據(jù)包括用于搜索內(nèi)容的命令的所述用戶語音來執(zhí)行搜索而產(chǎn)生的內(nèi)容列表,輸出包括用于執(zhí)行所述內(nèi)容列表中包含的特定內(nèi)容的向?qū)Ш陀糜谳敵鏊鎏囟▋?nèi)容的細(xì)節(jié)的向?qū)е械闹辽僖粋€(gè)在內(nèi)的所述語音命令向?qū)А?/p>
響應(yīng)于輸出與包括用于執(zhí)行相應(yīng)應(yīng)用的命令的所述用戶語音相對(duì)應(yīng)的應(yīng)用執(zhí)行屏幕,輸出包括可應(yīng)用于所述應(yīng)用執(zhí)行屏幕的向?qū)г趦?nèi)的語音命令向?qū)А?/p>
所述電子裝置可以是顯示裝置。
根據(jù)另一個(gè)示例性實(shí)施例的一個(gè)方案,提供了一種產(chǎn)生電子設(shè)備的語音命令向?qū)У姆椒?,所述方法包括:接收用于控制電子設(shè)備的用戶語音;輸出與所述用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng);產(chǎn)生與所述系統(tǒng)響應(yīng)相對(duì)應(yīng)的語音命令向?qū)?;以及輸出所述語音命令向?qū)А?/p>
所述語音命令向?qū)Э梢园ㄓ糜诳刂扑鲭娮釉O(shè)備的信息,所述信息包括:用于控制所述電子設(shè)備的功能的語音命令。
所述方法還可以包括:響應(yīng)于包括搜索內(nèi)容的命令在內(nèi)的用戶語音,搜索內(nèi)容;將通過搜索內(nèi)容而產(chǎn)生的內(nèi)容列表作為系統(tǒng)響應(yīng)進(jìn)行輸出;以及響應(yīng)于輸出所述內(nèi)容列表,將以下各項(xiàng)中的至少一項(xiàng)作為語音命令向?qū)нM(jìn)行輸出:用于對(duì)所述內(nèi)容列表進(jìn)行過濾的向?qū)?,用于?zhí)行所述內(nèi)容列表中包含的特定內(nèi)容的向?qū)?,或者用于輸出所述?nèi)容列表中包含的特定內(nèi)容的細(xì)節(jié)的向?qū)А?/p>
所述方法還可以包括:響應(yīng)于包括用于執(zhí)行應(yīng)用的命令在內(nèi)的所述用戶語音來執(zhí)行應(yīng)用;將與所述應(yīng)用相對(duì)應(yīng)的應(yīng)用執(zhí)行屏幕作為所述系統(tǒng)響應(yīng)進(jìn)行輸出;以及響應(yīng)于輸出所述應(yīng)用執(zhí)行屏幕,將用于執(zhí)行所述應(yīng)用執(zhí)行屏幕上的功能的向?qū)ё鳛樗稣Z音命令向?qū)нM(jìn)行輸出。輸出所述應(yīng)用執(zhí)行屏幕可以包括在所述電子設(shè)備中包含的屏幕上顯示所述應(yīng)用執(zhí)行屏幕。
所述電子設(shè)備可以包括屏幕。輸出所述系統(tǒng)響應(yīng)和輸出所述語音命令向?qū)Э梢园ㄔ谒銎聊簧巷@示所述系統(tǒng)響應(yīng)和所述語音命令向?qū)А?/p>
所述電子設(shè)備可以包括音頻輸出端。輸出所述系統(tǒng)響應(yīng)和輸出所述語音命令向?qū)Э梢园▽⑺鱿到y(tǒng)響應(yīng)和所述語音命令向?qū)ё鳛橐纛l輸出信號(hào)向所述音頻輸出端進(jìn)行輸出。
根據(jù)另一個(gè)示例性實(shí)施例的一個(gè)方案,提供了一種電子設(shè)備,包括:輸出端;輸入端,配置為接收用于控制電子設(shè)備的用戶語音;以及控制器,配置為控制所述輸出端輸出與所接收的用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)并且輸出與所述系統(tǒng)響應(yīng)相對(duì)應(yīng)的語音命令向?qū)А?/p>
所述語音命令向?qū)Э梢园ㄓ糜诳刂扑鲭娮釉O(shè)備的信息,所述信息包括用于控制所述電子設(shè)備的功能的語音命令。
所述控制器可以被進(jìn)一步配置為:響應(yīng)于包括搜索內(nèi)容的命令在內(nèi)的用戶語音來搜索內(nèi)容,控制所述輸出端將通過搜索內(nèi)容而產(chǎn)生的內(nèi)容列表作為所述系統(tǒng)響應(yīng)進(jìn)行輸出,以及響應(yīng)于所述輸出端輸出所述內(nèi)容列表,控制所述輸出端輸出以下各項(xiàng)中的至少一項(xiàng)作為所述語音命令向?qū)В河糜趯?duì)所述內(nèi)容列表進(jìn)行過濾的向?qū)?,用于?zhí)行所述內(nèi)容列表中包含的特定內(nèi)容的向?qū)В蛘哂糜谳敵鏊鰞?nèi)容列表中包含的特定內(nèi)容的細(xì)節(jié)的向?qū)А?/p>
所述電子設(shè)備還可以包括顯示器??刂破骺梢员贿M(jìn)一步配置為:響應(yīng)于包括用于執(zhí)行應(yīng)用的命令在內(nèi)的用戶語音來執(zhí)行應(yīng)用,控制所述輸出端將與所述應(yīng)用相對(duì)應(yīng)的應(yīng)用執(zhí)行屏幕作為所述系統(tǒng)響應(yīng)進(jìn)行輸出,并且響應(yīng)于所述輸出端輸出所述應(yīng)用執(zhí)行屏幕,控制所述輸出端將用于執(zhí)行所述應(yīng)用執(zhí)行屏幕上的功能的向?qū)ё鳛樗稣Z音命令向?qū)нM(jìn)行輸出。所述輸出端輸出所述應(yīng)用執(zhí)行屏幕和用于執(zhí)行所述應(yīng)用執(zhí)行屏幕上的功能的向?qū)Э梢园ㄏ蛩鲲@示器輸出要顯示的所述應(yīng)用執(zhí)行屏幕和用于執(zhí)行功能的向?qū)А?/p>
所述電子設(shè)備還可以包括顯示器。所述輸出端輸出所述系統(tǒng)響應(yīng)和輸出所述語音命令向?qū)Э梢园ㄏ蛩鲲@示器輸出要顯示的所述系統(tǒng)響應(yīng)和所述語音命令向?qū)А?/p>
所述電子設(shè)備還可以包括音頻輸出端。所述輸出端輸出所述系統(tǒng)響應(yīng)并且輸出所述語音命令向?qū)Э梢园ㄏ蛩鲆纛l輸出端輸出要作為音頻輸出的所述系統(tǒng)響應(yīng)和所述語音命令向?qū)А?/p>
根據(jù)各個(gè)示例性實(shí)施例,因?yàn)樘峁┝税墒褂玫恼Z音信息的語音命令向?qū)?,因此即使交互系統(tǒng)的初學(xué)用戶也能夠方便地使用系統(tǒng)。此外,因?yàn)樘峁┝伺c根據(jù)用戶的話語而輸出的系統(tǒng)響應(yīng)有關(guān)的語音命令向?qū)?,因此用戶可以自然地獲知可應(yīng)用于該情形的語音。
附圖說明
通過參照附圖描述特定示例性實(shí)施例,上述和/或其它方案將變得更加顯而易見,在附圖中:
圖1是提供來解釋根據(jù)示例性實(shí)施例的交互系統(tǒng)的視圖;
圖2是根據(jù)示例性實(shí)施例的顯示裝置的示意性框圖;
圖3是圖2的顯示裝置的詳細(xì)框圖;
圖4是圖1的第一服務(wù)器的框圖;
圖5是圖1的第二服務(wù)器的框圖;
圖6至圖11是提供來解釋根據(jù)示例性實(shí)施例的用于提供語音命令向?qū)У姆椒ǖ囊晥D;以及
圖12是提供來解釋根據(jù)示例性實(shí)施例的顯示裝置的控制方法的流程圖。
具體實(shí)施方式
現(xiàn)在將參照附圖更詳細(xì)地描述具體示例性實(shí)施例。
在下面的描述中,即使在不同的附圖中,相同的附圖標(biāo)記用于相同的元件。提供描述中定義的材料(例如,詳細(xì)的構(gòu)造和元素)以幫助全面理解示例性實(shí)施例。因此,顯而易見,可以在沒有這些具體定義的材料的情況下執(zhí)行示例性實(shí)施例。此外,未詳細(xì)描述公知的功能或構(gòu)造,這是因?yàn)樗鼈儠?huì)以不必要的細(xì)節(jié)使示例性實(shí)施例模糊。
圖1是被提供以解釋根據(jù)示例性實(shí)施例的交互系統(tǒng)的視圖。
參照?qǐng)D1,交互系統(tǒng)1000包括顯示裝置100、第一服務(wù)器200和第二服務(wù)器300。
顯示裝置100可以由提供來控制顯示裝置100的遙控器(未示出)來控制。也即是說,顯示裝置100可以執(zhí)行與從遙控器(未示出)接收的遙控信號(hào)相對(duì)應(yīng)的操作。例如,當(dāng)顯示裝置100實(shí)現(xiàn)為tv時(shí),如圖1中所示,顯示裝置100可以根據(jù)接收的遙控信號(hào)來執(zhí)行諸如開機(jī)/關(guān)機(jī)、頻道改變或音量改變等的操作。
此外,顯示裝置100可以根據(jù)用戶語音來執(zhí)行各種操作。
顯示裝置100向第一服務(wù)器200發(fā)送收集的用戶語音。當(dāng)從顯示裝置100接收到用戶語音時(shí),第一服務(wù)器200將接收的用戶語音轉(zhuǎn)換為文本信息(或文本)并且向顯示裝置100發(fā)送該文本信息。
顯示裝置100向第二服務(wù)器300發(fā)送從第一服務(wù)器200接收的文本信息。當(dāng)從顯示裝置100接收到文本信息時(shí),第二服務(wù)器300產(chǎn)生與接收的文本信息相對(duì)應(yīng)的響應(yīng)信息,并且向顯示裝置100發(fā)送響應(yīng)信息。
同時(shí),顯示裝置100可以基于從第二服務(wù)器300接收的響應(yīng)信息來執(zhí)行各種操作。
例如,顯示裝置100可以執(zhí)行與用戶語音相對(duì)應(yīng)的功能。也即是說,在由顯示裝置100提供的功能中,顯示裝置100可以執(zhí)行與用戶語音相對(duì)應(yīng)的功能。例如,響應(yīng)于用戶語音“打開頻道#o(即,頻道號(hào))”,顯示裝置100可以根據(jù)從第二服務(wù)器300接收的控制命令來調(diào)到頻道#o并且輸出頻道#o。為此目的,第二服務(wù)器300可以向顯示裝置100發(fā)送控制命令,以執(zhí)行與用戶語音相對(duì)應(yīng)的功能。
在上述示例中,顯示裝置100還可以提供與相應(yīng)功能相對(duì)應(yīng)的系統(tǒng)響應(yīng)。也即是說,顯示裝置100可以以語音和用戶界面(ui)屏幕(文本、圖像等)中的至少一個(gè)的形式輸出與響應(yīng)于用戶語音執(zhí)行的功能有關(guān)的信息。在上述示例中,顯示裝置100可以以語音和ui屏幕形式中的至少一個(gè)形式輸出用于指示與改變的頻道有關(guān)的信息或者用于向用戶通知頻道改變完成的消息。
此外,顯示裝置100可以響應(yīng)于用戶語音輸出系統(tǒng)響應(yīng)??梢砸哉Z音和ui屏幕中的至少一個(gè)的形式輸出系統(tǒng)響應(yīng)。例如,當(dāng)輸入詢問特定節(jié)目的廣播時(shí)間的用戶語音時(shí),顯示裝置100可以以語音和ui屏幕中的至少一個(gè)的形式輸出節(jié)目的相應(yīng)廣播時(shí)間。
此外,顯示裝置100可以輸出可以在當(dāng)前情形中執(zhí)行的語音命令向?qū)АR布词钦f,當(dāng)響應(yīng)于用戶語音輸出系統(tǒng)響應(yīng)時(shí),顯示裝置100可以輸出與系統(tǒng)響應(yīng)有關(guān)的語音命令向?qū)А?/p>
例如,假設(shè)顯示裝置100將今天要廣播的廣播節(jié)目列表作為對(duì)用戶語音“tv今天演什么?”的系統(tǒng)響應(yīng)進(jìn)行輸出。在該示例中,顯示裝置100可以輸出包括與用戶語音有關(guān)的信息在內(nèi)的語音命令向?qū)В撜Z音命令向?qū)Э梢韵鄬?duì)于作為系統(tǒng)響應(yīng)輸出的廣播節(jié)目列表使用,其中,語音命令向?qū)Э梢园ā皒xx(即,頻道名稱)演什么?”、“xxx(即,出現(xiàn)的人的名字)主演什么?”、“我可以看xxx(即,節(jié)目名稱)嗎?”、“第三個(gè)”、或“我可以看第三個(gè)的細(xì)節(jié)嗎?”。
因此,當(dāng)收集到語音命令向?qū)е邪挠脩粽Z音時(shí),顯示裝置100可以執(zhí)行相應(yīng)的操作。在上文解釋的示例中,當(dāng)收集的用戶語音是“xxx(即,頻道名稱)演什么?”時(shí),顯示裝置100可以輸出今天要廣播的廣播節(jié)目中由xxx(即,頻道名稱)提供的廣播節(jié)目列表。此外,當(dāng)收集的用戶語音是“第三個(gè)”時(shí),顯示裝置100可以調(diào)到作為系統(tǒng)響應(yīng)輸出的列表上的第三個(gè)廣播節(jié)目,并且輸出第三個(gè)廣播節(jié)目。
如上文所解釋的,因?yàn)轱@示裝置100提供語音命令向?qū)?,因此即使之前未使用過該交互系統(tǒng)的系統(tǒng)用戶也可以方便地使用該系統(tǒng)。此外,因?yàn)轱@示裝置100提供與根據(jù)用戶的話語輸出的系統(tǒng)響應(yīng)有關(guān)的語音命令向?qū)В虼擞脩艨梢宰匀坏孬@知在他們說話以后可應(yīng)用的語音。
同時(shí),雖然在圖1中顯示裝置100實(shí)現(xiàn)為tv,但是其它實(shí)施例是可能的。例如,顯示裝置100可以實(shí)現(xiàn)為各種電子裝置,例如,諸如智能電話等的移動(dòng)電話、臺(tái)式個(gè)人計(jì)算機(jī)(pc)、膝上型pc、或全球定位系統(tǒng)(gps)。
此外,雖然第一服務(wù)器200和第二服務(wù)器300實(shí)現(xiàn)為圖1中分立的服務(wù)器,因此其它實(shí)施例是可能的。舉一個(gè)例子,第一服務(wù)器200和第二服務(wù)器300可以實(shí)現(xiàn)為一個(gè)交互服務(wù)器。
.圖2是根據(jù)示例性實(shí)施例的顯示裝置的示意性框圖。
參照?qǐng)D2,顯示裝置100包括輸出端110、語音收集器120和控制器130。
輸出端110輸出語音和圖像中的至少一個(gè)。例如,輸出端110可以以語音和圖形ui(gui)中的至少一個(gè)的形式輸出與在語音收集器120處收集的用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)。
為此目的,輸出端110可以包括顯示器(未示出)和音頻輸出端(未示出)。
顯示器(未示出)可以實(shí)現(xiàn)為液晶顯示器(lcd)、有機(jī)發(fā)光顯示器(oled)或等離子顯示板(pdp)。顯示器(未示出)可以提供可通過顯示裝置100提供的各種類型的顯示屏幕。例如,顯示器(未示出)可以基于針對(duì)用戶語音的系統(tǒng)響應(yīng)來構(gòu)造包括文本、圖像、圖標(biāo)和gui中的至少一個(gè)的ui屏幕,并且顯示ui屏幕。
同時(shí),音頻輸出端(未示出)可以實(shí)現(xiàn)為諸如插孔或揚(yáng)聲器等輸出端口,從而以語音形式輸出針對(duì)用戶語音的系統(tǒng)響應(yīng)。
此外,輸出端110可以輸出各種內(nèi)容。內(nèi)容可以包括廣播內(nèi)容、視頻點(diǎn)播(vod)、精選vod、數(shù)字通用光盤(dvd)內(nèi)容等。例如,顯示器(未示出)可以輸出構(gòu)成內(nèi)容的圖像,音頻輸出端(未示出)可以輸出構(gòu)成內(nèi)容的音頻。
語音收集器120可以收集用戶語音。例如,語音收集器120可以實(shí)現(xiàn)為作為嵌入式部分位于顯示裝置100中或者與顯示裝置100分離的用于收集用戶語音的麥克風(fēng)。當(dāng)實(shí)現(xiàn)為與顯示裝置100分離時(shí),語音收集器120可以以用戶容易握住的形式或者以放置在桌子上的形式等來實(shí)現(xiàn)。語音收集器120可以通過有線網(wǎng)絡(luò)或無線網(wǎng)絡(luò)連接到顯示裝置100,向顯示裝置100發(fā)送收集的用戶語音。
同時(shí),語音收集器120可以確定收集的語音是否屬于用戶,并且從收集的用戶語音中濾除噪聲(例如,來自空調(diào)、真空吸塵器或音樂的噪聲)。
例如,當(dāng)輸入模擬形式的用戶語音時(shí),語音收集器120可以對(duì)該用戶語音進(jìn)行采樣并且將其轉(zhuǎn)換為數(shù)字信號(hào)。語音收集器120可以計(jì)算轉(zhuǎn)換的數(shù)字信號(hào)的能量以確定數(shù)字信號(hào)的能量是否等于或大于預(yù)置值。
當(dāng)數(shù)字信號(hào)的能量等于或大于預(yù)置值時(shí),語音收集器120可以從數(shù)字信號(hào)中移除噪聲分量并且向第一通信器130發(fā)送由此產(chǎn)生的信號(hào)。在本質(zhì)上偶發(fā)性的噪聲分量可能由于家庭環(huán)境而產(chǎn)生,并且可能包括例如空調(diào)聲、真空吸塵器聲或音樂。同時(shí),當(dāng)數(shù)字信號(hào)的能量小于預(yù)置值時(shí),語音收集器120可以等待另一輸入而不是處理數(shù)字信號(hào)。
因此,因?yàn)槌擞脩粽Z音以外的聲音不會(huì)激活整個(gè)音頻處理,因此可以防止不必要的功耗。
如圖1中所示,第一通信器130可以與第一服務(wù)器200進(jìn)行通信。例如,第一通信器130可以向第一服務(wù)器200發(fā)送用戶語音,并且從第一服務(wù)器200接收與用戶語音相對(duì)應(yīng)的文本信息。
如圖2中所示,第二通信器140與第二服務(wù)器300進(jìn)行通信。例如,第二通信器140可以向第二服務(wù)器300發(fā)送接收的文本信息,并且從第二服務(wù)器300接收與文本信息相對(duì)應(yīng)的響應(yīng)信息。
因此,第一通信器130和第二通信器140可以使用多種通信方法來與第一服務(wù)器200和第二服務(wù)器300進(jìn)行通信。
例如,第一通信器130和第二通信器140可以使用有線/無線局域網(wǎng)(lan)、wan、以太網(wǎng)、藍(lán)牙、zigbee、通用串行總線(usb)、ieee1394或wi-fi來與第一服務(wù)器200和第二服務(wù)器300進(jìn)行通信。為此目的,第一通信器130和第二通信器140可以采用與通信方法相對(duì)應(yīng)的芯片或輸入端口。例如,當(dāng)?shù)谝煌ㄐ牌?30和第二通信器140以有線lan方式進(jìn)行通信時(shí),第一通信器130和第二通信器140可以包括有線lan卡(未示出)和輸入端口(未示出)。
在上文解釋的示例性實(shí)施例中,為了與第一服務(wù)器200和第二服務(wù)器300進(jìn)行通信,顯示裝置100可以包括分離的通信器130、140。然而,其它實(shí)施例是可能的。例如,顯示裝置100可以經(jīng)由一個(gè)通信模塊與第一服務(wù)器200和第二服務(wù)器300進(jìn)行通信。
此外,第一通信器130和第二通信器140可以與第一服務(wù)器200和第二服務(wù)器300進(jìn)行通信,但是不限于此。例如,第一通信器130和第二通信器140可以連接到web服務(wù)器(未示出)以執(zhí)行web瀏覽。
控制器150可以控制顯示裝置100的整體操作。也即是說,控制器150可以控制輸出端110、語音收集器120以及第一通信器130和第二通信器140的操作。控制器150可以包括用于控制中央處理器單元(cpu)和顯示裝置100的模塊、以及用于存儲(chǔ)數(shù)據(jù)的只讀存儲(chǔ)器(rom)和隨機(jī)存取存儲(chǔ)器(ram)。
例如,控制器150可以通過語音收集器120收集用戶語音,并且控制第一通信器130向第一服務(wù)器200發(fā)送收集的用戶語音。當(dāng)接收到與用戶語音相對(duì)應(yīng)的文本信息時(shí),控制器150可以控制第二通信器140向第二服務(wù)器300發(fā)送接收的文本信息。
同時(shí),控制器150可以控制輸出端110輸出與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)。例如,當(dāng)接收到與文本信息相對(duì)應(yīng)的響應(yīng)信息時(shí),控制器150可以基于響應(yīng)信息來控制輸出端110輸出與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)。
響應(yīng)信息可以包括用于輸出系統(tǒng)響應(yīng)的系統(tǒng)響應(yīng)信息。
在一個(gè)示例性實(shí)施例中,系統(tǒng)響應(yīng)信息可以具有表示響應(yīng)于用戶語音從顯示裝置100輸出的系統(tǒng)響應(yīng)的文本形式,并且控制器150可以基于系統(tǒng)響應(yīng)信息控制輸出端110,使得響應(yīng)于用戶語音將與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)作為語音和ui屏幕中的至少一個(gè)進(jìn)行輸出。
更具體地,通過使用文本到語音(tts)引擎,控制器150可以將文本形式的系統(tǒng)響應(yīng)信息轉(zhuǎn)換為語音并且通過輸出端110輸出系統(tǒng)響應(yīng)信息。tts引擎是配置為將文本轉(zhuǎn)換為語音的模塊,因此可以使用各種已知的tts算法來將文本轉(zhuǎn)換為語音。此外,控制器150可以控制顯示裝置100,使得構(gòu)造包括構(gòu)成系統(tǒng)響應(yīng)信息的文本在內(nèi)的ui屏幕并且經(jīng)由輸出端110輸出。
例如,當(dāng)實(shí)現(xiàn)為tv的顯示裝置100收集到用戶語音“讓我知道最受歡迎的節(jié)目”時(shí),第二服務(wù)器300以文本形式“最受歡迎的節(jié)目是xxx(即,節(jié)目名稱)”進(jìn)行表達(dá)并且向顯示裝置100發(fā)送文本形式的“最受歡迎的節(jié)目是xxx(即,節(jié)目名稱)”。在該示例中,控制器150可以將文本形式的“最受歡迎的節(jié)目是xxx(即,節(jié)目名稱)”轉(zhuǎn)換為語音,并且經(jīng)由輸出端110輸出語音,或者構(gòu)造包括文本“最受歡迎的節(jié)目是xxx(即,節(jié)目名稱)”的ui屏幕并且經(jīng)由輸出端110輸出ui屏幕。此外,控制器150可以輸出語音和gui的組合。
在上文所解釋的示例性實(shí)施例中,從第二服務(wù)器300發(fā)送的系統(tǒng)響應(yīng)信息可以具有表達(dá)從顯示裝置100輸出的系統(tǒng)響應(yīng)的文本形式。然而,其它實(shí)施例是可能的。例如,系統(tǒng)響應(yīng)信息可以包括構(gòu)成從顯示裝置100輸出的系統(tǒng)響應(yīng)的語音數(shù)據(jù)或者構(gòu)成系統(tǒng)響應(yīng)的語音數(shù)據(jù)的一部分。備選地,系統(tǒng)響應(yīng)信息可以具有控制信號(hào)的形式以使用先前存儲(chǔ)在顯示裝置100中的語音或文本來輸出系統(tǒng)響應(yīng)。
因此,控制器150可以通過考慮系統(tǒng)響應(yīng)信息的形式來輸出系統(tǒng)響應(yīng)。
例如,當(dāng)接收到構(gòu)成系統(tǒng)響應(yīng)的語音數(shù)據(jù)時(shí),控制器150可以將相應(yīng)數(shù)據(jù)處理為可以經(jīng)由輸出端110可輸出的形式,并且以語音形式輸出該數(shù)據(jù)。
另一方面,即,當(dāng)接收到用于輸出系統(tǒng)響應(yīng)的控制信號(hào)時(shí),控制器150可以搜索顯示裝置100的預(yù)先存儲(chǔ)的數(shù)據(jù)以得到與控制信號(hào)相匹配的預(yù)先存儲(chǔ)的數(shù)據(jù),并且將找到的語音或文本數(shù)據(jù)處理為可輸出的形式,使得經(jīng)由輸出端110輸出該語音或文本數(shù)據(jù)。為此目的,顯示裝置100可以提前存儲(chǔ)語音或文本數(shù)據(jù)以提供系統(tǒng)響應(yīng)。例如,顯示裝置100可以以完整句子形式存儲(chǔ)數(shù)據(jù),例如,“頻道改變完成”,或者可以以部分句子形式存儲(chǔ)數(shù)據(jù),例如,“頻道改變到……”。在后一種情況下,可以從第二服務(wù)器300接收到完成句子的頻道名稱。
在另一種示例性實(shí)施例中,系統(tǒng)響應(yīng)信息可以包括各種信息以響應(yīng)于用戶語音從顯示裝置100輸出系統(tǒng)響應(yīng)。
例如,系統(tǒng)響應(yīng)信息可以包括與根據(jù)用戶的話語意圖而搜索的內(nèi)容有關(guān)的信息。也即是說,第二服務(wù)器300可以搜索與用戶語音中包含的話語意圖相匹配的內(nèi)容,并且向顯示裝置100發(fā)送與搜索的內(nèi)容有關(guān)的信息(例如,以下各項(xiàng)中的至少一項(xiàng):與內(nèi)容相對(duì)應(yīng)的內(nèi)容名稱、流派、廣播時(shí)間、演員表、縮略圖、廣播內(nèi)容的頻道名稱、頻道號(hào)和工作人員)。
例如,當(dāng)實(shí)現(xiàn)為tv的顯示裝置100收集到用戶語音“今天tv演什么?”時(shí),第二服務(wù)器300可以基于電子節(jié)目指南(epg)搜索今天要廣播的廣播節(jié)目,并且向顯示裝置100發(fā)送與廣播節(jié)目有關(guān)的信息。
因此,控制器150可以基于從第二服務(wù)器300接收的信息來產(chǎn)生內(nèi)容列表,并且輸出產(chǎn)生的內(nèi)容列表。在一個(gè)示例性實(shí)施例中,控制器150可以以語音和ui屏幕中的至少一個(gè)的形式輸出內(nèi)容列表。
例如,控制器150可以構(gòu)造包括安排在今天廣播的節(jié)目列表在內(nèi)的ui屏幕作為針對(duì)用戶語音的系統(tǒng)響應(yīng),并且輸出ui屏幕。控制器150可以產(chǎn)生以廣播時(shí)間順序列出搜索內(nèi)容的內(nèi)容列表。
控制器150還可以向搜索列表添加與搜索的內(nèi)容有關(guān)的各種信息。例如,控制器150可以基于與從第二服務(wù)器300接收的廣播節(jié)目有關(guān)的信息向搜索列表添加以下各項(xiàng)中的至少一項(xiàng):搜索的廣播節(jié)目的名稱、廣播時(shí)間、提供廣播節(jié)目的頻道名稱、頻道號(hào)和制作公司。
雖然第二服務(wù)器300可以向顯示裝置100發(fā)送與內(nèi)容有關(guān)的信息,并且顯示裝置100可以使用接收的信息產(chǎn)生內(nèi)容列表并且將內(nèi)容列表作為系統(tǒng)響應(yīng)進(jìn)行輸出,但是這僅是示例。
因此,其它實(shí)施例是可能的。例如,第二服務(wù)器300可以向顯示裝置100發(fā)送確定的用戶話語意圖,并且顯示裝置100可以基于與所確定的用戶語音中包含的話語意圖有關(guān)的信息來輸出與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)。
例如,當(dāng)?shù)诙?wù)器300確定用戶語音中包含的話語意圖是請(qǐng)求與安排在今天廣播的廣播節(jié)目有關(guān)的信息時(shí),第二服務(wù)器300可以向顯示裝置100發(fā)送用于輸出安排在今天廣播的廣播節(jié)目列表的控制命令。因此,控制器150可以基于epg來搜索安排在今天廣播的廣播節(jié)目,并且將廣播節(jié)目列表作為系統(tǒng)響應(yīng)進(jìn)行輸出。
同時(shí),響應(yīng)信息可以包括用于控制顯示裝置100的功能的控制命令??刂泼羁梢园ㄓ糜趫?zhí)行在顯示裝置100上可執(zhí)行的功能中與用戶語音相對(duì)應(yīng)的功能的命令。因此,基于從第二服務(wù)器300接收的控制命令,控制器150可以控制顯示裝置100的相應(yīng)組件以執(zhí)行與用戶語音相對(duì)應(yīng)的功能。
例如,當(dāng)顯示裝置100收集用戶語音“開大音量”時(shí),第二服務(wù)器300可以向顯示裝置100發(fā)送用于增加顯示裝置100的音量的控制命令。在一個(gè)示例性實(shí)施例中,控制器150可以基于控制命令增加經(jīng)由輸出端110輸出的音頻的音量。此外,當(dāng)顯示裝置100收集用戶語音“請(qǐng)執(zhí)行web瀏覽”時(shí),第二服務(wù)器300可以向顯示裝置100發(fā)送用于執(zhí)行與web瀏覽有關(guān)的應(yīng)用的控制命令。在一個(gè)示例性實(shí)施例中,控制器150可以基于控制命令來執(zhí)行預(yù)先存儲(chǔ)的應(yīng)用中用于web瀏覽的應(yīng)用。
然而,其它實(shí)施例也是可能的。例如,控制器150可以響應(yīng)于收集的用戶語音來控制顯示裝置100的相應(yīng)組件以執(zhí)行包括開機(jī)/關(guān)機(jī)、頻道改變等的各種操作。
此外,響應(yīng)信息可以包括與響應(yīng)于控制命令執(zhí)行的功能有關(guān)的系統(tǒng)響應(yīng)信息。在一個(gè)示例性實(shí)施例中,控制器150可以根據(jù)控制命令來執(zhí)行功能,并且基于系統(tǒng)響應(yīng)信息來控制顯示裝置100使得以語音和ui屏幕中的至少一個(gè)的形式輸出與執(zhí)行的功能有關(guān)的系統(tǒng)響應(yīng)。
例如,當(dāng)實(shí)現(xiàn)為tv的顯示裝置100收集用戶語音“調(diào)到頻道#11”時(shí),第二服務(wù)器300可以向顯示裝置100發(fā)送用于將顯示裝置100的頻道改變?yōu)轭l道#11的控制命令以及表達(dá)“頻道改變?yōu)?11”的文本形式。在一個(gè)示例性實(shí)施例中,控制器150可以基于控制命令將經(jīng)由輸出端110輸出的廣播頻道改變?yōu)轭l道#11。然后,控制器150可以將表達(dá)“頻道改變?yōu)轭l道#11”的文本形式轉(zhuǎn)換為說出“頻道改變?yōu)?11”的語音,并且經(jīng)由輸出端110輸出語音,或者構(gòu)造包括文本“頻道改變?yōu)?11”的ui屏幕并且經(jīng)由輸出端110輸出ui屏幕。
如上文所解釋的,控制器150可以根據(jù)收集的用戶語音來執(zhí)行各個(gè)操作。也即是說,控制器150可以輸出與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng),或者控制顯示裝置100,使得執(zhí)行與用戶語音相對(duì)應(yīng)的功能。
同時(shí),當(dāng)用戶語音指示顯示裝置100執(zhí)行不能在顯示裝置100上執(zhí)行的功能時(shí),可以在無需執(zhí)行顯示裝置100的單獨(dú)功能的情況下輸出與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)。
例如,為了解釋的目的,假設(shè)顯示裝置100實(shí)現(xiàn)為不支持電話呼叫功能的tv。在該情況下,當(dāng)顯示裝置100收集用戶語音“請(qǐng)呼叫xxx(即,另一用戶)”時(shí),第二服務(wù)器300可以向顯示裝置100發(fā)送用于執(zhí)行電話呼叫功能的控制命令。然而,因?yàn)轱@示裝置100不支持與控制命令相對(duì)應(yīng)的功能,因此控制器150不能了解從第二服務(wù)器300接收的控制命令。在該情況下,控制器150可以經(jīng)由輸出端110以語音和gui中的至少一個(gè)的形式輸出系統(tǒng)響應(yīng)“不支持該功能”。
同時(shí),控制器150可以控制顯示裝置100,使得輸出可以在顯示裝置100的當(dāng)前情形中使用的語音命令向?qū)А?/p>
“當(dāng)前情形”可以包括正在顯示裝置100中執(zhí)行特定功能(例如,輸出初始屏幕、輸出內(nèi)容或者執(zhí)行應(yīng)用)的情形。此外,初始屏幕可以包括在用戶語音控制顯示裝置100的交互模式中首先提供的屏幕。例如,當(dāng)選擇在顯示裝置100的操縱面板上提供的特定按鍵時(shí)或者當(dāng)從遙控器(未示出)接收到特定遙控信號(hào)時(shí),控制器150可以在交互模式中操作以顯示初始屏幕并且收集由用戶發(fā)出的語音。
更具體地,控制器150可以輸出表示了可以在執(zhí)行特定功能的情形(例如,初始屏幕輸出、內(nèi)容輸出或應(yīng)用執(zhí)行)中執(zhí)行特定操作的用戶語音的語音命令向?qū)А?/p>
例如,在輸出初始屏幕的情形中,可以輸出包括執(zhí)行在顯示裝置100上可執(zhí)行的操作的用戶語音的語音命令向?qū)?,例如,“今天tv演什么?”、“有什么有趣的嗎?”、“有新的電影嗎?”、“推薦受歡迎的電影”、“調(diào)到xxx(即,頻道名稱)”、“請(qǐng)運(yùn)行web瀏覽器”。
此外,在輸出內(nèi)容的情形中,可以輸出包括可應(yīng)用于內(nèi)容的用戶語音在內(nèi)的語音命令向?qū)?。例如,可以在輸出?nèi)容的情形中輸出包括可以搜索內(nèi)容或控制內(nèi)容(即,改變內(nèi)容或改變音量)的用戶語音在內(nèi)的語音命令向?qū)?,例如,“今天tv演什么?”、“有什么有趣的嗎?”、“有新的電影嗎?”、“推薦受歡迎的電影”、“調(diào)到xxx(即,頻道名稱)”或“開大音量”。
此外,在執(zhí)行應(yīng)用的情形中,可以輸出包括可應(yīng)用于應(yīng)用執(zhí)行屏幕的用戶語音在內(nèi)的語音命令向?qū)А@?,在?zhí)行用于web瀏覽的應(yīng)用并隨后顯示網(wǎng)頁(yè)屏幕的情形中,可以輸出包括可應(yīng)用以在頁(yè)面屏幕上執(zhí)行特定功能的用戶語音在內(nèi)的語音命令向?qū)В?,“主?yè)”、“收藏夾”、“刷新”、“打開新的頁(yè)面”、“關(guān)閉當(dāng)前頁(yè)面”、“后退”、“前進(jìn)”或“結(jié)束”。
當(dāng)輸出與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)時(shí),控制器150可以輸出與系統(tǒng)響應(yīng)有關(guān)的語音命令向?qū)?。也即是說,控制器150可以輸出與用戶語音中包含的用戶話語意圖相匹配的系統(tǒng)響應(yīng),并且輸出表示了可以響應(yīng)于輸出的系統(tǒng)響應(yīng)執(zhí)行特定操作的用戶語音的語音命令向?qū)А?/p>
更具體地,當(dāng)輸出根據(jù)用于搜索內(nèi)容的用戶語音而搜索的內(nèi)容列表時(shí),控制器150可以輸出對(duì)包括內(nèi)容的內(nèi)容列表中的內(nèi)容進(jìn)行過濾的語音命令向?qū)АR布词钦f,當(dāng)接收到具有搜索內(nèi)容的話語意圖的用戶語音時(shí),控制器150可以將根據(jù)用戶語音搜索的內(nèi)容列表作為系統(tǒng)響應(yīng)進(jìn)行輸出,并且將與可以用于在列表上的內(nèi)容中重新搜索特定內(nèi)容的用戶語音有關(guān)的信息作為語音命令向?qū)нM(jìn)行輸出。
例如,當(dāng)收集到用戶語音“今天tv演什么?”時(shí),控制器150可以基于安排在今天廣播的廣播節(jié)目列表來輸出系統(tǒng)響應(yīng)。在一個(gè)示例性實(shí)施例中,控制器150可以基于與可以從安排在今天廣播的廣播節(jié)目列表中選擇特定內(nèi)容的用戶語音有關(guān)的信息來輸出語音命令向?qū)?,例如,“xxx(即,頻道名稱)演什么?”、“我可以看紀(jì)錄片節(jié)目嗎?”、“我可以看xxx(即,出現(xiàn)的人的名字)主演的節(jié)目嗎?”、“找xxx(即,節(jié)目名稱)”。
此外,當(dāng)輸出響應(yīng)于搜索內(nèi)容的用戶語音而搜索的內(nèi)容列表時(shí),控制器150可以輸出以下各項(xiàng)中的至少一項(xiàng):用于執(zhí)行內(nèi)容列表中包含的特定內(nèi)容的語音命令向?qū)А⒑陀糜谳敵鎏囟▋?nèi)容的細(xì)節(jié)的語音命令向?qū)??!凹?xì)節(jié)”可以包括以下各項(xiàng)中的至少一項(xiàng):內(nèi)容的名稱、廣播時(shí)間、演員表、主題、提供內(nèi)容的頻道號(hào)和頻道名稱。
也即是說,當(dāng)接收到具有搜索內(nèi)容的話語意圖的用戶語音時(shí),控制器150可以將響應(yīng)于用戶語音而搜索的內(nèi)容列表作為系統(tǒng)響應(yīng)進(jìn)行輸出,并且輸出與可以用于執(zhí)行列表上的內(nèi)容中的特定內(nèi)容或者用于輸出特定內(nèi)容的細(xì)節(jié)的用戶語音有關(guān)的信息的語音命令向?qū)А?/p>
例如,當(dāng)收集到用戶語音“今天tv演什么?”時(shí),控制器150可以基于安排在今天廣播的廣播節(jié)目列表來輸出系統(tǒng)響應(yīng)。在一個(gè)示例性實(shí)施例中,控制器150可以輸出與可以用于執(zhí)行安排在今天廣播的廣播節(jié)目列表上的特定廣播節(jié)目或者用于輸出特定廣播節(jié)目的細(xì)節(jié)的用戶語音有關(guān)的信息的語音命令向?qū)В?,“第三個(gè)”或者“我可以看第三個(gè)的細(xì)節(jié)嗎?”。
當(dāng)響應(yīng)于用于執(zhí)行應(yīng)用的用戶語音而輸出相應(yīng)的應(yīng)用執(zhí)行屏幕時(shí),控制器150可以輸出在應(yīng)用執(zhí)行屏幕上可執(zhí)行的語音命令向?qū)?。也即是說,當(dāng)接收到具有執(zhí)行應(yīng)用的話語意圖的用戶語音時(shí),控制器150可以執(zhí)行與用戶語音相對(duì)應(yīng)的應(yīng)用,并且基于與可以用于執(zhí)行相應(yīng)應(yīng)用中的特定功能的用戶語音有關(guān)的信息輸出語音命令向?qū)А?/p>
例如,當(dāng)收集到用戶語音“運(yùn)行web瀏覽器”時(shí),控制器150可以執(zhí)行web瀏覽應(yīng)用并且輸出網(wǎng)頁(yè)屏幕。在一個(gè)示例性實(shí)施例中,控制器可以基于與可以用于執(zhí)行網(wǎng)頁(yè)屏幕上的特定功能的用戶語音有關(guān)的信息來輸出語音命令向?qū)?,例如,“主?yè)”、“收藏夾”、“刷新”、“打開新的頁(yè)面”、“關(guān)閉當(dāng)前頁(yè)面”、“后退”、“前進(jìn)”或“結(jié)束”。
在一個(gè)示例性實(shí)施例中,控制器150可以在預(yù)置時(shí)段或者在執(zhí)行特定功能時(shí)輸出語音命令向?qū)А?/p>
例如,控制器150可以在預(yù)置時(shí)段輸出在顯示裝置100的當(dāng)前情形中可應(yīng)用的語音命令向?qū)А4送?,控制?50可以在輸出初始屏幕、輸出內(nèi)容、執(zhí)行應(yīng)用或輸出與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)時(shí)輸出語音命令向?qū)?。此外,控制?50可以在輸出初始屏幕、輸出內(nèi)容、執(zhí)行應(yīng)用或輸出與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)時(shí)輸出語音命令向?qū)?,并且在預(yù)置時(shí)段重新輸出語音命令向?qū)А?/p>
為此目的,顯示裝置100可以存儲(chǔ)與當(dāng)前情形中可應(yīng)用的用戶語音有關(guān)的信息。也即是說,顯示裝置100可以存儲(chǔ)與每一個(gè)情形中使用的用戶語音有關(guān)的信息。因此,控制器150可以確定與顯示裝置100的當(dāng)前情形中可應(yīng)用的用戶語音有關(guān)的信息,并且基于與確定的用戶語音有關(guān)的信息來輸出語音命令向?qū)А?/p>
例如,當(dāng)輸出根據(jù)搜索內(nèi)容的用戶語音而搜索的內(nèi)容列表時(shí),控制器150可以確定對(duì)內(nèi)容進(jìn)行過濾、執(zhí)行特定內(nèi)容或輸出特定內(nèi)容的細(xì)節(jié)的用戶語音是可使用的。因此,在預(yù)先存儲(chǔ)的信息中,控制器150可以根據(jù)預(yù)先存儲(chǔ)的信息檢測(cè)與可以在輸出內(nèi)容列表的情形中使用的用戶語音有關(guān)的信息,并且將檢測(cè)到的信息作為語音命令向?qū)нM(jìn)行輸出。
同時(shí),在一些示例性實(shí)施例中,顯示裝置100可以存儲(chǔ)與在當(dāng)前情形中可應(yīng)用的用戶語音有關(guān)的信息,但是不限于此。因此,在另一個(gè)示例性實(shí)施例中,第二服務(wù)器300可以向顯示裝置100發(fā)送與可以在當(dāng)前情形中輸出的語音命令向?qū)в嘘P(guān)的信息,并且控制器150可以使用接收的信息來輸出語音命令向?qū)А?/p>
例如,響應(yīng)于用戶語音“今天tv演什么?”,第二服務(wù)器300可以向顯示裝置100發(fā)送與安排在今天廣播的廣播節(jié)目有關(guān)的信息。在該情況下,考慮顯示裝置100使用接收的信息,基于安排在今天廣播的廣播節(jié)目列表來輸出系統(tǒng)響應(yīng),第二服務(wù)器300可以向顯示裝置100發(fā)送與可應(yīng)用于作為系統(tǒng)響應(yīng)輸出的廣播節(jié)目列表的用戶語音有關(guān)的信息,例如,“第三個(gè)”、“我可以看第三個(gè)的細(xì)節(jié)嗎”、“xxx(即,頻道名稱)演什么?”、“我可以看紀(jì)錄片節(jié)目嗎?”、“我可以看xxx(即,出現(xiàn)的人的名字)主演的節(jié)目嗎?”、“找xxx(即,節(jié)目名稱)”。在一個(gè)示例性實(shí)施例中,控制器150可以使用接收的信息,基于與可以在廣播節(jié)目列表上使用的用戶語音有關(guān)的信息來輸出語音命令向?qū)А?/p>
圖3是圖2的顯示裝置的詳細(xì)框圖。參照?qǐng)D3,除了圖2中所示的組件以外,顯示裝置100可以另外包括存儲(chǔ)設(shè)備160、接收機(jī)170、信號(hào)處理器180、遙控信號(hào)接收機(jī)191、輸入端193和接口195??梢酝ㄟ^控制器150來控制組件。同時(shí),為了簡(jiǎn)潔起見,下面將不過多地解釋圖2與圖3之間重疊的組件。
存儲(chǔ)設(shè)備160可以實(shí)現(xiàn)為存儲(chǔ)對(duì)于顯示裝置100的操作必需的程序等的存儲(chǔ)介質(zhì),例如,存儲(chǔ)器、硬盤驅(qū)動(dòng)器(hdd)等。例如,存儲(chǔ)設(shè)備160可以包括存儲(chǔ)用于執(zhí)行控制器150的操作的程序的rom和用于臨時(shí)存儲(chǔ)根據(jù)控制器操作的數(shù)據(jù)的ram。存儲(chǔ)設(shè)備160可以另外包括用于存儲(chǔ)各種參考數(shù)據(jù)的電可擦除可編程rom(eeprom)。
存儲(chǔ)設(shè)備160可以存儲(chǔ)與在顯示裝置100的當(dāng)前情形中可應(yīng)用的用戶語音有關(guān)的信息。因此,控制器150可以確定與在顯示裝置100的當(dāng)前情形中可應(yīng)用的用戶語音有關(guān)的信息并且控制顯示裝置100使得以列表形式輸出確定的用戶語音。
接收機(jī)170接收各種內(nèi)容。更具體地,接收機(jī)170可以從web服務(wù)器接收內(nèi)容,其中,web服務(wù)器使用經(jīng)由廣播網(wǎng)絡(luò)發(fā)送廣播節(jié)目的廣播站或者經(jīng)由互聯(lián)網(wǎng)發(fā)送內(nèi)容文件的web服務(wù)器來發(fā)送內(nèi)容文件。
在從廣播站接收內(nèi)容的一個(gè)示例性實(shí)施例中,接收機(jī)170可以實(shí)現(xiàn)為包括調(diào)諧器(未示出)、解碼器(未示出)或均衡器(未示出)的形式。在從諸如web服務(wù)器等的源接收內(nèi)容的另一個(gè)示例性實(shí)施例中,接收機(jī)170可以實(shí)現(xiàn)為網(wǎng)絡(luò)接口卡(未示出)。
信號(hào)處理器180可以對(duì)內(nèi)容執(zhí)行信號(hào)處理,使得經(jīng)由接收機(jī)170或接口195接收的內(nèi)容經(jīng)由輸出端110被輸出。
更具體地,信號(hào)處理器180可以通過執(zhí)行諸如解碼、縮放或幀率轉(zhuǎn)換等操作將內(nèi)容中包含的圖像轉(zhuǎn)換為可以在顯示器111處輸出的形式。此外,信號(hào)處理器180可以通過執(zhí)行諸如解碼等信號(hào)處理將內(nèi)容中包含的音頻信號(hào)轉(zhuǎn)換為可以在音頻輸出端112輸出的形式。
遙控信號(hào)接收機(jī)191接收從外部遙控器輸入的控制信號(hào)??刂破?50可以基于輸入到遙控信號(hào)接收機(jī)191的控制信號(hào)來執(zhí)行各種操作。例如,控制器150可以響應(yīng)于在遙控信號(hào)接收機(jī)191處輸入的控制信號(hào)來執(zhí)行包括開機(jī)/關(guān)機(jī)、頻道改變、音量調(diào)整等的操作。
輸入端193接收各種用戶命令??刂破?50可以執(zhí)行與輸入到輸入端193的用戶命令相對(duì)應(yīng)的操作。例如,控制器150可以響應(yīng)于輸入到輸入端193的用戶命令來執(zhí)行開機(jī)/關(guān)機(jī)、頻道改變或音量調(diào)整。
為此目的,輸入端193可以實(shí)現(xiàn)為輸入面板。輸入面板可以是觸控板、或者包括各種功能鍵、數(shù)字鍵、特殊鍵或字母鍵等的小鍵盤、或者觸摸屏。
接口195與外部設(shè)備(未示出)進(jìn)行通信。外部設(shè)備(未示出)可以實(shí)現(xiàn)為可以向顯示裝置100發(fā)送內(nèi)容的各種類型的電子設(shè)備。
例如,當(dāng)顯示裝置100實(shí)現(xiàn)為tv時(shí),外部設(shè)備(未示出)可以實(shí)現(xiàn)為各種形式的電子設(shè)備,所述各種形式的電子設(shè)備連接到顯示裝置100并且可以執(zhí)行諸如機(jī)頂盒、音頻設(shè)備或游戲機(jī)等的功能。
例如,接口195可以根據(jù)各種類型的有線通信方法(例如,hdmi或usb)或者無線通信方法(例如,藍(lán)牙或zigbee)來與外部設(shè)備(未示出)進(jìn)行通信。為此目的,接口195可以包括與每一個(gè)通信方法相對(duì)應(yīng)的芯片或輸入端口。例如,為了基于hdmi通信方法與外部設(shè)備(未示出)進(jìn)行通信,接口195可以包括hdmi端口。
圖4是圖1中所示的第一服務(wù)器的框圖。參照?qǐng)D4,第一服務(wù)器200可以包括通信器210和控制器220。
通信器210可以與顯示裝置100進(jìn)行通信。也即是說,通信器210從顯示裝置100接收用戶語音,并且向顯示裝置100發(fā)送與用戶的語音相對(duì)應(yīng)的文本信息。為此目的,通信器210可以包括各種通信模塊。
控制器220控制第一服務(wù)器200的整體操作。具體地,當(dāng)從顯示裝置100接收到用戶語音時(shí),控制器220產(chǎn)生與用戶語音相對(duì)應(yīng)的文本信息,并且控制第一服務(wù)器200使得向顯示裝置100發(fā)送產(chǎn)生的信息。
更具體地,控制器220可以使用語音到文本(stt)引擎來產(chǎn)生與用戶語音相對(duì)應(yīng)的文本信息。stt引擎是將語音信號(hào)(即,音頻信號(hào))轉(zhuǎn)換為文本的模塊??梢允褂酶鞣N已知的stt算法將語音信號(hào)轉(zhuǎn)換為文本。
例如,控制器220通過在接收的用戶語音中檢測(cè)由用戶發(fā)出的語音的起始和結(jié)束,來確定語音間隔。更具體地,控制器220計(jì)算接收的語音信號(hào)的能量,根據(jù)計(jì)算的能量對(duì)語音信號(hào)的能量水平進(jìn)行分類,并且基于動(dòng)態(tài)規(guī)劃來檢測(cè)語音間隔??刂破?20可以基于聲學(xué)模型在檢測(cè)的語音間隔中檢測(cè)音素(即,最小語音單元),并且通過向產(chǎn)生的音素?cái)?shù)據(jù)應(yīng)用隱馬爾可夫模型(hmm)來將用戶語音轉(zhuǎn)換為文本。
圖5是圖1的第二服務(wù)器的框圖。參照?qǐng)D5,第二服務(wù)器300可以包括通信器310、存儲(chǔ)設(shè)備320和控制器330。
通信器310與顯示裝置100進(jìn)行通信。更具體地,通信器310可以從顯示裝置100接收文本信息,并且向顯示裝置100發(fā)送與文本信息相對(duì)應(yīng)的響應(yīng)信息。為此目的,通信器310可以包括各種通信模塊。
此外,通信器310可以連接到web服務(wù)器(未示出)并且執(zhí)行web瀏覽。也即是說,控制器330可以經(jīng)由通信器310向web服務(wù)器(未示出)發(fā)送各種關(guān)鍵詞以執(zhí)行web瀏覽,并且接收與關(guān)鍵詞相對(duì)應(yīng)的web搜索結(jié)果。
存儲(chǔ)設(shè)備320存儲(chǔ)用于產(chǎn)生與從顯示裝置100接收的文本信息相對(duì)應(yīng)的響應(yīng)信息的各種信息。
也即是說,存儲(chǔ)設(shè)備320可以存儲(chǔ)針對(duì)每一個(gè)服務(wù)域的交互模式??梢愿鶕?jù)用戶發(fā)出的語音的話題將服務(wù)域分類為“廣播”、“vod”、“應(yīng)用管理”、“設(shè)備控制”、“信息提供(天氣、股票交易、新聞等)”等,但是不限于此。因此,可以根據(jù)各種其它話題來對(duì)服務(wù)域進(jìn)行分類。
更具體地,存儲(chǔ)設(shè)備320可以包括針對(duì)每一個(gè)服務(wù)域的語料數(shù)據(jù)庫(kù)。語料數(shù)據(jù)庫(kù)可以采用存儲(chǔ)例句和針對(duì)例句的響應(yīng)的形式。
也即是說,存儲(chǔ)設(shè)備320可以針對(duì)服務(wù)域中的每一個(gè)存儲(chǔ)多個(gè)例句和針對(duì)這些例句的響應(yīng)。存儲(chǔ)設(shè)備320可以通過標(biāo)記(tag)來存儲(chǔ)用于解釋例句的信息和針對(duì)相應(yīng)例句的響應(yīng)。
例如,假設(shè)例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”存儲(chǔ)在廣播服務(wù)域中。
在上述示例中,存儲(chǔ)設(shè)備320可以通過標(biāo)記來存儲(chǔ)用于解釋例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”的信息。也即是說,對(duì)于例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”,存儲(chǔ)設(shè)備320可以通過標(biāo)記來存儲(chǔ)如下信息:指示了“xxx(即,廣播節(jié)目名稱)”是廣播節(jié)目的名稱、“何時(shí)”是詢問廣播時(shí)間、以及“?”是問題。此外,存儲(chǔ)設(shè)備320可以為相應(yīng)的例句標(biāo)記和存儲(chǔ)如下信息:指示了短語“何時(shí)演~?”需要與廣播節(jié)目有關(guān)的詞來填充。與廣播節(jié)目有關(guān)的詞可以包括廣播節(jié)目的名稱、出現(xiàn)的人或制片人。
此外,存儲(chǔ)設(shè)備320可以標(biāo)記針對(duì)例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”的響應(yīng)并且存儲(chǔ)該響應(yīng)。更具體地,存儲(chǔ)設(shè)備320可以標(biāo)記“你詢問的<廣播節(jié)目名稱>在<廣播時(shí)間>廣播”并且存儲(chǔ)“你詢問的<廣播節(jié)目名稱>在<廣播時(shí)間>廣播”,作為針對(duì)例句“何時(shí)演xxx(即,廣播節(jié)目名稱)”的響應(yīng)。
在另一個(gè)示例性實(shí)施例中,假設(shè)例句“今天tv演什么?”存儲(chǔ)在廣播服務(wù)域中。
在上述示例中,存儲(chǔ)設(shè)備320可以為例句標(biāo)記用于解釋例句“今天tv演什么”的信息,并且存儲(chǔ)該信息。更具體地,存儲(chǔ)設(shè)備320可以為相應(yīng)的例句標(biāo)記和存儲(chǔ)如下信息:“tv演”是指廣播節(jié)目,“今天”、“tv演”或“什么”指示了詢問安排在今天廣播的廣播節(jié)目,并且“?”指示了例句是問題。此外,存儲(chǔ)設(shè)備320可以標(biāo)記和存儲(chǔ)如下信息:與廣播時(shí)間(例如,現(xiàn)在、明天等)有關(guān)的詞可以填充具有“tv~演什么?”模式的例句。
在另一個(gè)示例性實(shí)施例中,假設(shè)例句“改變到#x(即,頻道號(hào))”存儲(chǔ)在設(shè)備控制服務(wù)域中。
在上述示例中,存儲(chǔ)設(shè)備可以標(biāo)記和存儲(chǔ)用于解釋諸如“請(qǐng)改變到#x(即,頻道號(hào))”等的例句的信息。更具體地,在例句“請(qǐng)改變到#x(即,頻道號(hào))”中,存儲(chǔ)設(shè)備320可以為相應(yīng)例句標(biāo)記和存儲(chǔ)指示了如下信息:“#x(即,頻道號(hào))”是指頻道號(hào),“改變”指示用于調(diào)到頻道的命令,以及“請(qǐng)”指示例句是請(qǐng)求句。此外,存儲(chǔ)設(shè)備320可以在相應(yīng)例句中標(biāo)記和存儲(chǔ)指示了與廣播節(jié)目有關(guān)的詞可以填充具有“請(qǐng)改變?yōu)椤蹦J降睦涞男畔ⅰEc廣播節(jié)目有關(guān)的詞可以包括頻道號(hào)、頻道名稱、廣播節(jié)目名稱、出現(xiàn)的人、或制片人。
存儲(chǔ)設(shè)備320還可以標(biāo)記和存儲(chǔ)針對(duì)句子“請(qǐng)改變到#x(即,頻道號(hào))”的響應(yīng)。更具體地,存儲(chǔ)設(shè)備320可以標(biāo)記和存儲(chǔ)針對(duì)句子“請(qǐng)改變到#x(即,頻道號(hào))”的響應(yīng)“頻道改變到<頻道號(hào)>”。
在另一個(gè)示例性實(shí)施例中,假設(shè)例句“請(qǐng)執(zhí)行xx(即,應(yīng)用名稱)”存儲(chǔ)在設(shè)備控制服務(wù)域中。
在上述示例中,存儲(chǔ)設(shè)備320可以為例句標(biāo)記和存儲(chǔ)用于解釋例句“請(qǐng)執(zhí)行xx(即,應(yīng)用名稱)”的信息。更具體地,在例句“執(zhí)行xx(即,應(yīng)用名稱)”中,存儲(chǔ)設(shè)備320可以標(biāo)記和存儲(chǔ)指示了“xx(即,應(yīng)用名稱)”是指應(yīng)用的名稱、“執(zhí)行”是指用于執(zhí)行應(yīng)用的命令、并且“請(qǐng)”指示例句是請(qǐng)求句的信息。
此外,存儲(chǔ)設(shè)備320可以為例句標(biāo)記和存儲(chǔ)指示了與在顯示裝置100上可執(zhí)行的功能有關(guān)的詞可以填充具有“請(qǐng)執(zhí)行~”模式的例句的信息。與在顯示裝置100上可執(zhí)行的功能有關(guān)的詞可以包括例如應(yīng)用的名稱、諸如電話呼叫等在顯示裝置100上可執(zhí)行的功能的名稱。
在另一個(gè)示例性實(shí)施例中,假設(shè)例句“查看更多”被存儲(chǔ)在設(shè)備控制服務(wù)域中。
在上述示例性實(shí)施例中,存儲(chǔ)設(shè)備320可以為例句標(biāo)記和存儲(chǔ)用于解釋例句“查看更多”的信息。也即是說,存儲(chǔ)設(shè)備320可以為諸如“查看更多”等例句標(biāo)記和存儲(chǔ)指示了如下的信息:例句包括請(qǐng)求與在顯示裝置100上可使用的語音有關(guān)的信息的話語意圖。
存儲(chǔ)設(shè)備320還可以標(biāo)記和存儲(chǔ)用于使用相應(yīng)的例句來控制顯示裝置100的控制命令。具體地,存儲(chǔ)設(shè)備320可以為與用于控制顯示裝置100的用戶語音相對(duì)應(yīng)的例句標(biāo)記和存儲(chǔ)用于控制顯示裝置100的控制命令。
在上文所解釋的示例性實(shí)施例中,存儲(chǔ)設(shè)備320可以為諸如“請(qǐng)改變到#x(即,頻道號(hào))”等例句標(biāo)記和存儲(chǔ)用于將顯示裝置100的頻道改變到頻道#x的控制命令。此外,存儲(chǔ)設(shè)備320可以為諸如“查看更多”等例句標(biāo)記和存儲(chǔ)用于輸出在顯示裝置100上可使用的語音的控制命令。
同時(shí),示例性實(shí)施例不限于上文舉例說明的所存儲(chǔ)的例句和響應(yīng)。因此,可以針對(duì)每一個(gè)服務(wù)域存儲(chǔ)各種其它例句和相應(yīng)響應(yīng)。
控制器330控制第二服務(wù)器300的整體操作。更具體地,當(dāng)從顯示裝置100接收到與用戶語音相對(duì)應(yīng)的文本信息時(shí),控制器330產(chǎn)生與接收的文本信息相對(duì)應(yīng)的響應(yīng)信息,并且控制通信器310使得經(jīng)由通信器310向顯示裝置100發(fā)送產(chǎn)生的響應(yīng)信息。
控制器330可以通過分析文本信息來確定用戶語音中包含的話語意圖,產(chǎn)生與確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息,并且控制通信器310以向顯示裝置100發(fā)送該響應(yīng)信息。
為此目的,控制器330可以檢測(cè)包括與接收的文本信息相匹配的交互模式在內(nèi)的語料數(shù)據(jù)庫(kù),并且確定用戶語音所屬的服務(wù)域。
更具體地,控制器330可以將接收的文本信息與針對(duì)每一個(gè)服務(wù)域存儲(chǔ)的例樣進(jìn)行比較,并且確定包括與接收的文本信息相匹配的例句的域是用戶語音所屬的域。
例如,當(dāng)從顯示裝置100接收到諸如“何時(shí)演xxx(即,廣播節(jié)目名稱)?”或者“今天tv演什么?”等文本時(shí),控制器330可以確定在顯示裝置100處收集的用戶語音屬于廣播服務(wù)域。當(dāng)從顯示裝置100接收到諸如“請(qǐng)改變到#x(即,頻道號(hào))”或“請(qǐng)執(zhí)行xx(即,應(yīng)用名稱)”等的文本時(shí),控制器330可以確定在顯示裝置100處收集的用戶語音屬于設(shè)備控制服務(wù)域。
當(dāng)未找到與接收的文本信息相匹配的例句時(shí),控制器330可以基于統(tǒng)計(jì)來確定用戶語音所屬的域。
舉例說明,假設(shè)顯示裝置100收集“請(qǐng)問我可以改變到#x(即,頻道號(hào))嗎”,并且向第二服務(wù)器300發(fā)送與收集的用戶語音相對(duì)應(yīng)的文本。在上述示例中,控制器330可以使用諸如隱馬爾可夫模型(hmm)、條件隨機(jī)場(chǎng)(crf)或支持向量機(jī)(svm)等分類模型確定用戶語音在統(tǒng)計(jì)上類似于“請(qǐng)改變到#x(即,頻道號(hào))”,并且確定“請(qǐng)問我可以改變到#x(即,頻道號(hào))嗎”屬于設(shè)備控制服務(wù)域。
存儲(chǔ)設(shè)備320還可以存儲(chǔ)被確定為在統(tǒng)計(jì)上類似于預(yù)先存儲(chǔ)的例句的文本信息。在一個(gè)示例性實(shí)施例中,存儲(chǔ)設(shè)備320可以將文本信息作為在統(tǒng)計(jì)上類似的例句所屬的服務(wù)域的另一例句進(jìn)行存儲(chǔ)。此外,通過參照預(yù)先存儲(chǔ)的例句,存儲(chǔ)設(shè)備320可以為相應(yīng)的新存儲(chǔ)的例句標(biāo)記和存儲(chǔ)用于解釋新存儲(chǔ)的例句的信息。
例如,假設(shè)將“請(qǐng)問我可以改變到#x(即,頻道號(hào))嗎”作為新的例句進(jìn)行存儲(chǔ)。
在上述示例中,存儲(chǔ)設(shè)備320可以通過參考“請(qǐng)改變到#x(即,頻道號(hào))”,為相應(yīng)例句標(biāo)記和存儲(chǔ)用于解釋諸如“請(qǐng)問我可以改變到#x(即,頻道號(hào))嗎?”等的例句的信息。也即是說,存儲(chǔ)設(shè)備320可以為相應(yīng)例句“請(qǐng)問我可以改變到#x(即,頻道號(hào))嗎”標(biāo)記和存儲(chǔ)指示了如下的信息:“#x(即,頻道號(hào))”是指頻道的號(hào)、“改變”是指用于調(diào)到頻道的命令、并且“請(qǐng)問我可以~嗎”指示例句是請(qǐng)求句。此外,存儲(chǔ)設(shè)備320可以為相應(yīng)例句標(biāo)記和存儲(chǔ)指示了如下的信息:與廣播節(jié)目有關(guān)的詞可以填充具有“請(qǐng)問我可以改變到~嗎”的模式的例句。與廣播節(jié)目有關(guān)的詞可以包括頻道號(hào)、廣播站名稱、廣播節(jié)目名稱、出現(xiàn)的人或制片人。
此外,存儲(chǔ)設(shè)備320可以為相應(yīng)句子標(biāo)記和存儲(chǔ)針對(duì)“請(qǐng)問我可以改變到#x(即,頻道號(hào))嗎”的響應(yīng)。更具體地,存儲(chǔ)設(shè)備320可以標(biāo)記和存儲(chǔ)“頻道改變到<頻道號(hào)>”作為針對(duì)“請(qǐng)問我可以改變到#x(即,頻道號(hào))嗎”的響應(yīng)。
同時(shí),當(dāng)存在與從顯示裝置100接收的文本信息相匹配的多個(gè)例句時(shí)并且當(dāng)多個(gè)例句屬于不同的服務(wù)域時(shí),控制器330可以基于統(tǒng)計(jì)分析來確定用戶語音的相應(yīng)服務(wù)域。
也即是說,控制器330可以基于詞(或詞素)在相應(yīng)服務(wù)域中出現(xiàn)的頻率,對(duì)構(gòu)成從顯示裝置100接收的文本信息的相應(yīng)詞(或詞素)進(jìn)行加權(quán),并且通過考慮應(yīng)用的權(quán)重來確定與用戶語音相對(duì)應(yīng)的服務(wù)域。
例如,假設(shè)分別在例句“請(qǐng)改變?yōu)閤xx(即,廣播節(jié)目名稱)”被存儲(chǔ)在廣播服務(wù)域和vod服務(wù)域中的狀態(tài)下,從顯示裝置100接收到文本“請(qǐng)改變?yōu)閤xx(即,廣播節(jié)目名稱)”。
在上述示例中,控制器330可以確定在廣播服務(wù)域和vod服務(wù)域中存在與“請(qǐng)改變?yōu)閤xx(即,廣播節(jié)目名稱)”相匹配的例句,并且基于“改變”和“請(qǐng)”出現(xiàn)在相應(yīng)的服務(wù)域中的頻率,針對(duì)相應(yīng)服務(wù)域?qū)?gòu)成了“請(qǐng)改變?yōu)閤xx(即,廣播節(jié)目名稱)”的詞(或詞素)加權(quán),即,對(duì)“改變”和“請(qǐng)”加權(quán)。
例如,控制器330可以基于包括“改變”的句子在廣播服務(wù)域中存儲(chǔ)的所有例句中的比率來計(jì)算“改變”在廣播服務(wù)域中的權(quán)重,并且基于包括“請(qǐng)”的例句在廣播服務(wù)域中存儲(chǔ)的所有例句中的比率來計(jì)算“請(qǐng)”在廣播服務(wù)域中的權(quán)重。
以上文解釋的類似方式,控制器330可以基于包括“改變”的句子在vod服務(wù)域中存儲(chǔ)的所有例句中的比率來計(jì)算“改變”在vod服務(wù)域中的權(quán)重,并且基于包括“請(qǐng)”的例句在vod服務(wù)域中存儲(chǔ)的所有例句中的比率來計(jì)算“請(qǐng)”在vod服務(wù)域中的權(quán)重。
此后,控制器330可以通過計(jì)算應(yīng)用于相應(yīng)詞的權(quán)重來確定用戶語音所屬的服務(wù)域。因此,在上文所解釋的示例中,控制器330可以將在廣播服務(wù)域中應(yīng)用于“改變”的權(quán)重與應(yīng)用于“請(qǐng)”的權(quán)重相乘的乘積與在vod服務(wù)域中應(yīng)用于“改變”的權(quán)重與應(yīng)用于“請(qǐng)”的權(quán)重相乘的乘積進(jìn)行比較,并且確定用戶語音屬于具有更大結(jié)果的服務(wù)域。
也即是說,當(dāng)基于在廣播服務(wù)域中應(yīng)用的權(quán)重的計(jì)算結(jié)果大于基于在vod服務(wù)域中應(yīng)用的權(quán)重的計(jì)算結(jié)果時(shí),控制器330可以確定“請(qǐng)改變?yōu)閤xx(即,廣播節(jié)目名稱)”屬于廣播服務(wù)域。相反,當(dāng)基于在vod服務(wù)域中應(yīng)用的權(quán)重的計(jì)算結(jié)果大于基于在廣播服務(wù)域中應(yīng)用的權(quán)重的計(jì)算結(jié)果時(shí),控制器330可以確定“請(qǐng)改變?yōu)閤xx(即,廣播節(jié)目名稱)”屬于vod服務(wù)域。
然而,本領(lǐng)域普通技術(shù)人員將理解的是,上文僅是為了說明的目的而提供的。因此,控制器330可以根據(jù)各種方法在統(tǒng)計(jì)上確定用戶語音所屬的服務(wù)域。
此后,控制器330基于用戶語音所屬的服務(wù)域從用戶語音中提取對(duì)話動(dòng)作、主動(dòng)作和組成空位(componentslot)(或?qū)嶓w名稱)。
“對(duì)話動(dòng)作”是與句子形式有關(guān)的類別,其指示相應(yīng)句子是陳述、請(qǐng)求還是問題。
“主動(dòng)作”是指表示在具體域中對(duì)話的相應(yīng)話語所指的動(dòng)作的有意義信息。例如,在廣播服務(wù)域中,主動(dòng)作可以包括tv開機(jī)/關(guān)機(jī)、廣播節(jié)目搜索、廣播節(jié)目時(shí)間搜索或廣播節(jié)目預(yù)留。在另一示例中,在設(shè)備控制服務(wù)域中,主動(dòng)作可以包括設(shè)備開機(jī)/關(guān)機(jī)、播放或暫停。
“組成空位”是指在話語中出現(xiàn)的具體域的實(shí)體信息,即,是指定具體域所指的動(dòng)作的意義的附加信息。例如,廣播服務(wù)域中的組成空位可以包括流派、廣播節(jié)目名稱、廣播時(shí)間、頻道名稱或男演員/或女演員名字,并且在設(shè)備控制服務(wù)域中可以包括外部設(shè)備的名稱、制造商等。
控制器330可以使用提取的對(duì)話動(dòng)作、主動(dòng)作和組成空位來確定用戶語音中包含的話語的意圖,并且產(chǎn)生與確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息并向顯示裝置100發(fā)送響應(yīng)信息。
響應(yīng)信息可以包括用于從顯示裝置100輸出系統(tǒng)響應(yīng)的系統(tǒng)響應(yīng)信息。為此目的,控制器330可以從存儲(chǔ)設(shè)備320中提取對(duì)確定的話語意圖的答復(fù),并且將提取的答復(fù)轉(zhuǎn)換為文本從而產(chǎn)生系統(tǒng)響應(yīng)信息。此外,控制器330可以搜索與確定的話語意圖相對(duì)應(yīng)的信息,并且使用搜索的信息來產(chǎn)生系統(tǒng)響應(yīng)信息。
此外,響應(yīng)信息可以包括用于執(zhí)行與用戶語音相對(duì)應(yīng)的功能的控制命令??刂泼羁梢园ㄓ糜诳刂骑@示裝置100執(zhí)行與用戶語音相對(duì)應(yīng)的功能的控制命令。為此目的,控制器330可以產(chǎn)生與確定的話語意圖相對(duì)應(yīng)的控制命令,并且控制通信器310使得向顯示裝置100發(fā)送產(chǎn)生的控制命令。
在下文中,將參照示例性實(shí)施例詳細(xì)地解釋控制器330用于產(chǎn)生與用戶語音相對(duì)應(yīng)的響應(yīng)信息的方法。
首先,控制器330可以使用為與用戶語音相匹配或者在統(tǒng)計(jì)上被確定為與用戶語音相類似的例句所標(biāo)記的信息,來從用戶語音中提取對(duì)話動(dòng)作、主動(dòng)作和組成空位,產(chǎn)生與用戶語音相對(duì)應(yīng)的響應(yīng)信息,并且向顯示裝置100發(fā)送響應(yīng)信息。
例如,假設(shè)從顯示裝置100接收到文本“何時(shí)演xxx(即,廣播節(jié)目名稱)?”。
在上述示例中,控制器330可以確定接收的文本屬于廣播服務(wù)域,使用為在廣播服務(wù)域中與接收的文本相匹配的例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”標(biāo)記的信息從用戶語音中提取對(duì)話動(dòng)作、主動(dòng)作和組成空位,并且產(chǎn)生相應(yīng)的響應(yīng)信息。
也即是說,使用用于解釋例句的信息(包括指示了“xxx(即,廣播節(jié)目名稱)”是指廣播節(jié)目、“何時(shí)”是指請(qǐng)求廣播時(shí)間、并且“?”是指例句是問題的信息)來標(biāo)記在廣播服務(wù)域中存儲(chǔ)的例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”。因此,控制器330可以基于上述信息確定例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”的對(duì)話動(dòng)作是問題、主動(dòng)作是詢問廣播時(shí)間、并且組成空位是xxx(即,廣播節(jié)目名稱)。因此,控制器330可以確定用戶語音中包含的話語意圖是“詢問”“xxx”的“廣播時(shí)間”。
此外,控制器330可以搜索存儲(chǔ)設(shè)備320以得到為存儲(chǔ)在廣播服務(wù)域中的例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”所標(biāo)記的響應(yīng),并且使用標(biāo)記的響應(yīng)產(chǎn)生系統(tǒng)響應(yīng)信息。
也即是說,控制器330可以搜索與用戶語音相對(duì)應(yīng)的響應(yīng),“你詢問的<廣播節(jié)目名稱>的廣播時(shí)間是<廣播時(shí)間>”,其是為存儲(chǔ)在廣播服務(wù)域中的例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”而標(biāo)記的。
在上述示例中,控制器330可以填充搜索的響應(yīng)中出現(xiàn)的空白,并且產(chǎn)生完整句。
例如,在響應(yīng)“你詢問的<廣播節(jié)目名稱>的廣播時(shí)間是<廣播時(shí)間>”中,控制器330可以在空白<廣播節(jié)目名稱>中寫入“xxx(即,廣播節(jié)目名稱)”。控制器330還可以基于“xxx(即,廣播節(jié)目名稱)”的電子節(jié)目指南(epg)來搜索“xxx(即,廣播節(jié)目名稱)”的廣播時(shí)間,并且在另一空白中寫入<廣播時(shí)間>。因此,控制器330可以產(chǎn)生完整句“你詢問的xxx(即,廣播節(jié)目名稱)的廣播時(shí)間是周六7點(diǎn)鐘”作為系統(tǒng)響應(yīng)信息,并且向顯示裝置100發(fā)送產(chǎn)生的系統(tǒng)響應(yīng)信息。
因此,顯示裝置100可以基于從第二服務(wù)器300接收的系統(tǒng)響應(yīng)信息,以語音和ui屏幕中的至少一個(gè)的形式輸出“你詢問的xxx(即,廣播節(jié)目名稱)的廣播時(shí)間是周六7點(diǎn)鐘”。
在另一個(gè)示例性實(shí)施例中,假設(shè)從顯示裝置100接收到文本“今天tv演什么?”。
在上述示例中,控制器330可以確定接收的文本屬于廣播服務(wù)域,使用為廣播服務(wù)域中與接收的文本相匹配的例句“今天tv演什么?”所標(biāo)記的信息,從用戶語音中提取對(duì)話動(dòng)作、主動(dòng)作和組成空位,并且產(chǎn)生相應(yīng)的響應(yīng)信息。
也即是說,使用用于解釋例句的信息(包括指示了“今天”、“tv演”、和“什么”是詢問安排在今天廣播的廣播節(jié)目并且“?”指示例句是問題的信息)來標(biāo)記存儲(chǔ)在廣播服務(wù)域中的例句“今天tv演什么?”。因此,控制器330可以基于上述信息來確定例句“今天tv演什么?”的對(duì)話動(dòng)作是問題、主動(dòng)作是詢問安排在今天廣播的廣播節(jié)目、并且組成空位是廣播節(jié)目。因此,控制器330可以確定用戶語音中包含的話語意圖是“詢問”“今天”要廣播的“廣播節(jié)目”。
在一個(gè)示例性實(shí)施例中,控制器330可以參考epg來搜索今天的廣播節(jié)目,并且控制通信器310以向顯示裝置100發(fā)送與搜索的廣播節(jié)目有關(guān)的信息,其可以包括以下各項(xiàng)中的至少一項(xiàng):內(nèi)容名稱、流派、廣播時(shí)間、演員表、相應(yīng)的縮略圖、廣播內(nèi)容的頻道名稱或制作人員。
控制器330還可以控制通信器310向顯示裝置100發(fā)送與確定的話語意圖有關(guān)的信息。也即是說,當(dāng)確定用戶的話語意圖涉及詢問與安排在今天廣播的廣播節(jié)目有關(guān)的信息時(shí),控制器330可以向顯示裝置100發(fā)送用于輸出今天的廣播節(jié)目列表的控制命令。
此外,控制器330可以控制通信器310使得與搜索的廣播節(jié)目有關(guān)的信息和與確定的話語意圖有關(guān)的信息一起被發(fā)送到顯示裝置100。
因此,顯示裝置100可以基于從第二服務(wù)器300接收的信息來以語音和ui屏幕中的至少一個(gè)的形式輸出今天的廣播節(jié)目列表。
在另一個(gè)示例性實(shí)施例中,假設(shè)從顯示裝置100接收到文本“請(qǐng)改變到#x(即,頻道號(hào))”。
在上述示例中,控制器330可以確定接收的文本屬于設(shè)備控制服務(wù)域,使用為設(shè)備控制服務(wù)域中與接收的文本相匹配的例句“請(qǐng)改變到#x(即,頻道號(hào))”所標(biāo)記的信息,從用戶語音中提取對(duì)話動(dòng)作、主動(dòng)作和組成空位,并且產(chǎn)生相應(yīng)的響應(yīng)信息。
也即是說,使用用于解釋例句的信息(包括指示了“#x(即,頻道號(hào))”是指頻道號(hào)、“改變”是指用于調(diào)到廣播的命令、并且“請(qǐng)”是指例句是請(qǐng)求的信息)來標(biāo)記設(shè)備控制服務(wù)域中存儲(chǔ)的例句“請(qǐng)改變到#x(即,頻道號(hào))”。因此,控制器330可以基于上述信息來確定例句“請(qǐng)改變到#x(即,頻道號(hào))”的對(duì)話動(dòng)作是請(qǐng)求、主動(dòng)作是用于調(diào)到廣播的命令、并且組成空位是#x(即,頻道號(hào))。因此,控制器330可以確定用戶語音中包含的話語意圖是“請(qǐng)求”“廣播調(diào)”到“#x”。
此外,控制器330可以搜索存儲(chǔ)設(shè)備320以得到為廣播服務(wù)域中存儲(chǔ)的例句“請(qǐng)改變到#x(即,頻道號(hào))”所標(biāo)記的響應(yīng),并且使用標(biāo)記的響應(yīng)產(chǎn)生響應(yīng)信息。
也即是說,控制器330可以搜索存儲(chǔ)在廣播服務(wù)域中的標(biāo)記的響應(yīng)“頻道改變到<頻道號(hào)>”作為與用戶語音“請(qǐng)改變到#x(即,頻道號(hào))”相對(duì)應(yīng)的響應(yīng)。
在上述示例中,控制器330可以填充出現(xiàn)在搜索的響應(yīng)中的空白以產(chǎn)生完整句。
例如,控制器330可以在諸如“改變到<頻道號(hào)>”等的響應(yīng)中出現(xiàn)的空白<頻道號(hào)>中寫入“#x(即,頻道號(hào))”。因此,控制器330可以產(chǎn)生完整句形式“頻道改變到#x”作為與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)信息,并且向顯示裝置100發(fā)送產(chǎn)生的系統(tǒng)響應(yīng)信息。
此外,控制器可以搜索存儲(chǔ)設(shè)備320以得到為存儲(chǔ)在設(shè)備控制服務(wù)域中的例句“請(qǐng)改變到#x(即,頻道號(hào))”所標(biāo)記的控制命令,并且控制通信器310使得向顯示裝置100發(fā)送標(biāo)記的控制命令。也即是說,控制器330可以向顯示裝置100發(fā)送與存儲(chǔ)在設(shè)備控制服務(wù)域中的例句“請(qǐng)改變到#x(即,頻道號(hào))”相對(duì)應(yīng)的用于將顯示裝置100的頻道改變到#x的所標(biāo)記的控制命令。
因此,顯示裝置100可以基于從第二服務(wù)器300接收的控制命令來將頻道改變到#x,并且基于從第二服務(wù)器300接收的系統(tǒng)響應(yīng)信息以語音和ui屏幕中的至少一個(gè)的形式輸出“頻道改變到#x”。
同時(shí),控制器330可以基于為例句標(biāo)記的控制命令來產(chǎn)生用于執(zhí)行顯示裝置100的功能的控制命令,但是不限于此。
也即是說,控制器330可以基于確定的話語意圖要來產(chǎn)生控制命令,并且向顯示裝置100發(fā)送控制命令。例如,當(dāng)確定用戶的話語意圖是請(qǐng)求廣播調(diào)到#x時(shí),控制器330可以產(chǎn)生用于將頻道改變到#x的控制命令并且向顯示裝置100發(fā)送控制命令。
此外,控制器330可以發(fā)送用于執(zhí)行顯示裝置100的功能的控制命令以及用于輸出系統(tǒng)響應(yīng)的系統(tǒng)響應(yīng)信息,但是不限于此。因此,控制器330可以根據(jù)用戶的話語意圖向顯示裝置100僅發(fā)送用于執(zhí)行顯示裝置100的功能的控制命令。
在上述示例性實(shí)施例中,顯示裝置100可以不輸出單獨(dú)的系統(tǒng)響應(yīng),或者可以使用顯示裝置100中預(yù)先存儲(chǔ)的數(shù)據(jù)來輸出系統(tǒng)響應(yīng)。
在另一個(gè)示例性實(shí)施例中,假設(shè)從顯示裝置100接收到文本“請(qǐng)執(zhí)行xx(即,應(yīng)用名稱)”。
在上述示例中,控制器330可以確定接收的文本屬于設(shè)備控制服務(wù)域,使用為設(shè)備控制服務(wù)域中的與接收的文本相匹配的例句“請(qǐng)執(zhí)行xx(即,應(yīng)用名稱)”所標(biāo)記的信息,來從用戶語音中提取對(duì)話動(dòng)作、主動(dòng)作和組成空位,并且產(chǎn)生相應(yīng)的響應(yīng)信息。
也即是說,使用用于解釋例句的信息(包括指示了“xx(即,應(yīng)用名稱)”是指應(yīng)用的名稱、“執(zhí)行”是指用于執(zhí)行應(yīng)用的命令、并且“請(qǐng)”指示例句是請(qǐng)求的信息)來標(biāo)記設(shè)備控制服務(wù)域中存儲(chǔ)的例句“請(qǐng)執(zhí)行xx(即,應(yīng)用名稱)”。因此,控制器330可以基于上述信息來確定例句“請(qǐng)執(zhí)行xx(即,應(yīng)用名稱)”的對(duì)話動(dòng)作是請(qǐng)求、主動(dòng)作是用于執(zhí)行應(yīng)用的命令、并且組成空位是xx(即,應(yīng)用名稱)。因此,控制器330可以確定用戶語音中包含的話語意圖是“請(qǐng)求”與“xx(即,應(yīng)用名稱)”有關(guān)的“應(yīng)用執(zhí)行”。
在一個(gè)示例性實(shí)施例中,控制器可以搜索存儲(chǔ)設(shè)備320以得到為存儲(chǔ)在設(shè)備控制服務(wù)域中的例句“請(qǐng)執(zhí)行xx(即,應(yīng)用名稱)”所標(biāo)記的控制命令,并且控制通信器310使得向顯示裝置100發(fā)送標(biāo)記的控制命令。也即是說,控制器330可以向顯示裝置100發(fā)送與存儲(chǔ)在設(shè)備控制服務(wù)域中的例句“請(qǐng)執(zhí)行xx(即,應(yīng)用名稱)”相對(duì)應(yīng)的用于執(zhí)行顯示裝置100上的xx(即,應(yīng)用名稱)的所標(biāo)記的控制命令。
因此,顯示裝置100可以基于從第二服務(wù)器300接收的控制命令來執(zhí)行xx(即,應(yīng)用名稱)。
同時(shí),控制器330可以基于為例句標(biāo)記的控制命令來產(chǎn)生用于執(zhí)行顯示裝置100的功能的控制命令,但是不限于此。
也即是說,控制器330可以基于確定的話語意圖要來產(chǎn)生控制命令,并且向顯示裝置100發(fā)送控制命令。例如,當(dāng)確定用戶的話語意圖是請(qǐng)求執(zhí)行xx(即,應(yīng)用名稱)時(shí),控制器330可以產(chǎn)生用于執(zhí)行xx(即,應(yīng)用名稱)的控制命令并且向顯示裝置100發(fā)送控制命令。
同時(shí),控制器330可以通過使用為在統(tǒng)計(jì)上被確定為類似于用戶語音的例句所標(biāo)記的信息來從用戶語音中提取對(duì)話動(dòng)作、主動(dòng)作和組成空位,并且產(chǎn)生相應(yīng)的響應(yīng)信息。
例如,假設(shè)從顯示裝置100接收到文本“何時(shí)演yyy(即,廣播節(jié)目名稱)?”。
在上述示例中,控制器330可以確定文本“何時(shí)演yyy(即,廣播節(jié)目名稱)?”在統(tǒng)計(jì)上類似于存儲(chǔ)在廣播服務(wù)域中的例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”。因此,控制器330可以通過使用為存儲(chǔ)在廣播服務(wù)域中的例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”所標(biāo)記的信息,來從用戶語音中提取對(duì)話動(dòng)作、主動(dòng)作和組成空位,并且產(chǎn)生相應(yīng)的響應(yīng)信息。
也即是說,使用用于解釋存儲(chǔ)在廣播服務(wù)域中的例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”的信息(其指示了與廣播節(jié)目有關(guān)的詞可以填在句子模式“何時(shí)演~?”中)來標(biāo)記該例句。因此,控制器330可以在諸如廣播節(jié)目名稱、出現(xiàn)的人或制片人等與廣播節(jié)目有關(guān)的詞中搜索“yyy(即,廣播節(jié)目名稱)”的含義。
為此目的,存儲(chǔ)設(shè)備320可以包括存儲(chǔ)了與每一個(gè)服務(wù)域的組成有關(guān)的信息的實(shí)體名稱詞典或tmex詞典。
也即是說,控制器330可以參考實(shí)體名稱詞典或timex詞典來搜索“yyy(即,廣播節(jié)目名稱)”的含義并且確定“yyy(即,廣播節(jié)目名稱)”是指示廣播節(jié)目。
然而,其它實(shí)施例也是可能的。例如,控制器330可以通過使用epg等來搜索“yyy(即,廣播節(jié)目名稱)”的含義,或者通過使用預(yù)先存儲(chǔ)的例句和條件隨機(jī)場(chǎng)(crf)來搜索“yyy(即,廣播節(jié)目名稱)”的含義。
因此,控制器330可以確定從顯示裝置100接收的文本“何時(shí)演yyy(即,廣播節(jié)目名稱)?”的對(duì)話動(dòng)作是問題,主動(dòng)作是詢問廣播時(shí)間,并且組成空位是yyy(即,廣播節(jié)目名稱)。控制器330還可以確定用戶語音中包含的話語意圖是詢問“yyy”的“廣播時(shí)間”。
此外,控制器330可以通過使用為存儲(chǔ)在廣播服務(wù)域中的例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”所標(biāo)記的響應(yīng)來產(chǎn)生與“何時(shí)演yyy(即,廣播節(jié)目名稱)?”有關(guān)的系統(tǒng)響應(yīng)信息,并且向顯示裝置100發(fā)送產(chǎn)生的系統(tǒng)響應(yīng)信息。
也即是說,控制器330可以搜索與用戶語音“你詢問的<廣播節(jié)目名稱>的廣播時(shí)間是<廣播時(shí)間>”相對(duì)應(yīng)的響應(yīng),該響應(yīng)是為存儲(chǔ)在廣播服務(wù)域中的例句“何時(shí)演xxx(即,廣播節(jié)目名稱)?”所標(biāo)記的響應(yīng)??刂破?30還可以基于完整句“yyy(即,廣播節(jié)目名稱)的廣播時(shí)間是周三11點(diǎn)鐘”來產(chǎn)生與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)信息,并且向顯示裝置100發(fā)送產(chǎn)生的系統(tǒng)響應(yīng)信息。
同時(shí),當(dāng)存儲(chǔ)了從顯示裝置100輸出的系統(tǒng)響應(yīng)的句子數(shù)據(jù)中的一些時(shí),控制器330可以控制通信器310使得只可以向顯示裝置100發(fā)送特定文本以完成相應(yīng)句子。
例如,當(dāng)諸如你詢問的“<廣播節(jié)目名稱>的廣播時(shí)間是<廣播時(shí)間>”等響應(yīng)被預(yù)先存儲(chǔ)在顯示裝置100中時(shí),控制器330可以控制通信器310使得以文本的形式向顯示裝置100發(fā)送用戶詢問的廣播節(jié)目名稱及其廣播時(shí)間以完成存儲(chǔ)在顯示裝置100中的響應(yīng)。在一個(gè)示例性實(shí)施例中,控制器330可以向顯示裝置100發(fā)送用于向顯示裝置100輸出預(yù)先存儲(chǔ)的響應(yīng)的單獨(dú)控制信號(hào)。
因此,顯示裝置100可以在預(yù)先存儲(chǔ)的響應(yīng)中寫入從第二服務(wù)器300接收的文本,從而輸出系統(tǒng)響應(yīng),該系統(tǒng)響應(yīng)可以是“xxx(即,廣播節(jié)目名稱)的廣播時(shí)間是周六7點(diǎn)鐘”。
同時(shí),控制器330可以使用為例句標(biāo)記的信息來提取對(duì)話動(dòng)作、主動(dòng)作和組成空位,但是不限于此。也即是說,控制器330可以通過使用最大熵分類器(maxent)從用戶語音中提取對(duì)話動(dòng)作和主動(dòng)作,并且通過使用條件隨機(jī)場(chǎng)(crf)提取組成空位。
當(dāng)然,示例性實(shí)施例不僅限于任何特定的示例。因此,控制器330可以以很多已知的方式從用戶語音中提取對(duì)話動(dòng)作、主動(dòng)作和組成空位。
同時(shí),當(dāng)控制器330不能確定當(dāng)前接收的用戶語音中包含的用戶的話語意圖時(shí),控制器330可以參考先前接收的用戶語音來確定當(dāng)前接收的用戶語音中包含的用戶的話語意圖。
更具體地,當(dāng)控制器330不能基于先前接收的用戶語音所屬的服務(wù)域確定當(dāng)前接收的用戶語音中包含的用戶的話語意圖時(shí),控制器330可以通過參考先前接收的用戶語音來確定當(dāng)前接收的用戶語音中包含的用戶的話語意圖。
例如,控制器330可以通過將當(dāng)前接收的用戶語音與存儲(chǔ)在語料數(shù)據(jù)庫(kù)中的對(duì)話模式進(jìn)行比較,來確定當(dāng)前接收的用戶語音是否與對(duì)話模式中的初始用戶話語相對(duì)應(yīng),并且響應(yīng)于確定當(dāng)前接收的用戶語音未與初始用戶話語相對(duì)應(yīng),通過參考先前接收的用戶語音來確定當(dāng)前接收的用戶語音中包含的用戶的話語意圖。
為此目的,存儲(chǔ)設(shè)備320可以以分級(jí)的方式存儲(chǔ)相應(yīng)服務(wù)域的相應(yīng)例句。也即是說,存儲(chǔ)設(shè)備320可以基于與用戶可能在每一個(gè)服務(wù)域中最初發(fā)出的用戶語音相匹配的例句來存儲(chǔ)最高分級(jí)層,并且以分級(jí)的方式存儲(chǔ)與可能跟隨其后的用戶語音相對(duì)應(yīng)的例句。
例如,存儲(chǔ)設(shè)備320可以將“今天tv演什么?”作為最高分級(jí)層存儲(chǔ)在廣播服務(wù)域中,并且存儲(chǔ)諸如以下各項(xiàng)等的較低層的例句:“第三個(gè)”、“請(qǐng)問我可以看第三個(gè)的細(xì)節(jié)嗎?”、“xxx(即,頻道名稱)演什么?”、“哪一個(gè)是紀(jì)錄片節(jié)目?”、“我可以看xxx(即,出現(xiàn)的人的名字)主演的節(jié)目嗎?”或者“請(qǐng)問我可以看xxx(即,廣播節(jié)目名稱)嗎?”。
在另一個(gè)示例性實(shí)施例中,存儲(chǔ)設(shè)備320可以將“請(qǐng)執(zhí)行xxx(即,應(yīng)用名稱)”作為最高分級(jí)層存儲(chǔ)在設(shè)備控制服務(wù)域中。當(dāng)“xxx(即,應(yīng)用名稱)”是web瀏覽應(yīng)用時(shí),存儲(chǔ)設(shè)備320可以基于在web瀏覽應(yīng)用上可執(zhí)行的例句來存儲(chǔ)“請(qǐng)執(zhí)行xxx(即,應(yīng)用名稱)”的較低層例句,例如,“主頁(yè)”、“收藏夾”、“刷新”、“打開新的頁(yè)面”、“關(guān)閉當(dāng)前頁(yè)面”、“后退”、“前進(jìn)”或者“結(jié)束”。
下面將更詳細(xì)地解釋用于參考先前接收的用戶語音來確定當(dāng)前接收的用戶語音中包含的用戶的話語意圖的方法。
首先,假設(shè)輸入用戶語音“今天tv演什么?”并且然后輸入用戶語音“今天xxx(即,頻道名稱)演什么?”。在上述示例中,當(dāng)控制器330確定用戶語音“今天xxx(即,頻道名稱)演什么?”未與廣播服務(wù)域中的初始用戶話語相對(duì)應(yīng)時(shí),控制器330可以基于先前接收的用戶語音“今天tv演什么?”來確定“xxx(即,頻道名稱)演什么?”的話語意圖。
因此,控制器330可以使用先前接收的用戶語音“今天tv演什么?”來確定“xxx(即,頻道名稱)演什么?”話語意圖是“詢問”今天廣播的節(jié)目中安排在“xxx(即,頻道名稱)”上廣播的“廣播節(jié)目”。
因此,控制器330可以產(chǎn)生與確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息,并且向顯示裝置100發(fā)送該響應(yīng)信息。也即是說,控制器330可以根據(jù)確定的話語意圖在今天的廣播節(jié)目中搜索在xxx(即,頻道名稱)上廣播的廣播節(jié)目,并且向顯示裝置100發(fā)送與搜索的廣播節(jié)目有關(guān)的信息。
此外,假設(shè)輸入用戶語音“今天tv演什么?”,然后輸入用戶語音“第三個(gè)”。在上述示例中,當(dāng)控制器330確定用戶語音“第三個(gè)”未與廣播服務(wù)域中的初始用戶話語相對(duì)應(yīng)時(shí),控制器330可以基于先前接收的用戶語音“今天tv演什么?”來確定“第三個(gè)”的話語意圖。
更具體地,控制器330可以確定話語意圖是請(qǐng)求“調(diào)”到作為響應(yīng)于先前接收的用戶語音“今天tv演什么?”而從顯示裝置100輸出的廣播節(jié)目列表上的“第三個(gè)”的“廣播節(jié)目”。因此,控制器330可以產(chǎn)生與所確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息,并且向顯示裝置100發(fā)送該響應(yīng)信息。也即是說,控制器330可以根據(jù)確定的話語意圖來向顯示裝置100發(fā)送用于調(diào)到作為從顯示裝置100輸出的廣播節(jié)目列表上的第三個(gè)的廣播節(jié)目的控制命令。
同時(shí),雖然假設(shè)輸入用戶語音“今天tv演什么?”,然后輸入“xxx(即,頻道名稱)演什么”和“第三個(gè)”,但是示例性實(shí)施例不僅限于上述特定示例。也即是說,也可以基于先前接收的用戶語音來解釋各種其它分級(jí)的例句。
在另一個(gè)示例性實(shí)施例中,假設(shè)輸入用戶語音“請(qǐng)執(zhí)行xxx(即,web瀏覽應(yīng)用名稱)”,然后輸入用戶語音“刷新”。在上述示例中,當(dāng)控制器330確定用戶語音“刷新”未與設(shè)備控制服務(wù)域中的初始用戶話語相對(duì)應(yīng)時(shí),控制器330可以基于先前接收的用戶語音“請(qǐng)執(zhí)行xxx(即,web瀏覽應(yīng)用名稱)”來確定“刷新”的話語意圖。
也即是說,控制器330可以通過使用先前接收的用戶語音“請(qǐng)執(zhí)行xxx(即,web瀏覽應(yīng)用名稱)”來確定話語意圖是“請(qǐng)求”“刷新”“web瀏覽屏幕”。
因此,控制器330可以產(chǎn)生與所確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息,并且向顯示裝置100發(fā)送該響應(yīng)信息。也即是說,在上文解釋的示例性實(shí)施例中,控制器330可以向顯示裝置100發(fā)送用于刷新web瀏覽屏幕的控制命令。
同時(shí),雖然假設(shè)輸入用戶語音“請(qǐng)執(zhí)行xxx(即,web瀏覽應(yīng)用名稱)”并且然后輸入用戶語音“刷新”,但是示例性實(shí)施例不僅限于特定示例。因此,可以基于先前接收的用戶語音來解釋各種其它分級(jí)的例句。
此外,雖然不限于此,但是控制器330可以確定當(dāng)前接收的用戶語音是否與對(duì)話模式中的初始用戶話語相對(duì)應(yīng),并且當(dāng)確定當(dāng)前接收的用戶語音未與初始用戶話語相對(duì)應(yīng)時(shí),控制器330可以通過參考先前接收的用戶語音來確定當(dāng)前接收的用戶語音中包含的用戶的話語意圖。
因此,當(dāng)不能通過參考包括當(dāng)前接收的用戶語音的服務(wù)域來確定當(dāng)前接收的用戶語音中包含的話語意圖時(shí),控制器330可以使用先前接收的用戶語音。
例如,假設(shè)輸入用戶語音“今天tv演什么?”并且然后輸入用戶語音“xxx(即,頻道名稱)演什么?”。因?yàn)椴荒茉趶V播服務(wù)域中確定用戶語音“xxx(即,頻道名稱)演什么?”中包含的話語意圖,因此控制器330可以基于先前接收的用戶語音“今天tv演什么?”來確定“xxx(即,頻道名稱)演什么?”的話語意圖。
也即是說,控制器330可以通過使用先前接收的用戶語音“今天tv演什么?”來確定“xxx(即,頻道名稱)演什么?”的話語意圖是“詢問”今天廣播的節(jié)目中在“xxx(即,頻道名稱)”上廣播的“廣播節(jié)目”。
在另一個(gè)示例性實(shí)施例中,假設(shè)輸入用戶語音“請(qǐng)執(zhí)行xxx(即,web瀏覽應(yīng)用名稱)”并且然后輸入用戶語音“刷新”。在上述示例中,因?yàn)椴荒茉谠O(shè)備控制服務(wù)域中確定用戶語音“刷新”中包含的話語意圖,因此控制器330可以基于先前接收的用戶語音“請(qǐng)執(zhí)行xxx(即,web瀏覽應(yīng)用名稱)”來確定“刷新”的話語意圖。
也即是說,通過使用先前接收的用戶語音“請(qǐng)執(zhí)行xxx(即,web瀏覽應(yīng)用名稱)”,控制器330可以確定“刷新”的話語意圖是“請(qǐng)求”“刷新”“web瀏覽屏幕”。
同時(shí),存儲(chǔ)設(shè)備320將與從顯示裝置100輸出的用戶語音有關(guān)的信息作為語音命令向?qū)нM(jìn)行存儲(chǔ)。也即是說,存儲(chǔ)設(shè)備320可以存儲(chǔ)與在顯示裝置100的每一個(gè)情形中可使用的用戶語音有關(guān)的信息。
因此,控制器330可以通過使用預(yù)先存儲(chǔ)的信息來確定與在顯示裝置100的當(dāng)前情形中可應(yīng)用的用戶語音有關(guān)的信息,并且向顯示裝置100發(fā)送確定的與用戶語音有關(guān)的信息。
例如,當(dāng)接收到用戶語音“今天tv演什么?”時(shí),控制器330可以確定“今天tv演什么?”的話語意圖是“詢問”“今天”廣播的“廣播節(jié)目”,并且向顯示裝置100發(fā)送與今天的廣播節(jié)目有關(guān)的信息。控制器330可以發(fā)送與可應(yīng)用于作為系統(tǒng)響應(yīng)輸出的廣播節(jié)目列表的用戶語音有關(guān)的信息,例如,“第三個(gè)”、“請(qǐng)問我可以看第三個(gè)的細(xì)節(jié)嗎?”、“xxx(即,頻道名稱)演什么?”、“哪一個(gè)是紀(jì)錄片節(jié)目?”、“我可以看xxx(即,出現(xiàn)的人的名字)主演的節(jié)目嗎?”或者“請(qǐng)問我可以看xxx(即,廣播節(jié)目名稱)嗎?”。
在另一個(gè)示例性實(shí)施例中,當(dāng)接收到用戶語音“請(qǐng)執(zhí)行xx(即,與web瀏覽有關(guān)的應(yīng)用的名稱)”時(shí),控制器330可以確定“請(qǐng)執(zhí)行xx(即,與web瀏覽有關(guān)的應(yīng)用的名稱)”的話語意圖是“請(qǐng)求”“執(zhí)行”“xx(即,與web瀏覽有關(guān)的應(yīng)用的名稱)”,并且向顯示裝置100發(fā)送用于執(zhí)行xx(即,與web瀏覽有關(guān)的應(yīng)用的名稱)的控制命令。控制器330可以發(fā)送與可應(yīng)用于在顯示裝置100上執(zhí)行的應(yīng)用的用戶語音有關(guān)的信息,例如,“主頁(yè)”、“收藏夾”、“刷新”、“打開新的頁(yè)面”、“關(guān)閉當(dāng)前頁(yè)面”、“后退”、“前進(jìn)”或者“結(jié)束”。
下面將參照?qǐng)D6至圖11來解釋各種示例性實(shí)施例。
參照?qǐng)D6,控制器150顯示初始屏幕410。參照?qǐng)D7a至圖7c,控制器150可以在初始屏幕410的預(yù)定區(qū)域上顯示語音命令向?qū)?20。
語音命令向?qū)?20可以以放映幻燈片的形式顯示文本,該文本表示了可執(zhí)行顯示裝置100的可用功能的用戶語音,例如,“今天tv演什么?”、“有什么有趣的嗎?”、“有新的電影嗎?”、“向我推薦”、“我可以看ebb(即,頻道名稱)嗎?”以及“請(qǐng)運(yùn)行web瀏覽器”。
參照?qǐng)D8a至圖8c,當(dāng)用戶說出“今天tv演什么?”時(shí),控制器150可以基于從第二服務(wù)器300接收的響應(yīng)信息來將今天要廣播的廣播節(jié)目列表430作為系統(tǒng)響應(yīng)進(jìn)行輸出。然后,控制器150可以輸出語音命令向?qū)?40,該語音命令向?qū)?40表示了在作為系統(tǒng)響應(yīng)輸出的列表430上可應(yīng)用的用戶語音。
參照?qǐng)D8a至圖8c,語音命令向?qū)?00可以以放映幻燈片的形式顯示文本,該文本表示了可以應(yīng)用于作為系統(tǒng)響應(yīng)輸出的廣播節(jié)目列表430的用戶語音,例如,“請(qǐng)?zhí)峁┑谌齻€(gè)”、“我可以看第三個(gè)的細(xì)節(jié)嗎?”、“sbs(即,頻道名稱)演什么?”、“我可以看紀(jì)錄片節(jié)目嗎?”、“我可以看peter(即,出現(xiàn)的人的名字)主演的節(jié)目嗎?”或者“請(qǐng)問我看可以看“theshow(表演)”(即,廣播節(jié)目名稱)嗎?”。
同時(shí),控制器150可以輸出與收集的用戶語音有關(guān)的信息。例如,當(dāng)從第一服務(wù)器200接收到與用戶語音相對(duì)應(yīng)的文本信息時(shí),控制器150可以產(chǎn)生包括接收的文本信息的ui并且在屏幕上輸出該ui。也即是說,參照?qǐng)D8a至圖8c,控制器150可以輸出“今天tv演什么?”450。
因此,當(dāng)用戶說出“sbs(即,頻道名稱)演什么?”時(shí),控制器150可以基于從第二服務(wù)器300接收的響應(yīng)信息將今天的廣播節(jié)目中由sbs(即,頻道名稱)提供的廣播節(jié)目列表作為系統(tǒng)響應(yīng)進(jìn)行輸出。
同時(shí),控制器150可以輸出用于確保正確的用戶語音的向?qū)?。為此目的,第二服?wù)器300可以向顯示裝置100發(fā)送用于確保正確的用戶語音的向?qū)畔ⅰ?/p>
也即是說,當(dāng)不存在與接收的文本信息相匹配的例句時(shí),控制器330可以確定在統(tǒng)計(jì)上類似的例句,如上文所解釋的。因此,控制器330可以向顯示裝置100發(fā)送響應(yīng)信息以及與在統(tǒng)計(jì)上類似于接收的用戶語音的例句有關(guān)的信息。
例如,參照?qǐng)D9,當(dāng)用戶說出“tv演什么?”時(shí),控制器330確定“tv演什么?”在統(tǒng)計(jì)上類似于預(yù)先存儲(chǔ)的例句中的“今天tv演什么?”,并且表達(dá)“今天tv演什么?”并向顯示裝置100發(fā)送“今天tv演什么?”。因此,控制器150可以產(chǎn)生諸如“下一次嘗試說‘今天tv演什么?’”等的ui,并且將該ui作為用于確保更準(zhǔn)確的用戶語音的向?qū)?60進(jìn)行輸出。
在一個(gè)示例性實(shí)施例中,控制器150可以輸出與收集的用戶語音有關(guān)的信息。參照?qǐng)D9,控制器150可以輸出“tv演什么?”470。
同時(shí),語音命令向?qū)У男问讲幌抻谏衔奶峁┑奶囟ㄊ纠?,因此,可以提供各種形式的語音命令向?qū)А?/p>
例如,參照?qǐng)D10a和圖10b,當(dāng)在輸出初始屏幕510的情形中收集用戶語音“今天tv演什么?”時(shí),控制器150可以基于今天要廣播的節(jié)目列表520輸出系統(tǒng)響應(yīng),并且輸出語音命令向?qū)?30,該語音命令向?qū)?30包括與關(guān)于列表520可使用的用戶語音有關(guān)的信息。更具體地,參照?qǐng)D10b,控制器150可以輸出諸如“說‘第三個(gè)、第二個(gè)……’”等的語音命令向?qū)?30。
同時(shí),圖11示出了在顯示初始屏幕的狀態(tài)下用戶說出“查看更多”的示例。在該示例中,第二服務(wù)器300可以向顯示裝置100發(fā)送用于輸出顯示裝置100上可使用的用戶語音有關(guān)的信息的控制命令。
因此,基于所接收的控制命令,控制器150可以產(chǎn)生ui610,ui610包括與可使用的用戶語音有關(guān)的信息(參見圖11),并且輸出ui610。同時(shí),與顯示裝置100處可使用的語音有關(guān)的信息可以被預(yù)先存儲(chǔ)在顯示裝置100中或者從第二服務(wù)器300接收。
圖12是提供來解釋根據(jù)示例性實(shí)施例的顯示裝置的控制方法的流程圖。
在s1210,收集用戶語音。
在s1220,向第一服務(wù)器200發(fā)送用戶語音,并且從第一服務(wù)器200接收與用戶語音相對(duì)應(yīng)的文本信息。在s1230,向第二服務(wù)器300發(fā)送接收的文本信息。
在s1240,當(dāng)從第二服務(wù)器300接收到與文本信息相對(duì)應(yīng)的響應(yīng)信息時(shí),基于響應(yīng)信息來輸出與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)??梢暂敵隹蓱?yīng)用于顯示裝置的當(dāng)前情形的語音命令向?qū)А?/p>
也即是說,當(dāng)輸出與用戶語音相對(duì)應(yīng)的系統(tǒng)響應(yīng)時(shí),可以輸出與系統(tǒng)響應(yīng)有關(guān)的語音命令向?qū)А?/p>
在上述示例中,當(dāng)輸出響應(yīng)于用于搜索內(nèi)容的用戶語音而搜索到的內(nèi)容列表時(shí),可以輸出用于對(duì)內(nèi)容列表中包含的內(nèi)容進(jìn)行過濾的語音命令。
此外,當(dāng)輸出響應(yīng)于用于搜索內(nèi)容的用戶語音而搜索到的內(nèi)容列表時(shí),可以輸出以下各項(xiàng)中的至少一項(xiàng):用于執(zhí)行內(nèi)容列表中包含的特定內(nèi)容的語音命令向?qū)?,和用于輸出特定?nèi)容的細(xì)節(jié)的語音命令向?qū)А?/p>
此外,當(dāng)響應(yīng)于用于執(zhí)行應(yīng)用的用戶語音而輸出應(yīng)用執(zhí)行屏幕時(shí),可以輸出在應(yīng)用執(zhí)行屏幕上可應(yīng)用的語音命令向?qū)А?/p>
上文將參照上文參照?qǐng)D1至圖11提供的解釋,并且為了簡(jiǎn)潔起見,在下文中將不對(duì)其進(jìn)行過多的解釋。
此外,可以提供其中記錄有用于順序地執(zhí)行根據(jù)示例性實(shí)施例的控制方法的程序的非臨時(shí)性計(jì)算機(jī)可讀介質(zhì)?!胺桥R時(shí)性計(jì)算機(jī)可讀記錄介質(zhì)”是指半持久性地存儲(chǔ)數(shù)據(jù)并且可以由設(shè)備讀取的介質(zhì)。具體地,上述各種應(yīng)用或程序可以被存儲(chǔ)和提供在諸如cd、dvd、硬盤、藍(lán)光光盤、usb、存儲(chǔ)卡或rom等的非臨時(shí)性計(jì)算機(jī)可讀記錄介質(zhì)中。
此外,雖然顯示裝置和服務(wù)器的框圖省略了總線,但是可以經(jīng)由總線來執(zhí)行顯示裝置和服務(wù)器的相應(yīng)組件之間的通信。此外,每一個(gè)設(shè)備可以另外包括用于執(zhí)行上文解釋的各個(gè)步驟的以下各項(xiàng)中的至少一項(xiàng):諸如cpu、微處理器等的處理器、硬件模塊或電路。
前述示例性實(shí)施例和優(yōu)點(diǎn)僅是示例性的,而不應(yīng)理解為限制示例性實(shí)施例。本教導(dǎo)可以容易地應(yīng)用于其它類型的裝置。此外,示例性實(shí)施例的描述只在是說明性的,而非限制由所附權(quán)利要求限定的發(fā)明構(gòu)思的范圍,并且對(duì)于本領(lǐng)域技術(shù)人員而言,很多替換形式、修改和變形將是顯而易見的。