用于使用語音識(shí)別提供情境感知服務(wù)的方法和用戶裝置制造方法
【專利摘要】本發(fā)明提供一種用于使用語音識(shí)別提供情境感知服務(wù)的方法和用戶裝置。所述方法包括:根據(jù)用戶輸入來定義用于情境感知服務(wù)的控制命令;響應(yīng)于用戶選擇來觸發(fā)回放模式和情境感知服務(wù);在回放模式下通過麥克風(fēng)接收外部音頻;確定接收到的音頻是否與控制命令對(duì)應(yīng);當(dāng)接收到的音頻與控制命令對(duì)應(yīng)時(shí),執(zhí)行分配到控制命令的特定動(dòng)作。
【專利說明】用于使用語音識(shí)別提供情境感知服務(wù)的方法和用戶裝置
【技術(shù)領(lǐng)域】
[0001]本公開涉及提供情境感知服務(wù)的技術(shù)。更具體地講,本公開涉及如下的方法和用戶裝置,即,在用戶裝置與耳機(jī)連接的狀態(tài)下通過語音識(shí)別知道用戶定義的情境,自動(dòng)地執(zhí)行分配到用戶定義的情境的特定動(dòng)作并將反饋提供給用戶。
【背景技術(shù)】
[0002]隨著數(shù)字技術(shù)的顯著發(fā)展,允許在移動(dòng)環(huán)境中進(jìn)行通信和數(shù)據(jù)處理的各種用戶裝置(諸如個(gè)人數(shù)字助理(PDA)、電子記事本、智能電話、平板個(gè)人計(jì)算機(jī)(PC)等)已變得越來越普遍。這樣的用戶裝置已超出它們的各個(gè)傳統(tǒng)領(lǐng)域并且已到達(dá)融合階段。例如,用戶裝置可提供許多有用的功能,包括語音/視頻呼叫功能、消息傳輸功能(諸如短消息服務(wù)(SMS))、多媒體消息服務(wù)(麗S)、電子郵件、導(dǎo)航功能、數(shù)碼相機(jī)功能、廣播接收功能、媒體(包括視頻和音樂)回放功能、互聯(lián)網(wǎng)訪問功能、信使功能、社交網(wǎng)絡(luò)服務(wù)(SNS)功能等。
[0003]最近已開發(fā)了將個(gè)人生活記錄為數(shù)字信息(例如,生活日志)的各種技術(shù),這引起了對(duì)情境感知服務(wù)的興趣。通常,情境感知服務(wù)根據(jù)由服務(wù)對(duì)象(例如,用戶)定義的情境的變化來確定服務(wù)的內(nèi)容和是否提供服務(wù)。情境表示用于確定由服務(wù)對(duì)象定義的特定服務(wù)動(dòng)作的信息,并可包括提供服務(wù)的時(shí)間、是否提供服務(wù)、服務(wù)的目標(biāo)、提供服務(wù)的位置等。
[0004]典型的情境感知服務(wù)基于域安裝各種傳感器單元以便收集個(gè)人信息。例如,現(xiàn)有技術(shù)的情境感知服務(wù)可包括從傳感器獲得數(shù)據(jù)的用戶裝置和從由用戶裝置獲得的數(shù)據(jù)提取情境的服務(wù)器,現(xiàn)有技術(shù)的情境感知服務(wù)可分析提取的數(shù)據(jù)并可執(zhí)行對(duì)于情境的合適服務(wù)。因此,為了支持情境感知服務(wù),這樣的系統(tǒng)可能需要用戶裝置具有各種傳感器并還可能需要用戶裝置與服務(wù)器之間的交互。不幸地,這會(huì)使實(shí)現(xiàn)高效且結(jié)構(gòu)合理的系統(tǒng)變得困難。
[0005]此外,現(xiàn)有技術(shù)的情境感知服務(wù)可能需要用戶執(zhí)行單獨(dú)的程序并執(zhí)行復(fù)雜的設(shè)置步驟。這會(huì)使用戶的可用性差。此外,典型的情境感知服務(wù)的使用方案可依賴用戶裝置中定義的命令。然而,由于只有用戶裝置的用戶可知道該命令,因此,可能無法合適地處理與外部事件相關(guān)聯(lián)的任何情境。
[0006]可連接到用戶裝置的耳機(jī)也已變得普遍。在用戶通過耳機(jī)接聽音頻的情況下,他或她可能不容易感知外部聲音。由于該原因,用戶應(yīng)取下耳機(jī)或直接操作運(yùn)行應(yīng)用。
[0007]因此,存在允許用戶裝置在用戶佩戴耳機(jī)時(shí)識(shí)別外部情境并將反饋提供給用戶的方法和裝置的需要。
[0008]上述信息僅被呈現(xiàn)為用于幫助理解本公開的背景信息。關(guān)于任何上述內(nèi)容是否可用于關(guān)于本公開的現(xiàn)有技術(shù),未做出任何確定,并且未做出任何斷言。
【發(fā)明內(nèi)容】
[0009]本公開的多個(gè)方面在于至少解決上述問題和/或缺點(diǎn)并在于至少提供下述優(yōu)點(diǎn)。因此,本公開的一方面在于提供用于通過語音識(shí)別來識(shí)別用戶定義的情境,自動(dòng)地執(zhí)行與識(shí)別的情境相應(yīng)的特定動(dòng)作并將反饋提供給用戶的方法和用戶裝置。[0010]本公開的另一方面在于提供用于即使在用戶裝置連接到耳機(jī)時(shí)也通過語音識(shí)別來識(shí)別用戶定義的情境的方法和用戶裝置。
[0011]本公開的另一方面在于提供用于識(shí)別用于支持情境感知服務(wù)的最優(yōu)環(huán)境,以此提高用戶便利性和裝置可用性的方法和用戶裝置。
[0012]根據(jù)本公開的一方面,提供一種用于提供情境感知服務(wù)的方法。所述方法包括:根據(jù)用戶輸入來定義用于情境感知服務(wù)的控制命令;響應(yīng)于用戶選擇來觸發(fā)回放模式和情境感知服務(wù);在回放模式下通過麥克風(fēng)接收外部音頻;確定接收到的音頻是否與控制命令對(duì)應(yīng);當(dāng)接收到的音頻與控制命令對(duì)應(yīng)時(shí),執(zhí)行分配到控制命令的特定動(dòng)作。
[0013]根據(jù)本公開的另一方面,提供一種用戶裝置。所述用戶裝置包括:麥克風(fēng),被構(gòu)造為接收外部音頻;存儲(chǔ)單元,被構(gòu)造為存儲(chǔ)包括用戶定義的控制命令、根據(jù)控制命令的特定動(dòng)作和情境信息的映射關(guān)系的命令表;語音識(shí)別單元,被構(gòu)造為在情境感知服務(wù)中執(zhí)行語音識(shí)別以識(shí)別用戶情境;控制單元,被構(gòu)造為根據(jù)用戶輸入來定義用于情境感知服務(wù)的控制命令,并在通過麥克風(fēng)接收到與控制命令相應(yīng)的特定音頻時(shí)執(zhí)行與特定音頻映射的特定動(dòng)作。
[0014]根據(jù)本公開的另一方面,提供一種計(jì)算機(jī)可讀介質(zhì)。所述計(jì)算機(jī)可讀介質(zhì)在其上記錄有程序,被構(gòu)造為根據(jù)用戶輸入來定義用于情境感知服務(wù)的控制命令,并在通過麥克風(fēng)接收到特定音頻輸入時(shí)執(zhí)行映射到與控制命令相應(yīng)的特定音頻輸入的特定動(dòng)作。
[0015]根據(jù)本公開的的另一方面用于通過使用語音識(shí)別來提供情境感知服務(wù)的方法和用戶裝置,用戶裝置可設(shè)置各種用戶定義的情境或規(guī)則。在本公開的各種實(shí)施例中,用戶裝置可通過語音識(shí)別處理來識(shí)別用戶定義的情境,可自動(dòng)地執(zhí)行分配到用戶定義的情境的特定動(dòng)作,并將關(guān)于情境的反饋提供給用戶。
[0016]根據(jù)本公開的另一方面,即使在用戶佩戴連接到用戶裝置的耳機(jī)時(shí),用戶裝置也可在給定條件(例如,特定分貝或更多)下執(zhí)行針對(duì)外部事件的語音識(shí)別。如果識(shí)別到用戶定義的情境,則用戶裝置可執(zhí)行特定動(dòng)作(例如,輸出識(shí)別的語音,顯示彈出消息,輸出振動(dòng)等),并將關(guān)于情境信息的立即反饋提供給用戶。因此,用戶可在不取下耳機(jī)或操作運(yùn)行的應(yīng)用的情況下容易地感知他或她的用戶定義的情境。
[0017]根據(jù)本公開的另一方面,用戶可定義與任何期望或可能的情境相關(guān)聯(lián)的各種控制命令以及由用戶裝置的制造商定義的特定情境。因此,可擴(kuò)大情境感知服務(wù)的支持范圍,這可滿足各種用戶的可用性。
[0018]根據(jù)本公開的另一方面,這里公開的方法和用戶裝置可實(shí)現(xiàn)用于支持情境感知服務(wù)的最優(yōu)環(huán)境,因此提供用戶的便利性和裝置可用性??梢栽谒蟹N類的用戶裝置或任何其它等同物中簡單實(shí)現(xiàn)這里公開的技術(shù)。
[0019]從以下結(jié)合附圖公開本公開的各種實(shí)施例的詳細(xì)描述中,本公開的其它方面、優(yōu)點(diǎn)和顯著特征將對(duì)于本領(lǐng)域技術(shù)人員變得清楚。
【專利附圖】
【附圖說明】
[0020]從結(jié)合附圖的以下描述中,本公開的特定實(shí)施例的上述以及其它方面、特征和優(yōu)點(diǎn)將會(huì)更加清楚,在附圖中:
[0021]圖1是示出根據(jù)本公開的實(shí)施例的情境感知服務(wù)的示圖。[0022]圖2是示出根據(jù)本公開的實(shí)施例的用戶裝置的構(gòu)造的框圖。
[0023]圖3是示出根據(jù)本公開的實(shí)施例的在用戶裝置中執(zhí)行情境感知服務(wù)的示圖。
[0024]圖4是示出根據(jù)本公開的實(shí)施例的顯示在用戶裝置上的控制命令的列表的屏幕截圖。
[0025]圖5是示出根據(jù)本公開的實(shí)施例的用于使用語音識(shí)別來提供情境感知服務(wù)的方法的流程圖。
[0026]圖6是示出根據(jù)本公開的另一實(shí)施例的使用語音識(shí)別來提供情境感知服務(wù)的方法的流程圖。
[0027]圖7示出根據(jù)本公開的實(shí)施例的使用語音識(shí)別來提供情境感知服務(wù)的處理。
[0028]圖8示出根據(jù)本公開的另一實(shí)施例的使用語音識(shí)別來提供情境感知服務(wù)的處理。
[0029]貫穿附圖,應(yīng)注意,相同的標(biāo)號(hào)用于描繪相同或相似的元件、特征和結(jié)構(gòu)。
【具體實(shí)施方式】
[0030]提供以下參照附圖的描述以幫助全面理解由權(quán)利要求及其等同物限定的本公開的各種實(shí)施例。以下描述包括各種特定細(xì)節(jié)以幫助理解,但是這些特定細(xì)節(jié)將僅被認(rèn)為是示例性的。因此,本領(lǐng)域的普通技術(shù)人員將認(rèn)識(shí)到,在不脫離本公開的范圍和精神的情況下可對(duì)在此描述的實(shí)施例進(jìn)行各種改變和修改。另外,為了清楚和簡明,可省略公知功能和構(gòu)造的描述。
[0031]在以下描述和權(quán)利要求中使用的術(shù)語和詞語不限于字面含義,而是僅被發(fā)明人使用,以能夠使本公開得到清楚和一致的理解。因此,對(duì)于本領(lǐng)域技術(shù)人員應(yīng)該清楚的是,本公開的各種實(shí)施例的以下描述僅被提供用于說明目的,而不是用于限制由權(quán)利要求及其等同物限定的本公開的目的。
[0032]將理解,除非上下文明確指示,否則單數(shù)形式包括復(fù)數(shù)指代。因此,例如,參照“組件表面”包括參照一個(gè)或多個(gè)這樣的表面。
[0033]本公開涉及用于提供情境感知服務(wù)的方法和用戶裝置。在本公開的各種實(shí)施例中,用戶裝置可基于用戶定義的情境(或規(guī)則)執(zhí)行情境感知,可自動(dòng)執(zhí)行分配到用戶定義的情境的至少一個(gè)動(dòng)作,并可將戶關(guān)于情境信息的反饋提供給用戶。
[0034]更具體地講,在情境感知服務(wù)中,用戶裝置可執(zhí)行針對(duì)從任何外部實(shí)體接收的音頻的語音識(shí)別。如果語音識(shí)別的音頻與控制命令對(duì)應(yīng),則用戶裝置可執(zhí)行分配到控制命令的一個(gè)或多個(gè)動(dòng)作并且還可向用戶提供情境信息。根據(jù)本公開的各種實(shí)施例,用戶裝置可通過使用語音識(shí)別來識(shí)別用戶定義的情境(或規(guī)則),并可向用戶提供與識(shí)別的情境有關(guān)的情境信息。
[0035]在本公開的一些實(shí)施例中,用戶可基于自然語言來定義用于文本識(shí)別的各種控制命令。例如,用戶的姓名、用戶的綽號(hào)、用戶的昵稱、任何其它稱呼用語、任何位置用語等可以以文本或語音的形式被輸入并可被定義為控制命令??赏ㄟ^連接到用戶裝置的耳機(jī)在回放模式下輸出任何音頻,同時(shí)用戶裝置可記錄通過麥克風(fēng)接收的音頻并可執(zhí)行語音識(shí)別解決方案。此時(shí),用戶裝置可將接收到的音頻的增益與參考增益進(jìn)行比較以便確定是否執(zhí)行語音識(shí)別解決方案。如果語音識(shí)別解決方案被執(zhí)行,則用戶裝置可輸出情境信息,使得用戶可容易地感知自動(dòng)任務(wù)控制(例如,用于媒體情境的暫停功能)和識(shí)別的音頻??梢砸砸曈X(即,屏幕顯示)、聽覺(即,聲音)和觸覺(即,振動(dòng))中的至少一個(gè)的方式提供情境信息的輸出。
[0036]在本公開中,情境感知服務(wù)表示如下的服務(wù),S卩,用戶裝置通過語音識(shí)別來識(shí)別用戶定義的情境(或規(guī)則),執(zhí)行相應(yīng)的特定動(dòng)作并向用戶提供關(guān)于情境信息的反饋。在該公開中,在情境感知服務(wù)中執(zhí)行的動(dòng)作表示由用戶裝置執(zhí)行的任何種類的控制動(dòng)作,包括通過用戶裝置的揚(yáng)聲器輸出情境信息,通過耳機(jī)輸出情境信息,通過耳機(jī)的右部分和左部分分別輸出情境信息,通過顯示單元顯示情境信息,通過振動(dòng)的方式輸出情境信息和對(duì)當(dāng)前模式的控制(例如,回放的暫停、回放的結(jié)束等)。情境信息表示根據(jù)特定動(dòng)作的執(zhí)行而輸出的任何種類的信息,包括識(shí)別的音頻、識(shí)別的文本、振動(dòng)及它們的任何組合。
[0037]在該公開中,根據(jù)在情境感知服務(wù)之前運(yùn)行的模式(或應(yīng)用),可執(zhí)行一個(gè)或多個(gè)動(dòng)作。例如,如果用戶裝置執(zhí)行音樂回放模式并通過耳機(jī)輸出播放的音樂的聲音,則任何識(shí)別的音頻可通過耳機(jī)輸出。在這種情況下,音樂可被暫停。如果用戶裝置執(zhí)行視頻回放模式并通過耳機(jī)和顯示單元分別輸出播放的視頻的音頻和圖像,則任何識(shí)別的情境可顯示在顯示單元上。在這種情況下,視頻可被暫?;蚩衫^續(xù)播放。此外,在這種情況下,任何識(shí)別的音頻還可通過耳機(jī)輸出并且視頻可被暫停。
[0038]圖1是示出根據(jù)本公開的實(shí)施例的情境感知服務(wù)的示圖。
[0039]參照?qǐng)D1,可使用用戶裝置100和耳機(jī)200執(zhí)行情境感知服務(wù)。用戶裝置100和耳機(jī)200可通過有線接口或無線接口彼此連接。
[0040]用戶裝置100可執(zhí)行與情境感知服務(wù)相關(guān)聯(lián)的總體操作。用戶裝置100可以是采用應(yīng)用處理器(AP)、圖形處理單元(GPU)和/或中央處理單元(CPU)的任何種類的電子裝置。例如,用戶裝置100可以是各種類型的移動(dòng)通信終端、平板PC、智能電話、數(shù)碼相機(jī)、便攜式多媒體播放器(PMP )、媒體播放器、便攜式游戲機(jī)、個(gè)人數(shù)字助理(PDA)等中的一個(gè)。此夕卜,公開于此的功能控制方法可應(yīng)用于各種類型的顯示裝置,諸如數(shù)字TV、數(shù)字標(biāo)牌(DS)、大型顯示器(LFD)等。
[0041]耳機(jī)200表示可連接到用戶裝置100,可從用戶裝置100接收聲音并可通過配備的揚(yáng)聲器輸出接收到的聲音的裝置。
[0042]用戶可連接用戶裝置100和耳機(jī)200并且隨后通過耳機(jī)200接聽用戶裝置100中播放的媒體內(nèi)容(例如,音樂或視頻文件)的聲音。
[0043]此外,用戶可設(shè)置用于情境感知服務(wù)的控制命令??稍谟脩羝谕娜魏螘r(shí)間設(shè)置控制命令。例如,用戶可設(shè)置各種控制命令,可在耳機(jī)200連接時(shí)設(shè)置必需的控制命令,或可在使用用戶裝置100時(shí)在任何時(shí)間設(shè)置期望的控制命令。
[0044]控制命令可基于自然語言(B卩,由用戶代表性地使用的語言)而被定義和識(shí)別??苫谧匀徽Z言以各種形式設(shè)置用戶的情境感知所需的任何命令。例如,為了在他或她通過耳機(jī)200接聽音樂時(shí)容易地感知某人正在呼叫用戶,用戶可將用于呼叫他或她的各種自然語言用語(例如,用戶的姓名或綽號(hào))設(shè)置為命令。此外或可選擇地,為了在使用交通工具(例如,公共汽車或地鐵)期間容易地感知到達(dá)目的地,用戶可將期望的目的地(例如,首爾站)設(shè)置為命令。此外,控制命令可通過在用戶裝置100中配備的麥克風(fēng)以基于語音的輸入而被輸入,控制命令可通過配備在用戶裝置100中的輸入單元或顯示單元以基于文本的輸入而被輸入,或控制命令可由用戶從用戶裝置100中定義的命令列表中選擇。[0045]當(dāng)通過情境感知服務(wù)中的語音識(shí)別識(shí)別到特定控制命令時(shí),用戶裝置100可控制聲音路徑和任務(wù)操作。
[0046]具體地講,當(dāng)情境感知服務(wù)被觸發(fā)時(shí),用戶裝置100可激活語音識(shí)別功能。例如,可在耳機(jī)200連接到用戶裝置100時(shí),在任何媒體情境開始播放,或在接收到相關(guān)用戶輸入時(shí),觸發(fā)情境感知服務(wù)。用戶裝置100可識(shí)別通過麥克風(fēng)接收到的外部音頻(例如,語音、通知等),并將識(shí)別的語音與用戶定義的控制命令進(jìn)行比較。如果確定接收到與選擇的用戶定義的控制命令對(duì)應(yīng)的特定音頻,則用戶裝置100可將所述特定音頻視為對(duì)用戶定義的情境的感知。此外,用戶裝置100可執(zhí)行與識(shí)別的情境相應(yīng)的至少一個(gè)特定動(dòng)作;所述特定動(dòng)作與選擇的控制命令映射。用戶裝置100還可將關(guān)于情境信息的反饋提供給用戶。
[0047]在一個(gè)實(shí)施例中,用戶可基于將用于呼叫他或她的自然語言用語(例如,用戶的姓名或綽號(hào))預(yù)先設(shè)置至少一個(gè)控制命令,可通過耳機(jī)200接聽正在用戶裝置100中播放的音樂。在這種情況下,用戶裝置100可當(dāng)在用戶請(qǐng)求時(shí)開始播放選擇的音樂文件時(shí)執(zhí)行語音識(shí)別解決方案。語音識(shí)別解決方案可包括用于激活麥克風(fēng)來接收外部音頻的動(dòng)作和用于記錄接收到的音頻的動(dòng)作。如果在播放音樂時(shí)從通過麥克風(fēng)接收到的音頻檢測到與用戶定義的控制命令相應(yīng)的特定音頻(例如,用戶的姓名或綽號(hào)),則用戶裝置100可執(zhí)行與控制命令相應(yīng)的特定動(dòng)作并將關(guān)于情境信息的反饋提供給用戶。例如,用戶裝置100可暫停音樂的恢復(fù)或可通過在保持音樂的回放的同時(shí)改變聲音路徑來停止聲音輸出到耳機(jī)200。隨后,用戶裝置100可將識(shí)別的音頻(例如,用戶的姓名或綽號(hào))發(fā)送到耳機(jī)200以通過耳機(jī)200輸出識(shí)別的音頻。因此,用戶可明白音樂由于情境感知而停止,并還可適當(dāng)?shù)靥幚砟橙撕艚兴蛩男彰那闆r。
[0048]在一個(gè)實(shí)施例中,如果識(shí)別到音頻的方向,則這可在控制命令中被反映。例如,如果某人在用戶的右側(cè)呼叫用戶的姓名,則用戶裝置100可通過耳機(jī)200的右揚(yáng)聲器將反饋提供給用戶,或可增加右揚(yáng)聲器的音量以便提高用戶的感知。
[0049]在另一實(shí)施例中,用戶可在地鐵上使用視頻講座。在這種情況下,用戶可將期望的目的地(例如,首爾的地鐵站)設(shè)置為用于情境感知的控制命令。隨后,用戶裝置100可觸發(fā)情境感知服務(wù)并執(zhí)行語音識(shí)別解決方案。如果在播放視頻的同時(shí),從通過麥克風(fēng)輸入的音頻檢測到與特定用戶定義的控制命令相應(yīng)的任何特定音頻(例如,“下一站是首爾站”的通知),則用戶裝置100可執(zhí)行與控制命令相應(yīng)的特定動(dòng)作并將關(guān)于情境信息的反饋提供給用戶。例如,用戶裝置100可暫停視頻的回放,可在保持視頻的回放的同時(shí)顯示彈出窗口,或可通過在保持視頻的回放的同時(shí)改變聲音路徑來停止聲音輸出到耳機(jī)200。在暫停視頻的回放或停止聲音的輸出的情況下,用戶裝置100可將識(shí)別的音頻(例如,通知“下一站是首爾站”)發(fā)送到耳機(jī)200以通過耳機(jī)200輸出識(shí)別的音頻。在顯示彈出窗口的情況下,用戶裝置100可創(chuàng)建與識(shí)別的音頻相應(yīng)的彈出窗口并可將彈出窗口顯示在正在播放的視頻上??蛇x擇地,用戶裝置100可組合上述動(dòng)作,S卩,用戶可不僅輸出聲音而且還可顯示彈出窗口。用戶即使在使用用戶裝置100時(shí)也可感知某人呼叫他或她。
[0050]如這里所討論的,用戶裝置100可知道外部情境并可將反饋提供給用戶,因此提高用戶的便利性。例如,通過停止耳機(jī)200的聲音輸出,用戶裝置100可允許用戶不需要取下耳機(jī)200。此外,通過識(shí)別用戶環(huán)境,用戶裝置100可以以各種方式(諸如聲音輸出控制、顯示控制、進(jìn)程控制等)將關(guān)于情境信息的立即反饋提供給用戶。[0051]同時(shí),在圖1中示出的實(shí)施例中,用戶裝置100通過有線接口或無線接口連接到耳機(jī)200并將聲音輸出到耳機(jī)200。然而,這僅為示例性的并不被視為對(duì)本公開的限制??蛇x擇地,即使不連接耳機(jī)200,用戶裝置100也可觸發(fā)情境感知服務(wù),可通過語音識(shí)別來識(shí)別用戶定義的情境,并可將關(guān)于情境信息的反饋提供給用戶。
[0052]現(xiàn)在,將參照附圖描述用戶裝置100的構(gòu)造和操作。提供下面的描述作為實(shí)施例并不被視為對(duì)本公開的限制。
[0053]圖2是示出根據(jù)本公開的實(shí)施例的用戶裝置的構(gòu)造的框圖。
[0054]參照?qǐng)D2,用戶裝置100可包括無線通信單元110、輸入單元120、顯示單元130、音頻處理單元140、存儲(chǔ)單元150、接口單元160、語音識(shí)別單元170、控制單元180和電源單元190。用戶裝置100的這些元件不總是必要的。可選擇地,更多或更少的元件可被包括在用戶裝置100中。例如,用戶裝置100還可包括相機(jī)模塊(未示出)以支持圖像捕捉功能。
[0055]無線通信單元110可具有能夠執(zhí)行用戶裝置100與無線通信系統(tǒng)之間或用戶裝置100與其它用戶裝置之間的無線通信的一個(gè)或多個(gè)模塊。例如,無線通信單元110可具有移動(dòng)通信模塊111、無線局域網(wǎng)(WLAN)模塊113、短程通信模塊115、位置計(jì)算模塊117和廣播接收模塊119中的至少一個(gè)。
[0056]移動(dòng)通信模塊111可將無線信號(hào)發(fā)送到移動(dòng)通信網(wǎng)絡(luò)中的基站、外部裝置和服務(wù)器中的至少一個(gè),或從移動(dòng)通信網(wǎng)絡(luò)中的基站、外部裝置和服務(wù)器中的至少一個(gè)接收無線信號(hào)。無線信號(hào)可包括語音呼叫信號(hào)、視頻呼叫信號(hào)和文本/多媒體消息數(shù)據(jù)。移動(dòng)通信模塊111可在控制單元180的控制下執(zhí)行對(duì)操作服務(wù)器或內(nèi)容服務(wù)器的訪問,并隨后下載命令表,其中,在命令表中,各種控制命令和動(dòng)作針對(duì)情境感知服務(wù)而相互映射。
[0057]WLAN模塊113表示用于執(zhí)行無線互聯(lián)網(wǎng)訪問并與其它用戶裝置建立無線LAN鏈路的模塊。WLAN模塊113可嵌入在用戶裝置100中或附著到用戶裝置100。對(duì)于無線互聯(lián)網(wǎng)訪問,可使用諸如W1-F1、無線寬帶(Wibro)、全球微波互聯(lián)接入(Wimax)或高速下行鏈路分組接入(HSDPA)的公知技術(shù)。WLAN模塊113可在控制單元180的控制下執(zhí)行對(duì)操作服務(wù)器或內(nèi)容服務(wù)器的訪問,并隨后下載命令表,其中,在命令表中,各種控制命令和動(dòng)作針對(duì)情境感知服務(wù)而相互映射。此外,當(dāng)利用任何其它用戶裝置形成無線LAN鏈路時(shí),WLAN模塊113可將命令表發(fā)送到其它用戶裝置或從其它用戶裝置接收命令表,其中,在命令表中,用戶選擇的控制命令和動(dòng)作相互映射。此外,WLAN模塊113可通過無線LAN將命令表發(fā)送到云服務(wù)器或從云服務(wù)器接收命令表。
[0058]短程通信模塊115表示為短程通信所設(shè)計(jì)的模塊。藍(lán)牙、射頻識(shí)別(RFID)、紅外數(shù)據(jù)協(xié)會(huì)(IrDA)、超寬帶(UWB)、ZigBee、近場通信(NFC)等可用作短程通信技術(shù)。當(dāng)短程通信連接到任何其它用戶裝置時(shí),短程通信模塊115可將命令表發(fā)送到其它用戶裝置或從其它用戶裝置接收命令表。更具體地講,短程通信模塊115可在控制單元180的控制下連接到耳機(jī)200并隨后將無線信號(hào)發(fā)送到耳機(jī)200或從耳機(jī)200接收無線信號(hào)。這樣的無線信號(hào)可包括聲音信號(hào)和控制命令。
[0059]位置計(jì)算模塊117表示用于獲得用戶裝置100的位置的模塊,例如,全球定位系統(tǒng)(GPS)模塊。位置計(jì)算模塊117可計(jì)算關(guān)于距至少三個(gè)基站的時(shí)間和距離的信息,并隨后基于這樣的信息,通過三角測量來計(jì)算當(dāng)前位置(如果需要,包括維度、經(jīng)度和高度的三維位置)??蛇x擇地,位置計(jì)算模塊117可通過從至少三個(gè)衛(wèi)星接收實(shí)時(shí)數(shù)據(jù)來計(jì)算用戶裝置100的實(shí)時(shí)位置。可使用用于獲得用戶裝置100的位置的任何其它技術(shù)。
[0060]廣播接收模塊119可通過廣播信道(例如,衛(wèi)星信道、陸地信道等)從任何外部廣播管理服務(wù)器接收廣播信號(hào)(例如,TV廣播信號(hào)、無線電廣播信號(hào)、數(shù)據(jù)廣播信號(hào)等)和/或與廣播有關(guān)的信息(例如,關(guān)于廣播信道、廣播節(jié)目、廣播服務(wù)提供方等的信息)。
[0061]輸入單元120可接收用戶的操作并創(chuàng)建用于控制用戶裝置100的操作的用戶數(shù)據(jù)。輸入單元120可選擇性地由鍵盤、圓頂(dome)開關(guān)、觸摸板、撥動(dòng)滾輪、撥動(dòng)開關(guān)等構(gòu)成。輸入單元120可由安裝在用戶裝置100的外側(cè)的按鈕形成,所述按鈕中的一些可被實(shí)現(xiàn)在觸摸面板。輸入單元120可在接收到用于設(shè)置控制命令或觸發(fā)情境感知服務(wù)時(shí)創(chuàng)建輸入數(shù)據(jù)。
[0062]顯示單元130可顯示在用戶裝置100中處理的顯示信息。例如,當(dāng)用戶裝置100處于呼叫模式時(shí),顯示單元130可顯示與呼叫模式有關(guān)的屏幕界面(諸如用戶界面(UI)或圖形用戶界面(GUI))。當(dāng)用戶裝置100處于視頻呼叫模式或相機(jī)模式時(shí),顯示單元130可顯示接收到的和/或捕捉的圖像、Π或⑶I。更具體地講,顯示單元130可顯示與情境感知服務(wù)相關(guān)聯(lián)的各種Π和/或⑶I。例如,顯示單元130可顯示控制命令設(shè)置屏幕、情境信息反饋屏幕等。之后將描述這樣的屏幕或界面的示例。
[0063]顯示單元130可包括液晶顯示器(IXD)、薄膜晶體管-1XD (TFT-1XD )、發(fā)光二極管(LED)、有機(jī)LED (OLED)、有源矩陣OLED (AM0LED)、柔性顯示器、彎曲顯示器或三維(3D)顯示器。這樣的顯示器的部分可被實(shí)現(xiàn)為透明顯示器。
[0064]如果采用顯示單元130和觸摸面板(未示出)由分層結(jié)構(gòu)形成的觸摸屏,則觸摸面板可用作輸入單元。觸摸面板可被構(gòu)造為從其表面或顯示單元130的表面檢測壓力或電容的變化并將其轉(zhuǎn)換為電輸入信號(hào)。在實(shí)施例中,觸摸面板可檢測觸摸位置、區(qū)域和壓力。如果存在對(duì)于觸摸面板的任何觸摸輸入,則相應(yīng)的信號(hào)可被傳送到觸摸控制器(未不出)。觸摸控制器可處理接收到的信號(hào)并將相應(yīng)數(shù)據(jù)發(fā)送到控制單元180。因此,控制單元180可識(shí)別被觸摸的點(diǎn)。
[0065]音頻處理單元140可將從控制單元180接收到的音頻信號(hào)發(fā)送到揚(yáng)聲器141,還將從麥克風(fēng)143接收的音頻信號(hào)(諸如語音)發(fā)送到控制單元180。在控制單元180的控制下,音頻處理單元140可將音頻信號(hào)轉(zhuǎn)換為可聽見的聲音并將其輸出到揚(yáng)聲器141,并且還可將從麥克風(fēng)接收的音頻信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)并將其輸出到控制單元180。
[0066]揚(yáng)聲器141可在呼叫模式、記錄模式、語音識(shí)別模式、廣播接收模式、相機(jī)模式、情境感知服務(wù)模式等下輸出從無線通信單元110接收的音頻數(shù)據(jù)、從麥克風(fēng)143接收的音頻數(shù)據(jù)、存儲(chǔ)在存儲(chǔ)單元150中的音頻數(shù)據(jù)。揚(yáng)聲器141可輸出與在用戶裝置100中執(zhí)行的特定功能(例如,情境信息的反饋、來電呼叫的到達(dá)、圖像的捕捉、媒體內(nèi)容(諸如音樂或視頻)的回放)相關(guān)聯(lián)的聲音信號(hào)。
[0067]麥克風(fēng)143可在呼叫模式、記錄模式、語音識(shí)別模式、相機(jī)模式、情境感知服務(wù)模式等下將接收到的聲音信號(hào)處理為電語音數(shù)據(jù)。在呼叫模式下,處理的語音數(shù)據(jù)被轉(zhuǎn)換為合適的形式,以通過移動(dòng)通信模塊111發(fā)送到基站。在情境感知服務(wù)模式下,處理的語音數(shù)據(jù)可被轉(zhuǎn)換為合適的形式,以通過語音識(shí)別單元170在控制單元180中進(jìn)行處理。麥克風(fēng)143可具有從接收的聲音信號(hào)去除噪聲的各種噪聲去除算法。當(dāng)接收到用于觸發(fā)情境感知服務(wù)或設(shè)置控制命令的用戶輸入時(shí),麥克風(fēng)143可創(chuàng)建相關(guān)輸入數(shù)據(jù)并將其傳送到控制單元 180。
[0068]存儲(chǔ)單元150可存儲(chǔ)與處理和控制控制單元180的操作相關(guān)聯(lián)的程序并暫時(shí)存儲(chǔ)輸入或?qū)⒈惠敵龅臄?shù)據(jù)(例如,控制命令、動(dòng)作、電話號(hào)碼、消息、音頻、視頻等)。存儲(chǔ)單元150還可存儲(chǔ)使用特定功能的頻率(例如,使用控制命令、應(yīng)用、電話號(hào)碼、消息、多媒體等的頻率)、特定功能的優(yōu)先級(jí)等。此外,存儲(chǔ)單元150可存儲(chǔ)具有特定形式且響應(yīng)于對(duì)于觸摸屏的觸摸輸入而輸出的振動(dòng)和聲音數(shù)據(jù)。更具體地講,存儲(chǔ)單元150可存儲(chǔ)命令表,其中,所述命令表包含從用戶定義的控制命令、根據(jù)控制命令的定義(例如,用戶定義)的動(dòng)作(或功能)、根據(jù)控制命令的情境信息、根據(jù)應(yīng)用的動(dòng)作執(zhí)行規(guī)則等中的映射關(guān)系。
[0069]此外,存儲(chǔ)單元150可在控制單元180的控制下緩存在情境感知服務(wù)中通過麥克風(fēng)143接收的音頻,并將緩存的音頻存儲(chǔ)為記錄的數(shù)據(jù)。在語音識(shí)別單元170由軟件形成的情況下,存儲(chǔ)單元150可存儲(chǔ)這樣的軟件。
[0070]存儲(chǔ)單元150可包括諸如閃存、硬盤、微類型存儲(chǔ)器、卡類型存儲(chǔ)器、隨機(jī)訪問存儲(chǔ)器(RAM)、靜態(tài)RAM (SRAM)、只讀存儲(chǔ)器(ROM)、可編程ROM (PR0M)、電可擦除PROM(EEPR0M)、磁RAM (MRAM)、磁盤、光盤等的至少一個(gè)存儲(chǔ)介質(zhì)。用戶裝置100可在互聯(lián)網(wǎng)上與執(zhí)行存儲(chǔ)單元150的存儲(chǔ)功能的任何種類的網(wǎng)頁存儲(chǔ)器交互。
[0071]接口單元160可充當(dāng)連接到用戶裝置100的外部裝置的通路。接口單元160可從任何外部裝置(例如,耳機(jī)200)接收數(shù)據(jù)或?qū)⒂脩粞b置100的數(shù)據(jù)發(fā)送到這樣的外部裝置。此外,接口單元160可從外部裝置(例如,電源裝置)接收電能并可將其分配到用戶裝置100中的各個(gè)元件。接口單元160可包括例如,但不限于,有線/無線耳機(jī)端口、充電器端口、有線/無線數(shù)據(jù)端口、存儲(chǔ)卡端口、音頻輸入/輸出端口、視頻輸入/輸出端口、用于連接具有識(shí)別模塊的任何裝置的端口等。
[0072]語音識(shí)別單元170可在情境感知服務(wù)中執(zhí)行語音識(shí)別操作,以通過使用語音識(shí)別來執(zhí)行用戶裝置100的各種功能并知道用戶情境。語音識(shí)別單元170可包括聲音記錄器171、引擎管理器173和語音識(shí)別引擎175。
[0073]聲音記錄器171可記錄從麥克風(fēng)143接收的音頻(例如,語音、通知等)以創(chuàng)建記錄的數(shù)據(jù)。
[0074]引擎管理器173可將從聲音記錄器171接收的記錄的數(shù)據(jù)傳送到語音識(shí)別引擎175,并可將從語音識(shí)別引擎175接收的識(shí)別結(jié)果傳送到控制單元180。當(dāng)從語音識(shí)別引擎175接收到被分析為控制命令的任何識(shí)別結(jié)果時(shí),引擎管理器173可創(chuàng)建相關(guān)控制命令并將其傳送到控制單元180。
[0075]語音識(shí)別引擎175可分析從引擎管理器173接收的記錄的數(shù)據(jù)。在實(shí)施例中,語音識(shí)別引擎175可確定記錄的數(shù)據(jù)是否包含定義的控制命令。如果記錄的數(shù)據(jù)包含任何定義的控制命令,則語音識(shí)別引擎175可將分析結(jié)果傳送到引擎管理器173。在實(shí)施例中,用于將輸入信號(hào)轉(zhuǎn)換為文本或語音的語音識(shí)別引擎175可包括用于將文本轉(zhuǎn)換為語音的文本-語音引擎和用于將語音轉(zhuǎn)換為文本的語音-文本引擎。
[0076]在實(shí)施例中,語音識(shí)別單元170可基于操作系統(tǒng)(OS)由軟件形成,以使用語音執(zhí)行與各種服務(wù)相關(guān)聯(lián)的操作。由軟件形成的語音識(shí)別單元170可被存儲(chǔ)或載入在存儲(chǔ)單元150、控制單元180或單獨(dú)的控制器(未示出)中。
[0077]控制單元180可控制用戶裝置100的總體操作。例如,控制單元180可執(zhí)行與語音呼叫、數(shù)據(jù)通信或視頻呼叫相關(guān)聯(lián)的控制處理。更具體地講,控制單元180可使用語音識(shí)別控制與情境感知服務(wù)相關(guān)聯(lián)的總體操作。在實(shí)施例中,控制單元180可控制設(shè)置用戶定義的控制命令的處理、通過語音識(shí)別執(zhí)行與控制命令對(duì)應(yīng)的情境感知的處理、執(zhí)行定義(例如,用戶定義)的動(dòng)作的處理、提供關(guān)于情境信息的反饋的處理。
[0078]控制單元180可根據(jù)用戶的輸入定義用于情境感知服務(wù)的控制命令,并可將其存儲(chǔ)在存儲(chǔ)單元150中。如果在情境感知服務(wù)中通過麥克風(fēng)143接收到與控制命令對(duì)應(yīng)的任何音頻,則控制單元180可執(zhí)行與接收到的音頻對(duì)應(yīng)的特定動(dòng)作。此外,控制單元180可控制與執(zhí)行的動(dòng)作相應(yīng)的情境信息的輸出。在實(shí)施例中,控制單元180可分析接收到的音頻的增益并將音頻的增益與參考增益進(jìn)行比較。如果音頻的增益大于參考增益,則控制單元180可執(zhí)行針對(duì)接收到的音頻的語音識(shí)別。此外,控制單元180可基于特定動(dòng)作控制在接收到與控制命令對(duì)應(yīng)的任何音頻時(shí)正在運(yùn)行的當(dāng)前播放模式,并控制在視覺、聽覺和觸覺中的至少一個(gè)方式下的情境信息的輸出。在輸出情境信息之后,控制單元180可繼續(xù)控制當(dāng)前播放模式。[0079]之后將參照附圖更充分地描述控制單元180。
[0080]電源單元190可在控制單元180的控制下提供用戶裝置100的操作所需的電能。
[0081]可以在任何種類的計(jì)算機(jī)可讀記錄介質(zhì)中使用軟件、硬件或它們的組合實(shí)現(xiàn)這里公開的各種實(shí)施例。在硬件的情況下,可使用專用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理裝置(DSPD)、可編程邏輯裝置((?0))、現(xiàn)場可編程門陣列斤?6々)、處理器、控制器、微處理器和任何其它等效電子電路中的至少一個(gè)實(shí)現(xiàn)這里公開的各種實(shí)施例。在任何情況下,可僅在控制單元180中實(shí)現(xiàn)這里公開的各種實(shí)施例。在軟件的情況下,可使用均可執(zhí)行這里討論的功能中的至少一個(gè)的單獨(dú)的軟件模塊實(shí)現(xiàn)這里公開的各種實(shí)施例。
[0082]在實(shí)施例中,計(jì)算機(jī)可讀記錄介質(zhì)可響應(yīng)于用戶輸入而記錄定義用于情境感知服務(wù)的控制命令的特定程序,可在通過麥克風(fēng)接收到與控制命令對(duì)應(yīng)的任何音頻時(shí)執(zhí)行特定動(dòng)作,并可處理與執(zhí)行的動(dòng)作相應(yīng)的情境信息的輸出。
[0083]圖3是示出根據(jù)本公開的實(shí)施例的在用戶裝置中執(zhí)行情境感知服務(wù)的示圖。
[0084]參照?qǐng)D3,如標(biāo)號(hào)310所示,用戶可連接用戶裝置100和耳機(jī)200。例如,期望通過耳機(jī)200接聽用戶裝置100中正在播放的媒體內(nèi)容的音頻的用戶可通過無線接口(例如,藍(lán)牙)或有線接口(例如,連接器)連接用戶裝置100和耳機(jī)200。
[0085]一旦耳機(jī)200在任何模式(例如,空閑模式、媒體內(nèi)容播放模式等)下連接到用戶裝置100,用戶裝置100可將音頻輸出路徑改變到耳機(jī)200。如標(biāo)號(hào)330所示,用戶裝置100可在屏幕上提供與情境感知服務(wù)相關(guān)聯(lián)的彈出窗口 300??筛鶕?jù)用戶的設(shè)置,可選擇地提供該彈出窗口 300。如果彈出窗口 300被設(shè)置為提供,則彈出窗口 300可在耳機(jī)200連接到用戶裝置100時(shí)自動(dòng)顯示。如果彈出窗口 300被設(shè)置為不提供,即,在自動(dòng)執(zhí)行類型的情況下,可在耳機(jī)200連接到用戶裝置100時(shí)自動(dòng)且在內(nèi)部執(zhí)行情境感知服務(wù)。
[0086]當(dāng)彈出窗口 300顯示在屏幕上時(shí),用戶可選擇彈出窗口 300中的執(zhí)行按鈕,使得情境感知服務(wù)可被立即執(zhí)行。響應(yīng)于用戶的選擇。用戶裝置100可從屏幕去除彈出窗口 300并可觸發(fā)情境感知服務(wù)的特定任務(wù)。例如,用戶裝置100可開啟麥克風(fēng)143以接收外部音頻并執(zhí)行針對(duì)接收到的音頻的語音識(shí)別。[0087]用戶可選擇彈出窗口 300中的設(shè)置按鈕,以便設(shè)置用于情境感知的控制命令。在圖4中示出相關(guān)屏幕截圖。在實(shí)施例中,一旦從彈出窗口 300選擇了設(shè)置按鈕,用戶裝置100可提供用于設(shè)置控制命令的屏幕界面。由標(biāo)號(hào)330指示的用戶裝置100的屏幕可被轉(zhuǎn)換為圖4中示出的屏幕。
[0088]圖4是示出根據(jù)本公開的實(shí)施例的顯示在用戶裝置上的控制命令的列表的屏幕截圖。
[0089]參照?qǐng)D4,用戶控制命令的屏幕界面可包括布置由用戶登記的控制命令的命令區(qū)域410和布置用于修改、添加或設(shè)置控制命令的菜單項(xiàng)的菜單區(qū)域430。在實(shí)施例中,控制命令可作為基于語音的輸入而通過麥克風(fēng)被輸入,控制命令可作為基于文本的輸入而通過輸入單元120 (未示出)或顯示單元130被輸入??梢砸栽~、短語、或句的形式的自然語言(例如,用戶的姓名(諸如“Michael”或“William”)、用戶的綽號(hào)(諸如“Mike”或“Bill”)、用戶的昵稱(諸如“甜心”或“親愛的”)、其它呼叫用語(諸如“你好”或“朋友”)和任何位置用語(諸如“首爾”、“首爾站”、“市政廳”或“下一站是首爾站”))的形式輸入用于控制命令的這樣的語音和文本。
[0090]期望立即使用情境感知服務(wù)的用戶可選擇屏幕界面的命令區(qū)域410中的至少一個(gè)控制命令并隨后選擇菜單區(qū)域430中的確認(rèn)按鈕。期望修改任何現(xiàn)有控制命令的用戶可選擇屏幕界面的命令區(qū)域410中的至少一個(gè)控制命令,并隨后選擇菜單區(qū)域430中的修改按鈕。期望另外登記新的控制命令的用戶可選擇屏幕界面的菜單區(qū)域430中的添加按鈕,并隨后基于文本或語音輸入新的控制命令。
[0091]盡管可根據(jù)圖3中示出的步驟提供圖4中示出的屏幕界面,這僅是示例性的,并不被視為限制性的??蛇x擇地或另外,可響應(yīng)于用戶的操作在任何時(shí)候調(diào)用圖4中示出的屏眷界面。
[0092]如果至少一個(gè)控制命令通過屏幕界面被設(shè)置,則用戶裝置100可觸發(fā)情境感知服務(wù)并開啟麥克風(fēng)143以接收外部音頻并執(zhí)行針對(duì)接收到的音頻的語音識(shí)別。
[0093]圖3示出當(dāng)耳機(jī)200連接到用戶裝置100時(shí),用于情境感知服務(wù)的彈出窗口 300被提供或者情境感知服務(wù)被自動(dòng)執(zhí)行。然而,這僅是示例性的并不被視為限制性的??蛇x擇地,可響應(yīng)于用戶的菜單操作來執(zhí)行情境感知服務(wù)而不管耳機(jī)200是否連接。另外,可在任何媒體內(nèi)容開始播放時(shí)執(zhí)行情境感知服務(wù)。還可響應(yīng)于用戶定義的情境(例如,用戶定義的特定位置(例如,家、辦公室、學(xué)校等))來執(zhí)行情境感知服務(wù)。
[0094]圖5是示出根據(jù)本公開的實(shí)施例的用于使用語音識(shí)別來提供情境感知服務(wù)的方法的流程圖。
[0095]參照?qǐng)D5,在操作501,控制單元180可觸發(fā)情境感知服務(wù)。在實(shí)施例中,可在耳機(jī)200連接到用戶裝置100或在檢測到用戶定義的特定情境時(shí),響應(yīng)于用戶的菜單操作執(zhí)行情境感知服務(wù)。
[0096]在操作503,控制單元180可確定是否存在設(shè)置控制命令的請(qǐng)求。如果存在設(shè)置控制命令的請(qǐng)求,則在操作505,控制單元180可響應(yīng)于用戶的輸入來設(shè)置控制命令。例如,如圖4所示,控制單元180可提供設(shè)置控制命令的屏幕界面并根據(jù)通過屏幕界面的用戶輸入,可添加基于文本或語音的新的控制命令,或選擇預(yù)登記的控制命令中的至少一個(gè)。另外,控制單元180可將添加或選擇的控制命令設(shè)置為用于情境感知服務(wù)的控制命令。[0097]如果不存在設(shè)置控制命令的請(qǐng)求或當(dāng)完成了設(shè)置控制命令的處理時(shí),控制單元180可在操作507激活麥克風(fēng)143。在實(shí)施例中,如果麥克風(fēng)143關(guān)閉,則控制單元180可開啟麥克風(fēng)143,并等待麥克風(fēng)143接收外部音頻。因此,如果麥克風(fēng)143已開啟,則可跳過操作507。
[0098]當(dāng)在操作509,通過麥克風(fēng)143接收到音頻時(shí),控制單元180可在操作511執(zhí)行針對(duì)接收到的音頻的語音識(shí)別。
[0099]在操作513,控制單元180可將語音識(shí)別的音頻與用戶定義的控制命令進(jìn)行比較,并可在操作515確定語音識(shí)別的音頻與特定用戶定義的控制命令對(duì)應(yīng)。在操作515,控制單元180可確定語音識(shí)別的音頻是否與特定控制命令一致(或包含任何控制命令)。例如,在用戶定義的控制命令為“首爾站”的情況下,控制單元180可確定語音識(shí)別的音頻是否為“首爾站”或?yàn)榘笆谞栒尽钡亩陶Z(例如,“下一站是首爾站”)。在操作513,可關(guān)于從語音識(shí)別的音頻轉(zhuǎn)換的文本執(zhí)行語音識(shí)別的音頻與用戶定義的控制命令的比較。
[0100]如果在操作515語音識(shí)別的音頻不與任何控制命令對(duì)應(yīng),則控制單元180可返回到操作509。如果在操作515語音識(shí)別的音頻與特定控制命令對(duì)應(yīng),則在操作517控制單元180可識(shí)別映射到特定控制命令的特定動(dòng)作。
[0101]在實(shí)施例中,在操作519,控制單元180可執(zhí)行識(shí)別的特定動(dòng)作,并可在操作521輸出與動(dòng)作的執(zhí)行相關(guān)聯(lián)的情境信息。例如,假設(shè)用戶定義的控制命令為“首爾站”,并且與控制命令映射的特定動(dòng)作為暫停媒體內(nèi)容的回放或輸出識(shí)別的音頻(例如,“下一站是首爾站”)。隨后,控制單元180可暫停媒體內(nèi)容的回放,并通過揚(yáng)聲器141或通過耳機(jī)200 (如果連接有耳機(jī)200)輸出識(shí)別的音頻(例如,“下一站是首爾站”)??蛇x擇地,如果與控制命令映射的特定動(dòng)作為保持媒體內(nèi)容的回放和將識(shí)別的音頻顯示在屏幕上,則控制單元180可在保持媒體內(nèi)容的回放的同時(shí)控制顯示單元130以覆蓋形式將識(shí)別的音頻(例如,“下一站是首爾站”)顯示在媒體內(nèi)容的屏幕上。
[0102]圖6是示出根據(jù)本公開的另一實(shí)施例的使用語音識(shí)別提供情境感知服務(wù)的方法的流程圖。
[0103]參照?qǐng)D6,當(dāng)在操作601檢測到耳機(jī)200的連接時(shí),控制單元180可在操作603觸發(fā)情境感知服務(wù)。此時(shí),控制單元180可檢查麥克風(fēng)143的狀態(tài),并且如果麥克風(fēng)143關(guān)閉,則可開啟麥克風(fēng)143來接收外部音頻。
[0104]在操作605,控制單元180可確定是否存在設(shè)置控制命令的用戶請(qǐng)求。例如,控制單元180可提供如圖3所示的彈出窗口 300,并可確定是否通過彈出窗口 300接收到用于設(shè)置控制命令的任何用戶輸入。
[0105]如果存在設(shè)置控制命令的請(qǐng)求,則在操作607控制單元180可響應(yīng)于用戶的輸入而設(shè)置控制命令,并隨后進(jìn)行到操作609。如果不存在設(shè)置控制命令的請(qǐng)求,則控制單元180可直接進(jìn)行到操作609。
[0106]在操作609,控制單元180可響應(yīng)于用戶的請(qǐng)求來執(zhí)行回放模式。例如,控制單元180可播放由用戶請(qǐng)求的媒體內(nèi)容(例如,音樂文件、視頻文件等)或接收和播放由用戶選擇的頻道的廣播節(jié)目??蛇x擇地,控制單元180可執(zhí)行用戶請(qǐng)求的游戲功能,或可執(zhí)行圖像捕捉功能。在實(shí)施例中,在回放模式下,用戶裝置100可執(zhí)行任何類型的可執(zhí)行功能。
[0107]當(dāng)在操作611通過麥克風(fēng)143接收到音頻時(shí),控制單元180可在操作613分析接收到的音頻的增益。在操作615,控制單元180可確定分析的音頻增益是否滿足給定條件(例如,參考增益)。例如,控制單元180可分析接收到的音頻的增益并隨后確定音頻增益是否大于參考增益。在實(shí)施例中,參考增益可以是由用戶定義的特定值(即,特定分貝值)或通過麥克風(fēng)143接收到的音頻輸入的平均值(S卩,平均分貝值)。在后面的情況下,控制單元180可獲得通過麥克風(fēng)143接收到的音頻輸入的增益并隨后計(jì)算平均值。需要該操作,以便不執(zhí)行針對(duì)不期望的噪聲的不必要的語音識(shí)別處理。
[0108]如果在操作615,分析的音頻增益不滿足給定條件(例如,當(dāng)分析的音頻增益不大于參考增益時(shí)),則控制單元180可返回到操作611。如果在操作615,分析的音頻增益滿足給定條件(例如,當(dāng)分析的音頻增益大于參考增益時(shí)),則控制單元180可在操作617執(zhí)行語音識(shí)別。
[0109]在操作619,控制單元180可將語音識(shí)別的音頻與用戶識(shí)別的控制命令進(jìn)行比較,并可在操作621確定語音識(shí)別的音頻是否與特定用戶定義的控制命令對(duì)應(yīng)。此時(shí),控制單元180可確定語音識(shí)別的音頻是否與特定控制命令一致或包括如上所述的任何控制命令。
[0110]如果在操作621語音識(shí)別的音頻不與任何控制命令對(duì)應(yīng),則控制單元180可返回到操作611。
[0111]如果在操作621語音識(shí)別的音頻與特定控制命令對(duì)應(yīng),則控制單元180可在操作623控制回放模式。例如,控制單元180可暫?;胤拍J?,調(diào)整耳機(jī)200的輸出音量(例如,靜音輸出),或在保持回放模式的同時(shí)執(zhí)行音頻的靜音輸出。控制單元180可在操作625輸出與控制命令映射的情境信息。例如,控制單元180可通過經(jīng)由彈出顯示、音頻輸出等輸出情境信息來向用戶提供反饋。
[0112]在輸出情境信息之后,在操作627控制單元180可重新開始回放模式。例如,控制單元180可釋放暫停的回放模式并隨后重新開始播放,可將輸出音量重新調(diào)整為先前的音量,或可恢復(fù)當(dāng)前播放的音頻的輸出音量。
[0113]圖7示出根據(jù)本公開的實(shí)施例的使用語音識(shí)別來提供情境感知服務(wù)的處理。
[0114]參照?qǐng)D7,在操作710,用戶可預(yù)先設(shè)置用于情境感知服務(wù)的控制命令或可在期望的時(shí)間設(shè)置觸發(fā)情境感知服務(wù)。例如,用戶裝置100可將“Michael”設(shè)置為用戶定義的控制命令。在操作720,用戶可將耳機(jī)200連接到用戶裝置100并還播放用戶裝置100中的選擇的音樂文件。在操作730,用戶裝置100可通過耳機(jī)200輸出選擇的音樂文件的音頻并可執(zhí)行語音識(shí)別解決方案(包括語音記錄)。
[0115]如果通過麥克風(fēng)143接收到用于呼叫用戶的外部音頻(例如,語音指示,“Michaelblah-blah-blah”),則用戶裝置100可在操作740通過語音識(shí)別將接收到的音頻識(shí)別為控制命令,并可在操作750暫停音樂文件的回放。此外,在操作760,用戶裝置100可通過耳機(jī)200輸出識(shí)別的音頻(或控制命令)以將反饋提供給用戶。在實(shí)施例中,通過經(jīng)由耳機(jī)200輸出識(shí)別的音頻,用戶裝置100可允許用戶知道音樂由于預(yù)定的情境而停止。
[0116]此外,如果識(shí)別到音頻的方向,則用戶裝置100可將其反映在將通過耳機(jī)200被輸出的識(shí)別的音頻(或控制命令)中。例如,如果某人從用戶的右側(cè)呼叫用戶并陳述例如,“Michael blah-blah-blah”,則用戶裝置100可通過耳機(jī)200的右揚(yáng)聲器輸出識(shí)別的音頻(或控制命令),或可增加右揚(yáng)聲器的相對(duì)音量,以便提高用戶的感知。
[0117]圖8示出根據(jù)本公開的另一實(shí)施例的使用語音識(shí)別來提供情境感知服務(wù)的處理。[0118]參照?qǐng)D8,在操作810,觀看或接聽視頻講座的用戶可在市政廳站乘坐地鐵。隨后,在操作820,用戶可將期望的目的地(例如,首爾站)設(shè)置為用于情境感知服務(wù)的控制命令,并可觸發(fā)情境感知服務(wù)??赏ㄟ^語音或文本輸入來設(shè)置控制命令。在操作820,用戶可仍然觀看或接聽視頻講座。
[0119]在操作830,用戶裝置100可在控制視頻講座的回放的同時(shí)執(zhí)行情境感知服務(wù)。在這種狀態(tài)下,可接收到與預(yù)定控制命令(例如,首爾站)相應(yīng)的特定通知(“下一站是首爾站”)。隨后,在操作840,用戶裝置100可從通知識(shí)別控制命令(例如,首爾站)。此外,在操作850,用戶裝置100可記錄識(shí)別的音頻并可將識(shí)別的音頻輸出在正在播放的視頻上。例如,可以將作為情境信息顯示的通知(例如,“下一站是首爾站”)以覆蓋形式顯示在當(dāng)前正在播放的視頻的屏幕上。
[0120]可通過計(jì)算機(jī)程序指令實(shí)現(xiàn)本公開的上述實(shí)施例??蓪⑦@些計(jì)算機(jī)程序指令提供到通用計(jì)算機(jī)、專用計(jì)算機(jī)的處理器、或用于產(chǎn)生機(jī)器的其它可編程數(shù)據(jù)處理設(shè)備,使得經(jīng)由計(jì)算機(jī)的處理器或其它可編程數(shù)據(jù)處理設(shè)備執(zhí)行的指令創(chuàng)建用于實(shí)現(xiàn)流程圖或框圖中指出的功能的裝置。這些計(jì)算機(jī)程序指令還可被存儲(chǔ)在可命令計(jì)算機(jī)或其它可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可用存儲(chǔ)器或計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在計(jì)算機(jī)可用存儲(chǔ)器或計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括實(shí)現(xiàn)流程圖或框圖中指出的功能的指令裝置的制造品。計(jì)算機(jī)程序指令還可被載入到計(jì)算機(jī)或其它可編程數(shù)據(jù)處理設(shè)備上以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,使得在計(jì)算機(jī)或其它可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖或框圖中指出的功能的步驟。
[0121]流程圖說明中的每個(gè)框可表示一個(gè)模塊、段、代碼段,其包括用于實(shí)現(xiàn)特定邏輯功能的一個(gè)或多個(gè)可執(zhí)行指令。還應(yīng)注意,在一些可替代實(shí)現(xiàn)方式中,在框中指出的功能可以不按順序發(fā)生。例如,事實(shí)上,根據(jù)涉及的功能,可基本上同時(shí)執(zhí)行順序示出的兩個(gè)框,或者有時(shí)可按相反順序執(zhí)行框。
[0122]如這里所使用的,術(shù)語“單元”表示諸如現(xiàn)場可編程門陣列(FPGA)或?qū)S眉呻娐?ASIC)的軟件或硬件構(gòu)件,“單元”執(zhí)行一些任務(wù)。然而,“單元”不總限于軟件或硬件。“單元”可被構(gòu)造為被存儲(chǔ)在可編址存儲(chǔ)介質(zhì)中并充當(dāng)至少一個(gè)處理器。因此,例如,“單元”包括軟件構(gòu)件、面向?qū)ο蟮能浖?gòu)件、類構(gòu)件、任務(wù)構(gòu)件、處理、函數(shù)、屬性、過程、子例程、程序代碼段、驅(qū)動(dòng)程序、固件、微代碼、電路、數(shù)據(jù)、數(shù)據(jù)庫、數(shù)據(jù)結(jié)構(gòu)、表格、數(shù)組和變量。由構(gòu)件和“單元”提供的功能可被結(jié)合在更少數(shù)量的構(gòu)件和“單元”中,或者拆分在其它構(gòu)件和“單元”之中。此外,這樣的構(gòu)件和“單元”可被實(shí)現(xiàn),以充當(dāng)裝置或安全多媒體卡中的至少一個(gè)CPU。
[0123]盡管已參照本公開的各種實(shí)施例具體示出和描述了本公開,但是本領(lǐng)域技術(shù)人員將理解,在不脫離由權(quán)利要求及其等同物限定的本公開的精神和范圍的情況下,可在形式和細(xì)節(jié)上做出各種改變。
【權(quán)利要求】
1.一種用于提供情境感知服務(wù)的方法,所述方法包括: 根據(jù)用戶輸入來定義用于情境感知服務(wù)的控制命令; 響應(yīng)于用戶選擇來觸發(fā)回放模式和情境感知服務(wù); 在回放模式下通過麥克風(fēng)接收外部音頻; 確定接收到的音頻是否與控制命令對(duì)應(yīng); 當(dāng)接收到的音頻與控制命令對(duì)應(yīng)時(shí),執(zhí)行分配到控制命令的特定動(dòng)作。
2.如權(quán)利要求1所述的方法,其中,確定接收到的音頻是否與控制命令對(duì)應(yīng)的步驟包括: 分析接收到的音頻的增益,并且當(dāng)接收到的音頻的增益滿足給定條件時(shí)執(zhí)行語音識(shí)別; 將通過語音識(shí)別識(shí)別到的音頻與控制命令進(jìn)行比較。
3.如權(quán)利要求2所述的方法,其中,執(zhí)行語音識(shí)別的步驟包括: 分析接收到的音頻的增益; 將接收到的音頻的增益與參考增益進(jìn)行比較; 當(dāng)接收到的增益大于參考增`益時(shí),執(zhí)行語音識(shí)別。
4.如權(quán)利要求3所述的方法,其中,參考增益包括由用戶定義的特定值和通過麥克風(fēng)接收到的音頻輸入的平均值。
5.如權(quán)利要求2所述的方法,其中,確定接收到的音頻是否與控制命令對(duì)應(yīng)的步驟包括:確定接收到的音頻是否與控制命令一致或包括控制命令。
6.如權(quán)利要求2所述的方法,其中,執(zhí)行特定動(dòng)作的步驟包括:當(dāng)接收到的音頻與控制命令對(duì)應(yīng)時(shí),控制回放模式。
7.如權(quán)利要求6所述的方法,還包括: 輸出與特定動(dòng)作的執(zhí)行相應(yīng)的情境信息。
8.如權(quán)利要求7所述的方法,其中,輸出情境信息的步驟包括重新開始控制的回放模式。
9.如權(quán)利要求1所述的方法,其中,基于自然語言以語音或文本輸入控制命令。
10.如權(quán)利要求1所述的方法,其中,在耳機(jī)連接到用戶裝置時(shí)執(zhí)行情境感知服務(wù)的觸發(fā)。
11.如權(quán)利要求7所述的方法,其中,情境信息的輸出被執(zhí)行,以通過視覺、聽覺和觸覺中的至少一個(gè)被感知。
12.—種用戶裝置,包括: 麥克風(fēng),被構(gòu)造為接收外部首頻; 存儲(chǔ)單元,被構(gòu)造為存儲(chǔ)包括用戶定義的控制命令、根據(jù)控制命令的特定動(dòng)作和情境信息的映射關(guān)系的命令表; 語音識(shí)別單元,被構(gòu)造為在情境感知服務(wù)中執(zhí)行語音識(shí)別以識(shí)別用戶情境; 控制單元,被構(gòu)造為根據(jù)用戶輸入來定義用于情境感知服務(wù)的控制命令,并在通過麥克風(fēng)接收到與控制命令對(duì)應(yīng)的特定音頻時(shí)執(zhí)行與特定音頻映射的特定動(dòng)作。
13.如權(quán)利要求12所述的用戶裝置,還包括: 顯示單元,被構(gòu)造為顯示用于設(shè)置控制命令的屏幕界面并顯示與特定動(dòng)作的執(zhí)行對(duì)應(yīng)的情境信息。
14.如權(quán)利要求13所述的用戶裝置,其中,控制單元還被構(gòu)造為控制顯示單元顯示與特定動(dòng)作的執(zhí)行相應(yīng)的情境信息。
15.如權(quán)利要求12所述的用戶裝置,其中,控制單元還被構(gòu)造為分析接收到的音頻的增益以將接收到的音頻與參考增益進(jìn)行比較,并在接收到的音頻的增益大于參考增益時(shí),執(zhí)行語音識(shí)別。
16.如權(quán)利要求12所述的用戶裝置,其中,控制單元還被構(gòu)造為當(dāng)接收到與控制命令對(duì)應(yīng)的音頻時(shí)根據(jù)特定動(dòng)作來控制回放模式,輸出通過視覺、聽覺和觸覺中的至少一個(gè)感知的情境信息并在輸出情境信`息之后重新開始控制的回放模式。
【文檔編號(hào)】G06F3/01GK103869971SQ201310670710
【公開日】2014年6月18日 申請(qǐng)日期:2013年12月10日 優(yōu)先權(quán)日:2012年12月10日
【發(fā)明者】樸珍, 鄭智連 申請(qǐng)人:三星電子株式會(huì)社