以語音識別來發(fā)生事件裝置及方法

文檔序號：2827366閱讀：141來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

以語音識別來發(fā)生事件裝置及方法
【專利摘要】本發(fā)明涉及一種以語音識別來事件發(fā)生裝置及方法，本發(fā)明的事件發(fā)生裝置是以語音識別來發(fā)生事件（event）的裝置，其特征在于，包括一個(gè)以上的處理裝置，所述一個(gè)以上的處理裝置，其構(gòu)成為，基于用戶的語音獲取輸入信息，基于應(yīng)用程序的畫面信息來獲取的至少一個(gè)的識別信息與輸入信息匹配，在識別信息中獲取與輸入信息匹配的匹配識別信息，在與匹配識別信息對應(yīng)領(lǐng)域中，至少在一部分領(lǐng)域中發(fā)生事件；在使用用戶事前未內(nèi)置控制指令的應(yīng)用程序時(shí)，也可以通過語音識別來控制電子裝置，具有可提高該電子裝置的用戶接近性的效果。
【專利說明】以語音識別來發(fā)生事件裝置及方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種以語音識別來發(fā)生事件的裝置和方法，尤其是利用基于應(yīng)用程序畫面信息而獲取的識別信息，通過語音識別發(fā)生事件的裝置和方法。

【背景技術(shù)】
[0002]隨著使用電腦、筆記本電腦、智能手機(jī)、平板電腦、汽車導(dǎo)航儀等電子裝置的用戶越來越多，這些電子裝置與用戶間易于人機(jī)交互的用戶界面的重要性也越來越高。
[0003]一般的用戶界面多是通過鍵盤、鼠標(biāo)、觸控屏幕等輸入裝置進(jìn)行物理性輸入，但是對于無法看到顯示畫面的視覺殘疾人，或是不便于使用操作鍵盤、鼠標(biāo)、觸控屏幕等輸入裝置的用戶來說，通過上述的用戶界面來操作電子裝置是不容易的。
[0004]另外，對于沒有殘疾的人來說，在駕駛中或是雙手拿著行李不便于或是很難對電子裝置進(jìn)行操作時(shí)，通過上述用戶界面不易于操作電子裝置。
[0005]由此可見，開發(fā)出可提高電子裝置接近性的用戶界面勢在必行。可提高電子裝置接近性的用戶界面中，如分析用戶語音控制電子裝置的語音識別技術(shù)就屬其一。
[0006]為了實(shí)現(xiàn)電子裝置利用語音識別技術(shù)，通過用戶的語音來進(jìn)行控制，需要事先將可與用戶語音匹配的控制指令內(nèi)置在電子裝置中。
[0007]在將可與用戶語音匹配的控制指令內(nèi)置在平臺端時(shí)，通過語音識別，可對相關(guān)電子裝置的基本設(shè)定，如電子裝置的音量或亮度等進(jìn)行控制。
[0008]此外，為了通過語音識別對個(gè)性的應(yīng)用程序進(jìn)行控制，在各個(gè)應(yīng)用程序上，必須內(nèi)置可與用戶語音匹配的控制指令。
[0009]因此，為了在不支持語音識別的應(yīng)用程序中進(jìn)行語音識別，或是為了添加語音識別功能，需要對應(yīng)用程序進(jìn)行新的開發(fā)或是升級，以便在相關(guān)的應(yīng)用程序上內(nèi)置與用戶語音匹配的控制指令。
[0010]但是，電子裝置和各個(gè)電子裝置所搭載的應(yīng)用程序日新月異、多種多樣，在所有的應(yīng)用程序上內(nèi)置與用戶語音匹配的控制指令并不容易，在多種多樣的應(yīng)用程序中實(shí)現(xiàn)可聯(lián)動(dòng)通用的語音識別系統(tǒng)就更為不易。
[0011]綜上所述，支持語音識別的應(yīng)用程序很少，即使支持語音識別，通過語音識別而執(zhí)行的動(dòng)作也很有限，實(shí)質(zhì)上提高電子裝置的接近性也是非常有限的。
[0012]由此可見，開發(fā)通過語音識別來提高電子裝置接近性的技術(shù)，是勢在必行的。

【發(fā)明內(nèi)容】

[0013]為了解決上述技術(shù)問題，本發(fā)明的目的在于，提供一種在使用用戶事前未內(nèi)置控制指令的應(yīng)用程序時(shí)，也可以通過語音識別控制電子裝置的裝置及方法。
[0014]為了解決上述技術(shù)問題，本發(fā)明的另一目的在于，提供一種利用應(yīng)用程序的畫面信息，提供直觀的語音識別系統(tǒng)的裝置及方法。
[0015]本發(fā)明的發(fā)明目的并不局限于此，在此未提及的其他發(fā)明目的通過本說明書的記載，是本【技術(shù)領(lǐng)域】的技術(shù)人員顯而易見的。
[0016]本發(fā)明實(shí)現(xiàn)上述目的的技術(shù)方案是:一種事件發(fā)生裝置，是以語音識別來發(fā)生事件(價(jià)^社)的裝置，其特征在于，包括一個(gè)以上的處理裝置；所述一個(gè)以上的處理裝置，基于用戶的語音獲取輸入信息，基于應(yīng)用程序的畫面信息來獲取的至少一個(gè)的識別信息與所述輸入信息匹配；在所述識別信息中獲取與所述輸入信息匹配的匹配識別信息；在與所述匹配識別信息對應(yīng)的領(lǐng)域中，至少在一部分領(lǐng)域中發(fā)生事件。
[0017]本發(fā)明的另一技術(shù)特征是:所述識別信息是通過光學(xué)字符識別
[0018]本發(fā)明的另一技術(shù)特征是:所述輸入信息包括分析所述用戶的語音特征而獲取的語音模式信息；所述識別信息和所述輸入信息的匹配包括所述識別信息和所述語音模式信息的匹配。
[0019]本發(fā)明的另一技術(shù)特征是:所述輸入信息包括通過語音識別，由所述用戶的語音而識別的文本06X0；所述識別信息和所述輸入信息的匹配包括所述識別信息和所述文本的匹配。
[0020]本發(fā)明的另一技術(shù)特征是:所述一個(gè)以上的處理裝置，基于用戶語音獲取附加輸入信息，基于所述附加輸入信息決定所述事件的類型。
[0021]本發(fā)明實(shí)現(xiàn)上述目的的另一技術(shù)方案是:一種事件發(fā)生裝置，是以語音識別來發(fā)生事件(價(jià)一社)的裝置，其特征在于，包括一個(gè)以上的處理裝置；所述一個(gè)以上的處理裝置，基于用戶的語音獲取輸入信息，基于應(yīng)用程序的畫面信息來獲取的至少一個(gè)的識別信息與輸入信息匹配；在所述識別信息中獲取與所述輸入信息匹配的匹配識別信息；與所述匹配識別信息對應(yīng)，生成控制客體；發(fā)生所述控制客體的事件。
[0022]本發(fā)明實(shí)現(xiàn)上述目的的另一技術(shù)方案是:一種事件發(fā)生方法，是以語音識別來發(fā)生事件(6760)的方法，其特征在于，包括:基于用戶的語音獲取輸入信息的步驟；基于應(yīng)用程序的畫面信息來獲取的至少一個(gè)的識別信息與所述輸入信息匹配的步驟；在所述識別信息中獲取與所述輸入信息匹配的匹配識別信息的步驟；及在與匹配識別信息對應(yīng)的領(lǐng)域中，至少在一部分領(lǐng)域中發(fā)生事件的步驟。
[0023]本發(fā)明的另一技術(shù)特征是:所述識別信息是通過光學(xué)字符識別
[0024]本發(fā)明的另一技術(shù)特征是:所述輸入信息包括分析所述用戶的語音特征而獲取的語音模式信息；所述識別信息和所述輸入信息的匹配包括所述識別信息和所述語音模式信息的匹配。
[0025]本發(fā)明的另一技術(shù)特征是:所述輸入信息包括通過語音識別，由所述用戶的語音而識別的文本06X0；所述識別信息和所述輸入信息的匹配包括所述識別信息和所述文本的匹配。
[0026]本發(fā)明的另一技術(shù)特征是:包括:基于用戶語音獲取附加輸入信息的步驟；及基于所述附加輸入信息決定所述事件的類型的步驟。
[0027]本發(fā)明實(shí)現(xiàn)上述目的的另一技術(shù)方案是:一種事件發(fā)生方法，是以語音識別來發(fā)生事件(6760)的裝置，其特征在于，包括:基于用戶的語音獲取輸入信息的步驟；基于應(yīng)用程序的畫面信息來獲取的至少一個(gè)的識別信息與輸入信息匹配的步驟；基于所述識別信息生成控制客體的步驟；在所述識別信息中獲取與所述輸入信息匹配的匹配識別信息的步驟；發(fā)生所述控制客體的事件的步驟。
[0028]本發(fā)明實(shí)現(xiàn)上述目的的另一技術(shù)方案是:一種可電腦判讀的媒體，是包括指令集的可電腦判讀的媒體，其特征在于，所述指令集因電腦裝置而被執(zhí)行時(shí)，可讓所述電腦裝置獲取基于用戶語音的輸入信息，基于應(yīng)用程序畫面信息獲取的至少一個(gè)的識別信息與所述輸入信息匹配，在所述識別信息中獲取與所述輸入信息匹配的匹配識別信息，在與所述匹配識別信息對應(yīng)的領(lǐng)域中，至少在一部分領(lǐng)域中發(fā)生事件。
[0029]其他實(shí)施方式的具體內(nèi)容包含在本發(fā)明的詳細(xì)說明及說明書附圖中。
[0030]本發(fā)明的有益效果是:依據(jù)本發(fā)明，在使用用戶事前未內(nèi)置控制指令的應(yīng)用程序時(shí)，也可以通過語音識別控制電子裝置，具有提高相關(guān)電子裝置接近性的效果。
[0031]依據(jù)本發(fā)明，利用應(yīng)用程序畫面信息，可提供直觀的語音識別系統(tǒng)，因此具有通過語音識別提高用戶與相關(guān)電子裝置接近性的效果。
[0032]本發(fā)明的效果并不局限于上述內(nèi)容，本發(fā)明還具有其他多種效果。

【專利附圖】

【附圖說明】
[0033]圖1是本發(fā)明一實(shí)施方式的事件發(fā)生裝置的方塊圖；
[0034]圖2是本發(fā)明一實(shí)施方式的事件發(fā)生方法的流程圖；
[0035]圖3圖示了本發(fā)明一實(shí)施方式的基于應(yīng)用程序畫面信息獲取的識別信息；
[0036]圖4圖示了本發(fā)明另一實(shí)施方式的基于應(yīng)用程序畫面信息獲取的識別信息；
[0037]圖5圖示了本發(fā)明一實(shí)施方式的與所獲取識別信息對應(yīng)的控制客體的生成模樣；
[0038]圖6是本發(fā)明一實(shí)施方式的事件的發(fā)生裝置的一示例圖；
[0039]圖7是本發(fā)明一實(shí)施方式的事件的發(fā)生裝置的另一示例圖。
[0040]附圖符號說明
[0041]100、控制客體選擇裝置；110、界面；120、處理器；122、內(nèi)存控制器；124、內(nèi)存；130、顯示部；140、話筒；142、揚(yáng)聲器；150、160、應(yīng)用程序；151八、152八、153八、154八、文本；1518、1528、1538、1548、識別信息:155356^1^2^3^4,161、162、163、164、165、166、控制客體；157、對話；167、168、169、瀏覽；200、控制客體的信息；251、252、253、254、控制客體的位置信息；231、232、233、234、控制客體的說明信息；2、事件

【具體實(shí)施方式】
[0042]本發(fā)明的優(yōu)點(diǎn)及特征，以及實(shí)現(xiàn)其優(yōu)點(diǎn)及特征的方法，將結(jié)合本發(fā)明的附圖，通過以下的實(shí)施方式進(jìn)行明確的說明。但是，本發(fā)明并不局限于以下的實(shí)施方式，可為多種形態(tài)，本發(fā)明的實(shí)施方式用于說明本發(fā)明的特征，用于在本發(fā)明的【技術(shù)領(lǐng)域】，向相關(guān)技術(shù)人員說明本發(fā)明的范圍，本發(fā)明的范圍取決于本發(fā)明的權(quán)利要求項(xiàng)的范圍。
[0043]“第一”、“第二”等表現(xiàn)用于說明多種構(gòu)成要素，但是本發(fā)明的構(gòu)成要素并不局限于此。這中表現(xiàn)只用來區(qū)分不同的構(gòu)成要素，也就是說，本發(fā)明中的第一構(gòu)成要素也可以被稱為第二構(gòu)成要素。
[0044]在說明書中所標(biāo)記的相同的符號是指相同的構(gòu)成要素。
[0045]本發(fā)明的多個(gè)實(shí)施方式的各自特征可部分或全部的結(jié)合或組合，本發(fā)明【技術(shù)領(lǐng)域】的技術(shù)人員可通過充分理解其內(nèi)容，進(jìn)行多種多樣的技術(shù)性聯(lián)動(dòng)或驅(qū)動(dòng)，各實(shí)施方式可相對獨(dú)立，也可結(jié)合實(shí)施。
[0046]在本說明書中，在任何一個(gè)構(gòu)成要素向其他構(gòu)成要素“傳送”數(shù)據(jù)或信號時(shí)，可以是直接傳送所述數(shù)據(jù)或信號，也可以是通過至少一個(gè)以上的其他構(gòu)成要素來傳送數(shù)據(jù)和信號。
[0047]為了說明本發(fā)明，以下對用于進(jìn)行定義。
[0048]“語音識別”一般是指用戶所發(fā)出的聲音被電子裝置分析，并以文本來識別的作業(yè)。具體來說，用戶所發(fā)出聲音的波形被輸入電子裝置時(shí)，參照音響型號等，語音波形被分析，從而獲取語音模式信息。另外，所獲取的語音模式信息與識別信息進(jìn)行對比，從而識別出識別信息中一致概率最高的文本。
[0049]“事件”是指程序中所偵測的活動(dòng)或事件，按照事件的類型，舉例來說有用于處理輸入的輸入事件、用于處理輸出的輸出事件、用于選擇特定客體的選擇事件等。
[0050]在此，輸入事件通常是通過鼠標(biāo)、觸控板、觸控屏幕、鍵盤等輸入裝置，進(jìn)行點(diǎn)擊、觸控、鍵入等輸入時(shí)而發(fā)生的，但是即使不通過上述輸入裝置進(jìn)行實(shí)際輸入，也可以處理虛擬的輸入，發(fā)生輸入事件。
[0051]另外，輸入事件一般來說是通過鼠標(biāo)、觸控面板、觸控屏幕、鍵盤等輸入裝置進(jìn)行點(diǎn)擊、觸控、鍵入等輸入，但是即使不通過上述的輸入裝置進(jìn)行實(shí)質(zhì)性的輸入，進(jìn)行虛擬的輸入時(shí)，也可以發(fā)生輸入事件。
[0052]此外，輸入事件依據(jù)輸入裝置，其輸入類型也有所不同。比如說，可以是左點(diǎn)擊事件、右點(diǎn)擊事件、雙擊事件、滾標(biāo)事件等。在觸控面板或觸控屏幕等輸入裝置上，也可以是觸擊事件、長觸擊事件、雙觸擊事件等。
[0053]這些輸入事件基于輸入裝置、輸入模式、輸入位置、輸入維持時(shí)間等信息而發(fā)生。
[0054]另外，選擇事件為了選擇控制客體而發(fā)生，將控制客體作為目標(biāo)(仏1^60發(fā)生選擇事件時(shí)，該控制客體被選擇。或是發(fā)生控制客體的上述輸入事件時(shí)，控制可會(huì)被選擇。
[0055]事件不局限于上述的輸入事件、選擇事件、輸出事件，還可以包括在程序中被偵測到的多種事件。
[0056]在本說明書中，“輸入信息”是指基于用戶的語音，經(jīng)過前述的部分或是全部的語音識別過程而獲取的信息。比如說，輸入信息可以是分析用戶的語音波形而獲取的語音模式信息。這種語音模式信息為了表現(xiàn)聲學(xué)特征，由按照短區(qū)間從用戶的語音中提取的語音特征系數(shù)構(gòu)成。
[0057]在本說明書中，“應(yīng)用程序的畫面信息”是指在控制客體選擇裝置所執(zhí)行的應(yīng)用程序中，顯示特定畫面時(shí)所使用的信息。
[0058]在本說明書中，“識別信息”是通過事件發(fā)生裝置基于應(yīng)用程序畫面信息自動(dòng)獲取的文本。分析用戶的語音而獲取的語音模式信息若與文本的識別信息匹配，識別信息中一致概率最高的識別信息可被識別。
[0059]識別信息中與用戶的語音一致概率最高的識別信息被識別時(shí)，與所識別的識別信息對應(yīng)的控制客體會(huì)被選擇。因此，即使未內(nèi)置與用戶的語音相匹配的控制指令，也會(huì)因事件發(fā)生裝置發(fā)生事件。
[0060]在本說明書中，“控制客體”是指在控制客體選擇裝置的畫面上顯示出來，可接收用戶輸入的按鍵等界面，在顯示出來的控制客體上，完成用戶輸入后，控制客體選擇裝置可執(zhí)行事先決定的控制動(dòng)作。
[0061]控制客體可以是用戶通過對按鍵、確認(rèn)欄、文字輸入欄等的點(diǎn)擊、輸入來選擇的界面，但并不局限于此，控制客體不表現(xiàn)為圖像或透明顯示時(shí)，也可以是用戶通過鼠標(biāo)或觸控屏幕等輸入裝置選擇的界面控制客體。
[0062]接下來，參照說明書附圖，對本發(fā)明的多種實(shí)施方式進(jìn)行詳細(xì)的說明。
[0063]圖1是本發(fā)明一實(shí)施方式的事件發(fā)生裝置的方塊圖。
[0064]如圖1所示，本發(fā)明的一實(shí)施方式的事件發(fā)生裝置100包括:處理器120、內(nèi)存控制器122、內(nèi)存124。還包括:界面110、話筒140、揚(yáng)聲器142、顯示部130。
[0065]本發(fā)明一實(shí)施方式的事件發(fā)生裝置100是可通過語音識別選擇控制客體的電腦裝置，包括一個(gè)以上的處理裝置，可以是具備音響輸入功能的電腦、筆記本電腦、智能手機(jī)、平板電腦、汽車導(dǎo)航儀、掌上電腦、便攜式媒體播放器、播放器、電子詞典等終端設(shè)備，或是與這些終端設(shè)備連接的服務(wù)器或由多個(gè)電腦構(gòu)成的分散電腦系統(tǒng)。在此，一個(gè)以上的處理裝置可包括至少一個(gè)以上的處理器120和內(nèi)存124，復(fù)數(shù)個(gè)處理器120可共享相互的內(nèi)存124。
[0066]內(nèi)存124儲存程序或指令集等，內(nèi)存124可包括隨機(jī)存取存儲器(狀￡100688 111611101*7^、只讀存儲器丨!^^;!^^^-。]!]^ 0611101*7)、磁盤裝置、光盤裝置、閃存等。
[0067]處理裝置基于用戶的語音獲取輸入信息，基于應(yīng)用程序加冕信息獲取的至少一個(gè)的識別信息與輸入信息匹配，在識別信息中，獲取與輸入信息匹配的匹配識別信息，在匹配的識別信息對應(yīng)的領(lǐng)域中，至少一部分領(lǐng)域中發(fā)生事件。
[0068]內(nèi)存控制器122控制處理器120或界面110等其他組件被格式化成內(nèi)存124。
[0069]處理器120可執(zhí)行儲存在內(nèi)存124上的程序或指令集進(jìn)行實(shí)行等的演算。
[0070]界面110將控制客體選擇裝置100的話筒140或揚(yáng)聲器142等輸入輸出裝置100連接在處理器120及內(nèi)存124上。
[0071]話筒140可接收語音信號，將接收的語音信號轉(zhuǎn)換成電子信號，提供給界面110。揚(yáng)聲器142接收來自界面110的電子信號，并將其轉(zhuǎn)換成語音信號后輸出。
[0072]顯示部130向用戶顯示視覺性的圖像信息，顯示部130可包括偵測觸控輸入的觸控屏幕顯示。
[0073]本發(fā)明的一實(shí)施方式的事件發(fā)生裝置100，儲存在內(nèi)存124上，利用由處理器120實(shí)行的程序(以下稱為“事件發(fā)生引擎”)，通過語音識別發(fā)送事件。
[0074]事件發(fā)生引擎是在事件發(fā)生裝置100的背景或格式下而實(shí)行的，利用在事件發(fā)生裝置100上實(shí)行的應(yīng)用程序畫面信息，通過語音識別讓事件發(fā)生裝置100發(fā)生事件。
[0075]圖2是本發(fā)明一實(shí)施方式的事件發(fā)生方法的流程圖；為了便于說明，連同圖3—并參照。圖3圖示了本發(fā)明一實(shí)施方式的基于應(yīng)用程序畫面信息獲取的識別信息。
[0076]如圖3所示，舉例來說，在事件發(fā)生裝置100上可實(shí)行游戲應(yīng)用程序150。
[0077]首先，事件發(fā)生裝置基于用戶的語音獲取輸入信息3100。
[0078]在此，輸入信息是指分析用戶的語音特征而獲取的語音模式信息，但并不局限于此，可以是基于用戶語音，在語音識別過程中獲取的一部分或全部的信息。
[0079]獲取輸入信息后，事件發(fā)生裝置將基于應(yīng)用程序的畫面信息而獲取的至少一個(gè)的識別信息與輸入信息進(jìn)行匹配3110。
[0080]應(yīng)用程序畫面信息的光學(xué)字符識別被實(shí)行時(shí)，在該應(yīng)用程序畫面信息顯示的畫面中，可獲取以文本識別的識別信息。在此，基于應(yīng)用程序畫面信息的識別信息的獲取不局限于光學(xué)字符識別，可以為磁墨文字識別等多種方法。
[0081]如圖3所示，撲克游戲應(yīng)用程序150的畫面上，顯示著“重新開始151八”、“繼續(xù)游戲152八”、“設(shè)定153八”、“瀏覽排序154八”等文本，自該應(yīng)用程序150的應(yīng)用程序畫面信息，可獲取“重新開始151八”、“繼續(xù)游戲152八”、“設(shè)定153八”、“瀏覽排序154八”等識別信息。
[0082]所獲取的識別信息，可包括與該識別信息對應(yīng)的文本在應(yīng)用程序畫面上所顯示的位置或領(lǐng)域等信息，這些信息可用于決定后面的事件發(fā)生的位置和領(lǐng)域。
[0083]識別信息和輸入信息的匹配，也就是通過識別信息和語音模式信息的匹配，將獲取的語音模式與識別信息進(jìn)行對比，判斷具有與該語音模式相同或最近似的模式的識別信肩、0
[0084]另外，識別信息也可以以來自用戶語音的語音模式信息代碼化的方式，代碼化成音素或特定的區(qū)間單位，從而使語音模式信息和識別信息互相匹配。識別信息和語音模式信息匹配時(shí)，可使用靜止匹配(81:211:1(3胍丨也丨叩)、余弦相似度(⑶81116 8111111211*1丨7)對比、彈性匹配胍七也丨叩)等。
[0085]事件發(fā)生裝置，按照所獲取的識別信息和輸入信息的匹配結(jié)果，判斷是否有與輸入信息匹配的識別信息3120。
[0086]如上所述，判斷具有與所獲取的語音模式相同或最近似的模式的識別信息是否是匹配識別信息。
[0087]如果判斷出沒有與輸入信息匹配的識別信息時(shí)，控制客體選擇裝置在重新獲取輸入信息前會(huì)待機(jī)或體現(xiàn)出要求用戶重新發(fā)出語音的要求。
[0088]若判斷有與輸入信息匹配的識別信息時(shí)，事件發(fā)生裝置獲取該匹配識別信息3130。
[0089]如圖3所示，自用戶語音獲取“重新開始”的輸入信息時(shí)，在“重新開始1518”、“繼續(xù)游戲1528”、“設(shè)定1538”、“瀏覽排序1548”的識別信息中，“重新開始1518”識別信息屬于該識別信息。
[0090]另外，所獲取的匹配識別信息為復(fù)數(shù)時(shí)，對應(yīng)匹配識別信息的復(fù)數(shù)個(gè)領(lǐng)域間，指定優(yōu)先順序，對于對應(yīng)匹配識別信息的復(fù)數(shù)個(gè)領(lǐng)域及優(yōu)先順序，將結(jié)合圖7后述說明。
[0091]獲取匹配識別信息后，事件發(fā)生裝置在匹配識別信息對應(yīng)的領(lǐng)域中的一部分領(lǐng)域內(nèi)發(fā)生事件3140。
[0092]對應(yīng)匹配識別信息的領(lǐng)域是指與匹配識別信息對應(yīng)的文本在應(yīng)用程序畫面上的位置，比如說，可以是該文本所位于的區(qū)段，也可以是該文本在應(yīng)用程序畫面上所位于的領(lǐng)域和事前決定的范圍隔開的領(lǐng)域等。
[0093]事件發(fā)生的位置可以是匹配識別信息對應(yīng)的領(lǐng)域內(nèi)的一坐標(biāo)，也可以是構(gòu)成一領(lǐng)域的復(fù)數(shù)坐標(biāo)。
[0094]由此可見，“重新開始1518”識別信息屬于匹配識別信息時(shí)，如圖3所示，“重新開始1518”對應(yīng)的領(lǐng)域，比如說，“重新開始1518”識別信息對應(yīng)的文本151八在撲克游戲應(yīng)用程序150的畫面上所位于的領(lǐng)域內(nèi)發(fā)生事件2。
[0095]在此，事件2是輸入事件時(shí)，實(shí)質(zhì)上發(fā)生與該領(lǐng)域內(nèi)進(jìn)行輸入一樣的效果。比如說，事件設(shè)定為觸擊事件時(shí)，在該領(lǐng)域發(fā)生實(shí)現(xiàn)觸擊相同的效果。進(jìn)一步，輸入事件所發(fā)生的位置上存在控制客體時(shí)，該控制客體可被選擇。
[0096]上述事件的類型是事先決定的，也可以是基于附加輸入信息決定的。比如說，和如上所述的輸入信息一起，“雙觸擊”、“長觸擊”、“重?fù)簟?、、化?化”或“1)11^-01^”等附加輸入信息被獲取時(shí)，在匹配識別信息對應(yīng)的領(lǐng)域中，分別實(shí)行雙觸擊、長觸擊、重?fù)?、化此?化或 1)111011—0111:。
[0097]圖4圖示了本發(fā)明另一實(shí)施方式的基于應(yīng)用程序畫面信息獲取的識別信息
[0098]如圖4所示，撲克游戲應(yīng)用程序150可包括對話框157和控制客體155八、156八。在此，對話框157屬于向用戶提供信息并由用戶選擇的客體，控制客體155八、156八是由用戶選擇的界面。
[0099]如圖4所示，基于撲克游戲應(yīng)用程序150的應(yīng)用程序畫面信息，可獲取“進(jìn)行中的157八”、“游戲1578”、“還在進(jìn)行1570”、“重新開始1570”、“需要實(shí)行嗎1572”、“重新開始1558”、“繼續(xù)游戲1568”等識別信息。
[0100]如圖4所示，自用戶獲取“重新開始”的輸入信息后，與獲取的輸入信息對應(yīng)的第一匹配識別信息1570和第二匹配識別信息1558所對應(yīng)的領(lǐng)域位于對話框157和“重新開始”控制客體155八內(nèi)。
[0101]如上所述，獲取復(fù)數(shù)個(gè)匹配識別信息時(shí)，決定滿足實(shí)現(xiàn)決定條件的匹配識別信息，在與決定的匹配識別信息對應(yīng)的領(lǐng)域內(nèi)發(fā)生事件。
[0102]比如說，作為事前決定的條件，可要求匹配識別信息對應(yīng)的領(lǐng)域中至少一部分領(lǐng)域內(nèi)有控制客體。
[0103]因此，自用戶語音獲取“重新開始”輸入信息時(shí)，在第一及第二匹配識別信息1570、1558中，在第二匹配識別信息1558對應(yīng)的領(lǐng)域中至少一部分領(lǐng)域上有控制客體155八，因此可在第二匹配識別信息1558對應(yīng)的領(lǐng)域內(nèi)發(fā)生事件2。
[0104]在“重新開始”控制客體155八內(nèi)發(fā)生輸入事件2時(shí)，應(yīng)答輸入事件2，可選擇“重新開始”控制客體155八。
[0105]如上所述，依據(jù)本發(fā)明的一實(shí)施方式的事件發(fā)生裝置，獲取復(fù)數(shù)個(gè)匹配識別信息時(shí)，可在用戶希望的地方發(fā)生事件。
[0106]尤其是，在網(wǎng)頁瀏覽中，顯示一般文本和超級鏈接文本時(shí)，僅發(fā)生超級鏈接文本的事件，通過用戶的語音識別可便利地控制網(wǎng)頁瀏覽。
[0107]另外，本發(fā)明一實(shí)施方式的事件發(fā)生裝置，基于獲取的識別信息生成控制客體，發(fā)生所生成的控制客體的事件，具有與在控制客體位于的位置上發(fā)生事件相同的效果。關(guān)于生成控制客體發(fā)生事件，參照圖5詳細(xì)說明。
[0108]圖5圖示了本發(fā)明一實(shí)施方式的與所獲取識別信息對應(yīng)的控制客體的生成模樣。
[0109]如圖5所示，基于應(yīng)用程序畫面信息獲取識別信息1518、1528、1538、1548時(shí)，可生成與該識別信息1518、1528、1538、1548對應(yīng)的控制客體、02、03、04。
[0110]在此，是指控制客體對應(yīng)識別信息而生成，這是本發(fā)明的一實(shí)施方式，控制客體也可在獲取與輸入信息匹配的匹配識別信息后，對應(yīng)匹配識別信息生成。在獲取與輸入信息匹配的匹配識別信息后，對應(yīng)匹配識別信息生成控制客體時(shí)，與對應(yīng)所有識別信息的控制客體被生成相比，可以減少裝置的負(fù)荷。
[0111]所生成的控制客體的信息200可包括控制客體的位置信息251、252、253、254和說明信息 261、262、263、264。
[0112]控制客體的位置信息251、252、253、254是在應(yīng)用程序150畫面上有關(guān)控制客體 02, 03, 04而設(shè)定的位置信息，此時(shí)，控制客體01、02, 03, 04對應(yīng)的領(lǐng)域，比如說，識別信息1518、1528、1538、1548對應(yīng)的文本151八、152八、153八、154八對應(yīng)該應(yīng)用程序150畫面上的位置領(lǐng)域。
[0113]控制客體的位置信息251、252、253、254如圖5所示，可表現(xiàn)為#(1訪”項(xiàng)目、“ 1161曲七”項(xiàng)目、“ 16代”項(xiàng)目及“七叩”項(xiàng)目的值。
[0114]說明信息261、262、263、264是控制客體01、02、03、04的標(biāo)簽，可直接表現(xiàn)基于應(yīng)用程序畫面信息而獲取的識別信息1518、1528、1538、1548。
[0115]控制客體01、02, 03, 04被生成后，可發(fā)生包括識別信息對應(yīng)的控制客體，即屬于識別信息的匹配識別信息的控制客體的事件。
[0116]在此，控制客體的事件是該控制客體位于的領(lǐng)域的輸入事件或?qū)⒃摽刂瓶腕w作為目標(biāo)對象的選擇事件。
[0117]另外，所生成的控制客體?:1、?:2、?:3、如圖5所示，可顯示為邊框，為了維持生成控制客體01、02、03、04的之前畫面，邊框不被顯示。
[0118]另外，本發(fā)明一實(shí)施方式的事件發(fā)生裝置，可臨時(shí)儲存所生成的控制客體在緩沖器上，在事前決定的時(shí)間或事前決定的條件下，可使用所生成的控制客體。所生成的控制客體被臨時(shí)儲存在緩沖器上的內(nèi)容，將參照圖6進(jìn)行詳細(xì)說明。
[0119]圖6是本發(fā)明一實(shí)施方式的事件的發(fā)生裝置的一示例圖。
[0120]如圖6所示，在事件發(fā)生裝置100上實(shí)行地圖應(yīng)用程序160，基于該應(yīng)用程序160的應(yīng)用程序畫面信息，可獲取“江南車醫(yī)院”、“新論峴站”、“江南站十字路口”、“江南站”、“驛三站”、“萊美樂賓館”等識別信息。
[0121]進(jìn)一步，如圖6所示，可生成所獲取的識別信息對應(yīng)的控制客體161至166。
[0122]如圖6所示，在事件發(fā)生裝置100上沒有實(shí)行地圖應(yīng)用程序160時(shí)，通過滾動(dòng)、擴(kuò)大及縮小等控制可以頻繁地改變畫面，由此生成變化的畫面所獲取的識別信息對應(yīng)的控制客體，持續(xù)儲存所生成控制客體時(shí)可導(dǎo)致該裝置100過度負(fù)荷。
[0123]因此，依據(jù)本發(fā)明一實(shí)施方式的時(shí)間發(fā)生裝置，對應(yīng)識別信息而生成的控制客體被儲存在緩沖器上，或是與輸入信息匹配的匹配識別信息被獲取后對應(yīng)匹配識別信息生成控制客體，從而可防止裝置的過度負(fù)荷。
[0124]另外，所獲取的識別信息為復(fù)數(shù)時(shí)，對應(yīng)匹配識別信息的復(fù)數(shù)個(gè)領(lǐng)域或?qū)?yīng)匹配識別信息的各個(gè)控制客體間指定優(yōu)選順序，根據(jù)優(yōu)先順序發(fā)生事件。根據(jù)優(yōu)先順序發(fā)生事件的內(nèi)容參照圖7進(jìn)行詳細(xì)說明。
[0125]圖7是本發(fā)明一實(shí)施方式的事件的發(fā)生裝置的另一示例圖。如圖7所示，自用戶語音獲取“江南”這一輸入信息后，與該輸入信息匹配的識別信息可為“江南車醫(yī)院”、“江南站路口”、“江南站”等，此時(shí)，對應(yīng)該匹配識別信息的領(lǐng)域中至少一部分領(lǐng)域內(nèi)或?qū)?yīng)該匹配識別信息的控制客體162、165、166發(fā)生事件。
[0126]如上所述，獲取復(fù)數(shù)個(gè)匹配識別信息時(shí)，對應(yīng)復(fù)數(shù)個(gè)匹配識別信息的各個(gè)領(lǐng)域內(nèi)全部發(fā)生事件，或是對應(yīng)復(fù)數(shù)個(gè)匹配識別信息的各個(gè)控制客體上全部發(fā)生事件時(shí)，會(huì)導(dǎo)致用戶所希望的事件沒有發(fā)生這樣的問題。
[0127]由此可見，獲取復(fù)數(shù)個(gè)匹配識別信息時(shí)，復(fù)數(shù)個(gè)匹配識別信息對應(yīng)的各個(gè)領(lǐng)域或匹配識別信息對應(yīng)的各個(gè)控制客體上指定優(yōu)先順序。
[0128]如圖7所示，優(yōu)先順序可按照匹配識別信息對應(yīng)的領(lǐng)域的位置或匹配識別信息對應(yīng)的控制客體的位置的上下順序來指定。
[0129]在此，所指定的最前的優(yōu)先順序，僅在“江南車醫(yī)院”識別信息對應(yīng)的領(lǐng)域或“江南車醫(yī)院”識別信息對應(yīng)的控制客體162上發(fā)生事件，如圖7所示，為了使用戶更加準(zhǔn)確的選擇，依照優(yōu)先順序可提供瀏覽167、168、169，在瀏覽167、168、169中的選擇可以通過語音識別來實(shí)現(xiàn)。
[0130]優(yōu)先順序如上所述，可以依據(jù)匹配識別信息對應(yīng)的領(lǐng)域或匹配識別信息對應(yīng)的控制客體的位置來指定，也可以通過如輸入歷史等來指定，其方式法多種多樣，不受局限。
[0131]另外，依據(jù)本發(fā)明一實(shí)施方式，輸入信息也可以是通過自用戶語音獲取的語音模式信息與語言模式數(shù)據(jù)庫對比的過程而被識別的文本。
[0132]輸入信息通過語音識別，自用戶的語音識別文本時(shí)，輸入信息和識別信息的匹配因識別的文本和識別信息自身的比較而被實(shí)行。
[0133]參附的方塊圖的各方塊和流程圖的各步驟的組合，可因電腦指令而實(shí)行。這些電腦指令可以搭載在常用電腦、特殊電腦或其它軟件數(shù)據(jù)處理裝備的處理機(jī)上，通過電腦或其它軟件數(shù)據(jù)處理裝備的處理機(jī)而實(shí)行的指令生成在方塊圖的各方塊或流程圖的各步驟中實(shí)行說明功能的手段。這些電腦軟件指令為了以特定的方式體現(xiàn)功能，可在電腦或其它軟件數(shù)據(jù)處理裝備的可用于電腦或電腦可讀的內(nèi)存上儲存，因此，在可用于電腦或電腦可讀的內(nèi)存上所儲存的指令包括各方塊圖的方塊或流程圖的各步驟中實(shí)行的說明功能的指令手段。電腦軟件指令也可搭載在電腦或其它軟件數(shù)據(jù)處理裝備上，電腦或其它軟件數(shù)據(jù)處理裝備上，相關(guān)的動(dòng)作步驟被實(shí)行，生成電腦實(shí)行的處理器，實(shí)行電腦或其它軟件數(shù)據(jù)處理裝備的指令可提供方塊圖各方塊及流程圖各步驟中用于說明功能的步驟。
[0134]在本說明書中，各方塊可以為包括用于實(shí)現(xiàn)特定的論理功能的一個(gè)以上可實(shí)行指令的模組、程序或代碼的一部分。另外，在幾種代替實(shí)行的舉例中，在方塊圖中所提及的功能也可以是脫離順序而發(fā)生的。舉例來說，陸續(xù)被圖示的兩個(gè)方塊也可能是實(shí)質(zhì)上同時(shí)實(shí)行的，也可以是該方塊有時(shí)隨著功能而逆順序?qū)嵭小?br> [0135]與本說明書中所記載的實(shí)施方式相關(guān)，并被說明的方法或算法的步驟，可以是處理器實(shí)行的硬件、軟件模組或其結(jié)合直接體現(xiàn)的。軟件模組可為在狀1內(nèi)存、閃存、1？01內(nèi)存、2？如1內(nèi)存、22？如1內(nèi)存、寄存器、硬盤、裝拆性盤、或本【技術(shù)領(lǐng)域】內(nèi)供知的任意形態(tài)的儲存媒體。示例性的儲存媒體在處理器上聯(lián)合，處理器可判讀來自媒體的信息，并在儲存媒體上記入信息。采用其他方法，儲存媒體可與處理器為一體形。處理器及儲存媒體可設(shè)在仏X集成電路內(nèi)。八31(:可設(shè)置的用戶終端機(jī)內(nèi)。采用其他方法，處理器及儲存媒體可各自設(shè)置在用戶終端機(jī)內(nèi)。
[0136]以上結(jié)合本發(fā)明的實(shí)施方式，對本發(fā)明作了更加詳細(xì)的說明，但是本發(fā)明并不局限于此，在本發(fā)明技術(shù)思想的范圍內(nèi)可進(jìn)行多種變形。由此可見，本發(fā)明所記載的實(shí)施方式并不用于限定本發(fā)明的思想，僅用于說明本發(fā)明，本發(fā)明的技術(shù)思想并不受實(shí)時(shí)方式的限制。本發(fā)明的保護(hù)范圍在權(quán)利要求書中的權(quán)利要求項(xiàng)內(nèi)，在其同等范圍內(nèi)的所有技術(shù)思想均被看作屬于本發(fā)明的權(quán)利范疇之內(nèi)。
【權(quán)利要求】
1.一種事件發(fā)生裝置，是以語音識別來發(fā)生事件(event)的裝置，其特征在于，包括一個(gè)以上的處理裝置；所述一個(gè)以上的處理裝置，基于用戶的語音獲取輸入信息，基于應(yīng)用程序的畫面信息來獲取的至少一個(gè)的識別信息與所述輸入信息匹配；在所述識別信息中獲取與所述輸入信息匹配的匹配識別信息；在與所述匹配識別信息對應(yīng)的領(lǐng)域中，至少在一部分領(lǐng)域中發(fā)生事件。
2.根據(jù)權(quán)利要求1所述的事件發(fā)生裝置，其特征在于，所述識別信息是通過光學(xué)字符識別(OCR:optical character recognit1n)而獲取的。
3.根據(jù)權(quán)利要求1所述的事件發(fā)生裝置，其特征在于，所述輸入信息包括分析所述用戶的語音特征而獲取的語音模式信息；所述識別信息和所述輸入信息的匹配包括所述識別信息和所述語音模式信息的匹配。
4.根據(jù)權(quán)利要求1所述的事件發(fā)生裝置，其特征在于，所述輸入信息包括通過語音識另O，由所述用戶的語音而識別的文本(Text);所述識別信息和所述輸入信息的匹配包括所述識別信息和所述文本的匹配。
5.根據(jù)權(quán)利要求1所述的事件發(fā)生裝置，其特征在于，所述一個(gè)以上的處理裝置，基于用戶語音獲取附加輸入信息，基于所述附加輸入信息決定所述事件的類型。
6.一種事件發(fā)生裝置，是以語音識別來發(fā)生事件(event)的裝置，其特征在于，包括一個(gè)以上的處理裝置；所述一個(gè)以上的處理裝置，基于用戶的語音獲取輸入信息，基于應(yīng)用程序的畫面信息來獲取的至少一個(gè)的識別信息與輸入信息匹配；在所述識別信息中獲取與所述輸入信息匹配的匹配識別信息；與所述匹配識別信息對應(yīng)，生成控制客體；發(fā)生所述控制客體的事件。
7.一種事件發(fā)生方法，是以語音識別來發(fā)生事件(event)的方法，其特征在于，包括:基于用戶的語音獲取輸入信息的步驟；基于應(yīng)用程序的畫面信息來獲取的至少一個(gè)的識別信息與所述輸入信息匹配的步驟；在所述識別信息中獲取與所述輸入信息匹配的匹配識別信息的步驟；及在與匹配識別信息對應(yīng)的領(lǐng)域中，至少在一部分領(lǐng)域中發(fā)生事件的步驟。
8.根據(jù)權(quán)利要求7所述的事件發(fā)生方法，其特征在于所述識別信息是通過光學(xué)字符識別(OCR:optical character recognit1n)而獲取的。
9.根據(jù)權(quán)利要求7所述的事件發(fā)生方法，其特征在于，所述輸入信息包括分析所述用戶的語音特征而獲取的語音模式信息；所述識別信息和所述輸入信息的匹配包括所述識別信息和所述語音模式信息的匹配。
10.根據(jù)權(quán)利要求7所述的事件發(fā)生方法，其特征在于，所述輸入信息包括通過語音識另O，由所述用戶的語音而識別的文本(Text);所述識別信息和所述輸入信息的匹配包括所述識別信息和所述文本的匹配。
11.根據(jù)權(quán)利要求7所述的事件發(fā)生方法，其特征在于，包括:基于用戶語音獲取附加輸入信息的步驟；及基于所述附加輸入信息決定所述事件的類型的步驟。
12.—種事件發(fā)生方法，是以語音識別來發(fā)生事件(event)的裝置，其特征在于，包括:基于用戶的語音獲取輸入信息的步驟；基于應(yīng)用程序的畫面信息來獲取的至少一個(gè)的識別信息與輸入信息匹配的步驟；基于所述識別信息生成控制客體的步驟；在所述識別信息中獲取與所述輸入信息匹配的匹配識別信息的步驟；發(fā)生所述控制客體的事件的步驟。
13.—種可電腦判讀的媒體，是包括指令集的可電腦判讀的媒體，其特征在于，所述指令集因電腦裝置而被執(zhí)行時(shí)，可讓所述電腦裝置獲取基于用戶語音的輸入信息，基于應(yīng)用程序畫面信息獲取的至少一個(gè)的識別信息與所述輸入信息匹配，在所述識別信息中獲取與所述輸入信息匹配的匹配識別信息，在與所述匹配識別信息對應(yīng)的領(lǐng)域中，至少在一部分領(lǐng)域中發(fā)生事件。
【文檔編號】G10L15/22GK104464730SQ201410100568
【公開日】2015年3月25日申請日期:2014年3月18日優(yōu)先權(quán)日:2013年9月24日
【發(fā)明者】申宗元, 金澀冪, 鄭姜理, 多全仁, 尹延森, 金京順申請人:迪歐泰克有限責(zé)任公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：申宗元;金澀冪;鄭姜理;多全仁;尹延森;金京順;
技術(shù)所有人：迪歐泰克有限責(zé)任公司;
我是此專利的發(fā)明人

上一篇：一種語音控制家庭電器的方法和裝置制造方法
上一篇：一種分離時(shí)頻域混合信號的方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

以語音識別來發(fā)生事件裝置及方法