一種信息處理方法、裝置和電子設(shè)備的制作方法
【專利摘要】本方面提供了一種信息處理方法,應用于電子設(shè)備,該方法中,對用戶的語音輸入進行識別時,根據(jù)語音識別引擎對該語音輸入進行匹配得到多個匹配結(jié)果,當接收到用戶反饋的選擇時,確定用戶選擇的為第一匹配結(jié)果,記錄該語音輸入、多個匹配結(jié)果以及該用戶選擇的第一匹配結(jié)果,并且依據(jù)記錄的內(nèi)容對語音識別引擎的模型進行自適應訓練,以使的下一次基于該語音識別引擎對所述語音輸入進行匹配時產(chǎn)生該第一匹配結(jié)果。在該處理方法中,結(jié)合了用戶匹配結(jié)果的選擇,提高了語音輸入和用戶選擇的識別結(jié)果的匹配度,進而提高了識別引擎的語音識別精度,優(yōu)化識別性能,提高用戶體驗。
【專利說明】一種信息處理方法、裝置和電子設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于語音識別領(lǐng)域,尤其涉及一種信息處理方法、裝置和電子設(shè)備。
【背景技術(shù)】
[0002]隨著電子技術(shù)的發(fā)展,電子設(shè)備進行語音識別已成為一種常用的技術(shù)。
[0003]用戶輸入一段語音信息,電子設(shè)備中的識別引擎自動識別該語音信息,并顯示識別該語音信息的結(jié)果。
[0004]但是,現(xiàn)有技術(shù)中,根據(jù)用戶輸入的語音信息識別進行識別,得到的結(jié)果為多個,用戶根據(jù)需求從多個結(jié)果中選擇目標結(jié)果。在該識別過程中,可能顯示在首位的不是用戶的目標結(jié)果,而是其他的混淆結(jié)果,此時,用戶需要手動選擇目標結(jié)果,交互效率較低。
【發(fā)明內(nèi)容】
[0005]有鑒于此,本發(fā)明的目的在于提供一種語音識別的方法,識別引擎結(jié)合用戶的選擇對識別結(jié)果進行調(diào)整,提高識別引擎的語音識別精度。
[0006]一種信息處理方法,所述方法應用于電子設(shè)備,所述電子設(shè)備中設(shè)置有語音采集單元,該方法包括:
[0007]接收所述語音采集單元采集的語音輸入;
[0008]基于語音識別引擎對所述語音輸入匹配,得到與所述語音輸入相關(guān)的由至少2個匹配結(jié)果組成的匹配結(jié)果組;
[0009]輸出所述匹配結(jié)果組;
[0010]接收用戶反饋的輸入操作;
[0011]依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果;
[0012]記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果;
[0013]對所述記錄的所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果進行語音識別引擎的模型自適應訓練,以使得下一次基于所述語音識別引擎對所述語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
[0014]上述的方法,優(yōu)選的,接收所述語音采集單元采集的語音輸入之前,還包括:
[0015]獲取進行所述語音輸入的用戶的身份信息。
[0016]上述的方法,優(yōu)選的,還包括:
[0017]在記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果的同時,記錄所述語音輸入的用戶的身份信息,以使得所述記錄的所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述用戶的身份信息用于所述語音識別引擎針對所述用戶的發(fā)音方式進行針對性的模型自適應訓練,以使得下一次基于所述語音識別引擎對所述用戶輸入的所述語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
[0018]上述的方法,優(yōu)選的,所述對所述記錄的所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果進行語音識別引擎的模型自適應訓練包括:[0019]基于所述匹配結(jié)果組和所述第一匹配結(jié)果,確定除所述第一匹配結(jié)果的第二匹配結(jié)果;
[0020]將所述第一匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為
第一值;
[0021]將所述第二匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為
第二值;
[0022]其中,所述第一值大于所述第二值。
[0023]上述的方法,優(yōu)選的,所述依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果之后,所述記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果之前,還包括:
[0024]依據(jù)預設(shè)條件判斷所述第一匹配結(jié)果響應所述語音輸入對應的操作是否完成;
[0025]當完成時,執(zhí)行所述記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果步驟。
[0026]一種信息處理裝置,應用于電子設(shè)備,所述電子設(shè)備中設(shè)置有語音采集單元,所述裝置包括:
[0027]第一接收模塊,用于接收所述語音采集單元采集的語音輸入;
[0028]匹配模塊,用于基于語音識別引擎對所述語音輸入匹配,得到與所述語音輸入相關(guān)的由至少2個匹配結(jié)果組成的匹配結(jié)果組;
[0029]輸出模塊,用于輸出所述匹配結(jié)果組;
[0030]第二接收模塊,用于接收用戶反饋的輸入操作;
[0031]選擇模塊,用于依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果;
[0032]記錄模塊,用于記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果;
[0033]訓練模塊,用于對所述記錄的所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果進行語音識別引擎的模型自適應訓練,以使得下一次基于所述語音識別引擎對搜索語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
[0034]上述的裝置,優(yōu)選的,還包括:
[0035]獲取模塊,用于獲取進行所述語音輸入的用戶的身份信息。
[0036]上述的裝置,優(yōu)選的,所述記錄模塊,在記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果的同時,還記錄所述語音輸入的用戶的身份信息,以使得所述記錄的所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述用戶的身份信息用于所述語音識別引擎針對所述用戶的發(fā)音方式進行針對性的模型自適應訓練,以使得下一次基于所述語音識別引擎對所述用戶輸入的所述語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
[0037]上述的裝置,優(yōu)選的,所述訓練模塊包括:
[0038]分類單元,用于基于所述匹配結(jié)果組和所述第一匹配結(jié)果,確定除所述第一匹配結(jié)果的第二匹配結(jié)果;
[0039]第一修改單元,用于將所述第一匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為第一值;
[0040]第二修改單元,用于將所述第二匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為第二值;[0041]其中,所述第一值大于所述第二值。
[0042]上述的裝置,優(yōu)選的,還包括:
[0043]判斷模塊,用于依據(jù)預設(shè)條件判斷所述第一匹配結(jié)果響應所述語音輸入對應的操作是否完成;
[0044]當完成時,觸發(fā)記錄模塊。
[0045]一種電子設(shè)備,包括:如上述任一項所述的信息處理裝置和對所述電子設(shè)備的語音輸入進行采集的語音采集單元。
[0046]經(jīng)由上述的技術(shù)方案可知,本申請一種信息處理方法,所述方法應用于電子設(shè)備,該方法中,對用戶的語音輸入進行識別時,根據(jù)語音識別引擎對該語音輸入進行匹配得到多個匹配結(jié)果,當接收到用戶反饋的選擇時,確定用戶選擇的為第一匹配結(jié)果,記錄該語音輸入、多個匹配結(jié)果以及該用戶選擇的第一匹配結(jié)果,并且依據(jù)記錄的內(nèi)容對語音識別引擎的模型進行自適應訓練,以使的下一次基于該語音識別引擎對所述語音輸入進行匹配時產(chǎn)生該第一匹配結(jié)果。在該處理方法中,結(jié)合了用戶匹配結(jié)果的選擇,提高了語音輸入和用戶選擇的識別結(jié)果的匹配度,進而提高了識別引擎的語音識別精度,優(yōu)化識別性能,提高用戶體驗。
【專利附圖】
【附圖說明】
[0047]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0048]圖1是本申請?zhí)峁┑囊环N信息處理方法實施例1的流程圖;
[0049]圖2是本申請?zhí)峁┑囊环N信息處理方法實施例2的流程圖;
[0050]圖3是本申請?zhí)峁┑囊环N信息處理方法實施例3的流程圖;
[0051]圖4是本申請?zhí)峁┑囊环N信息處理方法實施例4的流程圖;
[0052]圖5是本申請?zhí)峁┑囊环N信息處理方法實施例5的流程圖;
[0053]圖6是本申請?zhí)峁┑囊环N信息處理裝置實施例1的結(jié)構(gòu)示意圖;
[0054]圖7是本申請?zhí)峁┑囊环N信息處理裝置實施例2的結(jié)構(gòu)示意圖;
[0055]圖8是本申請?zhí)峁┑囊环N信息處理裝置實施例3的結(jié)構(gòu)示意圖;
[0056]圖9是本申請?zhí)峁┑囊环N信息處理裝置實施例4的結(jié)構(gòu)示意圖;
[0057]圖10是本申請?zhí)峁┑囊环N信息處理裝置實施例5的結(jié)構(gòu)示意圖。
【具體實施方式】
[0058]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0059]為了更加特定地強調(diào)實施的獨立性,本說明書涉及許多模塊或單元。舉例而言,模塊或單元可由硬件電路實現(xiàn),該硬件電路包括特制VLSI電路或門陣列,比如邏輯芯片、晶體管,或其它組件。模塊或單元也可在可編程的硬設(shè)備中實現(xiàn),比如場效可編程門陣列、可編程陣列邏輯、可編程邏輯設(shè)備等等。
[0060]模塊或單元也可在藉由各種形式的處理器所執(zhí)行的軟件中實現(xiàn)。比如說,一可執(zhí)行碼模塊可包括一個或多個實體的或邏輯的計算機指令區(qū)塊,該區(qū)塊可能形成為,比如說,對象、程序或函數(shù)。然而,鑒別模塊或單元的可執(zhí)行部分不需要物理上放置在一起,但可由存于不同位置的不同指令所組成,當邏輯上組合在一起時,形成模塊或單元且達到該模塊或單元所要求的目的。
[0061]實際上,可執(zhí)行碼模塊或單元可以是一單一指令或多個指令,甚至可以分布在位于不同的程序中的數(shù)個不同的碼區(qū)段,并且橫跨數(shù)個存儲設(shè)備。同樣地,操作數(shù)據(jù)可被辨識及顯示于此模塊或單元中,并且可以以任何合適的形式實施且在任何合適的數(shù)據(jù)結(jié)構(gòu)形式內(nèi)組織。操作數(shù)據(jù)可以集合成單一數(shù)據(jù)集,或可分布在具有不同的存儲設(shè)備的不同的位置,且至少部分地只以電子信號方式存在于一系統(tǒng)或網(wǎng)絡。
[0062]本說明書所提及的“實施例”或類似用語表示與實施例有關(guān)的特性、結(jié)構(gòu)或特征,包括在本發(fā)明的至少一實施例中。因此,本說明書所出現(xiàn)的用語“在一實施例中”、“在實施例中”以及類似用語可能但不必然都指向相同實施例。
[0063]再者,本發(fā)明所述特性、結(jié)構(gòu)或特征可以以任何方式結(jié)合在一個或多個實施例中。以下說明將提供許多特定的細節(jié),比如編程序、軟件模塊、用戶選擇、網(wǎng)絡交易、數(shù)據(jù)庫查詢、數(shù)據(jù)庫結(jié)構(gòu)、硬件模塊、硬件電路、硬件芯片等例子,以提供對本發(fā)明實施例的了解。然而相關(guān)領(lǐng)域的普通技術(shù)人員將看出本發(fā)明,即使沒有利用其中一個或多個特定細節(jié),或利用其它方法、組件、材料等亦可實施。另一方面,為避免混淆本發(fā)明,公知的結(jié)構(gòu)、材料或操作并沒有詳 細描述。
[0064]如圖1示出的本申請?zhí)峁┑囊环N信息處理方法實施例1的流程圖,所述方法可以應用于一電子設(shè)備,所述電子設(shè)備可以是臺式機、筆記本、平板電腦、手機、智能電視、智能手表、穿戴式設(shè)備等電子設(shè)備,所述電子設(shè)備中設(shè)置有語音采集單元,用于對外界環(huán)境中的語音進行采集,在本申請中該外界環(huán)境中的語音尤其指使用該電子設(shè)備的用戶發(fā)出的語
曰?
[0065]步驟SlOl:接收所述語音采集單元采集的語音輸入;
[0066]其中,該語音輸入為用戶發(fā)出的用于搜索的語音,該語音可以包括:電話號碼、數(shù)字組合等數(shù)字內(nèi)容,也可為名字等文字內(nèi)容,甚至為文字和數(shù)字的組合,本實施例中不做限制。
[0067]其中,該語音采集單元可以為實時采集語音輸入,也可為等待用戶開啟后再進行米集。
[0068]其中,當該語音單元為實時采集語音輸入時,該語音輸入中可包含啟動語音識別進行搜索的啟動指令。
[0069]具體的,該啟動指令可以預設(shè)的一個或一組觸發(fā)語音信號,當該語音輸入與該觸發(fā)語音信號一致時,啟動該語音識別引擎,執(zhí)行步驟S102對語音輸入進行匹配。
[0070]步驟S102:基于語音識別引擎對所述語音輸入匹配,得到與所述語音輸入相關(guān)的由至少2個匹配結(jié)果組成的匹配結(jié)果組;
[0071]其中,該語音識別引擎對語音輸入進行匹配的方式有兩種:一種為在有限的備選內(nèi)容中進行匹配;另一種為對該語音輸入進行識別,直接生成與該語音輸入相關(guān)的多個識別結(jié)果。
[0072]其中,在本實施例中,該有限的備選內(nèi)容可以為電子設(shè)備中存儲的內(nèi)容,具體包括:通訊錄中聯(lián)系人姓名、文件名稱等。
[0073]其中,當用戶在電子設(shè)備中搜索聯(lián)系人姓名時,該語音識別引擎對語音輸入進行匹配的方式可采用在有限的備選內(nèi)容中進行匹配。
[0074]其中,當用戶在電子設(shè)備通過輸入語音信息使用網(wǎng)絡搜索某些內(nèi)容時,由于網(wǎng)絡中資源眾多,所以該語音識別引擎對語音輸入進行匹配的方式可以采用直接生成與該語音輸入相關(guān)的多個識別結(jié)果的方式,再由用戶在其中選擇需要的識別結(jié)果,以根據(jù)該識別結(jié)果進行網(wǎng)絡搜索。
[0075]具體的,在接收到語音輸入時,基于預設(shè)的語音識別引擎對該語音輸入進行識別匹配,得到至少2個匹配結(jié)果,該匹配結(jié)果為與該語音輸入相關(guān)的內(nèi)容,并且,將該得到的匹配結(jié)果作為匹配結(jié)果組。
[0076]需要說明的是,該語音識別可以在本地識別也可在與該電子設(shè)備相關(guān)聯(lián)的云服務器進行。
[0077]其中,當該語音識別是在與電子設(shè)備相關(guān)聯(lián)的云服務器進行時,該電子設(shè)備設(shè)置有網(wǎng)絡單元,當接收到該語音輸入時,通過該網(wǎng)絡單元將該語音輸入上傳到云服務器中進行識別匹配,并且在云服務器識別匹配得到匹配結(jié)果組并反饋時,該電子設(shè)備通過網(wǎng)絡單元接收該匹配結(jié)果組。
[0078]步驟S103:輸出所述匹配結(jié)果組;
[0079]其中,該匹配結(jié)果組中含有多個匹配結(jié)果,需要用戶從中選擇一個與用戶的輸入語音對應的目標結(jié)果。
[0080]具體的,該輸出的匹配結(jié)果組的內(nèi)容可在該電子設(shè)備的顯示單元中進行顯示。
[0081]其中,該匹配結(jié)果組中,可對各個匹配結(jié)果按照與該語音輸入的匹配率的高低進行排序,使匹配率較高的匹配結(jié)果排序在前,以使得用戶首先看到該排序靠前的匹配結(jié)果。
[0082]步驟S104:接收用戶反饋的輸入操作;
[0083]其中,用戶反饋的輸入操作表示用戶在該多個匹配結(jié)果中選擇的一個匹配結(jié)果。
[0084]其中,該用戶反饋的輸入操作可通過多種方式實現(xiàn)。
[0085]比如,當該電子設(shè)備中設(shè)置有觸摸屏時,在觸摸屏上顯示該匹配得到的多個匹配結(jié)果,用戶在該觸摸屏中選擇一個目標結(jié)果,該選擇的操作作為用戶反饋的輸入操作,電子設(shè)備通過該觸摸屏接收該用戶反饋的輸入操作;
[0086]比如,當該電子設(shè)備中采用鍵盤按鍵時,在顯示屏幕上顯示的多個匹配結(jié)果,用戶根據(jù)在該鍵盤按鍵的操作選定一個目標結(jié)果,該通過鍵盤選擇的操作也可作為用戶反饋的輸入操作,電子設(shè)備通過該觸摸屏接收該用戶反饋的輸入操作;
[0087]或者,該電子設(shè)備中采用鼠標選擇時,采用鼠標在顯示屏幕上顯示的多個匹配結(jié)果進行選擇,選定一個目標結(jié)果,該鼠標選擇的操作也可作為用戶反饋的輸入操作;
[0088]或者,用戶通過語音控制選擇,如用戶輸入“選擇第二個”的語音信號,使得電子設(shè)備獲取該語音信號,并對該語音信號進行識別得出選擇第二個作為目標結(jié)果,該通過語音選擇的操作也可作為用戶反饋的輸入操作。[0089]步驟S105:依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果;
[0090]其中,依據(jù)該用戶反饋的輸入操作,從該匹配結(jié)果組中確定與該輸入操作對應的一個匹配結(jié)果作為第一匹配結(jié)果。
[0091]其中,該第一匹配結(jié)果為本次語音識別過程中,用戶選擇的目標結(jié)果。
[0092]實際實施中,當確定該第一匹配結(jié)果后,電子設(shè)備對該第一匹配結(jié)果進行響應,開始執(zhí)行與該第一匹配結(jié)果相應的操作。
[0093]例如,當該語音輸入用于查詢通訊錄聯(lián)系人時,確定第一匹配結(jié)果即目標聯(lián)系人后,可執(zhí)行撥打該目標聯(lián)系人電話的操作。
[0094]例如,當該語音輸入用于網(wǎng)絡查詢某內(nèi)容時,當確定第一匹配結(jié)果即搜索關(guān)鍵詞后,可依據(jù)該搜索關(guān)鍵詞進行網(wǎng)絡搜索。
[0095]步驟S106:記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果;
[0096]其中,對本次輸入的語音進行識別匹配的結(jié)果進行記錄,包括記錄該語音輸入、匹配結(jié)果組和第一匹配結(jié)果。
[0097]需要說明的是,當該語音識別為在云服務器中執(zhí)行時,可通過電子設(shè)備的網(wǎng)絡單元將該語音輸入、匹配結(jié)果組和第一匹配結(jié)果上傳到云服務器中存儲。
[0098]步驟S107:對所述記錄的所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果進行語音識別引擎的模型自適應訓練,以使得下一次基于所述語音識別引擎對所述語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
[0099]其中,由于本次基于該語音識別引擎對該語音輸入進行識別的結(jié)果為多個與該語音輸入相關(guān)的匹配結(jié)果,該語音識別引擎對該語音輸入的識別準確度不夠精確,因此,將該語音輸入、匹配結(jié)果組和該第一匹配結(jié)果作為輸入,對該語音識別引擎的模型進行自適應訓練,以增加該第一匹配結(jié)果與該語音輸入的關(guān)聯(lián)度,提高該語音識別引擎對該語音輸入的識別匹配的準確度。
[0100]所以,基于語音識別引擎的模型自適應訓練,使得下一次基于該語音識別引擎對該語音輸入進行匹配時,能夠準確識別匹配,得到該第一匹配結(jié)果,用戶無需從多個匹配結(jié)果中再次選擇,簡化了用戶的操作流程,提高用戶體驗。
[0101]需要說明的是,該對語音識別引擎模型的自適應訓練,可以在本地實現(xiàn)也可在與該電子設(shè)備相關(guān)聯(lián)的云服務器進行。
[0102]其中,當該對語音識別引擎模型的自適應訓練是在與電子設(shè)備相關(guān)聯(lián)的云服務器進行時,該電子設(shè)備設(shè)置有網(wǎng)絡單元,將記錄的所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果,通過該網(wǎng)絡單元上傳到云服務器中,對設(shè)置在該云服務器中的語音識別引擎模型進行自適應訓練。
[0103]需要說明的是,還可根據(jù)電子設(shè)備的姿態(tài)判斷用戶使用該電子設(shè)備的操作,如該電子設(shè)備為手持終端時,手持終端的姿態(tài)表明用戶的操作為打電話時,則直接使用該語音識別引擎對該語音輸入和通訊錄中聯(lián)系人進行匹配,減小識別匹配該語音輸入的范圍。
[0104]具體的,該用戶使用該手持終端打電話時,該手持終端的姿態(tài)可以包括:該手持終端與豎直方向的夾角滿足預設(shè)的夾角范圍、或者,該手持終端的表面溫度值滿足預設(shè)的溫度范圍,或者,該手持終端檢測到的距離值在預設(shè)的距離內(nèi)等條件,也可為其中的兩個組合,或者滿足全部條件。[0105]由于每個人的發(fā)音習慣不同,則在對用戶進行語音識別匹配時,還需要針對該用戶的發(fā)音習慣。
[0106]參見圖2,為本發(fā)明提供的一種信息處理方法實施例2流程圖。
[0107]步驟S201:獲取進行所述語音輸入的用戶的身份信息;
[0108]其中,每個用戶的身份信息唯一,獲取該語音輸入的用戶的信息,用于對該用戶進行針對性的識別匹配,以得到針對該用戶的匹配結(jié)果。
[0109]其中,該用戶的身份信息可以通過多種方式獲取,包括:人臉識別、聲紋識別、指紋識別和信息錄入等方式。
[0110]比如,當該身份信息通過人臉識別方式獲取時,用戶將電子設(shè)備放置在距離用戶面部預設(shè)距離范圍內(nèi)的區(qū)域,電子設(shè)備對該用戶面部特征進行獲取,以確定該用戶的身份信息。
[0111]又如,當該身份信息通過信息錄入方式獲取時,在該電子設(shè)備中預設(shè)區(qū)域設(shè)置登錄對話框,用戶在該對話框中填入表示身份的信息,實現(xiàn)對該用戶的身份信息的確定。
[0112]或者,當該身份信息通過指紋識別方式獲取時,用戶將識別對應的手指放置在電子設(shè)備中指紋采集區(qū)域,電子設(shè)備對該用戶的指紋特征進行獲取,以確定該用戶的身份信
肩、O
[0113]或者,當該身份信息通過聲紋識別方式獲取時,用戶對該電子設(shè)備發(fā)出測試聲音,以使該電子設(shè)備對該用戶的聲音進行獲取,并進行識別,以確定該用戶的身份信息。
[0114]需要說明的是,當采用聲紋識別方式獲取該用戶的身份信息時,可在語音采集單元采集語音輸入后,接收該語音輸入時,對該語音進行聲紋識別,以使得根據(jù)用戶的身份信息采用相應的語音識別引擎的模型對該語音輸入進行識別匹配。
[0115]步驟S202:接收所述語音采集單元采集的語音輸入;
[0116]步驟S203:基于語音識別引擎對所述語音輸入匹配,得到與所述語音輸入相關(guān)的由至少2個匹配結(jié)果組成的匹配結(jié)果組;
[0117]步驟S204:輸出所述匹配結(jié)果組;
[0118]步驟S205:接收用戶反饋的輸入操作;
[0119]步驟S206:依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果;
[0120]其中,步驟S202-206與實施例1中步驟S101-105—致,本實施例中不再贅述。
[0121]步驟S207:記錄所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述語音輸入的用戶的身份信息;
[0122]其中,將所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述語音輸入的用戶的身份信息作為本次識別的結(jié)果,對該結(jié)果進行記錄。
[0123]需要說明的是,當該語音識別為在云服務器中執(zhí)行時,可通過電子設(shè)備的網(wǎng)絡單元將該語音輸入、匹配結(jié)果組、第一匹配結(jié)果語音輸入的用戶的身份信息上傳到云服務器中存儲。
[0124]步驟S208:對所述記錄的所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述語音輸入的用戶的身份信息進行語音識別引擎針對所述用戶的發(fā)音方式進行針對性的模型自適應訓練,以使得下一次基于所述語音識別引擎對所述用戶輸入的所述語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。[0125]其中,本次識別匹配是針對該用戶的語音輸入進行的識別匹配,產(chǎn)生多個匹配結(jié)果,所以,該語音識別引擎針對該用戶的語音輸入的識別準確不夠精確,將該語音輸入、匹配結(jié)果組、第一匹配結(jié)果和語音輸入的用戶的身份信息作為輸入,對該語音識別引擎進行針對該用戶的發(fā)音方式進行針對性的模型自適應訓練,增加該第一匹配結(jié)果與該用戶輸入的該語音輸入的關(guān)聯(lián)度,提高該語音識別引擎對該用戶的這一語音輸入的識別匹配的準確度。
[0126]例如,當在該電子設(shè)備已登錄的用戶李四的語音輸入為“zhangshan”,語音識別引擎匹配得到的匹配結(jié)果依次為“張山”、“張三”、“張栓”三個匹配結(jié)果,而用戶發(fā)音不標準,其目標結(jié)果為“張三”,即根據(jù)用戶的選擇確定第一匹配結(jié)果為“張三”,此時,電子設(shè)備記錄該語音輸入“zhangshan”、“張山” “張三” “張栓”三個匹配結(jié)果、第一匹配結(jié)果“張三”以及該用戶李四的身份信息作為本次識別匹配的結(jié)果,依據(jù)該識別匹配結(jié)果對語音識別引擎針對用戶李四的發(fā)音方式進行針對性的模型自適應訓練。當用戶李四下一次的語音輸入為“zhangshan”時,語音識別引擎匹配得到的匹配結(jié)果“張三”,而不必再從多個匹配結(jié)果中進行再次選取,簡化用戶的操作,提高了用戶體驗。
[0127]需要說明的是,當該用戶為非首次進行語音輸入識別匹配時,將獲取到的用戶身份信息與存儲的歷史信息進行比對,判斷得到該用戶的為已記錄的用戶,并且在由語音識別引擎對該用戶的語音輸入進行識別時,采用與該用戶對應的語音識別引擎模型,該語音識別引擎模型已經(jīng)過上次用戶語音輸入的訓練,該語音識別引擎模型能夠針對該用戶的發(fā)音方式進行針對性識別,識別準確度更高。
[0128]需要說明的是,當某一非登錄用戶使用該電子設(shè)備時,可對該用戶的語音輸入進行識別匹配,但不記錄其識別匹配結(jié)果。
[0129]進一步的,該電子設(shè)備的所有者用戶,還可設(shè)置使用權(quán)限,當沒有獲得使用權(quán)限的用戶使用該電子設(shè)備時,該用戶未能通過權(quán)限識別,則不對該用戶的語音輸入進行識別匹配。
[0130]參見圖3,為本發(fā)明提供的一種信息處理方法實施例3的流程圖。
[0131]步驟S301:接收所述語音采集單元采集的語音輸入;
[0132]步驟S302:基于語音識別引擎對所述語音輸入匹配,得到與所述語音輸入相關(guān)的由至少2個匹配結(jié)果組成的匹配結(jié)果組;
[0133]步驟S303:輸出所述匹配結(jié)果組;
[0134]步驟S304:接收用戶反饋的輸入操作;
[0135]步驟S305:依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果;
[0136]步驟S306:記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果;
[0137]其中,步驟S301-306與上述實施例1中的步驟S101-106—致,本實施例中不再贅述。
[0138]步驟S307:基于所述匹配結(jié)果組和所述第一匹配結(jié)果,確定除所述第一匹配結(jié)果的第二匹配結(jié)果;
[0139]其中,該匹配結(jié)果組中有至少2個匹配結(jié)果,其中一個為第一匹配結(jié)果,剩余的為
第二匹配結(jié)果。
[0140]如,上述例子中該匹配結(jié)果組為“張山”、“張三”和“張栓”,該“張三”為第一匹配結(jié)果,剩余的“張山”和“張栓”為第二匹配結(jié)果。
[0141]驟S308:將所述第一匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為第一值;
[0142]其中,在語音識別引擎對該語音輸入進行識別時,對每個匹配結(jié)果中都標注有其與該語音輸入的匹配率,該匹配結(jié)果的發(fā)音與該語音輸入越接近,其匹配率越高。
[0143]其中,當根據(jù)用戶的選擇確定了第一匹配結(jié)果時,表示用戶的該語音輸入與其選擇的第一匹配結(jié)果對應的發(fā)音,對于用戶來講為最接近的,因此,將該第一匹配結(jié)果與該語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為第一值。
[0144]步驟S309:將所述第二匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為第二值。
[0145]其中,當根據(jù)用戶的選擇確定了第一匹配結(jié)果時,表示用戶的該語音輸入與其選擇的第一匹配結(jié)果對應的發(fā)音,對于用戶來講為最接近的,而其他的匹配結(jié)果為不滿足用戶需要的,因此,還要將第二匹配結(jié)果與該語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為第二值。
[0146]其中,所述第一值大于所述第二值。
[0147]因此,在該匹配率的數(shù)值調(diào)整之后,該第一匹配結(jié)果與該語音輸入的匹配率的數(shù)值為最高的,第二匹配結(jié)果與該語音輸入的匹配率較低,使得第一匹配結(jié)果和第二匹配結(jié)果的匹配率之間的差距較大,更利于下次再對用戶的語音輸入進行識別時能夠找到唯一的該第一匹配結(jié)果。
[0148]如上述例子中,當識別該語音輸入“zhangshan”,得到的匹配結(jié)果“張山”、“張三”、“張栓”的匹配率分別為90 %、75 %和40 %,當用戶選擇的第一匹配結(jié)果為“張三”時,在訓練該語音識別引擎的模型時,提高該“張三”的匹配率,如提高至95%,降低其他兩個匹配結(jié)果的匹配率,如降為40%。當語音輸入“zhangshan”時,經(jīng)過訓練的語音識別引擎的模型對該語音輸入進行識別匹配,得到匹配結(jié)果“張三”。
[0149]當然,降低該其他匹配結(jié)果的匹配率可采用其他方式,如,分別降低某一數(shù)值,使得該最初為最高匹配率的匹配結(jié)果的最終匹配率低于該第一匹配結(jié)果的最終匹配率。
[0150]參見圖4,為本發(fā)明提供的一種信息處理方法實施例4的流程圖。
[0151]步驟S401:獲取進行所述語音輸入的用戶的身份信息;
[0152]步驟S402:接收所述語音采集單元采集的語音輸入;
[0153]步驟S403:基于語音識別引擎對所述語音輸入匹配,得到與所述語音輸入相關(guān)的由至少2個匹配結(jié)果組成的匹配結(jié)果組;
[0154]步驟S404:輸出所述匹配結(jié)果組;
[0155]步驟S405:接收用戶反饋的輸入操作;
[0156]步驟S406:依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果;
[0157]步驟S407:記錄所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述語音輸入的用戶的身份信息;
[0158]其中,步驟S401-407與上述實施例2中的步驟S201-206 —致,本實施例中不再贅述。
[0159]步驟S408:基于所述匹配結(jié)果組和所述第一匹配結(jié)果,確定除所述第一匹配結(jié)果的第二匹配結(jié)果;
[0160]其中,該獲取用戶身份信息的用戶可視為登錄的用戶。所以,本實施例中針對該登錄用戶的發(fā)音,對該語音識別引擎的模型進行訓練。
[0161]其中,該語音該匹配結(jié)果組中有至少2個匹配結(jié)果,其中一個為第一匹配結(jié)果,剩余的為第二匹配結(jié)果。
[0162]如,上述例子中該匹配結(jié)果組為“張山”、“張三”和“張栓”,由于該登錄用戶的發(fā)音問題,該“張三”被確認為第一匹配結(jié)果,剩余的“張山”和“張栓”為第二匹配結(jié)果。
[0163]步驟S409:將所述第一匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為第一值;
[0164]其中,在語音識別引擎對該語音輸入進行識別時,對每個匹配結(jié)果中都標注有其與該語音輸入的匹配率,該匹配結(jié)果的發(fā)音與該語音輸入越接近,其匹配率越高。
[0165]其中,當根據(jù)用戶的選擇確定了第一匹配結(jié)果時,表示用戶的該語音輸入與其選擇的第一匹配結(jié)果對應的發(fā)音,對于用戶來講為最接近的,因此,將該第一匹配結(jié)果與該語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為第一值。
[0166]步驟S410:將所述第二匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為第二值。
[0167]其中,所述第一值大于所述第二值。
[0168]其中,當根據(jù)該登錄用戶的選擇確定了第一匹配結(jié)果時,表示該登錄用戶的該語音輸入與其選擇的第一匹配結(jié)果對應的發(fā)音,對于該登錄用戶來講為最接近的,而其他的匹配結(jié)果為不滿足用戶需要的,因此,還要將第二匹配結(jié)果與該語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為第二值。
[0169]因此,在該匹配率的數(shù)值調(diào)整之后,該第一匹配結(jié)果與該語音輸入的匹配率的數(shù)值為最高的,第二匹配結(jié)果與該語音輸入的匹配率較低,下次再對該登錄用戶的語音輸入進行識別時能夠找到唯一的該第一匹配結(jié)果。
[0170]由于本實施例中,該對語音識別引擎的模型進行自適應訓練為針對該登錄用戶所做,那么當其他用戶使用該電子設(shè)備進行語音輸入時,不再使用該針對登錄用戶進行訓練過的語音識別引擎的模型進行識別匹配,當該其他用戶未登錄過時,可采用未被進行自適應訓練過的模型進行識別;當該用戶是歷史登錄過的用戶時,可采用該歷史登錄過的用戶的身份信息找到與其對應的語音識別引擎的模型,該與其對應的語音識別引擎的模型也是經(jīng)過該歷史登錄過的用戶的發(fā)音方式的訓練的。
[0171]然而,實際實施中,用戶可能會出現(xiàn)錯選的操作。
[0172]參見圖5,為本發(fā)明提供的一種信息處理方法實施例5的流程圖。
[0173]步驟S501:接收所述語音采集單元采集的語音輸入;
[0174]步驟S502:基于語音識別引擎對所述語音輸入匹配,得到與所述語音輸入相關(guān)的由至少2個匹配結(jié)果組成的匹配結(jié)果組;
[0175]步驟S503:輸出所述匹配結(jié)果組;
[0176]步驟S504:接收用戶反饋的輸入操作;
[0177]步驟S505:依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果;
[0178]其中,步驟S501-505與實施例1中的步驟S101-105—致,本實施例中不再贅述。[0179]步驟S506:依據(jù)預設(shè)條件判斷所述第一匹配結(jié)果響應所述語音輸入對應的操作是否完成;
[0180]其中,所述語音輸入對應的操作是指用戶的目標操作,則該第一匹配結(jié)果響應所述語音輸入對應的操作包括:根據(jù)該第一匹配結(jié)果響應該用戶的目標操作。
[0181]如,當用戶采用語音輸入以實現(xiàn)通訊錄聯(lián)系人搜索,則該語音輸入對應的操作是指用戶與該搜索得到的第一匹配結(jié)果對應的聯(lián)系人建立通話或者正常通話結(jié)束;
[0182]又如,當用戶采用語音輸入以實現(xiàn)網(wǎng)絡搜索時,該語音輸入對應的操作是指用戶采用該第一匹配結(jié)果對應的內(nèi)容在網(wǎng)絡中進行搜索操作或者搜索完成;
[0183]或者,當該用戶采用語音輸入以實現(xiàn)短信息等內(nèi)容輸入時,該語音輸入對應的操作是指用戶采用該第一匹配結(jié)果生成短信息并發(fā)送。
[0184]具體的,當該響應為依據(jù)該第一匹配結(jié)果的聯(lián)系人進行打電話時,當對方接起電話,或者接通超過預設(shè)時間閾值,則判定操作完成;否則未完成。
[0185]當完成時,執(zhí)行步驟S507,否則,結(jié)束,不記錄該識別匹配結(jié)果。
[0186]具體的,當用戶選擇某一匹配結(jié)果后,該電子設(shè)備根據(jù)該選擇確定該匹配結(jié)果為第一匹配結(jié)果,但是,用戶在預設(shè)的時間內(nèi)取消了該匹配結(jié)果對應的響應操作,則可判定根據(jù)該用戶反饋的輸入操作確定的該第一匹配結(jié)果為非目標結(jié)果,即,用戶的選擇動作為誤操作,則不對本次的識別匹配結(jié)果進行記錄,以防止用戶的誤操作導致語音識別引擎的模型的自適應訓練受到影響。
[0187]其余操作對應的響應方式類似。
[0188]步驟S507:當完成時,記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果;
[0189]步驟S508:對所述記錄的所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果進行語音識別引擎的模型自適應訓練,以使得下一次基于所述語音識別引擎對所述語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
[0190]其中,步驟S507-508與實施例1中的步驟S106-107 —致,本實施例中不再贅述。
[0191]與本申請?zhí)峁┑囊环N信息處理方法實施例相對應的,本申請還提供了一種信息處理裝置實施例。
[0192]參見圖6,示出了本申請?zhí)峁┑囊环N信息處理裝置實施例1的結(jié)構(gòu)示意圖,所述裝置可以應用于一電子設(shè)備,所述電子設(shè)備可以是臺式機、筆記本、平板電腦、手機、智能電視、智能手表、穿戴式設(shè)備等電子設(shè)備,所述電子設(shè)備中設(shè)置有語音采集單元,用于對外界環(huán)境中的語音進行采集,在本申請中該外界環(huán)境中的語音尤其指使用該電子設(shè)備的用戶發(fā)出的語音。
[0193]該裝置包括:第一接收模塊601、匹配模塊602、輸出模塊603、第二接收模塊604、選擇模塊605、記錄模塊606和訓練模塊607 ;
[0194]第一接收模塊601,用于接收所述語音采集單元采集的語音輸入;
[0195]其中,該語音輸入為用戶發(fā)出的用于搜索的語音,該語音可以包括:電話號碼、數(shù)字組合等數(shù)字內(nèi)容,也可為名字等文字內(nèi)容,甚至為文字和數(shù)字的組合,本實施例中不做限制。
[0196]其中,該語音采集單元可以為實時采集語音輸入,也可為等待用戶開啟后再進行采集。[0197]其中,當該語音單元為實時采集語音輸入時,該語音輸入中可包含啟動語音識別進行搜索的啟動指令,該電子設(shè)備中還可包括啟動模塊,該啟動模塊可用于對語音輸入和預設(shè)的指令語音進行比對,當二者一致時,依據(jù)該預設(shè)的指令進行執(zhí)行響應動作。
[0198]具體的,該啟動指令可以預設(shè)的一個或一組觸發(fā)語音信號,當?shù)谝唤邮漳K601接收所述語音采集單元采集的語音輸入后,啟動模塊判斷該語音輸入與該觸發(fā)語音信號一致時,啟動該語音識別引擎,觸發(fā)匹配模塊602對語音輸入進行匹配。
[0199]匹配模塊602,用于基于語音識別引擎對所述語音輸入匹配,得到與所述語音輸入相關(guān)的由至少2個匹配結(jié)果組成的匹配結(jié)果組;
[0200]其中,該語音識別引擎對語音輸入進行匹配的方式有兩種:一種為在有限的備選內(nèi)容中進行匹配;另一種為對該語音輸入進行識別,直接生成與該語音輸入相關(guān)的多個識別結(jié)果。
[0201 ] 其中,在本實施例中,該有限的備選內(nèi)容可以為電子設(shè)備中存儲的內(nèi)容,具體包括:通訊錄中聯(lián)系人姓名、文件名稱等。
[0202]其中,當用戶在電子設(shè)備中搜索聯(lián)系人姓名時,該匹配模塊602的語音識別引擎對語音輸入進行匹配的方式可采用在有限的備選內(nèi)容中進行匹配。
[0203]其中,當用戶在電子設(shè)備通過輸入語音信息使用網(wǎng)絡搜索某些內(nèi)容時,由于網(wǎng)絡中資源眾多,所以該語音識別引擎對語音輸入進行匹配的方式可以采用直接生成與該語音輸入相關(guān)的多個識別結(jié)果的方式,再由用戶在其中選擇需要的識別結(jié)果,以根據(jù)該識別結(jié)果進行網(wǎng)絡搜索。
[0204]具體的,在接收到語音輸入時,匹配模塊602基于預設(shè)的語音識別引擎對該語音輸入進行識別匹配,得到至少2個匹配結(jié)果,該匹配結(jié)果為與該語音輸入相關(guān)的內(nèi)容,并且,將該得到的匹配結(jié)果作為匹配結(jié)果組。
[0205]需要說明的是,該語音識別可以在本地識別也可在與該電子設(shè)備相關(guān)聯(lián)的云服務器進行,即該匹配模塊602可以在電子設(shè)備中,也可設(shè)置在與該電子設(shè)備相關(guān)聯(lián)的云服務器。
[0206]其中,當該語音識別是在與電子設(shè)備相關(guān)聯(lián)的云服務器進行時,該電子設(shè)備設(shè)置有網(wǎng)絡單元,當接收到該語音輸入時,通過該網(wǎng)絡單元將該語音輸入上傳到云服務器中進行識別匹配,并且在云服務器識別匹配得到匹配結(jié)果組并反饋時,該電子設(shè)備通過網(wǎng)絡單元接收該匹配結(jié)果組。
[0207]輸出模塊603,用于輸出所述匹配結(jié)果組;
[0208]其中,該匹配結(jié)果組中含有多個匹配結(jié)果,需要用戶從中選擇一個與用戶的輸入語音對應的目標結(jié)果。
[0209]具體的,輸出模塊603將該匹配結(jié)果組輸出,該輸出的匹配結(jié)果組的內(nèi)容可在該電子設(shè)備的顯示單元中進行顯示。
[0210]其中,該匹配結(jié)果組中,可對各個匹配結(jié)果按照與該語音輸入的匹配率的高低進行排序,使匹配率較高的匹配結(jié)果排序在前,以使得用戶首先看到該排序靠前的匹配結(jié)果。
[0211]第二接收模塊604,用于接收用戶反饋的輸入操作;
[0212]其中,用戶反饋的輸入操作表示用戶在該多個匹配結(jié)果中選擇的一個匹配結(jié)果。
[0213]其中,該用戶反饋的輸入操作可通過多種方式實現(xiàn)。[0214]比如,當該電子設(shè)備中設(shè)置有觸摸屏時,在觸摸屏上顯示該匹配得到的多個匹配結(jié)果,用戶在該觸摸屏中選擇一個目標結(jié)果,該選擇的操作作為用戶反饋的輸入操作,電子設(shè)備通過該觸摸屏接收該用戶反饋的輸入操作;
[0215]比如,當該電子設(shè)備中采用鍵盤按鍵時,在顯示屏幕上顯示的多個匹配結(jié)果,用戶根據(jù)在該鍵盤按鍵的操作選定一個目標結(jié)果,該通過鍵盤選擇的操作也可作為用戶反饋的輸入操作,電子設(shè)備通過該觸摸屏接收該用戶反饋的輸入操作;
[0216]或者,該電子設(shè)備中采用鼠標選擇時,采用鼠標在顯示屏幕上顯示的多個匹配結(jié)果進行選擇,選定一個目標結(jié)果,該鼠標選擇的操作也可作為用戶反饋的輸入操作;
[0217]或者,用戶通過語音控制選擇,如用戶輸入“選擇第二個”的語音信號,使得電子設(shè)備獲取該語音信號,并對該語音信號進行識別得出選擇第二個作為目標結(jié)果,該通過語音選擇的操作也可作為用戶反饋的輸入操作。
[0218]選擇模塊605,用于依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果;
[0219]其中,依據(jù)該用戶反饋的輸入操作,選擇模塊605從該匹配結(jié)果組中確定與該輸入操作對應的一個匹配結(jié)果作為第一匹配結(jié)果。
[0220]其中,該第一匹配結(jié)果為本次語音識別過程中,用戶選擇的目標結(jié)果。
[0221]實際實施中,當確定該第一匹配結(jié)果后,電子設(shè)備對該第一匹配結(jié)果進行響應,開始執(zhí)行與該第一匹配結(jié)果相應的操作。
[0222]例如,當該語音輸入用于查詢通訊錄聯(lián)系人時,確定第一匹配結(jié)果即目標聯(lián)系人后,可執(zhí)行撥打該目標聯(lián)系人電話的操作。
[0223]例如,當該語音輸入用于網(wǎng)絡查詢某內(nèi)容時,當確定第一匹配結(jié)果即搜索關(guān)鍵詞后,可依據(jù)該搜索關(guān)鍵詞進行網(wǎng)絡搜索。
[0224]記錄模塊606,用于記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果;
[0225]其中,記錄模塊606對本次輸入的語音進行識別匹配的結(jié)果進行記錄,包括記錄該語音輸入、匹配結(jié)果組和第一匹配結(jié)果。
[0226]需要說明的是,當該語音識別為在云服務器中執(zhí)行時,可通過電子設(shè)備的網(wǎng)絡單元將該語音輸入、匹配結(jié)果組和第一匹配結(jié)果上傳到云服務器中存儲。
[0227]訓練模塊607,用于對所述記錄的所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果進行語音識別引擎的模型自適應訓練,以使得下一次基于所述語音識別引擎對搜索語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
[0228]其中,由于本次基于該語音識別引擎對該語音輸入進行識別的結(jié)果為多個與該語音輸入相關(guān)的匹配結(jié)果,該語音識別引擎對該語音輸入的識別準確度不夠精確,因此,訓練模塊607將該語音輸入、匹配結(jié)果組和該第一匹配結(jié)果作為輸入,對該語音識別引擎的模型進行自適應訓練,以增加該第一匹配結(jié)果與該語音輸入的關(guān)聯(lián)度,提高該語音識別引擎對該語音輸入的識別匹配的準確度。
[0229]所以,基于語音識別引擎的模型自適應訓練,使得下一次基于該語音識別引擎對該語音輸入進行匹配時,能夠準確識別匹配,得到該第一匹配結(jié)果,用戶無需從多個匹配結(jié)果中再次選擇,簡化了用戶的操作流程,提高用戶體驗。
[0230]需要說明的是,該對語音識別引擎模型的自適應訓練,可以在本地實現(xiàn)也可在與該電子設(shè)備相關(guān)聯(lián)的云服務器進行。
[0231]其中,當該對語音識別引擎模型的自適應訓練是在與電子設(shè)備相關(guān)聯(lián)的云服務器進行時,該電子設(shè)備設(shè)置有網(wǎng)絡單元,將記錄的所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果,通過該網(wǎng)絡單元上傳到云服務器中,對設(shè)置在該云服務器中的語音識別引擎模型進行自適應訓練。
[0232]需要說明的是,還可根據(jù)電子設(shè)備的姿態(tài)判斷用戶使用該電子設(shè)備的操作,如該電子設(shè)備為手持終端時,手持終端的姿態(tài)表明用戶的操作為打電話時,則直接使用該語音識別引擎對該語音輸入和通訊錄中聯(lián)系人進行匹配,減小識別匹配該語音輸入的范圍。
[0233]具體的,該用戶使用該手持終端打電話時,該手持終端的姿態(tài)可以包括:該手持終端與豎直方向的夾角滿足預設(shè)的夾角范圍、或者,該手持終端的表面溫度值滿足預設(shè)的溫度范圍,或者,該手持終端檢測到的距離值在預設(shè)的距離內(nèi)等條件,也可為其中的兩個組合,或者滿足全部條件。
[0234]由于每個人的發(fā)音習慣不同,則在對用戶進行語音識別匹配時,還需要針對該用戶的發(fā)音習慣。
[0235]參見圖7,為本發(fā)明提供的一種信息處理裝置實施例2的結(jié)構(gòu)示意圖,包括:獲取模塊701、第一接收模塊702、匹配模塊703、輸出模塊704、第二接收模塊705、選擇模塊706、記錄模塊707和訓練模塊708 ;
[0236]其中,該第一接收模塊702、匹配模塊703、輸出模塊704、第二接收模塊705、選擇模塊706、與實施例1中相應結(jié)構(gòu)功能相同,本實施例中不再贅述。
[0237]獲取模塊701,用于獲取進行所述語音輸入的用戶的身份信息;
[0238]其中,每個用戶的身份信息唯一,獲取模塊701獲取該語音輸入的用戶的信息,用于對該用戶進行針對性的識別匹配,以得到針對該用戶的匹配結(jié)果。
[0239]其中,該用戶的身份信息可以通過多種方式獲取,包括:人臉識別、聲紋識別、指紋識別和信息錄入等方式。
[0240]比如,當該身份信息通過人臉識別方式獲取時,用戶將電子設(shè)備放置在距離用戶面部預設(shè)距離范圍內(nèi)的區(qū)域,電子設(shè)備的攝像頭作為獲取模塊701對該用戶面部特征進行獲取,以確定該用戶的身份信息。
[0241]又如,當該身份信息通過信息錄入方式獲取時,在該電子設(shè)備中預設(shè)區(qū)域設(shè)置登錄對話框,用戶在該對話框中填入表示身份的信息,實現(xiàn)對該用戶的身份信息的確定。
[0242]或者,當該身份信息通過指紋識別方式獲取時,用戶將識別對應的手指放置在電子設(shè)備中指紋采集區(qū)域,電子設(shè)備對該用戶的指紋特征進行獲取,以確定該用戶的身份信
肩、O
[0243]或者,當該身份信息通過聲紋識別方式獲取時,用戶對該電子設(shè)備發(fā)出測試聲音,以使該電子設(shè)備對該用戶的聲音進行獲取,并進行識別,以確定該用戶的身份信息。
[0244]需要說明的是,當采用聲紋識別方式獲取該用戶的身份信息時,可在語音采集單元采集語音輸入后,接收該語音輸入時,對該語音進行聲紋識別,以使得根據(jù)用戶的身份信息采用相應的語音識別引擎的模型對該語音輸入進行識別匹配。
[0245]記錄模塊707,用于記錄所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述語音輸入的用戶的身份信息;[0246]其中,記錄模塊707將所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述語音輸入的用戶的身份信息作為本次識別的結(jié)果,對該結(jié)果進行記錄。
[0247]需要說明的是,當該語音識別為在云服務器中執(zhí)行時,可通過電子設(shè)備的網(wǎng)絡單元將該語音輸入、匹配結(jié)果組、第一匹配結(jié)果語音輸入的用戶的身份信息上傳到云服務器中存儲。
[0248]訓練模塊708,用于對所述記錄的所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述語音輸入的用戶的身份信息進行語音識別引擎針對所述用戶的發(fā)音方式進行針對性的模型自適應訓練,以使得下一次基于所述語音識別引擎對所述用戶輸入的所述語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
[0249]其中,本次識別匹配是針對該用戶的語音輸入進行的識別匹配,產(chǎn)生多個匹配結(jié)果,所以,該語音識別引擎針對該用戶的語音輸入的識別準確不夠精確,因此,訓練模塊708將該語音輸入、匹配結(jié)果組、第一匹配結(jié)果和語音輸入的用戶的身份信息作為輸入,對該語音識別引擎進行針對該用戶的發(fā)音方式進行針對性的模型自適應訓練,增加該第一匹配結(jié)果與該用戶輸入的該語音輸入的關(guān)聯(lián)度,提高該語音識別引擎對該用戶的這一語音輸入的識別匹配的準確度。
[0250]例如,當在該電子設(shè)備已登錄的用戶李四的語音輸入為“zhangshan”,語音識別引擎匹配得到的匹配結(jié)果依次為“張山”、“張三”、“張栓”三個匹配結(jié)果,而用戶發(fā)音不標準,其目標結(jié)果為“張三”,即根據(jù)用戶的選擇確定第一匹配結(jié)果為“張三”,此時,電子設(shè)備記錄該語音輸入“zhangshan”、“張山” “張三” “張栓”三個匹配結(jié)果、第一匹配結(jié)果“張三”以及該用戶李四的身份信息作為本次識別匹配的結(jié)果,依據(jù)該識別匹配結(jié)果對語音識別引擎針對用戶李四的發(fā)音方式進行針對性的模型自適應訓練。當用戶李四下一次的語音輸入為“zhangshan”時,語音識別引擎匹配得到的匹配結(jié)果“張三”,而不必再從多個匹配結(jié)果中進行再次選取,簡化用戶的操作,提高了用戶體驗。
[0251]需要說明的是,當該用戶為非首次進行語音輸入識別匹配時,將獲取到的用戶身份信息與存儲的歷史信息進行比對,判斷得到該用戶的為已記錄的用戶,并且在由語音識別引擎對該用戶的語音輸入進行識別時,采用與該用戶對應的語音識別引擎模型,該語音識別引擎模型已經(jīng)過上次用戶語音輸入的訓練,該語音識別引擎模型能夠針對該用戶的發(fā)音方式進行針對性識別,識別準確度更高。
[0252]需要說明的是,當某一非登錄用戶使用該電子設(shè)備時,可對該用戶的語音輸入進行識別匹配,但不記錄其識別匹配結(jié)果。
[0253]進一步的,該電子設(shè)備的所有者用戶,還可設(shè)置使用權(quán)限,當沒有獲得使用權(quán)限的用戶使用該電子設(shè)備時,該用戶未能通過權(quán)限識別,則不對該用戶的語音輸入進行識別匹配。
[0254]參見圖8,為本發(fā)明提供的一種信息處理裝置實施例,3的結(jié)構(gòu)示意圖,包括:第一接收模塊801、匹配模塊802、輸出模塊803、第二接收模塊804、選擇模塊805、記錄模塊806和訓練模塊807 ;其中,訓練模塊807包括:分類單元808、第一修改單元809和第二修改單元 810。
[0255]其中,第一接收模塊801、匹配模塊802、輸出模塊803、第二接收模塊804、選擇模塊805、記錄模塊806和實施例1中相應結(jié)構(gòu)功能一致,本實施例中不再贅述。[0256]分類單元808,用于基于所述匹配結(jié)果組和所述第一匹配結(jié)果,確定除所述第一匹配結(jié)果的第二匹配結(jié)果;
[0257]其中,該匹配結(jié)果組中有至少2個匹配結(jié)果,其中一個為第一匹配結(jié)果,分類單元808確定剩余的為第二匹配結(jié)果。
[0258]如,上述例子中該匹配結(jié)果組為“張山”、“張三”和“張栓”,該“張三”為第一匹配結(jié)果,剩余的“張山”和“張栓”為第二匹配結(jié)果。
[0259]第一修改單元809,用于將所述第一匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為第一值;
[0260]其中,在語音識別引擎對該語音輸入進行識別時,對每個匹配結(jié)果中都標注有其與該語音輸入的匹配率,該匹配結(jié)果的發(fā)音與該語音輸入越接近,其匹配率越高。
[0261]其中,當根據(jù)用戶的選擇確定了第一匹配結(jié)果時,表示用戶的該語音輸入與其選擇的第一匹配結(jié)果對應的發(fā)音,對于用戶來講為最接近的,因此,第一修改單元809將該第一匹配結(jié)果與該語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為第一值。
[0262]第二修改單元810,用于將所述第二匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為第二值。
[0263]其中,所述第一值大于所述第二值。
[0264]其中,當根據(jù)用戶的選擇確定了第一匹配結(jié)果時,表示用戶的該語音輸入與其選擇的第一匹配結(jié)果對應的發(fā)音,對于用戶來講為最接近的,而其他的匹配結(jié)果為不滿足用戶需要的,因此,還要第二修改單元810將第二匹配結(jié)果與該語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為第二值。
[0265]因此,在該匹配率的數(shù)值調(diào)整之后,該第一匹配結(jié)果與該語音輸入的匹配率的數(shù)值為最高的,第二匹配結(jié)果與該語音輸入的匹配率較低,使得第一匹配結(jié)果和第二匹配結(jié)果的匹配率之間的差距較大,更利于下次再對用戶的語音輸入進行識別時能夠找到唯一的該第一匹配結(jié)果。
[0266]如上述例子中,當識別該語音輸入“zhangshan”,得到的匹配結(jié)果“張山”、“張三”、“張栓”的匹配率分別為90 %、75 %和40 %,當用戶選擇的第一匹配結(jié)果為“張三”時,在訓練該語音識別引擎的模型時,提高該“張三”的匹配率,如提高至95%,降低其他兩個匹配結(jié)果的匹配率,如降為40%。當語音輸入“zhangshan”時,經(jīng)過訓練的語音識別引擎的模型對該語音輸入進行識別匹配,得到匹配結(jié)果“張三”。
[0267]當然,降低該其他匹配結(jié)果的匹配率可采用其他方式,如,分別降低某一數(shù)值,使得該最初為最高匹配率的匹配結(jié)果的最終匹配率低于該第一匹配結(jié)果的最終匹配率。
[0268]參見圖9,為本發(fā)明提供的一種信息處理裝置實施例4的結(jié)構(gòu)示意圖,包括:獲取模塊901、第一接收模塊902、匹配模塊903、輸出模塊904、第二接收模塊905、選擇模塊906、記錄模塊907和訓練模塊908 ;其中,訓練模塊908包括:分類單元909、第一修改單元910和第二修改單元911。
[0269]其中,獲取模塊901、第一接收模塊902、匹配模塊903、輸出模塊904、第二接收模塊905、選擇模塊906、記錄模塊907和實施例2中相應結(jié)構(gòu)功能一致,本實施例中不再贅述。
[0270]分類單元909,用于基于所述匹配結(jié)果組和所述第一匹配結(jié)果,確定除所述第一匹配結(jié)果的第二匹配結(jié)果;
[0271]其中,該獲取用戶身份信息的用戶可視為登錄的用戶。所以,本實施例中針對該登錄用戶的發(fā)音,對該語音識別引擎的模型進行訓練。
[0272]其中,該語音該匹配結(jié)果組中有至少2個匹配結(jié)果,其中一個為第一匹配結(jié)果,分類單元909確定剩余的為第二匹配結(jié)果。
[0273]如,上述例子中該匹配結(jié)果組為“張山”、“張三”和“張栓”,由于該登錄用戶的發(fā)音問題,該“張三”被確認為第一匹配結(jié)果,剩余的“張山”和“張栓”為第二匹配結(jié)果。
[0274]第一修改單元910,用于將所述第一匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為第一值;
[0275]其中,在語音識別引擎對該語音輸入進行識別時,對每個匹配結(jié)果中都標注有其與該語音輸入的匹配率,該匹配結(jié)果的發(fā)音與該語音輸入越接近,其匹配率越高。
[0276]其中,當根據(jù)用戶的選擇確定了第一匹配結(jié)果時,表示用戶的該語音輸入與其選擇的第一匹配結(jié)果對應的發(fā)音,對于用戶來講為最接近的,因此,第一修改單元910將該第一匹配結(jié)果與該語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為第一值。
[0277]第二修改單元911,用于將所述第二匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為第二值;
[0278]其中,所述第一值大于所述第二值。
[0279]其中,當根據(jù)該登錄用戶的選擇確定了第一匹配結(jié)果時,表示該登錄用戶的該語音輸入與其選擇的第一匹配結(jié)果對應的發(fā)音,對于該登錄用戶來講為最接近的,而其他的匹配結(jié)果為不滿足用戶需要的,因此,還要第二修改單元911將第二匹配結(jié)果與該語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為第二值。
[0280]因此,在該匹配率的數(shù)值調(diào)整之后,該第一匹配結(jié)果與該語音輸入的匹配率的數(shù)值為最高的,第二匹配結(jié)果與該語音輸入的匹配率較低,下次再對該登錄用戶的語音輸入進行識別時能夠找到唯一的該第一匹配結(jié)果。
[0281]由于本實施例中,該對語音識別引擎的模型進行自適應訓練為針對該登錄用戶所做,那么當其他用戶使用該電子設(shè)備進行語音輸入時,不再使用該針對登錄用戶進行訓練過的語音識別引擎的模型進行識別匹配,當該其他用戶未登錄過時,可采用未被進行自適應訓練過的模型進行識別;當該用戶是歷史登錄過的用戶時,可采用該歷史登錄過的用戶的身份信息找到與其對應的語音識別引擎的模型,該與其對應的語音識別引擎的模型也是經(jīng)過該歷史登錄過的用戶的發(fā)音方式的訓練的。
[0282]然而,實際實施中,用戶可能會出現(xiàn)錯選的操作。
[0283]參見圖10,為本發(fā)明提供的一種信息處理裝置實施例5的結(jié)構(gòu)示意圖,包括:獲取模塊1001、第一接收模塊1002、匹配模塊1003、輸出模塊1004、第二接收模塊1005、選擇模塊1006、判斷模塊1007、記錄模塊1008和訓練模塊1009 ;
[0284]其中,獲取模塊1001、第一接收模塊1002、匹配模塊1003、輸出模塊1004、第二接收模塊1005、選擇模塊1006、記錄模塊1008和訓練模塊1009與實施例1中相應的結(jié)構(gòu)功能一致,本實施例中不再贅述。
[0285]判斷模塊1007,用于依據(jù)預設(shè)條件判斷所述第一匹配結(jié)果響應所述語音輸入對應的操作是否完成;[0286]其中,所述語音輸入對應的操作是指用戶的目標操作,則該第一匹配結(jié)果響應所述語音輸入對應的操作包括:根據(jù)該第一匹配結(jié)果響應該用戶的目標操作。
[0287]如,當用戶采用語音輸入以實現(xiàn)通訊錄聯(lián)系人搜索,則該語音輸入對應的操作是指用戶與該搜索得到的第一匹配結(jié)果對應的聯(lián)系人建立通話或者正常通話結(jié)束;
[0288]又如,當用戶采用語音輸入以實現(xiàn)網(wǎng)絡搜索時,該語音輸入對應的操作是指用戶采用該第一匹配結(jié)果對應的內(nèi)容在網(wǎng)絡中進行搜索操作或者搜索完成;
[0289]或者,當該用戶采用語音輸入以實現(xiàn)短信息等內(nèi)容輸入時,該語音輸入對應的操作是指用戶采用該第一匹配結(jié)果生成短信息并發(fā)送。
[0290]具體的,當該響應為依據(jù)該第一匹配結(jié)果的聯(lián)系人進行打電話時,當對方接起電話,或者接通超過預設(shè)時間閾值,則判斷模塊1007判定操作完成;否則未完成。
[0291]當完成時,觸發(fā)記錄模塊;否則,結(jié)束,不記錄該識別匹配結(jié)果。
[0292]具體的,當用戶選擇某一匹配結(jié)果后,該電子設(shè)備根據(jù)該選擇確定該匹配結(jié)果為第一匹配結(jié)果,但是,用戶在預設(shè)的時間內(nèi)取消了該匹配結(jié)果對應的響應操作,則判斷模塊1007可判定根據(jù)該用戶反饋的輸入操作確定的該第一匹配結(jié)果為非目標結(jié)果,即,用戶的選擇動作為誤操作,則不對本次的識別匹配結(jié)果進行記錄,以防止用戶的誤操作導致語音識別引擎的模型的自適應訓練受到影響。
[0293]其余操作對應的響應方式類似。
[0294]本申請中還提供了 一種電子設(shè)備,該電子設(shè)備包括語音采集單元和上述實施例中的信息處理裝置,該信息處理裝置包括:第一接收模塊、匹配模塊、輸出模塊、第二接收模塊、選擇模塊、記錄模塊和訓練模塊。
[0295]其中,該信息處理裝置各個組成模塊的功能與上述的一種信息處理裝置實施例中相應結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0296]優(yōu)選的,該電子設(shè)備的信息處理裝置中還包括:獲取模塊,用于獲取進行所述語音輸入的用戶的身份信息;
[0297]同時,該記錄模塊,在記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果的同時,還記錄所述語音輸入的用戶的身份信息,以使得所述記錄的所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述用戶的身份信息用于所述語音識別引擎針對所述用戶的發(fā)音方式進行針對性的模型自適應訓練,以使得下一次基于所述語音識別引擎對所述用戶輸入的所述語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
[0298]其中,該信息處理裝置各個組成模塊的功能與上述的一種信息處理裝置實施例中相應結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0299]優(yōu)選的,該電子設(shè)備的信息處理裝置中,所述訓練模塊包括:分類單元、第一修改單元和第二修改單元;
[0300]其中,該信息處理裝置各個組成模塊單元的功能與上述的一種信息處理裝置實施例中相應結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0301]優(yōu)選的,該電子設(shè)備的信息處理裝置中還包括:判斷模塊,用于依據(jù)預設(shè)條件判斷所述第一匹配結(jié)果響應所述語音輸入對應的操作是否完成;完成時,觸發(fā)記錄模塊。
[0302]其中,該信息處理裝置各個組成模塊的功能與上述的一種信息處理裝置實施例中相應結(jié)構(gòu)的功能一致,本實施例中不再贅述。[0303]以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。
【權(quán)利要求】
1.一種信息處理方法,其特征在于,所述方法應用于電子設(shè)備,所述電子設(shè)備中設(shè)置有語音采集單元,該方法包括: 接收所述語音采集單元采集的語音輸入; 基于語音識別引擎對所述語音輸入匹配,得到與所述語音輸入相關(guān)的由至少2個匹配結(jié)果組成的匹配結(jié)果組; 輸出所述匹配結(jié)果組; 接收用戶反饋的輸入操作; 依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果; 記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果; 對所述記錄的所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果進行語音識別引擎的模型自適應訓練,以使得下一次基于所述語音識別引擎對所述語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,接收所述語音采集單元采集的語音輸入之前,還包括: 獲取進行所述語音輸入的用戶的身份信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括: 在記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果的同時,記錄所述語音輸入的用戶的身份信息,以使得所述記錄的所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述用戶的身份信息用于所述語音識別引擎針對所述用戶的發(fā)音方式進行針對性的模型自適應訓練,以使得下一次基于所述語音識別引擎對所述用戶輸入的所述語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
4.根據(jù)權(quán)利要求1或3所述的方法,其特征在于,所述對所述記錄的所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果進行語音識別引擎的模型自適應訓練包括: 基于所述匹配結(jié)果組和所述第一匹配結(jié)果,確定除所述第一匹配結(jié)果的第二匹配結(jié)果; 將所述第一匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為第一值; 將所述第二匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為第二值; 其中,所述第一值大于所述第二值。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果之后,所述記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果之前,還包括: 依據(jù)預設(shè)條件判斷所述第一匹配結(jié)果響應所述語音輸入對應的操作是否完成; 當完成時,執(zhí)行所述記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果步驟。
6.一種信息處理裝置,其特征在于,應用于電子設(shè)備,所述電子設(shè)備中設(shè)置有語音采集單元,所述裝置包括: 第一接收模塊,用于接收所述語音采集單元采集的語音輸入; 匹配模塊,用于基于語音識別引擎對所述語音輸入匹配,得到與所述語音輸入相關(guān)的由至少2個匹配結(jié)果組成的匹配結(jié)果組; 輸出模塊,用于輸出所述匹配結(jié)果組; 第二接收模塊,用于接收用戶反饋的輸入操作; 選擇模塊,用于依據(jù)所述輸入操作從所述匹配結(jié)果組中確定一個第一匹配結(jié)果; 記錄模塊,用于記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果; 訓練模塊,用于對所述記錄的所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果進行語音識別引擎的模型自適應訓練,以使得下一次基于所述語音識別引擎對搜索語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 獲取模塊,用于獲取進行所述語音輸入的用戶的身份信息。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于, 所述記錄模塊,在記錄所述語音輸入、所述匹配結(jié)果組和所述第一匹配結(jié)果的同時,還記錄所述語音輸入的用戶的身份信息,以使得所述記錄的所述語音輸入、所述匹配結(jié)果組、所述第一匹配結(jié)果和所述用戶的身份信息用于所述語音識別引擎針對所述用戶的發(fā)音方式進行針對性的模型自適應訓練,以使得下一次基于所述語音識別引擎對所述用戶輸入的所述語音輸入進行匹配時產(chǎn)生所述第一匹配結(jié)果。
9.根據(jù)權(quán)利要求6或8所述的裝置,其特征在于,所述訓練模塊包括: 分類單元,用于基于所述匹配結(jié)果組和所述第一匹配結(jié)果,確定除所述第一匹配結(jié)果的第二匹配結(jié)果; 第一修改單元,用于將所述第一匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上提高為第一值; 第二修改單元,用于將所述第二匹配結(jié)果與所述語音輸入的匹配率的數(shù)值在當前值的基礎(chǔ)上降低為第二值; 其中,所述第一值大于所述第二值。
10.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 判斷模塊,用于依據(jù)預設(shè)條件判斷所述第一匹配結(jié)果響應所述語音輸入對應的操作是否完成; 當完成時,觸發(fā)記錄模塊。
11.一種電子設(shè)備,其特征在于,包括:如權(quán)利要求6-10任一項所述的信息處理裝置和對所述電子設(shè)備的語音輸入進行采集的語音采集單元。
【文檔編號】G10L15/28GK103794214SQ201410083622
【公開日】2014年5月14日 申請日期:2014年3月7日 優(yōu)先權(quán)日:2014年3月7日
【發(fā)明者】戴中原, 戴海生 申請人:聯(lián)想(北京)有限公司