信息處理方法和信息處理裝置制造方法
【專利摘要】本發(fā)明公開了一種信息處理方法和裝置。所述信息處理方法應(yīng)用于第一電子設(shè)備中,所述第一電子設(shè)備能夠與第二電子設(shè)備進(jìn)行語音通信,所述方法包括:當(dāng)所述第一電子設(shè)備與所述第二電子設(shè)備進(jìn)行語音通信時(shí),獲取語音通信數(shù)據(jù);當(dāng)檢測到一識別指令時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別,以生成與所述語音通信數(shù)據(jù)對應(yīng)的文本信息;以及呈現(xiàn)一用戶界面,在所述用戶界面中顯示所述文本信息,以用于對所述文本信息進(jìn)行編輯確認(rèn)。因此,在本發(fā)明中,提供了一種能夠靈活、方便地記錄信息的方式,從而避免了用戶為了在語音通信期間記錄信息而不得不在通話操作和信息記錄之間進(jìn)行切換,提高了用戶體驗(yàn)。
【專利說明】信息處理方法和信息處理裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)【技術(shù)領(lǐng)域】,更具體地,本發(fā)明涉及一種信息處理方法和信息處
理裝置。
【背景技術(shù)】
[0002]近年來,諸如筆記本計(jì)算機(jī)、臺式計(jì)算機(jī)、平板電腦八0?、移動電話、多媒體播放器、個(gè)人數(shù)字助理(904)之類的電子設(shè)備越發(fā)普及。
[0003]同時(shí),隨著通信技術(shù)的不斷發(fā)展,在這些電子設(shè)備中通常都集成有通信裝置,這使得一個(gè)用戶能夠方便地與其他用戶隨時(shí)隨地地進(jìn)行語音通信。
[0004]在語音通信的過程中,典型地,經(jīng)常存在以下應(yīng)用場景,即一個(gè)用戶在使用電子設(shè)備(例如,移動電話)而與另一用戶進(jìn)行語音通信時(shí),隨時(shí)可能需要記錄對方所說的特定信息(諸如,姓名、電話號碼、地址、銀行卡號碼等 為此,在現(xiàn)有技術(shù)中,該用戶不得不將電子設(shè)備從自己耳邊拿開,并且在電子設(shè)備所顯示的撥號盤或其他應(yīng)用程序界面中手動輸入這些特定信息。顯然,這種信息記錄方式需要用戶首先暫停通話操作并開始記錄信息,并且在信息記錄完成之后再重新開始該通話操作。
[0005]顯然,這種操作方式十分繁瑣,造成用戶體驗(yàn)很差。尤其是,當(dāng)所要記錄的信息較長時(shí),用戶甚至可能需要在通話操作與信息記錄之間進(jìn)行多次切換,才能將信息完整地記錄下來,這無疑是極為耗費(fèi)精力的。
[0006]因此,需要一種新型的信息處理方法和信息處理裝置來解決上述問題。
【發(fā)明內(nèi)容】
[0007]為了解決上述技術(shù)問題,根據(jù)本發(fā)明的一個(gè)方面,提供了一種信息處理方法,所述方法應(yīng)用于第一電子設(shè)備中,所述第一電子設(shè)備能夠與第二電子設(shè)備進(jìn)行語音通信,所述方法包括:當(dāng)所述第一電子設(shè)備與所述第二電子設(shè)備進(jìn)行語音通信時(shí),獲取語音通信數(shù)據(jù);當(dāng)檢測到一識別指令時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別,以生成與所述語音通信數(shù)據(jù)對應(yīng)的文本信息;以及呈現(xiàn)一用戶界面,在所述用戶界面中顯示所述文本信息,以用于對所述文本信息進(jìn)行編輯確認(rèn)。
[0008]優(yōu)選地,在所述對所述語音通信數(shù)據(jù)進(jìn)行語音識別的步驟之前,所述方法還可以包括:當(dāng)檢測到一操作指令時(shí),或者當(dāng)檢測到在所述語音通信數(shù)據(jù)中包括一預(yù)設(shè)關(guān)鍵字信息時(shí),生成所述識別指令。
[0009]優(yōu)選地,所述對所述語音通信數(shù)據(jù)進(jìn)行語音識別的步驟可以包括:當(dāng)所述語音通信為音頻通信時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別;或者當(dāng)所述語音通信為視頻通信時(shí),從所述語音通信數(shù)據(jù)中提取音頻信息,并且對所述音頻信息進(jìn)行語音識別;或者當(dāng)所述語音通信為視頻通信時(shí),從所述語音通信數(shù)據(jù)中提取圖像信息,并且對所述圖像信息進(jìn)行圖像識別。
[0010]優(yōu)選地,所述方法還可以包括:在所述語音通信結(jié)束之后,在所述用戶界面中提供通話回放功能,所述通話回放功能用于向用戶播放所述語音通信數(shù)據(jù),使得所述用戶能夠根據(jù)所述語音通信數(shù)據(jù)來確認(rèn)所生成的文本信息。
[0011]優(yōu)選地,在所述用戶界面中顯示所述文本信息的步驟之后,所述方法還可以包括:啟動第一應(yīng)用程序,所述第一應(yīng)用程序用于存儲所述文本信息;識別所述文本信息的格式;以及根據(jù)所述格式來將所述文本信息填寫到所述第一應(yīng)用程序中的相應(yīng)文本輸入框中。
[0012]此外,根據(jù)本發(fā)明的另一方面,提供了 一種信息處理裝置,所述裝置應(yīng)用于第一電子設(shè)備中,所述第一電子設(shè)備能夠與第二電子設(shè)備進(jìn)行語音通信,所述裝置包括:數(shù)據(jù)獲取單元,用于當(dāng)所述第一電子設(shè)備與所述第二電子設(shè)備進(jìn)行語音通信時(shí),獲取語音通信數(shù)據(jù);語音識別單元,用于當(dāng)檢測到一識別指令時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別,以生成與所述語音通信數(shù)據(jù)對應(yīng)的文本信息;以及界面呈現(xiàn)單元,用于呈現(xiàn)一用戶界面,在所述用戶界面中顯示所述文本信息,以用于對所述文本信息進(jìn)行編輯確認(rèn)。
[0013]優(yōu)選地,所述裝置還可以包括:指令生成單元,用于在所述語音識別單元對所述語音通信數(shù)據(jù)進(jìn)行語音識別之前,當(dāng)檢測到一操作指令時(shí),或者當(dāng)檢測到在所述語音通信數(shù)據(jù)中包括一預(yù)設(shè)關(guān)鍵字信息時(shí),生成所述識別指令。
[0014]優(yōu)選地,所述語音識別單元可以通過以下操作來對所述語音通信數(shù)據(jù)進(jìn)行語音識別:當(dāng)所述語音通信為音頻通信時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別;或者當(dāng)所述語音通信為視頻通信時(shí),從所述語音通信數(shù)據(jù)中提取音頻信息,并且對所述音頻信息進(jìn)行語音識別;或者當(dāng)所述語音通信為視頻通信時(shí),從所述語音通信數(shù)據(jù)中提取圖像信息,并且對所述圖像信息進(jìn)行圖像識別。
[0015]優(yōu)選地,所述裝置還可以包括:數(shù)據(jù)回放單元,用于在所述語音通信結(jié)束之后,在所述用戶界面中提供回放功能,所述回放功能用于向用戶播放所述語音通信數(shù)據(jù),使得所述用戶能夠根據(jù)所述語音通信數(shù)據(jù)來確認(rèn)所生成的文本信息。
[0016]優(yōu)選地,所述裝置還可以包括:應(yīng)用啟動單元,用于在所述界面呈現(xiàn)單元在所述用戶界面中顯示所述文本信息之后,啟動第一應(yīng)用程序,所述第一應(yīng)用程序用于存儲所述文本信息;格式識別單元,用于識別所述文本信息的格式;以及信息填寫單元,用于根據(jù)所述格式來將所述文本信息填寫到所述第一應(yīng)用程序中的相應(yīng)文本輸入框中。
[0017]與現(xiàn)有技術(shù)相比,由此可見,采用根據(jù)本發(fā)明的信息處理方法和裝置,在語音通信期間,可以自動地獲取語音通信數(shù)據(jù),根據(jù)用戶需求來對所述語音通信數(shù)據(jù)進(jìn)行語音識別,并且在用戶界面中顯示通過語音識別所得到的文本信息,以供用戶進(jìn)行編輯確認(rèn)。因此,在本發(fā)明中,提供了一種能夠靈活、方便地記錄信息的方式,從而避免了用戶為了在語音通信期間記錄信息而不得不在通話操作和信息記錄之間進(jìn)行切換,提高了用戶體驗(yàn)。
[0018]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
【專利附圖】
【附圖說明】
[0019]附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0020]圖1圖示了根據(jù)本發(fā)明的信息處理方法。[0021]圖2圖示了根據(jù)本發(fā)明實(shí)施例的信息處理方法。
[0022]圖3圖示了根據(jù)本發(fā)明的信息處理裝置。
[0023]圖4圖示了根據(jù)本發(fā)明實(shí)施例的信息處理裝置。
[0024]圖5圖示了根據(jù)本發(fā)明實(shí)施例的電子設(shè)備。
【具體實(shí)施方式】
[0025]將參照附圖詳細(xì)描述根據(jù)本發(fā)明的各個(gè)實(shí)施例。這里,需要注意的是,在附圖中,將相同的附圖標(biāo)記賦予基本上具有相同或類似結(jié)構(gòu)和功能的組成部分,并且將省略關(guān)于它們的重復(fù)描述。
[0026]圖1圖示了根據(jù)本發(fā)明的信息處理方法。
[0027]圖1所圖示的信息處理方法應(yīng)用于第一電子設(shè)備中,所述第一電子設(shè)備能夠與第二電子設(shè)備進(jìn)行語音通信。如圖1所圖示的,所述信息處理方法包括:
[0028]在步驟3110中,當(dāng)所述第一電子設(shè)備與所述第二電子設(shè)備進(jìn)行語音通信時(shí),獲取語音通信數(shù)據(jù);
[0029]在步驟3120中,當(dāng)檢測到一識別指令時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別,以生成與所述語音通信數(shù)據(jù)對應(yīng)的文本信息;以及
[0030]在步驟3130中,呈現(xiàn)一用戶界面,在所述用戶界面中顯示所述文本信息,以用于對所述文本信息進(jìn)行編輯確認(rèn)。
[0031]由此可見,采用根據(jù)本發(fā)明的信息處理方法,在語音通信期間,可以自動地獲取語音通信數(shù)據(jù),根據(jù)用戶需求來對所述語音通信數(shù)據(jù)進(jìn)行語音識別,并且在用戶界面中顯示通過語音識別所得到的文本信息,以供用戶進(jìn)行編輯確認(rèn)。因此,在本發(fā)明中,提供了一種能夠靈活、方便地記錄信息的方式,從而避免了用戶為了在語音通信期間記錄信息而不得不在通話操作和信息記錄之間進(jìn)行切換,提高了用戶體驗(yàn)。
[0032]圖2圖示了根據(jù)本發(fā)明實(shí)施例的信息處理方法。
[0033]圖2所圖示的信息處理方法應(yīng)用于第一電子設(shè)備。為了使得用戶能夠通過該第一電子設(shè)備而與使用第二電子設(shè)備的其他用戶進(jìn)行語音通信,在這些電子設(shè)備中可以集成有通信裝置。
[0034]下面,將在以下具體實(shí)例中說明根據(jù)本發(fā)明實(shí)施例的信息處理方法,其中,假設(shè)該第一電子設(shè)備是移動電話,第一用戶使用該移動電話來與第二用戶進(jìn)行語音通信,并且在語音通信期間,該第一用戶需要在移動電話中記錄該第二用戶提及的特定信息(諸如,姓名、電話號碼、地址、銀行卡號碼等),以供稍后使用。
[0035]然而,需要說明的是,本發(fā)明不限于此。該電子設(shè)備可以是任何類型的電子設(shè)備,其包括但不限于:筆記本計(jì)算機(jī)、平板電腦、移動電話、多媒體播放器、個(gè)人數(shù)字助理等。此夕卜,還可以將根據(jù)本發(fā)明實(shí)施例的信息處理方法應(yīng)用于電子設(shè)備中的任何其他處理。
[0036]如圖2所圖示的,所述信息處理方法包括:
[0037]在步驟3210中,當(dāng)?shù)谝浑娮釉O(shè)備與第二電子設(shè)備進(jìn)行語音通信時(shí),獲取語音通信數(shù)據(jù)。
[0038]當(dāng)?shù)谝挥脩粝Mc第二用戶進(jìn)行語音通信時(shí),該第一用戶可以使用自己所持有的第一電子設(shè)備(例如,移動電話)來呼叫第二用戶所持有的第二電子設(shè)備。例如,該第一電子設(shè)備和第二電子設(shè)備都具有唯一的標(biāo)識符(例如,電話號碼、社交網(wǎng)絡(luò)賬戶、即時(shí)通信標(biāo)識信息等),以用于唯一地標(biāo)識所述電子設(shè)備。然后,第二用戶可以接通第一用戶的來電,并且使用第二電子設(shè)備與第一用戶開始進(jìn)行語音通信。
[0039]這里,該語音通信可以是指單純的音頻通信。然而,需要說明的是,本發(fā)明不限于此。該語音通信還可以包括視頻通信等。
[0040]在所述第一電子設(shè)備與所述第二電子設(shè)備建立起語音通信之后,本信息處理方法可以獲取與該語音通信相關(guān)的語音通信數(shù)據(jù)。
[0041]例如,在該語音通信是音頻通信的情況下,該語音通信數(shù)據(jù)可以包括純音頻信息?;蛘?,在該語音通信是視頻通信的情況下,該語音通信數(shù)據(jù)可以包括音頻信息和圖像信息兩者。
[0042]在步驟3220中,根據(jù)用戶需要來生成識別指令。
[0043]例如,在第一用戶與第二用戶進(jìn)行語音通信的過程中,第一用戶可能會注意到第二用戶馬上要提及某些特定信息并需要記錄下來。
[0044]為此,該信息處理方法可以根據(jù)用戶需要來在第一時(shí)刻處生成一個(gè)識別指令,所述識別指令用于命令該第一電子設(shè)備自動地對第二用戶提及的特定信息進(jìn)行語音識別,以生成對應(yīng)的文本信息,以供用戶稍后進(jìn)行查看、使用、編輯等用途。
[0045]在一個(gè)示例中,可以當(dāng)檢測到一操作指令時(shí)生成該識別指令。
[0046]換言之,可以基于用戶的手動請求來生成該識別指令。
[0047]例如,在該第一電子設(shè)備中可以裝備有一個(gè)物理按鍵,或者在該第一電子設(shè)備的語音通信界面中可以顯示有一個(gè)虛擬按鍵,使得當(dāng)檢測到用戶對于該物理按鍵或虛擬按鍵進(jìn)行按壓操作時(shí),會生成一個(gè)操作指令,然后可以根據(jù)該操作指令來生成用于觸發(fā)語音識別操作的識別指令。例如,這種按壓操作的方式可以是默認(rèn)的,也可以根據(jù)用戶的需要進(jìn)行設(shè)置。具體地,按壓操作的方式可以包括:單擊、雙擊、三擊、長按等。
[0048]優(yōu)選地,在物理按鍵的情況下,該物理按鍵可以與在電子設(shè)備中通常會配置有的錄音按鍵或照相按鍵進(jìn)行復(fù)用。
[0049]在另一示例中,可以當(dāng)檢測到在所述語音通信數(shù)據(jù)中包括一預(yù)設(shè)關(guān)鍵字信息時(shí),生成所述識別指令。
[0050]換言之,可以基于預(yù)設(shè)的關(guān)鍵字信息檢測來生成該識別指令。
[0051]為此,在獲取到上述語音通信數(shù)據(jù)之后,可以對所述語音通信數(shù)據(jù)進(jìn)行初始識別操作,以檢測在所述語音通信數(shù)據(jù)中是否包括關(guān)鍵字信息。
[0052]例如,當(dāng)所述語音通信為音頻通信時(shí),可以對所述語音通信數(shù)據(jù)(即,音頻信息)直接地進(jìn)行語音識別。當(dāng)所述語音通信為視頻通信時(shí),可以首先從所述語音通信數(shù)據(jù)(即,音頻信息和圖像信息的集合)中提取音頻信息,然后,對所述音頻信息進(jìn)行語音識別。
[0053]在對所述語音通信數(shù)據(jù)進(jìn)行初始識別操作之后,可以將識別的結(jié)果與啟動識別的關(guān)鍵字信息進(jìn)行比對。如果判斷出當(dāng)前出現(xiàn)該關(guān)鍵字信息,則生成用于觸發(fā)語音識別操作的識別指令。
[0054]例如,該關(guān)鍵字信息可以來自于一個(gè)詞庫,其中包括有通常會用到的關(guān)鍵字,例如“姓名是”、“電話號碼是”、“地址是”等。顯然,這個(gè)詞庫可以存儲在第一電子設(shè)備本地,并且由用戶根據(jù)需要而自行擴(kuò)充,或者可以通過更新程序而自動進(jìn)行更新;替換地,該詞庫也可以存儲在服務(wù)器端(即,云端),并且在需要時(shí)由第一電子設(shè)備進(jìn)行獲取。
[0055]在任一示例的情況下,在該電子設(shè)備中可以常態(tài)地運(yùn)行一個(gè)例程,用于執(zhí)行上述按鍵或關(guān)鍵字檢測操作,并且在檢測到按鍵的按壓操作或關(guān)鍵字出現(xiàn)時(shí),產(chǎn)生一個(gè)中斷,以觸發(fā)后續(xù)的語音識別操作。替換地,該例程也可以隨著在第一電子設(shè)備中語音通信進(jìn)行的啟動而啟動。
[0056]在步驟3230中,當(dāng)檢測到一識別指令時(shí),對語音通信數(shù)據(jù)進(jìn)行語音識別,以生成與語音通信數(shù)據(jù)對應(yīng)的文本信息。
[0057]當(dāng)檢測到在第一時(shí)刻處已經(jīng)生成識別指令時(shí),可以對接下來的語音通信數(shù)據(jù)進(jìn)行精確語首識別。
[0058]需要說明的是,為了減少第一電子設(shè)備的功耗,這里的精確語音識別的精度可以大于在步驟3220中的初始語音識別的精度,這是由于在步驟3230中進(jìn)行識別的目的是為了記錄對于第一用戶而言非常重要的信息,所以信息識別的精度要求較高,而在步驟3220中進(jìn)行識別的目的是為了判斷是否觸發(fā)上述識別和記錄操作,并且即使上述識別被誤觸發(fā),也不會對用戶造成太大損失,或者即使上述識別未能被及時(shí)觸發(fā),用戶仍可以手動地啟動識別操作,所以初始識別的精度要求相對較低。
[0059]此外,如上所述,當(dāng)所述語音通信為音頻通信時(shí),可以使用任何可行的語音識別算法(基于語音學(xué)和聲學(xué)的方法)來對所述語音通信數(shù)據(jù)(即,音頻信息)直接地進(jìn)行語音識另I」。當(dāng)所述語音通信為視頻通信時(shí),可以首先從所述語音通信數(shù)據(jù)(即,音頻信息和圖像信息的集合)中提取音頻信息,然后,對所述音頻信息進(jìn)行語音識別。
[0060]需要說明的是,這里所使用的語音識別算法不構(gòu)成對于本發(fā)明的限制。例如,除了基于語音學(xué)和聲學(xué)的方法之外,該語音識別算法還可以包括:模板匹配的方法、神經(jīng)網(wǎng)絡(luò)的方法等。
[0061]此外,在該語音通信是視頻通信的情況下,還可能存在以下場景,即第二用戶除了可以說出特定信息之外,還可以在畫面中展示該特定信息。例如,當(dāng)?shù)诙脩粽谙虻谝挥脩敉扑]一本書籍的時(shí)候,該第二用戶可能會在說出關(guān)鍵字“書名是”之后,在畫面中向第一用戶展示該書籍封面。這時(shí),如果僅僅對音頻信息進(jìn)行語音識別,則可能會錯(cuò)失需要記錄的信息。
[0062]為此,優(yōu)選地,當(dāng)所述語音通信為視頻通信時(shí),還可以首先從所述語音通信數(shù)據(jù)(即,音頻信息和圖像信息的集合)中提取圖像信息,并且對所述圖像信息進(jìn)行圖像識別。
[0063]此外,由于用戶需要記錄的特定信息的長度通常來說是有限的,所以為了節(jié)省第一電子設(shè)備的功耗和內(nèi)存資源,可以根據(jù)用戶需要來在第二時(shí)刻處終止上述識別操作,以免第一電子設(shè)備長時(shí)間地處于精確識別狀態(tài)中。這時(shí),語音識別操作將僅僅針對第一時(shí)刻與第二時(shí)刻之間的語音通信數(shù)據(jù)。
[0064]在一個(gè)示例中,可以基于用戶的手動請求來生成該終止指令。
[0065]例如,第一用戶可以通過再次按壓上述的物理按鍵或虛擬按鍵來生成該終止指令。
[0066]在另一示例中,可以基于關(guān)鍵字信息檢測來生成該識別指令。
[0067]例如,在精確識別過程中,可以將識別的結(jié)果與用于終止識別的關(guān)鍵字信息進(jìn)行比對。如果判斷出當(dāng)前出現(xiàn)該關(guān)鍵字信息,則生成用于觸發(fā)停止語音識別操作的終止指令。[0068]例如,該用于終止識別的關(guān)鍵字信息可以是“就是這樣”、“記下來了嗎”、“我再重
復(fù)一遍”等。
[0069]然而,需要說明的是,本發(fā)明不限于此。例如,還可以設(shè)置一個(gè)計(jì)時(shí)器,并且在該計(jì)時(shí)器的計(jì)時(shí)超出一時(shí)間閾值時(shí),生成該終止指令。替換地,還可以直到檢測到所述第一電子設(shè)備與所述第二電子設(shè)備之間語音通信結(jié)束時(shí),才生成該終止指令。
[0070]然后,在進(jìn)行了上述語音識別和/或圖像識別之后,可以生成與用戶所需要的特定信息對應(yīng)的文本信息。
[0071]在步驟3240中,呈現(xiàn)一用戶界面,在用戶界面中顯示文本信息,以用于對文本信息進(jìn)行編輯確認(rèn)。
[0072]接下來,可以在第一電子設(shè)備中顯示一個(gè)用戶界面,以向用戶呈現(xiàn)所識別出的文本信息,使得用戶能夠確認(rèn)該文本信息的正確與否,并且對該文本信息進(jìn)行編輯、和存儲
坐寸。
[0073]優(yōu)選地,為了避免影響兩個(gè)用戶之間的語音通信,可以等到該語音通信結(jié)束之后,將用于顯示文本信息的用戶界面彈出到前端進(jìn)行顯示。
[0074]此外,優(yōu)選地,為了使得用戶能夠進(jìn)一步確認(rèn)出通過識別操作得到的文本信息的正確性,可以在步驟3230中,在語音識別開始之后,對語音通信數(shù)據(jù)的內(nèi)容進(jìn)行記錄(例如,錄音或錄像)并產(chǎn)生一個(gè)記錄文件,以便稍后用戶可以參照該記錄文件來對該文本信息進(jìn)行編輯確認(rèn)。
[0075]在一個(gè)優(yōu)選示例中,可以直接在所彈出的用戶界面中提供通話回放功能,所述通話回放功能用于向用戶播放所述語音通信數(shù)據(jù),使得所述用戶能夠根據(jù)所述語音通信數(shù)據(jù)來確認(rèn)所生成的文本信息。
[0076]具體地,可以在該用戶界面中提供一個(gè)虛擬按鈕、超級鏈接或文件瀏覽器,以便用戶可以在該相關(guān)入口處,打開與先前存儲的語音通信數(shù)據(jù)對應(yīng)的記錄文件。在接收到用戶對于該記錄文件的點(diǎn)擊操作之后,可以在后臺播放音頻信息,以便用戶能夠反復(fù)收聽并且確認(rèn)識別得到的文本信息是否正確。
[0077]替換地,該音頻信息的播放也可以處于前臺,只要其不遮擋住所呈現(xiàn)的文本信息即可。相似地,如果所述語音通信為視頻通信時(shí),也可以在前臺播放相關(guān)的畫面,以便用戶查看和確認(rèn)。
[0078]在步驟3250中,將文本信息填寫到第一應(yīng)用程序中。
[0079]在用戶確認(rèn)了文本信息的正確性之后,可選地,可以進(jìn)一步判斷文本信息的類別,并且將該文本信息輸入到相關(guān)的應(yīng)用程序中。
[0080]為此,該信息處理方法可以啟動第一應(yīng)用程序,所述第一應(yīng)用程序用于存儲所述文本信息;識別所述文本信息的格式;并且根據(jù)所述格式來將所述文本信息填寫到所述第一應(yīng)用程序中的相應(yīng)文本輸入框中。
[0081]具體地,例如,當(dāng)識別出該文本信息是第二用戶的姓名和電話號碼時(shí),在用戶確認(rèn)上述文本信息之后,優(yōu)選地,可以向用戶提示是否打開潛在相關(guān)的應(yīng)用程序列表。例如,該應(yīng)用程序列表可以包括電話本、記事本、短信息等。例如,該用戶可以從列表中選擇打開電話本應(yīng)用程序,以用于在電話本中保存第二用戶的聯(lián)系方式。
[0082]為此,可以進(jìn)一步識別該文本信息的內(nèi)容,以確認(rèn)文本信息的哪一部分是文字、哪一部分是數(shù)字,從而判斷出其可能分別對應(yīng)于姓名和電話號碼。
[0083]最后,可以將自動判斷出的姓名和電話號碼填寫到所打開的電話本應(yīng)用程序中。例如,將第二用戶的姓名填寫到電話本中的姓名欄中,并且將第二用戶的電話號碼填寫到電話本中的電話號碼欄中。
[0084]由此可見,采用根據(jù)本發(fā)明實(shí)施例的信息處理方法,在語音通信期間,可以自動地獲取語音通信數(shù)據(jù),根據(jù)用戶需求來對所述語音通信數(shù)據(jù)進(jìn)行語音識別,在用戶界面中顯示通過語音識別所得到的文本信息,向用戶提供與該文本信息相關(guān)的語音通信數(shù)據(jù),以供用戶編輯和確認(rèn)該文本信息,并最終根據(jù)文本信息的類別來將該文本信息自動地輸入到相關(guān)的應(yīng)用程序中。因此,在本發(fā)明的實(shí)施例中提供了一種信息記錄方式,使得在進(jìn)行信息記錄時(shí),對語音通信的影響較小,需要用戶手動操作的時(shí)間較短,并且對文本信息的記錄也變得更加智能。
[0085]圖3圖示了根據(jù)本發(fā)明的信息處理裝置。
[0086]圖1所圖示的根據(jù)本發(fā)明的信息處理方法可以通過圖3所圖示的信息處理裝置100來實(shí)現(xiàn),并且該信息處理裝置100可以應(yīng)用于第一電子設(shè)備中,所述第一電子設(shè)備能夠與第二電子設(shè)備進(jìn)行語音通信。如圖3所圖示的,所述信息處理裝置包括:
[0087]數(shù)據(jù)獲取單元110,用于當(dāng)所述第一電子設(shè)備與所述第二電子設(shè)備進(jìn)行語音通信時(shí),獲取語音通信數(shù)據(jù);
[0088]語音識別單元120,用于當(dāng)檢測到一識別指令時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識另I」,以生成與所述語音通信數(shù)據(jù)對應(yīng)的文本信息;以及
[0089]界面呈現(xiàn)單元130,用于呈現(xiàn)一用戶界面,在所述用戶界面中顯示所述文本信息,以用于對所述文本信息進(jìn)行編輯確認(rèn)。
[0090]由此可見,采用根據(jù)本發(fā)明的信息處理裝置,在語音通信期間,可以自動地獲取語音通信數(shù)據(jù),根據(jù)用戶需求來對所述語音通信數(shù)據(jù)進(jìn)行語音識別,并且在用戶界面中顯示通過語音識別所得到的文本信息,以供用戶進(jìn)行編輯確認(rèn)。因此,在本發(fā)明中,提供了一種能夠靈活、方便地記錄信息的方式,從而避免了用戶為了在語音通信期間記錄信息而不得不在通話操作和信息記錄之間進(jìn)行切換,提高了用戶體驗(yàn)。
[0091]圖4圖示了根據(jù)本發(fā)明實(shí)施例的信息處理裝置,并且圖5圖示了根據(jù)本發(fā)明實(shí)施例的電子設(shè)備。
[0092]圖2所圖示的根據(jù)本發(fā)明實(shí)施例的信息處理方法可以通過圖4所圖示的信息處理裝置100來實(shí)現(xiàn),并且該信息處理裝置100可以應(yīng)用于圖5所圖示的一個(gè)或多個(gè)第一電子設(shè)備10。
[0093]所述第一電子設(shè)備10用于與所述第二電子設(shè)備建立起通信連接,以使得第一用戶和第二用戶進(jìn)行語音通信。
[0094]如圖5所圖示的,所述電子設(shè)備10可以包括:信息處理裝置100,用于在所述第一電子設(shè)備與第二電子設(shè)備的語音通信期間,自動地獲取語音通信數(shù)據(jù),根據(jù)用戶需求來對所述語音通信數(shù)據(jù)進(jìn)行語音識別,并且在用戶界面中顯示通過語音識別所得到的文本信息;以及通信裝置200,用于使得所述第一電子設(shè)備能夠與第二電子設(shè)備進(jìn)行語音通信。
[0095]此外,該信息處理裝置100可以通過任何方式與電子設(shè)備10進(jìn)行通信。
[0096]在一個(gè)示例中,該信息處理裝置100可以作為一個(gè)軟件模塊和/或硬件模塊而集成到該電子設(shè)備10中,換言之,該電子設(shè)備10可以包括該信息處理裝置100。例如,當(dāng)電子設(shè)備10是移動電話時(shí),該信息處理裝置100可以是該移動電話的操作系統(tǒng)中的一個(gè)軟件模塊,或者可以是針對于該移動電話所開發(fā)的一個(gè)應(yīng)用程序;當(dāng)然,該信息處理裝置100同樣可以是該移動電話的眾多硬件模塊之一。
[0097]替換地,在另一示例中,該信息處理裝置100與該電子設(shè)備10也可以是分離的設(shè)備,并且該信息處理裝置100可以通過有線和丨或無線網(wǎng)絡(luò)連接到該電子設(shè)備10,并且按照約定的數(shù)據(jù)格式來傳輸交互信息。
[0098]如圖4所圖示的,與圖3中相似地,該信息處理裝置100可以包括:數(shù)據(jù)獲取單元110、語音識別單元120、和界面呈現(xiàn)單元130。
[0099]此外,優(yōu)選地,該信息處理裝置100還可以包括:指令生成單元140、數(shù)據(jù)回放單元150、應(yīng)用啟動單元160、格式識別單元170、和/或信息填寫單元180。
[0100]該數(shù)據(jù)獲取單元110可以用于當(dāng)所述第一電子設(shè)備與所述第二電子設(shè)備進(jìn)行語音通信時(shí),獲取語音通信數(shù)據(jù)。
[0101]該語音識別單元120可以用于當(dāng)檢測到一識別指令時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別,以生成與所述語音通信數(shù)據(jù)對應(yīng)的文本信息。
[0102]具體地,該語音識別單元120可以通過以下操作來對所述語音通信數(shù)據(jù)進(jìn)行語音識別:當(dāng)所述語音通信為音頻通信時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別;或者當(dāng)所述語音通信為視頻通信時(shí),從所述語音通信數(shù)據(jù)中提取音頻信息,并且對所述音頻信息進(jìn)行語音識別;或者當(dāng)所述語音通信為視頻通信時(shí),從所述語音通信數(shù)據(jù)中提取圖像信息,并且對所述圖像信息進(jìn)行圖像識別。
[0103]該界面呈現(xiàn)單元130可以用于呈現(xiàn)一用戶界面,在所述用戶界面中顯示所述文本信息,以用于對所述文本信息進(jìn)行編輯確認(rèn)。
[0104]該指令生成單元140可以用于在所述語音識別單元對所述語音通信數(shù)據(jù)進(jìn)行語音識別之前,當(dāng)檢測到一操作指令時(shí),或者當(dāng)檢測到在所述語音通信數(shù)據(jù)中包括一預(yù)設(shè)關(guān)鍵字信息時(shí),生成所述識別指令。
[0105]該數(shù)據(jù)回放單元150可以用于在所述語音通信結(jié)束之后,在所述用戶界面中提供回放功能,所述回放功能用于向用戶播放所述語音通信數(shù)據(jù),使得所述用戶能夠根據(jù)所述語音通信數(shù)據(jù)來確認(rèn)所生成的文本信息。
[0106]該應(yīng)用啟動單元160可以用于在所述界面呈現(xiàn)單元在所述用戶界面中顯示所述文本信息之后,啟動第一應(yīng)用程序,所述第一應(yīng)用程序用于存儲所述文本信息。
[0107]該格式識別單元170可以用于識別所述文本信息的格式。
[0108]該信息填寫單元180可以用于根據(jù)所述格式來將所述文本信息填寫到所述第一應(yīng)用程序中的相應(yīng)文本輸入框中。
[0109]根據(jù)本發(fā)明實(shí)施例的信息處理裝置100中的各個(gè)單元以及電子設(shè)備10中的各個(gè)裝置的具體配置和操作已經(jīng)在上面參考圖1和圖2描述的信息處理方法中詳細(xì)介紹,并因此,將省略其重復(fù)描述。
[0110]由此可見,采用根據(jù)本發(fā)明實(shí)施例的信息處理裝置,在語音通信期間,可以自動地獲取語音通信數(shù)據(jù),根據(jù)用戶需求來對所述語音通信數(shù)據(jù)進(jìn)行語音識別,在用戶界面中顯示通過語音識別所得到的文本信息,向用戶提供與該文本信息相關(guān)的語音通信數(shù)據(jù),以供用戶編輯和確認(rèn)該文本信息,并最終根據(jù)文本信息的類別來將該文本信息自動地輸入到相關(guān)的應(yīng)用程序中。因此,在本發(fā)明的實(shí)施例中提供了一種信息記錄方式,使得在進(jìn)行信息記錄時(shí),對語音通信的影響較小,需要用戶手動操作的時(shí)間較短,并且對文本信息的記錄也變得更加智能。
[0111]此外,盡管此處將上述的各個(gè)單元作為各個(gè)步驟的執(zhí)行主體來說明本發(fā)明的各個(gè)實(shí)施例,但是,本領(lǐng)域技術(shù)人員能夠理解的是,本發(fā)明不限于此。各個(gè)步驟的執(zhí)行主體可以由其他的一個(gè)或多個(gè)設(shè)備、裝置、單元、甚至模塊來擔(dān)任。
[0112]例如,上述數(shù)據(jù)獲取單元110、語音識別單元120、界面呈現(xiàn)單元130、指令生成單元140、數(shù)據(jù)回放單元150、應(yīng)用啟動單元160、格式識別單元170、和/或信息填寫單元180所執(zhí)行的各個(gè)步驟可以統(tǒng)一地由電子設(shè)備中的中央處理單元(⑶們來實(shí)現(xiàn)。
[0113]通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助于軟件加必需的硬件平臺的方式來實(shí)現(xiàn),當(dāng)然也可以全部通過軟件、或硬件來實(shí)施?;谶@樣的理解,本發(fā)明的技術(shù)方案對【背景技術(shù)】做出貢獻(xiàn)的全部或者部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如801/狀1、磁盤、光盤等,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。
[0114]在上面詳細(xì)描述了本發(fā)明的各個(gè)實(shí)施例。然而,本領(lǐng)域技術(shù)人員應(yīng)該理解,在不脫離本發(fā)明的原理和精神的情況下,可對這些實(shí)施例進(jìn)行各種修改,組合或子組合,并且這樣的修改應(yīng)落入本發(fā)明的范圍內(nèi)。
【權(quán)利要求】
1.一種信息處理方法,所述方法應(yīng)用于第一電子設(shè)備中,所述第一電子設(shè)備能夠與第二電子設(shè)備進(jìn)行語音通信,其特征在于,所述方法包括: 當(dāng)所述第一電子設(shè)備與所述第二電子設(shè)備進(jìn)行語音通信時(shí),獲取語音通信數(shù)據(jù); 當(dāng)檢測到一識別指令時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別,以生成與所述語音通信數(shù)據(jù)對應(yīng)的文本信息;以及 呈現(xiàn)一用戶界面,在所述用戶界面中顯示所述文本信息,以用于對所述文本信息進(jìn)行編輯確認(rèn)。
2.根據(jù)權(quán)利要求1的方法,其特征在于,在所述對所述語音通信數(shù)據(jù)進(jìn)行語音識別的步驟之前,所述方法還包括: 當(dāng)檢測到一操作指令時(shí),或者當(dāng)檢測到在所述語音通信數(shù)據(jù)中包括一預(yù)設(shè)關(guān)鍵字信息時(shí),生成所述識別指令。
3.根據(jù)權(quán)利要求1的方法,其特征在于,所述對所述語音通信數(shù)據(jù)進(jìn)行語音識別的步驟包括: 當(dāng)所述語音通信為音頻通信時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別;或者 當(dāng)所述語音通信為視頻通信時(shí),從所述語音通信數(shù)據(jù)中提取音頻信息,并且對所述音頻信息進(jìn)行語音識別;或者 當(dāng)所述語音通信為視 頻通信時(shí),從所述語音通信數(shù)據(jù)中提取圖像信息,并且對所述圖像信息進(jìn)行圖像識別。
4.根據(jù)權(quán)利要求1的方法,其特征在于,所述方法還包括: 在所述語音通信結(jié)束之后,在所述用戶界面中提供回放功能,所述回放功能用于向用戶播放所述語音通信數(shù)據(jù),使得所述用戶能夠根據(jù)所述語音通信數(shù)據(jù)來確認(rèn)所生成的文本信息。
5.根據(jù)權(quán)利要求1的方法,其特征在于,在所述用戶界面中顯示所述文本信息的步驟之后,所述方法還包括: 啟動第一應(yīng)用程序,所述第一應(yīng)用程序用于存儲所述文本信息; 識別所述文本信息的格式;以及 根據(jù)所述格式來將所述文本信息填寫到所述第一應(yīng)用程序中的相應(yīng)文本輸入框中。
6.一種信息處理裝置,所述裝置應(yīng)用于第一電子設(shè)備中,所述第一電子設(shè)備能夠與第二電子設(shè)備進(jìn)行語音通信,其特征在于,所述裝置包括: 數(shù)據(jù)獲取單元,用于當(dāng)所述第一電子設(shè)備與所述第二電子設(shè)備進(jìn)行語音通信時(shí),獲取語音通信數(shù)據(jù); 語音識別單元,用于當(dāng)檢測到一識別指令時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別,以生成與所述語音通信數(shù)據(jù)對應(yīng)的文本信息;以及 界面呈現(xiàn)單元,用于呈現(xiàn)一用戶界面,在所述用戶界面中顯示所述文本信息,以用于對所述文本信息進(jìn)行編輯確認(rèn)。
7.根據(jù)權(quán)利要求6的裝置,其特征在于,所述裝置還包括: 指令生成單元,用于在所述語音識別單元對所述語音通信數(shù)據(jù)進(jìn)行語音識別之前,當(dāng)檢測到一操作指令時(shí),或者當(dāng)檢測到在所述語音通信數(shù)據(jù)中包括一預(yù)設(shè)關(guān)鍵字信息時(shí),生成所述識別指令。
8.根據(jù)權(quán)利要求6的裝置,其特征在于,所述語音識別單元通過以下操作來對所述語音通信數(shù)據(jù)進(jìn)行語音識別: 當(dāng)所述語音通信為音頻通信時(shí),對所述語音通信數(shù)據(jù)進(jìn)行語音識別;或者 當(dāng)所述語音通信為視頻通信時(shí),從所述語音通信數(shù)據(jù)中提取音頻信息,并且對所述音頻信息進(jìn)行語音識別;或者 當(dāng)所述語音通信為視頻通信時(shí),從所述語音通信數(shù)據(jù)中提取圖像信息,并且對所述圖像信息進(jìn)行圖像識別。
9.根據(jù)權(quán)利要求6的裝置,其特征在于,所述裝置還包括: 數(shù)據(jù)回放單元,用于在所述語音通信結(jié)束之后,在所述用戶界面中提供回放功能,所述回放功能用于向用戶播放所述語音通信數(shù)據(jù),使得所述用戶能夠根據(jù)所述語音通信數(shù)據(jù)來確認(rèn)所生成的文本信息。
10.根據(jù)權(quán)利要求6的裝置,其特征在于,所述裝置還包括: 應(yīng)用啟動單元,用于在所述界面呈現(xiàn)單元在所述用戶界面中顯示所述文本信息之后,啟動第一應(yīng)用程序,所述第一應(yīng)用程序用于存儲所述文本信息; 格式識別單元,用于識別所述文本信息的格式;以及 信息填寫單元,用于根據(jù)所述格式來將所述文本信息填寫到所述第一應(yīng)用程序中的相應(yīng)文本輸入框中。
【文檔編號】G10L15/26GK103841268SQ201410098941
【公開日】2014年6月4日 申請日期:2014年3月17日 優(yōu)先權(quán)日:2014年3月17日
【發(fā)明者】丁曉霞 申請人:聯(lián)想(北京)有限公司