獲取終端中的對話語音對應(yīng)的文本的方法和裝置制造方法
【專利摘要】本申請公開了一種獲取終端中的對話語音對應(yīng)的文本的方法和裝置。該方法的一【具體實施方式】包括:分別獲取對話語音中的第一語音和第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。該實施方式實現(xiàn)了即使對話雙方的語音在時間上出現(xiàn)重疊,也可以分別獲取對話雙方相互獨立的第一語音與第二語音,進而可以分別獲取到第一語音與第二語音對應(yīng)的文本。
【專利說明】獲取終端中的對話語音對應(yīng)的文本的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本申請涉及通信【技術(shù)領(lǐng)域】,具體涉及音頻處理領(lǐng)域,尤其涉及獲取終端中的對話語音對應(yīng)的文本的方法和裝置。
【背景技術(shù)】
[0002]現(xiàn)有技術(shù)中,可以從對話語音中提取相應(yīng)關(guān)鍵字,以實現(xiàn)將對話語音以文字形式進行顯示。但是,當(dāng)對話雙方的語音在時間上出現(xiàn)重疊時,則無法從重疊語音中提取關(guān)鍵字。
【發(fā)明內(nèi)容】
[0003]本申請?zhí)峁┝艘环N獲取終端中的對話語音對應(yīng)的文本的方法和裝置,解決了當(dāng)對話雙方的語音在時間上出現(xiàn)重疊,無法從重疊語音中提取關(guān)鍵字的問題。
[0004]第一方面,提供了一種獲取終端中的對話語音對應(yīng)的文本的方法,包括:
[0005]分別獲取對話語音中的第一語音和第二語音;
[0006]分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0007]在某些實施方式中,所述分別獲取對話語音中的第一語音和第二語音,包括:
[0008]通過不同信道接收所述第一語音和所述第二語音。
[0009]在某些實施方式中,所述不同信道是預(yù)先分別為檢測所述第一語音的第一輸入單元,和檢測所述第二語音的第二輸入單元配置的。
[0010]在某些實施方式中,當(dāng)所述第一輸入單元檢測到所述第一語音時,通過為所述第一輸入單元配置的第一信道接收所述第一語音;
[0011]當(dāng)所述第二輸入單元檢測到所述第二語音時,通過為所述第二輸入單元配置的第二信道接收所述第二語音。
[0012]在某些實施方式中,所述第一語音為當(dāng)前環(huán)境中的語音,所述第二語音對端終端發(fā)送的語音;或者,
[0013]所述第一語音為對端終端發(fā)送的語音,所述第二語音為當(dāng)前環(huán)境中的語音;或者,
[0014]所述第一語音和所述第二語音分別為不同對端終端發(fā)送的語音。
[0015]在某些實施方式中,當(dāng)前環(huán)境中的語音是通過麥克風(fēng)檢測的。
[0016]在某些實施方式中,所述第一信道為左聲道,所述第二信道為右聲道;或者,所述第一信道為右聲道,所述第二信道為左聲道。
[0017]在某些實施方式中,還包括:
[0018]在預(yù)設(shè)區(qū)域中,顯示所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0019]在某些實施方式中,所述在預(yù)設(shè)區(qū)域中,顯示所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本,包括:
[0020]檢測所述第一語音和所述第二語音中,是否存在位于相同時間段內(nèi)的語音;
[0021]若存在位于相同時間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所述第二文本分別為所述第一語音、所述第二語音中位于所述相同時間段內(nèi)的語音對應(yīng)的文本;
[0022]將所述第一文本與所述第二文本顯示在表征相同時間段的區(qū)域中。
[0023]第二方面,提供了一種獲取終端中的對話語音對應(yīng)的文本的裝置,包括:
[0024]獲取單元,用于分別獲取對話語音中的第一語音和第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0025]在某些實施方式中,所述獲取單元,具體用于通過不同信道接收所述第一語音和所述第二語音。
[0026]在某些實施方式中,所述不同信道是預(yù)先分別為檢測所述第一語音的第一輸入單元,和檢測所述第二語音的第二輸入單元配置的。
[0027]在某些實施方式中,所述獲取單元,具體用于當(dāng)所述第一輸入單元檢測到所述第一語音時,通過為所述第一輸入單元配置的第一信道接收所述第一語音;
[0028]當(dāng)所述第二輸入單元檢測到所述第二語音時,通過為所述第二輸入單元配置的第二信道接收所述第二語音。
[0029]在某些實施方式中,所述獲取單元獲取的所述第一語音為當(dāng)前環(huán)境中的語音,所述第二語音對端終端發(fā)送的語音;或者,
[0030]所述第一語音為對端終端發(fā)送的語音,所述第二語音為當(dāng)前環(huán)境中的語音;或者,
[0031]所述第一語音和所述第二語音分別為不同對端終端發(fā)送的語音。
[0032]在某些實施方式中,當(dāng)前環(huán)境中的語音是通過麥克風(fēng)檢測的。
[0033]在某些實施方式中,所述第一信道為左聲道,所述第二信道為右聲道;或者,所述第一信道為右聲道,所述第二信道為左聲道。
[0034]在某些實施方式中,還包括:
[0035]顯示單元,用于在預(yù)設(shè)區(qū)域中,顯示所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0036]在某些實施方式中,所述顯示單元,包括:
[0037]檢測模塊,用于檢測所述獲取單元獲取的所述第一語音和所述第二語音中,是否存在位于相同時間段內(nèi)的語音;
[0038]獲取模塊,用于若所述檢測模塊檢測存在位于相同時間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所述第二文本分別為所述第一語音、所述第二語音中位于所述相同時間段內(nèi)的語音對應(yīng)的文本;
[0039]顯示模塊,用于將所述獲取模塊獲取的所述第一文本與所述第二文本顯示在表征相同時間段的區(qū)域中。
[0040]在本方案中,分別獲取對話語音中的第一語音和第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。與現(xiàn)有技術(shù)中,獲取混合的對話終端的語音相t匕,本方案由于是分別獲取非混合的第一語音和第二語音,因此,若第一語音與第二語音中,存在位于相同時間段的語音,則可以分別從第一語音和第二語音中,獲取到位于相同時間段內(nèi)的語音,進而可以獲取到第一文本和第二文本。
【專利附圖】
【附圖說明】
[0041]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優(yōu)點將會變得更明顯:
[0042]圖1示出了本申請?zhí)峁┑墨@取終端中的對話語音對應(yīng)的文本的方法的一種實施例的流程圖;
[0043]圖2示出了本申請?zhí)峁┑墨@取終端中的對話語音對應(yīng)的文本的方法的另一種實施例的流程圖;
[0044]圖3示出了本申請?zhí)峁┑囊环N顯示第一語音對應(yīng)的文本和第二語音對應(yīng)的文本的不意圖;
[0045]圖4示出了本申請?zhí)峁┑牧硪环N顯示第一語音對應(yīng)的文本和第二語音對應(yīng)的文本的不意圖;
[0046]圖5示出了本申請?zhí)峁┑脑僖环N顯示第一語音對應(yīng)的文本和第二語音對應(yīng)的文本的不意圖;
[0047]圖6示出了本申請?zhí)峁┑墨@取終端中的對話語音對應(yīng)的文本的裝置的一種實施例的結(jié)構(gòu)不意圖;
[0048]圖7示出了本申請?zhí)峁┑墨@取終端中的對話語音對應(yīng)的文本的裝置的另一種實施例的結(jié)構(gòu)示意圖;
[0049]圖8示出了本申請?zhí)峁┑挠嬎銠C的一種實施例的結(jié)構(gòu)示意圖。
【具體實施方式】
[0050]下面結(jié)合附圖和實施例對本申請作進一步的詳細說明??梢岳斫獾氖牵颂幩枋龅木唧w實施例僅僅用于解釋相關(guān)發(fā)明,而非對該發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
[0051]需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結(jié)合實施例來詳細說明本申請。
[0052]本申請?zhí)峁┮环N獲取終端中的對話語音對應(yīng)的文本的方法的一個實施例,該實施例通過應(yīng)用于終端中來舉例說明,該終端可以但不限于包括智能手機、平板電腦、膝上型便攜計算機和臺式計算機等。
[0053]如圖1所示,所述獲取終端中的對話語音對應(yīng)的文本的方法可以包括如下步驟:
[0054]101、分別獲取對話語音中的第一語音和第二語音。
[0055]終端可以在接聽來電的同時錄制各通話方的對話語音,終端也可以從獲取相應(yīng)的對話語音。通常的,對話語音中可以包括至少兩個對話方的語音,終端分別獲取對話語音中的第一語音和第二語音。第一語音與第二語音分別為對話語音中不同對話方的語音,且終端獲取到的第一語音與第二語音為相互獨立的非混合語音。
[0056]對話語音不限于針對兩個對話方,還可以是針對更多對話方的,具體可以根據(jù)實際需要進行設(shè)定。以下內(nèi)容均以對話語音是針對兩個對話方的為例進行說明。
[0057]102、分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0058]終端在獲取對話雙方的第一語音和第二語音之后,可能需要第一語音與第二語音分別對應(yīng)的文本,以便后續(xù)使用,如,為了便于用戶更好的知曉對話內(nèi)容,顯示該文本等。
[0059]在本實施例中,終端可以但不限于通過語音識別技術(shù)分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。由于第一文本與第二文本為兩個相互獨立的非混合語音,因此,即使第一語音與第二語音位于相同時間段內(nèi),終端也可以分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0060]本實施例對分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本的方法不作限定,為本領(lǐng)域技術(shù)人員熟知的技術(shù),在此不作贅述。
[0061]在本方案中,分別獲取對話語音中的第一語音和第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。與現(xiàn)有技術(shù)中,獲取混合的對話終端的語音相t匕,本方案由于是分別獲取非混合的第一語音和第二語音,因此,若第一語音與第二語音中,存在位于相同時間段的語音,則可以分別從第一語音和第二語音中,獲取到位于相同時間段內(nèi)的語音,進而可以獲取到第一文本和第二文本。
[0062]本申請?zhí)峁┮环N獲取終端中的對話語音對應(yīng)的文本的方法的另一個實施例,該實施例是對圖1所示的實施例的進一步擴展和優(yōu)化,如圖2所示,可以包括:
[0063]201、分別獲取對話語音中的第一語音和第二語音。
[0064]進一步地,終端可以通過不同信道接收所述第一語音和所述第二語音。
[0065]進一步地,所述不同信道可以是預(yù)先分別為檢測所述第一語音的第一輸入單元,和檢測所述第二語音的第二輸入單元配置的。
[0066]進一步地,當(dāng)所述第一輸入單元檢測到所述第一語音時,通過為所述第一輸入單元配置的第一信道接收所述第一語音;當(dāng)所述第二輸入單元檢測到所述第二語音時,通過為所述第二輸入單元配置的第二信道接收所述第二語音。
[0067]進一步地,所述第一語音為當(dāng)前環(huán)境中的語音,所述第二語音對端終端發(fā)送的語音;或者,
[0068]所述第一語音為對端終端發(fā)送的語音,所述第二語音為當(dāng)前環(huán)境中的語音;或者,
[0069]所述第一語音和所述第二語音分別為不同對端終端發(fā)送的語音。
[0070]進一步地,當(dāng)前環(huán)境中的語音可以是通過麥克風(fēng)檢測的。
[0071]例如,當(dāng)本端終端與對端終端進行通話時,本端終端可以通過麥克風(fēng)檢測當(dāng)前環(huán)境中的第一語音/第二語音,即檢測使用本端終端的用戶的語音,通話對方的第二語音/第一語音可以由對端終端發(fā)送至本端終端,對端終端發(fā)送的第二語音/第一語音可以是由設(shè)置在對端終端上的麥克風(fēng)檢測的。當(dāng)本端終端需要獲取其他兩個終端間的對話語音,本端終端可以接收不同對端終端發(fā)送的第一語音和第二語音,第一語音和第二語音可以但不限于分別由設(shè)置在相應(yīng)的對端終端上的麥克風(fēng)檢測的。
[0072]本實施例對第一語音、第二語音及二者的獲取方法不作限定,為本領(lǐng)域技術(shù)人員熟知的技術(shù),具體可以根據(jù)實際需要進行設(shè)定,在此不作贅述。
[0073]進一步地,所述第一信道為左聲道,所述第二信道為右聲道;或者,所述第一信道為右聲道,所述第二信道為左聲道。
[0074]例如,以終端接聽電話為例。終端可以為麥克風(fēng)分配左聲道,為網(wǎng)絡(luò)語音接收設(shè)備分配右聲道,這樣,當(dāng)終端接聽電話,若終端使用者說話時,終端上的麥克風(fēng)便會檢測到相應(yīng)語音,終端此時可以通過左聲道接收該語音。當(dāng)另一對話方說話時,該語音便會通過網(wǎng)絡(luò)發(fā)送至本終端的語音接收設(shè)備,當(dāng)語音接收設(shè)備檢測到該語音時,終端可以通過右聲道接收該語音。
[0075]這樣,終端可以分別通過左聲道和右聲道接收對話雙方的第一語音和第二語音,使得終端可以獲取到相互獨立的非混合語音,便于后續(xù)的文本獲取。
[0076]202、分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0077]203、在預(yù)設(shè)區(qū)域中,顯示所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0078]為了便于用戶對對話語音的理解,終端還可以顯示對話語音對應(yīng)的文本,即顯示第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。通??梢圆捎米髮R方式和右對齊方式顯示不同對話方對應(yīng)的文本,如,圖3所示的短信的顯示方式。
[0079]進一步地,為了使顯示的文本可以體現(xiàn)出對話內(nèi)容與時間的對應(yīng)關(guān)系,尤其可以體現(xiàn)出哪些對話內(nèi)容是位于相同時間段上的,終端可以將第一語音對應(yīng)的文本與第二語音對應(yīng)的文本顯示在其對應(yīng)的時間區(qū)域中。
[0080]具體的,終端可以檢測所述第一語音和所述第二語音中,是否存在位于相同時間段內(nèi)的語音;若存在位于相同時間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所述第二文本分別為所述第一語音、所述第二語音中位于所述相同時間段內(nèi)的語音對應(yīng)的文本;將所述第一文本與所述第二文本顯示在表征相同時間段的區(qū)域中。
[0081]例如,如圖4所示,為了通過顯示的字幕呈現(xiàn)在時間上對話的重疊,則可以將與所述相同時間段對應(yīng)的文本顯示在至少一行中,即將所述第一文本與所述第二文本顯示在表征所述相同時間段的至少一行中。
[0082]進一步地,若第一語音和所述第二語音中,不存在位于相同時間段內(nèi)的語音,則終端可以將所述第一語音對應(yīng)的文本與所述第二語音對應(yīng)的文本,分別顯示在表征不同時間段的區(qū)域中。
[0083]為了使顯示的文本可以更好的體現(xiàn)出對話內(nèi)容與時間的對應(yīng)關(guān)系,所述表征不同時間段的區(qū)域之間顯示有表征目標時間間隔的空白區(qū)域,所述目標時間間隔為所述第一語音與所述第二語音之間的時間間隔。
[0084]具體的,若第一語音早于第二語音,且第一語音與第二語音不存在位于相同時間段內(nèi)的語音,則終端可以獲取第一語音的結(jié)束時間戳與第二語音的起始時間戳之間的時間間隔,根據(jù)時間間隔確定在顯示第一語音對應(yīng)的文本與第二語音對應(yīng)的文本時,在第一語音對應(yīng)的文本與第二語音對應(yīng)的文本之間插入的空白區(qū)域,如,可以確定插入的空白行的數(shù)量。
[0085]例如,當(dāng)時間間隔每增加三秒時,多插入一個空白行。如圖5所示,語音“麻煩回來的時候帶些飲料”的結(jié)束時間戳,與語音“好的”的起始時間戳之間的時間間隔為3秒,則可以在顯示語音“麻煩回來的時候帶些飲料”對應(yīng)的文本與語音“好的”對應(yīng)的文本之間插入一個空白行,若時間間隔為6秒,可以插入兩個空白行。其他情況在此不再贅述。
[0086]進一步地,終端在顯示所述第一語音對應(yīng)的文本和第二語音對應(yīng)的文本之前,可以優(yōu)先顯示對話語音的內(nèi)容摘要文本。在檢測到用戶的操作之后,再顯示第一語音對應(yīng)的文本和第二語音對應(yīng)的文本。用戶的操作可以但不限于包括:單擊或雙擊或長按內(nèi)容摘要文本的顯示區(qū)域,或向任一方向滑動等。
[0087]本實施例對顯示所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本的方法不作限定,并不顯示上述記載的內(nèi)容,具體可以根據(jù)實際需要進行設(shè)定,在此不作贅述。
[0088]在本方案中,通過不同信道接收所述第一語音和所述第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。與現(xiàn)有技術(shù)中,獲取混合的對話終端的語音相比,本方案由于是通過不同信道接收的第一語音和第二語音,因此,第一語音和第二語音為相互獨立的非混合語音,由此,若第一語音與第二語音中,存在位于相同時間段的語音,則可以分別從第一語音和第二語音中,獲取到位于相同時間段內(nèi)的語音,進而可以獲取到第一文本和第二文本。
[0089]作為對上述各圖所示方法的實現(xiàn),本申請?zhí)峁┮环N獲取終端中的對話語音對應(yīng)的文本的裝置的一個實施例,該裝置實施例與圖1所示的方法實施例相對應(yīng),如圖6所示,可以包括:
[0090]獲取單元61,用于分別獲取對話語音中的第一語音和第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0091]在本方案中,獲取單元分別獲取對話語音中的第一語音和第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。與現(xiàn)有技術(shù)中,獲取混合的對話終端的語音相比,本方案由于是分別獲取非混合的第一語音和第二語音,因此,若第一語音與第二語音中,存在位于相同時間段的語音,則可以分別從第一語音和第二語音中,獲取到位于相同時間段內(nèi)的語音,進而可以獲取到第一文本和第二文本。
[0092]本申請?zhí)峁┮环N獲取終端中的對話語音對應(yīng)的文本的裝置的另一個實施例,該虛擬裝置實施例與圖2所示的方法實施例相對應(yīng),且該裝置可以位于諸如手機、電腦、移動服務(wù)終端等用戶設(shè)備內(nèi)部,或位于用戶設(shè)備外部但與用戶設(shè)備之間具有通信關(guān)系,用以對上述各圖所示方法進行實現(xiàn),如圖7所示,該裝置可以包括:
[0093]獲取單元71,用于分別獲取對話語音中的第一語音和第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0094]進一步地,所述獲取單元71,具體用于通過不同信道接收所述第一語音和所述第二語音。
[0095]進一步地,所述不同信道是預(yù)先分別為檢測所述第一語音的第一輸入單元,和檢測所述第二語音的第二輸入單元配置的。
[0096]進一步地,所述獲取單元71,具體用于當(dāng)所述第一輸入單元檢測到所述第一語音時,通過為所述第一輸入單元配置的第一信道接收所述第一語音;
[0097]當(dāng)所述第二輸入單元檢測到所述第二語音時,通過為所述第二輸入單元配置的第二信道接收所述第二語音。
[0098]進一步地,所述獲取單元71獲取的所述第一語音為當(dāng)前環(huán)境中的語音,所述第二語音對端終端發(fā)送的語音;或者,
[0099]所述第一語音為對端終端發(fā)送的語音,所述第二語音為當(dāng)前環(huán)境中的語音;或者,
[0100]所述第一語音和所述第二語音分別為不同對端終端發(fā)送的語音。
[0101]進一步地,當(dāng)前環(huán)境中的語音是通過麥克風(fēng)檢測的。
[0102]進一步地,所述第一信道為左聲道,所述第二信道為右聲道;或者,所述第一信道為右聲道,所述第二信道為左聲道。
[0103]進一步地,獲取終端中的對話語音對應(yīng)的文本的裝置還包括:
[0104]顯示單元72,用于在預(yù)設(shè)區(qū)域中,顯示所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0105]進一步地,所述顯示單元72,包括:
[0106]檢測模塊721,用于檢測所述獲取單元71獲取的所述第一語音和所述第二語音中,是否存在位于相同時間段內(nèi)的語音;
[0107]獲取模塊722,用于若所述檢測模塊721檢測存在位于相同時間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所述第二文本分別為所述第一語音、所述第二語音中位于所述相同時間段內(nèi)的語音對應(yīng)的文本;
[0108]顯示模塊723,用于將所述獲取模塊722獲取的所述第一文本與所述第二文本顯示在表征相同時間段的區(qū)域中。
[0109]在本方案中,獲取單元可以通過不同信道接收所述第一語音和所述第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。與現(xiàn)有技術(shù)中,獲取混合的對話終端的語音相比,本方案由于是通過不同信道接收的第一語音和第二語音,因此,第一語音和第二語音為相互獨立的非混合語音,由此,若第一語音與第二語音中,存在位于相同時間段的語音,則可以分別從第一語音和第二語音中,獲取到位于相同時間段內(nèi)的語音,進而可以獲取到第一文本和第二文本。
[0110]作為對上述各圖所示方法的實現(xiàn),本申請?zhí)峁┮环N計算機8,如圖8所示,包括:至少一個處理器81,例如CPU (Central Processing Unit,中央處理器),至少一個輸出接口 82或者其他用戶接口 83,存儲器84,至少一個通信總線85。通信總線85用于實現(xiàn)上述組件之間的連接通信。計算機8可選的包含其他用戶接口 83,包括顯示器,鍵盤或者點擊設(shè)備(例如,鼠標,軌跡球(trackball),觸感板或者觸感顯示屏)。存儲器84可能包含高速RAM (Random Access Memory,隨機存取存儲器),也可能還包括非易失性存儲器(non-volatile memory),例如至少一個磁盤存儲器。存儲器84可選的可以包含至少一個位于遠離前述處理器81的存儲裝置。
[0111]在一些實施方式中,存儲器84存儲了如下的元素,可執(zhí)行模塊或者數(shù)據(jù)結(jié)構(gòu),或者他們的子集,或者他們的擴展集:
[0112]操作系統(tǒng)840,包含各種系統(tǒng)程序,用于實現(xiàn)各種基礎(chǔ)業(yè)務(wù)以及處理基于硬件的任務(wù)。
[0113]應(yīng)用程序841,包含各種應(yīng)用程序,用于實現(xiàn)各種應(yīng)用業(yè)務(wù)。
[0114]具體的,應(yīng)用程序841中可以但不限于包括:
[0115]獲取單元,用于分別獲取對話語音中的第一語音和第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0116]進一步地,所述獲取單元,具體用于通過不同信道接收所述第一語音和所述第二語音。
[0117]進一步地,所述不同信道是預(yù)先分別為檢測所述第一語音的第一輸入單元,和檢測所述第二語音的第二輸入單元配置的。
[0118]進一步地,所述獲取單元,具體用于當(dāng)所述第一輸入單元檢測到所述第一語音時,通過為所述第一輸入單元配置的第一信道接收所述第一語音;
[0119]當(dāng)所述第二輸入單元檢測到所述第二語音時,通過為所述第二輸入單元配置的第二信道接收所述第二語音。
[0120]進一步地,所述獲取單元獲取的所述第一語音為當(dāng)前環(huán)境中的語音,所述第二語音對端終端發(fā)送的語音;或者,
[0121]所述第一語音為對端終端發(fā)送的語音,所述第二語音為當(dāng)前環(huán)境中的語音;或者,
[0122]所述第一語音和所述第二語音分別為不同對端終端發(fā)送的語音。
[0123]進一步地,當(dāng)前環(huán)境中的語音是通過麥克風(fēng)檢測的。
[0124]進一步地,所述第一信道為左聲道,所述第二信道為右聲道;或者,所述第一信道為右聲道,所述第二信道為左聲道。
[0125]進一步地,應(yīng)用程序841還包括:
[0126]顯示單元,用于在預(yù)設(shè)區(qū)域中,顯示所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0127]進一步地,所述顯示單元,包括:
[0128]檢測模塊,用于檢測所述獲取單元獲取的所述第一語音和所述第二語音中,是否存在位于相同時間段內(nèi)的語音;
[0129]獲取模塊,用于若所述檢測模塊檢測存在位于相同時間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所述第二文本分別為所述第一語音、所述第二語音中位于所述相同時間段內(nèi)的語音對應(yīng)的文本;
[0130]顯示模塊,用于將所述獲取模塊獲取的所述第一文本與所述第二文本顯示在表征相同時間段的區(qū)域中。
[0131]在本實施例中,處理器81通過調(diào)用存儲器84中存儲的程序或指令執(zhí)行相應(yīng)步驟,處理器81,用于:
[0132]分別獲取對話語音中的第一語音和第二語音;
[0133]分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0134]進一步地,處理器81,具體用于通過不同信道接收所述第一語音和所述第二語音。
[0135]進一步地,所述不同信道是預(yù)先分別為檢測所述第一語音的第一輸入單元,和檢測所述第二語音的第二輸入單元配置的。
[0136]進一步地,當(dāng)所述第一輸入單元檢測到所述第一語音時,通過為所述第一輸入單元配置的第一信道接收所述第一語音;
[0137]當(dāng)所述第二輸入單元檢測到所述第二語音時,通過為所述第二輸入單元配置的第二信道接收所述第二語音。
[0138]進一步地,所述第一語音為當(dāng)前環(huán)境中的語音,所述第二語音對端終端發(fā)送的語音;或者,
[0139]所述第一語音為對端終端發(fā)送的語音,所述第二語音為當(dāng)前環(huán)境中的語音;或者,
[0140]所述第一語音和所述第二語音分別為不同對端終端發(fā)送的語音。
[0141]進一步地,當(dāng)前環(huán)境中的語音是通過麥克風(fēng)檢測的。
[0142]進一步地,所述第一信道為左聲道,所述第二信道為右聲道;或者,所述第一信道為右聲道,所述第二信道為左聲道。
[0143]進一步地,處理器81,還用于在預(yù)設(shè)區(qū)域中,顯示所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
[0144]進一步地,處理器81,具體用于檢測所述第一語音和所述第二語音中,是否存在位于相同時間段內(nèi)的語音;
[0145]若存在位于相同時間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所述第二文本分別為所述第一語音、所述第二語音中位于所述相同時間段內(nèi)的語音對應(yīng)的文本;
[0146]將所述第一文本與所述第二文本顯示在表征相同時間段的區(qū)域中。
[0147]在本方案中,計算機通過不同信道接收所述第一語音和所述第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。與現(xiàn)有技術(shù)中,獲取混合的對話終端的語音相比,本方案由于是通過不同信道接收的第一語音和第二語音,因此,第一語音和第二語音為相互獨立的非混合語音,由此,若第一語音與第二語音中,存在位于相同時間段的語音,則可以分別從第一語音和第二語音中,獲取到位于相同時間段內(nèi)的語音,進而可以獲取到第一文本和第二文本。
[0148]描述于本申請實施例中所涉及到的模塊可以通過軟件的方式實現(xiàn),也可以通過硬件的方式來實現(xiàn)。所描述的模塊也可以設(shè)置在處理器中,例如,可以描述為:一種處理器包括請求接收模塊,信息讀取模塊,視圖構(gòu)建模塊和功能啟用模塊。其中,這些模塊的名稱在某種情況下并不構(gòu)成對該模塊本身的限定,例如,請求接收模塊還可以被描述為“用于接收用戶提交的調(diào)用小組件的請求的模塊”。
[0149]作為另一方面,本申請還提供了一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)可以是上述實施例中所述裝置中所包含的計算機可讀存儲介質(zhì);也可以是單獨存在,未裝配入終端中的計算機可讀存儲介質(zhì)。所述計算機可讀存儲介質(zhì)存儲有一個或者一個以上程序,所述程序被一個或者一個以上的處理器用來執(zhí)行描述于本申請的在全屏應(yīng)用下使用小組件的方法。
[0150]以上描述僅為本申請的較佳實施例以及對所運用技術(shù)原理的說明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時也應(yīng)涵蓋在不脫離所述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術(shù)特征進行互相替換而形成的技術(shù)方案。
【權(quán)利要求】
1.一種獲取終端中的對話語音對應(yīng)的文本的方法,其特征在于,包括: 分別獲取對話語音中的第一語音和第二語音; 分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述分別獲取對話語音中的第一語音和第二語音,包括: 通過不同信道接收所述第一語音和所述第二語音。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述不同信道是預(yù)先分別為檢測所述第一語音的第一輸入單元,和檢測所述第二語音的第二輸入單元配置的。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于, 當(dāng)所述第一輸入單元檢測到所述第一語音時,通過為所述第一輸入單元配置的第一信道接收所述第一語音; 當(dāng)所述第二輸入單元檢測到所述第二語音時,通過為所述第二輸入單元配置的第二信道接收所述第二語音。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述第一語音為當(dāng)前環(huán)境中的語音,所述第二語音對端終端發(fā)送的語音;或者, 所述第一語音為對端終端發(fā)送的語音,所述第二語音為當(dāng)前環(huán)境中的語音;或者, 所述第一語音和所述第二語音分別為不同對端終端發(fā)送的語音。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,當(dāng)前環(huán)境中的語音是通過麥克風(fēng)檢測的。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述第一信道為左聲道,所述第二信道為右聲道;或者,所述第一信道為右聲道,所述第二信道為左聲道。
8.根據(jù)權(quán)利要求1至7中任一項所述的方法,其特征在于,還包括: 在預(yù)設(shè)區(qū)域中,顯示所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述在預(yù)設(shè)區(qū)域中,顯示所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本,包括: 檢測所述第一語音和所述第二語音中,是否存在位于相同時間段內(nèi)的語音; 若存在位于相同時間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所述第二文本分別為所述第一語音、所述第二語音中位于所述相同時間段內(nèi)的語音對應(yīng)的文本; 將所述第一文本與所述第二文本顯示在表征相同時間段的區(qū)域中。
10.一種獲取終端中的對話語音對應(yīng)的文本的裝置,其特征在于,包括: 獲取單元,用于分別獲取對話語音中的第一語音和第二語音;分別獲取所述第一語音對應(yīng)的文本和所述第二語音對應(yīng)的文本。
【文檔編號】G10L21/10GK104409077SQ201410553218
【公開日】2015年3月11日 申請日期:2014年10月17日 優(yōu)先權(quán)日:2014年10月17日
【發(fā)明者】馮穗豫, 樸在善 申請人:廣州三星通信技術(shù)研究有限公司, 三星電子株式會社