本發(fā)明涉及通信技術(shù)領(lǐng)域,特別是涉及一種圖片數(shù)據(jù)的處理方法、裝置及移動終端。
背景技術(shù):
目前,用照片或者視頻的方式記錄生活片段是人們使用較為頻繁的一種方式。手機照相作為手機的一個附加功能,其由于手機具有體積小、厚度薄、攜帶和操作方便等特點,因此更加受到人們的青睞。
照片產(chǎn)生的主要目的就是為了記憶存儲,但是隨著時間的久遠,這種照片的記憶會因為沒有環(huán)境記憶而淡去,而視頻的錄制、存儲、瀏覽或者分享并不能達到人們需要的簡單方便的要求。人們一方面對于手機攝影功能和照片多樣性藝術(shù)表現(xiàn)的要求不斷提高,另一方面又要求錄制、存儲、瀏覽、分享等操作簡單方便,可見,普通的拍照及攝像功能已無法滿足用戶多樣化的需求。
技術(shù)實現(xiàn)要素:
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的圖片數(shù)據(jù)的處理方法、裝置及移動終端。
依據(jù)本發(fā)明的一個方面,提供了一種圖片數(shù)據(jù)的處理方法,應用于移動終端,所述方法包括:
獲取待處理的第一圖片數(shù)據(jù),識別出第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù);
獲取與所述人物臉部特征數(shù)據(jù)相應的音頻文件,所述音頻文件為所述人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù);
依據(jù)所述第一圖片數(shù)據(jù)和所述音頻文件合成第二圖片數(shù)據(jù),所述第二圖片數(shù)據(jù)攜帶有所述音頻文件的音頻標識信息。
可選地,所述獲取待處理的第一圖片數(shù)據(jù),包括以下至少一項:
從所述移動終端的系統(tǒng)圖庫中獲取所述待處理的第一圖片數(shù)據(jù);
利用所述移動終端的拍攝功能拍攝所述待處理的第一圖片數(shù)據(jù);
調(diào)起所述移動終端上安裝的相機客戶端,并利用所述相機客戶端的拍攝功能拍攝所述待處理的第一圖片數(shù)據(jù)。
可選地,獲取與所述人物臉部特征數(shù)據(jù)相應的音頻文件,包括以下至少一項:
從本地選擇與所述人物臉部特征數(shù)據(jù)相應的音頻文件;
從網(wǎng)絡側(cè)下載與所述人物臉部特征數(shù)據(jù)相應的音頻文件;
調(diào)起所述移動終端上安裝的具有錄音功能的相機客戶端,并利用所述相機客戶端的錄音功能執(zhí)行錄音操作,獲得與所述人物臉部特征數(shù)據(jù)相應的音頻文件。
可選地,依據(jù)所述第一圖片數(shù)據(jù)和所述音頻文件合成第二圖片數(shù)據(jù),包括:
調(diào)起所述移動終端上安裝的具有有聲圖片合成功能的相機客戶端;
將所述第一圖片數(shù)據(jù)及所述音頻文件傳輸至所述相機客戶端;
觸發(fā)所述相機客戶端啟動所述有聲圖片合成功能,并利用所述相機客戶端的有聲圖片合成功能對所述第一圖片數(shù)據(jù)及所述第一音音頻文件進行合成,獲得所述第二圖片數(shù)據(jù)。
可選地,依據(jù)所述第一圖片數(shù)據(jù)和所述音頻文件合成第二圖片數(shù)據(jù),包括:
為所述音頻文件生成唯一的音頻標識信息;或者,將所述音頻文件發(fā)送至服務器,由所述服務器為所述音頻文件生成唯一的音頻標識信息,并將所述生成的音頻標識信息發(fā)送至所述移動終端;
將所述音頻標識信息寫入所述第一圖片數(shù)據(jù)的指定數(shù)據(jù)中,得到所述第二圖片數(shù)據(jù)。
可選地,當所述第一圖片數(shù)據(jù)包括多張時,將所述音頻標識信息寫入所述第一圖片數(shù)據(jù)的指定數(shù)據(jù)中,包括:
按照指定規(guī)則合成所述多張第一圖片數(shù)據(jù),獲得符合圖像互換格式GIF的動態(tài)圖片數(shù)據(jù);
將所述音頻標識信息寫入所述動態(tài)圖片數(shù)據(jù)的指定數(shù)據(jù)中。
可選地,所述音頻標識信息包括所述音頻文件的統(tǒng)一資源定位符URL。
可選地,所述指定數(shù)據(jù)包括所述第一圖片數(shù)據(jù)或所述動態(tài)圖片數(shù)據(jù)的格式數(shù)據(jù)。
可選地,所述方法還包括:
建立所述音頻文件與所述音頻標識信息之間的映射關(guān)系;
將所述音頻文件和/或所述映射關(guān)系發(fā)送至所述服務器進行存儲,以使所述移動終端接收到所述第二圖片數(shù)據(jù)之后解析獲取到所述音頻標識信息,并根據(jù)所述音頻標識信息從所述服務器獲取所述音頻文件進行播放。
可選地,當識別出多個所述人物臉部特征數(shù)據(jù)時,依據(jù)所述第一圖片數(shù)據(jù)和所述音頻文件合成第二圖片數(shù)據(jù),包括:
從所述音頻文件中提取與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件;
將所述各人物臉部特征數(shù)據(jù)分別相應的子音頻文件和所述第一圖片數(shù)據(jù)進行合成,得到多個子圖片數(shù)據(jù);
組合所述多個子圖片數(shù)據(jù),得到所述第二圖片數(shù)據(jù)。
可選地,從所述音頻文件中提取與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件,包括:
確定所述各人物臉部特征數(shù)據(jù)分別對應人物的人物信息,所述人物信息包括各對應人物的頭像、通訊號碼、姓名、昵稱中的至少一項;
獲取預設的人物信息和音頻數(shù)據(jù)之間的對應關(guān)系,并根據(jù)該對應關(guān)系確定各人物信息分別對應的音頻數(shù)據(jù);
根據(jù)所述各人物信息分別對應的音頻數(shù)據(jù),從所述音頻文件中提取與各音頻數(shù)據(jù)相匹配的子音頻文件,作為與所述各人物臉部特征數(shù)據(jù)分別相應的子音頻文件。
可選地,所述方法還包括:
確定所述人物臉部特征數(shù)據(jù)對應人物的通訊信息,所述通訊信息包括所述通訊號碼、與所述通訊號碼綁定的即時通訊賬號中的至少一項;
根據(jù)所述通訊信息,將所述第二圖片數(shù)據(jù)發(fā)送至所述對應人物。
可選地,所述方法還包括:
輸出用于提示用戶待發(fā)送的所述第二圖片數(shù)據(jù)為有聲圖片的提示信息。
可選地,所述輸出用于提示用戶待發(fā)送的第二圖片數(shù)據(jù)為有聲圖片的提示信息,包括:
在所述第二圖片數(shù)據(jù)上添加用于標識所述第二圖片數(shù)據(jù)攜帶有音頻文件的標識符;
或者,
語音輸出所述提示信息。
依據(jù)本發(fā)明的另一個方面,提供了一種圖片數(shù)據(jù)的處理裝置,設置于移動終端,所述裝置包括:
第一獲取模塊,適于獲取待處理的第一圖片數(shù)據(jù),識別出第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù);
第二獲取模塊,適于獲取與所述人物臉部特征數(shù)據(jù)相應的音頻文件,所述音頻文件為所述人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù);
合成模塊,適于依據(jù)所述第一圖片數(shù)據(jù)和所述音頻文件合成第二圖片數(shù)據(jù),所述第二圖片數(shù)據(jù)攜帶有所述音頻文件的音頻標識信息。
可選地,所述第一獲取模塊還適于以下至少一項:
從所述移動終端的系統(tǒng)圖庫中獲取所述待處理的第一圖片數(shù)據(jù);
利用所述移動終端的拍攝功能拍攝所述待處理的第一圖片數(shù)據(jù);
調(diào)起所述移動終端上安裝的相機客戶端,并利用所述相機客戶端的拍攝功能拍攝所述待處理的第一圖片數(shù)據(jù)。
可選地,所述第二獲取模塊還適于以下至少一項:
從本地選擇與所述人物臉部特征數(shù)據(jù)相應的音頻文件;
從網(wǎng)絡側(cè)下載與所述人物臉部特征數(shù)據(jù)相應的音頻文件;
調(diào)起所述移動終端上安裝的具有錄音功能的相機客戶端,并利用所述相機客戶端的錄音功能執(zhí)行錄音操作,獲得與所述人物臉部特征數(shù)據(jù)相應的音頻文件。
可選地,所述合成模塊還適于:
調(diào)起所述移動終端上安裝的具有有聲圖片合成功能的相機客戶端;
將所述第一圖片數(shù)據(jù)及所述音頻文件傳輸至所述相機客戶端;
觸發(fā)所述相機客戶端啟動所述有聲圖片合成功能,并利用所述相機客戶端的有聲圖片合成功能對所述第一圖片數(shù)據(jù)及所述第一音音頻文件進行合成,獲得所述第二圖片數(shù)據(jù)。
可選地,所述合成模塊還適于:
為所述音頻文件生成唯一的音頻標識信息;或者,將所述音頻文件發(fā)送至服務器,由所述服務器為所述音頻文件生成唯一的音頻標識信息,并將所述生成的音頻標識信息發(fā)送至所述移動終端;
將所述音頻標識信息寫入所述第一圖片數(shù)據(jù)的指定數(shù)據(jù)中,得到所述第二圖片數(shù)據(jù)。
可選地,所述合成模塊還適于:
當所述第一圖片數(shù)據(jù)包括多張時,按照指定規(guī)則合成所述多張第一圖片數(shù)據(jù),獲得符合圖像互換格式GIF的動態(tài)圖片數(shù)據(jù);
將所述音頻標識信息寫入所述動態(tài)圖片數(shù)據(jù)的指定數(shù)據(jù)中。
可選地,所述音頻標識信息包括所述音頻文件的統(tǒng)一資源定位符URL。
可選地,所述指定數(shù)據(jù)包括所述第一圖片數(shù)據(jù)或所述動態(tài)圖片數(shù)據(jù)的格式數(shù)據(jù)。
可選地,所述裝置還包括:
建立模塊,適于建立所述音頻文件與所述音頻標識信息之間的映射關(guān)系;
第一發(fā)送模塊,適于將所述音頻文件和/或所述映射關(guān)系發(fā)送至所述服務器進行存儲,以使所述移動終端接收到所述第二圖片數(shù)據(jù)之后解析獲取到所述音頻標識信息,并根據(jù)所述音頻標識信息從所述服務器獲取所述音頻文件進行播放。
可選地,所述合成模塊還適于:
當識別出多個所述人物臉部特征數(shù)據(jù)時,從所述音頻文件中提取與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件;
將所述各人物臉部特征數(shù)據(jù)分別相應的子音頻文件和所述第一圖片數(shù)據(jù)進行合成,得到多個子圖片數(shù)據(jù);
組合所述多個子圖片數(shù)據(jù),得到所述第二圖片數(shù)據(jù)。
可選地,所述合成模塊還適于:
確定所述各人物臉部特征數(shù)據(jù)分別對應人物的人物信息,所述人物信息包括各對應人物的頭像、通訊號碼、姓名、昵稱中的至少一項;
獲取預設的人物信息和音頻數(shù)據(jù)之間的對應關(guān)系,并根據(jù)該對應關(guān)系確定各人物信息分別對應的音頻數(shù)據(jù);
根據(jù)所述各人物信息分別對應的音頻數(shù)據(jù),從所述音頻文件中提取與各音頻數(shù)據(jù)相匹配的子音頻文件,作為與所述各人物臉部特征數(shù)據(jù)分別相應的子音頻文件。
可選地,所述裝置還包括:
確定模塊,適于確定所述人物臉部特征數(shù)據(jù)對應人物的通訊信息,所述通訊信息包括所述通訊號碼、與所述通訊號碼綁定的即時通訊賬號中的至少一項;
第二發(fā)送模塊,適于根據(jù)所述通訊信息,將所述第二圖片數(shù)據(jù)發(fā)送至所述對應人物。
可選地,所述裝置還包括:
輸出模塊,適于輸出用于提示用戶待發(fā)送的所述第二圖片數(shù)據(jù)為有聲圖片的提示信息。
可選地,所述輸出模塊還適于:
在所述第二圖片數(shù)據(jù)上添加用于標識所述第二圖片數(shù)據(jù)攜帶有音頻文件的標識符;
或者,
語音輸出所述提示信息。
依據(jù)本發(fā)明的另一個方面,提供了一種移動終端,包括處理器和存儲器,所述存儲器用于存儲執(zhí)行上述的圖片數(shù)據(jù)的處理方法的程序,所述處理器被配置為用于執(zhí)行所述存儲器中存儲的程序。
采用本發(fā)明實施例提供的技術(shù)方案,能夠識別出待處理的第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù),并獲取與人物臉部特征數(shù)據(jù)相應的音頻文件(即人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù)),并依據(jù)第一圖片數(shù)據(jù)和音頻文件合成第二圖片數(shù)據(jù),使得音頻文件能夠被合成到圖片數(shù)據(jù)中,從而實現(xiàn)了有聲圖片在移動終端中的應用,尤其是在圖片數(shù)據(jù)為照片時,該技術(shù)方案使得用戶能夠?qū)⒁纛l文件合成在照片中,進而使用戶在存儲照片的同時能夠通過合成在照片中的音頻文件來記錄一些照片中無法記錄的信息,增加用戶對拍照的樂趣。此外,這種在圖片數(shù)據(jù)中合成音頻文件的方式相較于視頻而言更為簡便,且占用的存儲空間很小。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。
根據(jù)下文結(jié)合附圖對本發(fā)明具體實施例的詳細描述,本領(lǐng)域技術(shù)人員將會更加明了本發(fā)明的上述以及其他目的、優(yōu)點和特征。
附圖說明
通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
圖1是根據(jù)本發(fā)明一個實施例的一種圖片數(shù)據(jù)的處理方法的示意性流程圖;
圖2是本發(fā)明具體實施例一的一種圖片數(shù)據(jù)的處理方法的示意性流程圖;
圖3是根據(jù)本發(fā)明一個實施例的一種圖片數(shù)據(jù)的處理裝置的示意性框圖;
圖4是根據(jù)本發(fā)明另一個實施例的一種圖片數(shù)據(jù)的處理裝置的示意性框圖;
圖5示出的是與本發(fā)明實施例提供的移動終端相關(guān)的手機的部分結(jié)構(gòu)的框圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現(xiàn)本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
圖1是根據(jù)本發(fā)明一個實施例的一種圖片數(shù)據(jù)的處理方法的示意性流程圖。如圖1所示,該方法應用于移動終端,其一般性地可包括以下步驟S101-S103:
步驟S101,獲取待處理的第一圖片數(shù)據(jù),識別出第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù)。
步驟S102,獲取與人物臉部特征數(shù)據(jù)相應的音頻文件,音頻文件為人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù)。
步驟S103,依據(jù)第一圖片數(shù)據(jù)和音頻文件合成第二圖片數(shù)據(jù),第二圖片數(shù)據(jù)攜帶有音頻文件的音頻標識信息。
該實施例中,第一圖片數(shù)據(jù)可以是照片。
采用本發(fā)明實施例提供的技術(shù)方案,能夠識別出待處理的第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù),并獲取與人物臉部特征數(shù)據(jù)相應的音頻文件(即人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù)),并依據(jù)第一圖片數(shù)據(jù)和音頻文件合成第二圖片數(shù)據(jù),使得音頻文件能夠被合成到圖片數(shù)據(jù)中,從而實現(xiàn)了有聲圖片在移動終端中的應用,尤其是在圖片數(shù)據(jù)為照片時,該技術(shù)方案使得用戶能夠?qū)⒁纛l文件合成在照片中,進而使用戶在存儲照片的同時能夠通過合成在照片中的音頻文件來記錄一些照片中無法記錄的信息,增加用戶對拍照的樂趣。此外,這種在圖片數(shù)據(jù)中合成音頻文件的方式相較于視頻而言更為簡便,且占用的存儲空間很小。
以下針對上述步驟S101-S103進行詳細說明。
首先執(zhí)行步驟S101,即獲取待處理的第一圖片數(shù)據(jù),識別出第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù)。其中,待處理的第一圖片數(shù)據(jù)可通過如下任一種方式獲取:
方式一、從移動終端的系統(tǒng)圖庫中獲取待處理的第一圖片數(shù)據(jù);當系統(tǒng)圖庫包括系統(tǒng)相冊時,可從移動終端的系統(tǒng)相冊中獲取任一張或多張照片作為待處理的第一圖片數(shù)據(jù)。
方式二、利用移動終端的拍攝功能拍攝待處理的第一圖片數(shù)據(jù);移動終端的拍攝功能可以是移動終端系統(tǒng)自帶的相機的拍攝功能,也可以是移動終端上安裝的第三方應用所具有的拍攝功能,例如,第三方應用為美圖秀秀、隨手拍等具有拍攝功能的應用。
方式三、調(diào)起移動終端上安裝的相機客戶端,并利用相機客戶端的拍攝功能拍攝待處理的第一圖片數(shù)據(jù)。
此外,該步驟中,可利用圖片識別技術(shù)從第一圖片數(shù)據(jù)中識別出人物臉部特征數(shù)據(jù),因圖片識別技術(shù)為現(xiàn)有技術(shù),因此不再贅述。第一圖片數(shù)據(jù)中可包括一個或多個人物臉部特征數(shù)據(jù)。
在識別出第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù)之后,繼續(xù)執(zhí)行步驟S102,即獲取與人物臉部特征數(shù)據(jù)相應的音頻文件,其中,音頻文件為人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù)。其中,與人物臉部特征數(shù)據(jù)相應的音頻文件可通過以下任一種方式獲?。?/p>
方式一、從本地選擇與人物臉部特征數(shù)據(jù)相應的音頻文件。例如,從本地選擇一首歌、一段插曲或預先錄制好的音頻文件作為與人物臉部特征數(shù)據(jù)相應的音頻文件。
方式二、從網(wǎng)絡側(cè)下載與人物臉部特征數(shù)據(jù)相應的音頻文件。例如,從網(wǎng)絡側(cè)下載一首歌、一段插曲等作為與人物臉部特征數(shù)據(jù)相應的音頻文件。
方式三、調(diào)起移動終端上安裝的具有錄音功能的相機客戶端,并利用相機客戶端的錄音功能執(zhí)行錄音操作,獲得與人物臉部特征數(shù)據(jù)相應的音頻文件。
方式四、開啟移動終端自身的錄音功能,并利用移動終端自身的錄音功能執(zhí)行錄音操作,獲得與人物臉部特征數(shù)據(jù)相應的音頻文件。
在一個實施例中,當識別出多個人物臉部特征數(shù)據(jù)時,還可分別獲取各人物臉部特征數(shù)據(jù)相應的音頻文件,具體可實施為以下任一種方式:
方式一、從本地選擇與各人物臉部特征數(shù)據(jù)分別相應的音頻文件。例如,從本地選擇一個音頻文件作為與第一人物臉部特征數(shù)據(jù)相應的音頻文件,同時從本地選擇另一個音頻文件作為與第二人物臉部特征數(shù)據(jù)相應的音頻文件。
方式二、從網(wǎng)絡側(cè)下載與各人物臉部特征數(shù)據(jù)分別相應的音頻文件。例如,從網(wǎng)絡側(cè)下載一個音頻文件作為與第一人物臉部特征數(shù)據(jù)相應的音頻文件,同時從網(wǎng)絡側(cè)下載另一個音頻文件作為與第二人物臉部特征數(shù)據(jù)相應的音頻文件。
方式三、調(diào)起移動終端上安裝的具有錄音功能的相機客戶端,并利用相機客戶端的錄音功能執(zhí)行多次錄音操作,獲得與各人物臉部特征數(shù)據(jù)分別相應的音頻文件。例如,利用相機客戶端的錄音功能錄制第一錄音文件,該第一錄音文件為與第一人物臉部特征數(shù)據(jù)相應的音頻文件,然后利用相機客戶端的錄音功能錄制第二錄音文件,該第二錄音文件為與第二人物臉部特征數(shù)據(jù)相應的音頻文件。
方式四、開啟移動終端自身的錄音功能,并利用移動終端自身的錄音功能執(zhí)行錄音操作,獲得與各人物臉部特征數(shù)據(jù)分別相應的音頻文件。例如,利用移動終端自身的錄音功能錄制第三錄音文件,該第三錄音文件為與第一人物臉部特征數(shù)據(jù)相應的音頻文件,然后利用移動終端自身的的錄音功能錄制第四錄音文件,該第四錄音文件為與第二人物臉部特征數(shù)據(jù)相應的音頻文件。
需要說明的是,當識別出多個人物臉部特征數(shù)據(jù)時,各人物臉部特征數(shù)據(jù)分別相應的音頻文件可通過相同或不同的方式獲取。例如,從本地選擇一個音頻文件作為與第一人物臉部特征數(shù)據(jù)相應的音頻文件,然后開啟移動終端自身的錄音功能,并利用動終端自身的錄音功能錄制一段錄音文件作為與第二人物臉部特征數(shù)據(jù)相應的音頻文件。
在獲取到與人物臉部特征數(shù)據(jù)相應的音頻文件之后,繼續(xù)執(zhí)行步驟S103,即依據(jù)第一圖片數(shù)據(jù)和音頻文件合成第二圖片數(shù)據(jù),第二圖片數(shù)據(jù)攜帶有音頻文件的音頻標識信息。其中,音頻標識信息可包括音頻文件的統(tǒng)一資源定位符URL、編號信息中的至少一項。依據(jù)第一圖片數(shù)據(jù)和音頻文件合成第二圖片數(shù)據(jù)的方式有多種,以下通過不同實施例列舉幾種合成第二圖片數(shù)據(jù)的方式。
在一個實施例中,可按照如下步驟合成第二圖片數(shù)據(jù):首先,調(diào)起移動終端上安裝的具有有聲圖片合成功能的相機客戶端;例如留聲相機客戶端,其具有有聲圖片合成功能。其次,將第一圖片數(shù)據(jù)及音頻文件傳輸至相機客戶端。再次,觸發(fā)相機客戶端啟動有聲圖片合成功能,并利用相機客戶端的有聲圖片合成功能對第一圖片數(shù)據(jù)及第一音音頻文件進行合成,獲得第二圖片數(shù)據(jù)。例如,觸發(fā)留聲相機客戶端啟動其有聲圖片合成功能,并利用啟動的有聲圖片合成功能合成第一圖片數(shù)據(jù)及第一音音頻文件,即可獲得第二圖片數(shù)據(jù)。
在另一個實施例中,當利用具有有聲圖片合成功能的相機客戶端獲取第一圖片數(shù)據(jù)、且利用該相機客戶端的錄音功能錄制與第一圖片數(shù)據(jù)種的人物臉部特征數(shù)居相應的音頻文件時,則無需再將第一圖片數(shù)據(jù)及音頻文件傳輸至相機客戶端,只需啟動該相機客戶端的有聲圖片合成功能直接合成第一圖片數(shù)據(jù)及音頻文件即可。
在另一個實施例中,還可按照如下步驟合成第二圖片數(shù)據(jù):首先,為音頻文件生成唯一的音頻標識信息;其次,將音頻標識信息寫入第一圖片數(shù)據(jù)的指定數(shù)據(jù)中,得到第二圖片數(shù)據(jù)。該實施例中,移動終端可在本地為音頻文件生成唯一的音頻標識信息,也可將音頻文件發(fā)送至服務器,由服務器為音頻文件生成唯一的音頻標識信息,并將生成的音頻標識信息發(fā)送至移動終端。其中,音頻標識信息可以是音頻文件的統(tǒng)一資源定位符URL、編號信息中的至少一項。
該實施例中,指定數(shù)據(jù)可以是第一圖片數(shù)據(jù)的格式數(shù)據(jù)。在將音頻標識信息寫入第一圖片數(shù)據(jù)的指定數(shù)據(jù)中時,可預先設定寫入位置,通常情況下,為使合成過程簡單方便、且合成后的第二圖片數(shù)據(jù)的結(jié)構(gòu)易于解析,可設定寫入位置為第一圖片數(shù)據(jù)的格式數(shù)據(jù)的最末尾位置。例如,某第一圖片數(shù)據(jù)的格式數(shù)據(jù)為“123.jpg”,與其對應的音頻文件的音頻標識信息為其URL“http://www.11111”,那么,在合成第一圖片數(shù)據(jù)和音頻文件時,可將音頻文件的URL寫入第一圖片數(shù)據(jù)的格式數(shù)據(jù)的最末尾位置,得到第二圖片數(shù)據(jù)“123.jpg.http://www.11111”。
此外,當?shù)谝粓D片數(shù)據(jù)包括多張時,還可按照如下方式將音頻標識信息寫入第一圖片數(shù)據(jù)的指定數(shù)據(jù)中:首先,按照指定規(guī)則合成多張第一圖片數(shù)據(jù),獲得符合圖像互換格式GIF的動態(tài)圖片數(shù)據(jù);其次,將音頻標識信息寫入動態(tài)圖片數(shù)據(jù)的指定數(shù)據(jù)中。其中,指定規(guī)則例如:按照多張第一圖片數(shù)據(jù)的獲取順序合成、按照多張第一圖片數(shù)據(jù)的排列順序合成、按照多張第一圖片數(shù)據(jù)的數(shù)據(jù)由大到小(或由小到大)的順序合成,等等。動態(tài)圖片數(shù)據(jù)的指定數(shù)據(jù)可包括動態(tài)圖片數(shù)據(jù)的格式數(shù)據(jù),音頻標識信息可以是音頻文件的統(tǒng)一資源定位符URL、編號信息中的至少一項。例如,將多張第一圖片數(shù)據(jù)合成動態(tài)圖片數(shù)據(jù)后,動態(tài)圖片數(shù)據(jù)的格式數(shù)據(jù)為“123.gif”,與動態(tài)圖片數(shù)據(jù)對應的音頻文件的音頻標識信息為其編號信息“0000”,那么,在合成動態(tài)圖片數(shù)據(jù)和音頻文件時,可將音頻文件的編號信息寫入動態(tài)圖片數(shù)據(jù)的格式數(shù)據(jù)的最末尾位置,得到第二圖片數(shù)據(jù)“123.gif.0000”。
當然,將音頻標識信息寫入第一圖片數(shù)據(jù)的指定數(shù)據(jù)中的寫入位置除上述列舉的最末尾位置外,還可以是指定數(shù)據(jù)中的其他位置,例如指定數(shù)據(jù)中的初始位置、預設中間位置等,具體的寫入方式與上述實施例中相同,在此不一一列舉。
如上述所說,移動終端從第一圖片數(shù)據(jù)中可識別出一個或多個人物臉部特征數(shù)據(jù),當識別出多個人物臉部特征數(shù)據(jù)時,可同樣使用上述列舉的合成方式來合成第二圖片數(shù)據(jù),即,多個人物臉部特征數(shù)據(jù)對應同一個音頻文件,將第一圖片數(shù)據(jù)和該同一個音頻文件進行合成得到第二圖片數(shù)據(jù)。
此外,還可按以下步驟來合成第二圖片數(shù)據(jù):首先,從音頻文件中提取與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件;其次,將各人物臉部特征數(shù)據(jù)分別相應的子音頻文件和第一圖片數(shù)據(jù)進行合成,得到多個子圖片數(shù)據(jù);再次,組合多個子圖片數(shù)據(jù),得到第二圖片數(shù)據(jù)。
具體的,可按照如下步驟從音頻文件中提取與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件:首先,確定各人物臉部特征數(shù)據(jù)分別對應人物的人物信息,該人物信息包括各對應人物的頭像、通訊號碼、姓名、昵稱中的至少一項;其次,獲取預設的人物信息和音頻數(shù)據(jù)之間的對應關(guān)系,并根據(jù)該對應關(guān)系確定各人物信息分別對應的音頻數(shù)據(jù);再次,根據(jù)各人物信息分別對應的音頻數(shù)據(jù),從音頻文件中提取與各音頻數(shù)據(jù)相匹配的子音頻文件,作為與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件。
例如,第一圖片數(shù)據(jù)中包括人物A和人物B,因此可識別出2個人物臉部特征數(shù)據(jù)(即人物A的人物臉部特征數(shù)據(jù)和人物B的人物臉部特征數(shù)據(jù)),在音頻文件中包括有人物A和人物B分別相應的子音頻文件,且以音頻數(shù)據(jù)和人物信息的對應關(guān)系的方式存儲,因此根據(jù)該對應關(guān)系可分別確定出人物A對應的音頻數(shù)據(jù)和人物B對應的音頻數(shù)據(jù),然后根據(jù)人物A對應的音頻數(shù)據(jù)和人物B對應的音頻數(shù)據(jù),分別從音頻文件中提取與各音頻數(shù)據(jù)相匹配的子音頻文件。
在一個實施例中,上述方法還包括以下步驟:首先,建立音頻文件與音頻標識信息之間的映射關(guān)系;其次,將音頻文件和/或音頻文件與音頻標識信息之間的映射關(guān)系發(fā)送至服務器進行存儲,以使移動終端接收到第二圖片數(shù)據(jù)之后解析獲取到音頻標識信息,并根據(jù)音頻標識信息從服務器獲取音頻文件進行播放。例如,服務器存儲有音頻文件以及各音頻文件與音頻標識信息之間的映射關(guān)系,當移動終端接收到第二圖片數(shù)據(jù)(即有聲圖片)時,解析出第二圖片數(shù)據(jù)中攜帶的音頻標識信息,并將該音頻標識信息發(fā)送至服務器,由服務器根據(jù)各音頻文件與音頻標識信息之間的映射關(guān)系查詢并獲取該音頻標識信息對應的音頻文件,并將獲取到的音頻文件發(fā)送至移動終端,以使移動終端能夠在查看第二圖片數(shù)據(jù)時播放音頻文件。
在一個實施例中,上述方法還包括以下步驟:首先,確定人物臉部特征數(shù)據(jù)對應人物的通訊信息,通訊信息包括通訊號碼、與通訊號碼綁定的即時通訊賬號中的至少一項;其次,根據(jù)通訊信息,將第二圖片數(shù)據(jù)發(fā)送至對應人物。在確定人物臉部特征數(shù)據(jù)對應人物的通訊信息時,可將人物臉部特征數(shù)據(jù)與移動終端通訊錄中的聯(lián)系人頭像和/或移動終端中安裝的第三方通訊應用中的聯(lián)系人頭像進行匹配,并根據(jù)匹配到的聯(lián)系人頭像確定對應的通訊信息。
例如,第一圖片數(shù)據(jù)中包括人物A,在識別出人物A的人物臉部特征數(shù)據(jù)后,將人物A的人物臉部特征數(shù)據(jù)和移動終端通訊錄中的聯(lián)系人頭像和/或移動終端中安裝的第三方通訊應用中的聯(lián)系人頭像進行匹配,并根據(jù)匹配到的聯(lián)系人頭像確定人物A的通訊信息,然后再將第二圖片數(shù)據(jù)發(fā)送至人物A,以使人物A也能分享與自己有關(guān)的有聲圖片,增加用戶之間的互動樂趣。
當然,有聲圖片(即第二圖片數(shù)據(jù))并不局限于發(fā)送給圖片中包含的人物,還可發(fā)送給其他任一用戶,例如,合成有聲圖片之后,將有聲圖片發(fā)送至移動終端通訊錄中的任一聯(lián)系人,或者發(fā)送至移動終端上安裝的第三方通訊應用中的任一好友。
發(fā)送第二圖片數(shù)據(jù)發(fā)送時,上述方法還包括以下步驟:輸出用于提示用戶待發(fā)送的第二圖片數(shù)據(jù)為有聲圖片的提示信息。具體的,提示信息的輸出方式包括以下任一種方式:方式一、在第二圖片數(shù)據(jù)上添加用于標識第二圖片數(shù)據(jù)攜帶有音頻文件的標識符;例如,在第二圖片數(shù)據(jù)上的任一位置添加一音符標識,以表示該第二圖片數(shù)據(jù)攜帶有音頻文件。方式二、語音輸出提示信息。
以下通過一具體實施例來說明本發(fā)明提供的圖片數(shù)據(jù)的處理方法。
實施例一
圖2為本發(fā)明具體實施例一的一種圖片數(shù)據(jù)的處理方法的示意性流程圖。在該實施例一中,待處理的第一圖片數(shù)據(jù)為照片,且應用于手機中。如圖2所示,該方法包括以下步驟S201-S207:
步驟S201,啟動手機的拍攝功能拍攝一張待處理的照片。
步驟S202,識別出照片中的人物臉部特征數(shù)據(jù)。
步驟S203,啟動手機的錄音功能為人物臉部特征數(shù)據(jù)錄制一段相應的音頻文件。
步驟S204,將音頻文件發(fā)送至服務器,由服務器為音頻文件生成唯一的音頻標識信息。其中,音頻標識信息可以是音頻文件的統(tǒng)一資源定位符URL、編號信息中的至少一項。
步驟S205,從服務器獲取音頻文件對應的音頻標識信息。
步驟S206,將音頻標識信息寫入照片的格式數(shù)據(jù)的預設位置,以合成照片和音頻文件,得到有聲照片。其中,預設位置可以是格式數(shù)據(jù)中的任一位置,例如格式數(shù)據(jù)中的初始位置、指定中間位置或末尾位置。
步驟S207,從手機通訊錄中選擇至少一個聯(lián)系人,并將有聲照片發(fā)送給所選擇的至少一個聯(lián)系人。
以具體場景為例說明該實施例一的技術(shù)方案。例如,用戶利用手機的拍攝功能為其孩子“王小明”拍攝一張照片,該照片的格式數(shù)據(jù)為“123.gif”,手機識別出該照片中“王小明”的人物臉部特征信息,并啟動手機的錄音功能。其次,用戶利用手機的錄音功能錄制一段音頻文件,如“小明今天心情很好,玩了旋轉(zhuǎn)木馬”,該音頻文件的編號信息為“0000”。然后,手機將音頻文件的編號信息“0000”寫入到照片的格式數(shù)據(jù)“123.gif”中的末尾位置,得到名為“123.gif.0000”的有聲照片,該有聲照片的格式仍為圖片格式。最后,用戶可將該有聲照片發(fā)送至自己的家人,以使家人也能看到為“王小明”拍攝的有聲照片。
由此可知,采用本發(fā)明實施例一中的技術(shù)方案,能夠識別出待處理的照片中的人物臉部特征數(shù)據(jù),并獲取與人物臉部特征數(shù)據(jù)相應的音頻文件(即人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù)),并依據(jù)照片和音頻文件合成有聲照片,使得音頻文件能夠被合成到照片中,從而實現(xiàn)了有聲照片在手機中的應用,使用戶在存儲照片的同時能夠通過合成在照片中的音頻文件來記錄一些照片中無法記錄的信息,增加用戶對拍照的樂趣。此外,這種在照片中合成音頻文件的方式相較于視頻而言更為簡便,且占用的存儲空間很小。
圖3是根據(jù)本發(fā)明一個實施例的一種圖片數(shù)據(jù)的處理裝置的示意性框圖。如圖3所示,該裝置設置于移動終端,包括:
第一獲取模塊310,適于獲取待處理的第一圖片數(shù)據(jù),識別出第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù);
第二獲取模塊320,與第一獲取模塊310相耦合,適于獲取與人物臉部特征數(shù)據(jù)相應的音頻文件,音頻文件為人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù);
合成模塊330,與第二獲取模塊320相耦合,適于依據(jù)第一圖片數(shù)據(jù)和音頻文件合成第二圖片數(shù)據(jù),第二圖片數(shù)據(jù)攜帶有音頻文件的音頻標識信息。
在一個實施例中,第一獲取模塊還適于以下至少一項:
從移動終端的系統(tǒng)圖庫中獲取待處理的第一圖片數(shù)據(jù);
利用移動終端的拍攝功能拍攝待處理的第一圖片數(shù)據(jù);
調(diào)起移動終端上安裝的相機客戶端,并利用相機客戶端的拍攝功能拍攝待處理的第一圖片數(shù)據(jù)。
在一個實施例中,第二獲取模塊還適于以下至少一項:
從本地選擇與人物臉部特征數(shù)據(jù)相應的音頻文件;
從網(wǎng)絡側(cè)下載與人物臉部特征數(shù)據(jù)相應的音頻文件;
調(diào)起移動終端上安裝的具有錄音功能的相機客戶端,并利用相機客戶端的錄音功能執(zhí)行錄音操作,獲得與人物臉部特征數(shù)據(jù)相應的音頻文件。
在一個實施例中,合成模塊330還適于:
調(diào)起移動終端上安裝的具有有聲圖片合成功能的相機客戶端;
將第一圖片數(shù)據(jù)及音頻文件傳輸至相機客戶端;
觸發(fā)相機客戶端啟動有聲圖片合成功能,并利用相機客戶端的有聲圖片合成功能對第一圖片數(shù)據(jù)及第一音音頻文件進行合成,獲得第二圖片數(shù)據(jù)。
在一個實施例中,合成模塊330還適于:
為音頻文件生成唯一的音頻標識信息;或者,將音頻文件發(fā)送至服務器,由服務器為音頻文件生成唯一的音頻標識信息,并將生成的音頻標識信息發(fā)送至移動終端;
將音頻標識信息寫入第一圖片數(shù)據(jù)的指定數(shù)據(jù)中,得到第二圖片數(shù)據(jù)。
在一個實施例中,合成模塊330還適于:
當?shù)谝粓D片數(shù)據(jù)包括多張時,按照指定規(guī)則合成多張第一圖片數(shù)據(jù),獲得符合圖像互換格式GIF的動態(tài)圖片數(shù)據(jù);
將音頻標識信息寫入動態(tài)圖片數(shù)據(jù)的指定數(shù)據(jù)中。
在一個實施例中,音頻標識信息包括音頻文件的統(tǒng)一資源定位符URL。
在一個實施例中,指定數(shù)據(jù)包括第一圖片數(shù)據(jù)或動態(tài)圖片數(shù)據(jù)的格式數(shù)據(jù)。
在一個實施例中,如圖4所示,上述裝置還包括:
建立模塊340,與合成模塊330相耦合,適于建立音頻文件與音頻標識信息之間的映射關(guān)系;
第一發(fā)送模塊350,與建立模塊340相耦合,適于將音頻文件和/或映射關(guān)系發(fā)送至服務器進行存儲,以使移動終端接收到第二圖片數(shù)據(jù)之后解析獲取到音頻標識信息,并根據(jù)音頻標識信息從服務器獲取音頻文件進行播放。
在一個實施例中,合成模塊330還適于:
當識別出多個人物臉部特征數(shù)據(jù)時,從音頻文件中提取與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件;
將各人物臉部特征數(shù)據(jù)分別相應的子音頻文件和第一圖片數(shù)據(jù)進行合成,得到多個子圖片數(shù)據(jù);
組合多個子圖片數(shù)據(jù),得到第二圖片數(shù)據(jù)。
在一個實施例中,合成模塊330還適于:
確定各人物臉部特征數(shù)據(jù)分別對應人物的人物信息,人物信息包括各對應人物的頭像、通訊號碼、姓名、昵稱中的至少一項;
獲取預設的人物信息和音頻數(shù)據(jù)之間的對應關(guān)系,并根據(jù)該對應關(guān)系確定各人物信息分別對應的音頻數(shù)據(jù);
根據(jù)各人物信息分別對應的音頻數(shù)據(jù),從音頻文件中提取與各音頻數(shù)據(jù)相匹配的子音頻文件,作為與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件。
在一個實施例中,上述裝置還包括:
確定模塊,與合成模塊330相耦合,適于確定人物臉部特征數(shù)據(jù)對應人物的通訊信息,通訊信息包括通訊號碼、與通訊號碼綁定的即時通訊賬號中的至少一項;
第二發(fā)送模塊,與確定模塊相耦合,適于根據(jù)通訊信息,將第二圖片數(shù)據(jù)發(fā)送至對應人物。
在一個實施例中,上述裝置還包括:
輸出模塊,與第二發(fā)送模塊相耦合,適于輸出用于提示用戶待發(fā)送的第二圖片數(shù)據(jù)為有聲圖片的提示信息。
在一個實施例中,輸出模塊還適于:
在第二圖片數(shù)據(jù)上添加用于標識第二圖片數(shù)據(jù)攜帶有音頻文件的標識符;
或者,
語音輸出提示信息。
采用本發(fā)明實施例提供的裝置,能夠識別出待處理的第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù),并獲取與人物臉部特征數(shù)據(jù)相應的音頻文件(即人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù)),并依據(jù)第一圖片數(shù)據(jù)和音頻文件合成第二圖片數(shù)據(jù),使得音頻文件能夠被合成到圖片數(shù)據(jù)中,從而實現(xiàn)了有聲圖片在移動終端中的應用,尤其是在圖片數(shù)據(jù)為照片時,該技術(shù)方案使得用戶能夠?qū)⒁纛l文件合成在照片中,進而使用戶在存儲照片的同時能夠通過合成在照片中的音頻文件來記錄一些照片中無法記錄的信息,增加用戶對拍照的樂趣。此外,這種在圖片數(shù)據(jù)中合成音頻文件的方式相較于視頻而言更為簡便,且占用的存儲空間很小。
本領(lǐng)域的技術(shù)人員應可理解,圖3和圖4中的圖片數(shù)據(jù)的處理裝置能夠用來實現(xiàn)前文所述的圖片數(shù)據(jù)的處理方案,其中的細節(jié)描述應與前文方法部分描述類似,為避免繁瑣,此處不另贅述。
本發(fā)明實施例還提供了一種移動終端,如圖5所示,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分,具體技術(shù)細節(jié)未揭示的,請參照本發(fā)明實施例方法部分。該移動終端可以為包括手機、平板電腦、PDA(Personal Digital Assistant,個人數(shù)字助理)、POS(Point of Sales,銷售終端)、車載電腦等任意終端設備,以終端為手機為例:
圖5示出的是與本發(fā)明實施例提供的移動終端相關(guān)的手機的部分結(jié)構(gòu)的框圖。參考圖5,手機包括:射頻(Radio Frequency,RF)電路510、存儲器520、輸入單元530、顯示單元540、傳感器550、音頻電路560、無線保真(wireless-fidelity,Wi-Fi)模塊570、處理器580、以及電源590等部件。本領(lǐng)域技術(shù)人員可以理解,圖5中示出的手機結(jié)構(gòu)并不構(gòu)成對手機的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
下面結(jié)合圖5對手機的各個構(gòu)成部件進行具體的介紹:
RF電路510可用于收發(fā)信息或通話過程中,信號的接收和發(fā)送,特別地,將基站的下行信息接收后,給處理器580處理;另外,將設計上行的數(shù)據(jù)發(fā)送給基站。通常,RF電路510包括但不限于天線、至少一個放大器、收發(fā)信機、耦合器、低噪聲放大器(Low Noise Amplifier,LNA)、雙工器等。此外,RF電路510還可以通過無線通信與網(wǎng)絡和其他設備通信。上述無線通信可以使用任一通信標準或協(xié)議,包括但不限于全球移動通訊系統(tǒng)(Global System of Mobile communication,GSM)、通用分組無線服務(General Packet Radio Service,GPRS)、碼分多址(Code Division Multiple Access,CDMA)、寬帶碼分多址(Wideband Code Division Multiple Access,WCDMA)、長期演進(Long Term Evolution,LTE)、電子郵件、短消息服務(Short Messaging Service,SMS)等。
存儲器520可用于存儲軟件程序以及模塊,處理器580通過運行存儲在存儲器520的軟件程序以及模塊,從而執(zhí)行手機的各種功能應用以及數(shù)據(jù)處理。存儲器520可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個功能所需的應用程序(比如聲音播放功能、圖像播放功能等)等;存儲數(shù)據(jù)區(qū)可存儲根據(jù)手機的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲器520可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。
輸入單元530可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與手機的用戶設置以及功能控制有關(guān)的鍵信號輸入。具體地,輸入單元530可包括觸控面板531以及其他輸入設備532。觸控面板531,也稱為觸摸屏,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板531上或在觸控面板531附近的操作),并根據(jù)預先設定的程式驅(qū)動相應的連接裝置??蛇x的,觸控面板531可包括觸摸檢測裝置和觸摸控制器兩個部分。其中,觸摸檢測裝置檢測用戶的觸摸方位,并檢測觸摸操作帶來的信號,將信號傳送給觸摸控制器;觸摸控制器從觸摸檢測裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點坐標,再送給處理器580,并能接收處理器580發(fā)來的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實現(xiàn)觸控面板531。除了觸控面板531,輸入單元530還可以包括其他輸入設備532。具體地,其他輸入設備532可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標、操作桿等中的一種或多種。
顯示單元540可用于顯示由用戶輸入的信息或提供給用戶的信息以及手機的各種菜單。顯示單元540可包括顯示面板541,可選的,可以采用液晶顯示器(Liquid Crystal Display,LCD)、有機發(fā)光二極管(Organic Light-Emitting Diode,OLED)等形式來配置顯示面板541。進一步的,觸控面板531可覆蓋顯示面板541,當觸控面板531檢測到在其上或附近的觸摸操作后,傳送給處理器580以確定觸摸事件的類型,隨后處理器580根據(jù)觸摸事件的類型在顯示面板541上提供相應的視覺輸出。雖然在圖5中,觸控面板531與顯示面板541是作為兩個獨立的部件來實現(xiàn)手機的輸入和輸入功能,但是在某些實施例中,可以將觸控面板531與顯示面板541集成而實現(xiàn)手機的輸入和輸出功能。
手機還可包括至少一種傳感器550,比如光傳感器、運動傳感器以及其他傳感器。具體地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來調(diào)節(jié)顯示面板541的亮度,接近傳感器可在手機移動到耳邊時,關(guān)閉顯示面板541和/或背光。作為運動傳感器的一種,加速計傳感器可檢測各個方向上(一般為三軸)加速度的大小,靜止時可檢測出重力的大小及方向,可用于識別手機姿態(tài)的應用(比如橫豎屏切換、相關(guān)游戲、磁力計姿態(tài)校準)、振動識別相關(guān)功能(比如計步器、敲擊)等;至于手機還可配置的陀螺儀、氣壓計、濕度計、溫度計、紅外線傳感器等其他傳感器,在此不再贅述。
音頻電路560、揚聲器561,傳聲器562可提供用戶與手機之間的音頻接口。音頻電路560可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號,傳輸?shù)綋P聲器561,由揚聲器561轉(zhuǎn)換為聲音信號輸出;另一方面,傳聲器562將收集的聲音信號轉(zhuǎn)換為電信號,由音頻電路560接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出處理器580處理后,經(jīng)RF電路510以發(fā)送給比如另一手機,或者將音頻數(shù)據(jù)輸出至存儲器520以便進一步處理。
WiFi屬于短距離無線傳輸技術(shù),手機通過WiFi模塊570可以幫助用戶收發(fā)電子郵件、瀏覽網(wǎng)頁和訪問流式媒體等,它為用戶提供了無線的寬帶互聯(lián)網(wǎng)訪問。雖然圖5示出了WiFi模塊570,但是可以理解的是,其并不屬于手機的必須構(gòu)成,完全可以根據(jù)需要在不改變發(fā)明的本質(zhì)的范圍內(nèi)而省略。
處理器580是手機的控制中心,利用各種接口和線路連接整個手機的各個部分,通過運行或執(zhí)行存儲在存儲器520內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲在存儲器520內(nèi)的數(shù)據(jù),執(zhí)行手機的各種功能和處理數(shù)據(jù),從而對手機進行整體監(jiān)控。可選的,處理器580可包括一個或多個處理單元;優(yōu)選的,處理器580可集成應用處理器和調(diào)制解調(diào)處理器,其中,應用處理器主要處理操作系統(tǒng)、用戶界面和應用程序等,調(diào)制解調(diào)處理器主要處理無線通信??梢岳斫獾氖?,上述調(diào)制解調(diào)處理器也可以不集成到處理器580中。
手機還包括給各個部件供電的電源590(比如電池),優(yōu)選的,電源可以通過電源管理系統(tǒng)與處理器580邏輯相連,從而通過電源管理系統(tǒng)實現(xiàn)管理充電、放電、以及功耗管理等功能。
盡管未示出,手機還可以包括攝像頭、藍牙模塊等,在此不再贅述。
在本發(fā)明實施例中,該終端所包括的處理器580還具有以下功能:
獲取待處理的第一圖片數(shù)據(jù),識別出第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù);
獲取與所述人物臉部特征數(shù)據(jù)相應的音頻文件,所述音頻文件為所述人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù);
依據(jù)所述第一圖片數(shù)據(jù)和所述音頻文件合成第二圖片數(shù)據(jù),所述第二圖片數(shù)據(jù)攜帶有所述音頻文件的音頻標識信息。
可選地,處理器580還具有以下功能:
從所述移動終端的系統(tǒng)圖庫中獲取所述待處理的第一圖片數(shù)據(jù);
利用所述移動終端的拍攝功能拍攝所述待處理的第一圖片數(shù)據(jù);
調(diào)起所述移動終端上安裝的相機客戶端,并利用所述相機客戶端的拍攝功能拍攝所述待處理的第一圖片數(shù)據(jù)。
可選地,處理器580還具有以下功能:
從本地選擇與所述人物臉部特征數(shù)據(jù)相應的音頻文件;
從網(wǎng)絡側(cè)下載與所述人物臉部特征數(shù)據(jù)相應的音頻文件;
調(diào)起所述移動終端上安裝的具有錄音功能的相機客戶端,并利用所述相機客戶端的錄音功能執(zhí)行錄音操作,獲得與所述人物臉部特征數(shù)據(jù)相應的音頻文件。
可選地,處理器580還具有以下功能:
調(diào)起所述移動終端上安裝的具有有聲圖片合成功能的相機客戶端;
將所述第一圖片數(shù)據(jù)及所述音頻文件傳輸至所述相機客戶端;
觸發(fā)所述相機客戶端啟動所述有聲圖片合成功能,并利用所述相機客戶端的有聲圖片合成功能對所述第一圖片數(shù)據(jù)及所述第一音音頻文件進行合成,獲得所述第二圖片數(shù)據(jù)。
可選地,處理器580還具有以下功能:
為所述音頻文件生成唯一的音頻標識信息;或者,將所述音頻文件發(fā)送至服務器,由所述服務器為所述音頻文件生成唯一的音頻標識信息,并將所述生成的音頻標識信息發(fā)送至所述移動終端;
將所述音頻標識信息寫入所述第一圖片數(shù)據(jù)的指定數(shù)據(jù)中,得到所述第二圖片數(shù)據(jù)。
可選地,處理器580還具有以下功能:
當所述第一圖片數(shù)據(jù)包括多張時,按照指定規(guī)則合成所述多張第一圖片數(shù)據(jù),獲得符合圖像互換格式GIF的動態(tài)圖片數(shù)據(jù);
將所述音頻標識信息寫入所述動態(tài)圖片數(shù)據(jù)的指定數(shù)據(jù)中。
可選地,所述音頻標識信息包括所述音頻文件的統(tǒng)一資源定位符URL。
可選地,所述指定數(shù)據(jù)包括所述第一圖片數(shù)據(jù)或所述動態(tài)圖片數(shù)據(jù)的格式數(shù)據(jù)。
可選地,處理器580還具有以下功能:
建立所述音頻文件與所述音頻標識信息之間的映射關(guān)系;
將所述音頻文件和/或所述映射關(guān)系發(fā)送至所述服務器進行存儲,以使所述移動終端接收到所述第二圖片數(shù)據(jù)之后解析獲取到所述音頻標識信息,并根據(jù)所述音頻標識信息從所述服務器獲取所述音頻文件進行播放。
可選地,處理器580還具有以下功能:
當識別出多個所述人物臉部特征數(shù)據(jù)時,從所述音頻文件中提取與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件;
將所述各人物臉部特征數(shù)據(jù)分別相應的子音頻文件和所述第一圖片數(shù)據(jù)進行合成,得到多個子圖片數(shù)據(jù);
組合所述多個子圖片數(shù)據(jù),得到所述第二圖片數(shù)據(jù)。
可選地,處理器580還具有以下功能:
確定所述各人物臉部特征數(shù)據(jù)分別對應人物的人物信息,所述人物信息包括各對應人物的頭像、通訊號碼、姓名、昵稱中的至少一項;
獲取預設的人物信息和音頻數(shù)據(jù)之間的對應關(guān)系,并根據(jù)該對應關(guān)系確定各人物信息分別對應的音頻數(shù)據(jù);
根據(jù)所述各人物信息分別對應的音頻數(shù)據(jù),從所述音頻文件中提取與各音頻數(shù)據(jù)相匹配的子音頻文件,作為與所述各人物臉部特征數(shù)據(jù)分別相應的子音頻文件。
可選地,處理器580還具有以下功能:
確定所述人物臉部特征數(shù)據(jù)對應人物的通訊信息,所述通訊信息包括所述通訊號碼、與所述通訊號碼綁定的即時通訊賬號中的至少一項;
根據(jù)所述通訊信息,將所述第二圖片數(shù)據(jù)發(fā)送至所述對應人物。
可選地,處理器580還具有以下功能:
輸出用于提示用戶待發(fā)送的所述第二圖片數(shù)據(jù)為有聲圖片的提示信息。
可選地,處理器580還具有以下功能:
在所述第二圖片數(shù)據(jù)上添加用于標識所述第二圖片數(shù)據(jù)攜帶有音頻文件的標識符;
或者,
語音輸出所述提示信息。
在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
類似地,應當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權(quán)利要求書由此明確地并入該具體實施方式,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。
本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設備中的模塊進行自適應性地改變并且把它們設置在與該實施例不同的一個或多個設備中??梢园褜嵤├械哪K或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的圖片數(shù)據(jù)的處理裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設計出替換實施例。在權(quán)利要求中,不應將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。
至此,本領(lǐng)域技術(shù)人員應認識到,雖然本文已詳盡示出和描述了本發(fā)明的多個示例性實施例,但是,在不脫離本發(fā)明精神和范圍的情況下,仍可根據(jù)本發(fā)明公開的內(nèi)容直接確定或推導出符合本發(fā)明原理的許多其他變型或修改。因此,本發(fā)明的范圍應被理解和認定為覆蓋了所有這些其他變型或修改。
本發(fā)明實施例提供了A1.一種圖片數(shù)據(jù)的處理方法,應用于移動終端,所述方法包括:
獲取待處理的第一圖片數(shù)據(jù),識別出第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù);
獲取與所述人物臉部特征數(shù)據(jù)相應的音頻文件,所述音頻文件為所述人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù);
依據(jù)所述第一圖片數(shù)據(jù)和所述音頻文件合成第二圖片數(shù)據(jù),所述第二圖片數(shù)據(jù)攜帶有所述音頻文件的音頻標識信息。
A2.根據(jù)A1所述的方法,其中,所述獲取待處理的第一圖片數(shù)據(jù),包括以下至少一項:
從所述移動終端的系統(tǒng)圖庫中獲取所述待處理的第一圖片數(shù)據(jù);
利用所述移動終端的拍攝功能拍攝所述待處理的第一圖片數(shù)據(jù);
調(diào)起所述移動終端上安裝的相機客戶端,并利用所述相機客戶端的拍攝功能拍攝所述待處理的第一圖片數(shù)據(jù)。
A3.根據(jù)A1或A2所述的方法,其中,獲取與所述人物臉部特征數(shù)據(jù)相應的音頻文件,包括以下至少一項:
從本地選擇與所述人物臉部特征數(shù)據(jù)相應的音頻文件;
從網(wǎng)絡側(cè)下載與所述人物臉部特征數(shù)據(jù)相應的音頻文件;
調(diào)起所述移動終端上安裝的具有錄音功能的相機客戶端,并利用所述相機客戶端的錄音功能執(zhí)行錄音操作,獲得與所述人物臉部特征數(shù)據(jù)相應的音頻文件。
A4.根據(jù)A1-A3中任一項所述的方法,其中,依據(jù)所述第一圖片數(shù)據(jù)和所述音頻文件合成第二圖片數(shù)據(jù),包括:
調(diào)起所述移動終端上安裝的具有有聲圖片合成功能的相機客戶端;
將所述第一圖片數(shù)據(jù)及所述音頻文件傳輸至所述相機客戶端;
觸發(fā)所述相機客戶端啟動所述有聲圖片合成功能,并利用所述相機客戶端的有聲圖片合成功能對所述第一圖片數(shù)據(jù)及所述第一音音頻文件進行合成,獲得所述第二圖片數(shù)據(jù)。
A5.根據(jù)A1-A4中任一項所述的方法,其中,依據(jù)所述第一圖片數(shù)據(jù)和所述音頻文件合成第二圖片數(shù)據(jù),包括:
為所述音頻文件生成唯一的音頻標識信息;或者,將所述音頻文件發(fā)送至服務器,由所述服務器為所述音頻文件生成唯一的音頻標識信息,并將所述生成的音頻標識信息發(fā)送至所述移動終端;
將所述音頻標識信息寫入所述第一圖片數(shù)據(jù)的指定數(shù)據(jù)中,得到所述第二圖片數(shù)據(jù)。
A6.根據(jù)A5所述的方法,其中,當所述第一圖片數(shù)據(jù)包括多張時,將所述音頻標識信息寫入所述第一圖片數(shù)據(jù)的指定數(shù)據(jù)中,包括:
按照指定規(guī)則合成所述多張第一圖片數(shù)據(jù),獲得符合圖像互換格式GIF的動態(tài)圖片數(shù)據(jù);
將所述音頻標識信息寫入所述動態(tài)圖片數(shù)據(jù)的指定數(shù)據(jù)中。
A7.根據(jù)A5或A6所述的方法,其中,所述音頻標識信息包括所述音頻文件的統(tǒng)一資源定位符URL。
A8.根據(jù)A5-A7中任一項所述的方法,其中,所述指定數(shù)據(jù)包括所述第一圖片數(shù)據(jù)或所述動態(tài)圖片數(shù)據(jù)的格式數(shù)據(jù)。
A9.根據(jù)A5-A8中任一項所述的方法,其中,所述方法還包括:
建立所述音頻文件與所述音頻標識信息之間的映射關(guān)系;
將所述音頻文件和/或所述映射關(guān)系發(fā)送至所述服務器進行存儲,以使所述移動終端接收到所述第二圖片數(shù)據(jù)之后解析獲取到所述音頻標識信息,并根據(jù)所述音頻標識信息從所述服務器獲取所述音頻文件進行播放。
A10.根據(jù)A1-A9中任一項所述的方法,其中,當識別出多個所述人物臉部特征數(shù)據(jù)時,依據(jù)所述第一圖片數(shù)據(jù)和所述音頻文件合成第二圖片數(shù)據(jù),包括:
從所述音頻文件中提取與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件;
將所述各人物臉部特征數(shù)據(jù)分別相應的子音頻文件和所述第一圖片數(shù)據(jù)進行合成,得到多個子圖片數(shù)據(jù);
組合所述多個子圖片數(shù)據(jù),得到所述第二圖片數(shù)據(jù)。
A11.根據(jù)A10所述的方法,其中,從所述音頻文件中提取與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件,包括:
確定所述各人物臉部特征數(shù)據(jù)分別對應人物的人物信息,所述人物信息包括各對應人物的頭像、通訊號碼、姓名、昵稱中的至少一項;
獲取預設的人物信息和音頻數(shù)據(jù)之間的對應關(guān)系,并根據(jù)該對應關(guān)系確定各人物信息分別對應的音頻數(shù)據(jù);
根據(jù)所述各人物信息分別對應的音頻數(shù)據(jù),從所述音頻文件中提取與各音頻數(shù)據(jù)相匹配的子音頻文件,作為與所述各人物臉部特征數(shù)據(jù)分別相應的子音頻文件。
A12.根據(jù)A1-A12中任一項所述的方法,其中,所述方法還包括:
確定所述人物臉部特征數(shù)據(jù)對應人物的通訊信息,所述通訊信息包括所述通訊號碼、與所述通訊號碼綁定的即時通訊賬號中的至少一項;
根據(jù)所述通訊信息,將所述第二圖片數(shù)據(jù)發(fā)送至所述對應人物。
A13.根據(jù)A12所述的方法,其中,所述方法還包括:
輸出用于提示用戶待發(fā)送的所述第二圖片數(shù)據(jù)為有聲圖片的提示信息。
A14.根據(jù)A13所述的方法,其中,所述輸出用于提示用戶待發(fā)送的第二圖片數(shù)據(jù)為有聲圖片的提示信息,包括:
在所述第二圖片數(shù)據(jù)上添加用于標識所述第二圖片數(shù)據(jù)攜帶有音頻文件的標識符;
或者,
語音輸出所述提示信息。
本發(fā)明實施例還提供了B15.一種圖片數(shù)據(jù)的處理裝置,設置于移動終端,所述裝置包括:
第一獲取模塊,適于獲取待處理的第一圖片數(shù)據(jù),識別出第一圖片數(shù)據(jù)中的人物臉部特征數(shù)據(jù);
第二獲取模塊,適于獲取與所述人物臉部特征數(shù)據(jù)相應的音頻文件,所述音頻文件為所述人物臉部特征數(shù)據(jù)對應人物的語音數(shù)據(jù);
合成模塊,適于依據(jù)所述第一圖片數(shù)據(jù)和所述音頻文件合成第二圖片數(shù)據(jù),所述第二圖片數(shù)據(jù)攜帶有所述音頻文件的音頻標識信息。
B16.根據(jù)B15所述的裝置,其中,所述第一獲取模塊還適于以下至少一項:
從所述移動終端的系統(tǒng)圖庫中獲取所述待處理的第一圖片數(shù)據(jù);
利用所述移動終端的拍攝功能拍攝所述待處理的第一圖片數(shù)據(jù);
調(diào)起所述移動終端上安裝的相機客戶端,并利用所述相機客戶端的拍攝功能拍攝所述待處理的第一圖片數(shù)據(jù)。
B17.根據(jù)B15或B16所述的裝置,其中,所述第二獲取模塊還適于以下至少一項:
從本地選擇與所述人物臉部特征數(shù)據(jù)相應的音頻文件;
從網(wǎng)絡側(cè)下載與所述人物臉部特征數(shù)據(jù)相應的音頻文件;
調(diào)起所述移動終端上安裝的具有錄音功能的相機客戶端,并利用所述相機客戶端的錄音功能執(zhí)行錄音操作,獲得與所述人物臉部特征數(shù)據(jù)相應的音頻文件。
B18.根據(jù)B15-B17中任一項所述的裝置,其中,所述合成模塊還適于:
調(diào)起所述移動終端上安裝的具有有聲圖片合成功能的相機客戶端;
將所述第一圖片數(shù)據(jù)及所述音頻文件傳輸至所述相機客戶端;
觸發(fā)所述相機客戶端啟動所述有聲圖片合成功能,并利用所述相機客戶端的有聲圖片合成功能對所述第一圖片數(shù)據(jù)及所述第一音音頻文件進行合成,獲得所述第二圖片數(shù)據(jù)。
B19.根據(jù)B15-B18中任一項所述的裝置,其中,所述合成模塊還適于:
為所述音頻文件生成唯一的音頻標識信息;或者,將所述音頻文件發(fā)送至服務器,由所述服務器為所述音頻文件生成唯一的音頻標識信息,并將所述生成的音頻標識信息發(fā)送至所述移動終端;
將所述音頻標識信息寫入所述第一圖片數(shù)據(jù)的指定數(shù)據(jù)中,得到所述第二圖片數(shù)據(jù)。
B20.根據(jù)B19所述的裝置,其中,所述合成模塊還適于:
當所述第一圖片數(shù)據(jù)包括多張時,按照指定規(guī)則合成所述多張第一圖片數(shù)據(jù),獲得符合圖像互換格式GIF的動態(tài)圖片數(shù)據(jù);
將所述音頻標識信息寫入所述動態(tài)圖片數(shù)據(jù)的指定數(shù)據(jù)中。
B21.根據(jù)B19或B20所述的裝置,其中,所述音頻標識信息包括所述音頻文件的統(tǒng)一資源定位符URL。
B22.根據(jù)B19-B21中任一項所述的裝置,其中,所述指定數(shù)據(jù)包括所述第一圖片數(shù)據(jù)或所述動態(tài)圖片數(shù)據(jù)的格式數(shù)據(jù)。
B23.根據(jù)B19-B22中任一項所述的裝置,其中,所述裝置還包括:
建立模塊,適于建立所述音頻文件與所述音頻標識信息之間的映射關(guān)系;
第一發(fā)送模塊,適于將所述音頻文件和/或所述映射關(guān)系發(fā)送至所述服務器進行存儲,以使所述移動終端接收到所述第二圖片數(shù)據(jù)之后解析獲取到所述音頻標識信息,并根據(jù)所述音頻標識信息從所述服務器獲取所述音頻文件進行播放。
B24.根據(jù)B15-B23中任一項所述的裝置,其中,所述合成模塊還適于:
當識別出多個所述人物臉部特征數(shù)據(jù)時,從所述音頻文件中提取與各人物臉部特征數(shù)據(jù)分別相應的子音頻文件;
將所述各人物臉部特征數(shù)據(jù)分別相應的子音頻文件和所述第一圖片數(shù)據(jù)進行合成,得到多個子圖片數(shù)據(jù);
組合所述多個子圖片數(shù)據(jù),得到所述第二圖片數(shù)據(jù)。
B25.根據(jù)B24所述的裝置,其中,所述合成模塊還適于:
確定所述各人物臉部特征數(shù)據(jù)分別對應人物的人物信息,所述人物信息包括各對應人物的頭像、通訊號碼、姓名、昵稱中的至少一項;
獲取預設的人物信息和音頻數(shù)據(jù)之間的對應關(guān)系,并根據(jù)該對應關(guān)系確定各人物信息分別對應的音頻數(shù)據(jù);
根據(jù)所述各人物信息分別對應的音頻數(shù)據(jù),從所述音頻文件中提取與各音頻數(shù)據(jù)相匹配的子音頻文件,作為與所述各人物臉部特征數(shù)據(jù)分別相應的子音頻文件。
B26.根據(jù)B15-B25中任一項所述的裝置,其中,所述裝置還包括:
確定模塊,適于確定所述人物臉部特征數(shù)據(jù)對應人物的通訊信息,所述通訊信息包括所述通訊號碼、與所述通訊號碼綁定的即時通訊賬號中的至少一項;
第二發(fā)送模塊,適于根據(jù)所述通訊信息,將所述第二圖片數(shù)據(jù)發(fā)送至所述對應人物。
B27.根據(jù)B26所述的裝置,其中,所述裝置還包括:
輸出模塊,適于輸出用于提示用戶待發(fā)送的所述第二圖片數(shù)據(jù)為有聲圖片的提示信息。
B28.根據(jù)B27所述的裝置,其中,所述輸出模塊還適于:
在所述第二圖片數(shù)據(jù)上添加用于標識所述第二圖片數(shù)據(jù)攜帶有音頻文件的標識符;
或者,
語音輸出所述提示信息。
本發(fā)明實施例還提供了C29.一種移動終端,包括處理器和存儲器:
所述存儲器用于存儲執(zhí)行A1至A14任一項方法的程序,
所述處理器被配置為用于執(zhí)行所述存儲器中存儲的程序。