1.一種多媒體數(shù)據(jù)處理裝置,其特征在于,所述裝置包括:
第一獲取模塊,用于獲取預(yù)先采集的語音數(shù)據(jù)和照片,并提取所述照片的拍攝時間;
匹配模塊,用于將獲取到的語音數(shù)據(jù)與預(yù)先采集的目標人物的基準語音數(shù)據(jù)進行匹配,獲取與所述基準語音數(shù)據(jù)相匹配的第一語音數(shù)據(jù);
第一轉(zhuǎn)換模塊,用于根據(jù)所述拍攝時間將所述第一語音數(shù)據(jù)轉(zhuǎn)換為多個對應(yīng)子文本數(shù)據(jù);
第一插入模塊,用于根據(jù)所述拍攝時間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片。
2.根據(jù)權(quán)利要求1所述的多媒體數(shù)據(jù)處理裝置,其特征在于,所述第一轉(zhuǎn)換模塊包括:
劃分模塊,用于以所述拍攝時間作為分割點,將所述第一語音數(shù)據(jù)劃分為多個第一子語音數(shù)據(jù);
第二轉(zhuǎn)換模塊,用于將所述第一子語音數(shù)據(jù)逐個轉(zhuǎn)換為對應(yīng)的子文本數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的多媒體數(shù)據(jù)處理裝置,其特征在于,所述第一插入模塊包括:
第二插入模塊,用于在所述預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù);
第三插入模塊,用于在兩個相鄰子文本數(shù)據(jù)之間插入所述照片,使得所述兩個子文本數(shù)據(jù)的分割點對應(yīng)的拍攝時間與所述照片的拍攝時間相對應(yīng)。
4.根據(jù)權(quán)利要求1所述的多媒體數(shù)據(jù)處理裝置,其特征在于,所述裝置還包括:
第二獲取模塊,用于獲取在采集語音數(shù)據(jù)和用戶拍攝的照片的過程中采集的地理位置信息,其中,在采集語音數(shù)據(jù)和用戶拍攝的照片的過程中,每隔預(yù)設(shè)的時間間隔采集用戶所在區(qū)域的地理位置信息;
第四插入模塊,用于按照所述地理位置信息的采集時間與所述照片的拍攝時間以及所述多個子文本數(shù)據(jù)對應(yīng)的時間的先后順序,將所述地理位置信息插入到所述多媒體文檔中。
5.根據(jù)權(quán)利要求1所述的多媒體數(shù)據(jù)處理裝置,其特征在于,所述第一插入模塊還用于:
在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片之后,創(chuàng)建以當前日期命名的文件夾,將所述多媒體文檔以及采集到的語音數(shù)據(jù)與用戶拍攝的照片分別保存到所述文件夾中。
6.一種多媒體數(shù)據(jù)處理方法,其特征在于,所述方法包括:
獲取預(yù)先采集的語音數(shù)據(jù)和照片,并提取所述照片的拍攝時間;
將獲取到的語音數(shù)據(jù)與預(yù)先采集的目標人物的基準語音數(shù)據(jù)進行匹配,獲取與所述基準語音數(shù)據(jù)相匹配的第一語音數(shù)據(jù);
根據(jù)所述拍攝時間將所述第一語音數(shù)據(jù)轉(zhuǎn)換為多個對應(yīng)子文本數(shù)據(jù);
根據(jù)所述拍攝時間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片。
7.根據(jù)權(quán)利要求6所述的多媒體數(shù)據(jù)處理方法,其特征在于,根據(jù)所述拍攝時間將所述第一語音數(shù)據(jù)轉(zhuǎn)換為多個對應(yīng)子文本數(shù)據(jù)的步驟包括:
以所述拍攝時間作為分割點,將所述第一語音數(shù)據(jù)劃分為多個第一子語音數(shù)據(jù);
將所述第一子語音數(shù)據(jù)逐個轉(zhuǎn)換為對應(yīng)的子文本數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的多媒體數(shù)據(jù)處理方法,其特征在于,根據(jù)所述拍攝時間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片的步驟包括:
在所述預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù);
在兩個相鄰子文本數(shù)據(jù)之間插入所述照片,使得所述兩個子文本數(shù)據(jù)的分割點對應(yīng)的拍攝時間與所述照片的拍攝時間相對應(yīng)。
9.根據(jù)權(quán)利要求6所述的多媒體數(shù)據(jù)處理方法,其特征在于,根據(jù)所述拍攝時間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片的步驟之后還包括:
獲取在采集語音數(shù)據(jù)和用戶拍攝的照片的過程中采集的地理位置信息,其中,在采集語音數(shù)據(jù)和用戶拍攝的照片的過程中,每隔預(yù)設(shè)的時間間隔采集用戶所在區(qū)域的地理位置信息;
按照所述地理位置信息的采集時間與所述照片的拍攝時間以及所述多個子文本數(shù)據(jù)對應(yīng)的時間的先后順序,將所述地理位置信息插入到所述多媒體文檔中。
10.根據(jù)權(quán)利要求6所述的多媒體數(shù)據(jù)處理方法,其特征在于,根據(jù)所述拍攝時間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片之后還包括:
創(chuàng)建以當前日期命名的文件夾,將所述多媒體文檔以及采集到的語音數(shù)據(jù)與用戶拍攝的照片分別保存到所述文件夾中。