本發(fā)明涉及多媒體技術(shù)領(lǐng)域,尤其涉及一種多媒體數(shù)據(jù)處理裝置及方法。
背景技術(shù):
目前,隨著生活質(zhì)量的提升,旅游已經(jīng)成為了人們生活中必不可少的一部分。繁忙的工作過后,旅游可以放松身心,開闊眼界,洗滌心境,了解各地的風(fēng)俗習(xí)慣。在快樂的旅行結(jié)束后,大多數(shù)人都想把旅途中美好的回憶記錄下來(lái),例如寫一篇游記,分享給自己的親朋好友。
但是,完成一篇完整的游記往往是非常麻煩的。尤其面對(duì)長(zhǎng)時(shí)間的旅途,人們要把行進(jìn)路線的每個(gè)細(xì)節(jié)記錄下來(lái)幾乎是不可能的,難免會(huì)有遺漏。而且,在分類照片時(shí),面對(duì)幾百甚至上千張照片,往往無(wú)從下手,需要花費(fèi)大量時(shí)間分類。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的主要目的在于提出一種多媒體數(shù)據(jù)處理裝置及方法,旨在解決現(xiàn)有技術(shù)中無(wú)法自動(dòng)處理多媒體數(shù)據(jù),需要用戶手動(dòng)去處理,費(fèi)時(shí)費(fèi)力的技術(shù)問題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種多媒體數(shù)據(jù)處理裝置,包括:
第一獲取模塊,用于獲取預(yù)先采集的語(yǔ)音數(shù)據(jù)和照片,并提取所述照片的拍攝時(shí)間;
匹配模塊,用于將獲取到的語(yǔ)音數(shù)據(jù)與預(yù)先采集的目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行匹配,獲取與所述基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù);
第一轉(zhuǎn)換模塊,用于根據(jù)所述拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)對(duì)應(yīng)子文本數(shù)據(jù);
第一插入模塊,用于根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片。
可選地,所述第一轉(zhuǎn)換模塊包括:
劃分模塊,用于以所述拍攝時(shí)間作為分割點(diǎn),將所述第一語(yǔ)音數(shù)據(jù)劃分為多個(gè)第一子語(yǔ)音數(shù)據(jù);
第二轉(zhuǎn)換模塊,用于將所述第一子語(yǔ)音數(shù)據(jù)逐個(gè)轉(zhuǎn)換為對(duì)應(yīng)的子文本數(shù)據(jù)。
可選地,所述第一插入模塊包括:
第二插入模塊,用于在所述預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù);
第三插入模塊,用于在兩個(gè)相鄰子文本數(shù)據(jù)之間插入所述照片,使得所述兩個(gè)子文本數(shù)據(jù)的分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間與所述照片的拍攝時(shí)間相對(duì)應(yīng)。
可選地,所述裝置還包括:
第二獲取模塊,用于獲取在采集語(yǔ)音數(shù)據(jù)和用戶拍攝的照片的過程中采集的地理位置信息,其中,在采集語(yǔ)音數(shù)據(jù)和用戶拍攝的照片的過程中,每隔預(yù)設(shè)的時(shí)間間隔采集用戶所在區(qū)域的地理位置信息;
第四插入模塊,用于按照所述地理位置信息的采集時(shí)間與所述照片的拍攝時(shí)間以及所述多個(gè)子文本數(shù)據(jù)對(duì)應(yīng)的時(shí)間的先后順序,將所述地理位置信息插入到所述多媒體文檔中。
可選地,所述第一插入模塊還用于:
在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片之后,創(chuàng)建以當(dāng)前日期命名的文件夾,將所述多媒體文檔以及采集到的語(yǔ)音數(shù)據(jù)與用戶拍攝的照片分別保存到所述文件夾中。
另外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種多媒體數(shù)據(jù)處理方法,所述方法包括:
獲取預(yù)先采集的語(yǔ)音數(shù)據(jù)和照片,并提取所述照片的拍攝時(shí)間;
將獲取到的語(yǔ)音數(shù)據(jù)與預(yù)先采集的目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行匹配,獲取與所述基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù);
根據(jù)所述拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)對(duì)應(yīng)子文本數(shù)據(jù);
根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片。
可選地,根據(jù)所述拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)對(duì)應(yīng)子文本數(shù)據(jù)的步驟包括:
以所述拍攝時(shí)間作為分割點(diǎn),將所述第一語(yǔ)音數(shù)據(jù)劃分為多個(gè)第一子語(yǔ)音數(shù)據(jù);
將所述第一子語(yǔ)音數(shù)據(jù)逐個(gè)轉(zhuǎn)換為對(duì)應(yīng)的子文本數(shù)據(jù)。
可選地,根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片的步驟包括:
在所述預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù);
在兩個(gè)相鄰子文本數(shù)據(jù)之間插入所述照片,使得所述兩個(gè)子文本數(shù)據(jù)的分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間與所述照片的拍攝時(shí)間相對(duì)應(yīng)。
可選地,根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片的步驟之后還包括:
獲取在采集語(yǔ)音數(shù)據(jù)和用戶拍攝的照片的過程中采集的地理位置信息,其中,在采集語(yǔ)音數(shù)據(jù)和用戶拍攝的照片的過程中,每隔預(yù)設(shè)的時(shí)間間隔采集用戶所在區(qū)域的地理位置信息;
按照所述地理位置信息的采集時(shí)間與所述照片的拍攝時(shí)間以及所述多個(gè)子文本數(shù)據(jù)對(duì)應(yīng)的時(shí)間的先后順序,將所述地理位置信息插入到所述多媒體文檔中。
可選地,根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片之后還包括:
創(chuàng)建以當(dāng)前日期命名的文件夾,將所述多媒體文檔以及采集到的語(yǔ)音數(shù)據(jù)與用戶拍攝的照片分別保存到所述文件夾中。
本發(fā)明所提供的一種多媒體數(shù)據(jù)處理裝置,包括:第一獲取模塊,用于獲取預(yù)先采集的語(yǔ)音數(shù)據(jù)和照片,并提取所述照片的拍攝時(shí)間;匹配模塊,用于將獲取到的語(yǔ)音數(shù)據(jù)與預(yù)先采集的目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行匹配,獲取與所述基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù);第一轉(zhuǎn)換模塊,用于根據(jù)所述拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)對(duì)應(yīng)子文本數(shù)據(jù);第一插入模塊,用于根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片。本發(fā)明還提供了一種多媒體數(shù)據(jù)處理方法。本發(fā)明通過采集用戶的語(yǔ)音數(shù)據(jù)和拍攝的照片,并將采集的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)后,將文本數(shù)據(jù)與拍攝的照片按照時(shí)間順序自動(dòng)添加到多媒體文檔中,不需要用戶手動(dòng)處理,解決了現(xiàn)有技術(shù)中無(wú)法自動(dòng)處理多媒體數(shù)據(jù)的技術(shù)問題。
附圖說明
圖1為實(shí)現(xiàn)本發(fā)明各個(gè)實(shí)施例一個(gè)可選的移動(dòng)終端的硬件結(jié)構(gòu)示意圖;
圖2為圖1中移動(dòng)終端的無(wú)線通信裝置示意圖;
圖3為本發(fā)明多媒體數(shù)據(jù)處理裝置第一實(shí)施例的模塊示意圖;
圖4為本發(fā)明圖3所示多媒體數(shù)據(jù)處理裝置中第一轉(zhuǎn)換模塊30的細(xì)化模塊示意圖;
圖5為本發(fā)明圖3所示多媒體數(shù)據(jù)處理裝置中第一插入模塊40的細(xì)化模塊示意圖;
圖6為本發(fā)明中在相鄰兩個(gè)子文本數(shù)據(jù)之間插入照片的場(chǎng)景示意圖;
圖7為本發(fā)明中在相鄰兩個(gè)子文本數(shù)據(jù)之間插入照片的另一場(chǎng)景示意圖;
圖8為本發(fā)明多媒體數(shù)據(jù)處理裝置第二實(shí)施例的模塊示意圖;
圖9為本發(fā)明中將采集到的地理位置信息插入到多媒體文檔中的場(chǎng)景示意圖;
圖10為本發(fā)明多媒體數(shù)據(jù)處理方法第一實(shí)施例的流程示意圖;
圖11為本發(fā)明圖10所示多媒體數(shù)據(jù)處理方法中步驟S30的細(xì)化步驟流程示意圖;
圖12為本發(fā)明圖10所示多媒體數(shù)據(jù)處理方法中步驟S40的細(xì)化步驟流程示意圖;
圖13為本發(fā)明多媒體數(shù)據(jù)處理方法第二實(shí)施例的流程示意圖。
本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明。
具體實(shí)施方式
應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
現(xiàn)在將參考附圖描述實(shí)現(xiàn)本發(fā)明各個(gè)實(shí)施例的移動(dòng)終端。在后續(xù)的描述中,使用用于表示元件的諸如“模塊”、“部件”或“單元”的后綴僅為了有利于本發(fā)明的說明,其本身并沒有特定的意義。因此,“模塊”與“部件”可以混合地使用。
移動(dòng)終端可以以各種形式來(lái)實(shí)施。例如,本發(fā)明中描述的終端可以包括諸如移動(dòng)電話、智能電話、筆記本電腦、數(shù)字廣播接收器、PDA(個(gè)人數(shù)字助理)、PAD(平板電腦)、PMP(便攜式多媒體播放器)、導(dǎo)航裝置等等的移動(dòng)終端以及諸如數(shù)字TV、臺(tái)式計(jì)算機(jī)等等的固定終端。下面,假設(shè)終端是移動(dòng)終端。然而,本領(lǐng)域技術(shù)人員將理解的是,除了特別用于移動(dòng)目的的元件之外,根據(jù)本發(fā)明的實(shí)施方式的構(gòu)造也能夠應(yīng)用于固定類型的終端。
圖1為實(shí)現(xiàn)本發(fā)明各個(gè)實(shí)施例一個(gè)可選的移動(dòng)終端的硬件結(jié)構(gòu)示意圖。
移動(dòng)終端100可以包括無(wú)線通信單元110、A/V(音頻/視頻)輸入單元120、用戶輸入單元130、感測(cè)單元140、輸出單元150、多媒體數(shù)據(jù)處理裝置400、存儲(chǔ)器160、控制器180和電源單元190等等。圖1示出了具有各種組件的移動(dòng)終端,但是應(yīng)理解的是,并不要求實(shí)施所有示出的組件。可以替代地實(shí)施更多或更少的組件。將在下面詳細(xì)描述移動(dòng)終端的元件。
無(wú)線通信單元110通常包括一個(gè)或多個(gè)組件,其允許移動(dòng)終端100與無(wú)線通信裝置或網(wǎng)絡(luò)之間的無(wú)線電通信。例如,無(wú)線通信單元可以包括廣播接收模塊、移動(dòng)通信模塊、無(wú)線互聯(lián)網(wǎng)模塊、短程通信模塊和位置信息模塊中的至少一個(gè)。
A/V輸入單元120用于接收音頻或視頻信號(hào)。A/V輸入單元120可以包括相機(jī)121和麥克風(fēng)122,相機(jī)121對(duì)在視頻捕獲模式或圖像捕獲模式中由圖像捕獲裝置獲得的靜態(tài)圖片或視頻的圖像數(shù)據(jù)進(jìn)行處理。處理后的圖像幀可以顯示在顯示單元151上。經(jīng)相機(jī)121處理后的圖像幀可以存儲(chǔ)在存儲(chǔ)器160(或其它存儲(chǔ)介質(zhì))中或者經(jīng)由無(wú)線通信單元110進(jìn)行發(fā)送,可以根據(jù)移動(dòng)終端的構(gòu)造提供兩個(gè)或更多相機(jī)121。麥克風(fēng)122可以在電話通話模式、記錄模式、語(yǔ)音識(shí)別模式等等運(yùn)行模式中經(jīng)由麥克風(fēng)接收聲音(音頻數(shù)據(jù)),并且能夠?qū)⑦@樣的聲音處理為音頻數(shù)據(jù)。麥克風(fēng)122可以實(shí)施各種類型的噪聲消除(或抑制)算法以消除(或抑制)在接收和發(fā)送音頻信號(hào)的過程中產(chǎn)生的噪聲或者干擾。
用戶輸入單元130可以根據(jù)用戶輸入的命令生成鍵輸入數(shù)據(jù)以控制移動(dòng)終端的各種操作。用戶輸入單元130允許用戶輸入各種類型的信息,并且可以包括鍵盤、鍋?zhàn)衅?、觸摸板(例如,檢測(cè)由于被接觸而導(dǎo)致的電阻、壓力值、電容等等的變化的觸敏組件)、滾輪、搖桿等等。特別地,當(dāng)觸摸板以層的形式疊加在顯示單元151上時(shí),可以形成觸摸屏。
感測(cè)單元140檢測(cè)移動(dòng)終端100的當(dāng)前狀態(tài),(例如,移動(dòng)終端100的打開或關(guān)閉狀態(tài))、移動(dòng)終端100的位置、用戶對(duì)于移動(dòng)終端100的接觸(即,觸摸輸入)的有無(wú)、移動(dòng)終端100的取向、移動(dòng)終端100的加速或?qū)⑺僖苿?dòng)和方向等等,并且生成用于控制移動(dòng)終端100的操作的命令或信號(hào)。另外,感測(cè)單元140能夠檢測(cè)電源單元190是否提供電力。
顯示單元151可以顯示在移動(dòng)終端100中處理的信息。例如,當(dāng)移動(dòng)終端100處于電話通話模式時(shí),顯示單元151可以顯示與通話或其它通信(例如,文本消息收發(fā)、多媒體文件下載等等)相關(guān)的用戶界面(UI)或圖形用戶界面(GUI)。當(dāng)移動(dòng)終端100處于視頻通話模式或者圖像捕獲模式時(shí),顯示單元151可以顯示捕獲的圖像和/或接收的圖像、示出視頻或圖像以及相關(guān)功能的UI或GUI等等。
同時(shí),當(dāng)顯示單元151和觸摸板以層的形式彼此疊加以形成觸摸屏?xí)r,顯示單元151可以用作輸入裝置和輸出裝置。顯示單元151可以包括液晶顯示器(LCD)、薄膜晶體管LCD(TFT-LCD)、有機(jī)發(fā)光二極管(OLED)顯示器、柔性顯示器、三維(3D)顯示器等等中的至少一種。這些顯示器中的一些可以被構(gòu)造為透明狀以允許用戶從外部觀看,這可以稱為透明顯示器,典型的透明顯示器可以例如為TOLED(透明有機(jī)發(fā)光二極管)顯示器等等。根據(jù)特定想要的實(shí)施方式,移動(dòng)終端100可以包括兩個(gè)或更多顯示單元(或其它顯示裝置),例如,移動(dòng)終端可以包括外部顯示單元(未示出)和內(nèi)部顯示單元(未示出)。觸摸屏可用于檢測(cè)觸摸輸入壓力值以及觸摸輸入位置和觸摸輸入面積。
音頻輸出模塊152可以在移動(dòng)終端處于呼叫信號(hào)接收模式、通話模式、記錄模式、語(yǔ)音識(shí)別模式、廣播接收模式等等模式下時(shí),將無(wú)線通信單元110接收的或者在存儲(chǔ)器160中存儲(chǔ)的音頻數(shù)據(jù)轉(zhuǎn)換音頻信號(hào)并且輸出為聲音。而且,音頻輸出模塊152可以提供與移動(dòng)終端100執(zhí)行的特定功能相關(guān)的音頻輸出(例如,呼叫信號(hào)接收聲音、消息接收聲音等等)。音頻輸出模塊152可以包括拾音器、蜂鳴器等等。
存儲(chǔ)器160可以存儲(chǔ)由控制器180執(zhí)行的處理和控制操作的軟件程序等等,或者可以暫時(shí)地存儲(chǔ)己經(jīng)輸出或?qū)⒁敵龅臄?shù)據(jù)(例如,電話簿、消息、靜態(tài)圖像、視頻等等)。而且,存儲(chǔ)器160可以存儲(chǔ)關(guān)于當(dāng)觸摸施加到觸摸屏?xí)r輸出的各種方式的振動(dòng)和音頻信號(hào)的數(shù)據(jù)。
存儲(chǔ)器160可以包括至少一種類型的存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)包括閃存、硬盤、多媒體卡、卡型存儲(chǔ)器(例如,SD或DX存儲(chǔ)器等等)、隨機(jī)訪問存儲(chǔ)器(RAM)、靜態(tài)隨機(jī)訪問存儲(chǔ)器(SRAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、可編程只讀存儲(chǔ)器(PROM)、磁性存儲(chǔ)器、磁盤、光盤等等。而且,移動(dòng)終端100可以與通過網(wǎng)絡(luò)連接執(zhí)行存儲(chǔ)器160的存儲(chǔ)功能的網(wǎng)絡(luò)存儲(chǔ)裝置協(xié)作。
控制器180通常控制移動(dòng)終端的總體操作。例如,控制器180執(zhí)行與語(yǔ)音通話、數(shù)據(jù)通信、視頻通話等等相關(guān)的控制和處理。另外,控制器180可以包括用于再現(xiàn)(或回放)多媒體數(shù)據(jù)的多媒體模塊181,多媒體模塊181可以構(gòu)造在控制器180內(nèi),或者可以構(gòu)造為與控制器180分離??刂破?80可以執(zhí)行模式識(shí)別處理,以將在觸摸屏上執(zhí)行的手寫輸入或者圖片繪制輸入識(shí)別為字符或圖像。
電源單元190在控制器180的控制下接收外部電力或內(nèi)部電力并且提供操作各元件和組件所需的適當(dāng)?shù)碾娏Α?/p>
這里描述的各種實(shí)施方式可以以使用例如計(jì)算機(jī)軟件、硬件或其任何組合的計(jì)算機(jī)可讀介質(zhì)來(lái)實(shí)施。對(duì)于硬件實(shí)施,這里描述的實(shí)施方式可以通過使用特定用途集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理裝置(DSPD)、可編程邏輯裝置(PLD)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、被設(shè)計(jì)為執(zhí)行這里描述的功能的電子單元中的至少一種來(lái)實(shí)施,在一些情況下,這樣的實(shí)施方式可以在控制器180中實(shí)施。對(duì)于軟件實(shí)施,諸如過程或功能的實(shí)施方式可以與允許執(zhí)行至少一種功能或操作的單獨(dú)的軟件模塊來(lái)實(shí)施。軟件代碼可以由以任何適當(dāng)?shù)木幊陶Z(yǔ)言編寫的軟件應(yīng)用程序(或程序)來(lái)實(shí)施,軟件代碼可以存儲(chǔ)在存儲(chǔ)器160中并且由控制器180執(zhí)行。
如圖1中所示的移動(dòng)終端100可以被構(gòu)造為利用經(jīng)由幀或分組發(fā)送數(shù)據(jù)的諸如有線和無(wú)線通信裝置以及基于衛(wèi)星的通信裝置來(lái)操作。
現(xiàn)在將參考圖2描述其中根據(jù)本發(fā)明的移動(dòng)終端能夠操作的通信裝置。
這樣的通信裝置可以使用不同的空中接口和/或物理層。例如,由通信裝置使用的空中接口包括例如頻分多址(FDMA)、時(shí)分多址(TDMA)、碼分多址(CDMA)和通用移動(dòng)通信裝置(UMTS)(特別地,長(zhǎng)期演進(jìn)(LTE))、全球移動(dòng)通信裝置(GSM)等等。作為非限制性示例,下面的描述涉及CDMA通信裝置,但是這樣的教導(dǎo)同樣適用于其它類型的裝置。
參考圖2,CDMA無(wú)線通信裝置可以包括多個(gè)移動(dòng)終端100、多個(gè)基站(BS)270、基站控制器(BSC)275和移動(dòng)交換中心(MSC)280。MSC280被構(gòu)造為與公共電話交換網(wǎng)絡(luò)(PSTN)290形成接口。MSC280還被構(gòu)造為與可以經(jīng)由回程線路耦接到BS270的BSC275形成接口。回程線路可以根據(jù)若干己知的接口中的任一種來(lái)構(gòu)造,所述接口包括例如E1/T1、ATM,IP、PPP、幀中繼、HDSL、ADSL或xDSL。將理解的是,如圖2中所示的裝置可以包括多個(gè)BSC275。
每個(gè)BS270可以服務(wù)一個(gè)或多個(gè)分區(qū)(或區(qū)域),由多向天線或指向特定方向的天線覆蓋的每個(gè)分區(qū)放射狀地遠(yuǎn)離BS270?;蛘撸總€(gè)分區(qū)可以由用于分集接收的兩個(gè)或更多天線覆蓋。每個(gè)BS270可以被構(gòu)造為支持多個(gè)頻率分配,并且每個(gè)頻率分配具有特定頻譜(例如,1.25MHz,5MHz等等)。
分區(qū)與頻率分配的交叉可以被稱為CDMA信道。BS270也可以被稱為基站收發(fā)器子裝置(BTS)或者其它等效術(shù)語(yǔ)。在這樣的情況下,術(shù)語(yǔ)"基站"可以用于籠統(tǒng)地表示單個(gè)BSC275和至少一個(gè)BS270?;疽部梢员环Q為"蜂窩站"?;蛘撸囟˙S270的各分區(qū)可以被稱為多個(gè)蜂窩站。
如圖2中所示,廣播發(fā)射器(BT)295將廣播信號(hào)發(fā)送給在裝置內(nèi)操作的移動(dòng)終端100。在圖2中,示出了幾個(gè)全球定位裝置(GPS)衛(wèi)星300。衛(wèi)星300幫助定位多個(gè)移動(dòng)終端100中的至少一個(gè)。
在圖2中,描繪了多個(gè)衛(wèi)星300,但是可以理解的是,可以利用任何數(shù)目的衛(wèi)星獲得有用的定位信息。作為無(wú)線通信裝置的一個(gè)典型操作,BS270接收來(lái)自各種移動(dòng)終端100的反向鏈路信號(hào)。移動(dòng)終端100通常參與通話、消息收發(fā)和其它類型的通信。特定基站270接收的每個(gè)反向鏈路信號(hào)被在特定BS270內(nèi)進(jìn)行處理。獲得的數(shù)據(jù)被轉(zhuǎn)發(fā)給相關(guān)的BSC275。BSC提供通話資源分配和包括BS270之間的軟切換過程的協(xié)調(diào)的移動(dòng)管理功能。BSC275還將接收到的數(shù)據(jù)路由到MSC280,其提供用于與PSTN290形成接口的額外的路由服務(wù)。類似地,PSTN290與MSC280形成接口,MSC與BSC275形成接口,并且BSC275相應(yīng)地控制BS270以將正向鏈路信號(hào)發(fā)送到移動(dòng)終端100。
基于上述移動(dòng)終端硬件結(jié)構(gòu)、通信裝置結(jié)構(gòu),提出本發(fā)明多媒體數(shù)據(jù)處理裝置各實(shí)施例,所述多媒體數(shù)據(jù)處理裝置為移動(dòng)終端的一部分。
參照?qǐng)D3,圖3是本發(fā)明多媒體數(shù)據(jù)處理裝置第一實(shí)施例的模塊示意圖,本實(shí)施例中,所述多媒體數(shù)據(jù)處理裝置400包括:
第一獲取模塊10,用于獲取預(yù)先采集的語(yǔ)音數(shù)據(jù)和照片,并提取所述照片的拍攝時(shí)間。
本實(shí)施例中,以旅行過程為例,當(dāng)用戶在旅行過程中遇見優(yōu)美的景色或獨(dú)特的景點(diǎn)之后,心中往往都會(huì)感慨萬(wàn)千,然后通過語(yǔ)言向自己的同伴表達(dá)出自己此刻內(nèi)心的感受,或者用自己的語(yǔ)言描述當(dāng)前的此情此景,并且在描述過程中,會(huì)希望通過拍照的方式,將眼前的景象記錄下來(lái),留作紀(jì)念或分享給自己的親人朋友。故本實(shí)施例中,在用戶啟動(dòng)多媒體數(shù)據(jù)處理應(yīng)用之后,實(shí)時(shí)采集移動(dòng)終端附近區(qū)域的語(yǔ)音數(shù)據(jù)以及用戶所拍攝的照片,并保存在預(yù)設(shè)的區(qū)域。其中,將采集到的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的采集時(shí)間以及照片所對(duì)應(yīng)的拍攝時(shí)間也同時(shí)進(jìn)行保存。在用戶關(guān)閉多媒體數(shù)據(jù)處理應(yīng)用之后,自動(dòng)獲取采集的語(yǔ)音數(shù)據(jù)和照片,并提取所述照片的拍攝時(shí)間。
匹配模塊20,用于將獲取到的語(yǔ)音數(shù)據(jù)與預(yù)先采集的目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行匹配,獲取與所述基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù)。
本實(shí)施例中,考慮到在語(yǔ)音數(shù)據(jù)的采集過程中,當(dāng)用戶處于人群時(shí),采集到的語(yǔ)音數(shù)據(jù)會(huì)包括移動(dòng)終端附近區(qū)域所有游客的語(yǔ)音數(shù)據(jù),而對(duì)于用戶來(lái)說,僅僅只希望將自己或者同伴所說的話進(jìn)行記錄,而不希望記錄到其他游客所述的話。故本實(shí)施例中,將獲取到的到的語(yǔ)音數(shù)據(jù)與預(yù)先采集的目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行匹配,獲取與所述基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù),即對(duì)獲取到的語(yǔ)音數(shù)據(jù)進(jìn)行過濾,僅僅獲取用戶指定的目標(biāo)人物的語(yǔ)音數(shù)據(jù)。其中,可通過語(yǔ)音識(shí)別技術(shù)或聲紋識(shí)別技術(shù)等獲取與所述基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù)。
其中,本實(shí)施例中,所述目標(biāo)人物可以為兩個(gè)或者兩個(gè)以上。
第一轉(zhuǎn)換模塊30,用于根據(jù)所述拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)對(duì)應(yīng)子文本數(shù)據(jù)。
本實(shí)施例中,如用戶在旅行過程中,一般都會(huì)一邊拍照,一邊與同伴進(jìn)行交流,故根據(jù)采集到的所述照片的拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)子文本數(shù)據(jù)。其中,可以通過語(yǔ)音識(shí)別技術(shù)或語(yǔ)音轉(zhuǎn)換軟件等方式將所述語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)子文本數(shù)據(jù)。
第一插入模塊40,用于根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片。
本實(shí)施例中,預(yù)先建立一個(gè)多媒體文檔,所述多媒體文檔中可以插入照片,文字、地理信息等。根據(jù)采集到的所述照片的拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中根據(jù)時(shí)間順序插入所述多個(gè)子文本數(shù)據(jù)和所述照片,并進(jìn)行保存。
其中,根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片之后還包括:創(chuàng)建以當(dāng)前日期命名的文件夾,將所述多媒體文檔以及采集到的語(yǔ)音數(shù)據(jù)與用戶拍攝的照片分別保存到所述文件夾中。本實(shí)施例中,同時(shí)將所述多媒體文檔以及采集到的語(yǔ)音數(shù)據(jù)與用戶拍攝的照片分別保存到所述文件夾中,以方便用戶對(duì)保存的多媒體文檔進(jìn)行個(gè)性化的設(shè)置或修改。
具體的,本實(shí)施例中所保存的多媒體文檔可以作為“游記”分享給他人或者上傳至網(wǎng)絡(luò)。
本實(shí)施例所述的多媒體數(shù)據(jù)處理裝置400,包括:第一獲取模塊10,獲取預(yù)先采集的語(yǔ)音數(shù)據(jù)和照片,并提取所述照片的拍攝時(shí)間;匹配模塊20,將獲取到的語(yǔ)音數(shù)據(jù)與預(yù)先采集的目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行匹配,獲取與所述基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù);第一轉(zhuǎn)換模塊30,根據(jù)所述拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)對(duì)應(yīng)子文本數(shù)據(jù);第一插入模塊40,根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片。本實(shí)施例通過采集語(yǔ)音數(shù)據(jù)和照片,并將采集的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)后將文本數(shù)據(jù)與所述照片按照時(shí)間順序自動(dòng)添加到多媒體文檔中,不需要用戶手動(dòng)處理,解決了現(xiàn)有技術(shù)中無(wú)法自動(dòng)處理多媒體數(shù)據(jù)的技術(shù)問題。
進(jìn)一步地,參照?qǐng)D4,圖4為本發(fā)明圖3所示多媒體數(shù)據(jù)處理裝置中第一轉(zhuǎn)換模塊30的細(xì)化模塊示意圖,基于上述圖3所述的實(shí)施例,所述第一轉(zhuǎn)換模塊30包括:
劃分模塊31,用于以所述拍攝時(shí)間作為分割點(diǎn),將所述第一語(yǔ)音數(shù)據(jù)劃分為多個(gè)第一子語(yǔ)音數(shù)據(jù)。
本實(shí)施例中,如用戶在旅行過程中時(shí),一般是一邊進(jìn)行拍照,一邊與同伴進(jìn)交流心得,故用戶所拍攝的每一張照片所對(duì)應(yīng)的用戶此刻的心得體會(huì)也會(huì)不同。例如,在9點(diǎn)00分至9點(diǎn)10分期間,采集到用戶分別在9點(diǎn)02分、9點(diǎn)04分、9點(diǎn)05分、9點(diǎn)08分拍攝了一張照片,那么便以9點(diǎn)02分、9點(diǎn)04分、9點(diǎn)05分、9點(diǎn)08分作為分割點(diǎn)將該時(shí)間段內(nèi)獲取到的第一語(yǔ)音數(shù)據(jù)劃分為5個(gè)第一子語(yǔ)音數(shù)據(jù)。
第二轉(zhuǎn)換模塊32,用于將所述第一子語(yǔ)音數(shù)據(jù)逐個(gè)轉(zhuǎn)換為對(duì)應(yīng)的子文本數(shù)據(jù)。
本實(shí)施例中,在上述采集到的語(yǔ)音數(shù)據(jù)劃分為多個(gè)第一子語(yǔ)音數(shù)據(jù)后,通過語(yǔ)音識(shí)別技術(shù)或者語(yǔ)音轉(zhuǎn)換軟件等方式將所述多個(gè)第一子語(yǔ)音數(shù)據(jù)分別轉(zhuǎn)換為多個(gè)子文本數(shù)據(jù)。
本實(shí)施例所述的第一轉(zhuǎn)換模塊30包括:劃分模塊31,用于以所述拍攝時(shí)間作為分割點(diǎn),將所述第一語(yǔ)音數(shù)據(jù)劃分為多個(gè)第一子語(yǔ)音數(shù)據(jù);第二轉(zhuǎn)換模塊32,用于將所述第一子語(yǔ)音數(shù)據(jù)逐個(gè)轉(zhuǎn)換為對(duì)應(yīng)的子文本數(shù)據(jù)。本實(shí)施例通過照片的拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)劃分為多個(gè)第一子語(yǔ)音數(shù)據(jù),并將所述多個(gè)第一子語(yǔ)音數(shù)據(jù)分別轉(zhuǎn)換為多個(gè)文本數(shù)據(jù),不需要用戶手動(dòng)處理,進(jìn)一步簡(jiǎn)化了自動(dòng)處理多媒體數(shù)據(jù)的實(shí)現(xiàn)過程,節(jié)省了用戶的精力。
進(jìn)一步地,參照?qǐng)D5,圖5為本發(fā)明圖3所示多媒體數(shù)據(jù)處理裝置中第一插入模塊40的細(xì)化模塊示意圖,基于上述圖3所述的實(shí)施例,所述第一插入模塊40包括:
第二插入模塊41,用于在所述預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)。
本實(shí)施例中,將每個(gè)子文本數(shù)據(jù)對(duì)應(yīng)的第一子語(yǔ)音數(shù)據(jù)的采集時(shí)間作為該子文本數(shù)據(jù)對(duì)應(yīng)的時(shí)間,將轉(zhuǎn)換后的多個(gè)子文本數(shù)據(jù)按照對(duì)應(yīng)的時(shí)間先后順序插入到預(yù)設(shè)的多媒體文檔中。
第三插入模塊42,用于在兩個(gè)相鄰子文本數(shù)據(jù)之間插入所述照片,使得所述兩個(gè)子文本數(shù)據(jù)的分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間與所述照片的拍攝時(shí)間相對(duì)應(yīng)。
本實(shí)施例中,首先獲取兩個(gè)相鄰子文本的分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間,然后再獲取拍攝時(shí)間與所述分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間相一致的照片,最后將所述照片插入到所述相鄰的兩個(gè)子文本之間,使得所述兩個(gè)子文本數(shù)據(jù)的分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間與所述照片的拍攝時(shí)間相對(duì)應(yīng)。
為了更好地理解本實(shí)施所提供的技術(shù)方案,參照?qǐng)D6,圖6為本發(fā)明中在相鄰兩個(gè)子文本數(shù)據(jù)之間插入照片的場(chǎng)景示意圖。
另外,本實(shí)施例中,如用戶想在多媒體文檔中記錄自己與同伴共同的旅游經(jīng)歷,即用戶預(yù)設(shè)采集語(yǔ)音數(shù)據(jù)的目標(biāo)人物為兩個(gè)或者兩個(gè)以上,則將采集到的語(yǔ)音數(shù)據(jù)分別與預(yù)先采集的每個(gè)目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行匹配,獲取與每個(gè)目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù),并且將不同目標(biāo)人物的第一語(yǔ)音數(shù)據(jù)通過不同的標(biāo)記方式進(jìn)行標(biāo)記。根據(jù)采集的照片的拍攝時(shí)間分別將所述第一語(yǔ)音數(shù)據(jù)劃分為多個(gè)子語(yǔ)音數(shù)據(jù),并且在所述多個(gè)子語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)后,將每個(gè)目標(biāo)人物相對(duì)應(yīng)的文本數(shù)據(jù)同樣用不同的標(biāo)記方式進(jìn)行標(biāo)記。
其中,在預(yù)設(shè)的多媒體文檔中插入所述多個(gè)子文本數(shù)據(jù),并將目標(biāo)人物相對(duì)應(yīng)的文本數(shù)據(jù)用不同的標(biāo)記方式進(jìn)行標(biāo)記。例如,將目標(biāo)人物甲對(duì)應(yīng)的子文本數(shù)據(jù)標(biāo)記為藍(lán)色,將目標(biāo)人物乙對(duì)應(yīng)的子文本數(shù)據(jù)標(biāo)記為紅色等。
為了更好的理解本實(shí)施例所述的技術(shù)方案,參照?qǐng)D7,圖7為本發(fā)明中在相鄰兩個(gè)子文本數(shù)據(jù)之間插入照片的另一場(chǎng)景示意圖。圖7中,通過文本的粗細(xì)來(lái)區(qū)分目標(biāo)人物甲與目標(biāo)人物乙的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)轉(zhuǎn)換后的文本數(shù)據(jù)。
本實(shí)施例所述的第一轉(zhuǎn)換模塊40包括:第二插入模塊41,用于在所述預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù);第三插入模塊42,用于在相鄰兩個(gè)子文本數(shù)據(jù)之間插入所述照片,使得所述兩個(gè)子文本數(shù)據(jù)的分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間與所述照片的拍攝時(shí)間相對(duì)應(yīng)。本實(shí)施例通過在預(yù)設(shè)的多媒體文檔中按照時(shí)間順序插入所有子文本數(shù)據(jù),以及根據(jù)照片的拍攝時(shí)間在相鄰兩個(gè)子文本數(shù)據(jù)之間插入照片,以此來(lái)自動(dòng)生成多媒體文檔,不需要用戶手動(dòng)整理,極大地節(jié)省了用戶的精力。
進(jìn)一步地,參照?qǐng)D8,圖8為本發(fā)明多媒體數(shù)據(jù)處理裝置第二實(shí)施例的模塊示意圖,基于上述圖3所述的實(shí)施例,本實(shí)施例中,所述多媒體數(shù)據(jù)處理裝置400還包括:
第二獲取模塊50,用于獲取在采集語(yǔ)音數(shù)據(jù)和用戶拍攝的照片的過程中采集的地理位置信息,其中,在采集語(yǔ)音數(shù)據(jù)和用戶拍攝的照片的過程中,每隔預(yù)設(shè)的時(shí)間間隔采集用戶所在區(qū)域的地理位置信息。
本實(shí)施例中,在采集語(yǔ)音數(shù)據(jù)和用戶拍攝的照片的過程中,每隔預(yù)設(shè)的時(shí)間間隔采集用戶的地理位置信息,例如每隔30分鐘采集一次用戶所在位置的地理位置信息。
第四插入模塊60,用于按照所述地理位置信息的采集時(shí)間與所述照片的拍攝時(shí)間以及所述多個(gè)子文本數(shù)據(jù)對(duì)應(yīng)的時(shí)間的先后順序,將所述地理位置信息插入到所述多媒體文檔中。
本實(shí)施例中,根據(jù)所述地理位置信息的采集時(shí)間和采集到的所述照片的拍攝時(shí)間、以及所述多個(gè)子文本數(shù)據(jù)對(duì)應(yīng)的時(shí)間的先后順序,將所述地理位置信息插入到預(yù)設(shè)的多媒體文檔中。
為了更好的理解本實(shí)施例所述的技術(shù)方案,參照?qǐng)D9,圖9為本發(fā)明中將采集到的地理位置信息插入到多媒體文檔中的場(chǎng)景示意圖。圖9中,假設(shè)獲取到用戶所在的位置為“故宮”,則根據(jù)獲取到該位置信息的時(shí)間點(diǎn)將“-故宮-”插入到多媒體文檔中,即在圖9中,位置信息“-故宮-”對(duì)應(yīng)的時(shí)間點(diǎn)晚于其上面的“照片”對(duì)應(yīng)的時(shí)間點(diǎn),早于其下面的“文本數(shù)據(jù)”對(duì)應(yīng)的時(shí)間點(diǎn)。
本實(shí)施例通過定時(shí)采集用戶在的地理位置信息,并將采集到的地理位置信息按照時(shí)間順序插入到預(yù)設(shè)的多媒體文檔中,使得生成的多媒體文檔中能夠有效記錄用戶的移動(dòng)路線,不需要用戶手動(dòng)去添加,節(jié)省了用戶的精力。
本發(fā)明還提供一種多媒體數(shù)據(jù)處理方法,該多媒體數(shù)據(jù)處理方法主要應(yīng)用于移動(dòng)終端上,參照?qǐng)D10,圖10是本發(fā)明多媒體數(shù)據(jù)處理方法第一實(shí)施例的流程示意圖,本實(shí)施例中,所述多媒體數(shù)據(jù)處理方法包括:
步驟S10,獲取預(yù)先采集的語(yǔ)音數(shù)據(jù)和用戶拍攝的照片,并提取所述照片的拍攝時(shí)間。
本實(shí)施例中,以旅行過程為例,當(dāng)用戶在旅行過程中遇見優(yōu)美的景色或獨(dú)特的景點(diǎn)之后,心中往往都會(huì)感慨萬(wàn)千,然后通過語(yǔ)言向自己的同伴表達(dá)出自己此刻內(nèi)心的感受,或者用自己的語(yǔ)言描述當(dāng)前的此情此景,并且在描述過程中,會(huì)希望通過拍照的方式,將眼前的景象記錄下來(lái),留作紀(jì)念或分享給自己的親人朋友。故本實(shí)施例中,在用戶啟動(dòng)多媒體數(shù)據(jù)處理應(yīng)用之后,實(shí)時(shí)采集移動(dòng)終端附近區(qū)域的語(yǔ)音數(shù)據(jù)以及用戶所拍攝的照片,并保存在預(yù)設(shè)的區(qū)域。其中,將采集到的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的采集時(shí)間以及照片所對(duì)應(yīng)的拍攝時(shí)間也同時(shí)進(jìn)行保存。在用戶結(jié)束旅程,關(guān)閉多媒體數(shù)據(jù)處理應(yīng)用之后,自動(dòng)獲取采集的語(yǔ)音數(shù)據(jù)和照片,并提取所述照片的拍攝時(shí)間。
步驟S20,將獲取到的語(yǔ)音數(shù)據(jù)與預(yù)先采集的目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行匹配,獲取與所述基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù)。
本實(shí)施例中,考慮到在語(yǔ)音數(shù)據(jù)的采集過程中,當(dāng)用戶處于人群時(shí),采集到的語(yǔ)音數(shù)據(jù)會(huì)包括移動(dòng)終端附近區(qū)域所有游客的語(yǔ)音數(shù)據(jù),而對(duì)于用戶來(lái)說,僅僅只希望將自己或者同伴所說的話進(jìn)行記錄,而不希望記錄到其他游客所述的話。故,本實(shí)施例中,將獲取到的到的語(yǔ)音數(shù)據(jù)與預(yù)先采集的目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行匹配,獲取與所述基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù),即對(duì)獲取到的語(yǔ)音數(shù)據(jù)進(jìn)行過濾,僅僅獲取用戶指定的目標(biāo)人物的語(yǔ)音數(shù)據(jù)。其中,可通過語(yǔ)音識(shí)別技術(shù)或聲紋識(shí)別技術(shù)等獲取與所述基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù)。
其中,本實(shí)施例中,所述目標(biāo)人物可以為兩個(gè)或者兩個(gè)以上。
步驟S30,根據(jù)所述拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)對(duì)應(yīng)子文本數(shù)據(jù)。
本實(shí)施例中,如用戶在旅行過程中,一般都會(huì)一邊拍照,一邊與同伴進(jìn)行交流,故,在處理多媒體數(shù)據(jù)時(shí),根據(jù)采集到的所述照片的拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)子文本數(shù)據(jù)。其中,可以通過語(yǔ)音識(shí)別技術(shù)或語(yǔ)音轉(zhuǎn)換軟件等方式將所述語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)子文本數(shù)據(jù)。
步驟S40,根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片。
本實(shí)施例中,預(yù)先建立一個(gè)多媒體文檔,所述多媒體文檔中可以插入照片,文字、地理信息等。根據(jù)采集到的所述照片的拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中根據(jù)時(shí)間順序插入所述多個(gè)子文本數(shù)據(jù)和所述照片,并進(jìn)行保存。
其中,根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片之后還包括:創(chuàng)建以當(dāng)前日期命名的文件夾,將所述多媒體文檔以及采集到的語(yǔ)音數(shù)據(jù)與用戶拍攝的照片分別保存到所述文件夾中。本實(shí)施例中,同時(shí)將所述多媒體文檔以及采集到的語(yǔ)音數(shù)據(jù)與用戶拍攝的照片分別保存到所述文件夾中,以方便用戶對(duì)保存的多媒體文檔進(jìn)行個(gè)性化的設(shè)置或修改。
具體的,本實(shí)施例中所保存的多媒體文檔可以作為“游記”分享給他人或者上傳至網(wǎng)絡(luò)。
本實(shí)施例所述的多媒體數(shù)據(jù)處理方法包括:獲取預(yù)先采集的語(yǔ)音數(shù)據(jù)和照片,并提取所述照片的拍攝時(shí)間;將獲取到的語(yǔ)音數(shù)據(jù)與預(yù)先采集的目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行匹配,獲取與所述基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù);根據(jù)所述拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為多個(gè)對(duì)應(yīng)子文本數(shù)據(jù);根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片。本實(shí)施例通過采集用戶在旅行過程中的語(yǔ)音數(shù)據(jù)和拍攝的照片,并將采集的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)后將文本數(shù)據(jù)與所述照片按照時(shí)間順序自動(dòng)添加到多媒體文檔中,不需要用戶手動(dòng)處理,解決了現(xiàn)有技術(shù)中無(wú)法在旅行過程中自動(dòng)生成多媒體文檔的技術(shù)問題。
進(jìn)一步地,參照?qǐng)D11,圖11為本發(fā)明圖10所示多媒體數(shù)據(jù)處理方法中步驟S30的細(xì)化步驟流程示意圖,基于上述圖10所述的實(shí)施例,所述步驟S30包括:
步驟S31,以所述拍攝時(shí)間作為分割點(diǎn),將所述第一語(yǔ)音數(shù)據(jù)劃分為多個(gè)第一子語(yǔ)音數(shù)據(jù)。
本實(shí)施例中,用戶來(lái)旅游過程中,一般是一邊進(jìn)行拍照,一邊與同伴進(jìn)交流心得,故用戶所拍攝的每一張照片所對(duì)應(yīng)的用戶此刻的心得體會(huì)也會(huì)不同。例如,在9點(diǎn)00分至9點(diǎn)10分期間,采集到用戶分別在9點(diǎn)02分、9點(diǎn)04分、9點(diǎn)05分、9點(diǎn)08分拍攝了一張照片,那么便以9點(diǎn)02分、9點(diǎn)04分、9點(diǎn)05分、9點(diǎn)08分作為分割點(diǎn)將該時(shí)間段內(nèi)獲取到的第一語(yǔ)音數(shù)據(jù)劃分為5個(gè)第一子語(yǔ)音數(shù)據(jù)。
步驟S32,將所述第一子語(yǔ)音數(shù)據(jù)逐個(gè)轉(zhuǎn)換為對(duì)應(yīng)的子文本數(shù)據(jù)。
本實(shí)施例中,在上述采集到的語(yǔ)音數(shù)據(jù)劃分為多個(gè)第一子語(yǔ)音數(shù)據(jù)后,通過語(yǔ)音識(shí)別技術(shù)或者語(yǔ)音轉(zhuǎn)換軟件等方式將所述多個(gè)第一子語(yǔ)音數(shù)據(jù)分別轉(zhuǎn)換為多個(gè)子文本數(shù)據(jù)。
本實(shí)施例所述多媒體數(shù)據(jù)處理方法中,所述步驟S30包括:以所述拍攝時(shí)間作為分割點(diǎn),將所述第一語(yǔ)音數(shù)據(jù)劃分為多個(gè)第一子語(yǔ)音數(shù)據(jù);將所述第一子語(yǔ)音數(shù)據(jù)逐個(gè)轉(zhuǎn)換為對(duì)應(yīng)的子文本數(shù)據(jù)。本實(shí)施例通過照片的拍攝時(shí)間將所述第一語(yǔ)音數(shù)據(jù)劃分為多個(gè)第一子語(yǔ)音數(shù)據(jù),并將所述多個(gè)第一子語(yǔ)音數(shù)據(jù)分別轉(zhuǎn)換為多個(gè)文本數(shù)據(jù),不需要用戶手動(dòng)處理,進(jìn)一步簡(jiǎn)化了自動(dòng)處理多媒體數(shù)據(jù)的實(shí)現(xiàn)過程,節(jié)省了用戶的精力。
進(jìn)一步地,參照?qǐng)D12,圖12為本發(fā)明圖10所示多媒體數(shù)據(jù)處理裝置中步驟S40的細(xì)化步驟流程示意圖,基于上述圖10所述的實(shí)施例,所述步驟S40包括:
步驟S41,在所述預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)。
本實(shí)施例中,將每個(gè)子文本數(shù)據(jù)對(duì)應(yīng)的第一子語(yǔ)音數(shù)據(jù)的采集時(shí)間作為該子文本數(shù)據(jù)對(duì)應(yīng)的時(shí)間,將轉(zhuǎn)換后的多個(gè)子文本數(shù)據(jù)按照對(duì)應(yīng)的時(shí)間先后順序插入到預(yù)設(shè)的多媒體文檔中。
步驟S42,在兩個(gè)相鄰子文本數(shù)據(jù)之間插入所述照片,使得所述兩個(gè)子文本數(shù)據(jù)的分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間與所述照片的拍攝時(shí)間相對(duì)應(yīng)。
本實(shí)施例中,首先獲取兩個(gè)相鄰子文本的分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間,然后再獲取拍攝時(shí)間與所述分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間相一致的照片,最后將所述照片插入到所述相鄰的兩個(gè)子文本之間,使得所述兩個(gè)子文本數(shù)據(jù)的分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間與所述照片的拍攝時(shí)間相對(duì)應(yīng)。
為了更好地理解本實(shí)施所提供的技術(shù)方案,參照?qǐng)D6,圖6為本發(fā)明中在相鄰兩個(gè)子文本數(shù)據(jù)之間插入照片的場(chǎng)景示意圖。
另外,本實(shí)施例中,如用戶想在多媒體文檔中記錄自己與同伴共同的旅游經(jīng)歷,即用戶預(yù)設(shè)采集語(yǔ)音數(shù)據(jù)的目標(biāo)人物為兩個(gè)或者兩個(gè)以上,則將采集到的語(yǔ)音數(shù)據(jù)分別與預(yù)先采集的每個(gè)目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行匹配,獲取與每個(gè)目標(biāo)人物的基準(zhǔn)語(yǔ)音數(shù)據(jù)相匹配的第一語(yǔ)音數(shù)據(jù),并且將不同目標(biāo)人物的第一語(yǔ)音數(shù)據(jù)通過不同的標(biāo)記方式進(jìn)行標(biāo)記。根據(jù)采集的照片的拍攝時(shí)間分別將所述第一語(yǔ)音數(shù)據(jù)劃分為多個(gè)子語(yǔ)音數(shù)據(jù),并且在所述多個(gè)子語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)后,將每個(gè)目標(biāo)人物相對(duì)應(yīng)的文本數(shù)據(jù)同樣用不同的標(biāo)記方式進(jìn)行標(biāo)記。
其中,在預(yù)設(shè)的多媒體文檔中插入所述多個(gè)子文本數(shù)據(jù),并將目標(biāo)人物相對(duì)應(yīng)的文本數(shù)據(jù)用不同的標(biāo)記方式進(jìn)行標(biāo)記。例如,將目標(biāo)人物甲對(duì)應(yīng)的子文本數(shù)據(jù)標(biāo)記為藍(lán)色,將目標(biāo)人物乙對(duì)應(yīng)的子文本數(shù)據(jù)標(biāo)記為紅色等。
為了更好的理解本實(shí)施例所述的技術(shù)方案,參照?qǐng)D7,圖7為本發(fā)明中在相鄰兩個(gè)子文本數(shù)據(jù)之間插入照片的另一場(chǎng)景示意圖。圖7中,通過文本的粗細(xì)來(lái)區(qū)分目標(biāo)人物甲與目標(biāo)人物乙的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)轉(zhuǎn)換后的文本數(shù)據(jù)。
本實(shí)施例所述的步驟S40包括:在所述預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù);在相鄰兩個(gè)子文本數(shù)據(jù)之間插入所述照片,使得所述兩個(gè)子文本數(shù)據(jù)的分割點(diǎn)對(duì)應(yīng)的拍攝時(shí)間與所述照片的拍攝時(shí)間相對(duì)應(yīng)。本實(shí)施例通過在預(yù)設(shè)的多媒體文檔中按照時(shí)間順序插入所有子文本數(shù)據(jù),以及根據(jù)照片的拍攝時(shí)間在相鄰兩個(gè)子文本數(shù)據(jù)之間插入照片,,以此來(lái)自動(dòng)生成多媒體文檔,不需要用戶手動(dòng)整理,極大地節(jié)省了用戶的精力。
進(jìn)一步地,參照?qǐng)D13,圖13為本發(fā)明多媒體數(shù)據(jù)處理方法第二實(shí)施例的流程示意圖,基于上述圖10所述的實(shí)施例,本實(shí)施例中,根據(jù)所述拍攝時(shí)間,在預(yù)設(shè)的多媒體文檔中插入所有所述子文本數(shù)據(jù)和所述照片的步驟之后還包括:
步驟S50,獲取在采集語(yǔ)音數(shù)據(jù)和用戶拍攝的照片的過程中采集的地理位置信息,其中,在采集語(yǔ)音數(shù)據(jù)和用戶拍攝的照片的過程中,每隔預(yù)設(shè)的時(shí)間間隔采集用戶所在區(qū)域的地理位置信息。
本實(shí)施例中,在采集語(yǔ)音數(shù)據(jù)和用戶拍攝的照片的過程中,每隔預(yù)設(shè)的時(shí)間間隔采集用戶在旅行過程中的地理位置信息,例如每隔30分鐘采集一次用戶所在位置的地理位置信息。
步驟S60,按照所述地理位置信息的采集時(shí)間與所述照片的拍攝時(shí)間以及所述多個(gè)子文本數(shù)據(jù)對(duì)應(yīng)的時(shí)間的先后順序,將所述地理位置信息插入到所述多媒體文檔中。
本實(shí)施例中,根據(jù)所述地理位置信息的采集時(shí)間和采集到的所述照片的拍攝時(shí)間、以及所述多個(gè)子文本數(shù)據(jù)對(duì)應(yīng)的時(shí)間的先后順序,將所述地理位置信息插入到預(yù)設(shè)的多媒體文檔中。
為了更好的理解本實(shí)施例所述的技術(shù)方案,參照?qǐng)D9,圖9為本發(fā)明中將采集到的地理位置信息插入到多媒體文檔中的場(chǎng)景示意圖。圖9中,假設(shè)獲取到用戶所在的位置為“故宮”,則根據(jù)獲取到該位置信息的時(shí)間點(diǎn)將“-故宮-”插入到多媒體文檔中,即在圖9中,位置信息“-故宮-”對(duì)應(yīng)的時(shí)間點(diǎn)晚于其上面的“照片”對(duì)應(yīng)的時(shí)間點(diǎn),早于其下面的“文本數(shù)據(jù)”對(duì)應(yīng)的時(shí)間點(diǎn)。
本實(shí)施例通過定時(shí)采集用戶在旅行過程中的地理位置信息,并將采集到的地理位置信息按照時(shí)間順序插入到預(yù)設(shè)的多媒體文檔中,使得生成的多媒體文檔中能夠有效記錄用戶的移動(dòng)路線,不需要用戶手動(dòng)去添加,節(jié)省了用戶的精力。
需要說明的是,在本文中,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。
上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實(shí)施例方法可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī),計(jì)算機(jī),服務(wù)器,空調(diào)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。
以上僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。