亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

視頻字幕的生成方法及系統(tǒng)的制作方法

文檔序號:7995678閱讀:221來源:國知局
視頻字幕的生成方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種視頻字幕生成方法和系統(tǒng),檢測視頻字幕播放類型控制信息;獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;提取視頻字幕文字信息;最后采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息,生成視頻字幕,由于生成的視頻字幕為具有字幕動畫模型的視頻字幕,實現(xiàn)了視頻字幕的動態(tài)效果的目的。
【專利說明】視頻字幕的生成方法及系統(tǒng)【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理【技術(shù)領(lǐng)域】,更具體地說,涉及一種視頻字幕的生成方法及系統(tǒng)。
【背景技術(shù)】
[0002]當今,視頻包括電影和電視,因能夠給人們帶來視覺體驗的提升,正在被迅速普及。
[0003]然而,現(xiàn)有技術(shù)中視頻的字幕的生成方式仍然只能滿足平面固態(tài)顯示的要求,不能實現(xiàn)動態(tài)顯示。

【發(fā)明內(nèi)容】

[0004]有鑒于此,本發(fā)明提供一種視頻字幕的生成方法,以生成動態(tài)效果的視頻字幕。
[0005]為了實現(xiàn)上述目的,現(xiàn)提出的方案如下:
[0006]一種視頻字幕生成方法,包括:
[0007]檢測視頻字幕播放類型控制信息;
[0008]獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;
[0009]確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;
[0010]提取視頻字幕文字信息;
[0011]采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息,生成視頻字幕。
[0012]優(yōu)選地,所述檢測視頻字幕播放類型控制信息包括:
[0013]采集視頻中與字幕對應(yīng)的語音提供者的人臉表情信息。
[0014]優(yōu)選地,所述檢測視頻字幕播放類型控制信息包括:
[0015]接收用戶輸入視頻字幕播放類型控制信息。
[0016]優(yōu)選地,所述檢測視頻字幕播放類型控制信息包括:
[0017]采集視頻中與字幕對應(yīng)的語音提供者的音調(diào);
[0018]計算預設(shè)時間段的音調(diào)變化,確定與所述音調(diào)變化對應(yīng)的視頻字幕播放類型控制信息。
[0019]優(yōu)選地,所述提取視頻字幕文字信息包括:
[0020]采集視頻中與字幕對應(yīng)的語音提供者的語音信息;
[0021]識別所述語音信息,生成與所述語音對應(yīng)的文字信息。
[0022]優(yōu)選地,生成視頻字幕之前還包括:
[0023]采集視頻中與字幕對應(yīng)的語音提供者的語音音量;
[0024]根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。
[0025]一種視頻字幕生成系統(tǒng),包括:
[0026]檢測器,用于檢測視頻字幕播放類型控制信息;
[0027]處理器,用于獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;提取視頻字幕文字信息;采用所述視頻字幕動畫模型制作所述視頻字幕文字信息,生成視頻字幕。
[0028]優(yōu)選地,所述檢測器為圖像采集器,用于采集視頻中與字幕對應(yīng)的語音提供者的人臉表情信息。
[0029]優(yōu)選地,所述檢測器為接收器,用于接收用戶輸入的視頻字幕播放類型控制信息。
[0030]優(yōu)選地,所述檢測器為語音采集器,用于采集視頻中與字幕對應(yīng)的語音提供者的
首調(diào);
[0031]所述處理器還用于獲取所述音調(diào),計算預設(shè)時間段的音調(diào)變化,確定與所述音調(diào)變化對應(yīng)的視頻字幕播放類型控制信息。
[0032]優(yōu)選地,所述處理器提取視頻字幕文字信息的方式包括:
[0033]采集視頻中與字幕對應(yīng)的語音提供者的語音信息;
[0034]識別所述語音信息,生成與所述語音對應(yīng)的文字信息。
[0035]優(yōu)選地,所述處理器還用于在生成視頻字幕之前,采集視頻中與字幕對應(yīng)的語音提供者的語音音量;根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。
[0036]從上述的技術(shù)方案可以看出,本發(fā)明公開的視頻字幕的生成方法中,生成的視頻子.為具有子.動畫|旲型的視頻子.,實現(xiàn)了視頻子.的動態(tài)效果。
【專利附圖】

【附圖說明】
[0037]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0038]圖1為本發(fā)明實施例公開的一種視頻字幕的生成方法的流程圖;
[0039]圖2為本發(fā)明另一實施例公開的一種視頻字幕的生成方法的流程圖;
[0040]圖3為本發(fā)明另一實施例公開的一種視頻字幕的生成方法的流程圖;
[0041]圖4為本發(fā)明另一實施例公開的一種視頻字幕的生成方法的流程圖;
[0042]圖5為本發(fā)明另一實施例公開的一種視頻字幕的生成方法的流程圖;
[0043]圖6為本發(fā)明另一實施例公開的一種視頻字幕生成系統(tǒng)的結(jié)構(gòu)圖。
【具體實施方式】
[0044]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0045]本發(fā)明實施例提供一種視頻字幕的生成方法,以生成動態(tài)效果的視頻字幕。
[0046]參見圖1,本發(fā)明實施例公開的視頻字幕生成方法,包括步驟:
[0047]S101、檢測視頻字幕播放類型控制信息;
[0048]其中,所述視頻字幕播放類型控制信息控制所述視頻字幕的生成類型,且播放視頻字幕時采用視頻字幕的生成類型進行播放。[0049]S102、獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;
[0050]具體的,預先存儲視頻字幕播放類型控制信息和視頻字幕播放信息的對應(yīng)關(guān)系,當獲取到所述視頻字幕播放類型控制信息后,在所述對應(yīng)關(guān)系中查找與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息。
[0051]S103、確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;
[0052]S104、提取視頻字幕文字信息;
[0053]具體的,可以預先存儲視頻字幕文字信息,當需要生成視頻字幕時,獲取預先存儲的視頻字幕文字信息;或者,當需要生成視頻字幕時,接收輸入的視頻字幕文字信息。
[0054]S105、采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息,生成視頻字幕。
[0055]其中,當需要生成動畫效果的視頻字幕時,需要按照視頻字幕動畫模型來生成。
[0056]本實施例公開的視頻字幕的生成方法中,生成的視頻字幕為具有字幕動畫模型的視頻子.,實現(xiàn)了視頻子.的動態(tài)效果。
[0057]優(yōu)選地,本實施例公開的視頻字幕生成方法中,步驟S105之前,還可以執(zhí)行以下步驟:
[0058]采集視頻中與字幕對應(yīng)的語音提供者的語音音量;
[0059]根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。
[0060]具體的,所述視頻字幕動畫模型中的參數(shù)用于控制生成的視頻字幕的動畫效果的程度,當需要生成不同動畫效果程度的視頻字幕時,可以調(diào)整視頻字幕動畫模型的參數(shù)。
[0061]在視頻的播放過程中,視頻中的說話者的語音文字與字幕對應(yīng),采集說話者的語音音量,根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù),生成不同動畫效果程度的
視頻字眷。
[0062]本發(fā)明另一實施例還公開了一種視頻字幕生成方法,如圖2所示,包括步驟:
[0063]S201、采集視頻中與字幕對應(yīng)的語音提供者的人臉表情信息;
[0064]具體的,視頻播放過程中,當前顯示的說話者的語音文字會和字幕相同。并且,說話者的人臉表情會根據(jù)視頻的場景發(fā)生變化,采集當前顯示的說話者的人臉表情信息,可以保證生成的視頻字幕的動畫效果與當前的視頻的場景相同。
[0065]并且,人臉表情信息可以包括雙眼的瞳距、眼睛的外形輪廓和嘴形等單特征信息,或者包括能夠反映人臉表情變化的所有特征,包括眼睛、嘴角和眉毛等。
[0066]S202、獲取與所述人臉表情信息相匹配的視頻字幕播放信息;
[0067]具體的,采集到人臉表情信息后,通過識別所述人臉表情信息反映出當前視頻的場景。并且,獲取的視頻字幕播放信息與人臉表情信息相匹配,可以保證生成的視頻字幕滿足視頻場景的需求。
[0068]例如:當采集的人臉表情信息表明當前顯示的說話者很高興,說明當前視頻的場景為歡快的場景;當采集的人臉表情信息表明當前顯示的說話者很生氣,說明當前視頻的場景為緊張的場景。
[0069]其中,當所述人臉表情信息為雙眼的瞳距,可以分析雙眼的瞳距的大小,來確定當前顯示的說話者的心情;當所述人臉表情信息為眼睛的外形輪廓時,可以分析眼睛的外形輪廓的走向,來確定當前顯示的說話者的心情;當所述人臉表情信息為嘴形,同樣可以分析嘴形的走向來確定當前顯示的說話者的心情。[0070]當所述人臉表情信息為綜合信息時,包括能夠反映人臉表情變化的所有特征,可以將所述能夠反映人臉表情變化的所有特征所組成的人臉表情與多個基本人臉表情模板進行匹配,匹配度較高的基本人臉表情模板所表明的人的心情為當前顯示的說話者的心情。
[0071]或者,采用神經(jīng)網(wǎng)絡(luò)分析方法,將基本人臉的表情作為輸出神經(jīng)元,一般為六種基本人臉的表情,將采集到的人臉表情信息作為輸入神經(jīng)元,分析計算得到對應(yīng)述人臉表情信息的人臉表情類型,確定當前顯示的說話者的心情。
[0072]S203、確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;
[0073]其中:不同的視頻字幕播放信息對應(yīng)有不同的視頻字幕動畫模型;獲取到視頻字幕播放信息后,需要確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型。
[0074]例如,當所述視頻字幕播放信息反應(yīng)當前顯示的說話者的心情為高興時,可以確定歡快的字幕跳動效果的模型;當所述視頻字幕播放信息反應(yīng)當前顯示的說話者的心情為憤怒時,可以確定具有破壞性效果的模型。
[0075]S204、提取視頻字幕文字信息;
[0076]與上述實施例相同,可以預先存儲視頻字幕文字信息,當需要生成視頻字幕時,獲取預先存儲的視頻字幕文字信息;或者,當需要生成視頻字幕時,接收輸入的視頻字幕文字信息。
[0077]S205、采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息,生成視頻字幕。
[0078]本發(fā)明公開的視頻字幕的生成方法中,生成的視頻字幕為具有字幕動畫模型的視頻字幕,實現(xiàn)了視頻字幕的動態(tài)效果;并且,所述視頻字幕的字幕動畫模型還和與所述字幕對應(yīng)的語音提供者人臉表情信息相對應(yīng),將字幕的動態(tài)效果滿足字幕語音提供者的人臉表情需求,增強了視屏畫面的形象性。
[0079]與上述實施例相同,本實施例在步驟S205之前,還可包括步驟:
[0080]采集視頻中與字幕對應(yīng)的語音提供者的語音音量;
[0081]根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。
[0082]具體的,所述視頻字幕動畫模型中的參數(shù)用于控制生成的視頻字幕的動畫效果的程度,當需要生成不同動畫效果程度的視頻字幕時,可以調(diào)整視頻字幕動畫模型的參數(shù)。
[0083]例如:當確定的視頻字幕動畫模型為歡快的字幕跳動效果的模型,通過采集的語音音量來調(diào)整歡快的字幕跳動效果的模型的參數(shù),確定跳動的字幕的幅度。
[0084]本發(fā)明另一實施例還公開了一種視頻字幕生成方法,如圖3所示,包括步驟:
[0085]S301、接收用戶輸入的視頻字幕播放類型控制信息;
[0086]具體的,當需要人為控制生成的視頻字幕的播放類型時,可以輸入視頻字幕播放類型控制信息。
[0087]S302、獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;
[0088]同樣,預先存儲有存儲視頻字幕播放類型控制信息和視頻字幕播放信息的對應(yīng)關(guān)系,當獲取到所述視頻字幕播放類型控制信息后,在所述對應(yīng)關(guān)系中查找與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息。
[0089]S303、確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;
[0090]S304、提取視頻字幕文字信息;[0091]S305、采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息,生成視頻字幕。
[0092]本實施例的具體過程見上述兩個實施例公開的內(nèi)容,此處不再贅述。
[0093]本實施例公開的視頻字幕生成方法,根據(jù)用戶輸入的視頻字幕播放類型控制信息,最終確定視頻字幕動畫模型,再采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息,生成視頻字幕;如此,可以根據(jù)用戶需求生成視頻字幕。
[0094]本發(fā)明另一實施例還公開了一種視頻字幕生成方法,如圖4所示,包括步驟:
[0095]S401、采集視頻中與字幕對應(yīng)的語音提供者的音調(diào);
[0096]具體的,在視頻播放過程中,視頻的場景不同,說話者的心情不同,說話者的說話的音調(diào)也不同;通過采集一段時間的視頻中與字幕對應(yīng)的語音提供者的音調(diào)來評判當前語首提供者的心情。
[0097]S402、計算預設(shè)時間段的音調(diào)變化,確定與所述音調(diào)變化對應(yīng)的視頻字幕播放類型控制信息;
[0098]具體的,根據(jù)實際使用需求設(shè)定時間段,計算該時間段的采集的音調(diào)的變化,根據(jù)音調(diào)變化確定視頻字幕播放類型控制信息。
[0099]其中,一般情況下,當判斷預設(shè)時間段的音調(diào)變化快,則表明說話者心情為興奮或者憤怒,確定的視頻字幕播放類型控制信息可以為控制視頻字幕具有劇烈動畫效果的視頻字幕播放類型控制信息;
[0100]當判斷預設(shè)時間的音調(diào)變化較小,或者沒有變化,表明說話者心態(tài)平和,確定的視頻字幕播放類型控制信息可以為控制視頻字幕具有平緩動畫效果的視頻字幕播放類型控制信息。
[0101]S403、獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;
[0102]具體的,預先存儲視頻字幕播放類型控制信息和視頻字幕播放信息的對應(yīng)關(guān)系,當獲取到所述視頻字幕播放類型控制信息后,在所述對應(yīng)關(guān)系中查找與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息。
[0103]S404、確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;
[0104]S405、提取視頻字幕文字信息;
[0105]S406、采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息,生成視頻字幕。
[0106]本實施例中,根據(jù)語音提供者音調(diào)變化生成視頻字幕,將視頻字幕的動態(tài)效果滿足字幕語音提供者的音調(diào)變化,同樣也增強了視屏畫面的形象性。
[0107]對應(yīng)圖3和圖4的實施例,優(yōu)選地,均可以在生成視頻字幕之前,執(zhí)行步驟:
[0108]采集視頻中與字幕對應(yīng)的語音提供者的語音音量;
[0109]根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。
[0110]其中,具體的過程見對應(yīng)圖1和圖2的實施例,此處不再贅述。
[0111]參見圖5,本發(fā)明另一實施例還公開的視頻字幕生成方法,包括步驟:
[0112]S501、檢測視頻字幕播放類型控制信息;
[0113]S502、獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;
[0114]S503、確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;
[0115]S504、采集視頻中與字幕對應(yīng)的語音提供者的語音信息;
[0116]S505、識別所述語音信息,生成與所述語音對應(yīng)的文字信息。[0117]S506、采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息,生成視頻字幕。
[0118]本實施例中,當視頻播放時,采集語音信息,識別語音信息,生成與所述語音對應(yīng)的文字信息,不需要預先存儲視頻字幕文字信息,也不需要獲取視頻字幕文字信息,更加簡單方便。
[0119]本實施例的具體過程見上述所有實施例公開的內(nèi)容,此處不再贅述。
[0120]本發(fā)明另一實施例還公開了一種視頻字幕生成系統(tǒng),參見圖6,包括:
[0121]檢測器101,用于檢測視頻字幕播放類型控制信息;
[0122]處理器102,用于獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;提取視頻字幕文字信息;采用所述視頻字幕動畫模型制作所述視頻字幕文字信息,生成視頻字幕。
[0123]具體的,檢測器101檢測到視頻字幕播放類型控制信息后傳輸至處理器102,處理器102內(nèi)預先存儲視頻字幕播放類型控制信息和視頻字幕播放信息的對應(yīng)關(guān)系,當處理器102接收到所述視頻字幕播放類型控制信息后,在所述對應(yīng)關(guān)系中查找與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息,再確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;并提取視頻字幕文字信息,最后,采用所述視頻字幕動畫模型制作所述視頻字幕文字信息,生成視頻字幕。
[0124]其中,處理器102可以預先存儲視頻字幕文字信息,當需要生成視頻字幕時,獲取預先存儲的視頻字幕文字信息;或者,當需要生成視頻字幕時,處理器102接收輸入的視頻字幕文字信息。
[0125]本實施例公開的視頻字幕生成系統(tǒng),當檢測器101檢測到視頻字幕播放類型控制信息,并將其發(fā)送至處理器102,處理器102獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;提取視頻字幕文字信息;采用所述視頻字幕動畫模型制作所述視頻字幕文字信息,生成視頻字幕。這樣,處理器102生成的視頻字幕為具有字幕動畫模型的視頻字幕,實現(xiàn)了視頻字幕的動態(tài)效果的目的。
[0126]優(yōu)選地,上述實施例中的檢測器101可以為圖像采集器,用于采集視頻中與字幕對應(yīng)的語首提供者的人臉表情信息。
[0127]具體的,所述圖像采集器可以為攝像頭,拍攝視屏中說話者的人臉圖像;其中,可以拍攝整個人臉,也可以僅針對人臉的局部拍攝,如:人眼、嘴等。
[0128]所述處理器獲取攝像頭拍攝的圖像,識別圖像,確定說話者的當前的心情,并獲取與所述人臉表情信息相匹配的視頻字幕播放信息。
[0129]其中,識別圖像以確定說話者的當前的心情的過程見與圖2對應(yīng)的實施例,此處不再贅述。
[0130]或者,優(yōu)選地,上述實施例中的檢測器101為接收器,用于接收用戶輸入的視頻字幕播放類型控制信息。
[0131 ] 具體的,所述接收器可以通信接口,所述處理器通過通信接口與外接設(shè)備相連,用戶在外界設(shè)備的人機交互界面輸入視頻字幕播放類型控制信息,所述視頻字幕播放類型控制信息通過通信接口傳輸至處理器。
[0132]再或者,優(yōu)選地,上述實施例中的檢測器101為語音采集器,用于采集視頻中與字幕對應(yīng)的語音提供者的音調(diào);
[0133]具體的,所述語音采集器可以為語音傳感器,采集說話者的語音的頻率,即音調(diào)。處理器獲取語音傳感器采集的說話者的語音的頻率,計算預設(shè)時間段的音調(diào)變化,確定與所述音調(diào)變化對應(yīng)的視頻字幕播放類型控制信息。
[0134]具體的,根據(jù)實際使用需求設(shè)定時間段,計算該時間段的采集的音調(diào)的變化,根據(jù)音調(diào)變化確定視頻字幕播放類型控制信息。
[0135]所述處理器根 據(jù)音調(diào)變化的快慢來確定視頻字幕播放類型控制信息,具體過程見圖4對應(yīng)的實施例的內(nèi)容,此處不再贅述。
[0136]上述所有實施例中,所述處理器提取視頻字幕文字信息的方式可以為:預先存儲視頻字幕文字信息,當需要生成視頻字幕時,獲取預先存儲的視頻字幕文字信息;或者,當需要生成視頻字幕時,接收輸入的視頻字幕文字信息。
[0137]還可以包括:在視頻播放的過程中,所述處理器采集視頻中與字幕對應(yīng)的語音提供者的語音信息;識別所述語音信息,生成與所述語音對應(yīng)的文字信息。這樣,不需要額外存儲視頻字幕文字信息或額外接收存儲視頻字幕文字信息,只需根據(jù)視頻語音轉(zhuǎn)化即可,簡單方便。
[0138]并且,上述公開的所有實施例,在所述處理器采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息,生成視頻字幕之前,所述處理器還可以執(zhí)行以下操作:
[0139]采集視頻中與字幕對應(yīng)的語音提供者的語音音量;
[0140]根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。
[0141 ] 具體的,所述視頻字幕動畫模型中的參數(shù)用于控制生成的視頻字幕的動畫效果的程度,當需要生成不同動畫效果程度的視頻字幕時,可以調(diào)整視頻字幕動畫模型的參數(shù)。
[0142]在視頻的播放過程中,視頻中的說話者的語音文字與字幕對應(yīng),采集說話者的語音音量,根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù),生成不同動畫效果程度的
視頻字眷。
[0143]最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0144]本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。
[0145]對所公開的實施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。
【權(quán)利要求】
1.一種視頻字幕生成方法,其特征在于,包括: 檢測視頻字幕播放類型控制信息; 獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息; 確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型; 提取視頻字幕文字信息; 采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息,生成視頻字幕。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測視頻字幕播放類型控制信息包括: 采集視頻中與字幕對應(yīng)的語音提供者的人臉表情信息。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測視頻字幕播放類型控制信息包括: 接收用戶輸入視頻字幕播放類型控制信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測視頻字幕播放類型控制信息包括: 采集視頻中與字幕對應(yīng)的語音提供者的音調(diào); 計算預設(shè)時間段的音調(diào)變化,確定與所述音調(diào)變化對應(yīng)的視頻字幕播放類型控制信肩、O
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取視頻字幕文字信息包括: 采集視頻中與字幕對應(yīng)的語音提供者的語音信息; 識別所述語音信息,生成與所述語音對應(yīng)的文字信息。
6.根據(jù)權(quán)利要求1-5中任意一項所述的方法,其特征在于,生成視頻字幕之前還包括: 采集視頻中與字幕對應(yīng)的語音提供者的語音音量; 根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。
7.一種視頻字幕生成系統(tǒng),其特征在于,包括: 檢測器,用于檢測視頻字幕播放類型控制信息; 處理器,用于獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;提取視頻字幕文字信息;采用所述視頻字幕動畫模型制作所述視頻字幕文字信息,生成視頻字幕。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述檢測器為圖像采集器,用于采集視頻中與字幕對應(yīng)的語音提供者的人臉表情信息。
9.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述檢測器為接收器,用于接收用戶輸入的視頻字幕播放類型控制信息。
10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述檢測器為語音采集器,用于采集視頻中與字幕對應(yīng)的語音提供者的音調(diào); 所述處理器還用于獲取所述音調(diào),計算預設(shè)時間段的音調(diào)變化,確定與所述音調(diào)變化對應(yīng)的視頻字幕播放類型控制信息。
11.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述處理器提取視頻字幕文字信息的方式包括: 采集視頻中與字幕對應(yīng)的語音提供者的語音信息;識別所述語音信息,生成與所述語音對應(yīng)的文字信息。
12.根據(jù)權(quán)利要求7-11任意一項所述的系統(tǒng),其特征在于,所述處理器還用于在生成視頻字幕之前,采集視頻中與字幕對應(yīng)的語音提供者的語音音量;根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。
【文檔編號】H04N21/83GK103945140SQ201310018669
【公開日】2014年7月23日 申請日期:2013年1月17日 優(yōu)先權(quán)日:2013年1月17日
【發(fā)明者】趙永剛 申請人:聯(lián)想(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1