一種字幕轉(zhuǎn)換的方法和設(shè)備的制作方法
【專利摘要】本發(fā)明的實施例提供一種字幕轉(zhuǎn)換的方法和設(shè)備,涉及視頻處理領(lǐng)域,能夠在后臺自動將視頻中的字幕格式統(tǒng)一轉(zhuǎn)換為文本格式的字幕,方便對字幕進行管理。具體方案為:首先獲取當前播放視頻的字幕的格式,字幕的格式包括圖片格式和文本格式;然后根據(jù)字幕的格式判斷字幕是否需要進行格式轉(zhuǎn)換;若字幕的格式為圖片格式,則獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將圖片文件轉(zhuǎn)換為文本格式字幕。本發(fā)明用于字幕格式的轉(zhuǎn)換。
【專利說明】一種字幕轉(zhuǎn)換的方法和設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻處理領(lǐng)域,尤其涉及一種字幕轉(zhuǎn)換的方法和設(shè)備。
【背景技術(shù)】
[0002]目前,比較流行的字幕格式,分為圖片格式和文本格式兩類。圖片格式字幕中最常見的字幕格式是由字幕圖片文件(比如.sub文檔)和字幕索引文件(比如.1dx文檔)組成。一個.sub文檔可同時包含多個語言的字幕,由.1dx文檔進行調(diào)用。.1dx文檔相當于索引文件,里面包括了字幕出現(xiàn)的時間碼和字幕顯示的屬性,.sub文檔就是字幕數(shù)據(jù)本身,由于是圖片格式,所以體積比較大,動輒IOM以上。文本格式字幕的擴展名通常是ass (AdvancedSubstation Alpha)、srt (Sub Rip Text)等等。因為是文本格式,通常不過百十來KB。其中srt文本字幕是最流行的,因為其制作和修改非常簡單:一句時間代碼加一句字幕就可以實現(xiàn)。
[0003]由于文本格式的字幕體積小,制作和修改簡單,逐漸成為主流的字幕格式,有時需要將圖片格式的字幕進行處理轉(zhuǎn)為文本格式的字幕,現(xiàn)有技術(shù)一般是由用戶自行對字幕格式進行處理轉(zhuǎn)換,但是,不能在后臺自動將字幕格式統(tǒng)一為文本格式的字幕。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的實施例提供一種字幕轉(zhuǎn)換的方法和設(shè)備,能夠在后臺自動將視頻中的字幕格式統(tǒng)一轉(zhuǎn)換為文本格式的字幕,方便對字幕進行管理。
[0005]為達到上述目的,本發(fā)明的實施例采用如下技術(shù)方案:
[0006]第一方面,本發(fā)明的實施例提供一種字幕轉(zhuǎn)換的方法,所述方法包括:
[0007]獲取當前播放視頻的字幕的格式,所述字幕的格式包括圖片格式和文本格式;
[0008]根據(jù)所述字幕的格式判斷所述字幕是否需要進行格式轉(zhuǎn)換;
[0009]若所述字幕的格式為圖片格式,則獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將所述圖片文件轉(zhuǎn)換為文本格式字幕。
[0010]結(jié)合第一方面,在第一種可能的實現(xiàn)方式中,所述獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將所述圖片文件轉(zhuǎn)換為文本格式字幕包括:
[0011]獲取圖片格式字幕的圖片文件;
[0012]根據(jù)文本識別算法識別出所述圖片文件中的文字;
[0013]根據(jù)所述識別出的文字以及所述圖片文件對應(yīng)的時間信息生成文本格式的字幕。
[0014]結(jié)合第一方面,在第二種可能的實現(xiàn)方式中,在所述獲取當前播放視頻的字幕的格式之前,所述方法還包括:
[0015]判斷視頻文件的字幕的掛載形式;
[0016]若所述字幕的掛載形式為外掛形式或內(nèi)掛形式,則執(zhí)行所述獲取當前播放視頻的字眷的格式;
[0017]若所述字幕的掛載形式為內(nèi)嵌形式,則提取所述視頻文件的視頻幀的圖片文件。[0018]結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,所述根據(jù)文本識別算法識別出所述圖片文件中的文字包括:
[0019]對所述圖片文件進行二值化以及邊緣處理得到處理后的圖像文件;
[0020]將所述處理文件作為光學文字識別OCR算法的輸入數(shù)據(jù)獲取所述圖片文件中的文字。
[0021]結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,所述根據(jù)所述識別出的文字以及所述圖片文件對應(yīng)的時間信息生成文本格式的字幕包括:
[0022]獲取所述圖片文件對應(yīng)的時間信息;
[0023]根據(jù)文本編輯算法對所述圖片文件的文字和所述對應(yīng)的時間信息進行編輯后得到文本格式的字幕。
[0024]第二方面,本發(fā)明的實施例提供一種字幕轉(zhuǎn)換的設(shè)備,所述設(shè)備包括:
[0025]格式識別單元,用于獲取當前播放視頻的字幕的格式,所述字幕的格式包括圖片格式和文本格式;
[0026]第一判斷單元,用于根據(jù)所述字幕的格式判斷所述字幕是否需要進行格式轉(zhuǎn)換;
[0027]格式轉(zhuǎn)換單元,用于若所述字幕的格式為圖片格式,則獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將所述圖片文件轉(zhuǎn)換為文本格式字幕。
[0028]結(jié)合第二方面,在第一種可能的實現(xiàn)方式中,所述格式轉(zhuǎn)換單元包括:
[0029]圖片提取單元,用于獲取圖片格式字幕的圖片文件;
[0030]文字識別單元,用于根據(jù)文本識別算法識別出所述圖片文件中的文字;
[0031]字幕生成單元,用于根據(jù)所述識別出的文字以及所述圖片文件對應(yīng)的時間信息生成文本格式的字幕。
[0032]結(jié)合第二方面,在第二種可能的實現(xiàn)方式中,所述設(shè)備還包括:
[0033]第二判斷單元,用于在所述獲取當前播放視頻的字幕的格式之前,判斷視頻文件的字幕的掛載形式;
[0034]若所述字幕的掛載形式為外掛形式或內(nèi)掛形式,則所述格式識別單元執(zhí)行所述獲取當前播放視頻的字幕的格式;
[0035]若所述字幕的掛載形式為內(nèi)嵌形式,所述圖片提取單元還用于提取所述視頻文件的視頻幀的圖片文件。
[0036]結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,
[0037]所述文字識別單元具體用于:
[0038]對所述圖片文件進行二值化以及邊緣處理得到處理后的圖像文件;
[0039]將所述處理文件作為光學文字識別OCR算法的輸入數(shù)據(jù)獲取所述圖片文件中的文字。
[0040]結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,
[0041 ] 所述字幕生成單元具體用于:
[0042]獲取所述圖片文件對應(yīng)的時間信息;
[0043]根據(jù)文本編輯算法對所述圖片文件的文字和所述對應(yīng)的時間信息進行編輯后得到文本格式的字幕。
[0044]本發(fā)明的實施例提供一種字幕轉(zhuǎn)換的方法和設(shè)備,首先獲取當前播放視頻的字幕的格式,所述字幕的格式包括圖片格式和文本格式;然后根據(jù)所述字幕的格式判斷所述字幕是否需要進行格式轉(zhuǎn)換;若所述字幕的格式為圖片格式,則獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將所述圖片文件轉(zhuǎn)換為文本格式字幕。這樣,能夠在后臺自動將視頻中的字幕格式統(tǒng)一轉(zhuǎn)換為文本格式的字幕,方便對字幕進行管理。
【專利附圖】
【附圖說明】
[0045]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0046]圖1為本發(fā)明的實施例提供的一種字幕轉(zhuǎn)換的方法的流程示意圖一;
[0047]圖2為本發(fā)明的實施例提供的一種字幕轉(zhuǎn)換的方法的流程示意圖二 ;
[0048]圖3為本發(fā)明的實施例提供的一種字幕轉(zhuǎn)換的設(shè)備的結(jié)構(gòu)示意圖一;
[0049]圖4為本發(fā)明的實施例提供的一種字幕轉(zhuǎn)換的設(shè)備的結(jié)構(gòu)示意圖二;
[0050]圖5為本發(fā)明的實施例提供的一種字幕轉(zhuǎn)換的設(shè)備的結(jié)構(gòu)示意圖三。
【具體實施方式】
[0051]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0052]本發(fā)明的實施例提供一種字幕轉(zhuǎn)換的方法,如圖1所示,該方法包括:
[0053]101、獲取當前播放視頻的字幕的格式。
[0054]其中,字幕的格式包括圖片格式和文本格式。
[0055]102、根據(jù)字幕的格式判斷字幕是否需要進行格式轉(zhuǎn)換。
[0056]103、若字幕的格式為圖片格式,則獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將圖片文件轉(zhuǎn)換為文本格式字幕。
[0057]104、若字幕的格式為圖片格式,則字幕不需要轉(zhuǎn)換。
[0058]本發(fā)明的實施例提供一種字幕轉(zhuǎn)換的方法,首先獲取當前播放視頻的字幕的格式,字幕的格式包括圖片格式和文本格式;然后根據(jù)字幕的格式判斷字幕是否需要進行格式轉(zhuǎn)換;若字幕的格式為圖片格式,則獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將圖片文件轉(zhuǎn)換為文本格式字幕。這樣,能夠在后臺自動將視頻中的字幕格式統(tǒng)一轉(zhuǎn)換為文本格式的字幕,方便對字幕進行管理。
[0059]為了使本領(lǐng)域技術(shù)人員能夠更清楚地理解本發(fā)明實施例提供的技術(shù)方案,下面通過具體的實施例,對本發(fā)明的實施例提供的字幕轉(zhuǎn)換的方法進行詳細說明,如圖2所示,該方法包括:
[0060]201、判斷視頻文件的字幕的掛載形式。
[0061]具體的,字幕的掛載方式可以分為內(nèi)嵌形式、內(nèi)掛形式以及外掛形式。
[0062]其中,示例性的,字幕內(nèi)嵌形式是指制作視頻文件時將字幕、視頻流、音頻流一起壓制生成視頻文件,這種形式中字幕文件被集成在視頻文件的編碼流中。字幕內(nèi)掛形式是指制作視頻文件時將視頻流與音頻流已經(jīng)壓制在一起的文件以及字幕封包得到視頻文件,這種形式中字幕文件是單獨存在的。字幕外掛形式是指字幕文件、視頻流與音頻流已經(jīng)壓制在一起的文件存儲在同一個文件夾中,字幕文件按照規(guī)定的規(guī)則來命名以確保播放視頻時字幕文件可以正常加載,這種形式中,字幕文件是獨立的。
[0063]若字幕的掛載形式為外掛形式或內(nèi)掛形式,則執(zhí)行步驟202至208 ;
[0064]若字幕的掛載形式為內(nèi)嵌形式,則執(zhí)行步驟209至212。
[0065]202、獲取當前播放視頻的字幕的格式。
[0066]具體的,字幕的格式包括圖片格式和文本格式。
[0067]示例性的,圖片格式的字幕數(shù)據(jù)以圖片方式呈現(xiàn),文件體積較大,不易于修改,圖片格式字幕中最常見的字幕格式是由字幕圖片文件.sub文檔和.1dx文檔組成。文本格式的字幕數(shù)據(jù)以文本格式呈現(xiàn),文件體積較小,可直接用Windows自帶的記事本功能進行修改。文本格式字幕中最常見的字幕格式是.srt,其組成為:一行字幕序號,一行時間代碼,一行字幕文本。
[0068]203、根據(jù)字幕的格式判斷字幕是否需要進行格式轉(zhuǎn)換。
[0069]204、若字幕的格式為文本格式,則字幕不需要轉(zhuǎn)換。
[0070]若字幕的格式為圖片格式,則字幕需要轉(zhuǎn)換,執(zhí)行步驟205至208。
[0071]205、獲取圖片格式字幕的圖片文件。
[0072]具體的,字幕是圖片格式的,以圖片形式呈現(xiàn),提取字幕的圖片文件。
[0073]示例性的,可以將.sub文檔中的圖片提取后保存為.bmp格式的圖片。
[0074]206、根據(jù)文本識別算法識別出圖片文件中的文字。
[0075]具體的,對圖片文件進行二值化以及邊緣處理得到處理后的圖像文件;
[0076]將處理文件作為光學文字識別OCR算法的輸入數(shù)據(jù)獲取圖片文件中的文字。
[0077]其中,圖像二值化就是將圖像上的像素點的灰度值設(shè)置為O或255,也就是將整個圖像呈現(xiàn)出明顯的黑白效果。圖像邊緣處理是指標識數(shù)字圖像中亮度變化明顯的點。
[0078]示例性的,通過對圖片文件進行二值化處理以及邊緣處理得到處理后的圖像,將該圖像作為光學文字識別OCR算法的輸入數(shù)據(jù),通過檢測圖像中亮、暗的模式確定其形狀,然后用字符識別方法將形狀翻譯成文本。
[0079]207、獲取圖片文件對應(yīng)的時間信息。
[0080]示例性的,從圖片格式的字幕中提取的圖片文件包含有對應(yīng)的時間信息,該時間信息與字幕在視頻中的顯示時間是一一對應(yīng)的。
[0081]208、根據(jù)文本編輯算法對圖片文件的文字和對應(yīng)的時間信息進行編輯后得到文本格式的子眷。
[0082]示例性的,根據(jù)每張圖片對應(yīng)的時間信息以及從中識別出的文本,利用文本編輯算法使兩者一一對應(yīng)從而生成文本格式的字幕。
[0083]209、提取視頻文件的視頻幀的圖片文件。
[0084]示例性的,視頻文件是由一幀一幀的圖片組成的,分割視頻文件得到視頻幀的圖片文件。
[0085]210、根據(jù)文本識別算法識別出圖片文件中的文字。[0086]具體的,對圖片文件進行二值化以及邊緣處理得到處理后的圖像文件;
[0087]將處理文件作為光學文字識別OCR算法的輸入數(shù)據(jù)獲取圖片文件中的文字。
[0088]其中,圖像二值化就是將圖像上的像素點的灰度值設(shè)置為O或255,也就是將整個圖像呈現(xiàn)出明顯的黑白效果。圖像邊緣護理是指標識數(shù)字圖像中亮度變化明顯的點。
[0089]示例性的,通過對圖片文件進行二值化處理以及邊緣處理得到處理后的圖像,將該圖像作為光學文字識別OCR (Optical Character Recognition)算法的輸入數(shù)據(jù),通過檢測圖像中亮、暗的模式確定其形狀,然后用字符識別方法將形狀翻譯成文本。
[0090]211、獲取圖片文件對應(yīng)的時間信息。
[0091]示例性的,從圖片格式的字幕中提取的圖片文件包含有對應(yīng)的時間信息,該時間信息與字幕在視頻中的顯示時間是一一對應(yīng)的。
[0092]212、根據(jù)文本編輯算法對圖片文件的文字和對應(yīng)的時間信息進行編輯后得到文本格式的子眷。
[0093]示例性的,根據(jù)每張圖片對應(yīng)的時間信息以及從中識別出的文本,利用文本編輯算法使兩者一一對應(yīng)從而生成文本格式的字幕。
[0094]本發(fā)明的實施例提供一種字幕轉(zhuǎn)換的方法,判斷視頻文件的字幕的掛載形式,若字幕的掛載形式為外掛形式或內(nèi)掛形式,則獲取當前播放視頻的字幕的格式,然后根據(jù)字幕的格式判斷字幕是否需要進行格式轉(zhuǎn)換,若字幕的格式為圖片格式,則獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將圖片文件轉(zhuǎn)換為文本格式字幕;若字幕的掛載形式為內(nèi)嵌形式,則提取視頻文件的視頻幀的圖片文件并根據(jù)轉(zhuǎn)換算法將圖片文件轉(zhuǎn)換為文本格式字幕。這樣,能夠在后臺自動將視頻中的字幕格式統(tǒng)一轉(zhuǎn)換為文本格式的字幕,方便對字幕進行管理。
[0095]本發(fā)明的實施例提供一種字幕轉(zhuǎn)換的設(shè)備00,如圖3所示,該設(shè)備00包括:
[0096]格式識別單元10,用于獲取當前播放視頻的字幕的格式,字幕的格式包括圖片格式和文本格式。
[0097]第一判斷單元20,用于根據(jù)字幕的格式判斷字幕是否需要進行格式轉(zhuǎn)換。
[0098]格式轉(zhuǎn)換單元30,用于若字幕的格式為圖片格式,則獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將圖片文件轉(zhuǎn)換為文本格式字幕。
[0099]可選的,如圖4所示,格式轉(zhuǎn)換單元30包括:
[0100]圖片提取單元31,用于獲取圖片格式字幕的圖片文件。
[0101]文字識別單元32,用于根據(jù)文本識別算法識別出圖片文件中的文字。
[0102]字幕生成單元33,用于根據(jù)識別出的文字以及圖片文件對應(yīng)的時間信息生成文本格式的字幕。
[0103]可選的,如圖5所示,該設(shè)備00還包括:
[0104]第二判斷單元40,用于在獲取當前播放視頻的字幕的格式之前,判斷視頻文件的字幕的掛載形式。
[0105]若字幕的掛載形式為外掛形式或內(nèi)掛形式,則格式識別單元10執(zhí)行獲取當前播放視頻的字幕的格式。
[0106]若字幕的掛載形式為內(nèi)嵌形式,圖片提取單元31還用于提取視頻文件的視頻幀的圖片文件。[0107]可選的,文字識別單元32具體用于:
[0108]對圖片文件進行二值化以及邊緣處理得到處理后的圖像文件;
[0109]將處理文件作為光學文字識別OCR算法的輸入數(shù)據(jù)獲取圖片文件中的文字。
[0110]可選的,字幕生成單元33具體用于:
[0111]獲取圖片文件對應(yīng)的時間信息;
[0112]根據(jù)文本編輯算法對圖片文件的文字和對應(yīng)的時間信息進行編輯后得到文本格
式的子眷。
[0113]本發(fā)明的實施例提供一種字幕轉(zhuǎn)換的設(shè)備,判斷視頻文件的字幕的掛載形式,若字幕的掛載形式為外掛形式或內(nèi)掛形式,則獲取當前播放視頻的字幕的格式,然后根據(jù)字幕的格式判斷字幕是否需要進行格式轉(zhuǎn)換,若字幕的格式為圖片格式,則獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將圖片文件轉(zhuǎn)換為文本格式字幕;若字幕的掛載形式為內(nèi)嵌形式,則提取視頻文件的視頻幀的圖片文件并根據(jù)轉(zhuǎn)換算法將圖片文件轉(zhuǎn)換為文本格式字幕。這樣,能夠在后臺自動將視頻中的字幕格式統(tǒng)一轉(zhuǎn)換為文本格式的字幕,方便對字幕進行管理。
[0114]需要說明的是,本發(fā)明實施例提供的字幕轉(zhuǎn)換的方法步驟的先后順序可以進行適當調(diào)整,步驟也可以根據(jù)情況進行相應(yīng)增減,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化的方法,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi),因此不再贅述。
[0115]通過以上的實施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,僅以上述各功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。
[0116]在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。
[0117]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
[0118]另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理包括,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
[0119]所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM, Read-Only Memory)、隨機存取存儲器(RAM, Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
[0120]以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準。
【權(quán)利要求】
1.一種字幕轉(zhuǎn)換的方法,其特征在于,包括: 獲取當前播放視頻的字幕的格式,所述字幕的格式包括圖片格式和文本格式; 根據(jù)所述字幕的格式判斷所述字幕是否需要進行格式轉(zhuǎn)換; 若所述字幕的格式為圖片格式,則獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將所述圖片文件轉(zhuǎn)換為文本格式字幕。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將所述圖片文件轉(zhuǎn)換為文本格式字幕包括: 獲取圖片格式字幕的圖片文件; 根據(jù)文本識別算法識別出所述圖片文件中的文字; 根據(jù)所述識別出的文字以及所述圖片文件對應(yīng)的時間信息生成文本格式的字幕。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述獲取當前播放視頻的字幕的格式之前,所述方法還包括: 判斷視頻文件的字幕的掛載形式; 若所述字幕的掛載形式為外掛形式或內(nèi)掛形式,則執(zhí)行所述獲取當前播放視頻的字幕的格式; 若所述字幕的掛載形式為內(nèi)嵌形式,則提取所述視頻文件的視頻幀的圖片文件。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)文本識別算法識別出所述圖片文件中的文字包括:` 對所述圖片文件進行二值化以及邊緣處理得到處理后的圖像文件; 將所述處理文件作為光學文字識別OCR算法的輸入數(shù)據(jù)獲取所述圖片文件中的文字。
5.根據(jù)權(quán)利要求2所述的方法,所述根據(jù)所述識別出的文字以及所述圖片文件對應(yīng)的時間信息生成文本格式的字幕包括: 獲取所述圖片文件對應(yīng)的時間信息; 根據(jù)文本編輯算法對所述圖片文件的文字和所述對應(yīng)的時間信息進行編輯后得到文本格式的字幕。
6.一種字幕轉(zhuǎn)換的設(shè)備,其特征在于,包括: 格式識別單元,用于獲取當前播放視頻的字幕的格式,所述字幕的格式包括圖片格式和文本格式; 第一判斷單元,用于根據(jù)所述字幕的格式判斷所述字幕是否需要進行格式轉(zhuǎn)換; 格式轉(zhuǎn)換單元,用于若所述字幕的格式為圖片格式,則獲取圖片格式字幕的圖片文件并根據(jù)轉(zhuǎn)換算法將所述圖片文件轉(zhuǎn)換為文本格式字幕。
7.根據(jù)權(quán)利要求6所述的設(shè)備,其特征在于,所述格式轉(zhuǎn)換單元包括: 圖片提取單元,用于獲取圖片格式字幕的圖片文件; 文字識別單元,用于根據(jù)文本識別算法識別出所述圖片文件中的文字; 字幕生成單元,用于根據(jù)所述識別出的文字以及所述圖片文件對應(yīng)的時間信息生成文本格式的子眷。
8.根據(jù)權(quán)利要求6所述的設(shè)備,其特征在于,所述設(shè)備還包括: 第二判斷單元,用于在所述獲取當前播放視頻的字幕的格式之前,判斷視頻文件的字幕的掛載形式;若所述字幕的掛載形式為外掛形式或內(nèi)掛形式,則所述格式識別單元執(zhí)行所述獲取當前播放視頻的字幕的格式; 若所述字幕的掛載形式為內(nèi)嵌形式,所述圖片提取單元還用于提取所述視頻文件的視頻幀的圖片文件。
9.根據(jù)權(quán)利要求7所述的設(shè)備,其特征在于,所述文字識別單元具體用于: 對所述圖片文件進行二值化以及邊緣處理得到處理后的圖像文件; 將所述處理文件作為光學文字識別OCR算法的輸入數(shù)據(jù)獲取所述圖片文件中的文字。
10.根據(jù)權(quán)利要求7所述的設(shè)備,其特征在于,所述字幕生成單元具體用于: 獲取所述圖片文件對應(yīng)的時間信息; 根據(jù)文本編輯算法對所述圖片文件的文字和所述對應(yīng)的時間信息進行編輯后得到文本格式的字幕。
【文檔編號】H04N21/435GK103716655SQ201310700679
【公開日】2014年4月9日 申請日期:2013年12月16日 優(yōu)先權(quán)日:2013年12月16日
【發(fā)明者】肖希哲 申請人:樂視致新電子科技(天津)有限公司