視頻轉碼方法和裝置的制造方法
【專利摘要】本發(fā)明實施例提供一種視頻轉碼方法和裝置,用以解決現(xiàn)有技術中經過采樣后屏幕視頻的內容變得模糊不清,導致用戶觀看時無法清晰地觀看視頻內容,降低用戶體驗的問題。其中,方法包括:對原始視頻進行識別,確定所述原始視頻是否為屏幕視頻;若所述原始視頻為屏幕視頻,則按照所述原始視頻的分辨率對所述原始視頻進行轉碼處理。本發(fā)明實施例無需對屏幕視頻進行采樣,轉碼得到的視頻的內容不會變模糊,從而保證用戶觀看時能夠清晰地觀看視頻內容,提升用戶體驗。
【專利說明】
視頻轉碼方法和裝置
技術領域
[0001] 本發(fā)明實施例設及對媒體技術領域,尤其設及一種視頻轉碼方法和裝置。
【背景技術】
[0002] 隨著多媒體技術的迅速發(fā)展,用戶可W通過各種播放終端觀看各式各樣的視頻。 W視頻網站為例,視頻網站中提供大量的視頻資源供用戶觀看,用戶可W選擇視頻網站中 推薦的視頻進行播放,還可W在視頻網站上捜索需要觀看的視頻,得到捜索結果后即可在 該視頻網站上播放捜索到的視頻,滿足了用戶的各種需求。目前視頻網站上還可W提供大 量的屏幕視頻,屏幕視頻是指通過軟件對計算機屏幕的操作情況進行錄制形成的視頻,例 如隨著在線教育的快速發(fā)展,大量的教育類屏幕視頻被制作并在互聯(lián)網上傳播,此類屏幕 視頻的內容包括PPT講解,應用軟件教學等等,用戶在觀看屏幕視頻時,需要從視頻中獲取 知識,聽講解的同時需要認真觀看視頻內容,因此就要求屏幕視頻的內容清晰。
[0003] 現(xiàn)有技術中,為了進一步提升用戶體驗,更大程度地滿足用戶需求,視頻網站還可 W針對原始視頻進行視頻轉碼,W將原始視頻轉換得到多種適合不同網絡帶寬的格式(檔 次),如兼容、標清、高清、超清等格式,各種格式對應的分辨率和碼率不同,用戶在觀看視 頻時可W根據(jù)網絡帶寬的情況選擇相應的格式播放。在傳統(tǒng)的視頻轉碼過程中,對于適合 大帶寬格式的視頻,轉碼得到的視頻分辨率和碼率大;對于適合小帶寬格式的視頻,轉碼得 到的視頻分辨率和碼率小,因此在轉碼過程中需要對原始視頻進行采樣W達到不同的分辨 率。
[0004] 但是,對于屏幕視頻而言,如果采用上述轉碼方式,則經過采樣后屏幕視頻的內容 會變得模糊不清,因此將導致用戶觀看時無法清晰地觀看視頻內容,降低用戶體驗。
【發(fā)明內容】
陽〇化]本發(fā)明實施例提供一種視頻轉碼方法和裝置,用W解決現(xiàn)有技術中經過采樣后屏 幕視頻的內容變得模糊不清,導致用戶觀看時無法清晰地觀看視頻內容,降低用戶體驗的 問題。
[0006] 本發(fā)明實施例提供一種視頻轉碼方法,包括: 陽007] 對原始視頻進行識別,確定所述原始視頻是否為屏幕視頻;
[0008] 若所述原始視頻為屏幕視頻,則按照所述原始視頻的分辨率對所述原始視頻進行 轉碼處理。
[0009] 本發(fā)明實施例提供一種視頻轉碼裝置,包括:
[0010] 視頻識別模塊,用于對原始視頻進行識別,確定所述原始視頻是否為屏幕視頻;
[0011] 屏幕視頻轉碼模塊,用于在所述視頻識別模塊識別出所述原始視頻為屏幕視頻 時,按照所述原始視頻的分辨率對所述原始視頻進行轉碼處理。
[0012] 本發(fā)明實施例提供的視頻轉碼方法和裝置,在對原始視頻進行轉碼時,并非直接 按照轉碼的目標格式對應的分辨率進行轉碼,而是先對原始視頻進行識別,確定原始視頻 是否為屏幕視頻,如果確定出原始視頻為屏幕視頻,則按照原始視頻的分辨率對原始視頻 進行轉碼處理,也即采用不改變原始視頻的分辨率的形式進行轉碼,因此,無需對屏幕視頻 進行采樣,轉碼得到的視頻的內容不會變模糊,從而保證用戶觀看時能夠清晰地觀看視頻 內容,提升用戶體驗。
【附圖說明】
[0013] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可W根 據(jù)運些附圖獲得其他的附圖。
[0014] 圖1為本發(fā)明實施例一的一種視頻轉碼方法的步驟流程圖;
[0015] 圖2為本發(fā)明實施例二的一種視頻轉碼方法的步驟流程圖;
[0016] 圖3為本發(fā)明實施例=的一種視頻轉碼裝置的結構框圖;
[0017] 圖4為本發(fā)明實施例四的一種視頻轉碼裝置的結構框圖。
【具體實施方式】
[0018] 為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0019] 實施例一
[0020] 參照圖1,示出了本發(fā)明實施例一的一種視頻轉碼方法的步驟流程圖。
[0021] 本實施例的視頻轉碼方法可W包括W下步驟:
[0022] 步驟101,對原始視頻進行識別,確定原始視頻是否為屏幕視頻。
[0023] 本發(fā)明實施例W視頻網站的視頻轉碼為例進行說明。視頻網站的服務器中可W保 存多個原始視頻的資源,服務器可W對原始視頻進行視頻轉碼處理,W得到多種適合不同 帶寬的格式的視頻,用戶可W根據(jù)網絡帶寬的狀態(tài)在視頻網站的客戶端中選擇對應格式的 視頻進行播放。
[0024] 本發(fā)明實施例中,針對屏幕視頻類的原始視頻,將采用特定的視頻轉碼方式,因 此,在轉碼之前先對原始視頻進行識別,W確定原始視頻是否為屏幕視頻,如果原始視頻是 屏幕視頻,則將采用步驟102中的特定方式進行視頻轉碼,如果原始視頻是非屏幕視頻,貝U 無需采用步驟102中的設定方式進行轉碼(具體過程將在實施例二中進行描述)。其中,屏 幕視頻是指通過軟件對計算機屏幕的操作情況進行錄制形成的視頻。
[0025] 步驟102,若原始視頻為屏幕視頻,則按照原始視頻的分辨率對原始視頻進行轉碼 處理。
[00%] 如果在步驟101中識別出原始視頻為屏幕視頻,則在轉碼處理過程中并非按照目 標格式的視頻的分辨率進行轉碼,而是將按照原始視頻的分辨率對原始視頻進行轉碼處 理,得到多種適合不同帶寬的格式的視頻。視頻轉碼處理是指將已經壓縮編碼的視頻碼流 轉換成另一個視頻碼流,W適應不同的網絡帶寬、不同的終端處理能力和不同的用戶需求, 轉碼本質上是一個先解碼,再編碼的過程,在得到目標碼流之后,對于對原始視頻進行轉碼 處理的具體過程,本領域技術人員根據(jù)實際經驗進行相關處理即可,本發(fā)明實施例在此不 再詳細論述。
[0027] 本發(fā)明實施例在對原始視頻進行轉碼時,并非直接按照轉碼的目標格式對應的分 辨率進行轉碼,而是先對原始視頻進行識別,確定原始視頻是否為屏幕視頻,如果確定出原 始視頻為屏幕視頻,則按照原始視頻的分辨率對原始視頻進行轉碼處理,也即采用不改變 原始視頻的分辨率的形式進行轉碼,因此,無需對屏幕視頻進行采樣,轉碼得到的視頻的內 容不會變模糊,從而保證用戶觀看時能夠清晰地觀看視頻內容,提升用戶體驗。 W28] 實施例二
[0029] 參照圖2,示出了本發(fā)明實施例二的一種視頻轉碼方法的步驟流程圖。
[0030] 本實施例的視頻轉碼方法可W包括W下步驟:
[0031] 步驟201,對原始視頻進行識別,確定原始視頻是否為屏幕視頻。
[0032] 本發(fā)明實施例中在對原始視頻進行轉碼處理之前先對原始視頻進行識別,W確定 原始視頻的類型,即確定原始視頻是否為屏幕視頻,根據(jù)識別結果的不同選用不同的轉碼 方式進行處理,如果確定出為屏幕視頻,則執(zhí)行步驟202的方式對原始視頻進行轉碼處理; 如果確定出為非屏幕視頻,則執(zhí)行步驟203的方式對原始視頻進行轉碼處理。
[0033] 優(yōu)選地,本發(fā)明實施例中,可W在對原始視頻進行識別之前,預先訓練生成視頻識 別模型,在對原始視頻進行識別時,利用該視頻識別模型進行識別。下面,具體介紹如何訓 練生成視頻識別模型。
[0034] 優(yōu)選地,本發(fā)明實施例可W采用SVM(Support Vector Machine,支持向量機)的方 式生成視頻識別模型,SVM是一種有監(jiān)督的機器學習方法,通常用來進行模式識別、分類、W 及回歸分析等,使用SVM生成模型的步驟包括:樣本準備與特征提取一訓練模型,因此,本 實施例中訓練生成視頻識別模型的過程可W包括W下步驟:
[0035] 步驟Al,獲取樣本視頻,并提取樣本視頻的樣本特征參數(shù)。
[0036] 可W從全網的視頻資源中獲取部分視頻作為樣本視頻,一個樣本視頻即指一個視 頻文件,樣本視頻中的屏幕視頻和非屏幕視頻的數(shù)量可W相同,也可W不同。例如,可W從 全網的視頻資源中獲取5000個樣本視頻,其中正樣本(屏幕視頻)2500個,負樣本(非屏 幕視頻)2500個,樣本視頻的時長隨機,內容隨機。
[0037] 經過對屏幕視頻和非屏幕視頻的特征進行分析發(fā)現(xiàn),屏幕視頻與非屏幕視頻的 明顯區(qū)別是屏幕視頻的帖間信息變化很小,因此本發(fā)明W此特征作為訓練的特征,進一步 地,考慮到對于樣本視頻的每一帖視頻圖像,當樣本視頻采用YUV420(其中Y表示亮度 (Luminance或Luma),也就是灰階值;U和V表示色度(化rominance或化roma))等格式時, 特征參數(shù)的維數(shù)為m = widthXhei曲t X 2,其中width和hei曲t分別表示一帖視頻圖像的 寬度和高度,但是該種數(shù)據(jù)量較大,處理過程較為復雜,因此本發(fā)明實施例對特征參數(shù)進行 降維處理,W帖間的亮度變化衡量帖間信息變化。
[0038] 因此,該步驟Al中提取樣本視頻的樣本特征參數(shù)的過程可W包括:
[0039] All,針對每個樣本視頻,分別提取當前樣本視頻中的每帖視頻圖像的亮度分量, 即Y分量。
[0040] Y分量表示的是一帖視頻圖像的亮度分量,Y分量是一個二維矩陣,矩陣的寬度和 高度與對應的一帖視頻圖像的寬度和高度一致,也即視頻圖像中的一個像素對應二維矩陣 中的一個元素。例如,視頻圖像的寬度和高度像素值為640X480,則該帖視頻圖像對應的Y 分量即為一個包括640行X 480列個元素的而為矩陣。
[0041] A12,針對每個樣本視頻,計算當前樣本視頻的全部視頻圖像中每兩帖相鄰的視頻 圖像的亮度分量的差值,并計算全部差值的平均值mean。
[0042] 通過W下公式1計算平均值mean :
[0043]
[0044] 公式1中,n表示當前樣本視頻的全部視頻圖像的總帖數(shù),Yi表示當前樣本視頻的 第i帖視頻圖像的亮度分量,Yw表示當前樣本視頻的第i+1帖視頻圖像的亮度分量。
[0045] A13,針對每個樣本視頻,依據(jù)當前樣本視頻對應的上述平均值計算當前樣本視頻 的全部視頻圖像的亮度分量的標準偏差sd。
[0046] 通過W下公式2計算平均值標準偏差Sd :
[0047]
[0048] 針對每個樣本視頻,計算出當前樣本視頻對應的平均值和標準偏差后,即可將平 均值和標準偏差作為當前樣本視頻對應的樣本特征參數(shù),此時特征的維數(shù)是2,與上述維 數(shù)m相比,大大降低了運算的復雜度。經過上述過程,得到了每個樣本視頻的樣本特征參 數(shù)(每個樣本視頻對應有平均值和標準偏差運兩個樣本特征參數(shù)),然后可W獲取全部樣 本視頻的樣本特征參數(shù)中的最小參數(shù)值min值)和最大參數(shù)值max值),也即,獲取全部樣本 視頻的平均值中的最小值和最大值,W及獲取全部樣本視頻的標準偏差中的最小值和最大 值。
[0049] 需要說明的是,本發(fā)明實施例中樣本視頻的樣本特征參數(shù)并不限定于上述平均值 和標準偏差兩種,將其他適用的參數(shù)作為樣本特征參數(shù)也是可行的,如針對每個樣本視頻, 計算當前樣本視頻的全部視頻圖像中每兩帖相鄰的視頻圖像的亮度分量的差值,并計算全 部差值的總和值,將該總和值作為當前樣本視頻對應的樣本特征參數(shù),等等。
[0050] 步驟A2,根據(jù)各個樣本視頻的樣本特征參數(shù)進行訓練,生成視頻識別模型。
[0051] 優(yōu)選地,本發(fā)明實施例使用的SVM類型可W是非線性軟間隔支持向量分類機 (C-SVC)。因此,該步驟A2可W包括:
[0052] A21,針對每個樣本視頻,分別對當前樣本視頻的樣本特征參數(shù)進行縮放處理。
[0053] 在訓練過程中,可W先將上述步驟Al中得到的各個樣本視頻的樣本特征參數(shù) mean和Sd分別進行縮放處理即歸一化處理,W使樣本特征參數(shù)縮放到[L,U]之間,進行縮 放處理可W避免一些樣本特征參數(shù)范圍過大,另一些樣本特征參數(shù)范圍過小而導致數(shù)據(jù)集 不平衡,還可W避免在計算核函數(shù)時計算過程復雜。本發(fā)明實施例中,對平均值和標準偏 差兩個樣本特征參數(shù)的縮放處理過程相同,針對一個樣本特征參數(shù)的縮放處理過程可W包 括:
[0054] A211,獲取設定的最小縮放值和最大縮放值,W及獲取上述多個樣本視頻的樣本 特征參數(shù)中的最小參數(shù)值和最大參數(shù)值。 陽化5] 在縮放時可W將特征參數(shù)縮放到[-1,1]或者[0,1]之間等,如果選取縮放到[-1, 1]之間,則最小縮放值L = -1,最大縮放值U = 1 ;如果選取縮放到[0,1]之間,則最小縮 放值L = 0,最大縮放值U = 1。在獲取到上述多個樣本視頻的樣本特征參數(shù)中的最小參數(shù) 值minO))和最大參數(shù)值maxO)后,還可W將maxO)及minO))保存到文件中,W供后續(xù)對 原始視頻進行識別時使用。
[0056] A212,依據(jù)最小縮放值和最大縮放值,W及最小參數(shù)值和最大參數(shù)值,對當前樣本 視頻的樣本特征參數(shù)進行縮放處理。
[0057] 按照如下公式3進行縮放處理:
[0058]
[0059] 公式3中,L為最小縮放值,U為最大縮放值,min值)為最小參數(shù)值,max值)為最 大參數(shù)值,D為當前樣本視頻的特征參數(shù),D ^為縮放處理后的樣本特征參數(shù)。
[0060] A22,依據(jù)縮放處理后的樣本特征參數(shù)進行訓練,生成視頻識別模型。
[0061] 首先,計算得到視頻識別模型的相關參數(shù)a^^和b^^其中,〇>^表示的是分類直線 的斜率,1/表示的是分類直線的偏移量。 W創(chuàng)
公式4
[0063] 公式4中的參數(shù)W的計算如公式5所示:
[0064]
W65] 公式4的對偶問題如公式6所示:
[0066]
公式 6
[0067] K(Xi,x,)表示核函數(shù),本發(fā)明實施例中的核函數(shù)可W選用RBF核函數(shù)(Radial Basis化nction,徑向基核函數(shù)),核函數(shù)如公式7所示:
[0068]
公式 7 陽069] 其中,C表示懲罰參數(shù),e 1表示第i個樣本視頻對應的松弛變量,X 1表示第i個樣 本視頻對應的縮放處理后的樣本特征參數(shù),表示第i個樣本視頻的類型(即樣本視頻是 屏幕視頻還是非屏幕視頻,例如可W設置1表示屏幕視頻,-1表示非屏幕視頻等),X,表示 第j個樣本視頻對應的縮放處理后的樣本特征參數(shù),y,表示第j個樣本視頻的類型,O為 核函數(shù)的可調參數(shù),1表示樣本視頻的總個數(shù),符號"M 11"表示范數(shù)。
[0070] 根據(jù)上述公式4-公式7可W計算得出公式6的最優(yōu)解,如公式8所示:
[00川 曰*=(曰1*,...,曰1*)T公式8 陽0巧根據(jù)a呵W計算得到b %如公式9所示: 陽07引
公式9
[0074] 公式9中,通過從a *中選取一個正分量0 < a /< C得到j的數(shù)值。
[0075] 本發(fā)明實施例中,可朗尋上述的懲罰參數(shù)C的初始值設置為0. 1,將RBF核函數(shù)的 參數(shù)O的初始值設置為le-5,經過上述公式4-公式9,可W計算得到視頻識別模型的相關 參數(shù)〇>^和13%對于計算參數(shù)〇>^和13"^勺具體過程,本領域技術人員根據(jù)實際經驗進行相關 處理即可,本發(fā)明實施例在此不再詳細論述。
[0076] 其次,根據(jù)上述相關參數(shù)a 和b巧P可得到如公式10所示的視頻識別模型:
[0077]
公式 10
[0078] 優(yōu)選地,為了提高訓練模型的泛化能力,本發(fā)明實施例還可W針對該視頻識別模 型,選用K折交叉驗證化-folder cross-validation)的方法尋找參數(shù)O與C的最優(yōu)值, 例如可W選取折數(shù)k為5,懲罰參數(shù)C的范圍設置為[0. 1,500],核函數(shù)的參數(shù)O的范圍設 置為[le-5,4]。驗證過程中O與0的步長均選擇5,則進行K折交叉驗證后得到最優(yōu)參數(shù) 為C = 312. 5, O = 3. 90625,在得到上述最優(yōu)參數(shù)后,再基于最優(yōu)參數(shù)對樣本視頻進行訓 練,得到視頻識別模型的相關參數(shù)a嘴b %并得到上述公式7所示的視頻識別模型,并將 該視頻識別模型保存到文件中。
[0079] 在通過上述方式生成視頻識別模型之后,即可采用該視頻識別模型對原始視頻進 行識別。
[0080] 優(yōu)選地,步驟201可W包括W下子步驟:
[0081] 子步驟al,獲取原始視頻對應的原始特征參數(shù)。
[0082] 優(yōu)選地,該子步驟al可W包括W下子步驟:
[0083] 子步驟all,分別提取原始視頻中的每帖視頻圖像的亮度分量。
[0084] 子步驟al2,計算原始視頻的全部視頻圖像中每兩帖相鄰的視頻圖像的亮度分量 的差值,并計算全部差值的平均值。該子步驟al2可W采用上述公式I計算平均值。
[00化]子步驟al3,依據(jù)平均值計算全部視頻圖像的亮度分量的標準偏差。該子步驟al3 可W采用上述公式2計算標準偏差。
[0086] 計算出原始視頻對應的平均值和標準偏差,即可將該平均值和標準偏差作為該原 始視頻對應的原始特征參數(shù)。
[0087] 該子步驟al的具體過程與上述針對每個樣本視頻提取樣本特征參數(shù)的具體過程 基本相似,具體參照上述相關描述即可,本發(fā)明實施例在此不再詳細論述。
[0088] 子步驟曰2,將原始特征參數(shù)進行縮放處理,W使原始特征參數(shù)縮放到設定范圍內。
[0089] 優(yōu)選地,該子步驟a2可W包括W下子步驟:
[0090] 子步驟a21,獲取設定的最小縮放值和最大縮放值,W及獲取預設的多個樣本視頻 的樣本特征參數(shù)中的最小參數(shù)值和最大參數(shù)值.
[0091] 子步驟a22,依據(jù)最小縮放值和最大縮放值,W及最小參數(shù)值和最大參數(shù)值,對原 始特征參數(shù)進行縮放處理。
[0092] 該子步驟a22可W采用上述公式3計算縮放處理后的原始特征參數(shù),即根據(jù)如下 公式將原始特征參數(shù)進行縮放處理:
[0093]
[0094] 其中,L為最小縮放值,U為最大縮放值,min (D)為最小參數(shù)值,max (D)為最大參 數(shù)值,D為原始特征參數(shù),D ^為縮放處理后的原始特征參數(shù)。
[00巧]該子步驟al與上述步驟A21基本相似,相關之處參照上述參照步驟A21的相關描 述即可,本發(fā)明實施例在此不再詳細論述。
[0096] 子步驟曰3,將縮放處理后的原始特征參數(shù)作為預先訓練得到的視頻識別模型的輸 入,獲取視頻識別模型的輸出結果,其中輸出結果用于指示原始視頻是否為屏幕視頻。
[0097] 將縮放處理后的原始特征參數(shù)作為上述公式10所示的視頻識別模型的輸入,即 公式10中的X表示原始視頻對應的縮放處理后的樣本特征參數(shù),公式10中的Sgn函數(shù)返 回表示數(shù)字符號的整數(shù),公式10的輸出結果即可指示原始視頻是否為屏幕視頻,如輸出結 果為1表示屏幕視頻,輸出結果為-1表示非屏幕視頻等。
[0098] 例如,原始視頻為視頻A,首先獲取視頻A對應的原始特征參數(shù)為m(平均值)和 n (標準偏差),然后將m和n分別進行縮放處理,m縮放處理后得到m ^,n縮放處理后得到 n ^ ;后續(xù)在利用公式10所示的視頻識別模型對視頻A進行識別時,將矩陣虹^,n^ ]作 為公式10中的X,計算得到輸出結果f (X),如果f (X)為1則表示視頻A為屏幕視頻,如果 f (X)為-1則表示視頻A為非屏幕視頻。
[0099] 步驟202,若原始視頻為屏幕視頻,則按照原始視頻的分辨率對原始視頻進行轉碼 處理。
[0100] 如果在步驟201中識別出原始視頻為屏幕視頻,則為了避免在視頻轉碼過程中對 屏幕視頻進行采樣而導致轉碼后得到的屏幕視頻變模糊,本發(fā)明實施例中針對該種類型的 原始視頻,將按照原始視頻的分辨率對原始視頻進行轉碼處理。 陽101] 優(yōu)選地,該步驟202中按照原始視頻的分辨率對原始視頻進行轉碼處理的過程可 W包括:針對設定的每種目標格式,保持原始視頻的分辨率不變,將原始視頻轉碼為目標格 式的視頻。對于一個原始視頻,可W將其轉碼為多種不同目標格式的視頻,如表一所示,可 W將原始視頻轉碼為兼容、急速、標清、高清、超清、720PU080P運屯種檔次(即目標格式) 的視頻,轉碼得到的每種檔次的視頻的分辨率和帖率均為隨源(隨源是指與原始視頻相 同),每種檔次的視頻的碼率通過將原始視頻的碼率度itrate)乘上一個對應的系數(shù)(具體 系數(shù)如表一所示)計算得到,且視頻的碼率對應有最大碼率和最小碼率,如果計算得到某 種檔次的視頻的碼率超出了最大碼率和最小碼率之間的范圍,則選用最大碼率和最小碼率 之間的某個碼率作為該種檔次的視頻的碼率。通過該種轉碼方式,在轉碼過程中無需對原 始視頻進行采樣處理,因此不會導致采樣后視頻內容(如文字等)的清晰度降低。 陽 1021
[(
陽104] 表一
[0105] 步驟203,若原始視頻為非屏幕視頻,則按照設定的目標格式對應的分辨率對原始 視頻進行轉碼處理。 陽106] 如果在步驟201中識別出原始視頻為非屏幕視頻,則考慮到用戶觀看非屏幕視頻 時對文字等內容的清晰度要求相比于屏幕視頻來說較低,若對非屏幕視頻仍然采用上述步 驟202的方式進行轉碼,則將造成很大的帶寬浪費,因此,本發(fā)明實施例中針對非屏幕視頻 類型的原始視頻,將不再采用上述屏幕視頻的轉碼方法,而是按照設定的目標格式對應的 分辨率對原始視頻進行轉碼處理。 陽107] 優(yōu)選地,該步驟203中按照設定的目標格式對應的分辨率對原始視頻進行轉碼處 理的過程可W包括:針對設定的每種目標格式,將原始視頻的分辨率修改為目標格式對應 的分辨率,W將原始視頻轉碼為目標格式的視頻。針對每種目標格式,可W分別設定其對應 的分辨率,在轉碼過程中將對原始視頻進行采樣W達到目標格式對應的分辨率,例如,如果 目標格式對應的分辨率小于原始視頻的分辨率,則將原始視頻進行下采樣處理W降低分辨 率,如果目標格式對應的分辨率大于原始視頻的分辨率,則將原始視頻進行上采樣處理W 提高分辨率。對于具體的轉碼處理過程,本領域技術人員根據(jù)實際經驗進行相關處理即可, 本發(fā)明實施例在此不再詳細論述。
[0108] 本發(fā)明實施例自動對原始視頻進行識別,對屏幕視頻類的原始視頻采用保持原始 分辨率不變的視頻轉碼方式,對非屏幕視頻類的原始視頻采用改變分辨率的視頻轉碼方 式,因此對于屏幕視頻能夠能保證轉碼后的視頻在小帶寬的情況下依舊保持文字等內容的 清晰度,提升用戶體驗,對于非屏幕視頻能夠避免帶寬的浪費。 陽109] 對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但 是本領域技術人員應該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某 些步驟可W采用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描 述的實施例均屬于優(yōu)選實施例,所設及的動作和模塊并不一定是本發(fā)明所必須的。
[0110] 實施例S 陽111] 參照圖3,示出了本發(fā)明實施例=的一種視頻轉碼裝置的結構框圖。
[0112] 本實施例的視頻轉碼裝置可W包括W下模塊:
[0113] 視頻識別模塊301,用于對原始視頻進行識別,確定原始視頻是否為屏幕視頻;
[0114] 屏幕視頻轉碼模塊302,用于在視頻識別模塊識別出原始視頻為屏幕視頻時,按照 原始視頻的分辨率對原始視頻進行轉碼處理。
[0115] 本發(fā)明實施例在對原始視頻進行轉碼時,并非直接按照轉碼的目標格式對應的分 辨率進行轉碼,而是先對原始視頻進行識別,確定原始視頻是否為屏幕視頻,如果確定出原 始視頻為屏幕視頻,則按照原始視頻的分辨率對原始視頻進行轉碼處理,也即采用不改變 原始視頻的分辨率的形式進行轉碼,因此,無需對屏幕視頻進行采樣,轉碼得到的視頻的內 容不會變模糊,從而保證用戶觀看時能夠清晰地觀看視頻內容,提升用戶體驗。 陽116] 實施例四
[0117] 參照圖4,示出了本發(fā)明實施例四的一種視頻轉碼裝置的結構框圖。
[0118] 本實施例的視頻轉碼裝置可W包括W下模塊:
[0119] 視頻識別模塊401,用于對原始視頻進行識別,確定原始視頻是否為屏幕視頻;
[0120] 屏幕視頻轉碼模塊402,用于在視頻識別模塊識別出原始視頻為屏幕視頻時,按照 原始視頻的分辨率對原始視頻進行轉碼處理。 陽121] 優(yōu)選地,視頻轉碼裝置還可W包括:非屏幕視頻轉碼模塊403,用于在視頻識別模 塊識別出原始視頻為非屏幕視頻時,按照設定的目標格式對應的分辨率對原始視頻進行轉 碼處理。
[0122] 優(yōu)選地,屏幕視頻轉碼模塊402,具體用于針對設定的每種目標格式,保持原始視 頻的分辨率不變,將原始視頻轉碼為目標格式的視頻。 陽123] 優(yōu)選地,視頻識別模塊401可W包括W下子模塊:獲取子模塊,用于獲取原始視頻 對應的原始特征參數(shù);縮放子模塊,用于將原始特征參數(shù)進行縮放處理,W使原始特征參數(shù) 縮放到設定范圍內;識別子模塊,用于將縮放處理后的原始特征參數(shù)作為預先訓練得到的 視頻識別模型的輸入,獲取視頻識別模型的輸出結果,其中輸出結果用于指示原始視頻是 否為屏幕視頻。
[0124] 優(yōu)選地,獲取子模塊可W包括W下子單元:亮度提取子單元,用于分別提取原始視 頻中的每帖視頻圖像的亮度分量;參數(shù)計算子單元,用于計算全部視頻圖像中每兩帖相鄰 的視頻圖像的亮度分量的差值,并計算全部差值的平均值,W及,依據(jù)平均值計算全部視頻 圖像的亮度分量的標準偏差;將平均值和標準偏差作為原始視頻對應的原始特征參數(shù)。
[01巧]優(yōu)選地,縮放子模塊可W包括W下子單元:參數(shù)獲取子單元,用于獲取設定的最小 縮放值和最大縮放值,W及獲取預設的多個樣本視頻的樣本特征參數(shù)中的最小參數(shù)值和最 大參數(shù)值;參數(shù)處理子單元,用于依據(jù)最小縮放值和最大縮放值,W及最小參數(shù)值和最大參 數(shù)值,對原始特征參數(shù)進行縮放處理。
[01%] 優(yōu)選地,參數(shù)處理子單元,具體用于根據(jù)如下公式將原始特征參數(shù)進行縮放處 理: 陽 127]
[0128] 其中,L為最小縮放值,U為最大縮放值,min值)為最小參數(shù)值,max值)為最大參 數(shù)值,D為原始特征參數(shù),D ^為縮放處理后的原始特征參數(shù)。
[0129] 本發(fā)明實施例自動對原始視頻進行識別,對屏幕視頻類的原始視頻采用保持原始 分辨率不變的視頻轉碼方式,對非屏幕視頻類的原始視頻采用改變分辨率的視頻轉碼方 式,因此對于屏幕視頻能夠能保證轉碼后的視頻在小帶寬的情況下依舊保持文字等內容的 清晰度,提升用戶體驗,對于非屏幕視頻能夠避免帶寬的浪費。
[0130] 對于裝置實施例而言,由于其與方法實施例基本相似,所W描述的比較簡單,相關 之處參見方法實施例的部分說明即可。 陽131] W上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可 W是或者也可W不是物理上分開的,作為單元顯示的部件可W是或者也可W不是物理單 元,即可W位于一個地方,或者也可W分布到多個網絡單元上??蒞根據(jù)實際的需要選擇其 中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領域普通技術人員在不付出創(chuàng)造性 的勞動的情況下,即可W理解并實施。
[0132] 本發(fā)明的各個裝置實施例可W W硬件實現(xiàn),或者W在一個或者多個處理器上運行 的軟件模塊實現(xiàn),或者W它們的組合實現(xiàn)。本領域的技術人員應當理解,可W在實踐中使用 微處理器或者數(shù)字信號處理器值S巧來實現(xiàn)根據(jù)本發(fā)明實施例的通信處理設備中的一些 或者全部部件的一些或者全部功能。本發(fā)明還可W實現(xiàn)為用于執(zhí)行運里所描述的方法的一 部分或者全部的設備或者裝置程序(例如,計算機程序和計算機程序產品)。運樣的實現(xiàn)本 發(fā)明的程序可W存儲在計算機可讀介質上,或者可W具有一個或者多個信號的形式。運樣 的信號可W從因特網網站上下載得到,或者在載體信號上提供,或者W任何其他形式提供。
[0133] 例如,本發(fā)明的裝置可W應用于服務器中,該服務器傳統(tǒng)上可W包括處理器和W 存儲器形式的計算機程序產品或者計算機可讀介質。存儲器可W是諸如閃存、邸PROM(電 可擦除可編程只讀存儲器)、EPROM、硬盤或者ROM之類的電子存儲器。存儲器具有用于執(zhí) 行上述方法中的任何方法步驟的程序代碼的存儲空間。例如,用于程序代碼的存儲空間可 W包括分別用于實現(xiàn)上面的方法中的各種步驟的各個程序代碼。運些程序代碼可W從一個 或者多個計算機程序產品中讀出或者寫入到運一個或者多個計算機程序產品中。運些計算 機程序產品包括諸如硬盤,緊致盤(CD)、存儲卡或者軟盤之類的程序代碼載體。運樣的計算 機程序產品通常為便攜式或者固定存儲單元,該存儲單元可W具有與上述服務器中的存儲 器類似布置的存儲段、存儲空間等。程序代碼可WW適當形式進行壓縮。通常,存儲單元包 括計算機可讀代碼,即可W由例如上述處理器讀取的代碼,運些代碼當由服務器運行時,導 致該服務器執(zhí)行上面所描述的方法中的各個步驟。
[0134] 通過W上的實施方式的描述,本領域的技術人員可W清楚地了解到各實施方式可 借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可W通過硬件?;谶\樣的理解,上 述技術方案本質上或者說對現(xiàn)有技術做出貢獻的部分可WW軟件產品的形式體現(xiàn)出來,該 計算機軟件產品可W存儲在計算機可讀存儲介質中,如R0M/RAM、磁碟、光盤等,包括若干指 令用W使得一臺計算機設備(可W是個人計算機,服務器,或者網絡設備等)執(zhí)行各個實施 例或者實施例的某些部分所述的方法。
[0135] 最后應說明的是:W上實施例僅用W說明本發(fā)明的技術方案,而非對其限制;盡 管參照前述實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依然 可W對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替 換;而運些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明各實施例技術方案的精 神和范圍。
【主權項】
1. 一種視頻轉碼方法,其特征在于,包括: 對原始視頻進行識別,確定所述原始視頻是否為屏幕視頻; 若所述原始視頻為屏幕視頻,則按照所述原始視頻的分辨率對所述原始視頻進行轉碼 處理。2. 根據(jù)權利要求1所述的方法,其特征在于,所述按照所述原始視頻的分辨率對所述 原始視頻進行轉碼處理的步驟,包括: 針對設定的每種目標格式,保持所述原始視頻的分辨率不變,將所述原始視頻轉碼為 所述目標格式的視頻。3. 根據(jù)權利要求1所述的方法,其特征在于,所述對原始視頻進行識別,確定所述原始 視頻是否為屏幕視頻的步驟,包括: 獲取所述原始視頻對應的原始特征參數(shù); 將所述原始特征參數(shù)進行縮放處理,W使所述原始特征參數(shù)縮放到設定范圍內; 將縮放處理后的原始特征參數(shù)作為預先訓練得到的視頻識別模型的輸入,獲取所述視 頻識別模型的輸出結果,其中所述輸出結果用于指示所述原始視頻是否為屏幕視頻。4. 根據(jù)權利要求3所述的方法,其特征在于,所述獲取所述原始視頻對應的原始特征 參數(shù)的步驟,包括: 分別提取所述原始視頻中的每帖視頻圖像的亮度分量; 計算全部視頻圖像中每兩帖相鄰的視頻圖像的亮度分量的差值,并計算全部差值的平 均值; 依據(jù)所述平均值計算全部視頻圖像的亮度分量的標準偏差; 將所述平均值和所述標準偏差作為所述原始視頻對應的原始特征參數(shù)。5. 根據(jù)權利要求3所述的方法,其特征在于,所述將所述原始特征參數(shù)進行縮放處理 的步驟,包括: 獲取設定的最小縮放值和最大縮放值,W及獲取預設的多個樣本視頻的樣本特征參數(shù) 中的最小參數(shù)值和最大參數(shù)值; 依據(jù)所述最小縮放值和最大縮放值,W及所述最小參數(shù)值和最大參數(shù)值,對所述原始 特征參數(shù)進行縮放處理。6. 根據(jù)權利要求5所述的方法,其特征在于,所述依據(jù)所述最小縮放值和最大縮放值, W及所述最小參數(shù)值和最大參數(shù)值,將所述原始特征參數(shù)進行縮放處理的步驟,包括: 根據(jù)如下公式將所述原始特征參數(shù)進行縮放處理:其中,L為所述最小縮放值,U為所述最大縮放值,min(D)為所述最小參數(shù)值,max(D) 為所述最大參數(shù)值,D為所述原始特征參數(shù),D ^為縮放處理后的原始特征參數(shù)。7. -種視頻轉碼裝置,其特征在于,包括: 視頻識別模塊,用于對原始視頻進行識別,確定所述原始視頻是否為屏幕視頻; 屏幕視頻轉碼模塊,用于在所述視頻識別模塊識別出所述原始視頻為屏幕視頻時,按 照所述原始視頻的分辨率對所述原始視頻進行轉碼處理。8. 根據(jù)權利要求7所述的裝置,其特征在于, 所述屏幕視頻轉碼模塊,具體用于針對設定的每種目標格式,保持所述原始視頻的分 辨率不變,將所述原始視頻轉碼為所述目標格式的視頻。9. 根據(jù)權利要求7所述的裝置,其特征在于,所述視頻識別模塊包括: 獲取子模塊,用于獲取所述原始視頻對應的原始特征參數(shù); 縮放子模塊,用于將所述原始特征參數(shù)進行縮放處理,W使所述原始特征參數(shù)縮放到 設定范圍內; 識別子模塊,用于將縮放處理后的原始特征參數(shù)作為預先訓練得到的視頻識別模型的 輸入,獲取所述視頻識別模型的輸出結果,其中所述輸出結果用于指示所述原始視頻是否 為屏幕視頻。10. 根據(jù)權利要求9所述的裝置,其特征在于,所述獲取子模塊包括: 亮度提取子單元,用于分別提取所述原始視頻中的每帖視頻圖像的亮度分量; 參數(shù)計算子單元,用于計算全部視頻圖像中每兩帖相鄰的視頻圖像的亮度分量的差 值,并計算全部差值的平均值,W及,依據(jù)所述平均值計算全部視頻圖像的亮度分量的標準 偏差;將所述平均值和所述標準偏差作為所述原始視頻對應的原始特征參數(shù)。11. 根據(jù)權利要求9所述的裝置,其特征在于,所述縮放子模塊包括: 參數(shù)獲取子單元,用于獲取設定的最小縮放值和最大縮放值,W及獲取預設的多個樣 本視頻的樣本特征參數(shù)中的最小參數(shù)值和最大參數(shù)值; 參數(shù)處理子單元,用于依據(jù)所述最小縮放值和最大縮放值,W及所述最小參數(shù)值和最 大參數(shù)值,對所述原始特征參數(shù)進行縮放處理。12. 根據(jù)權利要求11所述的裝置,其特征在于, 所述參數(shù)處理子單元,具體用于根據(jù)如下公式將所述原始特征參數(shù)進行縮放處理:其中,L為所述最小縮放值,U為所述最大縮放值,min(D)為所述最小參數(shù)值,max(D) 為所述最大參數(shù)值,D為所述原始特征參數(shù),D ^為縮放處理后的原始特征參數(shù)。
【文檔編號】H04N21/4402GK105979283SQ201510493729
【公開日】2016年9月28日
【申請日】2015年8月12日
【發(fā)明人】劉陽, 白茂生, 魏偉, 蔡硯剛, 邊智
【申請人】樂視云計算有限公司