亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種視頻片段提取方法和裝置與流程

文檔序號:12379156閱讀:455來源:國知局
一種視頻片段提取方法和裝置與流程

本發(fā)明涉及視頻技術領域,特別是涉及一種視頻片段提取方法和裝置。



背景技術:

隨著互聯網技術的快速發(fā)展,以及視頻制作成本的大幅縮減,以至互聯網中視頻的總時長成指數級的增長。以某網站例,每分鐘生產和用戶上傳的視頻總時長數達數十小時,用戶根本不可能在一分鐘內觀看數十小時的視頻。因此,只有篩選出用戶感興趣的視頻片段,過濾用戶不感興趣的視頻片段,才能更好的滿足用戶的需求,更好的為用戶服務,提升用戶的忠誠度,最終增加用戶訪問該網站的的頻次和單次訪問的時長,進而留住用戶。因此,需要通過技術手段,為用戶篩選出某個幾百小時的電視劇或者某個幾個小時的綜藝節(jié)目中的精彩視頻片段。

現有視頻片段提取技術中,獲取用戶視頻片段的方法包括:根據用戶操作視頻播放器和觀看視頻的行為,得到實際觀看比例值,大于一定閾值的作為精彩片段。然后,根據視頻圖像信息,采用圖像處理算法提取視頻的精彩片段。

但對于現有技術中這種采用實際觀看比例值的方法,當用戶數據較少時,準確性顯然不夠。

因此,如何提供一種準確有效的精彩視頻片段提取方法和裝置成為亟待解決的技術問題。



技術實現要素:

本發(fā)明實施例提供一種視頻片段提取方法和裝置,用以解決現有技術中精彩視頻片段提取準確度低的缺陷,實現精彩視頻片段高準確率的提取。

為了解決上述問題,本發(fā)明公開了一種視頻片段提取方法,其中,包括步驟:

分別對用戶彈幕文本情感、用戶拖拽視頻行為數據進行分析;

對上述兩者的分析數據進行加權融合得到視頻片段的精彩值。

本發(fā)明所述的方法,其中,所述用戶彈幕文本情感進行分析的步驟進一步包括:

對用戶彈幕文本進行分詞,

對所述得到的分詞進行詞性標注,只保留否定詞及情感詞;

根據預先設置的情感詞典,對詞性標注保留的分詞生成特征向量;

根據分詞的特征向量計算得到用戶彈幕文本的褒義情感屬性A1、用戶彈幕文本的貶義情感屬性A3、用戶彈幕文本的中性情感屬性A2;

根據彈幕文本的情感屬性對預設時間的視頻拖拽次數值進行調整。

本發(fā)明所述的方法,其中,所述對用戶拖拽視頻行為數據進行分析進一步包括:

解析視頻程序用戶日志,計算得到所有用戶在整個視頻中每秒正常觀看次數值和拖拽次數值。

本發(fā)明所述的方法,其中,

所述所有用戶在整個視頻中每秒的拖拽次數值等于快退次數減去快進次數。

本發(fā)明所述的方法,其中,所述對上述兩者的分析數據進行加權融合得到視頻片段的精彩值的步驟進一步包括:

視頻片段的精彩值為拖拽次數、用戶彈幕文本褒義情感屬性A1、用戶彈幕文本中性情感屬性A2、用戶彈幕文本貶義情感屬性A3及正常觀看次數之和除以正常觀看次數。

為了解決上述問題,本發(fā)明還公開了一種視頻片段提取裝置,其中,包括:

用戶彈幕文本分析模塊,用于對用戶彈幕文本情感數據進行分析;

用戶拖拽視頻行為分析模塊,用于對用戶拖拽視頻行為數據進行分析;

分析結果數據加權融合模塊,用于根據用戶彈幕文本分析模塊及用戶拖拽視頻行為分析模塊得到的分析數據進行加權融合得到視頻片段的精彩值。

本發(fā)明所述的裝置,其中,

所述用戶彈幕文本分析模塊,進一步用于對用戶彈幕文本情感數據進行分析得到用戶彈幕文本褒義情感屬性A1、用戶彈幕文本中性情感屬性A2、用戶彈幕文本貶義情感屬性A3,及根據彈幕文本的情感屬性對預設時間的視頻拖拽數值進行調整;

所述用戶拖拽視頻行為分析模塊,進一步用于對用戶拖拽視頻行為數據進行分析得到所有用戶在整個視頻中每秒正常觀看次數值和拖拽次數值。

所述分析結果數據加權融合模塊,進一步用于根據拖拽次數、用戶彈幕文本褒義情感屬性A1、用戶彈幕文本中性情感屬性A2、用戶彈幕文本貶義情感屬性A3及正常觀看次數之和除以正常觀看次數得到視頻片段的精彩值。

本發(fā)明所述的裝置,其中,所述用戶彈幕文本分析模塊進一步包括:

分詞生成子模塊,用于對彈幕文本進行分詞;

詞性標注生成子模塊,用于對分詞生成子模塊得到的分詞進行詞性標注,并去掉名詞,保留否定詞及情感詞;

特征向量生成子模塊,用于根據預先設置的情感詞典,對詞性標注生成子模塊根據詞性標注保留的分詞生成特征向量;

情感屬性生成子模塊,用于根據特征向量生成子模塊生成的分詞特征向量計算得到用戶彈幕文本褒義的情感屬性A1、用戶彈幕文本的貶義情感屬性A3、用戶彈幕文本的中性情感屬性A2;

視頻拖拽次數值調整子模塊,用于根據情感屬性生成子模塊生成的彈幕文本的情感屬性對預設時間的視頻拖拽次數值進行調整。

本發(fā)明所述的裝置,其中,所述用戶拖拽視頻行為分析模塊進一步包括:

正常觀看次數值及拖拽次數值計算子模塊,用于解析視頻程序用戶日志,計算得到所有用戶在整個視頻中每秒正常觀看次數值和拖拽次數值。

本發(fā)明所述的裝置,其中,

所述正常觀看次數值及拖拽次數值計算子模塊,進一步用于通過快退次數減去快進次數計算所有用戶在整個視頻中每秒的拖拽次數值。

本發(fā)明實施例提供的一種視頻片段提取方法及裝置,通過分別對用戶彈幕文本情感、用戶拖拽視頻行為數據進行分析;對上述兩者的分析數據進行加權融合得到視頻片段的精彩值。提高了發(fā)掘精彩視頻片段的準確性,從而提升了用戶對視頻網站的忠誠度。

附圖說明

為了更清楚地說明本發(fā)明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。

圖1是本發(fā)明一種視頻片段提取方法實施例的步驟流程圖;

圖2是本發(fā)明一種視頻片段提取方法中用戶彈幕數據分析實施例的步驟流程圖;

圖3是本發(fā)明一種視頻片段提取方法中用戶播放行為數據分析實施例的步驟流程圖;

圖4是本發(fā)明一種視頻片段提取裝置實施例的結構框圖。

具體實施方式

為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。

實施例一

參照圖1,示出了本發(fā)明一種視頻片段提取方法實施例的步驟流程圖。

本實施例的一種視頻片段提取方法包括以下步驟:

步驟101:對用戶彈幕文本情感數據進行分析;

步驟102:用戶拖拽視頻行為數據進行分析;

步驟103:對上述兩者的分析數據進行加權融合得到視頻片段的精彩值。之后,可以根據精彩值進行精彩視頻片段的提取。本步驟中,視頻片段的精彩值為拖拽次數、用戶彈幕文本褒義情感屬性、用戶彈幕文本中性情感屬性、用戶彈幕文本貶義情感屬性及正常觀看次數之和除以正常觀看次數。

本方法實施例通過對用戶彈幕文本情感數據及用戶拖拽視頻行為數據的分析,并將兩者分析數據加權融合,得到視頻片段的精彩值。提高了發(fā)掘精彩視頻片段的準確性,從而提升了用戶對視頻網站的忠誠度。

實施例二

參照圖2,示出了本發(fā)明一種視頻片段提取方法中用戶彈幕數據分析實施例的步驟流程圖。

本實施例的視頻片段提取方法中用戶彈幕數據分析具體包括以下步驟:

步驟201:對用戶彈幕文本進行分詞,本實施例中可以采用HMM分詞模型或者借助開源工具對彈幕文本進行分詞。

步驟202:對所述得到的分詞進行詞性標注,并去掉名詞,保留否定詞及情感詞;這里通過去掉名詞等無情感的詞語,保留情感詞語和否定詞。

步驟203:根據預先設置的情感詞典,對詞性標注保留的分詞生成特征向量;例如否定詞設置為0,情感詞根據查找情感詞典,褒義設置為正值,貶義設置為負值。本步驟中先設置的情感詞典根據訓練樣本中的情感詞的TF-IDF值計算得到。在本步驟中,我們訓練模型采用了SVM支持向量機算法,首先,訓練樣本中事先標注好褒義、貶義、中性的短文本語句,進行特征處理和提取,輸入為上述的特征向量,然后用支持向量機(SVM)算法,訓練得到文本情感分類模型。SVM采用核函數進行非線性映射,將原訓練數據映射到較高的維。從而使得高維特征空間采用線性算法對樣本的非線性特征進行線性分析成為可能,本發(fā)明采用了徑向基函數核函數。

步驟204:根據分詞的特征向量計算得到用戶彈幕文本的褒義情感屬性A1、用戶彈幕文本的貶義情感屬性A3、用戶彈幕文本的中性情感屬性A2。

步驟205:根據彈幕文本的情感屬性對預設時間如用戶彈幕時間點前后2*文本長度個秒的視頻拖拽次數值進行調整。在本步驟中,發(fā)送彈幕文本時間點前后的2*文本字數秒的托拽數增加A1、A2、A3。其中褒義:A1,貶義:A3,中性:A2,A1>A2>A3,A3為負數。從而得到彈幕每一秒的文本托拽數,即所有用戶每一秒的(A1+A2+A3)。

實施例三

參照圖3,示出了本發(fā)明一種視頻片段提取方法中用戶播放行為數據分析實施例的步驟流程圖。

本實施例的視頻片段提取方法中用戶播放行為數據分析的步驟流程圖,包括:

步驟301:解析視頻程序用戶日志,

步驟302:計算得到所有用戶在整個視頻中每秒正常觀看次數值和拖拽次數值。本步驟中,正常觀看次數指的是用戶沒有拖拽行為的觀看次數。所有用戶在整個視頻中每秒的拖拽次數值等于快退次數減去快進次數。本步驟中,快退次數指用戶觀看視頻時快退觀看的次數,快進次數指的是用戶觀看視頻時快進觀看的次數。

實施例四

參照圖4,示出了本發(fā)明一種視頻片段提取裝置實施例的結構框圖。

本實施例的視頻片段提取裝置401,包括:用戶彈幕文本分析模塊402、用戶拖拽視頻行為分析模塊403、分析結果數據加權融合模塊404;其中,用戶彈幕文本分析模塊402還包括:分詞生成子模塊405、詞性標注生成子模塊406、特征向量生成子模塊407、情感屬性生成子模塊408、視頻拖拽數值調整子模塊409;用戶拖拽視頻行為分析模塊403還包括:正常觀看數值及拖拽次數值計算子模塊410。

本實施例中,

用戶彈幕文本分析模塊402,用于對用戶彈幕文本情感數據進行分析;例如,用于對用戶彈幕文本情感數據進行分析得到用戶彈幕文本褒義情感屬性A1、用戶彈幕文本中性情感屬性A2、用戶彈幕文本貶義情感屬性A3,及根據彈幕文本的情感屬性對預設時間,例如用戶彈幕時間點前后2*文本長度個秒的視頻拖拽數值進行調整。

分詞生成子模塊405,用于對彈幕文本進行分詞;

詞性標注生成子模塊406,用于對分詞生成子模塊得到的分詞進行詞性標注,并去掉名詞,保留否定詞及情感詞;

特征向量生成子模塊407,用于根據預先設置的情感詞典,對詞性標注生成子模塊根據詞性標注保留的分詞生成特征向量;

情感屬性生成子模塊408,用于根據特征向量生成子模塊生成的分詞特征向量計算得到用戶彈幕文本的褒義情感屬性A1、用戶彈幕文本的貶義情感屬性A3、用戶彈幕文本的中性情感屬性A2;

視頻拖拽次數值調整子模塊409,用于根據情感屬性生成子模塊生成的彈幕文本的情感屬性對設時間,例如用戶彈幕時間點前后2*文本長度個秒的視頻拖拽次數值進行調整。

用戶拖拽視頻行為分析模塊403,用于對用戶拖拽視頻行為數據進行分析;例如,用于對用戶拖拽視頻行為數據進行分析得到所有用戶在整個視頻中每秒正常觀看次數值和拖拽次數值。本實施例中,正常觀看次數指的是用戶沒有拖拽行為的觀看次數。

正常觀看次數值及拖拽次數值計算子模塊410,用于解析視頻程序用戶日志,計算得到所有用戶在整個視頻中每秒正常觀看次數值和拖拽次數值。本實施例中,所有用戶在整個視頻中每秒的拖拽次數值等于快退次數減去快進次數。本實施例中,快退次數指用戶觀看視頻時快退觀看的次數,快進次數指的是用戶觀看視頻時快進觀看的次數。

分析結果數據加權融合模塊404,用于根據用戶彈幕文本分析模塊及用戶拖拽視頻行為分析模塊得到的分析數據進行加權融合得到視頻片段的精彩值。例如,根據拖拽次數、用戶彈幕文本褒義情感屬性A1、用戶彈幕文本中性情感屬性A2、用戶彈幕文本貶義情感屬性A3及正常觀看次數之和除以正常觀看次數得到視頻片段的精彩值。

本實施例的視頻片段提取裝置用于實現前述實施例一、二以及實施例三中相應的視頻片段提取方法,并且具有相應的方法實施例的有益效果,在此不再贅述。

以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創(chuàng)造性的勞動的情況下,即可以理解并實施。

通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到各實施方式可借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件?;谶@樣的理解,上述技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品可以存儲在計算機可讀存儲介質中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執(zhí)行各個實施例或者實施例的某些部分所述的方法。

最后應說明的是:以上實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明各實施例技術方案的精神和范圍。

當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1