視頻識別方法、裝置和系統(tǒng)的制作方法
【專利摘要】提供一種視頻識別方法和裝置,方法包括:接收目標用戶設備發(fā)送的目標統(tǒng)一資源定位符URL,確定與該目標URL相對應的目標視頻,其中,該目標URL包括第一目標URL和第二目標URL,該目標視頻包括與該第一目標URL相對應的第一目標視頻,以及與該第二目標URL相對應的第二目標視頻;根據(jù)會話部分提取模型,確定該第一目標URL的會話部分,以及該第二目標URL的會話部分,該會話部分提取模型是根據(jù)至少兩個第一采樣URL的會話部分確定的,其中,各該第一采樣URL均與第一用戶設備相對應,各該第一采樣URL的會話部分的字符串相同;如果該第一目標URL的會話部分與該第二目標URL的會話部分相同,則確定該第一目標視頻與該第二目標視頻屬于同一視頻播放會話。
【專利說明】視頻識別方法、裝置和系統(tǒng)
[0001]技術領
[0002]本發(fā)明涉及通信領域,并且更具體地,涉及一種視頻識別方法、裝置和系統(tǒng)。
【背景技術】
[0003]目前,隨著互聯(lián)網(wǎng)的飛速發(fā)展,基于開放互聯(lián)網(wǎng)的視頻傳輸服務也得到大規(guī)模應用,即,互聯(lián)網(wǎng)視頻發(fā)布商利用電信運營商提供的網(wǎng)絡,向終端用戶提供視頻播放服務,其中,電信運營商僅負責傳輸視頻,不涉足視頻內容的控制、分發(fā)、版權等。
[0004]現(xiàn)有技術中,視頻傳輸是基于超文本傳輸協(xié)議(HTTP, Hypertext transferprotocol)進行的,具體地說,用戶在希望觀看互聯(lián)網(wǎng)視頻發(fā)布商(例如,視頻網(wǎng)站)提供的視頻時,通過用戶設備向電信運營商(例如,網(wǎng)關設備)發(fā)送HTTP消息,該HTTP消息中攜帶與所希望觀看的視頻相對應的統(tǒng)一資源定位符URL (Uniform Resoure Locator),電信運營商可以將該HTTP消息轉發(fā)給互聯(lián)網(wǎng)視頻發(fā)布商(例如,視頻網(wǎng)站的服務器),以從互聯(lián)網(wǎng)視頻發(fā)布商獲得該視頻,并下發(fā)至用戶設備。
[0005]為了改善用戶體驗,縮短用戶觀看視頻的等待時間,電信運營商通常會設置緩存設備,以緩存從電信運營商獲取的視頻,并建立所獲取的各視頻與各URL之間的映射關系表項,從而,當接收到攜帶著與所緩存的視頻相對應的URL的HTTP消息時,可以從緩存設備獲取該視頻,并下發(fā)給用戶設備。
[0006]例如,目前,已經(jīng)可以實現(xiàn)視頻傳輸對網(wǎng)絡狀況自適應能力的支持,即同一個視頻內容,在服務器中存儲有多個碼率的副本或者多個編碼格式的副本,例如,高清碼率、標清碼率。碼率越高的副本,視頻畫面越清晰,單位播放時間對應的視頻數(shù)據(jù)越多,對傳送帶寬的需求越大,在網(wǎng)絡條件好的時候傳送高清片段,在網(wǎng)絡條件差的時候傳送標清片段,這樣保證視頻觀看過程中的流暢度,改善用戶體驗。但是,當網(wǎng)絡條件發(fā)生變化時,一次視頻觀看過程中可能傳輸同一個視頻內容(或者說,同一視頻播放會話)的多個副本,同時,視頻的URL—般是視頻網(wǎng)站動態(tài)生成的,不同用戶訪問同一個視頻,同一個用戶不同時間訪問同一個視頻,都可能獲取到不同的URL;因此,可能導致以下問題的出現(xiàn),例如,導致點擊率計算和視頻播放量計算是不等價的。
[0007]再例如,該多個副本的增值處理(例如,廣告投放、殺毒處理等)也是獨立進行,嚴重影響了處理的效率和準確性。
[0008]因此,希望提供一種技術,能夠通過URL識別屬于同一視頻播放會話的不同視頻。
【發(fā)明內容】
[0009]本發(fā)明實施例提供一種視頻識別方法、裝置和系統(tǒng),能夠通過URL分辨視頻內容相同的多個視頻。
[0010]第一方面,提供了一種視頻識別方法,該方法包括:接收目標用戶設備發(fā)送的目標統(tǒng)一資源定位符URL,確定與該目標URL相對應的目標視頻,其中,該目標URL包括第一目標URL和第二目標URL,該目標視頻包括與該第一目標URL相對應的第一目標視頻,以及與該第二目標URL相對應的第二目標視頻;根據(jù)會話部分提取模型,確定該第一目標URL的會話部分,以及該第二目標URL的會話部分,該會話部分提取模型是根據(jù)至少兩個第一采樣URL的會話部分確定的,其中,各該第一采樣URL均與第一用戶設備相對應,各該第一采樣URL的會話部分的字符串相同,該第一采樣URL的會話部分包括該第一采樣URL中除用戶部分以外的部分,該第一采樣URL的用戶部分用于指示該第一用戶設備,該第一采樣URL的會話部分的包含于該第一采樣URL的非主機名Host部分,該非Host部分是URL的字符串中除Host部分以外的部分,該至少兩個第一采樣URL與至少兩個第一采樣視頻一一對應,且該至少兩個第一采樣視頻屬于同一視頻播放會話;如果該第一目標URL的會話部分與該第二目標URL的會話部分相同,則確定該第一目標視頻與該第二目標視頻屬于同一視頻播放會話。
[0011 ] 結合第一方面,在第一方面的第一種實現(xiàn)方式中,在根據(jù)會話部分提取模型,確定該第一目標URL的會話部分之前,該方法還包括:接收該至少兩個第一采樣URL ;遍歷該第一米樣URL的非Host部分,確定各該第一米樣URL的會話部分;根據(jù)該至少兩個第一米樣URL的會話部分,確定該會話部分提取模型。
[0012]結合第一方面及其上述實現(xiàn)方式,在第一方面的第二種實現(xiàn)方式中,該接收該至少兩個第一米樣URL,包括:在第一時段內,接收該至少兩個第一米樣URL,該第一時段是根據(jù)該至少兩個第一采樣URL中最先接收到的URL的所對應的第一采樣視頻的時長確定的。
[0013]結合第一方面及其上述實現(xiàn)方式,在第一方面的第三種實現(xiàn)方式中,在確定各該第一采樣URL的會話部分之前,該方法還包括:在該第一時段外,接收至少一個第二采樣URL,該第二采樣URL與該第一用戶設備相對應;根據(jù)各該第一采樣URL和該第二采樣URL,確定各該第一采樣URL的用戶部分,在該第一采樣URL與該第二采樣URL中,該用戶部分的字符串相同;從該至少兩個第一采樣URL中,去除該用戶部分。
[0014]結合第一方面及其上述實現(xiàn)方式,在第一方面的第五種實現(xiàn)方式中,該至少兩個第一采樣URL的路徑Path部分的深度相同。
[0015]結合第一方面及其上述實現(xiàn)方式,在第一方面的第六種實現(xiàn)方式中,各該第一采樣URL的搜索參數(shù)Quey Param部分包括的Quey Param中,參數(shù)名相異的Quey Param數(shù)量小于等于第一閾值。
[0016]結合第一方面及其上述實現(xiàn)方式,在第一方面的第七種實現(xiàn)方式中,在遍歷該第一采樣URL的非Host部分之前,該方法還包括:根據(jù)標識部分提取模型,確定該至少兩個第一采樣URL的標識部分,其中,該標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各該第三采樣URL的標識部分的字符串相同,各該第三采樣URL的字符串相異,各該第三采樣URL所對應的用戶設備相異,各該第三采樣URL均與第二采樣視頻相對應,該第三采樣URL的標識部分包含于該第三采樣URL的非Host部分;從該至少兩個第一采樣URL中,去除該標識部分。
[0017]結合第一方面及其上述實現(xiàn)方式,在第一方面的第八種實現(xiàn)方式中,在遍歷該第一采樣URL的非Host部分之前,該方法還包括:根據(jù)分段部分提取模型,確定該至少兩個第一采樣URL的分段部分,其中,該分段部分提取模型是根據(jù)該分段信息確定的,該分段信息是基于分段部分提取條件,對第一采樣信息集合和第二采樣信息集合進行對比處理而從該第一采樣信息集合和該第二采樣信息集合中確定的,該第一采樣信息集合是根據(jù)第四采樣URL確定的,該第四采樣URL包括路徑Path部分和搜索參數(shù)Quey Param部分,該第四采樣URL的Quey Param部分包括K個Quey Param,該第一采樣信息集合包括第一信息和第二信息中的至少一個,該第一信息用于指示該第四采樣URL的Path部分的深度和Path值,該第二信息用于指示該第四采樣URL的K個Quey Param的名稱和參數(shù)值,該第二采樣信息集合是根據(jù)第五采樣URL確定的,該第五采樣URL包括Path部分和Quey Param部分,該第五采樣URL的Quey Param部分包括M個Quey Param,該第四采樣URL和該第五采樣URL均對應第三視頻相同,該第五采樣信息集合包括第三信息和第四信息中的至少一個,該第三信息用于指示該第五采樣URL的Path部分的深度和Path值,該第四信息用于指示該第五采樣URL的M個Quey Param的名稱和參數(shù)值,該分段部分提取條件包括第一條件、第二條件和第三條件中的至少一個,該第一條件為:該分段信息指示的Path部分的深度在該第一采樣信息集合和該第二采樣信息集合中相同,且該分段信息該指示Path值在該第一采樣信息集合和該第二采樣信息集合中相異,該第二條件為:該分段信息指示的Quey Param的名稱屬于該第一米樣信息集合和該第二米樣信息集合雙方,且該分段信息指不的Quey Param的參數(shù)值在該第一采樣信息集合和該第二采樣信息集合中相異,該第三條件為:該分段信息指不的Quey Param的名稱僅屬于該第一米樣信息集合和該第二米樣信息集合中的一方;從該至少兩個第一采樣URL中,去除該分段部分。
[0018]結合第一方面及其上述實現(xiàn)方式,在第一方面的第九種實現(xiàn)方式中,該第四采樣URL是第一用戶設備在請求獲取該第三采樣視頻時發(fā)送的URL,該第五采樣URL是該第一用戶設備在請求獲取該第三采樣視頻的片段時發(fā)送的URL ;或該第四采樣URL是第一用戶設備在請求獲取該第三采樣視頻的片段時發(fā)送的URL,該第五采樣URL是該第一用戶設備在請求獲取該第三采樣視頻時發(fā)送的URL ;或該第四采樣URL是第一用戶設備在請求獲取該第三采樣視頻的第一片段時發(fā)送的URL,該第五采樣URL是該第一用戶設備在請求獲取該第三采樣視頻的第二片段時發(fā)送的URL,其中,該第一片段與該第二片段相異。
[0019]結合第一方面及其上述實現(xiàn)方式,在第一方面的第十種實現(xiàn)方式中,該確定與該目標URL相對應的目標視頻,包括:接收并在該緩存設備中存儲緩存視頻以及至少一個緩存URL,其中,各該緩存URL均與該緩存視頻相對應;根據(jù)標識部分提取模型,確定該緩存URL的標識部分,其中,該標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各該第三采樣URL的標識部分的字符串相同,各該第三采樣URL的字符串相異,各該第三采樣URL所對應的用戶設備相異,各該第三采樣URL均與第二采樣視頻相對應,該第三采樣URL的標識部分包含于該第三采樣URL的非Host部分;遍歷該目標URL的非Host部分,如果確定該目標URL的非Host部分中包含該緩存URL的標識部分的字符串,則確定該緩存視頻為該目標視頻。
[0020]結合第一方面及其上述實現(xiàn)方式,在第一方面的第十一種實現(xiàn)方式中,該方法還包括:接收至少一個驗證URL,且該驗證URL的非Host子字符串中包含該緩存URL的標識部分的字符串;向服務器轉發(fā)該驗證URL ;接收該服務器根據(jù)該驗證URL發(fā)送的驗證視頻;確定該驗證視頻與該緩存視頻相同。
[0021]結合第一方面及其上述實現(xiàn)方式,在第一方面的第十二種實現(xiàn)方式中,該方法還包括:接收第六采樣URL以及第四采樣視頻,其中,該第六采樣URL與該第四視頻相對應,該第四采樣視頻與該第二采樣視頻相異;根據(jù)該標識部分提取模型,確定該第六采樣URL的標識部分;確定第六采樣URL的標識部分與該第三采樣URL的標識部分之間的重疊部分,該重疊部分包括Path值相同的Path級別和參數(shù)值相同的Quey Param中的至少一項;從該第三采樣URL的標識部分中去除該重疊部分,以更新該第三采樣URL的標識部分;根據(jù)更新后的第三采樣URL的標識部分,更新該標識部分提取模型。
[0022]第二方面,提供了一種視頻識別裝置,該裝置包括:收發(fā)單元,用于接收目標用戶設備發(fā)送的目標統(tǒng)一資源定位符URL ;確定單元,用于確定與該目標URL相對應的目標視頻,其中,該目標URL包括第一目標URL和第二目標URL,該目標視頻包括與該第一目標URL相對應的第一目標視頻,以及與該第二目標URL相對應的第二目標視頻,根據(jù)會話部分提取模型,確定該第一目標URL的會話部分,以及該第二目標URL的會話部分,該會話部分提取模型是根據(jù)至少兩個第一米樣URL的會話部分確定的,其中,各該第一米樣URL均與第一用戶設備相對應,各該第一米樣URL的會話部分的字符串相同,該第一米樣URL的會話部分包括該第一采樣URL中除用戶部分以外的部分,該第一采樣URL的用戶部分用于指示該第一用戶設備,該第一采樣URL的會話部分的包含于該第一采樣URL的非主機名Host部分,該非Host部分是URL的字符串中除Host部分以外的部分,該至少兩個第一采樣URL與至少兩個第一采樣視頻一一對應,且該至少兩個第一采樣視頻屬于同一視頻播放會話;判定單元,用于如果該第一目標URL的會話部分與該第二目標URL的會話部分相同,則確定該第一目標視頻與該第二目標視頻屬于同一視頻播放會話。
[0023]結合第二方面,在第二方面的第一種實現(xiàn)方式中,該收發(fā)單元還用于接收該至少兩個第一米樣URL ;該確定單兀還用于遍歷該第一米樣URL的非Host部分,確定各該第一采樣URL的會話部分,根據(jù)該至少兩個第一采樣URL的會話部分,確定該會話部分提取模型。
[0024]結合第二方面及其上述實現(xiàn)方式,在第二方面的第二種實現(xiàn)方式中,該收發(fā)單元具體用于在第一時段內,接收該至少兩個第一采樣URL,該第一時段是根據(jù)該至少兩個第一采樣URL中最先接收到的URL的所對應的第一采樣視頻的時長確定的。
[0025]結合第二方面及其上述實現(xiàn)方式,在第二方面的第三種實現(xiàn)方式中,該收發(fā)單元還用于在該第一時段外,接收至少一個第二采樣URL,該第二采樣URL與該第一用戶設備相對應;該確定單兀還用于根據(jù)各該第一米樣URL和該第二米樣URL,確定各該第一米樣URL的用戶部分,在該第一采樣URL與該第二采樣URL中,該用戶部分的字符串相同,從該至少兩個第一采樣URL中,去除該用戶部分。
[0026]結合第二方面及其上述實現(xiàn)方式,在第二方面的第四種實現(xiàn)方式中,該確定單元還用于根據(jù)標識部分提取模型,確定該至少兩個第一采樣URL的標識部分,其中,該標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各該第三采樣URL的標識部分的字符串相同,各該第三采樣URL的字符串相異,各該第三采樣URL所對應的用戶設備相異,各該第三采樣URL均與第二采樣視頻相對應,該第三采樣URL的標識部分包含于該第三采樣URL的非Host部分;用于從該至少兩個第一采樣URL中,去除該標識部分。
[0027]結合第二方面及其上述實現(xiàn)方式,在第二方面的第五種實現(xiàn)方式中,該確定單元還用于根據(jù)分段部分提取模型,確定該至少兩個第一采樣URL的分段部分,其中,該分段部分提取模型是根據(jù)該分段信息確定的,該分段信息是基于分段部分提取條件,對第一采樣信息集合和第二采樣信息集合進行對比處理而從該第一采樣信息集合和該第二采樣信息集合中確定的,該第一米樣信息集合是根據(jù)第四米樣URL確定的,該第四米樣URL包括路徑Path部分和搜索參數(shù)Quey Param部分,該第四采樣URL的Quey Param部分包括K個QueyParam,該第一米樣信息集合包括第一信息和第二信息中的至少一個,該第一信息用于指不該第四采樣URL的Path部分的深度和Path值,該第二信息用于指示該第四采樣URL的K個Quey Param的名稱和參數(shù)值,該第二采樣信息集合是根據(jù)第五采樣URL確定的,該第五采樣URL包括Path部分和Quey Param部分,該第五采樣URL的Quey Param部分包括M個Quey Param,該第四采樣URL和該第五采樣URL均對應第三視頻相同,該第五采樣信息集合包括第三信息和第四信息中的至少一個,該第三信息用于指示該第五采樣URL的Path部分的深度和Path值,該第四信息用于指示該第五采樣URL的M個Quey Param的名稱和參數(shù)值,該分段部分提取條件包括第一條件、第二條件和第三條件中的至少一個,該第一條件為:該分段信息指示的Path部分的深度在該第一采樣信息集合和該第二采樣信息集合中相同,且該分段信息該指不Path值在該第一米樣信息集合和該第二米樣信息集合中相異,該第二條件為:該分段信息指示的Quey Param的名稱屬于該第一采樣信息集合和該第二米樣信息集合雙方,且該分段信息指不的Quey Param的參數(shù)值在該第一米樣信息集合和該第二采樣信息集合中相異,該第三條件為:該分段信息指示的Quey Param的名稱僅屬于該第一采樣信息集合和該第二采樣信息集合中的一方;用于從該至少兩個第一采樣URL中,去除該分段部分。
[0028]結合第二方面及其上述實現(xiàn)方式,在第二方面的第六種實現(xiàn)方式中,該收發(fā)單元還用于接收并在該緩存設備中存儲緩存視頻以及至少一個緩存URL,其中,各該緩存URL均與該緩存視頻相對應;該確定單元具體用于根據(jù)標識部分提取模型,確定該緩存URL的標識部分,其中,該標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各該第三采樣URL的標識部分的字符串相同,各該第三采樣URL的字符串相異,各該第三采樣URL所對應的用戶設備相異,各該第三采樣URL均與第二采樣視頻相對應,該第三采樣URL的標識部分包含于該第三米樣URL的非Host部分;遍歷該目標URL的非Host部分,如果確定該目標URL的非Host部分中包含該緩存URL的標識部分的字符串,則確定該緩存視頻為該目標視頻。
[0029]結合第二方面及其上述實現(xiàn)方式,在第二方面的第七種實現(xiàn)方式中,該收發(fā)單元還用于接收第六采樣URL以及第四采樣視頻,其中,該第六采樣URL與該第四視頻相對應,該第四采樣視頻與該第二采樣視頻相異;該確定單元還用于用于根據(jù)該標識部分提取模型,確定該第六采樣URL的標識部分,確定第六采樣URL的標識部分與該第三采樣URL的標識部分之間的重疊部分,該重疊部分包括Path值相同的Path級別和參數(shù)值相同的QueyParam中的至少一項,用于從該第三采樣URL的標識部分中去除該重疊部分,以更新該第三采樣URL的標識部分;用于根據(jù)更新后的第三采樣URL的標識部分,更新該標識部分提取模型。
[0030]第三方面,提供了一種視頻識別系統(tǒng),該系統(tǒng)包括:第二方面及第二方面的各實現(xiàn)方式的各視頻識別裝置,用戶設備和服務器。
[0031]根據(jù)本發(fā)明實施例的視頻識別方法、裝置和系統(tǒng),利用內容相同的至少兩個第一采樣視頻所分別對應的第一采樣URL,訓練獲得會話部分提取模型,該會話部分提取模型用于從URL中提取指示視頻所屬于的視頻播放會話的會話部分,從而,在接收到第一目標視頻與第二目標視頻所分別對應的第一目標URL和第二目標URL時,能夠根據(jù)該會話部分提取模型,確定第一目標URL和第二目標URL中的會話部分,進而在確定第一目標URL和第二目標URL中的會話部分相同之后,能夠確定第一目標視頻和第二目標視頻屬于同一視頻播放會話,從而,能夠將對第一目標視頻和第二目標視頻的點擊視為一次點擊,從而提高了點擊率計算的準確性,并且,在僅通過識別URL的情況下,便能夠確認需要對第一目標視頻和第二目標視頻進行相同的增值處理,提高了處理的效率。
【專利附圖】
【附圖說明】
[0032]為了更清楚地說明本發(fā)明實施例的技術方案,下面將對本發(fā)明實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面所描述的附圖僅僅是本發(fā)明的一些實施例,對于本領普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0033]圖1是根據(jù)本發(fā)明實施例的視頻識別方法的示意性流程圖。
[0034]圖2是表示URL中各部分的劃分方式的一例的示意圖。
[0035]圖3是表示URL中的Path部分的深度及Path值的一例的示意圖。
[0036]圖4是根據(jù)本發(fā)明實施例的視頻識別裝置的示意性框圖。
[0037]圖5是根據(jù)本發(fā)明實施例的視頻識別設備的示意性結構圖。
[0038]圖6是根據(jù)本發(fā)明實施例的視頻識別系統(tǒng)的示意性架構圖。
【具體實施方式】
[0039]下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0040]下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0041]本發(fā)明的技術方案中,用戶設備可以通過電信運營商提供的通信網(wǎng)絡訪問提供視頻業(yè)務的服務器,并且,該通信網(wǎng)絡可以是例如:全球移動通訊系統(tǒng)(GSM,Global Systemof Mobile communicat1n),碼分多址(CDMA, Code Divis1n Multiple Access)系統(tǒng),寬帶碼分多址(WCDMA, Wideband Code Divis1n Multiple Access Wireless),通用分組無線業(yè)務(GPRS, General Packet Rad1 Service),長期演進(LTE, Long Term Evolut1n)等。
[0042]用戶設備(UE, User Equipment),也可稱之為移動終端(Mobile Terminal)、移動用戶設備等,可以經(jīng)上述通信網(wǎng)絡(例如,RAN,Rad1 Access Network)與一個或多個核心網(wǎng)(例如,上述服務器所在的網(wǎng)絡)進行通信,用戶設備可以是移動終端,如移動電話(或稱為“蜂窩”電話)和具有移動終端的計算機,例如,可以是便攜式、袖珍式、手持式、計算機內置的或者車載的移動裝置,它們與無線接入網(wǎng)交換語言和/或數(shù)據(jù)。
[0043]并且,在本發(fā)明實施例中,用戶設備與服務器之間可以采用HTTP通信方式,或者說,在用戶設備與服務器之間傳輸?shù)男畔⒎螲TTP通信規(guī)則。
[0044]例如,用戶在通過用戶設備訪問視頻網(wǎng)站,以觀看視頻時,視頻網(wǎng)站會針對用戶希望觀看的視頻(例如,通過用戶的點擊行為獲知用戶希望的視頻),為該用戶設備分配與該視頻相對應的URL,用戶設備向該視頻網(wǎng)站的服務器發(fā)送攜帶有該URL的請求消息,從而,服務器可以根據(jù)該URL查找到該視頻,并下發(fā)給用戶設備。
[0045]另外,在本發(fā)明實施例中,用戶設備與服務器之間的通信經(jīng)由電信運營商提供的通信網(wǎng)絡進行,例如,用戶設備發(fā)送給服務器的消息(例如,請求播放視頻片段的消息)需要首先被封裝成符合上述通信網(wǎng)絡傳輸規(guī)則的格式,并經(jīng)由例如該通信網(wǎng)絡的網(wǎng)關設備將該消息轉換為服務器能夠識別的格式。類似的,服務器在從網(wǎng)關設備接收到該消息后,可以查找與該消息相對應的視頻,并將該視頻傳輸至上述網(wǎng)關設備,網(wǎng)關設備可以將該視頻封裝成服務符合上述通信網(wǎng)絡傳輸規(guī)則的格式,并下發(fā)至用戶設備。
[0046]為了改善用戶體驗,縮短用戶觀看視頻的等待時間,電信運營商通常會設置緩存設備,以緩存從電信運營商獲取的視頻。并且,該緩存設備通常與網(wǎng)關設備通信連接或集成于一體。
[0047]為了便于理解,以具有視頻緩存功能的網(wǎng)關設備作為本發(fā)明實施例的視頻識別方法的執(zhí)行主體,進行說明。
[0048]圖1示出了根據(jù)本發(fā)明實施例的視頻識別方法100的示意性流程圖。如圖1所示,該方法包括:
[0049]SI 10,接收目標用戶設備發(fā)送的目標統(tǒng)一資源定位符URL,確定與該目標URL相對應的目標視頻,其中,該目標URL包括第一目標URL和第二目標URL,該目標視頻包括與該第一目標URL相對應的第一目標視頻,以及與該第二目標URL相對應的第二目標視頻;
[0050]S120,根據(jù)會話部分提取模型,確定該第一目標URL的會話部分,以及該第二目標URL的會話部分,該會話部分提取模型是根據(jù)至少兩個第一采樣URL的會話部分確定的,其中,各該第一采樣URL均與第一用戶設備相對應,各該第一采樣URL的會話部分的字符串相同,該第一米樣URL的會話部分包括該第一米樣URL中除用戶部分以外的部分,該第一米樣URL的用戶部分用于指不該第一用戶設備,該第一米樣URL的會話部分的包含于該第一米樣URL的非主機名Host部分,該非Host部分是URL的字符串中除Host部分以外的部分,該至少兩個第一采樣URL與至少兩個第一采樣視頻一一對應,且該至少兩個第一采樣視頻屬于同一視頻播放會話;
[0051]S130,如果該第一目標URL的會話部分與該第二目標URL的會話部分相同,則確定該第一目標視頻與該第二目標視頻屬于同一視頻播放會話。
[0052]具體地說,例如,由于網(wǎng)絡狀態(tài)、用戶級別和用戶設備使用的播放器等原因,同樣的視頻內容,可能會有多種版本,例如,標清格式版本、高清格式版本、植入廣告版本、去廣告版本以及各種視頻播放器所支持的格式版本等。并且,視頻網(wǎng)站是將各個版本的視頻視為不同的視頻,例如,為不同版本的視頻存儲于不同的服務器,因而,在用戶請求收看不同版本的視頻時,視頻網(wǎng)站也會為不同版本的視頻分配不同的URL。應理解,以上列舉的造成同一視頻具有多個視頻版本的原因僅為示例性說明,本發(fā)明并不限定于此。
[0053]并且,在URL中,通常會攜帶用于指示該視頻所屬于的視頻播放會話(或者說,視頻播放業(yè)務)的字符串,即,會話部分,并且,在屬于同一視頻播放業(yè)務的不同視頻(例如,碼率不同的視頻)的URL中,該用于指示視頻所屬于的視頻播放會話(或者說,視頻內容)的字符串相同。
[0054]因此本發(fā)明實施例中,可以通過采樣URL(即,第一采樣URL)進行訓練,獲得會話部分提取模型(以下,為了便于理解和說明,稱為Sess1n部分提取模型),從而,能夠實現(xiàn)從URL中提取上述會話部分(以下,為了便于理解和說明,稱為Sess1n部分),并且,可以判定會話部分相同的多個視頻的視頻內容也是相同的。
[0055]下面,首先對該Sess1n部分提取模型的訓練過程進行詳細說明。
[0056]可選地,在根據(jù)會話部分提取模型,確定該第一目標URL的會話部分之前,該方法還包括:
[0057]接收該至少兩個第一采樣URL ;
[0058]遍歷該第一采樣URL的非Host部分,確定各該第一采樣URL的會話部分;
[0059]根據(jù)該至少兩個第一采樣URL的會話部分,確定該會話部分提取模型
[0060]具體地說,例如,網(wǎng)關設備獲取URL#A(即,第一采樣URL的一例),其中,該URL#A與用戶設備A(第一用戶設備的一例)相對應,并且,該URLM與視頻A(即,第一采樣視頻的一例)相對應,例如,可以是網(wǎng)關設備從來自該用戶設備A的用于請求播放視頻A的HTTP消息中提取的,或者,也可以是網(wǎng)關設備從來自該用戶設備A的用于請求播放視頻A的片段的HTTP消息中提取的。
[0061]需要說明的是,以上列舉的URLM的獲取過程僅為示例性說明,本發(fā)明并未限定于此,例如,該URL#A也可以是由互聯(lián)網(wǎng)視頻發(fā)布商提供給網(wǎng)關設備的,只要能夠確保該URL#A與用戶設備A相對應,且該URL#A與視頻A相對應即可,例如,現(xiàn)有技術中,該URL#A可以作為完整的視頻A的索引,或者該URL#A可以作為視頻A的某一片段的索引。
[0062]用戶設備在請求獲取視頻時發(fā)送的URL中,與該視頻的視頻內容相對應的上述Sess1n部分通常存在于URL的路徑(Path)部分或搜索參數(shù)(Quey Param)部分中,即,該Sess1n部分可能是Path部分中的某一深度的Path值,也可能是Quey Param部分中的某一參數(shù)的值。
[0063]因此,在本發(fā)明實施例中,網(wǎng)關設備在獲取該URL#A之后,可以提取該URL#A的Path部分和/或Quey Param部分。
[0064]圖2示出了 URL的字符串中各部分的構成的一例,如圖2所示,URL的域名(Host)部分與Path部分之間由“/”符號隔開,因此,網(wǎng)絡設備可以將Host部分之后的第一個“/”符號(或者說,URL中的最后一個“/”符號)后的字符識別為Path部分的起始字符。
[0065]并且,如圖2所示,URL的Path部分與Quey Param部分之間由“?”符號隔開,因此,網(wǎng)絡設備可以將Path部分(或者說,URL中的最后一個“/”符號)之后的第一個“?”符號后的字符識別為Path部分的起始字符。從而,能夠實現(xiàn)Quey Param部分的提取。
[0066]另外,網(wǎng)絡設備可以將該path部分之后的第一個“?”符號后的字符識別為Path部分的結束字符,從而,結合上述Path部分的起始字符,能夠實現(xiàn)Path部分的提取。
[0067]應理解,以上列舉的Path部分的提取方法以及Quey Param部分的提取方法僅為示例性說明,本發(fā)明并不限定于此,可以根據(jù)URL的變化而進行相應變更,例如,存在某些URL只存在Path部分而不存在Quey Param部分的情況,此情況下,只須其確定Path部分的起始字符即可。并且,以上列舉的Host部分與Path部分的分隔符號(即,“/”符號)以及Path部分與Quey Param部分之間的分隔符號(即,“? ”符號)僅為示例性說明,本發(fā)明并不限定于此,現(xiàn)有技術中,URL所采用的能夠實現(xiàn)分隔標識作用的符號均落入本發(fā)明的保護范圍內。
[0068]網(wǎng)關設備在完成了對URL#A的Path部分提取之后,可以確定URL#A的Path部分的深度和Path值。
[0069]具體地說,Path部分的深度(或者說,級別)可以根據(jù)Path部分中包括的“/”符號的數(shù)量確定,例如,圖3示出了 URL中的Path部分的一例的示意圖。以圖3所示的URL為例,該URL包括六個“/”符號,因此,可以確定其深度為6,其中,
[0070]第I 級深度的 Path 值為 “sec (44ab57eec5d98lfaa33) ” ;
[0071]第2級深度的Path值為“frag(O) ” ;
[0072]第3級深度的Path值為“video” ;
[0073]第4級深度的Path值為“ 484 ” ;
[0074]第5級深度的Path值為“516” ;
[0075]第6 級深度的 Path 值為 “56615484_mp4_h264_aac_l.flv”。
[0076]同樣,網(wǎng)關設備在完成了對URL#A的Quey Param部分提取之后,可以確定URL#A的Quey Param部分中全部Quey Param的名稱和參數(shù)值。
[0077]通常情況下,URL中Quey Param的格式為“NAME = VALUE”,NAME為參數(shù)名,Value為參數(shù)值。但是,本發(fā)明并不限定于此,可以是只有NAME,可以是NAME為空,也可以是VALUE為空,即,URL中Quey Param的格式可為:
[0078]“NAME = VALUE”,或
[0079]“NAME”,或
[0080]“NAME=,,或
[0081]“= VALUE”。
[0082]具體地說,以圖2所示的URL為例,該URL包括9個“&”符號,因此,可以確定其包括9個Quey Param,其中,
[0083]第I個Quey Param所對應的字符串為“4”,其參數(shù)名為“4”,參數(shù)值為空;
[0084]第2個Quey Param所對應的字符串為“ipbits = O”,其參數(shù)名為“ipbits”,參數(shù)值為“O”;
[0085]第3個Quey Param所對應的字符串為
[0086]“signature =.BC606865625583C2BE5AA6472A7536D827ED7E58”,
[0087]其參數(shù)名為“signature”,參數(shù)值為
[0088]“.BC606865625583C2BE5AA6472A7536D827ED7E58” ;
[0089]第4個Quey Param所對應的字符串為“sver = 3”,其參數(shù)名為“sver”,參數(shù)值為“3”;
[0090]第5個Quey Param所對應的字符串為“expire = 1252105200”,其參數(shù)名為“expire,,,參數(shù)值為 “1252105200” ;
[0091]第6個Quey Param所對應的字符串為“key = ytl”,其參數(shù)名為“key”,參數(shù)值為“ytl,,;
[0092]第7個Quey Param所對應的字符串為factor = 1.25”,其參數(shù)名為“factor”,參數(shù)值為“1.25”;
[0093]第8個Quey Param所對應的字符串為burst = 40”,其參數(shù)名為“burst”,參數(shù)值為 “40,,;
[0094]第9個Quey Param所對應的字符串為“id = cl9764decel7ab”,其參數(shù)名為“id”,參數(shù)值為 “cl9764decel7ab,,。
[0095]從而,如上所述,可以確定URL#A的Path部分的深度Path值以及Quey Param部分中各Quey Param的名稱和參數(shù)值。
[0096]另外,網(wǎng)關設備獲取URL#B (即,第一采樣URL的另一例),其中,該URL#B與用戶設備A相對應,并且,該URL#B與視頻B ( S卩,第一采樣視頻的另一例)相對應,例如,可以是網(wǎng)關設備從來自該用戶設備A的用于請求播放視頻B的HTTP消息中提取的,或者,也可以是網(wǎng)關設備從來自該用戶設備A的用于請求播放視頻B的片段的HTTP消息中提取的。
[0097]網(wǎng)關設備在獲取該URL#B之后,可以提取該URL#B的Path部分和/或Quey Param部分,并可以確定URL#B的Path部分的深度和Path值,以及URL#B的Quey Param部分中全部Quey Param的名稱和參數(shù)值。該過程與上述針對URL#A的處理過程相似,這里,為了避免贅述,省略其詳細說明。
[0098]需要說明的是,視頻網(wǎng)站為同一用戶設備所請求的屬于同一視頻播放會話(或者說,視頻播放業(yè)務)的不同視頻(例如,不同的視頻格式或者碼率)所分配的URL中,通常只有Sess1n部分和用于指示該用戶設備的用戶簽名部分(S卩,與用戶設備相對應的部分)是相同的,因此,為了準確地確定該Sess1n部分,需要使URL#A和URL#B屬于同一視頻播放會話,或者說,需要確保URL#A和URL#B所對應的視頻的視頻內容相同,并且,需要排除上述用戶簽名部分的干擾。
[0099]對于確定URL#A和URL#B屬于同一視頻播放會話的方法,可以列舉以下過程。
[0100]可選地,該接收該至少兩個第一采樣URL,包括:
[0101]在第一時段內,接收該至少兩個第一采樣URL,該第一時段是根據(jù)該至少兩個第一采樣URL中最先接收到的URL的所對應的第一采樣視頻的時長確定的。
[0102]具體地說,網(wǎng)關設備在接收到來自用戶設備A的URL#A后,可以記錄該URL#A的接收時刻tl,并且可以采用視頻內容分析等方式,獲取該URLM所對應的視頻A的視頻時長L,這里需要說明的是,當URLM對應的是視頻A的視頻片段時,該視頻時長L是指該視頻片段所屬于的完整視頻A的時長。
[0103]當在以tl時刻為起始時刻的長度為視頻時長L的時間范圍T內接收到來自用戶設備A的URL#B時,由于該URL#B與URL#A均來自用戶設備A,并且,該URL#B是在上述時間范圍T內接收到的,因此,網(wǎng)關設備可以推斷該URL#B是在視頻A(或者,視頻A的片段)的播放期間內接收到的,進而網(wǎng)關設備可以確定該URL#B與URLM所對應的視頻屬于同一視頻播放會話。
[0104]可選地,該至少兩個第一采樣URL的路徑Path部分的深度相同。
[0105]具體地說,屬于同一視頻播放會話的視頻所對應的各URL的Path部分通常具有相同的Path深度,因此,通過在確定該URL#B與URL#A的Path部分的深度相同之后,能夠進一步提聞該URL#B與URL#A所對應的視頻屬于同一視頻播放會話的可罪性,進而提聞本發(fā)明實施例的Sess1n部分提取模型的準確性。
[0106]可選地,各該第一采樣URL的搜索參數(shù)Quey Param部分包括的Quey Param中,參數(shù)名相異的Quey Param數(shù)量小于等于第一閾值。
[0107]具體地說,屬于同一視頻播放會話的視頻所對應的各URL的Quey Param部分中包含的Quey Param的通常具有一定相似性,例如,參數(shù)名相異的Quey Param的數(shù)量通常小于等于第一閾值,例如,5個,因此,通過在確定該URL#B與URL#A的Quey Param中參數(shù)名相異的Quey Param的數(shù)量小于等于第一閾值,能夠進一步提高該URL#B與URL#A所對應的視頻屬于同一視頻播放會話的可靠性,進而提高本發(fā)明實施例的Sess1n部分提取模型的準確性。
[0108]應理解,以上列舉的作為第一閾值的數(shù)量僅為示例性說明,本發(fā)明并未限定于此,可以根據(jù)標準需要或互聯(lián)網(wǎng)視頻發(fā)布商的要求進行任意變更。
[0109]并且,以上列舉的確定URL#A和URL#B所對應的視頻屬于同一視頻播放會話的方法僅為示例性說明,本發(fā)明并不限定于此,例如,再用離線采樣的方式,直接從管理設備或數(shù)據(jù)庫獲取屬于同一視頻播放會話的不同視頻以及所對應的URL。
[0110]對于排除用戶簽名部分的干擾的方法,可以列舉以下過程。
[0111]可選地,在第一時段外,接收至少一個第二米樣URL,該第二米樣URL與該第一用戶設備相對應,該第一時段是根據(jù)所述至少兩個第一采樣URL中最先接收到的URL的所對應的第一米樣視頻的時長確定的;
[0112]遍歷各該第一采樣URL和該第二采樣URL的非Host部分,以確定各該第一采樣URL中與該第一用戶設備相對應的部分,其中,該第一采樣URL與該第二采樣URL中,與該第一用戶設備相對應的部分的字符串相同
[0113]具體地說,網(wǎng)關設備在接收到來自用戶設備A的URL#A后,可以記錄該URL#A的接收時刻tl,并且可以采用視頻內容分析等方式,獲取該URL#A所對應的視頻A的視頻時長L,這里需要說明的是,當URLM對應的是視頻A的視頻片段時,該視頻時長L是指該視頻片段所屬于的完整視頻A的時長。
[0114]當在以tl時刻為起始時刻的長度為視頻時長L的時間范圍T以外,例如,以tl時刻為起始時刻,2倍于該視頻時長L之后的時刻,接收到來自用戶設備A的URL#C (第二采樣URL的一例)時,由于該URL#C與URL#A均來自用戶設備A,并且,該URL#C是在上述時間范圍T外接收到的,因此,網(wǎng)關設備可以推斷該URL#C是在視頻A (或者,視頻A的片段)的播放期間以外接收到的,進而網(wǎng)關設備可以確定該URL#C與URL#A所對應的視頻不屬于同一視頻播放會話。并且,由于URL#C與URL#A均來自用戶設備A,因此,該URL#C與URL#A中用于標識該用戶設備A的字符串(即,用戶簽名部分)相同,因此,通過從URL#A中去除該相同部分,能夠去除用戶簽名部分的干擾。通過同樣的方法,能夠從URL#B中去除用戶簽名部分的干擾。
[0115]可選地,該至少兩個第一 URL的Host部分的字符串相同。
[0116]具體地說,由于同一視頻網(wǎng)站在生成URL時所使用的規(guī)則通常相同,例如,對于兩個視頻內容相同的視頻,用于指示其視頻內容的Path部分的級別或者Quey Param的名稱通常相同,因此通過選用Host部分相同的URL作為上述URL#A和URL#B,能夠確保生成該URL#A和URL#B的視頻網(wǎng)站相同,從而能夠提高該Sess1n部分提取模型的準確性。
[0117]在本發(fā)明實施例中,互聯(lián)網(wǎng)視頻發(fā)布商可能將屬于同一視頻播放會話的不同視頻副本視為同一視頻,從而,用相同的標識信息來標識該不同視頻副,因此,在URL#A和URL#B除了上述會話部分之外,用于標識視頻的標識部分也可能相同,因此,需要去除該標識部分的干擾。
[0118]對于排除標識部分的干擾的方法,可以列舉以下過程。
[0119]可選地,在遍歷該第一采樣URL的非Host部分之前,該方法還包括:
[0120]根據(jù)標識部分提取模型,確定該至少兩個第一采樣URL的標識部分,其中,該標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各該第三采樣URL的標識部分的字符串相同,各該第三采樣URL的字符串相異,各該第三采樣URL所對應的用戶設備相異,各該第三采樣URL均與第二采樣視頻相對應,該第三采樣URL的標識部分包含于該第三采樣URL的非Host部分;
[0121]從該至少兩個第一采樣URL中,去除該標識部分。
[0122]具體地說,對于同一視頻,在多個URL(例如,不同用戶訪問該同一個視頻時使用的多個URL,或同一個用戶在多個時間訪問該同一個視頻使用的多個URL)中,存在相同的內容,例如,URL中的連續(xù)的一部分字符串即,標識部分。
[0123]在本發(fā)明實施例中,可以利用采樣URL (即,第三采樣URL),通過訓練來獲得用于從URL中提取標識部分的標識部分提取模型。
[0124]在本發(fā)明實施例中,作為該第三采樣URL,可以采用來自不同用戶設備的對應于同一視頻(為了便于區(qū)分,記做視頻D)的URL。并且,在本發(fā)明實施例中,該第三采樣URL的數(shù)量為兩個或兩個以上,為了便于理解和說明,以下,以該第三采樣URL為URL#D和URL#E為例,進行說明。
[0125]其中,該URL#D與用戶設備D相對應,并且,該URL#D與視頻D相對應,例如,可以是網(wǎng)關設備從來自該用戶設備D的用于請求播放視頻D的HTTP消息中提取的,或者,也可以是網(wǎng)關設備從來自該用戶設備D的用于請求播放視頻D的片段的HTTP消息中提取的。
[0126]該URL#E與用戶設備E相對應,并且,該URL#E與視頻D相對應,例如,可以是網(wǎng)關設備從來自該用戶設備E的用于請求播放視頻D的HTTP消息中提取的,或者,也可以是網(wǎng)關設備從來自該用戶設備E的用于請求播放視頻D的片段的HTTP消息中提取的
[0127]需要說明的是,以上列舉的URL#D和URL#E的獲取過程僅為示例性說明,本發(fā)明并未限定于此,例如,該URL#D也可以是由互聯(lián)網(wǎng)視頻發(fā)布商提供給網(wǎng)關設備的,只要能夠確保該URL#D與用戶設備D相對應,且該URL#D與視頻D相對應(例如,現(xiàn)有技術中,該URL#D可以作為完整的視頻D的索引,或者該URL#D可以作為視頻D的某一片段的索引)即可。
[0128]同樣,該URL#E也可以是由互聯(lián)網(wǎng)視頻發(fā)布商提供給網(wǎng)關設備的,只要能夠確保該URL#E與用戶設備E相對應,且該URL#E與視頻D相對應(例如,現(xiàn)有技術中,該URL#E可以作為完整的視頻D的索引,或者該URL#E可以作為視頻D的某一片段的索引)即可。
[0129]另外,在本發(fā)明實施例中,需要確保URL#D與URL#E對應同一視頻(即,視頻D)。作為實現(xiàn)方法,可以確定URL#D所對應的視頻的視頻摘要D,以及URL#E所對應的視頻的視頻摘要E,當確定視頻摘要D與視頻摘要E相同時,可以確定URL#D與URL#E對應同一視頻。
[0130]用戶設備在請求獲取視頻或視頻片段時發(fā)送的URL中,與視頻相對應的上述標識部分通常存在于URL的路徑(Path)部分或搜索參數(shù)(Quey Param)部分中,即,該標識部分可能是Path部分中的某一深度的Path值,也可能是Quey Param部分中的某一參數(shù)的值。
[0131]因此,在本發(fā)明實施例中,網(wǎng)關設備在獲取該URL#D和URL#E之后,可以提取該URLSD的Path部分和/或Quey Param部分,以及該URL#E的Path部分和/或Quey Param部分。
[0132]圖2示出了 URL的字符串中各部分的構成的一例,如圖2所示,URL的域名(Host)部分與Path部分之間由“/”符號隔開,因此,網(wǎng)絡設備可以將Host部分之后的第一個“/”符號(或者說,URL中的最后一個“/”符號)后的字符識別為Path部分的起始字符。
[0133]并且,如圖2所不,URL的Path部分與Quey Param部分之間由“? ”符號隔開,因此,網(wǎng)絡設備可以將Path部分(或者說,URL中的最后一個“/”符號)之后的第一個“?”符號后的字符識別為Path部分的起始字符。從而,能夠實現(xiàn)Quey Param部分的提取。
[0134]另外,網(wǎng)絡設備可以將該path部分之后的第一個“?”符號后的字符識別為Path部分的結束字符,從而,結合上述Path部分的起始字符,能夠實現(xiàn)Path部分的提取。
[0135]應理解,以上列舉的Path部分的提取方法以及Quey Param部分的提取方法僅為示例性說明,本發(fā)明并不限定于此,可以根據(jù)URL的變化而進行相應變更,例如,存在某些URL只存在Path部分而不存在Quey Param部分的情況,此情況下,只須其確定Path部分的起始字符即可。并且,以上列舉的Host部分與Path部分的分隔符號(即,“/”符號)以及Path部分與Quey Param部分之間的分隔符號(即,“? ”符號)僅為示例性說明,本發(fā)明并不限定于此,現(xiàn)有技術中,URL所采用的能夠實現(xiàn)分隔標識作用的符號均落入本發(fā)明的保護范圍內。
[0136]網(wǎng)關設備在完成了對URL#D和URL#E的Path部分提取之后,可以確定URL#D的Path部分的深度和Path值。
[0137]具體地說,Path部分的深度(或者說,級別)可以根據(jù)Path部分中包括的“/”符號的數(shù)量確定,例如,圖3示出了 URL中的Path部分的一例的示意圖。以圖3所示的URL為例,該URL包括六個“/”符號,因此,可以確定其深度為6,其中,
[0138]第I 級深度的 Path 值為 “sec (44ab57eec5d981faa33) ” ;
[0139]第2級深度的Path值為“ frag (O) ” ;
[0140]第3級深度的Path值為“video” ;
[0141]第4級深度的Path值為“484” ;
[0142]第5級深度的Path值為“516” ;
[0143]第6 級深度的 Path 值為 “56615484_mp4_h264_aac_l.flv”。
[0144]同樣,網(wǎng)關設備在完成了對URL#D的Quey Param部分提取之后,可以確定URL#A的Quey Param部分中全部Quey Param的名稱和參數(shù)值。
[0145]通常情況下,URL中Quey Param的格式為“NAME = VALUE”,NAME為參數(shù)名,Value為參數(shù)值。但是,本發(fā)明并不限定于此,可以是只有NAME,可以是NAME為空,也可以是VALUE為空,即,URL中Quey Param的格式可為:
[0146]“NAME = VALUE”,或
[0147]“NAME”,或
[0148]“NAME=” 或
[0149]“= VALUE”。
[0150]具體地說,以圖2所示的URL為例,該URL包括9個“&”符號,因此,可以確定其包括9個Quey Param,其中,
[0151]第I個Quey Param所對應的字符串為“4”,其參數(shù)名為“4”,參數(shù)值為空;
[0152]第2個Quey Param所對應的字符串為“ipbits = 0”,其參數(shù)名為“ipbits”,參數(shù)值為“O”;
[0153]第3個Quey Param所對應的字符串為
[0154]“signature =.BC606865625583C2BE5AA6472A7536D827ED7E58,>,
[0155]其參數(shù)名為“signature”,參數(shù)值為
[0156]“.BC606865625583C2BE5AA6472A7536D827ED7E58” ;
[0157]第4個Quey Param所對應的字符串為“sver = 3”,其參數(shù)名為“sver”,參數(shù)值為“3”;
[0158]第5個Quey Param所對應的字符串為“expire = 1252105200”,其參數(shù)名為“expire,,,參數(shù)值為 “1252105200” ;
[0159]第6個Quey Param所對應的字符串為“key = ytl”,其參數(shù)名為“key”,參數(shù)值為“ytl,,;
[0160]第7個Quey Param所對應的字符串為factor = 1.25”,其參數(shù)名為“factor”,參數(shù)值為“1.25”;
[0161]第8個Quey Param所對應的字符串為burst = 40”,其參數(shù)名為“burst”,參數(shù)值為 “O,,;
[0162]第9個Quey Param所對應的字符串為“id = cl9764decel7ab”,其參數(shù)名為“id”,參數(shù)值為 “cl9764decel7ab,,。
[0163]從而,如上所述,可以確定URL#D和URL#E的Path部分的深度Path值以及QueyParam部分中各Quey Param的名稱和參數(shù)值。
[0164]由于如上所述存在URL只存在Path部分而不存在Quey Param部分的情況,因此,可能存在URL#D和URL#E僅包含Path部分的深度和Path值的情況(即,情況I),也可能存在URLSD和URL#E中包含Path部分的深度和Path值以及Quey Param部分中全部QueyParam的名稱和參數(shù)值的情況(即,情況2)。
[0165]下面,分別對上述兩種情況的處理進行說明。
[0166]情況I
[0167]網(wǎng)關設備可以遍歷URL#D和URL#E的Path部分中各級深度的Path值,當URL#D和URL#E的Path部分的深度相同,或者說,Path部分包括的級數(shù)相同時,逐級進行比較,例如,可以首先比較URL#D和URL#E的Path部分中的第一級Path值,即,第一個“/”符號與第二個“/”符號之間的字符串,然后比較URL#D和URL#E的Path部分中的第二級Path值,即,第二個“/”符號與第三個“/”符號之間的字符串,依次類推。
[0168]從而,能夠URL#D和URL#E中path值相同的級別,以及,該相同的Path值。
[0169]例如,設URLSD 的 Path 部分為:/sec (44ab57eec5d981faa33)/frag (O) /video/484/516/56615484_mp4_h264_aac_l.fIv ;
[0170]并且,URL#E的 Path 部分為:/sec (98ac09efd2e662cef97)/frag (O) /video/580/720/56615484_mp4_h264_aac_l.flv,
[0171]則網(wǎng)關設備可以確定URL#D和URL#E中path值相同的級別第2級、第3級和第5級。
[0172]從而,網(wǎng)關設備可以確定發(fā)布該視頻D的視頻網(wǎng)站是通過URL中Path部分中的第2級、第3級和第5級來標識視頻的片段,例如,可以確定Path部分中第2級、第3級和第5級的值用于指示該視頻D。
[0173]進而,可以將標識部分提取模型確定為用于提取URL的Path部分中Path部分中第2級、第3級和第5級的Path值。
[0174]可選地,該方法還包括:
[0175]獲取第四采樣URL以及第四視頻,其中,該第四采樣URL與該第四視頻相對應,該第四采樣視頻與該第三采樣視頻相異;
[0176]根據(jù)標識部分提取模型,確定該第四采樣URL的標識部分;
[0177]確定該第四采樣URL的標識部分與該第三采樣URL的標識部分之間的重疊部分,該重疊部分包括Path值相同的Path級別和/或參數(shù)值相同的Quey Param ;
[0178]從該第三采樣URL的標識部分中去除該重疊部分,以更新該第三采樣URL的標識部分;
[0179]根據(jù)更新后的第三采樣URL的標識部分,更新該標識部分提取模型。
[0180]具體地說,為了進一步提高如上所述確定的標識部分提取模型的準確性,還可以獲取與視頻N(第四采樣視頻的一例)所對應的URL#N(第四采樣URL的一例),其中,發(fā)布該視頻N和視頻D的視頻網(wǎng)站相同,并且,該視頻N與視頻D相異(例如,視頻摘要相異)。
[0181]例如,設URUN 的 Path 部分為:/sec (74cf57abe5f336fbe78)/frag (O) /video/665/896/91362310_wma_pl35_aac_8.flv ;
[0182]則網(wǎng)關設備可以確定URL.、URL#D和URL#E中path值相同的級別第2級和第3級,進而可以判定Path部分中第2級和第3級不能用于區(qū)分視頻。
[0183]從而,網(wǎng)關設備可以確定發(fā)布該視頻D和視頻N的視頻網(wǎng)站是通過URL中Path部分中的第5級來標識視頻的片段,例如,可以確定URL#D的Path部分中第5級的值用于指示該視頻D。
[0184]進而,可以將標識部分提取模型確定為用于提取URL的Path部分中Path部分中第5級的Path值。
[0185]情況2
[0186]網(wǎng)關設備可以遍歷URLSD和URL#E的Quey Param部分中各Quey Param的參數(shù)值,從而,能夠確定URL#D和URL#E中參數(shù)值相同的Quey Param,以及,該相同的Path值。
[0187]例如,設URLSD 的 Quey Param 部分為:
[0188]4&ipbits = O&signature =.BC606865625583C2BE5AA6472A7536D827ED7E58&sver = 3&expire = 1252105200&key = ytl&factor = 1.25&burst = 40&id = cl9764decel7ab
[0189]并且,URL#E的 Quey Param 部分為:
[0190]5&ipbits = l&signature = 9879DD9541B65704625CAB118092DFD151856C&sver =4&expire = 1252105201&key = ytl&factor = 2.25&burst = 50&id = cl9764decel7ab
[0191]則網(wǎng)關設備可以確定URL#D和URL#E中參數(shù)名為“key” “和id”的Quey Param的參數(shù)值相同。
[0192]從而,網(wǎng)關設備可以確定發(fā)布該視頻D的視頻網(wǎng)站是通過URL中Quey Param部分中的“key” “和id”參數(shù)來標識視頻,例如,可以確定“key” “和id”的參數(shù)值用于指示該視頻D。
[0193]進而,網(wǎng)關設備可以將標識部分提取模型確定為用于提取URL的Quey Param部分中的“key” “和id”參數(shù)。
[0194]情況4中基于Path部分來訓練獲得標識部分提取模型的方法和過程與情況3類似,這里,為了避免贅述,省略其說明。
[0195]另夕卜,由于同一視頻網(wǎng)站在生成URL時所使用的規(guī)則通常相同,例如,對于不同用戶設備請求觀看同一視頻時生成的不同的URL中,用于標識該視頻的Path部分的級別或者Quey Param的名稱通常相同,因此通過選用Host部分相同的URL作為上述URL#D和URL#E,能夠確保,該生成該URL#D和URL#E的視頻網(wǎng)站相同,從而能夠提高該標識部分提取模型的準確性。
[0196]需要說明的是,在以上實施例中,列舉了使用兩個URL來訓練獲得標識部分提取模型的過程,但本發(fā)明并不限定于此,可以采用更多的個URL來訓練獲得標識部分提取模型,例如,在如上所述通過對比URL#D和URL#E從而確定相同部分(包括相同的Path級別及Path值,和/或,相同的Quey Param的名稱及參數(shù)值,為了便于區(qū)分記做,相同部分A)后,還可以獲取URL#Z,該URL#Z與用戶設備Z相對應,并且,該URL#Z與視頻D相對應,該URL#Z的獲取過程可以與URL#A和URL#B的獲取過程類似,這里為了避免贅述,省略其詳細說明。其后,可以對比URL#Z和URL#D或對比URL#Z和URL#E,找出相同部分(包括相同的Path級別及Path值,和/或,相同的Quey Param的名稱及參數(shù)值,為了便于區(qū)分記做,相同部分B),并將該相同部分A與相同部分B進行對比,從中去除相異的部分(包括相已的Path級別及Path值,和相異的Quey Param的名稱及參數(shù)值)作為標識部分提取模型的訓練依據(jù),能夠進一步提高本發(fā)明的標識部分提取模型的準確性。
[0197]在本發(fā)明實施例中,網(wǎng)關設備可以對從各服務器獲得的視頻(即,緩存視頻的一例)進行緩存,并且,可以根據(jù)如上所述獲得的標識部分提取模型,從各視頻所對應的URL (即,緩存URL的一例)中提取各視頻的標識,作為對應視頻的索引。
[0198]可選地,該方法還包括:
[0199]接收至少一個驗證URL,且該驗證URL的非Host子字符串中包含該緩存URL的標識部分的字符串;
[0200]向服務器轉發(fā)該驗證URL ;
[0201]接收該服務器根據(jù)該驗證URL發(fā)送的驗證視頻;
[0202]確定該驗證視頻與該緩存視頻相同。
[0203]具體地說,在本發(fā)明實施例中,為了驗證上述標識部分提取模型的準確性,可以進行在線驗證,例如,在接收到一個用戶設備X發(fā)送的URL#X后,可以根據(jù)上述標識部分提取模型提取該URL#X中的標識部分,并作為索引,從上述緩存視頻中確定與該URL#X相對應的視頻XI,并且,可以將該URL#X轉發(fā)至服務器,并且從服務器獲得與該視頻相對應的視頻X2,如果視頻Xl與視頻X2相同,則可以認為上述標識部分提取模型是準確地。如果視頻Xl與視頻X2不相同,則可以認為上述標識部分提取模型是不準確地,并可以重新選擇采樣URL,以訓練獲得新的標識部分提取模型。
[0204]在如上所述,獲取標識部分提取模型后,可以根據(jù)該標識部分提取模型確定URL#A和URL#B中的標識部分,并將其去除,從而,能夠排除標識部分的干擾,進而,能夠提高該Sess1n部分提取模型的準確性。
[0205]在本發(fā)明實施例中,上述視頻A和視頻B可能為視頻片段,并且,當視頻A和視頻B為同一視頻片段相同而僅是格式或者碼率相異時,在URL#A和URL#B除了上述會話部分之夕卜,用于標識該片段(或者說,標識視頻在原視頻中的位置)的分段部分(以下,稱為Rang部分)也可能相同,因此,需要去除該Rang部分的干擾。
[0206]對于排除標識部分的干擾的方法,可以列舉以下過程。
[0207]可選地,該方法還包括:
[0208]在遍歷該第一采樣URL的非Host部分之前,該方法還包括:
[0209]根據(jù)分段部分提取模型,確定該至少兩個第一采樣URL的分段部分,其中,該分段部分提取模型是根據(jù)該分段信息確定的,該分段信息是基于分段部分提取條件,對第一采樣信息集合和第二采樣信息集合進行對比處理而從該第一采樣信息集合和該第二采樣信息集合中確定的,該第一米樣信息集合是根據(jù)第四米樣URL確定的,該第四米樣URL包括路徑Path部分和搜索參數(shù)Quey Param部分,該第四采樣URL的Quey Param部分包括K個Quey Param,該第一米樣信息集合包括第一信息和第二信息中的至少一個,該第一信息用于指示該第四采樣URL的Path部分的深度和Path值,該第二信息用于指示該第四采樣URL的K個Quey Param的名稱和參數(shù)值,該第二采樣信息集合是根據(jù)第五采樣URL確定的,該第五采樣URL包括Path部分和Quey Param部分,該第五采樣URL的Quey Param部分包括M個Quey Param,該第四米樣URL和該第五米樣URL均對應第三視頻相同,該第五米樣信息集合包括第三信息和第四信息中的至少一個,該第三信息用于指示該第五采樣URL的Path部分的深度和Path值,該第四信息用于指示該第五采樣URL的M個Quey Param的名稱和參數(shù)值,該分段部分提取條件包括第一條件、第二條件和第三條件中的至少一個,
[0210]該第一條件為:該分段信息指示的Path部分的深度在該第一采樣信息集合和該第二采樣信息集合中相同,且該分段信息該指示Path值在該第一采樣信息集合和該第二采樣信息集合中相異,
[0211]該第二條件為:該分段信息指示的Quey Param的名稱屬于該第一采樣信息集合和該第二米樣信息集合雙方,且該分段信息指不的Quey Param的參數(shù)值在該第一米樣信息集合和該第二采樣信息集合中相異,
[0212]該第三條件為:該分段信息指示的Quey Param的名稱僅屬于該第一采樣信息集合和該第二米樣信息集合中的一方;
[0213]從該至少兩個第一采樣URL中,去除該分段部分。
[0214]在時段Tl (即,第二時段的一例),網(wǎng)關設備獲取URL#F( g卩,第四采樣URL的一例),其中,該URL#F與用戶設備F相對應,并且,該URL#F與視頻F (即,第三采樣視頻的一例)相對應,例如,可以是網(wǎng)關設備從來自該用戶設備F的用于請求播放視頻F的HTTP消息中提取的,或者,也可以是網(wǎng)關設備從來自該用戶設備F的用于請求播放視頻F的片段的HTTP消息中提取的。
[0215]需要說明的是,以上列舉的URL#F的獲取過程僅為示例性說明,本發(fā)明并未限定于此,例如,該URL#F也可以是由互聯(lián)網(wǎng)視頻發(fā)布商提供給網(wǎng)關設備的,只要能夠確保該URL#F與用戶設備F相對應,且該URL#F與視頻F相對應即可,例如,現(xiàn)有技術中,該URL#F可以作為完整的視頻F的索引,或者該URL#F可以作為視頻F的某一片段的索引。
[0216]用戶設備在請求獲取視頻片段時發(fā)送的URL中,與片段相對應的上述Range部分通常存在于URL的路徑(Path)部分或搜索參數(shù)(Quey Param)部分中,即,該Range部分可能是Path部分中的某一深度的Path值,也可能是Quey Param部分中的某一參數(shù)的值。
[0217]因此,在本發(fā)明實施例中,網(wǎng)關設備在獲取該URL#F之后,可以提取該URL#F的Path部分和/或Quey Param部分。
[0218]圖2示出了 URL的字符串中各部分的構成的一例,如圖2所示,URL的域名(Host)部分與Path部分之間由“/”符號隔開,因此,網(wǎng)絡設備可以將Host部分之后的第一個“/”符號(或者說,URL中的最后一個“/”符號)后的字符識別為Path部分的起始字符。
[0219]并且,如圖2所示,URL的Path部分與Quey Param部分之間由“?”符號隔開,因此,網(wǎng)絡設備可以將Path部分(或者說,URL中的最后一個“/”符號)之后的第一個“?”符號后的字符識別為Path部分的起始字符。從而,能夠實現(xiàn)Quey Param部分的提取。
[0220]另外,網(wǎng)絡設備可以將該path部分之后的第一個“?”符號后的字符識別為Path部分的結束字符,從而,結合上述Path部分的起始字符,能夠實現(xiàn)Path部分的提取。
[0221]應理解,以上列舉的Path部分的提取方法以及Quey Param部分的提取方法僅為示例性說明,本發(fā)明并不限定于此,可以根據(jù)URL的變化而進行相應變更,例如,存在某些URL只存在Path部分而不存在Quey Param部分的情況,此情況下,只須其確定Path部分的起始字符即可。并且,以上列舉的Host部分與Path部分的分隔符號(即,“/”符號)以及Path部分與Quey Param部分之間的分隔符號(即,“? ”符號)僅為示例性說明,本發(fā)明并不限定于此,現(xiàn)有技術中,URL所采用的能夠實現(xiàn)分隔標識作用的符號均落入本發(fā)明的保護范圍內。
[0222]網(wǎng)關設備在完成了對URL#F的Path部分提取之后,可以確定URL#F的Path部分的深度和Path值。
[0223]具體地說,Path部分的深度(或者說,級別)可以根據(jù)Path部分中包括的“/”符號的數(shù)量確定,例如,圖3示出了 URL中的Path部分的一例的示意圖。以圖3所示的URL為例,該URL包括六個“/”符號,因此,可以確定其深度為6,其中,
[0224]第I 級深度的 Path 值為 “sec (44ab57eec5d981faa33) ” ;
[0225]第2級深度的Path值為“ frag (O) ” ;
[0226]第3級深度的Path值為“video” ;
[0227]第4級深度的Path值為“ 484 ” ;
[0228]第5級深度的Path值為“516” ;
[0229]第6 級深度的 Path 值為 “56615484_mp4_h264_aac_l.flv”。
[0230]同樣,網(wǎng)關設備在完成了對URL#F的Quey Param部分提取之后,可以確定URL#F的Quey Param部分中全部Quey Param的名稱和參數(shù)值。
[0231 ] 通常情況下,URL中Quey Param的格式為“NAME = VALUE”,NAME為參數(shù)名,Value為參數(shù)值。但是,本發(fā)明并不限定于此,可以是只有NAME,可以是NAME為空,也可以是VALUE為空,即,URL中Quey Param的格式可為:
[0232]“NAME = VALUE”,或
[0233]“NAME”,或
[0234]“NAME=” 或
[0235]“= VALUE”。
[0236]具體地說,以圖2所示的URL為例,該URL包括9個“&”符號,因此,可以確定其包括9個Quey Param,其中,
[0237]第I個Quey Param所對應的字符串為“4”,其參數(shù)名為“4”,參數(shù)值為空;
[0238]第2個Quey Param所對應的字符串為“ipbits = O”,其參數(shù)名為“ipbits”,參數(shù)值為“O”;
[0239]第3個Quey Param所對應的字符串為
[0240]“signature =.BC606865625583C2BE5AA6472A7536D827ED7E58”,
[0241]其參數(shù)名為“signature”,參數(shù)值為
[0242]“.BC606865625583C2BE5AA6472A7536D827ED7E58” ;
[0243]第4個Quey Param所對應的字符串為“sver = 3”,其參數(shù)名為“sver”,參數(shù)值為“3”;
[0244]第5個Quey Param所對應的字符串為“expire = 1252105200”,其參數(shù)名為“expire,,,參數(shù)值為 “1252105200” ;
[0245]第6個Quey Param所對應的字符串為“key = ytl”,其參數(shù)名為“key”,參數(shù)值為“ytl,,;
[0246]第7個Quey Param所對應的字符串為factor = 1.25”,其參數(shù)名為“factor”,參數(shù)值為“1.25”;
[0247]第8個Quey Param所對應的字符串為burst = 40”,其參數(shù)名為“burst”,參數(shù)值為 “40,,;
[0248]第9個Quey Param所對應的字符串為“id = cl9764decel7ab”,其參數(shù)名為“id”,參數(shù)值為 “cl9764decel7ab,,。
[0249]從而,如上所述,可以確定URL#F的Path部分的深度Path值以及Quey Param部分中各Quey Param的名稱和參數(shù)值,并記錄上述信息以生成第一信息集合。
[0250]在時段T2 (即,第三時段的一例),網(wǎng)關設備獲取URL#G( S卩,第五采樣URL的一例),其中,該URL#G與用戶設備F相對應,并且,該URL#G與視頻F (即,第三采樣視頻的一例)相對應,例如,可以是網(wǎng)關設備從來自該用戶設備F的用于請求播放視頻F的HTTP消息中提取的,或者,也可以是網(wǎng)關設備從來自該用戶設備F的用于請求播放視頻F的片段的HTTP消息中提取的。
[0251]需要說明的是,視頻網(wǎng)站為同一用戶所請求的來自同一視頻的不同片段所分配的URL中,通常只有Rang部分(例如,指示視頻開始時間的字符串)是相異的,因此,為了準確地確定該Rang部分,需要確保URL#F和URL#G分別對應同一視頻(即,上述視頻F)的不同片段,例如,URL#F對應完整的視頻F而URL#G對應視頻F的一個片段,或者,URL#F對應視頻F的一個片段而URL#G對應完整的視頻,再或者,URL#F對應視頻F的一個片段而URL#G對應視頻F的另一個片段。
[0252]在本發(fā)明實施例中,可以采用在線采樣的方式,在為用戶轉發(fā)視頻的同時,訓練獲得Rang部分提取模型,因此,通過使URL#F和URL#G對應同一視頻(即,上述視頻F)能夠提高該Rang部分提取模型的準確性。
[0253]在本發(fā)明實施例中,可以根據(jù)URL#F和URL#G的獲取時間來判斷URL#F和URL#G
是否對應同一視頻。
[0254]即,可選地,該第四URL是在第二時段接收的,該第五URL是在第三時段接收的,該第二時段與該第三時段之間的間隔是根據(jù)該第三視頻的時長確定的。
[0255]具體地說,如果網(wǎng)關設備首先接收到URL#F,則可以確定與URL#F相對應的視頻F(這里,URL#F可以對應完整的視頻F,也可以對應視頻F的一個片段),其中,該視頻F可以是網(wǎng)關設備從服務器獲取的,也可以是網(wǎng)關設備利用URL#F中的標識部分而從緩存的視頻中獲取的(隨后,以確定目標URL所對應的第二視頻為例,對該過程進行詳細說明)。其后,可以確定該視頻F的總時長(S卩,第一視頻的時長)。從而可以確定一個判定范圍(即,預設范圍),該判定范圍的起始時刻為URL#F的接收時刻,該判定范圍的時長為該視頻F的總時長。
[0256]如果URL#G的接收時間位于該判定范圍內,且該URL#G同樣來自用戶設備F,則可以認為URL#F和URL#G對應同一視頻。接收時間在該判定范圍以外的URL則不能作為該URLSG0
[0257]根據(jù)本發(fā)明實施例的視頻識別方法,第四采樣URL和第五采樣URL的獲取時間間隔處于預設范圍內,并且該預設范圍是根據(jù)第四采樣URL和第五采樣URL均對應的第三采樣視頻的時長確定的,能夠確保第四采樣URL和第五采樣URL分別對應第三采樣視頻的不同片段,從而能夠提高Rang部分提取模型的有效性。
[0258]應理解,以上列舉的確定URL#F和URL#G對應同一視頻的方法僅為示例性說明,本發(fā)明并不限定于此,例如,可以根據(jù)上述標識部分提取模型提取URL#F和URL#G的標識部分,并確定URL#F和URL#G的標識部分相同后,確定URL#F和URL#G對應同一視頻。
[0259]網(wǎng)關設備在獲取該URL#G之后,可以提取該URL#G的Path部分和/或Quey Param部分,并可以確定URL#G的Path部分的深度和Path值,以及URL#G的Quey Param部分中全部Quey Param的名稱和參數(shù)值,并記錄上述信息以生成第二信息集合。該過程與上述針對URL#F的處理過程相似,這里,為了避免贅述,省略其詳細說明。
[0260]可選地,該第四采樣URL是第一用戶設備在請求獲取該第三采樣視頻時發(fā)送的URL,該第五采樣URL是該第一用戶設備在請求獲取該第三采樣視頻的片段時發(fā)送的URL ;或
[0261]該第四采樣URL是第一用戶設備在請求獲取該第三采樣視頻的片段時發(fā)送的URL,該第五采樣URL是該第一用戶設備在請求獲取該第三采樣視頻時發(fā)送的URL ;或
[0262]該第四采樣URL是第一用戶設備在請求獲取該第三采樣視頻的第一片段時發(fā)送的URL,該第五采樣URL是該第一用戶設備在請求獲取該第三采樣視頻的第二片段時發(fā)送的URL,其中,該第一片段與該第二片段相異。
[0263]具體地說,在本發(fā)明實施例中,當時段Tl處于時段T2之前時,該URL#F可以是用戶在請求觀看完整的視頻時(例如,用戶點擊播放圖標時)視頻網(wǎng)站為該用戶設備下發(fā)的URL。而上述URL#G可以是用戶在發(fā)生拖動動作時視頻網(wǎng)站為該用戶設備下發(fā)的URL。或者,當時段TI處于時段T2之后時,該URL#G可以是用戶在請求觀看完整的視頻時(例如,用戶點擊播放圖標時)視頻網(wǎng)站為該用戶設備下發(fā)的URL。而上述URL#F可以是用戶在發(fā)生拖動動作時視頻網(wǎng)站為該用戶設備下發(fā)的URL。再或者,該URL#F可以是用戶在發(fā)生拖動動作而請求觀看視頻的一個片段時視頻網(wǎng)站為該用戶設備下發(fā)的URL。而上述URL#G可以是用戶在發(fā)生拖動動作而請求觀看視頻的另一個片段時視頻網(wǎng)站為該用戶設備下發(fā)的URL,從而,能夠確保該URL#G與該URL#F中存在差異的字符串與視頻的片段相關,進而能夠提高本發(fā)明實施的Rang部分提取模型的準確性。
[0264]可選地,該第四采樣URL與該第五采樣URL的Host部分的字符串相同。
[0265]具體地說,由于同一視頻網(wǎng)站在生成URL時所使用的規(guī)則通常相同,例如,對于兩個視頻片段,用于表示該片段在源視頻中的位置的Path部分的級別或者Quey Param的名稱通常相同,因此通過選用Host部分相同的URL作為上述URL#F和URL#G,能夠確保生成該URL#F和URL#G的視頻網(wǎng)站相同,從而能夠提高該Rang部分提取模型的準確性。
[0266]在如上所述獲取第一信息集合和第二信息集合之后,可以對上述第一信息集合和第二信息集合進行對比處理,以確定Rang部分提取模型。
[0267]由于如上所述存在URL只存在Path部分而不存在Quey Param部分的情況,因此,可能存在第一信息集合和第二信息集合中僅包含Path部分的深度和Path值的情況(即,情況3),也可能存在第一信息集合和第二信息集合中包含Path部分的深度和Path值以及Quey Param部分中全部Quey Param的名稱和參數(shù)值的情況(即,情況4)。
[0268]下面,分別對上述兩種情況的處理進行說明。
[0269]情況3
[0270]網(wǎng)關設備可以遍歷URL#F和URL#G的Path部分中各級深度的Path值,當URL#F和URL#G的Path部分的深度相同,或者說,Path部分包括的級數(shù)相同時,逐級進行比較,例如,可以首先比較URL#F和URL#G的Path部分中的第一級Path值,即,第一個“/”符號與第二個“/”符號之間的字符串,然后比較URL#F和URL#G的Path部分中的第二級Path值,即,第二個“/”符號與第三個“/”符號之間的字符串,依次類推。
[0271]從而,能夠URL#F和URL#G中path值彼此相異的級別,以及,該相異的Path值,即,對應上述第一條件。
[0272]例如,設URL#F 的 Path 部分為:/sec (44ab57eec5d981faa33)/frag (O) /video/484/516/56615484_mp4_h264_aac_l.flv ;
[0273]并且,URL#G的 Path 部分為:/sec (44ab57eec5d981faa33)/frag (I) /video/484/516/56615484_mp4_h264_aac_l.flv,
[0274]則網(wǎng)關設備可以確定URL#F和URL#G中path值彼此相異的級別第2級,且URL#F和URL#G中彼此相異path值為frag (O)和frag (I)。
[0275]從而,網(wǎng)關設備可以確定發(fā)布該視頻F的視頻網(wǎng)站是通過URL中Path部分中的第二級(即,frag)來標識視頻的片段,例如,可以確定“frag”的值用于指示該視頻片段相對于完整的視頻的起始時間或結束時間。
[0276]進而,可以將Rang部分提取模型確定為用于提取URL的Path部分中第2級的path值。
[0277]情況4
[0278]例如,在本發(fā)明實施例中,可能存在第一信息集合和第二信息集合中Quey Param的數(shù)量相同的情況,即,URL#F與URL#G所對應的視頻為同一視頻的不同視頻片段,因此,URL#F與URL#G的Quey Param部分中的Quey Param的數(shù)量,或者Quey Param的參數(shù)名的數(shù)量通常相同。
[0279]此情況下,通過對比參數(shù)名相同但參數(shù)值相異的Quey Param,能夠確定用來標識視頻的片段的參數(shù)名,即,對應上述第二條件。
[0280]例如,設URL#F 的 Quey Param 部分為:
[0281]10200&key = 25blIc805e36d6aef3038550860c680040cdaa4201&playtype =l&tk = 155012700719935787180022220&brt = 3&bc = O&nt = O&du = 538470&sz =179904090&tflvbegin = 18055261 ;
[0282]并且,URL#G的 Quey Param 部分為:
[0283]10200&key = 25blIc805e36d6aef3038550860c680040cdaa4201&playtype =l&tk = 155012700719935787180022220&brt = 3&bc = O&nt = O&du = 538470&sz =213602090&tflvbegin = 28941773,
[0284]則網(wǎng)關設備可以確定URL#F和URL#G中參數(shù)名為“sz”和“tflvbegin”的QueyParam的參數(shù)值彼此相異。
[0285]從而,網(wǎng)關設備可以確定發(fā)布該視頻F的視頻網(wǎng)站是通過URL中Quey Param部分中的“sz”和“tflvbegin”參數(shù)來標識視頻的片段,例如,可以確定“sz”和“tflvbegin”的參數(shù)值用于指示該視頻片段相對于完整的視頻的長度和起始時間。
[0286]進而,網(wǎng)關設備可以將分段部分提取模型確定為用于提取URL的Quey Param部分中的“sz”參數(shù)和“tflvbegin”參數(shù)。
[0287]再例如,在本發(fā)明實施例中,也可能存在第一信息集合和第二信息集合中QueyParam的數(shù)量相異的情況。例如,URL#F對應完整的視頻F而URL#G對應視頻F的一個片段,該URL#F可以是用戶在請求觀看完整的視頻時(例如,用戶點擊播放圖標時)視頻網(wǎng)站為該用戶設備下發(fā)的URL。而上述URL#G可以是用戶在發(fā)生拖動動作時視頻網(wǎng)站為該用戶設備下發(fā)的URL,因此,URL#F與URL#G的Quey Param部分中的Quey Param的數(shù)量,或者Quey Param的參數(shù)名的數(shù)量可能相異,即,對應上述第三條件。
[0288]例如,設URL#F 的 Quey Param 部分為:
[0289]10200&key = 25bllc805e36d6aef3038550860c680040cdaa4201&playtype = l&tk=155012700719935787180022220&brt = 3&bc = O&nt = O&du = 538470 ;
[0290]并且,URL#G的 Quey Param 部分為:
[0291]10200&key = 25blIc805e36d6aef3038550860c680040cdaa4201&playtype =l&tk = 155012700719935787180022220&brt = 3&bc = O&nt = O&du = 538470&sz =179904090&tflvbegin = 18055261,
[0292]則網(wǎng)關設備可以確定URL#G中參數(shù)名為“sz”和“tflvbegin”的Quey Param的不存在于URL#F。
[0293]從而,網(wǎng)關設備可以確定發(fā)布該視頻F的視頻網(wǎng)站是通過URL中Quey Param部分中的“sz”和“tflvbegin”參數(shù)來標識視頻的片段,例如,可以確定“sz”和“tflvbegin”的參數(shù)值用于指示該視頻片段相對于完整的視頻的長度和起始時間。
[0294]進而,網(wǎng)關設備可以將Rang部分提取模型確定為用于提取URL的Quey Param部分中的“sz”參數(shù)和“tflvbegin”參數(shù)。
[0295]需要說明的是,在以上實施例中,列舉了使用兩個URL來訓練獲得Rang部分提取模型的過程,但本發(fā)明并不限定于此,可以采用更多的個URL來訓練獲得Rang部分提取模型,例如,在如上所述通過對比URL#F和URL#G從而確定相異部分(包括相異的Path級別及Path值,和/或,相異的Quey Param的名稱及參數(shù)值,為了便于區(qū)分記做,相異部分A)后,還可以獲取URL#Y,該URL#Y與用戶設備F(即,第一用戶設備的一例)相對應,并且,該URL#Y與視頻F相對應,其中,該URL#Y的獲取過程可以與URL#F和URL#G的獲取過程類似,這里為了避免贅述,省略其詳細說明。其后,可以對比URL#Y和URL#F或對比URL#Y和URL#G,找出相異部分(包括相異的Path級別及Path值,和/或,相異的Quey Param的名稱及參數(shù)值,為了便于區(qū)分記做,相異部分B),并將該相異部分A與相異部分B進行對比,從中去除相同的部分(包括相同的Path級別及Path值,和相同的Quey Param的名稱及參數(shù)值)作為Rang部分提取模型的訓練依據(jù),能夠進一步提高本發(fā)明的Rang部分提取模型的準確性。
[0296]另外,如上所述,Rang部分中各字符串的可以包括多個參數(shù),例如,“ sz ”和“tflvbegin”,并且多個參數(shù)可以分別指示該視頻片段相對于完整的視頻的長度和起始時間,因此,需要確定每個參數(shù)的具體作用,例如,是由“sz”來指示長度(或,起始時間),還是由“tflvbegin”來指示長度(或,起始時間)。
[0297]作為示例而非限定,可以通過驗證來確定每個參數(shù)的具體作用,具體地說,例如。網(wǎng)關設備可以獲取與視頻W的視頻片段相對應的URL#W,并且,能夠利用上述Rang部分提取模型獲得該URL鼎的Rang部分,例如,該URL鼎網(wǎng)關設備可以假設該URL鼎中由“sz”來指示長度,而由“tflvbegin”來指示起始時間,從而,能夠從緩存的視頻W中獲取一個視頻片段Wl。并且,可以將包括該URLttW發(fā)送給服務器,從而,能夠從服務器獲得準確的視頻片段W2,如果視頻片段Wl與視頻片段W2相同,則可以確定假設成立,即由“sz”來指示長度,而由“tflvbegin”來指示起始時間,如果不相同,則可以確定由“sz”來指示起始時間,而由“tflvbegin”來指示程度。
[0298]再例如,網(wǎng)關設備可以獲取與視頻M的多個視頻片段(這里,為了便于理解,以兩個為例,即視頻片段Ml和視頻片段M2)相對應的URL#M1和URL#M2,并且,能夠利用上述Rang部分提取模型獲得該URL#M1和URL#M2的Rang部分,例如,該URL測網(wǎng)關設備可以假設該URL#M1和URL#M2中由“sz”來指示長度,而由“tflvbegin”來指示起始時間,從而,能夠根據(jù)該URL#M1和URL#M2的Rang部分,推算出該視頻M的長度(稱為,推算長度),并且,網(wǎng)關設備可以從URL#M1或URL#M2的視頻摘要獲知該視頻M的長度(稱為,實際長度),如果推算長度與實際長度相同,則可以確定假設成立。
[0299]在如上該獲取Rang部分提取模型之后,可以根據(jù)該Rang部分提取模型確定URL#A和URL#B中的Rang部分,并將其去除,從而,能夠排除標識部分的干擾,進而,能夠提高該Sess1n部分提取模型的準確性。
[0300]在如上所述排除標識部分和Rang部分的干擾后,可以確定URL#A和URL#B中的Sess1n 部分。
[0301]由于如上所述存在URL只存在Path部分而不存在Quey Param部分的情況,因此,可能存Sess1n部分僅包含Path部分的深度和Path值的情況(即,情況5),也可能存在該Sess1n部分包含Path部分的深度和Path值以及Quey Param部分中全部Quey Param的名稱和參數(shù)值的情況(即,情況6)。
[0302]下面,分別對上述兩種情況的處理進行說明。
[0303]情況5
[0304]網(wǎng)關設備可以遍歷URL#A和URL#B的Path部分中各級深度的Path值,當URL#A和URL#B的Path部分的深度相同,或者說,Path部分包括的級數(shù)相同時,逐級進行比較,例如,可以首先比較URL#A和URL#B的Path部分中的第一級Path值,即,第一個“/”符號與第二個“/”符號之間的字符串,然后比較URL#A和URL#B的Path部分中的第二級Path值,即,第二個“/”符號與第三個“/”符號之間的字符串,依次類推。
[0305]從而,能夠URL#A和URL#B中path值相同的級別,以及,該相同的Path值。
[0306]例如,設URL#A 的 Path 部分為:/sec (44ab57eec5d981faa33)/frag (O) /video/484/516/tape(NOR)56615484_mp4_h264_aac_l.flv ;
[0307]并且,URL#B的 Path 部分為:/sec (44ab57eec5d981faa33)/frag (0) /video/484/516/tape (HD)/56615484_mp4_h264_aac_l.flv,
[0308]網(wǎng)關設備根據(jù)上述標識部分提取模型,可以確定該URL#A和URL#B的Path部分中的 “56615484_mp4_h264_aac_l.flv” 為標識部分。
[0309]網(wǎng)關設備根據(jù)上述Rang部分提取模型,可以確定該URL#A和URL#B的Path部分中的“frag (O) ”為Rang部分。
[0310]如上所述,網(wǎng)關設備可以確定該URL#A和URL#B的Path部分中的“sec(44ab57eec5d981faa33) ”為用戶簽名部分。
[0311]并且,如上所述,Path部分中的“video”在視頻網(wǎng)站分配給其他用戶設備或其他視頻的URL中也相同。
[0312]從而,該URL#A和URL#B的Path部分中剩余的Path值相同的部分為第四級和第五級。
[0313]進而,網(wǎng)關設備可以確定發(fā)布該視頻A和視頻B的視頻網(wǎng)站是通過URL中Path部分中的第四級和第五級來標識視頻的會話。
[0314]需要說明的是,上述URL#A中的第六級為tape (NOR)表示該視頻A為標清版本,URL#B中的第六級為tape (HD)表示該視頻B為高清版本。從而服務器能夠根據(jù)Path部分中的第六級確定為用戶設備傳輸視頻A或者視頻B。
[0315]并且,例如,可以根據(jù)仿真實驗等方式,獲知該Sess1n部分。具體地說,可以假設Sess1n部分提取模型用于提取Path部分中的第四級和第五級,作為Sess1n部分,并獲得Path部分中的第四級和第五級相同的兩個URL,并將該URL發(fā)送給服務器,以獲取這兩個URL分別對應的視頻,并根據(jù)視頻內容分析等確定各視頻的視頻內容,如果兩個視頻的視頻內容相同,則可以確兩個URL所對應的視頻屬于同一視頻播放會話。
[0316]進而,可以將該Sess1n部分提取模型確定為用于提取URL的Path部分中第四級和第五級的path值。
[0317]情況6
[0318]例如,設URL#A 的 Quey Param 部分為:
[0319]10200&key = 25blIc805e36d6aef3038550860c680040cdaa4201&playtype =l&tk = 155012700719935787180022220&brt = 3&bc = O&nt = O&du = 538470&sz =179904090&tflvbegin = 18055261 ;
[0320]并且,URL#B的 Quey Param 部分為:
[0321]10201&key = 25blIc805e36d6aef3038550860c680040cdaa4201&playtype =2&tk = 155012700719935787180022220&brt = 4&bc = l&nt = l&du = 538470&sz =213602090&tflvbegin = 28941773,
[0322]網(wǎng)關設備根據(jù)上述標識部分提取模型,可以確定該URLM和URL#B的Quey Param部分中參數(shù)名為“key”的Quey Param為標識部分。
[0323]網(wǎng)關設備根據(jù)上述Rang部分提取模型,可以確定該URL#A和URL#B的Quey Param部分中參數(shù)名為“sz”和“tflvbegin”的Quey Param為Rang部分。
[0324]如上所述,網(wǎng)關設備可以確定該URL#A和URL#B的Quey Param部分中參數(shù)名為“tk”的Quey Param為用戶簽名部分。
[0325]并且,該URL#A和URL#B的Quey Param部分中剩余的參數(shù)值相同的參數(shù)名為“du”,該相同的參數(shù)值為“du = 538470”。
[0326]從而,網(wǎng)關設備可以確定發(fā)布該視頻A和視頻B的視頻網(wǎng)站是通過URL的QueyParam部分中參數(shù)名為的“ du ”的Quey Param來標識視頻的會話。
[0327]并且,例如,可以根據(jù)仿真實驗等方式,獲知該Sess1n部分。具體地說,可以假設Sess1n部分提取模型用于提取Quey Param部分中參數(shù)名為的“du”的Quey Param作為Sess1n部分來標識視頻的會話,并獲得“du”的參數(shù)值相同的兩個URL,并將該URL發(fā)送給服務器,以獲取這兩個URL分別對應的視頻,并根據(jù)視頻內容分析等確定各視頻的視頻內容,如果兩個視頻的視頻內容相同,則可以確兩個URL所對應的視頻屬于同一視頻播放會話。
[0328]進而,可以將該Sess1n部分提取模型確定為用于提取Quey Param部分中參數(shù)名為的“du”的Quey Param的參數(shù)值。
[0329]需要說明的是,在以上實施例中,列舉了使用兩個URL來訓練獲得Sess1n部分提取模型的過程,但本發(fā)明并不限定于此,可以采用更多的個URL來訓練獲得Sess1n部分提取模型,例如,在如上所述通過對比URL#A和URL#B從而確定相同部分(包括相異的Path級別及Path值,和/或,相異的Quey Param的名稱及參數(shù)值,為了便于區(qū)分記做,相同部分A)后,還可以在上述時間范圍T內獲取URL#Q(即,第一采樣URL的另一例),該URL#Q與用戶設備A相對應,并且,該URL#Y與視頻Q相對應,該視頻Q、視頻A及視頻屬于同一視頻訪問會話,視頻內容相同,其中,該URL#Q的獲取過程可以與URL#A和URL#B的獲取過程類似,這里為了避免贅述,省略其詳細說明。并且,可以利用上述標識部分提取模型和Rang部分提取模型去除該URL#Q中的標識部分和Rang部分。其后,可以對比URL#Q和URL#A或對比URL#Q和URL#B,找出相同部分(包括相異的Path級別及Path值,和/或,相異的QueyParam的名稱及參數(shù)值,為了便于區(qū)分記做,相同部分B),并將該相同部分A與相同部分B進行對比,從中去除相異的部分(包括相同的Path級別及Path值,和相同的Quey Param的名稱及參數(shù)值)作為Sess1n部分提取模型的訓練依據(jù),能夠進一步提高本發(fā)明的Sess1n部分提取模型的準確性。
[0330]在如上該獲取Sess1n部分提取模型之后,當接收到用戶設備M( S卩,目標用戶設備的一例)發(fā)送的URL#M(即,第一目標URL的一例)時,網(wǎng)關設備可以獲取與該URL#M相對應的視頻M ( S卩,第一目標視頻的一例)。
[0331]并且,當接收到用戶設備M(S卩,目標用戶設備的一例)發(fā)送的URL_(S卩,第二目標URL的一例)時,網(wǎng)關設備可以獲取與該URL#N相對應的視頻N(即,第二目標視頻的一例)。
[0332]需要說明的是,在本發(fā)明實施例中,該用戶設備M可以包括上述用戶設備A,從而該URL#M可以與上述URL#A或URL#B相同,也可以與上述URL#A或URL#B相異,本發(fā)明并未特別限定,并且視頻M可以與上述視頻A或視頻B相同,也可以與上述視頻A或視頻B相異,本發(fā)明并未特別限定。同樣,該URUN可以與上述URL#A或URL#B相同,也可以與上述URL#A或URL#B相異,本發(fā)明并未特別限定,并且視頻N可以與上述視頻A或視頻B相同,也可以與上述視頻A或視頻B相異,本發(fā)明并未特別限定。
[0333]下面對上述確定URL#M相對應的視頻M的方法進行詳細說明。
[0334]可選地,該確定與該目標URL相對應的目標視頻,包括:
[0335]接收并在該緩存設備中存儲緩存視頻以及至少一個緩存URL,其中,各該緩存URL均與該緩存視頻相對應;
[0336]根據(jù)標識部分提取模型,確定該緩存URL的標識部分,其中,該標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各該第三采樣URL的標識部分的字符串相同,各該第三采樣URL的字符串相異,各該第三采樣URL所對應的用戶設備相異,各該第三采樣URL均與第二采樣視頻相對應,該第三采樣URL的標識部分包含于該第三采樣URL的非Host部分;遍歷該目標URL的非Host部分,如果確定該目標URL的非Host部分中包含該緩存URL的標識部分的字符串,則確定該緩存視頻為該目標視頻。
[0337]具體地說,在網(wǎng)關設備接收到URL#M后,可以利用標識部分提取模型,獲取URL#M的標識部分,作為索引,從所緩存的視頻中,查找到該視頻M。并且,該標識部分提取模型的獲取方法,與前文所述過程相似,這里,為了避免贅述,省略其說明。
[0338]可選地,各該第一采樣URL的Host部分的字符串相同,以及
[0339]在根據(jù)該會話部分提取模型,獲取該第一目標URL的會話部分,以及該第二目標URL的會話部分之前,該方法還包括:
[0340]確定該第一目標URL的Host部分的字符串與該第一采樣URL的Host部分的字符串相同;
[0341]確定該第二目標URL的Host部分的字符串與該第一采樣URL的Host部分的字符串相同。
[0342]具體地說,由于同一視頻網(wǎng)站在生成URL時所使用的規(guī)則通常相同,例如,對于不同用戶設備請求觀看同一視頻時生成的不同的URL中,用于標識該視頻的Path部分的級別或者Quey Param的名稱通常相同,因此,在確定URL#M的Host部分與緩存URL的Host部分相同后,能夠確定URL#M所對應的視頻網(wǎng)站與該緩存URL的視頻網(wǎng)站相同,從而能夠可靠地通過該標識部分提取模型確定URL#M中用于標識視頻M的字符,進一步提高所獲取的視頻的準確性。
[0343]可選地,該非Host部分包括路徑Path部分,各該緩存URL的Path部分的深度相同,以及
[0344]在遍歷該目標URL的非Host部分之前,該方法還包括:
[0345]確定該目標URL的Path部分的深度與各該緩存URL的Path部分的深度相同。
[0346]具體地說,由于同一視頻網(wǎng)站在生成URL時所使用的規(guī)則通常相同,例如,對于不同用戶設備請求觀看同一視頻時生成的不同的URL中,用于標識該視頻的Path部分的Path部分的深度相同,因此,如果確定URL#M的Path部分的深度與緩存URL的Path部分的深度不相同,則可以確定與該URL#M相對應的視頻未被緩存,從而,無需進行查找動作,能夠提高本發(fā)明實施例的視頻識別方法的效率,改善用戶體驗。
[0347]可選地,該非Host部分包括路徑Path部分和搜索參數(shù)Quey Param部分,
[0348]該方法還包括:
[0349]獲取各該緩存URL的Quey Param部分所包含的搜索參數(shù)的參數(shù)名,以生成參數(shù)名集合;
[0350]在遍歷該目標URL的非Host部分之前,該方法還包括:
[0351]確定該目標URL的Quey Param部分所包含的搜索參數(shù)的參數(shù)名屬于該參數(shù)名集入口 ο
[0352]具體地說,網(wǎng)關設備可以確定用于訓練獲得上述標識部分提取模型的各URL的Quey Param的參數(shù)名,并生成包括上述各參數(shù)名的參數(shù)名集合,并且,如果URL#M包括的各Quey Param的參數(shù)名均不屬于該參數(shù)名集合,則可以確定,無法根據(jù)上述標識部分提取模型從該URL#M中提取到用于指示該視頻M的標識,從而無需進行后續(xù)動作,能夠提高本發(fā)明實施例的視頻識別方法的效率,改善用戶體驗。
[0353]應理解,以上列舉的確定與URL#M相對應的視頻M的方法僅為示例性說明,本發(fā)明并不限定于此,例如,也可以以完整的URL#M,作為視頻M的緩存索引,或者,也可以直接將該URL#M轉發(fā)給服務器,以從服務器獲得該視頻M。
[0354]在確定與URL#M相對應的視頻M后,可以根據(jù)如上所述獲得的Sess1n部分提取模型,確定URL#M的Sess1n部分。
[0355]基于相似的方法和過程,可以獲取URL.相對應的視頻N,并且可以根據(jù)如上所述獲得的Sess1n部分提取模型,確定URL#N的Sess1n部分。
[0356]從而,如果URL#M的Sess1n部分與URL#N的Sess1n部分相同,貝U可以確定視頻M與視頻N屬于同一視頻會話,其視頻內容相同。
[0357]進而,例如,可以將對視頻N與視頻M的播放行為視為一次點擊,從而能夠使視頻網(wǎng)站對視頻的點擊率計算更加準確。
[0358]再例如,如果首先進行對視頻M的增值處理,例如,獲取該使用設備M的用戶信息,例如,該用戶的用戶級別信息、簽約信息或者付費信息等,并根據(jù)該用戶信息,對視頻M進行去廣告處理、殺毒處理等,則可以記錄該增值處理的具體過程。從而,在對視頻N進行增值處理時,無需獲取上述用戶信息,可以直接對視頻N進行與視頻M相同的處理。從而,能夠減輕網(wǎng)關設備的處理負擔,提聞網(wǎng)關設備的處理效率。
[0359]根據(jù)本發(fā)明實施例的視頻識別方法,利用內容相同的至少兩個第一采樣視頻所分別對應的第一采樣URL,訓練獲得會話部分提取模型,該會話部分提取模型用于從URL中提取指示視頻所屬于的視頻播放會話的會話部分,從而,在接收到第一目標視頻與第二目標視頻所分別對應的第一目標URL和第二目標URL時,能夠根據(jù)該會話部分提取模型,確定第一目標URL和第二目標URL中的會話部分,進而在確定第一目標URL和第二目標URL中的會話部分相同之后,能夠確定第一目標視頻和第二目標視頻屬于同一視頻播放會話,從而,能夠將對第一目標視頻和第二目標視頻的點擊視為一次點擊,從而提高了點擊率計算的準確性,并且,在僅通過識別URL的情況下,便能夠確認需要對第一目標視頻和第二目標視頻進行相同的增值處理,提高了處理的效率。
[0360]以上,結合圖1至圖3詳細說明了根據(jù)本發(fā)明實施例的視頻識別方法,下面,結合圖詳細說明根據(jù)本發(fā)明實施例的視頻識別裝置。
[0361]圖4示出了根據(jù)本發(fā)明實施例的視頻識別裝置200的示意性框圖,如圖4所示,該裝置200包括:
[0362]收發(fā)單元210,用于接收目標用戶設備發(fā)送的目標統(tǒng)一資源定位符URL ;
[0363]確定單元220,用于確定與該目標URL相對應的目標視頻,其中,該目標URL包括第一目標URL和第二目標URL,該目標視頻包括與該第一目標URL相對應的第一目標視頻,以及與該第二目標URL相對應的第二目標視頻,根據(jù)會話部分提取模型,確定該第一目標URL的會話部分,以及該第二目標URL的會話部分,該會話部分提取模型是根據(jù)至少兩個第一采樣URL的會話部分確定的,其中,各該第一采樣URL均與第一用戶設備相對應,各該第一采樣URL的會話部分的字符串相同,該第一采樣URL的會話部分包括該第一采樣URL中除用戶部分以外的部分,該第一采樣URL的用戶部分用于指示該第一用戶設備,該第一采樣URL的會話部分的包含于該第一采樣URL的非主機名Host部分,該非Host部分是URL的字符串中除Host部分以外的部分,該至少兩個第一采樣URL與至少兩個第一采樣視頻一一對應,且該至少兩個第一采樣視頻屬于同一視頻播放會話;
[0364]確定單元230,用于如果該第一目標URL的會話部分與該第二目標URL的會話部分相同,則確定該第一目標視頻與該第二目標視頻屬于同一視頻播放會話。
[0365]可選地,該至少兩個第一采樣URL的Host部分的字符串相同。
[0366]可選地,該收發(fā)單元210還用于接收該至少兩個第一采樣URL ;
[0367]該確定單元220還用于遍歷該第一采樣URL的非Host部分,確定各該第一采樣URL的會話部分,根據(jù)該至少兩個第一采樣URL的會話部分,確定該會話部分提取模型。
[0368]可選地,該收發(fā)單元210具體用于在第一時段內,接收該至少兩個第一采樣URL,該第一時段是根據(jù)該至少兩個第一采樣URL中最先接收到的URL的所對應的第一采樣視頻的時長確定的。
[0369]可選地,該收發(fā)單元210還用于在該第一時段外,接收至少一個第二采樣URL,該第二米樣URL與該第一用戶設備相對應;
[0370]該確定單兀220還用于根據(jù)各該第一米樣URL和該第二米樣URL,確定各該第一米樣URL的用戶部分,在該第一采樣URL與該第二采樣URL中,該用戶部分的字符串相同,從該至少兩個第一采樣URL中,去除該用戶部分。
[0371]可選地,該確定單元220還用于根據(jù)標識部分提取模型,確定該至少兩個第一采樣URL的標識部分,其中,該標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各該第三采樣URL的標識部分的字符串相同,各該第三采樣URL的字符串相異,各該第三采樣URL所對應的用戶設備相異,各該第三采樣URL均與第二采樣視頻相對應,該第三米樣URL的標識部分包含于該第三米樣URL的非Host部分;
[0372]用于從該至少兩個第一采樣URL中,去除該標識部分。
[0373]可選地,該確定單元220還用于根據(jù)分段部分提取模型,確定該至少兩個第一采樣URL的分段部分,其中,該分段部分提取模型是根據(jù)該分段信息確定的,該分段信息是基于分段部分提取條件,對第一米樣信息集合和第二米樣信息集合進行對比處理而從該第一采樣信息集合和該第二采樣信息集合中確定的,該第一采樣信息集合是根據(jù)第四采樣URL確定的,該第四采樣URL包括路徑Path部分和搜索參數(shù)Quey Param部分,該第四采樣URL的Quey Param部分包括K個Quey Param,該第一采樣信息集合包括第一信息和第二信息中的至少一個,該第一信息用于指示該第四采樣URL的Path部分的深度和Path值,該第二信息用于指示該第四采樣URL的K個Quey Param的名稱和參數(shù)值,該第二采樣信息集合是根據(jù)第五米樣URL確定的,該第五米樣URL包括Path部分和Quey Param部分,該第五米樣URL的Quey Param部分包括M個Quey Param,該第四采樣URL和該第五采樣URL均對應第三視頻相同,該第五采樣信息集合包括第三信息和第四信息中的至少一個,該第三信息用于指示該第五采樣URL的Path部分的深度和Path值,該第四信息用于指示該第五采樣URL的M個Quey Param的名稱和參數(shù)值,該分段部分提取條件包括第一條件、第二條件和第三條件中的至少一個,
[0374]該第一條件為:該分段信息指示的Path部分的深度在該第一采樣信息集合和該第二采樣信息集合中相同,且該分段信息該指示Path值在該第一采樣信息集合和該第二米樣信息集合中相異,
[0375]該第二條件為:該分段信息指示的Quey Param的名稱屬于該第一采樣信息集合和該第二米樣信息集合雙方,且該分段信息指不的Quey Param的參數(shù)值在該第一米樣信息集合和該第二采樣信息集合中相異,
[0376]該第三條件為:該分段信息指示的Quey Param的名稱僅屬于該第一采樣信息集合和該第二米樣信息集合中的一方;
[0377]用于從該至少兩個第一采樣URL中,去除該分段部分。
[0378]可選地,該收發(fā)單元210還用于接收并在該緩存設備中存儲緩存視頻以及至少一個緩存URL,其中,各該緩存URL均與該緩存視頻相對應;
[0379]該確定單元220具體用于根據(jù)標識部分提取模型,確定該緩存URL的標識部分,其中,該標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各該第三采樣URL的標識部分的字符串相同,各該第三采樣URL的字符串相異,各該第三采樣URL所對應的用戶設備相異,各該第三采樣URL均與第二采樣視頻相對應,該第三采樣URL的標識部分包含于該第三米樣URL的非Host部分;遍歷該目標URL的非Host部分,如果確定該目標URL的非Host部分中包含該緩存URL的標識部分的字符串,則確定該緩存視頻為該目標視頻。
[0380]可選地,該收發(fā)單元210還用于接收第六采樣URL以及第四采樣視頻,其中,該第六采樣URL與該第四視頻相對應,該第四采樣視頻與該第二采樣視頻相異;
[0381]該確定單元220還用于用于根據(jù)該標識部分提取模型,確定該第六采樣URL的標識部分,確定第六采樣URL的標識部分與該第三采樣URL的標識部分之間的重疊部分,該重疊部分包括Path值相同的Path級別和參數(shù)值相同的Quey Param中的至少一項,用于從該第三采樣URL的標識部分中去除該重疊部分,以更新該第三采樣URL的標識部分;
[0382]用于根據(jù)更新后的第三采樣URL的標識部分,更新該標識部分提取模型。。
[0383]根據(jù)本發(fā)明實施例的視頻識別裝置200可對應于本發(fā)明實施例的方法中的網(wǎng)關設備,并且,該視頻識別裝置200中的各單元即模塊和上述其他操作和/或功能分別為了實現(xiàn)圖1中的方法100的相應流程,為了簡潔,在此不再贅述。
[0384]根據(jù)本發(fā)明實施例的視頻識別裝置,利用內容相同的至少兩個第一采樣視頻所分別對應的第一采樣URL,訓練獲得會話部分提取模型,該會話部分提取模型用于從URL中提取指示視頻內容的會話部分,從而,在接收到內容相同的第一目標視頻與第二目標視頻所分別對應的第一目標URL和第二目標URL時,能夠根據(jù)該會話部分提取模型,確定第一目標URL和第二目標URL中的會話部分,進而在確定第一目標URL和第二目標URL中的會話部分相同之后,能夠確定第一目標視頻和第二目標視頻的視頻內容相同,從而,能夠將對第一目標視頻和第二目標視頻的點擊視為一次點擊,從而提高了點擊率計算的準確性,并且,在僅通過識別URL的情況下,便能夠確認需要對第一目標視頻和第二目標視頻進行相同的增值處理,提高了處理的效率。
[0385]以上,結合圖1至圖3詳細說明了本發(fā)明實施例的視頻識別方法,下面,結合圖5,詳細說明本發(fā)明實施例的視頻識別設備。
[0386]圖5示出了本發(fā)明實施例的視頻識別設備300,如圖5所示,該設備300包括:
[0387]總線310 ;
[0388]與所述總線310相連的處理器320 ;
[0389]與所述總線310相連的存儲器330 ;
[0390]與所述總線310相連的收發(fā)機340 ;
[0391]其中,該處理器320通過所述總線310,調用所述存儲器330中存儲的程序,以用于控制收發(fā)機340接收目標用戶設備發(fā)送的目標統(tǒng)一資源定位符URL,確定與該目標URL相對應的目標視頻,其中,該目標URL包括第一目標URL和第二目標URL,該目標視頻包括與該第一目標URL相對應的第一目標視頻,以及與該第二目標URL相對應的第二目標視頻;
[0392]用于根據(jù)會話部分提取模型,確定該第一目標URL的會話部分,以及該第二目標URL的會話部分,該會話部分提取模型是根據(jù)至少兩個第一采樣URL的會話部分確定的,其中,各該第一采樣URL均與第一用戶設備相對應,各該第一采樣URL的會話部分的字符串相同,該第一米樣URL的會話部分包括該第一米樣URL中除用戶部分以外的部分,該第一米樣URL的用戶部分用于指不該第一用戶設備,該第一米樣URL的會話部分的包含于該第一米樣URL的非主機名Host部分,該非Host部分是URL的字符串中除Host部分以外的部分,該至少兩個第一采樣URL與至少兩個第一采樣視頻一一對應,且該至少兩個第一采樣視頻屬于同一視頻播放會話;
[0393]用于如果該第一目標URL的會話部分與該第二目標URL的會話部分相同,則確定該第一目標視頻與該第二目標視頻屬于同一視頻播放會話。
[0394]可選地,該處理器320還用于控制收發(fā)機340接收該至少兩個第一采樣URL ;
[0395]用于遍歷該第一米樣URL的非Host部分,確定各該第一米樣URL的會話部分;
[0396]用于根據(jù)該至少兩個第一采樣URL的會話部分,確定該會話部分提取模型。
[0397]可選地,該處理器320具體用于控制收發(fā)機340在第一時段內,接收該至少兩個第一采樣URL,該第一時段是根據(jù)該至少兩個第一采樣URL中最先接收到的URL的所對應的第一米樣視頻的時長確定的。
[0398]可選地,該處理器320還用于控制收發(fā)機340在該第一時段外,接收至少一個第二采樣URL,該第二采樣URL與該第一用戶設備相對應;
[0399]用于根據(jù)各該第一采樣URL和該第二采樣URL,確定各該第一采樣URL的用戶部分,在該第一采樣URL與該第二采樣URL中,該用戶部分的字符串相同;
[0400]用于從該至少兩個第一采樣URL中,去除該用戶部分。
[0401 ] 可選地,該至少兩個第一采樣URL的路徑Path部分的深度相同。
[0402]可選地,各該第一采樣URL的搜索參數(shù)Quey Param部分包括的Quey Param中,參數(shù)名相異的Quey Param數(shù)量小于等于第一閾值。
[0403]可選地,該處理器320還用于根據(jù)標識部分提取模型,確定該至少兩個第一采樣URL的標識部分,其中,該標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各該第三采樣URL的標識部分的字符串相同,各該第三采樣URL的字符串相異,各該第三采樣URL所對應的用戶設備相異,各該第三采樣URL均與第二采樣視頻相對應,該第三采樣URL的標識部分包含于該第三采樣URL的非Host部分;
[0404]用于從該至少兩個第一采樣URL中,去除該標識部分。
[0405]可選地,該處理器320還用于根據(jù)分段部分提取模型,確定該至少兩個第一采樣URL的分段部分,其中,該分段部分提取模型是根據(jù)該分段信息確定的,該分段信息是基于分段部分提取條件,對第一采樣信息集合和第二采樣信息集合進行對比處理而從該第一采樣信息集合和該第二采樣信息集合中確定的,該第一采樣信息集合是根據(jù)第四采樣URL確定的,該第四采樣URL包括路徑Path部分和搜索參數(shù)Quey Param部分,該第四采樣URL的Quey Param部分包括K個Quey Param,該第一采樣信息集合包括第一信息和第二信息中的至少一個,該第一信息用于指示該第四采樣URL的Path部分的深度和Path值,該第二信息用于指示該第四采樣URL的K個Quey Param的名稱和參數(shù)值,該第二采樣信息集合是根據(jù)第五米樣URL確定的,該第五米樣URL包括Path部分和Quey Param部分,該第五米樣URL的Quey Param部分包括M個Quey Param,該第四采樣URL和該第五采樣URL均對應第三視頻相同,該第五采樣信息集合包括第三信息和第四信息中的至少一個,該第三信息用于指示該第五采樣URL的Path部分的深度和Path值,該第四信息用于指示該第五采樣URL的M個Quey Param的名稱和參數(shù)值,該分段部分提取條件包括第一條件、第二條件和第三條件中的至少一個,
[0406]該第一條件為:該分段信息指示的Path部分的深度在該第一采樣信息集合和該第二采樣信息集合中相同,且該分段信息該指示Path值在該第一采樣信息集合和該第二采樣信息集合中相異,
[0407]該第二條件為:該分段信息指示的Quey Param的名稱屬于該第一采樣信息集合和該第二米樣信息集合雙方,且該分段信息指不的Quey Param的參數(shù)值在該第一米樣信息集合和該第二采樣信息集合中相異,
[0408]該第三條件為:該分段信息指示的Quey Param的名稱僅屬于該第一采樣信息集合和該第二米樣信息集合中的一方;
[0409]用于從該至少兩個第一采樣URL中,去除該分段部分。
[0410]可選地,該第四URL是在第二時段接收的,該第五URL是在第三時段接收的,該第二時段與該第三時段之間的間隔是根據(jù)該第三視頻的時長確定的。
[0411]可選地,該第四采樣URL是第一用戶設備在請求獲取該第三采樣視頻時發(fā)送的URL,該第五采樣URL是該第一用戶設備在請求獲取該第三采樣視頻的片段時發(fā)送的URL ;或
[0412]該第四采樣URL是第一用戶設備在請求獲取該第三采樣視頻的片段時發(fā)送的URL,該第五采樣URL是該第一用戶設備在請求獲取該第三采樣視頻時發(fā)送的URL ;或
[0413]該第四采樣URL是第一用戶設備在請求獲取該第三采樣視頻的第一片段時發(fā)送的URL,該第五采樣URL是該第一用戶設備在請求獲取該第三采樣視頻的第二片段時發(fā)送的URL,其中,該第一片段與該第二片段相異。
[0414]可選地,該處理器320還用于控制收發(fā)機340接收并在該緩存設備中存儲緩存視頻以及至少一個緩存URL,其中,各該緩存URL均與該緩存視頻相對應;
[0415]用于根據(jù)標識部分提取模型,確定該緩存URL的標識部分,其中,該標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各該第三采樣URL的標識部分的字符串相同,各該第三采樣URL的字符串相異,各該第三采樣URL所對應的用戶設備相異,各該第三采樣URL均與第二采樣視頻相對應,該第三采樣URL的標識部分包含于該第三采樣URL的非Host部分;遍歷該目標URL的非Host部分,如果確定該目標URL的非Host部分中包含該緩存URL的標識部分的字符串,則確定該緩存視頻為該目標視頻。
[0416]可選地,該處理器320還用于確定該目標URL的Path部分的深度與各該緩存URL的Path部分的深度相同。
[0417]可選地,該處理器320還用于確定該目標URL的Path部分與各該緩存URL的至少一個URL的Path部分相同。
[0418]可選地,該處理器320還用于控制收發(fā)機340確定各該緩存URL的Quey Param部分所包含的搜索參數(shù)的參數(shù)名,以生成參數(shù)名集合;
[0419]用于確定該目標URL的Quey Param部分所包含的搜索參數(shù)的參數(shù)名屬于該參數(shù)
々隹A
-?:? 口 O
[0420]可選地,該處理器320還用于控制收發(fā)機340接收至少一個驗證URL,且該驗證URL的非Host子字符串中包含該緩存URL的標識部分的字符串,向服務器轉發(fā)該驗證URL,接收該服務器根據(jù)該驗證URL發(fā)送的驗證視頻;
[0421]用于確定該驗證視頻與該緩存視頻相同。
[0422]可選地,該處理器320還用于控制收發(fā)機340接收第六采樣URL以及第四采樣視頻,其中,該第六采樣URL與該第四視頻相對應,該第四采樣視頻與該第二采樣視頻相異;
[0423]用于根據(jù)該標識部分提取模型,確定該第六采樣URL的標識部分;
[0424]用于確定第六采樣URL的標識部分與該第三采樣URL的標識部分之間的重疊部分,該重疊部分包括Path值相同的Path級別和參數(shù)值相同的Quey Param中的至少一項;
[0425]用于從該第三采樣URL的標識部分中去除該重疊部分,以更新該第三采樣URL的標識部分;
[0426]用于根據(jù)更新后的第三采樣URL的標識部分,更新該標識部分提取模型。
[0427]可選地,該處理器320還用于確定該第一目標URL的Host部分的字符串與該第一采樣URL的Host部分的字符串相同;
[0428]用于確定該第二目標URL的Host部分的字符串與該第一采樣URL的Host部分的字符串相同。
[0429]在本發(fā)明實施例中,處理單器還可以稱為CPU。存儲器可以包括只讀存儲器和隨機存取存儲器,并向處理器提供指令和信號。存儲器的一部分還可以包括非易失行隨機存取存儲器(NVRAM)。具體的應用中,傳輸信號的設備可以嵌入或者本身可以就是例如個人電腦之類的標準以太網(wǎng)通信設備,傳輸信號的設備的各個模塊通過總線系統(tǒng)耦合在一起,其中,總線系統(tǒng)除包括信號總線之外,還包括電源總線、控制總線和狀態(tài)信號總線。
[0430]處理器可以實現(xiàn)或者執(zhí)行本發(fā)明方法實施例中的公開的各步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器,解碼器等。結合本發(fā)明實施例所公開的方法的步驟可以直接體現(xiàn)為硬件處理器執(zhí)行完成,或者用解碼處理器中的硬件及軟件模塊組合執(zhí)行完成。軟件模塊可以位于隨機存儲器,閃存、只讀存儲器,可編程只讀存儲器或者電可擦寫可編程存儲器、寄存器等本領域成熟的存儲介質中。該存儲介質位于存儲器,解碼單元或者處理單元讀取存儲器中的信息,結合其硬件完成上述方法的步驟。
[0431]應理解,在本發(fā)明實施例中,該處理器可以是中央處理單元(Central ProcessingUnit,簡稱為“CPU”),該處理器還可以是其他通用處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)成可編程門陣列(FPGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件等。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。
[0432]在實現(xiàn)過程中,上述方法的各步驟可以通過處理器中的硬件的集成邏輯電路或者軟件形式的指令完成。結合本發(fā)明實施例所公開的方法的步驟可以直接體現(xiàn)為硬件處理器執(zhí)行完成,或者用處理器中的硬件及軟件模塊組合執(zhí)行完成。軟件模塊可以位于隨機存儲器,閃存、只讀存儲器,可編程只讀存儲器或者電可擦寫可編程存儲器、寄存器等本領域成熟的存儲介質中。該存儲介質位于存儲器,處理器讀取存儲器中的信息,結合其硬件完成上述方法的步驟。為避免重復,這里不再詳細描述。
[0433]根據(jù)本發(fā)明實施例的視頻識別設備300可對應于本發(fā)明實施例的方法中的網(wǎng)關設備,并且,該視頻識別設備300中的各單元即模塊和上述其他操作和/或功能分別為了實現(xiàn)圖1中的方法100的相應流程,為了簡潔,在此不再贅述。
[0434]根據(jù)本發(fā)明實施例的視頻識別設備,利用內容相同的至少兩個第一采樣視頻所分別對應的第一采樣URL,訓練獲得會話部分提取模型,該會話部分提取模型用于從URL中提取指示視頻內容的會話部分,從而,在接收到內容相同的第一目標視頻與第二目標視頻所分別對應的第一目標URL和第二目標URL時,能夠根據(jù)該會話部分提取模型,確定第一目標URL和第二目標URL中的會話部分,進而在確定第一目標URL和第二目標URL中的會話部分相同之后,能夠確定第一目標視頻和第二目標視頻的視頻內容相同,從而,能夠將對第一目標視頻和第二目標視頻的點擊視為一次點擊,從而提高了點擊率計算的準確性,并且,在僅通過識別URL的情況下,便能夠確認需要對第一目標視頻和第二目標視頻進行相同的增值處理,提高了處理的效率。
[0435]以上,結合圖1至圖3詳細說明了本發(fā)明實施例的視頻識別方法,下面,結合圖6,詳細說明本發(fā)明實施例的視頻識別系統(tǒng)。
[0436]圖6示出了本發(fā)明實施例的視頻識別系統(tǒng)400,如圖6所示,該系統(tǒng)600包括:
[0437]用戶設備410,用于向該視頻識別裝置發(fā)送統(tǒng)一資源定位符URL,并從該視頻識別裝置獲取與該URL相對應的視頻;
[0438]視頻識別裝置420,用于接收目標用戶設備發(fā)送的目標統(tǒng)一資源定位符URL,確定與該目標URL相對應的目標視頻,其中,該目標URL包括第一目標URL和第二目標URL,該目標視頻包括與該第一目標URL相對應的第一目標視頻,以及與該第二目標URL相對應的第二目標視頻;根據(jù)會話部分提取模型,確定該第一目標URL的會話部分,以及該第二目標URL的會話部分,該會話部分提取模型是根據(jù)至少兩個第一采樣URL的會話部分確定的,其中,各該第一采樣URL均與第一用戶設備相對應,各該第一采樣URL的會話部分的字符串相同,該第一米樣URL的會話部分包括該第一米樣URL中除用戶部分以外的部分,該第一米樣URL的用戶部分用于指不該第一用戶設備,該第一米樣URL的會話部分的包含于該第一米樣URL的非主機名Host部分,該非Host部分是URL的字符串中除Host部分以外的部分,該至少兩個第一采樣URL與至少兩個第一采樣視頻一一對應,且該至少兩個第一采樣視頻屬于同一視頻播放會話;如果該第一目標URL的會話部分與該第二目標URL的會話部分相同,則確定該第一目標視頻與該第二目標視頻屬于同一視頻播放會話;
[0439]服務器430,用于接收視頻識別裝置轉發(fā)的該URL,確定與該URL相對應的視頻,并向該視頻識別裝置發(fā)送該視頻。
[0440]根據(jù)本發(fā)明實施例的視頻識別系統(tǒng)400中的視頻識別裝置420可對應于本發(fā)明實施例的方法中的網(wǎng)關設備,并且,視頻識別裝置420中的各單元即模塊和上述其他操作和/或功能分別為了實現(xiàn)圖1中的方法100的相應流程,為了簡潔,在此不再贅述。
[0441]根據(jù)本發(fā)明實施例的視頻識別系統(tǒng),利用內容相同的至少兩個第一采樣視頻所分別對應的第一采樣URL,訓練獲得會話部分提取模型,該會話部分提取模型用于從URL中提取指示視頻內容的會話部分,從而,在接收到內容相同的第一目標視頻與第二目標視頻所分別對應的第一目標URL和第二目標URL時,能夠根據(jù)該會話部分提取模型,確定第一目標URL和第二目標URL中的會話部分,進而在確定第一目標URL和第二目標URL中的會話部分相同之后,能夠確定第一目標視頻和第二目標視頻的視頻內容相同,從而,能夠將對第一目標視頻和第二目標視頻的點擊視為一次點擊,從而提高了點擊率計算的準確性,并且,在僅通過識別URL的情況下,便能夠確認需要對第一目標視頻和第二目標視頻進行相同的增值處理,提高了處理的效率。
[0442]應理解,本文中術語“和/或”,僅僅是一種描述關聯(lián)對象的關聯(lián)關系,表示可以存在三種關系,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另外,本文中字符“/”,一般表示前后關聯(lián)對象是一種“或”的關系。
[0443]應理解,在本發(fā)明的各種實施例中,上述各過程的序號的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應以其功能和內在邏輯確定,而不應對本發(fā)明實施例的實施過程構成任何限定。
[0444]本領普通技術人員可以意識到,結合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計算機軟件和電子硬件的結合來實現(xiàn)。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術方案的特定應用和設計約束條件。專業(yè)技術人員可以對每個特定的應用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應認為超出本發(fā)明的范圍。
[0445]所屬領的技術人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng)、裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。
[0446]在本申請所提供的幾個實施例中,應該理解到,所揭露的系統(tǒng)、裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。
[0447]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
[0448]另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。
[0449]所述功能如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質中?;谶@樣的理解,本發(fā)明的技術方案本質上或者說對現(xiàn)有技術做出貢獻的部分或者該技術方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM, Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質。
[0450]以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術領的技術人員在本發(fā)明揭露的技術范圍內,可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內。因此,本發(fā)明的保護范圍應以所述權利要求的保護范圍為準。
【權利要求】
1.一種視頻識別方法,其特征在于,所述方法包括: 接收目標用戶設備發(fā)送的目標統(tǒng)一資源定位符URL,確定與所述目標URL相對應的目標視頻,其中,所述目標URL包括第一目標URL和第二目標URL,所述目標視頻包括與所述第一目標URL相對應的第一目標視頻,以及與所述第二目標URL相對應的第二目標視頻; 根據(jù)會話部分提取模型,確定所述第一目標URL的會話部分,以及所述第二目標URL的會話部分,所述會話部分提取模型是根據(jù)至少兩個第一采樣URL的會話部分確定的,其中,各所述第一采樣URL均與第一用戶設備相對應,各所述第一采樣URL的會話部分的字符串相同,所述第一采樣URL的會話部分包括所述第一采樣URL中除用戶部分以外的部分,所述第一采樣URL的用戶部分用于指示所述第一用戶設備,所述第一采樣URL的會話部分的包含于所述第一采樣URL的非主機名Host部分,所述非Host部分是URL的字符串中除Host部分以外的部分,所述至少兩個第一采樣URL與至少兩個第一采樣視頻一一對應,且所述至少兩個第一采樣視頻屬于同一視頻播放會話; 如果所述第一目標URL的會話部分與所述第二目標URL的會話部分相同,則確定所述第一目標視頻與所述第二目標視頻屬于同一視頻播放會話。
2.根據(jù)權利要求1所述的方法,其特征在于,在根據(jù)會話部分提取模型,確定所述第一目標URL的會話部分之前,所述方法還包括: 接收所述至少兩個第一采樣URL ; 遍歷所述第一采樣URL的非Host部分,確定各所述第一采樣URL的會話部分; 根據(jù)所述至少兩個第一采樣URL的會話部分,確定所述會話部分提取模型。
3.根據(jù)權利要求2所述的方法,其特征在于,所述接收所述至少兩個第一采樣URL,包括: 在第一時段內,接收所述至少兩個第一采樣URL,所述第一時段是根據(jù)所述至少兩個第一采樣URL中最先接收到的URL的所對應的第一采樣視頻的時長確定的。
4.根據(jù)權利要求3所述的方法,其特征在于,在確定各所述第一采樣URL的會話部分之前,所述方法還包括: 在所述第一時段外,接收至少一個第二采樣URL,所述第二采樣URL與所述第一用戶設備相對應; 根據(jù)各所述第一采樣URL和所述第二采樣URL,確定各所述第一采樣URL的用戶部分,在所述第一采樣URL與所述第二采樣URL中,所述用戶部分的字符串相同; 從所述至少兩個第一采樣URL中,去除所述用戶部分。
5.根據(jù)權利要求1至4中任一項所述的方法,其特征在于,所述至少兩個第一采樣URL的路徑Path部分的深度相同。
6.根據(jù)權利要求1至5中任一項所述的方法,其特征在于,各所述第一采樣URL的搜索參數(shù)Quey Param部分包括的Quey Param中,參數(shù)名相異的Quey Param數(shù)量小于等于第一閾值。
7.根據(jù)權利要求2至6中任一項所述的方法,其特征在于,在遍歷所述第一采樣URL的非Host部分之前,所述方法還包括: 根據(jù)標識部分提取模型,確定所述至少兩個第一采樣URL的標識部分,其中,所述標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各所述第三采樣URL的標識部分的字符串相同,各所述第三采樣URL的字符串相異,各所述第三采樣URL所對應的用戶設備相異,各所述第三采樣URL均與第二采樣視頻相對應,所述第三采樣URL的標識部分包含于所述第三采樣URL的非Host部分; 從所述至少兩個第一采樣URL中,去除所述標識部分。
8.根據(jù)權利要求2至7中任一項所述的方法,其特征在于,在遍歷所述第一采樣URL的非Host部分之前,所述方法還包括: 根據(jù)分段部分提取模型,確定所述至少兩個第一采樣URL的分段部分,其中,所述分段部分提取模型是根據(jù)所述分段信息確定的,所述分段信息是基于分段部分提取條件,對第一采樣信息集合和第二采樣信息集合進行對比處理而從所述第一采樣信息集合和所述第二采樣信息集合中確定的,所述第一采樣信息集合是根據(jù)第四采樣URL確定的,所述第四采樣URL包括路徑Path部分和搜索參數(shù)Quey Param部分,所述第四采樣URL的Quey Param部分包括K個Quey Param,所述第一采樣信息集合包括第一信息和第二信息中的至少一個,所述第一信息用于指示所述第四采樣URL的Path部分的深度和Path值,所述第二信息用于指示所述第四采樣URL的K個Quey Param的名稱和參數(shù)值,所述第二采樣信息集合是根據(jù)第五采樣URL確定的,所述第五采樣URL包括Path部分和Quey Param部分,所述第五采樣URL的Quey Param部分包括M個Quey Param,所述第四采樣URL和所述第五采樣URL均對應第三視頻相同,所述第五采樣信息集合包括第三信息和第四信息中的至少一個,所述第三信息用于指示所述第五采樣URL的Path部分的深度和Path值,所述第四信息用于指示所述第五采樣URL的M個Quey Param的名稱和參數(shù)值,所述分段部分提取條件包括第一條件、第二條件和第三條件中的至少一個, 所述第一條件為:所述分段信息指示的Path部分的深度在所述第一采樣信息集合和所述第二采樣信息集合中相同,且所述分段信息所述指示Path值在所述第一采樣信息集合和所述第二采樣信息集合中相異, 所述第二條件為:所述分段信息指示的Quey Param的名稱屬于所述第一采樣信息集合和所述第二采樣信息集合雙方,且所述分段信息指示的Quey Param的參數(shù)值在所述第一采樣信息集合和所述第二采樣信息集合中相異, 所述第三條件為:所述分段信息指示的Quey Param的名稱僅屬于所述第一采樣信息集合和所述第二采樣信息集合中的一方; 從所述至少兩個第一采樣URL中,去除所述分段部分。
9.根據(jù)權利要求8所述的方法,其特征在于,所述第四URL是在第二時段接收的,所述第五URL是在第三時段接收的,所述第二時段與所述第三時段之間的間隔是根據(jù)所述第三視頻的時長確定的。
10.根據(jù)權利要求8所述的方法,其特征在于,所述第四采樣URL是第一用戶設備在請求獲取所述第三采樣視頻時發(fā)送的URL,所述第五采樣URL是所述第一用戶設備在請求獲取所述第三采樣視頻的片段時發(fā)送的URL ;或 所述第四采樣URL是第一用戶設備在請求獲取所述第三采樣視頻的片段時發(fā)送的URL,所述第五采樣URL是所述第一用戶設備在請求獲取所述第三采樣視頻時發(fā)送的URL ;或 所述第四采樣URL是第一用戶設備在請求獲取所述第三采樣視頻的第一片段時發(fā)送的URL,所述第五采樣URL是所述第一用戶設備在請求獲取所述第三采樣視頻的第二片段時發(fā)送的URL,其中,所述第一片段與所述第二片段相異。
11.根據(jù)權利要求1至10中任一項所述的方法,其特征在于,所述確定與所述目標URL相對應的目標視頻,包括: 接收并在所述緩存設備中存儲緩存視頻以及至少一個緩存URL,其中,各所述緩存URL均與所述緩存視頻相對應; 根據(jù)標識部分提取模型,確定所述緩存URL的標識部分,其中,所述標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各所述第三采樣URL的標識部分的字符串相同,各所述第三采樣URL的字符串相異,各所述第三采樣URL所對應的用戶設備相異,各所述第三采樣URL均與第二采樣視頻相對應,所述第三采樣URL的標識部分包含于所述第三采樣URL的非Host部分;遍歷所述目標URL的非Host部分,如果確定所述目標URL的非Host部分中包含所述緩存URL的標識部分的字符串,則確定所述緩存視頻為所述目標視頻。
12.根據(jù)權利要求11所述的方法,其特征在于,所述非Host部分包括路徑Path部分,各所述緩存URL的Path部分的深度相同,以及 在遍歷所述目標URL的非Host部分之前,所述方法還包括: 確定所述目標URL的Path部分的深度與各所述緩存URL的Path部分的深度相同。
13.根據(jù)權利要求11或12所述的方法,其特征在于,所述非Host部分包括路徑Path部分,以及 在遍歷所述目標URL的非Host部分之前,所述方法還包括: 確定所述目標URL的Path部分與各所述緩存URL的至少一個URL的Path部分相同。
14.根據(jù)權利要求11至13中任一項所述的方法,其特征在于,所述非Host部分包括路徑Path部分和搜索參數(shù)Quey Param部分, 所述方法還包括: 確定各所述緩存URL的Quey Param部分所包含的搜索參數(shù)的參數(shù)名,以生成參數(shù)名集合; 在遍歷所述目標URL的非Host部分之前,所述方法還包括: 確定所述目標URL的Quey Param部分所包含的搜索參數(shù)的參數(shù)名屬于所述參數(shù)名集入口 ο
15.根據(jù)權利要求11至14中任一項所述的方法,其特征在于,所述方法還包括: 接收至少一個驗證URL,且所述驗證URL的非Host子字符串中包含所述緩存URL的標識部分的字符串; 向服務器轉發(fā)所述驗證URL; 接收所述服務器根據(jù)所述驗證URL發(fā)送的驗證視頻; 確定所述驗證視頻與所述緩存視頻相同。
16.根據(jù)權利要求7或11所述的方法,其特征在于,所述方法還包括: 接收第六采樣URL以及第四采樣視頻,其中,所述第六采樣URL與所述第四視頻相對應,所述第四采樣視頻與所述第二采樣視頻相異; 根據(jù)所述標識部分提取模型,確定所述第六采樣URL的標識部分; 確定第六采樣URL的標識部分與所述第三采樣URL的標識部分之間的重疊部分,所述重疊部分包括Path值相同的Path級別和參數(shù)值相同的Quey Param中的至少一項; 從所述第三采樣URL的標識部分中去除所述重疊部分,以更新所述第三采樣URL的標識部分; 根據(jù)更新后的第三采樣URL的標識部分,更新所述標識部分提取模型。
17.根據(jù)權利要求1至16中任一項所述的方法,其特征在于,各所述第一采樣URL的Host部分的字符串相同,以及 在根據(jù)所述會話部分提取模型,確定所述第一目標URL的會話部分,以及所述第二目標URL的會話部分之前,所述方法還包括: 確定所述第一目標URL的Host部分的字符串與所述第一采樣URL的Host部分的字符串相同; 確定所述第二目標URL的Host部分的字符串與所述第一采樣URL的Host部分的字符串相同。
18.—種視頻識別裝置,其特征在于,所述裝置包括: 收發(fā)單元,用于接收目標用戶設備發(fā)送的目標統(tǒng)一資源定位符URL; 確定單元,用于確定與所述目標URL相對應的目標視頻,其中,所述目標URL包括第一目標URL和第二目標URL,所述目標視頻包括與所述第一目標URL相對應的第一目標視頻,以及與所述第二目標URL相對應的第二目標視頻,根據(jù)會話部分提取模型,確定所述第一目標URL的會話部分,以及所述第二目標URL的會話部分,所述會話部分提取模型是根據(jù)至少兩個第一采樣URL的會話部分確定的,其中,各所述第一采樣URL均與第一用戶設備相對應,各所述第一采樣URL的會話部分的字符串相同,所述第一采樣URL的會話部分包括所述第一采樣URL中除用戶部分以外的部分,所述第一采樣URL的用戶部分用于指示所述第一用戶設備,所述第一采樣URL的會話部分的包含于所述第一采樣URL的非主機名Host部分,所述非Host部分是URL的字符串中除Host部分以外的部分,所述至少兩個第一采樣URL與至少兩個第一采樣視頻一一對應,且所述至少兩個第一采樣視頻屬于同一視頻播放會話; 判定單元,用于如果所述第一目標URL的會話部分與所述第二目標URL的會話部分相同,則確定所述第一目標視頻與所述第二目標視頻屬于同一視頻播放會話。
19.根據(jù)權利要求18所述的裝置,其特征在于,所述收發(fā)單元還用于接收所述至少兩個第一采樣URL ; 所述確定單元還用于遍歷所述第一采樣URL的非Host部分,確定各所述第一采樣URL的會話部分,根據(jù)所述至少兩個第一采樣URL的會話部分,確定所述會話部分提取模型。
20.根據(jù)權利要求19所述的裝置,其特征在于,所述收發(fā)單元具體用于在第一時段內,接收所述至少兩個第一采樣URL,所述第一時段是根據(jù)所述至少兩個第一采樣URL中最先接收到的URL的所對應的第一采樣視頻的時長確定的。
21.根據(jù)權利要求20所述的裝置,其特征在于,所述收發(fā)單元還用于在所述第一時段夕卜,接收至少一個第二采樣URL,所述第二采樣URL與所述第一用戶設備相對應; 所述確定單元還用于根據(jù)各所述第一采樣URL和所述第二采樣URL,確定各所述第一采樣URL的用戶部分,在所述第一采樣URL與所述第二采樣URL中,所述用戶部分的字符串相同,從所述至少兩個第一采樣URL中,去除所述用戶部分。
22.根據(jù)權利要求18至21中任一項所述的裝置,其特征在于,所述確定單元還用于根據(jù)標識部分提取模型,確定所述至少兩個第一采樣URL的標識部分,其中,所述標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各所述第三采樣URL的標識部分的字符串相同,各所述第三采樣URL的字符串相異,各所述第三采樣URL所對應的用戶設備相異,各所述第三采樣URL均與第二采樣視頻相對應,所述第三采樣URL的標識部分包含于所述第三采樣URL的非Host部分; 用于從所述至少兩個第一采樣URL中,去除所述標識部分。
23.根據(jù)權利要求18至22中任一項所述的裝置,其特征在于,所述確定單元還用于根據(jù)分段部分提取模型,確定所述至少兩個第一采樣URL的分段部分,其中,所述分段部分提取模型是根據(jù)所述分段信息確定的,所述分段信息是基于分段部分提取條件,對第一采樣信息集合和第二采樣信息集合進行對比處理而從所述第一采樣信息集合和所述第二采樣信息集合中確定的,所述第一采樣信息集合是根據(jù)第四采樣URL確定的,所述第四采樣URL包括路徑Path部分和搜索參數(shù)Quey Param部分,所述第四采樣URL的Quey Param部分包括K個Quey Param,所述第一采樣信息集合包括第一信息和第二信息中的至少一個,所述第一信息用于指示所述第四采樣URL的Path部分的深度和Path值,所述第二信息用于指示所述第四采樣URL的K個Quey Param的名稱和參數(shù)值,所述第二采樣信息集合是根據(jù)第五采樣URL確定的,所述第五采樣URL包括Path部分和Quey Param部分,所述第五采樣URL的Quey Param部分包括M個Quey Param,所述第四采樣URL和所述第五采樣URL均對應第三視頻相同,所述第五采樣信息集合包括第三信息和第四信息中的至少一個,所述第三信息用于指示所述第五采樣URL的Path部分的深度和Path值,所述第四信息用于指示所述第五采樣URL的M個Quey Param的名稱和參數(shù)值,所述分段部分提取條件包括第一條件、第二條件和第三條件中的至少一個, 所述第一條件為:所述分段信息指示的Path部分的深度在所述第一采樣信息集合和所述第二采樣信息集合中相同,且所述分段信息所述指示Path值在所述第一采樣信息集合和所述第二采樣信息集合中相異, 所述第二條件為:所述分段信息指示的Quey Param的名稱屬于所述第一采樣信息集合和所述第二采樣信息集合雙方,且所述分段信息指示的Quey Param的參數(shù)值在所述第一采樣信息集合和所述第二采樣信息集合中相異, 所述第三條件為:所述分段信息指示的Quey Param的名稱僅屬于所述第一采樣信息集合和所述第二采樣信息集合中的一方; 用于從所述至少兩個第一采樣URL中,去除所述分段部分。
24.根據(jù)權利要求18至23中任一項所述的裝置,其特征在于,所述收發(fā)單元還用于接收并在所述緩存設備中存儲緩存視頻以及至少一個緩存URL,其中,各所述緩存URL均與所述緩存視頻相對應; 所述確定單元具體用于根據(jù)標識部分提取模型,確定所述緩存URL的標識部分,其中,所述標識部分提取模型是根據(jù)至少兩個第三采樣URL的標識部分確定的,其中,各所述第三采樣URL的標識部分的字符串相同,各所述第三采樣URL的字符串相異,各所述第三采樣URL所對應的用戶設備相異,各所述第三采樣URL均與第二采樣視頻相對應,所述第三采樣URL的標識部分包含于所述第三采樣URL的非Host部分;遍歷所述目標URL的非Host部分,如果確定所述目標URL的非Host部分中包含所述緩存URL的標識部分的字符串,則確定所述緩存視頻為所述目標視頻。
25.根據(jù)權利要求22或24所述的裝置,其特征在于,所述收發(fā)單元還用于接收第六采樣URL以及第四采樣視頻,其中,所述第六采樣URL與所述第四視頻相對應,所述第四采樣視頻與所述第二采樣視頻相異; 所述確定單元還用于用于根據(jù)所述標識部分提取模型,確定所述第六采樣URL的標識部分,確定第六采樣URL的標識部分與所述第三采樣URL的標識部分之間的重疊部分,所述重疊部分包括Path值相同的Path級別和參數(shù)值相同的Quey Param中的至少一項,用于從所述第三采樣URL的標識部分中去除所述重疊部分,以更新所述第三采樣URL的標識部分; 用于根據(jù)更新后的第三采樣URL的標識部分,更新所述標識部分提取模型。
26.一種視頻識別系統(tǒng),其特征在于,所述系統(tǒng)包括: 根據(jù)權利要求18至25中任一項所述的視頻識別裝置; 用戶設備,用于向所述視頻識別裝置發(fā)送統(tǒng)一資源定位符URL,并從所述傳輸視頻的裝置獲取與所述URL相對應的視頻; 服務器,用于接收所述視頻識別裝置轉發(fā)的所述URL,確定與所述URL相對應的視頻,并向所述視頻識別裝置發(fā)送所述視頻。
【文檔編號】H04N21/858GK104301806SQ201410461436
【公開日】2015年1月21日 申請日期:2014年9月11日 優(yōu)先權日:2014年9月11日
【發(fā)明者】韓霆軍, 鄭桂慶 申請人:華為技術有限公司