亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種信息處理方法及服務器與流程

文檔序號:11707600閱讀:155來源:國知局
一種信息處理方法及服務器與流程
本發(fā)明涉及通訊技術,尤其涉及一種信息處理方法及服務器。
背景技術
:本申請發(fā)明人在實現(xiàn)本申請實施例技術方案的過程中,至少發(fā)現(xiàn)相關技術中存在如下技術問題:信息分享的方式多種多樣,比如用戶看到一則很棒的新聞,可以通過微博轉發(fā)這條新聞,這是一種信息分享;比如用戶在瀏覽網頁時除了正在瀏覽的信息,還可以獲取到與所瀏覽信息相關的信息,然而,推薦分享的該信息是否為用戶所需要的信息,取決于推薦分享的信息定向策略是否合理,定向策略通過定向屬性生成。現(xiàn)有技術中,各個定向屬性之間的運算是以交集的方式進行組合,且同時配合定制的目標用戶群數(shù)據(jù)包的功能也需要和特定定向屬性交叉組合,以實現(xiàn)精準地定向推送用戶所需要的信息。目前只支持運算以交集的方式進行組合,并不能支持并集和取反等二元運算操作,以用戶所需要的信息為廣告信息為例,例如:針對定向屬性一(如針對18到25歲的男性)和定向屬性二(看過歐萊雅廣告)從原始數(shù)據(jù)中篩選出目標用戶群,以便為目標用戶群定向投放廣告信息,通過現(xiàn)有技術無法直接實現(xiàn),需要進一步配合額外的數(shù)據(jù)處理機制來根據(jù)定向屬性運算出最終所需的目標用戶群,從而導致計算的過程耗時過久,處理效率低下。相關技術中,對于該問題,尚無有效解決方案。技術實現(xiàn)要素:有鑒于此,本發(fā)明實施例希望提供一種信息處理方法及服務器,至少解決了現(xiàn)有技術存在的問題。本發(fā)明實施例的技術方案是這樣實現(xiàn)的:本發(fā)明實施例的一種信息處理方法,所述方法包括:獲取至少一組第一數(shù)據(jù);按照預設規(guī)則掃描所述至少一組第一數(shù)據(jù)以進行預處理,得到第一結果集,所述第一結果集中的數(shù)據(jù)存儲容量小于所述至少一組第一數(shù)據(jù)的存儲容量;根據(jù)所述第一結果集生成索引集,所述索引集中包含與每個索引對應的定向標簽屬性;獲取第一終端反饋的信息發(fā)送定向需求;解析出所述定向需求中的至少一個定向屬性,在所述索引集中匹配出對應的定向標簽屬性,將所述第一結果集中符合所述定向標簽屬性的數(shù)據(jù)進行運算處理,得到用于表征目標用戶群的第二結果集,發(fā)送信息給登錄第二終端的所述目標用戶群。上述方案中,所述按照預設規(guī)則掃描所述至少一組第一數(shù)據(jù)以進行預處理,得到第一結果集,包括:掃描所述至少一組第一數(shù)據(jù),從所述至少一組第一數(shù)據(jù)中解析得到至少一個定向維度,對所述至少一個定向維度中的每個定向屬性進行預處理得到至少一個定向標簽屬性,將由所述至少一個定向標簽屬性構成的數(shù)據(jù)作為所述第一結果集。上述方案中,所述根據(jù)所述第一結果集生成索引集,包括:按照所述至少一個定向標簽屬性分別建立與其對應的索引,由得到的至少一個索引構成所述索引集。上述方案中,所述定向標簽屬性為所述第二結果集中目標用戶群所能使用的標簽屬性。上述方案中,所述對所述至少一個定向維度中的每個定向屬性進行預處理得到至少一個定向標簽屬性,包括:預先收集歷史數(shù)據(jù),將所述歷史數(shù)據(jù)按照預定義的分類標簽屬性進行分類,得到標簽屬性的分類結果,將所述標簽屬性的分類結果按照在第二終端進行信息顯示后得到的排序結果進行篩選,以通過預處理得到所述至少一個定向標簽屬性。上述方案中,所述方法還包括:按照社交號碼段對所述第二結果集中的目標用戶群進行數(shù)據(jù)拆分后,將信息發(fā)送給拆分后得到的各個目標用戶群。本發(fā)明實施例的一種服務器,所述服務器包括:第一獲取單元,用于獲取至少一組第一數(shù)據(jù);預處理單元,用于按照預設規(guī)則掃描所述至少一組第一數(shù)據(jù)以進行預處理,得到第一結果集,所述第一結果集中的數(shù)據(jù)存儲容量小于所述至少一組第一數(shù)據(jù)的存儲容量;索引生成單元,用于根據(jù)所述第一結果集生成索引集,所述索引集中包含與每個索引對應的定向標簽屬性;第二獲取單元,用于獲取第一終端反饋的信息發(fā)送定向需求;發(fā)送單元,用于解析出所述定向需求中的至少一個定向屬性,在所述索引集中匹配出對應的定向標簽屬性,將所述第一結果集中符合所述定向標簽屬性的數(shù)據(jù)進行運算處理,得到用于表征目標用戶群的第二結果集,發(fā)送信息給登錄第二終端的所述目標用戶群。上述方案中,所述預處理單元,進一步用于:掃描所述至少一組第一數(shù)據(jù),從所述至少一組第一數(shù)據(jù)中解析得到至少一個定向維度,對所述至少一個定向維度中的每個定向屬性進行預處理得到至少一個定向標簽屬性,將由所述至少一個定向標簽屬性構成的數(shù)據(jù)作為所述第一結果集。上述方案中,所述索引生成單元,進一步用于:按照所述至少一個定向標簽屬性分別建立與其對應的索引,由得到的至少一個索引構成所述索引集。上述方案中,所述定向標簽屬性為所述第二結果集中目標用戶群所能使用的標簽屬性。上述方案中,所述預處理單元,進一步用于:預先收集歷史數(shù)據(jù),將所述歷史數(shù)據(jù)按照預定義的分類標簽屬性進行分類,得到標簽屬性的分類結果,將所述標簽屬性的分類結果按照在第二終端進行信息顯示后得到的排序結果進行篩選,以通過預處理得到所述至少一個定向標簽屬性。上述方案中,所述發(fā)送單元,進一步用于:按照社交號碼段對所述第二結果集中的目標用戶群進行數(shù)據(jù)拆分后,將所述信息發(fā)送給拆分后得到的各個目標用戶群。本發(fā)明實施例的信息處理方法包括:獲取至少一組第一數(shù)據(jù);按照預設規(guī)則掃描所述至少一組第一數(shù)據(jù)以進行預處理,得到第一結果集,所述第一結果集中的數(shù)據(jù)存儲容量小于所述至少一組第一數(shù)據(jù)的存儲容量;根據(jù)所述第一結果集生成索引集,所述索引集中包含與每個索引對應的定向標簽屬性;獲取第一終端反饋的信息發(fā)送定向需求;解析出所述定向需求中的至少一個定向屬性,在所述索引集中匹配出對應的定向標簽屬性,將所述第一結果集中符合所述定向標簽屬性的數(shù)據(jù)進行運算處理,得到用于表征目標用戶群的第二結果集,發(fā)送信息給登錄第二終端的所述目標用戶群。采用本發(fā)明實施例,由于可以按照預設規(guī)則掃描所述至少一組第一數(shù)據(jù)以進行預處理,得到第一結果集,所述第一結果集中的數(shù)據(jù)存儲容量小于所述至少一組第一數(shù)據(jù)的存儲容量,因此大大減少了需要處理的數(shù)據(jù)量,從而提高了數(shù)據(jù)處理效率。還可以根據(jù)所述第一結果集生成索引集,所述索引集中包含與每個索引對應的定向標簽屬性;獲取第一終端反饋的信息發(fā)送定向需求;解析出所述定向需求中的至少一個定向屬性,在所述索引集中匹配出對應的定向標簽屬性,將所述第一結果集中符合所述定向標簽屬性的數(shù)據(jù)進行運算處理,由于運算處理是各個定向屬性之間的各種自由組合,不限于交集的方式進行組合,從而配合定制的目標用戶群數(shù)據(jù)包的功能也通過和特定定向屬性的自由組合,能以最快的速度運算得到用于表征目標用戶群的第二結果集,最終發(fā)送信息給登錄第二終端的所述目標用戶群,整個處理過程以較少的數(shù)據(jù)量,較大靈活性的運算邏輯自由組合,從而避免了計算的過程耗時過久的問題,大大提高了數(shù)據(jù)處理效率。附圖說明圖1為本發(fā)明實施例中進行信息交互的各方硬件實體的示意圖;圖2為本發(fā)明實施例一的一個實現(xiàn)流程示意圖;圖3為本發(fā)明實施例二的一個實現(xiàn)流程示意圖;圖4為本發(fā)明實施例三的一個組成結構示意圖;圖5為本發(fā)明實施例四的一個硬件組成結構示意圖;圖6-9為各個應用場景的示意圖。具體實施方式下面結合附圖對技術方案的實施作進一步的詳細描述。圖1為本發(fā)明實施例中進行信息交互的各方硬件實體的示意圖,圖1中包括:服務器11……1n、終端設備21-24,終端設備21-24通過有線網絡或者無線網絡與服務器進行信息交互,終端設備包括手機、臺式機、pc機、一體機等類型,一個示例中,服務器11……1n還可以通過網絡與第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)進行交互,第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)將想要投放的廣告提交后,被存儲在服務器集群中,可以配備管理員對第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)投放的廣告進行審核等一系列處理。其中,相對于第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)而言,終端設備21-24可以稱為第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象),可以為通過視頻應用看視頻的用戶,通過游戲應用打游戲的用戶,通過上網瀏覽頁面的用戶等等。其中,終端設備中安裝的所有應用或者指定的應用(如游戲應用,視頻應用,瀏覽器應用等等)都可以添加廣告以展示給用戶更多的推薦信息。采用本發(fā)明實施例,基于上述圖1所示的系統(tǒng),服務器獲取第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)和/或第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象)發(fā)送的至少一組第一數(shù)據(jù)(如歷史數(shù)據(jù)和實時更新的數(shù)據(jù)),將所述至少一組第一數(shù)據(jù)作為原始數(shù)據(jù)來使用,按照預設規(guī)則掃描所述至少一組第一數(shù)據(jù)以進行預處理,得到第一結果集,所述第一結果集中的數(shù)據(jù)存儲容量小于所述至少一組第一數(shù)據(jù)的存儲容量;根據(jù)所述第一結果集生成索引集,所述索引集中包含與每個索引對應的定向標簽屬性;獲取第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)反饋的信息發(fā)送定向需求(如用戶定制定向屬性時得到的定向投放需求,比如廣告主通過其所在的第一終端向那些符合該定向屬性的目標用戶群投放廣告信息時所生成的定向投放需求);解析出所述定向需求中的至少一個定向屬性,在所述索引集中匹配出對應的定向標簽屬性,將所述第一結果集中符合所述定向標簽屬性的數(shù)據(jù)進行運算處理,得到用于表征目標用戶群的第二結果集,發(fā)送信息給登錄第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象)的所述目標用戶群。上述圖1的例子只是實現(xiàn)本發(fā)明實施例的一個系統(tǒng)架構實例,本發(fā)明實施例并不限于上述圖1所述的系統(tǒng)結構,基于該系統(tǒng)架構,提出本發(fā)明各個實施例。實施例一:本發(fā)明實施例的一種信息處理方法,如圖2所示,所述方法包括:步驟101、獲取至少一組第一數(shù)據(jù)。這里,所述至少一組第一數(shù)據(jù)為原始數(shù)據(jù),可以是服務器從第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)側收集的,也可以是從第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象)側收集的,也可以是從第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)和第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象)側共同收集的數(shù)據(jù)。步驟102、按照預設規(guī)則掃描所述至少一組第一數(shù)據(jù)以進行預處理,得到第一結果集,所述第一結果集中的數(shù)據(jù)存儲容量小于所述至少一組第一數(shù)據(jù)的存儲容量。這里,所述預設規(guī)則為用于執(zhí)行步驟102-103所構成預處理過程的數(shù)據(jù)處理規(guī)則,通過所述預設規(guī)則進行預處理,可以對數(shù)據(jù)進行拆分,對拆分后的數(shù)據(jù)進行處理,由于拆分后能得到更小的數(shù)據(jù)存儲量,即第一結果集中的數(shù)據(jù)存儲容量小于所述至少一組第一數(shù)據(jù)的存儲容量,因此,后續(xù)在針對這些數(shù)據(jù)通過運算策略(不限于交集,并集,取反等運算策略)的自由組合進行運算,也能提高運算速度,降低響應時間。這里,響應時間是指:廣告主通過其所在的第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)向那些符合其定向屬性的目標用戶群投放廣告信息時生成定向投放需求后,將該定向投放需求發(fā)送給服務器,服務器能通過上述運算策略的自由組合,或者在第一終端本地根據(jù)定向投放需求進行上述運算策略的自由組合,能盡快得到最終符合定向投放需求的所述目標用戶群,這個響應時間越短越好。步驟103、根據(jù)所述第一結果集生成索引集,所述索引集中包含與每個索引對應的定向標簽屬性。這里,是按照第一結果集中的定向標簽屬性數(shù)據(jù)建立與定向標簽數(shù)據(jù)對應的索引。步驟102與步驟103都屬于預處理過程。比如,預先對所有要使用的定向標簽屬性進行索引,索引后10億社交號碼(如qq)一個屬性-定向屬性的緯度占用空間縮小到100m以內,相比原始數(shù)據(jù)空間占用縮小了很多,通過利用索引將原始數(shù)據(jù)分成更小的存儲單元,并存儲于第一結果集中,同樣的存儲容量不僅可以存儲更多的數(shù)據(jù),還能確保數(shù)據(jù)夠精簡,以便后續(xù)進行運算策略的自由組合,如交集,并集或取反處理時,運算速度更加快,響應時間也更加快。步驟104、獲取第一終端反饋的信息發(fā)送定向需求。這里,所述信息發(fā)送定向需求,如在針對廣告信息進行定向投放時,由第一終端選擇定向屬性組合時生成該定向需求。步驟105、解析出所述定向需求中的至少一個定向屬性,在所述索引集中匹配出對應的定向標簽屬性,將所述第一結果集中符合所述定向標簽屬性的數(shù)據(jù)進行運算處理,得到用于表征目標用戶群的第二結果集。這里,本步驟按照定向需求中配置的定向屬性組合策略(包括交集,并集和取反在內的運算邏輯)進行自由組合,得到第二結果集,所述第二結果集用于表征最終的目標用戶群所在的集合。采用本發(fā)明實施例,支持通過包括交集,并集和取反在內的各種運算邏輯自由組合運算策略,可以根據(jù)不同定向屬性的自由組合運算策略從至少一組第一數(shù)據(jù)(即原始數(shù)據(jù))中篩選出最終的目標用戶群,而且通過將所述至少一組第一數(shù)據(jù)(即原始數(shù)據(jù))進行預處理以得到更小存儲容量的第一結果集,根據(jù)第一結果集生成索引集(索引集包括多個索引,每個索引與預定義好的該定向標簽屬性相對應,以便后續(xù)根據(jù)預定義好的該定向標簽屬性,進行按需組合,以在最短的響應時間內得到最終的目標用戶群),服務器獲取用戶定制定向屬性時得到的定向投放需求(即向那些符合該定向屬性的目標用戶群投放廣告時),根據(jù)所述索引集得到第二結果集,所述第二結果集為最終的目標用戶群。本實施例分為兩個部分,1)數(shù)據(jù)預處理過程:如步驟101-103所示;2)數(shù)據(jù)運算過程,如步驟104-105所示,根據(jù)用戶定向投放需求,自定義多種運算邏輯的自由組合(不限于交集,并集和取反操作),從而根據(jù)多個定向屬性的自由運算邏輯的組合從至少一組數(shù)據(jù)(原始數(shù)據(jù))中篩選計算出最終的目標用戶群,最終通過步驟106,將第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)想要推送的信息,如廣告信息發(fā)送給第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象)進行信息展示。步驟106、發(fā)送信息給登錄第二終端的所述目標用戶群。實施例二:本發(fā)明實施例的一種信息處理方法,如圖3所示,所述方法包括:步驟201、獲取至少一組第一數(shù)據(jù)。這里,所述至少一組第一數(shù)據(jù)為原始數(shù)據(jù),可以是服務器從第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)側收集的,也可以是從第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象)側收集的,也可以是從第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)和第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象)側共同收集的數(shù)據(jù)。步驟202、掃描所述至少一組第一數(shù)據(jù),從所述至少一組第一數(shù)據(jù)中解析得到至少一個定向維度。步驟203、對所述至少一個定向維度中的每個定向屬性進行預處理得到至少一個定向標簽屬性,將由所述至少一個定向標簽屬性構成的數(shù)據(jù)作為所述第一結果集。這里,所述第一結果集中的數(shù)據(jù)存儲容量小于所述至少一組第一數(shù)據(jù)的存儲容量。這里,步驟202-204構成預處理過程,通過預處理過程,可以對數(shù)據(jù)進行拆分,對拆分后的數(shù)據(jù)進行處理,由于拆分后能得到更小的數(shù)據(jù)存儲量,即第一結果集中的數(shù)據(jù)存儲容量小于所述至少一組第一數(shù)據(jù)的存儲容量,因此,后續(xù)在針對這些數(shù)據(jù)通過運算策略(不限于交集,并集,取反等運算策略)的自由組合進行運算,也能提高運算速度,降低響應時間。這里,響應時間是指:廣告主通過其所在的第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)向那些符合其定向屬性的目標用戶群投放廣告信息時生成定向投放需求后,將該定向投放需求發(fā)送給服務器,服務器能通過上述運算策略的自由組合,或者在第一終端本地根據(jù)定向投放需求進行上述運算策略的自由組合,能盡快得到最終符合定向投放需求的所述目標用戶群,這個響應時間越短越好。步驟204、按照所述第一結果集中至少一個定向標簽屬性分別建立與其對應的索引,由得到的至少一個索引構成索引集。這里,所述索引集中包含與每個索引對應的定向標簽屬性。這里,是按照第一結果集中的定向標簽屬性數(shù)據(jù)建立與定向標簽數(shù)據(jù)對應的索引。步驟202-204都屬于預處理過程。比如,預先對所有要使用的定向標簽屬性進行索引,索引后10億社交號碼(如qq)一個屬性-定向屬性的緯度占用空間縮小到100m以內,相比原始數(shù)據(jù)空間占用縮小了很多,通過利用索引將原始數(shù)據(jù)分成更小的存儲單元,并存儲于第一結果集中,同樣的存儲容量不僅可以存儲更多的數(shù)據(jù),還能確保數(shù)據(jù)夠精簡,以便后續(xù)進行運算策略的自由組合,如交集,并集或取反處理時,運算速度更加快,響應時間也更加快。步驟205、獲取第一終端反饋的信息發(fā)送定向需求。這里,所述信息發(fā)送定向需求,如在針對廣告信息進行定向投放時,由第一終端選擇定向屬性組合時生成該定向需求。步驟206、解析出所述定向需求中的至少一個定向屬性,在所述索引集中匹配出對應的定向標簽屬性,將所述第一結果集中符合所述定向標簽屬性的數(shù)據(jù)進行運算處理,得到用于表征目標用戶群的第二結果集。這里,本步驟按照定向需求中配置的定向屬性組合策略(包括交集,并集和取反在內的運算邏輯)進行自由組合,得到第二結果集,所述第二結果集用于表征最終的目標用戶群所在的集合。采用本發(fā)明實施例,支持通過包括交集,并集和取反在內的各種運算邏輯自由組合運算策略,可以根據(jù)不同定向屬性的自由組合運算策略從至少一組第一數(shù)據(jù)(即原始數(shù)據(jù))中篩選出最終的目標用戶群,而且通過將所述至少一組第一數(shù)據(jù)(即原始數(shù)據(jù))進行預處理以得到更小存儲容量的第一結果集,根據(jù)第一結果集生成索引集(索引集包括多個索引,每個索引與預定義好的該定向標簽屬性相對應,以便后續(xù)根據(jù)預定義好的該定向標簽屬性,進行按需組合,以在最短的響應時間內得到最終的目標用戶群),服務器獲取用戶定制定向屬性時得到的定向投放需求(即向那些符合該定向屬性的目標用戶群投放廣告時),根據(jù)所述索引集得到第二結果集,所述第二結果集為最終的目標用戶群。本實施例分為兩個部分,1)數(shù)據(jù)預處理過程:如步驟201-204所示;2)數(shù)據(jù)運算過程,如步驟205-206所示,根據(jù)用戶定向投放需求,自定義多種運算邏輯的自由組合(不限于交集,并集和取反操作),從而根據(jù)多個定向屬性的自由運算邏輯的組合從至少一組數(shù)據(jù)(原始數(shù)據(jù))中篩選計算出最終的目標用戶群,最終通過步驟207,將第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)想要推送的信息,如廣告信息發(fā)送給第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象)進行信息展示。步驟207、發(fā)送信息給登錄第二終端的所述目標用戶群?;谏鲜鰧嵤├?二,在本發(fā)明實施例一實施方式中,所述定向標簽屬性為所述目標用戶群(即用戶定制人群包)所能使用的標簽屬性?;谏鲜鰧嵤├?二,在本發(fā)明實施例一實施方式中,所述對所述至少一個定向維度中的每個定向屬性進行預處理得到至少一個定向標簽屬性,包括:預先收集歷史數(shù)據(jù),將所述歷史數(shù)據(jù)按照預定義的分類標簽屬性進行分類,得到標簽屬性的分類結果,將所述標簽屬性的分類結果按照在第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象)進行信息顯示后得到的排序結果(如曝光量排序結果)進行篩選,以通過預處理得到所述至少一個定向標簽屬性。一個實例為:比如,采用本實施方式,可以對歷史幾個月內的熱門品牌,明星,行業(yè)分類等按曝光量排序并進行一定的人工干預,篩選出常用的標簽屬性,并按一定周期(例如:按月)對上述定向標簽屬性進行更新。本發(fā)明實施例中,對于沒有經過預處理過程得到的上述定向標簽屬性,不支持后續(xù)的運算邏輯自由組合的運算,只針對能獲取到預處理過程得到上述定向標簽屬性的數(shù)據(jù)進行該運算邏輯自由組合的運算?;谏鲜鰧嵤├?二,在本發(fā)明實施例一實施方式中,所述方法還包括:按照社交號碼段(如qq號碼段)對所述第二結果集中的目標用戶群進行數(shù)據(jù)拆分后,將信息推送給拆分后得到的各個目標用戶群。實施例三:本發(fā)明實施例的一種信息交互系統(tǒng),如圖4所示,服務器41(如圖1中的服務器11-1n)、第一終端42(如圖1中的31-3n)、第二終端43(如圖1中的終端21-24),其中,所述服務器包括:第一獲取單元411,用于獲取至少一組第一數(shù)據(jù);預處理單元412,用于按照預設規(guī)則掃描所述至少一組第一數(shù)據(jù)以進行預處理,得到第一結果集,所述第一結果集中的數(shù)據(jù)存儲容量小于所述至少一組第一數(shù)據(jù)的存儲容量;索引生成單元413,用于根據(jù)所述第一結果集生成索引集,所述索引集中包含與每個索引對應的定向標簽屬性;第二獲取單元414,用于獲取第一終端反饋的信息發(fā)送定向需求;發(fā)送單元415,用于解析出所述定向需求中的至少一個定向屬性,在所述索引集中匹配出對應的定向標簽屬性,將所述第一結果集中符合所述定向標簽屬性的數(shù)據(jù)進行運算處理,得到用于表征目標用戶群的第二結果集,發(fā)送信息給登錄第二終端的所述目標用戶群。第一終端42用于發(fā)送作為原始數(shù)據(jù)使用的第一數(shù)據(jù)給服務器分析,并根據(jù)從服務器獲取的定向策略或者從服務器獲取的定向需求對應投放的目標用戶群發(fā)送所推薦的信息給對應登錄第二終端43的所述目標用戶群,第一終端42也可以發(fā)送作為原始數(shù)據(jù)使用的第一數(shù)據(jù)給第二終端43進行展示后,第二終端將獲取的反饋信息也作為所述原始數(shù)據(jù)使用并發(fā)送給服務器進行分析,以便服務器可以根據(jù)第一終端和/或第二終端發(fā)送的原始數(shù)據(jù)進行預處理,將不同定向維度中每個定向屬性生成定向屬性標簽后,建立與該定向屬性標簽對應的索引,基于索引重新分配和存儲預處理后得到的數(shù)據(jù),在根據(jù)定向屬性篩選目標用戶群的過程中,根據(jù)定向屬性標簽與索引間建立的關系,利用定向屬性間的多種運算邏輯(不限于交集,并集和取反)的自由組合,盡快的篩選計算出所述目標用戶群。在本發(fā)明實施例一實施方式中,所述至少一組第一數(shù)據(jù)為原始數(shù)據(jù),可以是服務器從第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)側收集的,也可以是從第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象)側收集的,也可以是從第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)和第二終端(如普通用戶所在的終端,或稱為廣告展示或曝光的對象)側共同收集的數(shù)據(jù)。在本發(fā)明實施例一實施方式中,所述預設規(guī)則為預處理單元和索引生成單元執(zhí)行相應預處理過程的數(shù)據(jù)處理規(guī)則,通過所述預設規(guī)則進行預處理,可以對數(shù)據(jù)進行拆分,對拆分后的數(shù)據(jù)進行處理,由于拆分后能得到更小的數(shù)據(jù)存儲量,即第一結果集中的數(shù)據(jù)存儲容量小于所述至少一組第一數(shù)據(jù)的存儲容量,因此,后續(xù)在針對這些數(shù)據(jù)通過運算策略(不限于交集,并集,取反等運算策略)的自由組合進行運算,也能提高運算速度,降低響應時間。這里,響應時間是指:廣告主通過其所在的第一終端(如廣告主所在的終端,或稱為提供廣告素材和內容推廣的對象)向那些符合其定向屬性的目標用戶群投放廣告信息時生成定向投放需求后,將該定向投放需求發(fā)送給服務器,服務器能通過上述運算策略的自由組合,或者在第一終端本地根據(jù)定向投放需求進行上述運算策略的自由組合,能盡快得到最終符合定向投放需求的所述目標用戶群,這個響應時間越短越好。在本發(fā)明實施例一實施方式中,是按照第一結果集中的定向標簽屬性數(shù)據(jù)建立與定向標簽數(shù)據(jù)對應的索引。預處理單元和索引生成單元執(zhí)行的處理過程都屬于預處理過程。比如,預先對所有要使用的定向標簽屬性進行索引,索引后10億社交號碼(如qq)一個屬性-定向屬性的緯度占用空間縮小到100m以內,相比原始數(shù)據(jù)空間占用縮小了很多,通過利用索引將原始數(shù)據(jù)分成更小的存儲單元,并存儲于第一結果集中,同樣的存儲容量不僅可以存儲更多的數(shù)據(jù),還能確保數(shù)據(jù)夠精簡,以便后續(xù)進行運算策略的自由組合,如交集,并集或取反處理時,運算速度更加快,響應時間也更加快。在本發(fā)明實施例一實施方式中,按照定向需求中配置的定向屬性組合策略(包括交集,并集和取反在內的運算邏輯)進行自由組合,得到第二結果集,所述第二結果集用于表征最終的目標用戶群所在的集合。采用本發(fā)明實施例,支持通過包括交集,并集和取反在內的各種運算邏輯自由組合運算策略,可以根據(jù)不同定向屬性的自由組合運算策略從至少一組第一數(shù)據(jù)(即原始數(shù)據(jù))中篩選出最終的目標用戶群,而且通過將所述至少一組第一數(shù)據(jù)(即原始數(shù)據(jù))進行預處理以得到更小存儲容量的第一結果集,根據(jù)第一結果集生成索引集(索引集包括多個索引,每個索引與預定義好的該定向標簽屬性相對應,以便后續(xù)根據(jù)預定義好的該定向標簽屬性,進行按需組合,以在最短的響應時間內得到最終的目標用戶群),服務器獲取用戶定制定向屬性時得到的定向投放需求(即向那些符合該定向屬性的目標用戶群投放廣告時),根據(jù)所述索引集得到第二結果集,所述第二結果集為最終的目標用戶群。在本發(fā)明實施例一實施方式中,所述預處理單元,進一步用于:掃描所述至少一組第一數(shù)據(jù),從所述至少一組第一數(shù)據(jù)中解析得到至少一個定向維度,對所述至少一個定向維度中的每個定向屬性進行預處理得到至少一個定向標簽屬性,將由所述至少一個定向標簽屬性構成的數(shù)據(jù)作為所述第一結果集。在本發(fā)明實施例一實施方式中,所述索引生成單元,進一步用于:按照所述至少一個定向標簽屬性分別建立與其對應的索引,由得到的至少一個索引構成所述索引集。在本發(fā)明實施例一實施方式中,所述定向標簽屬性為所述第二結果集中目標用戶群所能使用的標簽屬性。在本發(fā)明實施例一實施方式中,所述預處理單元,進一步用于:預先收集歷史數(shù)據(jù),將所述歷史數(shù)據(jù)按照預定義的分類標簽屬性進行分類,得到標簽屬性的分類結果,將所述標簽屬性的分類結果按照在第二終端進行信息顯示后得到的排序結果進行篩選,以通過預處理得到所述至少一個定向標簽屬性。在本發(fā)明實施例一實施方式中,所述發(fā)送單元,進一步用于:按照社交號碼段對所述第二結果集中的目標用戶群進行數(shù)據(jù)拆分后,將所述信息發(fā)送給拆分后得到的各個目標用戶群。實施例四:這里需要指出的是,上述第一終端,第二終端可以為pc這種電子設備,還可以為如pad,平板電腦,手提電腦這種便攜電子設備、還可以為如手機這種智能移動終端,不限于這里的描述;所述服務器可以是通過集群系統(tǒng)構成的,為實現(xiàn)各單元功能而合并為一或各單元功能分體設置的電子設備,客戶端和服務器都至少包括用于存儲數(shù)據(jù)的數(shù)據(jù)庫和用于數(shù)據(jù)處理的處理器,或者包括設置于服務器內的存儲介質或獨立設置的存儲介質。其中,對于用于數(shù)據(jù)處理的處理器而言,在執(zhí)行處理時,可以采用微處理器、中央處理器(cpu,centralprocessingunit)、數(shù)字信號處理器(dsp,digitalsingnalprocessor)或可編程邏輯陣列(fpga,field-programmablegatearray)實現(xiàn);對于存儲介質來說,包含操作指令,該操作指令可以為計算機可執(zhí)行代碼,通過所述操作指令來實現(xiàn)上述本發(fā)明實施例信息處理方法流程中的各個步驟。該第一終端、第二終端和該服務器作為硬件實體s11的一個示例如圖5所示。所述裝置包括處理器51、存儲介質52以及至少一個外部通信接口53;所述處理器51、存儲介質52以及外部通信接口53均通過總線54連接。這里需要指出的是:以上涉及第一終端,第二終端和服務器項的描述,與上述方法描述是類似的,同方法的有益效果描述,不做贅述。對于本發(fā)明終端設端側和服務器實施例中未披露的技術細節(jié),請參照本發(fā)明方法實施例的描述。以一個現(xiàn)實應用場景為例對本發(fā)明實施例闡述如下:由于目前各個定向屬性之間的運算是以交集的方式進行組合,同時配合定制的目標用戶群數(shù)據(jù)包的功能可以實現(xiàn)和特定定向屬性交叉組合,以實現(xiàn)精準地定向推送用戶所需要的信息。目前只支持各個定向屬性之間的運算以交集的方式進行組合,并不能支持并集和取反等二元運算操作,以用戶所需要的信息為廣告信息為例,例如:針對定向屬性(如需要針對18到25歲的男性)和目標用戶群(如看過歐萊雅廣告的人)一起定向投放廣告信息,則對于該類信息定向推送的需求,通過現(xiàn)有技術無法直接實現(xiàn),還需要配合通過額外的數(shù)據(jù)處理機制根據(jù)定向推送的需求計算出目標用戶群數(shù)據(jù)包后再進行信息定向推送,從而導致整個數(shù)據(jù)處理的運算過程耗時過久,處理效率低下。相關技術中,對于該問題,尚無有效解決方案。本應用場景采用本發(fā)明實施例,針對信息為廣告信息,數(shù)據(jù)處理采用分布式文件系統(tǒng)(hadoop,phadoopdistributedfilesystem)的方式,先對數(shù)據(jù)進行預處理后,使其數(shù)據(jù)存儲容量比原始數(shù)據(jù)要小,同樣的存儲容量可以存儲更多的數(shù)據(jù),之后,通過預處理過程中建立的定向屬性標簽與索引的對應關系,根據(jù)定向屬性的多種運算邏輯(交集,并集和取反操作)自由組合,快速運算得到最終的目標用戶群,以便第一終端可以根據(jù)該目標用戶群精準的按照定向投放需求進行廣告信息的投放。整個處理過程處理時間快,效率高,響應時間短。針對hadoop方式而言,是通過對搜索關鍵字進行內容分類的數(shù)據(jù)處理機制,例如,如果您要對一個10tb的巨型文件進行搜索分類,會出現(xiàn)什么情況?在傳統(tǒng)的系統(tǒng)上,這將需要很長的時間。但是,采用hadoop方式,尤其在設計時就考慮到這些問題,它是一個能夠對大量數(shù)據(jù)進行分布式處理的軟件框架,也就是說,hadoop方式是采用并行執(zhí)行的機制,提供一種可靠、高效、可伸縮、高容錯性、高擴展性的方式進行數(shù)據(jù)處理,因此能大大提高數(shù)據(jù)處理效率。就可靠而言,hadoop方式按位存儲,且在設計時假設計算元素和存儲會失敗,因此,采用hadoop方式會維護多個工作數(shù)據(jù)副本,確保能夠針對失敗的節(jié)點重新分布處理;就高效而言,因為hadoop方式以并行的方式工作,通過并行處理加快處理速度,能夠在節(jié)點之間動態(tài)地移動數(shù)據(jù),并保證各個節(jié)點的動態(tài)平衡,因此處理速度非常快;就可伸縮而言,采用hadoop方式,能夠處理pb級數(shù)據(jù);針對高容錯性而言,采用hadoop方式,能夠自動保存數(shù)據(jù)的多個副本,并且能夠自動將失敗的任務重新分配;就高擴展性而言,采用hadoop方式,在可用的計算機集簇間分配數(shù)據(jù)并完成計算任務的,這些集簇可以方便地擴展到數(shù)以千計的節(jié)點中。一種針對廣告信息基于hadoop方式的數(shù)據(jù)處理過程如圖6所示,對于曝光落地的數(shù)據(jù),使用hadoop方式掃描原始數(shù)據(jù)(包含多個定向屬性的定向投放需求),以獲得結果集,結果集為包含目標用戶群的集合。采用這種方式,由于是集群離線計算的方式,因此運算過程耗時過久。比如,原始曝光落地數(shù)據(jù)日均20億條左右,每日的數(shù)據(jù)總量都在tb級。當用戶提出定制需求時,需使用多臺機器的hadoop集群進行mapreduce任務計算得到結果。計算量和耗時較長。這里,所述mapreduce指,用于大規(guī)模數(shù)據(jù)集(大于1tb)的并行運算。map指映射,reduce指規(guī)約。本應用場景采用本發(fā)明實施例,是一種針對廣告信息基于在線dmp方式的數(shù)據(jù)處理過程,具體為一種在線自定義廣告受眾人群投放的技術方案,涉及的技術術語包括:1)顯示廣告:一種圖形化的廣告技術;2)dmp:數(shù)據(jù)管理平臺;3)精準定向:用戶身份識別、用戶行為的收集、用戶數(shù)據(jù)的挖掘分析和廣告的匹配投放。本應用場景采用本發(fā)明實施例的這種基于在線dmp自定義目標用戶群(即目標人群數(shù)據(jù)包)的功能可以提供在線的目標人群數(shù)據(jù)包組合功能,具有目標人群定向精準、數(shù)據(jù)處理效率高,響應時間短的優(yōu)點,可以根據(jù)所提供的性別定向,時間定向,地域定向等等單一維度的定向屬性的自由運算邏輯組合(不限于交集、并集和取反)的精準定向方式,配合定制目標人群數(shù)據(jù)包的功能,實現(xiàn)和特定定向屬性進行自由組合以實現(xiàn)針對在線dmp自定義目標用戶群(即目標人群數(shù)據(jù)包)進行精準的定向廣告信息投放。例如:針對看過歐萊雅廣告的18到25歲的男性,精準投放廣告信息。本應用場景采用本發(fā)明實施例,其數(shù)據(jù)處理過程如圖7所示,包括:對于曝光落地的數(shù)據(jù),先進行預處理過程:如采取每周定時全量計算的策略,具體使用hadoop方式掃描原始數(shù)據(jù)(包含多個定向屬性的定向投放需求)獲得第一結果集,根據(jù)第一結果集得到索引集,之后,進行具體的運算過程:如根據(jù)廣告主提交的定制需求采用在線實時計算的策略,具體是根據(jù)具體的定向投放需求進行針對該定向投放需求中多個定向屬性的運算策略自由組合,由索引集計算得到第二結果集,第二結果集為包含目標用戶群的集合。通過這種預處理的方式,可以預先對所有要使用的定向標簽屬性進行索引,索引后10億qq一個屬性緯度占用空間縮小到100m以內,相比原始數(shù)據(jù)空間占用縮小了很多。那么,在后續(xù)實際執(zhí)行具體運算過程時,針對用戶提出定制需求時,可以直接實時的通過索引集計算出結果,計算時間在分鐘級。本應用場景采用本發(fā)明實施例,該方案需要對用戶定制人群包所能使用的標簽屬性進行預先定義,具體方法可以是對歷史幾個月內的熱門品牌,明星,行業(yè)分類等按曝光量排序并進行一定的人工干預,篩選出常用的標簽屬性,并按一定周期(例如:按月)進行更新。對于沒有進行預索引的定向標簽屬性不予支持。一個具體數(shù)據(jù)預處理的例子如下所示:首先利用hadoop方式離線計算預先對每個定向維度里每個屬性計算出結果(用戶標識的有序集合)并索引。再利用在線dmp自定義目標用戶群(即目標人群數(shù)據(jù)包)進行精準的定向廣告信息投放,具體可以通過并行計算實現(xiàn)在線自定義人群包的功能,支持“交”、“并”、“取反”等位運算符。1)利用hadoop方式離線建立索引:針對所有用戶標識(qq號使用次級列重新進行編碼),大盤總共21億的qq號,活躍的大約在10億左右,而qq號碼有12位以上,使用次級列編碼后可以使用一個10億的bitmap來表示一個qq號碼包的集合,如表1所示。qq號次級列xxx678130xxx678901xxx789312xxx890003表1一個包含xxx67813和xxx78931兩個qq號的可以使用4位如下表2所示:1010表2將所有的緯度的屬性都按上述方法進行編碼,再使用字節(jié)對齊混合壓縮(wah)算法對位圖(bitmap)進行壓縮。2)結合表3(定向屬性為:男性),表4(定向屬性為18到25歲),表5(看過歐萊雅廣告的人),定向屬性運算的邏輯為:男性and18到25歲or看過歐萊雅廣告的人,在線自定義人群包進行并行處理的位運算,得到表6(結果:最終的目標用戶群結果),再和qq號的次級列字典匹配得到結果qq號碼包,并行化處理的一個實例如圖8所示,并行化處理時,將bitmap按位拆分,多任務(如worker1、worker2、worker3、worker4、….workern,n為大于1的正整數(shù))同時進行,運算結果再進行合并,縮短運算時間。1010…表30110…表41011…表51011…表63)第一終端的選擇定向屬性以生成對應的定向需求發(fā)送給服務器進行上述(2)的在線自定義人群包進行并行處理的位運算,選擇定向屬性的操作界面如圖9所示,可以按照交集,也可以按照并集來選取多個定向屬性的自由組合,那么,服務器側就可以根據(jù)該定向需求,解析出多個定向屬性后,根據(jù)第一終端請求的自由組合,進行交集或并集的位運算,以盡快得到目標用戶群,反饋給第一終端,第一終端根據(jù)定向策略及該目標用戶群,向對應目標用戶群的多個第二終端發(fā)送廣告信息。定向投放邏輯為:生成以qq號為索引(key),人群包id序列的為值(value)的表,其中,就上述提及的索引而言,生成以qq號為索引(key),就獲得目標用戶群后,還需要分別投放時,投放時按照人群包id序列進行分別投放。比如,在線播放的場景中,根據(jù)用戶標識qq號,查找索引表獲取該用戶標識qq號所附屬的人群id列表,再從訂單號-定向人群包配對找查找符合條件的訂單,并按權重規(guī)則予以播放。由于可以根據(jù)用戶需求,自定義多種位運算自由組合,并在線(響應時間分鐘級)計算出目標用戶群,并對接投放系統(tǒng)的整個流程,因此,處理效率得到大大提高,響應時間也得到大大縮短。在本申請所提供的幾個實施例中,應該理解到,所揭露的設備和方法,可以通過其它的方式實現(xiàn)。以上所描述的設備實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,如:多個單元或組件可以結合,或可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過一些接口,設備或單元的間接耦合或通信連接,可以是電性的、機械的或其它形式的。上述作為分離部件說明的單元可以是、或也可以不是物理上分開的,作為單元顯示的部件可以是、或也可以不是物理單元,即可以位于一個地方,也可以分布到多個網絡單元上;可以根據(jù)實際的需要選擇其中的部分或全部單元來實現(xiàn)本實施例方案的目的。另外,在本發(fā)明各實施例中的各功能單元可以全部集成在一個處理單元中,也可以是各單元分別單獨作為一個單元,也可以兩個或兩個以上單元集成在一個單元中;上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。本領域普通技術人員可以理解:實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質包括:移動存儲設備、只讀存儲器(rom,read-onlymemory)、隨機存取存儲器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質?;蛘?,本發(fā)明上述集成的單元如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質中?;谶@樣的理解,本發(fā)明實施例的技術方案本質上或者說對現(xiàn)有技術做出貢獻的部分可以以軟件產品的形式體現(xiàn)出來,該計算機軟件產品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機、服務器、或者網絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分。而前述的存儲介質包括:移動存儲設備、rom、ram、磁碟或者光盤等各種可以存儲程序代碼的介質。以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本
技術領域
的技術人員在本發(fā)明揭露的技術范圍內,可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內。因此,本發(fā)明的保護范圍應以所述權利要求的保護范圍為準。當前第1頁12
當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1