亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于自然語言分析技術的信息推送系統(tǒng)的制作方法

文檔序號:11155239閱讀:834來源:國知局
一種基于自然語言分析技術的信息推送系統(tǒng)的制造方法與工藝

本發(fā)明涉及推薦引擎領域,尤其涉及一種基于自然語言分析技術的信息推送系統(tǒng)。



背景技術:

當今社會,每天生產(chǎn)大量的新聞資訊內(nèi)容,并設置相對獨特的原創(chuàng)圖文、視頻欄目,新聞編輯團隊從中篩選出相對優(yōu)質(zhì)、熱門的資訊內(nèi)容推送給用戶,或者,聚合第三方新聞平臺的資源,根據(jù)用戶的閱讀行為記錄來推送給用戶個性化資訊內(nèi)容,前者的推送方式缺點在于,推送規(guī)則單一,將優(yōu)質(zhì)、熱門的資訊內(nèi)容推送給每一個人必然是不能貼合用戶需求的;后者的推送方式缺點在于,聚合第三方新聞平臺的資源,聚合成本較高,且用戶的閱讀習慣受到該第三方新聞平臺的限制,無法深入挖掘用戶潛在興趣。

互聯(lián)網(wǎng)上各種信息摻雜,且更新速度非??欤枰度氪罅康娜肆磉M行編輯和篩選工作,運營成本非常高;對用戶的閱讀興趣分析不夠精準,推送給用戶的資訊內(nèi)容沒有和用戶需求相貼合,長此以往會導致用戶閱讀興趣下降,用戶量減少。



技術實現(xiàn)要素:

為克服現(xiàn)有技術的不足,本發(fā)明的目的是:提供一種基于自然語言分析技術的信息推送系統(tǒng),通過算法對文章進行熱度分析,在內(nèi)容編選方面減少人工干預,對個性化推薦效果進行自我修正,提高推薦結果的準確度。

為了解決背景技術中的技術問題,本發(fā)明提供了一種基于自然語言分析技術的信息推送系統(tǒng),包括以下模塊:

數(shù)據(jù)整合模塊,用于對全網(wǎng)資訊信息進行24小時不間斷采集;

數(shù)據(jù)存儲模塊,用于將所述數(shù)據(jù)整合模塊采集的資訊信息存儲到數(shù)據(jù)庫;

數(shù)據(jù)處理模塊,用于對采集入庫的數(shù)據(jù)進行正文抽取、聚類、去雜質(zhì)、排版優(yōu)化,并進行熱度分析,組成專題;

用戶畫像模型,通過用戶在客戶端的行為和操作,建立起用戶區(qū)分度模型,學習了解用戶的閱讀興趣信息,進而對用戶的閱讀偏好進行預測;

信息推送模塊,用于根據(jù)用戶的閱讀偏好,與數(shù)據(jù)庫中的資訊內(nèi)容進行智能化匹配,并將匹配中的信息推送給用戶。

進一步地,所述用戶畫像模型還包括修正單元,用于跟進用戶喜好的變化,修正用戶的閱讀偏好結果。

具體地,所述數(shù)據(jù)處理模塊通過自然語言語義分類技術與關鍵詞配置規(guī)則的結合,實現(xiàn)對信息的細化分析并分類。

本發(fā)明的基于自然語言分析技術的信息推送系統(tǒng)還包括接口模塊,所述接口模塊包括管理數(shù)據(jù)接口單元、應用系統(tǒng)數(shù)據(jù)接口單元和索引數(shù)據(jù)接口單元。

采用上述技術方案,本發(fā)明的基于自然語言分析技術的信息推送系統(tǒng)以資訊聚合客戶端為載體,在整合優(yōu)化全網(wǎng)資訊文章的基礎上,通過算法語義分析,對文章進行正文抽取、聚類、去雜質(zhì)、排版優(yōu)化,并對文章熱度進行分析,同時根據(jù)用戶閱讀行為建立每個用戶的個人畫像,然后針對不同用戶畫像里的興趣、地域、收入等個人信息,建立起用戶個性化推薦模型,再通過大數(shù)據(jù)、人工智能等手段,在盡可能短的時間內(nèi)學習了解用戶的興趣偏好,并對用戶的閱讀喜好進行預測,最終有針對性的推送出與用戶閱讀偏好相匹配的的優(yōu)質(zhì)資訊信息。從而達到既大大減少人力成本,又能根據(jù)用戶需求來推送資訊信息的目的。

附圖說明

為了更清楚地說明本發(fā)明的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其它附圖。

圖1是本發(fā)明實施例提供的基于自然語言分析技術的信息推送系統(tǒng)的系統(tǒng)框圖。

具體實施方式

下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。

實施例:圖1是本發(fā)明實施例提供的基于自然語言分析技術的信息推送系統(tǒng)的系統(tǒng)框圖,從圖中可以看出,所述基于自然語言分析技術的信息推送系統(tǒng)包括以下模塊:

數(shù)據(jù)整合模塊,用于對全網(wǎng)資訊信息進行24小時不間斷采集;

數(shù)據(jù)存儲模塊,用于將所述數(shù)據(jù)整合模塊采集的資訊信息存儲到數(shù)據(jù)庫;

數(shù)據(jù)處理模塊,用于對采集入庫的數(shù)據(jù)進行正文抽取、聚類、去雜質(zhì)、排版優(yōu)化,并進行熱度分析,組成專題;

用戶畫像模型,通過用戶在客戶端的行為和操作,建立起用戶區(qū)分度模型,學習了解用戶的閱讀興趣信息,進而對用戶的閱讀偏好進行預測;

信息推送模塊,用于根據(jù)用戶的閱讀偏好,與數(shù)據(jù)庫中的資訊內(nèi)容進行智能化匹配,并將匹配中的信息推送給用戶。

進一步地,所述用戶畫像模型還包括修正單元,用于跟進用戶喜好的變化,修正用戶的閱讀偏好結果。

具體地,所述數(shù)據(jù)處理模塊通過自然語言語義分類技術與關鍵詞配置規(guī)則的結合,實現(xiàn)對信息的細化分析并分類。

本實施例提供的基于自然語言分析技術的信息推送系統(tǒng)還包括接口模塊,所述接口模塊包括管理數(shù)據(jù)接口單元、應用系統(tǒng)數(shù)據(jù)接口單元和索引數(shù)據(jù)接口單元。

本發(fā)明涉及一種基于自然語言智能分析處理的推薦引擎技術。首先,數(shù)據(jù)后臺會24小時不間斷采集全網(wǎng)數(shù)據(jù),并對采來的數(shù)據(jù)進行正文抽取、聚類、去雜質(zhì)、排版優(yōu)化、熱度分析等智能分析處理,經(jīng)過優(yōu)化處理后的數(shù)據(jù)會進入備用內(nèi)容庫。當用戶打開客戶端后,后臺會根據(jù)用戶的一系列閱讀行為和操作建立起不同的用戶畫像,并持續(xù)進行自我修正:本發(fā)明以最短的學習時間,對用戶的閱讀偏好進行學習預測,并會持續(xù)的對用戶行為進行分析,及時跟進用戶喜好的變化,提高資訊推薦的準確程度,最終根據(jù)用戶畫像中記錄的用戶信息來從內(nèi)容庫中匹配用戶可能感興趣的資訊信息,有針對性的推送給用戶。

本發(fā)明針對現(xiàn)有的人工編輯推薦運營成本大以及個性化推薦質(zhì)量不高的問題,在整合全網(wǎng)資訊內(nèi)容的基礎上,通過算法語義分析,對文章進行正文抽取、聚類、去雜質(zhì)、排版優(yōu)化,并對文章熱度進行分析,組建專題,無需像現(xiàn)在的媒體那樣安排大量編輯對內(nèi)容進行人工編選,既保證了內(nèi)容的質(zhì)量,又減少了人工運營成本,然后再將算法處理過的文章與大數(shù)據(jù)分析得出的用戶閱讀偏好相匹配,推送給用戶感興趣的文章。

以上所揭露的僅為本發(fā)明的幾種較佳實施例而已,當然不能以此來限定本發(fā)明之權利范圍,因此依本發(fā)明權利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1