亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種信息推薦方法和裝置與流程

文檔序號:11514915閱讀:270來源:國知局
一種信息推薦方法和裝置與流程

本公開一般涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及瀏覽器技術(shù)領(lǐng)域,尤其涉及一種信息推薦方法和裝置。



背景技術(shù):

在當(dāng)今的網(wǎng)絡(luò)信息時代,網(wǎng)絡(luò)上的信息量非常巨大,用戶在上網(wǎng)時可以大致分為兩種行為:寬泛地瀏覽網(wǎng)頁信息(簡稱為泛閱讀)與精準(zhǔn)地搜索引擎檢索。目前針對第一種情況,用戶往往會關(guān)注一些平時感興趣的內(nèi)容,比如xx網(wǎng)站,通過訂閱它的rss(reallysimplesyndication,簡易信息聚合,也叫聚合內(nèi)容)來獲取摘要信息。目前已有很多rss集成的閱讀軟件,方便用戶集中瀏覽。

但是,通過訂閱rss來獲取用戶感興趣的內(nèi)容往往存在以下缺陷:

訂閱的rss的信息量過大,遠遠超出了用戶的閱讀量,使得用戶閱讀時可能遺漏最感興趣的內(nèi)容,且耗費不少時間,泛閱讀的質(zhì)量不高。



技術(shù)實現(xiàn)要素:

鑒于現(xiàn)有技術(shù)中的上述缺陷或不足,期望提供一種能夠有效提高泛閱讀質(zhì)量的方案。

第一方面,本申請實施例提供了一種信息推薦方法,包括:

獲取用戶訂閱的rss;

對所述rss進行解析,確定rss中每條源數(shù)據(jù)的關(guān)鍵信息;

根據(jù)所述rss中每條源數(shù)據(jù)的關(guān)鍵信息,從所述rss中篩選滿足預(yù)設(shè)條件的源數(shù)據(jù);

將篩選出的源數(shù)據(jù)以信息流的形式推薦給所述用戶。

第二方面,本申請實施例還提供了一種信息推薦裝置,包括:

獲取單元,用于獲取用戶訂閱的rss;

解析單元,用于對所述rss進行解析,確定rss中每條源數(shù)據(jù)的關(guān)鍵信息;

篩選單元,用于根據(jù)所述rss中每條源數(shù)據(jù)的關(guān)鍵信息,從所述rss中篩選滿足預(yù)設(shè)條件的源數(shù)據(jù);以及

推薦單元,用于將篩選出的源數(shù)據(jù)以信息流的形式推薦給所述用戶。

第三方面,本申請實施例還提供了一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述信息推薦方法。

本申請實施例提供的信息推薦方案,通過對用戶訂閱的rss進行解析,確定rss中每條源數(shù)據(jù)的關(guān)鍵信息,根據(jù)該關(guān)鍵信息,從rss中篩選出滿足預(yù)設(shè)條件的源數(shù)據(jù),并以信息流的形式推薦給用戶,使得用戶可以快捷的獲取最感興趣的內(nèi)容,泛閱讀的質(zhì)量得以提升,同時也提高了用戶的使用體驗。

附圖說明

通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優(yōu)點將會變得更明顯:

圖1示出了其中可以應(yīng)用本申請實施例的示例性系統(tǒng)架構(gòu);

圖2示出了根據(jù)本申請實施例的信息推薦方法的示例性流程圖;

圖3a示出了一個現(xiàn)有技術(shù)中的feed流的頁面截圖;

圖3b示出了本申請實施例的加入rss中源數(shù)據(jù)的feed流的頁面截圖;

圖4示出了根據(jù)本申請一個實施例的信息推薦裝置的示例性結(jié)構(gòu)框圖;以及

圖5示出了適于用來實現(xiàn)本申請實施例的服務(wù)器的計算機系統(tǒng)的結(jié)構(gòu)示意圖。

具體實施方式

下面結(jié)合附圖和實施例對本申請作進一步的詳細說明??梢岳斫獾氖牵颂幩枋龅木唧w實施例僅僅用于解釋相關(guān)發(fā)明,而非對該發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與發(fā)明相關(guān)的部分。

需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結(jié)合實施例來詳細說明本申請。

請參考圖1,其示出了可以應(yīng)用本申請實施例的示例性系統(tǒng)架構(gòu)100。

如圖1所示,系統(tǒng)架構(gòu)100可以包括終端設(shè)備101、102、網(wǎng)絡(luò)103和服務(wù)器104、105、106和107。網(wǎng)絡(luò)103用以在終端設(shè)備101、102和服務(wù)器104、105、106、107之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)103可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。

用戶110可以使用終端設(shè)備101、102通過網(wǎng)絡(luò)103與服務(wù)器104、105、106、107交互,以訪問各種服務(wù),例如瀏覽網(wǎng)頁、下載數(shù)據(jù)等。終端設(shè)備101、102上可以安裝有各種客戶端應(yīng)用,例如可以接入統(tǒng)一資源定位符url云服務(wù)的應(yīng)用,包括但不限于瀏覽器、安全應(yīng)用等。

終端設(shè)備101、102可以是各種電子設(shè)備,包括但不限于個人電腦、智能手機、智能電視、平板電腦、個人數(shù)字助理、電子書閱讀器等等。

服務(wù)器104、105、106、107可以是提供各種服務(wù)的服務(wù)器。服務(wù)器可以響應(yīng)于用戶的服務(wù)請求而提供服務(wù)。可以理解,一個服務(wù)器可以提供一種或多種服務(wù),同一種服務(wù)也可以由多個服務(wù)器來提供。在本申請的實施例中,所涉及的服務(wù)器可以包括但不限于,網(wǎng)頁服務(wù)器、搜索引擎服務(wù)器等。

應(yīng)該理解,圖1中的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器的數(shù)目僅僅是示意性的。根據(jù)實現(xiàn)需要,可以具有任意數(shù)目的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器。

如背景技術(shù)中所提到的,現(xiàn)有技術(shù)通過訂閱rss來獲取用戶感興趣的內(nèi)容時,由于訂閱的rss的信息量過大,遠遠超出了用戶的閱讀量,使得用戶閱讀時可能遺漏最感興趣的內(nèi)容,且耗費不少時間,泛閱讀的質(zhì)量不高。

鑒于現(xiàn)有技術(shù)的上述缺陷,本申請實施例提供了一種基于rss的信息推薦方案。該方案通過對用戶訂閱的rss進行解析,確定rss中每條源數(shù)據(jù)的關(guān)鍵信息,根據(jù)該關(guān)鍵信息,從rss中篩選出滿足預(yù)設(shè)條件的源數(shù)據(jù),并以信息流的形式推薦給用戶,使得用戶可以快捷的獲取最感興趣的內(nèi)容,泛閱讀的質(zhì)量得以提升。

下面將結(jié)合流程圖來描述本申請實施例的方法。

參考圖2,其示出了根據(jù)本申請一個實施例的用于檢測惡意網(wǎng)址的方法的示例性流程圖。圖2所示的方法可以在圖1中的服務(wù)器端執(zhí)行。如圖2所示,包括如下步驟:

步驟210,獲取用戶訂閱的rss。

步驟220,對rss進行解析,確定rss中每條源數(shù)據(jù)的關(guān)鍵信息。

其中,關(guān)鍵信息可以但不限于包括:數(shù)據(jù)來源和/或關(guān)鍵詞。

具體的,步驟220可以按照如下方式實現(xiàn):

首先獲取rss名稱和rss鏈接;

將rss名稱確定為rss中每條源數(shù)據(jù)的數(shù)據(jù)來源;

再對rss鏈接進行爬取,確定rss中每條源數(shù)據(jù)的標(biāo)題和鏈接;

進一步的,再對rss中每條源數(shù)據(jù)的鏈接進行解析,提取rss中每條源數(shù)據(jù)的正文內(nèi)容;

對rss中每條源數(shù)據(jù)的標(biāo)題和正文內(nèi)容進行分析,得到rss中每條源數(shù)據(jù)的關(guān)鍵詞。其中,該關(guān)鍵詞可以是標(biāo)題和正文內(nèi)容中的高頻詞匯。

步驟230,根據(jù)rss中每條源數(shù)據(jù)的關(guān)鍵信息,從rss中篩選滿足預(yù)設(shè)條件的源數(shù)據(jù)。

具體的,當(dāng)關(guān)鍵信息為一種時,將rss中每條源數(shù)據(jù)的關(guān)鍵信息與預(yù)先存儲的用戶偏好信息進行匹配,并篩選出匹配度高于第一閾值的源數(shù)據(jù)。

此時,當(dāng)關(guān)鍵信息為數(shù)據(jù)來源時,預(yù)先存儲的用戶偏好信息為用戶偏好數(shù)據(jù)來源;當(dāng)關(guān)鍵信息為關(guān)鍵詞時,預(yù)先存儲的用戶偏好信息為用戶偏好關(guān)鍵詞。

當(dāng)關(guān)鍵信息為至少兩種時,根據(jù)預(yù)先針對每種關(guān)鍵信息設(shè)置的權(quán)重值,將rss中每條源數(shù)據(jù)的關(guān)鍵信息分別與預(yù)先存儲的、和自身對應(yīng)的用戶偏好信息進行匹配,并篩選出匹配度高于第二閾值的源數(shù)據(jù)。

此時,當(dāng)關(guān)鍵信息為數(shù)據(jù)來源和關(guān)鍵詞時,預(yù)先存儲的用戶偏好信息為用戶偏好數(shù)據(jù)來源和用戶偏好關(guān)鍵詞,且源數(shù)據(jù)的數(shù)據(jù)來源與用戶偏好數(shù)據(jù)來源對應(yīng),源數(shù)據(jù)的關(guān)鍵詞與用戶偏好關(guān)鍵詞對應(yīng)。在進行匹配時,源數(shù)據(jù)的數(shù)據(jù)來源與用戶偏好數(shù)據(jù)來源進行匹配,得到數(shù)據(jù)來源匹配度,源數(shù)據(jù)的關(guān)鍵詞與用戶偏好關(guān)鍵詞進行匹配,得到關(guān)鍵詞匹配度,最后再根據(jù)預(yù)先針對每種關(guān)鍵信息設(shè)置的權(quán)重值計算出總匹配度。

另外,本申請實施例中的用戶偏好信息可以按照如下方式確定:

首先根據(jù)預(yù)先設(shè)置的獲取周期,獲取用戶的歷史瀏覽數(shù)據(jù)和點擊行為數(shù)據(jù);

再根據(jù)用戶的歷史瀏覽數(shù)據(jù)和點擊行為數(shù)據(jù),確定用戶偏好信息并存儲。

步驟240,將篩選出的源數(shù)據(jù)以信息流的形式推薦給用戶。

在現(xiàn)有技術(shù)中,眾多新聞類app也以信息流(比如feed流)的形式向用戶提供資訊以供用戶進行泛閱讀,其中,feed流指的是單條feed數(shù)據(jù)的信息集合,feed數(shù)據(jù)是對信息的概括展示,它可以使用不同的模塊,比如三圖、左文右圖、純文本和大圖等。用戶可以通過點擊feed數(shù)據(jù)進入到該feed數(shù)據(jù)的落地頁,即詳細信息展示頁面。

因此,本申請實施例中,對篩選出的源數(shù)據(jù)以信息流的形式推薦給用戶時,可以將篩選出的源數(shù)據(jù)和待推薦的非rss源數(shù)據(jù)(比如feed數(shù)據(jù))同時以feed流的形式推薦給用戶。

具體實現(xiàn)方式可以但不限于按照如下方式實現(xiàn):

1、對篩選出的源數(shù)據(jù)和待推薦的非rss源數(shù)據(jù)進行優(yōu)先級排序;

具體的,首先,基于預(yù)先訓(xùn)練得到的用于預(yù)測點擊率的機器學(xué)習(xí)模型,對篩選出的源數(shù)據(jù)的特征信息和非rss源數(shù)據(jù)的特征信息進行學(xué)習(xí),預(yù)測出篩選出的源數(shù)據(jù)和所述非rss源數(shù)據(jù)的點擊率;

其中,特征信息可以為:用戶id、用戶瀏覽時間段、以及通過用戶id衍生出的屬性,比如用戶畫像中的人群屬性等等。除此之外,篩選出的源數(shù)據(jù)的特征信息還可以包括上述確定出的關(guān)鍵信息。

其次,按照點擊率降序排列的原則,對篩選出的源數(shù)據(jù)和非rss源數(shù)據(jù)進行優(yōu)先級排序;其中,點擊率的高低與優(yōu)先級的高低成正比。也就是說,點擊率越高,優(yōu)先級越高,點擊率越低,優(yōu)先級越低。

2、按照優(yōu)先級從高到低的順序,將篩選出的源數(shù)據(jù)和非rss源數(shù)據(jù)推薦給用戶。

另外,推薦給用戶后,篩選出的源數(shù)據(jù)可以但不限于按照“標(biāo)題+圖片+數(shù)據(jù)來源”的形式進行展示,當(dāng)用戶點擊該源數(shù)據(jù)時,即進入到該源數(shù)據(jù)的落地頁,包括標(biāo)題、正文內(nèi)容和圖片。其中,圖片可以是在對rss中的數(shù)據(jù)源的鏈接進行進一步解析時提取到的。

應(yīng)當(dāng)注意,盡管在附圖中以特定順序描述了本發(fā)明方法的操作,但是,這并非要求或者暗示必須按照該特定順序來執(zhí)行這些操作,或是必須執(zhí)行全部所示的操作才能實現(xiàn)期望的結(jié)果。相反,流程圖中描繪的步驟可以改變執(zhí)行順序。附加地或備選地,可以省略某些步驟,將多個步驟合并為一個步驟執(zhí)行,和/或?qū)⒁粋€步驟分解為多個步驟執(zhí)行。

圖3a示出了一個現(xiàn)有技術(shù)中的feed流的頁面截圖,圖3b示出了本申請實施例中加入rss源數(shù)據(jù)的feed流的頁面截圖,其中,黑框中的新聞即為新加入的rss源數(shù)據(jù)。

進一步參考圖4,其示出了根據(jù)本申請一個實施例的信息推薦裝置的示例性結(jié)構(gòu)框圖。

獲取單元410,用于獲取用戶訂閱的rss;

解析單元420,用于對所述rss進行解析,確定rss中每條源數(shù)據(jù)的關(guān)鍵信息;

篩選單元430,用于根據(jù)所述rss中每條源數(shù)據(jù)的關(guān)鍵信息,從所述rss中篩選滿足預(yù)設(shè)條件的源數(shù)據(jù);以及

推薦單元440,用于將篩選出的源數(shù)據(jù)以信息流的形式推薦給所述用戶。

可選的,所述關(guān)鍵信息包括:數(shù)據(jù)來源和/或關(guān)鍵詞;

所述解析單元420包括:

獲取模塊421,用于獲取rss名稱和rss鏈接;

數(shù)據(jù)來源確定模塊422,用于將所述rss名稱確定為所述rss中每條源數(shù)據(jù)的數(shù)據(jù)來源;

關(guān)鍵詞確定模塊423,用于對所述rss鏈接進行爬取,確定所述rss中每條源數(shù)據(jù)的標(biāo)題和鏈接;對所述rss中每條源數(shù)據(jù)的鏈接進行解析,提取所述rss中每條源數(shù)據(jù)的正文內(nèi)容;對所述rss中每條源數(shù)據(jù)的標(biāo)題和正文內(nèi)容進行分析,得到所述rss中每條源數(shù)據(jù)的關(guān)鍵詞。

可選的,所述篩選單元430,用于:

當(dāng)所述關(guān)鍵信息為一種時,將所述rss中每條源數(shù)據(jù)的關(guān)鍵信息與預(yù)先存儲的用戶偏好信息進行匹配,并篩選出匹配度高于第一閾值的源數(shù)據(jù);

當(dāng)所述關(guān)鍵信息為至少兩種時,根據(jù)預(yù)先針對每種關(guān)鍵信息設(shè)置的權(quán)重值,將所述rss中每條源數(shù)據(jù)的關(guān)鍵信息分別與預(yù)先存儲的、和自身對應(yīng)的用戶偏好信息進行匹配,并篩選出匹配度高于第二閾值的源數(shù)據(jù)。

可選的,所述裝置還包括:

用戶偏好信息確定單元450,用于根據(jù)預(yù)先設(shè)置的獲取周期,獲取用戶的歷史瀏覽數(shù)據(jù)和點擊行為數(shù)據(jù);以及根據(jù)所述歷史瀏覽數(shù)據(jù)和點擊行為數(shù)據(jù),確定用戶偏好信息并存儲。

可選的,所述推薦單元440,包括:

排序模塊441,用于對篩選出的源數(shù)據(jù)和待推薦的非rss源數(shù)據(jù)進行優(yōu)先級排序;

推薦模塊442,用于按照優(yōu)先級從高到低的順序,將所述篩選出的源數(shù)據(jù)和所述非rss源數(shù)據(jù)推薦給所述用戶。

其中,所述排序模塊441,用于:

基于預(yù)先訓(xùn)練得到的用于預(yù)測點擊率的機器學(xué)習(xí)模型,對所述篩選出的源數(shù)據(jù)的特征信息和所述非rss源數(shù)據(jù)的特征信息進行學(xué)習(xí),預(yù)測出所述篩選出的源數(shù)據(jù)和所述非rss源數(shù)據(jù)的點擊率;

按照點擊率降序排列的原則,對所述篩選出的源數(shù)據(jù)和所述非rss源數(shù)據(jù)進行優(yōu)先級排序;其中,點擊率的高低與優(yōu)先級的高低成正比。

應(yīng)當(dāng)理解,系統(tǒng)400中記載的諸子系統(tǒng)或單元與參考圖2描述的方法中的各個步驟相對應(yīng)。由此,上文針對方法描述的操作和特征同樣適用于系統(tǒng)400及其中包含的單元,在此不再贅述。

下面參考圖5,其示出了適于用來實現(xiàn)本申請實施例的服務(wù)器的計算機系統(tǒng)500的結(jié)構(gòu)示意圖。

如圖5所示,計算機系統(tǒng)500包括中央處理單元(cpu)501,其可以根據(jù)存儲在只讀存儲器(rom)502中的程序或者從存儲部分508加載到隨機訪問存儲器(ram)503中的程序而執(zhí)行各種適當(dāng)?shù)膭幼骱吞幚?。在ram503中,還存儲有系統(tǒng)500操作所需的各種程序和數(shù)據(jù)。cpu501、rom502以及ram503通過總線504彼此相連。輸入/輸出(i/o)接口505也連接至總線504。

以下部件連接至i/o接口505:包括鍵盤、鼠標(biāo)等的輸入部分506;包括諸如陰極射線管(crt)、液晶顯示器(lcd)等以及揚聲器等的輸出部分507;包括硬盤等的存儲部分508;以及包括諸如lan卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分509。通信部分509經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動器510也根據(jù)需要連接至i/o接口505。可拆卸介質(zhì)511,諸如磁盤、光盤、磁光盤、半導(dǎo)體存儲器等等,根據(jù)需要安裝在驅(qū)動器510上,以便于從其上讀出的計算機程序根據(jù)需要被安裝入存儲部分508。

特別地,根據(jù)本公開的實施例,上文參考圖2描述的過程可以被實現(xiàn)為計算機軟件程序。例如,本公開的實施例包括一種計算機程序產(chǎn)品,其包括有形地包含在機器可讀介質(zhì)上的計算機程序,所述計算機程序包含用于執(zhí)行圖2的方法的程序代碼。在這樣的實施例中,該計算機程序可以通過通信部分509從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)511被安裝。

附圖中的流程圖和框圖,圖示了按照本發(fā)明各種實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。

描述于本申請實施例中所涉及到的單元或模塊可以通過軟件的方式實現(xiàn),也可以通過硬件的方式來實現(xiàn)。所描述的單元或模塊也可以設(shè)置在處理器中。這些單元或模塊的名稱在某種情況下并不構(gòu)成對該單元或模塊本身的限定。

作為另一方面,本申請還提供了一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)可以是上述實施例中所述裝置中所包含的計算機可讀存儲介質(zhì);也可以是單獨存在,未裝配入設(shè)備中的計算機可讀存儲介質(zhì)。計算機可讀存儲介質(zhì)存儲有一個或者一個以上程序,所述程序被一個或者一個以上的處理器用來執(zhí)行描述于本申請的公式輸入方法。

以上描述僅為本申請的較佳實施例以及對所運用技術(shù)原理的說明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時也應(yīng)涵蓋在不脫離所述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術(shù)特征進行互相替換而形成的技術(shù)方案。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1