一種基于深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng)及方法與流程

文檔序號：12185370閱讀：3848來源：國知局

本發(fā)明涉及大數(shù)據(jù)、人工智能、機器學習，特別涉及一種基于深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng)及方法。

背景技術：

近年來，社交網(wǎng)絡迅速發(fā)展，用戶人數(shù)呈爆炸式增長。通過社交網(wǎng)絡服務，人們除了進行社交行為，則更多的是將社交網(wǎng)絡當成公共的媒體平臺，滿足社交需求和特定興趣獲取需求。對于用戶的專業(yè)信息及特定興趣獲取需求，而當前社交網(wǎng)絡產品則不能很好的滿足該需求，各類用戶發(fā)表的信息混雜在一起，用戶需要自己去甄別其中自己感興趣的信息。如果對社交網(wǎng)絡特定領域中信息走向及分布特點進行深度學習提取特征，則更有利于獲取用戶的信息特征。

目前用戶畫像主要通過統(tǒng)計的方式來實現(xiàn)，這種方式往往忽略了用戶的一些隱含的一些信息。通過深度學習的方式來學習用戶畫像，可以對特征進行抽象提煉，特征表示更簡潔更精準，也能提取到更深層次的隱含信息。

技術實現(xiàn)要素：

本發(fā)明公開一種基于深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng)，其中包括：意圖識別模塊，用于根據(jù)接收的語句識別用戶的使用功能；特征向量提取模塊，用于通過深度學習對輸入語句文本的上下文關系進行建模，提取到用戶使用功能的特征信息；以及用戶畫像學習模塊，用于通過特征信息和監(jiān)督信息迭代訓練，來不斷更新用戶畫像。

優(yōu)選的，還包括語句接收模塊，用于接收用戶輸入的語句。

優(yōu)選的，用戶輸入的語句包含有做非結構化數(shù)據(jù)處理的語句以及可轉為結構化數(shù)據(jù)的語句。

優(yōu)選的，所述非結構化數(shù)據(jù)是指用戶輸入的語句文本。

優(yōu)選的，所述結構化數(shù)據(jù)是指把輸入語句轉化為實體和關系后的數(shù)據(jù)。

優(yōu)選的，所述識別用戶的使用功能中包含有多個功能。

本發(fā)明還公開了一種基于深度神經網(wǎng)絡的用戶畫像表示學習方法，其中包。括：識別用戶的使用功能；提取使用功能的特征信息；以及通過特征信息和監(jiān)督信息迭代訓練，來不斷更新用戶畫像。

優(yōu)選的，還包括接收用戶輸入的語句。

優(yōu)選的，用戶輸入的語句包含做非結構化數(shù)據(jù)處理的語句以及可轉為結構化數(shù)據(jù)的語句。

優(yōu)選的，所述非結構化數(shù)據(jù)是指用戶輸入的語句文本。

優(yōu)選的，所述結構化數(shù)據(jù)是指把輸入語句轉化為實體和關系后的數(shù)據(jù)。

優(yōu)選的，更新用戶畫像時要結合監(jiān)督信息。

附圖說明

為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案，下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實施例，對于本領域普通技術人員來講，在不付出創(chuàng)造性勞動性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。

圖1是本發(fā)明的實施例基于深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng)的模塊圖；

圖2是本發(fā)明的實施例基于深度神經網(wǎng)絡的用戶畫像表示學習的方法流程圖。

具體實施例

下面結合附圖和具體實施例對本發(fā)明的技術方案作進一步更詳細的描述。顯然，所描述的實施例僅僅是本發(fā)明的一部分實施例，而不是全部的實施例?；诒景l(fā)明中的實施例，本領域普通技術人員在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實施例，都應屬于本發(fā)明保護的范圍。

如圖1所示為根據(jù)本發(fā)明的實施例基于深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng)的模塊圖100。如圖1所示，用戶畫像表示學習系統(tǒng)100中包括有語句接收模塊101、意圖識別模塊102、特征向量提取模塊103以及用戶畫像學習模塊104。其中語句接收模塊用于接收用戶輸入的語句，接收到用戶的語句后發(fā)送至意圖識別模塊102，意圖識別模塊102用于根據(jù)用戶的語句識別用戶想要使用的功能，比如用戶希望閑聊、點播或是調教等等功能，可以是眾多功能中的一個或者多個。針對每一種不同的功能需求，可以按結構化數(shù)據(jù)和非結構化數(shù)據(jù)進行區(qū)分。具體地，結構化數(shù)據(jù)是指把輸入語句轉化為實體和關系后的數(shù)據(jù)。而比如閑聊輸入的語句，調教的語句可以作為非結構化數(shù)據(jù)，點播輸入的語句數(shù)據(jù)可以提取出對應的點播實體。其中用戶輸入的語句包含有做非結構化數(shù)據(jù)處理的語句以及可轉為結構化數(shù)據(jù)的語句。

在一個實施例中，用戶輸入的語句文本設定為非結構化數(shù)據(jù)。當意圖識別模塊102獲取到用戶想要使用的功能后，特征向量提取模塊103根據(jù)非結構化數(shù)據(jù)，通過深度學習對輸入語句文本的上下文關系進行建模，提取到用戶使用功能的特征信息值。在獲取到特征信息值后，用戶畫像學習模塊104通過特征信息和監(jiān)督信息迭代訓練，來不斷更新用戶畫像。而對于結構化數(shù)據(jù)，使用深度學習對實體之間的關系進行建模，再通過少量監(jiān)督信息更新用戶畫像，最終獲取高質量的用戶畫像。具體地，結構化數(shù)據(jù)是指把輸入語句轉化為實體和關系后的數(shù)據(jù)。

圖2是本發(fā)明的實施例基于深度神經網(wǎng)絡的用戶畫像表示學習的方法流程圖。圖2將結合圖1進行描述。如圖2所示，步驟S201，用戶輸入語句文本；根據(jù)用于輸入的語句文本判斷用戶的意圖。步驟S202，獲取到用戶的意圖信息，比如用戶輸入的是閑聊語句、點播語句或者調教語句等。對獲取到的用戶意圖信息進行特征提取，主要是通過深度學習提取特征向量。步驟S203，提取到用戶意圖信息的特征向量，比如閑聊向量、點播向量或者調教向量等等。步驟S204，用戶畫像更新，通過特征信息和監(jiān)督信息迭代訓練，來不斷更新用戶畫像。

圖2中所示以三種意圖判斷為實施例來描述本發(fā)明，但應該理解的是本發(fā)明并不局限于這三種意圖的輸入(即閑聊意圖、點播意圖或調教意圖)，也可以是其他類型的意圖輸入。

在一個實施例中，用戶輸入的語句文本設定為非結構化數(shù)據(jù)。獲取到用戶想要使用的功能后，根據(jù)非結構化數(shù)據(jù)，通過深度學習對輸入語句文本的上下文關系進行建模，提取到用戶使用功能的特征信息。在獲取到特征信息值后，結合少量的監(jiān)督信息，更新用戶畫像。而對于結構化數(shù)據(jù)，使用深度學習對實體之間的關系進行建模，再通過少量監(jiān)督信息更新用戶畫像，最終獲取高質量的用戶畫像。具體地，結構化數(shù)據(jù)是指把輸入語句轉化為實體和關系后的數(shù)據(jù)。

綜上所述，本發(fā)明提出了一種深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng)及方法，通過分析用戶的特征，更新用戶畫像，從而獲取高質量的用戶畫像。

顯然，本領域的技術人員應該理解，上述的本發(fā)明的各模塊或各步驟可以用通用的計算系統(tǒng)來實現(xiàn)，它們可以集中在單個的計算系統(tǒng)上，或者分布在多個計算系統(tǒng)所組成的網(wǎng)絡上，可選地，它們可以用計算系統(tǒng)可執(zhí)行的程序代碼來實現(xiàn)，從而，可以將它們存儲在存儲系統(tǒng)中由計算系統(tǒng)來執(zhí)行。這樣，本發(fā)明不限制于任何特定的硬件和軟件結合。

以上所揭露的僅為本發(fā)明實施例中的較佳實施例而已，當然不能以此來限定本發(fā)明之權利范圍，因此依本發(fā)明權利要求所作的等同變化，仍屬本發(fā)明所涵蓋的范圍。

完整全部詳細技術資料下載

當前第1頁1 2 3

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：邱楠;楊新宇;王昊奮;
技術所有人：深圳狗尾草智能科技有限公司;
我是此專利的發(fā)明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng)及方法與流程