本發(fā)明涉及大數(shù)據(jù)、人工智能、機器學習,特別涉及一種基于深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng)及方法。
背景技術:
近年來,社交網(wǎng)絡迅速發(fā)展,用戶人數(shù)呈爆炸式增長。通過社交網(wǎng)絡服務,人們除了進行社交行為,則更多的是將社交網(wǎng)絡當成公共的媒體平臺,滿足社交需求和特定興趣獲取需求。對于用戶的專業(yè)信息及特定興趣獲取需求,而當前社交網(wǎng)絡產品則不能很好的滿足該需求,各類用戶發(fā)表的信息混雜在一起,用戶需要自己去甄別其中自己感興趣的信息。如果對社交網(wǎng)絡特定領域中信息走向及分布特點進行深度學習提取特征,則更有利于獲取用戶的信息特征。
目前用戶畫像主要通過統(tǒng)計的方式來實現(xiàn),這種方式往往忽略了用戶的一些隱含的一些信息。通過深度學習的方式來學習用戶畫像,可以對特征進行抽象提煉,特征表示更簡潔更精準,也能提取到更深層次的隱含信息。
技術實現(xiàn)要素:
本發(fā)明公開一種基于深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng),其中包括:意圖識別模塊,用于根據(jù)接收的語句識別用戶的使用功能;特征向量提取模塊,用于通過深度學習對輸入語句文本的上下文關系進行建模,提取到用戶使用功能的特征信息;以及用戶畫像學習模塊,用于通過特征信息和監(jiān)督信息迭代訓練,來不斷更新用戶畫像。
優(yōu)選的,還包括語句接收模塊,用于接收用戶輸入的語句。
優(yōu)選的,用戶輸入的語句包含有做非結構化數(shù)據(jù)處理的語句以及可轉為結構化數(shù)據(jù)的語句。
優(yōu)選的,所述非結構化數(shù)據(jù)是指用戶輸入的語句文本。
優(yōu)選的,所述結構化數(shù)據(jù)是指把輸入語句轉化為實體和關系后的數(shù)據(jù)。
優(yōu)選的,所述識別用戶的使用功能中包含有多個功能。
本發(fā)明還公開了一種基于深度神經網(wǎng)絡的用戶畫像表示學習方法,其中包。括:識別用戶的使用功能;提取使用功能的特征信息;以及通過特征信息和監(jiān)督信息迭代訓練,來不斷更新用戶畫像。
優(yōu)選的,還包括接收用戶輸入的語句。
優(yōu)選的,用戶輸入的語句包含做非結構化數(shù)據(jù)處理的語句以及可轉為結構化數(shù)據(jù)的語句。
優(yōu)選的,所述非結構化數(shù)據(jù)是指用戶輸入的語句文本。
優(yōu)選的,所述結構化數(shù)據(jù)是指把輸入語句轉化為實體和關系后的數(shù)據(jù)。
優(yōu)選的,更新用戶畫像時要結合監(jiān)督信息。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明的實施例基于深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng)的模塊圖;
圖2是本發(fā)明的實施例基于深度神經網(wǎng)絡的用戶畫像表示學習的方法流程圖。
具體實施例
下面結合附圖和具體實施例對本發(fā)明的技術方案作進一步更詳細的描述。顯然,所描述的實施例僅僅是本發(fā)明的一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都應屬于本發(fā)明保護的范圍。
如圖1所示為根據(jù)本發(fā)明的實施例基于深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng)的模塊圖100。如圖1所示,用戶畫像表示學習系統(tǒng)100中包括有語句接收模塊101、意圖識別模塊102、特征向量提取模塊103以及用戶畫像學習模塊104。其中語句接收模塊用于接收用戶輸入的語句,接收到用戶的語句后發(fā)送至意圖識別模塊102,意圖識別模塊102用于根據(jù)用戶的語句識別用戶想要使用的功能,比如用戶希望閑聊、點播或是調教等等功能,可以是眾多功能中的一個或者多個。針對每一種不同的功能需求,可以按結構化數(shù)據(jù)和非結構化數(shù)據(jù)進行區(qū)分。具體地,結構化數(shù)據(jù)是指把輸入語句轉化為實體和關系后的數(shù)據(jù)。而比如閑聊輸入的語句,調教的語句可以作為非結構化數(shù)據(jù),點播輸入的語句數(shù)據(jù)可以提取出對應的點播實體。其中用戶輸入的語句包含有做非結構化數(shù)據(jù)處理的語句以及可轉為結構化數(shù)據(jù)的語句。
在一個實施例中,用戶輸入的語句文本設定為非結構化數(shù)據(jù)。當意圖識別模塊102獲取到用戶想要使用的功能后,特征向量提取模塊103根據(jù)非結構化數(shù)據(jù),通過深度學習對輸入語句文本的上下文關系進行建模,提取到用戶使用功能的特征信息值。在獲取到特征信息值后,用戶畫像學習模塊104通過特征信息和監(jiān)督信息迭代訓練,來不斷更新用戶畫像。而對于結構化數(shù)據(jù),使用深度學習對實體之間的關系進行建模,再通過少量監(jiān)督信息更新用戶畫像,最終獲取高質量的用戶畫像。具體地,結構化數(shù)據(jù)是指把輸入語句轉化為實體和關系后的數(shù)據(jù)。
圖2是本發(fā)明的實施例基于深度神經網(wǎng)絡的用戶畫像表示學習的方法流程圖。圖2將結合圖1進行描述。如圖2所示,步驟S201,用戶輸入語句文本;根據(jù)用于輸入的語句文本判斷用戶的意圖。步驟S202,獲取到用戶的意圖信息,比如用戶輸入的是閑聊語句、點播語句或者調教語句等。對獲取到的用戶意圖信息進行特征提取,主要是通過深度學習提取特征向量。步驟S203,提取到用戶意圖信息的特征向量,比如閑聊向量、點播向量或者調教向量等等。步驟S204,用戶畫像更新,通過特征信息和監(jiān)督信息迭代訓練,來不斷更新用戶畫像。
圖2中所示以三種意圖判斷為實施例來描述本發(fā)明,但應該理解的是本發(fā)明并不局限于這三種意圖的輸入(即閑聊意圖、點播意圖或調教意圖),也可以是其他類型的意圖輸入。
在一個實施例中,用戶輸入的語句文本設定為非結構化數(shù)據(jù)。獲取到用戶想要使用的功能后,根據(jù)非結構化數(shù)據(jù),通過深度學習對輸入語句文本的上下文關系進行建模,提取到用戶使用功能的特征信息。在獲取到特征信息值后,結合少量的監(jiān)督信息,更新用戶畫像。而對于結構化數(shù)據(jù),使用深度學習對實體之間的關系進行建模,再通過少量監(jiān)督信息更新用戶畫像,最終獲取高質量的用戶畫像。具體地,結構化數(shù)據(jù)是指把輸入語句轉化為實體和關系后的數(shù)據(jù)。
綜上所述,本發(fā)明提出了一種深度神經網(wǎng)絡的用戶畫像表示學習系統(tǒng)及方法,通過分析用戶的特征,更新用戶畫像,從而獲取高質量的用戶畫像。
顯然,本領域的技術人員應該理解,上述的本發(fā)明的各模塊或各步驟可以用通用的計算系統(tǒng)來實現(xiàn),它們可以集中在單個的計算系統(tǒng)上,或者分布在多個計算系統(tǒng)所組成的網(wǎng)絡上,可選地,它們可以用計算系統(tǒng)可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲系統(tǒng)中由計算系統(tǒng)來執(zhí)行。這樣,本發(fā)明不限制于任何特定的硬件和軟件結合。
以上所揭露的僅為本發(fā)明實施例中的較佳實施例而已,當然不能以此來限定本發(fā)明之權利范圍,因此依本發(fā)明權利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。