一種智能推薦數(shù)據(jù)的技術(shù)方法
【專利摘要】本發(fā)明主要提供了一種終端用戶能夠快速獲取信息的一種解決方法,以解決現(xiàn)有技術(shù)中用戶在運(yùn)用互聯(lián)網(wǎng)的過程中需要從眾多的信息中去搜索、尋找自己喜歡的或需要的資訊所帶來的不便。此項(xiàng)技術(shù)解決方法可以改變用戶被動(dòng)獲取信息和花時(shí)間搜索信息的模式,讓互聯(lián)網(wǎng)真正改變我們?nèi)祟惖纳盍?xí)慣。首先要使用爬蟲獲得大量的信息,然后使用提取關(guān)鍵字算法和主題算法,建立海量的信息源,其次需要構(gòu)建用戶數(shù)據(jù)模型,并根據(jù)數(shù)據(jù)模型采集用戶的瀏覽信息,點(diǎn)擊信息,智能設(shè)備的基本情況和使用行為,以及位置變化的軌跡等行為數(shù)據(jù),然后使用模型算法不停的完善用戶的特征畫像。再次當(dāng)一個(gè)用戶在使用智能設(shè)備時(shí),服務(wù)器會(huì)根據(jù)該用戶的特征畫像,判斷該用戶在該時(shí)刻需要什么信息,并給用戶推薦什么信息。
【專利說明】一種智能推薦數(shù)據(jù)的技術(shù)方法
[0001]【技術(shù)領(lǐng)域】:
本發(fā)明涉及移動(dòng)終端智能推送的技術(shù)方法,特別地涉及一種移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)量下根據(jù)用戶喜好和需求推送數(shù)據(jù)的技術(shù)實(shí)現(xiàn)方法。
[0002]【背景技術(shù)】:
隨著互聯(lián)網(wǎng)的發(fā)展,特別是智能手機(jī)的普及和移動(dòng)互聯(lián)網(wǎng)到來,使越來越多的人能夠隨時(shí)隨地的接觸到互聯(lián)網(wǎng),從多人共用一臺(tái)手機(jī),到人手一臺(tái)智能手機(jī),使連接互聯(lián)網(wǎng)的終端,越來越能體現(xiàn)一個(gè)人的特征,但是人類獲取信息的方式卻沒有太多變化,還是遵循在輸入框中輸入關(guān)鍵字,然后點(diǎn)擊查詢,然后從大量的查詢結(jié)果中找到自己想要的信息。在信息爆炸的今天這是一件很繁瑣和費(fèi)時(shí)的事情。而目前市場(chǎng)上根據(jù)用戶喜好和需求推送信息(以下簡稱智能推薦)還未有先例。
[0003]智能推薦是根據(jù)用戶的喜好和需求給用戶推送信息,不是簡單的根據(jù)某一類別推送,也不是簡單的相關(guān)類別的推薦,而是根據(jù)人的喜好和需求,如喜歡美食、愛打籃球、關(guān)注時(shí)政、愛玩游戲、經(jīng)常出差、出去旅游等等。智能推薦將達(dá)到一種效果:當(dāng)用戶想去吃飯的時(shí)候,就會(huì)得到他附近的符合他飲食習(xí)慣的餐廳;當(dāng)用戶出差時(shí),可實(shí)時(shí)提供當(dāng)?shù)氐木频?、餐飲等相關(guān)信息給客戶;同時(shí)還能夠根據(jù)用戶喜好變化而變化,如:用戶瀏覽汽車方面的信息時(shí),用戶可以看到更多汽車方面的信息,當(dāng)用戶的想看體育方面的信息時(shí),隨著用戶點(diǎn)擊的增多,體育方面的信息就會(huì)增多,而汽車方面的信息就會(huì)相應(yīng)減少,除此之外我們還會(huì)有場(chǎng)景識(shí)別等,通過場(chǎng)景識(shí)別來為客戶推送相應(yīng)的信息。
[0004]目前實(shí)現(xiàn)智能推薦的方法是:根據(jù)用戶在智能終端使用習(xí)慣和瀏覽并點(diǎn)擊信息的習(xí)慣,再通過長期屬性算法和實(shí)時(shí)熟悉算法,算出用戶的長期屬性和短期屬性,并根據(jù)這些屬性給每個(gè)用戶繪制特征畫像,根據(jù)特征畫像給用戶推送數(shù)據(jù),并且能夠根據(jù)用戶的實(shí)時(shí)屬性實(shí)時(shí)的遞增或衰減相應(yīng)的信息數(shù)據(jù)。
[0005]
【發(fā)明內(nèi)容】
:
本發(fā)明的主要目的是提供一種用戶能夠快速獲取信息的解決方法,以解決現(xiàn)有技術(shù)中用戶在運(yùn)用互聯(lián)網(wǎng)的過程中需要從眾多的信息中去搜索、尋找自己喜歡的或需要的資訊所帶來的不便。此項(xiàng)技術(shù)解決方法可以改變用戶被動(dòng)獲取信息和花時(shí)間搜索信息的模式,讓互聯(lián)網(wǎng)正在改變我們?nèi)祟惖纳盍?xí)慣。
[0006]為解決上述問題本發(fā)明提供如下技術(shù)方案:
1、要使用爬蟲獲得大量的信息,然后使用提取關(guān)鍵字算法和主題算法,建立海量的信息源。
[0007]2、構(gòu)建用戶數(shù)據(jù)模型,并根據(jù)數(shù)據(jù)模型采集用戶的瀏覽信息,點(diǎn)擊信息,智能設(shè)備的基本情況和使用行為,以及位置變化的軌跡等行為數(shù)據(jù),然后使用模型算法不停的完善用戶的特征畫像。
[0008]3、當(dāng)一個(gè)用戶在使用智能設(shè)備時(shí),服務(wù)器會(huì)根據(jù)該用戶的特征畫像,判斷該用戶在該時(shí)刻需要什么信息,并給用戶什么信息。
[0009]【具體實(shí)施方式】:一、首先要搭建爬蟲系統(tǒng),該系統(tǒng)要實(shí)時(shí)抓取大量的各種豐富的類型的數(shù)據(jù),以保證服務(wù)器有足夠豐富的數(shù)據(jù),這樣服務(wù)器才能滿足更多的用戶群體,還要抓取數(shù)據(jù)的原始熱度,以保證數(shù)據(jù)的起初熱度。
[0010]二、要搭建數(shù)據(jù)處理系統(tǒng),關(guān)鍵字提取算法很重要,要能通過自主學(xué)習(xí)不停的豐富自己的關(guān)鍵字庫,類型的劃分很重要,不能完全根據(jù)互聯(lián)網(wǎng)的分類來分類,必須要有人工干預(yù),因?yàn)榛ヂ?lián)網(wǎng)的分類雜亂無章,往往詞不同意同,同時(shí)分的類別層級(jí)高低不一,如有的網(wǎng)站是〃體育--籃球”有的網(wǎng)站是”體育一NBA “。在類型劃分很重要,對(duì)實(shí)時(shí)算法會(huì)有影響,因此類型的劃分要足夠的細(xì)致與合理,如:“可以是體育一籃球--NBA-喬丹”。主題算法,要對(duì)信息進(jìn)行主題的提取,這更能得到用戶喜歡什么類型的主題。數(shù)據(jù)的處理結(jié)束后的灌庫很重要,海量數(shù)據(jù)的存儲(chǔ),查找,更新是處理大數(shù)據(jù)量的能力,很好的處理掉這些數(shù)據(jù),是能否快速響應(yīng)用戶的信息需求的根本,本系統(tǒng)使用了 google的一個(gè)分布式多層級(jí)的海量數(shù)據(jù)存儲(chǔ)的框架技術(shù)leveldb。這個(gè)框架能高效的完成海量數(shù)據(jù)的存儲(chǔ),查找,計(jì)算的工作。
[0011]三、構(gòu)建用戶模型和采集機(jī)制,一個(gè)真實(shí)的用戶,包含著用戶的基本屬性,如性別、年齡的區(qū)分等,用戶的數(shù)據(jù)模型,其中還包含用戶的唯一標(biāo)識(shí)符,就像我們的身份證號(hào)碼一樣,具有唯一性。根據(jù)真實(shí)用戶的特性,用戶數(shù)據(jù)模型按變化性分為長期屬性和實(shí)時(shí)屬性,長期屬性如:性別、居住地、工作地、愛好、主題、關(guān)鍵字。短期屬性如:PV、點(diǎn)擊、多級(jí)類別、關(guān)鍵字。長期屬性每隔一段時(shí)間(可配置)繪制用戶特征畫像,用于當(dāng)用戶沒有實(shí)時(shí)屬性可根據(jù)長期屬性給用戶推薦信息。短期屬性會(huì)隨著用戶在智能終端的操作實(shí)時(shí)發(fā)生變化,并根據(jù)變化實(shí)時(shí)給用戶推送信息 四、當(dāng)用戶使用智能終端時(shí),會(huì)將該用戶的唯一標(biāo)識(shí)發(fā)送到推薦服務(wù)器,推薦服務(wù)器會(huì)根據(jù)用戶的標(biāo)識(shí),得到該用戶的特征畫像,然后依次根據(jù)關(guān)鍵字、主題、多級(jí)類別、pv、點(diǎn)擊、分享、收藏、評(píng)論以及場(chǎng)景變化得到該用戶的推薦信息列表,并根據(jù)特征總權(quán)重分?jǐn)?shù)排序,根據(jù)智能終端請(qǐng)求信息的條數(shù)給用戶推薦信息。
【權(quán)利要求】
1.一種智能推薦信息的一種方法,應(yīng)用于在使用互聯(lián)網(wǎng)軟件時(shí)分析用戶喜好和需求并進(jìn)行智能推薦信息的一種方法,其特征在于: 要使用爬蟲獲得大量的信息,然后使用提取關(guān)鍵字算法和主題算法,建立海量的信息源,構(gòu)建用戶數(shù)據(jù)模型,并根據(jù)數(shù)據(jù)模型采集用戶的瀏覽信息,點(diǎn)擊信息,智能設(shè)備的基本情況和使用行為,以及位置變化的軌跡等行為數(shù)據(jù),然后使用模型算法不停的完善用戶的特征畫像,當(dāng)一個(gè)用戶在使用智能設(shè)備時(shí),服務(wù)器會(huì)根據(jù)該用戶的特征畫像,判斷該用戶在該時(shí)刻需要什么信息,并給用戶什么信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 搭建數(shù)據(jù)處理系統(tǒng),抓取用戶數(shù)據(jù),根據(jù)用戶的興趣點(diǎn),推薦服務(wù)器做更細(xì)分的多層級(jí)計(jì)算,如:體育一籃球一NBA-喬丹等,并推薦信息給用戶。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 構(gòu)建用戶模型和采集機(jī)制,根據(jù)用戶的屬性特征,唯一性,喜好,活動(dòng)軌跡等結(jié)合場(chǎng)景算法,形成一個(gè)特定的場(chǎng)景,引導(dǎo)用戶,為用戶提供智能服務(wù)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括: 根據(jù)關(guān)鍵字、主題、多級(jí)類別、pv、點(diǎn)擊、分享、收藏、評(píng)論以及場(chǎng)景變化得到該用戶的推薦信息列表,并根據(jù)特征總權(quán)重分?jǐn)?shù)排序,根據(jù)智能終端請(qǐng)求信息的條數(shù)給用戶推薦信息。
【文檔編號(hào)】G06F17/30GK104036002SQ201410266630
【公開日】2014年9月10日 申請(qǐng)日期:2014年6月16日 優(yōu)先權(quán)日:2014年6月16日
【發(fā)明者】不公告發(fā)明人 申請(qǐng)人:深圳市英威諾科技有限公司