專利名稱:一種內容推薦方法和裝置的制作方法
背景技術:
本發(fā)明涉及內容推薦裝置和方法,特別涉及更準確地向用戶推薦內容的技術。
隨著現(xiàn)代通信技術的發(fā)展,人們隨時可以獲取大量信息。然而信息量的急劇增加使人們往往無所適從,人們迫切需要有一種工具可以幫助他們快速找到真正感興趣的內容,即個性化的容推薦裝置。
在現(xiàn)有的推薦系統(tǒng)中,每個內容可包含至少一個內容特征,同類型的內容特征組成內容特征類型。例如,對于電視節(jié)目,特征類型可以是演員,相應的內容特征是Tom Hanks,Brad Pitt等。特征類型還可以是節(jié)目類型,相應的內容特征是文藝片、愛情片、恐怖片等。特征類型還可以是導演,相應的內容特征是張藝謀、馮小剛等。這些內容特征可以來自廣播、電視或者互聯(lián)網(wǎng)絡等信息源,最具代表性的就是通過數(shù)字電視電子節(jié)目指南(Electric Program Guide,EPG)隨節(jié)目一起發(fā)送給用戶。
為了滿足不斷變化的用戶興趣,內容推薦裝置中的用戶檔案(UserProfile)中存儲該用戶對節(jié)目中的內容特征的喜好程度(Like_degree)及權重(Weight)等信息,并不斷對用戶檔案進行更新。
推薦裝置一般根據(jù)用戶觀看的歷史(例如,用戶觀看了什么節(jié)目)或用戶觀看的行為(例如,用戶觀看了多長時間)來修改用戶檔案,通常是先獲得用戶觀看某特定節(jié)目的時間長度并減去一個預設的閾值,再由所得到的差值與該特定節(jié)目預定播放的時間長度的比值,來得出用戶對該節(jié)目的興趣度,以用來修正用戶檔案。
一般來說,如果用戶長時間觀看具有某一內容特定的內容,內容推薦裝置就認定用戶喜歡具有該內容特征的內容并推薦更多該類節(jié)目。現(xiàn)有的內容推薦裝置的結構圖如圖1所示,該內容推薦裝置100包括一個內容接收裝置101,用于接收有特定內容特征的內容;一個用戶檔案102,用于存儲用戶觀看歷史;一個篩選裝置103,用于根據(jù)用戶觀看的歷史向用戶推薦節(jié)目。
例如,在美國專利申請10/066453(申請日2002年1月31日,公開號20030145326,
公開日
2003年7月31日,受讓人為皇家飛利浦電子股份有限公司)公開了一種推薦裝置,該系統(tǒng)跟蹤用戶觀看的所有節(jié)目并生成標識所觀看的特定節(jié)目頻率的用戶檔案。隨后,向用戶提供基于存儲在用戶檔案中的觀看習慣的多種預定方案,這樣用戶可以根據(jù)他的興趣來選擇付費節(jié)目。
傳統(tǒng)推薦裝置的一個缺點是只考慮了用戶的實際觀看量而未考慮一定類型的內容的可用量。由于用戶只能觀看播放的節(jié)目,如果用戶非常喜歡的內容非常少播放,即使他觀看了所有這種類型的內容,由于觀看的總時間還是不長,在他的檔案中也不能強烈地表現(xiàn)出他對該類型內容的喜愛。這樣,用戶非常喜歡的節(jié)目可能并不出現(xiàn)在推薦中,導致向用戶推薦的節(jié)目并不是非常準確。例如,一個用戶在一個星期內觀看了3個電視劇和觀看了1個記錄片,傳統(tǒng)的推薦裝置更新了用戶檔案,其中3次提高了該用戶對電視劇的喜好程度和提高了對紀錄片的喜歡程度1次。但事實上,這個星期可能總共播出了15個電視劇和而只播出了1個紀錄片。因為他觀看了播出的所有的紀錄片,這個用戶很可能更喜歡看紀錄片,應當將用戶檔案中對紀錄片的喜歡程度更多的提高才能正確反映用戶的喜好。
發(fā)明內容
本發(fā)明的目的之一是解決上述問題,提供一種準確性更高的內容推薦裝置。
根據(jù)本發(fā)明的第一個方面,提供一種內容推薦方法,首先,接收關于內容的信息,該信息包括至少一個該內容的內容特征;然后,獲取具有該內容特征的內容的可用量并獲取一個用戶對具有該內容特征的內容的觀看量;最后,根據(jù)該可用量與該觀看量的關系,決定是否推薦該內容給該用戶。
本發(fā)明的一個實施例是,所接收的內容是一個節(jié)目,該可用量是在一個預定的時間段內具有該內容特征的節(jié)目的可用量,該預定的時間段的長度大于至少一個具有該內容特征的節(jié)目的長度;該觀看量是在該預定的時間段內一個用戶對具有該內容特征的節(jié)目的觀看量。
本發(fā)明的另一個實施例是,獲得針對該預定的時間段的一個節(jié)目推薦列表;對該節(jié)目推薦列表上具有該內容特征的節(jié)目進行統(tǒng)計,從而得到該可用量;并對該用戶在該預定的時間段內觀看該節(jié)目推薦列表上所推薦的的節(jié)目進行統(tǒng)計,從而得到該觀看量。這樣,可以評估用戶實際觀看了所推薦的節(jié)目的比例,從而校正推薦的內容,提供推薦的準確程度。
本發(fā)明的又一個實施例是,在用戶檔案中包含一個用戶對該內容特征的喜好程度,根據(jù)該可用量與該觀看量的關系,調整該喜好程度;根據(jù)該調整后的喜好程度,決定是否推薦該節(jié)目給該用戶。
本發(fā)明中,可用量是在預定的時間段內具有該內容特征的節(jié)目的總的播放時間,觀看量是在預定的時間段內用戶觀看具有該內容特征的節(jié)目的總時間。
本發(fā)明中,可用量還可以是在預定的時間段內具有該內容特征的節(jié)目的個數(shù),觀看量可以是在預定的時間段內用戶觀看具有該內容特征的節(jié)目的次數(shù)。
本發(fā)明中,可用量還可以是在預定的時間段內具有該內容特征的節(jié)目總量與在該預定的時間段內所有節(jié)目總量的比值,觀看量是在預定的時間段內用戶觀看具有該內容特征的節(jié)目總量與在預定的時間段內該用戶所有觀看節(jié)目總量的比值。
根據(jù)本發(fā)明的另一個方面,提供一種內容推薦系統(tǒng),它帶有一個接收裝置,用于接收關于內容的信息,該信息包括至少一個該內容的內容特征;一個可用量獲取裝置,用于獲取具有該內容特征的節(jié)目的可用量;一個觀看量獲取裝置,用于獲取一個用戶對具有該內容特征的內容的觀看量;和一個決定裝置,用于根據(jù)該可用量與該觀看量的關系,決定是否推薦該內容給該用戶。
通過參照結合附圖所進行的如下描述和權利要求,本發(fā)明的其它目的和成就將是顯而易見的,并對本發(fā)明也會有更為全面的理解。
本發(fā)明通過實例的方式,參照附圖進行詳盡的解釋,其中圖1是現(xiàn)有的內容推薦裝置的結構方框圖;圖2是本發(fā)明的內容推薦裝置的一個實施例的結構方框圖;圖3是本發(fā)明的內容推薦裝置的另一個實施例的結構方框圖;
圖4是本發(fā)明的內容推薦裝置的一個實施例所執(zhí)行的流程圖;圖5是本發(fā)明的內容推薦裝置的另一個實施例所執(zhí)行的流程圖;圖6是用模糊邏輯實現(xiàn)本發(fā)明的內容推薦時模糊成員函數(shù)的輸入示意圖。
圖7是用模糊邏輯實現(xiàn)本發(fā)明的內容推薦時模糊成員函數(shù)的輸出示意圖。
在所有的附圖中,相同的參照數(shù)字表示相似的或相同的特征和功能。
具體實施例方式
圖2中示出了本發(fā)明的內容推薦裝置的一個實施例的結構方框圖。該內容推薦裝置200包括一個接收裝置210,一個可用量獲取裝置220,一個觀看量獲取裝置230和一個決定裝置240。該內容推薦裝置200還可以包括一個用戶檔案250,可用量獲取裝置220還可以帶有一個統(tǒng)計裝置260。
接收裝置210用于接收關于內容的信息,該信息包括至少一個內容的內容特征。內容可以來自廣播、電視臺或者互聯(lián)網(wǎng)絡等任何信息源。例如,內容可以是電視節(jié)目,內容的信息可以是EPG,其中的一個內容特征類型是“演員”,該內容特征類型中的一個內容特征是“BradPitt”和另一個內容特征是“Tom Hanks”。這些內容特征可來自于EPG。
可用量獲取裝置220用于獲取具有該內容特征的節(jié)目的可用量。節(jié)目供應商可以統(tǒng)計在一個預定的時間段內具有該內容特征的內容的可用量,將該可用量存儲在EPG中,并將該可用量信息隨EPG一起發(fā)送給推薦裝置。這樣,可用量獲取裝置220可以直接從EPG中具有該內容特征的內容的可用量。如果節(jié)目供應商并未在EPG中提供各種類型的節(jié)目的可用量,可用量獲取裝置220通過一個統(tǒng)計裝置260對接收的EPG中具有該內容特征的節(jié)目進行統(tǒng)計,從而得到具有該內容特征的節(jié)目的可用量。
觀看量獲取裝置230用于獲取一個用戶對具有該內容特征的內容的觀看量。觀看量獲取裝置230可以通過監(jiān)控機頂盒獲得用戶觀看歷史,對用戶觀看歷史進行統(tǒng)計可以獲取具有該內容特征的節(jié)目的觀看量。
決定裝置240從可用量獲取裝置220和觀看量獲取裝置230接收可用量和觀看量,并根據(jù)可用量和觀看量的關系決定是否推薦該內容或將該內容加入推薦列表??捎昧亢陀^看量的關系可以是比例關系,例如,當該比例高過預定值時,則向用戶推薦該節(jié)目??捎昧亢陀^看量的關系還可以通過,例如,以下將要說明的模糊邏輯等方式進行計算。當符合預定關系時,則推薦該節(jié)目。
本發(fā)明的推薦裝置還可以帶有一個用戶檔案250,其中存儲與用戶觀看節(jié)目相關的各種信息,例如,當前的EPG和以前的EPG以及由節(jié)目供應商或推薦裝置統(tǒng)計EPG而所得到的各種節(jié)目的可用量。用戶檔案250還可以存儲該用戶對各種節(jié)目的喜好程度及權重,以及對各種節(jié)目的觀看歷史以及對各種節(jié)目的實際觀看量等信息。這樣,可用量獲取裝置220和觀看量獲取裝置230可以直接從用戶檔案250中獲取節(jié)目的可用量和用戶的觀看量。
圖3中示出了本發(fā)明的內容推薦裝置的另一個實施例的結構方框圖。內容推薦裝置300的接收裝置210,可用量獲取裝置220,觀看量獲取裝置230,用戶檔案250和統(tǒng)計裝置260與圖2中的實施例相同。在本實施例中,內容推薦裝置300的決定裝置310中帶有一個用戶檔案修正裝置320。用戶檔案修正裝置320根據(jù)節(jié)目的可用量和觀看量的關系對用戶檔案中針對該內容特征的喜好程度進行修正。例如,當觀看量和可用量的比例超過預定值則提高用戶檔案中該內容特征的喜好程度。反之,當觀看量和可用量的比例低于預定值則降低用戶檔案中該內容特征的喜好程度。此外,根據(jù)可用量和觀看量的關系修改用戶對內容特征的喜歡程度還可以通過,例如,以下將要說明的模糊邏輯的方式計算。
決定裝置310在收到從接收裝置210得到的節(jié)目信息后,從用戶檔案中獲得針對該內容特征的喜歡程度,如果喜歡程度高于預定值,則向用戶推薦該節(jié)目。
圖4是圖2所示的內容推薦裝置所執(zhí)行的流程圖。以下結合圖4詳細描述本發(fā)明的內容推薦方法的一個實施例。
在步驟S410接收關于內容的信息,該信息包括至少一個該內容的內容特征。該內容可以來自廣播、電視臺或者互聯(lián)網(wǎng)絡等任何信息源。例如,內容可以是電視節(jié)目,內容的信息可以是EPG,內容的一個內容特征類型是“演員”,該內容特征類型中的一個內容特征是“BradPitt”和另一個內容特征是“Tom Hanks”。
在步驟S420獲取具有該內容特征的內容的可用量。對于EPG,可以統(tǒng)計在一個預定的時間段內具有某種內容特征的節(jié)目的播出量。該預定的時間段可以是一個月、一個星期或其它時間。預定的時間段可以由機頂盒的制造商設定或推薦裝置的制造商設定。該時間段也可以由用戶設定或修改。此外,該預定的時間段的長度不能比具有該內容特征的節(jié)目中最短的節(jié)目還短,也就是時間段的長度應大于至少一個具有該內容特征的節(jié)目的長度。
具有一個內容特征的內容的可用量可以通過多種方式獲得。例如,可以由節(jié)目供應商統(tǒng)計并存儲在EPG中,并隨EPG一起發(fā)送到推薦裝置。如果EPG中沒有提供內容的可用量,則可以在接收到EPG時對EPG進行統(tǒng)計,而得到具有一個內容特征的內容的可用量。此外,內容的可用量還可以從用戶檔案中獲得。例如,用戶檔案中可以保存有內容供應商提供的具有一個內容特征的內容的可用量。這樣,內容的可用量可以直接從用戶檔案中讀取。另一種可能的情況是用戶檔案中保存當前的EPG和以前的EPG。這樣,節(jié)目的可用量可以通過讀取用戶檔案中保存的EPG,通過統(tǒng)計的方式獲得。
假設在上一個星期內,共播出了5個喜劇片,共10小時,其中一個2小時的喜劇片由Brad Pitt主演,一個2小時的喜劇片由Tom Hanks主演。該星期內還播出了3個紀錄片,共3小時;10個電視?。?個恐怖片,共3小時,其中的一個1.5小時的恐怖片由Jenifer Aniston主演以及其他節(jié)目。
這樣,對于同類型的內容的可用量進行分析后,產生一個各個類型內容的可用量表。例如,對播出時間進行統(tǒng)計,產生以下的表1(收集的各種內容的播出時間)。
表1.收集的各種內容的播出時間
這些內容特征可以是基于TV-Anytime的字段。當創(chuàng)建這個表時,系統(tǒng)應當過濾重復的內容特征。
在步驟S430獲取一個用戶對具有該內容特征的內容的觀看量。這可以通過統(tǒng)計用戶在該預定的時間段內實際觀看的各類型的節(jié)目的時間來獲得。觀看量的統(tǒng)計時間段與節(jié)目的可用量的統(tǒng)計時間斷是相同的。
用戶的觀看量可以由多種方式獲得。例如,推薦裝置通過監(jiān)控機頂盒而獲得用戶的觀看歷史,對用戶的觀看歷史進行統(tǒng)計得到用戶對具有該內容特征的內容的實際觀看量?;蛘?,用戶檔案記錄有用戶的觀看歷史,推薦系統(tǒng)統(tǒng)計用戶的觀看歷史就可以得到該用戶對具有各種內容特征的內容的觀看量。
例如,一個用戶在上個星期觀看了其中的3個喜劇片、3個紀錄片、2個恐怖片和1個電視劇以及其他節(jié)目。對于用戶在一個星期內的實際觀看量進行分析,建立表2(用戶實際觀看的具有各種內容特征的節(jié)目的時間)。
表2.用戶實際觀看的具有各種內容特征的節(jié)目的時間
在步驟S440檢查可用量與觀看量是否符合預定關系,如果是,則在步驟S450推薦該內容給該用戶,否則,在步驟S460不推薦該內容??捎昧亢陀^看量的關系可以是比例關系,當該比例高過預定值時,則向用戶推薦該節(jié)目。例如,推薦系統(tǒng)可以設定當觀看量和可用量的比例超過50%時向用戶推薦具有相同內容特征的節(jié)目。這樣,上一個星期紀錄片的可用量是3小時,而用戶觀看了3小時的紀錄片,也就是觀看量為3小時。觀看量和可用量的比例是100%,超過了預定值。推薦系統(tǒng)則將當前EPG中的紀錄片推薦給該用戶或將當前EPG中的紀錄片加入推薦列表,由用戶根據(jù)推薦列表進行選擇。
此外,可用量和觀看量的關系還可以通過,例如,以下將要說明的模糊邏輯的方式計算。
根據(jù)本發(fā)明的一個可選實施例,步驟S420中內容的可用量還可以用內容的個數(shù)來表示,對播出的具有相同內容特征的內容的個數(shù)進行統(tǒng)計,產生以下的表3(EPG中各種內容特征的播出的個數(shù))。
表3.EPG中各種內容特征的播出的個數(shù)。
同樣,步驟S430中對于用戶的實際觀看量進行分析可以是對實際觀看的內容的個數(shù)進行統(tǒng)計,產生以下的表4(用戶實際觀看的具有各種內容特征的節(jié)目的個數(shù))。
表4.用戶實際觀看的具有各種內容特征的節(jié)目的個數(shù)
根據(jù)本發(fā)明另一個可選實施例,步驟S420中的內容的可用量的表示可以是具有該內容特征的內容在內容總量中的比例。這樣,表中的可用量一欄則用百分比表示,如表5(EPG中各種內容特征的播出的百分比)所示。
表5.EPG中內容特征的播出的百分比
這樣,步驟S430中的用戶的觀看量是用戶觀看具有該內容特征的內容的時間與他的總觀看時間的比例,如表6(用戶觀看一個內容特征的時間與他的總觀看時間的比例)所示。
表6.用戶觀看一個內容特征的時間與他的總觀看時間的比例
根據(jù)本發(fā)明的另一個可選實施例,可用量和觀看量的收集可以不是在EPG的全部節(jié)目中進行。例如,可以從用戶檔案中獲得針對該預定的時間段的一個節(jié)目推薦列表;對該節(jié)目推薦列表上具有該內容特征的節(jié)目進行統(tǒng)計,從而得到該可用量。根據(jù)用戶檔案中的記錄,對該用戶在該預定的時間段內觀看該節(jié)目推薦列表上所推薦的的節(jié)目進行統(tǒng)計,從而得到該觀看量。采用這種方式進行統(tǒng)計可以評估用戶實際觀看了所推薦的節(jié)目的比例,從而校正推薦的內容,提供推薦的準確程度。
為了滿足不斷變化的用戶興趣,內容推薦系統(tǒng)中的用戶檔案也需要不斷地改變。因此按照用戶的興趣(喜好),動態(tài)地修正推薦系統(tǒng)中的用戶檔案,以向用戶推薦用戶真正感興趣的內容,可以提高推薦的準確性。為此,圖5示出了本發(fā)明的推薦方法的另一個實施例。該實施例中,推薦裝置根據(jù)用戶檔案中的喜歡程度來推薦節(jié)目。圖5中步驟S410-S430與圖4中的步驟S410-S430相同。
在步驟S540根據(jù)該可用量與該觀看量的關系,調整用戶檔案中該內容特征的喜好程度。例如,當觀看量與可用量的比例超過預定值時,增加用戶檔案中對該內容特征的喜歡程度,反之,當觀看量與可用量的比例低于預定值時,降低用戶檔案中對該內容特征的喜歡程度。這樣,使得用戶檔案中對該內容特征的喜歡程度更準確。對于上面給出的實例,假設推薦系統(tǒng)設定當觀看量和可用量的比例超過50%時就增加用戶檔案中該內容特征的喜歡程度10%。這樣,上一個星期紀錄片的可用量是3小時,而用戶觀看了3小時的紀錄片,也就是觀看量為3小時。觀看量和可用量的比例是100%,超過了預定值。則推薦系統(tǒng)將用戶檔案中紀錄片的喜歡程度由原來的50%提供到60%。
用戶的觀看量和節(jié)目的可用量之間的關系還可以用以下將要說明的模糊邏輯的方式計算。
接下來,在步驟S550中,推薦裝置收到關于內容的信息后,該信息包括至少一個該內容的內容特征,將從用戶檔案中獲得該用戶對該內容特征的喜歡程度,并判斷該喜歡程度是否符合預定值。如果是,則在步驟S560中向用戶推薦該內容。如果不是,則在步驟S570,不推薦該內容。對應于上面的實例,當推薦裝置接收到EPG后,判斷其中一個節(jié)目是紀錄片,則從用戶檔案中獲取該用戶對紀錄片的喜歡程度為60%,超過預定值50%,則向該用戶推薦這個紀錄片。
在本發(fā)明中,根據(jù)用戶觀看量與節(jié)目的可用量的關系向用戶推薦節(jié)目或調整用戶檔案中的喜歡程度Like_degree可以采用多種方式,除了上述的比例關系外,還可以采用以下方式。
基本方式在這種方式中,設W是一個內容特征的觀看量與可用量的百分比,如果W值高,則增加該內容特征的Like_degree;如果該值低則減小Like_degree。對Like_degree的調節(jié)最好是平滑的,這樣,經過一段時間,對Like_degree的校正更新將是一個連續(xù)的趨勢線,使得用戶的一次非典型的變化不會對推薦的內容產生不利的影響。
·設BL為下限,當W低于該下限時,則減小Like_degree;·設BH為上限,當W高于該上限時,則增加Like_degree;·BL和BH之間的W值則不影響Like_degree,使得Like_degree的不會過于頻繁地波動。
·設S為縮放系數(shù),即每次更新Like_degree的最大變化。
例如,S=20%表示Like_degree每次最多只能增加或減少20%。這將使Like_degree的變化較為平滑,避免不具有代表性的突變。
計算Like_degree的步驟如下首先計算兩個值WL和WH·如果W<BL則WL=W,否則WL=0·如果W>BH則WH=W,否則WH=0接下來計算Like_degree的差值·ΔL=(WL/BL)×S 即降低Like_degree的百分比;·ΔH=(WH/BH)×S 即增加Like_degree的百分比計算實際更新Like_degree的量·ΔLike_degree=Like_degree×(100-ΔL)/100+Like_degree×(100+ΔH)/100最后,得到新的Like_degree·Like_degree=Like_degree+ΔLike_degree其中,在任何情況下ΔL和ΔH中最多只有一個是非零值。
這樣,如果每個星期作評估,經過一段時間,Like_degree將不經過任何突變收斂到正確的值。
可選地,上述可用量可以不是對一段時間內播出的節(jié)目的統(tǒng)計,而是在給該用戶的推薦的內容中進行統(tǒng)計。這樣就可以分析用戶實際觀看了系統(tǒng)推薦給他的節(jié)目的比例。根據(jù)這個比例再調整Like_degree的值,使Like_degree經過一段時間后收斂到正確的值,從而更準確地推薦內容。
模糊邏輯方式為用戶推薦內容還可以采用模糊邏輯的方式實現(xiàn)。采用模糊邏輯方式的優(yōu)點在于提高內容推薦裝置的魯棒性,并使內容推薦裝置更加智能化。
例如,本申請人的另一個申請(中國專利申請第200310123354.7號,申請人為皇家飛利浦電子股份有限公司,發(fā)明人為施笑畏,申請日為2003年12月15日)建議將用戶檔案存儲為一個向量或三元數(shù)組,每個向量的輸入項表示內容特征之一(例如某種節(jié)目類型)和相關的Like_degree(即用戶喜歡該內容特征的程度)以及權重Weight(該內容特征在內容推薦裝置中的重要程度)。一般來說,權重對相同的內容特征類型的所有內容特征來說是相同的(例如,對于所有節(jié)目類型或所有演員來說權重是相同的)。該用戶檔案向量可以用以下的表7(使用Like-degree和Weight用于存儲用戶檔案的數(shù)據(jù)結構)來表示。
表7使用Like-degree和Weight用于存儲用戶檔案的數(shù)據(jù)結構
這樣,采用模糊邏輯的方式更新Like_degree的方式如下對于第k個節(jié)目,它屬于內容特征類型t,相關的內容特征參數(shù)fi可以按如下公式更新Weighti′=Weightt′=Weightt+Δ Weightt(1)Like_degreei′=Like_degreei+ΔLike_degreei(2)其中,Weightt為內容特征類型t的權重,屬于相同類型的內容特征具有相同的權重,例如節(jié)目類型的權重,演員的權重等等;Weightt′為更新后的Weightt;Like_degreei為fi的Like-degree;Like_degreei′為更新后的Like_degreei;ΔWeightt為Weightt的更新幅度,更新幅度;ΔLike_degreei為Like_degreei的更新幅度如果內容特征是新的,將Like_degreei置為0,即Like_degreei=0,其Weighti與屬于該類型的其他內容特征相同。
如果Weightt′高于它的上限,則Weightt′置為上限,即Weight′t=higher_boundary;如果Weightt′低于它的下限,則Weightt′置為下限,即Weight′t=lower_boundary;如果Like_degreei′高于它的上限,則Like_degree′i置為上限,即Like_degree′i=higher_boundary;如果Like_degreei′低于它的下限,則Like_degreei′置為下限,即Like_degree′i=lower_boundary。
之后,對用戶檔案的變化通過模糊推理理論進行評估以模擬人類智能。
本發(fā)明的模糊邏輯方法基于內容推薦裝置中的知識庫,該知識庫來自存儲器中存儲的可用量available_time(%)和實際觀看量watched_time(%)的分析數(shù)據(jù)。
為了對ΔLike_degreei進行模糊邏輯運算,執(zhí)行以下步驟1>選擇輸入變量和輸出變量并進行模糊化。
基于上述分析,available_time(%)和watched_time(%)作為輸入變量和ΔLike_degreei作為輸出變量。
模糊化參數(shù)available_time(%)和watched_time(%)由清晰值映射為模糊值。對于不同的問題模糊隸屬函數(shù)可以有不同的形狀和位置。這里,假設e1=available_time(%),e2=watch_time(%),對應的模糊值可以如圖6所示。
模糊輸出變量ΔLike_degreei可以用圖7表示。
2>通過以下模糊邏輯推理規(guī)則得到輸出變量ΔLike_degreei的模糊值
I.如果e1為“大”并且e2為“大”,則ΔLike_degreei為“中”;II.如果e1為“大”并且e2為“中”,則ΔLike_degreei為“小”;III.如果e1為“大”并且e2為“小”,則ΔLike_degreei為“更小”;IV.如果e1為“中”并且e2為“大”,則ΔLike_degreei為“大”;V.如果e1為“中”并且e2為“中”,則ΔLike_degreei為“中”;VI.如果e1為“中”并且e2為“小”,則ΔLike_degreei為“小”;VII.如果e1為“小”并且e2為“大”,則ΔLike_degreei為“更大”;VIII.如果e1為“小”并且e2為“中”,則ΔLike_degreei為“大”;IX.如果e1為“小”并且e2為“小”,則ΔLike_degreei為“中”.
3>去模糊將模糊輸出變量ΔLike_degreei變換為清晰值.最傳統(tǒng)的去模糊方法是“去重心”法和“最大值平均”法。“去重心”法考慮了更多的有用系數(shù),因此,采用該方法計算Like_degree?!爸匦摹狈ㄈ绻?3)所示ΔLike_degreei=Σl=1mμ[l]yl/Σl=1mμ[l]---(3)]]>其中,μ[l]是第1個規(guī)則的輸出區(qū)的高度;yl是第1個規(guī)則的輸出區(qū)的重力水平坐標;m是規(guī)則的個數(shù)。
對于內容特征類型t,ΔWeightt可以按下式計算ΔWeightt=Σj=1p|Like_degreetj′|-Σj=1p|Like_degreetj|p---(4)]]>其中,p是某種類型的內容特征的個數(shù)。
通過模糊邏輯的方式進行Like_degree的更新的具體過程可以參考中國專利申請第200310123354.7號(申請人為皇家飛利浦電子股份有限公司,發(fā)明人為施笑畏,申請日為2003年12月15日)。
以上結合EPG系統(tǒng)對本發(fā)明的內容推薦裝置和內容推薦方法進行了詳細描述。但是本發(fā)明顯然可以同樣應用于其他領域的內容推薦,例如Internet搜索引擎。將搜索引擎的一個或多個關鍵字視為內容特征,則Internet搜索引擎中的內容與電視節(jié)目一樣可以分成多個類型,具有多個內容特征。在給用戶提供內容時,搜索引擎可以根據(jù)用戶以前的搜索操作歷史獲得搜索引擎提供的內容總量和用戶實際瀏覽量之間的關系,根據(jù)這個關系修改搜索結果,以提高搜索的命中率或向用戶推薦用戶更喜歡的內容。
本發(fā)明同樣還可以進一步改進。例如,如果用戶的設備是聯(lián)網(wǎng)的,則每個用戶可以將他的觀看歷史(他們觀看某種類型的內容的時間量)的提供給服務器?;谶@些信息的綜合分析,服務器可以確定一個典型用戶的用戶檔案。如果一個用戶檔案與該典型檔案的區(qū)別很大,則表示該用戶非常喜歡或不喜歡這種類型的節(jié)目。用戶可以匿名提交他的觀看歷史以保護他的隱私。
雖然經過對本發(fā)明結合具體實施例進行描述,對于在本技術領域熟練的人士,根據(jù)上文的敘述作出的許多替代、修改和變化將是顯而易見的。因此,當這樣的替代、修改和變化落入附后的權利要求的精神和范圍內時,應該被包括在本發(fā)明中。
權利要求
1.一種內容推薦方法,包含步驟(a).接收關于內容的信息,該信息包括至少一個該內容的內容特征;(b).獲取具有該內容特征的內容的可用量;(c).獲取一個用戶對具有該內容特征的內容的觀看量;和(d).根據(jù)該可用量與該觀看量的關系,決定是否推薦該內容給該用戶。
2.如權利要求1所述的方法,其中所述的內容是一個節(jié)目,所述可用量是在一個預定的時間段內具有該內容特征的節(jié)目的可用量,該預定的時間段的長度大于至少一個具有該內容特征的節(jié)目的長度;所述觀看量是在該預定的時間段內一個用戶對具有該內容特征的節(jié)目的觀看量。
3.如權利要求2所述的方法,其中所述的信息是來自于一個電子節(jié)目指南,所述的步驟(b)包括步驟對該電子節(jié)目指南中在所述預定的時間段內具有該內容特征的節(jié)目進行統(tǒng)計,從而得到所述的可用量。
4.如權利要求2所述的方法,所述的步驟(b)包括步驟獲得針對所述預定的時間段的一個節(jié)目推薦列表;對該節(jié)目推薦列表上具有所述內容特征的節(jié)目進行統(tǒng)計,從而得到所述的可用量。
5.如權利要求4所述的方法,所述的步驟(c)包括步驟對所述用戶在所述預定的時間段內觀看所述節(jié)目推薦列表上所推薦的的節(jié)目進行統(tǒng)計,從而得到所述的觀看量。
6.如權利要求2所述的方法,其中所述的觀看量是來自于一個用戶檔案。
7.如權利要求6所述的方法,其中所述的用戶檔案包含一個用戶對所述內容特征的喜好程度,所述的步驟(d)包括步驟根據(jù)該可用量與該觀看量的關系,調整該喜好程度;根據(jù)該調整后的喜好程度,決定是否推薦該節(jié)目給該用戶。
8.如權利要求2的方法,其中所述的可用量是在所述預定的時間段內具有該內容特征的節(jié)目的總的播放時間,所述的觀看量是在所述預定的時間段內用戶觀看具有該內容特征的節(jié)目的總時間。
9.如權利要求2的方法,其中所述的可用量是在所述預定的時間段內具有該內容特征的節(jié)目的個數(shù),所述的觀看量是在所述預定的時間段內用戶觀看具有該內容特征的節(jié)目的次數(shù)。
10.如權利要求2的方法,其中所述的可用量是在所述預定的時間段內具有該內容特征的節(jié)目總量與在該預定的時間段內所有節(jié)目總量的比值,所述的觀看量是在所述預定的時間段內用戶觀看具有該內容特征的節(jié)目總量與在預定的時間段內該用戶所有觀看節(jié)目總量的比值。
11.如權利要求2所述的方法,所述的步驟(d)包括步驟當該可用量與該觀看量的比值大于一個預定值時,決定推薦該節(jié)目給該用戶。
12.一種內容推薦系統(tǒng),包含一個接收裝置,用于接收關于內容的信息,該信息包括至少一個該內容的內容特征;一個可用量獲取裝置,用于獲取具有該內容特征的節(jié)目的可用量;一個觀看量獲取裝置,用于獲取一個用戶對具有該內容特征的內容的觀看量;和一個決定裝置,用于根據(jù)該可用量與該觀看量的關系,決定是否推薦該內容給該用戶。
13.如權利要求12所述的方法,其中所述的內容是一個節(jié)目,所述可用量是在一個預定的時間段內具有該內容特征的節(jié)目的可用量,該預定的時間段的長度大于至少一個具有該內容特征的節(jié)目的長度;所述觀看量是在該預定的時間段內一個用戶對具有該內容特征的節(jié)目的觀看量。
14.如權利要求13所述的裝置,其中所述的信息是來自于一個電子節(jié)目指南,所述的可用量獲取裝置包括一個統(tǒng)計裝置,用于對該電子節(jié)目指南中在所述預定的時間段內具有該內容特征的節(jié)目進行統(tǒng)計,從而得到所述的可用量。
15.如權利要求13所述的裝置,其中所述的觀看量是來自于一個用戶檔案。
16.如權利要求15所述的方法,其中所述的用戶檔案包含一個用戶對所述內容特征的喜歡程度,所述的決定裝置包括一個用戶檔案修正裝置,用于根據(jù)該可用量與該觀看量的關系,調整該喜歡程度。
17.如權利要求13的裝置,其中所述的可用量是在所述預定的時間段內具有該內容特征的節(jié)目的總的播放時間,所述的觀看量是在所述預定的時間段內用戶觀看具有該內容特征的節(jié)目的總時間。
18.如權利要求13的裝置,其中所述的可用量是在所述預定的時間段內具有該內容特征的節(jié)目的個數(shù),所述的觀看量是在所述預定的時間段內用戶觀看具有該內容特征的節(jié)目的次數(shù)。
全文摘要
本發(fā)明涉及內容推薦方法和裝置,以提高向用戶推薦內容的準確性。根據(jù)本發(fā)明的內容推薦方法,首先,接收關于內容的信息,該信息包括至少一個該內容的內容特征;然后獲取具有該內容特征的內容的可用量和獲取一個用戶對具有該內容特征的內容的觀看量;最后根據(jù)該可用量與該觀看量的關系,決定是否推薦該內容給該用戶。
文檔編號H04N7/16GK101088288SQ200580044531
公開日2007年12月12日 申請日期2005年12月7日 優(yōu)先權日2004年12月23日
發(fā)明者D·P·凱利, 施笑畏 申請人:皇家飛利浦電子股份有限公司