專利名稱:內(nèi)容檢索裝置及內(nèi)容檢索方法
技術領域:
本發(fā)明涉及用來從大量存儲的內(nèi)容之中檢索用戶想要使用的內(nèi)容的內(nèi)容檢索裝置。
背景技術:
作為從存儲在服務器等中的大量內(nèi)容之中檢索想要的內(nèi)容的方法,提出了多種從 檢索裝置側(cè)提示多個關聯(lián)關鍵字的方法。這里,所謂關聯(lián)關鍵字,是指與用戶確定的單詞 (關鍵字)有關聯(lián)的單詞(關鍵字)。此外,一般根據(jù)關鍵字間的同現(xiàn)數(shù)、出現(xiàn)頻度等計算 表示相互關聯(lián)的關鍵字間的關聯(lián)程度的關聯(lián)度。這樣的檢索裝置與存儲了內(nèi)容的內(nèi)容數(shù)據(jù)庫的數(shù)據(jù)更新同時更新用來提示關聯(lián) 關鍵字的關鍵字間的關聯(lián)(例如參照專利文獻1)。因而,該檢索裝置對用戶提示基于存儲 在內(nèi)容數(shù)據(jù)庫中的最新內(nèi)容的關聯(lián)關鍵字。但是,用戶由指定的關鍵字想起的關聯(lián)關鍵字根據(jù)用戶不同而分別不同。例如,僅 視聽了“男演員A”出演的最近播放的電視劇的用戶作為關聯(lián)關鍵字而想起在該電視劇中出 演的“女演員B”。另一方面,僅視聽了“男演員A”出演的于1年前播放的電視劇的用戶作 為關聯(lián)關鍵字而想起在該電視劇中出演的“女演員C”。這樣,在用戶個人的知識不同的情 況下,用戶對于“男演員A”想起的關聯(lián)關鍵字有可能為不同的關鍵字。即,在檢索裝置僅提 示了根據(jù)最新的內(nèi)容生成的關聯(lián)關鍵字的情況下,根據(jù)用戶不同,被提示了不能想起的關 聯(lián)關鍵字。結(jié)果,有用戶不能進行關鍵字的選擇、不能縮減內(nèi)容的問題。所以,以往為了解決這樣的問題,提出了將存儲在內(nèi)容數(shù)據(jù)庫中的所有的內(nèi)容通 過固定時間的時間區(qū)間分類的方法(例如參照專利文獻2)。由此,利用專利文獻2的方法 的檢索裝置可以按時間區(qū)間構建關鍵字間的關聯(lián)。結(jié)果,該檢索裝置能夠?qū)τ脩舭炊鄠€時 間區(qū)間提示根據(jù)不同的時間區(qū)間的關聯(lián)生成的關聯(lián)關鍵字。例如,該檢索裝置作為與“男演 員A”關聯(lián)的關鍵字,可以將在對應于今年1年間的內(nèi)容中關聯(lián)強的“女演員B”和在對應于 去年1年間的內(nèi)容中關聯(lián)強的“女演員C”同時提示給用戶。這樣,通過檢索裝置提示多個 時間區(qū)間中的關聯(lián)關鍵字,用戶能夠選擇適合于自己的知識的關聯(lián)關鍵字。即,用戶能夠有 效地進行通過重復關聯(lián)關鍵字的選擇進行的內(nèi)容的縮減。[專利文獻1]日本特開2007-188225號公報[專利文獻2]日本特開2002-183175號公報但是,在利用專利文獻2的方法的以往的檢索裝置中,由于利用固定時間的時間 區(qū)間將存儲在內(nèi)容數(shù)據(jù)庫中的所有的內(nèi)容分類,所以有不能提示與各內(nèi)容的關鍵字結(jié)構的 變化對應的關聯(lián)關鍵字的問題。一般,在內(nèi)容數(shù)據(jù)庫中存儲有屬性(類型)不同的多個內(nèi)容的情況下,內(nèi)容的關鍵 字結(jié)構較大地變化的頻度根據(jù)屬性不同而大為不同。例如,在電視節(jié)目的情況下,新聞節(jié)目 在較短的時間間隔中關鍵字結(jié)構較大地變化,而電視劇節(jié)目僅一季度一次關鍵字結(jié)構較大 地變化。
這樣,在內(nèi)容數(shù)據(jù)庫之中包含有關鍵字結(jié)構較大變化的頻度不同的屬性的內(nèi)容的 情況下,如果以往的檢索裝置決定固定時間以使其適合于關鍵字結(jié)構較大變化的頻度較低 的內(nèi)容,則檢索裝置不能提示適合于各屬性的關鍵字結(jié)構較大變化的頻度的具有時事性的 關聯(lián)關鍵字。例如,假設在關鍵字結(jié)構較大變化的頻度較高的“新聞類型”的內(nèi)容中,對于關 鍵字“話題”,關聯(lián)度較高的關鍵字在特定的期間中以“國會”一“足球”一“臺風”的順序變 化。在此情況下,以往的檢索裝置匹配于關鍵字結(jié)構較大變化的頻度較低的“電視劇類型” 的內(nèi)容而決定上述確定的期間包含在1個時間區(qū)間中的固定時間。結(jié)果,從“國會”、“足球” 及“臺風”之中,將對于“話題”關聯(lián)度最高的關鍵字作為關聯(lián)關鍵字提示。即,有可能有對 于“話題”不是提示作為最適合于時事性的關聯(lián)關鍵字的“臺風”而是提示“國會”或“足球” 的情況。另一方面,如果以往的檢索裝置決定固定時間以使其適合于關鍵字結(jié)構較大變化 的頻度較高的內(nèi)容,則檢索裝置在多個時間區(qū)間中提示相同的關聯(lián)關鍵字。例如,在以往的 檢索裝置匹配于關鍵字結(jié)構較大變化的頻度較高的“新聞類型”的內(nèi)容決定了固定時間的 情況下,檢索裝置在關鍵字結(jié)構較大變化的頻度較低的“電視劇類型”的內(nèi)容中,在多個時 間區(qū)間中提示相同的關聯(lián)關鍵字。由于檢索裝置能夠?qū)τ脩粢淮翁崾镜年P鍵字的數(shù)量存在 限制,所以提示多個相同的關鍵字會造成使用戶的選擇分支的范圍變窄。結(jié)果,在用戶選擇 關鍵字時,產(chǎn)生多余的檢索步驟的可能性變高。即,在以往的檢索裝置中,用戶不能有效地 檢索內(nèi)容。
發(fā)明內(nèi)容
所以,本發(fā)明的目的是解決上述問題,提供一種能夠?qū)⑦m合于時事性的關聯(lián)關鍵 字高效率地提示給用戶的內(nèi)容檢索裝置。為了達到上述目的,有關本發(fā)明的內(nèi)容檢索裝置,利用與表示內(nèi)容的數(shù)據(jù)的關鍵 字關聯(lián)的關聯(lián)關鍵字,從按表示內(nèi)容的分類的內(nèi)容屬性存儲內(nèi)容的內(nèi)容數(shù)據(jù)庫中檢索規(guī)定 的內(nèi)容,其特征在于,具備詞典數(shù)據(jù)庫,按表示規(guī)定的時間區(qū)間的關聯(lián)區(qū)間,存儲表示是包 含在上述關聯(lián)區(qū)間中的內(nèi)容且屬于由上述內(nèi)容屬性表示的分類的內(nèi)容的數(shù)據(jù)的多個關鍵 字間的關聯(lián)度;關聯(lián)區(qū)間計算機構,根據(jù)通過表示存儲在上述內(nèi)容數(shù)據(jù)庫中的第1內(nèi)容的 數(shù)據(jù)的多個第ι關鍵字和表示存儲在上述內(nèi)容數(shù)據(jù)庫中的第2內(nèi)容的數(shù)據(jù)的多個第2關鍵 字計算出的每個上述內(nèi)容屬性的差異度是否滿足規(guī)定基準值,按上述內(nèi)容屬性計算設定為 使上述第1內(nèi)容和上述第2內(nèi)容包含在同一時間區(qū)間中的關聯(lián)區(qū)間;詞典更新機構,在包含 于由上述關聯(lián)區(qū)間計算機構計算出的關聯(lián)區(qū)間中的內(nèi)容中,使用按上述內(nèi)容屬性計算出的 關鍵字間的關聯(lián)度、以及上述關聯(lián)區(qū)間,更新存儲在上述詞典數(shù)據(jù)庫中的關聯(lián)度;以及輸出 生成機構,根據(jù)存儲在上述詞典數(shù)據(jù)庫中的關聯(lián)度,生成用來將與用戶輸入的關鍵字關聯(lián) 的關聯(lián)關鍵字按上述關聯(lián)區(qū)間輸出的輸出信息。由此,在從混合存儲有關鍵字結(jié)構變化的頻度不同的屬性的內(nèi)容的內(nèi)容數(shù)據(jù)庫中 檢索內(nèi)容的情況下,內(nèi)容檢索裝置通過根據(jù)按內(nèi)容屬性計算出的關聯(lián)區(qū)間更新詞典數(shù)據(jù) 庫,由此能夠?qū)⑦m合于時事性的關聯(lián)關鍵字高效率地提示給用戶。具體而言,在關鍵字結(jié)構較大變化的頻度較高的屬性的內(nèi)容的情況下,內(nèi)容檢索 裝置更新詞典數(shù)據(jù)庫以成為比其他屬性短的時間的關聯(lián)區(qū)間,所以能夠?qū)⑦m合于時事性的關鍵字提示給用戶。另一方面,在關鍵字結(jié)構較大變化的頻度較低的屬性的內(nèi)容的情況下, 內(nèi)容檢索裝置更新詞典數(shù)據(jù)庫以成為比其他屬性長的時間的關聯(lián)區(qū)間,所以不會在多個關 聯(lián)區(qū)間中提示同一個關鍵字,即能夠高效率地提示關鍵字。進而,在從存儲有關鍵字結(jié)構非周期性變化的屬性的內(nèi)容的內(nèi)容數(shù)據(jù)庫中檢索內(nèi) 容的情況下,內(nèi)容檢索裝置通過根據(jù)按照內(nèi)容關鍵字結(jié)構的變化計算出的關聯(lián)區(qū)間來更新 詞典數(shù)據(jù)庫,能夠?qū)⑦m合于時事性的關聯(lián)關鍵字高效率地提示給用戶。具體而言,在關鍵字結(jié)構以較短的周期變化時,內(nèi)容檢索裝置更新詞典數(shù)據(jù)庫以 成為比其他短的時間的關聯(lián)區(qū)間,所以能夠?qū)⑦m合于時事性的關鍵字提示給用戶。另一方 面,在關鍵字結(jié)構以較長的周期變化時,內(nèi)容檢索裝置更新詞典數(shù)據(jù)庫以成為比其他長的 時間的關聯(lián)區(qū)間,所以不會在多個關聯(lián)區(qū)間中提示同一個關鍵字,即能夠高效率地提示關 鍵字。此外,也可以其特征在于,上述關聯(lián)區(qū)間計算機構在將包含在存儲于上述詞典數(shù) 據(jù)庫中的最新的關聯(lián)區(qū)間中的內(nèi)容作為上述第2內(nèi)容,計算關聯(lián)區(qū)間。由此,在將新的時間區(qū)間的內(nèi)容追加到內(nèi)容數(shù)據(jù)庫中的情況下,根據(jù)新的時間區(qū) 間與在上次更新時計算出的關聯(lián)區(qū)間的關鍵字結(jié)構的差異度決定新的關聯(lián)區(qū)間,所以能夠 將適合于時事性的關聯(lián)關鍵字高效率地提示給用戶。此外,也可以其特征在于,上述關聯(lián)區(qū)間計算機構根據(jù)上述第1關鍵字中的出現(xiàn) 頻度較高的規(guī)定的數(shù)量的關鍵字與上述第2關鍵字中的出現(xiàn)頻度較高的規(guī)定的數(shù)量的關 鍵字的差異度是否滿足規(guī)定基準值,計算關聯(lián)區(qū)間。由此,在將新的時間區(qū)間的內(nèi)容追加到內(nèi)容數(shù)據(jù)庫中的情況下,不論包含在新的 時間區(qū)間與上次更新內(nèi)容時計算出的關聯(lián)區(qū)間中的關鍵字數(shù)量的差異如何,都能夠計算差 異度。此外,也可以其特征在于,上述關聯(lián)區(qū)間計算機構將對應于上次新添加在上述內(nèi) 容數(shù)據(jù)庫中的內(nèi)容的時間區(qū)間中的、預先設定的長度的時間的時間區(qū)間中包含的內(nèi)容作為 上述第2內(nèi)容,計算關聯(lián)區(qū)間。由此,在將新的時間區(qū)間的內(nèi)容追加到內(nèi)容數(shù)據(jù)庫中的情況下,與在上次更新內(nèi) 容時計算出的關聯(lián)區(qū)間無關,內(nèi)容檢索裝置能夠計算存儲在內(nèi)容數(shù)據(jù)庫中的最新的內(nèi)容與 新追加的內(nèi)容的關鍵字結(jié)構的差異性。因而,內(nèi)容檢索裝置能夠提示更適合于時事性的關 鍵字。此外,也可以其特征在于,上述內(nèi)容檢索裝置還具備屬性取得機構,取得與用戶 輸入的關鍵字關聯(lián)的內(nèi)容屬性;以及關聯(lián)關鍵字取得機構,通過參照上述詞典數(shù)據(jù)庫,按關 聯(lián)區(qū)間取得對應于上述用戶輸入的關鍵字和通過上述屬性取得機構取得的內(nèi)容屬性的關 聯(lián)關鍵字;上述輸出生成機構生成用來輸出由上述關聯(lián)關鍵字取得機構取得的關聯(lián)關鍵字 的上述輸出信息。由此,能夠從用戶輸入的關鍵字中取得內(nèi)容屬性,所以內(nèi)容檢索裝置能夠提示適 合于用戶的輸入的關聯(lián)關鍵字。此外,也可以其特征在于,上述關聯(lián)關鍵字取得機構在由上述屬性取得機構取得 了多個內(nèi)容屬性的情況下,對于上述多個內(nèi)容屬性分別生成關聯(lián)關鍵字;上述輸出生成機 構生成用來將對上述多個內(nèi)容屬性分別生成的關聯(lián)關鍵字按內(nèi)容屬性、按關聯(lián)區(qū)間輸出的輸出信息。由此,能夠?qū)⒍鄠€內(nèi)容屬性的關聯(lián)關鍵字同時提示給用戶,所以內(nèi)容檢索裝置能 夠提高能夠提示用戶要求的關聯(lián)關鍵字的可能性。發(fā)明效果根據(jù)本發(fā)明,在從存儲有關鍵字結(jié)構較大變化的頻度不同的內(nèi)容屬性的內(nèi)容的內(nèi) 容數(shù)據(jù)庫中檢索想要的內(nèi)容時,能夠高效率地提示適合于時事性的關聯(lián)關鍵字。
圖1是表示有關本發(fā)明的實施方式的內(nèi)容檢索裝置的功能結(jié)構的模塊圖。圖2是表示內(nèi)容數(shù)據(jù)庫的一例的圖。圖3是關聯(lián)語詞典的概念圖。圖4是表示關聯(lián)語詞典的一例的圖。圖5是表示內(nèi)容檢索裝置的處理的流程的流程圖。圖6是表示關聯(lián)區(qū)間計算部進行的關于關聯(lián)區(qū)間計算的處理(圖5所示的步驟 S106)的流程的流程圖。圖7是表示關聯(lián)區(qū)間計算部進行的關于變化率的計算的處理(圖6所示的步驟 S204)的流程的流程圖。圖8是表示初始檢索畫面的一例的圖。圖9是表示檢索畫面的一例的圖。圖10是表示檢索畫面的一例的圖。圖11(a)、圖11(b)及圖11(c)是用來說明關聯(lián)區(qū)間計算方法的圖。圖12(a)及圖12(b)是用來說明關聯(lián)區(qū)間計算方法的圖。圖13是多個屬性的關聯(lián)關鍵字的提示畫面的一例。圖14(a)是由有關現(xiàn)有技術的內(nèi)容檢索裝置輸出的關聯(lián)關鍵字的提示畫面的一 例。圖14(b)是由有關本發(fā)明的實施方式的內(nèi)容檢索裝置輸出的關聯(lián)關鍵字的提示畫面的一例。圖15是有關本發(fā)明的變形例1的內(nèi)容數(shù)據(jù)庫更新部進行的生成內(nèi)容屬性的處理 的概念圖。圖16是用來說有關本發(fā)明的變形例1的內(nèi)容數(shù)據(jù)庫更新部進行的生成內(nèi)容屬性 的處理的圖。圖17是表示有關本發(fā)明的變形例2的關聯(lián)區(qū)間計算部進行的關于關聯(lián)區(qū)間計算 的處理(圖5所示的步驟S106)的流程的流程圖。圖18是表示本發(fā)明的變形例2的文件矩陣的一例的圖。圖19是用來說明本發(fā)明的變形例2的取得文件矩陣的處理的圖。符號說明20 內(nèi)容 ID21 內(nèi)容屬性22 標題23 播放日
24關鍵字
25概要
31,32 區(qū)間詞典
41內(nèi)容屬性
42關聯(lián)區(qū)間
43關鍵字
44關聯(lián)關鍵字
45關聯(lián)度
70內(nèi)容列表
71關聯(lián)關鍵字列表
100內(nèi)容檢索裝置
101內(nèi)容數(shù)據(jù)庫
102詞典數(shù)據(jù)庫
102a關聯(lián)語詞典
103輸入部
104輸入選別部
105內(nèi)容數(shù)據(jù)庫更新部
106關聯(lián)區(qū)間計算部
107詞典更新部
108屬性取得部
109關聯(lián)關鍵字取得部
110輸出生成部
111輸出部
121、122、123、124、125、126
1001上次更新區(qū)間
1002、1102 追加區(qū)間
1003、1004 新關聯(lián)區(qū)間
1101上次內(nèi)容更新區(qū)間
1103關鍵字比較區(qū)間
具體實施例方式以下,利用附圖對本發(fā)明的實施方式的內(nèi)容檢索裝置詳細地說明。(實施方式)圖1是表示有關本發(fā)明的實施方式的內(nèi)容檢索裝置100的結(jié)構圖。如圖1所示, 內(nèi)容檢索裝置100具備內(nèi)容數(shù)據(jù)庫101、詞典數(shù)據(jù)庫102、輸入部103、輸入選別部104、內(nèi)容 數(shù)據(jù)庫更新部105、關聯(lián)區(qū)間計算部106、詞典更新部107、屬性取得部108、關聯(lián)關鍵字取得 部109、輸出生成部110、以及輸出部111。以下,對于圖1所示的內(nèi)容檢索裝置100的各結(jié)構的詳細情況依次說明。內(nèi)容數(shù)據(jù)庫101是存儲作為檢索對象的活動圖像、圖像、音樂、文本等內(nèi)容、以及表示該內(nèi)容的數(shù)據(jù)的內(nèi)容附屬信息的數(shù)據(jù)庫。這里,所謂內(nèi)容附屬信息,是指關鍵字、內(nèi) 容屬性等表示內(nèi)容的數(shù)據(jù)的信息。另外,所謂內(nèi)容屬性,是指用來將內(nèi)容分類的目錄信息。 例如,在有關電視節(jié)目的內(nèi)容的情況下,記載在EPG(電子節(jié)目指南Electronic Program Guide)中的“類別”為內(nèi)容屬性。在圖2中表示存儲在內(nèi)容數(shù)據(jù)庫中的內(nèi)容附屬信息的一例。內(nèi)容數(shù)據(jù)庫101除了 活動圖像等內(nèi)容以外,還存儲包括圖2所示那樣的內(nèi)容ID20、內(nèi)容屬性21、標題22、播放日 23、關鍵字24、概要25的內(nèi)容附屬信息。播放日23是表示關于內(nèi)容的時間的信息的時間信 息的一例。這里,所謂時間信息,是表示關于內(nèi)容的時間的信息。另外,時間信息并不必須是 播放日,也可以是內(nèi)容被登錄到內(nèi)容數(shù)據(jù)庫101中的日期時間等。關鍵字24是表示內(nèi)容的 數(shù)據(jù)的單詞(關鍵字)。例如,在關鍵字24中,存儲有預先附屬于EPG的關鍵字。此外,在 關鍵字24中,也可以存儲通過對標題22或概要25執(zhí)行形態(tài)要素解析等而提取的關鍵字。詞典數(shù)據(jù)庫102是存儲了內(nèi)容數(shù)據(jù)庫101所存儲的關鍵字間的關聯(lián)度等的數(shù)據(jù) 庫。具體而言,詞典數(shù)據(jù)庫102存儲關聯(lián)語詞典102a,該關聯(lián)語詞典102a按用來將內(nèi)容分 類的內(nèi)容屬性、以及按表示規(guī)定的時間區(qū)間的關聯(lián)區(qū)間,記述了作為由時間信息表示的時 間包含在該關聯(lián)區(qū)間中的內(nèi)容且屬于由內(nèi)容屬性表示的分類的內(nèi)容所對應的多個關鍵字 間的關聯(lián)度。該關聯(lián)語詞典102a能夠在內(nèi)容屬性內(nèi)及內(nèi)容屬性間,使用時間的長度不同的 關聯(lián)區(qū)間存儲關鍵字間的關聯(lián)度。另外,所謂關聯(lián)區(qū)間,是指用來計算關鍵字間的關聯(lián)度的 時間區(qū)間。在圖3中表示在內(nèi)容數(shù)據(jù)庫101中存在“新聞”、“體育”、“綜藝”以及“趣味·教 養(yǎng)”這4個內(nèi)容屬性的內(nèi)容的情況下的關聯(lián)語詞典102a的概念圖。如圖3所示,關聯(lián)語詞典 102a被分類為4個內(nèi)容屬性。并且,在各內(nèi)容屬性內(nèi),如區(qū)間詞典31 (Ni)、區(qū)間詞典32 (N2) 等那樣,存儲有關聯(lián)區(qū)間的時間的長度不同的區(qū)間詞典。此外,各關聯(lián)區(qū)間按各內(nèi)容屬性 (“新聞”、“體育”、“綜藝”以及“趣味·教養(yǎng)”)而時間的長度不同。在圖4中,表示存儲在詞典數(shù)據(jù)庫102中的關聯(lián)語詞典102a的一例。如圖4所示, 在關聯(lián)語詞典102a中,包括內(nèi)容屬性41、內(nèi)容區(qū)間42、關鍵字43、關聯(lián)關鍵字44、關聯(lián)度 45。例如,在內(nèi)容屬性41是“新聞”的情況下,與關聯(lián)區(qū)間42為“2007/9/10 2007/9/12” 的關鍵字43 “新聞”有關聯(lián)的關聯(lián)關鍵字44 “秋”的關聯(lián)度45是“0.94”。通過參照圖4 所示那樣的關聯(lián)語詞典102a,關聯(lián)關鍵字取得部109能夠取得對應于用戶選擇的關鍵字的 關聯(lián)關鍵字。圖1所示的輸入部103接受關于用戶的操作輸入及內(nèi)容數(shù)據(jù)庫的更新的信息,將 接受到的信息通知給輸入選別部104。輸入選別部104對從輸入部103接受到的信息是表示“關鍵字選擇”、“內(nèi)容選擇”、 以及“內(nèi)容數(shù)據(jù)庫更新”的哪種處理的信息進行選別。關于選別方法在后面敘述。內(nèi)容數(shù)據(jù)庫更新部105在輸入選別部104將從輸入部103接受到的信息選別為 “內(nèi)容數(shù)據(jù)庫更新”的情況下,更新存儲在內(nèi)容數(shù)據(jù)庫101中的內(nèi)容及內(nèi)容附屬信息。另外,內(nèi)容數(shù)據(jù)庫更新部105將內(nèi)容服務器分發(fā)的所有取得對象數(shù)據(jù)復制到內(nèi)容 數(shù)據(jù)庫101中。即,將更新以前保持的數(shù)據(jù)先全部刪除,新進行覆蓋。例如,在將本發(fā)明用于電視廣播的試聽預約用途的情況下,根據(jù)電視廣播的數(shù)據(jù) 庫特性(沒有播放日以前的數(shù)據(jù)),僅將更新日期時間以后的數(shù)據(jù)儲存到設備側(cè)的內(nèi)容數(shù)據(jù)庫101中。另一方面,在VOD(視頻點播Videoon Demand)那樣的蓄積型內(nèi)容的情況下, 在將內(nèi)容從作為取得對象的內(nèi)容服務器刪除時,從設備側(cè)的內(nèi)容數(shù)據(jù)庫101中也將內(nèi)容刪除。關聯(lián)區(qū)間計算部106在內(nèi)容數(shù)據(jù)庫更新部105更新了內(nèi)容數(shù)據(jù)庫101的情況下, 通過參照內(nèi)容數(shù)據(jù)庫101及詞典數(shù)據(jù)庫102,按內(nèi)容屬性計算新的關聯(lián)區(qū)間。具體而言,關 聯(lián)區(qū)間計算部106按內(nèi)容屬性,計算表示新存儲到內(nèi)容數(shù)據(jù)庫101中的內(nèi)容(第1內(nèi)容) 的數(shù)據(jù)的多個關鍵字(第1關鍵字)、與表示已經(jīng)存儲在內(nèi)容數(shù)據(jù)庫101中的內(nèi)容(第2內(nèi) 容)的數(shù)據(jù)的多個關鍵字(第2關鍵字)之間的差異度。并且,關聯(lián)區(qū)間計算部106根據(jù) 計算出的第1關鍵字與第2關鍵字的差異度是否滿足規(guī)定基準值,計算新的關聯(lián)區(qū)間。艮口, 關聯(lián)區(qū)間計算部106計算新的關聯(lián)區(qū)間,以使得第1關鍵字與第2關鍵字的差異度越小則 第1內(nèi)容與第2內(nèi)容越包含在相同的時間區(qū)間中。另外,關聯(lián)區(qū)間的詳細的計算方法在后 面敘述。詞典更新部107在包含在關聯(lián)區(qū)間計算部106計算出的新的關聯(lián)區(qū)間中的內(nèi)容 中,計算關鍵字間的關聯(lián)度。并且,詞典更新部107將計算出的新的關聯(lián)區(qū)間的關聯(lián)度與關 鍵字及關聯(lián)關鍵字一起登錄到關聯(lián)語詞典102a中。另外,關鍵字間的關聯(lián)度根據(jù)單詞的同 現(xiàn)度(兩個單詞相互出現(xiàn)在同一內(nèi)容中的程度)計算。因而,在同一內(nèi)容之中,越是同時出 現(xiàn)的次數(shù)多的關鍵字的組合,關聯(lián)度的值越大。例如,詞典更新部107利用記載在非專利文 獻《用于根據(jù)在文件中出現(xiàn)的單詞間的關聯(lián)性的聯(lián)想檢索的元數(shù)據(jù)空間生成方式》(本間秀 典等,第16次數(shù)據(jù)工學研究會(DEWS2005),6A-o2,電子信息通信學會,2005)中的方法等計 算關鍵字間的關聯(lián)度。屬性取得部108在輸入選別部104將從輸入部103接受到的信息選別為“關鍵字 選擇”的情況下,取得用戶在輸入部103中選擇的關鍵字的內(nèi)容屬性。內(nèi)容屬性的判斷方法 在后面敘述。關聯(lián)關鍵字取得部109通過參照關聯(lián)語詞典102a,取得屬性取得部108所取得的 內(nèi)容屬性、以及對應于用戶在輸入部103中選擇的關鍵字的關聯(lián)關鍵字及關聯(lián)度。輸出生成部110在輸入選別部104將從輸入部103接受到的信息選別為“關鍵字 選擇”的情況下,生成用來將由關聯(lián)關鍵字取得部109取得的關聯(lián)關鍵字按關聯(lián)區(qū)間對應于 關聯(lián)度顯示的輸出信息。例如,輸出生成部110生成用來從關聯(lián)度高的關聯(lián)關鍵字開始依 次顯示的輸出信息。此外,例如輸出生成部110也可以生成關聯(lián)度越高的關聯(lián)關鍵字用越 大的字符顯示的輸出信息。此外,輸出生成部Iio在輸入選別部104將從輸入部103接受 到的信息選別為“內(nèi)容選擇”的情況下,生成用來表示對應于用戶在輸入部103中輸入的信 息的節(jié)目等內(nèi)容的輸出信息。輸出部111將輸出生成部110生成的輸出信息向輸出媒體輸出。作為輸出媒體, 例如使用電視機等監(jiān)視器。接著,對以上那樣構成的內(nèi)容檢索裝置100的動作進行說明。圖5是表示圖1的內(nèi)容檢索裝置100執(zhí)行的整體處理的流程的流程圖。首先,輸入部103接受來自用戶的操作輸入,將接受到的信息通知給輸入選別部 104 (步驟S101)。接著,輸入選別部104對從輸入部103通知的信息是表示“關鍵字選擇”、 “內(nèi)容選擇”及“內(nèi)容數(shù)據(jù)庫更新”的哪種處理的信息(步驟S102)進行選別。
這里,在輸入選別部104將從輸入部103接受到的信息選別為“關鍵字選擇”的情 況下(步驟S103的是),屬性取得部108取得用戶在輸入部103中選擇的關鍵字及關鍵字 的內(nèi)容屬性(步驟S108)。接著,關聯(lián)關鍵字取得部109根據(jù)所取得的內(nèi)容屬性和關聯(lián)語詞 典102a,取得關聯(lián)關鍵字(步驟S109)。接著,輸出生成部110生成用來將所取得的關聯(lián)關 鍵字輸出的輸出信息(步驟S110)。最后,輸出部111將輸出生成部110生成的輸出信息輸 出給輸出媒體(步驟S111),結(jié)束處理。另一方面,在輸入選別部104沒有將從輸入部103接受到的信息選別為“關鍵字選 擇”的情況下(步驟S103的否),輸入選別部104判斷是否將從輸入部103接受到的信息 選別為“數(shù)據(jù)庫更新”(步驟S104)。這里,在輸入選別部104將從輸入部103接受到的信息選別為“數(shù)據(jù)庫更新”的情 況下(步驟S104的是),內(nèi)容數(shù)據(jù)庫更新部105將內(nèi)容數(shù)據(jù)庫101更新(步驟S105)。接 著,關聯(lián)區(qū)間計算部106計算設定在關聯(lián)語詞典102a中的關聯(lián)區(qū)間(步驟S106)。另外,步 驟S106的詳細的處理流程在后面敘述。并且,根據(jù)計算出的關聯(lián)區(qū)間,詞典更新部107將 關聯(lián)語詞典102a更新(步驟S107),結(jié)束處理。另一方面,在輸入選別部104沒有將從輸入部103接受到的信息選別為“數(shù)據(jù)庫更 新”的情況下(步驟S104的否),即在選別為“內(nèi)容選擇”的情況下,輸出生成部110生成 用來顯示對應于用戶在輸入部103中輸入的信息的節(jié)目的輸出信息(步驟S110)。接著,輸 出部111將輸出生成部110生成的輸出信息輸出給輸出媒體(步驟S111),結(jié)束處理。圖6是表示關聯(lián)區(qū)間計算部106進行的關于關聯(lián)區(qū)間計算的處理(圖5所示的步 驟S106)的流程的流程圖。首先,關聯(lián)區(qū)間計算部106按內(nèi)容屬性取得在關聯(lián)語詞典102a中上次更新的關聯(lián) 區(qū)間(以下稱作上次更新區(qū)間)(步驟S201)。接著,關聯(lián)區(qū)間計算部106按內(nèi)容屬性制作 作為取得的上次更新區(qū)間的關鍵字的一覽的關鍵字列表(步驟S202)。另外,上次更新區(qū) 間的關鍵字對應于表示存儲在內(nèi)容數(shù)據(jù)庫101中的第2內(nèi)容的數(shù)據(jù)的多個第2關鍵字。接 著,關聯(lián)區(qū)間計算部106按內(nèi)容屬性取得作為新追加到內(nèi)容數(shù)據(jù)庫101中的內(nèi)容的關鍵字 的一覽的關鍵字列表(步驟S203)。另外,新追加的內(nèi)容的關鍵字對應于表示存儲在內(nèi)容數(shù) 據(jù)庫101中的第1內(nèi)容的數(shù)據(jù)的多個第1關鍵字。接著,關聯(lián)區(qū)間計算部106將在步驟S202中制作的關鍵字列表與在步驟S203中 制作的關鍵字列表比較,計算關鍵字結(jié)構的變化率(步驟S204)。另外,關鍵字結(jié)構的變化 率是差異度的一例。這里,在計算出的變化率超過規(guī)定的閾值的情況下(步驟S205的是),關聯(lián)區(qū)間計 算部106計算對應于新追加到內(nèi)容數(shù)據(jù)庫101中的內(nèi)容的時間區(qū)間作為新的關聯(lián)區(qū)間(步 驟S206)。即,關聯(lián)區(qū)間計算部106計算對應于第1內(nèi)容的時間區(qū)間作為新的關聯(lián)區(qū)間。另 外,所謂對應于內(nèi)容的時間區(qū)間,表示包含該內(nèi)容的時間信息表示的時間的時間區(qū)間。例 如,在將2007年9月10日及11日播放的內(nèi)容新追加到內(nèi)容數(shù)據(jù)庫101中的情況下,對應 于內(nèi)容的時間區(qū)間是2007年9月10日 11日。另一方面,在計算出的變化率是規(guī)定的閾值以下的情況下(步驟S205的否),關 聯(lián)區(qū)間計算部106計算將上次更新區(qū)間與對應于新追加到內(nèi)容數(shù)據(jù)庫101中的內(nèi)容的時間 區(qū)間相加后的時間區(qū)間作為新的關聯(lián)區(qū)間(步驟S207)。即,關聯(lián)區(qū)間計算部106計算包含對應于第1內(nèi)容的時間區(qū)間和包含對應于第2內(nèi)容的時間區(qū)間的時間區(qū)間作為新的關聯(lián) 區(qū)間。在這樣通過關聯(lián)區(qū)間計算部106計算關聯(lián)區(qū)間之后,執(zhí)行圖5所示的步驟S107的處理。圖7是表示關聯(lián)區(qū)間計算部106進行的關于變化率的計算的處理(圖6所示的步 驟S204)的流程的流程圖。首先,關聯(lián)區(qū)間計算部106從在步驟S203中制作的追加內(nèi)容的關鍵字列表中,取 得還沒有執(zhí)行以下的處理(步驟S302 S308)的關鍵字(新關鍵字候選)(步驟S301)。 進而,關聯(lián)區(qū)間計算部106從在步驟S202中制作的上次更新區(qū)間的關鍵字列表中取得還沒 有執(zhí)行以下的處理(步驟S303 S305)的關鍵字(比較關鍵字)(步驟S302)。接著,關聯(lián)區(qū)間計算部106判斷在步驟S301及步驟S302中取得的新關鍵字候選 與比較關鍵字是否部分一致(步驟S303)。另外,所謂部分一致,是指在4字符以上的關鍵 字中、8成(80%)以上的字符數(shù)的字符一致。這里,在新關鍵字候選與比較關鍵字部分一致的情況下(步驟S303的是),關聯(lián)區(qū) 間計算部106將新關鍵字候選判斷為不是新關鍵字(步驟S308)。另一方面,在新關鍵字候 選與比較關鍵字沒有部分一致的情況下(步驟S303的否),關聯(lián)區(qū)間計算部106判斷新關 鍵字候選與比較關鍵字是否是近義詞一致(步驟S304)。另外,所謂近義詞一致,是指新關 鍵字候選的近義詞與比較關鍵字一致。這里,在新關鍵字候選與比較關鍵字為近義詞一致的情況下(步驟S304的是),關 聯(lián)區(qū)間計算部106將新關鍵字候選判斷為不是新關鍵字(步驟S308)。另一方面,在新關鍵 字候選不與比較關鍵字為近義詞一致的情況下(步驟S304的否),關聯(lián)區(qū)間計算部106判 斷新關鍵字候選與比較關鍵字是否為記述變動一致(步驟S305)。另外,所謂記述變動一 致,是指將新關鍵字候選使用平假名、片假名、漢字或羅馬字替換后的關鍵字與比較關鍵字 一致。這里,在新關鍵字候選與比較關鍵字候選為表述差異一致的情況下(步驟S305的 是),關聯(lián)區(qū)間計算部106將新關鍵字候選判斷為不是新關鍵字(步驟S308)。另一方面, 在新關鍵字候選與比較關鍵字不為記述變動一致的情況下(步驟S305的否),關聯(lián)區(qū)間計 算部106判斷是否已取得了包含在上次更新區(qū)間的關鍵字列表中的所有的關鍵字(步驟 S306)。這里,在沒有取得包含在上次更新區(qū)間的關鍵字列表中的所有關鍵字的情況下 (步驟S306的否),再次從步驟S302的關鍵字的取得開始重復處理。另一方面,在取得了 包含在上次更新區(qū)間的關鍵字列表中的所有關鍵字的情況下(步驟S306的是),關聯(lián)區(qū)間 計算部106將新關鍵字候選判斷為是新關鍵字(步驟S307)。接著,關聯(lián)區(qū)間計算部106判斷是否已取得了包含在追加內(nèi)容的關鍵字列表中的 所有的關鍵字(步驟S309)。這里,在沒有取得包含在追加內(nèi)容的關鍵字列表中的所有關鍵 字的情況下(步驟S309的否),再次從步驟S301的關鍵字的取得開始重復處理。另一方 面,在取得了包含在追加內(nèi)容的關鍵字列表中的所有的關鍵字的情況下(步驟S309的是), 關聯(lián)區(qū)間計算部106通過將在步驟S307中判斷為是新關鍵字的關鍵字的數(shù)量用包含在上 次更新區(qū)間的關鍵字列表中的關鍵字的數(shù)量除,由此計算變化率(步驟S310)。在這樣通過關聯(lián)區(qū)間計算部106計算出關聯(lián)區(qū)間之后,執(zhí)行圖5所示的步驟S107的處理。接著,利用圖8 圖10對內(nèi)容檢索裝置100輸出的畫面進行說明。圖8 圖10 是表示用戶想要從可視聽的電視節(jié)目之中視聽與新聞節(jié)目關聯(lián)的節(jié)目的情況下的、內(nèi)容檢 索所輸出的畫面的轉(zhuǎn)變的圖。在檢索開始時,內(nèi)容檢索裝置100對用戶提示圖8所示的初始檢索畫面。在該初始 檢索畫面之中提示的初始檢索關鍵字例如是“體育”、“記錄片”等表示類別的關鍵字。用戶 在想要從提示的關鍵字之中觀看新聞節(jié)目的情況下,從初始檢索關鍵字之中選擇“新聞”。圖9是在用戶選擇了初始檢索關鍵字之后、內(nèi)容檢索裝置100提示的檢索畫面。 在該檢索畫面中,分別提示關于所選擇的關鍵字(新聞)的內(nèi)容列表70及關聯(lián)關鍵字列表 71。另外,在關聯(lián)關鍵字列表71中,按關聯(lián)區(qū)間,以關聯(lián)度從高到低的順序提示關聯(lián)關鍵 字。用戶在該檢索畫面中有想要觀看的內(nèi)容的情況下,從內(nèi)容列表70之中選擇內(nèi)容。 另一方面,用戶在該檢索畫面中沒有想要觀看的內(nèi)容的情況下,從關聯(lián)關鍵字列表71之中 選擇與想要觀看的內(nèi)容關聯(lián)的關鍵字。在圖9所示的檢索畫面中,在用戶從內(nèi)容列表70之中選擇了內(nèi)容的情況下,內(nèi)容 檢索裝置100顯示所選擇的內(nèi)容,結(jié)束檢索處理。另一方面,在用戶從關聯(lián)關鍵字列表71 之中選擇了任意的關聯(lián)關鍵字的情況下,內(nèi)容檢索裝置100根據(jù)所選擇的關鍵字,再次提 示顯示有內(nèi)容列表和關聯(lián)關鍵字的畫面。例如,在圖9所示的檢索畫面中,在用戶從關聯(lián)關 鍵字列表71之中選擇了國會72的情況下,如圖10所示,內(nèi)容檢索裝置100按關聯(lián)區(qū)間提 示關于“國會”的內(nèi)容和與“國會”關聯(lián)的關鍵字。以上,用戶一邊反復進行系統(tǒng)提示的關聯(lián)關鍵字的選擇,一邊檢索自己想要觀看 的內(nèi)容。接著,利用圖8 圖10所示的畫面,對圖5及圖6所示的內(nèi)容檢索裝置100的處 理更具體地說明。在圖5的步驟SlOl中,輸入部103接受用戶向系統(tǒng)的輸入信息。具體而言,用戶 在圖8的初始檢索畫面中選擇的“新聞”、在圖9的檢索畫面中選擇的“國會”等關鍵字成為 輸入信息。此外,用戶從圖9所示的內(nèi)容列表70選擇的內(nèi)容也成為輸入信息。進而,雖然 沒有圖示,但在用戶選擇了內(nèi)容數(shù)據(jù)庫更新的情況下,該選擇也成為輸入信息。另外,在本實施方式中,在有用戶的輸入的情況下,內(nèi)容檢索裝置100將內(nèi)容數(shù)據(jù) 庫101更新,但也可以是內(nèi)容檢索裝置100在任意的時間更新內(nèi)容數(shù)據(jù)庫101。此外,也可 以是,如果與內(nèi)容檢索裝置100不同的其他裝置對內(nèi)容檢索裝置請求內(nèi)容數(shù)據(jù)庫101的更 新,則內(nèi)容檢索裝置100將內(nèi)容數(shù)據(jù)庫101更新。在這樣的情況下,向內(nèi)容數(shù)據(jù)庫101的新 內(nèi)容的輸入成為輸入信息。在圖5的步驟S102中,輸入選別部104將從步驟SlOl接受到的輸入信息選別為 “關鍵字選擇”、“內(nèi)容選擇”及“內(nèi)容數(shù)據(jù)庫更新”的某個。具體而言,例如在圖9的檢索畫 面中、用戶從關聯(lián)關鍵字列表71之中選擇了某個關鍵字的情況下選別為“關鍵字選擇”。此 外,例如在圖9的檢索畫面中、用戶從內(nèi)容列表70之中選擇了某個內(nèi)容的情況下選別為“內(nèi) 容選擇”。此外,例如雖然沒有圖示、但在用戶選擇了內(nèi)容數(shù)據(jù)庫的更新的情況下選別為“內(nèi) 容數(shù)據(jù)庫更新”。
在圖5的步驟S103中,輸入選別部104判斷步驟S 102中的選別是否是“關鍵字 選擇”。這里,在輸入選別部104判斷從輸入部103接受到的信息是“關鍵字選擇”的情況 下,輸入選別部104將對應的選擇關鍵字向?qū)傩匀〉貌?08傳遞。并且,處理向步驟S108前 進。另一方面,在輸入選別部104沒有將從輸入部103接受到的信息判斷為“關鍵字選擇” 的情況下,處理向步驟S104前進。具體而言,例如在用戶在圖8的初始檢索畫面中選擇了 關鍵字“新聞”的情況下,或者用戶在圖9的檢索畫面中選擇了關鍵字“國會”的情況下,輸 入選別部104都選別為“關鍵字選擇”。并且,輸入選別部104將關鍵字“新聞”或“國會” 向?qū)傩匀〉貌?08傳遞。并且,處理前進到步驟S108。在圖5的步驟S104中,輸入選別部104判斷步驟S102中的選別是否是“內(nèi)容數(shù) 據(jù)庫更新”。這里,在輸入選別部104將從輸入部103接受到的信息判斷為“內(nèi)容數(shù)據(jù)庫更 新”的情況下,處理向步驟S105前進。另一方面,在輸入選別部104將從輸入部103接受到 的信息判斷為不是“內(nèi)容數(shù)據(jù)庫更新”的情況下,即在輸入選別部104在步驟S102中將從 輸入部103接受到的信息選別為“內(nèi)容選擇”的情況下,輸入選別部104從內(nèi)容數(shù)據(jù)庫101 中取得對應于用戶選擇的內(nèi)容的內(nèi)容ID。接著,輸入選別部104將取得的內(nèi)容ID向輸出 生成部110傳遞。然后,處理向步驟S 109前進。例如,在圖10的檢索畫面中用戶選擇了 “周日記錄片”的節(jié)目的情況下,輸入選別部104從內(nèi)容數(shù)據(jù)庫101取得對應于所選擇的節(jié) 目的內(nèi)容ID,將所取得的內(nèi)容ID向輸出生成部110傳遞。然后,處理向步驟SllO前進。另 一方面,在用戶沒有選擇節(jié)目的情況下,即在選擇了內(nèi)容數(shù)據(jù)庫更新的情況下,輸入選別部 104將更新數(shù)據(jù)向內(nèi)容數(shù)據(jù)庫更新部105傳遞。接著,處理向步驟S105前進。在圖5的步驟S105中,內(nèi)容數(shù)據(jù)庫更新部105將通過步驟S104的處理取得的更 新數(shù)據(jù)追加到內(nèi)容數(shù)據(jù)庫101中。在圖5的步驟S106中,關聯(lián)區(qū)間計算部106根據(jù)在步驟S 105中內(nèi)容數(shù)據(jù)庫更新 部105新追加到內(nèi)容數(shù)據(jù)庫101中的更新數(shù)據(jù)計算關聯(lián)區(qū)間。這里,以下詳細敘述步驟S106中的處理。在圖6的步驟S201中,關聯(lián)區(qū)間計算部106按“新聞”及“體育”等內(nèi)容屬性取得 包含在關聯(lián)語詞典102a中的上次更新的關聯(lián)區(qū)間。具體而言,關聯(lián)區(qū)間計算部106從存儲 在圖4所示的關聯(lián)語詞典102a中的數(shù)據(jù)之中,按內(nèi)容屬性取得最新的關聯(lián)區(qū)間42。另外, 如圖11(a)所示,將這里取得的關聯(lián)區(qū)間設為上次更新區(qū)間1001(tn-2 tn-1)。接著,在圖6的步驟S202中,關聯(lián)區(qū)間計算部106按內(nèi)容屬性制作包含于在步驟 S201中取得的關聯(lián)區(qū)間中的內(nèi)容的關鍵字列表。具體而言,例如關聯(lián)區(qū)間計算部106參照 圖4所示的關聯(lián)語詞典102a并按內(nèi)容屬性取得對應于上次更新區(qū)間1001的關鍵字43即 可。接著,在圖6的步驟S203中,關聯(lián)區(qū)間計算部106按內(nèi)容屬性制作對應于在圖5 的步驟S104中取得的更新數(shù)據(jù)的關鍵字列表。如上所述,通過圖6的步驟S201 S203的處理,按內(nèi)容屬性,制作上次更新區(qū)間 中的關鍵字列表和對應于此次新更新的內(nèi)容的關鍵字列表。接著,在圖6的步驟S204中,關聯(lián)區(qū)間計算部106將在步驟S202中制作的關鍵字 列表與在步驟S203中制作的關鍵字列表比較,計算關鍵字結(jié)構的變化率。這里,所謂關鍵 字結(jié)構的變化率,是差異度的一例。具體而言,是以此次新更新的內(nèi)容的關鍵字中的、沒有包含在有關上次更新區(qū)間1001中的關鍵字列表中的的關鍵字的數(shù)量為分子、以包含在有 關上次更新區(qū)間1001中的關鍵字列表中的關鍵字的數(shù)量為分母來計算的值。例如,在從在 步驟S203中制作的此次新更新的內(nèi)容得到的關鍵字列表中的、沒有包含在上次更新區(qū)間 1001的關鍵字列表中的新的關鍵字的數(shù)量是40個、包含在上次更新區(qū)間1001的關鍵字列 表中的關鍵字的數(shù)量是200個的情況下,關鍵字結(jié)構的變化率為0. 2。另外,新的關鍵字的 數(shù)量根據(jù)圖7所示的處理計算。接著,在圖6的步驟S205中,關聯(lián)區(qū)間計算部106判斷在步驟S204中取得的關鍵 字結(jié)構的變化率是否超過規(guī)定的閾值。在圖6的步驟S205中判斷為變化率是規(guī)定的閾值 以上的情況下,在圖6的步驟S206中,關聯(lián)區(qū)間計算部106僅計算對應于新追加的內(nèi)容的 時間區(qū)間作為新的關聯(lián)區(qū)間。另一方面,在圖6的步驟S205中判斷變化率低于規(guī)定的閾值的情況下,在圖6的 步驟S206中,關聯(lián)區(qū)間計算部106計算將上次更新的區(qū)間與對應于此次新更新的內(nèi)容的時 間區(qū)間相加后的時間區(qū)間作為新的關聯(lián)區(qū)間。具體而言,在將對應于此次新更新的內(nèi)容的時間區(qū)間設為追加區(qū)間1002(tn-l tn)的情況下,關聯(lián)區(qū)間計算部106在關鍵字結(jié)構的變化率是閾值以上時,如圖11(b)所示, 計算與追加區(qū)間1002相同的新關聯(lián)區(qū)間1003(tn-l tn)作為新的關聯(lián)區(qū)間,當變化率低 于閾值時,如圖11(c)所示,計算將上次更新區(qū)間1001與追加區(qū)間1002相加后的新關聯(lián)區(qū) 間1004(tn-2 tn)作為新的關聯(lián)區(qū)間。另外,一般關鍵字結(jié)構的變化率變大的頻度根據(jù)內(nèi)容屬性不同而大為不同。例如, 由于“新聞”等時事性較高的內(nèi)容每天提供新的話題,所以關鍵字結(jié)構的變化率變大的時間 間隔變短。另一方面,“綜藝”及“體育”等內(nèi)容與“新聞”相比,關鍵字結(jié)構的變化率變大的 時間間隔變長。這是因為體育內(nèi)容按季節(jié)較大地變化這一點、綜藝內(nèi)容每3個月一次進行 節(jié)目改編這一點等。如果關鍵字結(jié)構變化,則關鍵字間的關聯(lián)度也變化。因而,為了提示具 有時事性的關鍵字,內(nèi)容檢索裝置100優(yōu)選地使用根據(jù)關鍵字結(jié)構的變化來變更關聯(lián)區(qū)間 的關聯(lián)語詞典102a,從而生成關聯(lián)關鍵字。如上所述,由于關聯(lián)區(qū)間計算部106能夠根據(jù)各 屬性的關鍵字結(jié)構的變化率計算關聯(lián)區(qū)間,所以內(nèi)容檢索裝置100能夠提示具有時事性的 關鍵字。通過進行以上的圖6所示的步驟S201 S207的處理,在圖5的步驟S106中,關 聯(lián)區(qū)間計算部106能夠計算對應于新追加到內(nèi)容數(shù)據(jù)庫101中的內(nèi)容的關聯(lián)語詞典102a 的關聯(lián)區(qū)間。另外,在上述圖6的步驟S204的說明中,關于包含在兩個比較的關鍵字列表中的 關鍵字的數(shù)量并沒有特別規(guī)定,但也可以僅將出現(xiàn)頻度高的規(guī)定數(shù)量的關鍵字作為對象來 計算變化率。具體而言,關聯(lián)區(qū)間計算部106將在步驟S202中制作的關鍵字列表中出現(xiàn) 頻度從高開始的η個關鍵字、與在步驟S203中制作的關鍵字列表中出現(xiàn)頻度從高開始的η 個關鍵字比較,計算關鍵字結(jié)構的變化率。例如,在步驟S203中制作的關鍵字列表之中出 現(xiàn)頻度從高開始的100個關鍵字中的、沒有包含在上次更新區(qū)間的關鍵字列表中出現(xiàn)頻度 從高開始的100個關鍵字中的新的關鍵字的數(shù)量是40個的情況下,關鍵字結(jié)構的變化率為 0. 4。此外,在上述圖6的步驟S201中,關聯(lián)區(qū)間計算部106取得了關聯(lián)語詞典102a的最新的關聯(lián)區(qū)間作為上次更新區(qū)間,但也可以將對應于在內(nèi)容數(shù)據(jù)庫101中上次更新的內(nèi) 容的時間區(qū)間中包含的、規(guī)定長度的時間區(qū)間設為上次更新區(qū)間。具體而言,在圖12(a)所 示那樣的情況下,關聯(lián)區(qū)間計算部106取得圖12(b)所示的關鍵字比較區(qū)間1103 (tn-2 tn-Ι)。即,在對應于在內(nèi)容數(shù)據(jù)庫101中上次更新的內(nèi)容的時間區(qū)間即上次內(nèi)容更新區(qū)間 1101 (tn-3 tn-Ι)是最小時間單位的2倍的長度的時間區(qū)間的情況下,關聯(lián)區(qū)間計算部 106從上次內(nèi)容更新區(qū)間中的接近于追加區(qū)間1102 —方取得最小時間單位量的時間區(qū)間。最小時間單位中的變化率的比較可以設定對應于關鍵字關聯(lián)度的細微變化的關 聯(lián)區(qū)間。由此,例如在內(nèi)容的數(shù)據(jù)變化的頻度整體上較高的博客(blog)等的內(nèi)容的檢索 中,內(nèi)容檢索裝置能夠總是將新的關聯(lián)關鍵字提示給用戶。接著,在圖5的步驟S107中,詞典更新部107根據(jù)在步驟S105中計算出的關聯(lián)區(qū) 間,更新關聯(lián)語詞典。詞典制作方法如圖1中說明那樣的。在圖5的步驟S108中,屬性取得部108判斷在步驟S103中取得的關鍵字的內(nèi)容屬 性。并且,屬性取得部108將關鍵字和判斷的內(nèi)容屬性向關聯(lián)關鍵字取得部109傳遞。然 后,處理向步驟S109前進。作為內(nèi)容屬性的判斷的具體例,在圖8的初始檢索畫面中提示 的關鍵字是與內(nèi)容屬性共通的關鍵字的情況下,屬性取得部108只要將用戶在初始檢索畫 面中選擇的關鍵字判斷為內(nèi)容屬性就可以。此外,在圖8所示的初始檢索畫面中選擇了“新 聞”的情況下,在圖9所示的檢索畫面中,將用戶選擇的關聯(lián)關鍵字的內(nèi)容屬性判斷為“新 聞”。這成為將最先選擇的“體育”的內(nèi)容屬性的內(nèi)容縮減的檢索,在縮減檢索的情況下是 有效的。在圖5的步驟S109中,關聯(lián)關鍵字取得部109通過參照詞典數(shù)據(jù)庫102,取得對應 于在步驟S103中取得的關鍵字和在步驟S108中取得的關鍵字屬性的關聯(lián)關鍵字。并且, 關聯(lián)關鍵字取得部109將所取得的關聯(lián)關鍵字向輸出生成部110傳遞。然后,處理向步驟 SllO前進。具體而言,例如在用戶在圖8的初始檢索畫面中選擇“新聞”、接著在圖9的檢 索畫面中選擇了“國會”的情況下,屬性取得部108將關鍵字屬性判斷為“新聞”。并且,關 聯(lián)關鍵字取得部109通過參照圖4所示的關聯(lián)語詞典102a,從對應于內(nèi)容屬性“新聞”和關 鍵字“國會”的關聯(lián)關鍵字之中,取得關聯(lián)度45的值高的關鍵字。例如,關聯(lián)關鍵字取得部 109在2007年9月10日至12日的關聯(lián)區(qū)間中,取得關鍵字“首相演說”、“政治”及“年金”。在圖5的步驟SllO中,輸出生成部110在步驟S109中取得了關聯(lián)關鍵字的情況 下,使用所取得的關聯(lián)關鍵字和內(nèi)容數(shù)據(jù)庫101,生成例如用來輸出圖9所示那樣的檢索畫 面的輸出信息。另一方面,在步驟S104中取得了內(nèi)容ID的情況下,輸出生成部110使用所 取得的內(nèi)容ID和內(nèi)容數(shù)據(jù)庫101生成用來顯示內(nèi)容的輸出信息。在圖5的步驟Slll中,輸出部111將在步驟SllO中生成的輸出信息輸出給監(jiān)視器等。通過執(zhí)行以上的步驟SlOl 步驟Slll的處理,內(nèi)容檢索裝置100能夠參照關聯(lián) 區(qū)間按內(nèi)容屬性不同而不同的關聯(lián)語詞典102a,所以能夠?qū)磧?nèi)容屬性不同而不同的適合 于時事性的關聯(lián)關鍵字提示給用戶。另外,在圖5的步驟S108中,屬性取得部108也可以使用與在上述中說明的方法 不同的方法取得內(nèi)容屬性。例如,屬性取得部108也可以取得存在所取得的關鍵字的內(nèi)容 屬性中的、關鍵字的出現(xiàn)頻度高的多個內(nèi)容屬性。例如,在關鍵字“國會”存在于“新聞”及“綜藝”的兩個內(nèi)容屬性中的情況下,在各內(nèi)容屬性之中,在關鍵字“國會”的出現(xiàn)頻度的位 次是規(guī)定閾值以上的時候,也可以取得兩個內(nèi)容屬性作為關鍵字屬性。在圖13中表示此情 況下輸出的畫面的一例。如圖13所示,輸出部111將對于關鍵字“國會”的關聯(lián)關鍵字,對 “新聞”及“綜藝”的各內(nèi)容屬性分別輸出。因而,用戶能夠按內(nèi)容屬性選擇關聯(lián)關鍵字。因 此,內(nèi)容檢索裝置100能夠避免用戶不想要的關聯(lián)關鍵字的提示(例如用戶想要綜藝的關 聯(lián)關鍵字,但提示了新聞的關聯(lián)關鍵字等)的情況發(fā)生。結(jié)果,內(nèi)容檢索裝置100能夠削減 用戶的檢索的返回操作數(shù)。在圖14中表示將由本實施方式的內(nèi)容檢索裝置輸出的關聯(lián)關鍵字、以及使用專 利文獻2所述的現(xiàn)有技術的固定區(qū)間輸出的關聯(lián)關鍵字并列輸出的情況下的輸出例。圖14(a)是由有關現(xiàn)有技術的內(nèi)容檢索裝置輸出的關聯(lián)關鍵字的提示畫面的一 例。如圖所示,各關聯(lián)關鍵字按將2007年8月13日 9月12日的數(shù)據(jù)以10天劃分的時 間區(qū)間121、122、123生成。圖14(b)是由有關本實施方式的內(nèi)容檢索裝置100輸出的關聯(lián)關鍵字的提示畫 面的一例。如圖所示,各關聯(lián)關鍵字在根據(jù)各屬性的關鍵字結(jié)構的變化率計算的時間區(qū)間 124、125、126 中生成。在制作關聯(lián)關鍵字的時間區(qū)間相對于數(shù)據(jù)的內(nèi)容變化的頻度較短的情況下(例 如關鍵字結(jié)構在20天中沒有變化的情況下),如圖14(a)的時間區(qū)間121及時間區(qū)間122 所示的“選舉”等那樣,內(nèi)容檢索裝置在多個時間區(qū)間中輸出相同的關鍵字。這樣的將多個 相同的關鍵字輸出到相同的畫面中造成用戶的選擇分支的范圍變窄。結(jié)果,在用戶想要選 擇其他關鍵字的情況下,產(chǎn)生多余的檢索步驟的可能性變高。另一方面,有關本實施方式的內(nèi)容檢索裝置100決定以下時間區(qū)間,該時間區(qū)間 生成對應于各內(nèi)容屬性的關鍵字結(jié)構的變化的關聯(lián)關鍵字。因而,內(nèi)容檢索裝置100能夠 使對不同的時間區(qū)間輸出多個相同的關鍵字的可能性變低。即,如圖14(b)的時間區(qū)間124 所示,關鍵字結(jié)構的變化較小的時間區(qū)間為1個時間區(qū)間124。結(jié)果,在時間區(qū)間124中提 示的關鍵字和在與時間區(qū)間124相鄰的時間區(qū)間125中提示的關鍵字為不同的關鍵字。此外,在制作關聯(lián)關鍵字的時間區(qū)間相對于數(shù)據(jù)的內(nèi)容變化的頻度較長的情況下 (例如在關鍵字結(jié)構的變化每5天發(fā)生的情況下),跨關鍵字結(jié)構變化的期間的前后關聯(lián)度 高的關鍵字被優(yōu)先地提示。因而,內(nèi)容檢索裝置不能提示適合于時事性的關鍵字。即,如圖 14(a)的時間區(qū)間123所示,與關鍵字結(jié)構變化后的適合于時事性的關鍵字“首相演說”相 比,在關鍵字結(jié)構變化前關聯(lián)度較高的關鍵字“美國”被在高位提示。在此情況下也與上述 同樣,在用戶想要選擇其他關鍵字的情況下,檢索步驟數(shù)增加的可能性變高。相對于此,有關本實施方式的內(nèi)容檢索裝置100根據(jù)關聯(lián)關鍵字結(jié)構的變化率, 按內(nèi)容屬性變更生成關聯(lián)關鍵字的時間區(qū)間。因此,內(nèi)容檢索裝置100能夠提示適合于時 事性的關聯(lián)關鍵字。即,如圖14(b)的時間區(qū)間125以及時間區(qū)間126所示,內(nèi)容檢索裝置 100能夠以關鍵字結(jié)構較大變化的2007年9月10日為邊界變更時間區(qū)間,所以在最新的時 間區(qū)間126中,能夠提示適合于時事性的關鍵字“首相演說”。如上所述,本實施方式的內(nèi)容檢索裝置根據(jù)對應于新追加的內(nèi)容與已經(jīng)存儲的內(nèi) 容之間的關鍵字結(jié)構的差異度的關聯(lián)區(qū)間,更新用來生成關聯(lián)關鍵字的關聯(lián)語詞典,所以 能夠?qū)⑦m合于時事性的關聯(lián)關鍵字高效率地提示給用戶。由此,用戶在從包含了時事性不同的多個內(nèi)容屬性的內(nèi)容的內(nèi)容數(shù)據(jù)庫中檢索內(nèi)容的情況下,通過反復進行關聯(lián)關鍵字的 選擇,能夠以對話的方式縮減內(nèi)容。(變形例1)接著,利用附圖對上述實施方式的變形例1進行說明。有關本變形例的內(nèi)容檢索裝置在內(nèi)容數(shù)據(jù)庫更新部105生成內(nèi)容屬性21這一點 上與圖1所示的有關實施方式1的內(nèi)容檢索裝置100不同。以下,對有關本變形例的內(nèi)容數(shù)據(jù)庫更新部105進行的關于內(nèi)容屬性21的生成的 處理進行說明。有關本變形例的內(nèi)容數(shù)據(jù)庫更新部105通過將存儲在內(nèi)容數(shù)據(jù)庫101中的內(nèi)容聚 類,生成“群集標簽”作為內(nèi)容屬性21。并且,內(nèi)容數(shù)據(jù)庫更新部105將生成的內(nèi)容屬性21 登錄到內(nèi)容數(shù)據(jù)庫101中。通過這樣內(nèi)容數(shù)據(jù)庫更新部105進行聚類,內(nèi)容檢索裝置例如 可以如體育類的節(jié)目集合的群集(內(nèi)容集合)或電影類的節(jié)目集合的群集等那樣將節(jié)目內(nèi) 容接近的內(nèi)容彼此分類到相同的組中。即,“群集標簽”是與EPG的“類型”同樣的信息,為 內(nèi)容屬性21的一例。另外,關于內(nèi)容數(shù)據(jù)庫更新部105執(zhí)行的聚類的具體方法,使用例如 在非專利文獻2《信息檢索和語言處理》(德永健伸,東京大學出版會,pp. 60 65,1999)) 中記載的再配置法即可。圖15表示內(nèi)容數(shù)據(jù)庫更新部105生成群集標簽作為內(nèi)容屬性21的處理的概念 圖。如圖15所示,內(nèi)容數(shù)據(jù)庫更新部105通過使用包含在存儲于內(nèi)容數(shù)據(jù)庫101中的內(nèi)容 附屬信息中的關鍵字等進行聚類,生成多個群集。并且,內(nèi)容數(shù)據(jù)庫更新部105生成對應于 所生成的群集的群集標簽。例如,內(nèi)容數(shù)據(jù)庫更新部105對群集賦予隨機生成的群集標簽 (CL1、CL2、CL3及CL4)。由此,成為對存儲在內(nèi)容數(shù)據(jù)庫101中的所有的內(nèi)容ID生成某個 群集標簽。并且,內(nèi)容數(shù)據(jù)庫更新部105將生成的群集標簽作為內(nèi)容屬性21登錄到內(nèi)容數(shù) 據(jù)庫101中。通過以上的處理,內(nèi)容數(shù)據(jù)庫更新部105能夠自動地登錄相當于EPG的“類型”的 內(nèi)容屬性21。因此,有關本變形例的內(nèi)容檢索裝置即使是沒有預先登錄內(nèi)容屬性的內(nèi)容數(shù) 據(jù)庫101也能夠輸出關聯(lián)關鍵字。另外,內(nèi)容數(shù)據(jù)庫更新部105每當數(shù)據(jù)庫更新時對新存儲到內(nèi)容數(shù)據(jù)庫101中 的更新數(shù)據(jù)生成群集標簽。此時,如圖16所示,有可能通過對應于更新數(shù)據(jù)的群集標簽 (CL21、CL22及CL23)和對于已經(jīng)存儲在內(nèi)容數(shù)據(jù)庫101中的更新前的數(shù)據(jù)的群集標簽 (CL11、CL12及CL13)中對相同的群集賦予了不同的群集標簽。例如,對于更新前的體育類 的群集賦予了群集標簽“ CLl 1 ”,而對于更新數(shù)據(jù)的體育類的群集賦予了群集標簽“ CL22 ”。 即,對于相同內(nèi)容的群集沒有賦予相同的標簽。在這樣的情況下,內(nèi)容數(shù)據(jù)庫更新部105首 先計算更新數(shù)據(jù)的各群集與更新前的數(shù)據(jù)的各群集的類似度。接著,內(nèi)容數(shù)據(jù)庫更新部105 制作類似度高的群集之間的對。然后,內(nèi)容數(shù)據(jù)庫更新部105在制作成的對中,將更新前的 群集標簽作為更新數(shù)據(jù)的群集標簽賦予。另外,關于類似度,通過例如使用各群集間的余弦 尺度或內(nèi)積的方法(非專利文獻3《信息檢索算法》,北研二等,共立出版,pp. 60 63,2002) 中記載的方法計算即可。由此,例如如能夠?qū)⑸鲜隼拥娜杭瘶撕灐癈L22”向“CL11”變換 那樣,內(nèi)容數(shù)據(jù)庫更新部105能夠在更新前后對內(nèi)容接近的群集賦予相同的群集標簽。(變形例2)
接著,利用附圖對上述實施方式的變形例2進行說明。有關本變形例的內(nèi)容檢索裝置中,由關聯(lián)區(qū)間計算部106執(zhí)行的處理的內(nèi)容與有 關實施方式1的內(nèi)容檢索裝置100不同。在內(nèi)容間關鍵字的數(shù)量大為不同的內(nèi)容數(shù)據(jù)庫101 中計算關聯(lián)區(qū)間的情況下,計算出的關聯(lián)區(qū)間被關鍵字數(shù)較大的內(nèi)容較大地影響。所以,有 關本變形例的關聯(lián)區(qū)間計算部106在圖5所示的步驟S106中,利用已經(jīng)存儲在內(nèi)容數(shù)據(jù)庫 101中的更新前的內(nèi)容與新追加到內(nèi)容數(shù)據(jù)庫101中的追加內(nèi)容的文件空間的類似度計算 關聯(lián)區(qū)間。以下,對有關本變形例的關聯(lián)區(qū)間計算部106進行的關于關聯(lián)區(qū)間的計算的處理 進行說明。圖17是表示關聯(lián)區(qū)間計算部106進行的關于關聯(lián)區(qū)間計算的處理(圖5所示的 步驟S106)的流程的流程圖。在圖17中,對于與圖6相同的步驟賦予相同的標號,省略詳 細的說明。首先,關聯(lián)區(qū)間計算部106按內(nèi)容屬性取得上次更新區(qū)間(步驟S201)。接著,關聯(lián)區(qū)間計算部106對于各內(nèi)容屬性制作所取得的上次更新區(qū)間的內(nèi)容的 文件矩陣(步驟S1701)。即,關聯(lián)區(qū)間計算部106利用表示已經(jīng)存儲在內(nèi)容數(shù)據(jù)庫中的第 2內(nèi)容的數(shù)據(jù)的多個第2關鍵字,按內(nèi)容屬性制作文件矩陣。以下,將制作出的文件矩陣稱 作文件矩陣組A。這里,所謂的文件矩陣,如圖18所示,是表示各內(nèi)容的關鍵字的頻度信息 (出現(xiàn)頻度,tf-idf等)的矩陣。接著,關聯(lián)區(qū)間計算部106對于各內(nèi)容屬性制作新追加到內(nèi)容數(shù)據(jù)庫101中的內(nèi) 容的文件矩陣(步驟S1702)。即關聯(lián)區(qū)間計算部106利用表示新存儲到內(nèi)容數(shù)據(jù)庫中的第 1內(nèi)容的數(shù)據(jù)的多個第1關鍵字,按內(nèi)容屬性制作文件矩陣。以下,將制作出的文件矩陣稱 作文件矩陣組B。接著,關聯(lián)區(qū)間計算部106從文件矩陣組A及B之中分別取得相同的內(nèi)容屬性的 文件矩陣(步驟S1703)。以下,將從文件矩陣組A及B中分別取得的各文件矩陣稱作文件 矩陣Al及Bi。在圖19中表示在步驟S1703中取得的文件矩陣A1、B1的一例。如圖所示, 在文件矩陣組A及B中,分別包含有“體育”及“電影”的內(nèi)容屬性的文件矩陣。所以,在步 驟S1703中,通過從文件矩陣組A及B中分別選擇內(nèi)容屬性是“體育”的文件矩陣,取得對 應于內(nèi)容屬性“體育”的文件矩陣Al及Bi。接著,關聯(lián)區(qū)間計算部106利用文件矩陣Al及Bl計算各文件矩陣的類似度(步 驟S1704)。關聯(lián)區(qū)間計算部106例如計算矩陣Bl的各文件矢量相對于文件矩陣Al的余弦 距離,對于文件矩陣Bl的所有的文件數(shù),計算包含余弦距離是閾值以上的文件的比例作為 類似度。這里,在計算出的類似度比規(guī)定的閾值小的情況下(步驟S1705的是),關聯(lián)區(qū)間 計算部106計算對應于新追加到內(nèi)容數(shù)據(jù)庫101中的內(nèi)容(第1內(nèi)容)的時間區(qū)間作為新 的關聯(lián)區(qū)間(步驟S206)。另一方面,在計算出的類似度是規(guī)定的閾值以上的情況下(步驟 S1705的否),關聯(lián)區(qū)間計算部106計算將對應于新追加到內(nèi)容數(shù)據(jù)庫101中的內(nèi)容的時間 區(qū)間與上次更新區(qū)間相加后的時間區(qū)間作為新的關聯(lián)區(qū)間(步驟S207)。即,關聯(lián)區(qū)間計算 部106計算將對應于第1內(nèi)容的時間區(qū)間與對應于第2內(nèi)容的時間區(qū)間相加后的時間區(qū)間 作為新的關聯(lián)區(qū)間。
接著,關聯(lián)區(qū)間計算部106判斷在步驟S1703中是否已選擇了存儲在內(nèi)容數(shù)據(jù)庫 101中的所有的內(nèi)容屬性(步驟S1706)。這里,在沒有選擇所有的內(nèi)容屬性的情況下(步驟 S1706的否),回到步驟S1703的處理。另一方面,在選擇了所有的內(nèi)容屬性的情況下(步 驟S 1706的是),執(zhí)行圖5所示的步驟S107的處理。通過進行以上的步驟S201、步驟S206、步驟S207及步驟S1701 S1706的處理, 關聯(lián)區(qū)間計算部106能夠計算對應于以內(nèi)容為單位的類似度的關聯(lián)區(qū)間。由此,即使在內(nèi) 容間關鍵字的數(shù)量大為不同的內(nèi)容數(shù)據(jù)庫101中計算關聯(lián)區(qū)間的情況下,在關聯(lián)區(qū)間的計 算中也能夠降低關鍵字數(shù)量較大的內(nèi)容的影響,所以能夠防止關聯(lián)區(qū)間的誤計算。另外,關聯(lián)區(qū)間計算部106也可以在步驟S106中根據(jù)更新前的內(nèi)容與追加內(nèi)容 的內(nèi)容標題的差異度是否滿足規(guī)定的基準值來計算關聯(lián)區(qū)間。具體而言,關聯(lián)區(qū)間計算部 106計算上次更新區(qū)間的內(nèi)容的標題與新追加的內(nèi)容的標題的一致率。并且,在一致率是 閾值以上的情況下,關聯(lián)區(qū)間計算部106計算將上次更新區(qū)間與對應于新追加到內(nèi)容數(shù)據(jù) 庫101中的內(nèi)容的時間區(qū)間相加后的時間區(qū)間作為新的關聯(lián)區(qū)間。另一方面,在一致率比 閾值小的情況下,關聯(lián)區(qū)間計算部106計算對應于新追加到內(nèi)容數(shù)據(jù)庫101中的內(nèi)容的時 間區(qū)間作為新的關聯(lián)區(qū)間。由此,在相同標題的情況下,在存儲有內(nèi)容的數(shù)據(jù)類似的內(nèi)容的 內(nèi)容數(shù)據(jù)庫101中,關聯(lián)區(qū)間計算部106能夠大幅減少用來計算關聯(lián)區(qū)間的處理時間。以上,根據(jù)實施方式及其變形例對有關本發(fā)明的內(nèi)容檢索裝置進行了說明,但本 發(fā)明并不限定于上述實施方式及其變形例。只要不脫離本發(fā)明的主旨,本領域技術人員對 上述實施方式及其變形例實施了想到的各種變形后的形態(tài)、以及將不同的實施方式及其變 形例的結(jié)構要素組合構建的形態(tài)也包含在本發(fā)明的范圍內(nèi)。例如,在上述實施方式中,在內(nèi)容檢索裝置中具備內(nèi)容數(shù)據(jù)庫,但也可以在與內(nèi)容 檢索裝置不同的其他裝置中具備內(nèi)容數(shù)據(jù)庫。在此情況下,內(nèi)容檢索裝置與其他裝置經(jīng)由 網(wǎng)絡等連接。此外,上述實施方式的內(nèi)容檢索裝置從存儲有電視節(jié)目的內(nèi)容數(shù)據(jù)庫中檢索想要 的電視節(jié)目,但也可以從存儲有電影、音樂等視聽內(nèi)容、書、論文等文本內(nèi)容等的內(nèi)容數(shù)據(jù) 庫中檢索內(nèi)容。即,有關本發(fā)明的內(nèi)容檢索裝置檢索的內(nèi)容只要是具有字符信息的內(nèi)容就可以。另外,本發(fā)明不僅能夠作為上述那樣的內(nèi)容檢索裝置實現(xiàn),也可以作為以包含 在內(nèi)容檢索裝置中的特征性結(jié)構部分的動作為步驟的內(nèi)容檢索方法實現(xiàn)、或作為使計算 機執(zhí)行包含在內(nèi)容檢索方法中的特征性步驟的程序?qū)崿F(xiàn)。并且,這樣的程序可以經(jīng)由 CD-ROM (Compact Disc-Read OnlyMemory)等記錄媒體或互聯(lián)網(wǎng)等通信網(wǎng)絡流通。工業(yè)實用性本發(fā)明能夠作為用來從大量的內(nèi)容之中檢索用戶想要利用的內(nèi)容的內(nèi)容檢索裝 置等、例如作為從大量存儲有電視節(jié)目的數(shù)據(jù)庫中檢索用戶想要觀看的節(jié)目的裝置使用。
權利要求
一種內(nèi)容檢索裝置,利用與表示內(nèi)容的數(shù)據(jù)的關鍵字相關聯(lián)的關聯(lián)關鍵字,從內(nèi)容數(shù)據(jù)庫中檢索規(guī)定內(nèi)容,該內(nèi)容數(shù)據(jù)庫按表示內(nèi)容的分類的內(nèi)容屬性存儲有內(nèi)容,上述內(nèi)容檢索裝置的特征在于,具備詞典數(shù)據(jù)庫,按表示規(guī)定的時間區(qū)間的關聯(lián)區(qū)間,存儲對作為上述關聯(lián)區(qū)間所包含的內(nèi)容且屬于由上述內(nèi)容屬性表示的分類的內(nèi)容的數(shù)據(jù)進行表示的多個關鍵字間的關聯(lián)度;關聯(lián)區(qū)間計算機構,根據(jù)通過表示上述內(nèi)容數(shù)據(jù)庫所存儲的第1內(nèi)容的數(shù)據(jù)的多個第1關鍵字以及表示上述內(nèi)容數(shù)據(jù)庫所存儲的第2內(nèi)容的數(shù)據(jù)的多個第2關鍵字來計算的各上述內(nèi)容屬性的差異度是否滿足規(guī)定基準值,按上述內(nèi)容屬性計算被設定為上述第1內(nèi)容和上述第2內(nèi)容包含在同一時間區(qū)間中的關聯(lián)區(qū)間;詞典更新機構,在由上述關聯(lián)區(qū)間計算機構計算的關聯(lián)區(qū)間所包含的內(nèi)容中,使用按上述內(nèi)容屬性計算的關鍵字間的關聯(lián)度、以及上述關聯(lián)區(qū)間,更新上述詞典數(shù)據(jù)庫所存儲的關聯(lián)度;以及輸出生成機構,根據(jù)上述詞典數(shù)據(jù)庫所存儲的關聯(lián)度,生成用于按上述關聯(lián)區(qū)間輸出與用戶輸入的關鍵字相關聯(lián)的關聯(lián)關鍵字的輸出信息。
2.如權利要求1所述的內(nèi)容檢索裝置,其特征在于,上述關聯(lián)區(qū)間計算機構在上述差異度超過規(guī)定基準值的情況下,計算通過對應于上述 第1內(nèi)容的時間區(qū)間來決定的關聯(lián)區(qū)間,在上述差異度是規(guī)定基準值以下的情況下,計算 通過將上述詞典數(shù)據(jù)庫所存儲的最新的關聯(lián)區(qū)間與對應于上述第1內(nèi)容的時間區(qū)間相加 得到的時間區(qū)間來決定的關聯(lián)區(qū)間。
3.如權利要求2所述的內(nèi)容檢索裝置,其特征在于,上述關聯(lián)區(qū)間計算機構將存儲在上述詞典數(shù)據(jù)庫中的最新的關聯(lián)區(qū)間所包含的內(nèi)容 作為上述第2內(nèi)容,來計算關聯(lián)區(qū)間。
4.如權利要求3所述的內(nèi)容檢索裝置,其特征在于,上述關聯(lián)區(qū)間計算機構根據(jù)上述第1關鍵字中的出現(xiàn)頻度高的規(guī)定數(shù)量的關鍵字與 上述第2關鍵字中的出現(xiàn)頻度高的規(guī)定數(shù)量的關鍵字之間的差異度是否滿足規(guī)定基準值, 來計算關聯(lián)區(qū)間。
5.如權利要求2所述的內(nèi)容檢索裝置,其特征在于,上述關聯(lián)區(qū)間計算機構將與上次新添加在上述內(nèi)容數(shù)據(jù)庫中的內(nèi)容對應的時間區(qū)間 中的、預定長度時間的時間區(qū)間所包含的內(nèi)容作為上述第2內(nèi)容,來計算關聯(lián)區(qū)間。
6.如權利要求1所述的內(nèi)容檢索裝置,其特征在于,上述內(nèi)容檢索裝置還具備屬性取得機構,取得與用戶輸入的關鍵字相關聯(lián)的內(nèi)容屬性;以及關聯(lián)關鍵字取得機構,通過參照上述詞典數(shù)據(jù)庫,按關聯(lián)區(qū)間取得與上述用戶輸入的 關鍵字和由上述屬性取得機構取得的內(nèi)容屬性對應的關聯(lián)關鍵字;上述輸出生成機構生成用于輸出由上述關聯(lián)關鍵字取得機構取得的關聯(lián)關鍵字的上 述輸出信息。
7.如權利要求6所述的內(nèi)容檢索裝置,其特征在于,上述關聯(lián)關鍵字取得機構在由上述屬性取得機構取得了多個內(nèi)容屬性的情況下,對上述多個內(nèi)容屬性的各個內(nèi)容屬性生成關聯(lián)關鍵字;上述輸出生成機構生成用于按內(nèi)容屬性、按關聯(lián)區(qū)間輸出對上述多個內(nèi)容屬性的各個 內(nèi)容屬性生成的關聯(lián)關鍵字的輸出信息。
8.如權利要求1所述的內(nèi)容檢索裝置,其特征在于,關聯(lián)區(qū)間計算機構根據(jù)作為上述第1關鍵字中的與上述第2關鍵字不重復的關鍵字的 數(shù)量除以第2關鍵字的數(shù)量所得的值的差異度是否滿足規(guī)定基準值,來計算關聯(lián)區(qū)間。
9.一種內(nèi)容檢索方法,由計算機利用與表示內(nèi)容的數(shù)據(jù)的關鍵字相關聯(lián)的關聯(lián)關鍵 字,從內(nèi)容數(shù)據(jù)庫中檢索規(guī)定內(nèi)容,該內(nèi)容數(shù)據(jù)庫按表示內(nèi)容的分類的內(nèi)容屬性存儲有內(nèi) 容,上述內(nèi)容檢索方法的特征在于,上述計算機具備詞典數(shù)據(jù)庫,該詞典數(shù)據(jù)庫按表示規(guī)定的時間區(qū)間的關聯(lián)區(qū)間,存儲 對作為上述關聯(lián)區(qū)間所包含的內(nèi)容且屬于由上述內(nèi)容屬性表示的分類的內(nèi)容的數(shù)據(jù)進行 表示的多個關鍵字間的關聯(lián)度;上述內(nèi)容檢索方法包括關聯(lián)區(qū)間計算步驟,上述計算機根據(jù)通過表示上述內(nèi)容數(shù)據(jù)庫所存儲的第1內(nèi)容的數(shù) 據(jù)的多個第1關鍵字以及表示上述內(nèi)容數(shù)據(jù)庫所存儲的第2內(nèi)容的數(shù)據(jù)的多個第2關鍵字 來計算的各上述內(nèi)容屬性的差異度是否滿足規(guī)定基準值,按上述內(nèi)容屬性計算被設定為上 述第1內(nèi)容和上述第2內(nèi)容包含在同一時間區(qū)間中的關聯(lián)區(qū)間;詞典更新步驟,上述計算機在由上述關聯(lián)區(qū)間計算步驟計算的關聯(lián)區(qū)間所包含的內(nèi)容 中,使用按上述內(nèi)容屬性計算的關鍵字間的關聯(lián)度、以及上述關聯(lián)區(qū)間,更新上述詞典數(shù)據(jù) 庫所存儲的關聯(lián)度;以及輸出生成步驟,上述計算機根據(jù)上述詞典數(shù)據(jù)庫所存儲的關聯(lián)度,生成用于按上述關 聯(lián)區(qū)間輸出與用戶輸入的關鍵字相關聯(lián)的關聯(lián)關鍵字的輸出信息。
10.一種程序,是計算機可執(zhí)行的程序,利用與表示內(nèi)容的數(shù)據(jù)的關鍵字相關聯(lián)的關聯(lián) 關鍵字,從內(nèi)容數(shù)據(jù)庫中檢索規(guī)定內(nèi)容,該內(nèi)容數(shù)據(jù)庫按表示內(nèi)容的分類的內(nèi)容屬性存儲 有內(nèi)容,上述程序的特征在于,上述計算機具備詞典數(shù)據(jù)庫,該詞典數(shù)據(jù)庫按表示規(guī)定的時間區(qū)間的關聯(lián)區(qū)間,存儲 對作為上述關聯(lián)區(qū)間所包含的內(nèi)容且屬于由上述內(nèi)容屬性表示的分類的內(nèi)容的數(shù)據(jù)進行 表示的多個關鍵字間的關聯(lián)度;上述程序使計算機執(zhí)行關聯(lián)區(qū)間計算步驟,根據(jù)通過表示上述內(nèi)容數(shù)據(jù)庫所存儲的第1內(nèi)容的數(shù)據(jù)的多個第 1關鍵字以及表示上述內(nèi)容數(shù)據(jù)庫所存儲的第2內(nèi)容的數(shù)據(jù)的多個第2關鍵字來計算的各 上述內(nèi)容屬性的差異度是否滿足規(guī)定基準值,按上述內(nèi)容屬性計算被設定為上述第1內(nèi)容 和上述第2內(nèi)容包含在同一時間區(qū)間中的關聯(lián)區(qū)間;詞典更新步驟,在由上述關聯(lián)區(qū)間計算步驟計算的關聯(lián)區(qū)間所包含的內(nèi)容中,使用按 上述內(nèi)容屬性計算的關鍵字間的關聯(lián)度、以及上述關聯(lián)區(qū)間,更新上述詞典數(shù)據(jù)庫所存儲 的關聯(lián)度;以及輸出生成步驟,根據(jù)上述詞典數(shù)據(jù)庫所存儲的關聯(lián)度,生成用于按上述關聯(lián)區(qū)間輸出 與用戶輸入的關鍵字相關聯(lián)的關聯(lián)關鍵字的輸出信息。
全文摘要
提供一種能夠?qū)⑦m合于時事性的關聯(lián)關鍵字高效率地提示給用戶的內(nèi)容檢索裝置。內(nèi)容檢索裝置(100)利用關聯(lián)關鍵字從內(nèi)容數(shù)據(jù)庫中檢索規(guī)定內(nèi)容,具備關聯(lián)區(qū)間計算部(106),根據(jù)由表示內(nèi)容數(shù)據(jù)庫(101)所存儲的第1內(nèi)容的數(shù)據(jù)的多個第1關鍵字和表示內(nèi)容數(shù)據(jù)庫(101)所存儲的第2內(nèi)容的數(shù)據(jù)的多個第2關鍵字計算出的各內(nèi)容屬性的差異度是否滿足規(guī)定基準值,按內(nèi)容屬性計算設定為使第1內(nèi)容和第2內(nèi)容包含在同一時間區(qū)間中的關聯(lián)區(qū)間;以及詞典更新部(107),使用按內(nèi)容屬性計算出的關鍵字間的關聯(lián)度和上述關聯(lián)區(qū)間,更新存儲在詞典數(shù)據(jù)庫(102)中的關聯(lián)度。
文檔編號G06F17/30GK101889281SQ20098010125
公開日2010年11月17日 申請日期2009年3月2日 優(yōu)先權日2008年3月10日
發(fā)明者松浦聰, 續(xù)木貴史, 高田和豊 申請人:松下電器產(chǎn)業(yè)株式會社