專利名稱:信息處理設(shè)備和方法以及程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于信息處理的設(shè)備和方法以及程序,更具體地涉及一種用于信息處理的設(shè)備和方法以及程序,其能夠向用戶呈現(xiàn)允許高效地選擇內(nèi)容的信息。
背景技術(shù):
為了使用戶能夠高效地選擇各種內(nèi)容(靜止圖像、運(yùn)動(dòng)圖像、音樂、網(wǎng)絡(luò)文檔等),通過利用基于空間方法的TF/IDF方法進(jìn)行匹配或者使用詞庫(thesaurus)來檢索與用戶指定的特定內(nèi)容相似的一組內(nèi)容的方法已經(jīng)被投入實(shí)際使用(參見日本專利特許公開第Hei 3-172966號。在下文中將其稱為專利文檔1)。例如,在因特網(wǎng)上可以得到呈現(xiàn)類似于輸入文本的文檔信息的服務(wù)(Webcat Plus(http://webcatplus.nii.ac.jp/))。
另外,存在一種分組并描述多個(gè)內(nèi)容的標(biāo)簽加注(labeling)(特征關(guān)鍵字的提取)的方法(參見日本專利特許公開第2003-248686號。在下文中將其稱為專利文檔2)。
此外,在因特網(wǎng)上還可以得到響應(yīng)于詢問(對于數(shù)據(jù)庫管理系統(tǒng)的處理請求(查詢)作為字符串的表示)而將搜索結(jié)果聚類(分類),并且隨后呈現(xiàn)該結(jié)果的服務(wù)(Clusty(http://clusty.jp/))。
發(fā)明內(nèi)容
然而,使用專利文檔1中的方法,用戶不能認(rèn)識到根據(jù)什么視點(diǎn)將所檢索的相似內(nèi)容判斷為與所述特定內(nèi)容“相似”。
使用專利文檔2中的方法,同等地處理多個(gè)內(nèi)容,因此不考慮指示作為源的內(nèi)容和與該內(nèi)容相關(guān)聯(lián)的內(nèi)容的相關(guān)性。
基于詢問的信息搜索僅僅是搜索與詞相關(guān)的相關(guān)內(nèi)容的功能,并且由于該詞是由用戶指定的,基于詢問的信息搜索不能根據(jù)任意視點(diǎn)來為用戶選擇內(nèi)容。
考慮到這種情況而作出了本發(fā)明,并且理想的是能夠根據(jù)任意視點(diǎn)來為用戶檢索與特定內(nèi)容相關(guān)聯(lián)的內(nèi)容,并且還檢測和呈現(xiàn)指示所檢索的內(nèi)容與所述特定內(nèi)容的相關(guān)性的信息。
根據(jù)本發(fā)明的實(shí)施例,提供一種信息處理設(shè)備,包括生成部分,用于基于多個(gè)內(nèi)容、從所述多個(gè)內(nèi)容的內(nèi)容信息提取的提取信息、以及由每個(gè)內(nèi)容的提取信息指示的值,生成在同一二維或更多維空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型;計(jì)算部分,用于使用所述同一空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型,來計(jì)算在所述多個(gè)內(nèi)容中除了預(yù)定的關(guān)聯(lián)源內(nèi)容之外的關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度;關(guān)聯(lián)檢測部分,用于基于計(jì)算部分計(jì)算的相關(guān)度,檢測與關(guān)聯(lián)源內(nèi)容相關(guān)聯(lián)的關(guān)聯(lián)目標(biāo)內(nèi)容以及指示關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息;以及呈現(xiàn)部分,用于呈現(xiàn)關(guān)聯(lián)檢測部分檢測到的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
關(guān)聯(lián)檢測裝置可以將具有高于閾值的相關(guān)度的組的關(guān)聯(lián)目標(biāo)內(nèi)容設(shè)置為關(guān)聯(lián)目標(biāo)內(nèi)容,并將該組的提取信息設(shè)置為相關(guān)性信息。
呈現(xiàn)部分可以顯示關(guān)聯(lián)檢測部分檢測的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
呈現(xiàn)部分可以對應(yīng)于關(guān)聯(lián)目標(biāo)內(nèi)容的顯示來顯示關(guān)聯(lián)目標(biāo)內(nèi)容的所有或部分內(nèi)容信息。
呈現(xiàn)部分可以突出與對應(yīng)于關(guān)聯(lián)目標(biāo)內(nèi)容的顯示而顯示的內(nèi)容信息中的相關(guān)性信息相對應(yīng)的部分。
呈現(xiàn)部分可以基于相關(guān)度來確定關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息之一的顯示形式。
信息處理設(shè)備還可以包括聚類生成部分,用于通過對提取信息進(jìn)行分組來生成提取信息的聚類,其中,計(jì)算部分可以將所計(jì)算的關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度轉(zhuǎn)換成對應(yīng)于提取信息的聚類的相關(guān)度,并且關(guān)聯(lián)檢測部分可以將具有高于閾值的相關(guān)度的組的關(guān)聯(lián)目標(biāo)候選內(nèi)容設(shè)置為關(guān)聯(lián)目標(biāo)內(nèi)容,所述相關(guān)度對應(yīng)于所述提取信息的聚類,并將代表該組的提取信息的聚類的代表性提取信息設(shè)置為相關(guān)性信息。
信息處理設(shè)備還可以包括聚類生成部分,用于通過對關(guān)聯(lián)目標(biāo)候選內(nèi)容進(jìn)行分組來生成關(guān)聯(lián)目標(biāo)候選內(nèi)容的關(guān)聯(lián)目標(biāo)候選聚類,其中,所述計(jì)算部分可以計(jì)算關(guān)聯(lián)目標(biāo)候選聚類和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度,以及所述關(guān)聯(lián)檢測部分可以將屬于具有高于閾值的相關(guān)度的組的關(guān)聯(lián)目標(biāo)候選聚類的關(guān)聯(lián)目標(biāo)候選內(nèi)容設(shè)置為關(guān)聯(lián)目標(biāo)內(nèi)容,并將該組的提取信息設(shè)置為相關(guān)性信息。
信息處理設(shè)備還可以包括用于輸入內(nèi)容信息的輸入部分,其中,生成部件可以通過生成與利用輸入部件輸入的內(nèi)容信息的提取信息相對應(yīng)的向量、并將該向量添加到已經(jīng)生成的內(nèi)容的數(shù)值模型來重新構(gòu)造內(nèi)容模型。
根據(jù)本發(fā)明的實(shí)施例,提供一種信息處理方法,包括如下步驟基于多個(gè)內(nèi)容、從所述多個(gè)內(nèi)容的內(nèi)容信息提取的提取信息、以及由每個(gè)內(nèi)容的提取信息指示的值,生成在同一二維或更多維空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型;使用所述同一空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型,來計(jì)算在所述多個(gè)內(nèi)容中除了預(yù)定的關(guān)聯(lián)源內(nèi)容之外的關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度;基于在所述計(jì)算步驟的處理中計(jì)算的相關(guān)度,檢測與關(guān)聯(lián)源內(nèi)容相關(guān)聯(lián)的關(guān)聯(lián)目標(biāo)內(nèi)容、以及指示關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息;以及呈現(xiàn)在關(guān)聯(lián)檢測步驟的處理中檢測的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
根據(jù)本發(fā)明的實(shí)施例,提供一種用于使計(jì)算機(jī)執(zhí)行呈現(xiàn)處理的程序,所述呈現(xiàn)處理用于呈現(xiàn)指示與特定內(nèi)容相關(guān)聯(lián)的內(nèi)容的信息,包括生成步驟,基于多個(gè)內(nèi)容、從所述多個(gè)內(nèi)容的內(nèi)容信息提取的提取信息、以及由每個(gè)內(nèi)容的提取信息指示的值,生成在同一二維或更多維空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型;計(jì)算步驟,使用所述同一空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型,來計(jì)算在所述多個(gè)內(nèi)容中除了預(yù)定的關(guān)聯(lián)源內(nèi)容之外的關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度;關(guān)聯(lián)檢測步驟,基于在計(jì)算步驟的處理中計(jì)算的相關(guān)度,檢測與關(guān)聯(lián)源內(nèi)容相關(guān)聯(lián)的關(guān)聯(lián)目標(biāo)內(nèi)容、以及指示關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息;以及呈現(xiàn)步驟,呈現(xiàn)在關(guān)聯(lián)檢測步驟的處理中檢測的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
根據(jù)本發(fā)明實(shí)施例的信息處理設(shè)備、信息處理方法或程序基于多個(gè)內(nèi)容、從所述多個(gè)內(nèi)容的內(nèi)容信息提取的提取信息、以及由所述內(nèi)容的每一個(gè)的提取信息指示的值,生成在同一二維或更多維空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型;使用所述同一空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型,來計(jì)算在所述多個(gè)內(nèi)容中除了預(yù)定的關(guān)聯(lián)源內(nèi)容之外的關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與所述關(guān)聯(lián)源內(nèi)容的相關(guān)度;基于所計(jì)算的所述相關(guān)度,檢測與關(guān)聯(lián)源內(nèi)容相關(guān)聯(lián)的關(guān)聯(lián)目標(biāo)內(nèi)容、以及指示關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息;以及呈現(xiàn)在所檢測的關(guān)聯(lián)目標(biāo)內(nèi)容和所檢測的相關(guān)性信息。
根據(jù)本發(fā)明,可以基于關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度,檢測與關(guān)聯(lián)源內(nèi)容相關(guān)聯(lián)的關(guān)聯(lián)目標(biāo)內(nèi)容以及指示關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息,并且呈現(xiàn)該關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
圖1是示出應(yīng)用本發(fā)明實(shí)施例的信息處理設(shè)備的結(jié)構(gòu)示例的方框圖;圖2是幫助解釋圖1的信息處理設(shè)備1的呈現(xiàn)處理的流程圖;圖3是示出內(nèi)容-提取信息頻率矩陣的示例的圖;圖4是示意性地示出內(nèi)容-提取信息頻率矩陣的奇異值分解的圖;圖5是示意性地示出作為內(nèi)容模型的矩陣的圖;圖6是示例性地示出作為提取信息模型的矩陣的圖;圖7是示出內(nèi)容模型示例的圖;圖8是示出提取信息模型示例的圖;圖9是示出關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度的示例的圖;圖10是示出關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息的顯示示例的圖;圖11是示出關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息的另一顯示示例的圖;圖12是示出應(yīng)用本發(fā)明實(shí)施例的另一信息處理設(shè)備的結(jié)構(gòu)示例的方框圖;圖13是幫助解釋提取信息的聚類的圖;圖14是示出關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息聚類(cluster)的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度的示例的圖;圖15是示出其它關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息的顯示示例的圖;圖16是示出提取信息聚類與關(guān)聯(lián)源內(nèi)容的相關(guān)度的示例的圖;圖17是示出應(yīng)用本發(fā)明實(shí)施例的另一信息處理設(shè)備的結(jié)構(gòu)示例的方框圖;圖18是幫助解釋圖17的信息處理設(shè)備的呈現(xiàn)處理的流程圖;
圖19是示出關(guān)聯(lián)目標(biāo)候選聚類和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度的示例的圖;圖20是示出關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息的另一顯示示例的圖;圖21是示出關(guān)聯(lián)目標(biāo)候選聚類和提取信息聚類的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度的示例的圖;圖22是示出應(yīng)用本發(fā)明實(shí)施例的另一信息處理設(shè)備1的結(jié)構(gòu)示例的方框圖;圖23是示出關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與另一關(guān)聯(lián)源內(nèi)容的相關(guān)度的示例的圖;圖24是示出關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息聚類的組與其它關(guān)聯(lián)源內(nèi)容的相關(guān)度的示例的圖;以及圖25是示出個(gè)人計(jì)算機(jī)的結(jié)構(gòu)示例的圖。
具體實(shí)施例方式
在下文中將介紹本發(fā)明的優(yōu)選實(shí)施例。本發(fā)明的構(gòu)成要件與說明書或附圖中的實(shí)施例之間的對應(yīng)關(guān)系說明如下。此描述是要確認(rèn)在說明書或附圖中描述了支持本發(fā)明的實(shí)施例。因此,即使有在說明書或附圖中描述但在此沒有作為對應(yīng)于本發(fā)明的構(gòu)成要件的實(shí)施例描述的實(shí)施例時(shí),也不表示該實(shí)施例不符合所述構(gòu)成要件。反之,即使在這里將實(shí)施例描述為與構(gòu)成要件相對應(yīng)時(shí),也不表示該實(shí)施例不符合除了那個(gè)構(gòu)成要件之外的構(gòu)成要件。
根據(jù)本發(fā)明實(shí)施例的信息處理設(shè)備包括生成部件(例如,圖1中的模型生成單元12),用于基于多個(gè)內(nèi)容、從所述多個(gè)內(nèi)容的內(nèi)容信息提取的提取信息以及由每個(gè)內(nèi)容的提取信息指示的值來生成在同一二維或更多維空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型;計(jì)算部件(例如,圖1中的相關(guān)度計(jì)算單元14),用于使用所述同一空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型,計(jì)算在所述多個(gè)內(nèi)容中除了預(yù)定關(guān)聯(lián)源內(nèi)容之外的關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度;關(guān)聯(lián)檢測部件(例如,圖1中的關(guān)聯(lián)檢測單元15),用于基于由計(jì)算部件計(jì)算的相關(guān)度,檢測與關(guān)聯(lián)源內(nèi)容相關(guān)聯(lián)的關(guān)聯(lián)目標(biāo)內(nèi)容以及指示關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息;以及呈現(xiàn)部件(例如,圖1中的呈現(xiàn)單元16),用于呈現(xiàn)由關(guān)聯(lián)檢測部件檢測的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
關(guān)聯(lián)檢測部件可以將具有高于閾值的相關(guān)度的組的關(guān)聯(lián)目標(biāo)候選內(nèi)容設(shè)置為關(guān)聯(lián)目標(biāo)內(nèi)容,并且將該組的提取信息設(shè)置為相關(guān)性信息(例如,圖2中的步驟S3)。
呈現(xiàn)部件可以顯示由關(guān)聯(lián)檢測部件檢測的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息(例如,圖2中的步驟S4)(例如,圖10)。
呈現(xiàn)部件可以對應(yīng)于關(guān)聯(lián)目標(biāo)內(nèi)容的顯示來顯示關(guān)聯(lián)目標(biāo)內(nèi)容的內(nèi)容信息的全部或一部分(例如,圖11)。
呈現(xiàn)部件可以突出與對應(yīng)于關(guān)聯(lián)目標(biāo)內(nèi)容的顯示而顯示的內(nèi)容信息中與相關(guān)性信息相對應(yīng)的部分(例如,圖11)。
呈現(xiàn)部件可以基于相關(guān)度來確定關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息之一的顯示形式(例如,圖11)。
信息處理設(shè)備還可以包括聚類生成部件(例如,圖12中的提取信息聚類生成單元21),用于通過對提取信息進(jìn)行分組來生成提取信息的聚類,其中,計(jì)算部件可以將所計(jì)算的關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度轉(zhuǎn)換成對應(yīng)于提取信息的聚類的相關(guān)度(例如,圖14),并且關(guān)聯(lián)檢測部件可以將具有高于閾值的相關(guān)度、即對應(yīng)于提取信息的聚類的相關(guān)度的組的關(guān)聯(lián)目標(biāo)候選內(nèi)容設(shè)置為關(guān)聯(lián)目標(biāo)內(nèi)容,并將代表該組的提取信息的聚類的代表性提取信息設(shè)置為相關(guān)性信息(例如,圖15)。
信息處理設(shè)備還可以包括聚類生成部件(例如,圖17中的內(nèi)容聚類生成單元31),用于通過對關(guān)聯(lián)目標(biāo)候選內(nèi)容進(jìn)行分組來生成關(guān)聯(lián)目標(biāo)候選內(nèi)容的關(guān)聯(lián)目標(biāo)候選聚類,其中,計(jì)算部件可以計(jì)算關(guān)聯(lián)目標(biāo)候選聚類和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度(例如,圖19),并且關(guān)聯(lián)檢測部件可以將屬于具有高于閾值的相關(guān)度的組的關(guān)聯(lián)目標(biāo)聚類的關(guān)聯(lián)目標(biāo)候選內(nèi)容設(shè)置為關(guān)聯(lián)目標(biāo)內(nèi)容,并將該組的提取信息設(shè)置為相關(guān)性信息(例如,圖20)。
信息處理設(shè)備還可以包括用于輸入內(nèi)容信息的輸入部件(例如,內(nèi)容信息輸入單元41),其中,生成部件可以通過生成與利用輸入部件輸入的內(nèi)容信息的提取信息相對應(yīng)的向量并且將該向量添加到已經(jīng)生成的內(nèi)容的數(shù)值模型來重新構(gòu)造內(nèi)容模型。
根據(jù)本發(fā)明實(shí)施例的信息處理方法或程序包括如下步驟(例如,圖2中的步驟S1)基于多個(gè)內(nèi)容、從所述多個(gè)內(nèi)容的內(nèi)容信息提取的提取信息以及由每個(gè)內(nèi)容的提取信息指示的值,生成在同一二維或更多維空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型;(例如,圖2中的步驟S2)使用所述同一空間中的內(nèi)容的數(shù)值模型和提取信息的數(shù)值模型,計(jì)算在所述多個(gè)內(nèi)容中除了預(yù)定關(guān)聯(lián)源內(nèi)容之外的關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度;(例如,圖2中的步驟S3)基于在計(jì)算步驟的處理中計(jì)算的相關(guān)度,檢測與關(guān)聯(lián)源內(nèi)容相關(guān)聯(lián)的關(guān)聯(lián)目標(biāo)內(nèi)容以及指示關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息;以及(例如,圖2中的步驟S4)呈現(xiàn)在關(guān)聯(lián)檢測步驟的處理中檢測的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
圖1示出應(yīng)用本發(fā)明實(shí)施例的信息處理設(shè)備1的結(jié)構(gòu)示例。信息處理設(shè)備1生成用于由用戶高效地選擇內(nèi)容的信息,并提供該信息。
內(nèi)容信息存儲(chǔ)單元11存儲(chǔ)例如用于每個(gè)內(nèi)容的關(guān)于可由用戶使用的內(nèi)容的信息(以下稱為內(nèi)容信息)。
在這種情況下,所述內(nèi)容可以是公共內(nèi)容或私有內(nèi)容,并且包括靜止畫面、電視廣播節(jié)目的運(yùn)動(dòng)圖像、電影等、音樂、網(wǎng)頁、文檔(采用自然語言的文本)等。
例如,當(dāng)內(nèi)容例如是電視廣播節(jié)目時(shí),內(nèi)容信息是EPG(電子節(jié)目指南)信息;當(dāng)內(nèi)容是電影、圖像、或音樂時(shí),內(nèi)容信息是對作品或藝術(shù)家的評論(review)的文本、或表示內(nèi)容的特征量(例如,諸如節(jié)奏、節(jié)拍等的音樂特征量,或者諸如顏色、紋理等的圖像信息);當(dāng)內(nèi)容是靜止畫面時(shí),內(nèi)容信息是附加到靜止畫面的注釋文本;以及當(dāng)內(nèi)容是網(wǎng)頁時(shí),內(nèi)容信息是網(wǎng)頁上的內(nèi)容的文本部分。
當(dāng)內(nèi)容是文本時(shí),可以將文本本身設(shè)置為內(nèi)容信息。也就是說,內(nèi)容本身可以是內(nèi)容信息。此外,可以將附加到內(nèi)容上的諸如作者姓名、關(guān)鍵字等的適當(dāng)元數(shù)據(jù)設(shè)置為內(nèi)容信息。
附帶地說,在這種情況下,可以作為一個(gè)內(nèi)容來處理根據(jù)某一標(biāo)準(zhǔn)而彼此關(guān)聯(lián)的多個(gè)內(nèi)容,例如與同一個(gè)體或組相關(guān)聯(lián)的多個(gè)內(nèi)容。
模型生成單元12基于從存儲(chǔ)在內(nèi)容信息存儲(chǔ)單元11中的所有或部分內(nèi)容信息提取的提取信息的內(nèi)容信息的提取頻率,來對內(nèi)容和提取信息建模(用數(shù)值表示內(nèi)容和提取信息)。模型生成單元12將作為建模結(jié)果而獲得的內(nèi)容模型和提取信息模型存儲(chǔ)在模型存儲(chǔ)單元13中。
當(dāng)內(nèi)容信息是文本時(shí),提取信息是在該文本或元數(shù)據(jù)(流派、藝術(shù)家的出生地等)中出現(xiàn)的詞或短語。另外,提取信息可以是預(yù)定符號或圖像。也就是說,提取信息是任意的,只要該提取信息可與其它信息離散地(discretely)區(qū)分開即可。此外,取代實(shí)際出現(xiàn)的詞句(expression)等,可以將替換實(shí)際出現(xiàn)的詞句等的其它詞句設(shè)置為提取信息,或者可以基于某一標(biāo)準(zhǔn)來對詞句進(jìn)行分級,使得只將等級高的詞句設(shè)置為提取信息。
相關(guān)度計(jì)算單元14基于存儲(chǔ)在模型存儲(chǔ)單元13中的內(nèi)容模型和提取信息模型,計(jì)算當(dāng)從提取信息來看時(shí)指示預(yù)定內(nèi)容(在下文中稱為關(guān)聯(lián)源內(nèi)容)(例如,在可由用戶使用的內(nèi)容中由用戶指定的特定內(nèi)容)和除了關(guān)聯(lián)源內(nèi)容之外的內(nèi)容(在下文中將該內(nèi)容稱為關(guān)聯(lián)目標(biāo)候選內(nèi)容)(例如,在可由用戶使用的內(nèi)容中除了關(guān)聯(lián)源內(nèi)容之外的內(nèi)容)彼此相關(guān)聯(lián)的程度的相關(guān)度(換句話說,相關(guān)度計(jì)算單元14計(jì)算當(dāng)從關(guān)聯(lián)目標(biāo)候選內(nèi)容來看時(shí)指示關(guān)聯(lián)源內(nèi)容和提取信息彼此相關(guān)聯(lián)的程度的相關(guān)度)。
也就是說,對于關(guān)聯(lián)源內(nèi)容、關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的每個(gè)組檢測相關(guān)度。在下文中,將在適當(dāng)時(shí)把該相關(guān)度稱為關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息與關(guān)聯(lián)源內(nèi)容的相關(guān)度。
例如,關(guān)聯(lián)檢測單元15將具有作為由相關(guān)度計(jì)算單元14計(jì)算的相關(guān)度中的相關(guān)度的高值的組的關(guān)聯(lián)目標(biāo)候選內(nèi)容檢測為與關(guān)聯(lián)源內(nèi)容具有高相關(guān)性的內(nèi)容(在下文中,將把與關(guān)聯(lián)源內(nèi)容具有高相關(guān)性的內(nèi)容稱為關(guān)聯(lián)目標(biāo)內(nèi)容),并且將該組的提取信息檢測為指示關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的信息(在下文中,將把該信息稱為相關(guān)性信息)。附帶地說,可以將指示關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的提取信息本身設(shè)置為相關(guān)性信息,或者可以將替換提取信息的另一詞句設(shè)置為相關(guān)性信息。
例如,呈現(xiàn)單元16生成顯示由關(guān)聯(lián)檢測單元15檢測到的關(guān)聯(lián)目標(biāo)內(nèi)容的名稱等和相關(guān)性信息的顯示屏幕,并且隨后將該顯示屏幕顯示在圖中未示出的顯示單元上,從而向用戶呈現(xiàn)關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
也就是說,在本發(fā)明中,檢測并呈現(xiàn)例如與用戶指定的內(nèi)容(關(guān)聯(lián)源內(nèi)容)具有相關(guān)性的關(guān)聯(lián)目標(biāo)內(nèi)容以及指示關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息。因此,用戶可以根據(jù)相關(guān)性信息掌握所呈現(xiàn)的關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性。
另外,相關(guān)性信息對應(yīng)于內(nèi)容信息的提取信息,并且不是由用戶設(shè)定的。因此,關(guān)聯(lián)目標(biāo)內(nèi)容是為用戶從任意視點(diǎn)檢測的。
附帶地說,內(nèi)容數(shù)據(jù)本身可由信息處理設(shè)備1擁有,或者可由另一設(shè)備擁有。
接下來,將參考圖2的流程圖來描述信息處理設(shè)備1中的呈現(xiàn)處理。
步驟S1中,模型生成單元12基于從存儲(chǔ)在內(nèi)容信息存儲(chǔ)單元11中的所有或部分內(nèi)容信息提取的提取信息的內(nèi)容信息的提取頻率,來對內(nèi)容和提取信息建模(用數(shù)值表示內(nèi)容和提取信息)。模型生成單元12將作為建模結(jié)果獲得的內(nèi)容模型和提取信息模型存儲(chǔ)在模型存儲(chǔ)單元13中。
在本發(fā)明中,在同一空間中生成所述內(nèi)容模型和提取信息模型。
例如,可以使用LSA(潛在語義分析)在同一空間中生成所述內(nèi)容模型和提取信息模型。在以下文獻(xiàn)中對LSA進(jìn)行了詳細(xì)描述。
S.C.Deerwester,S.T.Dumais,T.K.Landauer,G.W.Furnas,and R.A.Harshman,“Indexing by Latent Semantic Analysis”,Journal of the AmericanSociety of Information Science,41(6)39-407,1990.
以LSA作為示例來描述這種情況下的建模處理,首先,將內(nèi)容設(shè)置為行項(xiàng)目并且將提取信息設(shè)置為列項(xiàng)目。然后,獲得將來自每個(gè)內(nèi)容(每個(gè)內(nèi)容的內(nèi)容信息)的提取信息的提取頻率作為矩陣元素的矩陣(在下文中被稱為內(nèi)容-提取信息頻率矩陣)X。也就是說,當(dāng)具有Nc個(gè)內(nèi)容和Nw個(gè)(種)提取信息時(shí),內(nèi)容-提取信息頻率矩陣X是(Nc×Nw)矩陣。
例如,當(dāng)所述內(nèi)容是音樂片段、同一藝術(shù)家的一組音樂片段被作為一個(gè)內(nèi)容處理、內(nèi)容信息是藝術(shù)家的評論的文本、該評論與所述內(nèi)容(正確的一組內(nèi)容)相伴隨、并且提取信息是出現(xiàn)在評論文本中的詞時(shí),獲得如圖3所示的內(nèi)容-提取信息頻率矩陣X。
在如圖3所示的內(nèi)容-提取頻率矩陣X中,行項(xiàng)目是藝術(shù)家A到E的五個(gè)(=Nc)項(xiàng)目,列項(xiàng)目是出現(xiàn)在藝術(shù)家的伴隨所述內(nèi)容的評論文本(內(nèi)容信息)中的六個(gè)詞(提取信息)的項(xiàng)目,并且矩陣元素是從每個(gè)評論文本提取詞的頻率。
接下來,對如此獲得的內(nèi)容-提取信息頻率矩陣X進(jìn)行如等式(1)所示的奇異值分解。
X=USVT...(1)在等式(1)中,U是Nc×r(=矩陣X的秩)矩陣,S是r×r矩陣,其中以奇異值的降序來排列對角線元素,并且VT是r×Nw矩陣。附帶地說,在圖4中示意性地示出等式(1)的矩陣。
接下來,使用作為對內(nèi)容-提取信息頻率矩陣X進(jìn)行奇異值分解的結(jié)果獲得的矩陣U、矩陣S、和矩陣V,計(jì)算等式(2)和等式(3)。獲得減小到m維的矩陣D(行項(xiàng)目是內(nèi)容的項(xiàng)目的矩陣)作為內(nèi)容模型,獲得減小到m維的矩陣W(行項(xiàng)目是提取信息的項(xiàng)目的矩陣)作為提取信息模型。
D=UmSm1/2...(2)[等式3]W=VmSm1/2...(3)在等式(2)和等式(3)中,Um是矩陣U的從第1列到第m列的子矩陣,Vm是矩陣V的從第1列到第m列的子矩陣,Sm1/2是對角線矩陣S的從第1列到第m列的子矩陣并且取S的每個(gè)元素的平方根。附帶地說,在圖5和圖6中示意性地示出了等式(2)和等式(3)。
例如,當(dāng)對在圖3中示出的內(nèi)容-提取信息頻率矩陣X進(jìn)行奇異值分解并且m=3,并且使用作為對內(nèi)容-提取信息頻率矩陣X進(jìn)行奇異值分解的結(jié)果而獲得的矩陣U、矩陣S、和矩陣V來計(jì)算等式(2)和等式(3)時(shí),獲得在圖7中示出的三維矩陣D作為內(nèi)容模型,獲得在圖8中示出的三維矩陣W作為提取信息模型。
這樣,生成了被壓縮到m維的同一空間中的內(nèi)容模型和提取信息模型(也就是說,由多個(gè)相同屬性限定的內(nèi)容模型和提取信息模型)。將所生成的模型存儲(chǔ)在模型存儲(chǔ)單元13中。
附帶地說,盡管以上描述是對使用LSA來生成同一空間中的內(nèi)容模型和提取信息模型的情況進(jìn)行的,但是可以使用對應(yīng)分析或PLSA(概率潛在語義分析)來生成同一空間中的內(nèi)容模型和提取信息模型。
在對應(yīng)分析的情況下,如同在LSA中那樣,將內(nèi)容和提取信息向量化到歐幾里德空間中。在PLSA的情況下,利用條件概率P(z|d)來表示內(nèi)容,其中z是潛在(latent)隨機(jī)變量,且z=z1,z2....,由此,可以將條件概率當(dāng)作作為表達(dá)(expression)的向量。
例如,在以下文獻(xiàn)中描述了PLSA的詳細(xì)情況。
Hofrmann,T.,“Probabilistic Latent Semantic Analysis”,Proc.of Uncertaintyin Artificial Intelligence,1999.
返回圖2,在下一步驟S2中,相關(guān)度計(jì)算單元14基于存儲(chǔ)在模型存儲(chǔ)單元13中的內(nèi)容模型(圖7)和提取信息模型(圖8),來計(jì)算關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度(從提取信息看時(shí),指示關(guān)聯(lián)源內(nèi)容和關(guān)聯(lián)目標(biāo)候選內(nèi)容彼此相關(guān)聯(lián)的程度的相關(guān)度,或者從關(guān)聯(lián)目標(biāo)候選內(nèi)容看時(shí),指示關(guān)聯(lián)源內(nèi)容和提取信息彼此相關(guān)聯(lián)的程度的相關(guān)度)。
當(dāng)利用LSA對內(nèi)容和提取信息建模時(shí),假設(shè)關(guān)聯(lián)源內(nèi)容是當(dāng)從內(nèi)容-提取信息頻率矩陣X的第一行項(xiàng)目看時(shí)的第i內(nèi)容(在下文中稱為關(guān)聯(lián)源內(nèi)容Ci),如等式(4)所示來獲得當(dāng)從矩陣X的第一行項(xiàng)目看時(shí)的第k(k≠i)關(guān)聯(lián)目標(biāo)候選內(nèi)容(在下文中稱為關(guān)聯(lián)目標(biāo)候選內(nèi)容Ck)和當(dāng)從矩陣X的第一列項(xiàng)目看時(shí)的第j提取信息(在下文中稱為提取信息Hj)的組與關(guān)聯(lián)源內(nèi)容Ci的相關(guān)度fi(hj,ck)。
fi(hj,ck)=wj·dk·wj·dk|wj||dk||wj||di|---(4)]]>在等式(4)中,向量di或dk是矩陣D(等式(2))(圖7)的第i或第k行向量(與對于第i或第k行項(xiàng)目的每個(gè)列項(xiàng)目相對應(yīng)的一組元素),向量wj是矩陣W(等式(3))(圖8)的第j行向量。
也就是說,將提取信息向量和關(guān)聯(lián)目標(biāo)候選內(nèi)容向量之間的余弦相似度與提取信息向量和關(guān)聯(lián)源內(nèi)容向量之間的余弦相似度乘到一起的結(jié)果是相關(guān)度fi(hj,ck)。
圖9示出了當(dāng)矩陣D和矩陣W是圖7和圖8所示的矩陣且關(guān)聯(lián)源內(nèi)容是藝術(shù)家A的內(nèi)容時(shí),關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度。由于高相關(guān)度表示高相關(guān)性,所以通過該步驟中的計(jì)算來對關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)性分級。
附帶地說,當(dāng)使用PLSA等對內(nèi)容和提取信息建模時(shí)(也就是說,當(dāng)作出概率表達(dá)時(shí)),可以將聯(lián)合概率(等式(5))、條件概率(等式(6))等設(shè)置為相關(guān)度。
fi(wj,dk)=P(di,wj,dk)]]>=ΣZP(di|z)P(wj|z)P(dk|z)P(z)---(5)]]>[等式6]
fi(wj,dk)=P(di|wj,dk)]]>=p(di,wj,dk)P(wj,dk)]]>=ΣZP(di|z)P(wj|z)P(dk|z)P(z)ΣZP(wj|z)P(dk|z)P(z)---(6)]]>在下一步驟S3中,參考在步驟S2中獲得的相關(guān)度,關(guān)聯(lián)檢測單元15將具有高相關(guān)度的關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組的關(guān)聯(lián)目標(biāo)候選內(nèi)容檢測為關(guān)聯(lián)目標(biāo)內(nèi)容(與關(guān)聯(lián)源內(nèi)容具有高相關(guān)性的內(nèi)容),并且將該組的提取信息檢測為相關(guān)性信息(描述關(guān)聯(lián)源內(nèi)容和關(guān)聯(lián)目標(biāo)內(nèi)容之間的相關(guān)性的信息)。
具體地,將具有等于或高于預(yù)定閾值的相關(guān)度的組的關(guān)聯(lián)目標(biāo)候選內(nèi)容檢測為關(guān)聯(lián)目標(biāo)內(nèi)容,并且將所述組的提取信息檢測為相關(guān)性信息。
例如,當(dāng)獲得圖9所示的相關(guān)度時(shí),假設(shè)相關(guān)度的閾值為0.5,則具有等于或高于該閾值的組如下。
(悲哀的(sad),藝術(shù)家B)、(悲哀的,藝術(shù)家C)、(令人傷心的(heartrending),藝術(shù)家B)、(令人傷心的,藝術(shù)家C)(感傷的(sentimental),藝術(shù)家B)、(感傷的,藝術(shù)家C)(流行的(groovy),藝術(shù)家D)、(流行的,藝術(shù)家E)(有活力的(vibrant),藝術(shù)家D)和(有活力的,藝術(shù)家E)因此,將“藝術(shù)家B”、“藝術(shù)家C”、“藝術(shù)家D”、和“藝術(shù)家E”檢測作為關(guān)聯(lián)目標(biāo)內(nèi)容,而將“悲哀的”、“令人傷心的”、和“感傷的”檢測為對應(yīng)于“藝術(shù)家B”和“藝術(shù)家C”的相關(guān)性信息,并將“流行的”、“有活力的”檢測為對應(yīng)于“藝術(shù)家D”和“藝術(shù)家E”的相關(guān)性信息。
在下一步驟S4中,呈現(xiàn)單元16向用戶呈現(xiàn)在步驟S3中檢測到的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
具體地,例如,呈現(xiàn)單元16生成用于顯示關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息的顯示屏幕,并且隨后將該顯示屏幕顯示在圖中未示出的顯示單元上。
圖10示出當(dāng)將閾值設(shè)置為0.5時(shí),基于圖9中示出的相關(guān)度而檢測到的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息的顯示示例。
在該示例中,作為與“藝術(shù)家A”的音樂片段(關(guān)聯(lián)源內(nèi)容)相關(guān)聯(lián)的內(nèi)容,顯示“藝術(shù)家B”和“藝術(shù)家C”的姓名等,以便對應(yīng)“悲哀的”、“令人傷心的”、和“感傷的”的每一個(gè),并且顯示“藝術(shù)家D”和“藝術(shù)家E”的姓名等,以便對應(yīng)“流行的”和“有活力的”的每一個(gè)。
因此,用戶可以了解“藝術(shù)家B”和“藝術(shù)家C”的音樂片段在詞“悲哀的”、“令人傷心的”、和“感傷的”的含義上與“藝術(shù)家A”的音樂片段相關(guān)聯(lián),并且“藝術(shù)家D”和“藝術(shù)家E”的音樂片段在詞“流行的”和“有活力的”的含義上與“藝術(shù)家A”的音樂片段相關(guān)聯(lián)。
因此,例如,在用戶現(xiàn)在正在聽的“藝術(shù)家A”的音樂片段是關(guān)聯(lián)源內(nèi)容的情況下,當(dāng)接下來用戶期望聽“悲哀的”音樂(例如,節(jié)奏慢的音樂)時(shí),用戶可以選擇“藝術(shù)家B”或“藝術(shù)家C”的音樂片段。當(dāng)用戶接下來希望聽“流行的”音樂(例如,節(jié)奏快的音樂)時(shí),用戶可以選擇“藝術(shù)家D”或“藝術(shù)家E”的音樂片段。
附帶地說,當(dāng)一個(gè)相關(guān)性信息與多個(gè)內(nèi)容相關(guān)聯(lián)時(shí),可以根據(jù)相關(guān)度來確定呈現(xiàn)所述內(nèi)容的方法。在圖10的示例中,“藝術(shù)家B”和“藝術(shù)家C”與“悲哀的”、“令人傷心的”、和“感傷的”相關(guān)聯(lián),并且“藝術(shù)家D”和“藝術(shù)家E”與“流行的”和“有活力的”相關(guān)聯(lián)。首先(在上側(cè))顯示與每個(gè)相關(guān)性信息具有更高相關(guān)度的內(nèi)容。
例如,“悲哀的”與“藝術(shù)家B”的相關(guān)度(0.77)高于“悲哀的”與“藝術(shù)家C”的相關(guān)度(0.72)。因此,“藝術(shù)家B”顯示在“藝術(shù)家C”上面,以便對應(yīng)“悲哀的”。
在圖10的示例中,僅僅與相關(guān)性信息相對應(yīng)地顯示關(guān)聯(lián)目標(biāo)內(nèi)容。然而,當(dāng)選擇關(guān)聯(lián)目標(biāo)內(nèi)容時(shí)(當(dāng)注意力集中在關(guān)聯(lián)目標(biāo)內(nèi)容上時(shí)),可以顯示關(guān)聯(lián)目標(biāo)內(nèi)容的內(nèi)容信息。此外,可以突出與內(nèi)容信息中的相關(guān)性信息相對應(yīng)的信息。
例如,當(dāng)在圖10的示例中選擇了對應(yīng)于“令人傷心的”而顯示的“藝術(shù)家C”時(shí),如圖11所示,將“藝術(shù)家C”的評論的文本(內(nèi)容信息)顯示在所選擇的“藝術(shù)家C”下面,并且突出(加下劃線)與作為評論文本中的相關(guān)性信息的“令人傷心的”相對應(yīng)的詞(“令人傷心的”)。
附帶地說,不僅可以通過下劃線,還還可以通過粗體字、不同字符顏色、動(dòng)畫等來突出該詞。
另外,代替當(dāng)關(guān)聯(lián)目標(biāo)內(nèi)容被選擇時(shí)顯示內(nèi)容信息,可以從每個(gè)關(guān)聯(lián)目標(biāo)內(nèi)容的開始顯示該內(nèi)容信息。附帶地說,在這種情況下,可以顯示所有內(nèi)容信息,或者可以只顯示包括對應(yīng)于相關(guān)性信息的信息的部分(例如,包括對應(yīng)于相關(guān)性信息的詞以及該詞之前和之后的若干個(gè)詞的部分)。
此外,代替如圖10所示排列并顯示相關(guān)性信息和關(guān)聯(lián)目標(biāo)內(nèi)容使得相關(guān)性信息和關(guān)聯(lián)目標(biāo)內(nèi)容彼此對應(yīng),可以生成并呈現(xiàn)例如“具有‘令人傷心的’悲痛的感覺的‘藝術(shù)家B’和‘藝術(shù)家C’怎么樣”的消息。
如上所述地執(zhí)行呈現(xiàn)處理。
由此,計(jì)算關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度。因此,有可能檢測與關(guān)聯(lián)源內(nèi)容具有高相關(guān)性的關(guān)聯(lián)目標(biāo)內(nèi)容,并且同時(shí)檢測指示關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息,并且呈現(xiàn)關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。從而,用戶可以根據(jù)相關(guān)性信息掌握所呈現(xiàn)的關(guān)聯(lián)目標(biāo)內(nèi)容和關(guān)聯(lián)源內(nèi)容之間的相關(guān)性。
另外,相關(guān)性信息對應(yīng)于從內(nèi)容信息提取的提取信息,并且不是由用戶設(shè)置的。因此,從任意視點(diǎn)為用戶檢測關(guān)聯(lián)目標(biāo)內(nèi)容。
附帶地說,在圖3、圖7、圖8和圖9的示例中,內(nèi)容信息是評論文本。然而,評論文本僅僅是示例,內(nèi)容信息可以是除了評論文本之外的其它形式。
圖12示出應(yīng)用本發(fā)明的另一信息處理設(shè)備1的結(jié)構(gòu)示例。通過進(jìn)一步提供提取信息聚類生成單元21并且提供代替圖1的信息處理設(shè)備1中的相關(guān)度計(jì)算單元14的相關(guān)度計(jì)算單元22,來形成該信息處理設(shè)備1。其它部分與圖1的信息處理設(shè)備1中的其它部分相同,因此將在適當(dāng)時(shí)省略對其的描述。
例如,在顯示呈現(xiàn)信息時(shí),存在由于顯示區(qū)域的有限尺寸而期望減少呈現(xiàn)信息量的情況。另外,存在期望更有效地呈現(xiàn)信息的情況。
因此,信息處理設(shè)備1通過基于預(yù)定標(biāo)準(zhǔn)將提取信息分類來減少最終要呈現(xiàn)的呈現(xiàn)信息量。
提取信息聚類生成單元21基于提取信息的含義或模型對提取信息進(jìn)行分組,并由此生成提取信息聚類。
例如,當(dāng)提取信息是詞時(shí),將某個(gè)注釋變化(notational variations)范圍之內(nèi)的詞或在詞匯上具有細(xì)微差異的詞分組成一組。當(dāng)提取信息是元數(shù)據(jù)時(shí),將高度相關(guān)的元數(shù)據(jù)分組成一組。
提取信息聚類生成單元21還確定代表所生成的聚類的提取信息(在下文中稱為代表性提取信息)。
例如,當(dāng)提取信息是詞時(shí),如在k-均值(k-means)方法中那樣在空間中定義聚類的中心,并且,最接近聚類中心的詞代表該聚類,并被設(shè)置為代表性提取信息。在這種情況下,沒有實(shí)際出現(xiàn)在內(nèi)容信息中的詞可以是代表性提取信息。
附帶地說,有可能基于事先準(zhǔn)備的一般的或有限領(lǐng)域的詞庫來生成聚類,并將例如位于較高概念層次上的詞設(shè)置為代表性提取信息。另外,不限制這些方法,可以手動(dòng)地將所述詞替換為詞句。
如同圖1中的相關(guān)度計(jì)算單元14那樣,相關(guān)度計(jì)算單元22計(jì)算關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度(圖9)。
相關(guān)度計(jì)算單元22還以與由提取信息聚類生成單元21生成的聚類相對應(yīng)這樣的方式,轉(zhuǎn)換所計(jì)算的關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度。
具體地,計(jì)算等式(7)。
ΣqTqpRqki---(7)]]>在等式(7)中,R是示出關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度的(Nc-1)×Nw矩陣(圖9)。T是其中提取信息為行項(xiàng)目、聚類為列項(xiàng)目、以及通過等式(8)獲得行元素的Nw×Nkw矩陣。Nkw是聚類(代表性提取信息)的總數(shù)。
在等式(8)中,t是非零正值,并且當(dāng)在置換中分配權(quán)重時(shí)是對應(yīng)于p和q的預(yù)定值,而在其它情況下是1。
例如,當(dāng)對如圖8所示建模的提取信息執(zhí)行聚類,使得將“悲哀的”、“令人傷心的”、和“感傷的”包括在聚類1中,將“流行的”和“有活力的”包括在聚類2中,并將“純潔的”包括在聚類3中時(shí),獲得如圖13所示的其中元素是二進(jìn)制值1或0的矩陣T。附帶地說,當(dāng)給提取信息和代表性提取信息之間的對應(yīng)分配權(quán)重時(shí),所述元素取預(yù)定值。
然后,當(dāng)基于該矩陣T和圖9中的矩陣R來計(jì)算等式(7)時(shí),獲得如圖14所示的對應(yīng)于提取信息聚類的相關(guān)度。附帶地說,在圖13和圖14的示例中,聚類1、聚類2、和聚類3的代表性提取信息是“令人傷心的”、“流行的”和“純潔的”。
因此,將關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度(圖9)轉(zhuǎn)換成對應(yīng)于提取信息聚類的相關(guān)度(也就是說,關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息聚類的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度)(圖14)。
返回圖12,關(guān)聯(lián)檢測單元15將具有在關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息聚類的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度(圖14)中的高相關(guān)度的組的關(guān)聯(lián)目標(biāo)候選內(nèi)容檢測為關(guān)聯(lián)目標(biāo)內(nèi)容,并且將該組的聚類的代表性提取信息檢測為相關(guān)性信息,其中所述相關(guān)度是由相關(guān)度計(jì)算單元22計(jì)算的。
具體地,當(dāng)獲得圖14所示的相關(guān)度時(shí),假設(shè)相關(guān)度的閾值為0.5,具有等于或高于該閾值的相關(guān)度的組如下。
(令人傷心的,藝術(shù)家B)、(令人傷心的,藝術(shù)家C)(流行的,藝術(shù)家D)、和(流行的,藝術(shù)家E)因此,將“藝術(shù)家B”、“藝術(shù)家C”、“藝術(shù)家D”、和“藝術(shù)家E”檢測為關(guān)聯(lián)目標(biāo)內(nèi)容,而將“令人傷心的”檢測為對應(yīng)于“藝術(shù)家B”和“藝術(shù)家C”的相關(guān)性信息,并將“流行的”檢測為對應(yīng)于“藝術(shù)家D”和“藝術(shù)家E”的相關(guān)性信息。
如在圖1中那樣,例如,呈現(xiàn)單元16生成用于顯示由關(guān)聯(lián)檢測單元15檢測到的關(guān)聯(lián)目標(biāo)內(nèi)容的姓名等和相關(guān)聯(lián)信息的顯示屏幕,然后將該顯示屏幕顯示在圖中未示出的顯示單元上,由此向用戶呈現(xiàn)關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
圖15示出基于圖14中的相關(guān)度檢測到的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息的顯示示例。圖15中的信息量小于圖10中呈現(xiàn)的信息量。
附帶地說,在上面,基于圖14中的相關(guān)度來檢測關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。然而,有可能通過計(jì)算等式(9)首先計(jì)算如圖16所示的提取信息聚類與關(guān)聯(lián)源內(nèi)容的相關(guān)度,然后檢測相關(guān)性信息(“令人傷心的”和“流行的”,閾值為0.5),并將具有高于閾值的相關(guān)度的關(guān)聯(lián)目標(biāo)候選內(nèi)容(“藝術(shù)家B”、“藝術(shù)家C”、“藝術(shù)家D”、和“藝術(shù)家E”)檢測為關(guān)聯(lián)目標(biāo)內(nèi)容,在關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息聚類的組的相關(guān)度(圖14)中,將與具有在這種情況下檢測到的相關(guān)性信息的聚類相對應(yīng)的相關(guān)度稱為其代表性提取信息。
1Nc-1ΣkΣqTpqRqki---(9)]]>
當(dāng)計(jì)算出如圖16所示的提取信息(或提取信息的聚類)與關(guān)聯(lián)源內(nèi)容的相關(guān)度時(shí),可以根據(jù)該相關(guān)度確定呈現(xiàn)相關(guān)性信息的方法。在圖15的示例中,在“流行的”之前(在“流行的”之上)顯示“令人傷心的”。
根據(jù)圖16的示例,“令人傷心的”與關(guān)聯(lián)源內(nèi)容的相關(guān)度(1.17)高于“流行的”與關(guān)聯(lián)源內(nèi)容的相關(guān)度(0.72)。因此,在圖15中,“令人傷心的”顯示在“流行的”之上。
如上所述,由于提取信息被聚類,并且獲得了對應(yīng)于提取信息聚類的相關(guān)度,因此可以適當(dāng)?shù)販p少呈現(xiàn)信息量。
另外,在本發(fā)明中,在同一空間中生成內(nèi)容模型和提取信息模型,并且對于每個(gè)關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組,計(jì)算與關(guān)聯(lián)源內(nèi)容的相關(guān)度(圖9)。因此,即使當(dāng)提取信息被聚類時(shí),也可以容易地從關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度計(jì)算出對應(yīng)于提取信息聚類的相關(guān)度(例如,等式(7))。
圖17示出了應(yīng)用本發(fā)明的另一信息處理設(shè)備1的結(jié)構(gòu)的示例。通過提供內(nèi)容聚類生成單元31、替代相關(guān)度計(jì)算單元14的相關(guān)度計(jì)算單元32、以及替代圖1的信息處理設(shè)備1中的關(guān)聯(lián)檢測單元15的關(guān)聯(lián)檢測單元33來形成該信息處理設(shè)備1。
內(nèi)容聚類生成單元31通過適當(dāng)方法使關(guān)聯(lián)目標(biāo)候選內(nèi)容聚類。
相關(guān)度計(jì)算單元32計(jì)算由內(nèi)容聚類生成單元31生成的關(guān)聯(lián)目標(biāo)候選內(nèi)容的聚類(在下文中稱為關(guān)聯(lián)目標(biāo)候選聚類)和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度。
關(guān)聯(lián)檢測單元33根據(jù)關(guān)聯(lián)目標(biāo)候選聚類和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度來檢測關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息,其中所述相關(guān)度是由相關(guān)度計(jì)算單元32計(jì)算的。
將參考圖18的流程圖描述信息處理設(shè)備1的操作。
在步驟S11中,如同圖2中的步驟S1那樣,模型生成單元12生成內(nèi)容模型(圖7)和提取信息模型(圖8),并將內(nèi)容模型和提取信息模型存儲(chǔ)在模型存儲(chǔ)單元13中。
在步驟S12中,內(nèi)容聚類生成單元31將關(guān)聯(lián)目標(biāo)候選內(nèi)容聚類。
該聚類方法是任意的;可以使用諸如k-均值方法的區(qū)域劃分型聚類、諸如最遠(yuǎn)相鄰方法的分級聚類等??商鎿Q地,可以將通過對于建模后的提取信息生成的Voronoi圖劃分的空間中的部分區(qū)域中的一組內(nèi)容當(dāng)作內(nèi)容聚類。
當(dāng)像在上述示例中那樣所述內(nèi)容是“藝術(shù)家A”、“藝術(shù)家B”、“藝術(shù)家C”、“藝術(shù)家D”、和“藝術(shù)家E”,以及關(guān)聯(lián)源內(nèi)容是“藝術(shù)家A”時(shí),例如,生成作為關(guān)聯(lián)目標(biāo)候選內(nèi)容的“藝術(shù)家B”和“藝術(shù)家C”的第一關(guān)聯(lián)目標(biāo)候選聚類1、以及“藝術(shù)家D”和“藝術(shù)家E”的第二關(guān)聯(lián)目標(biāo)候選聚類2。
在步驟S13中,相關(guān)度計(jì)算單元32計(jì)算關(guān)聯(lián)目標(biāo)候選聚類和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度。
當(dāng)利用LSA來對所述內(nèi)容和提取信息建模時(shí),利用等式(10)計(jì)算第j提取信息Hj和第k關(guān)聯(lián)目標(biāo)候選聚類CCk的組與第i關(guān)聯(lián)源內(nèi)容Ci的相關(guān)度。
fi(hj,cck)=wj·Σd∈Dkd·wj·di|wj||Σd∈Dkd||wj||di|---(10)]]>當(dāng)內(nèi)容模型和提取信息模型是如圖7和圖8所示的模型、并且生成作為關(guān)聯(lián)目標(biāo)候選內(nèi)容的“藝術(shù)家B”和“藝術(shù)家C”的第一關(guān)聯(lián)目標(biāo)候選聚類1以及“藝術(shù)家D”和“藝術(shù)家E”的第二關(guān)聯(lián)目標(biāo)候選聚類2時(shí),計(jì)算如圖19所示的關(guān)聯(lián)目標(biāo)候選聚類和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度。
在步驟S14中,關(guān)聯(lián)檢測單元33基于關(guān)聯(lián)目標(biāo)候選聚類和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度,檢測關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息,其中所述相關(guān)度是由相關(guān)度計(jì)算單元32計(jì)算的。
當(dāng)獲得圖19所示的相關(guān)度時(shí),假設(shè)相關(guān)度的閾值為0.5,具有等于或高于該閾值的相關(guān)度的組如下。
(悲哀的,關(guān)聯(lián)目標(biāo)候選聚類1)、(令人傷心的,關(guān)聯(lián)目標(biāo)候選聚類1)、(感傷的,關(guān)聯(lián)目標(biāo)候選聚類1)、(流行的,關(guān)聯(lián)目標(biāo)候選聚類2)、以及(有活力的,關(guān)聯(lián)目標(biāo)候選聚類2)因此,將被分類到關(guān)聯(lián)目標(biāo)候選聚類1的“藝術(shù)家B”和“藝術(shù)家C”以及被分類到關(guān)聯(lián)目標(biāo)候選聚類2的“藝術(shù)家D”和“藝術(shù)家E”檢測為關(guān)聯(lián)目標(biāo)內(nèi)容,而將“悲哀的”、“令人傷心的”、和“感傷的”檢測為對應(yīng)于“藝術(shù)家B”和“藝術(shù)家C”的相關(guān)性信息,并將“流行的”和“有活力的”檢測為對應(yīng)于“藝術(shù)家D”和“藝術(shù)家E”的相關(guān)性信息。
在下一步驟S15中,呈現(xiàn)單元16向用戶呈現(xiàn)在步驟S14中檢測的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
圖20示出當(dāng)將閾值設(shè)置為0.5時(shí)基于圖19所示的相關(guān)度而檢測到的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息的顯示示例。
在該示例中,如在圖10的示例中那樣,作為與“藝術(shù)家A”(關(guān)聯(lián)源內(nèi)容)的音樂片段相關(guān)聯(lián)的內(nèi)容,顯示“藝術(shù)家B”和“藝術(shù)家C”的姓名等,以便對應(yīng)“悲哀的”、“令人傷心的”、和“感傷的”的每一個(gè),并且顯示“藝術(shù)家D”和“藝術(shù)家E”的姓名等,以便對應(yīng)“流行的”和“有活力的”的每一個(gè)。將針對不同聚類而不同的背景添加到藝術(shù)家的顯示上(將相同背景添加到“藝術(shù)家B”和“藝術(shù)家C”的顯示上,并且將相同背景添加到“藝術(shù)家D”和“藝術(shù)家E”的顯示上)。
附帶地說,仍然在該示例中,可以如同在圖12的信息處理設(shè)備1的情況中那樣提供提取信息聚類生成單元21,從而計(jì)算如圖21所示的關(guān)聯(lián)目標(biāo)候選聚類和提取信息聚類的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度,并且基于該相關(guān)度檢測關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。另外,有可能計(jì)算如圖16所示的提取信息聚類與關(guān)聯(lián)源內(nèi)容的相關(guān)度,并使用該相關(guān)度檢測關(guān)聯(lián)目標(biāo)內(nèi)容和提取信息。
圖22示出應(yīng)用本發(fā)明的另一信息處理設(shè)備1的結(jié)構(gòu)的示例。通過進(jìn)一步提供內(nèi)容信息輸入單元41、提供替代模型生成單元12的模型生成單元42、并且提供替代圖1的信息處理設(shè)備1中的相關(guān)度計(jì)算單元14的相關(guān)度計(jì)算單元43來形成該信息處理設(shè)備1。
每次增加新內(nèi)容時(shí),使用包括新內(nèi)容的內(nèi)容信息的內(nèi)容信息來如上所述(圖2中的步驟S1)重新生成內(nèi)容模型和提取信息模型花費(fèi)時(shí)間和成本。
因此,當(dāng)增加新內(nèi)容時(shí),信息處理設(shè)備1通過將新內(nèi)容的內(nèi)容信息的向量添加到已經(jīng)生成的內(nèi)容模型來簡單地重新構(gòu)造內(nèi)容模型。
內(nèi)容信息輸入單元41接收新內(nèi)容的內(nèi)容信息,然后將新內(nèi)容的內(nèi)容信息提供給模型生成單元42。
在從內(nèi)容信息輸入單元41將內(nèi)容信息提供到模型生成單元42之前,如同圖12中的模型生成單元12那樣,模型生成單元42已經(jīng)根據(jù)存儲(chǔ)在內(nèi)容信息存儲(chǔ)單元11中的內(nèi)容信息生成了內(nèi)容模型和提取信息模型,并且已經(jīng)將該內(nèi)容模型和提取信息模型存儲(chǔ)在模型存儲(chǔ)單元13中。
當(dāng)從內(nèi)容信息輸入單元41提供內(nèi)容信息時(shí),模型生成單元42將內(nèi)容信息的向量添加到存儲(chǔ)在模型存儲(chǔ)單元13中的內(nèi)容模型,并因此重新構(gòu)造內(nèi)容模型。
具體地,當(dāng)利用LSA對內(nèi)容和提取信息建模時(shí),例如,通過已經(jīng)生成的提取信息模型(矩陣W),將新內(nèi)容的向量dnew(新內(nèi)容的內(nèi)容信息)轉(zhuǎn)換成對應(yīng)于已經(jīng)生成的內(nèi)容模型的向量d’new,如等式(11)所示。
d′new=Wdnew…(11)然后,將如此計(jì)算的向量d’new添加到已經(jīng)生成的內(nèi)容模型(矩陣D),并且因此重新構(gòu)造內(nèi)容模型。
例如,當(dāng)已經(jīng)從圖3所示的內(nèi)容-提取信息頻率矩陣X生成了圖7所示的內(nèi)容模型和圖8中所示的提取信息模型時(shí),增加個(gè)人日記作為新內(nèi)容,并且從內(nèi)容信息輸入單元41提供句子“今天發(fā)生了悲哀的事件。我不能承受令人傷心的悲痛?!弊鳛閮?nèi)容信息,模型生成單元42將與“悲哀的”、“令人傷心的”、“感傷的”、“流行的”、“有活力的”和“純潔的”相對應(yīng)的這一內(nèi)容信息的向量dnew確定為提取信息,如等式(12)所示(向量dnew是從新內(nèi)容的內(nèi)容信息提取這些提取信息的一組頻率)。
dnew=(1.1.0.0.0.0)...(12)然后,模型生成單元42使用等式(12)所示的向量dnew來計(jì)算等式(11),獲得如等式(13)所示的對應(yīng)于已經(jīng)生成的內(nèi)容模型(圖7)(三維矩陣D)的向量d’new,然后將向量d’new添加到所述內(nèi)容模型(圖7),因此重新構(gòu)造了內(nèi)容模型。
d’new=(3.92,0.04,0.53)...(13)這樣,重新構(gòu)造了內(nèi)容模型。
返回圖22,相關(guān)度計(jì)算單元43使用由模型生成單元42重新構(gòu)造的內(nèi)容模型和已經(jīng)生成的提取信息模型(例如,通過計(jì)算等式(4)),來計(jì)算關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息的組與關(guān)聯(lián)源內(nèi)容的相關(guān)度。
例如,當(dāng)使用通過將等式(13)所示的向量d’new添加到圖7所示的內(nèi)容模型而重新構(gòu)造的內(nèi)容模型時(shí),假設(shè)新內(nèi)容是關(guān)聯(lián)源內(nèi)容,獲得圖23所示的關(guān)聯(lián)目標(biāo)候選內(nèi)容(在這種情況下,藝術(shù)家A是關(guān)聯(lián)目標(biāo)候選內(nèi)容)和提取信息的組的相關(guān)度。
返回圖22,例如,關(guān)聯(lián)檢測單元15將具有在由相關(guān)度計(jì)算單元43計(jì)算的相關(guān)度中的高相關(guān)度的組的關(guān)聯(lián)目標(biāo)候選內(nèi)容檢測為關(guān)聯(lián)目標(biāo)內(nèi)容,并且將該組的提取信息檢測為相關(guān)性信息。
具體地,當(dāng)獲得圖23所示的相關(guān)度時(shí),假設(shè)相關(guān)度的閾值為0.5,具有等于或高于該閾值的相關(guān)度的組如下。
(悲哀的,藝術(shù)家A)、(悲哀的,藝術(shù)家B)、(悲哀的,藝術(shù)家C)、(令人傷心的,藝術(shù)家A)、(令人傷心的,藝術(shù)家B)、(令人傷心的,藝術(shù)家C)(感傷的,藝術(shù)家A)、(感傷的,藝術(shù)家B)、和(感傷的,藝術(shù)家C)因此,將“藝術(shù)家A”、“藝術(shù)家B”和“藝術(shù)家C”檢測為關(guān)聯(lián)目標(biāo)內(nèi)容,而將“悲哀的”、“令人傷心的”、和“感傷的”檢測為對應(yīng)于“藝術(shù)家A”、“藝術(shù)家B”和“藝術(shù)家C”的相關(guān)性信息。
如在圖1中那樣,例如,呈現(xiàn)單元16生成用于顯示由關(guān)聯(lián)檢測單元15檢測的關(guān)聯(lián)目標(biāo)內(nèi)容的姓名等和相關(guān)性信息的顯示屏幕,然后將該顯示屏幕顯示在圖中未示出的顯示單元上,由此向用戶呈現(xiàn)所述關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
如上所述,當(dāng)增加新內(nèi)容時(shí),可以簡單地重新構(gòu)造內(nèi)容模型。因此,即使增加新內(nèi)容時(shí),也可以容易地檢測到關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
另外,由于當(dāng)增加新內(nèi)容時(shí)這樣容易地檢測關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息,因此有可能將新內(nèi)容設(shè)置為關(guān)聯(lián)源內(nèi)容,基于其與新內(nèi)容的關(guān)系檢測關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息,并且呈現(xiàn)該關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。也就是說,例如,每次更新日記時(shí),可以向用戶呈現(xiàn)對應(yīng)于所述更新的內(nèi)容的關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
附帶地說,仍然在該示例中,可以像在圖12的信息處理設(shè)備1的情況中那樣提供提取信息聚類生成單元21,從而計(jì)算出關(guān)聯(lián)目標(biāo)候選內(nèi)容和提取信息聚類的組與關(guān)聯(lián)源內(nèi)容(例如,增加的日記)的相關(guān)度,如圖24所示,并且基于該相關(guān)度檢測關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息。
雖然在圖1、圖12、圖17和圖22中的一個(gè)信息處理設(shè)備1內(nèi)提供每個(gè)部分,但是并不一定需要在一個(gè)信息處理設(shè)備1中提供每個(gè)部分,并且例如可以將用于實(shí)現(xiàn)每個(gè)部分的模塊分布在網(wǎng)絡(luò)上。
不僅可以通過硬件還可以通過軟件來進(jìn)行上述的一系列處理。當(dāng)要通過軟件來進(jìn)行這一系列處理時(shí),將構(gòu)成該軟件的程序安裝在通用個(gè)人計(jì)算機(jī)等上。
圖25示出其上安裝了用于執(zhí)行上述的一系列處理的程序的計(jì)算機(jī)的實(shí)施例的結(jié)構(gòu)示例。
可以將所述程序預(yù)先記錄在作為被包含在計(jì)算機(jī)中的記錄介質(zhì)的硬盤2005上或ROM 2003中。
可替換地,可以臨時(shí)或永久地將所述程序存儲(chǔ)(記錄)在諸如軟盤、CD-ROM(致密盤只讀存儲(chǔ)器)、MO(磁光)盤、DVD(數(shù)字多用途盤)、磁盤、半導(dǎo)體存儲(chǔ)器等的可移動(dòng)記錄介質(zhì)2011上。可以作為所謂的成套軟件(packaged software)提供這種可移動(dòng)記錄介質(zhì)201。
附帶地說,除了從上述可移動(dòng)記錄介質(zhì)2011安裝到計(jì)算機(jī)上之外,可以通過無線電經(jīng)由用于數(shù)字衛(wèi)星廣播的人造衛(wèi)星從下載站點(diǎn)將程序傳送到計(jì)算機(jī),或者通過線路經(jīng)由諸如LAN(局域網(wǎng))、因特網(wǎng)等的網(wǎng)絡(luò)將程序傳送到計(jì)算機(jī),并且計(jì)算機(jī)可以通過通信單元2008接收如此傳送的程序,并將該程序安裝到內(nèi)置硬盤2005上。
計(jì)算機(jī)包括CPU(中央處理單元)2002。CPU 2002經(jīng)由總線2001與輸入-輸出接口2010連接。當(dāng)用戶通過例如操作由鍵盤、鼠標(biāo)、麥克風(fēng)等形成的輸入單元2007而經(jīng)由輸入-輸出接口2010輸入命令時(shí),CPU 2002根據(jù)該命令執(zhí)行存儲(chǔ)在ROM(只讀存儲(chǔ)器)2003中的程序??商鎿Q地,CPU 2002將存儲(chǔ)在硬盤2005上的程序、從衛(wèi)星或網(wǎng)絡(luò)傳送的通過通信單元2008接收的然后被安裝到硬盤2005上的程序、或者從被加載到驅(qū)動(dòng)器2009中的可移動(dòng)記錄介質(zhì)2011讀取然后被安裝到硬盤2005上的程序加載到RAM(隨機(jī)存取存儲(chǔ)器)2004中,然后執(zhí)行該程序。由此,CPU 2002執(zhí)行由上述方框圖的結(jié)構(gòu)執(zhí)行的處理。然后,在需要時(shí),例如,CPU 2002經(jīng)由輸入-輸出接口2010將處理結(jié)果輸出到由LCD(液晶顯示器)、揚(yáng)聲器等形成的輸出單元2006,經(jīng)由輸入-輸出接口2010從通信單元2008發(fā)送該結(jié)果、或?qū)⒃摻Y(jié)果記錄到硬盤2005上。
可以由一臺(tái)計(jì)算機(jī)處理所述程序,或者可以由多臺(tái)計(jì)算機(jī)對其進(jìn)行分布式處理。此外,可以將所述程序傳送到遠(yuǎn)程計(jì)算機(jī)然后執(zhí)行該程序。
應(yīng)該注意,本發(fā)明的實(shí)施例不限于上述實(shí)施例,并且能夠進(jìn)行各種改變,而不偏離本發(fā)明的精神。
本領(lǐng)域技術(shù)人員應(yīng)該懂得根據(jù)設(shè)計(jì)要求和其他因素,可以進(jìn)行各種修改、組合、子組合和替換,只要它們處于所附權(quán)利要求或其等效物的范圍之內(nèi)即可。
相關(guān)申請交叉引用本發(fā)明包含涉及2006年3月10日在日本專利局提交的日本專利申請JP2006-066469的主題,其全部內(nèi)容通過引用而被合并于此。
權(quán)利要求
1.一種信息處理設(shè)備,包括生成部件,用于基于多個(gè)內(nèi)容、從所述多個(gè)內(nèi)容的內(nèi)容信息提取的提取信息、以及由所述內(nèi)容的每一個(gè)的所述提取信息指示的值,生成在同一二維或更多維空間中的所述內(nèi)容的數(shù)值模型和所述提取信息的數(shù)值模型;計(jì)算部件,用于使用所述同一空間中的所述內(nèi)容的數(shù)值模型和所述提取信息的數(shù)值模型,來計(jì)算在所述多個(gè)內(nèi)容中除了預(yù)定的關(guān)聯(lián)源內(nèi)容之外的關(guān)聯(lián)目標(biāo)候選內(nèi)容和所述提取信息的組與所述關(guān)聯(lián)源內(nèi)容的相關(guān)度;關(guān)聯(lián)檢測部件,用于基于所述計(jì)算部件計(jì)算的所述相關(guān)度,檢測與所述關(guān)聯(lián)源內(nèi)容相關(guān)聯(lián)的關(guān)聯(lián)目標(biāo)內(nèi)容以及指示所述關(guān)聯(lián)目標(biāo)內(nèi)容和所述關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息;以及呈現(xiàn)部件,用于呈現(xiàn)所述關(guān)聯(lián)檢測部分檢測到的所述關(guān)聯(lián)目標(biāo)內(nèi)容和所述相關(guān)性信息。
2.如權(quán)利要求1所述的信息處理設(shè)備,其中,所述關(guān)聯(lián)檢測部件將具有高于閾值的所述相關(guān)度的所述組的所述關(guān)聯(lián)目標(biāo)候選內(nèi)容設(shè)置為所述關(guān)聯(lián)目標(biāo)內(nèi)容,并且將所述組的提取信息設(shè)置為所述相關(guān)性信息。
3.如權(quán)利要求1所述的信息處理設(shè)備,其中,所述呈現(xiàn)部件顯示由所述關(guān)聯(lián)檢測部件檢測到的所述關(guān)聯(lián)目標(biāo)內(nèi)容和所述相關(guān)性信息。
4.如權(quán)利要求3所述的信息處理設(shè)備,其中,所述呈現(xiàn)部件對應(yīng)于所述關(guān)聯(lián)目標(biāo)內(nèi)容的顯示而顯示所述關(guān)聯(lián)目標(biāo)內(nèi)容的內(nèi)容信息的全部或一部分。
5.如權(quán)利要求4所述的信息處理設(shè)備,其中,所述呈現(xiàn)部件突出與對應(yīng)于所述關(guān)聯(lián)目標(biāo)內(nèi)容的顯示而顯示的所述內(nèi)容信息中的所述相關(guān)性信息相對應(yīng)的部分。
6.如權(quán)利要求3所述的信息處理設(shè)備,其中,所述呈現(xiàn)部件在所述相關(guān)度的基礎(chǔ)上確定關(guān)聯(lián)目標(biāo)內(nèi)容和相關(guān)性信息之一的顯示形式。
7.如權(quán)利要求1所述的信息處理設(shè)備,還包括用于通過對所述提取信息進(jìn)行分組而生成所述提取信息的聚類的聚類生成部件,其中,所述計(jì)算部件將所計(jì)算的所述關(guān)聯(lián)目標(biāo)候選內(nèi)容和所述提取信息的組與所述關(guān)聯(lián)源內(nèi)容的相關(guān)度轉(zhuǎn)換成對應(yīng)于所述提取信息的聚類的相關(guān)度,以及所述關(guān)聯(lián)檢測部件將具有高于閾值的相關(guān)度的所述組的所述關(guān)聯(lián)目標(biāo)候選內(nèi)容設(shè)置為所述關(guān)聯(lián)目標(biāo)內(nèi)容,所述相關(guān)度對應(yīng)于所述提取信息的聚類,并且所述關(guān)聯(lián)檢測部件將代表所述組的所述提取信息的聚類的代表性提取信息設(shè)置為所述相關(guān)性信息。
8.如權(quán)利要求1所述的信息處理設(shè)備,還包括聚類生成部件,其用于通過對所述關(guān)聯(lián)目標(biāo)候選內(nèi)容進(jìn)行分組來生成所述關(guān)聯(lián)目標(biāo)候選內(nèi)容的關(guān)聯(lián)目標(biāo)候選聚類,其中,所述計(jì)算部件計(jì)算所述關(guān)聯(lián)目標(biāo)候選聚類和所述提取信息的組與所述關(guān)聯(lián)源內(nèi)容的相關(guān)度,以及所述關(guān)聯(lián)檢測部件將屬于具有高于閾值的所述相關(guān)度的所述組的所述關(guān)聯(lián)目標(biāo)候選聚類的關(guān)聯(lián)目標(biāo)候選內(nèi)容設(shè)置為所述關(guān)聯(lián)目標(biāo)內(nèi)容,并將所述組的所述提取信息設(shè)置為所述相關(guān)性信息。
9.如權(quán)利要求1所述的信息處理設(shè)備,還包括用于輸入內(nèi)容信息的輸入部件,其中,所述生成部件通過生成與利用所述輸入部件輸入的所述內(nèi)容信息的所述提取信息相對應(yīng)的向量、并將該向量添加到已經(jīng)生成的所述內(nèi)容的數(shù)值模型來重新構(gòu)造所述內(nèi)容的模型。
10.一種信息處理方法,包括以下步驟基于多個(gè)內(nèi)容、從所述多個(gè)內(nèi)容的內(nèi)容信息提取的提取信息、以及由所述內(nèi)容的每一個(gè)的所述提取信息指示的值,生成在同一二維或更多維空間中的所述內(nèi)容的數(shù)值模型和所述提取信息的數(shù)值模型;使用所述同一空間中的所述內(nèi)容的數(shù)值模型和所述提取信息的數(shù)值模型,來計(jì)算在所述多個(gè)內(nèi)容中除了預(yù)定的關(guān)聯(lián)源內(nèi)容之外的關(guān)聯(lián)目標(biāo)候選內(nèi)容和所述提取信息的組與所述關(guān)聯(lián)源內(nèi)容的相關(guān)度;基于在所述計(jì)算步驟的處理中計(jì)算的所述相關(guān)度,檢測與所述關(guān)聯(lián)源內(nèi)容相關(guān)聯(lián)的關(guān)聯(lián)目標(biāo)內(nèi)容、以及指示所述關(guān)聯(lián)目標(biāo)內(nèi)容和所述關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息;以及呈現(xiàn)在所述關(guān)聯(lián)檢測步驟的處理中檢測的所述關(guān)聯(lián)目標(biāo)內(nèi)容和所述相關(guān)性信息。
11.一種用于使計(jì)算機(jī)執(zhí)行呈現(xiàn)處理的程序,所述呈現(xiàn)處理用于呈現(xiàn)指示與特定內(nèi)容相關(guān)聯(lián)的內(nèi)容的信息,所述呈現(xiàn)處理包括以下步驟基于多個(gè)內(nèi)容、從所述多個(gè)內(nèi)容的內(nèi)容信息提取的提取信息、以及由所述內(nèi)容的每一個(gè)的所述提取信息指示的值,生成在同一二維或更多維空間中的所述內(nèi)容的數(shù)值模型和所述提取信息的數(shù)值模型;使用所述同一空間中的所述內(nèi)容的數(shù)值模型和所述提取信息的數(shù)值模型,來計(jì)算在所述多個(gè)內(nèi)容中除了預(yù)定的關(guān)聯(lián)源內(nèi)容之外的關(guān)聯(lián)目標(biāo)候選內(nèi)容和所述提取信息的組與所述關(guān)聯(lián)源內(nèi)容的相關(guān)度;基于在所述計(jì)算步驟的處理中計(jì)算的所述相關(guān)度,檢測與所述關(guān)聯(lián)源內(nèi)容相關(guān)聯(lián)的關(guān)聯(lián)目標(biāo)內(nèi)容、以及指示所述關(guān)聯(lián)目標(biāo)內(nèi)容和所述關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息;以及呈現(xiàn)在所述關(guān)聯(lián)檢測步驟的處理中檢測的所述關(guān)聯(lián)目標(biāo)內(nèi)容和所述相關(guān)性信息。
12.一種信息處理設(shè)備,包括生成部分,用于基于多個(gè)內(nèi)容、從所述多個(gè)內(nèi)容的內(nèi)容信息提取的提取信息、以及由所述內(nèi)容的每一個(gè)的所述提取信息指示的值,生成在同一二維或更多維空間中的所述內(nèi)容的數(shù)值模型和所述提取信息的數(shù)值模型;計(jì)算部分,用于使用所述同一空間中的所述內(nèi)容的數(shù)值模型和所述提取信息的數(shù)值模型,來計(jì)算在所述多個(gè)內(nèi)容中除了預(yù)定的關(guān)聯(lián)源內(nèi)容之外的關(guān)聯(lián)目標(biāo)候選內(nèi)容和所述提取信息的組與所述關(guān)聯(lián)源內(nèi)容的相關(guān)度;關(guān)聯(lián)檢測部分,用于基于所述計(jì)算部分計(jì)算的所述相關(guān)度,檢測與所述關(guān)聯(lián)源內(nèi)容相關(guān)聯(lián)的關(guān)聯(lián)目標(biāo)內(nèi)容、以及指示所述關(guān)聯(lián)目標(biāo)內(nèi)容和所述關(guān)聯(lián)源內(nèi)容之間的相關(guān)性的相關(guān)性信息;以及呈現(xiàn)部分,用于呈現(xiàn)由所述關(guān)聯(lián)檢測部分檢測的所述關(guān)聯(lián)目標(biāo)內(nèi)容和所述相關(guān)性信息。
全文摘要
本發(fā)明提供一種包括生成部分、計(jì)算部分、關(guān)聯(lián)檢測部分和呈現(xiàn)部分的信息處理設(shè)備。
文檔編號G06F17/30GK101034414SQ200710087709
公開日2007年9月12日 申請日期2007年3月12日 優(yōu)先權(quán)日2006年3月10日
發(fā)明者館野啟 申請人:索尼株式會(huì)社