專利名稱:信息處理裝置、方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息處理裝置、信息處理方法和程序,且更具體地說涉及能夠向不同國家或文化的給定內(nèi)容精確地分配感覺信息的信息處理裝置、信息處理方法和程序。
背景技術(shù):
在現(xiàn)有技術(shù)中,可以通過向大量內(nèi)容分配指示內(nèi)容特征的元數(shù)據(jù)(例如,流派等) 來從大量內(nèi)容搜索期望內(nèi)容。特別地,近來,提出了其中通過向比如元數(shù)據(jù)等的內(nèi)容分配感覺信息 (sensibility information)(在下文中,稱為標(biāo)簽)來搜索和推薦適于用戶的情緒(心情) 的內(nèi)容的技術(shù)(例如,參見日本未審查專利申請公開No. 2007-172523),或提出了其中搜索和推薦具有與用戶指定的語境(指示用戶的情況和狀態(tài))對應(yīng)的心情標(biāo)簽的內(nèi)容的技術(shù) (例如,參見日本未審查專利申請公開No. 2007-207218)。
發(fā)明內(nèi)容
但是,作為能夠用于搜索上述內(nèi)容的標(biāo)簽的候選,不易于普遍地決定制備哪些標(biāo)簽。具體地,優(yōu)選地制備彼此不重疊(不類似)的許多候選;但是,估計相似性的存在或不存在費時且費力,因此是麻煩的。并且,關(guān)于不同國家或文化的內(nèi)容,通過翻譯指示標(biāo)簽的單詞來搜索內(nèi)容。例如, 當(dāng)已經(jīng)向美國的一段音樂分配日語單詞“shiawase”作為元數(shù)據(jù)時,根據(jù)詞典使用與日語 "shiawase"對應(yīng)的英語單詞“happy”來搜索該段音樂。但是,在日本分配了 “shiawase”的音樂中,節(jié)奏是慢的,存在很少的打擊樂器,且和弦進(jìn)階(chord progressions)是平緩,然而在美國分配了 “happy”的音樂中,節(jié)奏是快的,且存在大量的打擊樂器。同樣地,由于人的感覺在不同國家或文化中不同,因此難以僅通過標(biāo)簽的翻譯來精確地搜索期望內(nèi)容。因此,可以預(yù)先對每個國家或文化領(lǐng)域制備標(biāo)簽并分配給內(nèi)容,但是費時且費力, 并且在不理解該國家的語言或文化的情況下難以精確地處理標(biāo)簽。期望向不同國家或文化的給定內(nèi)容精確地分配感覺信息。根據(jù)本發(fā)明的實施例,提供了信息處理裝置,包括獲得裝置,獲得分配了指示內(nèi)容的用戶主觀評價的標(biāo)簽作為元數(shù)據(jù)的多個內(nèi)容;選擇裝置,在分配給由獲得裝置獲得的多個內(nèi)容的標(biāo)簽當(dāng)中,選擇關(guān)于內(nèi)容的評價具有高可靠性的標(biāo)簽;計算裝置,計算由選擇裝置選擇的各標(biāo)簽之間的相似度;聚類裝置,基于由計算裝置計算的相似度來對標(biāo)簽進(jìn)行聚類;和存儲裝置,存儲作為在聚類裝置中進(jìn)行聚類的結(jié)果而獲得的聚類作為一個標(biāo)簽。該信息處理裝置可進(jìn)一步包括生成裝置,其生成聚類鑒別器,作為用于基于分配有由聚類裝置進(jìn)行聚類的標(biāo)簽的內(nèi)容的特征值,來鑒別對于內(nèi)容的聚類的相關(guān)性的鑒別器;和標(biāo)簽鑒別器,作為用于鑒別對于內(nèi)容的聚類標(biāo)簽的相關(guān)性的鑒別器,其中存儲裝置可以在聚類鑒別器的鑒別精度好于標(biāo)簽鑒別器的鑒別精度時將聚類存儲為一個標(biāo)簽。計算裝置可以計算由選擇裝置選擇的標(biāo)簽和由聚類裝置預(yù)先獲得的現(xiàn)有聚類之間的相似度,且聚類裝置可基于相似度使得標(biāo)簽包括在現(xiàn)有聚類中。生成裝置可生成作為關(guān)于通過使得標(biāo)簽被包括在現(xiàn)有聚類中而獲得的新的聚類的鑒別器的新的聚類鑒別器,且存儲裝置可在新的聚類鑒別器的鑒別精度好于關(guān)于現(xiàn)有聚類的聚類鑒別器的鑒別精度時將新的聚類存儲為一個標(biāo)簽。信息處理裝置可進(jìn)一步包括分配裝置,在用于評價內(nèi)容的標(biāo)簽輸入被包括在作為聚類裝置中進(jìn)行聚類的結(jié)果而獲得的聚類中時,向內(nèi)容分配除了被包括在聚類中的輸入標(biāo)簽之外的標(biāo)簽。可以使用多種不同語言給出標(biāo)簽。根據(jù)本發(fā)明的實施例,提供了信息處理方法,包括步驟獲得分配了指示內(nèi)容的用戶主觀評價的標(biāo)簽作為元數(shù)據(jù)的多個內(nèi)容;在分配給在獲得步驟中獲得的多個內(nèi)容的標(biāo)簽當(dāng)中,選擇關(guān)于內(nèi)容的評價具有高可靠性的標(biāo)簽;計算在選擇步驟選擇的各標(biāo)簽之間的相似度;基于在計算步驟計算的相似度對標(biāo)簽進(jìn)行聚類;和存儲作為在聚類步驟進(jìn)行聚類的結(jié)果而獲得的聚類為一個標(biāo)簽。根據(jù)本發(fā)明的實施例,提供了使得計算機能夠執(zhí)行以下步驟的程序獲得分配了指示內(nèi)容的用戶主觀評價的標(biāo)簽作為元數(shù)據(jù)的多個內(nèi)容;在分配給在獲得步驟中獲得的多個內(nèi)容的標(biāo)簽當(dāng)中,選擇關(guān)于內(nèi)容的評價具有高可靠性的標(biāo)簽;計算在選擇步驟選擇的各標(biāo)簽之間的相似度;基于在計算步驟計算的相似度對標(biāo)簽進(jìn)行聚類;和存儲作為在聚類步驟進(jìn)行聚類的結(jié)果而獲得的聚類為一個標(biāo)簽。根據(jù)本發(fā)明的實施例,獲得分配了指示內(nèi)容的用戶主觀評價的標(biāo)簽作為元數(shù)據(jù)的多個內(nèi)容,在分配給所獲得的多個內(nèi)容的標(biāo)簽當(dāng)中選擇具有關(guān)于內(nèi)容的評價的高可靠性的標(biāo)簽,計算所選標(biāo)簽之間的相似度,基于所計算的相似度對標(biāo)簽進(jìn)行聚類,和將作為進(jìn)行聚類的結(jié)果而獲得的聚類存儲為一個標(biāo)簽。根據(jù)本發(fā)明的實施例,可以向不同國家或文化的給定項目精確地分配感覺信息。
圖1是圖示根據(jù)本發(fā)明實施例的系統(tǒng)的配置的框圖。 圖2是圖示服務(wù)器的硬件配置示例的框圖。 圖3是圖示服務(wù)器的功能配置示例的框圖。 圖4是圖示標(biāo)簽管理單元的配置示例的圖。 圖5是圖示相似性計算單元中的處理的圖。 圖6是圖示相似性計算單元中的處理的圖。 圖7是圖示標(biāo)簽的示例的圖。 圖8是圖示精度計算單元中的處理的圖。 圖9是圖示翻譯列表的圖。
圖10是圖示標(biāo)簽聚類處理的示例的流程圖。 圖11是圖示標(biāo)簽聚類處理的另一示例的流程圖。 圖12是圖示標(biāo)簽分配處理的流程圖。
具體實施例方式在下文中,將參考附圖描述本發(fā)明的實施例。系統(tǒng)的配置圖1是圖示根據(jù)本發(fā)明實施例的系統(tǒng)的配置的圖。網(wǎng)絡(luò)1連接到服務(wù)器2和終端 3-1到3-N。圖1所示的系統(tǒng)是向用戶呈現(xiàn)由用戶搜索的給定內(nèi)容(例如,音樂、節(jié)目、商品等)的系統(tǒng)。網(wǎng)絡(luò)1包括因特網(wǎng)或LAN(局域網(wǎng))等。服務(wù)器2累積由用戶搜索的內(nèi)容并向其分配用于用戶搜索該內(nèi)容的信息。終端 3-1到3-N是用戶側(cè)終端。例如,當(dāng)用戶向終端3-1輸入關(guān)于搜索內(nèi)容的信息時,基于該信息在服務(wù)器2中搜索內(nèi)容并經(jīng)由網(wǎng)絡(luò)1將內(nèi)容提供給終端3-1。在下面的描述中,在不需要區(qū)分終端3-1到3-N的情況下,將終端3-1到3_N簡稱為終端3。雖然在圖1中單獨地示出服務(wù)器2,但是可以以復(fù)數(shù)提供服務(wù)器2。服務(wù)器的硬件配置接下來,將參考圖2描述服務(wù)器2的硬件配置。CPU (中央處理單元)21根據(jù)存儲在ROM (只讀存儲器)22或存儲單元觀中的程序來執(zhí)行各種處理。RAM(隨機存取存儲器)23適當(dāng)?shù)卮鎯τ蒀PU 21執(zhí)行的程序或數(shù)據(jù)。CPU 21、ROM 22和RAM 23經(jīng)由總線M彼此連接。CPU 21經(jīng)由總線M連接到輸入和輸出接口 25。輸入和輸出接口 25連接到由鍵盤、鼠標(biāo)、麥克風(fēng)等構(gòu)成的輸入單元26以及由顯示器、揚聲器等構(gòu)成的輸出單元27。CPU 21 響應(yīng)于從輸入單元26輸出的命令執(zhí)行各種處理。CPU 21將處理結(jié)果輸出到輸出單元27。連接到輸入和輸出接口 25的存儲單元觀例如包括硬盤,并存儲由CPU21執(zhí)行的程序或各種數(shù)據(jù)。通信單元四經(jīng)由網(wǎng)絡(luò)1與外部裝置(例如,終端幻通信,由此從外部裝置接收命令或?qū)⑿畔⑤敵龅酵獠垦b置。另外,可以經(jīng)由通信單元四獲得程序或?qū)⒊绦虼鎯υ诖鎯卧?8中。連接到輸入和輸出接口 25的驅(qū)動器30驅(qū)動安裝在驅(qū)動器30中的磁盤、光盤、磁光盤或比如半導(dǎo)體存儲器之類的可拆卸介質(zhì)31,并獲得存儲在其中的程序或數(shù)據(jù)。所獲得的程序或數(shù)據(jù)被可選地發(fā)送到存儲單元觀并存儲在存儲單元觀中。可以基本上以與服務(wù)器2相同的方式配置終端3,因此這里將省略其描述。服務(wù)器的功能配置接下來,將參考圖3描述服務(wù)器2的功能配置示例。圖3中的服務(wù)器2包括標(biāo)簽管理單元51、標(biāo)簽分配單元52、內(nèi)容DB (數(shù)據(jù)庫)53 和呈現(xiàn)(presentation)單元Μ。標(biāo)簽管理單元51和標(biāo)簽分配單元52由執(zhí)行預(yù)定程序的 CPU 21(圖2)實現(xiàn)。標(biāo)簽管理單元51管理作為分配給內(nèi)容的元數(shù)據(jù)的感覺標(biāo)簽(在下文中,簡稱為標(biāo)簽),并可選地將標(biāo)簽提供給標(biāo)簽分配單元52或呈現(xiàn)單元M。將在之后描述標(biāo)簽管理單元 51的細(xì)節(jié)。標(biāo)簽是指示內(nèi)容的用戶主觀評價(感覺)的信息。更具體地說,標(biāo)簽包括指示內(nèi)容的用戶情緒的心情(mood),指示用戶情況的語境(context)和指示用戶動作的活動 (activity)。
響應(yīng)于通過用戶來自終端3的命令,標(biāo)簽分配單元52讀取存儲在與存儲單元觀對應(yīng)的內(nèi)容DB 53中的內(nèi)容(圖2),并向內(nèi)容分配在標(biāo)簽管理單元51中管理的標(biāo)簽。標(biāo)簽分配單元52再次在內(nèi)容DB 53中存儲分配了標(biāo)簽的內(nèi)容,或?qū)⒃搩?nèi)容提供給呈現(xiàn)單元M。呈現(xiàn)單元M具有與圖2中的輸出單元27和通信單元四對應(yīng)的功能。用作輸出單元27的呈現(xiàn)單元M顯示響應(yīng)于來自終端3的命令讀取的、并在標(biāo)簽管理單元51中管理的標(biāo)簽,或顯示在內(nèi)容DB 53中累積的內(nèi)容。用作通信單元四的呈現(xiàn)單元M將響應(yīng)于來自終端3的命令讀取的、并在標(biāo)簽管理單元51中管理的標(biāo)簽或在內(nèi)容DB 53中累積的內(nèi)容經(jīng)由網(wǎng)絡(luò)1提供給終端3。在終端3的輸出單元(沒有示出)(顯示器等)上顯示提供給終端3的內(nèi)容。標(biāo)簽管理單元的配置現(xiàn)在將參考圖4描述標(biāo)簽管理單元51的詳細(xì)配置。標(biāo)簽管理單元51包括內(nèi)容獲得單元71、標(biāo)簽選擇單元72、相似性計算單元73、聚類(clustering)單元74、鑒別器生成單元75、精度計算單元76和標(biāo)簽DB 77。內(nèi)容獲得單元71從存儲在內(nèi)容DB 53 (圖3)、網(wǎng)絡(luò)1上的終端3或其他服務(wù)器等中的大量內(nèi)容中獲得預(yù)定量的內(nèi)容,并存儲所獲得的內(nèi)容。例如,當(dāng)內(nèi)容是音樂片段時,內(nèi)容獲得單元71獲得音樂片段的各個流派(J-P0P、搖滾、古典、enka等)。通過單個用戶或多個用戶(志愿者)向由內(nèi)容獲得單元71獲得的內(nèi)容預(yù)先分配作為元數(shù)據(jù)的標(biāo)簽。制備多個標(biāo)簽而不考慮國家(語言)或文化,并由志愿者將其分配給內(nèi)容作為內(nèi)容的評價。具體地,例如,當(dāng)某個日本人在聽到某段音樂A之后感覺“shiawase” 時,向音樂A分配日語標(biāo)簽“shiawase”,而當(dāng)某個美國人在聽到某段音樂B之后感覺 “happy”時,向音樂B分配英語標(biāo)簽“happy”。根據(jù)通過志愿者來自終端3的請求,分配給由內(nèi)容獲得單元71獲得的內(nèi)容的標(biāo)簽被分配給在服務(wù)器2的內(nèi)容DB 53中累積的內(nèi)容或網(wǎng)絡(luò)1上的內(nèi)容。由內(nèi)容獲得單元71獲得的內(nèi)容預(yù)先分配有關(guān)于內(nèi)容的物理(客觀)的特征值(在下文中,簡稱為特征值)。例如,當(dāng)內(nèi)容是音樂時,音樂的節(jié)奏、和弦進(jìn)階、聲音的上升、從關(guān)于音樂的語句提取的關(guān)鍵字等被分配給音樂作為特征值。
標(biāo)簽選擇單元72從分配給由內(nèi)容獲得單元71獲得的預(yù)定量的內(nèi)容的標(biāo)簽中選擇關(guān)于內(nèi)容的評價具有高可靠性的標(biāo)簽,并將所選的標(biāo)簽提供給相似性計算單元73。更具體地說,例如,標(biāo)簽選擇單元72從分配給由內(nèi)容獲得單元71獲得的內(nèi)容的標(biāo)簽中選擇標(biāo)簽,排除對于其所分配的內(nèi)容非常小的標(biāo)簽。并且,例如,當(dāng)由多個志愿者分配標(biāo)簽時,標(biāo)簽選擇單元72從分配給由內(nèi)容獲得單元71獲得的內(nèi)容的標(biāo)簽中選擇標(biāo)簽,排除存在由志愿者分配標(biāo)簽(內(nèi)容的評價)的趨向(評級(rating))的變化的標(biāo)簽。相似性計算單元73計算從標(biāo)簽選擇單元72提供的各個標(biāo)簽之間的相似度。例如,相似性計算單元73通過從標(biāo)簽選擇單元72獲得各個標(biāo)簽的評級的相關(guān)性來計算相似度。這里,將參考圖5描述標(biāo)簽之間相似度的計算。圖5示出在指示心情的標(biāo)簽和指示使用標(biāo)簽的國家的代碼之間的相關(guān)性。更具體地說,存在在“US” (美國)和英語“happy”之間、在“DE” (德國)和德語“gelimgen”之間、 在“JP”(日本)和日語“shiawase”之間以及在“US”(美國)和英語“mellow”之間的各個相關(guān)性。以這種方式,將標(biāo)簽分配給世界的各個國家(語言)。根據(jù)相似性計算單元73,如果例如五步評價或一致率(concordance rate)之類的相關(guān)性在“happy”和“gelimgen”之間高,則在“happy”和“gelimgen”之間的相似度(評級的相關(guān)性)高。另外,例如,如果例如五步評價或一致率之類的相關(guān)性在“shiawase”和 “mellow”之間高,則在“shiawase”和“mellow”之間的相似度(評級的相關(guān)性)高。相似性計算單元73可以基于分配有來自標(biāo)簽選擇單元72的各個標(biāo)簽的內(nèi)容的特征值來計算各個標(biāo)簽之間的相似度。這里,將參考圖6描述基于分配有各個標(biāo)簽的內(nèi)容的特征值,在標(biāo)簽之間相似度的計算。在圖6中,示出與圖5中相同的標(biāo)簽,且在右側(cè)分別示出分配有標(biāo)簽的內(nèi)容的特征值。并且,因為分配有各個標(biāo)簽的內(nèi)容不限于一個,所以假定通過對分配有標(biāo)簽的多個內(nèi)容的特征值量化、求平均和將其分類為高、中和低三級而獲得圖6所示的內(nèi)容的特征值。更具體地說,如圖6所示,作為分配有“happy”的內(nèi)容的特征值的節(jié)奏、和弦改變和敲擊分別是高、高和中。這指示分配有“happy”的內(nèi)容具有包含其中節(jié)奏是快的、存在很多和弦改變且存在略微多的打擊樂器的特征的趨向。另外,作為分配有“gelimgen”的內(nèi)容的特征值的節(jié)奏、和弦改變和敲擊分別是高、 高和高。這指示分配有“gelimgen”的內(nèi)容具有包含其中節(jié)奏是快的、存在很多和弦改變且存在很多打擊樂器的特征的趨向。另外,作為分配有“shiawase”的內(nèi)容的特征值的節(jié)奏、和弦改變和敲擊分別是低、 低和低。這指示分配有“shiawase”的內(nèi)容具有包含其中節(jié)奏是慢的、存在更少和弦改變且存在更少打擊樂器的特征的趨向。另外,作為分配有“mellow”的內(nèi)容的特征值的節(jié)奏、和弦改變和敲擊分別是低、中和低。這指示分配有“mellow”的內(nèi)容具有包含其中節(jié)奏是慢的、存在更多和弦改變且存在更少打擊樂器的特征的趨向。根據(jù)相似性計算單元73,在分配有“happy”的內(nèi)容的特征值和分配有“gelimgen” 的內(nèi)容的特征值之間的相似度高,且在分配有“shiawase”的內(nèi)容的特征值和分配有 "mellow"的內(nèi)容的特征值之間的相似度高。以這種方式,相似性計算單元73計算在來自標(biāo)簽選擇單元72的各個標(biāo)簽之間的相似度,并將各個標(biāo)簽和指示相似度的信息提供給聚類單元74。相似性計算單元73可以使用如上所述的方法之外的其它方法來計算標(biāo)簽之間的相似度。雖然在圖5和圖6中已經(jīng)描述了指示心情的標(biāo)簽之間相似度的計算,但是如圖7 所示相似性計算單元73可以計算指示語境或活動的標(biāo)簽之間的相似度。圖7示出指示語境或活動的標(biāo)簽的示例。圖7示出在指示語境或活動的標(biāo)簽和使用標(biāo)簽的國家的代碼之間存在相關(guān)性。更具體地說,從圖7的上部,順序地存在在“DE”和德語“aggresiv”、在“DE”和德語“sport”、 在 “JP” 和 “ochitsukanai”、在 “JP” 和 “yukanna”、在 “JP” 和 “joggingu”、在 “US” 和 “aggressive”以及在“US”和“Sports”之間的各個相關(guān)性。相似性計算單元73可以計算在如圖7所示的標(biāo)簽之間的相似度,作為各個標(biāo)簽的評級的相關(guān)性,或基于分配有各個標(biāo)簽的內(nèi)容的特征值來計算標(biāo)簽之間的相似度。另外,相似性計算單元73不僅計算標(biāo)簽之間的相似度,而且計算其中對在標(biāo)簽DB 77中累積的給定標(biāo)簽進(jìn)行聚類(分組)的聚類和單獨地獲得的標(biāo)簽之間的相似度。在之后描述標(biāo)簽的聚類,且可以以與單獨的標(biāo)簽相同的方式處理其中對給定標(biāo)簽進(jìn)行聚類的聚類。相似性計算單元73可以計算在標(biāo)簽和聚類之間的相似度,作為每個評級的相關(guān)性,或基于分配有各個標(biāo)簽的內(nèi)容的特征值來計算相似度。相似性計算單元73將指示標(biāo)簽和聚類之間所計算的相似度的信息與標(biāo)簽和聚類一起提供給聚類單元74。聚類單元74基于來自相似性計算單元73的標(biāo)簽和指示相似度的信息對標(biāo)簽進(jìn)行聚類,并將作為進(jìn)行聚類的結(jié)果而獲得的聚類提供給鑒別器生成單元75。例如,聚類單元74指定在來自相似性計算單元73的標(biāo)簽之間具有高度相似性的一對標(biāo)簽作為一個聚類。更具體地說,聚類單元74分別指定圖5和圖6中具有高相似度的一對“happy”和“gelungen”以及一對“shiawase”和“mellow”作為一個聚類。進(jìn)行聚類的標(biāo)簽不限于對(兩個標(biāo)簽),而可以是三個或更多標(biāo)簽。聚類單元74從相似性計算單元73接收指示標(biāo)簽和聚類之間相似度的信息,且如果相似度大于預(yù)定值,則通過對標(biāo)簽進(jìn)行聚類來獲得新的聚類,并將所獲得的聚類提供給鑒別器生成單元75。鑒別器生成單元75生成聚類鑒別器,其為用于基于分配有來自聚類單元74的聚類中包括的標(biāo)簽的內(nèi)容的特征值,通過機械學(xué)習(xí)來鑒別內(nèi)容的聚類的相關(guān)性和非相關(guān)性的鑒別器。并且,鑒別器生成單元75對于每個標(biāo)簽生成標(biāo)簽鑒別器,其為用于基于分配有來自聚類單元74的聚類中包括的標(biāo)簽的內(nèi)容的特征值,通過機械學(xué)習(xí)來鑒別內(nèi)容的、被包括在聚類中的每個標(biāo)簽的相關(guān)性和非相關(guān)性的鑒別器。鑒別器生成單元75將所生成的鑒別器提供給精度計算單元76。例如,當(dāng)從聚類單元74提供由“happy”和“gelungen”構(gòu)成的聚類時,鑒別器生成單元75從內(nèi)容獲得單元71獲得分配有“happy”和“gelungen”的內(nèi)容的特征值,并生成由 “happy”和“gelungen”構(gòu)成的聚類的聚類鑒別器和用于“happy”和“gelungen”的每個標(biāo)簽的標(biāo)簽鑒別器。另外,例如,當(dāng)從聚類單元74提供由標(biāo)簽和聚類構(gòu)成的新的聚類時,鑒別器生成單元75從內(nèi)容獲得單元71獲得標(biāo)簽和分配有聚類中包括的標(biāo)簽的內(nèi)容的特征值,并基于該特征值生成(再生)新的聚類的聚類鑒別器。精度計算單元76計算從鑒別器生成單元75提供的鑒別器的鑒別精度。更具體地說,當(dāng)從鑒別器生成單元75提供聚類鑒別器和聚類中包括的每個標(biāo)簽的標(biāo)簽鑒別器時,精度計算單元76獲得并比較聚類鑒別器的鑒別精度和每個標(biāo)簽的標(biāo)簽鑒別器的鑒別精度。作為比較的結(jié)果,當(dāng)聚類鑒別器的鑒別精度高時,精度計算單元76將聚類作為一個標(biāo)簽提供給標(biāo)簽DB 77。另一方面,當(dāng)每個標(biāo)簽的標(biāo)簽鑒別器的鑒別精度高時,精度計算單元76將聚類中包括的每個標(biāo)簽提供給標(biāo)簽DB 77。這里,將參考圖8描述精度計算單元76中執(zhí)行的處理的詳細(xì)示例。如圖8的左側(cè)所示,精度計算單元76獲得例如三個標(biāo)簽(“DE”的“dark”、“US”的 “angry”和“US”的“dark”)中每一個的標(biāo)簽鑒別器的鑒別精度。在圖8中,“DE”的“dark”的標(biāo)簽鑒別器的鑒別精度是0. 62,“US”的“angry”的標(biāo)簽鑒別器的鑒別精度是0. 43,且 “US”的“dark”的標(biāo)簽鑒別器的鑒別精度是0. 39。并且,精度計算單元76從三個標(biāo)簽的標(biāo)簽鑒別器的鑒別精度獲得平均值A(chǔ)verage (平均)0. 48。進(jìn)一步,精度計算單元76獲得對三個標(biāo)簽進(jìn)行聚類的聚類的聚類鑒別器的鑒別精度Cluster (聚類)0. 79,并將所獲得的鑒別精度與三個標(biāo)簽鑒別器的鑒別精度的平均值進(jìn)行比較。在該情況下,在將三個標(biāo)簽鑒別器的鑒別精度的平均值0.48與聚類鑒別器的鑒別精度0. 79的比較時,由于聚類鑒別器的鑒別精度0. 79較大,因此精度計算單元76將對三個標(biāo)簽進(jìn)行聚類的聚類作為一個標(biāo)簽提供給標(biāo)簽DB77。以這種方式獲得的聚類由基于人的感覺(主觀評價)而聚類的標(biāo)簽構(gòu)成,而無論國家(語言)或文化如何。并且,如圖8的右側(cè)所示,精度計算單元76獲得例如圖7所示的七個標(biāo)簽中的每一個的標(biāo)簽鑒別器的鑒別精度。在圖8中,“DE”的“aggressiv”的標(biāo)簽鑒別器的鑒別精度是0. 73,“DE”的"sport"的標(biāo)簽鑒別器的鑒別精度是0. 77,“ JP”的"ochitsukanai"的標(biāo)簽鑒別器的鑒別精度是0. 66,“JP”的“yukarma”的標(biāo)簽鑒別器的鑒別精度是0. 69,“JP”的 "joggingu"的標(biāo)簽鑒別器的鑒別精度是0. 74,“US”的“aggressive”的標(biāo)簽鑒別器的鑒別精度是0. 78,且“US”的“Sports”的標(biāo)簽鑒別器的鑒別精度是0. 78。并且,精度計算單元 76從七個標(biāo)簽的標(biāo)簽鑒別器的鑒別精度獲得平均值A(chǔ)verage 0. 74。另外,精度計算單元76獲得對七個標(biāo)簽進(jìn)行聚類的聚類的聚類鑒別器的鑒別精度Cluster 0. 62,并將所獲得的鑒別精度與七個標(biāo)簽鑒別器的鑒別精度的平均值進(jìn)行比較。在該情況下,在將七個標(biāo)簽鑒別器的鑒別精度的平均值0. 74與聚類鑒別器的鑒別精度0. 62的比較時,由于標(biāo)簽鑒別器的鑒別精度的平均值0. 74較大,因此精度計算單元 76將七個標(biāo)簽中的每一個提供給標(biāo)簽DB 77。對于精度計算單元76中的每個鑒別器,由精度計算單元76獲得的鑒別器的精度被存儲在存儲單元(沒有示出)中。當(dāng)從鑒別器生成單元75提供再生的聚類鑒別器時,精度計算單元76獲得再生的聚類鑒別器的鑒別精度,并將所獲得的鑒別精度與再生之前的聚類鑒別器的鑒別精度(存儲在存儲單元(沒有示出)中)進(jìn)行比較。作為比較的結(jié)果,當(dāng)再生的聚類鑒別器的鑒別精度高時,精度計算單元76將新的聚類作為一個標(biāo)簽提供給標(biāo)簽DB 77。另一方面,當(dāng)再生之前的聚類鑒別器的鑒別精度高時,精度計算單元76將進(jìn)行聚類之前的聚類提供給標(biāo)簽 DB 77。標(biāo)簽DB 77存儲從精度計算單元76提供的聚類和標(biāo)簽。以與標(biāo)簽同樣的方式處理標(biāo)簽DB 77中累積(存儲)的聚類,由標(biāo)簽分配單元52讀取,然后分配給給定內(nèi)容。相反地,將在標(biāo)簽DB 77中累積且不進(jìn)行聚類的標(biāo)簽分別處理為一個聚類。在標(biāo)簽DB 77中累積的聚類(標(biāo)簽)適當(dāng)?shù)赜捎嬎憔垲惡蜆?biāo)簽之間的相似度的相似性計算單元73讀取。標(biāo)簽DB 77存儲翻譯列表77a,其中由聚類中包括的國家的語言形成的標(biāo)簽分別彼此相關(guān)。這里,將參考圖9描述翻譯列表77a的示例。
如圖9所示,在翻譯列表77a中,對于五個聚類Cluster 1到Cluster 5,各個聚類中包括的英語“US”、德語“DE”和日語“ JP”標(biāo)簽彼此相關(guān)。更具體地說,作為Cluster 1中包括的標(biāo)簽,英語“happy”和德語“gelungen”彼此相關(guān),且作為Cluster 2中包括的標(biāo)簽,英語“angry”和德語“dimkel ”彼此相關(guān)。另外,作為Cluster 3中包括的標(biāo)簽,英語“mellow”和日語“shiawase”彼此相關(guān),且作為Cluster 4中包括的標(biāo)簽,僅示出了日語“honobono”。另外,作為Cluster 5中包括的標(biāo)簽,英語 “aggressive” 和“sports”、德語“aggressiv” 以及日語“ochitsukanai” 和“ joggingu” 彼此相關(guān)。當(dāng)用戶從終端3向內(nèi)容DB 53中的內(nèi)容分配標(biāo)簽時,由標(biāo)簽分配單元52參考該翻譯列表77a,或當(dāng)顯示分配有標(biāo)簽的內(nèi)容時,由呈現(xiàn)單元M參考該翻譯列表77a。例如,如果不懂德語的美國人根據(jù)圖9中的翻譯列表77a,在停留在德國等期間打算分配與英語單詞“happy”對應(yīng)的德語標(biāo)簽作為某段音樂的標(biāo)簽,則將與“happy”相同的聚類Cluster 1中包括的“gelungen”分配給該音樂。并且,例如,如果不懂英語的日本人根據(jù)圖9中的翻譯列表77,在他停留在美國期間打算分配與日語單詞“ochitsukanai”對應(yīng)的英語標(biāo)簽作為某段音樂的標(biāo)簽,則將將與 “ochitsukanai”相同的聚類Cluster 5中包括的“aggressive”分配給該音樂。標(biāo)簽聚類處理的示例接下來,將參考圖10的流程圖描述由上述服務(wù)器2執(zhí)行的標(biāo)簽聚類處理。在標(biāo)簽DB 77中未充分地累積聚類的服務(wù)器2的初始狀態(tài)下執(zhí)行參考圖10的流程圖描述的標(biāo)簽聚類處理。在步驟S11,內(nèi)容獲得單元71從在內(nèi)容DB 53、網(wǎng)絡(luò)1上的終端3或其它服務(wù)器等中累積的大量內(nèi)容獲得預(yù)定量的內(nèi)容。在步驟S12,標(biāo)簽選擇單元72從分配給由內(nèi)容獲得單元71獲得的內(nèi)容的標(biāo)簽中選擇標(biāo)簽,排除被分配的內(nèi)容非常小的標(biāo)簽或其中存在志愿者的評級變化的標(biāo)簽,并將所選的標(biāo)簽提供給相似性計算單元73。在步驟S13,相似性計算單元73計算在從標(biāo)簽選擇單元72提供的各個標(biāo)簽之間的相似度,并將各個標(biāo)簽和指示相似度的信息提供給聚類單元74。在步驟S14,聚類單元74根據(jù)來自相似性計算單元73的各個標(biāo)簽和指示相似度的信息,使用基于k-均值(k-means)方法或相關(guān)規(guī)則的方法對具有高相似度的標(biāo)簽進(jìn)行聚類,且聚類單元74將所獲得的聚類提供給鑒別器生成單元75。并且,這里,當(dāng)可以通過對標(biāo)簽進(jìn)行聚類來獲得多個聚類時,對于每個聚類一起執(zhí)行從步驟S14的處理。在步驟S15,鑒別器生成單元75基于分配有來自聚類單元74的聚類中包括的標(biāo)簽的內(nèi)容的特征值產(chǎn)生聚類的聚類鑒別器,并將所生成的聚類鑒別器提供給精度計算單元 76。在步驟S16,鑒別器生成單元75基于分配有來自聚類單元74的聚類中包括的標(biāo)簽的內(nèi)容的特征值產(chǎn)生進(jìn)行聚類之前的每個標(biāo)簽的標(biāo)簽鑒別器,并將所生成的標(biāo)簽鑒別器提供給精度計算單元76。在步驟S17,精度計算單元76計算并比較來自鑒別器生成單元75的聚類鑒別器和標(biāo)簽鑒別器中每一個的鑒別精度。這里,精度計算單元76通過交叉驗證等,來計算用于每個計算的適當(dāng)?shù)蔫b別精度,比如F值的精度。在步驟S18,作為聚類鑒別器的鑒別精度與標(biāo)簽鑒別器的鑒別精度的比較結(jié)果,精度計算單元76確定聚類鑒別器的鑒別精度是否更好。當(dāng)在步驟S18確定聚類鑒別器的鑒別精度更好時,流程到達(dá)步驟S19,在步驟S19, 精度計算單元76將聚類作為一個標(biāo)簽提供給標(biāo)簽DB 77從而進(jìn)行存儲。另一方面,在步驟S18,當(dāng)確定聚類鑒別器的鑒別精度并非更好時,即,當(dāng)標(biāo)簽鑒別器的鑒別精度高時,流程到達(dá)步驟S20,在步驟S20,精度計算單元76將聚類中包括的每個標(biāo)簽提供給標(biāo)簽DB 77從而進(jìn)行存儲。通過上述處理,基于標(biāo)簽之間的相似度對不同語言的標(biāo)簽進(jìn)行分組。由此,例如, 當(dāng)在使用用戶不完全懂的語言的國家,用戶向給定內(nèi)容分配標(biāo)簽作為內(nèi)容的評價時,可以容易地選擇與用戶自己的語言的標(biāo)簽對應(yīng)的國家的標(biāo)簽。因此,可以向不同國家或文化的給定內(nèi)容精確地分配感覺信息。特別地,當(dāng)評級的相關(guān)性用于標(biāo)簽之間的相似度的計算時,對志愿者的內(nèi)容評價的趨向接近的標(biāo)簽進(jìn)行聚類,因此可以從更接近于人類的觀點來對標(biāo)簽進(jìn)行分組。換句話說,由于即使在不同語言的情況下也可以對指示類似感覺的標(biāo)簽分組,因此可以向不同國家或文化的給定內(nèi)容精確地分配感覺信息。并且,當(dāng)在圖10的流程圖中的步驟S14可以獲得多個聚類時,對于每個聚類一起執(zhí)行從步驟S14開始的處理;但是,存在通過對具有最高相似度的一對標(biāo)簽進(jìn)行聚類而僅獲得一個聚類的情況。在該情況下,其次可以計算在步驟S19中的聚類或在步驟S20存儲的標(biāo)簽與未進(jìn)行聚類的標(biāo)簽之間的相似度,且可以重復(fù)地執(zhí)行從步驟S13開始的處理。已經(jīng)照此描述了其中以使得在標(biāo)簽DB 77中不充分地累積聚類的初始狀態(tài)來集中地對標(biāo)簽進(jìn)行聚類的處理。在下文中,將描述在從累積相對足夠數(shù)目的聚類的狀態(tài)另外給出標(biāo)簽的情況下的處理。標(biāo)簽聚類處理的另一示例這里,將參考圖11中的流程圖描述在從累積相對足夠數(shù)目的聚類的狀態(tài)另外給出標(biāo)簽的情況下的標(biāo)簽聚類處理。在步驟S31,內(nèi)容獲得單元71從在內(nèi)容DB 53、網(wǎng)絡(luò)1上的終端3或其它服務(wù)器等中累積的大量內(nèi)容獲得預(yù)定量的內(nèi)容。在步驟S32,標(biāo)簽選擇單元72從分配給由內(nèi)容獲得單元71獲得的內(nèi)容的標(biāo)簽中選擇標(biāo)簽,排除分配的內(nèi)容非常小的標(biāo)簽或存在志愿者的評級變化的標(biāo)簽,并將所選的標(biāo)簽提供給相似性計算單元73。在步驟S33,相似性計算單元73獲得在標(biāo)簽DB 77中累積的聚類(在下文中,稱為現(xiàn)有聚類)并計算從標(biāo)簽選擇單元72提供的標(biāo)簽與現(xiàn)有聚類之間的相似度?,F(xiàn)有聚類可以包括進(jìn)行聚類的多個標(biāo)簽或進(jìn)行聚類的單個標(biāo)簽。在步驟S34,相似性計算單元73確定步驟S33中計算的相似度當(dāng)中的最大相似度是否大于預(yù)定值。這里,預(yù)定值可以是預(yù)先設(shè)置的值或可以是關(guān)于通過集中地對標(biāo)簽進(jìn)行聚類而獲得的聚類(在圖10的流程圖中步驟S19存儲的聚類)計算的相似度的最小值或平均值。在步驟S34,當(dāng)確定最大相似度大于預(yù)定值時,相似性計算單元73將使得要計算最大相似度的標(biāo)簽和現(xiàn)有聚類提供給聚類單元74,且流程達(dá)到步驟S35。在步驟S35,聚類單元74通過對標(biāo)簽和關(guān)于標(biāo)簽的現(xiàn)有聚類以及來自相似性計算單元73的現(xiàn)有聚類進(jìn)行聚類來獲得聚類(在下文中,稱為新的聚類),并將新的聚類和現(xiàn)有聚類提供到鑒別器生成單元75。在步驟S36,鑒別器生成單元75從內(nèi)容獲得單元71獲得分配有從聚類單元74提供的新的聚類中包括的標(biāo)簽和現(xiàn)有聚類中包括的標(biāo)簽的內(nèi)容的特征值,并基于該特征值生成(再生)新的聚類的聚類鑒別器。在步驟S37,精度計算單元76計算來自鑒別器生成單元75的再生的聚類鑒別器的鑒別精度。另外,精度計算單元76將計算出的再生的聚類鑒別器的鑒別精度與再生之前的聚類鑒別器的鑒別精度(存儲在存儲單元(沒有示出)中)進(jìn)行比較。在步驟S38,作為再生的聚類鑒別器的鑒別精度與再生之前的聚類鑒別器的鑒別精度的比較結(jié)果,精度計算單元76確定再生的聚類鑒別器的鑒別精度是否更好。這里,作為鑒別精度的比較結(jié)果,精度計算單元76可以簡單地確定再生的聚類鑒別器的鑒別精度是否更好,或可以確定再生的聚類鑒別器的鑒別精度的值是否大于再生之前的聚類鑒別器的鑒別精度的值,例如,是否大于比如再生之前的聚類鑒別器的鑒別精度的值的15%或更多的恒定值。同時,例如,精度計算單元76可以將再生的聚類鑒別器的鑒別精度與存儲在存儲單元(沒有示出)中的所有聚類鑒別器的鑒別精度進(jìn)行比較,且可以確定再生的聚類鑒別器的鑒別精度是否比存儲在存儲單元(沒有示出)中的所有聚類鑒別器的鑒別精度更好,寸寸。換句話說,在步驟S38,確定所有最終存儲的聚類鑒別器的平均鑒別精度沒有變得更壞。當(dāng)在步驟S38確定再生的聚類鑒別器的鑒別精度更好時,流程到達(dá)步驟S39,在步驟S39,精度計算單元76將新的聚類作為一個標(biāo)簽提供給標(biāo)簽DB77從而進(jìn)行存儲。此后, 流程到達(dá)步驟S46。另一方面,當(dāng)在步驟S38確定再生的聚類鑒別器的鑒別精度沒有更好時,即,當(dāng)所有存儲的聚類鑒別器的平均鑒別精度似乎變得更壞時,流程到達(dá)步驟S40,在步驟S40,精度計算單元76將現(xiàn)有聚類作為一個標(biāo)簽提供給標(biāo)簽DB 77從而再次進(jìn)行存儲。在步驟S40 之后,流程到達(dá)步驟S46。這里,可以除去在步驟S35中包括在現(xiàn)有聚類中的標(biāo)簽,且可以執(zhí)行稍后描述的、從步驟S41開始的處理。當(dāng)在步驟S34確定最大相似度不大于預(yù)定值時,相似性計算單元73僅將使得要計算最大相似度的標(biāo)簽和現(xiàn)有聚類的標(biāo)簽經(jīng)由聚類單元74提供給鑒別器生成單元75。在這時,聚類單元74對于來自相似性計算單元73的標(biāo)簽不執(zhí)行處理,且將標(biāo)簽提供到鑒別器生成單元75。在步驟S41,鑒別器生成單元75從內(nèi)容獲得單元71獲得分配有來自相似性計算單元73的標(biāo)簽的內(nèi)容的特征值,基于特征值產(chǎn)生標(biāo)簽的標(biāo)簽鑒別器,并將生成的標(biāo)簽鑒別器提供到精度計算單元76。在步驟S42,精度計算單元76計算來自鑒別器生成單元75的標(biāo)簽鑒別器的鑒別精度,并將計算出的鑒別精度與預(yù)定基準(zhǔn)值進(jìn)行比較。
這里,預(yù)定基準(zhǔn)值可以是預(yù)先設(shè)置的值,例如,可以是在標(biāo)簽DB 77中累積的聚類和標(biāo)簽的聚類鑒別器和標(biāo)簽鑒別器的鑒別精度的最小值等。在步驟S43,作為標(biāo)簽鑒別器的鑒別精度與預(yù)定基準(zhǔn)值的比較結(jié)果,精度計算單元 76確定標(biāo)簽鑒別器的鑒別精度是否更好。當(dāng)在步驟S43確定標(biāo)簽鑒別器的鑒別精度更好時,流程到達(dá)步驟S44,在步驟S44, 精度計算單元76將標(biāo)簽鑒別器的標(biāo)簽提供給標(biāo)簽DB 77從而進(jìn)行存儲,且然后流程到達(dá)步驟 S46。另一方面,當(dāng)在步驟S43確定標(biāo)簽鑒別器的鑒別精度并非更好時,流程到達(dá)步驟 S45,在步驟S45,精度計算單元76除去標(biāo)簽鑒別器的標(biāo)簽。此后,流程到達(dá)步驟S46。在步驟S46,相似性計算單元73確定是否對于從標(biāo)簽選擇單元72提供的所有標(biāo)簽執(zhí)行從步驟S34開始的處理。當(dāng)在步驟S46確定未對所有標(biāo)簽執(zhí)行處理時,流程返回到步驟S33,且從步驟S33 開始重復(fù)地執(zhí)行處理直到對于所有標(biāo)簽執(zhí)行了處理為止。在第二聚類處理的步驟S33從標(biāo)簽DB 77獲得的現(xiàn)有聚類包括在步驟S39存儲的新的聚類、其次在步驟S40存儲的現(xiàn)有聚類和在步驟S44存儲的一個標(biāo)簽。另一方面,當(dāng)在步驟S46確定對于所有標(biāo)簽執(zhí)行了處理時,標(biāo)簽聚類處理結(jié)束。通過上述處理,基于標(biāo)簽和現(xiàn)有聚類之間的相似度對不同語言的標(biāo)簽進(jìn)行分組。 由此,例如,當(dāng)在使用用戶不完全懂的語言的國家,用戶向給定內(nèi)容分配標(biāo)簽作為內(nèi)容的評價時,可以容易地選擇與用戶自己的語言的標(biāo)簽對應(yīng)的國家的標(biāo)簽。因此,可以向不同國家或文化的給定內(nèi)容精確地分配感覺信息。并且,根據(jù)標(biāo)簽和現(xiàn)有聚類之間的相似度將添加的標(biāo)簽包括在現(xiàn)有聚類中或除去而無論語言如何,因此不需要通過類似標(biāo)簽的存在與否的評價來制備標(biāo)簽,或不需要預(yù)先制備每種語言的標(biāo)簽,且可以不費時和不費力地制備標(biāo)簽。并且,當(dāng)在步驟S32選擇的標(biāo)簽的數(shù)目大于某個數(shù)目時,或,例如,在步驟S33計算的相似度的平均值小于某個值時,可以執(zhí)行從圖10的流程圖中的步驟S13開始的處理。由此,當(dāng)大部分所選的標(biāo)簽未包括在現(xiàn)有聚類中時,可以對標(biāo)簽集合地重新進(jìn)行聚類。在參考圖11的流程圖描述的聚類處理中,對于在所選的一個標(biāo)簽和現(xiàn)有聚類之間具有最大相似度的新的聚類產(chǎn)生鑒別器,且根據(jù)鑒別器的鑒別精度將新的聚類處理為一個標(biāo)簽。但是,在圖11的聚類處理中,例如,對于在多個現(xiàn)有聚類和一個標(biāo)簽之間的相似度大于預(yù)定值的多個現(xiàn)有聚類中的每一個,可以獲得包括標(biāo)簽的新的聚類,且可以將對于各個新的聚類生成的鑒別器中具有最好的鑒別精度的鑒別器的新的聚類處理為一個標(biāo)簽。以上描述了基于人的感覺而無論國家或文化如何,對不同語言的標(biāo)簽分聚類的標(biāo)簽聚類處理。以下將描述將如上所述聚類的標(biāo)簽分配給內(nèi)容的處理。標(biāo)簽分配處理的示例這里,將參考圖12描述服務(wù)器2中的標(biāo)簽分配處理。由用戶經(jīng)由終端3讀取內(nèi)容 DB 53中累積的內(nèi)容,輸入指示將標(biāo)簽分配給內(nèi)容的命令,此后如果由標(biāo)簽分配單元52讀取了內(nèi)容則執(zhí)行標(biāo)簽分配處理。在步驟S71,標(biāo)簽分配單元52確定是否由用戶經(jīng)由終端3輸入了用于分配給內(nèi)容的標(biāo)簽。
當(dāng)在步驟S71確定沒有輸入標(biāo)簽時,重復(fù)在步驟S71的處理直到輸入標(biāo)簽為止。另一方面,當(dāng)在步驟S71確定輸入了標(biāo)簽時,流程到達(dá)步驟S72。在步驟S72,標(biāo)簽分配單元52參考存儲在標(biāo)簽管理單元51的標(biāo)簽DB 77中的翻譯列表77a,并從標(biāo)簽DB 77中,從包括輸入標(biāo)簽的聚類中所包括的標(biāo)簽中讀取與呈現(xiàn)的國家或文化對應(yīng)的語言的標(biāo)簽。例如,當(dāng)輸入日語“shiawase”作為在采用英語作為語言的說英語的國家中的標(biāo)簽時,參考圖9所示的翻譯列表77a,且從標(biāo)簽DB 77讀取與作為Cluster 3中包括的標(biāo)簽的日語“shiawase”相關(guān)的英語“mellow”。在步驟S73,標(biāo)簽分配單元52將在步驟S72讀取的標(biāo)簽分配給從內(nèi)容DB 53讀取的內(nèi)容。在這時,標(biāo)簽分配單元52將分配有標(biāo)簽的內(nèi)容提供給呈現(xiàn)單元M。呈現(xiàn)單元M 與分配給內(nèi)容的標(biāo)簽一起向終端3提供(發(fā)送)分配有標(biāo)簽的內(nèi)容的名稱。終端3顯示與由用戶輸入的標(biāo)簽對應(yīng)的標(biāo)簽被分配給由用戶讀取的內(nèi)容。通過上述處理,基于人的感覺而分組的不同語言的標(biāo)簽被分配給內(nèi)容而無論國家或文化如何。例如,當(dāng)在使用用戶不完全懂的語言的國家,用戶向給定內(nèi)容分配標(biāo)簽作為內(nèi)容的評價時,分配與用戶自己的語言的標(biāo)簽對應(yīng)的國家的標(biāo)簽。就是說,可以向不同國家或文化的給定內(nèi)容精確地分配感覺信息。另外,在上述實施例的描述中,在服務(wù)器2側(cè)執(zhí)行標(biāo)簽聚類處理或標(biāo)簽分配處理。 在服務(wù)器2側(cè)執(zhí)行處理的類型適于例如經(jīng)由網(wǎng)絡(luò)1將內(nèi)容提供給終端3的情況等。但是,這不意味著僅在服務(wù)器2側(cè)執(zhí)行如上所述的標(biāo)簽聚類處理或標(biāo)簽分配處理。例如,可以在服務(wù)器2側(cè)執(zhí)行標(biāo)簽聚類處理,且可以使用其結(jié)果在終端3中執(zhí)行標(biāo)簽分配處理。此外,可以在終端3中執(zhí)行標(biāo)簽聚類處理或標(biāo)簽分配處理。記錄介質(zhì)可以由硬件或軟件執(zhí)行上述一系列處理。當(dāng)由軟件執(zhí)行一系列處理時,將構(gòu)成軟件的程序從程序記錄介質(zhì)安裝到在其中嵌入專用硬件的計算機,或,例如,安裝到可以通過安裝各種程序來執(zhí)行各種功能的通用個人計算機。記錄可以被安裝在計算機中并由計算機執(zhí)行的程序的程序記錄介質(zhì)如圖2所示包括磁盤(包括軟盤)、光盤(包括⑶_R0M(致密盤-只讀存儲器)和DVD(數(shù)字多用途盤)、磁光盤(包括MD (小磁盤)),或者作為由半導(dǎo)體存儲器等構(gòu)成的封裝介質(zhì)的可拆卸介質(zhì)31,或構(gòu)成臨時或永久地存儲程序的ROM 22或存儲單元觀的硬盤。可選地使用比如包括因特網(wǎng)或LAN的網(wǎng)絡(luò)1或數(shù)字衛(wèi)星廣播之類的有線或無線通信介質(zhì),經(jīng)由比如路由器或調(diào)制解調(diào)器之類的作為接口的通信單元四將程序記錄在程序記錄介質(zhì)中。并且,在本說明書中,用于描述記錄在記錄介質(zhì)中的程序的步驟不僅包括根據(jù)所描述的次序以時間順序執(zhí)行的處理,而且包括即使不一定以時間順序執(zhí)行也并行地或單獨地執(zhí)行的處理。在本說明書中,系統(tǒng)指示由多個裝置構(gòu)成的整個裝置。本申請包括與于2010年2月15日在日本專利局提交的日本優(yōu)先權(quán)專利申請JP 2010-030178中公開的主題相關(guān)的主題,將其全部內(nèi)容通過引用完全包括于此。本領(lǐng)域技術(shù)人員應(yīng)該理解根據(jù)設(shè)計要求及其它因素,可產(chǎn)生各種修改、組合、部分組合和替代,只要它們在所附權(quán)利要求及其等效物的范圍之內(nèi)。
權(quán)利要求
1.一種信息處理裝置,包括獲得裝置,獲得分配了指示內(nèi)容的用戶主觀評價的標(biāo)簽作為元數(shù)據(jù)的多個內(nèi)容; 選擇裝置,在分配給由所述獲得裝置獲得的多個內(nèi)容的標(biāo)簽當(dāng)中,選擇關(guān)于內(nèi)容的評價具有高可靠性的標(biāo)簽;計算裝置,計算由所述選擇裝置選擇的各標(biāo)簽之間的相似度;聚類裝置,基于由所述計算裝置計算的所述相似度來對標(biāo)簽進(jìn)行聚類;知存儲裝置,存儲作為在所述聚類裝置中進(jìn)行聚類的結(jié)果而獲得的聚類作為一個標(biāo)簽。
2.如權(quán)利要求1所述的信息處理裝置,進(jìn)一步包括生成裝置,其生成聚類鑒別器,作為用于基于分配有由所述聚類裝置進(jìn)行聚類的標(biāo)簽的內(nèi)容的特征值, 來鑒別對于內(nèi)容的聚類的相關(guān)性的鑒別器;和標(biāo)簽鑒別器,作為用于鑒別對于內(nèi)容的已聚類標(biāo)簽的相關(guān)性的鑒別器, 其中,所述存儲裝置在所述聚類鑒別器的鑒別精度好于所述標(biāo)簽鑒別器的鑒別精度時將聚類存儲為一個標(biāo)簽。
3.如權(quán)利要求2所述信息處理裝置,其中,所述計算裝置計算由所述選擇裝置選擇的標(biāo)簽和由所述聚類裝置預(yù)先獲得的現(xiàn)有聚類之間的相似度,且其中,所述聚類裝置基于所述相似度使得標(biāo)簽包括在所述現(xiàn)有聚類中。
4.如權(quán)利要求3所述的信息處理裝置,其中,所述生成裝置生成作為關(guān)于通過使得標(biāo)簽包括在所述現(xiàn)有聚類中而獲得的新的聚類的鑒別器的新的聚類鑒別器,和其中,所述存儲裝置在所述新的聚類鑒別器的鑒別精度好于所述關(guān)于現(xiàn)有聚類的聚類鑒別器的鑒別精度時將所述新的聚類存儲為一個標(biāo)簽。
5.如權(quán)利要求1所述的信息處理裝置,進(jìn)一步包括分配裝置,其在用于評價內(nèi)容而輸入的標(biāo)簽被包括在作為所述聚類裝置中進(jìn)行聚類的結(jié)果而獲得的聚類中時,向內(nèi)容分配除了被包括在聚類中的輸入標(biāo)簽之外的標(biāo)簽。
6.如權(quán)利要求1所述的信息處理裝置,其中,使用多種不同語言給出標(biāo)簽。
7.一種信息處理方法,包括步驟獲得分配了指示內(nèi)容的用戶主觀評價的標(biāo)簽作為元數(shù)據(jù)的多個內(nèi)容; 在分配給在所述獲得步驟獲得的多個內(nèi)容的標(biāo)簽當(dāng)中,選擇關(guān)于內(nèi)容的評價具有高可靠性的標(biāo)簽;計算在所述選擇步驟選擇的各標(biāo)簽之間的相似度;基于在所述計算步驟計算的相似度對標(biāo)簽進(jìn)行聚類;和存儲作為在所述聚類步驟進(jìn)行聚類的結(jié)果而獲得的聚類作為一個標(biāo)簽。
8.一種使得計算機能夠執(zhí)行以下步驟的程序獲得分配了指示內(nèi)容的用戶主觀評價的標(biāo)簽作為元數(shù)據(jù)的多個內(nèi)容; 在分配給在所述獲得步驟獲得的多個內(nèi)容的標(biāo)簽當(dāng)中,選擇關(guān)于內(nèi)容的評價具有高可靠性的標(biāo)簽;計算在所述選擇步驟選擇的各標(biāo)簽之間的相似度;基于在所述計算步驟計算的相似度對標(biāo)簽進(jìn)行聚類;和存儲作為在所述聚類步驟進(jìn)行聚類的結(jié)果而獲得的聚類作為一個標(biāo)簽。
9.一種信息處理裝置,包括獲得單元,獲得分配了指示內(nèi)容的用戶主觀評價的標(biāo)簽作單元元數(shù)據(jù)的多個內(nèi)容; 選擇單元,在分配給由所述獲得單元獲得的多個內(nèi)容的標(biāo)簽當(dāng)中,選擇關(guān)于內(nèi)容的評價具有高可靠性的標(biāo)簽;計算單元,計算由所述選擇單元選擇的各標(biāo)簽之間的相似度;聚類單元,基于由所述計算單元計算的所述相似度來對標(biāo)簽進(jìn)行聚類;知存儲單元,存儲作為所述聚類裝置中進(jìn)行聚類的結(jié)果而獲得的聚類作為一個標(biāo)簽。
全文摘要
提供了信息處理裝置、信息處理方法和程序。信息處理裝置包括獲得單元,獲得向其分配指示內(nèi)容的用戶主觀評價的標(biāo)簽作為元數(shù)據(jù)的多個內(nèi)容;選擇單元,在分配給由獲得單元獲得的多個內(nèi)容的標(biāo)簽當(dāng)中選擇關(guān)于內(nèi)容的評價具有高可靠性的標(biāo)簽;計算單元,計算由選擇單元選擇的標(biāo)簽之間的相似度;聚類單元,基于由計算單元計算的相似度對標(biāo)簽進(jìn)行聚類;和存儲單元,存儲作為聚類單元中進(jìn)行聚類的結(jié)果獲得的聚類作為一個標(biāo)簽。
文檔編號G06F17/30GK102163208SQ20111003489
公開日2011年8月24日 申請日期2011年2月9日 優(yōu)先權(quán)日2010年2月15日
發(fā)明者齋藤真里 申請人:索尼公司