背景技術(shù):
計(jì)算設(shè)備通常可以從特定用戶接收該用戶感興趣的實(shí)體的指示。例如,用戶可以使用計(jì)算設(shè)備來(lái)執(zhí)行對(duì)于實(shí)體的搜索,所述實(shí)體諸如地點(diǎn)、事件、人、商業(yè)、飯店等。用戶還可提供該用戶已經(jīng)參加的事件或者在飯店吃飯的指示,諸如通過(guò)使用社交媒體應(yīng)用登記到事件,或者通過(guò)將某個(gè)事件的指示置于該用戶的日歷中。
技術(shù)實(shí)現(xiàn)要素:
在一個(gè)示例中,本公開(kāi)涉及一種方法。該方法可包括:由計(jì)算設(shè)備生成包括多個(gè)節(jié)點(diǎn)的圖,其中該多個(gè)節(jié)點(diǎn)包括表示多個(gè)實(shí)體的多個(gè)實(shí)體節(jié)點(diǎn)以及表示多個(gè)特征的多個(gè)特征節(jié)點(diǎn),并且其中該多個(gè)實(shí)體節(jié)點(diǎn)中的每個(gè)實(shí)體節(jié)點(diǎn)在該圖中連接至該多個(gè)特征節(jié)點(diǎn)中的一個(gè)或多個(gè)特征節(jié)點(diǎn)。該方法可進(jìn)一步包括:由該計(jì)算設(shè)置執(zhí)行標(biāo)簽傳播來(lái)跨該圖傳播多個(gè)標(biāo)簽,以將標(biāo)簽分布與該多個(gè)節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)相關(guān)聯(lián)。該計(jì)算設(shè)備被配置來(lái):接收感興趣特征或感興趣實(shí)體中的至少一個(gè)的指示,以及對(duì)于該感興趣特征或者感興趣實(shí)體中的該至少一個(gè),輸出與該感興趣特征或者感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)相關(guān)實(shí)體的指示,其中,輸出該一個(gè)或多個(gè)相關(guān)實(shí)體的該指示至少部分地基于與該多個(gè)特征節(jié)點(diǎn)中表示該感興趣特征的的一個(gè)特征節(jié)點(diǎn)或者該多個(gè)實(shí)體節(jié)點(diǎn)中表示該感興趣實(shí)體的一個(gè)實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的相應(yīng)標(biāo)簽分布。
在另一個(gè)示例中,本公開(kāi)涉及一種包括存儲(chǔ)器和至少一個(gè)處理器的計(jì)算系統(tǒng)。該至少一個(gè)處理器通信地耦合至該存儲(chǔ)器,并且可被配置來(lái):生成將要被存儲(chǔ)在該存儲(chǔ)器中的、包括多個(gè)節(jié)點(diǎn)的圖,其中,該多個(gè)節(jié)點(diǎn)包括表示多個(gè)實(shí)體的多個(gè)實(shí)體節(jié)點(diǎn)以及表示多個(gè)特征的多個(gè)特征節(jié)點(diǎn),并且其中該多個(gè)實(shí)體節(jié)點(diǎn)中的每個(gè)實(shí)體節(jié)點(diǎn)在該圖中連接至該多個(gè)特征節(jié)點(diǎn)中的一個(gè)或多個(gè)特征節(jié)點(diǎn);以及執(zhí)行標(biāo)簽傳播來(lái)跨該圖傳播多個(gè)標(biāo)簽以將標(biāo)簽分布與該多個(gè)節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)相關(guān)聯(lián)。
在另一個(gè)示例中,本公開(kāi)涉及一種方法。該方法可包括:由計(jì)算設(shè)備接收感興趣特征或感興趣實(shí)體中的至少一個(gè)的指示。該方法可進(jìn)一步包括:至少部分地基于與圖中的多個(gè)特征節(jié)點(diǎn)中表示該感興趣特征的一個(gè)特征節(jié)點(diǎn)或者圖中的多個(gè)實(shí)體節(jié)點(diǎn)中表示該感興趣實(shí)體的一個(gè)實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的相應(yīng)標(biāo)簽分布,由該計(jì)算設(shè)備確定與該感興趣特征或者該感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)相關(guān)的實(shí)體,其中,該圖包括多個(gè)節(jié)點(diǎn),其中該多個(gè)節(jié)點(diǎn)包括表示多個(gè)實(shí)體的多個(gè)實(shí)體節(jié)點(diǎn)以及表示多個(gè)特征的多個(gè)特征節(jié)點(diǎn),并且其中該多個(gè)實(shí)體節(jié)點(diǎn)中的每個(gè)實(shí)體節(jié)點(diǎn)在該圖中連接至該多個(gè)特征節(jié)點(diǎn)中的一個(gè)或多個(gè)特征節(jié)點(diǎn),并且其中,多個(gè)標(biāo)簽經(jīng)由標(biāo)簽傳播跨該圖來(lái)被傳播以將標(biāo)簽分布與該多個(gè)節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)相關(guān)聯(lián)。方法可進(jìn)一步包括:對(duì)于該感興趣特征或者感興趣實(shí)體中的該至少一個(gè),由該計(jì)算設(shè)備輸出與該感興趣特征或該感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)相關(guān)實(shí)體的指示,其中,輸出該一個(gè)或多個(gè)相關(guān)實(shí)體的該指示至少部分地基于與該多個(gè)特征節(jié)點(diǎn)中表示該感興趣特征的一個(gè)特征節(jié)點(diǎn)或者多個(gè)實(shí)體節(jié)點(diǎn)中表示該感興趣實(shí)體的一個(gè)實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的相應(yīng)標(biāo)簽分布。
在另一個(gè)示例中,本公開(kāi)涉及一種計(jì)算系統(tǒng),該計(jì)算系統(tǒng)包括存儲(chǔ)器以及至少一個(gè)處理器。該至少一個(gè)處理器通信地耦合至該存儲(chǔ)器,并且可被配置來(lái):接收感興趣特征或感興趣實(shí)體中的至少一個(gè)的指示;至少部分地基于與圖中的多個(gè)特征節(jié)點(diǎn)中表示該感興趣特征的一個(gè)特征節(jié)點(diǎn)或者與圖中的多個(gè)實(shí)體節(jié)點(diǎn)中表示感興趣實(shí)體的一個(gè)實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的相應(yīng)標(biāo)簽分布,確定與該感興趣特征或者感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)相關(guān)實(shí)體,其中,該圖包括多個(gè)節(jié)點(diǎn),其中該多個(gè)節(jié)點(diǎn)包括表示多個(gè)實(shí)體的多個(gè)實(shí)體節(jié)點(diǎn)以及表示多個(gè)特征的多個(gè)特征節(jié)點(diǎn),并且其中該多個(gè)實(shí)體節(jié)點(diǎn)的每個(gè)實(shí)體節(jié)點(diǎn)在該圖中連接至該多個(gè)特征節(jié)點(diǎn)中的一個(gè)或多個(gè)特征節(jié)點(diǎn),并且其中,多個(gè)標(biāo)簽經(jīng)由標(biāo)簽傳播跨該圖來(lái)被傳播以將標(biāo)簽分布與該多個(gè)節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)相關(guān)聯(lián);以及對(duì)于該感興趣特征或該感興趣實(shí)體中的至少一個(gè),輸出與該感興趣特征或者該感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)相關(guān)實(shí)體的指示,其中,輸出該一個(gè)或多個(gè)相關(guān)實(shí)體的該指示至少部分地基于與多個(gè)特征節(jié)點(diǎn)中表示該感興趣特征的一個(gè)特征節(jié)點(diǎn)或者多個(gè)實(shí)體節(jié)點(diǎn)中表示該感興趣實(shí)體的一個(gè)實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的相應(yīng)標(biāo)簽分布。
在附圖以及下面的描述中闡述了一個(gè)或多個(gè)示例的細(xì)節(jié)。本公開(kāi)的其他特征、目的、以及優(yōu)點(diǎn)根據(jù)說(shuō)明書和附圖以及權(quán)利要求書將顯而易見(jiàn)。
附圖說(shuō)明
圖1是圖示了根據(jù)本公開(kāi)一個(gè)或多個(gè)方面的、被配置來(lái)確定相關(guān)實(shí)體的示例系統(tǒng)的概念圖。
圖2是圖示了根據(jù)本公開(kāi)一個(gè)或多個(gè)方面的、被配置來(lái)確定一組實(shí)體的相關(guān)性水平的示例計(jì)算系統(tǒng)的框圖。
圖3a-3c是圖示了根據(jù)本公開(kāi)方面的、示例排名模塊可構(gòu)造其來(lái)執(zhí)行示例性擴(kuò)展器技術(shù)的示例特征-實(shí)體二分圖的框圖。
圖4是圖示了根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面的、用于確定相關(guān)實(shí)體的示例過(guò)程的流程圖。
圖5是圖示了根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面的、用于確定相關(guān)實(shí)體的示例過(guò)程的流程圖。
具體實(shí)施方式
大體上,本公開(kāi)的技術(shù)可以使得計(jì)算系統(tǒng)能夠針對(duì)實(shí)體來(lái)確定一個(gè)或多個(gè)相關(guān)的實(shí)體。對(duì)于感興趣實(shí)體,該計(jì)算系統(tǒng)可以確定與該感興趣實(shí)體在語(yǔ)義上相關(guān)的一個(gè)或多個(gè)實(shí)體,并且可以至少部分地基于其與該感興趣實(shí)體的相關(guān)性來(lái)對(duì)該一個(gè)或多個(gè)實(shí)體進(jìn)行排名。因此,如果該計(jì)算系統(tǒng)確定用戶對(duì)實(shí)體感興趣,則該計(jì)算系統(tǒng)可以確定該用戶潛在地也可能對(duì)與該用戶感興趣的實(shí)體在語(yǔ)義上相關(guān)的一個(gè)或多個(gè)實(shí)體感興趣。這樣,計(jì)算系統(tǒng)可為用戶提供用戶可能感興趣的所建議實(shí)體。
兩個(gè)實(shí)體的相關(guān)性可以與對(duì)第一實(shí)體感興趣的隨機(jī)用戶也對(duì)第二實(shí)體感興趣的可能性成比例。該計(jì)算系統(tǒng)可確定實(shí)體與多個(gè)實(shí)體中的每個(gè)實(shí)體的相關(guān)性,并且可至少部分地基于該實(shí)體與多個(gè)實(shí)體中的每個(gè)實(shí)體相關(guān)的程度來(lái)生成該多個(gè)實(shí)體的經(jīng)排名列表。
圖1是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面的、將系統(tǒng)10圖示為可以被配置來(lái)被配置來(lái)確定相關(guān)實(shí)體的示例系統(tǒng)的概念圖。系統(tǒng)100包括經(jīng)由網(wǎng)絡(luò)12與計(jì)算設(shè)備2通信的信息服務(wù)器系統(tǒng)(“iss”)14。計(jì)算設(shè)備2可經(jīng)由網(wǎng)絡(luò)12與iss14進(jìn)行通信,以向iss14提供指示由計(jì)算設(shè)備2接收的查詢或者計(jì)算設(shè)備2的用戶感興趣的實(shí)體的信息。iss14可生成與該查詢或者實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的經(jīng)排名列表,并且可將一個(gè)或多個(gè)實(shí)體的經(jīng)排名列表傳輸至計(jì)算設(shè)備2。計(jì)算設(shè)備2可以經(jīng)由用戶界面設(shè)備4來(lái)輸出該一個(gè)或多個(gè)實(shí)體的經(jīng)排名列表,以用于顯示給計(jì)算設(shè)備2的用戶。
網(wǎng)絡(luò)12表示任何公用或?qū)S玫耐ㄐ啪W(wǎng)絡(luò)——例如,蜂窩、wi-fi、和/或其他類型的網(wǎng)絡(luò)——以用于在計(jì)算系統(tǒng)、服務(wù)器、和計(jì)算設(shè)備之間傳送數(shù)據(jù)。網(wǎng)絡(luò)12可以包括一個(gè)或多個(gè)網(wǎng)絡(luò)中樞、網(wǎng)絡(luò)交換機(jī)、網(wǎng)絡(luò)路由器、或者任何其他網(wǎng)絡(luò)器材,其操作地相互耦合從而提供iss14與計(jì)算設(shè)備2之間的信息交換。計(jì)算設(shè)備2和iss14可使用任何合適的有線或無(wú)線通信技術(shù)來(lái)跨網(wǎng)絡(luò)12傳送和接收數(shù)據(jù)。在某些示例中,網(wǎng)絡(luò)12可以是互聯(lián)網(wǎng)20。
iss14和計(jì)算設(shè)備2可以使用相應(yīng)的網(wǎng)絡(luò)鏈路操作地耦合至網(wǎng)絡(luò)12。將計(jì)算設(shè)備2和iss14耦合至網(wǎng)絡(luò)12的鏈路可以是以太網(wǎng)或者其他類型的網(wǎng)絡(luò)連接,并且這樣的連接可以是無(wú)線連接和/或有線連接。
計(jì)算設(shè)備2表示個(gè)體移動(dòng)或非移動(dòng)計(jì)算設(shè)備。計(jì)算設(shè)備2的示例可以包括移動(dòng)電話、平板電腦、膝上型電腦、桌面型電腦、服務(wù)器、主機(jī)、機(jī)頂盒、電視、可穿戴式設(shè)備(例如計(jì)算機(jī)化的手表、計(jì)算機(jī)化的護(hù)目鏡、計(jì)算機(jī)化的手套)、家用自動(dòng)化設(shè)備或系統(tǒng)(例如,智能恒溫器或者家庭助手)、個(gè)人數(shù)字助理(pda)、便攜式游戲系統(tǒng)、媒體播放器、電子書閱讀器、移動(dòng)電視平臺(tái)、汽車導(dǎo)航和娛樂(lè)系統(tǒng),或者被配置來(lái)通過(guò)網(wǎng)絡(luò),諸如網(wǎng)絡(luò)12接收信息的任何其他類型的移動(dòng)、非移動(dòng)、可穿戴以及非可穿戴計(jì)算設(shè)備。
計(jì)算設(shè)備2包括用戶界面設(shè)備(uid)4以及用戶界面(ui)模塊6。ui模塊6可使用軟件、硬件、固件、或者在相應(yīng)計(jì)算設(shè)備2中駐留和/或在該處執(zhí)行的硬件、軟件、和固件的組合來(lái)執(zhí)行上述的操作。在某些示例中,計(jì)算設(shè)備2可執(zhí)行具有一個(gè)或多個(gè)處理器或者一個(gè)或多個(gè)設(shè)備的ui模塊6。在某些示例中,計(jì)算設(shè)備2可將ui模塊6執(zhí)行為在底層硬件上執(zhí)行的一個(gè)或多個(gè)虛擬機(jī)。在某些示例中,ui模塊6可執(zhí)行為操作系統(tǒng)或計(jì)算平臺(tái)的一個(gè)或多個(gè)服務(wù)。在某些示例中,ui模塊6可執(zhí)行為計(jì)算平臺(tái)的應(yīng)用層處的一個(gè)或多個(gè)可執(zhí)行程序。
計(jì)算設(shè)備2的uid4可充當(dāng)計(jì)算設(shè)備2的輸入和/或輸出設(shè)備。uid4可使用各種技術(shù)來(lái)實(shí)現(xiàn)。例如,uid4可充當(dāng)使用一個(gè)或多個(gè)存在敏感輸入組件的輸入設(shè)備,諸如電阻式觸摸屏、表面聲波觸摸屏、電容式觸摸屏、投射電容觸摸屏、壓敏屏幕、聲學(xué)脈沖識(shí)別觸摸屏、或者其他存在敏感顯示技術(shù)。此外,uid4可以包括麥克風(fēng)技術(shù)、紅外傳感器技術(shù)、或者用于接收用戶輸入的其他輸入設(shè)備技術(shù)。
uid4可充當(dāng)使用任何一個(gè)或多個(gè)顯示組件的輸出(例如顯示)設(shè)備,諸如液晶顯示器(lcd)、點(diǎn)陣顯示器、發(fā)光二極管(led)顯示器、有機(jī)發(fā)光二極管(oled)顯示器、電子墨水、或者能夠輸出可視信息給計(jì)算設(shè)備2的用戶的類似的單色或彩色顯示器。此外,uid4可以包括揚(yáng)聲器技術(shù)、觸覺(jué)反饋技術(shù)、或者用于輸出信息給用戶的其他輸出設(shè)備技術(shù)。
uid4可包括存在敏感顯示器,其可從計(jì)算設(shè)備2的用戶接收觸覺(jué)輸入。uid4可以通過(guò)檢測(cè)來(lái)自用戶的一個(gè)或多個(gè)手勢(shì)而接收觸覺(jué)輸入的指示(例如,用戶用手指或觸控筆接觸或者指向uid4的一個(gè)或多個(gè)位置)。例如在存在敏感顯示器處,uid4可將輸出呈現(xiàn)給用戶。uid4可將輸出呈現(xiàn)為圖形用戶界面(例如,用戶界面8),其可與計(jì)算設(shè)備2提供的功能相關(guān)聯(lián)。例如,uid4可以呈現(xiàn)計(jì)算設(shè)備2的用戶可能感興趣的、與實(shí)體集合相關(guān)的各個(gè)用戶界面(例如,用戶界面8),所述用戶界面由ui模塊6或者在計(jì)算設(shè)備2處執(zhí)行或者可從其訪問(wèn)的計(jì)算平臺(tái)、操作系統(tǒng)、應(yīng)用、和/或服務(wù)(例如,電子消息應(yīng)用、互聯(lián)網(wǎng)瀏覽應(yīng)用、移動(dòng)或桌面型操作系統(tǒng)等等)的其他特征來(lái)提供。
ui模塊6可以管理與uid4以及計(jì)算設(shè)備2的其他組件的用戶交互——包括與iss14的交互,以便在uid4處提供對(duì)一個(gè)或多個(gè)實(shí)體的指示。當(dāng)計(jì)算設(shè)備2的用戶在uid4處查看輸出和/或提供輸入時(shí),ui模塊6可以使得uid4輸出用戶界面——諸如用戶界面8(或者其他示例用戶界面)以供顯示。在用戶與用戶界面進(jìn)行交互時(shí),ui模塊6和uid4可以從該用戶接收一個(gè)或多個(gè)對(duì)輸入的指示。ui模塊6和uid4可以解釋在uid4處檢測(cè)的輸入,并且可以將關(guān)于在uid4處檢測(cè)的輸入的信息中繼給在計(jì)算設(shè)備2處執(zhí)行的一個(gè)或多個(gè)關(guān)聯(lián)的平臺(tái)、操作系統(tǒng)、應(yīng)用、和/或服務(wù),以例如使得計(jì)算設(shè)備2執(zhí)行功能。
ui模塊6可從在計(jì)算設(shè)備2處執(zhí)行的一個(gè)或多個(gè)關(guān)聯(lián)的平臺(tái)、操作系統(tǒng)、應(yīng)用、和/或服務(wù)和/或諸如iss14的一個(gè)或多個(gè)遠(yuǎn)程計(jì)算系統(tǒng)接收信息和指令。此外,ui模塊6可以充當(dāng)在計(jì)算設(shè)備2處執(zhí)行的一個(gè)或多個(gè)關(guān)聯(lián)的平臺(tái)、操作系統(tǒng)、應(yīng)用、和/或服務(wù)與計(jì)算設(shè)備2的各個(gè)輸出設(shè)備(例如,揚(yáng)聲器、led顯示器、音頻和靜電觸覺(jué)輸出設(shè)備等等)之間的中介,以利用計(jì)算設(shè)備2來(lái)產(chǎn)生輸出(例如,圖形、閃光、聲音、觸覺(jué)響應(yīng)等)。
ui模塊6可以接收計(jì)算設(shè)備2的用戶感興趣的實(shí)體的指示。在某些示例中,實(shí)體可以是事件、地點(diǎn)、人、商業(yè)、電影、飯店等。例如,計(jì)算設(shè)備2的用戶可以使用在計(jì)算設(shè)備2上運(yùn)行的web瀏覽器應(yīng)用,來(lái)訪問(wèn)特定事件的網(wǎng)頁(yè)(例如,用于攀巖旅行的網(wǎng)頁(yè)),或者“贊(like)”針對(duì)特定事件的社交媒體發(fā)布(socialmediapost),其可向ui模塊6指示該用戶對(duì)特定事件感興趣。
ui模塊6可以經(jīng)由網(wǎng)絡(luò)12來(lái)向iss14發(fā)送對(duì)感興趣實(shí)體的指示。例如,ui模塊6可以發(fā)送針對(duì)實(shí)體的網(wǎng)頁(yè)的互聯(lián)網(wǎng)地址(例如,統(tǒng)一資源定位符)。作為響應(yīng),ui模塊6可以經(jīng)由網(wǎng)絡(luò)12從iss14接收與感興趣實(shí)體最相關(guān)的一個(gè)或多個(gè)實(shí)體的指示。例如,ui模塊6可以接收該一個(gè)或多個(gè)實(shí)體的互聯(lián)網(wǎng)地址。ui模塊6還可從iss14接收該一個(gè)或多個(gè)實(shí)體與感興趣實(shí)體的相關(guān)性水平的指示,諸如該一個(gè)或多個(gè)實(shí)體中的每一個(gè)與感興趣實(shí)體有多相關(guān)的排名或者該一個(gè)或多個(gè)實(shí)體中的每一個(gè)與感興趣實(shí)體的相關(guān)性水平的數(shù)值量化(例如,從0到1.0)。
uid4可輸出用戶界面8,諸如包括與感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的指示的圖形用戶界面。如圖1所示,如果感興趣實(shí)體是徒步旅行,則用戶界面8可以包括攀巖事件、背包行(backpacking)事件、以及洞穴探險(xiǎn)(caving)事件以作為與徒步旅行相關(guān)的實(shí)體。在圖1的非限定性實(shí)例中,uid4可以以與感興趣實(shí)體的相關(guān)性的順序來(lái)呈現(xiàn)相關(guān)的實(shí)體,使得攀巖事件可以是最相關(guān)的實(shí)體、背包行事件可以是其次最相關(guān)的實(shí)體、以及洞穴探險(xiǎn)事件可以是第三最相關(guān)的實(shí)體。這樣,uid4可以基于用戶對(duì)特定徒步旅行的興趣來(lái)呈現(xiàn)計(jì)算設(shè)備2的用戶可能感興趣的實(shí)體的經(jīng)排名列表。
在圖1的示例中,iss14包括實(shí)體模塊16以及排名模塊18。共同地,模塊16和18可以是計(jì)算設(shè)備2和連接至網(wǎng)絡(luò)12的其他計(jì)算設(shè)備可訪問(wèn)的相關(guān)實(shí)體服務(wù),其用于提供與感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體。模塊16和18可使用駐留在iss14中和/或在iss14處執(zhí)行的軟件、硬件、固件、或硬件、軟件、和固件的組合來(lái)執(zhí)行所描述的操作。iss14可利用在底層硬件上執(zhí)行的一個(gè)或多個(gè)處理器、一個(gè)或多個(gè)設(shè)備、虛擬機(jī)來(lái)執(zhí)行模塊16和18,和/或?qū)⒛K16和18執(zhí)行為操作系統(tǒng)或計(jì)算平臺(tái)的一個(gè)或多個(gè)服務(wù),僅舉幾個(gè)非限制性示例。在某些示例中,模塊16和18可以執(zhí)行為iss14的計(jì)算平臺(tái)的應(yīng)用層處的一個(gè)或多個(gè)可執(zhí)行程序。
實(shí)體模塊16可從互聯(lián)網(wǎng)20檢索和/或接收與實(shí)體相關(guān)聯(lián)的互聯(lián)網(wǎng)資源,并且可從相關(guān)聯(lián)的互聯(lián)網(wǎng)資源中提取與實(shí)體中的每一個(gè)相關(guān)聯(lián)的特征集合。實(shí)體模塊16可針對(duì)存儲(chǔ)在互聯(lián)網(wǎng)服務(wù)器22(例如web服務(wù)器)上的互聯(lián)網(wǎng)資源——諸如web頁(yè)面、社交媒體發(fā)布等來(lái)爬取(crawl)互聯(lián)網(wǎng)20,或者可以以其他方式接收互聯(lián)網(wǎng)資源的集合,并且可從這樣的互聯(lián)網(wǎng)資源中提取特征。例如,與徒步旅行相關(guān)聯(lián)的互聯(lián)網(wǎng)資源可以是描述該徒步旅行的web站點(diǎn)或者社交媒體發(fā)布。
在一個(gè)示例中,實(shí)體模塊16可以從針對(duì)實(shí)體的一個(gè)或多個(gè)web頁(yè)面提取與該實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)特征。與實(shí)體相關(guān)聯(lián)的特征可以是描述所關(guān)聯(lián)的實(shí)體的場(chǎng)境信息(contextualinformation)。特征可以包括文本,諸如包含在針對(duì)該實(shí)體的web頁(yè)面中的詞、短語(yǔ)等。在某些示例中,特征還可包括圖像、視頻、和其他媒介。實(shí)體模塊16可從針對(duì)實(shí)體的web頁(yè)面中提取特征,諸如實(shí)體描述、web頁(yè)面中的周圍的文本、與實(shí)體出現(xiàn)在其上的web頁(yè)面相關(guān)聯(lián)的查詢、指向針對(duì)該實(shí)體的web頁(yè)面的錨文本、針對(duì)該實(shí)體的web頁(yè)面的分類學(xué)類別等。
實(shí)體模塊16可以將從互聯(lián)網(wǎng)資源中提取的特征以及對(duì)實(shí)體與特征之間的關(guān)聯(lián)的指示存儲(chǔ)到信息服務(wù)器系統(tǒng)14中的計(jì)算機(jī)可讀取存儲(chǔ)設(shè)備上,諸如盤、非易失性存儲(chǔ)器等。例如,實(shí)體模塊16可以將這樣的特征以及對(duì)實(shí)體與所述特征之間的關(guān)聯(lián)的指示存儲(chǔ)為一個(gè)或多個(gè)文檔、數(shù)據(jù)庫(kù)條目、或其他結(jié)構(gòu)數(shù)據(jù),包括但不局限于逗號(hào)分隔的值、相關(guān)的數(shù)據(jù)庫(kù)條目、可擴(kuò)展標(biāo)記語(yǔ)言(xml)數(shù)據(jù)、javascript對(duì)象表示法(json)數(shù)據(jù)等。
實(shí)體模塊16還可在與每個(gè)實(shí)體相關(guān)聯(lián)的特征集合上執(zhí)行特征準(zhǔn)備,所述特征是從與相應(yīng)實(shí)體相關(guān)聯(lián)的互聯(lián)網(wǎng)資源提取的。例如,實(shí)體模塊16可執(zhí)行停止詞去除,以去除語(yǔ)言中最常見(jiàn)的詞語(yǔ)(例如,英語(yǔ)語(yǔ)言的a、the、is、at、which、on等)。實(shí)體模塊16可執(zhí)行特征再加權(quán),以至少部分地基于特征在與實(shí)體相關(guān)聯(lián)的互聯(lián)網(wǎng)資源中出現(xiàn)的頻率來(lái)對(duì)與該實(shí)體相關(guān)聯(lián)的特征進(jìn)行加權(quán)。例如,實(shí)體模塊16可對(duì)在與該實(shí)體相關(guān)聯(lián)的互聯(lián)網(wǎng)資源中較頻繁出現(xiàn)的特征指派較高的權(quán)重。實(shí)體模塊16可將實(shí)體的特征的這樣的權(quán)重存儲(chǔ)到iss14中的計(jì)算機(jī)可讀取存儲(chǔ)設(shè)備上,以作為一個(gè)或多個(gè)文檔、數(shù)據(jù)庫(kù)條目、或者其他結(jié)構(gòu)數(shù)據(jù),包括但不局限于逗號(hào)分隔的值、關(guān)系數(shù)據(jù)庫(kù)條目、xml數(shù)據(jù)、json數(shù)據(jù)等。
排名模塊18可從計(jì)算設(shè)備2接收對(duì)感興趣實(shí)體的指示,至少部分地基于與該感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體中的每個(gè)實(shí)體與該感興趣實(shí)體的相關(guān)性水平來(lái)確定該一個(gè)或多個(gè)實(shí)體的排名、并且將該一個(gè)或多個(gè)實(shí)體的指示傳輸至計(jì)算設(shè)備2。為此,排名模塊18可以確定該感興趣實(shí)體與多個(gè)其他實(shí)體中的每個(gè)實(shí)體之間的相似性度量,其中該相似性度量可以對(duì)應(yīng)于相關(guān)性水平,并且可至少部分地基于該相似性度量來(lái)確定該多個(gè)其他實(shí)體中的哪些與該感興趣實(shí)體最相關(guān)。
在一個(gè)示例中,排名模塊18可至少部分地基于測(cè)量在兩個(gè)實(shí)體的特征之間相似性度量、并且將該兩個(gè)實(shí)體的每個(gè)特征類型之間的相似性度量進(jìn)行組合,來(lái)確定兩個(gè)實(shí)體之間的相似性度量。為了確定感興趣實(shí)體與目標(biāo)實(shí)體之間的相似性度量,對(duì)于與感興趣實(shí)體相關(guān)聯(lián)的每個(gè)特征類型的特征,排名模塊18可確定感興趣實(shí)體的特征類型的特征和目標(biāo)實(shí)體的特征類型的特征之間的相似性度量,并且可以對(duì)該實(shí)體的特征類型中的每一個(gè)的相似性度量進(jìn)行組合,以確定感興趣實(shí)體與目標(biāo)實(shí)體之間的相似性度量。
在另一個(gè)示例中,排名模塊18可至少部分地基于兩個(gè)實(shí)體(例如,感興趣實(shí)體和目標(biāo)實(shí)體)是否共享到其他類似實(shí)體的連接來(lái)確定兩個(gè)實(shí)體之間的相似性度量。換言之,排名模塊18可因?yàn)閮蓚€(gè)實(shí)體的相關(guān)聯(lián)的特征中的一些在語(yǔ)義上相關(guān)而確定該兩個(gè)實(shí)體相關(guān),即使該兩個(gè)實(shí)體不共享相同的特征。
為此,根據(jù)本公開(kāi)的方面,在各個(gè)非限制性示例中,排名模塊18可生成二分圖,其中排名模塊18可通過(guò)該圖傳播信息以傳遞語(yǔ)義消息。具體地,二分圖可以包括與多個(gè)實(shí)體相關(guān)聯(lián)的多個(gè)實(shí)體節(jié)點(diǎn),其連接至與多個(gè)特征相關(guān)聯(lián)的多個(gè)特征節(jié)點(diǎn),其中該多個(gè)實(shí)體節(jié)點(diǎn)中的每一個(gè)連接至該多個(gè)特征節(jié)點(diǎn)中的一個(gè)或多個(gè)。因此,在該二分圖中,與實(shí)體相關(guān)聯(lián)的實(shí)體節(jié)點(diǎn)可以連接至與該實(shí)體的一個(gè)或多個(gè)特征相關(guān)聯(lián)的一個(gè)或多個(gè)特征節(jié)點(diǎn)。
,至少部分地基于二分圖中與一個(gè)或多個(gè)相關(guān)實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)實(shí)體節(jié)點(diǎn)之間到與感興趣實(shí)體相關(guān)的實(shí)體節(jié)點(diǎn)的連接,排名模塊18可針對(duì)該感興趣實(shí)體來(lái)確定一個(gè)或多個(gè)相關(guān)實(shí)體。具體地,排名模塊18可執(zhí)行無(wú)監(jiān)督機(jī)器學(xué)習(xí)——包括以多次迭代來(lái)執(zhí)行標(biāo)簽傳播,以將標(biāo)簽的分布與二分圖的多個(gè)節(jié)點(diǎn)中的每一個(gè)相關(guān)聯(lián),如下文關(guān)于圖3a-3c所詳細(xì)描述。排名模塊18可執(zhí)行這樣的標(biāo)簽傳播以作為使目標(biāo)函數(shù)最小化的優(yōu)化解,來(lái)生成與該二分圖的每個(gè)節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽的分布,其中標(biāo)簽的分布中的每一個(gè)包括一個(gè)或多個(gè)實(shí)體的排名的指示,該一個(gè)或多個(gè)實(shí)體與相關(guān)聯(lián)的實(shí)體節(jié)點(diǎn)或特征節(jié)點(diǎn)所表示的實(shí)體和特征相關(guān)。這樣,對(duì)于特定的感興趣實(shí)體,排名模塊18可以確定與該感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名。
盡管在二分圖方面進(jìn)行了描述,但本公開(kāi)的方面可以被實(shí)現(xiàn)為表格、數(shù)據(jù)庫(kù)、或者其他基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)。因此,二分圖的節(jié)點(diǎn)和邊還可以被實(shí)現(xiàn)為數(shù)據(jù)結(jié)構(gòu)的一部分、數(shù)據(jù)庫(kù)、表格中的條目、應(yīng)用到表格、數(shù)據(jù)庫(kù)的條目或者在其之間應(yīng)用的函數(shù)、變換、或者數(shù)據(jù)、或者其他基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)。因此,該數(shù)據(jù)結(jié)構(gòu)、表格、數(shù)據(jù)庫(kù)、函數(shù)、數(shù)據(jù)等可以表示本文所公開(kāi)的一個(gè)或多個(gè)二分圖。
排名模塊18可以執(zhí)行上面的技術(shù)來(lái)確定感興趣實(shí)體與多個(gè)其他實(shí)體之間的相似性度量(例如相似性分值),并且可以根據(jù)所確定的相似性度量確定多個(gè)實(shí)體與感興趣實(shí)體之間的相關(guān)性排名。排名模塊18可以經(jīng)由網(wǎng)絡(luò)12將與感興趣實(shí)體最相關(guān)的實(shí)體中的一個(gè)或多個(gè)的經(jīng)排名列表的指示發(fā)送給計(jì)算設(shè)備2。例如,排名模塊18可以向計(jì)算設(shè)備2發(fā)送web頁(yè)面,其包括指向與最相關(guān)的實(shí)體中的一個(gè)或多個(gè)的經(jīng)排名列表相關(guān)聯(lián)的web頁(yè)面的鏈接。因此,在計(jì)算設(shè)備2上運(yùn)行的web瀏覽器可以渲染所接收的web頁(yè)面,使得ui設(shè)備4可以呈現(xiàn)用戶界面8,其包括指向與該最相關(guān)的實(shí)體中的一個(gè)或多個(gè)的經(jīng)排名列表相關(guān)聯(lián)的web頁(yè)面的鏈接。
根據(jù)本公開(kāi)的方面,iss14可以生成包括多個(gè)節(jié)點(diǎn)的圖,其中該多個(gè)節(jié)點(diǎn)包括表示多個(gè)實(shí)體的多個(gè)實(shí)體節(jié)點(diǎn)以及表示多個(gè)特征的多個(gè)特征節(jié)點(diǎn),并且其中該多個(gè)實(shí)體節(jié)點(diǎn)中的每一個(gè)在圖中連接到該多個(gè)特征節(jié)點(diǎn)中的一個(gè)或多個(gè)。iss14可以執(zhí)行標(biāo)簽傳播來(lái)跨圖來(lái)傳播多個(gè)標(biāo)簽,以將標(biāo)簽的分布與多個(gè)節(jié)點(diǎn)中的每一個(gè)相關(guān)聯(lián)。iss14可以接收感興趣特征或感興趣實(shí)體中的至少一個(gè)的指示。對(duì)于該感興趣特征或感興趣實(shí)體中的至少一個(gè),iss14可以輸出與該感興趣特征或者感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)相關(guān)實(shí)體的指示,其中輸出對(duì)該一個(gè)或多個(gè)相關(guān)實(shí)體的指示是部分地基于相應(yīng)標(biāo)簽的分布的,所述相應(yīng)標(biāo)簽與表示感興趣特征的多個(gè)特征節(jié)點(diǎn)中的一個(gè)或者表示該感興趣實(shí)體的多個(gè)實(shí)體節(jié)點(diǎn)中的一個(gè)相關(guān)聯(lián)。本公開(kāi)的這些和其他方面在下面被更詳細(xì)地討論。
圖2是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面的、將iss14圖示為被配置來(lái)確定一組實(shí)體的相關(guān)性水平的示例計(jì)算系統(tǒng)。圖2僅圖示了iss14的一個(gè)特定示例,并且iss14的許多其他示例可以被使用在其他實(shí)例中,并且可包括在示例iss14中所包括的組件的子集或者可包括圖2中未示出的附加組件。
iss14向計(jì)算設(shè)備2提供了管道(conduit),諸如計(jì)算設(shè)備2的計(jì)算設(shè)備通過(guò)其可訪問(wèn)相關(guān)的實(shí)體服務(wù),以用于自動(dòng)接收指示感興趣實(shí)體或感興趣特征的一個(gè)或多個(gè)相關(guān)實(shí)體的信息。如圖2的示例所示,iss14包括一個(gè)或多個(gè)處理器44、一個(gè)或多個(gè)通信單元46、以及一個(gè)或多個(gè)存儲(chǔ)設(shè)備48。iss14的存儲(chǔ)設(shè)備48包括實(shí)體模塊16和排名模塊18。
iss14的存儲(chǔ)設(shè)備48進(jìn)一步包括特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a、圖數(shù)據(jù)存儲(chǔ)52b、排名數(shù)據(jù)存儲(chǔ)52c、以及互聯(lián)網(wǎng)資源數(shù)據(jù)存儲(chǔ)52d(統(tǒng)稱為“數(shù)據(jù)存儲(chǔ)52”)。通信信道50可將組件44、46、和48中的每一個(gè)互連,以用于組件間的通信(在物理、通信、和/或操作上)。在某些示例中,通信信道50可包括系統(tǒng)總線、網(wǎng)絡(luò)連接、進(jìn)程間通信數(shù)據(jù)結(jié)構(gòu)、或者用于傳輸數(shù)據(jù)的任何其他方法。
iss14的一個(gè)或多個(gè)通信單元46可以通過(guò)在諸如圖1的網(wǎng)絡(luò)12或者互聯(lián)網(wǎng)20的一個(gè)或多個(gè)網(wǎng)絡(luò)上傳送和/或接收網(wǎng)絡(luò)信號(hào)來(lái)與外部計(jì)算設(shè)備——諸如圖1的計(jì)算設(shè)備2進(jìn)行通信。例如,iss14可使用通信單元46跨網(wǎng)絡(luò)12來(lái)傳送和/或接收音頻信號(hào),以與計(jì)算設(shè)備2交換信息。通信單元46的示例包括網(wǎng)絡(luò)接口卡(例如,諸如以太網(wǎng)卡)、光學(xué)收發(fā)器、射頻收發(fā)器、gps接收器、或者能夠發(fā)送和/或接收信息的任何其他類型的設(shè)備。通信單元46的其他示例可包括短波無(wú)線電、蜂窩數(shù)據(jù)無(wú)線電、無(wú)線以太網(wǎng)網(wǎng)絡(luò)無(wú)線電、以及通用串行總線(usb)控制器。
存儲(chǔ)設(shè)備48可以存儲(chǔ)用于在iss14的操作期間進(jìn)行處理的信息(例如,iss14可以在iss14處存儲(chǔ)模塊16和18在執(zhí)行期間所訪問(wèn)的數(shù)據(jù))。在某些示例中,存儲(chǔ)設(shè)備48是臨時(shí)存儲(chǔ)器,意指存儲(chǔ)設(shè)備48的主要目的不是長(zhǎng)期存儲(chǔ)。iss14上的存儲(chǔ)設(shè)備48可以作為易失性存儲(chǔ)器來(lái)被配置用于信息的短期存儲(chǔ)來(lái),并且因此在被關(guān)閉電源的情況下不保持存儲(chǔ)的內(nèi)容。易失性存儲(chǔ)器的示例包括隨機(jī)存取存儲(chǔ)器(ram)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(dram)、靜態(tài)隨機(jī)存取存儲(chǔ)器(sram)、以及本領(lǐng)域公知的其他形式的易失性存儲(chǔ)器。
在某些示例中,存儲(chǔ)設(shè)備48還包括一個(gè)或多個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)。存儲(chǔ)設(shè)備48可被配置來(lái)比易失性存儲(chǔ)器存儲(chǔ)更大量的信息。存儲(chǔ)設(shè)備48可進(jìn)一步作為非易失性存儲(chǔ)器空間被配置用于信息的長(zhǎng)期存儲(chǔ),并且在電源開(kāi)/關(guān)循環(huán)之后保持信息。非易失性存儲(chǔ)器的示例包括磁性硬盤、光盤、軟盤、閃速存儲(chǔ)器、或者電可編程存儲(chǔ)器(eprom)或者電可擦可編程(eeprom)存儲(chǔ)器的形式。存儲(chǔ)設(shè)備48可以存儲(chǔ)與模塊16和18相關(guān)聯(lián)的程序指令和/或數(shù)據(jù)。
一個(gè)或多個(gè)處理器44可以實(shí)現(xiàn)iss14內(nèi)的功能和/或執(zhí)行iss14內(nèi)的指令。例如,iss14上的處理器44可接收和執(zhí)行存儲(chǔ)設(shè)備48所存儲(chǔ)的指令,其執(zhí)行模塊16和18的功能。這些指令在由處理器44執(zhí)行時(shí)可以使得iss14在程序執(zhí)行期間在存儲(chǔ)設(shè)備48內(nèi)存儲(chǔ)信息。處理器44可以執(zhí)行模塊16和18的指令,以從多個(gè)互聯(lián)網(wǎng)來(lái)源提取與多個(gè)實(shí)體相關(guān)聯(lián)的多個(gè)特征,并且確定實(shí)體中的每一個(gè)之間的相關(guān)性水平,從而針對(duì)特定的感興趣實(shí)體或感興趣特征輸出一個(gè)或多個(gè)相關(guān)實(shí)體的排名。即,模塊16和18可以是可由處理器44操作以執(zhí)行本文所述的iss14的各個(gè)動(dòng)作或功能。
數(shù)據(jù)存儲(chǔ)52處所存儲(chǔ)的信息可以作為可檢索和/或歸類的結(jié)構(gòu)化數(shù)據(jù)被存儲(chǔ)。例如,一個(gè)或多個(gè)模塊16和18可將數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)存儲(chǔ)52中。一個(gè)或多個(gè)模塊16和18也可提供從數(shù)據(jù)存儲(chǔ)52中的一個(gè)或多個(gè)請(qǐng)求信息的輸入,并且響應(yīng)于該輸入而接收在數(shù)據(jù)存儲(chǔ)52處存儲(chǔ)的信息。iss14可作為基于云的數(shù)據(jù)訪問(wèn)服務(wù),向連接到網(wǎng)絡(luò)12或者互聯(lián)網(wǎng)20的設(shè)備——諸如計(jì)算設(shè)備2提供對(duì)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)52處的信息的訪問(wèn)。當(dāng)數(shù)據(jù)存儲(chǔ)52包含與個(gè)體用戶相關(guān)聯(lián)的信息或者當(dāng)信息跨多個(gè)用戶而通用化時(shí),將該信息鏈接回各個(gè)人的所有個(gè)人可識(shí)別信息——諸如姓名、地址、電話號(hào)碼、和/或電子郵件地址都可在被存儲(chǔ)在iss14處之前去除。iss14可進(jìn)一步對(duì)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)52處的信息進(jìn)行加密,以防止訪問(wèn)其中存儲(chǔ)的任何信息。此外,如果計(jì)算設(shè)備的用戶確定性地同意這樣的信息收集,則iss14僅可存儲(chǔ)與那些用戶相關(guān)聯(lián)的信息。iss14可進(jìn)一步為用戶提供撤回同意的機(jī)會(huì)并且在該情況下,iss14可停止收集或者以其他方式保持與該特定用戶相關(guān)聯(lián)的信息。
實(shí)體模塊16可諸如經(jīng)由互聯(lián)網(wǎng)20從互聯(lián)網(wǎng)服務(wù)器22檢索、接收、或者以其他方式獲得互聯(lián)網(wǎng)資源以及與該互聯(lián)網(wǎng)資源相關(guān)聯(lián)的資源信息,并且可將該互聯(lián)網(wǎng)資源以及與該互聯(lián)網(wǎng)資源相關(guān)聯(lián)的資源信息存儲(chǔ)到互聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)52d中。
在某些示例中,由實(shí)體模塊16獲得的互聯(lián)網(wǎng)資源可以是通過(guò)針對(duì)文檔而爬取互聯(lián)網(wǎng)20來(lái)獲得的文檔(例如,web頁(yè)面)。在某些示例中,實(shí)體模塊16可以不在互聯(lián)網(wǎng)資源數(shù)據(jù)存儲(chǔ)52d中存儲(chǔ)互聯(lián)網(wǎng)資源。相反,可以在別處存儲(chǔ)互聯(lián)網(wǎng)資源,諸如實(shí)體模塊16可利用其來(lái)經(jīng)由互聯(lián)網(wǎng)20進(jìn)行通信的一個(gè)或多個(gè)遠(yuǎn)程計(jì)算設(shè)備(未示出)上。
與互聯(lián)網(wǎng)資源相關(guān)聯(lián)的資源信息可包括關(guān)于可以沒(méi)有被包括在互聯(lián)網(wǎng)資源自身的本體中的互聯(lián)網(wǎng)資源的場(chǎng)境信息。例如,與特定互聯(lián)網(wǎng)資源相關(guān)聯(lián)的資源信息可包括發(fā)布到互聯(lián)網(wǎng)搜索引擎的查詢,其導(dǎo)致經(jīng)由指向在檢索結(jié)果中所包括的互聯(lián)網(wǎng)資源的鏈接來(lái)對(duì)該互聯(lián)網(wǎng)資源的訪問(wèn)。在另一示例中,與特定互聯(lián)網(wǎng)資源相關(guān)聯(lián)的資源信息可包括從另一個(gè)互聯(lián)網(wǎng)資源指向該互聯(lián)網(wǎng)資源的鏈接的錨文本。在另一示例中,與特定互聯(lián)網(wǎng)資源相關(guān)聯(lián)的資源信息可包括該互聯(lián)網(wǎng)資源的分類學(xué)類別。
由實(shí)體模塊16獲得的互聯(lián)網(wǎng)資源可與多個(gè)實(shí)體相關(guān)聯(lián),使得每個(gè)實(shí)體可以與一個(gè)或多個(gè)互聯(lián)網(wǎng)資源相關(guān)聯(lián)。在某些示例中,實(shí)體可以是事件、地點(diǎn)、人、商業(yè)、電影、飯店等。實(shí)體可進(jìn)一步與描述、位置、和時(shí)間中的一個(gè)或多個(gè)相關(guān)聯(lián)。在某些示例中,對(duì)實(shí)體的描述可以是事件標(biāo)題、商業(yè)名稱等。位置可以是地理位置,諸如事件地點(diǎn)、商業(yè)地點(diǎn)等。在某些示例中,時(shí)間可以是事件發(fā)生的時(shí)間。
與特定實(shí)體相關(guān)聯(lián)的互聯(lián)網(wǎng)資源可以描述該特定實(shí)體。例如,如果特定實(shí)體是事件,則與該特定實(shí)體相關(guān)聯(lián)的互聯(lián)網(wǎng)資源可以是針對(duì)該事件的web頁(yè)面、關(guān)于該事件的社交媒體發(fā)布、舉辦該事件的場(chǎng)所的web站點(diǎn)等。
實(shí)體模塊16可至少?gòu)膶?shí)體模塊16所獲得的互聯(lián)網(wǎng)資源提取多個(gè)實(shí)體,并且可以對(duì)于該多個(gè)實(shí)體中的每個(gè)實(shí)體來(lái)確定與該特定實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源。對(duì)于該多個(gè)實(shí)體中的每個(gè)實(shí)體,實(shí)體模塊16可以至少?gòu)呐c該特定實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源提取與該實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)特征以及與該一個(gè)或多個(gè)互聯(lián)網(wǎng)資源相關(guān)聯(lián)的資源信息。與該實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)特征可包括描述該實(shí)體的場(chǎng)境信息。在某些示例中,特征可包括諸如詞、短語(yǔ)、句子等的場(chǎng)境信息。例如,實(shí)體模塊16可以從與音樂(lè)會(huì)相關(guān)聯(lián)的web頁(yè)面提取諸如“貝多芬(beethoven)”、“交響樂(lè)(symphony)”、“協(xié)奏曲(concerto)”、“管弦樂(lè)團(tuán)(orchestra)”、“指揮(conductor)”、“鋼琴家(pianist)”、“首席小提琴手(concertmaster)”、“小提琴手(violinist)”等的語(yǔ)和短語(yǔ)以作為描述或者以其他方式與該音樂(lè)會(huì)相關(guān)聯(lián)的特征。
由實(shí)體模塊16針對(duì)特定實(shí)體而提取的特征可以被歸類為一個(gè)或多個(gè)特征類別,其對(duì)應(yīng)于描述相關(guān)聯(lián)的實(shí)體的信息的類型。特征類別的集合可以包括標(biāo)題、周邊、查詢、錨、以及分類學(xué)中的一個(gè)或多個(gè)。從與該實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源(例如,一個(gè)或多個(gè)web頁(yè)面)的標(biāo)題或頭部(heading)提取的一個(gè)或多個(gè)特征可以被歸類為屬于特征標(biāo)題類別,并且可包括描述該實(shí)體的一個(gè)或兩個(gè)句子。從被包括在一個(gè)或多個(gè)互聯(lián)網(wǎng)資源中的周邊文本中提取的一個(gè)或多個(gè)特征——諸如與實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)web頁(yè)面的主體,可以被歸類為屬于周邊特征類別。
查詢特征類別可包括從被發(fā)布到互聯(lián)網(wǎng)搜索引擎的查詢中提取的一個(gè)或多個(gè)特征,該查詢導(dǎo)致經(jīng)由指向被包括在搜索結(jié)果中的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源的鏈接來(lái)訪問(wèn)經(jīng)由實(shí)體所關(guān)聯(lián)的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源。例如,實(shí)體模塊16可將導(dǎo)致對(duì)音樂(lè)會(huì)的web頁(yè)面的訪問(wèn)的“古典音樂(lè)會(huì)(classicalmusicconcerts)”的查詢歸類為屬于查詢特征類別里面的特征“古典”、“音樂(lè)”、以及“音樂(lè)會(huì)”。
錨特征類別可包括從另一互聯(lián)網(wǎng)資源指向與實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源的鏈接的錨文本提取的一個(gè)或多個(gè)特征。因此,在一個(gè)示例中,如果web頁(yè)面包含指向針對(duì)作為古典音樂(lè)會(huì)的實(shí)體的web頁(yè)面的“古典音樂(lè)會(huì)”錨,則實(shí)體模塊16可將“古典音樂(lè)會(huì)”的錨文本歸類為屬于與該古典音樂(lè)會(huì)相關(guān)聯(lián)的實(shí)體的錨特征類別的特征“古典”和“音樂(lè)會(huì)”。
分類學(xué)特征類別可以包括從與實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源的分類學(xué)類別提取的一個(gè)或多個(gè)特征。實(shí)體模塊16可以執(zhí)行互聯(lián)網(wǎng)資源的分類學(xué)歸類,來(lái)將與該實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源中的每一個(gè)標(biāo)記為與該一個(gè)或多個(gè)類別相關(guān)聯(lián),從諸如運(yùn)動(dòng)和藝術(shù)的較高級(jí)別類別到諸如高爾夫和搖滾樂(lè)的較低級(jí)別類別。
對(duì)于每個(gè)實(shí)體,實(shí)體模塊16可以將特征值和與特定實(shí)體相關(guān)聯(lián)的每個(gè)不同的特征相關(guān)聯(lián)。與關(guān)聯(lián)于實(shí)體的特征相關(guān)聯(lián)的特征值可對(duì)應(yīng)于從與該實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源以及與該一個(gè)或多個(gè)互聯(lián)網(wǎng)資源相關(guān)聯(lián)的資源信息提取出相同特征的次數(shù)。例如,對(duì)于作為音樂(lè)事件的實(shí)體,特征“音樂(lè)會(huì)”可以出現(xiàn)很多次,諸如在一個(gè)或多個(gè)互聯(lián)網(wǎng)資源的標(biāo)題以及該互聯(lián)網(wǎng)資源的主體中。通過(guò)將資源的單個(gè)實(shí)例與該實(shí)體相關(guān)聯(lián),并且通過(guò)向該實(shí)體指派特征值——其對(duì)應(yīng)于從與該實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源以及與該一個(gè)或多個(gè)互聯(lián)網(wǎng)資源相關(guān)聯(lián)的資源信息提取出相同特征的次數(shù),實(shí)體模塊16可對(duì)從與該實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源以及與該一個(gè)或多個(gè)互聯(lián)網(wǎng)資源相關(guān)聯(lián)的資源信息中多次提取的相同事件進(jìn)行去重。
作為從互聯(lián)網(wǎng)資源以及從該互聯(lián)網(wǎng)資源所關(guān)聯(lián)的資源信息提取特征的結(jié)果,實(shí)體模塊16可將一個(gè)或多個(gè)特征與多個(gè)實(shí)體中的每一個(gè)相關(guān)聯(lián),其中該一個(gè)或多個(gè)特征可以是描述或者以其他方式提供對(duì)應(yīng)實(shí)體的場(chǎng)境信息的文本信息。通過(guò)將所述特征歸類為特征類別,每個(gè)實(shí)體可與該特征類別中的一個(gè)或多個(gè)相關(guān)聯(lián),并且對(duì)于每個(gè)所關(guān)聯(lián)的類別,可以與該特征類別中的一個(gè)或多個(gè)特征相關(guān)聯(lián)。在某些示例中,實(shí)體可以與上述的五個(gè)特征類別中的每個(gè)類別中的特征相關(guān)聯(lián)。在其他示例中,實(shí)體可以與少于上述的全部五個(gè)特征類別的特征相關(guān)聯(lián)。在附加示例中,實(shí)體可以與不同于上述的特征類別的一個(gè)或多個(gè)附加特征類別中的特征相關(guān)聯(lián)。
對(duì)于每個(gè)實(shí)體,實(shí)體模塊16可以執(zhí)行特征處理,以處理從互聯(lián)網(wǎng)資源中提取的實(shí)體以及特征。例如,所述特征可包括文本信息,使得實(shí)體模塊16可以執(zhí)行對(duì)特征的詞干分析(stemming)(例如,應(yīng)用porter詞干器(stemmer))并且將經(jīng)詞干分析的特征變換為一元(unigram)以及二元(bigram)特征。
實(shí)體模塊16還可以執(zhí)行實(shí)體去重——諸如通過(guò)對(duì)具有相同名稱或標(biāo)題的實(shí)體進(jìn)行去重,并且可執(zhí)行特征合并以將與重復(fù)事件相關(guān)聯(lián)的特征合并。如上所討論,與該重復(fù)事件相關(guān)聯(lián)的每個(gè)特征可具有相關(guān)聯(lián)的特征值,其可對(duì)應(yīng)于那些事件在相應(yīng)特征類別中出現(xiàn)的頻率。例如,如果詞“爵士(jazz)”是在特定事件的周邊特征類別中多次出現(xiàn)的特征,則特征“爵士”的特征值可對(duì)應(yīng)于詞“爵士”出現(xiàn)在與該實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)互聯(lián)網(wǎng)資源中所包括的周邊文本中的次數(shù)。為了將重復(fù)事件的特征合并,實(shí)體模塊16可在待合并的特征落入標(biāo)題、周邊、查詢、以及錨特征類別下的情況下,將那些特征的特征值確定為兩個(gè)實(shí)體的相同特征的特征值的和。對(duì)于落入分類學(xué)特征類別的實(shí)體,實(shí)體模塊16也可將待合并的特征的特征值確定為兩個(gè)實(shí)體的相同特征的特征值中的最大。
作為特征處理的一部分,實(shí)體模塊16也可執(zhí)行停止詞去除以及特征再加權(quán)以在信息檢索中減小特征噪聲。停止詞去除可包括全局停止詞去除以及局部停止詞去除。為了執(zhí)行全局停止詞去除,實(shí)體模塊16可確定所提取的特征中的每個(gè)特征的特征頻率,其可以是與特定特征相關(guān)聯(lián)的實(shí)體的數(shù)目。實(shí)體模塊16可以確定具有相對(duì)高的特征頻率(例如與多于閾值數(shù)目的實(shí)體相關(guān)聯(lián)的特征、相關(guān)聯(lián)的特征頻率百分比在前10中的特征等)的特征可以是全局停止詞,并且可以從實(shí)體中去除那些特征或者以其他方式將那些特征與實(shí)體解除關(guān)聯(lián)。
實(shí)體模塊16還可以執(zhí)行局部停止詞去除以去除局部停止詞。局部停止詞可以是特定區(qū)域的實(shí)體的頻繁特征,其在執(zhí)行全局停止詞去除之后仍然保持。如上所討論,每個(gè)實(shí)體可具有相關(guān)聯(lián)的地理位置或地理區(qū)域。例如,當(dāng)聚焦在諸如紐約的特定位置的實(shí)體上時(shí),來(lái)自紐約的許多實(shí)體可以包含短語(yǔ)“紐約(newyork)”,其在停止詞去除期間可不被去除。對(duì)于特定地理位置(例如,紐約),實(shí)體模塊16可以執(zhí)行局部停止詞去除,以去除作為該特定地理位置中的實(shí)體的特征而頻繁出現(xiàn)的詞或短語(yǔ)。因此,通過(guò)確定與地理位置相關(guān)聯(lián)的特定區(qū)域內(nèi)的特征頻率以及去除與該地理位置相關(guān)聯(lián)的停止詞,實(shí)體模塊16可針對(duì)實(shí)體的相關(guān)聯(lián)的地理位置來(lái)執(zhí)行局部停止詞去除。
對(duì)于每個(gè)實(shí)體,通過(guò)確定與該實(shí)體相關(guān)聯(lián)的每個(gè)特征的特征權(quán)重——其至少部分地基于相應(yīng)實(shí)體的每個(gè)特征的特征頻率,實(shí)體模塊16可以進(jìn)一步執(zhí)行與該實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)特征的特征再加權(quán)。換言之,實(shí)體模塊16可以至少部分地基于與特定實(shí)體相關(guān)聯(lián)的特定特征的特征值來(lái)對(duì)該特定特征進(jìn)行再加權(quán),因?yàn)樗P(guān)于該特定實(shí)體。如果特征與多個(gè)實(shí)體相關(guān)聯(lián),則實(shí)體模塊16可以對(duì)于每個(gè)特征-實(shí)體對(duì)確定單獨(dú)的特征權(quán)重,使得這樣的特征可以與多個(gè)特征權(quán)重相關(guān)聯(lián),與其相關(guān)聯(lián)的每個(gè)實(shí)體各有一個(gè)特征權(quán)重。
對(duì)于每個(gè)實(shí)體,執(zhí)行特征再加權(quán)可包括按比例減小該實(shí)體具有高特征值的頻繁特征以及按比例增大該實(shí)體具有低特征值的特征,這是因?yàn)榧词乖趫?zhí)行停止詞去除之后還可能存在特征頻率的偏態(tài)分布(skeweddistribution)。對(duì)于實(shí)體的每個(gè)特征的頻率,實(shí)體模塊16可以通過(guò)對(duì)頻率進(jìn)行對(duì)數(shù)擴(kuò)縮并將經(jīng)對(duì)數(shù)擴(kuò)縮的頻率與其倒排文檔頻率(inversedocumentfrequency)相乘來(lái)應(yīng)用對(duì)數(shù)標(biāo)準(zhǔn)化的詞頻-倒排文檔頻率(termfrequency-inversedocumentfrequency)(tf-idf),以確定在實(shí)體i中特定特征j的權(quán)重,如下:
實(shí)體模塊16可以將實(shí)體、特征、和從互聯(lián)網(wǎng)資源提取的每個(gè)實(shí)體的特征類別的關(guān)聯(lián)的指示存儲(chǔ)到實(shí)體-特征數(shù)據(jù)存儲(chǔ)52a中,以及與該實(shí)體相關(guān)聯(lián)的每個(gè)特征的特征權(quán)重。例如,對(duì)于作為結(jié)構(gòu)化數(shù)據(jù)的每個(gè)實(shí)體,實(shí)體模塊16可存儲(chǔ)與該結(jié)構(gòu)化數(shù)據(jù)相關(guān)聯(lián)的至少一個(gè)或多個(gè)特征、該一個(gè)或多個(gè)特征中的每個(gè)特征的特征權(quán)重、以及該一個(gè)或多個(gè)特征落入的一個(gè)或多個(gè)特征類別。實(shí)體模塊16可進(jìn)一步將與實(shí)體相關(guān)聯(lián)的任何附加信息存儲(chǔ)到特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中,所述附加信息諸如與實(shí)體中的每一個(gè)相關(guān)聯(lián)的地理位置,或者任何其他合適的信息。
對(duì)于特定實(shí)體,排名模塊18可確定與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名。與該特征實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名可以是具有與存儲(chǔ)在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中的一組實(shí)體當(dāng)中的特定實(shí)體的最高相關(guān)性水平的一個(gè)或多個(gè)實(shí)體的指示。如果一組實(shí)體中的每個(gè)實(shí)體均具有指示相應(yīng)實(shí)體與該特定實(shí)體之間的相關(guān)性水平的關(guān)聯(lián)的相似性分值,則與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體可以是該實(shí)體集合當(dāng)中關(guān)于該特定實(shí)體具有最高相似性分值的一個(gè)或多個(gè)實(shí)體。換言之,給定對(duì)該特定實(shí)體感興趣的隨機(jī)用戶,則與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體可以是存儲(chǔ)在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中的一組實(shí)體當(dāng)中相同隨機(jī)用戶會(huì)最感興趣的一個(gè)或多個(gè)實(shí)體。
在某些示例中,排名模塊18可以確定被存儲(chǔ)在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中的實(shí)體中的每一個(gè)之間的相關(guān)性水平(例如,相似性分值)。因此,在此示例中,對(duì)于存儲(chǔ)在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中的每個(gè)實(shí)體,排名模塊18可以確定特定實(shí)體與存儲(chǔ)在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中的每個(gè)其他實(shí)體之間的相關(guān)性水平。
在其他示例中,由于對(duì)特定實(shí)體感興趣的用戶也可能僅對(duì)處于相同地理區(qū)域內(nèi)的其他實(shí)體感興趣,不同于確定特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中所存儲(chǔ)的實(shí)體中的每一個(gè)之間的相關(guān)性水平,排名模塊18作為替代可確定僅在存儲(chǔ)在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中的、處于相同的地理區(qū)域或位置或者與該相同的地理區(qū)域或位置相關(guān)聯(lián)的實(shí)體之間的相關(guān)性。排名模塊18可以至少部分地基于與實(shí)體相關(guān)聯(lián)的地理位置來(lái)確定該實(shí)體是否在相同的地理區(qū)域內(nèi)。這樣,在此示例中,排名模塊18可以確定在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中所存儲(chǔ)的實(shí)體的子集(例如,小于全部)中的每個(gè)之間的相關(guān)性水平(例如,相似性分值)。
在一個(gè)示例中,排名模塊18可以執(zhí)行組合器(combiner)技術(shù),以確定與一組實(shí)體中的每一個(gè)相關(guān)的一個(gè)或多個(gè)實(shí)體的排名。排名模塊18可以執(zhí)行組合器技術(shù),以確定存儲(chǔ)在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中的一組實(shí)體中的每個(gè)實(shí)體之間的相關(guān)性。例如,排名模塊18可以確定存儲(chǔ)在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中的與相同地理區(qū)域或者地理位置相關(guān)聯(lián)的一組實(shí)體中的每個(gè)實(shí)體之間的相關(guān)性水平。對(duì)于可被稱作源實(shí)體的特定實(shí)體,排名模塊18可以通過(guò)確定該源實(shí)體與稱作目標(biāo)實(shí)體的另一實(shí)體之間的相同特征集合中的特征的相似性水平,來(lái)確定該源實(shí)體和該目標(biāo)實(shí)體之間的相關(guān)性水平。
假定與源實(shí)體和目標(biāo)實(shí)體相關(guān)聯(lián)的k個(gè)特征類別的列表,
更具體的,為了確定特定的特征類別的源實(shí)體s和目標(biāo)實(shí)體t之間的相似性分值,排名模塊18可以將每個(gè)實(shí)體視為特征的分布。為此,排名模塊18可以利用jeffreys-kullback-leibler散度——其可以是kullback-leibler散度的對(duì)稱版本,來(lái)確定源實(shí)體和目標(biāo)實(shí)體的特征的分布之間的差異的度量。給定特征集合
排名模塊18可以執(zhí)行組合器技術(shù),以確定k個(gè)特征類別中的每一個(gè)的源實(shí)體s和目標(biāo)實(shí)體t之間的相似性分值為
給定特征類別j,源實(shí)體s和目標(biāo)實(shí)體t的相似性分值可以被標(biāo)示為rj。排名模塊18可以通過(guò)倒數(shù)排名融合(reciprocalrankfusion)將源實(shí)體s和目標(biāo)實(shí)體t的特征類別中的每一個(gè)的相似性分值組合為單個(gè)排名列表。給定目標(biāo)實(shí)體t相對(duì)于源實(shí)體s與相似性分值
因此,通過(guò)執(zhí)行組合器技術(shù),排名模塊18可以至少部分地基于兩個(gè)實(shí)體的特征之間的相似性的聚合來(lái)確定兩個(gè)實(shí)體之間的相關(guān)性水平。如上所討論,排名模塊18可確定在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中所存儲(chǔ)的實(shí)體中的一組實(shí)體中的每個(gè)實(shí)體之間的相關(guān)性水平,并且可以將排名模塊18所確定的一組實(shí)體中的每個(gè)實(shí)體之間的相關(guān)性水平的指示存儲(chǔ)到排名數(shù)據(jù)存儲(chǔ)52c中。例如,排名數(shù)據(jù)存儲(chǔ)52c可以將實(shí)體對(duì)的指示連同相關(guān)聯(lián)的相關(guān)性水平——諸如相似性分值的指示一起存儲(chǔ)到排名數(shù)據(jù)存儲(chǔ)52c中。
在其他示例中,對(duì)于一組實(shí)體中的每個(gè)實(shí)體,排名模塊18可基于在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中所存儲(chǔ)的實(shí)體當(dāng)中的一組實(shí)體中的每個(gè)實(shí)體之間的相關(guān)性水平來(lái)確定與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名,諸如具有與該組實(shí)體當(dāng)中的特定實(shí)體的最高相關(guān)性水平的一個(gè)或多個(gè)實(shí)體的排名,并且可以將與該組實(shí)體中的每個(gè)實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的這樣的指示存儲(chǔ)到排名數(shù)據(jù)存儲(chǔ)52c中。
這樣,例如,iss14可以從計(jì)算設(shè)備2接收對(duì)實(shí)體的指示,根據(jù)存儲(chǔ)在排名數(shù)據(jù)存儲(chǔ)52c中的數(shù)據(jù)來(lái)確定與特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名,并且將與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示傳送至計(jì)算設(shè)備2。在一個(gè)示例中,iss14從計(jì)算設(shè)備2接收的實(shí)體的指示可以指示與該實(shí)體相關(guān)聯(lián)的名稱,諸如“milesdavis”或者“beethoven’s5thsymphony(貝多芬第五交響曲)”。排名模塊18可利用與該實(shí)體相關(guān)聯(lián)的名稱來(lái)在排名數(shù)據(jù)存儲(chǔ)52c中進(jìn)行索引,以找出與該名稱相關(guān)聯(lián)的實(shí)體,并且可以確定排名數(shù)據(jù)存儲(chǔ)52c內(nèi)、與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示被存儲(chǔ)的位置。排名模塊18可檢索與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示。iss14可以將與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的所檢索的指示格式化為任何合適的結(jié)構(gòu)化數(shù)據(jù)格式——諸如json或者xml以用于傳送該一個(gè)或多個(gè)實(shí)體的排名的指示,并且可以諸如經(jīng)由網(wǎng)絡(luò)12或互聯(lián)網(wǎng)20將該一個(gè)或多個(gè)實(shí)體的指示輸出至計(jì)算設(shè)備2。
在其他示例中,不同于從排名數(shù)據(jù)存儲(chǔ)52c中檢索與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名,iss14可以響應(yīng)于例如從計(jì)算設(shè)備2接收到對(duì)實(shí)體的指示而使用本文所述的組合器技術(shù)來(lái)在運(yùn)行中(on-the-fly)確定與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名,并使用本文所述的技術(shù)諸如經(jīng)由網(wǎng)絡(luò)12或互聯(lián)網(wǎng)20來(lái)將一個(gè)或多個(gè)實(shí)體的排名的指示輸出至計(jì)算設(shè)備2。
在另一示例中,iss14可以例如從計(jì)算設(shè)備2接收對(duì)查詢的指示。查詢可以是文本數(shù)據(jù),諸如詞、短語(yǔ)等,計(jì)算設(shè)備2可以接收該查詢以作為輸入。例如,查詢可以是對(duì)于與該查詢相關(guān)的一個(gè)或多個(gè)實(shí)體的搜索短語(yǔ)。響應(yīng)于接收對(duì)查詢的指示,計(jì)算設(shè)備2可以經(jīng)由排名模塊18來(lái)確定與該查詢相關(guān)的一個(gè)或多個(gè)實(shí)體的排名,并且可向計(jì)算設(shè)備2輸出與該查詢相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示。
具體地,響應(yīng)于計(jì)算設(shè)備2接收諸如“馬拉松(marathon)”的查詢的指示,排名模塊18可以部分地基于執(zhí)行本文所述的組合器技術(shù)來(lái)確定與該搜索短語(yǔ)相關(guān)的一個(gè)或多個(gè)實(shí)體的排名。排名模塊18可以確定均具有與所發(fā)布的查詢匹配的實(shí)體名稱或標(biāo)題的一個(gè)或多個(gè)實(shí)體的集合為種子集合s。使用這些種子實(shí)體,排名模塊18可以確定與種子集合s內(nèi)的每個(gè)實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體——包括該種子實(shí)體在內(nèi)——為候選實(shí)體cs集合。排名模塊18可以通過(guò)該候選實(shí)體cs集合內(nèi)的候選實(shí)體的相應(yīng)相似性分值來(lái)對(duì)它們進(jìn)行排名。如果從不同的種子實(shí)體中多次檢索到該候選實(shí)體集合內(nèi)的實(shí)體,則因?yàn)榕琶K18確定該實(shí)體與種子集合s中的多于一個(gè)的實(shí)體相關(guān),所以排名模塊18可以對(duì)其相似性分值進(jìn)行合計(jì),以得出該實(shí)體的單個(gè)相似性分值。更正式地,目標(biāo)實(shí)體t與查詢q的相似性可以被定位為
在另一個(gè)示例中,排名模塊18可以執(zhí)行擴(kuò)展器技術(shù),以確定與一組實(shí)體中的每個(gè)實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名。排名模塊18可以執(zhí)行擴(kuò)展器技術(shù)以確定在特征-實(shí)體數(shù)據(jù)存儲(chǔ)52a中所存儲(chǔ)的一組實(shí)體中的每個(gè)實(shí)體之間的相關(guān)性水平。具體地,排名模塊18可以執(zhí)行擴(kuò)展技術(shù),以至少部分地基于確定給定的一對(duì)兩個(gè)實(shí)體的特征之間的語(yǔ)義相關(guān)性來(lái)確定該兩個(gè)實(shí)體之間的相關(guān)性水平。例如,排名模塊18可以確定如果兩個(gè)實(shí)體二者都與第三方實(shí)體高度相似,則該兩個(gè)實(shí)體高度相似,即使基于執(zhí)行上文所討論的組合器技術(shù)兩個(gè)實(shí)體具有相對(duì)低的相似性度量。
為此,排名模塊18可以生成特征-實(shí)體二分圖(關(guān)于圖3a-3c進(jìn)行更詳細(xì)地描述),其中特征和實(shí)體都被表示為節(jié)點(diǎn)。具體地,該圖可包括多個(gè)節(jié)點(diǎn),其包括表示多個(gè)特征的特征節(jié)點(diǎn)以及表示多個(gè)實(shí)體的實(shí)體節(jié)點(diǎn)。圖中的實(shí)體節(jié)點(diǎn)中的每一個(gè)可經(jīng)由均具有邊權(quán)重的一個(gè)或多個(gè)邊來(lái)連接至該特征節(jié)點(diǎn)中的一個(gè)或多個(gè),其中如果由該實(shí)體節(jié)點(diǎn)表示的實(shí)體與由該特征節(jié)點(diǎn)表示的特征相關(guān)聯(lián),則該實(shí)體節(jié)點(diǎn)可連接至該特征節(jié)點(diǎn)。
排名模塊18可以將由排名模塊18生成的特征-實(shí)體二分圖的指示作為數(shù)據(jù)來(lái)存儲(chǔ)到圖數(shù)據(jù)存儲(chǔ)52b中,其可包括一個(gè)或多個(gè)數(shù)據(jù)結(jié)構(gòu),諸如陣列、數(shù)據(jù)庫(kù)記錄、寄存器等。例如,排名模塊18可以將指示多個(gè)特征節(jié)點(diǎn)、多個(gè)實(shí)體節(jié)點(diǎn)、將每個(gè)實(shí)體節(jié)點(diǎn)連接到所述特征節(jié)點(diǎn)中的一個(gè)或多個(gè)的一個(gè)或多個(gè)邊、該一個(gè)或多個(gè)邊的邊權(quán)重等的數(shù)據(jù)存儲(chǔ)到圖數(shù)據(jù)存儲(chǔ)52b中。在一個(gè)示例中,對(duì)于特征-實(shí)體二分圖的每個(gè)實(shí)體節(jié)點(diǎn),排名模塊18可將以下存儲(chǔ)到圖數(shù)據(jù)存儲(chǔ)52b中:指示該實(shí)體節(jié)點(diǎn)所表示的實(shí)體的數(shù)據(jù)、指示連接到該實(shí)體節(jié)點(diǎn)的一個(gè)或多個(gè)特征節(jié)點(diǎn)的數(shù)據(jù)、和/或?qū)⒃搶?shí)體節(jié)點(diǎn)連接至該一個(gè)或多個(gè)特征節(jié)點(diǎn)中的每一個(gè)的一個(gè)或多個(gè)邊的邊權(quán)重的值。類似地,對(duì)于特征-實(shí)體二分圖的每個(gè)特征節(jié)點(diǎn),排名模塊18可以將指示特征節(jié)點(diǎn)所表示的特征的數(shù)據(jù)存儲(chǔ)在圖數(shù)據(jù)存儲(chǔ)52b中。
貫穿本公開(kāi),術(shù)語(yǔ)特征-實(shí)體二分圖或者圖可以與存儲(chǔ)在圖數(shù)據(jù)存儲(chǔ)52b中的指示該特征-實(shí)體二分圖的數(shù)據(jù)同義。換言之,盡管本公開(kāi)可以在特征-實(shí)體二分圖上描述由模塊16和18執(zhí)行的操作,但是應(yīng)當(dāng)理解,模塊16和18實(shí)際上可在指示特征-實(shí)體二分圖的圖數(shù)據(jù)存儲(chǔ)52b中所存儲(chǔ)的數(shù)據(jù)上進(jìn)行操作,該數(shù)據(jù)諸如特征節(jié)點(diǎn)、實(shí)體節(jié)點(diǎn)、邊、邊權(quán)重、實(shí)體節(jié)點(diǎn)中的每一個(gè)與特征節(jié)點(diǎn)中的一個(gè)或多個(gè)之間經(jīng)由邊的連接等,其可組成該特征-實(shí)體二分圖。
將實(shí)體節(jié)點(diǎn)連接到特征節(jié)點(diǎn)的每個(gè)邊可以具有邊權(quán)重,該邊權(quán)重對(duì)應(yīng)于特征節(jié)點(diǎn)所表示的特征的特征權(quán)重,該特征節(jié)點(diǎn)與所連接的實(shí)體節(jié)點(diǎn)所表示的實(shí)體相關(guān)聯(lián),如上面關(guān)于特征再加權(quán)所討論。在某些示例中,在圖中,實(shí)體節(jié)點(diǎn)可不連接至其他實(shí)體節(jié)點(diǎn),并且特征節(jié)點(diǎn)可不連接至其他特征節(jié)點(diǎn)。如果實(shí)體的特征出現(xiàn)在多個(gè)特征類別中,則排名模塊18可以將那些特征疊縮為由連接到表示該實(shí)體的實(shí)體節(jié)點(diǎn)的單個(gè)特征節(jié)點(diǎn)所表示的單個(gè)特征。例如,排名模塊18可將對(duì)于特定實(shí)體被歸類為查詢特征類別和標(biāo)題特征類別二者的特征“電影(movie)”疊縮為由單個(gè)特征節(jié)點(diǎn)表示的單個(gè)特征,并且可以將兩個(gè)特征中該特征的特征權(quán)重合計(jì)為將實(shí)體節(jié)點(diǎn)連接至特征節(jié)點(diǎn)的邊的單個(gè)邊權(quán)重中,從而減小了特征維度并減輕了特征稀疏性問(wèn)題。
從概念上來(lái)講,排名模塊18可以確定一對(duì)實(shí)體的相關(guān)性,諸如源實(shí)體s和目標(biāo)實(shí)體t之間的相關(guān)性為
換言之,兩個(gè)實(shí)體節(jié)點(diǎn)可以因?yàn)樗麄兌歼B接到相同的特征節(jié)點(diǎn)而在圖中處于彼此的直接鄰域內(nèi)。然而,基于源實(shí)體和目標(biāo)實(shí)體的特征之間的相似性連同由處于表示源實(shí)體和目標(biāo)實(shí)體的實(shí)體節(jié)點(diǎn)的鄰域內(nèi)的實(shí)體節(jié)點(diǎn)表示的另一實(shí)體的特征一起,排名模塊18仍然可以確定兩個(gè)實(shí)體相關(guān),即使它們的相應(yīng)實(shí)體節(jié)點(diǎn)并不處于彼此的直接鄰域內(nèi)。因此,對(duì)于特定的源實(shí)體,即使表示該源實(shí)體和目標(biāo)實(shí)體的實(shí)體節(jié)點(diǎn)沒(méi)有連接至相同的特征節(jié)點(diǎn),只要表示該源實(shí)體和該目標(biāo)實(shí)體的實(shí)體節(jié)點(diǎn)與處于表示該源實(shí)體和目標(biāo)實(shí)體的實(shí)體節(jié)點(diǎn)鄰域內(nèi)的實(shí)體節(jié)點(diǎn)所表示的另一實(shí)體相關(guān),排名模塊18就可確定該源實(shí)體與目標(biāo)實(shí)體相關(guān)。
在生成了特征-實(shí)體二分圖后,排名模塊18可以執(zhí)行標(biāo)簽傳播來(lái)跨特征-實(shí)體二分圖傳播標(biāo)簽,以將標(biāo)簽的分布與該多個(gè)節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)相關(guān)聯(lián),使得圖中的每個(gè)節(jié)點(diǎn)可以與標(biāo)簽的分布相關(guān)聯(lián)。因此,作為標(biāo)簽傳播的結(jié)果,圖中的每個(gè)特征節(jié)點(diǎn)和每個(gè)實(shí)體節(jié)點(diǎn)可與標(biāo)簽的分布相關(guān)聯(lián)。如上所討論,跨特征-實(shí)體二分圖來(lái)執(zhí)行標(biāo)簽傳播可包括排名模塊18在指示特征-實(shí)體二分圖的圖數(shù)據(jù)存儲(chǔ)52b中的數(shù)據(jù)存儲(chǔ)上操作,以執(zhí)行標(biāo)簽傳播。
排名模塊18跨圖來(lái)傳播的標(biāo)簽中的每一個(gè)可指示被表示為該圖中的節(jié)點(diǎn)的實(shí)體中的一個(gè),使得與該圖中的節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽的分布可以是與該特定節(jié)點(diǎn)所表示的實(shí)體或特征相關(guān)的一個(gè)或多個(gè)實(shí)體的分布。此外,與圖中的節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽的分布可以指示在一個(gè)或多個(gè)實(shí)體的分布中的一個(gè)或多個(gè)實(shí)體中的每個(gè)實(shí)體與由該特定節(jié)點(diǎn)表示的實(shí)體或特征的相關(guān)性水平,使得與圖中的節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽的分布可以是與由特定實(shí)體節(jié)點(diǎn)或特征節(jié)點(diǎn)所表示的實(shí)體或特征相關(guān)的一個(gè)或多個(gè)實(shí)體的相關(guān)性排名的指示。
為了發(fā)起跨特征-實(shí)體二分圖的標(biāo)簽傳播,排名模塊18可以通過(guò)利用多個(gè)標(biāo)簽中的一個(gè)對(duì)多個(gè)實(shí)體節(jié)點(diǎn)中的每一個(gè)進(jìn)行播種來(lái)將標(biāo)簽與每個(gè)實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)。初始與實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的這樣的標(biāo)簽可以被稱為種子標(biāo)簽。與特定實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽可以標(biāo)識(shí)由該實(shí)體節(jié)點(diǎn)表示的實(shí)體,使得排名模塊18所播種的標(biāo)簽中的每一個(gè)標(biāo)簽可以標(biāo)識(shí)實(shí)體節(jié)點(diǎn)中的對(duì)應(yīng)實(shí)體節(jié)點(diǎn)。每個(gè)標(biāo)簽可以是身份標(biāo)簽,使得實(shí)體可以是其自身的相關(guān)標(biāo)簽。因此,表示實(shí)體a的實(shí)體節(jié)點(diǎn)可以與“實(shí)體a”的標(biāo)簽相關(guān)聯(lián),其可以是關(guān)聯(lián)的實(shí)體的標(biāo)題。
排名模塊18可以執(zhí)行標(biāo)簽傳播,以跨圖來(lái)傳播與該實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽,使得每個(gè)節(jié)點(diǎn)可以與標(biāo)簽中的一個(gè)或多個(gè)的分布相關(guān)聯(lián)。為了執(zhí)行標(biāo)簽傳播,排名模塊18可以將與圖的每個(gè)節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽的分布確定為使目標(biāo)函數(shù)最小化的最優(yōu)解。
給定特征-實(shí)體二分圖,目標(biāo)函數(shù)可以同時(shí)在圖中全部節(jié)點(diǎn)上的使以下最小化:真實(shí)和誘導(dǎo)(induced)的標(biāo)簽分布之間的平方損失、懲罰具有與該實(shí)體節(jié)點(diǎn)不同的標(biāo)簽分布的相鄰特征節(jié)點(diǎn)的正則項(xiàng)(regularizationterm)、以及將所誘導(dǎo)的標(biāo)簽分布向在先的分布平滑的正則項(xiàng),其在實(shí)踐中通常是均勻分布。
更具體地,對(duì)于具有其特征鄰居
因此,在此示例中,
此外,μnp可以是懲罰相鄰特征節(jié)點(diǎn)的第一正則項(xiàng),該相鄰特征節(jié)點(diǎn)關(guān)聯(lián)于與實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽分布不同的標(biāo)簽分布,其中
對(duì)于具有其實(shí)體鄰居
通過(guò)執(zhí)行標(biāo)簽傳播,排名模塊18可以將圖的實(shí)體節(jié)點(diǎn)和特征節(jié)點(diǎn)的標(biāo)簽分布確定為使整個(gè)圖上的目標(biāo)函數(shù)最小化的最佳解。因此,盡管排名模塊18可能沒(méi)有使每個(gè)個(gè)體實(shí)體節(jié)點(diǎn)或特征節(jié)點(diǎn)的目標(biāo)函數(shù)最小化,但是排名模塊18可以使構(gòu)成圖的特征節(jié)點(diǎn)和實(shí)體節(jié)點(diǎn)的總體目標(biāo)函數(shù)最小化。
排名模塊18可以執(zhí)行無(wú)監(jiān)督機(jī)器學(xué)習(xí),以執(zhí)行本文所討論的標(biāo)簽傳播。具體地,給定其中多個(gè)實(shí)體節(jié)點(diǎn)經(jīng)由具有關(guān)聯(lián)的邊權(quán)重的邊來(lái)連接至多個(gè)特征節(jié)點(diǎn)的特征-實(shí)體二分圖,其中多個(gè)實(shí)體節(jié)點(diǎn)利用多個(gè)標(biāo)簽來(lái)被播種,排名模塊18可以以多次迭代(例如,5次迭代)執(zhí)行標(biāo)簽傳播而無(wú)需附加輸入,以對(duì)于該圖的每個(gè)節(jié)點(diǎn)確定標(biāo)簽分布來(lái)最小化上述的目標(biāo)函數(shù)。
通過(guò)執(zhí)行標(biāo)簽傳播,排名模塊18可以將標(biāo)簽的分布與圖中的每個(gè)節(jié)點(diǎn)相關(guān)聯(lián)。與節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽分布中的每一個(gè)可包括與相關(guān)聯(lián)的實(shí)體節(jié)點(diǎn)或特征節(jié)點(diǎn)所表示的實(shí)體或特征相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示。由于圖中的每個(gè)標(biāo)簽可以標(biāo)識(shí)實(shí)體節(jié)點(diǎn)所表示的特定實(shí)體,因此與節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽的分布可以指示與該節(jié)點(diǎn)所表示的特定特征或?qū)嶓w相關(guān)的一個(gè)或多個(gè)實(shí)體的實(shí)體名稱。此外,與節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽分布還可指示實(shí)體與該節(jié)點(diǎn)所表示的特定特征或?qū)嶓w的相關(guān)性水平。這樣,標(biāo)簽的分布可以指示與相關(guān)聯(lián)的實(shí)體節(jié)點(diǎn)或特征節(jié)點(diǎn)所表示的實(shí)體或特征相關(guān)的一個(gè)或多個(gè)實(shí)體的排名。排名模塊18可以將圖中所表示的每個(gè)實(shí)體和每個(gè)特征的指示存儲(chǔ)到排名數(shù)據(jù)存儲(chǔ)52c中,包括與該實(shí)體或特征相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示(通過(guò)相關(guān)性水平)。
因此,iss14可以經(jīng)由網(wǎng)絡(luò)12或互聯(lián)網(wǎng)20從例如計(jì)算設(shè)備2接收指示實(shí)體或者特征的指示的輸入數(shù)據(jù),根據(jù)存儲(chǔ)在排名數(shù)據(jù)存儲(chǔ)52c中的數(shù)據(jù)來(lái)確定與該實(shí)體或特征相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示,并且將包括與特定實(shí)體或特征相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示的傳出數(shù)據(jù)傳送至計(jì)算設(shè)備2。在一個(gè)示例中,對(duì)iss14從計(jì)算設(shè)備2接收的實(shí)體的指示可以指示與該實(shí)體相關(guān)聯(lián)的名稱,諸如“milesdavis”或者“beethoven’s5thsymphony”。排名模塊18可以利用與該實(shí)體相關(guān)聯(lián)的名稱來(lái)在排名數(shù)據(jù)存儲(chǔ)52c中進(jìn)行索引,以找出與該名稱相關(guān)聯(lián)的實(shí)體,并且可以確定排名數(shù)據(jù)存儲(chǔ)52c內(nèi)、與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示被存儲(chǔ)的位置。排名模塊18可以檢索與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示。iss14可將與該特定實(shí)體相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的所檢索的指示格式化為任何合適的結(jié)構(gòu)化數(shù)據(jù)格式——諸如json或者xml以用于傳送該一個(gè)或多個(gè)實(shí)體的排名的指示,并且可諸如經(jīng)由網(wǎng)絡(luò)12或互聯(lián)網(wǎng)20將該一個(gè)或多個(gè)實(shí)體的指示輸出至計(jì)算設(shè)備2。
在另一個(gè)示例中,iss14可以從例如計(jì)算設(shè)備2接收指示查詢的傳入數(shù)據(jù)。查詢可以是文本數(shù)據(jù),諸如詞、短語(yǔ)等,計(jì)算設(shè)備2可以接收該查詢以作為輸入。例如,查詢可以是對(duì)于與查詢相關(guān)的一個(gè)或多個(gè)實(shí)體的搜索短語(yǔ)。響應(yīng)于接收對(duì)該查詢的指示,計(jì)算設(shè)備2可經(jīng)由排名模塊18來(lái)確定與該查詢相關(guān)的一個(gè)或多個(gè)實(shí)體的排名,并且可將與該查詢相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示輸出至計(jì)算設(shè)備2。
給定諸如“馬拉松”的對(duì)查詢的指示,排名模塊18可確定與該查詢相關(guān)的一個(gè)或多個(gè)實(shí)體的排名。排名模塊18可以將該查詢視為特征,諸如通過(guò)將該查詢的文本映射到特征的文本,從而確定
圖3a-3c是均圖示了示例特征-實(shí)體二分圖的框圖,排名模塊18可以構(gòu)造該特征-實(shí)體二分圖來(lái)執(zhí)行根據(jù)本公開(kāi)的方面的擴(kuò)展器技術(shù)。如圖3a所示,排名模塊18可以生成包括經(jīng)由邊86a-86f所連接的連接至特征節(jié)點(diǎn)84d-84f的實(shí)體節(jié)點(diǎn)84a和84b的特征-實(shí)體二分圖80。排名模塊18可以分別利用標(biāo)簽88a和88b來(lái)對(duì)實(shí)體節(jié)點(diǎn)82a和84b進(jìn)行播種。邊86a-6f中的每一個(gè)可以具有相關(guān)聯(lián)的邊權(quán)重(未示出)。
排名模塊18可以通過(guò)運(yùn)用標(biāo)簽傳播的構(gòu)思來(lái)在圖90上執(zhí)行機(jī)器學(xué)習(xí),所述標(biāo)簽傳播是基于圖的學(xué)習(xí)技術(shù),其使用與每個(gè)標(biāo)簽的種子節(jié)點(diǎn)相關(guān)聯(lián)的信息并且以有原則且迭代的方式將這些標(biāo)簽在該圖上傳播。標(biāo)簽傳播可利用兩個(gè)輸入源:圖80以及種子標(biāo)簽88a和88b。排名模塊8可以基于圖80上的所提供的圖結(jié)構(gòu)來(lái)對(duì)種子標(biāo)簽88a和88b進(jìn)行傳播,以將圖80中的節(jié)點(diǎn)84a-84f中的每一個(gè)的種子標(biāo)簽的分布關(guān)聯(lián)為使目標(biāo)函數(shù)最小化的最優(yōu)解。
排名模塊18可以以多個(gè)迭代來(lái)執(zhí)行標(biāo)簽傳播,以將圖80中的節(jié)點(diǎn)84a-84f中的每一個(gè)的種子標(biāo)簽的分布關(guān)聯(lián)為使目標(biāo)函數(shù)最小化的最優(yōu)解。圖3b示出了在圖80上的標(biāo)簽傳播的第一迭代。如圖3b所示,在標(biāo)簽傳播的第一迭代之后,排名模塊18可以分別將標(biāo)簽82a-82f的分布與節(jié)點(diǎn)84a-84f相關(guān)聯(lián)。排名模塊88還可跨圖80來(lái)分發(fā)標(biāo)簽88a和88b,使得標(biāo)簽8a-82f的分布可以包括標(biāo)簽88a和88b中的一個(gè)或二者的指示。標(biāo)簽的每個(gè)分布可包括對(duì)一個(gè)或多個(gè)相關(guān)實(shí)體的指示以及由節(jié)點(diǎn)表示的實(shí)體或特征與該一個(gè)或多個(gè)相關(guān)實(shí)體中的每一個(gè)之間的相關(guān)性水平的指示。例如,與特征節(jié)點(diǎn)84d相關(guān)聯(lián)的標(biāo)簽82d的分布包括實(shí)體sciencefictionmovies(科幻電影)和scienceficitonfilms(科幻影片)的指示,并且包括那些實(shí)體和與特征節(jié)點(diǎn)84d相關(guān)聯(lián)的特征之間的、在0到1.0數(shù)值范圍上的相關(guān)性的指示,其中較大的分值指示較高的相似性水平。
排名模塊18可以進(jìn)一步在圖80上迭代執(zhí)行標(biāo)簽傳播。圖3c示出了在圖80上的標(biāo)簽傳播的進(jìn)一步迭代。如圖3c所示,在場(chǎng)傳播的進(jìn)一步迭代之后,排名模塊18可以進(jìn)一步修改與節(jié)點(diǎn)84a-84f中的一個(gè)或多個(gè)相關(guān)聯(lián)的標(biāo)簽分布,以確定使圖80上的目標(biāo)函數(shù)最小化的優(yōu)化解。例如,節(jié)點(diǎn)82c的分布現(xiàn)在包括實(shí)體sciencefictionmovies和scienceficitonfilms的指示,并且包括與特征節(jié)點(diǎn)84d關(guān)聯(lián)的那些實(shí)體和特征之間在0到1.0比例上的相關(guān)性指示,其中分值越大表示相似性水平越高。
圖4是圖示根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面的、用以確定相關(guān)實(shí)體的示例過(guò)程的流程圖。在某些示例中,該過(guò)程可由圖1和2所示的iss14、實(shí)體模塊16、以及排名模塊18中的一個(gè)或多個(gè)來(lái)執(zhí)行。在某些示例中,該過(guò)程可利用圖1-2所示的附加模塊或組件來(lái)執(zhí)行。僅僅出于說(shuō)明的目的,在一個(gè)示例中,該過(guò)程由圖2中所示的iss14來(lái)執(zhí)行。如圖4所示,該過(guò)程可包括由排名模塊18生成包括多個(gè)節(jié)點(diǎn)的圖,諸如圖80,其中該多個(gè)節(jié)點(diǎn)包括表示多個(gè)實(shí)體的多個(gè)實(shí)體節(jié)點(diǎn)以及表示多個(gè)特征的多個(gè)特征節(jié)點(diǎn),并且其中該多個(gè)實(shí)體節(jié)點(diǎn)中的每一個(gè)在圖中連接至該多個(gè)特征節(jié)點(diǎn)中的一個(gè)或多個(gè)上(102)。該過(guò)程進(jìn)一步包括由排名模塊18執(zhí)行標(biāo)簽傳播來(lái)跨圖傳播多個(gè)標(biāo)簽,以將標(biāo)簽的分布與該多個(gè)節(jié)點(diǎn)中的每一個(gè)相關(guān)聯(lián)(104)。在某些示例中,iss14可以被配置來(lái)接收感興趣特征或感興趣實(shí)體中的至少一個(gè)的指示。在某些示例中,iss14可以被配置來(lái)輸出與該感興趣特征或該感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)相關(guān)實(shí)體的指示。
在某些示例中,該過(guò)程可進(jìn)一步包括由排名模塊18利用該多個(gè)標(biāo)簽中的相應(yīng)標(biāo)簽對(duì)該多個(gè)實(shí)體節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)進(jìn)行播種,其中該標(biāo)簽中的每個(gè)標(biāo)簽標(biāo)識(shí)該多個(gè)實(shí)體節(jié)點(diǎn)中的對(duì)應(yīng)節(jié)點(diǎn)。在某些示例中,執(zhí)行標(biāo)簽傳播可進(jìn)一步包括由排名模塊18執(zhí)行標(biāo)簽傳播,以將與該多個(gè)節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽的分布確定為使目標(biāo)函數(shù)最小化的最優(yōu)解。
在某些示例中,該多個(gè)特征節(jié)點(diǎn)的針對(duì)實(shí)體節(jié)點(diǎn)的目標(biāo)函數(shù)被最小化,并且其中該目標(biāo)函數(shù)包括:與實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的真實(shí)標(biāo)簽分布和與該實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的經(jīng)學(xué)習(xí)標(biāo)簽分布之間的平方損失;懲罰相鄰特征節(jié)點(diǎn)的第一正則項(xiàng),該相鄰特征節(jié)點(diǎn)關(guān)聯(lián)于與該實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽分布不同的標(biāo)簽分布;以及將與該實(shí)體節(jié)點(diǎn)相關(guān)聯(lián)的經(jīng)學(xué)習(xí)標(biāo)簽分布向在先的標(biāo)簽分布平滑的第二正則項(xiàng)。
在某些示例中,該多個(gè)特征節(jié)點(diǎn)的針對(duì)特征節(jié)點(diǎn)的目標(biāo)函數(shù)被最小化,并且其中該目標(biāo)函數(shù)包括:懲罰相鄰實(shí)體節(jié)點(diǎn)的第一正則項(xiàng),該相鄰實(shí)體節(jié)點(diǎn)關(guān)聯(lián)于與該特征節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽分布不同的標(biāo)簽分布;以及將與該特征節(jié)點(diǎn)相關(guān)聯(lián)的經(jīng)學(xué)習(xí)標(biāo)簽分布向在先的標(biāo)簽分布平滑的第二正則項(xiàng)。
在某些示例中,標(biāo)簽分布中的每一個(gè)包括與關(guān)聯(lián)的實(shí)體節(jié)點(diǎn)或特征節(jié)點(diǎn)所表示的實(shí)體或特征相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示。在某些示例中,與關(guān)聯(lián)的節(jié)點(diǎn)所表示的實(shí)體或特征相關(guān)的一個(gè)或多個(gè)實(shí)體的排名的指示包括:該一個(gè)或多個(gè)實(shí)體中的每一個(gè)與關(guān)聯(lián)的實(shí)體節(jié)點(diǎn)或特征節(jié)點(diǎn)所表示的實(shí)體或特征的相關(guān)性水平的指示。
在某些示例中,該過(guò)程進(jìn)一步包括由排名模塊18經(jīng)由圖的一個(gè)或多個(gè)邊來(lái)將圖中表示對(duì)應(yīng)實(shí)體的多個(gè)實(shí)體節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)和圖中表示與該對(duì)應(yīng)實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)特征的多個(gè)特征節(jié)點(diǎn)中的一個(gè)或多個(gè)特征節(jié)點(diǎn)連接。在某些示例中,該過(guò)程可進(jìn)一步包括由排名模塊18將一個(gè)或多個(gè)權(quán)重關(guān)聯(lián)至該一個(gè)或多個(gè)邊。
在某些示例中,該過(guò)程可進(jìn)一步包括由實(shí)體模塊16從與該多個(gè)實(shí)體相關(guān)聯(lián)的多個(gè)互聯(lián)網(wǎng)資源提取與該多個(gè)實(shí)體相關(guān)聯(lián)的多個(gè)特征。在某些示例中,該多個(gè)實(shí)體與相同地理區(qū)域相關(guān)聯(lián)。
圖5是圖示根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面的、用以確定相關(guān)實(shí)體的示例過(guò)程的流程圖。在某些示例中,該過(guò)程可由圖1和2中所示的iss14、實(shí)體模塊16、以及排名模塊18中的一個(gè)或多個(gè)來(lái)執(zhí)行。在某些示例中,該過(guò)程可利用圖1-2所示的附加模塊或組件來(lái)執(zhí)行。僅僅出于說(shuō)明的目的,在一個(gè)示例中,該過(guò)程由圖2所示的iss14來(lái)執(zhí)行。如圖5所示,該過(guò)程可包括由iss14的通信單元46接收感興趣特征或感興趣實(shí)體中的至少一個(gè)的指示(202)。該過(guò)程可進(jìn)一步包括:由iss14的一個(gè)或多個(gè)處理器44至少部分地基于圖中表示該感興趣特征的多個(gè)特征節(jié)點(diǎn)中的一個(gè)或者圖中表示該感興趣實(shí)體的多個(gè)實(shí)體節(jié)點(diǎn)中的一個(gè)相關(guān)聯(lián)的相應(yīng)標(biāo)簽分布,來(lái)確定與該感興趣特征或感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)相關(guān)實(shí)體,其中該圖包括多個(gè)節(jié)點(diǎn),其中該多個(gè)節(jié)點(diǎn)包括表示多個(gè)實(shí)體的多個(gè)實(shí)體節(jié)點(diǎn)以及表示多個(gè)特征的多個(gè)特征節(jié)點(diǎn),并且其中該多個(gè)實(shí)體節(jié)點(diǎn)中的每一個(gè)在圖中連接到該多個(gè)特征節(jié)點(diǎn)中的一個(gè)或多個(gè)上,并且其中多個(gè)標(biāo)簽經(jīng)由標(biāo)簽傳播來(lái)跨圖上傳播,以將標(biāo)簽分布與多個(gè)節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)相關(guān)聯(lián)(204)。該過(guò)程可進(jìn)一步包括:對(duì)于該感興趣特征或感興趣實(shí)體中的至少一個(gè)、由iss14的通信單元46輸出與該感興趣特征或感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)相關(guān)實(shí)體的指示,其中輸出該一個(gè)或多個(gè)相關(guān)實(shí)體的指示至少部分地基于與表示感興趣特征的多個(gè)特征節(jié)點(diǎn)中的一個(gè)或表示感興趣實(shí)體的多個(gè)實(shí)體節(jié)點(diǎn)中的一個(gè)相關(guān)聯(lián)的相應(yīng)標(biāo)簽分布(206)。
在某些示例中,接收該感興趣特征或該感興趣實(shí)體中的至少一個(gè)的指示進(jìn)一步包括由iss14經(jīng)由網(wǎng)絡(luò)12從遠(yuǎn)程計(jì)算設(shè)備2接收指示該感興趣特征或該感興趣實(shí)體中的至少一個(gè)的傳入數(shù)據(jù),并且對(duì)于該感興趣特征或感興趣實(shí)體中的至少一個(gè),由iss14輸出與該感興趣特征或感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)相關(guān)實(shí)體的指示進(jìn)一步包括由iss14經(jīng)由網(wǎng)絡(luò)12向遠(yuǎn)程計(jì)算設(shè)備2傳送傳出數(shù)據(jù),該傳出數(shù)據(jù)包括與該感興趣特征或該感興趣實(shí)體相關(guān)的一個(gè)或多個(gè)相關(guān)實(shí)體的指示。
在一個(gè)或多個(gè)示例中,所描述的功能可以以硬件、軟件、固件或其任何組合中實(shí)施。如果以軟件實(shí)現(xiàn),則所述功能可以作為一個(gè)或多個(gè)指令或代碼被存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上或者通過(guò)計(jì)算機(jī)可讀介質(zhì)傳送,并由基于硬件的處理單元來(lái)執(zhí)行。計(jì)算機(jī)可讀介質(zhì)可包括:一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)媒介或介質(zhì),其對(duì)應(yīng)于諸如數(shù)據(jù)存儲(chǔ)介質(zhì)的有形介質(zhì),或者通信介質(zhì),其包括例如根據(jù)通信協(xié)議來(lái)促進(jìn)計(jì)算機(jī)程序從一個(gè)地點(diǎn)傳送至另一個(gè)地點(diǎn)的任何介質(zhì)。這樣,計(jì)算機(jī)可讀介質(zhì)通??蓪?duì)應(yīng)于:(1)非暫時(shí)性的有形計(jì)算機(jī)可讀存儲(chǔ)介質(zhì);或者(2)諸如信號(hào)或載波的通信介質(zhì)。數(shù)據(jù)存儲(chǔ)介質(zhì)可以是任何可用介質(zhì),其可由一個(gè)或多個(gè)計(jì)算機(jī)或者一個(gè)或多個(gè)處理器來(lái)訪問(wèn)以檢索指令、代碼和/或數(shù)據(jù)結(jié)構(gòu),以用于實(shí)現(xiàn)本公開(kāi)所述的技術(shù)。計(jì)算機(jī)程序產(chǎn)品可包括計(jì)算機(jī)可讀介質(zhì)。
作為示例而非限制,這樣的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可包括ram、rom、eeprom、cd-rom或者其他光盤存儲(chǔ)、磁盤存儲(chǔ)、或者其他磁存儲(chǔ)設(shè)備、閃存、或者可用于以指令或數(shù)據(jù)結(jié)構(gòu)的形式存儲(chǔ)期望的程序代碼并可由計(jì)算機(jī)訪問(wèn)的任何其他存儲(chǔ)介質(zhì)。此外,任何連接被適當(dāng)?shù)胤Q為計(jì)算機(jī)可讀介質(zhì)。例如,如果使用同軸線纜、光纖線纜、雙絞線、數(shù)字訂戶線路(dsl)、或者諸如紅外、無(wú)線電、以及微波的無(wú)線技術(shù)從網(wǎng)站、服務(wù)器或者其它遠(yuǎn)程源傳送指令,則同軸線纜、光纖線纜、雙絞線、dsl或者諸如紅外、無(wú)線電、以及微波的無(wú)線技術(shù)包括在介質(zhì)的定義中。然而,應(yīng)當(dāng)理解,計(jì)算機(jī)可讀存儲(chǔ)媒介、介質(zhì)以及數(shù)據(jù)存儲(chǔ)介質(zhì)不包括連接、載波、信號(hào)或其他變換介質(zhì),而是涉及非暫時(shí)性的、有形存儲(chǔ)介質(zhì)。本文所使用的磁盤或者光盤包括壓縮盤(cd)、激光盤、光盤、數(shù)字多功能盤(dvd)、軟盤和藍(lán)光盤(blu-raydics),其中磁盤通常以磁方式來(lái)再現(xiàn)數(shù)據(jù),而光盤利用激光來(lái)以光學(xué)方式再現(xiàn)數(shù)據(jù)。以上的組合應(yīng)當(dāng)也應(yīng)當(dāng)被包括在計(jì)算機(jī)可讀取介質(zhì)的范圍內(nèi)。
指令可由一個(gè)或多個(gè)處理器來(lái)執(zhí)行,諸如一個(gè)或多個(gè)數(shù)字信號(hào)處理器(dsp)、通用微處理器、專用集成電路(asic)、現(xiàn)場(chǎng)可編程邏輯陣列(fpga)、或者其他等效的集成或分離邏輯電路。因此,本文所使用的術(shù)語(yǔ)“處理器”可以指代前述結(jié)構(gòu)中的任一或者適合實(shí)現(xiàn)本文所述的技術(shù)的任何其他結(jié)構(gòu)。此外,在某些方面,本文所述的功能可以在專用硬件和/或軟件模塊中提供。此外,所述技術(shù)可以完全在一個(gè)或多個(gè)電路或者邏輯元件中實(shí)現(xiàn)。
本公開(kāi)的技術(shù)可以以廣泛多種設(shè)備或裝置實(shí)現(xiàn),包括無(wú)線送受話器、集成電路(ic)或者ic集合(例如芯片組)。本公開(kāi)中描述了各個(gè)組件、模塊、或單元以強(qiáng)調(diào)被配置來(lái)實(shí)現(xiàn)所公開(kāi)技術(shù)的設(shè)備的功能方面,而無(wú)需通過(guò)不同的硬件單元實(shí)現(xiàn)。相反,如上所述,各種單元可以被組合在硬件單元中,或者由協(xié)作硬件單元的集合來(lái)提供,包括與合適的軟件和/或固件結(jié)合的上述的一個(gè)或多個(gè)處理器。
已經(jīng)描述了各個(gè)實(shí)施例。這些以及其他實(shí)施例均落入所附權(quán)利要求書的范圍內(nèi)。