專(zhuān)利名稱:跨語(yǔ)言搜索的制作方法
技術(shù)領(lǐng)域:
本公開(kāi)涉及跨語(yǔ)言搜索。
背景技術(shù):
以某些語(yǔ)言(例如,英語(yǔ))寫(xiě)的網(wǎng)頁(yè)的數(shù)量可能遠(yuǎn)大于以其它語(yǔ)言寫(xiě)的網(wǎng)頁(yè)的數(shù) 量。這種差異在很大程度上應(yīng)歸于說(shuō)某些語(yǔ)言的人的數(shù)量以及在說(shuō)那些語(yǔ)言的國(guó)家中技術(shù) 的寬泛可用性。此外,與其它語(yǔ)言的頁(yè)面相比,這樣的頁(yè)面通常被更好地維護(hù),并且能夠提 供與許多主題有關(guān)的更精確和最新的信息。因此,說(shuō)在web上未廣泛使用的語(yǔ)言的人仍然 可能對(duì)在其它語(yǔ)言(例如,英語(yǔ))可用的網(wǎng)頁(yè)上找到的信息感興趣。因此,由于相關(guān)結(jié)果甚 至可能不存在于搜索者的語(yǔ)言中,所以搜索以用來(lái)提交搜索查詢的語(yǔ)言寫(xiě)的網(wǎng)頁(yè)可能不一 定滿足搜索者的查詢。例如,在埃及的人有時(shí)對(duì)與到中東以外的地方旅游、在國(guó)外大學(xué)學(xué)習(xí)或了解著名 的非埃及的人有關(guān)的信息感興趣。然而,可能沒(méi)有多少以用來(lái)提交查詢的語(yǔ)言的即用戶的 本國(guó)語(yǔ)的與這些主題有關(guān)的頁(yè)面。此外,由于頁(yè)面的作者對(duì)這樣的主題可能沒(méi)有充足的訪 問(wèn),所以以用戶的本國(guó)語(yǔ)的頁(yè)面可能是相對(duì)低質(zhì)量的。額外地,由于用戶不會(huì)說(shuō)另一種語(yǔ) 言,所以這樣的用戶可能不能以另一種語(yǔ)言發(fā)出查詢。因此,這些用戶可能不能找到相關(guān)和 /或優(yōu)質(zhì)內(nèi)容。
發(fā)明內(nèi)容
總的來(lái)說(shuō),在本說(shuō)明書(shū)中描述的主題的一個(gè)方面可以被實(shí)現(xiàn)在包括輸入模塊、評(píng) 估模塊和輸出模塊的系統(tǒng)中。輸入模塊可以接收第一語(yǔ)言的原始搜索查詢,原始搜索查詢 是對(duì)與原始搜索相關(guān)的文檔的請(qǐng)求。評(píng)估模塊可以接收與來(lái)自原始搜索查詢的結(jié)果相關(guān)聯(lián) 的相關(guān)性分值的第一集合和與來(lái)自第二語(yǔ)言的翻譯的搜索查詢的結(jié)果相關(guān)聯(lián)的相關(guān)性分 值的第二集合。評(píng)估模塊可以對(duì)相關(guān)性分值的第一和第二集合進(jìn)行比較以確定是原始搜 索查詢還是翻譯的搜索查詢產(chǎn)生最相關(guān)的結(jié)果。輸出模塊可以基于是原始搜索查詢還是翻 譯的查詢具有最相關(guān)的結(jié)果,向用戶提供包括來(lái)自原始搜索查詢的結(jié)果或來(lái)自翻譯的搜索 查詢的結(jié)果中的一個(gè)或兩者中的至少部分的搜索結(jié)果。本方面的其它實(shí)施例包括對(duì)應(yīng)的方 法、裝置和計(jì)算機(jī)程序產(chǎn)品。用于執(zhí)行跨語(yǔ)言搜索的示例方法可以包括接收第一語(yǔ)言的原始搜索查詢;獲取 與原始搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢,翻譯的搜索查詢以第二語(yǔ)言形式;基于與翻譯 的搜索查詢的結(jié)果相關(guān)聯(lián)的相關(guān)性分值、與翻譯相關(guān)聯(lián)的翻譯置信分值、或包括與第一或 第二語(yǔ)言相關(guān)聯(lián)的實(shí)體的搜索查詢,評(píng)估翻譯的搜索查詢來(lái)確定翻譯的搜索查詢是否是用于跨語(yǔ)言搜索的候選;以及基于評(píng)估的結(jié)果來(lái)派發(fā)搜索結(jié)果頁(yè)面。將在下面的附圖和描述中闡述本說(shuō)明書(shū)中描述的主題的一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)。主題的其它特征、方面和優(yōu)勢(shì)從描述、附圖和權(quán)利要求中將變得顯而易見(jiàn)。
圖IA是描述跨語(yǔ)言搜索系統(tǒng)的體系結(jié)構(gòu)的框圖。圖IB是圖示示例跨語(yǔ)言搜索系統(tǒng)的框圖。圖IC是圖示查詢?cè)u(píng)估模塊的示例實(shí)施方式的框圖。圖2是圖示查詢?cè)u(píng)估模塊的框圖。圖3是圖示另一個(gè)示例跨語(yǔ)言搜索系統(tǒng)的框圖。圖4-7是圖示評(píng)估模塊的一些實(shí)施方式的框圖。圖8-10是圖示提供跨語(yǔ)言搜索的示例過(guò)程的流程圖。在各附圖中相同的參考數(shù)字和符號(hào)指示相同的元素。
具體實(shí)施例方式在本說(shuō)明書(shū)的一些實(shí)施方式中,實(shí)現(xiàn)從客戶端設(shè)備接收搜索查詢并且確定外語(yǔ)的 網(wǎng)頁(yè)是否是對(duì)查詢的良好匹配的系統(tǒng)和方法。例如,如果在埃及的用戶輸入關(guān)于諸如美式 足球的主題的阿拉伯語(yǔ)的查詢,則可能沒(méi)有多少查詢語(yǔ)言的為該查詢提供相關(guān)結(jié)果的網(wǎng) 頁(yè)。然而,可能存在其它語(yǔ)言的相關(guān)頁(yè)面。例如,可以將來(lái)自先前示例的阿拉伯語(yǔ)的查詢翻 譯成英語(yǔ)的查詢,并且與網(wǎng)頁(yè)的英語(yǔ)索引進(jìn)行比較。如果在該示例中存在在英語(yǔ)的網(wǎng)頁(yè)中 找到的更相關(guān)的結(jié)果,則相關(guān)頁(yè)面的列表可以被翻譯并且提供給用戶。在一些實(shí)施方式中, 基于用戶從相關(guān)頁(yè)面的列表中選擇網(wǎng)頁(yè),相關(guān)網(wǎng)頁(yè)可以被翻譯并且提供給用戶。在一些實(shí) 施方式中,相關(guān)結(jié)果的列表可以包括翻譯的結(jié)果和未翻譯的結(jié)果兩者。圖IA是描述跨語(yǔ)言搜索系統(tǒng)100的體系結(jié)構(gòu)的框圖??缯Z(yǔ)言搜索系統(tǒng)100可以 接收第一語(yǔ)言的搜索查詢(Q)10a。在一些實(shí)施方式中,第一語(yǔ)言(例如,搜索語(yǔ)言)可以 基于與客戶端設(shè)備相關(guān)聯(lián)的輸入模式來(lái)識(shí)別。在其它實(shí)施方式中,第一語(yǔ)言可以基于正被 訪問(wèn)的特定國(guó)家代碼頂級(jí)域名來(lái)識(shí)別。例如,加州山景城的谷歌向許多不同的國(guó)家提供許 多不同的網(wǎng)頁(yè),以及國(guó)家代碼頂級(jí)域名可以被用來(lái)識(shí)別客戶端期望接收來(lái)自何種語(yǔ)言(或 哪些語(yǔ)言)的輸入。在這樣的示例中,如果用戶正在訪問(wèn)“google.ru”國(guó)家代碼頂級(jí)域名, 則客戶端期望接收俄語(yǔ)的輸入。在又一些實(shí)施方式中,用戶可以使用客戶端來(lái)指定第一語(yǔ) 言。例如,用戶可以使用下拉菜單來(lái)選擇多個(gè)所支持的語(yǔ)言中的一個(gè),其中用戶意欲以該語(yǔ) 言輸入搜索查詢。在一些實(shí)施方式中,跨語(yǔ)言搜索系統(tǒng)100可以將搜索查詢發(fā)送到搜索引擎20。搜 索引擎20可以接收查詢并且識(shí)別搜索結(jié)果。例如,搜索引擎20可以從文檔的索引(例如, 從網(wǎng)頁(yè)的索引)檢索相關(guān)搜索結(jié)果。搜索結(jié)果可以包括例如網(wǎng)頁(yè)標(biāo)題的列表、從那些網(wǎng) 頁(yè)提取的文本的摘錄以及指向那些網(wǎng)頁(yè)的超文本鏈接,以及可以被分組成預(yù)定數(shù)量(例如 10)的搜索結(jié)果。在一些實(shí)施方式中,搜索引擎20可以將搜索查詢(Q)IOa解析成組分標(biāo)志(Q1, Q2.....Qn) 10b。在一些實(shí)施方式中,標(biāo)志是形成查詢的單詞(或單詞組,其中單詞組形成單個(gè)概念,諸如“New YorkCity”)。組分標(biāo)志(Q1A2.....Qn) IOb可以被用來(lái)識(shí)別第一語(yǔ)言
的與搜索查詢(Q) IOa相關(guān)的網(wǎng)頁(yè)。在一些實(shí)施方式中,相關(guān)網(wǎng)頁(yè)是第一語(yǔ)言的包括多于組
分標(biāo)志(QpQ2.....Qn) IOb中的一個(gè)的那些網(wǎng)頁(yè)。這樣的網(wǎng)頁(yè)可以例如在被限制在第一語(yǔ)
言的網(wǎng)頁(yè)的索引30中找到。在一些實(shí)施方式中,搜索引擎20可以導(dǎo)出與最相關(guān)頁(yè)面相關(guān) 聯(lián)的相關(guān)性分值。在又一些實(shí)施方式中,搜索引擎20可以導(dǎo)出與如由鏈接到頁(yè)面的其它站 點(diǎn)的數(shù)量測(cè)量的網(wǎng)頁(yè)的質(zhì)量相關(guān)聯(lián)的頁(yè)面排名分值。搜索引擎20還可以導(dǎo)出與搜索結(jié)果 有關(guān)的分值(例如,信息檢索(IR)分值)。在一些實(shí)施方式中,IR分值可以從例如與查詢 和文檔相關(guān)性相對(duì)應(yīng)的特征向量的點(diǎn)積、頁(yè)面排名分值和/或IR分值和頁(yè)面排名分值的組 合等來(lái)計(jì)算ο在一些實(shí)施方式中,跨語(yǔ)言搜索系統(tǒng)100確定組分標(biāo)志(Q^ Q2.....Qn) IOb中
的任何一些是否是本地實(shí)體40,并且從跨語(yǔ)言搜索中排除包括本地實(shí)體的任何搜索查詢 (Q) IOa0實(shí)體是識(shí)別人、地方或事物的那些單詞或詞組。本地實(shí)體是與輸入查詢的語(yǔ)言相 關(guān)聯(lián)的那些實(shí)體,并且人、地方或事物指示其中主要說(shuō)該語(yǔ)言的發(fā)源地??梢源嬖谄渲兄饕?說(shuō)該語(yǔ)言的發(fā)源地的物理指示、發(fā)源地的邏輯指示或發(fā)源地的歷史指示。例如,埃菲爾鐵塔 位于法國(guó),因此查詢“l(fā)a Tour Eiffel”是關(guān)于法語(yǔ)的本地實(shí)體。在另一個(gè)示例中,大陸軍 在美國(guó)具有發(fā)源地的邏輯和歷史指示兩者,因此其是關(guān)于英語(yǔ)的本地實(shí)體。在又一些示例 中,由于詞語(yǔ)“Mo c κ B a ”識(shí)別位于俄羅斯的城市莫斯科,所以其是關(guān)于俄語(yǔ)的本地實(shí) 體。這樣的實(shí)體的列表可以從百科全書(shū)、位置服務(wù)器、公共歸檔等導(dǎo)出,或可以從第三 方提供。本地實(shí)體的列表典型地排除單獨(dú)的通用詞語(yǔ),即使通用詞語(yǔ)是在商標(biāo)名稱中的構(gòu) 成單詞。然而,包括通用詞語(yǔ)的多單詞商標(biāo)名稱可以被包括在本地實(shí)體的列表中(例如, "AuburnUniversity (奧本大學(xué)),,)。本地實(shí)體的列表還典型地排除包括外來(lái)實(shí)體。在一個(gè)實(shí)施方式中,外來(lái)實(shí)體是對(duì) 于輸入查詢的語(yǔ)言不是本地實(shí)體的那些實(shí)體。在其它實(shí)施方式中,外來(lái)實(shí)體可以是對(duì)于另 一種語(yǔ)言是本地的實(shí)體和那些實(shí)體的翻譯。實(shí)體對(duì)于一種語(yǔ)言可以是本地的,而對(duì)于另一 種語(yǔ)言可以是外來(lái)的。例如,標(biāo)志“Vladimir Putin”定義了俄語(yǔ)的本地實(shí)體,而相同的標(biāo)志 將定義英語(yǔ)的外來(lái)實(shí)體。因此,如果俄羅斯用戶將(俄語(yǔ)的)“Vladimir Putin”作為搜索 查詢20a的一部分輸入,則將在俄語(yǔ)的本地實(shí)體中找到實(shí)體“Vladimir Putin”,并且可以 將搜索排除在執(zhí)行跨語(yǔ)言搜索之外。在另一個(gè)示例中,“Mo c κ B a”(例如“莫斯科”) 是俄語(yǔ)的本地實(shí)體。在一些實(shí)施方式中,包括與本地實(shí)體相匹配的標(biāo)志的搜索查詢不適合跨語(yǔ)言搜 索,因此搜索可以以用來(lái)提交搜索查詢的語(yǔ)言提供。例如,如果接收搜索“Al-Qahira”(例 如,與埃及實(shí)體“Cairo”相互關(guān)聯(lián)),則由于標(biāo)志“Al-Qahira”與阿拉伯語(yǔ)的本地實(shí)體相匹 配,所以可以從阿拉伯語(yǔ)的網(wǎng)頁(yè)的索引提供搜索查詢。因此,可以假設(shè)與以另一種語(yǔ)言寫(xiě)的 網(wǎng)頁(yè)(例如,翻譯的英語(yǔ)搜索查詢“Cairo”產(chǎn)生的網(wǎng)頁(yè))相比,以阿拉伯語(yǔ)創(chuàng)作的網(wǎng)頁(yè)與搜 索查詢更相關(guān)。此外,以另一種語(yǔ)言寫(xiě)的網(wǎng)頁(yè)在翻譯后可能很難理解。例如,與以阿拉伯語(yǔ) 寫(xiě)的網(wǎng)頁(yè)相比,被翻譯成阿拉伯語(yǔ)的以英語(yǔ)寫(xiě)的網(wǎng)頁(yè)對(duì)于天生說(shuō)阿拉伯語(yǔ)的人來(lái)說(shuō)可能更 難閱讀。在一些實(shí)施方式中,可以將組分標(biāo)志(Qp Q2.....Qn) IOb與本地實(shí)體40進(jìn)行比較來(lái)確定組分標(biāo)志(QpQ2.....Qn) IOb的集合與本地實(shí)體40的聚集的任何相交的程度。在組 分標(biāo)志IOb和本地實(shí)體40的聚集之間相交的程度可以被用來(lái)確定是否執(zhí)行跨語(yǔ)言搜索。在其它實(shí)施方式中,可以將搜索查詢的子集(例如,η元)與本地實(shí)體40的聚集 進(jìn)行比較。在這樣的實(shí)施方式中,跨語(yǔ)言搜索系統(tǒng)100可以將搜索查詢的子集中的每一個(gè) 與本地實(shí)體40的聚集進(jìn)行比較以確定包括在搜索查詢中的子集中的任何子集是否與來(lái)自 本地實(shí)體60的聚集的本地實(shí)體相匹配。例如,如果跨語(yǔ)言搜索系統(tǒng)100接收了搜索查詢 "vacation homes finger lakes”,則跨語(yǔ)言搜索系統(tǒng)100可以對(duì)本地實(shí)體40的聚集搜索包 括以下任何集合“vacationvacation homes">"vacation homes finger“vacation homes finger lakes,,、"homes,,、"homes finger,,、‘‘homes finger lakes,,、"finger,,以及 "finger lakes”。在一些實(shí)施方式中,如果子部分字符串的第一單詞不包含在本地實(shí)體40 的聚集中的匹配,則跨語(yǔ)言搜索系統(tǒng)100可以停止搜索子部分字符串。在額外的實(shí)施方式 中,跨語(yǔ)言搜索系統(tǒng)100可以在找到與來(lái)自本地實(shí)體40的聚集的實(shí)體相匹配的子集后中 止搜索。例如,如果跨語(yǔ)言搜索系統(tǒng)100接收了查詢"Manhattan gourmet restaurants”, 則跨語(yǔ)言搜索系統(tǒng)100可能立即找到與來(lái)自本地實(shí)體40的聚集的本地實(shí)體相匹配的詞語(yǔ) ‘‘Manhattan”。因此,可以認(rèn)為搜索進(jìn)一步匹配是不必要的。在待執(zhí)行跨語(yǔ)言搜索的那些情況下,跨語(yǔ)言搜索系統(tǒng)100可以將搜索查詢(Q) IOa 發(fā)送到翻譯器25。翻譯器25使用搜索查詢(Q) IOa來(lái)導(dǎo)出第二語(yǔ)言的翻譯的搜索查詢 (Q’)50a。在一些實(shí)施方式中,翻譯器可以是可操作來(lái)接收第一語(yǔ)言的搜索查詢(Q) IOa并 且輸出第二語(yǔ)言的翻譯的查詢(Q’ )50a的自動(dòng)機(jī)器翻譯器。翻譯的搜索查詢(Q’)50a可以由搜索引擎20分成組分標(biāo)志(Q/、Q2’.....
Qn’)50b。在一些實(shí)施方式中,搜索引擎20或跨語(yǔ)言搜索系統(tǒng)100可以將組分標(biāo)志(Q/、
Q2'.....Qn' )50b與外來(lái)實(shí)體60的聚集進(jìn)行比較。外來(lái)實(shí)體60的聚集可以包括與第二
語(yǔ)言相關(guān)聯(lián)的那些實(shí)體。例如,如果第二語(yǔ)言是俄語(yǔ),則外來(lái)實(shí)體可以包括位置(例如,紅 場(chǎng)、克里姆林宮、莫斯科或西伯利亞)以及人(例如,列寧、斯大林、戈?duì)柊蛦谭蚧蛉~利欽)、
或與俄語(yǔ)相關(guān)聯(lián)的俄羅斯商標(biāo)名稱、產(chǎn)品和公司。在第二語(yǔ)言的組分標(biāo)志(Q1’、Q2’.....
Qn') 50b的集合包括與外來(lái)實(shí)體60的一些相交的那些情況下,翻譯的查詢(Q’)50a可以被 認(rèn)為是執(zhí)行跨語(yǔ)言搜索的良好候選。在其它實(shí)施方式中,翻譯的查詢(Q’)可以被分成子集 并且與外來(lái)實(shí)體60的聚集中的實(shí)體進(jìn)行比較以確定包括在搜索查詢中的詞語(yǔ)是否與外來(lái) 實(shí)體相匹配。在又一些實(shí)施方式中,翻譯器可以產(chǎn)生與翻譯的搜索查詢(Q’)50a相關(guān)聯(lián)的翻譯 置信分值70。與翻譯的查詢(Q’)50a相關(guān)聯(lián)的翻譯置信分值70可以被用來(lái)確定翻譯是否 可能產(chǎn)生相關(guān)結(jié)果。在這樣的實(shí)施方式中,可以將翻譯置信70與翻譯置信閾值進(jìn)行比較以 確定翻譯的查詢(Q’)50a是否是用于跨語(yǔ)言搜索的候選。例如,搜索查詢(Q) IOa可以潛在 地具有一百或更多的翻譯。更大數(shù)量的潛在翻譯關(guān)于從可能的翻譯中選擇的翻譯的搜索查 詢(Q’)可以產(chǎn)生更大的不確定性。因此,存在下述的某種可能性所選擇的翻譯是不正確 的;使用這樣的搜索查詢生成的任何結(jié)果將與原始搜索查詢IOa不相關(guān)。因此,翻譯置信分 值70不滿足翻譯置信閾值的翻譯的搜索查詢(Q’)50a可以被認(rèn)為是用于執(zhí)行跨語(yǔ)言搜索 的不良候選。在一些實(shí)施方式中,翻譯器25基于超過(guò)翻譯置信閾值的多個(gè)翻譯可以將多個(gè)翻譯提供給搜索引擎20。在其它實(shí)施方式中,翻譯器25可以將單個(gè)翻譯(例如,翻譯的搜索 查詢(Q’)50a)提供給跨語(yǔ)言搜索系統(tǒng)100,并且跨語(yǔ)言系統(tǒng)可以確定與該翻譯的搜索查詢 (Q’)50a相關(guān)聯(lián)的翻譯置信分值是否滿足翻譯置信閾值。從跨語(yǔ)言搜索排除不滿足翻譯置 信閾值的翻譯的搜索查詢(Q’)50a。如果翻譯的搜索查詢(Q’ )滿足置信閾值,則可以將翻譯的搜索查詢(Q’)50a發(fā) 送給搜索引擎20以搜索與翻譯的搜索查詢(Q’)50a相關(guān)的文檔(例如,網(wǎng)頁(yè))。搜索引擎
20可以使用翻譯的搜索查詢(Q’)50a的組分標(biāo)志(Q’ 1、Q’ 2.....Q’ η) 50b來(lái)找尋第二語(yǔ)
言的相關(guān)網(wǎng)頁(yè)80。如前所述,搜索引擎20可以向跨語(yǔ)言搜索系統(tǒng)100提供與第二語(yǔ)言的相 關(guān)網(wǎng)頁(yè)相關(guān)聯(lián)的IR分值。在一些實(shí)施方式中,可以將與翻譯的搜索查詢(Q’ )50a的結(jié)果相關(guān)聯(lián)的相應(yīng)相關(guān) 性分值與相關(guān)性分值閾值進(jìn)行比較以確定是否將翻譯的網(wǎng)頁(yè)用作為搜索查詢(Q) 20a的結(jié) 果。例如,在一些情況下,翻譯的查詢(Q’)50a的結(jié)果可能具有如此低的相關(guān)性分值,使得 其不會(huì)被派發(fā)給搜索者,即使翻譯的搜索查詢(Q’)50a的結(jié)果具有比搜索查詢(Q) 20a的結(jié) 果更高的相關(guān)性分值。在一些實(shí)施方式中,可以將用于翻譯的搜索查詢(Q’ )50a的結(jié)果的相關(guān)性分值與 用于搜索查詢(Q) IOa的結(jié)果的相關(guān)性分值進(jìn)行比較??梢詫⒏嚓P(guān)的結(jié)果作為結(jié)果90派 發(fā)給用戶。在翻譯的搜索查詢(Q’)50a的結(jié)果具有比搜索查詢(Q) IOa的結(jié)果的相關(guān)性分 值更高的相關(guān)性分值的那些情況下,第二語(yǔ)言的相關(guān)網(wǎng)頁(yè)可以被翻譯成第一語(yǔ)言并且作為 結(jié)果90派發(fā)。在一些實(shí)施方式中,基于翻譯的網(wǎng)頁(yè)比以第一語(yǔ)言原始創(chuàng)作的網(wǎng)頁(yè)更難閱讀 的可能性,相關(guān)性分值可以偏向于喜好來(lái)自搜索查詢(Q) IOa的結(jié)果。在一些實(shí)施方式中,翻譯的搜索查詢的翻譯的網(wǎng)頁(yè)結(jié)果可以包括翻譯置信分值。 在這樣的實(shí)施方式中,可以將與翻譯的網(wǎng)頁(yè)的翻譯相關(guān)聯(lián)的翻譯置信分值或質(zhì)量與翻譯置 信閾值進(jìn)行比較以確定是否應(yīng)當(dāng)將翻譯的網(wǎng)頁(yè)用作為搜索查詢IOa的結(jié)果90。例如,在一 些情況下,可以確定第二語(yǔ)言的相關(guān)網(wǎng)頁(yè)或相關(guān)聯(lián)的部分或摘錄的翻譯對(duì)于搜索者來(lái)說(shuō)幾 乎是不可閱讀的。在這樣的示例中,跨語(yǔ)言搜索系統(tǒng)100可能僅派發(fā)比本地結(jié)果更相關(guān)并 且滿足翻譯置信閾值的那些結(jié)果。圖IB是圖示示例跨語(yǔ)言搜索系統(tǒng)100的框圖。在一些實(shí)施方式中,系統(tǒng)100可以 包括輸入模塊110、查詢?cè)u(píng)估模塊120、實(shí)體數(shù)據(jù)存儲(chǔ)130以及輸出模塊140。輸入模塊110 可以從客戶端設(shè)備接收搜索查詢。在一些實(shí)施方式中,輸入模塊110可以包括提供給例如 計(jì)算機(jī)設(shè)備的用戶設(shè)備的搜索引擎網(wǎng)頁(yè)代碼,其在用戶設(shè)備上呈現(xiàn)使用戶能夠輸入搜索查 詢的網(wǎng)頁(yè)。在其它實(shí)施方式中,輸入模塊110可以包括使系統(tǒng)能夠從客戶端設(shè)備接收查詢 的通信接口。在一些實(shí)施方式中,查詢?cè)u(píng)估模塊120可以從輸入模塊110接收搜索查詢,并且可 以評(píng)估搜索查詢以確定搜索查詢是否是用于執(zhí)行跨語(yǔ)言搜索的候選。在這些實(shí)施方式中, 查詢?cè)u(píng)估模塊120可以過(guò)濾搜索查詢以識(shí)別那些查詢與在以用來(lái)輸入查詢的語(yǔ)言創(chuàng)作的 網(wǎng)頁(yè)上找到的相比,更可能具有來(lái)自另一種語(yǔ)言的網(wǎng)頁(yè)的更相關(guān)的結(jié)果。在一些實(shí)施方式中,查詢?cè)u(píng)估模塊120可以與翻譯服務(wù)122通信。翻譯服務(wù)122 可以接收第一語(yǔ)言的搜索查詢,以及可以將搜索查詢翻譯成第二語(yǔ)言并且生成與翻譯的搜 索查詢相關(guān)聯(lián)的翻譯置信分值??梢詫⒎g的搜索查詢和翻譯置信分值提供給查詢?cè)u(píng)估模塊 120。
在一些實(shí)施方式中,來(lái)自搜索查詢的同與第一語(yǔ)言(例如,搜索查詢語(yǔ)言)相關(guān)聯(lián) 的實(shí)體(例如,本地實(shí)體)相匹配的標(biāo)志可以由查詢?cè)u(píng)估模塊120協(xié)同實(shí)體數(shù)據(jù)存儲(chǔ)130 識(shí)別。在一些實(shí)施方式中,本地實(shí)體可以是與對(duì)于用來(lái)輸入搜索查詢的語(yǔ)言是本地的區(qū)域 相關(guān)聯(lián)的專(zhuān)有名詞(例如,城市、地方等)。在其它實(shí)施方式中,包括與本地實(shí)體相匹配的標(biāo)志的搜索查詢基于第一語(yǔ)言的網(wǎng) 頁(yè)的相關(guān)性可以仍然適合跨語(yǔ)言搜索。在這樣的實(shí)施方式中,在搜索查詢包括與本地實(shí)體 相匹配的標(biāo)志時(shí),可以將查詢的語(yǔ)言的與本地實(shí)體相關(guān)聯(lián)的結(jié)果與閾值相關(guān)性分值進(jìn)行比 較以確定第一語(yǔ)言的結(jié)果是否是劣質(zhì)的。例如,搜索查詢可能包括與本地實(shí)體相匹配的標(biāo) 志;然而,與該本地實(shí)體相關(guān)聯(lián)的語(yǔ)言的網(wǎng)頁(yè)可能是稀少的。因此,確定另一種語(yǔ)言的網(wǎng)頁(yè) 是否可能具有更相關(guān)的結(jié)果可以是有用的。在一些實(shí)施方式中,跨語(yǔ)言搜索系統(tǒng)100可以識(shí)別何時(shí)來(lái)自翻譯的搜索查詢的標(biāo) 志匹配外來(lái)實(shí)體。外來(lái)實(shí)體是與除第一語(yǔ)言外的語(yǔ)言相關(guān)聯(lián)的任何實(shí)體(例如,“Cairo, Egypt”是英語(yǔ)的外來(lái)實(shí)體)。在一些示例中,用于第一或第二語(yǔ)言的百科全書(shū)可以被用來(lái) 確定翻譯的查詢是否是用于跨語(yǔ)言搜索的良好候選。在這些示例中,包括在搜索查詢或翻 譯的搜索查詢中的與實(shí)體(例如,本地或外來(lái))相匹配的標(biāo)志可以分別使用與第一語(yǔ)言或 第二語(yǔ)言相關(guān)聯(lián)的百科全書(shū)網(wǎng)站來(lái)識(shí)別。在其它示例中,位置服務(wù)器可以被用來(lái)識(shí)別與搜 索查詢或翻譯的搜索查詢相關(guān)聯(lián)的位置。在一些實(shí)施方式中,在編輯實(shí)體數(shù)據(jù)存儲(chǔ)130時(shí),通用單詞可以被識(shí)別并且從實(shí) 體數(shù)據(jù)存儲(chǔ)130移除,即使在單詞表示與第一或第二語(yǔ)言相關(guān)聯(lián)的商標(biāo)或城市的情況下。 例如,通用單詞是與該語(yǔ)言不具有任何特定關(guān)聯(lián)的那些單詞。還使城市或商標(biāo)與之相關(guān)聯(lián) 的通用單詞的一個(gè)示例是“auburn”。在一些情況下,“auburn”通常是指顏色,在其它情 況下,其可以指城市亞拉巴馬州奧本或商標(biāo)“AuburnUniversity”。在另一個(gè)示例中,詞語(yǔ) “apple”通常可以指水果,而在其它情況下其可以指公司。由于如果用戶正試圖輸入通用詞 語(yǔ),而不是城市或商標(biāo),則這些單詞可以導(dǎo)致不相關(guān)的結(jié)果,所以從實(shí)體數(shù)據(jù)存儲(chǔ)130移除 這些單詞。在一些實(shí)施方式中,查詢?cè)u(píng)估模塊120可以檢索與包括在百科全書(shū)中的實(shí)體有關(guān) 的歷史統(tǒng)計(jì)。基于與實(shí)體相關(guān)聯(lián)的統(tǒng)計(jì),查詢?cè)u(píng)估模塊120可以確定與實(shí)體的在先前接收 的搜索查詢中的包括相關(guān)聯(lián)的頻率。例如,實(shí)體在搜索查詢中出現(xiàn)越頻繁,與該實(shí)體有關(guān)的 主題越受歡迎。由于如由用戶查詢所指示的興趣通常由來(lái)自發(fā)布者的興趣反映,所以更受 歡迎的主題更可能具有與主題相關(guān)聯(lián)的相關(guān)網(wǎng)頁(yè)。此外,當(dāng)不存在關(guān)于查詢的相關(guān)內(nèi)容時(shí), 由于該查詢沒(méi)有產(chǎn)生相關(guān)結(jié)果,所以該查詢可以變得不受歡迎。以閾值頻率查詢的實(shí)體可 以被包括在實(shí)體數(shù)據(jù)存儲(chǔ)130中,因?yàn)榭梢约僭O(shè)這樣的實(shí)體具有在相關(guān)聯(lián)的網(wǎng)頁(yè)方面的相 關(guān)主題語(yǔ)料庫(kù)。在又一些實(shí)施方式中,查詢?cè)u(píng)估模塊120可以確定搜索查詢的翻譯的質(zhì)量。翻譯 的質(zhì)量可以被用來(lái)確定搜索查詢是否是用于跨語(yǔ)言搜索的良好候選。例如,如果翻譯是低 劣的,例如翻譯置信指示該翻譯具有為不正確的相對(duì)高的可能性,則來(lái)自低劣翻譯的查詢 的結(jié)果也可能是低劣的,或可能與原始搜索查詢完全不相關(guān)。各種翻譯服務(wù)為翻譯提供置 信分值以確定慣用法最可能涉及哪個(gè)單詞。在一些實(shí)施方式中,翻譯服務(wù)可以基于與搜索查詢中的每一個(gè)單詞的翻譯相關(guān)聯(lián)的置信來(lái)為搜索查詢的整體翻譯提供置信分值。因此,搜索查詢可能很難精確翻譯,以及置信值或質(zhì)量值可以被用來(lái)過(guò)濾使用這樣的單詞的搜索 查詢而不被用于跨語(yǔ)言搜索。例如,特定單詞可能具有翻譯成外語(yǔ)的多個(gè)翻譯或可能根本 不具有翻譯。這樣的單詞很難翻譯,并且導(dǎo)致與翻譯有關(guān)的較低置信分值。在一些實(shí)施方式中,可以測(cè)試翻譯的搜索查詢以確定翻譯的搜索查詢是否產(chǎn)生相 關(guān)網(wǎng)頁(yè)匹配。在這樣的實(shí)施方式中,查詢?cè)u(píng)估模塊120可以將翻譯的搜索查詢發(fā)送到搜索 引擎124。搜索引擎124可以使用翻譯的搜索查詢來(lái)識(shí)別文檔語(yǔ)料庫(kù)126(例如,第二語(yǔ)言 的索引)中的相關(guān)文檔。所識(shí)別的文檔和翻譯的搜索查詢可以被用來(lái)導(dǎo)出與翻譯的搜索查 詢的結(jié)果相關(guān)聯(lián)的相關(guān)性分值。在一些實(shí)施方式中,相關(guān)性分值可以包括相關(guān)性組分和質(zhì) 量組分兩者。在接收與從搜索引擎124接收的來(lái)自翻譯的搜索查詢的結(jié)果相關(guān)聯(lián)的相關(guān)性 分值后,查詢?cè)u(píng)估模塊120可以將與搜索查詢的結(jié)果相關(guān)聯(lián)的相關(guān)性分值與相關(guān)性閾值進(jìn) 行比較以確定翻譯的搜索查詢是否可能與搜索查詢相關(guān)。例如,在一些情況下,來(lái)自翻譯的 搜索查詢的結(jié)果可能如此不相關(guān),使得甚至不向搜索者提供所述結(jié)果。在又一些實(shí)施方式中,用戶關(guān)于與翻譯的查詢相匹配的先前查詢的結(jié)果的活動(dòng)可 以被用來(lái)確定來(lái)自相似查詢的結(jié)果對(duì)于其他用戶來(lái)說(shuō)是否是滿意的,從而指示相似搜索查 詢產(chǎn)生了相關(guān)結(jié)果。例如,搜索引擎124可以在客戶端設(shè)備請(qǐng)求結(jié)果,例如在搜索結(jié)果上點(diǎn) 擊并且到達(dá)與該結(jié)果相關(guān)聯(lián)的登陸頁(yè)面時(shí)記入日志。如果客戶端設(shè)備在訪問(wèn)登陸頁(yè)面后立 即返回到搜索頁(yè)面來(lái)輸入新的查詢,則結(jié)果可能是不相關(guān)的。相反,如果客戶端設(shè)備駐留在 結(jié)果頁(yè)面中的一個(gè)或多個(gè)上一段時(shí)間,則結(jié)果更可能與搜索查詢相關(guān)。因此,查詢?cè)u(píng)估模塊 120可以基于使用與翻譯的查詢相匹配的搜索查詢的其他用戶的活動(dòng),來(lái)確定翻譯的搜索 查詢是否可能產(chǎn)生優(yōu)質(zhì)結(jié)果。在又一些實(shí)施方式中,查詢?cè)u(píng)估模塊120可以確定第一語(yǔ)言的搜索查詢是否比第 二語(yǔ)言的翻譯的搜索查詢具有更相關(guān)的結(jié)果。在這樣的實(shí)施方式中,查詢?cè)u(píng)估模塊120可 以將搜索查詢和翻譯的搜索查詢兩者發(fā)送到搜索引擎124。搜索引擎124可以導(dǎo)出與來(lái)自 原始搜索查詢的結(jié)果的第一集合相關(guān)聯(lián)的相關(guān)性分值的第一集合,以及與來(lái)自翻譯的搜索 查詢的結(jié)果的第二集合相關(guān)聯(lián)的相關(guān)性分值的第二集合。在一些實(shí)施方式中,如果如分別 由第一和第二相關(guān)性分值所指示的,搜索查詢產(chǎn)生比來(lái)自翻譯的搜索查詢的結(jié)果中的任何 結(jié)果更好的結(jié)果,則可以將來(lái)自搜索查詢的結(jié)果派發(fā)給搜索者。替選地,如果如由各自相關(guān) 性分值所指示的,來(lái)自翻譯的搜索查詢的結(jié)果比來(lái)自搜索查詢的結(jié)果更相關(guān),則可以將來(lái) 自翻譯的搜索查詢的結(jié)果派發(fā)給搜索者。這樣的比較假設(shè)對(duì)不同語(yǔ)言的相關(guān)性測(cè)量跨各個(gè) 語(yǔ)料庫(kù)是可公度的。在一些實(shí)施方式中,可以對(duì)第二語(yǔ)言的網(wǎng)頁(yè)(或多個(gè)網(wǎng)頁(yè))進(jìn)行翻譯以產(chǎn)生該第 一語(yǔ)言的網(wǎng)頁(yè)的翻譯版本。例如,可以將第一語(yǔ)言的網(wǎng)頁(yè)的翻譯版本與第一語(yǔ)言的搜索查 詢進(jìn)行比較以導(dǎo)出相關(guān)性分值。例如,可以將接收的西班牙語(yǔ)的搜索查詢翻譯成英語(yǔ)。如 果與最高排名的西班牙語(yǔ)的網(wǎng)頁(yè)與西班牙語(yǔ)的查詢的相關(guān)程度相比,最高排名的英語(yǔ)的網(wǎng) 頁(yè)與翻譯的英語(yǔ)查詢更相關(guān),則可以將英語(yǔ)網(wǎng)頁(yè)翻譯成西班牙語(yǔ)。在該示例中,在將英語(yǔ) 網(wǎng)頁(yè)翻譯成西班牙語(yǔ)后,可以將西班牙語(yǔ)查詢與翻譯的英語(yǔ)網(wǎng)頁(yè)進(jìn)行比較。如果與西班牙 語(yǔ)網(wǎng)頁(yè)與西班牙語(yǔ)查詢的相關(guān)程度相比,翻譯的英語(yǔ)網(wǎng)頁(yè)與西班牙語(yǔ)查詢?nèi)匀桓嚓P(guān),則 可以將翻譯的英語(yǔ)網(wǎng)頁(yè)作為結(jié)果提供。如果與西班牙語(yǔ)網(wǎng)頁(yè)與西班牙語(yǔ)查詢的相關(guān)程度相比,翻譯的英語(yǔ)網(wǎng)頁(yè)與西班牙語(yǔ)查詢不更相關(guān),則可以將西班牙語(yǔ)網(wǎng)頁(yè)作為結(jié)果提供給搜 索者。因此,可以將翻譯的搜索頁(yè)面對(duì)于原始查詢的相關(guān)性分值與以第一語(yǔ)言寫(xiě)的網(wǎng)頁(yè)對(duì) 于原始搜索查詢的相關(guān)性分值進(jìn)行比較。在一些實(shí)施方式中,基于與相應(yīng)結(jié)果相關(guān)聯(lián)的相關(guān)性分值,派發(fā)給客戶端設(shè)備的 結(jié)果可以包括翻譯的網(wǎng)頁(yè)和以第一語(yǔ)言寫(xiě)的網(wǎng)頁(yè)兩者。例如,如果來(lái)自英語(yǔ)查詢的結(jié)果具 有10、9和2的相關(guān)性分值,而來(lái)自西班牙語(yǔ)查詢的結(jié)果具有8、8和6的相關(guān)性分值,則跨 語(yǔ)言搜索系統(tǒng)可以提供來(lái)自英語(yǔ)查詢的兩個(gè)最相關(guān)的結(jié)果,后跟西班牙語(yǔ)查詢的結(jié)果,并 且以來(lái)自英語(yǔ)查詢的最不相關(guān)的結(jié)果結(jié)束。在其它實(shí)施方式中,可以將原始搜索查詢的結(jié) 果的相關(guān)性分值聚合來(lái)產(chǎn)生第一聚合相關(guān)性分值,以及可以將原始搜索查詢的相關(guān)性分值 聚合來(lái)產(chǎn)生第二聚合相關(guān)性分值。在一些實(shí)施方式中,聚合可以包括對(duì)相應(yīng)相關(guān)性分值求 和來(lái)產(chǎn)生第一和第二聚合相關(guān)性分值??梢詫⒌谝痪酆舷嚓P(guān)性分值與第二聚合相關(guān)性分值 進(jìn)行比較以確定是否派發(fā)與翻譯的搜索查詢相關(guān)聯(lián)的結(jié)果。輸出模塊140可操作來(lái)從查詢?cè)u(píng)估模塊120接收結(jié)果并且將結(jié)果派發(fā)給客戶端設(shè) 備。在一些實(shí)施方式中,輸出模塊140可以調(diào)集包含搜索結(jié)果的網(wǎng)頁(yè)用于傳送到客戶端設(shè) 備。在其它實(shí)施方式中,輸出模塊140可以將結(jié)果派發(fā)到可操作來(lái)將結(jié)果格式化并傳送到 客戶端設(shè)備的另一個(gè)模塊。圖IC是圖示查詢?cè)u(píng)估模塊120的示例實(shí)施方式的框圖。查詢?cè)u(píng)估模塊120可以接 收第一語(yǔ)言的搜索查詢(Q)。查詢?cè)u(píng)估模塊120可以將搜索查詢(Q)發(fā)送給搜索引擎124。 搜索引擎124可以基于搜索查詢(Q)執(zhí)行對(duì)與第一語(yǔ)言相關(guān)聯(lián)的文檔語(yǔ)料庫(kù)126的搜索以 產(chǎn)生搜索結(jié)果(RQ)的集合。查詢?cè)u(píng)估模塊120還可以將接收的搜索查詢提供給實(shí)體過(guò)濾器154。實(shí)體過(guò)濾器 154可以將標(biāo)志(例如,形成單個(gè)概念的單詞或單詞組)與本地實(shí)體數(shù)據(jù)存儲(chǔ)156中的實(shí)體 以及與外來(lái)實(shí)體數(shù)據(jù)存儲(chǔ)158中的實(shí)體進(jìn)行比較。如果實(shí)體過(guò)濾器154確定搜索查詢(Q) 包括與來(lái)自本地實(shí)體數(shù)據(jù)存儲(chǔ)156的實(shí)體相匹配的標(biāo)志,則查詢?cè)u(píng)估模塊120可以確定搜 索查詢(Q)不適合跨語(yǔ)言搜索。因此,僅向搜索者派發(fā)搜索結(jié)果(RQ) 152的集合。如果搜索查詢(Q)不包括與來(lái)自本地實(shí)體數(shù)據(jù)存儲(chǔ)156的實(shí)體相匹配的標(biāo)志,則 可以將來(lái)自搜索查詢(Q)的標(biāo)志與外來(lái)實(shí)體數(shù)據(jù)存儲(chǔ)158中的外來(lái)實(shí)體的列表進(jìn)行比較。 如果實(shí)體過(guò)濾器154確定搜索查詢(Q)包括與外來(lái)實(shí)體相匹配的標(biāo)志,則查詢?cè)u(píng)估模塊120 可以如由路徑159和163所指示的使用翻譯服務(wù)122和搜索引擎124來(lái)以來(lái)自翻譯的搜索 查詢(Q’ ) 162的結(jié)果對(duì)接收的搜索查詢(Q)作出響應(yīng),從而避免查詢?cè)u(píng)估過(guò)濾器120進(jìn)一 步評(píng)估。然而,如果實(shí)體過(guò)濾器154確定搜索查詢(Q)不包括與來(lái)自外來(lái)實(shí)體數(shù)據(jù)存儲(chǔ)158 的外來(lái)實(shí)體相匹配的標(biāo)志,則實(shí)體過(guò)濾器154可以確定查詢應(yīng)當(dāng)經(jīng)歷進(jìn)一步評(píng)估并且指示 翻譯服務(wù)122翻譯搜索查詢(Q)以產(chǎn)生翻譯的搜索查詢(Q’ )。雖然本申請(qǐng)描述本地實(shí)體的列表從百科全書(shū)以及其它參考源導(dǎo)出,并且排除某些 通用詞語(yǔ)以及對(duì)其它語(yǔ)言而言是本地的詞語(yǔ),但是本地實(shí)體的列表和外來(lái)實(shí)體的列表在一 些實(shí)施方式中可以由另一個(gè)系統(tǒng)生成,并且可以被提供給跨語(yǔ)言搜索系統(tǒng)以在確定搜索詞 語(yǔ)是否包括與來(lái)自由這樣的其它系統(tǒng)提供的列表的本地或外來(lái)實(shí)體相匹配的標(biāo)志時(shí)使用。 翻譯評(píng)估過(guò)濾器160可以從翻譯服務(wù)122接收翻譯的搜索查詢(Q’ )。翻譯評(píng)估 過(guò)濾器160還可以從翻譯服務(wù)122接收翻譯置信分值。翻譯評(píng)估過(guò)濾器160可以將來(lái)自翻譯服務(wù)122的翻譯置信分值與閾值置信分值進(jìn)行比較以確定翻譯是否是足夠高質(zhì)量來(lái)成 為用于執(zhí)行跨語(yǔ)言搜索的良好候選。如果翻譯的搜索查詢(Q’)滿足置信閾值,則翻譯評(píng)估 過(guò)濾器160可以將翻譯的搜索查詢(Q’)傳送給搜索引擎124。在一些實(shí)施方式中,可以將 原始搜索查詢的最可能的翻譯返回給查詢?cè)u(píng)估模塊120,并且可以將與該翻譯相關(guān)聯(lián)的翻 譯置信分值與翻譯置信閾值進(jìn)行比較。在其它實(shí)施方式中,可以將超過(guò)翻譯置信閾值的原 始搜索查詢的所有翻譯返回給查詢?cè)u(píng)估模塊120。 搜索引擎124可以基于翻譯的搜索查詢(Q’ )執(zhí)行對(duì)與第二語(yǔ)言相關(guān)聯(lián)的文檔語(yǔ) 料庫(kù)126的搜索以產(chǎn)生第二語(yǔ)言的搜索結(jié)果(RQ’)162的集合。搜索引擎124可以將翻譯 的搜索查詢(Q’)的結(jié)果(RQ’)162提供給相關(guān)性結(jié)果過(guò)濾器164。搜索引擎124還可以將 與翻譯的搜索查詢(Q’ )的結(jié)果(RQ’)162相關(guān)聯(lián)的相關(guān)性分值(例如,IR分值)提供給 相關(guān)性結(jié)果過(guò)濾器164。相關(guān)性結(jié)果過(guò)濾器164可以確定翻譯的搜索查詢(Q’ )的結(jié)果(RQ’ ) 162是否相 關(guān)得足以被派發(fā)給搜索者。相關(guān)性結(jié)果過(guò)濾器164可以將翻譯的搜索查詢(Q’)的結(jié)果 (RQ’)162與閾值相關(guān)性進(jìn)行比較以確保翻譯的搜索查詢(Q’ )的結(jié)果(RQ’)162相關(guān)得 足以被派發(fā)給搜索者。在其它示例中,相關(guān)性結(jié)果過(guò)濾器164可以檢索與翻譯的搜索查詢 (Q’)相關(guān)聯(lián)的統(tǒng)計(jì)并且基于與結(jié)果(RQ’)162相關(guān)聯(lián)的點(diǎn)擊分析來(lái)確定結(jié)果的相關(guān)性。在 確定結(jié)果(RQ’)162不滿足閾值相關(guān)性的那些情況下,僅向搜索者派發(fā)原始查詢(Q)的結(jié)果 (RQ) 152。如果確定翻譯的搜索查詢(Q’ )的結(jié)果(RQ’)162滿足閾值相關(guān)性,則將翻譯的 搜索查詢(Q’ )的結(jié)果(RQ’)162提供給相關(guān)性比較過(guò)濾器168。相關(guān)性比較過(guò)濾器168可以接收原始搜索查詢(Q)的結(jié)果(RQ) 152和翻譯的搜索 查詢(Q’)的結(jié)果(RQ’)162。相關(guān)性比較過(guò)濾器168還可以接收原始搜索查詢(Q)的結(jié)果 (RQ) 152的第一相關(guān)性分值(例如,IR分值)和翻譯的搜索查詢(Q,)的結(jié)果(RQ,) 162的 第二相關(guān)性分值。相關(guān)性比較過(guò)濾器168可以比較第一和第二相關(guān)性分值以確定是否派發(fā) 原始搜索查詢的結(jié)果(RQ) 152和/或翻譯的搜索查詢的結(jié)果(RQ’)162。例如,如果翻譯的 搜索查詢(Q’ )的結(jié)果(RQ’)162具有比原始搜索查詢的結(jié)果(RQ) 152更高的聚合相關(guān)性 分值,則可以將翻譯的搜索查詢的結(jié)果(RQ’)162作為搜索結(jié)果170提供給搜索者。否則, 將原始搜索查詢的結(jié)果(RQ) 152作為搜索結(jié)果170派發(fā)給用戶。也可以使用基于相關(guān)性的 其它派發(fā)方案??梢砸愿鞣N方式將搜索結(jié)果170派發(fā)給客戶端。在一些實(shí)施方式中,如果查詢?cè)u(píng) 估模塊120執(zhí)行了跨語(yǔ)言搜索,則搜索結(jié)果170可以包括指向由查詢?cè)u(píng)估模塊120識(shí)別的 替選結(jié)果頁(yè)面(例如,包括翻譯的網(wǎng)頁(yè)結(jié)果)的鏈接。在其它實(shí)施方式中,搜索結(jié)果170可 以包括由查詢?cè)u(píng)估模塊120識(shí)別的結(jié)果的聚合。例如,搜索結(jié)果170可以包括原始搜索查 詢(Q)的結(jié)果(RQ) 152和翻譯的搜索查詢(Q’ )的結(jié)果(RQ’)162兩者。在又其它實(shí)施方 式中,搜索結(jié)果170可以包括分割的結(jié)果176。例如,搜索結(jié)果170可以僅包括原始搜索查 詢的結(jié)果(RQ) 152或翻譯的搜索查詢的結(jié)果(RQ’)162、或指向來(lái)自展示另一個(gè)的頁(yè)面的結(jié) 果的一個(gè)集合的鏈接。在又一些實(shí)施方式中,搜索結(jié)果170可以包括翻譯的結(jié)果178。例 如,如果搜索結(jié)果170包括翻譯的查詢的結(jié)果(RQ’)162,則結(jié)果(RQ’ )可以在向搜索者展 示之前被翻譯。圖2是圖示查詢?cè)u(píng)估模塊120的框圖。在一些實(shí)施方式中,查詢?cè)u(píng)估模塊120可以包括本地實(shí)體過(guò)濾器210。本地實(shí)體過(guò)濾器210可以確定搜索查詢是否與本地實(shí)體有關(guān)。 本地實(shí)體過(guò)濾器210可以將包括在搜索查詢中的標(biāo)志與本地實(shí)體數(shù)據(jù)存儲(chǔ)130a進(jìn)行比較 以確定搜索查詢是否與本地實(shí)體有關(guān)(例如,包括與本地實(shí)體相匹配的標(biāo)志)。在搜索查詢 與本地實(shí)體有關(guān)的那些情況下,可能的是,來(lái)自以第一語(yǔ)言寫(xiě)的網(wǎng)頁(yè)的結(jié)果將與搜索查詢 相關(guān)。在這樣的情況下,查詢?cè)u(píng)估模塊120可以從跨語(yǔ)言搜索排除該搜索查詢。 在一些實(shí)施方式中,查詢?cè)u(píng)估模塊120可以包括外來(lái)實(shí)體過(guò)濾器220。外來(lái)實(shí)體過(guò) 濾器220可以確定搜索查詢或翻譯的搜索查詢是否與外來(lái)實(shí)體有關(guān)(例如,包括與外來(lái)實(shí) 體相匹配的標(biāo)志)。在一些實(shí)施方式中,外來(lái)實(shí)體過(guò)濾器220可以包括外來(lái)實(shí)體的數(shù)據(jù)庫(kù), 可以將與搜索查詢或翻譯的查詢相關(guān)聯(lián)的標(biāo)志與該外來(lái)實(shí)體的數(shù)據(jù)庫(kù)進(jìn)行比較。在搜索查 詢與外來(lái)實(shí)體有關(guān)(例如,包括與外來(lái)實(shí)體相匹配的標(biāo)志)的那些情況下,可能的是,來(lái)自 以第二語(yǔ)言寫(xiě)的網(wǎng)頁(yè)的結(jié)果將與搜索查詢相關(guān)。在這樣的情況下,查詢?cè)u(píng)估模塊120可以 基于來(lái)自與原始搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢的搜索引擎結(jié)果124來(lái)派發(fā)搜索結(jié)果。在一些示例中,本地實(shí)體數(shù)據(jù)存儲(chǔ)130a和外來(lái)實(shí)體數(shù)據(jù)存儲(chǔ)130b可以被編輯來(lái) 包括分別與第一語(yǔ)言(例如,查詢語(yǔ)言)或第二語(yǔ)言(例如,翻譯的查詢語(yǔ)言)相關(guān)聯(lián)的專(zhuān) 有名詞。例如,本地實(shí)體和外來(lái)實(shí)體可以包括在相應(yīng)語(yǔ)言中使用的商標(biāo)名稱、與語(yǔ)言相關(guān)聯(lián) 的位置、名人、電視節(jié)目、產(chǎn)品等??梢约僭O(shè)這樣的實(shí)體在其相應(yīng)語(yǔ)言中具有比這樣的實(shí)體 在另一種語(yǔ)言中具有更好的結(jié)果。在一些實(shí)施方式中,例如可以使用百科全書(shū)(例如,電子 百科全書(shū))和/或諸如用來(lái)提供地圖的那些的位置服務(wù)器,來(lái)編輯本地實(shí)體數(shù)據(jù)存儲(chǔ)130a 和外來(lái)實(shí)體數(shù)據(jù)存儲(chǔ)130b。在一些實(shí)施方式中,可以從本地實(shí)體數(shù)據(jù)存儲(chǔ)130a和/或外來(lái) 實(shí)體數(shù)據(jù)存儲(chǔ)130b移除對(duì)于用來(lái)提交查詢的語(yǔ)言而言是本地的通用詞語(yǔ)和/或位置。在一些實(shí)施方式中,可以將包括在數(shù)據(jù)庫(kù)中的外來(lái)和本地實(shí)體與查詢統(tǒng)計(jì)(例 如,實(shí)體先前被查詢過(guò)多少次)進(jìn)行比較以確保來(lái)自百科全書(shū)的每一個(gè)外來(lái)或本地實(shí)體應(yīng) 當(dāng)被包括在實(shí)體的列表中。例如,基于如果沒(méi)有搜索者對(duì)實(shí)體感興趣,則同樣極少有發(fā)布者 對(duì)該實(shí)體感興趣的暗示,在許多先前查詢中沒(méi)有出現(xiàn)的實(shí)體可能不會(huì)致使找到相關(guān)網(wǎng)頁(yè)。 替選地,實(shí)體在許多先前查詢中沒(méi)有出現(xiàn)的事實(shí)可以是對(duì)該實(shí)體是拼寫(xiě)或語(yǔ)法錯(cuò)誤并且應(yīng) 當(dāng)從考慮中排除的指示。在一些實(shí)施方式中,可以將查詢?cè)u(píng)估模塊120耦接到翻譯服務(wù)122。在一些示例 中,翻譯服務(wù)122可以接收搜索查詢并且翻譯搜索查詢以產(chǎn)生翻譯的搜索查詢。在一些實(shí) 施方式中,翻譯服務(wù)122還可以產(chǎn)生與翻譯的查詢相關(guān)聯(lián)的置信值。例如,置信值可以提供 與搜索查詢的翻譯相關(guān)聯(lián)的置信。在一些實(shí)施方式中,查詢?cè)u(píng)估模塊120可以包括翻譯質(zhì)量過(guò)濾器230。翻譯質(zhì)量過(guò) 濾器230可以確定翻譯的搜索查詢是否被精確翻譯的可能性。例如,如果第一語(yǔ)言(例如, 查詢語(yǔ)言)的單詞具有第二語(yǔ)言的許多翻譯,則可能很難確定多個(gè)單詞中的哪個(gè)是在翻譯 中使用的適當(dāng)單詞。與單詞相關(guān)聯(lián)的潛在翻譯越多,所選擇的翻譯是正確的可能越小。因 此,在翻譯的web查詢不滿足置信/質(zhì)量閾值的那些情況下,翻譯質(zhì)量過(guò)濾器230可以確定 從翻譯服務(wù)122接收的翻譯的搜索查詢不會(huì)產(chǎn)生關(guān)于原始查詢的相關(guān)結(jié)果。在這樣的情況 下,查詢?cè)u(píng)估模塊120可以將翻譯的搜索查詢排除于適合跨語(yǔ)言搜索之外,并且派發(fā)原始 搜索查詢的結(jié)果。在一些實(shí)施方式中,查詢?cè)u(píng)估模塊120可以包括閾值相關(guān)性過(guò)濾器240。閾值相關(guān)性過(guò)濾器240可以將翻譯的搜索查詢發(fā)送給搜索引擎124。搜索引擎可以從文檔語(yǔ)料庫(kù) 126識(shí)別相關(guān)網(wǎng)頁(yè),并且提供相關(guān)網(wǎng)頁(yè)和與相關(guān)網(wǎng)頁(yè)相關(guān)聯(lián)的相關(guān)性分值。閾值相關(guān)性過(guò) 濾器240可以將從搜索引擎124接收的與翻譯的搜索查詢相關(guān)聯(lián)的結(jié)果的相關(guān)性分值與閾 值相關(guān)性分值進(jìn)行比較以確定翻譯的搜索查詢是否產(chǎn)生相關(guān)得足以向用戶派發(fā)的結(jié)果。例 如,用戶可以輸入德語(yǔ)搜索查詢??梢苑g該德語(yǔ)搜索查詢以產(chǎn)生英語(yǔ)搜索查詢。英語(yǔ)搜 索查詢可以被用來(lái)基于與英語(yǔ)網(wǎng)頁(yè)中的每一個(gè)相關(guān)聯(lián)的相關(guān)性分值,識(shí)別與英語(yǔ)搜索查詢 有關(guān)的英語(yǔ)網(wǎng)頁(yè)??梢詫⒂⒄Z(yǔ)網(wǎng)頁(yè)的相關(guān)性分值與閾值相關(guān)性分值進(jìn)行比較以確定英語(yǔ)網(wǎng) 頁(yè)是否相關(guān)得足以向搜索者返回。例如,如果英語(yǔ)頁(yè)面相對(duì)不相關(guān),則不會(huì)翻譯英語(yǔ)頁(yè)面來(lái) 作為德語(yǔ)搜索查詢的結(jié)果展示。在與英語(yǔ)網(wǎng)頁(yè)相關(guān)聯(lián)的相關(guān)性分值不滿足閾值相關(guān)性分值 的那些情況下,可以將產(chǎn)生自德語(yǔ)搜索查詢的德語(yǔ)網(wǎng)頁(yè)派發(fā)給搜索者。在一些實(shí)施方式中,查詢?cè)u(píng)估模塊120可以包括相關(guān)性比較過(guò)濾器250。相關(guān)性比 較過(guò)濾器250將原始搜索查詢和翻譯的查詢傳送給搜索引擎124。搜索引擎124可以從文 檔語(yǔ)料庫(kù)126識(shí)別相關(guān)網(wǎng)頁(yè),并且提供針對(duì)搜索查詢和翻譯的搜索查詢的相關(guān)網(wǎng)頁(yè)。搜索 引擎124還可以提供與原始搜索查詢的相關(guān)網(wǎng)頁(yè)相關(guān)聯(lián)的第一相關(guān)性分值和與翻譯的搜 索查詢的相關(guān)網(wǎng)頁(yè)相關(guān)聯(lián)的第二相關(guān)性分值。在一些實(shí)施方式中,相關(guān)性比較過(guò)濾器250 可以將第一相關(guān)性分值與第二相關(guān)性分值進(jìn)行比較。如果第二相關(guān)性分值高于第一相關(guān)性 分值,則可以使用翻譯的搜索查詢。否則,可以使用原始搜索查詢。在一些實(shí)施方式中,可 以不考慮與來(lái)自翻譯的搜索查詢的結(jié)果相關(guān)聯(lián)的第二相關(guān)性分值。例如,可以將英語(yǔ)的網(wǎng) 頁(yè)翻譯成德語(yǔ),但是其可能很難閱讀。因此,在這些實(shí)施方式中,可以在比較時(shí)考慮與翻譯 的網(wǎng)頁(yè)相關(guān)聯(lián)的可讀性因素,因而喜好提交搜索查詢的語(yǔ)言的網(wǎng)頁(yè)。
在一些實(shí)施方式中,諸如圖2中所示,對(duì)于適合跨語(yǔ)言搜索的搜索查詢,必須滿足 過(guò)濾器中的每一個(gè)。在其它實(shí)施方式中,對(duì)于適合跨語(yǔ)言搜索的搜索查詢,可以滿足過(guò)濾器 中的任何過(guò)濾器。也可以使用除圖IA-C和2的實(shí)施方式外的其它實(shí)施方式來(lái)幫助跨語(yǔ)言搜索。例 如,圖3-7概述其中只有單個(gè)過(guò)濾器可以被包括在查詢?cè)u(píng)估模塊中的不同的實(shí)施方式。也 可以使用過(guò)濾器的任何子集的組合。圖3是圖示另一個(gè)示例跨語(yǔ)言搜索系統(tǒng)300的框圖。在圖3的實(shí)施方式中,實(shí)體 數(shù)據(jù)庫(kù)340、350可以由遠(yuǎn)離跨語(yǔ)言搜索系統(tǒng)300的系統(tǒng)提供??缯Z(yǔ)言搜索系統(tǒng)300可以包 括輸入模塊310。輸入模塊310可以可操作來(lái)接收搜索查詢。在一些實(shí)施方式中,輸入模 塊310可以從客戶端設(shè)備接收搜索查詢。在其它實(shí)施方式中,輸入模塊310可以通過(guò)搜索 引擎接口接收搜索查詢??缯Z(yǔ)言搜索系統(tǒng)300與翻譯服務(wù)320通信。翻譯服務(wù)320可以從輸入模塊310接 收搜索查詢。在一些實(shí)施方式中,翻譯服務(wù)320可以翻譯來(lái)自第一語(yǔ)言的搜索查詢以產(chǎn)生 第二語(yǔ)言的翻譯搜索查詢。在一些實(shí)施方式中,翻譯模塊可以翻譯搜索查詢以產(chǎn)生可以被 用來(lái)執(zhí)行跨語(yǔ)言搜索的多個(gè)翻譯的搜索查詢。在一些實(shí)施方式中,翻譯模塊320還可以產(chǎn) 生與翻譯相關(guān)聯(lián)的翻譯置信分值。翻譯置信分值可以識(shí)別與翻譯的搜索查詢相關(guān)聯(lián)的置
fn °在一些實(shí)施方式中,跨語(yǔ)言搜索系統(tǒng)可以包括查詢?cè)u(píng)估模塊330。查詢?cè)u(píng)估模塊 330可以評(píng)估搜索查詢以確定搜索查詢是否是用于執(zhí)行跨語(yǔ)言搜索的候選。在一些實(shí)施方式中,查詢?cè)u(píng)估模塊可以識(shí)別在翻譯成語(yǔ)言時(shí)會(huì)產(chǎn)生相關(guān)結(jié)果的那些查詢。例如,查詢?cè)u(píng) 估模塊330可以將與翻譯相關(guān)聯(lián)的置信分值與閾值置信分值進(jìn)行比較。在這樣的示例中, 由于翻譯置信分值低于閾值的翻譯的搜索查詢可能不會(huì)產(chǎn)生相關(guān)結(jié)果,所以查詢?cè)u(píng)估模塊 330可以從跨語(yǔ)言搜索排除具有低于閾值的置信分值的翻譯的搜索查詢。在其它示例中,查詢?cè)u(píng)估模塊330可以確定翻譯的搜索查詢是否與對(duì)于與翻譯的搜索查詢相關(guān)聯(lián)的語(yǔ)言是本地的實(shí)體相關(guān)聯(lián)。在這樣的示例中,用戶可能輸入“Al Qahira”,以及查詢?cè)u(píng)估模塊可以確定“Al Qahira”是阿拉伯語(yǔ)的本地實(shí)體。因此,查詢?cè)u(píng) 估模塊可以確定阿拉伯語(yǔ)的結(jié)果可能比來(lái)自英語(yǔ)網(wǎng)頁(yè)的結(jié)果與搜索查詢更相關(guān)。在又一些示例中,查詢?cè)u(píng)估模塊330可以確定來(lái)自翻譯的搜索查詢的結(jié)果是否滿 足最小相關(guān)性閾值。在這樣的示例中,查詢?cè)u(píng)估模塊330可以將翻譯的搜索查詢傳送給搜 索服務(wù)360。搜索服務(wù)360可以向查詢?cè)u(píng)估模塊330提供與翻譯的搜索查詢相關(guān)的結(jié)果和 與來(lái)自翻譯的搜索查詢的結(jié)果相關(guān)聯(lián)的相關(guān)性分值。在一些示例中,查詢?cè)u(píng)估模塊330可以將原始搜索查詢和翻譯的搜索查詢傳送給 搜索服務(wù)360。搜索服務(wù)360可以將與原始搜索查詢相關(guān)的結(jié)果的第一集合和與翻譯的搜 索查詢相關(guān)的結(jié)果的第二集合提供給查詢?cè)u(píng)估模塊360。搜索服務(wù)360還可以提供與結(jié)果 的第一集合相關(guān)聯(lián)的第一相關(guān)性分值和與結(jié)果的第二集合相關(guān)聯(lián)的第二相關(guān)性分值。查詢 評(píng)估模塊可以確定第一相關(guān)性分值是否高于第二相關(guān)性分值。在一些實(shí)施方式中,可以相 似地計(jì)算第一相關(guān)性分值和第二相關(guān)性分值,使得來(lái)自不同語(yǔ)言的相似相對(duì)結(jié)果的分值是 可比較的。在其它實(shí)施方式中,第一相關(guān)性分值或第二相關(guān)性分值可以經(jīng)歷到統(tǒng)一相關(guān)性 標(biāo)度的變換。圖4是圖示查詢?cè)u(píng)估模塊330a的實(shí)施方式的框圖。在一些實(shí)施方式中,查詢?cè)u(píng)估 模塊330a可以包括本地實(shí)體過(guò)濾器模塊410,其可操作來(lái)確定原始搜索查詢是否與對(duì)于原 始搜索查詢的語(yǔ)言是本地的實(shí)體有關(guān)。在這些實(shí)施方式中,本地實(shí)體過(guò)濾器模塊410可以 確定包括在原始搜索查詢中的標(biāo)志中的任何標(biāo)志是否與包括在本地實(shí)體數(shù)據(jù)存儲(chǔ)340中 的任何實(shí)體相匹配。如果搜索查詢的標(biāo)志中的一個(gè)或多個(gè)對(duì)于原始搜索查詢的語(yǔ)言是本地 的,則查詢?cè)u(píng)估模塊可以將原始搜索查詢(和/或來(lái)自原始搜索查詢的結(jié)果)發(fā)送給輸出 模塊(例如,圖3的輸出模塊370)。替選地,在一些實(shí)施方式中,如果原始搜索查詢的標(biāo)志對(duì)于原始搜索查詢的語(yǔ)言 不是本地的,則查詢?cè)u(píng)估模塊可以包括外來(lái)實(shí)體過(guò)濾器模塊430。外來(lái)實(shí)體過(guò)濾器模塊430 可以確定搜索查詢是否與外來(lái)實(shí)體(例如,對(duì)于原始搜索查詢的語(yǔ)言是外來(lái)的實(shí)體)有關(guān)。 例如,如果搜索者輸入了阿拉伯語(yǔ)的“Yankee Stadium"的等價(jià)物,則可以假設(shè)來(lái)自英語(yǔ)網(wǎng) 頁(yè)的結(jié)果比來(lái)自阿拉伯語(yǔ)網(wǎng)頁(yè)的結(jié)果與搜索查詢更相關(guān)。在這些實(shí)施方式中,外來(lái)實(shí)體過(guò) 濾器模塊430可以識(shí)別包括在搜索查詢中的標(biāo)志中的任何標(biāo)志是否與包括在外來(lái)實(shí)體數(shù) 據(jù)存儲(chǔ)350中的實(shí)體中的任何實(shí)體相匹配。在一些實(shí)施方式中,如果搜索查詢不與包括在 外來(lái)實(shí)體數(shù)據(jù)庫(kù)440中的外來(lái)實(shí)體中的任何外來(lái)實(shí)體有關(guān),則可以將原始搜索查詢傳送給 輸出模塊(例如,圖3的輸出模塊370)。在其它實(shí)施方式中,如果搜索查詢不與本地實(shí)體 340中的任何本地實(shí)體有關(guān)并且搜索查詢不與外來(lái)實(shí)體350中的任何外來(lái)實(shí)體有關(guān),則查 詢?cè)u(píng)估模塊330可以執(zhí)行對(duì)搜索查詢和/或翻譯的搜索查詢的進(jìn)一步評(píng)估。在一些實(shí)施方式中,在搜索查詢與外來(lái)實(shí)體350中的一個(gè)相關(guān)聯(lián)時(shí),查詢?cè)u(píng)估模塊330a可以包括查詢頻率模塊450,其可操作來(lái)確定翻譯的搜索查詢是否使用頻繁得足以 可能產(chǎn)生相關(guān)結(jié)果。例如,如果翻譯的搜索查詢不以某一頻率被使用,則可能搜索者或發(fā)布 者對(duì)主題沒(méi)有什么興趣。因此,可能不存在許多與翻譯的搜索查詢相關(guān)的網(wǎng)頁(yè),以及翻譯的 搜索查詢不可能產(chǎn)生比原始搜索查詢更好的結(jié)果。在一些實(shí)施方式中,查詢頻率模塊450 可以基于從搜索服務(wù)360檢索的查詢統(tǒng)計(jì)來(lái)導(dǎo)出搜索查詢的受歡迎度。查詢統(tǒng)計(jì)可以包括 搜索查詢由客戶端先前發(fā)出的次數(shù)。如果與翻譯的搜索查詢相關(guān)聯(lián)的查詢統(tǒng)計(jì)滿足閾值頻 率,則可以將翻譯的搜索查詢發(fā)送給輸出模塊(例如,圖3的輸出模塊370)。如果與翻譯的 搜索查詢相關(guān)聯(lián)的查詢統(tǒng)計(jì)不滿足閾值頻率,則可以將原始搜索查詢發(fā)送給輸出模塊。在 其它實(shí)施方式中,如果查詢頻率模塊450沒(méi)有找到閾值頻率,則查詢?cè)u(píng)估模塊330a可以執(zhí) 行對(duì)搜索查詢和/或翻譯的搜索查詢的進(jìn)一步評(píng)估。 圖5是圖示另一個(gè)查詢?cè)u(píng)估模塊330b的實(shí)施方式的框圖。在一些實(shí)施方式中,查 詢?cè)u(píng)估模塊330b可以包括翻譯評(píng)估模塊510。翻譯評(píng)估模塊510可以從翻譯服務(wù)320接收 與翻譯的搜索查詢相關(guān)聯(lián)的置信分值。翻譯服務(wù)320可以基于與翻譯相關(guān)聯(lián)的置信來(lái)導(dǎo)出 翻譯置信分值。置信可以基于翻譯是正確的可能性,例如,基于可用于搜索查詢的替選翻譯 的數(shù)量。在一些實(shí)施方式中,翻譯評(píng)估模塊510可以將與翻譯的搜索查詢相關(guān)聯(lián)的置信分 值與閾值置信分值進(jìn)行比較。在這樣的實(shí)施方式中,閾值置信分值可以識(shí)別與可能產(chǎn)生相 關(guān)結(jié)果的翻譯的搜索查詢相關(guān)聯(lián)的最小置信。如果翻譯置信分值低于閾值置信分值,則可 以將原始搜索查詢發(fā)送給輸出模塊(例如,圖3的輸出模塊370)。否則可以將翻譯的搜索 查詢發(fā)送給輸出模塊。圖6是圖示另一個(gè)查詢?cè)u(píng)估模塊330c的實(shí)施方式的框圖。在一些實(shí)施方式中,查 詢?cè)u(píng)估模塊330c可以包括相關(guān)性模塊610,其可操作來(lái)將翻譯的搜索查詢傳送給搜索引擎 360。搜索引擎360可以導(dǎo)出與識(shí)別與翻譯的搜索查詢相關(guān)的網(wǎng)頁(yè)的結(jié)果相關(guān)聯(lián)的相關(guān)性 分值并且將結(jié)果的相關(guān)性分值提供給相關(guān)性模塊610。在一些實(shí)施方式中,查詢?cè)u(píng)估模塊330c可以包括比較模塊620,其可操作來(lái)將通 過(guò)相關(guān)性模塊610從搜索引擎360接收的相關(guān)性分值與閾值相關(guān)性分值進(jìn)行比較。閾值相 關(guān)性分值可以是對(duì)可能產(chǎn)生搜索者感興趣的結(jié)果的翻譯的搜索查詢的最小相關(guān)性的測(cè)量。 如果與翻譯的查詢相關(guān)聯(lián)的相關(guān)性分值低于閾值相關(guān)性分值,則查詢?cè)u(píng)估模塊330c可以 將原始搜索查詢發(fā)送給輸出模塊(例如,圖3的輸出模塊370)。替選地,如果與翻譯的搜索 查詢的相關(guān)聯(lián)的相關(guān)性分值高于閾值相關(guān)性分值,則查詢?cè)u(píng)估模塊330c可以將翻譯的搜 索查詢發(fā)送給輸出模塊。圖7是圖示另一個(gè)查詢?cè)u(píng)估模塊330d的實(shí)施方式的框圖。在一些實(shí)施方式中,查 詢?cè)u(píng)估模塊330d可以包括第一相關(guān)性模塊710和第二相關(guān)性模塊720。第一相關(guān)性模塊 710可以將原始搜索查詢發(fā)送給搜索服務(wù)360。搜索服務(wù)360可以識(shí)別與原始搜索查詢相 關(guān)聯(lián)的相關(guān)性分值的第一集合并且將相關(guān)性分值的第一集合和包括第一語(yǔ)言的相關(guān)網(wǎng)頁(yè) 的結(jié)果的第一集合提供給第一相關(guān)性模塊710。第二相關(guān)性模塊720可以將翻譯的搜索查詢傳送給搜索服務(wù)360。搜索服務(wù)360可 以識(shí)別與翻譯的搜索查詢相關(guān)聯(lián)的相關(guān)性分值的第二集合。搜索服務(wù)360可以將相關(guān)性分 值的第二集合和包括第二語(yǔ)言的相關(guān)網(wǎng)頁(yè)的結(jié)果的第二集合提供給第二相關(guān)性模塊720。
在一些實(shí)施方式中,查詢?cè)u(píng)估模塊330d可以包括比較模塊730。比較模塊730可 以比較相關(guān)性分值的第一集合和第二相關(guān)性分值以確定是原始搜索查詢還是翻譯的搜索 查詢產(chǎn)生更相關(guān)的搜索結(jié)果。在一些實(shí)施方式中,如果第一相關(guān)性分值高于第二相關(guān)性分 值,則可以將與原始搜索查詢相關(guān)聯(lián)的結(jié)果的第一集合發(fā)送給輸出模塊(例如,圖3的輸出 模塊370)。如果第二相關(guān)性分值高于第一相關(guān)性分值,則可以將與翻譯的搜索查詢相關(guān)聯(lián) 的結(jié)果的第二集合發(fā)送給輸出模塊。在一些實(shí)施方式中,如果第二相關(guān)性分值不顯著高于 第一相關(guān)性分值,則比較模塊可以偏向于選擇與原始搜索查詢相關(guān)聯(lián)的結(jié)果。在一些實(shí)施方式中,關(guān)于圖4-7公開(kāi)的查詢?cè)u(píng)估模塊330a_d的實(shí)施方式中的任何 實(shí)施方式可以與其它查詢?cè)u(píng)估模塊330a_d中的任何一個(gè)或多個(gè)組合。圖8是圖示提供跨語(yǔ)言搜索的示例過(guò)程800的流程圖。過(guò)程800接收搜索查詢 (805)。搜索查詢可以例如由輸入模塊(例如,圖IB的輸入模塊110)接收。在一些實(shí)施方 式中,搜索查詢可以從搜索引擎接收。例如,跨語(yǔ)言搜索系統(tǒng)可以是可操作來(lái)通過(guò)應(yīng)用編程 接口(API)接收搜索查詢的外接式組件或第三方搜索組件。在其它實(shí)施方式中,跨語(yǔ)言搜 索系統(tǒng)可以被集成到搜索引擎中,使得輸入模塊為搜索引擎接口網(wǎng)頁(yè)。在又一些實(shí)施方式 中,輸入模塊可以包括在客戶端設(shè)備上操作的客戶端軟件組件,其可操作來(lái)截取搜索查詢。過(guò)程獲取翻譯的搜索查詢(810)。翻譯的搜索查詢可以例如由查詢?cè)u(píng)估模塊(例 如,圖IB的查詢?cè)u(píng)估模塊120)從翻譯服務(wù)(例如,圖IB的翻譯服務(wù)122)獲取。在一些實(shí) 施方式中,翻譯服務(wù)可以產(chǎn)生翻譯的搜索查詢和與翻譯的搜索查詢相關(guān)聯(lián)的置信分值。置 信分值可以指示翻譯是正確的置信。過(guò)程將搜索查詢和翻譯的搜索查詢傳送給搜索引擎(815)。搜索查詢和翻譯的搜 索查詢可以例如由查詢?cè)u(píng)估模塊(例如,圖IB的查詢?cè)u(píng)估模塊120)傳送給搜索引擎。在 一些實(shí)施方式中,翻譯的搜索查詢可以包括原始搜索查詢的多個(gè)翻譯,其中每一個(gè)是原始 搜索查詢的不同翻譯(例如,同一語(yǔ)言或不同語(yǔ)言的)。過(guò)程接收結(jié)果和相關(guān)性分值(820)。結(jié)果和相關(guān)性分值可以例如由查詢?cè)u(píng)估模塊 (例如,圖IB的查詢?cè)u(píng)估模塊120)從搜索引擎(例如,圖IB的搜索引擎124)接收。結(jié)果 和相關(guān)性分值可以包括與原始搜索查詢相關(guān)聯(lián)的結(jié)果的第一集合和相關(guān)性分值的第一集 合。結(jié)果和相關(guān)性分值還可以包括與翻譯的搜索查詢相關(guān)聯(lián)的結(jié)果的第二集合和相關(guān)性分 值的第二集合。過(guò)程評(píng)估來(lái)自搜索查詢和翻譯的搜索查詢的結(jié)果和相關(guān)性分值(825)。結(jié)果和相 關(guān)性分值可以例如由查詢?cè)u(píng)估模塊(例如,圖IB的查詢?cè)u(píng)估模塊120)評(píng)估。在一些實(shí)施 方式中,可以將搜索查詢與本地和外來(lái)實(shí)體的列 表進(jìn)行比較、可以使用置信分值來(lái)測(cè)試翻 譯質(zhì)量、可以針對(duì)最小相關(guān)性閾值測(cè)試翻譯的搜索查詢結(jié)果的相關(guān)性分值、和/或可以基 于分別與查詢的結(jié)果相關(guān)聯(lián)的第一和第二相關(guān)性分值將原始搜索查詢結(jié)果與來(lái)自翻譯的 搜索查詢的結(jié)果進(jìn)行比較。過(guò)程基于評(píng)估的結(jié)果來(lái)派發(fā)結(jié)果(830)。結(jié)果可以例如由輸出模塊(例如,圖IB 的輸出模塊140)派發(fā)。在一些實(shí)施方式中,結(jié)果可以包括來(lái)自原始搜索查詢和/或翻譯的 搜索查詢的結(jié)果。在其它實(shí)施方式中,結(jié)果可以包括與原始搜索查詢或與翻譯的搜索查詢 最相關(guān)的網(wǎng)頁(yè)的列表。圖9是圖示提供跨語(yǔ)言搜索的示例過(guò)程900的流程圖。過(guò)程接收搜索查詢(905)。搜索查詢可以例如由輸入模塊(例如,圖IB的輸入模塊110)接收。在一些實(shí)施方式中,搜 索查詢可以從搜索引擎接口接收。例如,跨語(yǔ)言搜索系統(tǒng)可以是可操作來(lái)從搜索引擎接口 接收搜索查詢的外接式組件或第三方搜索組件。在其它實(shí)施方式中,跨語(yǔ)言搜索系統(tǒng)可以 被集成到搜索引擎中,使得輸入模塊為搜索引擎接口網(wǎng)頁(yè)。在又一些實(shí)施方式中,輸入模塊 可以包括在客戶端設(shè)備上操作的客戶端軟件組件,其可操作來(lái)截取搜索查詢。過(guò)程獲取翻譯的搜索查詢(910)。翻譯的搜索查詢可以例如由查詢?cè)u(píng)估模塊(例 如,圖IB的查詢?cè)u(píng)估模塊120)從翻譯服務(wù)(例如,圖IB的翻譯服務(wù)122)獲取。在一些實(shí) 施方式中,翻譯服務(wù)可以產(chǎn)生翻譯的搜索查詢和與翻譯的搜索查詢相關(guān)聯(lián)的置信分值。置 信分值可以指示翻譯是正確的置信。過(guò)程獲取來(lái)自原始搜索查詢和翻譯的搜索查詢的結(jié)果的相關(guān)性分值(915)。對(duì)于 原始搜索查詢和翻譯的搜索查詢結(jié)果的相關(guān)性分值可以例如由查詢?cè)u(píng)估模塊(例如,圖IB 的查詢?cè)u(píng)估模塊120)從搜索引擎(例如,圖IB的搜索引擎124)獲取。在一些實(shí)施方式中, 可以將原始搜索查詢和翻譯的搜索查詢傳送給搜索引擎。搜索引擎可以提供與原始搜索查 詢相關(guān)聯(lián)的結(jié)果的第一集合和相關(guān)性分值的第一集合,以及與翻譯的搜索查詢相關(guān)聯(lián)的結(jié) 果的第二集合和相關(guān)性分值的第二集合。過(guò)程可以比較搜索查詢和翻譯的搜索查詢的結(jié)果(920)。搜索查詢和翻譯的搜索 查詢的結(jié)果可以例如由查詢?cè)u(píng)估模塊(例如,圖IB的查詢?cè)u(píng)估模塊120)比較。在一些實(shí) 施方式中,比較原始搜索查詢和翻譯的搜索查詢的結(jié)果可以包括將相關(guān)性分值的第一集合 與相關(guān)性分值的第二集合進(jìn)行比較。在一些實(shí)施方式中,可以比較相關(guān)性分值的第一集合 與相關(guān)性分值的第二集合以基于如由相應(yīng)的相關(guān)性分值所指示的哪個(gè)搜索查詢具有更相 關(guān)的結(jié)果來(lái)確定是使用原始搜索查詢還是翻譯的搜索查詢。如果過(guò)程確定原始搜索查詢產(chǎn)生更相關(guān)的結(jié)果,則過(guò)程派發(fā)原始搜索查詢的結(jié)果 (925)。原始搜索查詢結(jié)果可以例如由輸出模塊(例如,圖IB的輸出模塊140)協(xié)同查詢?cè)u(píng) 估模塊(例如,圖IB的查詢?cè)u(píng)估模塊120)來(lái)派發(fā)。在一些實(shí)施方式中,可以將搜索查詢的 結(jié)果派發(fā)給提交該搜索查詢的客戶端設(shè)備。如果過(guò)程確定翻譯的搜索查詢產(chǎn)生更相關(guān)的結(jié)果,則過(guò)程派發(fā)翻譯的搜索查詢的 結(jié)果(930)。翻譯的搜索查詢結(jié)果可以例如由輸出模塊(例如,圖IB的輸出模塊140)協(xié)同 查詢?cè)u(píng)估模塊(例如,圖IB的查詢?cè)u(píng)估模塊120)來(lái)派發(fā)。在一些實(shí)施方式中,可以將翻譯 的搜索查詢的結(jié)果派發(fā)給提交搜索查詢的客戶端設(shè)備。圖10是圖示提供跨語(yǔ)言搜索的另一個(gè)示例方法的流程圖。過(guò)程接收搜索查詢 (1005)。搜索查詢可以例如由輸入模塊(例如,圖IB的輸入模塊110)接收。在一些實(shí)施 方式中,搜索查詢可以從搜索引擎接口接收。例如,跨語(yǔ)言搜索系統(tǒng)可以是可操作來(lái)從搜索 引擎接口接收搜索查詢的外接式組件或第三方搜索組件。在其它實(shí)施方式中,跨語(yǔ)言搜索 系統(tǒng)可以被集成到搜索引擎中,使得輸入模塊為搜索引擎接口網(wǎng)頁(yè)。在又一些實(shí)施方式中, 輸入模塊可以包括在客戶端設(shè)備上操作的客戶端軟件組件,其可操作來(lái)截取搜索查詢。過(guò)程獲取翻譯的 搜索查詢(1010)。翻譯的搜索查詢可以例如由查詢?cè)u(píng)估模塊(例 如,圖IB的查詢?cè)u(píng)估模塊120)從翻譯模塊(例如,圖IB的翻譯服務(wù)122)獲取。在一些實(shí) 施方式中,翻譯服務(wù)可以提供翻譯的搜索查詢和與翻譯的搜索查詢相關(guān)聯(lián)的置信分值。置 信分值可以指示翻譯是正確的置信。
過(guò)程獲取來(lái)自翻譯的搜索查詢的結(jié)果(1015)。翻譯的搜索查詢結(jié)果可以例如由查 詢?cè)u(píng)估模塊(例如,圖IB的查詢?cè)u(píng)估模塊120)獲取。在一些實(shí)施方式中,可以將翻譯的搜 索查詢傳送給搜索引擎(例如,圖IB的搜索引擎124)。搜索引擎可以識(shí)別與翻譯的搜索查 詢相關(guān)的網(wǎng)頁(yè)的集合以及與相關(guān)網(wǎng)頁(yè)的集合相關(guān)聯(lián)的相關(guān)性分值的集合。搜索引擎可以將 結(jié)果(例如,相關(guān)網(wǎng)頁(yè)和相關(guān)聯(lián)的相關(guān)性分值)提供給查詢?cè)u(píng)估模塊。過(guò)程確定翻譯的搜索查詢的結(jié)果是否是令人滿意的(1020)。對(duì)翻譯的搜索查詢結(jié) 果是否是令人滿意的確定例如可以由查詢?cè)u(píng)估模塊(例如,圖IB的查詢?cè)u(píng)估模塊120)執(zhí) 行。在一些實(shí)施方式中,對(duì)來(lái)自翻譯的搜索查詢的結(jié)果是否是令人滿意的確定可以基于相 關(guān)性分值的集合(例如,單個(gè)地或聚合地)滿足最小相關(guān)性分值閾值、與翻譯的搜索查詢相 關(guān)聯(lián)的結(jié)果的相關(guān)性分值好于與原始搜索查詢相關(guān)聯(lián)的結(jié)果的相關(guān)性分值、與翻譯的搜索 查詢相關(guān)聯(lián)的翻譯置信分值滿足最小置信閾值、或來(lái)自搜索查詢或翻譯的搜索查詢的標(biāo)志 與來(lái)自實(shí)體數(shù)據(jù)存儲(chǔ)的實(shí)體相匹配。如果過(guò)程確定翻譯的搜索查詢的結(jié)果不是令人滿意的,則過(guò)程派發(fā)原始搜索查詢 的結(jié)果(1025)。原始搜索查詢的結(jié)果可以例如由查詢?cè)u(píng)估模塊(例如,圖IB的查詢?cè)u(píng)估模 塊120)協(xié)同輸出模塊(例如,圖IB的輸出模塊140)來(lái)派發(fā)。在一些實(shí)施方式中,可以將 搜索查詢的結(jié)果派發(fā)給提交該搜索查詢的客戶端設(shè)備。
如果過(guò)程確定翻譯的搜索查詢的結(jié)果是令人滿意的,則過(guò)程派發(fā)翻譯的搜索查詢 的結(jié)果(1030)。翻譯的搜索查詢的結(jié)果可以例如由查詢?cè)u(píng)估模塊(例如,圖IB的查詢?cè)u(píng)估 模塊120)協(xié)同輸出模塊(例如,圖IB的輸出模塊140)來(lái)派發(fā)。在一些實(shí)施方式中,可以 將翻譯的搜索查詢的結(jié)果派發(fā)給提交搜索查詢的客戶端設(shè)備。在本說(shuō)明書(shū)中描述的主題和功能性操作的實(shí)施例可以在數(shù)字電子電路,或者在計(jì) 算機(jī)軟件、固件或硬件,包括在本說(shuō)明書(shū)中公開(kāi)的結(jié)構(gòu)以及其結(jié)構(gòu)等價(jià)物,或者在以上的一 個(gè)或多個(gè)的組合中實(shí)現(xiàn)??梢詫⒃诒菊f(shuō)明書(shū)中描述的主題的實(shí)施例實(shí)現(xiàn)為一個(gè)或多個(gè)計(jì)算 機(jī)程序產(chǎn)品,即編碼在有形的程序載體上的、由數(shù)據(jù)處理裝置執(zhí)行或控制數(shù)據(jù)處理裝置的 操作的計(jì)算機(jī)程序指令的一個(gè)或多個(gè)模塊。有形的程序載體可以是傳播信號(hào)或計(jì)算機(jī)可讀 介質(zhì)。傳播信號(hào)是非自然生成的信號(hào),例如機(jī)器生成的電的、光學(xué)或電磁的信號(hào),其被生成 以編碼用于傳輸?shù)竭m當(dāng)接收器裝置的信息以供計(jì)算機(jī)執(zhí)行。計(jì)算機(jī)可讀介質(zhì)可以是機(jī)器可 讀存儲(chǔ)設(shè)備、機(jī)器可讀存儲(chǔ)基片、存儲(chǔ)器設(shè)備、形成機(jī)器可讀傳播信號(hào)的物質(zhì)成分或以上的 一個(gè)或多個(gè)的組合。術(shù)語(yǔ)“數(shù)據(jù)處理裝置”包含用于處理數(shù)據(jù)的所有裝置、設(shè)備以及機(jī)器,包括例如可 編程處理器、計(jì)算機(jī)或多個(gè)處理器或計(jì)算機(jī)。除硬件外所述裝置可以包括創(chuàng)建用于討論中 的計(jì)算機(jī)程序的執(zhí)行環(huán)境的代碼,例如構(gòu)成處理器固件、協(xié)議堆棧、數(shù)據(jù)庫(kù)管理系統(tǒng)、操作 系統(tǒng)或以上一個(gè)或多個(gè)的組合的代碼。計(jì)算機(jī)程序(也稱作程序、軟件、軟件應(yīng)用、腳本或代碼)可以以任何形式的編程 語(yǔ)言編寫(xiě),所述編程語(yǔ)言包括編譯或解釋語(yǔ)言,或者說(shuō)明性或過(guò)程性語(yǔ)言,并且其可以以任 何形式部署,包括作為獨(dú)立程序或作為模塊、組件、子程序或適于在計(jì)算環(huán)境中使用的其它 單元。計(jì)算機(jī)程序沒(méi)有必要對(duì)應(yīng)于文件系統(tǒng)中的文件。程序可以被存儲(chǔ)在保持其它程序或 數(shù)據(jù)的文件(例如,存儲(chǔ)在標(biāo)記語(yǔ)言文檔中的一個(gè)或多個(gè)腳本)的一部分、專(zhuān)用于討論中的 程序的單個(gè)文件或者多個(gè)協(xié)調(diào)文件(例如,存儲(chǔ)一個(gè)或多個(gè)模塊、子程序或部分代碼的文件)中。計(jì)算機(jī)程序可以被部署為在一個(gè)計(jì)算機(jī)上或者在位于一個(gè)地點(diǎn)或跨多個(gè)地點(diǎn)分布 并且由通信網(wǎng)絡(luò)互連的多個(gè)計(jì)算機(jī)上執(zhí)行。在本說(shuō)明書(shū)中描述的過(guò)程和邏輯流可以由執(zhí)行一個(gè)或多個(gè)計(jì)算機(jī)程序的一個(gè)或 多個(gè)可編程處理器執(zhí)行以通過(guò)操作輸入數(shù)據(jù)并生成輸出來(lái)執(zhí)行功能。過(guò)程和邏輯流還可 以通過(guò)專(zhuān)用邏輯電路執(zhí)行,以及裝置還可以被實(shí)現(xiàn)為專(zhuān)用邏輯電路,專(zhuān)用邏輯電路例如 FPGA (場(chǎng)可編程門(mén)陣列)或ASIC (專(zhuān)用集成電路)。
適于執(zhí)行計(jì)算機(jī)程序的處理器包括例如通用和專(zhuān)用微處理器兩者,以及任何類(lèi)型 的數(shù)字計(jì)算機(jī)的任何一個(gè)或多個(gè)處理器。通常,處理器將從只讀存儲(chǔ)器或隨機(jī)存取存儲(chǔ)器 或兩者接收指令和數(shù)據(jù)。計(jì)算機(jī)的主要元件是用于執(zhí)行指令的處理器和用于存儲(chǔ)指令和數(shù) 據(jù)的一個(gè)或多個(gè)存儲(chǔ)器設(shè)備。通常,計(jì)算機(jī)還包括用于存儲(chǔ)數(shù)據(jù)的一個(gè)或多個(gè)海量存儲(chǔ)設(shè) 備,例如磁盤(pán)、磁光盤(pán)或光盤(pán),或可操作地耦接到所述一個(gè)或多個(gè)海量存儲(chǔ)設(shè)備以從其接收 數(shù)據(jù)或向其傳送數(shù)據(jù),或者兩者。然而,計(jì)算機(jī)不必具有這樣的設(shè)備。此外,計(jì)算機(jī)能夠被 嵌入另一個(gè)設(shè)備中,所述設(shè)備例如移動(dòng)電話、個(gè)人數(shù)字助理(PDA)、移動(dòng)音頻或視頻播放器、 游戲控制臺(tái)、全球定位系統(tǒng)(GPS)接收器,僅列出一些。適于存儲(chǔ)計(jì)算機(jī)程序指令和數(shù)據(jù)的計(jì)算機(jī)可讀介質(zhì)包括所有形式的非易失性存 儲(chǔ)器、媒體和存儲(chǔ)器設(shè)備,例如包括半導(dǎo)體存儲(chǔ)器設(shè)備,例如EPROM、EEPROM和閃存設(shè)備; 磁盤(pán),例如內(nèi)部硬盤(pán)或活動(dòng)盤(pán);磁光盤(pán);以及⑶ROM和DVD ROM盤(pán)。處理器和存儲(chǔ)器可以由 專(zhuān)用邏輯電路補(bǔ)充,或合并入專(zhuān)用邏輯電路。為了提供與用戶的交互,本說(shuō)明書(shū)中描述的主題的實(shí)施例可以在具有下述的計(jì)算 機(jī)上實(shí)現(xiàn)用于向用戶顯示信息的顯示設(shè)備,例如CRT(陰極射線管)或LCD(液晶顯示)監(jiān) 視器,以及用戶通過(guò)其可以向計(jì)算機(jī)提供輸入的鍵盤(pán)和指示設(shè)備,例如鼠標(biāo)或跟蹤球。也可 以使用其它類(lèi)型的設(shè)備來(lái)提供與用戶的交互;例如,提供給用戶的反饋可以是任何形式的 感知反饋,例如視覺(jué)反饋、聽(tīng)覺(jué)反饋或觸覺(jué)反饋;以及可以以任何形式,包括聲學(xué)的、話語(yǔ)或 觸覺(jué)的輸入,接收來(lái)自用戶的輸入。本說(shuō)明書(shū)中描述的主題的實(shí)施例可以在包括例如作為數(shù)據(jù)服務(wù)器的后端組件、或 包括例如應(yīng)用服務(wù)器的中間件組件、或包括例如具有用戶通過(guò)其可以與在本說(shuō)明書(shū)中描述 的主題的實(shí)施方式交互的圖形用戶界面或Web瀏覽器的客戶端計(jì)算機(jī)的前端組件、或者一 個(gè)或多個(gè)這樣的后端、中間件或前端組件的任何組合的計(jì)算系統(tǒng)中實(shí)現(xiàn)。系統(tǒng)的組件可以 通過(guò)例如通信網(wǎng)絡(luò)的任何形式或介質(zhì)的數(shù)字?jǐn)?shù)據(jù)通信互連。通信網(wǎng)絡(luò)的示例包括局域網(wǎng) (“LAN")和例如因特網(wǎng)的廣域網(wǎng)(“WAN")。計(jì)算系統(tǒng)可以包括客戶端和服務(wù)器??蛻舳撕头?wù)器通常彼此遠(yuǎn)離并且典型地 通過(guò)通信網(wǎng)絡(luò)交互??蛻舳撕头?wù)器的關(guān)系依靠在各個(gè)計(jì)算機(jī)上運(yùn)行并且彼此具有客戶 端_服務(wù)器關(guān)系的計(jì)算機(jī)程序產(chǎn)生。雖然本說(shuō)明書(shū)包含許多具體實(shí)施方式
細(xì)節(jié),但是這些細(xì)節(jié)不應(yīng)當(dāng)被解釋為對(duì)任何 發(fā)明或者所主張的內(nèi)容的范圍的限定,而應(yīng)當(dāng)被解釋為針對(duì)特定發(fā)明的特定實(shí)施例的特征 的描述。在本說(shuō)明書(shū)中在分離的實(shí)施例的語(yǔ)境中描述的某些特征也可以在以單個(gè)實(shí)施例的 組合中實(shí)現(xiàn)。相反地,在單個(gè)實(shí)施例的語(yǔ)境中描述的各種特征也可以分離地在多個(gè)實(shí)施例 中實(shí)現(xiàn)或者在任何適當(dāng)?shù)淖咏M合中實(shí)現(xiàn)。此外,盡管特征可能在上面被描述為在某些組合 中起作用,甚至最初主張如此,但是來(lái)自所主張的組合的一個(gè)或多個(gè)特征在一些情況下可以從組合中刪去,并且所主張的組合可以指向子組合或者子組合的變體。類(lèi)似地,雖然在附圖中以特定順序描述了操作,但是不應(yīng)當(dāng)理解為需要這樣的操 作以所示的特定順序被執(zhí)行或者以連續(xù)順序被執(zhí)行、或者需要全部圖示的操作均被執(zhí)行才 能實(shí)現(xiàn)所期望的結(jié)果。在某些環(huán)境中,多任務(wù)以及并行處理可以是有利的。此外,在如上所 述實(shí)施例中的各種系統(tǒng)組件的分離不應(yīng)當(dāng)被理解為在全部實(shí)施例中均需要這樣的分離,而 應(yīng)當(dāng)理解的是,描述的程序組件和系統(tǒng)通??梢员患傻揭黄鸪蔀閱蝹€(gè)軟件產(chǎn)品或封裝為 多個(gè)軟件產(chǎn)品。已描述了本說(shuō)明書(shū)中描述的主題的特定實(shí) 施例。其它實(shí)施例在所附權(quán)利要求的范 圍內(nèi)。例如,權(quán)利要求中記載的行為可以以不同的順序來(lái)執(zhí)行并且仍然實(shí)現(xiàn)所期望的結(jié)果。 作為一個(gè)示例,在附圖中描述的過(guò)程不必需要所示出的特定順序或者連續(xù)順序才能實(shí)現(xiàn)所 期望的結(jié)果。在某些實(shí)施方式中,多任務(wù)以及并行處理可以是有利的。
權(quán)利要求
一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括從客戶端設(shè)備接收搜索查詢,所述搜索查詢是以第一語(yǔ)言提交的;獲取翻譯的搜索查詢,所述翻譯的搜索查詢是所述搜索查詢到第二語(yǔ)言的翻譯;接收對(duì)所述搜索查詢作出響應(yīng)的結(jié)果的第一集合以及對(duì)所述翻譯的搜索查詢作出響應(yīng)的結(jié)果的第二集合,所述結(jié)果的第一集合包括網(wǎng)頁(yè)的第一集合和相關(guān)性分值的第一集合以及所述結(jié)果的第二集合包括網(wǎng)頁(yè)的第二集合和相關(guān)性分值的第二集合;將所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合進(jìn)行比較;以及響應(yīng)于對(duì)所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合的所述比較,派發(fā)包括所述結(jié)果的第一集合或所述結(jié)果的第二集合中的一個(gè)或兩者的至少部分的結(jié)果頁(yè)面。
2.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括使用與所述網(wǎng)頁(yè)的第一集合 的第一部分和所述網(wǎng)頁(yè)的第二集合的第二部分相關(guān)聯(lián)的所述相關(guān)性分值,派發(fā)所述第一部 分和所述第二部分,所述第一部分和所述第二部分包括最相關(guān)的結(jié)果。
3.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中將所述相關(guān)性分值的第一集合與所述 相關(guān)性分值的第二集合進(jìn)行比較包括聚合所述相關(guān)性分值的第一集合; 聚合所述相關(guān)性分值的第二集合;將所述相關(guān)性分值的第二集合的所述聚合與所述相關(guān)性分值的第一集合的所述聚合 進(jìn)行比較;其中,如果所述相關(guān)性分值的第二集合的所述聚合大于所述相關(guān)性分值的第一集合的 所述聚合,則派發(fā)來(lái)自所述結(jié)果的第二集合的結(jié)果,否則派發(fā)來(lái)自所述搜索結(jié)果的第一集 合的結(jié)果。
4.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括如果對(duì)所述相關(guān)性分值的第 一集合和所述相關(guān)性分值的第二集合的所述比較識(shí)別所述相關(guān)性分值的第二集合更相關(guān), 則獲取翻譯的網(wǎng)頁(yè),并且基于從所述客戶端設(shè)備接收對(duì)所述網(wǎng)頁(yè)的選擇來(lái)派發(fā)所述翻譯的 網(wǎng)頁(yè)。
5.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括將來(lái)自所述相關(guān)性分值的第二集合的相關(guān)性分值的聚合與閾值相關(guān)性分值進(jìn)行比較;以及如果所述相關(guān)性分值的聚合超過(guò)所述閾值相關(guān)性分值,則派發(fā)搜索結(jié)果。
6.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括 獲取與所述翻譯的搜索查詢相對(duì)應(yīng)的先前查詢的數(shù)量; 將所述先前查詢的數(shù)量與查詢的閾值數(shù)量進(jìn)行比較;以及其中,基于對(duì)所述先前查詢的數(shù)量與所述查詢的閾值數(shù)量的所述比較來(lái)派發(fā)所述結(jié)果 的第二集合。
7.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述相關(guān)性分值的第一集合和所述相 關(guān)性分值的第二集合每一個(gè)包括相關(guān)性因素和排名因素,所述相關(guān)性因素測(cè)量來(lái)自所述搜 索查詢或所述翻譯的搜索查詢的所述結(jié)果與所述搜索查詢相匹配的程度,以及所述排名因 素測(cè)量網(wǎng)頁(yè)被其它網(wǎng)頁(yè)鏈接的頻率。
8.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述相關(guān)性分值的第一集合基于對(duì)來(lái)自所述第一搜索查詢的結(jié)果的第一點(diǎn)進(jìn)率的分析,以及所述相關(guān)性分值的第二集合基于對(duì) 來(lái)自所述翻譯的搜索查詢的結(jié)果的第二點(diǎn)進(jìn)率的分析。
9.一種存儲(chǔ)在一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)中并且包括由處理系統(tǒng)可執(zhí)行以及在被執(zhí) 行后促使所述處理系統(tǒng)執(zhí)行操作的指令的軟件,所述操作包括從客戶端設(shè)備接收搜索查詢,所述搜索查詢是以第一語(yǔ)言提交的;獲取翻譯的搜索查詢,所述翻譯的搜索查詢是所述搜索查詢到第二語(yǔ)言的翻譯;接收對(duì)所述搜索查詢作出響應(yīng)的結(jié)果的第一集合以及對(duì)所述翻譯的搜索查詢作出響 應(yīng)的結(jié)果的第二集合,所述結(jié)果的第一集合包括網(wǎng)頁(yè)的第一集合和相關(guān)性分值的第一集合 以及所述結(jié)果的第二集合包括網(wǎng)頁(yè)的第二集合和相關(guān)性分值的第二集合;將所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合進(jìn)行比較;以及基于對(duì)所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合的所述比較,派發(fā)包 括所述結(jié)果的第一集合或所述結(jié)果的第二集合中的一個(gè)或兩者的至少部分的結(jié)果頁(yè)面。
10.如權(quán)利要求9所述的軟件,其中所述指令可被進(jìn)一步操作來(lái)促使所述處理系統(tǒng)執(zhí) 行操作,所述操作包括使用與所述網(wǎng)頁(yè)的第一集合的第一部分和所述網(wǎng)頁(yè)的第二集合的 第二部分相關(guān)聯(lián)的所述相關(guān)性分值,派發(fā)所述第一部分和所述第二部分,所述第一部分和 所述第二部分包括最相關(guān)的結(jié)果。
11.如權(quán)利要求9所述的軟件,其中所述指令可被進(jìn)一步操作來(lái)促使所述處理系統(tǒng)執(zhí) 行操作,所述操作包括如果對(duì)所述相關(guān)性分值的第一集合和所述相關(guān)性分值的第二集合 的所述比較識(shí)別所述相關(guān)性分值的第二集合更相關(guān),則獲取翻譯的網(wǎng)頁(yè),并且基于從所述 客戶端設(shè)備接收對(duì)所述網(wǎng)頁(yè)的選擇來(lái)派發(fā)所述翻譯的網(wǎng)頁(yè)。
12.如權(quán)利要求9所述的軟件,其中所述指令可被進(jìn)一步操作來(lái)促使所述處理系統(tǒng)執(zhí) 行操作,所述操作包括將來(lái)自所述相關(guān)性分值的第二集合的相關(guān)性分值的聚合與閾值相關(guān)性分值進(jìn)行比較;以及如果所述相關(guān)性分值的聚合超過(guò)所述閾值相關(guān)性分值,則派發(fā)搜索結(jié)果。
13.如權(quán)利要求9所述的軟件,其中所述指令可被進(jìn)一步操作來(lái)促使所述處理系統(tǒng)執(zhí) 行操作,所述操作包括獲取與所述翻譯的搜索查詢相對(duì)應(yīng)的先前查詢的數(shù)量;將所述先前查詢的數(shù)量與查詢的閾值數(shù)量進(jìn)行比較;以及其中,基于對(duì)所述先前查詢的數(shù)量與所述查詢的閾值數(shù)量的所述比較來(lái)派發(fā)所述結(jié)果 的第二集合。
14.如權(quán)利要求9所述的軟件,其中所述相關(guān)性分值的第一集合和所述相關(guān)性分值的 第二集合每一個(gè)包括相關(guān)性因素和排名因素,所述相關(guān)性因素測(cè)量來(lái)自所述搜索查詢或所 述翻譯的搜索查詢的所述結(jié)果與所述搜索查詢相匹配的程度,以及所述排名因素測(cè)量網(wǎng)頁(yè) 被其它網(wǎng)頁(yè)鏈接的頻率。
15.如權(quán)利要求9所述的軟件,其中所述相關(guān)性分值的第一集合基于對(duì)來(lái)自所述第一 搜索查詢的結(jié)果的第一點(diǎn)進(jìn)率的分析,以及所述相關(guān)性分值的第二集合基于對(duì)來(lái)自所述翻 譯的搜索查詢的結(jié)果的第二點(diǎn)進(jìn)率的分析。
16.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括從客戶端設(shè)備接收搜索查詢,所述搜索查詢是以第一語(yǔ)言提交的; 獲取翻譯的搜索查詢,所述翻譯的搜索查詢是所述搜索查詢到第二語(yǔ)言的翻譯; 接收對(duì)所述搜索查詢作出響應(yīng)的第一結(jié)果,所述第一結(jié)果包括具有第一相關(guān)性分值的 第一網(wǎng)頁(yè);接收對(duì)所述翻譯的搜索查詢作出響應(yīng)的第二結(jié)果,所述第二結(jié)果包括具有第二相關(guān)性 分值的第二網(wǎng)頁(yè);將所述結(jié)果的第一集合和所述結(jié)果的第二集合組合成搜索結(jié)果的有序列表; 從所述第一和第二相關(guān)性分值導(dǎo)出最相關(guān)到最少相關(guān)的順序,所述順序包括所述搜索 結(jié)果的有序列表的所述順序;派發(fā)包括所述搜索結(jié)果的有序列表的指定數(shù)量的結(jié)果頁(yè)面。
17.如權(quán)利要求16所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括如果所述結(jié)果頁(yè)面包括來(lái) 自所述搜索結(jié)果的第二集合的網(wǎng)頁(yè),則獲取翻譯的網(wǎng)頁(yè)。
18.如權(quán)利要求16所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括將來(lái)自所述搜索結(jié)果的有序列表的相應(yīng)相關(guān)性分值與閾值相關(guān)性分值進(jìn)行比較;以及 如果相應(yīng)相關(guān)性分值沒(méi)有超過(guò)所述閾值相關(guān)性分值,則從所述搜索結(jié)果的有序列表排 除所述結(jié)果。
19.如權(quán)利要求16所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括 獲取與所述翻譯的搜索查詢相對(duì)應(yīng)的先前查詢的數(shù)量;將所述先前查詢的數(shù)量與查詢的閾值數(shù)量進(jìn)行比較;以及其中,如果關(guān)于所述翻譯的搜索查詢的所述先前查詢的數(shù)量超過(guò)所述查詢的閾值數(shù) 量,則將來(lái)自所述搜索結(jié)果的第二集合的結(jié)果包括在所述搜索結(jié)果的有序列表中。
20.如權(quán)利要求16所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述相關(guān)性分值的第一集合基于對(duì) 來(lái)自所述第一搜索查詢的結(jié)果的第一點(diǎn)進(jìn)率的分析,以及所述相關(guān)性分值的第二集合基于 對(duì)來(lái)自所述翻譯的搜索查詢的結(jié)果的第二點(diǎn)進(jìn)率的分析。
21.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括從客戶端設(shè)備接收搜索查詢,所述搜索查詢是以第一語(yǔ)言提交的; 獲取翻譯的搜索查詢,所述翻譯的搜索查詢是所述搜索查詢到第二語(yǔ)言的翻譯; 接收對(duì)所述搜索查詢作出響應(yīng)的第一結(jié)果,所述第一結(jié)果包括具有第一相關(guān)性分值的 第一網(wǎng)頁(yè);接收對(duì)所述翻譯的搜索查詢作出響應(yīng)的第二結(jié)果,所述第二結(jié)果包括具有第二相關(guān)性 分值的第二網(wǎng)頁(yè);將所述第一相關(guān)性分值與所述第二相關(guān)性分值進(jìn)行比較;以及 如果所述第一相關(guān)性分值超過(guò)所述第二相關(guān)性分值,則派發(fā)包括所述第一結(jié)果的結(jié)果 頁(yè)面,如果所述第二相關(guān)性分值超過(guò)所述第一相關(guān)性分值,則派發(fā)包括所述第二結(jié)果的所 述結(jié)果頁(yè)面。
22.—種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括 接收第一語(yǔ)言的原始搜索查詢;獲取與所述原始搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢,所述翻譯的搜索查詢?yōu)榈诙Z(yǔ)評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于跨語(yǔ)言搜索的候選;以及如果確定所述翻譯的搜索查詢是用于跨語(yǔ)言搜索的候選,則生成與所述翻譯的搜索查 詢相關(guān)的搜索結(jié)果。
23.如權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中評(píng)估所述翻譯的搜索查詢以確定所 述翻譯的搜索查詢是否是用于跨語(yǔ)言搜索的候選基于與所述翻譯相關(guān)聯(lián)的翻譯置信分值;或者 搜索查詢包括與所述第一或第二語(yǔ)言相關(guān)聯(lián)的實(shí)體。
24.如權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括如果要派發(fā)與所述翻譯的搜索查詢相關(guān)的搜索結(jié)果,則獲取產(chǎn)生自所述翻譯的搜索查 詢的網(wǎng)頁(yè)的翻譯的摘錄;以及派發(fā)包括所述產(chǎn)生自所述翻譯的搜索查詢的網(wǎng)頁(yè)的翻譯的摘錄的搜索結(jié)果頁(yè)面。
25.如權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中基于搜索查詢包括與所述第一或第 二語(yǔ)言相關(guān)聯(lián)的實(shí)體來(lái)評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于 跨語(yǔ)言搜索的候選包括確定所述搜索查詢是否包括來(lái)自對(duì)所述第一語(yǔ)言為本地的實(shí)體的列表的實(shí)體;以及 如果所述原始搜索查詢包括來(lái)自所述對(duì)所述第一語(yǔ)言為本地的實(shí)體的列表的實(shí)體,則 生成關(guān)于所述原始搜索查詢的所述搜索結(jié)果。
26.如權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中基于搜索查詢包括與所述第一或第 二語(yǔ)言相關(guān)聯(lián)的實(shí)體來(lái)評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于 跨語(yǔ)言搜索的候選包括確定所述翻譯的搜索查詢是否包括來(lái)自外來(lái)實(shí)體的列表的實(shí)體;以及 如果所述翻譯的搜索查詢包括來(lái)自與所述第二語(yǔ)言有關(guān)的所述外來(lái)實(shí)體的列表的外 來(lái)實(shí)體,則生成關(guān)于所述翻譯的搜索查詢的所述搜索結(jié)果。
27.如權(quán)利要求26所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中評(píng)估所述翻譯的搜索查詢以確定所 述翻譯的搜索查詢是否是用于跨語(yǔ)言搜索的候選包括 識(shí)別包括來(lái)自所述外來(lái)實(shí)體的所述實(shí)體的先前查詢的數(shù)量; 將所述包括所述外來(lái)實(shí)體的先前查詢的數(shù)量與查詢的閾值數(shù)量進(jìn)行比較;以及 如果超過(guò)所述查詢的閾值數(shù)量,則確定包括所述外來(lái)實(shí)體的所述翻譯的搜索查詢是候選;其中,如果確定所述翻譯的搜索查詢是候選,則生成與所述翻譯的搜索查詢相關(guān)聯(lián)的結(jié)果。
28.如權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中評(píng)估所述翻譯的搜索查詢以確定所 述翻譯的搜索查詢是否是用于跨語(yǔ)言搜索的候選包括接收與所述翻譯的搜索查詢相關(guān)聯(lián)的翻譯置信分值,所述翻譯置信分值測(cè)量與所述翻 譯的搜索查詢的翻譯相關(guān)聯(lián)的置信度;將所述翻譯置信分值與閾值置信分值進(jìn)行比較;以及如果所述翻譯置信分值超過(guò)所述閾值置信分值,則確定所述翻譯的搜索查詢是用于跨 語(yǔ)言搜索的候選。
29.如權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中評(píng)估所述翻譯的搜索查詢以確定所 述翻譯的搜索查詢是否是用于跨語(yǔ)言搜索的候選包括識(shí)別對(duì)所述翻譯的搜索查詢作出響應(yīng)的網(wǎng)頁(yè)的集合以及關(guān)于所述網(wǎng)頁(yè)的第二集合的 相關(guān)性分值的集合;將所述相關(guān)性分值與閾值相關(guān)性分值進(jìn)行比較;以及如果所述相關(guān)性分值超過(guò)所述閾值相關(guān)性分值,則確定所述翻譯的搜索查詢是用于跨 語(yǔ)言搜索的候選。
30.如權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中評(píng)估所述翻譯的搜索查詢以確定所 述翻譯的搜索查詢是否是用于跨語(yǔ)言搜索的候選包括獲取與所述翻譯的搜索查詢相對(duì)應(yīng)的先前查詢的數(shù)量; 將所述先前查詢的數(shù)量與查詢的閾值數(shù)量進(jìn)行比較;以及如果所述先前查詢的數(shù)量超過(guò)所述查詢的閾值數(shù)量,則確定所述翻譯的搜索查詢是用 于跨語(yǔ)言搜索的候選。
31.一種存儲(chǔ)在一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)中并且包括由處理系統(tǒng)可執(zhí)行以及在被這 樣執(zhí)行后促使所述處理系統(tǒng)執(zhí)行操作的指令的軟件,所述操作包括接收第一語(yǔ)言的原始搜索查詢;獲取與所述原始搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢,所述翻譯的搜索查詢?yōu)榈诙Z(yǔ)H ;評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于跨語(yǔ)言搜索的候選;以及如果確定所述翻譯的搜索查詢是用于跨語(yǔ)言搜索的候選,則生成與所述翻譯的搜索查 詢相關(guān)的搜索結(jié)果。
32.如權(quán)利要求31所述的軟件,其中評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索 查詢是否是用于跨語(yǔ)言搜索的候選基于與所述翻譯相關(guān)聯(lián)的翻譯置信分值;或者 搜索查詢包括與所述第一或第二語(yǔ)言相關(guān)聯(lián)的實(shí)體。
33.如權(quán)利要求31所述的軟件,可進(jìn)一步操作來(lái)促使所述處理系統(tǒng)執(zhí)行操作,所述操 作包括如果與所述翻譯的搜索查詢相關(guān)的搜索結(jié)果待被派發(fā),則獲取產(chǎn)生自所述翻譯的搜索 查詢的網(wǎng)頁(yè)的翻譯的摘錄;以及派發(fā)包括所述產(chǎn)生自所述翻譯的搜索查詢的網(wǎng)頁(yè)的翻譯的摘錄的搜索結(jié)果頁(yè)面。
34.如權(quán)利要求31所述的軟件,其中基于搜索查詢包括與所述第一或第二語(yǔ)言相關(guān)聯(lián) 的實(shí)體來(lái)評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于跨語(yǔ)言搜索的 候選包括確定所述搜索查詢是否包括來(lái)自對(duì)所述第一語(yǔ)言為本地的實(shí)體的列表的實(shí)體;以及 如果所述原始搜索查詢包括來(lái)自所述對(duì)所述第一語(yǔ)言為本地的實(shí)體的列表的實(shí)體,則 生成關(guān)于所述原始搜索查詢的所述搜索結(jié)果。
35.如權(quán)利要求31所述的軟件,其中基于搜索查詢包括與所述第一或第二語(yǔ)言相關(guān)聯(lián) 的實(shí)體來(lái)評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于跨語(yǔ)言搜索的候選包括確定所述翻譯的搜索查詢是否包括來(lái)自外來(lái)實(shí)體的列表的實(shí)體;以及 如果所述翻譯的搜索查詢包括來(lái)自與所述第二語(yǔ)言有關(guān)的所述外來(lái)實(shí)體的列表的外 來(lái)實(shí)體,則生成關(guān)于所述翻譯的搜索查詢的所述搜索結(jié)果。
36.如權(quán)利要求35所述的軟件,其中評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索 查詢是否是用于跨語(yǔ)言搜索的候選包括識(shí)別包括來(lái)自所述外來(lái)實(shí)體的所述實(shí)體的先前查詢的數(shù)量; 將所述包括所述外來(lái)實(shí)體的先前查詢的數(shù)量與查詢的閾值數(shù)量進(jìn)行比較;以及 如果超過(guò)所述查詢的閾值數(shù)量,則確定包括所述外來(lái)實(shí)體的所述翻譯的搜索查詢是候選;其中,如果確定所述翻譯的搜索查詢是候選,則生成與所述翻譯的搜索查詢相關(guān)聯(lián)的結(jié)果。
37.如權(quán)利要求31所述的軟件,其中評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索 查詢是否是用于跨語(yǔ)言搜索的候選包括接收與所述翻譯的搜索查詢相關(guān)聯(lián)的翻譯置信分值,所述翻譯置信分值測(cè)量與所述翻 譯的搜索查詢的翻譯相關(guān)聯(lián)的置信度;將所述翻譯置信分值與閾值置信分值進(jìn)行比較;以及如果所述翻譯置信分值超過(guò)所述閾值置信分值,則確定所述翻譯的搜索查詢是用于跨 語(yǔ)言搜索的候選。
38.如權(quán)利要求31所述的軟件,其中評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索 查詢是否是用于跨語(yǔ)言搜索的候選包括識(shí)別對(duì)所述翻譯的搜索查詢作出響應(yīng)的網(wǎng)頁(yè)的集合以及關(guān)于所述網(wǎng)頁(yè)的第二集合的 相關(guān)性分值的集合;將所述相關(guān)性分值與閾值相關(guān)性分值進(jìn)行比較;以及如果所述相關(guān)性分值超過(guò)所述閾值相關(guān)性分值,則確定所述翻譯的搜索查詢是用于跨 語(yǔ)言搜索的候選。
39.如權(quán)利要求31所述的軟件,其中評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索 查詢是否是用于跨語(yǔ)言搜索的候選包括獲取與所述翻譯的搜索查詢相對(duì)應(yīng)的先前查詢的數(shù)量; 將所述先前查詢的數(shù)量與查詢的閾值數(shù)量進(jìn)行比較;以及如果所述先前查詢的數(shù)量超過(guò)所述查詢的閾值數(shù)量,則確定所述翻譯的搜索查詢是用 于跨語(yǔ)言搜索的候選。
40.一種系統(tǒng),包括輸入模塊,所述輸入模塊可操作來(lái)從用戶接收第一語(yǔ)言的原始搜索查詢; 查詢?cè)u(píng)估模塊,所述查詢?cè)u(píng)估模塊可操作來(lái)評(píng)估包括所述原始搜索查詢到第二語(yǔ)言的 翻譯的翻譯的搜索查詢,所述查詢?cè)u(píng)估模塊可操作來(lái)確定與所述翻譯的搜索查詢的結(jié)果相 關(guān)聯(lián)的相關(guān)性分值、獲取與所述翻譯相關(guān)聯(lián)的翻譯置信分值或識(shí)別所述翻譯的搜索查詢中 的包括與所述第二語(yǔ)言相關(guān)聯(lián)的實(shí)體的一個(gè)或多個(gè)詞語(yǔ);以及輸出模塊,所述輸出模塊可操作來(lái)將包括對(duì)所述查詢?cè)u(píng)估模塊作出響應(yīng)的產(chǎn)生自所述原始搜索查詢或所述翻譯的搜索查詢的頁(yè)面的列表的結(jié)果頁(yè)面派發(fā)給所述用戶。
41.如權(quán)利要求40所述的系統(tǒng),其中,如果所述搜索結(jié)果包括來(lái)自所述翻譯的搜索查 詢的結(jié)果,則所述輸出模塊可操作來(lái)獲取產(chǎn)生自所述翻譯的搜索查詢的網(wǎng)頁(yè)的翻譯的摘 錄,并且其中所述搜索結(jié)果頁(yè)面包括產(chǎn)生自所述翻譯的搜索查詢的所述網(wǎng)頁(yè)的所述翻譯的 摘錄。
42.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括 接收第一語(yǔ)言的原始搜索查詢;獲取與所述原始搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢,所述翻譯的搜索查詢?yōu)榈诙Z(yǔ)H ;評(píng)估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于跨語(yǔ)言搜索的候選;以及如果所述翻譯的搜索查詢是用于所述跨語(yǔ)言搜索的候選,則 接收對(duì)所述搜索查詢作出響應(yīng)的結(jié)果的第一集合以及對(duì)所述翻譯的搜索查詢作出響 應(yīng)的結(jié)果的第二集合,所述結(jié)果的第一集合包括網(wǎng)頁(yè)的第一集合和相關(guān)性分值的第一集合 以及所述結(jié)果的第二集合包括網(wǎng)頁(yè)的第二集合和相關(guān)性分值的第二集合;將所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合進(jìn)行比較;以及 響應(yīng)于對(duì)所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合的所述比較,派發(fā) 包括所述結(jié)果的第一集合或所述結(jié)果的第二集合中的一個(gè)或兩者的至少部分的結(jié)果頁(yè)面; 以及如果所述翻譯的搜索查詢不是用于所述跨語(yǔ)言搜索的候選,則派發(fā)關(guān)于所述原始搜索 查詢的搜索結(jié)果。
全文摘要
在其中可以執(zhí)行跨語(yǔ)言搜索的方法、系統(tǒng)和裝置,包括計(jì)算機(jī)程序產(chǎn)品??梢詸z查搜索查詢以確定其是否是用于跨語(yǔ)言搜索的候選。在識(shí)別候選后,可以使用與搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢來(lái)執(zhí)行搜索??梢詫⒎g的搜索查詢的結(jié)果派發(fā)給提交搜索查詢的客戶端設(shè)備。
文檔編號(hào)G06F17/30GK101868797SQ200880117083
公開(kāi)日2010年10月20日 申請(qǐng)日期2008年9月22日 優(yōu)先權(quán)日2007年9月21日
發(fā)明者亞歷山德拉·科約烏霍夫, 檀慧, 沙-梅恩·特赫, 秦家豪, 莫琳·海曼斯 申請(qǐng)人:谷歌公司