亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

多字字輪的制作方法

文檔序號(hào):6453694閱讀:244來(lái)源:國(guó)知局
專利名稱:多字字輪的制作方法
多字字輪
祖且 冃足
計(jì)算機(jī)硬件、軟件和聯(lián)網(wǎng)的技術(shù)進(jìn)步已經(jīng)產(chǎn)生了能夠從世界上基本任何地 方彼此通信以便交換信息的高效的、成本有效的計(jì)算系統(tǒng)(例如,臺(tái)式計(jì)算機(jī)、 膝上型計(jì)算機(jī)、手持式計(jì)算機(jī)、蜂窩電話、服務(wù)器……)。這些系統(tǒng)持續(xù)發(fā)展 成更可靠的、穩(wěn)健的、且用戶友好的系統(tǒng)。進(jìn)步已使得這些計(jì)算系統(tǒng)被用于訪 問(wèn)、瀏覽和搜索因特網(wǎng);撰寫(xiě)、發(fā)送和接收電子郵件消息;查看和編輯文檔; 發(fā)送和獲得文本消息和/或即時(shí)消息;以及執(zhí)行眾多其它動(dòng)作。例如,用戶可采 用蜂窩電話和/或個(gè)人數(shù)字助理(PDA)在因特網(wǎng)上搜索電影時(shí)間并且通過(guò)發(fā)送 電子郵件、文本消息或即時(shí)消息來(lái)邀請(qǐng)朋友觀看特定的放映。
隨著這些系統(tǒng)的持續(xù)發(fā)展,已經(jīng)采用了各種技術(shù)來(lái)用于輸入信息。某些最 初的計(jì)算系統(tǒng)通過(guò)利用穿孔卡和紙帶來(lái)接收輸入。最近,改進(jìn)已允許通過(guò)使用 鍵盤、鼠標(biāo)、觸敏屏幕、筆設(shè)備、光學(xué)字符識(shí)別、語(yǔ)音識(shí)別等來(lái)向這些設(shè)備提 供信息。例如,常規(guī)的系統(tǒng)通常采用大小可取決于設(shè)備類型而變化的鍵盤。根 據(jù)一種圖示,個(gè)人計(jì)算機(jī)或膝上型計(jì)算機(jī)可采用基于QWERTY布局的鍵盤, 其中每一字母數(shù)字字符可以與一相應(yīng)的鍵相關(guān)聯(lián);而蜂窩電話可包括更少的 鍵,使得多個(gè)字母字符與一數(shù)字字符共享單個(gè)鍵。例如,蜂窩電話鍵區(qū)上的"2" 鍵通常與字母"A" 、 "B"和"C"相關(guān)聯(lián)。
當(dāng)前,可利用多種技術(shù)來(lái)用有限的鍵盤輸入文本,其中由于多于一個(gè)字母 數(shù)字字符與一特定鍵相關(guān)聯(lián),可能存在歧義。例如,可采用多擊(multiple-tap) 方法,使得用戶按壓一數(shù)字鍵多次以輸入所需的字母或數(shù)字。作為說(shuō)明,可按 壓"2"鍵一次來(lái)輸入數(shù)字2,按下兩次來(lái)輸入字母A,按下三次來(lái)輸入字母B, 而按下四次來(lái)輸入字母C。暫停和/或按下諸如箭頭鍵等移動(dòng)光標(biāo)的鍵可以幫助 在不同的字母數(shù)字字符之間作出區(qū)分。然而,這一技術(shù)通常是耗時(shí)的,且對(duì)于
用戶而言是低效的,因?yàn)橐磯簡(jiǎn)蝹€(gè)鍵多次來(lái)輸入單個(gè)字母數(shù)字字符。
用數(shù)字鍵輸入文本的另一常見(jiàn)的方法是單擊(single-tap)方法,其中用戶
按下與一所需字母相關(guān)聯(lián)的數(shù)字鍵一次。之后,所輸入的字符例如通過(guò)將與一 單詞相對(duì)應(yīng)的字符序列匹配到儲(chǔ)存在存儲(chǔ)器中的序列來(lái)消除歧義。作為說(shuō)明,
為了輸入單詞"cell",用戶可按壓序列2-3-5-5,該序列可以與儲(chǔ)存在存儲(chǔ)器 中的序列進(jìn)行比較。即使單擊方法提供了輸入文本的更高效方式,但是它也與 多個(gè)缺陷相關(guān)聯(lián)。具體地,用于單擊方法的輸入可能會(huì)保留歧義;由此,通常 需要附加的用戶輸入來(lái)解決這樣的歧義。根據(jù)以上說(shuō)明,輸入序列2-3-5-5可 匹配與所述的單詞"cell"相關(guān)聯(lián)的序列以及涉及單詞"bdl"的鍵序列。因此, 通常需要附加輸入來(lái)在這些有歧義的可能性之間作出區(qū)分。
由此,缺少全鍵盤的常規(guī)系統(tǒng)通常與低效且耗時(shí)的輸入數(shù)據(jù)的技術(shù)相關(guān) 聯(lián)。除了上述的與有限的鍵盤相關(guān)聯(lián)的困難之外,諸如PDA等設(shè)備通常利用 了手寫(xiě)形式,采用該手寫(xiě)形式,數(shù)據(jù)輸入可能是低效和/或慢速的。此外,即使 在有鍵盤可用的情況下,用戶可能拼寫(xiě)不佳和/或可能不熟悉適當(dāng)和/或流行的 輸入。
概述
以下提出了簡(jiǎn)化概述以便提供對(duì)在此描述的某些方面的基本理解。本概述 并不是對(duì)要求保護(hù)的主題的全面綜述。它既不旨在標(biāo)識(shí)出所要求保護(hù)的主題的 關(guān)鍵或重要的要素,也不描繪其范圍。其唯一的目的是以簡(jiǎn)化的形式來(lái)介紹一 些概念,作為稍后提出的更為詳細(xì)的描述的序言。
所要求保護(hù)的主題涉及幫助擴(kuò)充輸入數(shù)據(jù)的系統(tǒng)和/或方法。輸入數(shù)據(jù)可 包括顯式通配符和/或可具有插入在其中的隱式通配符。該通配符之后可以利用 一語(yǔ)言模型來(lái)擴(kuò)充。例如,可提供k個(gè)最佳擴(kuò)充作為建議??蛇x擇這些建議中 的一個(gè)或多個(gè),例如用于執(zhí)行搜索、將文本輸入到文檔和/或消息(例如,文本 消息、即時(shí)消息、電子郵件……)等等。根據(jù)一個(gè)示例,輸入數(shù)據(jù)可以與任意 數(shù)目的期望單詞相關(guān)聯(lián)。這些期望單詞的每一個(gè)可以至少部分地基于一語(yǔ)言模 型來(lái)擴(kuò)充,使得可以生成一候選列表,并且可以從該候選列表中作出選擇。
根據(jù)所要求保護(hù)的主題的各方面,一擴(kuò)充組件可至少部分地基于所獲得的 輸入數(shù)據(jù)來(lái)生成一候選擴(kuò)充數(shù)據(jù)列表。該擴(kuò)充組件可利用一語(yǔ)言模型來(lái)提供與 輸入數(shù)據(jù)相關(guān)聯(lián)的通配符的可能擴(kuò)充??梢岳斫猓斎霐?shù)據(jù)可以由任何類型的
輸入設(shè)備來(lái)生成。例如,臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、手持式計(jì)算機(jī)、蜂窩電 話、服務(wù)器等可提供輸入數(shù)據(jù)。此外,輸入數(shù)據(jù)可包括字母數(shù)據(jù)、數(shù)字?jǐn)?shù)據(jù)(例 如,利用蜂窩電話的鍵區(qū)輸入)、語(yǔ)音數(shù)據(jù)、手寫(xiě)數(shù)據(jù)、其組合等等。另外, 輸入數(shù)據(jù)可以被轉(zhuǎn)換成適當(dāng)?shù)男问?例如,為了構(gòu)成字母字符)。
根據(jù)所要求保護(hù)的主題的一個(gè)或多個(gè)方面,可將隱式通配符插入到可獲得 的輸入數(shù)據(jù)中。該隱式通配符可以被放置在輸入數(shù)據(jù)內(nèi)的任何位置處。例如, 隱式通配符可以被插入在輸入數(shù)據(jù)的開(kāi)頭和/或末尾。另外地或另選地,隱式通 配符可以被包括在輸入數(shù)據(jù)內(nèi)的期望單詞之前和/或之后。
根據(jù)所要求保護(hù)的主題的各方面,可在服務(wù)器側(cè)實(shí)現(xiàn)通配符(例如,顯式 和/或隱式)的擴(kuò)充。服務(wù)器側(cè)應(yīng)用程序可以實(shí)現(xiàn)對(duì)通配符完成的計(jì)算上輕量且 快速的檢索。此外,可以實(shí)現(xiàn)考慮了位置數(shù)據(jù)的擴(kuò)充。例如,可采用一語(yǔ)言模 型,使得位置相關(guān)的擴(kuò)充可以與更高的相關(guān)度相關(guān)聯(lián)。
以下描述和附圖詳細(xì)闡明了所要求保護(hù)的主題的某些說(shuō)明性方面。然而, 這些方面僅指示了可采用該主題的原理的各種方法中的幾種,且所要求保護(hù)的 主題不旨在包括所有這些方面及其等效方面。結(jié)合附圖閱讀下面的詳細(xì)描述, 則其他優(yōu)點(diǎn)和新穎特征將變得清楚。
附圖簡(jiǎn)述


圖1示出了擴(kuò)充輸入數(shù)據(jù)的示例性系統(tǒng)的框圖。
圖2示出了將隱式通配符插入到輸入數(shù)據(jù)中的示例性系統(tǒng)的框圖。 圖3示出了執(zhí)行服務(wù)器側(cè)輸入數(shù)據(jù)擴(kuò)充的示例性系統(tǒng)的框圖。
圖4示出了完成與輸入數(shù)據(jù)相關(guān)聯(lián)的通配符的示例性系統(tǒng)的框圖。
圖5示出了訓(xùn)練用于擴(kuò)充輸入數(shù)據(jù)的語(yǔ)言模型的示例性系統(tǒng)的框圖。
圖6示出了修改和/或利用從輸入數(shù)據(jù)生成的候選列表的示例性系統(tǒng)的框圖。
圖7示出了至少部分地基于對(duì)位置的考慮來(lái)擴(kuò)充輸入數(shù)據(jù)的示例性系統(tǒng) 的框圖。
圖8示出了幫助生成和/或利用候選擴(kuò)充數(shù)據(jù)列表的示例性系統(tǒng)的框圖。 圖9示出了幫助擴(kuò)充輸入數(shù)據(jù)的示例性方法。
圖IO示出了幫助評(píng)價(jià)與輸入數(shù)據(jù)相關(guān)聯(lián)的通配符的示例性方法。
圖11-23示出了描繪與擴(kuò)充通配符相關(guān)聯(lián)的各方面的示例性屏幕截圖。 圖24示出了其中可采用所要求保護(hù)的主題的新穎方面的示例性聯(lián)網(wǎng)環(huán)
境0
圖25示出了可根據(jù)所要求保護(hù)的主題采用的示例性操作環(huán)境。 詳細(xì)描述
所要求保護(hù)的主題參考附圖來(lái)描述,所有附圖中使用相同的參考標(biāo)號(hào)來(lái)指 代相同的元素。在以下描述中,為解釋起見(jiàn),闡明了眾多具體細(xì)節(jié)以提供對(duì)本 發(fā)明的全面理解。然而,很明顯,所要求保護(hù)的主題可以在沒(méi)有這些具體細(xì)節(jié) 的情況下實(shí)施。在其它情況下,以框圖形式示出了公知的結(jié)構(gòu)和設(shè)備以便于描 述本發(fā)明。
如在此使用的,術(shù)語(yǔ)"組件"、"系統(tǒng)"、"接口"等指的是計(jì)算機(jī)相關(guān) 的實(shí)體,它們可以是硬件、軟件(例如,執(zhí)行中的)和/或固件。例如,組件可 以是運(yùn)行在處理器上的進(jìn)程、處理器、對(duì)象、可執(zhí)行碼、程序、和/或計(jì)算機(jī)。 作為說(shuō)明,運(yùn)行在服務(wù)器上的應(yīng)用程序和服務(wù)器都可以是組件。 一個(gè)或多個(gè)組 件可駐留在一個(gè)進(jìn)程內(nèi),且組件可位于一臺(tái)計(jì)算機(jī)上和/或分布在兩臺(tái)或更多計(jì) 算機(jī)之間。
此外,所要求保護(hù)的主題可以使用產(chǎn)生軟件、固件、硬件或其任意組合的 標(biāo)準(zhǔn)編程和/或工程技術(shù)而被實(shí)現(xiàn)為用于控制計(jì)算機(jī)以實(shí)現(xiàn)所公開(kāi)的本發(fā)明的 方法、裝置或制品。在此使用的術(shù)語(yǔ)"制品"旨在涵蓋可以從任何計(jì)算機(jī)可讀 設(shè)備、載體或介質(zhì)訪問(wèn)的計(jì)算機(jī)程序。例如,計(jì)算機(jī)可讀介質(zhì)可以包括但不限 于磁存儲(chǔ)設(shè)備(例如,硬盤、軟盤、磁帶……)、光盤(例如,緊致盤(CD)、 數(shù)字多功能盤(DVD)……)、智能卡和閃存設(shè)備(例如,卡、棒、鍵驅(qū)動(dòng)器……)。 另外應(yīng)該明白,載波可以被用于承載計(jì)算機(jī)可讀電子數(shù)據(jù),例如那些用于發(fā)送 和接收電子郵件或用于訪問(wèn)如因特網(wǎng)或局域網(wǎng)(LAN)等網(wǎng)絡(luò)的數(shù)據(jù)。當(dāng)然, 本領(lǐng)域的技術(shù)人員將會(huì)認(rèn)識(shí)到,在不背離所要求保護(hù)的主題的范圍或精神的前 提下可以對(duì)這一配置進(jìn)行許多修改。此外,在此使用詞語(yǔ)"示例性"意指用作 示例、實(shí)例或說(shuō)明。在此被描述為"示例性"的任何方面或設(shè)計(jì)并不一定要被
解釋為相比其他方面或設(shè)計(jì)更優(yōu)選或有利。
現(xiàn)在轉(zhuǎn)向附圖,圖i示出了擴(kuò)充輸入數(shù)據(jù)的系統(tǒng)ioo。系統(tǒng)100可包括獲 得輸入數(shù)據(jù)的接口 102以及利用該輸入數(shù)據(jù)來(lái)生成候選擴(kuò)充數(shù)據(jù)列表的擴(kuò)充組 件104。接口 102可以從任何類型的輸入設(shè)備(未示出)接收輸入數(shù)據(jù)。例如, 輸入數(shù)據(jù)可以由個(gè)人計(jì)算機(jī)、膝上型計(jì)算機(jī)、手持式計(jì)算機(jī)、蜂窩電話、服務(wù) 器等生成??梢岳斫?,接口 102和/或擴(kuò)充組件103可以耦合到輸入設(shè)備、可以 全部或部分地包括在輸入設(shè)備中、和/或可以是獨(dú)立的組件。
任何類型的輸入數(shù)據(jù)都可由接口 102接收。根據(jù)一個(gè)示例,當(dāng)用戶采用個(gè) 人計(jì)算機(jī)時(shí),接口 102可以獲得與用戶按下的鍵相關(guān)聯(lián)的字母數(shù)字字符。另外, 可采用語(yǔ)音識(shí)別來(lái)分析用戶口頭輸入和/或可利用手寫(xiě)識(shí)別來(lái)標(biāo)識(shí)書(shū)面數(shù)據(jù);由 此,接口 102可以接收聽(tīng)覺(jué)和/或視覺(jué)數(shù)據(jù)。作為進(jìn)一步的說(shuō)明,接口 102可以 接收與蜂窩電話鍵區(qū)相關(guān)聯(lián)的數(shù)字字符,其中每一數(shù)字字符可以與多個(gè)字母數(shù) 字字符相關(guān)。
輸入數(shù)據(jù)可以包括一個(gè)或多個(gè)顯式通配符。通配符可以由"*"來(lái)表示; 然而,通配符的任何完全不同的表示也落入所要求保護(hù)的主題的范圍之內(nèi)(例 如,除了*,任何其它字符可以被用作通配符,如聲音、記號(hào)……)。顯式通 配符可以被包括在輸入數(shù)據(jù)內(nèi)的任何地方。由此,例如,如果用戶希望輸入單 詞"Lincoln",輸入"Linc*n"可以用與個(gè)人計(jì)算機(jī)相關(guān)聯(lián)的鍵盤來(lái)鍵入并提 供給接口 102。根據(jù)另一說(shuō)明,用戶可發(fā)出"m-星號(hào)-t"的聲音,并且該輸入 數(shù)據(jù)可被提供給擴(kuò)充組件104,后者可利用語(yǔ)音識(shí)別來(lái)將輸入數(shù)據(jù)標(biāo)識(shí)為 "m*t"??梢岳斫?,所要求保護(hù)的主題不限于這些示例。
在獲得了輸入數(shù)據(jù)之后,接口 102可以將輸入數(shù)據(jù)提供給擴(kuò)充組件104。 擴(kuò)充組件104可包括允許采用提供與輸入數(shù)據(jù)相關(guān)聯(lián)的通配符的可能擴(kuò)充的語(yǔ) 言模型的語(yǔ)言模型組件106。由此,通過(guò)利用該語(yǔ)言模型,擴(kuò)充組件104可以 擴(kuò)充與輸入數(shù)據(jù)相關(guān)聯(lián)的顯式通配符以生成候選擴(kuò)充數(shù)據(jù)列表。另外地或另選 地,擴(kuò)充組件104可以將隱式通配符插入到輸入數(shù)據(jù)中;這些隱式通配符可以 類似地通過(guò)采用語(yǔ)言模型來(lái)擴(kuò)充。該語(yǔ)言模型可用于找出k個(gè)最佳擴(kuò)充。
常規(guī)系統(tǒng)可以允許用戶通過(guò)有限的鍵區(qū)來(lái)輸入文本。假定用戶希望利用蜂 窩電話來(lái)搜索"MSN"。采用多擊的標(biāo)準(zhǔn)方法可以是鍵入6<暫停>777<暫停>66,
其中6產(chǎn)生M, 777產(chǎn)生S,而66表示N。另一種多擊方法可利用鍵入66<暫 停〉7777<暫停>666,使得66可表示M, 7777可與S相關(guān)聯(lián),而666可以與N 有關(guān)。如果在多擊方法中沒(méi)有包括暫停,則輸入數(shù)據(jù)將有歧義?;蛘呖刹捎脝?擊技術(shù)。由此,輸入676 (對(duì)于MSN)可用于找到k個(gè)最佳匹配,并且之后, 用戶可從該列表中選擇MSN。根據(jù)此示例,676可以表示[6MNOmno] [7PRSprs] [6MNOmno]。然而,常規(guī)系統(tǒng)無(wú)法利用語(yǔ)言模型來(lái)擴(kuò)充可以位于輸入數(shù)據(jù)內(nèi)的 任何地方的隱式和/或顯式通配符。
語(yǔ)言模型組件106可以采用任何語(yǔ)言模型。例如,可以利用三元語(yǔ)法 (trigram)語(yǔ)言模型。另外,可采用受限語(yǔ)言模型。根據(jù)一個(gè)示例,用于web 查詢的語(yǔ)言模型可以基于一查詢列表以及與其相關(guān)聯(lián)的概率。根據(jù)另一示例, 可將基于音節(jié)元素構(gòu)建的語(yǔ)言模型用于擴(kuò)充隱式和/或顯式通配符。根據(jù)又一示 例,語(yǔ)言模型組件106使用的語(yǔ)言模型可以被頻繁地更新以允許及時(shí)地標(biāo)識(shí)出 突發(fā)新聞報(bào)導(dǎo)。
盡管接口 102被描繪為與擴(kuò)充組件104分開(kāi),但是可以構(gòu)想擴(kuò)充組件104 可包括接口 102或其一部分。并且,接口 102可以提供各種適配器、連接器、 通道、通信路徑等以便允許與擴(kuò)充組件104交互。
擴(kuò)充組件104產(chǎn)生之后可被利用的候選擴(kuò)充數(shù)據(jù)列表。例如,該候選列表 可以被顯示給用戶(例如,經(jīng)由接口 102),和/或用戶可從該候選列表中作出 選擇。從該候選列表中所選的擴(kuò)充可以用于執(zhí)行搜索、可被輸入到所撰寫(xiě)的文 檔或消息中、可被插入到地址欄中等等??梢詷?gòu)想,接口 102可以提供如圖所 示的候選擴(kuò)充數(shù)據(jù)列表(例如,提供給用戶、給輸入設(shè)備……)。另外地或另 選地,擴(kuò)充組件104或一完全不同的組件(未示出)可以輸出該候選列表。例 如,該候選列表可包括k個(gè)最佳擴(kuò)充。根據(jù)另一示例,該候選列表可包括5個(gè) 最常用的擴(kuò)充、三個(gè)最常用的擴(kuò)充和前十個(gè)使用最多的擴(kuò)充中的另外兩個(gè)的混 合、和/或贊助推薦;然而,所要求保護(hù)的主題不限于這些示例。
轉(zhuǎn)向圖2,所示是將隱式通配符插入到輸入數(shù)據(jù)中的系統(tǒng)200。系統(tǒng)200 包括接收輸入數(shù)據(jù)并將輸入數(shù)據(jù)提供給擴(kuò)充組件204的接口 202。擴(kuò)充組件204 可以擴(kuò)充輸入數(shù)據(jù)以產(chǎn)生一擴(kuò)充數(shù)據(jù)候選列表。例如,可用擴(kuò)充組件204來(lái)生 成k個(gè)最佳擴(kuò)充。擴(kuò)充可以至少部分地利用由語(yǔ)言模型組件206提供的語(yǔ)言模 型來(lái)實(shí)現(xiàn)。
擴(kuò)充組件204還可以包括將一個(gè)或多個(gè)隱式通配符插入到輸入數(shù)據(jù)中的
通配符插入組件208。可以理解,通配符插入組件208可以將隱式通配符定位 在輸入數(shù)據(jù)中的任何地方。在插入了隱式通配符之后,可以基于語(yǔ)言模型來(lái)擴(kuò) 充輸入數(shù)據(jù)中的隱式通配符以及任何顯式通配符。
根據(jù)一個(gè)示例,通配符插入組件208可以標(biāo)識(shí)輸入數(shù)據(jù)中的期望單詞的末 尾。根據(jù)此示例,通配符插入組件208可以在這一標(biāo)識(shí)的位置處插入一通配符。 可以理解,可以確定多個(gè)這樣的位置,并且因此可以隨輸入數(shù)據(jù)包括任何適當(dāng) 數(shù)量的隱式通配符。作為說(shuō)明,通配符插入組件208可以通過(guò)標(biāo)識(shí)空格來(lái)定位 期望單詞的末尾,并在輸入數(shù)據(jù)內(nèi)的每一空格之前插入一隱式通配符。另外地 或另選地,通配符插入組件208可以在輸入數(shù)據(jù)的末尾處放置一隱式通配符。
通配符插入組件208還可將隱式通配符插入在輸入數(shù)據(jù)內(nèi)的其它位置中。 例如, 一隱式通配符可以通過(guò)利用通配符插入組件208被包括在輸入數(shù)據(jù)的開(kāi) 頭處。另外地或另選地,通配符插入組件208可以在輸入數(shù)據(jù)的每一期望單詞 的開(kāi)頭處放置一隱式通配符。以下示出了示例性輸入數(shù)據(jù)(左手側(cè))以及可利用擴(kuò)充組件204、語(yǔ)言模 型組件206和/或通配符插入組件208生成的對(duì)應(yīng)的擴(kuò)充數(shù)據(jù)(右手側(cè))
n y e — New York City
Cin OH —Cincinnati Ohio
Am S*w*g —Arnold Schwarzenegger
根據(jù)第一個(gè)示例,通配符插入組件208可以在"n" 、 "y"和"c"之后 插入隱式通配符??刹捎谜Z(yǔ)言模型來(lái)提供這些通配符的可能擴(kuò)充,由此產(chǎn)生 "New York City"作為擴(kuò)充輸出。第三個(gè)示例展示了顯式通配符可被包括在輸 入數(shù)據(jù)中。由此,這些顯式通配符以及位于"n"之后和"g"之后的隱式通配 符可被擴(kuò)充以生成"Arnold Schwarzenegger"作為擴(kuò)充輸出。
對(duì)通配符插入組件208 (以及擴(kuò)充組件204)的利用可以提供優(yōu)于常規(guī)技 術(shù)的多個(gè)優(yōu)點(diǎn)。具體地,通配符插入組件208和/或擴(kuò)充組件204可允許字輪 (work wheeling)。由此,用戶可在諸如蜂窩電話或PDA等具有有限鍵盤能 力的移動(dòng)設(shè)備上輸入數(shù)據(jù),其中該有限的鍵盤能力可能與字母數(shù)字字符的低效
和/或耗時(shí)輸入相關(guān)聯(lián);然而,所要求保護(hù)的主題不如此限制。另外,字輪可以 補(bǔ)償用戶不知道期望輸入的正確拼寫(xiě)。此外,字輪可以幫助對(duì)于對(duì)輸入的査詢 僅有模糊概念(例如,在web搜索的上下文中)或?qū)Ξ?dāng)前什么是流行的感到好 奇的用戶,并且因此匹配一部分輸入。
參考圖3,所示是執(zhí)行服務(wù)器側(cè)輸入數(shù)據(jù)擴(kuò)充的系統(tǒng)300。系統(tǒng)300可包 括接收輸入數(shù)據(jù)和/或發(fā)送候選擴(kuò)充數(shù)據(jù)列表的接口 302。接口 302可將輸入數(shù) 據(jù)提供給擴(kuò)充顯式和/或隱式通配符的擴(kuò)充組件304。擴(kuò)充組件304可利用語(yǔ)言 模型組件306來(lái)生成與輸入數(shù)據(jù)相關(guān)聯(lián)的k個(gè)最佳擴(kuò)充。盡管未描繪,但是可 以理解,通配符插入組件(例如,圖2的通配符插入組件208)可以另外地結(jié) 合系統(tǒng)300 —起使用。
系統(tǒng)300還包括與接口 302通信的客戶機(jī)組件308??蛻魴C(jī)組件308和接 口 302可以經(jīng)由任何類型的連接來(lái)耦合。作為說(shuō)明而非局限,輸入數(shù)據(jù)和/或候 選擴(kuò)充數(shù)據(jù)列表可以經(jīng)由有線連接、無(wú)線連接、其組合、或任何完全不同類型 的連接來(lái)傳送。例如,客戶機(jī)組件308可以是臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、手 持式計(jì)算機(jī)、蜂窩電話等等。
作為說(shuō)明,客戶機(jī)組件308可以是諸如蜂窩電話等移動(dòng)設(shè)備。利用與蜂窩 電話相關(guān)聯(lián)的鍵區(qū),輸入數(shù)據(jù)可被輸入且之后可被傳送到接口 302??捎蓴U(kuò)充 組件304生成輸入數(shù)據(jù)的k個(gè)最佳擴(kuò)充。擴(kuò)充組件304可以利用語(yǔ)言模型來(lái)評(píng) 估輸入數(shù)據(jù)以產(chǎn)生一組擴(kuò)充數(shù)據(jù),其中與輸入數(shù)據(jù)相關(guān)聯(lián)的通配符(例如,隱 式和/或顯式的)可以用用于該組擴(kuò)充中的至少一個(gè)的至少一個(gè)字母數(shù)字字符來(lái) 替換。之后,可將所得的候選擴(kuò)充數(shù)據(jù)列表提供回客戶機(jī)組件308。
與系統(tǒng)300相關(guān)聯(lián)的服務(wù)器側(cè)實(shí)現(xiàn)可以采用計(jì)算上輕量和/或快速的通配 符(和/或電話數(shù)字鍵)完成檢索,而較小的存儲(chǔ)器占用量可能并不是必需的。 為了實(shí)現(xiàn)快速的通配符完成檢索,擴(kuò)充組件304可采用一后綴樹(shù),其中后綴按 照流行度和字母表兩者的順序來(lái)排序,且在樹(shù)中的偶和奇深度上交替。另外地 或另選地,如果快速檢索不是問(wèn)題(例如,如果有許多服務(wù)器可用于完成通配 符),則用于語(yǔ)言模型的實(shí)際數(shù)據(jù)結(jié)構(gòu)可能是較不重要的。由此,如果有足夠 的計(jì)算能力可用,則通配符完成可通過(guò)采用可能條目的有序列表上的簡(jiǎn)單正則 表達(dá)式匹配來(lái)實(shí)現(xiàn)。
以下示出了利用索引和/或壓縮來(lái)生成候選擴(kuò)充數(shù)據(jù)列表的擴(kuò)充組件304 的一個(gè)示例。與k個(gè)最佳串匹配相關(guān)聯(lián)地,可采用各種類型的語(yǔ)言模型。例如,
可利用三元語(yǔ)言模型和/或長(zhǎng)列表(例如,用于諸如七百萬(wàn)個(gè)最流行web查詢
等有限語(yǔ)言)。長(zhǎng)列表可以用后綴數(shù)組來(lái)索引。后綴數(shù)組可以被推廣到電話模
式。web査詢列表可以作為N字節(jié)的文本來(lái)對(duì)待。(新的行可以用串結(jié)束定界 符來(lái)替換)。后綴數(shù)組S可以是N個(gè)整數(shù)的序列。該數(shù)組可以用從0到N-l 的數(shù)字來(lái)初始化。由此,S[/]=f, 0&、iV。這些整數(shù)中的每一個(gè)都可表示一個(gè) 串,該串從文本中的位置/開(kāi)始,并延伸到該串的末尾。因此,S可以按照字 母表來(lái)排序。
后綴陣列可使得能夠容易地找到任何n元語(yǔ)法(子串)的頻率和位置。例 如,給定諸如"mail"等子串,可找到以"mail"開(kāi)頭的第一個(gè)和最后一個(gè)后 綴,并且這兩者之間的間隙可以是頻率。另外,間隙中的每一后綴可以指向 "mail"的超串(super-string)。
為將后綴數(shù)組推廣到電話模式,例如,字母表順序(strcmp)可以用電話 順序(phone-strcmp)來(lái)替換。strcmp禾卩phone-strcmp都可以每次一個(gè)地考慮 每一字符。在標(biāo)準(zhǔn)的字母表排序中,'a,〈,b,〈,c,,但是在phone-strcmp中,映 射到電話鍵區(qū)上的同一鍵的字符可以作為等效的來(lái)對(duì)待。
后綴數(shù)組可以被推廣以便利用流行度權(quán)重。由此,代替找出包含子串 "mail"的所有查詢,可標(biāo)識(shí)k個(gè)最佳(例如,最流行)。標(biāo)準(zhǔn)后綴數(shù)組方法 可以通過(guò)對(duì)輸出添加過(guò)濾器以在結(jié)果中搜索k個(gè)最佳來(lái)工作。然而,如果有大 量的匹配,則該過(guò)濾器可能花費(fèi)O(A0的時(shí)間。
作為一種改進(jìn),后綴數(shù)組可以同時(shí)按照流行度和字母表順序來(lái)排序,使得 樹(shù)中的偶和奇深度交替。在第一層,后綴數(shù)組可以按照第一順序來(lái)排序,然后 按照第二順序來(lái)排序,依此類推。當(dāng)搜索按照字母表順序來(lái)排序的節(jié)點(diǎn)時(shí),可 利用標(biāo)準(zhǔn)后綴數(shù)組技術(shù)。另外,當(dāng)搜索按照流行度排序的節(jié)點(diǎn)時(shí),可先搜索到 較流行的一半再搜索另一半。如果有大量匹配,如對(duì)于短串常見(jiàn)的情形,則索 引可使得能夠容易地快速找到前k個(gè),且因此,可能無(wú)需搜索另一半。如果前 綴是少見(jiàn)的,則可搜索這兩部分,且因此,對(duì)較壞的情況,有一半的拆分(例 如,按照流行度的拆分)可能是無(wú)用的,其中輸入子串不匹配表中的任何內(nèi)容。
查找是O(sqrtTV)。
通配符匹配可以不同于子串匹配。有限狀態(tài)機(jī)是考慮帶有通配符的k個(gè)最 佳匹配問(wèn)題的好方法。例如,輸入串通常包括長(zhǎng)的常量定位點(diǎn)(例如,無(wú)通配 符的子串)。后綴數(shù)組可使用這些定位點(diǎn)來(lái)生成然后按照正則表達(dá)式包來(lái)過(guò)濾 的候選列表。
在許多實(shí)際應(yīng)用中,存儲(chǔ)器可能是有限的,尤其是在移動(dòng)上下文中。對(duì)于 三元語(yǔ)法模型,可以利用有損方法。每一三元語(yǔ)法〈x,y,z〉可被映射到一散列節(jié) 點(diǎn)// = ^、 + & +々/0尸,其中r是詞匯量大小,而尸是適當(dāng)?shù)馁|(zhì)數(shù)。P在存儲(chǔ)器 和損耗之間折衷。儲(chǔ)存W個(gè)三元語(yǔ)法的成本可以是iV[l/logJ + logJP/iV)]位。 損耗,即假命中的概率為1/P。 N個(gè)三元語(yǔ)法可被散列成h個(gè)散列碼并且可對(duì) 這些代碼排序。差異x可以用Golomb碼來(lái)編碼,假定差異是指數(shù)分布的,則 該代碼是最優(yōu)哈夫曼碼,這可以是散列是泊松的情況。
參考圖4,所示是完成與輸入數(shù)據(jù)相關(guān)聯(lián)的通配符的系統(tǒng)400。系統(tǒng)400 包括接收輸入數(shù)據(jù)并將輸入數(shù)據(jù)提供給擴(kuò)充組件404的接口 402,擴(kuò)充組件404 可以完成與輸入數(shù)據(jù)相關(guān)聯(lián)的通配符(例如,隱式和/或顯式通配符)??梢岳?解,接口 402和/或擴(kuò)充組件404可以位于服務(wù)器側(cè)和/或客戶機(jī)側(cè)。此外,擴(kuò) 充組件404可以采用可結(jié)合輸入數(shù)據(jù)來(lái)利用的語(yǔ)言模型組件406以產(chǎn)生擴(kuò)充數(shù) 據(jù)。
擴(kuò)充組件404還可以包括將接口 402接收到的輸入數(shù)據(jù)轉(zhuǎn)換成對(duì)應(yīng)的字母 字符數(shù)據(jù)的轉(zhuǎn)換組件408。字母字符數(shù)據(jù)之后可以被擴(kuò)充以產(chǎn)生候選擴(kuò)充數(shù)據(jù) 列表。另外地或另選地,轉(zhuǎn)換組件408可以在擴(kuò)充組件404完成了通配符之后 對(duì)該數(shù)據(jù)操作;然而,所要求保護(hù)的主題不限于此。根據(jù)一個(gè)示例,所接收的 輸入數(shù)據(jù)可以是可以通過(guò)采用蜂窩電話來(lái)輸入的數(shù)字?jǐn)?shù)據(jù)。轉(zhuǎn)換組件408可識(shí) 別所接收的數(shù)據(jù)是用蜂窩電話生成的,并將該數(shù)據(jù)轉(zhuǎn)換成對(duì)應(yīng)的字母字符數(shù) 據(jù)。轉(zhuǎn)換組件408可以在特意包括數(shù)字字符的輸入數(shù)據(jù)(例如,如果輸入是如 "T1")和其中數(shù)字字符代表字母字符的輸入數(shù)據(jù)(例如,可以是輸入數(shù)據(jù)是 利用蜂窩電話生成的情況)之間作出區(qū)分。根據(jù)另一說(shuō)明,轉(zhuǎn)換組件408可以 標(biāo)識(shí)對(duì)語(yǔ)音數(shù)據(jù)的接收并允許執(zhí)行語(yǔ)音識(shí)別。根據(jù)又一示例,轉(zhuǎn)換組件408可 以確定接口 402獲得了手寫(xiě)輸入,并進(jìn)行手寫(xiě)識(shí)別以更改輸入數(shù)據(jù)??梢岳斫?,
所要求保護(hù)的主題不限于上述示例。
擴(kuò)充組件404還可以包括拼寫(xiě)糾正組件410。拼寫(xiě)糾正組件410可以修改
輸入數(shù)據(jù)的一部分或全部以解決潛在的拼寫(xiě)錯(cuò)誤。由此,候選列表中的至少一
個(gè)通配符完成可以與經(jīng)修改的輸入數(shù)據(jù)相關(guān)聯(lián)。拼寫(xiě)糾正組件410可以用于顯 示對(duì)輸入數(shù)據(jù)的一個(gè)或多個(gè)拼寫(xiě)糾正。由此,作為示例,如果輸入數(shù)據(jù)是"mon search",則拼寫(xiě)糾正組件410可在候選列表中提供"msn search"。
擴(kuò)充組件404還可包括更新組件412,該組件可在輸入輸入數(shù)據(jù)的每一字 符時(shí)動(dòng)態(tài)更新候選列表。建議的通配符完成可動(dòng)態(tài)地顯示,其中通過(guò)釆用更新 組件412,當(dāng)輸入每一新字符時(shí)建議改變和/或改進(jìn)。在這一情況下用戶可以不 必按下"Suggest (建議)"按鈕來(lái)獲得候選列表。例如,用戶可輸入"7", 并且更新組件412和/或擴(kuò)充組件404可以提供"Shopping"作為候選列表的一 部分。隨后,用戶可輸入一空格后跟另一 "7",并且更新組件412可以修改 候選擴(kuò)充數(shù)據(jù)列表,使得不再包括"Sh叩ping",而是呈現(xiàn)"SpaceNeedle"; 然而,所要求保護(hù)的主題不限于此示例。
圖5示出了訓(xùn)練用于擴(kuò)充輸入數(shù)據(jù)的語(yǔ)言模型的系統(tǒng)500。系統(tǒng)500包括 接口 502和擴(kuò)充組件504。接口 502可以接收輸入數(shù)據(jù),并基于擴(kuò)充組件504 執(zhí)行的擴(kuò)充來(lái)提供候選擴(kuò)充數(shù)據(jù)列表。擴(kuò)充組件504還可包括語(yǔ)言模型組件 506,該組件可提供可用于生成擴(kuò)充數(shù)據(jù)的語(yǔ)言模型??梢岳斫猓瑢?duì)所要求保 護(hù)的主題可以利用任何類型的語(yǔ)言模型。
系統(tǒng)500還可包括模型訓(xùn)練組件508,該組件基于一訓(xùn)練數(shù)據(jù)集來(lái)訓(xùn)練語(yǔ) 言模型,該訓(xùn)練數(shù)據(jù)集被儲(chǔ)存在訓(xùn)練數(shù)據(jù)存儲(chǔ)510中。對(duì)于不同的應(yīng)用,模型 訓(xùn)練組件508可以采用不同的訓(xùn)練集。例如,對(duì)于web搜索,模型訓(xùn)練組件 508采用的訓(xùn)練集可包括查詢?nèi)罩竞蛍eb文檔的組合。根據(jù)另一示例,訓(xùn)練集 可包括典型的文檔以便在采用文本編輯器應(yīng)用程序時(shí)訓(xùn)練語(yǔ)言模型。作為又一 說(shuō)明,模型訓(xùn)練組件508可利用即時(shí)消息通信日志來(lái)訓(xùn)練可結(jié)合即時(shí)消息通信 應(yīng)用程序采用的語(yǔ)言模型。模型訓(xùn)練組件508可包括訓(xùn)練集選擇組件512,該 組件可基于所采用的應(yīng)用程序來(lái)選擇一特定的訓(xùn)練數(shù)據(jù)集。
訓(xùn)練數(shù)據(jù)存儲(chǔ)510可包括各種訓(xùn)練集,并且可以由訓(xùn)練集選擇組件512 來(lái)標(biāo)識(shí)并利用適當(dāng)?shù)募?。?xùn)練數(shù)據(jù)存儲(chǔ)510可以是例如易失性存儲(chǔ)器或非易
失性存儲(chǔ)器,或者可同時(shí)包括易失性存儲(chǔ)器和非易失性存儲(chǔ)器兩者。作為說(shuō)明
而非局P艮,非易失性存儲(chǔ)器可包括只讀存儲(chǔ)器(ROM)、可編程ROM(PROM)、 電可編程ROM (EPROM)、電可擦除可編程ROM (EEPROM)或閃存。易 失性存儲(chǔ)器可包括隨機(jī)存取存儲(chǔ)器(RAM),它用作外部高速緩沖存儲(chǔ)器。作 為示例而非局限,RAM以多種形式可得,諸如靜態(tài)RAM (SRAM)、動(dòng)態(tài) RAM (DRAM)、同步DRAM (SDRAM)、雙數(shù)據(jù)率SDRAM (DDR SDRAM)、 增強(qiáng)型SDRAM (ESDRAM)、同步鏈路(Synchlink) DRAM (SLDRAM)、 存儲(chǔ)器總線(Rambus)直接RAM (RDRAM)、直接存儲(chǔ)器總線動(dòng)態(tài)RAM (DRDRAM)、以及存儲(chǔ)器總線動(dòng)態(tài)RAM (RDRAM)。本系統(tǒng)和方法的訓(xùn) 練數(shù)據(jù)存儲(chǔ)510旨在包括但不限于這些以及其它任何適當(dāng)類型的存儲(chǔ)器。另外, 可以理解,訓(xùn)練數(shù)據(jù)存儲(chǔ)510可以是服務(wù)器、數(shù)據(jù)庫(kù)、硬盤驅(qū)動(dòng)器等等。
轉(zhuǎn)向圖6,所示是修改和/或利用從輸入數(shù)據(jù)生成的候選列表的系統(tǒng)600。 系統(tǒng)600可包括可獲得輸入數(shù)據(jù)的接口 602以及標(biāo)識(shí)、插入和/或擴(kuò)充與輸入數(shù) 據(jù)相關(guān)聯(lián)的通配符(例如,隱式和/或顯式的)擴(kuò)充組件604。還可包括提供有 助于擴(kuò)充通配符的語(yǔ)言模型的語(yǔ)言模型組件606作為擴(kuò)充組件604的一部分。
系統(tǒng)600還可包括可耦合到擴(kuò)充組件604的搜索組件608。例如,擴(kuò)充組 件604可提供與輸入數(shù)據(jù)有關(guān)的候選擴(kuò)充列表。之后,可選擇(例如,由用戶、 由不同的組件……)候選列表中的一個(gè)特定擴(kuò)充,并且可由搜索組件608基于 該選擇來(lái)執(zhí)行搜索。例如,搜索組件608可以與搜索引擎(未示出)相關(guān)聯(lián), 使得選擇可以被用作搜索查詢并且可檢索到與其有關(guān)的內(nèi)容。另外地或另選 地,搜索組件608可以是搜索引擎。搜索組件608可輸出與搜索有關(guān)的結(jié)果(例 如,向顯示組件、向用戶、向輸入組件……)。
系統(tǒng)600還可包括過(guò)濾器組件610和/或個(gè)性化組件612。盡管被描繪為耦 合到擴(kuò)充組件604,但是可以構(gòu)想其中的任一個(gè)或兩者都可耦合到搜索組件 608。過(guò)濾器組件610可以用于從候選列表中移除各種擴(kuò)充。例如,可由過(guò)濾 器組件610中k個(gè)最佳建議的候選列表中過(guò)濾掉本質(zhì)上成人的、粗俗的、討厭 的等等擴(kuò)充,且因此不顯示給用戶。另外地或另選地,有可能產(chǎn)生本質(zhì)上成人 的、粗俗的、討厭的等的搜索結(jié)果的擴(kuò)充可經(jīng)由過(guò)濾器組件610來(lái)移除。過(guò)濾 器組件610可以由用戶打開(kāi)或關(guān)閉、可以總是或從不可操作、可以基于輸入數(shù)
據(jù)和/或輸入設(shè)備來(lái)實(shí)現(xiàn)過(guò)濾等等。
個(gè)性化組件612可以有助于對(duì)特定用戶定制系統(tǒng)600。例如,個(gè)性化組件
612可以標(biāo)識(shí)用戶(例如,通過(guò)口令、生物測(cè)定指示器、卡、鑰匙、位置……)。 個(gè)性化組件612可以為特定用戶更改語(yǔ)言模型組件606用于生成候選列表的語(yǔ) 言模型。另外地或另選地,個(gè)性化組件612可以允許過(guò)濾器組件610基于用戶 身份來(lái)顯示和/或移除特定擴(kuò)充。個(gè)性化組件612可以跟蹤和/或利用用戶的偏 好和/或歷史數(shù)據(jù)。此外,個(gè)性化組件612可以允許至少部分地基于與特定用戶 相關(guān)聯(lián)的桌面搜索索引來(lái)訓(xùn)練語(yǔ)言模型(例如,經(jīng)由圖5的模型訓(xùn)練組件508)。
參考圖7,所示是至少部分地基于對(duì)位置的考慮來(lái)擴(kuò)充輸入數(shù)據(jù)的系統(tǒng) 700。系統(tǒng)700可包括能獲得可被提供給擴(kuò)充組件704的查詢和/或位置數(shù)據(jù)的 接口 702。擴(kuò)充組件704還可包括語(yǔ)言模型組件706以及可鑒于位置數(shù)據(jù)來(lái)提 供相關(guān)擴(kuò)展的本地上下文組件708。當(dāng)利用位置數(shù)據(jù)時(shí),語(yǔ)言模型組件706可 以采用與不采用位置數(shù)據(jù)時(shí)不同的語(yǔ)言模型。例如,位置相關(guān)語(yǔ)言模型可以使 得與地點(diǎn)有關(guān)的擴(kuò)展(例如,酒店、熱門景點(diǎn)、餐館……)更為主導(dǎo),而人(例 如,名人)較不重要。本地上下文組件708可以允許作出依賴于位置的完成。
客戶機(jī)組件710可以向接口 702提供輸入數(shù)據(jù)和/或位置數(shù)據(jù)??蛻魴C(jī)組 件710還可包括能夠標(biāo)識(shí)與客戶機(jī)組件712相關(guān)聯(lián)的位置的位置組件712。例 如,位置組件712可采用全球定位系統(tǒng)(GPS)來(lái)確定客戶機(jī)組件710的位置。 可以構(gòu)想用戶可向客戶機(jī)組件710輸入位置,且該數(shù)據(jù)之后可被發(fā)送到服務(wù)器 側(cè)。盡管系統(tǒng)700描繪了利用位置信息來(lái)擴(kuò)充通配符的服務(wù)器側(cè)實(shí)現(xiàn),但是可 以構(gòu)想可以在客戶機(jī)側(cè)采用基于位置的系統(tǒng)。
系統(tǒng)700還可包括能夠基于候選列表中的一個(gè)或多個(gè)擴(kuò)充來(lái)執(zhí)行搜索的 搜索組件714。例如,用戶可從候選列表中選擇一擴(kuò)充(例如,通過(guò)用客戶機(jī) 組件710作出選擇),并且搜索組件714可以執(zhí)行與所選擴(kuò)充相關(guān)的搜索。由 此,可采用中間査詢細(xì)化,使得可在用搜索組件714獲得查詢結(jié)果之前提供附 加輸入(例如,用戶選擇)。然而,可以理解,所要求保護(hù)的主題不限于此。
搜索組件714還可包括能夠排列擴(kuò)充的排列組件716。例如,最有可能的 擴(kuò)充可以被顯示在列表的開(kāi)頭、下拉列表的頂部、更突出地顯示等等。盡管被 描繪為作為搜索組件714的一部分來(lái)包括,但是排列組件716可以與搜索組件714分開(kāi)。
此外,搜索組件714可包括能夠隨候選擴(kuò)充列表一起包括與任何數(shù)量的擴(kuò) 充相關(guān)聯(lián)的搜索結(jié)果的嵌入組件718。例如,擴(kuò)充組件704可以擴(kuò)充輸入數(shù)據(jù) 以生成可被提供給嵌入組件718的候選列表。嵌入組件718可以通過(guò)采用搜索 組件714來(lái)執(zhí)行與該列表中最有可能的候選有關(guān)的搜索。與搜索相關(guān)聯(lián)的結(jié)果 然后可以與給予客戶機(jī)組件710的候選列表一起包括在內(nèi)。由此,客戶機(jī)組件 710的用戶無(wú)需選擇特定擴(kuò)充來(lái)執(zhí)行此搜索,因?yàn)榻Y(jié)果可被自動(dòng)提供。例如, 嵌入組件718可允許呈現(xiàn)對(duì)于最重要査詢推薦(例如,擴(kuò)充)的搜索結(jié)果以及 能包括該候選擴(kuò)充列表的建議査詢面板。
根據(jù)一示例,客戶機(jī)組件710可以向接口 702發(fā)送一短消息服務(wù)(SMS) 文本消息。該SMS文本消息可以包括顯式通配符和/或可插入(例如,由擴(kuò)充 組件704、圖2的通配符插入組件208……)隱式通配符。服務(wù)器(例如,經(jīng) 由接口 702)可發(fā)回一返回SMS文本消息。返回SMS文本消息可包括例如關(guān) 于最重要的建議完成的第一個(gè)搜索結(jié)果所指向的頁(yè)面(或該頁(yè)面的一部分或該 頁(yè)面的概略)。另外地或另選地,可提供關(guān)于m個(gè)最佳的建議完成的n個(gè)最佳 搜索結(jié)果作為返回SMS文本消息的一部分??梢岳斫?,所要求保護(hù)的主題不 限于此示例。
轉(zhuǎn)向圖8,所示是幫助生成和/或利用候選擴(kuò)充數(shù)據(jù)列表的系統(tǒng)800。系統(tǒng) 800可包括接口 802、擴(kuò)展組件804、以及語(yǔ)言模型組件806,其各自都基本類 似于以上所述的相應(yīng)組件。系統(tǒng)800還可包括智能組件808。智能組件808可 以由擴(kuò)充組件804用于幫助完成與輸入數(shù)據(jù)相關(guān)聯(lián)的通配符(例如,隱式和/ 或顯式的)。例如,智能組件808可確定特定擴(kuò)充經(jīng)常被選中,并且相應(yīng)地更 新用于生成未來(lái)的擴(kuò)充的語(yǔ)言模型。根據(jù)另一說(shuō)明,智能組件808可以確定一 特定擴(kuò)充若被顯示則有很高的可能性被(例如,用戶)選中(例如,與突發(fā)新 聞相關(guān)聯(lián)的及時(shí)擴(kuò)充和/或結(jié)果);由此,智能組件808可隨候選列表一起提供 擴(kuò)充和/或嵌入的結(jié)果(即使這一擴(kuò)充不匹配輸入數(shù)據(jù))。
可以理解,智能組件808能夠從一組通過(guò)事件和/或數(shù)據(jù)捕捉到的觀察結(jié) 果中推出或推斷系統(tǒng)、環(huán)境和/或用戶的狀態(tài)。例如,推斷可用于標(biāo)識(shí)特定的上 下文或動(dòng)作,或可生成狀態(tài)的概率分布。推斷可以是概率性的——即,基于數(shù)
據(jù)和事件的考慮計(jì)算感興趣的狀態(tài)的概率分布。推斷也可以指用于從一組事件 和/或數(shù)據(jù)合成更高級(jí)事件的技術(shù)。這類推斷導(dǎo)致從一組觀察到的事件和/或儲(chǔ) 存的事件數(shù)據(jù)構(gòu)造新的事件或動(dòng)作,無(wú)論事件是否在相鄰時(shí)間上相關(guān),也無(wú)論 事件和數(shù)據(jù)是來(lái)自一個(gè)還是若干個(gè)事件和數(shù)據(jù)源??刹捎酶鞣N分類(顯式和/ 或隱式訓(xùn)練的)方案和/或系統(tǒng)(例如,支持矢量機(jī)、神經(jīng)網(wǎng)絡(luò)、專家系統(tǒng)、貝 葉斯信任網(wǎng)絡(luò)、模糊邏輯、數(shù)據(jù)融合引擎……)來(lái)執(zhí)行關(guān)于所要求保護(hù)的主題 的自動(dòng)化和/或推斷的動(dòng)作。
分類器是將輸入屬性矢量X = (Xl, X2, X3, X4, X")映射到該輸入屬于一個(gè)類
的置信度的函數(shù),即/r力二co"乂 ^we(c/a^)。這一分類可采用基于概率和/或基 于統(tǒng)計(jì)的分析(例如,分解成分析效用和成本)來(lái)預(yù)測(cè)或推斷用戶期望自動(dòng)執(zhí) 行的動(dòng)作。支持矢量機(jī)(SVM)是可采用的分類器的一個(gè)示例。SVM通過(guò)找 出可能輸入空間中的超曲面來(lái)操作,其中,超曲面試圖將觸發(fā)準(zhǔn)則從非觸發(fā)事 件中分離出來(lái)。直觀上,這使得分類對(duì)于接近但不等同于訓(xùn)練數(shù)據(jù)的測(cè)試數(shù)據(jù) 正確??刹捎闷渌ㄏ蚝头嵌ㄏ蚰P头诸惙椒ǎ?,例如,單純貝葉斯、貝 葉斯網(wǎng)絡(luò)、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、模糊邏輯模型以及提供不同獨(dú)立性模式的概率 分類模型。此處所使用的分類也包括用于開(kāi)發(fā)優(yōu)先級(jí)模型的統(tǒng)計(jì)回歸。
呈現(xiàn)組件810可提供各種類型的用戶界面以便于用戶與耦合到擴(kuò)充組件 804的任何組件之間的交互。如所描繪的,呈現(xiàn)組件810是可以與擴(kuò)充組件804 一起利用的單獨(dú)實(shí)體。然而,可以理解,呈現(xiàn)組件810和/或類似的査看組件可 以被結(jié)合到擴(kuò)充組件804 (和/或接口 802)中和/或是一獨(dú)立單元。呈現(xiàn)組件 810可提供一個(gè)或多個(gè)圖形用戶界面(GUI)、命令行界面等等。例如,可以 呈現(xiàn)向用戶提供對(duì)數(shù)據(jù)進(jìn)行加載、導(dǎo)入、讀取等的區(qū)域或手段的GUI,并且所 述GUI可包括呈現(xiàn)這些動(dòng)作的結(jié)果的區(qū)域。這些區(qū)域可包括已知的文本和/或 圖形區(qū)域,包括對(duì)話框、靜態(tài)控件、下拉菜單、列表框、彈出菜單、編輯控件、 組合框、單選按鈕、復(fù)選框、按鈕以及圖形框。另外,可采用便于呈現(xiàn)的工具, 諸如用于導(dǎo)航的垂直和/或水平滾動(dòng)條以及確定一區(qū)域是否可被査看的工具欄 按鈕。例如,用戶可以與耦合到擴(kuò)充組件804的一個(gè)或多個(gè)組件交互。
用戶還可與這些區(qū)域交互,以便例如經(jīng)由諸如鼠標(biāo)、滾球、鍵區(qū)、鍵盤、 筆和/或語(yǔ)音激活等各種設(shè)備來(lái)選擇和提供信息。通常,諸如鍵盤上的按鈕或回
車鍵等機(jī)制可在輸入了信息之后采用以啟動(dòng)搜索。然而,可以理解,所要求保 護(hù)的主題不限于此。例如,僅僅加亮顯示一復(fù)選框可啟動(dòng)信息傳送。在另一示 例中,可采用命令行界面。例如,命令行界面可以提示(例如,經(jīng)由顯示器上 的文本消息和音頻聲調(diào))用戶通過(guò)提供文本消息來(lái)輸入信息。用戶然后可提供 適當(dāng)?shù)男畔ⅲT如對(duì)應(yīng)于在該界面提示中提供的選項(xiàng)的字母數(shù)字輸入或?qū)μ崾?中所提出的問(wèn)題的回答。可以理解,命令行界面可以與GUI和/或API結(jié)合使 用。另外,命令行界面可以結(jié)合具有有限圖形支持和/或低帶寬通信信道的硬件
(例如,視頻卡)和/或顯示器(例如,黑白和EGA)來(lái)使用。
圖9-10示出了根據(jù)所要求保護(hù)的主題的方法。為解釋簡(jiǎn)明起見(jiàn),該方法 被描繪和描述為一系列動(dòng)作??梢岳斫夂兔靼?,本發(fā)明不受所示的動(dòng)作和/或動(dòng) 作次序的限制,例如,動(dòng)作可按各種次序和/或同時(shí)發(fā)生,并且可以與此處未呈 現(xiàn)和描述的其它動(dòng)作一起發(fā)生。此外,并非所有示出的動(dòng)作都是實(shí)現(xiàn)根據(jù)所要 求保護(hù)的主題的方法所必需的。另外,本領(lǐng)域的技術(shù)人員可以理解和明白,方 法可經(jīng)由狀態(tài)圖或事件替代地被表示為一系列相關(guān)狀態(tài)。
轉(zhuǎn)向圖9,所示是幫助擴(kuò)充輸入數(shù)據(jù)的方法卯O。在902處,獲得輸入數(shù) 據(jù)。例如,可以對(duì)任何類型的輸入設(shè)備(例如,臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、 手持式計(jì)算機(jī)、蜂窩電話、服務(wù)器……)接收輸入數(shù)據(jù)。另外,輸入數(shù)據(jù)可以 與搜索査詢、文本消息(例如,短消息服務(wù)(SMS)消息)、即時(shí)消息、所生 成和/或編輯的文檔等有關(guān)。此外,輸入數(shù)據(jù)可包括字母字符、數(shù)字字符、手寫(xiě) 數(shù)據(jù)、口頭數(shù)據(jù)、其組合等等。在904處,可將一個(gè)或多個(gè)隱式通配符插入到 輸入數(shù)據(jù)中。例如,隱式通配符可以被插入到輸入數(shù)據(jù)的末尾處。另外地或另 選地,隱式通配符可以被插入到輸入數(shù)據(jù)內(nèi)的一個(gè)或多個(gè)期望單詞的末尾處。 作為示例,隱式通配符可以被插入在輸入數(shù)據(jù)中的每一空格之前。在906處, 利用提供可能擴(kuò)充的語(yǔ)言模型生成候選擴(kuò)充數(shù)據(jù)列表。例如,可生成與輸入數(shù) 據(jù)相關(guān)聯(lián)的通配符(例如,隱式和/或顯式的)的k個(gè)最佳擴(kuò)充??梢岳斫?,對(duì) 所要求保護(hù)的主題可以利用任何語(yǔ)言模型。另外,候選列表可以用任何方式來(lái) 排序。例如,該排序可以至少部分地基于流行度、字母表順序等等。所生成的 候選列表可被提供給用戶、顯示、用于生成搜索結(jié)果等等。
參考圖10,所示是幫助評(píng)估與輸入數(shù)據(jù)相關(guān)聯(lián)的通配符的方法1000。在1002處,獲得輸入數(shù)據(jù)(例如,輸入文本……)。例如,用戶可以輸入期望搜 索查詢的(諸)部分。輸入數(shù)據(jù)可包括用戶提供的顯式通配符。另外地或另選 地,可將隱式通配符插入到輸入數(shù)據(jù)中(例如,插入到輸入數(shù)據(jù)內(nèi)的每一期望
單詞的末尾處)。在1004處,利用語(yǔ)言模型生成與輸入數(shù)據(jù)相關(guān)聯(lián)的通配符 的擴(kuò)充。例如,用戶可以按下"建議"按鈕以便于初始化與輸入數(shù)據(jù)相關(guān)聯(lián)的 隱式和/或顯式通配符的k個(gè)最佳擴(kuò)充的生成。在1006處,為候選列表中的擴(kuò) 充創(chuàng)建排序。作為示例,擴(kuò)充可根據(jù)流行度和/或字母表來(lái)排序。根據(jù)另一示例, 可顯式該候選列表。根據(jù)一個(gè)說(shuō)明,匹配實(shí)際輸入字符(或與電話數(shù)字字符沒(méi) 有歧義)的字符可以被突出顯示(例如,加粗、斜體、變化字體、變化顏色、 變化樣式……)。在1008處,可基于所選擴(kuò)充來(lái)執(zhí)行搜索。例如,建議的搜 索查詢可具有嵌入的超鏈接。由此,搜索可通過(guò)用戶點(diǎn)擊建議的搜索查詢來(lái)啟 動(dòng),這可將用戶直接帶到其中對(duì)搜索利用了所選的建議搜索查詢的搜索頁(yè)面。 例如,可利用任何搜索瀏覽器來(lái)顯示搜索結(jié)果。
圖11-23示出了描繪與擴(kuò)充通配符相關(guān)聯(lián)的各方面的示例性屏幕截圖。可 以理解,這些屏幕截圖是作為示例來(lái)提供的,并且所要求保護(hù)的主題不限于此。 參考圖11-15,所示是示出了從輸入數(shù)據(jù)生成擴(kuò)充數(shù)據(jù)的屏幕截圖。圖11描繪 了包括輸入數(shù)據(jù)域1102和建議按鈕(Suggest) 1104的屏幕截圖。在圖12中, 所示是描繪輸入數(shù)據(jù)1202 (例如,"cinoh")可被輸入到輸入數(shù)據(jù)域中的屏 幕截圖。圖13示出了可在按下建議按鈕之后獲得的與輸入數(shù)據(jù)相關(guān)聯(lián)的候選 擴(kuò)充數(shù)據(jù)列表1302。另外,可提供備選拼寫(xiě)1304作為候選列表1302的一部分。 圖14描繪了與涉及從候選列表中所選的擴(kuò)充的搜索結(jié)果相關(guān)聯(lián)的屏幕截圖。 圖15示出數(shù)字字符可被用作輸入數(shù)據(jù)1502 (例如,利用蜂窩電話鍵區(qū))。數(shù) 字?jǐn)?shù)據(jù)可被消除歧義和/或擴(kuò)充以生成與數(shù)字輸入有關(guān)的字母候選列表1504。 如在圖15所示的示例中所描繪的,候選1504中的兩個(gè)可以與以下歧義消除相 關(guān)聯(lián)"2"可表示"C",第一個(gè)"4"可表示"I",第一個(gè)"6"可表示"N", 第二個(gè)"6"可表示"0",而第二個(gè)"4"可表示"H"。候選列表1504內(nèi)的 擴(kuò)充中匹配輸入數(shù)據(jù)的字符可以在視覺(jué)上與作為擴(kuò)充的一部分生成的字符進(jìn) 行區(qū)分(例如,以黑體示出……)。
轉(zhuǎn)向圖16-23,所示是與至少部分地基于位置來(lái)生成擴(kuò)充數(shù)據(jù)有關(guān)的示例
性屏幕截圖。圖16示出了包括輸入數(shù)據(jù)域1602、位置域1604和建議按鈕1606 的屏幕截圖。圖17示出了顯示在按下顯示幫助按鈕(Displayhelp) 1702時(shí)發(fā) 生的結(jié)果(例如,可顯示示例輸入句法)的屏幕截圖。圖18示出了包括輸入 數(shù)據(jù)1802 (例如,"po")、位置數(shù)據(jù)1804 (例如,"solon")以及考慮了 位置數(shù)據(jù)的、與輸入數(shù)據(jù)的擴(kuò)充有關(guān)的候選列表1806的屏幕截圖。圖19描繪 了示出與選擇圖18的"post office"超鏈接相關(guān)聯(lián)的搜索結(jié)果1902的屏幕截圖。 具體地,圖19包括按照到與輸入的位置數(shù)據(jù)相關(guān)聯(lián)的地點(diǎn)的距離排序的本地 結(jié)果。參考圖20,所示是其中輸入數(shù)字?jǐn)?shù)據(jù)2002 (例如,"7 6")以及位置 數(shù)據(jù)2004的屏幕截圖。與選擇關(guān)于"post office"的超鏈接相關(guān)聯(lián)的搜索結(jié)果 在圖21的屏幕截圖中描繪。圖22示出了包括包含顯式通配符(例如,"s*gm*l) 的輸入數(shù)據(jù)2202的屏幕截圖。圖23描繪了與同圖22的輸入數(shù)據(jù)2202有關(guān)的 顯式和隱式通配符的擴(kuò)充相關(guān)聯(lián)的候選列表2302。
為了提供用于實(shí)現(xiàn)所要求保護(hù)的主題的各方面的附加上下文,圖24-25及 以下討論旨在提供對(duì)其中可實(shí)現(xiàn)本發(fā)明的各方面的合適的計(jì)算環(huán)境的簡(jiǎn)要概 括描述。盡管前面已經(jīng)在運(yùn)行在本地計(jì)算機(jī)和/或遠(yuǎn)程計(jì)算機(jī)上的計(jì)算機(jī)程序的 計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述了所要求保護(hù)的主題,然而本領(lǐng)域內(nèi)的 技術(shù)人員將認(rèn)識(shí)到,本發(fā)明也可以和與其他程序模塊結(jié)合實(shí)現(xiàn)。 一般地,程序 模塊包括執(zhí)行特定任務(wù)和/或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、數(shù)據(jù) 結(jié)構(gòu)等等。
此外,本領(lǐng)域的技術(shù)人員可以理解,本發(fā)明的方法可用其它計(jì)算機(jī)系統(tǒng)配 置來(lái)實(shí)施,包括單處理器或多處理器計(jì)算機(jī)系統(tǒng)、小型機(jī)、大型計(jì)算機(jī)、以及 個(gè)人計(jì)算機(jī)、手持式計(jì)算設(shè)備、基于微處理器的和/或可編程消費(fèi)電子產(chǎn)品等, 其每一個(gè)都可操作上與一個(gè)或多個(gè)相關(guān)聯(lián)的設(shè)備通信。所示的要求保護(hù)的主題 的各方面也可在其中某些任務(wù)由通過(guò)通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備來(lái)執(zhí)行的 分布式計(jì)算環(huán)境中實(shí)施。然而,本發(fā)明的一些方面(如果不是全部方面)可以 在獨(dú)立計(jì)算機(jī)上實(shí)施。在分布式計(jì)算環(huán)境中,程序模塊可以位于本地和/或遠(yuǎn)程 存儲(chǔ)器存儲(chǔ)設(shè)備中。
圖24是要求保護(hù)的主題可以與之交互的示例性計(jì)算環(huán)境2400的示意性框 圖。系統(tǒng)2400包括一個(gè)或多個(gè)客戶機(jī)2410。(諸)客戶機(jī)2410可以是硬件和
/或軟件(例如,線程、進(jìn)程、計(jì)算設(shè)備)。系統(tǒng)2400也包括一個(gè)或多個(gè)服務(wù)
器2420。(諸)服務(wù)器2420可以是硬件和/或軟件(例如,線程、進(jìn)程、計(jì)算 設(shè)備)。服務(wù)器2420可以容納各線程以通過(guò)例如利用本發(fā)明執(zhí)行轉(zhuǎn)換。
在客戶機(jī)2410和服務(wù)器2420之間的一種可能的通信能夠以適合在兩個(gè)或 多個(gè)計(jì)算機(jī)進(jìn)程之間傳輸?shù)臄?shù)據(jù)分組的形式進(jìn)行。系統(tǒng)2400包括可以用來(lái)使 (諸)客戶機(jī)2410和(諸)服務(wù)器2420之間通信更容易的通信框架2440。(諸) 客戶機(jī)2410可在操作上連接到一個(gè)或多個(gè)可以用來(lái)存儲(chǔ)對(duì)(諸)客戶機(jī)2410 本地的信息的客戶機(jī)數(shù)據(jù)存儲(chǔ)2450。同樣地,(諸)服務(wù)器2420可在操作上 連接到一個(gè)或多個(gè)可以用來(lái)存儲(chǔ)對(duì)(諸)服務(wù)器2430本地的信息的服務(wù)器數(shù) 據(jù)存儲(chǔ)2420。
參考圖25,用來(lái)實(shí)現(xiàn)所要求保護(hù)的主題各個(gè)方面的示例性環(huán)境2500包括 計(jì)算機(jī)2512。計(jì)算機(jī)2512包括處理器單元2514、系統(tǒng)存儲(chǔ)器2516、以及系統(tǒng) 總線2518。系統(tǒng)總線2518把包括但不限于系統(tǒng)存儲(chǔ)器2516的系統(tǒng)組件耦合到 處理單元2514。處理單元2514可以是各種可用處理器中的任意一種。雙微處 理器和其它多處理器體系結(jié)構(gòu)也可用作處理單元2514。
系統(tǒng)總線2518可以是幾種類型的總線結(jié)構(gòu)中的任意一種,包括存儲(chǔ)器總 線或存儲(chǔ)器控制器、外圍總線或外部總線、和/或利用下述可用總線體系結(jié)構(gòu)中 的任意一種的局部總線,其包括但不限于,工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(ISA)、微通 道體系結(jié)構(gòu)(MSA)、擴(kuò)展型ISA (EISA)、智能化驅(qū)動(dòng)器電子接口 (IDE)、 VESA局部總線(VLB)、外圍部件互連(PCI)、插件總線、通用串行總線 (USB)、高級(jí)圖形端口(AGP)、個(gè)人計(jì)算機(jī)存儲(chǔ)卡國(guó)際聯(lián)合會(huì)總線(PCMCIA)、 火線(IEEE 1394)、以及小型計(jì)算機(jī)系統(tǒng)接口 (SCSI)。
系統(tǒng)存儲(chǔ)器2516包括易失性存儲(chǔ)器2520以及非易失性存儲(chǔ)器2522?;?本輸入/輸出系統(tǒng)(BIOS)包含諸如在啟動(dòng)期間在計(jì)算機(jī)2512的元件之間傳送 信息的基本例程,其存儲(chǔ)在非易失性存儲(chǔ)器2522中。作為說(shuō)明而非局限,非 易失性存儲(chǔ)器2522可以包括只讀存儲(chǔ)器(ROM)、可編程ROM (PROM)、 電可編程ROM (EPROM)、電可擦除可編程ROM (EEPROM)、或者閃存。 易失性存儲(chǔ)器2520包括用作外部高速緩沖存儲(chǔ)器的隨機(jī)存取存儲(chǔ)器(RAM)。 作為示例而非局限,RAM以多種形式可得,諸如靜態(tài)RAM (SRAM)、動(dòng)態(tài) RAM (DRAM)、同步DRAM (SDRAM)、雙數(shù)據(jù)率SDRAM (DDR SDRAM)、 增強(qiáng)型SDRAM (ESDRAM)、同步鏈路(Synchlink) DRAM (SLDRAM)、 存儲(chǔ)器總線(Rambus)直接RAM (RDRAM)、直接存儲(chǔ)器總線動(dòng)態(tài)RAM (DRDRAM)、以及存儲(chǔ)器總線動(dòng)態(tài)RAM (RDRAM)。
計(jì)算機(jī)2512還包括可移動(dòng)/不可移動(dòng)、易失性/非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)。 例如,圖25示出了盤存儲(chǔ)2524。盤存儲(chǔ)2524包括但不限于諸如磁盤驅(qū)動(dòng)器、 軟盤驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器、Jaz驅(qū)動(dòng)器、Zip驅(qū)動(dòng)器、LS-100驅(qū)動(dòng)器、閃存卡、 或者記憶棒之類的設(shè)備。此外,盤存儲(chǔ)2524可以包括獨(dú)立的或者與其它存儲(chǔ) 介質(zhì)結(jié)合的存儲(chǔ)介質(zhì),包括但不限于諸如緊致盤ROM設(shè)備(CD-ROM)、可 記錄CD驅(qū)動(dòng)器(CD-R驅(qū)動(dòng)器)、可重寫(xiě)CD驅(qū)動(dòng)器(CD-RW驅(qū)動(dòng)器)或者 數(shù)字多功能盤ROM驅(qū)動(dòng)器(DVD-ROM)這樣的光盤驅(qū)動(dòng)器。為了便于把盤 存儲(chǔ)設(shè)備2524連接到系統(tǒng)總線2518,通常使用諸如接口 2526等可移動(dòng)或不可 移動(dòng)接口。
應(yīng)該明白,圖25描述了擔(dān)當(dāng)用戶與在合適的操作環(huán)境2500中描述的基本 計(jì)算機(jī)資源之間的中介的軟件。這些軟件包括操作系統(tǒng)2528。存儲(chǔ)在盤存儲(chǔ) 2524上的操作系統(tǒng)2528用于控制并分配計(jì)算機(jī)系統(tǒng)2512的資源。系統(tǒng)應(yīng)用程 序2530通過(guò)存儲(chǔ)在系統(tǒng)存儲(chǔ)器2516或盤存儲(chǔ)2524上的程序模塊2532和程序 數(shù)據(jù)2534利用了操作系統(tǒng)2528對(duì)資源的管理。應(yīng)該明白,所要求保護(hù)的主題 可以用各種操作系統(tǒng)或操作系統(tǒng)的組合來(lái)實(shí)現(xiàn)。
用戶通過(guò)輸入設(shè)備2536把命令或信息輸入到計(jì)算機(jī)2512中。輸入設(shè)備 2536包括但不限于諸如鼠標(biāo)、跟蹤球、指示筆、觸摸墊等定點(diǎn)設(shè)備、鍵盤、話 筒、操縱桿、游戲手柄、圓盤式衛(wèi)星天線、掃描儀、TV調(diào)諧卡、數(shù)碼相機(jī)、 數(shù)碼攝像機(jī)、網(wǎng)絡(luò)攝像頭等等。這些以及其它輸入設(shè)備通過(guò)系統(tǒng)總線2518經(jīng) 由接口端口 2538連至處理單元2514。接口端口 2538包括,例如串行端口、并 行端口、游戲端口、以及通用串行總線(USB)。輸出設(shè)備2540利用和輸入 設(shè)備2536相同類型的某些端口 。因此,例如,USB端口可以用來(lái)向計(jì)算機(jī)2512 提供輸入,以及把來(lái)自計(jì)算機(jī)2512的信息輸出到輸出設(shè)備2540。提供輸出適 配器2542是為了說(shuō)明除了輸出設(shè)備2540之外還有一些像監(jiān)視器、揚(yáng)聲器、以 及打印機(jī)這樣的需要專用適配器的輸出設(shè)備2540。輸出適配器2542包括,作
為說(shuō)明而非局限,提供輸出設(shè)備2540和系統(tǒng)總線2518之間的連接手段的顯卡 和聲卡。應(yīng)該注意到,其它設(shè)備和/或設(shè)備系統(tǒng)提供了輸入和輸出能力,諸如遠(yuǎn) 程計(jì)算機(jī)2544。
計(jì)算機(jī)2512可以利用到諸如遠(yuǎn)程計(jì)算機(jī)2544這樣的一個(gè)或多個(gè)遠(yuǎn)程計(jì)算 機(jī)的邏輯連接在聯(lián)網(wǎng)的環(huán)境中操作。遠(yuǎn)程計(jì)算機(jī)2544可以是個(gè)人計(jì)算機(jī)、服 務(wù)器、路由器、網(wǎng)絡(luò)PC、工作站、基于微處理器的電器、對(duì)等設(shè)備或者其它 常見(jiàn)的網(wǎng)絡(luò)節(jié)點(diǎn)等,且通常包括相對(duì)于計(jì)算機(jī)2512所描述的很多或者全部元 件。為了簡(jiǎn)明起見(jiàn),僅示出了遠(yuǎn)程計(jì)算機(jī)2544的存儲(chǔ)器存儲(chǔ)設(shè)備2546。遠(yuǎn)程 計(jì)算機(jī)2544經(jīng)由網(wǎng)絡(luò)接口 2548被邏輯地連接到計(jì)算機(jī)2512,然后經(jīng)由通信連 接2550物理地連接。網(wǎng)絡(luò)接口 2548包括諸如局域網(wǎng)(LAN)和廣域網(wǎng)(WAN) 這樣的有線和/或無(wú)線通信網(wǎng)絡(luò)。LAN技術(shù)包括光纖分布式數(shù)據(jù)接口 (FDDI)、 銅分布式數(shù)據(jù)接口 (CDDI)、以太網(wǎng)、令牌環(huán)等。WAN技術(shù)包括但不限于, 點(diǎn)對(duì)點(diǎn)鏈路、諸如綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)及其各種變體等電路交換網(wǎng)、分 組交換網(wǎng)、以及數(shù)字用戶線(DSL)。
通信連接2550指的是用于把網(wǎng)絡(luò)接口2548連接到總線2518的硬件/軟件。 雖然為了清楚地舉例說(shuō)明,通信連接2550被示為在計(jì)算機(jī)2512的內(nèi)部,但其 也可以在計(jì)算機(jī)2512的外部。連接到網(wǎng)絡(luò)接口 2548所需要的硬件/軟件包括, 僅出于示例的目的,內(nèi)部和外部技術(shù),諸如包括常規(guī)電話級(jí)調(diào)制解調(diào)器、電纜 調(diào)制解調(diào)器以及DSL調(diào)制解調(diào)器的調(diào)制解調(diào)器、ISDN適配器和以太網(wǎng)卡。
在上面所描述的包括本發(fā)明的示例。當(dāng)然,不可能為了描述所要求保護(hù)的 主題而描述組件或方法的每一個(gè)可以想到的組合,但本領(lǐng)域內(nèi)的普通技術(shù)人員 應(yīng)該認(rèn)識(shí)到,本發(fā)明的許多進(jìn)一步的組合和排列都是可能的。因此,所要求保 護(hù)的主題旨在涵蓋所有這些落入所附權(quán)利要求書(shū)的精神和范圍內(nèi)的改變、修改 和變動(dòng)。
特別地,對(duì)于由上述組件、設(shè)備、電路、系統(tǒng)等執(zhí)行的各種功能,除非另 外指明,否則用于描述這些組件的術(shù)語(yǔ)(包括對(duì)"裝置"的引用)旨在對(duì)應(yīng)于 執(zhí)行所描述的執(zhí)行此處在所要求保護(hù)的主題的示例性方面中所示的功能的組 件的指定功能(例如,功能上等效)的任何組件,即使這些組件在結(jié)構(gòu)上不等 效于所公開(kāi)的結(jié)構(gòu)。在這一點(diǎn)上,也可認(rèn)識(shí)到本發(fā)明包括用于執(zhí)行所要求保護(hù)
的主題的各種方法的動(dòng)作和/或事件的系統(tǒng)以及具有用于執(zhí)行這些動(dòng)作和/或事 件的計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì)。
另外,盡管可相對(duì)于若干實(shí)現(xiàn)中的僅一個(gè)來(lái)公開(kāi)本發(fā)明的一個(gè)特定特征, 但是這一特征可以如對(duì)任何給定或特定應(yīng)用所需且有利地與其它實(shí)現(xiàn)的一個(gè) 或多個(gè)其它特征相組合。此外,就在說(shuō)明書(shū)或權(quán)利要求書(shū)中使用術(shù)語(yǔ)"包括"
和"含有"及其變體而言,這些術(shù)語(yǔ)旨在以與術(shù)語(yǔ)"包含"相似的方式為包含 性的。
權(quán)利要求
1.一種擴(kuò)充輸入數(shù)據(jù)的系統(tǒng),包括獲得輸入數(shù)據(jù)的接口(102、202、302、402、502、602、702、802);修改所述輸入數(shù)據(jù)以包括在每一期望單詞的末尾處插入的至少一個(gè)隱式通配符的通配符插入組件(208);以及至少部分地基于包括所述至少一個(gè)隱式通配符的所述輸入數(shù)據(jù)、利用提供通配符的可能擴(kuò)充的語(yǔ)言模型來(lái)生成候選擴(kuò)充數(shù)據(jù)列表的擴(kuò)充組件(104、204、304、404、504、604、704、804)。
2. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述通配符插入組件標(biāo)識(shí)對(duì) 應(yīng)于所述輸入數(shù)據(jù)內(nèi)的每一期望單詞的末尾。
3. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述通配符插入組件在所述 輸入數(shù)據(jù)內(nèi)的每一空格前插入所述至少一個(gè)隱式通配符。
4. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述通配符插入組件提供所 述輸入數(shù)據(jù)的開(kāi)頭處的隱式通配符和所述輸入數(shù)據(jù)中的每一期望單詞的開(kāi)頭 處的隱式通配符中的至少一個(gè)。
5. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述輸入數(shù)據(jù)包括由所述擴(kuò) 充組件通過(guò)采用所述語(yǔ)言模型來(lái)擴(kuò)充的顯式通配符。
6. 如權(quán)利要求1所述的系統(tǒng),其特征在于,還包括將所述輸入數(shù)據(jù)轉(zhuǎn)換 成對(duì)應(yīng)的字母字符數(shù)據(jù)的轉(zhuǎn)換組件,所述字母字符數(shù)據(jù)被擴(kuò)充以產(chǎn)生所述候選 擴(kuò)充數(shù)據(jù)列表。
7. 如權(quán)利要求6所述的系統(tǒng),其特征在于,所述轉(zhuǎn)換組件轉(zhuǎn)換包括語(yǔ)音 數(shù)據(jù)、手寫(xiě)數(shù)據(jù)和數(shù)字?jǐn)?shù)據(jù)中的至少一個(gè)的輸入數(shù)據(jù)。
8. 如權(quán)利要求1所述的系統(tǒng),其特征在于,還包括修改所述輸入數(shù)據(jù)的 至少一部分以解決潛在拼寫(xiě)錯(cuò)誤的拼寫(xiě)糾正組件,使得所述擴(kuò)充組件在所述候 選列表內(nèi)包括對(duì)應(yīng)于所修改的輸入數(shù)據(jù)的擴(kuò)充數(shù)據(jù)。
9. 如權(quán)利要求1所述的系統(tǒng),其特征在于,還包括基于從所述候選擴(kuò)充 數(shù)據(jù)列表的選擇來(lái)執(zhí)行搜索的搜索組件。
10. 如權(quán)利要求1所述的系統(tǒng),其特征在于,還包括基于一訓(xùn)練數(shù)據(jù)集來(lái)訓(xùn)練所述語(yǔ)言模型的模型訓(xùn)練組件。
11. 如權(quán)利要求10所述的系統(tǒng),其特征在于,所述模型訓(xùn)練組件還包括 基于與所述輸入數(shù)據(jù)相關(guān)聯(lián)的應(yīng)用程序來(lái)選擇一特定訓(xùn)練數(shù)據(jù)集的訓(xùn)練集選 擇組件。
12. 如權(quán)利要求11所述的系統(tǒng),其特征在于,所述訓(xùn)練集選擇組件選擇基于對(duì)web搜索應(yīng)用程序的利用的査詢?nèi)罩竞蛍eb文檔、基于對(duì)文本編輯器 應(yīng)用程序的利用的文檔、以及基于對(duì)即時(shí)消息通信應(yīng)用程序的利用的即時(shí)消息 通信日志中的至少一個(gè)。
13. 如權(quán)利要求l所述的系統(tǒng),其特征在于,還包括在輸入所述輸入數(shù)據(jù) 的每一字符時(shí)動(dòng)態(tài)地更新所述候選擴(kuò)充數(shù)據(jù)列表的更新組件。
14. 一種幫助擴(kuò)充輸入數(shù)據(jù)的方法,包括 將隱式通配符插入到每一期望單詞的末尾處;以及 通過(guò)利用提供可能的通配符擴(kuò)充的語(yǔ)言模型來(lái)生成候選擴(kuò)充列表。
15. 如權(quán)利要求14所述的方法,其特征在于,還包括基于一訓(xùn)練數(shù)據(jù)集 來(lái)訓(xùn)練所述語(yǔ)言模型。
16. 如權(quán)利要求14所述的方法,其特征在于,還包括在獲得所述輸入數(shù) 據(jù)時(shí)動(dòng)態(tài)地更新所述候選擴(kuò)充列表。
17. 如權(quán)利要求14所述的方法,其特征在于,還包括利用來(lái)自所述候選列表的擴(kuò)充中的特定一個(gè)擴(kuò)充來(lái)執(zhí)行搜索。
18. 如權(quán)利要求14所述的方法,其特征在于,還包括自動(dòng)執(zhí)行對(duì)最可能的擴(kuò)充的搜索以及連同所述候選擴(kuò)充列表一起嵌入與所述搜索相關(guān)聯(lián)的結(jié)果。
19. 如權(quán)利要求14所述的方法,其特征在于,還包括至少部分地基于所 獲得的位置數(shù)據(jù)來(lái)生成所述候選擴(kuò)充列表。
20. —種插入通配符并擴(kuò)充輸入數(shù)據(jù)的系統(tǒng),包括 用于獲得輸入數(shù)據(jù)的裝置(102、 202、 302、 402、 502、 602、 702、 802); 用于將隱式通配符插入到所述輸入數(shù)據(jù)中以便于擴(kuò)充每一期望單詞的裝置(208);以及用于通過(guò)利用提供可能的通配符擴(kuò)充的語(yǔ)言模型來(lái)生成候選擴(kuò)充列表的 裝置(104、 204、 304、 404、 504、 604、 704、 804)。
全文摘要
所要求保護(hù)的主題提供了擴(kuò)充輸入數(shù)據(jù)的系統(tǒng)和/或方法。一接口可獲得輸入數(shù)據(jù),且一通配符插入組件可修改該輸入數(shù)據(jù)以包括插入在每一期望單詞的末尾處的至少一個(gè)隱式通配符。另外,一擴(kuò)充組件可至少部分地基于包括至少一個(gè)隱式通配符的輸入數(shù)據(jù),利用提供可能的通配符擴(kuò)充的語(yǔ)言模型來(lái)生成候選擴(kuò)充數(shù)據(jù)列表。此外,該擴(kuò)充組件可在服務(wù)器處評(píng)估輸入數(shù)據(jù)。
文檔編號(hào)G06F17/00GK101375279SQ200780003211
公開(kāi)日2009年2月25日 申請(qǐng)日期2007年1月4日 優(yōu)先權(quán)日2006年1月17日
發(fā)明者B·提爾森, K·丘奇, T·D·薩普 申請(qǐng)人:微軟公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1