專利名稱:基于隱式馬爾可夫模型的手寫筆跡/書法生成的制作方法
基于隱式馬爾可夫模型的手寫筆跡/書法生成 背景 模仿個性化或有美感的手寫字符的真實筆跡的手寫和/或書法生成在娛樂或計 算機圖形領(lǐng)域正變得越來越流行。生成這些風(fēng)格元素的系統(tǒng)不同于僅僅打印或顯示標準字 體的常規(guī)系統(tǒng)。以下是常規(guī)系統(tǒng)的簡要概覽,這幫助凸顯對于手寫筆跡和/或書法生成所 存在的挑戰(zhàn)。 存在用于輸入文本或手寫筆跡的許多類型的輸入設(shè)備。例如,常規(guī)計算機鍵盤是 在致動鍵或鍵的組合時生成信號的輸入設(shè)備。計算機內(nèi)的芯片接收信號位并將其解碼成正 確的按鍵。該計算機然后基于所按下的鍵來決定做什么(例如,在屏幕上顯示一字符或執(zhí) 行某一動作)。所顯示的字符通常根據(jù)字面或字體來顯示。例如,文字處理程序可包括諸如 Arial、Time New Roman等字體。 在印刷術(shù)中,字面是風(fēng)格單一地設(shè)計的一組協(xié)調(diào)的字形。字面通常包括字母表、數(shù)
字和標點符號;它還可包括表意文字和符號或者全由它們組成,例如,數(shù)學(xué)或制圖符號。術(shù)
語字面通常與字體混合,字體是歷史上在桌面發(fā)布出現(xiàn)之前具有多個不同含義的術(shù)語;在
討論數(shù)字印刷術(shù)時,這些術(shù)語現(xiàn)在實際上是同義的。字體和字面之間的一個值得注意且仍
然有效的區(qū)別是字體的狀態(tài)作為離散物品,而字面指定視覺外觀或風(fēng)格。 設(shè)計字面的藝術(shù)和手藝被稱為字設(shè)計。字面的設(shè)計者被稱為字設(shè)計者,并且通常
是排印工人。在數(shù)字印刷術(shù)中,字設(shè)計者也被稱為字體開發(fā)者或字體設(shè)計者。 無論用戶是通過鍵盤、筆/圖形輸入板、還是通過語音識別等來輸入字符,對于常
規(guī)系統(tǒng)而言,最終結(jié)果由與所輸入的字符具有一對一對應(yīng)關(guān)系的所選字體來規(guī)定。例如,雖
然一個人可以在圖形輸入板上使用筆來輸入草寫體字符,但常規(guī)手寫識別和生成系統(tǒng)能夠
實現(xiàn)的最佳"草寫體"結(jié)果是通過不考慮字符順序、間隔等的草寫體字體實現(xiàn)的。換言之,
輸出與表達相剝離。雖然用戶可論證地對特定字體應(yīng)用斜體樣式以進行強調(diào)(或加下劃線
或粗體),但最終結(jié)果仍然缺乏人類手寫筆跡中出現(xiàn)的表達。 對于表達,一個人可通過使用僵直的、有傾斜度的、高壓筆劃來表達憤怒,或者一 個人可通過使用巻曲的、舒展的、低壓筆劃來表達喜悅。的確,筆跡學(xué)領(lǐng)域致力于對這些字 符的研究和分析,尤其在與人類心理狀態(tài)的關(guān)系方面。筆跡學(xué)已用于評估配偶相容性、智力 和甚至將來(類似于占星術(shù)),對于名人、政客等尤其如此。在醫(yī)療領(lǐng)域,筆跡學(xué)有更實際的 目的,例如,幫助診斷和跟蹤大腦和神經(jīng)系統(tǒng)的疾病。法院和銀行經(jīng)常使用筆跡學(xué)的各方面 (或者更一般而言是筆劃特征、字符鍵入等)來認證書寫者身份或?qū)υ撋矸莅l(fā)表意見。
此處所討論的各示例性技術(shù)可生成手寫筆跡和/或書法。這些技術(shù)允許寬泛范圍
的用戶表達。
概述 —種用于手寫字符生成(例如,草寫體、書法或其他風(fēng)格化字符)的示例性方法包 括接收一個或多個字符以及對于該一個或多個接收到的字符,使用被訓(xùn)練以供生成手寫字 符的隱式馬爾可夫模型來生成手寫字符。在這一方法中,經(jīng)訓(xùn)練的隱式馬爾可夫模型可使 用諸如最大后驗技術(shù)、最大似然線性回歸技術(shù)或本征空間技術(shù)等技術(shù)來自適應(yīng)。
4
附圖簡述 參考附圖描述了非限制性的和非窮盡的實施例,其中除非另外指定,否則在各個
視圖中相同的附圖標記指示相同的部分。
圖1是用于生成手寫字符的設(shè)備和過程的圖示。 圖2是東亞(EA)字符以及筆劃指示、筆劃順序和EA字符的草寫體和印刷體表示 的圖示;注意各示例性方法可以與來自其他語言(例如,草寫體英語等)的字符一起使用。
圖3是用于字符和風(fēng)格建模的各種建模特征的圖示。 圖4是用于使用基于HMM的模型以及個性化選項來生成手寫字符的示例性方法的 圖示。 圖5是用于手寫字符生成的示例性方法的圖示,該方法包括訓(xùn)練階段和合成階段 以及示例性特征向量和求解技術(shù)。 圖6是用于使用一種或多種自適應(yīng)技術(shù)來使經(jīng)訓(xùn)練的HMM自適應(yīng)的示例性方法的 圖示。 圖7是用于通過將自適應(yīng)技術(shù)應(yīng)用于一個或多個均值向量和一個或多個協(xié)方差 矩陣來使初始、經(jīng)訓(xùn)練的HMM自適應(yīng)的示例性方法的圖示。 圖8是使用示例性系統(tǒng)來生成和呈現(xiàn)的各種手寫EA字符的圖示,該示例性系統(tǒng)使 用斜率、曲率和虛構(gòu)筆劃特征。 圖9是可用于實現(xiàn)此處所討論的各種示例性方法中的部分或全部的示例性計算
設(shè)備的各個組件的圖示。 詳細描述 此處描述了在手寫筆跡和書法生成系統(tǒng)中使用的技術(shù)。這些技術(shù)可應(yīng)用于與各種 語言中的任一種相關(guān)聯(lián)的手寫筆跡。例如,在英語中,各種示例性技術(shù)可生成草寫手寫筆 跡,而在漢語中,各種技術(shù)可生成手寫字符。在這些示例中的任一個中,所生成或呈現(xiàn)的手 寫筆跡的風(fēng)格可以是"金牌"書寫者的風(fēng)格、特定書寫者的風(fēng)格或者不止一個書寫者的風(fēng)格 組合。對于最后一種情況,書寫者可選擇她的手寫和金牌書寫者(或著名書寫者)的手寫 之間的特征相似性或自適應(yīng)性的程度。這些技術(shù)允許書寫者"偽造"金牌書寫者的手寫筆 跡或書法,"偽造"名人的手寫筆跡或書法或者將另一書寫者的風(fēng)格的各方面混合到該書寫 者自己的手寫筆跡或書法中。 圖1示出了用于手寫筆跡和/或書法生成100的過程和設(shè)備。關(guān)于設(shè)備,示出了 計算設(shè)備以及各種輸入部件120的某些示例。輸入可經(jīng)由鍵盤、筆、話筒、遙控器、蜂窩電 話鍵區(qū)等來進行。關(guān)于生成,顯示器140、鍵盤170和計算設(shè)備180示出用戶能夠如何經(jīng)由 字符鍵172和數(shù)字鍵174來輸入信息。在圖1的示例中,用戶使用鍵盤170來輸入"HellQ World"或東亞字符"來"。對于常規(guī)系統(tǒng),計算設(shè)備180使得顯示器140以所選標準字體150 顯示"HelloWorld"或"來"。相反,在示例性手寫筆跡生成系統(tǒng)中,計算設(shè)備180使得顯示 器140顯示草寫體的"Hello World"或繕寫的東亞字符。 此處所描述的各種示例性技術(shù)使用諸如常用于手寫字符識別的基于隱式馬爾可 夫模型(HMM)的方法來生成手寫字符。例如,為了生成風(fēng)格化輸出160,計算機180包括使 用示例性的基于HMM的手寫筆跡生成方法的軟件。用于手寫字符生成的示例性方法(例如, 至少部分地由計算設(shè)備實現(xiàn))包括接收字符并使用為生成手寫字符而訓(xùn)練的HMM來生成對應(yīng)的手寫字符。這一方法可接收字符串或字符組并生成對應(yīng)的手寫字符。
由此,如此處所描述的,手寫字符生成依賴于基于HMM的方法。各種字符識別系統(tǒng) 使用基于HMM的方法來基于書寫者的輸入數(shù)據(jù)識別字符。單個HMM包括狀態(tài)以及可使用適 當?shù)挠?xùn)練信息來訓(xùn)練的狀態(tài)轉(zhuǎn)換。 一組經(jīng)訓(xùn)練的HMM以及關(guān)于一個或多個字符的輸入信息 可用于預(yù)測該輸入信息的可能結(jié)果(例如,對應(yīng)于該字符信息的一個或多個字符)。
如在下文中更詳細地描述的,一種示例性方法使計算設(shè)備能以自然的、個性化的 或有美感的方式生成手寫字符。如圖1的示例所示,用戶可使用鍵盤170來鍵入一消息,并 且然后計算機180將自動生成模仿人類手寫筆跡的筆跡。 各種示例性技術(shù)解決靈活的、可訓(xùn)練的框架中的手寫筆跡生成。 一種示例性技術(shù)
對代表性特征(例如,字符的x、y坐標)以及導(dǎo)出特征(例如,斜率和曲率)建模。因此,
在生成對應(yīng)于手寫字符的跡線時,該方法能夠?qū)μ峁┢交E線的最大似然問題求解,因為
不僅斜率而且曲率都被訓(xùn)練成在似然的意義上盡可能地接近對應(yīng)的模型。 除了靈活性、可訓(xùn)練性和自適應(yīng)性優(yōu)點之外,另一能力是生成超出傳統(tǒng)字體概念
(參見背景部分)的連續(xù)手寫筆跡。各種示例性技術(shù)可使用壓力和速度信息來定義特征。
有了這些信息和特征,使用基于HMM的生成方法的示例性框架還能夠處理由畫筆書寫的有
美感的東亞書法。 各種示例性技術(shù)能夠使用各種筆劃順序/書寫風(fēng)格和虛構(gòu)筆劃(或者在常規(guī)的基 于HMM的字符識別系統(tǒng)中使用的其他技術(shù))來表征筆跡。 一種示例性手寫字符生成系統(tǒng)采 用多路徑HMM和多空間概率分布(MSD)來對筆劃順序/書寫風(fēng)格和虛構(gòu)筆劃求解。
用于字符識別的常規(guī)的基于HMM的方法可如下地操作。在定義東亞字符的特征之 后,從訓(xùn)練墨水數(shù)據(jù)中提取所定義的特征以訓(xùn)練HMM模型。所提取的特征(有時被稱為"特 征信息")可用于(i)訓(xùn)練字符識別模型或者(ii)可被輸入到經(jīng)訓(xùn)練的字符識別模型中, 該模型進而輸出對應(yīng)于該特征信息的字符。 如此處所描述的,出于手寫筆跡和/或書法的目的,用于生成手寫筆跡的示例性 的基于HMM的方法使用所定義的特征來捕捉不僅與字符,而且與字符或字符串(例如,以草 寫體書寫的字)中的各個筆劃的風(fēng)格特性相關(guān)聯(lián)的特質(zhì)。捕捉這些特性的過程此處被稱為 編碼,這是訓(xùn)練示例性的基于HMM的系統(tǒng)以生成手寫筆跡和/或書法的訓(xùn)練過程的一部分。
對于常規(guī)的基于HMM的字符識別,對關(guān)于手寫字符的墨水數(shù)據(jù)應(yīng)用特征提取并且 將所得特征信息輸入到經(jīng)訓(xùn)練的HMM中。接著,使用來自經(jīng)訓(xùn)練的HMM的輸出來選擇對應(yīng)于 特征信息并且間接對應(yīng)于墨水數(shù)據(jù)的字符。經(jīng)訓(xùn)練的HMM模型的準確性取決于各種因素, 包括所選在線特征集。 如此處所描述的,用于手寫筆跡生成的示例性的基于HMM的方法使用足夠豐富以 編碼手寫字符及其相關(guān)聯(lián)的風(fēng)格元素的所選特征集。取決于要編碼或再現(xiàn)(例如,呈現(xiàn)) 的表達水平,特征可允許編碼單個字符或具有不同風(fēng)格(例如,喜悅、憤怒等)的字符串。
更具體而言, 一種示例性方法處理墨水數(shù)據(jù)(例如,關(guān)于"金牌"書寫者、普通用戶 等的手寫筆跡的墨水數(shù)據(jù))以提供特征信息,該特征信息然后可用于訓(xùn)練基于H匪的手寫 筆跡生成模型。在需要時,墨水數(shù)據(jù)處理可包括重新采樣以確保每一字符筆劃的墨水數(shù)據(jù) 點的間隔統(tǒng)一。墨水數(shù)據(jù)處理可將墨水數(shù)據(jù)分解成各個幀,其中可針對一組預(yù)定特征來分 析這些幀。例如,一組特征可包括正切或斜率特征、曲率特征和虛構(gòu)筆劃特征。進而,該組
6特征可增強字符生成。 特征可參考可以是數(shù)學(xué)等式的規(guī)則來描述。特征可使用一個數(shù)字(例如,角度、長
度等)、多個數(shù)字(例如,坐標等)或其他表示來表征。在特征之間可能存在關(guān)系,其中這一
關(guān)系可出于字符編碼和/或風(fēng)格編碼的目的來量化。所提取的墨水數(shù)據(jù)特征可以按例如向
量或數(shù)組的形式表示為用于訓(xùn)練基于HMM的手寫筆跡生成系統(tǒng)的合適的輸入。 基于特征的方法使墨水數(shù)據(jù)能以聚焦于保留增強或以其他方式便于手寫筆跡生
成的特性同時仍然保留所需風(fēng)格特性的方式減少。特征提取還可用于消除無關(guān)或降低識別
準確度的數(shù)據(jù)或特性。 字符特征和建模特征 圖2示出了連同筆劃指示的東亞(EA)字符205以及每一筆劃的起始點和結(jié)束點 (1-6)的時序210的圖示200。還示出了草寫體和印刷體字符220。如參照字符205所指示 的,筆劃可以是真實筆劃(例如,墨水筆劃)或虛構(gòu)筆劃。根據(jù)個人繪制該字符的順序來從 l到6標記各個筆劃的起始點和結(jié)束點。示出了點l到6中的每一個的以毫秒計的時序110 以及笛卡爾坐標(x,y)。在該示例中,書寫者在時刻O毫秒在點l處開始第一真實筆劃,并 且在時刻20毫秒在點2處結(jié)束該第一筆劃。第二真實筆劃在時刻36毫秒在點3處開始并 且在時刻48毫秒在點4處結(jié)束。最后的真實筆劃在時刻71毫秒在點5處開始并且在時刻 95毫秒在點6處結(jié)束。在使用100Hz的采樣速率的情況下,最小時間增量將會是10毫秒, 因此,時間信息可能是四舍五入的(例如,O毫秒、20毫秒、40毫秒、50毫秒、70毫秒、100毫 秒)。時序信息允許確定筆劃的速率、速度和加速度。 此處所描述的各種技術(shù)可以與在線手寫墨水數(shù)據(jù)或離線手寫墨水一起使用以訓(xùn) 練基于HMM的生成系統(tǒng)或使其自適應(yīng)。離線手寫數(shù)據(jù)通常被轉(zhuǎn)換成缺少時間信息的圖像, 而在線手寫數(shù)據(jù)可由對筆尖跡線的一系列點進行采樣的圖形輸入板設(shè)備來收集。然而,離 線手寫數(shù)據(jù)可以按保留時間信息(例如,速率、速度、加速度等)和/或其他信息(例如,壓 力、畫筆粗度等)的方式來生成。 雖然圖2的時序210僅示出了笛卡爾坐標和時間戳,但手寫墨水數(shù)據(jù)可包括其他 信息。對于書法,手寫數(shù)據(jù)中可包括畫筆信息或其他書法相關(guān)信息。手寫數(shù)據(jù)可包括關(guān)于 若干筆劃的書寫順序的信息,諸如對應(yīng)于一字符的三個筆劃的有序點1到6。如將在下文中 進一步描述的,基于HMM的模型可包括表示一組筆劃的不同筆劃順序的路徑,其進而能夠 解釋書寫風(fēng)格。 一般而言,一組預(yù)定特征捕捉特定類型的手寫筆跡信息以保留風(fēng)格特性。
被配置成記錄手寫筆跡的設(shè)備通常依賴于書寫工具(例如,筆)和記錄表面(參 見,例如,圖1的設(shè)備110)之間的交互。在形成字符時,每一墨水筆劃都可被記錄為由筆尖 在圖形輸入板上的接觸喚起的采樣點序列,其表示筆尖在提筆和落筆之間的跡線。用戶還 可在筆劃之間提起書寫工具以使得不記錄該工具的移動,然而,不與墨水筆劃相關(guān)聯(lián)的移 動與墨水筆劃的移動相比可被認為是不重要的。更具體而言,手寫字符具有一個或多個墨 水筆劃,這些墨水筆劃在坐標中是不連續(xù)的。 對于東亞字符,用戶可以按印刷體(printed)風(fēng)格、行體(ru皿ing)風(fēng)格或草寫體 風(fēng)格來書寫字符。這些風(fēng)格可一致地用固定數(shù)量的筆劃或可變數(shù)量的筆劃來書寫。例如, 考慮字符220的草寫體和印刷體版本。在印刷體風(fēng)格中,字符更規(guī)則地書寫(例如,像印刷 字體)并且兩個筆劃之間的邊界往往相當明顯;而在行體或草寫體風(fēng)格中,連續(xù)筆劃往往連接在一起并且連續(xù)筆劃之間的邊界是模糊的。更具體而言,在草寫體東亞字符書寫中,用 戶往往通過僅用單個筆劃來書寫一字符來將該字符的若干部分連接成一個部分,注意,用 戶可對整個字符使用不止一個筆劃。相反,對于印刷體東亞字符,用戶的字符筆劃數(shù)通常相 當穩(wěn)定。草寫體書寫或印刷體書寫中引起的不一致性可被認為是可在對風(fēng)格建模時解釋的 風(fēng)格特性。常規(guī)字符識別系統(tǒng)將這些不一致性視作是有問題的,并且在構(gòu)建用于字符識別 的HMM模型時使用各種技術(shù)來減小其影響。這一常規(guī)方法使對風(fēng)格建模的能力降低。
再次參考圖2的字符205,示例性字符生成系統(tǒng)可標識一個或多個虛構(gòu)筆劃以便 于以解釋書寫者的手寫和/或書法風(fēng)格的方式對字符生成建模。例如,虛構(gòu)筆劃可被定義 為筆從前一筆劃的提筆到下一筆劃的落筆的虛構(gòu)線性移動。有了相鄰真實筆劃之間的虛構(gòu) 筆劃,連接所有筆劃以形成連續(xù)跡線,可在該跡線上構(gòu)建HMM以便出于手寫筆跡生成的目 的對手寫字符建模。 圖3示出了用于字符和風(fēng)格編碼(例如,用戶對東亞字符或其他手寫字符建模) 的各種建模特征250。手寫構(gòu)架(skeleton)筆劃字符和書法字符252展示風(fēng)格以及風(fēng)格元 素之間的差異。該構(gòu)架筆劃字符可使用標準特征集(例如,x-y坐標)來相當好地表示,然 而,該書法字符包括更多的風(fēng)格元素(例如,可隨心情、情緒狀態(tài)等變化的個人、非標準特 性)。書法或有表現(xiàn)力的筆劃此處還被稱為"豐富筆劃",因為它們包括比構(gòu)架筆劃更多的 信息。示例性特征集可包括關(guān)于壓力、速度(和/或速率)、斜率(或正切)和/或曲率以 解釋在豐富筆劃中找到的風(fēng)格元素的特征。 圖3中的另一個框示出了具有虛構(gòu)筆劃的字符的示例以及具有真實筆劃的同一 字符的示例254。如此處所描述的,虛構(gòu)筆劃可使用比真實筆劃更少的維度來表示。具體而 言,在該示例中,虛構(gòu)筆劃被表示為有斜率但沒有曲率的筆直虛線,如Ax和Ay距離以及 余弦和正弦函數(shù)(或正切函數(shù))所指示的。與虛構(gòu)筆劃相反,真實筆劃不是筆直的而是彎 曲的;因此,除了真實筆劃的斜率特征之外,可使用特征余弦A 和正弦A 0,無論該真實 筆劃是字符的基礎(chǔ)部分(例如,構(gòu)架組成部分)、連接筆劃(例如,草寫體)還是風(fēng)格元素 (例如,書法元素)。如此處所描述的,就手寫筆跡生成系統(tǒng)而言,對于虛構(gòu)筆劃可估算斜率 特征,而對于真實筆劃可估算斜率和曲率特征。 經(jīng)由虛構(gòu)筆劃特征來標識虛構(gòu)筆劃可幫助編碼和訓(xùn)練以及風(fēng)格生成。此外,雖然 具有真實筆劃的字符部分可被標記或標識為與字符識別有極少或沒有關(guān)聯(lián),但它也可被標 識為"虛構(gòu)"筆劃部分(或者草寫體連接部分或風(fēng)格部分)并出于手寫生成的目的而使用。
如此處所描述的,虛構(gòu)筆劃可通過將相鄰真實筆劃連接在一起以形成連續(xù)跡線來 生成。例如,墨水數(shù)據(jù)可轉(zhuǎn)換(例如,重新采樣)成數(shù)據(jù)點之間的增量相等的連續(xù)數(shù)據(jù)集。 對于手寫東亞字符,墨水數(shù)據(jù)可被表示為各部分被適當?shù)貥擞洖樘摌?gòu)或真實的單個連續(xù)跡 線。對于一個或多個手寫、草寫體英語字符,也可使用單個連續(xù)跡線,其中適當?shù)貥擞浻糜?連接草寫體手跡中的字符的連接部分。 在某些情況下,上述連續(xù)跡線方法可導(dǎo)致具有相似但實際上不同的跡線的字符之 間的混淆。為了克服這些問題,可實現(xiàn)示例性多空間概率分布(MSD)技術(shù)以便連同真實筆 劃對虛構(gòu)筆劃建模。例如,考慮兩個漢語偏旁"?(水)'和'i (語言)',如果連接所有真 實筆劃,則這兩個偏旁的跡線變成無法區(qū)分。除了筆跡之外,用于編碼連續(xù)的真實筆劃之間 的連接/不連接的二進制指示符對于將真實筆劃與虛構(gòu)筆劃區(qū)分開來可能是有用的。如已經(jīng)參考字符254所提到的,虛構(gòu)筆劃建模中的另一問題對于兩個連續(xù)的真實筆劃的直接連 接發(fā)生,其中如曲率的特征退化(這些虛構(gòu)筆劃具有零方差)。 使用MSD技術(shù),真實和虛構(gòu)筆劃變成來自可隨機對其建模的不同概率空間的觀察 結(jié)果。同樣,MSD技術(shù)中的靈活性,即為每一單獨空間分配不同的特征維度使得識別系統(tǒng)能 忽略可能在建模時導(dǎo)致奇異性(singularity)問題的特定特征。出于字符識別的目的,在 手寫漢字識別中獲取的實驗結(jié)果指示MSD方法提供跨不同識別系統(tǒng)的約1. 3% -2. 8%的字 符識別準確度提升,其中MSD顯著地改善具有相似跡線的可被混淆的字符(例如,'清'和 '請')之間的鑒別。如此處所描述的,這一方法適用于用于手寫筆跡生成的基于HMM的模 型。 對于基于HMM的模型,用于處理虛構(gòu)和真實筆劃的示例性結(jié)構(gòu)可包括狀態(tài)("狀 態(tài)A")方法,該狀態(tài)方法具有擁有兩個概率密度函數(shù)(PDF)的一個數(shù)據(jù)流(4維高斯PDF對 真實筆劃特征建模而2維高斯PDF對虛構(gòu)筆劃特征建模);以及狀態(tài)("狀態(tài)B")方法,該 狀態(tài)方法具有兩個流, 一個流由2維高斯函數(shù)建模而另一個流是具有以下兩個PDF的MSD 流對真實筆劃特征建模的2維高斯PDF以及其概率恒定為1的0維PDF。對于狀態(tài)B,狀 態(tài)概率是這兩個流輸出概率的總和。 筆劃的真實概率(RP)的物理意義是筆劃是在落筆階段中書寫的或真實筆劃的概 率。對于那些對應(yīng)于印刷字體中的真實筆劃的字體,RP應(yīng)接近于1。對于那些對應(yīng)于虛構(gòu) 筆劃的狀態(tài),虛構(gòu)概率(IP)在0和1之間,這取決于訓(xùn)練或輸入數(shù)據(jù)中的樣本是連接的可 能性。 通過添加虛構(gòu)筆劃和適當?shù)腗SD建模,增強了跡線相似的字符之間的鑒別。例如, 在傳統(tǒng)HMM方法中,偏旁'? '、'i '和'?'之間的鑒別可能缺乏準確性,但有了 MSD-HMM方 法,鑒別更加準確。通過使用MSD-HMM方法實現(xiàn)的總體改進在緩解由于僅僅將真實筆劃與 虛構(gòu)筆劃相連接而導(dǎo)致的問題時是有效的。 如上所述,示例性的基于HMM的方法可使用斜率和曲率特征。更具體而言,斜率特 征(cos ;sin )和曲率(cos A , sinA )特征允許對字符和風(fēng)格建模。雖然在各個 示例中使用正弦和余弦,但可將斜率和曲率的其他表示用作替換方案(例如,正切等)???在虛構(gòu)筆劃上測量斜率特征,但對于曲率特征,由于直接連接兩個連續(xù)的真實筆劃,因此虛 構(gòu)筆劃的曲率固有地為零,這在HMM建模時產(chǎn)生奇異性。為了克服這點,在MSD-HMM中,對 于真實筆劃,使用四維特征集(cos ;sin ;cosA ;sinA )而對于虛構(gòu)筆劃,使用二 維特征集(cos ;sin )。該方法消除虛構(gòu)筆劃的曲率奇異性的可能性、同時保留關(guān)于真 實筆劃的豐富筆劃信息。換言之,經(jīng)由該特征安排,丟棄虛構(gòu)筆劃的曲率信息中的非隨機、 退化信息,并且高效地對筆跡建模。 示例性的基于HMM的建模方法使用斜率特征和曲率特征來確定作為代表性特征 的原始坐標。雖然并未詳細陳述斜率確定哪一部分以及曲率確定哪一部分,但最終結(jié)果是 在不僅斜率而且曲率的意義上的最大似然解(ML解)。向基于HMM的模型添加MSD技術(shù)以 便例如使用MSD-HMM模型中的"真實性"權(quán)重或概率來確定筆劃是真實的還是虛構(gòu)的。上 述真實概率(RP)和虛構(gòu)概率(IP)對應(yīng)于該權(quán)重。雖然這一權(quán)重可以是連續(xù)的值,但該權(quán) 重也可更近似地處理(例如,小于0. 5的那些值可被設(shè)為權(quán)重0而大于0. 5的那些值可被 設(shè)為權(quán)重1)。
圖3還示出了對應(yīng)于虛構(gòu)/真實筆劃順序的HMM 256的圖示。在圖示256的右側(cè), 開圓表示字符的兩個可能的虛構(gòu)筆劃。手寫字符是以一種方式還是以另一種方式書寫是經(jīng) 由墨水順序數(shù)據(jù)來捕捉的。如參考字符250所解釋的,書寫者可使用標準順序(例如,學(xué)校 里教的)或替換順序(例如,個人或其他)來書寫字符。為了捕捉這一信息,這可幫助產(chǎn)生 手寫筆跡,示例性的基于HMM的手寫輸出系統(tǒng)包括對應(yīng)于兩種可能性的HMM。當然,在存在 不止兩種可能性的情況下,生成系統(tǒng)可包括不止兩種可能性。 HMM 256中所示的方法被稱為多路徑方法。在常規(guī)在線手寫建模時,HMM拓撲結(jié)構(gòu) 是從左到右的,并且僅能夠表征特定種類的筆跡。示例性多路徑HMM方法解釋書寫順序和 書寫風(fēng)格中的變化。如將在以下進一步解釋的,一種示例性方法包括訓(xùn)練對應(yīng)于變化的書 寫順序和書寫風(fēng)格的單元的多路徑HMM。 如上所述,對于HMM 256,每個單一轉(zhuǎn)換路徑都對一特定書寫順序或書寫風(fēng)格建 模。示例性的多路徑拓撲結(jié)構(gòu)還使得能夠自動訓(xùn)練所有路徑而不將數(shù)據(jù)分成書寫順序和書 寫風(fēng)格的不同訓(xùn)練組。在圖3的示例中,每一經(jīng)訓(xùn)練的路徑都表示字符的主要書寫模式,其 可以是一種書寫筆劃順序或一種書寫風(fēng)格。每一路徑表示的模式都是自動從數(shù)據(jù)中訓(xùn)練出 的。例如,漢字"九"通常能夠以兩種筆劃順序來書寫。根據(jù)圖示256,對應(yīng)于該字符的經(jīng)訓(xùn) 練的兩路徑模型的每一路徑都表示一種書寫筆劃順序(在模型可視化中,每一條線都表示 一個狀態(tài)模型)。同樣,對于漢字"復(fù)",雖然它通常只具有一種書寫筆劃順序,但它能夠以 不同的風(fēng)格(例如,正常體和草寫體)書寫。
示例性手寫筆跡和/或書法生成系統(tǒng)和方法 —旦選擇了一組特征以及用于處理這些特征的建模方法,就可訓(xùn)練基于HMM的模 型并且然后使用該模型來生成手寫字符及其風(fēng)格元素。此外,如此處所描述的,基于HMM的 模型可使用書寫者自己的手寫筆跡來自適應(yīng)或以其他方式"個性化"以引入特定風(fēng)格元素。 自適應(yīng)是可任選的并且自適應(yīng)程度可根據(jù)書寫者的需要而變化(例如,從幾乎沒有個性化 到高度個性化)。 圖4示出了用于手寫筆跡生成和呈現(xiàn)的示例性方法400。方法400對若干數(shù)據(jù)源 進行操作標準手寫數(shù)據(jù)402(例如,"金牌"書寫者);其他手寫數(shù)據(jù)404(例如,個人書寫 者);輸入"標簽"數(shù)據(jù)406(例如,經(jīng)由鍵盤等);以及筆模型或數(shù)據(jù)408(例如,書法畫筆、 筆尖等)。圖4中所使用的各種字體僅出于說明的目的,實際手寫筆跡可包括更豐富的筆劃 和筆劃可變性,如參考圖2和3的字符所解釋的。方法400可任選地由個性化或自適應(yīng)框 450來個性化(例如,使用數(shù)據(jù)404)。方法400首先在沒有個性化選項的情況下大致描述, 并且然后在有個性化選項的情況下更具體地描述。 根據(jù)方法400,將標準數(shù)據(jù)402輸入到訓(xùn)練框410中,該訓(xùn)練框410訓(xùn)練HMM模型 以生成經(jīng)訓(xùn)練的HMM模型,該HMM模型包括經(jīng)訓(xùn)練的HMM 420的集合。在該示例中,HMM 420 對標準數(shù)據(jù)402的斜率、曲率、虛構(gòu)筆劃特征建模。如參考圖5所解釋的,該HMM模型可以 是其中將MSD技術(shù)應(yīng)用于對真實和虛構(gòu)筆劃建模的MSD-HMM模型。 給定經(jīng)訓(xùn)練的HMM 420,手寫筆跡生成可以在合成框430中進行,該合成框430從 特定"書寫者"處接收輸入數(shù)據(jù)406,如參考圖1所解釋的,該輸入數(shù)據(jù)406可來自各種源 (例如,鍵區(qū)、鍵盤、語音識別、字符識別等)中的任一種。合成框430產(chǎn)生所生成的結(jié)果 440,該結(jié)果可根據(jù)筆模型408來呈現(xiàn)。在未實現(xiàn)個性化選項的情況下,結(jié)果440是非個性化結(jié)果(左側(cè)),取決于呈現(xiàn)(例如,筆模型)該結(jié)果可模仿或再現(xiàn)標準手寫數(shù)據(jù)402風(fēng)格。 例如,在標準手寫數(shù)據(jù)402對應(yīng)于"金牌"書寫者的情況下,則所呈現(xiàn)的結(jié)果可以是金牌書 寫者的風(fēng)格的再現(xiàn),即使輸入數(shù)據(jù)406(例如,作為經(jīng)由鍵區(qū)、鍵盤等的輸入)的僅僅是一普 通用戶。 個性化選項450可以用其他手寫數(shù)據(jù)404的風(fēng)格來調(diào)整標準手寫數(shù)據(jù)402的風(fēng) 格。數(shù)據(jù)404可以來自一用戶或另一用戶。在數(shù)據(jù)404是來自一用戶的情況下,個性化框 450可調(diào)整標準手寫數(shù)據(jù)402的風(fēng)格以使得結(jié)果440是標準風(fēng)格和書寫者自己的風(fēng)格的 混合。在數(shù)據(jù)404是來自另一用戶的情況下,例如,標準手寫數(shù)據(jù)402可以是來自諸如安 吉利娜 茱莉(Angelina Jolie)等名人而其他手寫數(shù)據(jù)404可以是來自諸如布拉德 皮 特(Brad Pitt)等另一名人。進而,輸入數(shù)據(jù)406可以是來自想要其手寫筆跡看上去像 Angelina Jolie和Brad Pitt之間的混合(即,"布拉吉利娜(brangelina)")的普通用戶。
自適應(yīng)技術(shù)參考圖6和7更詳細地討論;注意,用戶可確定進行多少自適應(yīng)。如圖 4的底部所指示的,所呈現(xiàn)的結(jié)果440可不具有個性化,具有一些個性化或可以是高度個性 化的。 圖5示出了示例性方法500,該方法包括圖4的訓(xùn)練階段410和合成階段430以及 其他細節(jié)。 一般而言,訓(xùn)練階段410用作為原始代表性特征向量的函數(shù)的建模特征向量來 訓(xùn)練HMM,以便學(xué)習(xí)跡線的更詳細信息,而合成階段430包括通過經(jīng)由在建模特征向量和代 表性特征向量之間顯式地施加相關(guān)來最大化相對于代表性特征向量的似然來對生成問題 求解。例如,在語音合成中,代表性特征向量包括頻譜包絡(luò)參數(shù)和基頻,并且為建模特征向 量追加它們的增量和加速度。在訓(xùn)練階段410中,使用所有建模特征來訓(xùn)練HMM并且然后 在合成階段430中,生成具有最大似然的頻譜參數(shù)和基頻跡線作為輸出。
如此處所描述的,用于手寫筆跡和/或書法的基于HMM的建模提供了一種開放式 解決方案,其中能夠容易地使用所有種類的特征,這在有美感的書法合成中尤其有幫助。這 一方法可通過使用HMM自適應(yīng)技術(shù),只用少許自適應(yīng)樣本來構(gòu)建個性化手寫字體。 一種示 例性基于HMM的方法允許訓(xùn)練數(shù)據(jù)中的未看見的字符組合的連接變形,這可由決策樹或在 語音識別和合成中廣泛采用的其他群集技術(shù)來自然地生成,這賦予這一系統(tǒng)更好的生成或 創(chuàng)建能力。 再次參考圖5的方法500,數(shù)據(jù)塊402、405、406和408是如圖4所描述的。雖然數(shù) 據(jù)塊402可以是來自標準書寫者(g卩,金牌書寫者)的,但它也可以是來自不止一個書寫者 (例如,許多書寫者)的數(shù)據(jù)集合,以便訓(xùn)練平均字體。 訓(xùn)練階段410可接收標準手寫數(shù)據(jù)402并分析這些數(shù)據(jù)以標識豐富筆劃和標簽。 將豐富筆劃輸入到特征提取框412中,該特征提取框提取諸如代表性特征向量R二 {x, y, v,p}所指示的x-y坐標、速度和壓力等特征。特征轉(zhuǎn)換框414將這些特征轉(zhuǎn)換成作為基本 特征的函數(shù)的更有意義的向量,如0 = f (R) = {AX, Ay, A2X, A2y, v, Av, p, Ap, } 所指示的。然后將該信息與對應(yīng)的標簽一起輸入到HMM訓(xùn)練框416中以產(chǎn)生經(jīng)訓(xùn)練的HMM 420。 如在語音合成中,高階動態(tài)特征在描述平滑演化跡線時是有幫助的。因此,經(jīng)由特 征提取框412和特征轉(zhuǎn)換框414,為了生成代表性特征R二 {x,y,v,p}的跡線,該方法采用 建模特征0= {Ax, Ay, A2X, A2y,v, Av,p, A p}。在該示例中,并不包括x和y本身的靜態(tài)特征,因為適當?shù)匾?guī)格化這些特征通常不是瑣碎的。在其中規(guī)格化這些特征的某些情 況下,也可使用它們。 如上所述,對于虛構(gòu)和真實筆劃,虛構(gòu)空間的維度低于真實空間的維度。例如,一 種方法采用(Ax, Ay, A2x, A2y)作為真實空間中的特征,則虛構(gòu)空間中的特征是(Ax, Ay),因為作為定義加速度(曲率)在虛構(gòu)筆劃上始終為0。 自適應(yīng)框452可使用其他手寫數(shù)據(jù)404來使經(jīng)訓(xùn)練的HMM 420自適應(yīng)。同樣,自 適應(yīng)或個性化是可任選的并且可由用戶選擇以調(diào)整或個性化標準手寫筆跡或書法風(fēng)格。
在合成階段430中,將輸入數(shù)據(jù)406標簽輸入到選擇HMM序列的模型選擇框432 中。之后是生成框434,其使用函數(shù)R二argmaxR' P[f(R' ) ] A T]所指示的最大似然方法 來確定"最適合"的HMM。因此,在合成階段430中,給定一文本片段(例如,圖1的"hello world"示例),首先經(jīng)由選擇框432從經(jīng)訓(xùn)練的且經(jīng)可任選地自適應(yīng)的HMM 420中選擇對 應(yīng)的模型序列,并且經(jīng)由生成框434,獲取對于代表性特征向量的最大似然解并且在呈現(xiàn)框 436中用該最大似然解來產(chǎn)生所呈現(xiàn)的結(jié)果440、或者經(jīng)調(diào)整的或個性化的所呈現(xiàn)的結(jié)果 440'。 圖6示出了用于使經(jīng)訓(xùn)練的HMM自適應(yīng)的示例性方法600。如上所述,訓(xùn)練階段可 使用來自金牌書寫者的數(shù)據(jù)來產(chǎn)生經(jīng)訓(xùn)練的H匪620,該數(shù)據(jù)可以是自然的或合成的訓(xùn)練 數(shù)據(jù)602。給定經(jīng)訓(xùn)練的HMM 620,可進行自適應(yīng)。 自適應(yīng)框650接收書寫者的訓(xùn)練數(shù)據(jù)606作為輸入,該訓(xùn)練數(shù)據(jù)可以來自個人 書寫者、名人書寫者等。經(jīng)訓(xùn)練的HMM 620的自適應(yīng)使用一種或多種技術(shù)來進行。例如, 可出于經(jīng)訓(xùn)練的HMM 620自適應(yīng)的目的而使用最大后驗(MAP)651、最大似然線性回歸 (MLLR)653或本征空間(ES)655技術(shù)。 在自適應(yīng)框650后,合成框630接收書寫者的輸入數(shù)據(jù)608 (例如,用鍵盤輸入的 字符),并且然后按照該書寫者的訓(xùn)練數(shù)據(jù)606來生成具有書寫者的特性中的至少一部分 的結(jié)果640。 圖7示出了用于使經(jīng)訓(xùn)練的HMM自適應(yīng)的示例性方法700。方法700開始于提供 初始、經(jīng)訓(xùn)練的HMM的提供框720。接收框752出于自適應(yīng)的目的而接收書寫者的訓(xùn)練數(shù) 據(jù)706。計算框754計算書寫者的訓(xùn)練數(shù)據(jù)的特征向量。接著,選擇一種技術(shù)(例如,MAP 751、MLLR 753或ES 755)并且經(jīng)由框756應(yīng)用該技術(shù)以使得初始、經(jīng)訓(xùn)練的HMM均值向量 和協(xié)方差矩陣自適應(yīng)。 一旦自適應(yīng),提供框758提供經(jīng)自適應(yīng)的HMM以便進行書寫合成。
示例 圖8示出了所生成和所呈現(xiàn)的手寫東亞字符800的某些示例。這些示例使用漢語 手寫筆跡數(shù)據(jù)庫來展示由向量1 = {x, y}表示的訓(xùn)練和生成構(gòu)架特征,其中建模特征包括 斜率和曲率0= {AX, Ay, A2X, A2y}。在這些示例中,使用單路徑MSD HMM來對每一特征 建模。在這些示例中示出自動生成的文本行"(平均字體)"。如參考圖4和5所解釋的,可 使用筆模型或其他呈現(xiàn)技術(shù)來呈現(xiàn)具有特定畫筆、筆尖等的特性的字符。
雖然圖8示出了東亞字符,但各種示例性技術(shù)可用于其他語言的字符。例如,各種 示例性技術(shù)允許生成草寫體英語手寫。這一連續(xù)生成可在相對實時的基礎(chǔ)上進行,其中生 成手寫筆跡并將其傳送到遠程位置或本地地呈現(xiàn)手寫筆跡。例如,用戶可以在蜂窩電話上 輸入文本消息并且所生成的手寫筆跡可以按在遠程位置呈現(xiàn)的方式出現(xiàn)。在這一示例中,
12生成可在一個計算設(shè)備上進行而呈現(xiàn)可以在另一計算設(shè)備上進行?;蛘呱珊统尸F(xiàn)可以在 遠程計算設(shè)備處進行(例如,將文本發(fā)送到遠程設(shè)備以便生成和呈現(xiàn)手寫筆跡)。生成和/ 或呈現(xiàn)可基于所標識的文本消息發(fā)送者來進行(例如,朋友2喜歡名人X,因此按名人X的 手寫筆跡來生成/呈現(xiàn)朋友2的文本消息)。 用于手寫筆跡和/或書法生成的示例性計算設(shè)備可包括處理器、用戶輸入機構(gòu)、 顯示器以及至少部分地由該處理器實現(xiàn)的控制邏輯,該控制邏輯用于基于生成算法來生成 手寫字符,該生成算法使用隱式馬爾可夫模型(HMM)和多空間概率分布(MSD)技術(shù)以及從 手寫字符墨水數(shù)據(jù)中提取的特征,其中所提取的特征包括真實筆劃特征集和較少維度的虛 構(gòu)特征集。 這一計算設(shè)備可包括用于統(tǒng)一對墨水數(shù)據(jù)采樣并生成長度統(tǒng)一的墨水數(shù)據(jù)幀的 控制邏輯、用于從字符墨水數(shù)據(jù)中生成包括真實筆劃幀和虛構(gòu)筆劃幀的一系列連續(xù)的墨水 數(shù)據(jù)幀的控制邏輯、用于從字符墨水數(shù)據(jù)中生成墨水數(shù)據(jù)幀并對于x、 y笛卡爾坐標系確定 每一墨水數(shù)據(jù)幀的Ax值和Ay值的控制邏輯、從字符墨水數(shù)據(jù)中生成墨水數(shù)據(jù)幀并確定
正弦值和余弦值(例如,針對幀或者兩個相鄰墨水數(shù)據(jù)幀之間的角度)的控制邏輯。用于 使用基于經(jīng)訓(xùn)練的HMM的方法來生成手寫筆跡的示例性計算設(shè)備可以是蜂窩電話或其他 手持式計算設(shè)備(例如,PDA等)。
示例性計算設(shè)備 圖9示出可用于實現(xiàn)此處所討論的各種示例性方法的部分或全部的示例性計算 設(shè)備900的各個組件。 圖9所示的計算設(shè)備只是計算環(huán)境的一個示例,且并非旨在對計算機和網(wǎng)絡(luò)體系 結(jié)構(gòu)的使用范圍或功能提出任何限制。也不應(yīng)將該計算環(huán)境解釋為對示例操作環(huán)境中所示 出的任一組件或其組合有任何依賴性或要求。 參考圖9,用于實現(xiàn)對訓(xùn)練墨水數(shù)據(jù)使用基于特征的方法的示例性字符生成系統(tǒng) 的示例性系統(tǒng)包括計算設(shè)備,諸如計算設(shè)備900。在一非?;镜呐渲弥?,計算設(shè)備900通 常包括至少一個處理單元902和系統(tǒng)存儲器904。取決于計算設(shè)備的確切配置和類型,系統(tǒng) 存儲器904可以是易失性的(諸如RAM)、非易失性的(諸如ROM、閃存等)或是兩者的某種 組合。系統(tǒng)存儲器904通常包括操作系統(tǒng)905、一個或多個程序模塊906,并且可包括程序 數(shù)據(jù)907。該基本配置在圖9中由虛線908內(nèi)的組件示出。 操作系統(tǒng)905可包括基于組件的框架920,其支持組件(包括屬性和事件)、對象、 繼承、多態(tài)性、反射,并且提供面向?qū)ο蟮幕诮M件的應(yīng)用程序編程接口 (API),諸如由華盛 頓州雷蒙德市的微軟公司制造的.NETTM框架的API。 計算設(shè)備900還可具有附加特征或功能。例如,計算設(shè)備900還可包括附加數(shù)據(jù)存 儲設(shè)備(可移動和/或不可移動),諸如,例如磁盤、光盤或磁帶。這樣的附加存儲在圖9中 由可移動存儲909和不可移動存儲910例示。計算機存儲介質(zhì)可包括以用于存儲諸如計算 機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)等信息的任何方法或技術(shù)實現(xiàn)的易失性和非 易失性、可移動和不可移動介質(zhì)。系統(tǒng)存儲器904、可移動存儲909和不可移動存儲910都 是計算機存儲介質(zhì)的示例。因此,計算機存儲介質(zhì)包括但不限于,RAM、ROM、EEPROM、閃存或 其它存儲器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其它光存儲、磁帶盒、磁帶、磁盤存儲或其 它磁性存儲設(shè)備、或能用于存儲所需信息且可以由計算設(shè)備900訪問的任何其它介質(zhì)。任何這樣的計算機存儲介質(zhì)都可以是設(shè)備900的一部分。計算設(shè)備900還可具有諸如鍵盤、
鼠標、筆、語音輸入設(shè)備、觸摸輸入設(shè)備等輸入設(shè)備912。還可包括諸如顯示器、揚聲器、打印
機等輸出設(shè)備914。這些設(shè)備在本領(lǐng)域是公知的,因此不必在此詳細討論。 計算設(shè)備900還可包含允許該設(shè)備諸如通過網(wǎng)絡(luò)來與其它計算設(shè)備918進行通信
的通信連接916。通信連接916是通信介質(zhì)的一個示例。通信介質(zhì)通常由諸如載波或其它
傳輸機制等已調(diào)制數(shù)據(jù)信號中的計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)來體現(xiàn),
并包括任何信息傳遞介質(zhì)。術(shù)語"已調(diào)制數(shù)據(jù)信號"指的是其一個或多個特征以在信號中
編碼信息的方式被設(shè)定或更改的信號。作為示例而非限制,通信介質(zhì)包括有線介質(zhì),諸如有
線網(wǎng)絡(luò)或直接線連接,以及無線介質(zhì),諸如聲學(xué)、RF、紅外線和其它無線介質(zhì)。如此處所使用
的術(shù)語計算機可讀介質(zhì)包括存儲介質(zhì)和通信介質(zhì)兩者。 各種模塊和技術(shù)在此可在諸如程序模塊等由一個或多個計算機或其它設(shè)備執(zhí)行 的計算機可執(zhí)行指令的一般上下文中描述。 一般而言,程序模塊包括用于執(zhí)行特定任務(wù)或 實現(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等。這些程序模塊等可以作為本 機代碼執(zhí)行或諸如在虛擬機或其它即時(just-in-time)編譯執(zhí)行環(huán)境中下載和執(zhí)行。通 常,程序模塊的功能可以在各個實施例中按需進行組合或分布。 這些模塊和技術(shù)的實現(xiàn)可以存儲在某種形式的計算機可讀介質(zhì)上或通過某種形 式的計算機可讀介質(zhì)傳輸。計算機可讀介質(zhì)可以是可由計算機訪問的任何可用介質(zhì)。作為 示例而非限制,計算機可讀介質(zhì)可包括"計算機存儲介質(zhì)"和"通信介質(zhì)"。
示例性計算設(shè)備可包括處理器、用戶輸入機制(例如,鼠標、指示筆、滾動墊等)、 顯示器以及至少部分地由該處理器實現(xiàn)的控制邏輯,該控制邏輯用于基于手寫筆跡生成算 法來訓(xùn)練和/或生成手寫筆跡,該手寫筆跡生成算法使用隱式馬爾可夫模型(HMM)和基于 特征的方法來從時序墨水數(shù)據(jù)中提取信息。對于生成和/或呈現(xiàn),這一設(shè)備可以是蜂窩電 話或者一般地是手持式計算機。 然而,本領(lǐng)域技術(shù)人員可認識到此處所描述的技術(shù)也可在沒有這些具體細節(jié)中的
一個或多個的情況下,或者用其它方法、資源、材料等來實施。在其它情況下,僅僅為了避免
混淆各示例性技術(shù)的各方面而未詳細地示出或描述公知的結(jié)構(gòu)、資源或操作。 雖然示出和描述了各示例和應(yīng)用,但可以理解,這些技術(shù)不限于上述精確配置和
資源??梢詫Υ颂幩_的方法和系統(tǒng)的安排、操作和細節(jié)作出對本領(lǐng)域技術(shù)人員顯而易
見的各種修改、改變和變更,而不背離其實際范圍。
權(quán)利要求
一種用于手寫字符生成的方法,所述方法至少部分地由計算設(shè)備實現(xiàn),所述方法包括接收字符;以及使用為生成手寫字符而訓(xùn)練的隱式馬爾可夫模型來生成對應(yīng)的手寫字符。
2. 如權(quán)利要求1所述的方法,其特征在于,包括接收一個以上字符以及生成對應(yīng)的手寫字符。
3. 如權(quán)利要求1所述的方法,其特征在于,所述隱式馬爾可夫模型包括使用斜率、曲率和虛構(gòu)筆劃特征來訓(xùn)練的隱式馬爾可夫模型。
4. 如權(quán)利要求1所述的方法,其特征在于,所述隱式馬爾可夫模型包括使用包括斜率特征和曲率特征的真實筆劃特征集與包括斜率特征的較少維度的虛構(gòu)筆劃特征集來訓(xùn)練的隱式馬爾可夫模型。
5. 如權(quán)利要求1所述的方法,其特征在于,所述生成還包括使用多空間概率分布技術(shù),其中所述多空間概率分布技術(shù)包括用于確定筆劃是真實的還是虛構(gòu)的真實性概率。
6. 如權(quán)利要求1所述的方法,其特征在于,所述隱式馬爾可夫模型包括使用書法數(shù)據(jù)來訓(xùn)練的隱式馬爾可夫模型。
7. 如權(quán)利要求1所述的方法,其特征在于,所述隱式馬爾可夫模型包括使用東亞字符數(shù)據(jù)來訓(xùn)練的隱式馬爾可夫模型。
8. 如權(quán)利要求1所述的方法,其特征在于,所述隱式馬爾可夫模型包括使用來自標準書寫者的數(shù)據(jù)來訓(xùn)練的隱式馬爾可夫模型。
9. 如權(quán)利要求1所述的方法,其特征在于,還包括使用筆模型來呈現(xiàn)所生成的對應(yīng)的手寫字符。
10. 如權(quán)利要求9所述的方法,其特征在于,所述筆模型包括筆尖參數(shù)。
11. 如權(quán)利要求1所述的方法,其特征在于,所述隱式馬爾可夫模型包括使用對應(yīng)于書寫壓力的壓力特征來訓(xùn)練的隱式馬爾可夫模型。
12. 如權(quán)利要求1所述的方法,其特征在于,所述隱式馬爾可夫模型包括使用選自包括最大后驗技術(shù)、最大似然線性回歸技術(shù)和本征空間技術(shù)的組的技術(shù)來自適應(yīng)的經(jīng)自適應(yīng)的、經(jīng)訓(xùn)練的隱式馬爾可夫模型。
13. 如權(quán)利要求1所述的方法,其特征在于,所述隱式馬爾可夫模型包括使用最大似然線性回歸技術(shù)以及來自與所接收到的一個或多個字符相同的書寫者的墨水數(shù)據(jù)來自適應(yīng)的經(jīng)自適應(yīng)的、經(jīng)訓(xùn)練的隱式馬爾可夫模型。
14. 如權(quán)利要求1所述的方法,其特征在于,所述經(jīng)訓(xùn)練的隱式馬爾可夫模型包括使用自適應(yīng)技術(shù)和來自名人的墨水數(shù)據(jù)來自適應(yīng)的經(jīng)自適應(yīng)的、經(jīng)訓(xùn)練的隱式馬爾可夫模型。
15. —種用于使經(jīng)訓(xùn)練的隱式馬爾可夫模型自適應(yīng)以生成手寫字符的方法,所述方法至少部分地由計算設(shè)備實現(xiàn),所述方法包括提供初始、經(jīng)訓(xùn)練的隱式馬爾可夫模型以生成手寫字符;提供訓(xùn)練墨水數(shù)據(jù)以使得所述初始、經(jīng)訓(xùn)練的隱式馬爾可夫模型自適應(yīng);以及應(yīng)用自適應(yīng)技術(shù)以使得所述初始、經(jīng)訓(xùn)練的隱式馬爾可夫模型對所述訓(xùn)練墨水數(shù)據(jù)自適應(yīng),其中所述自適應(yīng)技術(shù)包括選自包括最大后驗技術(shù)、最大似然線性回歸技術(shù)和本征空間技術(shù)的組的技術(shù)。
16. 如權(quán)利要求15所述的方法,其特征在于,還包括計算所述訓(xùn)練墨水數(shù)據(jù)的特征向
17. 如權(quán)利要求15所述的方法,其特征在于,所述應(yīng)用對一個或多個均值向量和一個或多個協(xié)方差矩陣應(yīng)用所選技術(shù)。
18. 如權(quán)利要求15所述的方法,其特征在于,所述初始、經(jīng)訓(xùn)練的隱式馬爾可夫模型包括使用書法數(shù)據(jù)來訓(xùn)練的隱式馬爾可夫模型。
19. 如權(quán)利要求15所述的方法,其特征在于,所述初始、經(jīng)訓(xùn)練的隱式馬爾可夫模型包括使用標準書寫者和包括來自不同書寫者的數(shù)據(jù)的訓(xùn)練墨水數(shù)據(jù)來訓(xùn)練的隱式馬爾可夫模型。
20. —種用于生成手寫字符的計算設(shè)備,所述設(shè)備包括處理器;用戶輸入機構(gòu);顯示器;以及至少部分地由所述處理器實現(xiàn)的基于使用隱式馬爾可夫模型的算法來生成手寫字符控制邏輯。
全文摘要
一種用于手寫字符生成的示例性方法包括接收一個或多個字符以及對于該一個或多個接收到的字符,使用被訓(xùn)練以供生成手寫字符的隱式馬爾可夫模型來生成手寫字符。在這一方法中,經(jīng)訓(xùn)練的隱式馬爾可夫模型可使用諸如最大后驗技術(shù)、最大似然線性回歸技術(shù)或本征空間技術(shù)等技術(shù)來自適應(yīng)。
文檔編號G06T11/60GK101785030SQ200880102021
公開日2010年7月21日 申請日期2008年8月11日 優(yōu)先權(quán)日2007年8月10日
發(fā)明者F·K·宋, L·馬, P·劉, Y·吳 申請人:微軟公司