一種輸入的糾錯(cuò)方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種輸入的糾錯(cuò)方法和裝置,以解決糾錯(cuò)候選準(zhǔn)確性比較低的問題。所述的方法包括:采用糾錯(cuò)檢測(cè)得到的錯(cuò)輸串構(gòu)造至少一個(gè)糾錯(cuò)候選字符串;基于上下文信息計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率,并依據(jù)所述第一概率選擇糾錯(cuò)候選字符串;將選擇的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì)應(yīng)的糾錯(cuò)候選文字串。
【專利說明】一種輸入的糾錯(cuò)方法和裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及輸入法技術(shù),特別是涉及一種輸入的糾錯(cuò)方法和裝置。
【背景技術(shù)】
[0002] 計(jì)算機(jī)、互聯(lián)網(wǎng)技術(shù)的普及,使得人機(jī)交互愈發(fā)流行,對(duì)于用戶而言,輸入法是人 機(jī)交互的主要接口。統(tǒng)計(jì)發(fā)現(xiàn),用戶使用輸入法進(jìn)行文字輸入的過程中存在大量的錯(cuò)輸行 為,如想要輸入" jimi ",但卻錯(cuò)輸成了 "nimi "。
[0003] 當(dāng)前主流的輸入法軟件大都提供了輸入糾錯(cuò)功能。其過程為:首先檢測(cè)到用戶輸 入的編碼字符串串中的錯(cuò)輸片段,修改錯(cuò)輸片段并生成若干糾錯(cuò)候選字符串,評(píng)估糾錯(cuò)候 選字符串的優(yōu)先級(jí),音字轉(zhuǎn)換后,展示最優(yōu)糾錯(cuò)候選給用戶。其中,在確定糾錯(cuò)候選字符串 并進(jìn)行音字轉(zhuǎn)換后,若所述糾錯(cuò)候選字符串下對(duì)應(yīng)多個(gè)文字串,則只根據(jù)各文字串出現(xiàn)的 概率作為衡量依據(jù)、選出概率最高的候選文字串展示。
[0004] 但是,上述方法進(jìn)行糾錯(cuò)時(shí)是一個(gè)孤立的過程,匹配得到的最優(yōu)糾錯(cuò)候選字符 串和概率最高的候選文字串很可能出錯(cuò)。例如對(duì)錯(cuò)輸?shù)淖址? n i m i ",可能會(huì)被糾正 為"^1^"、"1加1"、"1^1^"、"1^ 1^"中的一個(gè),最優(yōu)糾錯(cuò)候選字符串可能為"1加1",而實(shí) 際用戶想要輸入的可能是"jimi"。即使最優(yōu)糾錯(cuò)候選字符串為"jimi",針對(duì)候選項(xiàng)"機(jī) 密""幾米" "吉米"等,會(huì)選取概率最高的候選文字串"機(jī)密"對(duì)用戶進(jìn)行展示。而實(shí)際上, 用戶可能輸入的是"shinimi",而期望得到的是"shijimi (十幾米)",或者用戶輸入的是 "nimimanhua",想要得到的是"jimimanhua (幾米漫畫)"。
[0005] 因此,采用上述方法對(duì)輸入進(jìn)行糾錯(cuò)后,展示給用戶的糾錯(cuò)候選準(zhǔn)確性比較低,很 可能沒有用戶想要輸入的內(nèi)容。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明實(shí)施例提供了一種輸入的糾錯(cuò)方法和裝置,以解決糾錯(cuò)候選準(zhǔn)確性比較低 的問題。
[0007] 為了解決上述問題,本發(fā)明實(shí)施例公開了一種輸入的糾錯(cuò)方法,包括:
[0008] 采用糾錯(cuò)檢測(cè)得到的錯(cuò)輸串構(gòu)造至少一個(gè)糾錯(cuò)候選字符串;
[0009] 基于上下文信息計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率,并依據(jù)所述第一概率選 擇糾錯(cuò)候選字符串;
[0010] 將選擇的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì)應(yīng)的糾錯(cuò)候選文字串。
[0011] 可選的,所述將選擇的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì)應(yīng)的糾錯(cuò)候選文字串之后,還包 括:基于上下文信息計(jì)算所述糾錯(cuò)候選文字串的第二概率,并依據(jù)所述第二概率對(duì)所述糾 錯(cuò)候選文字串進(jìn)行選擇。
[0012] 可選的,所述上下文信息包括上下文字符串;所述基于上下文信息計(jì)算構(gòu)造的糾 錯(cuò)候選字符串的第一概率,并依據(jù)所述第一概率選擇糾錯(cuò)候選字符串,包括:基于上下文字 符串確定所述構(gòu)造的糾錯(cuò)候選字符串在上下文中的第一概率;將所述構(gòu)造的糾錯(cuò)候選字符 串按照第一概率由大到小進(jìn)行排序,選擇前N個(gè)糾錯(cuò)候選字符串,其中N為正整數(shù)。
[0013] 可選的,所述基于上下文字符串確定所述構(gòu)造的糾錯(cuò)候選字符串在上下文中的第 一概率,包括:計(jì)算在所述上下文字符串的基礎(chǔ)上,所述構(gòu)造的糾錯(cuò)候選字符串出現(xiàn)的概 率;計(jì)算在所述上下文字符串的基礎(chǔ)上,所述構(gòu)造的糾錯(cuò)候選字符串被錯(cuò)輸成所述錯(cuò)輸串 的概率;基于所述構(gòu)造的糾錯(cuò)候選字符串出現(xiàn)的概率和被錯(cuò)輸成所述錯(cuò)輸串的概率,確定 對(duì)構(gòu)造的糾錯(cuò)候選字符串在上下文中的第一概率。
[0014] 可選的,所述上下文信息還包括:上下文文字串;所述方法還包括:從上屏內(nèi)容中 獲取上屏文字串作為上下文文字串;將所述上屏文字串對(duì)應(yīng)字符串作為上下文字符串。
[0015] 可選的,所述上下文字符串為包含切分方式的字符串;所述將上屏文字串對(duì)應(yīng)字 符串作為上下文字符串,包括:根據(jù)所述上下文文字串確定所述上下文字符串的切分方式。
[0016] 可選的,所述基于上下文信息計(jì)算所述糾錯(cuò)候選文字串的第二概率,并依據(jù)所述 第二概率對(duì)所述糾錯(cuò)候選文字串進(jìn)行選擇,包括:計(jì)算在所述上下文文字串的基礎(chǔ)上,確定 所述糾錯(cuò)候選文字串在上下文中出現(xiàn)的第二概率;將所述糾錯(cuò)候選文字串按照所述第二概 率由大到小進(jìn)行排序,選取前Μ個(gè)糾錯(cuò)候選文字串,其中Μ為正整數(shù)。
[0017] 可選的,所述的方法還包括:依據(jù)預(yù)置展示規(guī)則,從所述糾錯(cuò)候選文字串中選取至 少一個(gè)糾錯(cuò)候選文字串進(jìn)行展示。
[0018] 相應(yīng)的,本發(fā)明實(shí)施例還公開了一種輸入的糾錯(cuò)裝置,包括:
[0019] 構(gòu)造模塊,用于采用糾錯(cuò)檢測(cè)得到的錯(cuò)輸串構(gòu)造至少一個(gè)糾錯(cuò)候選字符串;
[0020] 字符串選擇模塊,用于基于上下文信息計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率, 并依據(jù)所述第一概率選擇糾錯(cuò)候選字符串;
[0021] 轉(zhuǎn)換模塊,用于將選擇的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì)應(yīng)的糾錯(cuò)候選文字串。
[0022] 可選的,所述的裝置還包括:文字串選擇模塊,用于基于上下文信息計(jì)算所述糾錯(cuò) 候選文字串的第二概率,并依據(jù)所述第二概率對(duì)所述糾錯(cuò)候選文字串進(jìn)行選擇。
[0023] 可選的,所述上下文信息包括:上下文字符串;所述字符串選擇模塊,包括:第一 概率計(jì)算子模塊,用于基于上下文字符串確定所述構(gòu)造的糾錯(cuò)候選字符串在上下文中的第 一概率;字符串選擇子模塊,用于將所述構(gòu)造的糾錯(cuò)候選字符串按照第一概率由大到小進(jìn) 行排序,選擇前Ν個(gè)糾錯(cuò)候選字符串,其中Ν為正整數(shù)。
[0024] 可選的,所述第一概率計(jì)算子模塊,包括:出現(xiàn)概率計(jì)算單元,用于計(jì)算在所述上 下文字符串的基礎(chǔ)上,所述構(gòu)造的糾錯(cuò)候選字符串出現(xiàn)的概率;錯(cuò)輸概率計(jì)算單元,用于 計(jì)算在所述上下文字符串的基礎(chǔ)上,所述構(gòu)造的糾錯(cuò)候選字符串被錯(cuò)輸成所述錯(cuò)輸串的概 率;第一概率計(jì)算單元,用于基于所述構(gòu)造的糾錯(cuò)候選字符串出現(xiàn)的概率和被錯(cuò)輸成所述 錯(cuò)輸串的概率,確定對(duì)構(gòu)造的糾錯(cuò)候選字符串在上下文中的第一概率。
[0025] 可選的,所述上下文信息包括:上下文文字串;所述的裝置還包括:上下文信息獲 取模塊,用于從上屏內(nèi)容中獲取上屏文字串作為上下文文字串;將所述上屏文字串對(duì)應(yīng)字 符串作為上下文字符串。
[0026] 可選的,所述上下文字符串為包含切分方式的字符串;所述上下文信息獲取模塊, 還用于根據(jù)所述上下文文字串確定所述上下文字符串的切分方式。
[0027] 可選的,所述文字串選擇模塊,包括:第二概率計(jì)算子模塊,用于計(jì)算在所述上下 文文字串的基礎(chǔ)上,確定所述糾錯(cuò)候選文字串在上下文中出現(xiàn)的第二概率;文字串選取子 模塊,用于將所述糾錯(cuò)候選文字串按照所述第二概率由大到小進(jìn)行排序,選取前Μ個(gè)糾錯(cuò) 候選文字串,其中Μ為正整數(shù)。
[0028] 可選的,展示模塊,用于依據(jù)預(yù)置展示規(guī)則,從所述糾錯(cuò)候選文字串中選取至少一 個(gè)糾錯(cuò)候選文字串進(jìn)行展示。
[0029] 與現(xiàn)有技術(shù)相比,本發(fā)明包括以下優(yōu)點(diǎn):
[0030] 針對(duì)糾錯(cuò)檢測(cè)得到的錯(cuò)輸串構(gòu)造至少一個(gè)糾錯(cuò)候選字符串,從而基于上下文信息 計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率,并依據(jù)所述第一概率選擇糾錯(cuò)候選字符串,選取 符合上下文語境的錯(cuò)候選字符串,進(jìn)而能夠?qū)⑦x擇的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì)應(yīng)的糾錯(cuò)候 選文字串,使得到的糾錯(cuò)候選文字串更加符合輸入的語境,提高糾錯(cuò)的準(zhǔn)確性。
【專利附圖】
【附圖說明】
[0031] 圖1是本發(fā)明實(shí)施例一提供的輸入的糾錯(cuò)方法流程圖;
[0032] 圖2是本發(fā)明實(shí)施例二提供的輸入的糾錯(cuò)方法流程圖;
[0033] 圖3是本發(fā)明實(shí)施例三提供的輸入的糾錯(cuò)裝置結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0034] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0035] 本發(fā)明實(shí)施例提供一種輸入糾錯(cuò)方法,針對(duì)糾錯(cuò)檢測(cè)得到的錯(cuò)輸串構(gòu)造至少一個(gè) 糾錯(cuò)候選字符串,從而基于上下文信息計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率,并依據(jù)所 述第一概率選擇糾錯(cuò)候選字符串,選取符合上下文語境的錯(cuò)候選字符串,進(jìn)而能夠?qū)⑦x擇 的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì)應(yīng)的糾錯(cuò)候選文字串,使得到的糾錯(cuò)候選文字串更加符合輸入 的語境,提高糾錯(cuò)的準(zhǔn)確性。
[0036] 實(shí)施例一
[0037] 參照?qǐng)D1,給出了本發(fā)明實(shí)施例一提供的輸入的糾錯(cuò)方法流程圖。
[0038] 步驟101,采用糾錯(cuò)檢測(cè)得到的錯(cuò)輸串構(gòu)造至少一個(gè)糾錯(cuò)候選字符串。
[0039] 用戶輸入編碼字符串以進(jìn)行文字輸入時(shí),可能會(huì)存在錯(cuò)輸?shù)男袨?,如由于疏忽?dǎo) 致的輸入的編碼字符串出現(xiàn)錯(cuò)誤,難以得到正確的候選項(xiàng)。此時(shí)要對(duì)輸入的編碼字符串進(jìn) 行糾錯(cuò)檢測(cè),從而得到編碼字符串中的錯(cuò)輸串,所述錯(cuò)輸串即輸錯(cuò)的編碼字符串。然后進(jìn)一 步對(duì)錯(cuò)輸串進(jìn)行修改,以構(gòu)造至少一個(gè)糾錯(cuò)候選字符串,在修改錯(cuò)輸串時(shí)可以采用插入、刪 除、交換、替換等操作,從而構(gòu)造出若干糾錯(cuò)候選字符串,本部分可以采用現(xiàn)有技術(shù)或能夠 產(chǎn)生糾錯(cuò)候選字符串的其他技術(shù),不是本發(fā)明的重點(diǎn),因此不再詳述。
[0040] 其中,所述編碼字符串是輸入法系統(tǒng)直接接收的用戶輸入內(nèi)容,輸入法系統(tǒng)可以 根據(jù)用戶當(dāng)前使用的輸入方式,將這些輸入內(nèi)容轉(zhuǎn)換為所輸入文字的字詞候選項(xiàng),提供給 用戶選擇。用戶可以采用任意的輸入手段進(jìn)行編碼字符串的輸入,如鍵盤、觸摸、音頻等;用 戶也可以采用任意的輸入方式,如拼音、五筆、筆畫、語音、手寫等,本申請(qǐng)中不做限定。
[0041] 步驟102,基于上下文信息計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率,并依據(jù)所述第 一概率選擇糾錯(cuò)候選字符串。
[0042] 本發(fā)明實(shí)施例為了提高糾錯(cuò)的準(zhǔn)確性,采用上下文信息進(jìn)行糾錯(cuò),其中,上下文信 息是指用戶在輸入環(huán)境(語境)中的上屏內(nèi)容,如在當(dāng)前宿主程序中的上屏內(nèi)容,所述上屏 內(nèi)容指的是用戶已完成輸入并展示的內(nèi)容。
[0043] 可以基于上下文信息,計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率,所述第一概率指 的是給定上下文信息的前提下,在上下文中采用所述構(gòu)造的糾錯(cuò)候選字符串的概率。從而 可以依據(jù)第一概率對(duì)構(gòu)造的糾錯(cuò)候選字符串進(jìn)行評(píng)估,從而選出符合語境即上下文的糾錯(cuò) 候選字符串。
[0044] 步驟103,將選擇的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì)應(yīng)的糾錯(cuò)候選文字串。
[0045] 根據(jù)用戶當(dāng)前使用的輸入方式,將選擇的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì)應(yīng)的糾錯(cuò)候選 文字串,從而可以得到至少一種糾錯(cuò)候選文字串。其中,文字串是對(duì)字符串通過轉(zhuǎn)換得到的 文字集合,因此,在輸入法中上述文字串可以作為輸入的候選項(xiàng)。
[0046] 綜上,針對(duì)糾錯(cuò)檢測(cè)得到的錯(cuò)輸串構(gòu)造至少一個(gè)糾錯(cuò)候選字符串,從而基于上下 文信息計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率,并依據(jù)所述第一概率選擇糾錯(cuò)候選字符 串,即選取符合上下文語境的糾錯(cuò)候選字符串,進(jìn)而將選擇的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì)應(yīng) 的糾錯(cuò)候選文字串,使得到的糾錯(cuò)候選文字串更加符合輸入的語境,提高糾錯(cuò)的準(zhǔn)確性。
[0047] 實(shí)施例二
[0048] 參照?qǐng)D2,給出了本發(fā)明實(shí)施例二提供的輸入糾錯(cuò)方法流程圖。
[0049] 步驟201,采用糾錯(cuò)檢測(cè)得到的錯(cuò)輸串構(gòu)造至少一個(gè)糾錯(cuò)候選字符串。
[0050] 用戶想要輸入"jimi (機(jī)密)"卻錯(cuò)輸為"nimi"。此時(shí),通過糾錯(cuò)檢測(cè)可以檢測(cè)出 錯(cuò)輸串"nimi",然后利用插入、刪除、交換、替換等操作能夠構(gòu)造大量的糾錯(cuò)候選字符串,包 括 "ni im","nim","nmi "," j imi "," 1 imi ","mimi " 等。
[0051] 步驟202,從上屏內(nèi)容中獲取上下文信息。
[0052] 實(shí)際處理中,上下文信息包括:上下文字符串和/或上下文文字串。從上屏內(nèi)容中 獲取上下文信息進(jìn)一步包括:從上屏內(nèi)容中獲取上屏文字串作為上下文文字串;將所述上 屏文字串對(duì)應(yīng)字符串作為上下文字符串;采用所述上下文文字串和/或上下文字符串構(gòu)成 所述上下文信息。
[0053] 候選項(xiàng)出現(xiàn)的概率與其前X個(gè)上屏項(xiàng)(上屏文字)有關(guān),為了提高糾錯(cuò)的準(zhǔn)確性,本 發(fā)明實(shí)施例從上屏內(nèi)容中獲取上下文信息,后續(xù)依據(jù)上下文信息確定糾錯(cuò)候選字符串和糾 錯(cuò)候選文字串。
[0054] 通常狀況下,取X彡3就可以滿足用戶的輸入需求,即可得到較高的準(zhǔn)確性,因此, 本發(fā)明實(shí)施例為了減少對(duì)資源的浪費(fèi),提高計(jì)算的效率,可以根據(jù)實(shí)際情況及用戶所使用 客戶端的計(jì)算能力選定X取1?3之間的任一值。例如,當(dāng)用戶處于連續(xù)輸入過程中時(shí),根 據(jù)客戶端計(jì)算資源的富余情況,資源最富余時(shí)X取3,最差時(shí)取1等。當(dāng)然,實(shí)際處理中X也 可以取大于3的任意整數(shù),本發(fā)明實(shí)施例對(duì)此不作限定。
[0055] 因此可以結(jié)合客戶端的計(jì)算能力、上一次的上屏信息確定選取的X的值,然后從 上屏內(nèi)容中獲取后X個(gè)上屏文字構(gòu)成上屏文字串,然后將該上屏文字串作為上下文文字 串。
[0056] 此外,由于相同的字符串可能會(huì)轉(zhuǎn)化成多種不同的文字串,例如,用戶輸入 "wohenfangan",可以被切分為"wo, hen' fan' gan (我很反感)"、"wo' hen' fang' an (我很 方案)",因此,為了保證獲取準(zhǔn)確的上下文信息,即確保上下文字符串準(zhǔn)確性,可以將上下 文字符串與上下文文字串關(guān)聯(lián),即上下文字符串的切分方式由上下文文字串決定。
[0057] 因此,如果所述上下文字符串為包含切分方式的字符串,則將上屏文字串對(duì)應(yīng)字 符串作為上下文字符串,包括:根據(jù)所述上下文文字串確定所述上下文字符串的切分方式。 具體的,可以將所述上屏文字串轉(zhuǎn)化為對(duì)應(yīng)字符串,在轉(zhuǎn)化字符串的同時(shí)確定字符串的切 分方式,然后將轉(zhuǎn)化后的帶有切分方式的字符串作為上下文字符串,從而采用所述上下文 文字串和帶有切分方式的上下文字符串構(gòu)成所述上下文信息。
[0058] 因此針對(duì)上例,若上屏內(nèi)容,即上下文文字串信息為"我很反感",則將上下文文字 串轉(zhuǎn)換為對(duì)應(yīng)的字符串時(shí),可以得到采用如下方式進(jìn)行切分的字符串"wo' hen' fan' gan"。
[0059] 針對(duì)步驟201中的例子,上屏內(nèi)容為"保守",則上下文文字串為"保守",對(duì)應(yīng)上文 字符串為"baoshou (保守)"。
[0060] 可選的,上述步驟102基于上下文信息計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率, 并依據(jù)所述第一概率選擇糾錯(cuò)候選字符串,包括:
[0061] 步驟203,基于上下文字符串確定所述構(gòu)造的糾錯(cuò)候選字符串在上下文中的第一 概率。
[0062] 步驟204,將所述構(gòu)造的糾錯(cuò)候選字符串按照第一概率由大到小進(jìn)行排序,選擇前 N個(gè)糾錯(cuò)候選字符串。
[0063] 本發(fā)明實(shí)施例中,構(gòu)造出糾錯(cuò)候選字符串后,可以利用上下文字符串確定所述構(gòu) 造的糾錯(cuò)候選字符串在上下文中的第一概率,從而依據(jù)第一概率選出最優(yōu)的N個(gè)糾錯(cuò)候選 字符串。
[0064] 其中,選取最優(yōu)糾錯(cuò)候選字符串的過程,可以看作是根據(jù)錯(cuò)輸串搜索概率最高的 糾錯(cuò)候選字符串過程,可以采用貝葉斯公式進(jìn)行計(jì)算,從而確定未引入上下文信息時(shí)各構(gòu) 造的糾錯(cuò)候選字符串的概率,公式如下:
【權(quán)利要求】
1. 一種輸入的糾錯(cuò)方法,其特征在于,包括: 采用糾錯(cuò)檢測(cè)得到的錯(cuò)輸串構(gòu)造至少一個(gè)糾錯(cuò)候選字符串; 基于上下文信息計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率,并依據(jù)所述第一概率選擇糾 錯(cuò)候選字符串; 將選擇的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì)應(yīng)的糾錯(cuò)候選文字串。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將選擇的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì) 應(yīng)的糾錯(cuò)候選文字串之后,還包括: 基于上下文信息計(jì)算所述糾錯(cuò)候選文字串的第二概率,并依據(jù)所述第二概率對(duì)所述糾 錯(cuò)候選文字串進(jìn)行選擇。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述上下文信息包括上下文字符串; 所述基于上下文信息計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率,并依據(jù)所述第一概率選 擇糾錯(cuò)候選字符串,包括: 基于上下文字符串確定所述構(gòu)造的糾錯(cuò)候選字符串在上下文中的第一概率; 將所述構(gòu)造的糾錯(cuò)候選字符串按照第一概率由大到小進(jìn)行排序,選擇前N個(gè)糾錯(cuò)候選 字符串,其中N為正整數(shù)。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于上下文字符串確定所述構(gòu)造的 糾錯(cuò)候選字符串在上下文中的第一概率,包括: 計(jì)算在所述上下文字符串的基礎(chǔ)上,所述構(gòu)造的糾錯(cuò)候選字符串出現(xiàn)的概率; 計(jì)算在所述上下文字符串的基礎(chǔ)上,所述構(gòu)造的糾錯(cuò)候選字符串被錯(cuò)輸成所述錯(cuò)輸串 的概率; 基于所述構(gòu)造的糾錯(cuò)候選字符串出現(xiàn)的概率和被錯(cuò)輸成所述錯(cuò)輸串的概率,確定對(duì)構(gòu) 造的糾錯(cuò)候選字符串在上下文中的第一概率。
5. 根據(jù)權(quán)利要求2至4任意一項(xiàng)所述的方法,其特征在于,所述上下文信息還包括:上 下文文字串; 所述方法還包括:從上屏內(nèi)容中獲取上屏文字串作為上下文文字串;將所述上屏文字 串對(duì)應(yīng)字符串作為上下文字符串。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述上下文字符串為包含切分方式的字 符串; 所述將上屏文字串對(duì)應(yīng)字符串作為上下文字符串,包括:根據(jù)所述上下文文字串確定 所述上下文字符串的切分方式。
7. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于上下文信息計(jì)算所述糾錯(cuò)候選 文字串的第二概率,并依據(jù)所述第二概率對(duì)所述糾錯(cuò)候選文字串進(jìn)行選擇,包括: 計(jì)算在所述上下文文字串的基礎(chǔ)上,確定所述糾錯(cuò)候選文字串在上下文中出現(xiàn)的第二 概率; 將所述糾錯(cuò)候選文字串按照所述第二概率由大到小進(jìn)行排序,選取前Μ個(gè)糾錯(cuò)候選文 字串,其中Μ為正整數(shù)。
8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 依據(jù)預(yù)置展示規(guī)則,從所述糾錯(cuò)候選文字串中選取至少一個(gè)糾錯(cuò)候選文字串進(jìn)行展 /_J、1 〇
9. 一種輸入的糾錯(cuò)裝置,其特征在于,包括: 構(gòu)造模塊,用于采用糾錯(cuò)檢測(cè)得到的錯(cuò)輸串構(gòu)造至少一個(gè)糾錯(cuò)候選字符串; 字符串選擇模塊,用于基于上下文信息計(jì)算構(gòu)造的糾錯(cuò)候選字符串的第一概率,并依 據(jù)所述第一概率選擇糾錯(cuò)候選字符串; 轉(zhuǎn)換模塊,用于將選擇的糾錯(cuò)候選字符串轉(zhuǎn)換為對(duì)應(yīng)的糾錯(cuò)候選文字串。
10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,還包括: 文字串選擇模塊,用于基于上下文信息計(jì)算所述糾錯(cuò)候選文字串的第二概率,并依據(jù) 所述第二概率對(duì)所述糾錯(cuò)候選文字串進(jìn)行選擇。
11. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述上下文信息包括:上下文字符串;所 述字符串選擇模塊,包括: 第一概率計(jì)算子模塊,用于基于上下文字符串確定所述構(gòu)造的糾錯(cuò)候選字符串在上下 文中的第一概率; 字符串選擇子模塊,用于將所述構(gòu)造的糾錯(cuò)候選字符串按照第一概率由大到小進(jìn)行排 序,選擇前N個(gè)糾錯(cuò)候選字符串,其中N為正整數(shù)。
12. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述第一概率計(jì)算子模塊,包括: 出現(xiàn)概率計(jì)算單元,用于計(jì)算在所述上下文字符串的基礎(chǔ)上,所述構(gòu)造的糾錯(cuò)候選字 符串出現(xiàn)的概率; 錯(cuò)輸概率計(jì)算單元,用于計(jì)算在所述上下文字符串的基礎(chǔ)上,所述構(gòu)造的糾錯(cuò)候選字 符串被錯(cuò)輸成所述錯(cuò)輸串的概率; 第一概率計(jì)算單元,用于基于所述構(gòu)造的糾錯(cuò)候選字符串出現(xiàn)的概率和被錯(cuò)輸成所述 錯(cuò)輸串的概率,確定對(duì)構(gòu)造的糾錯(cuò)候選字符串在上下文中的第一概率。
13. 根據(jù)權(quán)利要求9至12任意一項(xiàng)所述的裝置,其特征在于,所述上下文信息包括:上 下文文字串;所述的裝置還包括: 上下文信息獲取模塊,用于從上屏內(nèi)容中獲取上屏文字串作為上下文文字串;將所述 上屏文字串對(duì)應(yīng)字符串作為上下文字符串。
14. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述上下文字符串為包含切分方式的 字符串;所述上下文信息獲取模塊,還用于根據(jù)所述上下文文字串確定所述上下文字符串 的切分方式。
15. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述文字串選擇模塊,包括: 第二概率計(jì)算子模塊,用于計(jì)算在所述上下文文字串的基礎(chǔ)上,確定所述糾錯(cuò)候選文 字串在上下文中出現(xiàn)的第二概率; 文字串選取子模塊,用于將所述糾錯(cuò)候選文字串按照所述第二概率由大到小進(jìn)行排 序,選取前Μ個(gè)糾錯(cuò)候選文字串,其中Μ為正整數(shù)。
16. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,還包括: 展示模塊,用于依據(jù)預(yù)置展示規(guī)則,從所述糾錯(cuò)候選文字串中選取至少一個(gè)糾錯(cuò)候選 文字串進(jìn)行展示。
【文檔編號(hào)】G06F17/30GK104298672SQ201310298446
【公開日】2015年1月21日 申請(qǐng)日期:2013年7月16日 優(yōu)先權(quán)日:2013年7月16日
【發(fā)明者】桂正科, 任尚昆, 崔欣, 張揚(yáng) 申請(qǐng)人:北京搜狗科技發(fā)展有限公司