專用詞不拆行處理方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息技術(shù)領(lǐng)域,尤其涉及一種基于專用詞不拆行處理方法和裝置。
【背景技術(shù)】
[0002] 在文章排版中,一些特定詞語,即專用詞,比如:人名、國名、地名等,通常需要整體 排在一行中,不能在行末進(jìn)行拆分。這樣排版,可以提供良好的閱讀體驗(yàn),體現(xiàn)豐富的人文 關(guān)懷。
[0003]目前,通常情況下是操作人員通過鼠標(biāo)拖放或鍵盤操作選中文檔中的某個(gè)專用詞 文本,通過菜單命令,將該專用詞文本的屬性設(shè)置為不可拆分屬性。然而,如果文檔過長(zhǎng), 或者文章內(nèi)容發(fā)生變化需要重新設(shè)置,則手動(dòng)設(shè)置過程極其繁瑣、浪費(fèi)人力和時(shí)間,效率低 下。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明提供一種基于專用詞不拆行處理方法和裝置,以提高對(duì)專用詞在同一行中 不拆分的處理效率。
[0005] -方面,本發(fā)明提供一種專用詞不拆行處理方法,包括:
[0006] 對(duì)文章段落換行位置附近的字符與預(yù)先設(shè)置的專用詞索引表中的關(guān)鍵字的字符 進(jìn)行匹配,識(shí)別出包括關(guān)鍵字的專用詞,所述專用詞索引表包括多個(gè)關(guān)鍵字以及每個(gè)所述 關(guān)鍵字相匹配的至少一個(gè)專用詞;
[0007] 根據(jù)所識(shí)別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)整所述文 章段落的換行位置,以使設(shè)定類型的每個(gè)所述專用詞中包括的所有字符位于所述段落中的 同一行。
[0008] 另一方面,本發(fā)明還提供一種專用詞不拆行處理裝置,包括:
[0009] 識(shí)別模塊,用于根據(jù)預(yù)先設(shè)置的專用詞索引表中的關(guān)鍵字,識(shí)別文章段落換行位 置附近的字符與預(yù)先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進(jìn)行匹配,識(shí)別出包括關(guān)鍵 字的專用詞,所述專用詞索引表包括多個(gè)關(guān)鍵字以及每個(gè)所述關(guān)鍵字相匹配的至少一個(gè)專 用詞;
[0010] 調(diào)整模塊,用于根據(jù)所識(shí)別出的專用詞中所包括的字符與所述換行位置的位置關(guān) 系,調(diào)整所述文章段落的換行位置,以使設(shè)定類型的每個(gè)所述專用詞中包括的所有字符位 于所述段落中的同一行。
[0011] 本發(fā)明提供一種基于專用詞不拆行處理方法和裝置,對(duì)文章段落換行位置附近的 字符與預(yù)先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進(jìn)行匹配,識(shí)別出包括關(guān)鍵字的專用 詞,再根據(jù)所識(shí)別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)整所述文章 段落的換行位置,以使設(shè)定類型的每個(gè)所述專用詞中包括的所有字符位于所述段落中的同 一行。從而提高對(duì)專用詞在同一行中不拆分的處理效率。
【附圖說明】
[0012] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0013] 圖1為本發(fā)明提供的專用詞不拆行處理方法一個(gè)實(shí)施例的流程圖;
[0014] 圖2為本發(fā)明提供的專用詞索引表的示意圖;
[0015] 圖3為本發(fā)明提供的專用詞不拆行處理方法專用詞處理效果示意圖;
[0016]圖4為本發(fā)明提供的專用詞不拆行處理裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
[0017]圖5為本發(fā)明提供的專用詞不拆行處理裝置又一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0018] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例 中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是 本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員 在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0019] 圖1為本發(fā)明提供的專用詞不拆行處理方法一個(gè)實(shí)施例的流程圖,如圖1所示,該 方法包括:
[0020] S101、對(duì)文章段落換行位置附近的字符與預(yù)先設(shè)置的專用詞索引表中的關(guān)鍵字的 字符進(jìn)行匹配,識(shí)別出包括關(guān)鍵字的專用詞,專用詞索引表包括多個(gè)關(guān)鍵字以及每個(gè)關(guān)鍵 字相匹配的至少一個(gè)專用詞;
[0021]S102、根據(jù)所識(shí)別出的專用詞中所包括的字符與換行位置的位置關(guān)系,調(diào)整文章 段落的換行位置,以使設(shè)定類型的每個(gè)專用詞中包括的所有字符位于段落中的同一行。
[0022] -方面,可以預(yù)先創(chuàng)建并維護(hù)專用詞庫,分類管理專用詞。
[0023] 其中,該專用詞庫中可以包括多個(gè)專用詞分類,例如:地名分類,國家分類,名人分 類等等。每個(gè)專用詞分類可以包含下列內(nèi)容:
[0024] 分類名稱,指定該專用詞分類的名稱;
[0025] 分類對(duì)應(yīng)的優(yōu)先級(jí)別,指在段落換行處,該專用詞分類中專用詞項(xiàng)的匹配優(yōu)先次 序;
[0026] 忽略標(biāo)記,指在段落換行處,該專用詞分類中專用詞項(xiàng)是否允許拆行;
[0027] 專用詞項(xiàng)(M個(gè),M> 0),指在該專用詞分類中包括的專用詞。
[0028] 進(jìn)一步的,專用詞項(xiàng)中包括下列內(nèi)容:文本,指定該專用詞項(xiàng)的內(nèi)容;優(yōu)先級(jí)別, 指在段落拆行處,該專用詞項(xiàng)的匹配優(yōu)先次序;忽略標(biāo)記,指在段落拆行處,該專用詞項(xiàng)是 否允許拆行。
[0029] 另一方面,基于專用詞庫,可以預(yù)先建立專用詞索引表,該專用詞索引表包括多個(gè) 專用詞索引項(xiàng),專用詞索引項(xiàng)包含以下內(nèi)容:關(guān)鍵字以及每個(gè)關(guān)鍵字相匹配的匹配項(xiàng)。其 中,關(guān)鍵字,指該專用詞索引項(xiàng)的檢索關(guān)鍵字,為專用詞項(xiàng)的文本中相鄰的2個(gè)字符;匹配 項(xiàng)(N個(gè),N30),指定該專用詞索引項(xiàng)對(duì)應(yīng)的匹配項(xiàng)數(shù)組,可以按照計(jì)算出匹配項(xiàng)的優(yōu)先級(jí) 從高到低的順序進(jìn)行排序。
[0030] 可以通過以下步驟來建立專用詞索引表:依次遍歷設(shè)定的專用詞庫確定專用詞所 屬的分類,專用詞庫中包括專用詞分類、每個(gè)分類對(duì)應(yīng)的優(yōu)先級(jí)別和是否拆行的忽略標(biāo)識(shí); 每個(gè)專用詞分類中包括至少一個(gè)專用詞項(xiàng)、每個(gè)專用詞項(xiàng)的優(yōu)先級(jí)別和是否拆行的忽略標(biāo) 識(shí);根據(jù)專用詞庫中每個(gè)專用詞項(xiàng)中的相鄰2個(gè)字符,確定專用詞項(xiàng)對(duì)應(yīng)的關(guān)鍵字以及關(guān) 鍵字在專用詞項(xiàng)中的匹配位置信息;根據(jù)專用詞所屬的分類,對(duì)應(yīng)的關(guān)鍵字以及關(guān)鍵字在 專用詞中的匹配位置信息,建立專用詞索引表。
[0031] 具體的,對(duì)于當(dāng)前專用詞項(xiàng)的文本中的第N組相鄰字符,構(gòu)建新的關(guān)鍵字[字符N, 字符N+1],構(gòu)建新的匹配項(xiàng),將其專用詞項(xiàng)指針設(shè)置為當(dāng)前專用詞項(xiàng),匹配位置設(shè)置為N; 在專用詞索引表中,根據(jù)新的關(guān)鍵字查找對(duì)應(yīng)的專用詞索引項(xiàng),如果找到,將當(dāng)前的專用詞 索引項(xiàng)設(shè)置為找到的專用詞索引項(xiàng),轉(zhuǎn)入執(zhí)行:計(jì)算出新的匹配項(xiàng)的優(yōu)先級(jí),并按照高低順 序,加入到當(dāng)前的專用詞索引項(xiàng);否則,轉(zhuǎn)入執(zhí)行:構(gòu)建新的專用詞索引項(xiàng),設(shè)置其關(guān)鍵字 為新的關(guān)鍵字,其匹配項(xiàng)數(shù)組為空,加入專用詞索引表,并將當(dāng)前的專用詞索引項(xiàng)設(shè)置為新 的專用詞索引項(xiàng)。
[0032] 可選的,對(duì)于同一關(guān)鍵字對(duì)應(yīng)的多個(gè)專用詞項(xiàng),還可以根據(jù)各個(gè)專用詞項(xiàng)的:文本 長(zhǎng)度,分類優(yōu)先級(jí)別,分類順序,詞優(yōu)先級(jí)別,詞順序,和匹配位置中的一種或多種,確定該 關(guān)鍵字對(duì)應(yīng)的各專用詞項(xiàng)的匹配優(yōu)先級(jí)。
[0033] 其中,文本長(zhǎng)度,指定對(duì)應(yīng)的專用詞項(xiàng)的文本長(zhǎng)度;分類優(yōu)先級(jí)別,指定對(duì)應(yīng)的專 用詞分類的優(yōu)先級(jí)別;分類順序,指定對(duì)應(yīng)的專用詞分類在庫中的位置;詞優(yōu)先級(jí)別,指定 對(duì)應(yīng)的專用詞項(xiàng)的優(yōu)先級(jí)別;詞順序,指定對(duì)應(yīng)的專用詞項(xiàng)在分類中的位置;匹配位置,指 定該匹配項(xiàng)的匹配位置。
[0034]其中,優(yōu)先級(jí)的比較可以按照文本長(zhǎng)度,分類優(yōu)先級(jí)別,分類順序,詞優(yōu)先級(jí)別,詞 順序,和匹配位置的順序依次進(jìn)行,例如:文本長(zhǎng)度越大,優(yōu)先級(jí)越高;分類級(jí)別越高,優(yōu)先 級(jí)越高;分類順序越靠前,優(yōu)先級(jí)越高;匹配位置越靠后,優(yōu)先級(jí)越高。
[0035] 專用詞索引表可以如下表一所示,同時(shí)參見圖2 :
[0036]
【主權(quán)項(xiàng)】
1. 一種專用詞不拆行處理方法,其特征在于,包括: 對(duì)文章段落換行位置附近的字符與預(yù)先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進(jìn)行 匹配,識(shí)別出包括關(guān)鍵字的專用詞,所述專用詞索引表包括多個(gè)關(guān)鍵字W及每個(gè)所述關(guān)鍵 字相匹配的至少一個(gè)專用詞; 根據(jù)所識(shí)別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)整所述文章段 落的換行位置,W使設(shè)定類型的每個(gè)所述專用詞中包括的所有字符位于所述段落中的同一 行。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所