一種翻譯方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明實(shí)施例提供一種翻譯方法及系統(tǒng),用于數(shù)據(jù)集市,其中方法包括:獲取邏輯模型中實(shí)體中文名稱;將獲取的實(shí)體中文名稱自動(dòng)翻譯為實(shí)體英文名稱,將所述實(shí)體英文名稱視為物理模型中表英文名稱;獲取邏輯模型中屬性中文名稱,將獲取的屬性中文名稱自動(dòng)翻譯為屬性英文名稱,將所述屬性英文名稱視為物理模型中字段英文名稱。
【專利說明】-種翻譯方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及翻譯【技術(shù)領(lǐng)域】,特別是涉及一種翻譯方法及系統(tǒng),應(yīng)用于數(shù)據(jù)集市。
【背景技術(shù)】
[0002] 數(shù)據(jù)集市值ata Mart),也叫數(shù)據(jù)市場(chǎng),是一個(gè)從操作的數(shù)據(jù)和其他的為某個(gè)特殊 的專業(yè)人員團(tuán)體服務(wù)的數(shù)據(jù)源中收集數(shù)據(jù)的倉(cāng)庫(kù)。從范圍上來說,數(shù)據(jù)是從企業(yè)范圍的數(shù) 據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù),或者是更加專業(yè)的數(shù)據(jù)倉(cāng)庫(kù)中抽取出來的。數(shù)據(jù)集市的重點(diǎn)就在于它迎合 了專業(yè)用戶群體的特殊需求,在分析、內(nèi)容、表現(xiàn),W及易用方面。數(shù)據(jù)中也的用戶希望數(shù)據(jù) 是由他們熟悉的術(shù)語(yǔ)表現(xiàn)的。
[0003] 目前,在數(shù)據(jù)集市開發(fā)過程中,將邏輯模型中的實(shí)體與屬性的中文名稱翻譯為物 理模型中表與字段的英文名稱的方法有漢語(yǔ)拼音全字母翻譯、單詞拼音首字母翻譯、無含 義字段翻譯和英文詞組翻譯四種;漢語(yǔ)拼音全字母翻譯,根據(jù)邏輯模型的實(shí)體和屬性中文 名稱采用漢字的全拼音來手動(dòng)定義相應(yīng)的表和字段英文名稱;單詞拼音首字母翻譯,根據(jù) 邏輯模型的實(shí)體和屬性中文名稱用手動(dòng)的方式首先把漢字進(jìn)行分詞處理,然后針對(duì)每個(gè) 詞,翻譯成全拼音,采用每個(gè)詞的拼音的首字母作為字段和表名的英文名稱;無含義字段翻 譯,手動(dòng)采用無任何特殊含義的英文字母、數(shù)字W及特殊字符組合的方式,依次翻譯邏輯模 型中的實(shí)體和屬性中文名稱;英文詞組翻譯,根據(jù)邏輯模型的實(shí)體和屬性中文名稱,首先用 人工的方式把漢字進(jìn)行分詞處理,然后針對(duì)每個(gè)詞,翻譯成全英文單詞,然后使用字符進(jìn)行 連接。
[0004] 由于數(shù)據(jù)集市項(xiàng)目一般規(guī)模比較大,在W上四種翻譯方法中,均需要大量的設(shè)計(jì) 人員實(shí)現(xiàn)物理模型的生成,如果每個(gè)設(shè)計(jì)人員都是手動(dòng)生成物理模型的話,那么,相同的屬 性在不同的實(shí)體內(nèi)時(shí),很可能就翻譯為不同的字段英文名,而在數(shù)據(jù)集市系統(tǒng)邏輯模型設(shè) 計(jì)中,同名的屬性,不管它在哪個(gè)實(shí)體中,代表的都是相同的業(yè)務(wù)含義,所W原則上由邏輯 模型生成物理模型的過程中,同名的屬性應(yīng)該翻譯為相同的字段名,所W利用現(xiàn)有技術(shù)完 成邏輯模型實(shí)體與屬性中文名稱翻譯為對(duì)應(yīng)的表與字段英文名稱,會(huì)導(dǎo)致物理模型命名的 規(guī)范性及質(zhì)量無法保證。同時(shí),手動(dòng)生成物理模型的過程中,要保證物理模型比較明確的 反映邏輯模型的含義,需要設(shè)計(jì)人員認(rèn)真分析哪個(gè)英文名稱能夠比較準(zhǔn)確的翻譯出中文名 稱的含義,且不同的設(shè)計(jì)人員面臨相同的屬性時(shí),都會(huì)考慮相同的問題,會(huì)有很多重復(fù)性勞 動(dòng),物理模型生成效率較低。
【發(fā)明內(nèi)容】
[0005] 有鑒于此,本發(fā)明實(shí)施例提供一種翻譯方法及系統(tǒng),W解決現(xiàn)有技術(shù)中使用人工 手動(dòng)生成物理模型而造成物理模型命名的規(guī)范性及質(zhì)量無法保證且物理模型生成效率較 低的問題。
[0006] 為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供如下技術(shù)方案:
[0007] -種翻譯方法,用于數(shù)據(jù)集市,包括:
[0008] 獲取邏輯模型中實(shí)體中文名稱;將獲取的實(shí)體中文名稱自動(dòng)翻譯為實(shí)體英文名 稱,將所述實(shí)體英文名稱視為物理模型中表英文名稱;
[0009] 獲取邏輯模型中屬性中文名稱;將獲取的屬性中文名稱自動(dòng)翻譯為屬性英文名 稱,將所述屬性英文名稱視為物理模型中字段英文名稱。
[0010] 其中,將所述實(shí)體英文名稱視為物理模型中表英文名稱包括:
[0011] 判斷所得的實(shí)體英文名稱是否與物理模型中已存在的所有表英文名稱均不同,女口 果是,得到物理模型中的表英文名稱;如果不是,將所得的實(shí)體英文名稱的最后一位字母替 換為一個(gè)預(yù)定的正整數(shù)n,0《n《9 ;判斷該將最后一位字母替換為n的實(shí)體英文名稱是 否與物理模型中已存在的所有表英文名稱均不同,若不是,則將該將最后一位字母替換為n 的實(shí)體英文名稱的最后一位字母替換為n+1,直至物理模型中已存在的所有表英文名稱均 與該替換了最后一位字母的實(shí)體英文名稱不同,得到物理模型中的表英文名稱;
[0012] 所述將所述屬性英文名稱視為物理模型中字段英文名稱包括:
[0013] 判斷所得的屬性英文名稱是否與物理模型中已存在的所有字段英文名稱均不同, 若不是,將所得的屬性英文名稱的最后一位字母替換為一個(gè)預(yù)定的正整數(shù)n,0《n《9 ;判 斷物理模型中已存在的所有字段英文名稱是否均與該將最后一位字母替換為n的屬性英 文名稱不同,若不是,則將該將最后一位字母替換為n的屬性英文名稱的最后一位字母替 換為n+1,直至物理模型中已存在的所有字段英文名稱均與該替換了最后一位字母的屬性 英文名稱不同,得到物理模型中的字段英文名稱。
[0014] 其中,所述將獲取的實(shí)體中文名稱自動(dòng)翻譯為實(shí)體英文名稱包括:
[0015] 將獲取的實(shí)體中文名稱進(jìn)行拆分,得實(shí)體詞根;根據(jù)詞根表將所有實(shí)體詞根翻譯 為對(duì)應(yīng)的實(shí)體英文簡(jiǎn)稱;將所有實(shí)體英文簡(jiǎn)稱按預(yù)定順序通過預(yù)定方法進(jìn)行拼接,并自動(dòng) 加上代表所述實(shí)體英文名稱所在主題的英文前綴,得到實(shí)體中文名稱對(duì)應(yīng)的實(shí)體英文名 稱;
[0016] 所述將獲取的屬性中文名稱自動(dòng)翻譯為屬性英文名稱包括:
[0017] 將獲取的屬性中文名稱進(jìn)行拆分,得屬性詞根;根據(jù)詞根表將所有屬性詞根翻譯 為對(duì)應(yīng)的屬性英文簡(jiǎn)稱;將所有屬性英文簡(jiǎn)稱按預(yù)定順序通過預(yù)定方法進(jìn)行拼接,得到屬 性中文名稱對(duì)應(yīng)的屬性英文名稱。
[0018] 其中,所述將獲取的實(shí)體中文名稱進(jìn)行拆分,包括:
[0019] 判斷獲取的實(shí)體中文名稱是否在詞根表中;若不在,則去掉該實(shí)體中文名稱中最 后一個(gè)漢字,獲取該去掉最后端一個(gè)漢字的實(shí)體中文名稱;若在,則將該實(shí)體中文名稱作為 一個(gè)實(shí)體詞根,并將該實(shí)體詞根從該實(shí)體中文名稱中去除,獲取該去除了所述實(shí)體詞根的 實(shí)體中文名稱;
[0020] 所述將獲取的屬性中文名稱進(jìn)行拆分,包括:
[0021] 判斷獲取的屬性中文名稱是否在詞根表中;若不在,則去掉該屬性中文名稱中最 后一個(gè)漢字,獲取該去掉最后端一個(gè)漢字的屬性中文名稱;若在,則將該屬性中文名稱作為 一個(gè)屬性詞根,并將該屬性詞根從該實(shí)體中文名稱中去除,獲取該去除了所述屬性詞根的 屬性中文名稱。
[0022] 其中,所述去掉該實(shí)體中文名稱中最后一個(gè)漢字后還包括:
[0023] 判斷是否所有漢字都已經(jīng)去除,若是,則找出該實(shí)體中文名稱對(duì)應(yīng)的原始實(shí)體中 文名稱中未被拆分為實(shí)體詞根的漢字,在詞根表中添加所有未被拆分為實(shí)體詞根的漢字的 英文翻譯及簡(jiǎn)稱;
[0024] 所述去掉該屬性中文名稱中最后一個(gè)漢字后還包括:
[0025] 判斷是否所有漢字都已經(jīng)去除,若是,則找出該屬性中文名稱對(duì)應(yīng)的原始屬性中 文名稱中未被拆分為屬性詞根的漢字,在詞根表中添加所有未被拆分為屬性詞根的漢字的 英文翻譯及簡(jiǎn)稱。
[0026] 其中,所述獲取該去除了所述實(shí)體詞根的實(shí)體中文名稱后還包括:
[0027] 判斷獲取的去除了所述實(shí)體詞根的實(shí)體中文名稱中是否包含漢字,若不包含,貝U 說明獲取的實(shí)體中文名稱已拆分完成,根據(jù)詞根表將所有實(shí)體詞根翻譯為對(duì)應(yīng)的實(shí)體英文 簡(jiǎn)稱;
[0028] 所述獲取該去除了所述屬性詞根的屬性中文名稱后還包括:
[0029] 判斷獲取的去除了所述屬性詞根的實(shí)體中文名稱中是否包含漢字,若不包含,貝U 說明獲取的屬性中文名稱已拆分完成,根據(jù)詞根表將所有實(shí)體詞根翻譯為對(duì)應(yīng)的實(shí)體英文 簡(jiǎn)稱。
[0030] 其中,所述得到實(shí)體中文名稱對(duì)應(yīng)的實(shí)體英文名稱后還包括:
[0031] 判斷所得的實(shí)體英文名稱的字節(jié)數(shù)是否超過預(yù)定的字節(jié)數(shù),若超過,則去掉該實(shí) 體英文名稱最后端超出的字節(jié);
[0032] 所述得到屬性中文名稱對(duì)應(yīng)的屬性英文名稱后還包括:
[0033] 判斷所得的屬性英文名稱的字節(jié)數(shù)是否超過預(yù)定的字節(jié)數(shù),若超過,則去掉該屬 性英文名稱最后端超出的字節(jié)。
[0034] 本發(fā)明實(shí)施例還提供一種翻譯系統(tǒng),用于數(shù)據(jù)集市,包括:第一翻譯模塊和第二翻 譯模塊;其中,
[0035] 所述第一翻譯模塊,用于將邏輯模型中實(shí)體中文名稱翻譯為物理模型中表英文名 稱;
[0036] 所述第二翻譯模塊,用于將邏輯模型中屬性中文名稱翻譯為物理模型中字段英文 名稱;
[0037] 其中,所述第一翻譯模塊包括;第一獲取單元和第一翻譯單元,其中,所述第一獲 取單元用于獲取邏輯模型中實(shí)體中文名稱;所述第一翻譯單元用于將獲取的實(shí)體中文名稱 自動(dòng)翻譯為實(shí)體英文名稱,將所述實(shí)體英文名稱視為物理模型中表英文名稱;
[0038] 其中,所述第二翻譯模塊包括;第二獲取單元和第二翻譯單元,其中,所述第二獲 取單元用于獲取邏輯模型中屬性中文名稱;所述第二翻譯單元用于將獲取的屬性中文名稱 自動(dòng)翻譯為屬性英文名稱,將所述屬性英文名稱視為物理模型中字段英文名稱。
[0039] 其中,所述第一翻譯單元包括;第一拆分子單元、第一翻譯子單元和第一拼接子單 元,其中,
[0040] 所述第一拆分子單元,用于將獲取的實(shí)體中文名稱進(jìn)行拆分,得實(shí)體詞根;
[0041] 所述第一翻譯子單元,用于根據(jù)詞根表將所有實(shí)體詞根翻譯為對(duì)應(yīng)的實(shí)體英文簡(jiǎn) 稱;
[0042] 所述第一拼接子單元,用于將所有實(shí)體英文簡(jiǎn)稱按預(yù)定順序通過預(yù)定方法進(jìn)行拼 接,并自動(dòng)加上代表所述實(shí)體英文名稱所在主題的英文前綴,得到實(shí)體中文名稱對(duì)應(yīng)的實(shí) 體英文名稱;
[0043] 其中,所述第二翻譯單元包括;第二拆分子單元、第二翻譯子單元和第二拼接子單 元,其中,
[0044] 所述第二拆分子單元,用于將獲取的屬性中文名稱進(jìn)行拆分,得屬性詞根;
[0045] 所述第二翻譯子單元,用于根據(jù)詞根表將所有屬性詞根翻譯為對(duì)應(yīng)的屬性英文簡(jiǎn) 稱;
[0046] 所述第二拼接子單元,用于將所有屬性英文簡(jiǎn)稱按預(yù)定順序通過預(yù)定方法進(jìn)行拼 接,得到屬性中文名稱對(duì)應(yīng)的屬性英文名稱。
[0047] 其中,所述第一翻譯單元還包括:第一判斷子單元,
[0048] 所述第一判斷子單元,用于判斷所得的實(shí)體英文名稱的字節(jié)數(shù)是否超過預(yù)定的字 節(jié)數(shù),若超過,則去掉該實(shí)體英文名稱最后端超出的字節(jié);
[0049] 第一視為子單元,用于判斷所得的實(shí)體英文名稱是否與物理模型中已存在的所有 表英文名稱均不同,如果是,得到物理模型中的表英文名稱,如果不是,將所得的實(shí)體英文 名稱的最后一位字母替換為一個(gè)預(yù)定的整數(shù)n,0《n《9 ;判斷該將最后一位字母替換為 n的實(shí)體英文名稱是否與物理模型中已存在的所有表英文名稱均不同,若不是,則將該將最 后一位字母替換為n的實(shí)體英文名稱的最后一位字母替換為n+1,直至物理模型中已存在 的所有表英文名稱均與該替換了最后一位字母的實(shí)體英文名稱不同,得到物理模型中的表 英文名稱;
[0050] 其中,所述第二翻譯單元還包括:第二判斷子單元,
[0051] 所述第二判斷子單元,用于判斷所得的屬性英文名稱的字節(jié)數(shù)是否超過預(yù)定的字 節(jié)數(shù),若超過,則去掉該屬性英文名稱最后端超出的字節(jié);
[0052] 第二視為子單元,用于判斷所得的屬性英文名稱是否與物理模型中已存在的所有 字段英文名稱均不同,若不是,將所得的屬性英文名稱的最后一位字母替換為一個(gè)預(yù)定的 整數(shù)n,0《n《9 ;判斷物理模型中已存在的所有字段英文名稱是否均與該將最后一位字 母替換為n的屬性英文名稱不同,若不是,則將該將最后一位字母替換為n的屬性英文名稱 的最后一位字母替換為n+1,直至物理模型中已存在的所有字段英文名稱均與該替換了最 后一位字母的屬性英文名稱不同,得到物理模型中的字段英文名稱。
[0053] 基于上述技術(shù)方案,本發(fā)明實(shí)施例提供的用于數(shù)據(jù)集市的翻譯方法及系統(tǒng),將獲 取的實(shí)體中文名稱自動(dòng)翻譯為實(shí)體英文名稱,將所述實(shí)體英文名稱視為物理模型中表英文 名稱;將獲取的屬性中文名稱自動(dòng)翻譯為屬性英文名稱,將所述屬性英文名稱視為物理模 型中字段英文名稱。本發(fā)明實(shí)施例提供的翻譯方法及系統(tǒng),采用全自動(dòng)的方式生成物理模 型,相同中文名稱的屬性能夠翻譯為相同的字段英文名稱,在由邏輯模型生成物理模型過 程中,保證了屬性中文名稱到字段英文名稱的一致性,從而保證了物理模型命名的規(guī)范性; 整個(gè)數(shù)據(jù)集市項(xiàng)目組只需要一個(gè)或者一組專業(yè)的人員來進(jìn)行詞根翻譯,保證詞根翻譯的準(zhǔn) 確合理性,從而提高了物理模型命名的質(zhì)量;完全采用自動(dòng)化方式將中文名稱進(jìn)行翻譯,與 W前手動(dòng)生成方式相比,大大減少了物理模型生成的工作量,提高了物理模型的生成速度, 縮短了邏輯模型到物理模型的生成過程,進(jìn)而提高整個(gè)數(shù)據(jù)集市項(xiàng)目設(shè)計(jì)開發(fā)效率。
【專利附圖】
【附圖說明】
[0054]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可W根據(jù) 提供的附圖獲得其他的附圖。
[00巧]圖1為本發(fā)明實(shí)施例提供的翻譯方法的流程圖;
[0056] 圖2為本發(fā)明實(shí)施例提供的翻譯方法中處理自動(dòng)翻譯得到的實(shí)體英文名稱的方 法流程圖;
[0057] 圖3為本發(fā)明實(shí)施例提供的翻譯方法中處理自動(dòng)翻譯得到的屬性英文名稱的方 法流程圖;
[0058] 圖4為本發(fā)明實(shí)施例提供的翻譯方法中將獲取的實(shí)體中文名稱自動(dòng)翻譯為實(shí)體 英文名稱的方法流程圖;
[0059] 圖5為本發(fā)明實(shí)施例提供的翻譯方法中將獲取的屬性中文名稱自動(dòng)翻譯為屬性 英文名稱的方法流程圖;
[0060] 圖6為本發(fā)明實(shí)施例提供的翻譯方法中將獲取的實(shí)體中文名稱進(jìn)行拆分的方法 流程圖;
[0061] 圖7為本發(fā)明實(shí)施例提供的翻譯方法中將獲取的屬性中文名稱進(jìn)行拆分的方法 流程圖;
[0062] 圖8為本發(fā)明實(shí)施例提供的翻譯方法中擴(kuò)充詞根表的方法流程圖;
[0063] 圖9為本發(fā)明實(shí)施例提供的翻譯方法中判斷獲取的實(shí)體中文名稱是否拆分完成 的方法流程圖;
[0064] 圖10為本發(fā)明實(shí)施例提供的翻譯方法中判斷獲取的屬性中文名稱是否已經(jīng)拆分 完成的方法流程圖;
[0065] 圖11為本發(fā)明實(shí)施例提供的翻譯方法中處理實(shí)體英文名稱的方法流程圖;
[0066] 圖12為本發(fā)明實(shí)施例提供的翻譯方法中處理屬性英文名稱的方法流程圖;
[0067] 圖13為本發(fā)明實(shí)施例提供的翻譯系統(tǒng)的系統(tǒng)框圖;
[0068] 圖14為本發(fā)明實(shí)施例提供的翻譯系統(tǒng)中第一翻譯模塊的結(jié)構(gòu)框圖;
[0069] 圖15為本發(fā)明實(shí)施例提供的翻譯系統(tǒng)中第二翻譯模塊的結(jié)構(gòu)框圖;
[0070] 圖16為本發(fā)明實(shí)施例提供的翻譯系統(tǒng)中第一翻譯單元的結(jié)構(gòu)框圖;
[0071] 圖17為本發(fā)明實(shí)施例提供的翻譯系統(tǒng)中第二翻譯單元的結(jié)構(gòu)框圖;
[0072] 圖18為本發(fā)明實(shí)施例提供的翻譯系統(tǒng)中第一翻譯單元的另一結(jié)構(gòu)框圖;
[0073] 圖19為本發(fā)明實(shí)施例提供的翻譯系統(tǒng)中第二翻譯單元的另一結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0074] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0075] 圖1為本發(fā)明實(shí)施例提供的翻譯方法的流程圖,用于數(shù)據(jù)集市,采用全自動(dòng)的方 式生成物理模型,保證了物理模型命名的規(guī)范性,提高了物理模型命名的質(zhì)量,且縮短了邏 輯模型到物理模型的生成過程,進(jìn)而提高整個(gè)數(shù)據(jù)集市項(xiàng)目設(shè)計(jì)開發(fā)效率,參照?qǐng)D1,該方 法可W包括:
[0076] 步驟SlOO ;獲取邏輯模型中實(shí)體中文名稱;
[0077] 邏輯模型中包括所有的實(shí)體和關(guān)系,并確定每個(gè)實(shí)體的屬性,定義每個(gè)實(shí)體的主 鍵,指定每個(gè)實(shí)體的外鍵,明確屬性是否為代碼等。
[0078] 例如,如表1所示,財(cái)會(huì)數(shù)據(jù)集市中的"組織單元"實(shí)體的邏輯模型:
[0079] 財(cái)會(huì)數(shù)據(jù)集市中的"組織單元"實(shí)體的邏輯模型
[0080]
【權(quán)利要求】
1. 一種翻譯方法,用于數(shù)據(jù)集市,其特征在于,包括: 獲取邏輯模型中實(shí)體中文名稱;將獲取的實(shí)體中文名稱自動(dòng)翻譯為實(shí)體英文名稱,將 所述實(shí)體英文名稱視為物理模型中表英文名稱; 獲取邏輯模型中屬性中文名稱;將獲取的屬性中文名稱自動(dòng)翻譯為屬性英文名稱,將 所述屬性英文名稱視為物理模型中字段英文名稱。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述將所述實(shí)體英文名稱視為物理模型中表英文名稱包括:判斷所得的實(shí)體英文名稱 是否與物理模型中已存在的所有表英文名稱均不同,如果是,得到物理模型中的表英文名 稱,如果不是,將所得的實(shí)體英文名稱的最后一位字母替換為一個(gè)預(yù)定的整數(shù)n,0 < n < 9 ; 判斷該將最后一位字母替換為n的實(shí)體英文名稱是否與物理模型中已存在的所有表英文 名稱均不同,若不是,則將該將最后一位字母替換為n的實(shí)體英文名稱的最后一位字母替 換為n+1,直至物理模型中已存在的所有表英文名稱均與該替換了最后一位字母的實(shí)體英 文名稱不同,得到物理模型中的表英文名稱; 所述將所述屬性英文名稱視為物理模型中字段英文名稱包括:判斷所得的屬性英文名 稱是否與物理模型中已存在的所有字段英文名稱均不同,若不是,將所得的屬性英文名稱 的最后一位字母替換為一個(gè)預(yù)定的整數(shù)n,〇 < n < 9 ;判斷物理模型中已存在的所有字段 英文名稱是否均與該將最后一位字母替換為n的屬性英文名稱不同,若不是,則將該將最 后一位字母替換為n的屬性英文名稱的最后一位字母替換為n+1,直至物理模型中已存在 的所有字段英文名稱均與該替換了最后一位字母的屬性英文名稱不同,得到物理模型中的 字段英文名稱。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述將獲取的實(shí)體中文名稱自動(dòng)翻譯為實(shí)體英文名稱包括:將獲取的實(shí)體中文名稱進(jìn) 行拆分,得實(shí)體詞根;根據(jù)詞根表將所有實(shí)體詞根翻譯為對(duì)應(yīng)的實(shí)體英文簡(jiǎn)稱;將所有實(shí) 體英文簡(jiǎn)稱按預(yù)定順序通過預(yù)定方法進(jìn)行拼接,并自動(dòng)加上代表所述實(shí)體英文名稱所在主 題的英文前綴,得到實(shí)體中文名稱對(duì)應(yīng)的實(shí)體英文名稱; 所述將獲取的屬性中文名稱自動(dòng)翻譯為屬性英文名稱包括:將獲取的屬性中文名稱進(jìn) 行拆分,得屬性詞根;根據(jù)詞根表將所有屬性詞根翻譯為對(duì)應(yīng)的屬性英文簡(jiǎn)稱;將所有屬 性英文簡(jiǎn)稱按預(yù)定順序通過預(yù)定方法進(jìn)行拼接,得到屬性中文名稱對(duì)應(yīng)的屬性英文名稱。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于, 所述將獲取的實(shí)體中文名稱進(jìn)行拆分,包括:判斷獲取的實(shí)體中文名稱是否在詞根表 中;若不在,貝1J去掉該實(shí)體中文名稱中最后一個(gè)漢字,獲取該去掉最后端一個(gè)漢字的實(shí)體中 文名稱;若在,則將該實(shí)體中文名稱作為一個(gè)實(shí)體詞根,并將該實(shí)體詞根從該實(shí)體中文名稱 中去除,獲取該去除了所述實(shí)體詞根的實(shí)體中文名稱; 所述將獲取的屬性中文名稱進(jìn)行拆分,包括:判斷獲取的屬性中文名稱是否在詞根表 中;若不在,則去掉該屬性中文名稱中最后一個(gè)漢字,獲取該去掉最后端一個(gè)漢字的屬性中 文名稱;若在,則將該屬性中文名稱作為一個(gè)屬性詞根,并將該屬性詞根從該實(shí)體中文名稱 中去除,獲取該去除了所述屬性詞根的屬性中文名稱。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于, 所述去掉該實(shí)體中文名稱中最后一個(gè)漢字后還包括:判斷是否所有漢字都已經(jīng)去除, 若是,則找出該實(shí)體中文名稱對(duì)應(yīng)的原始實(shí)體中文名稱中未被拆分為實(shí)體詞根的漢字,在 詞根表中添加所有未被拆分為實(shí)體詞根的漢字的英文翻譯及簡(jiǎn)稱; 所述去掉該屬性中文名稱中最后一個(gè)漢字后還包括:判斷是否所有漢字都已經(jīng)去除, 若是,則找出該屬性中文名稱對(duì)應(yīng)的原始屬性中文名稱中未被拆分為屬性詞根的漢字,在 詞根表中添加所有未被拆分為屬性詞根的漢字的英文翻譯及簡(jiǎn)稱。
6. 根據(jù)權(quán)利要求4所述的方法,其特征在于, 所述獲取該去除了所述實(shí)體詞根的實(shí)體中文名稱后還包括:判斷獲取的去除了所述實(shí) 體詞根的實(shí)體中文名稱中是否包含漢字,若不包含,則說明獲取的實(shí)體中文名稱已拆分完 成,根據(jù)詞根表將所有實(shí)體詞根翻譯為對(duì)應(yīng)的實(shí)體英文簡(jiǎn)稱; 所述獲取該去除了所述屬性詞根的屬性中文名稱后還包括:判斷獲取的去除了所述屬 性詞根的實(shí)體中文名稱中是否包含漢字,若不包含,則說明獲取的屬性中文名稱已拆分完 成,根據(jù)詞根表將所有實(shí)體詞根翻譯為對(duì)應(yīng)的實(shí)體英文簡(jiǎn)稱。
7. 根據(jù)權(quán)利要求3所述的方法,其特征在于, 所述得到實(shí)體中文名稱對(duì)應(yīng)的實(shí)體英文名稱后還包括:判斷所得的實(shí)體英文名稱的字 節(jié)數(shù)是否超過預(yù)定的字節(jié)數(shù),若超過,則去掉該實(shí)體英文名稱最后端超出的字節(jié); 所述得到屬性中文名稱對(duì)應(yīng)的屬性英文名稱后還包括:判斷所得的屬性英文名稱的字 節(jié)數(shù)是否超過預(yù)定的字節(jié)數(shù),若超過,則去掉該屬性英文名稱最后端超出的字節(jié)。
8. -種翻譯系統(tǒng),用于數(shù)據(jù)集市,其特征在于,包括:第一翻譯模塊和第二翻譯模塊; 其中, 所述第一翻譯模塊,用于將邏輯模型中實(shí)體中文名稱翻譯為物理模型中表英文名稱; 所述第二翻譯模塊,用于將邏輯模型中屬性中文名稱翻譯為物理模型中字段英文名 稱; 所述第一翻譯模塊包括:第一獲取單元和第一翻譯單元,其中,所述第一獲取單元用于 獲取邏輯模型中實(shí)體中文名稱;所述第一翻譯單元用于將獲取的實(shí)體中文名稱自動(dòng)翻譯為 實(shí)體英文名稱,將所述實(shí)體英文名稱視為物理模型中表英文名稱; 所述第二翻譯模塊包括:第二獲取單元和第二翻譯單元,其中,所述第二獲取單元用于 獲取邏輯模型中屬性中文名稱;所述第二翻譯單元用于將獲取的屬性中文名稱自動(dòng)翻譯為 屬性英文名稱,將所述屬性英文名稱視為物理模型中字段英文名稱。
9. 根據(jù)權(quán)利要求8所述的翻譯系統(tǒng),其特征在于, 所述第一翻譯單元包括:第一拆分子單元、第一翻譯子單元和第一拼接子單元,其中, 所述第一拆分子單元用于將獲取的實(shí)體中文名稱進(jìn)行拆分,得實(shí)體詞根;所述第一翻譯子 單元用于根據(jù)詞根表將所有實(shí)體詞根翻譯為對(duì)應(yīng)的實(shí)體英文簡(jiǎn)稱;所述第一拼接子單元用 于將所有實(shí)體英文簡(jiǎn)稱按預(yù)定順序通過預(yù)定方法進(jìn)行拼接,并自動(dòng)加上代表所述實(shí)體英文 名稱所在主題的英文前綴,得到實(shí)體中文名稱對(duì)應(yīng)的實(shí)體英文名稱; 所述第二翻譯單元包括:第二拆分子單元、第二翻譯子單元和第二拼接子單元,其中, 所述第二拆分子單元用于將獲取的屬性中文名稱進(jìn)行拆分,得屬性詞根;所述第二翻譯子 單元用于根據(jù)詞根表將所有屬性詞根翻譯為對(duì)應(yīng)的屬性英文簡(jiǎn)稱;所述第二拼接子單元用 于將所有屬性英文簡(jiǎn)稱按預(yù)定順序通過預(yù)定方法進(jìn)行拼接,得到屬性中文名稱對(duì)應(yīng)的屬性 英文名稱。
10.根據(jù)權(quán)利要求9所述的翻譯系統(tǒng),其特征在于, 所述第一翻譯單元還包括:第一判斷子單元,用于判斷所得的實(shí)體英文名稱的字節(jié)數(shù) 是否超過預(yù)定的字節(jié)數(shù),若超過,則去掉該實(shí)體英文名稱最后端超出的字節(jié); 第一視為子單元,用于判斷所得的實(shí)體英文名稱是否與物理模型中已存在的所有表英 文名稱均不同,如果是,得到物理模型中的表英文名稱,如果不是,將所得的實(shí)體英文名稱 的最后一位字母替換為一個(gè)預(yù)定的整數(shù)n,0 < n < 9 ;判斷該將最后一位字母替換為n的 實(shí)體英文名稱是否與物理模型中已存在的所有表英文名稱均不同,若不是,則將該將最后 一位字母替換為n的實(shí)體英文名稱的最后一位字母替換為n+1,直至物理模型中已存在的 所有表英文名稱均與該替換了最后一位字母的實(shí)體英文名稱不同,得到物理模型中的表英 文名稱; 所述第二翻譯單元還包括:第二判斷子單元,用于判斷所得的屬性英文名稱的字節(jié)數(shù) 是否超過預(yù)定的字節(jié)數(shù),若超過,則去掉該屬性英文名稱最后端超出的字節(jié); 第二視為子單元,用于判斷所得的屬性英文名稱是否與物理模型中已存在的所有字段 英文名稱均不同,若不是,將所得的屬性英文名稱的最后一位字母替換為一個(gè)預(yù)定的整數(shù) n,0 < n < 9 ;判斷物理模型中已存在的所有字段英文名稱是否均與該將最后一位字母替換 為n的屬性英文名稱不同,若不是,則將該將最后一位字母替換為n的屬性英文名稱的最后 一位字母替換為n+1,直至物理模型中已存在的所有字段英文名稱均與該替換了最后一位 字母的屬性英文名稱不同,得到物理模型中的字段英文名稱。
【文檔編號(hào)】G06F17/28GK104331401SQ201410685502
【公開日】2015年2月4日 申請(qǐng)日期:2014年11月25日 優(yōu)先權(quán)日:2014年11月25日
【發(fā)明者】周靈艷, 高尚, 劉安, 王寧, 李莉, 崔大凱, 葉馥郁, 付慧敏 申請(qǐng)人:中國(guó)農(nóng)業(yè)銀行股份有限公司