亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種名稱相似度獲取方法及裝置制造方法

文檔序號(hào):6512682閱讀:190來源:國(guó)知局
一種名稱相似度獲取方法及裝置制造方法
【專利摘要】本申請(qǐng)公開了一種名稱相似度獲取方法及裝置,所述方法包括:確定第一對(duì)象和第二對(duì)象;獲取字包含相似度值,字包含相似度值為第一對(duì)象中包含有與第二對(duì)象中相同字符的字符數(shù)量在第一對(duì)象中所占的比重值;獲取字順序相似度值,字順序相似度值為第一對(duì)象中包含有第二對(duì)象中相同字符的字順序相似度值;獲取字距離相似度值,字距離相似度值為第一對(duì)象中包含有第二對(duì)象中相同的字符將第一對(duì)象中名稱字符分割后的字符片段均勻度值;依據(jù)字包含相似度值、字順序相似度值及字距離相似度值,獲取第一對(duì)象與第二對(duì)象的三維相似度值。本申請(qǐng)?jiān)讷@取兩個(gè)名稱對(duì)象的相似度值的過程中,無需語料庫、統(tǒng)計(jì)規(guī)劃或分詞庫等做基礎(chǔ)計(jì)算,計(jì)算量較小,效率較高。
【專利說明】一種名稱相似度獲取方法及裝置

【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及相似度識(shí)別【技術(shù)領(lǐng)域】,特別涉及一種名稱相似度獲取方法及裝置。

【背景技術(shù)】
[0002] 中文機(jī)構(gòu)名稱在簡(jiǎn)寫、縮寫或改寫之后的名稱相似度識(shí)別方案應(yīng)用在反洗錢系統(tǒng) 名稱過濾、高校就業(yè)系統(tǒng)照片單位管理、wiki百科各種切換詞條等應(yīng)用中。
[0003] 目標(biāo),進(jìn)行名稱相似度識(shí)別的方案通常以基于特征規(guī)則的縮寫識(shí)別方案為主,但 這種方案需要分詞作為基礎(chǔ)計(jì)算,使得在相似度計(jì)算的過程中需要分詞庫支持,計(jì)算量較 大,效率較低。


【發(fā)明內(nèi)容】

[0004] 本申請(qǐng)所要解決的技術(shù)問題是提供一種名稱相似度獲取方法及裝置,用以解決現(xiàn) 有技術(shù)中基于特征規(guī)則的縮寫識(shí)別方案中需要分詞庫做基礎(chǔ)計(jì)算,使得計(jì)算量較大,效率 較低的技術(shù)問題。
[0005] 本申請(qǐng)?zhí)峁┝艘环N名稱相似度獲取方法,包括:
[0006] 確定第一對(duì)象和第二對(duì)象,所述第一對(duì)象包括至少一個(gè)名稱字符,所述第二對(duì)象 包括至少一個(gè)名稱字符,所述第一對(duì)象的字符數(shù)量大于或等于所述第二對(duì)象的字符數(shù)量;
[0007] 獲取字包含相似度值,所述字包含相似度值為所述第一對(duì)象中包含有與所述第二 對(duì)象中相同字符的字符數(shù)量在所述第一對(duì)象中所占的比重值;
[0008] 獲取字順序相似度值,所述字順序相似度值為所述第一對(duì)象中包含有所述第二對(duì) 象中相同字符的字順序相似度值;
[0009] 獲取字距離相似度值,所述字距離相似度值為所述第一對(duì)象中包含有所述第二對(duì) 象中相同的字符將所述第一對(duì)象中名稱字符分割后的字符片段均勻度值;
[0010] 依據(jù)所述字包含相似度值、所述字順序相似度值及所述字距離相似度值,獲取所 述第一對(duì)象與所述第二對(duì)象的三維相似度值。
[0011] 上述方法,優(yōu)選的,所述獲取字包含相似度包括:
[0012] 利/

【權(quán)利要求】
1. 一種名稱相似度獲取方法,其特征在于,包括: 確定第一對(duì)象和第二對(duì)象,所述第一對(duì)象包括至少一個(gè)名稱字符,所述第二對(duì)象包括 至少一個(gè)名稱字符,所述第一對(duì)象的字符數(shù)量大于或等于所述第二對(duì)象的字符數(shù)量; 獲取字包含相似度值,所述字包含相似度值為所述第一對(duì)象中包含有與所述第二對(duì)象 中相同字符的字符數(shù)量在所述第一對(duì)象中所占的比重值; 獲取字順序相似度值,所述字順序相似度值為所述第一對(duì)象中包含有所述第二對(duì)象中 相同字符的字順序相似度值; 獲取字距離相似度值,所述字距離相似度值為所述第一對(duì)象中包含有所述第二對(duì)象中 相同的字符將所述第一對(duì)象中名稱字符分割后的字符片段均勻度值; 依據(jù)所述字包含相似度值、所述字順序相似度值及所述字距離相似度值,獲取所述第 一對(duì)象與所述第二對(duì)象的三維相似度值。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取字包含相似度,包括: 利用C(民= 獲取所述第一對(duì)象中包含有所述第二對(duì)象中相同字符的字符 數(shù)量在所述第一對(duì)象中所占的比重值作為字包含相似度值; 其中,η(ΒΠΑ)為所述第一對(duì)象A中包含有所述第二對(duì)象B中相同字符的字符數(shù)量,η(Α)為所述第一對(duì)象A的字符數(shù)量,C(B,A)為所述比重值。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取字順序相似度值,包括: prcj(OrdcjHB/?)) 利用獲取所述第一對(duì)象中包含有所述第二對(duì)象中相同字符 的字順序相似度值; 其中,Order(Β,Α)為所述第一對(duì)象A中包含有第二對(duì)象B中相同的字符在所述第一對(duì) 象A中的序號(hào)排列組合,pre(Order(Β,A))為所述序號(hào)排列組合中的正序數(shù),η(ΒΠΑ)為所 述第一對(duì)象A中包含有所述第二對(duì)象B中相同字符的字符數(shù)量,0(Β,Α)為所述第一對(duì)象與 所述第二對(duì)象的字順序相似度值。
4. 根據(jù)權(quán)利要求1、2或3所述的方法,其特征在于,所述獲取字距離相似度值,包括: 利用
獲取所述第一對(duì)象中包含有所述 第二對(duì)象中相同的字符將所述第一對(duì)象中名稱字符分割后的字符片段累積距離值; 其中,N為第一對(duì)象A中名稱字符的數(shù)量,Pi為所述第一對(duì)象A中包含有所述第二對(duì)象B中相同的字符在所述第一對(duì)象A中對(duì)應(yīng)的位置排序序號(hào),U(B,A)為所述第一對(duì)象A中包 含有所述第二對(duì)象B中相同的字符將所述第一對(duì)象A中名稱字符分割后的字符片段累積距 離值; 利用= ^),獲取所述第一對(duì)象與所述第二對(duì)象的字順序相 η/2+1 似度值; 其中,η為所述第一對(duì)象A中包含有所述第二對(duì)象B中相同字符的字符數(shù)量,L(Β,Α)為 所述第一對(duì)象與所述第二對(duì)象的字順序相似度值。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述字包含相似度值、所述字順 序相似度值及所述字距離相似度值,獲取所述第一對(duì)象與所述第二對(duì)象的三維相似度值, 包括: 利用… ,分別獲取所述字包含相似度值、所述 字順序相似度值及所述字距離相似度值各自對(duì)應(yīng)的權(quán)重系數(shù); 其中,ai為所述第一對(duì)象A與所述第二對(duì)象B的字包含相似度值C對(duì)應(yīng)的權(quán)重系數(shù);α2為所述第一對(duì)象A與所述第二對(duì)象B的字順序相似度值O對(duì)應(yīng)的權(quán)重系數(shù);α3為所述 第一對(duì)象A與所述第二對(duì)象B的字距離相似度值L對(duì)應(yīng)的權(quán)重系數(shù); 利用S=aα2〇+a3L,獲取所述第一對(duì)象與所述第二對(duì)象的三維相似度值; 其中,S為所述第一對(duì)象A與所述第二對(duì)象B的三維相似度值。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述獲取到所述第一對(duì)象與所述第二 對(duì)象的三維相似度值之后,所述方法還包括: 判斷所述三維相似度值是否大于或等于預(yù)設(shè)第一閥值,如果是,生成第一提示信息,所 述第一提示信息用于提示對(duì)所述第一對(duì)象進(jìn)行操作的信息。
7.根據(jù)權(quán)利要求1或6所述的方法,其特征在于,在所述獲取到所述第一對(duì)象與所述第 二對(duì)象的三維相似度值之后,所述方法還包括: 獲取第一對(duì)象分別與至少一個(gè)第三對(duì)象的三維相似度值; 將所述第一對(duì)象與每個(gè)所述第三對(duì)象的三維相似度值與所述第一對(duì)象和所述第二對(duì) 象的三維相似度值組成相似度值集合; 對(duì)所述相似度值集合中的三維相似度值進(jìn)行大小排序; 依據(jù)排序后的三維相似度值,生成第二提示信息,所述第二提示信息用于提示依據(jù)所 述排序后三維相似度值各自對(duì)應(yīng)的第三對(duì)象或第二對(duì)象對(duì)第一對(duì)象進(jìn)行操作的信息。
8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述確定第一對(duì)象和第二對(duì)象之后,在 所述獲取字包含相似度值之前,所述方法還包括: 獲取所述第二對(duì)象中字符數(shù)量與所述第一對(duì)象中包含有所述第二對(duì)象中相同字符的 字符數(shù)量的差值; 判斷所述差值是否等于1,如果是,生成第三提示信息,并結(jié)束當(dāng)前名稱相似度獲取,所 述第三提示信息用于提示所述第二對(duì)象中只有一個(gè)名稱字符不包含在所述第一對(duì)象中的 信息。
9. 一種名稱相似度獲取裝置,其特征在于,包括: 對(duì)象確定單元,用于確定第一對(duì)象和第二對(duì)象,所述第一對(duì)象包括至少一個(gè)名稱字符, 所述第二對(duì)象包括至少一個(gè)名稱字符,所述第一對(duì)象的字符數(shù)量大于或等于所述第二對(duì)象 的字符數(shù)量; 第一值獲取單元,用于獲取字包含相似度值,所述字包含相似度值為所述第一對(duì)象中 包含有與所述第二對(duì)象中相同字符的字符數(shù)量在所述第一對(duì)象中所占的比重值; 第二值獲取單元,用于獲取字順序相似度值,所述字順序相似度值為所述第一對(duì)象中 包含有所述第二對(duì)象中相同字符的字順序相似度值; 第三值獲取單元,用于獲取字距離相似度值,所述字距離相似度值為所述第一對(duì)象中 包含有所述第二對(duì)象中相同的字符將所述第一對(duì)象中名稱字符分割后的字符片段均勻度 值; 相似度值獲取單元,用于依據(jù)所述字包含相似度值、所述字順序相似度值及所述字距 離相似度值,獲取所述第一對(duì)象與所述第二對(duì)象的三維相似度值。
10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述第一值獲取單元包括: 第一值獲取子單元,用于利用C(艮/0 = ^^,獲取所述第一對(duì)象中包含有所述第 η{Α) 二對(duì)象中相同字符的字符數(shù)量在所述第一對(duì)象中所占的比重值作為字包含相似度值; 其中,η(ΒΠΑ)為所述第一對(duì)象A中包含有所述第二對(duì)象B中相同字符的字符數(shù)量,η(Α)為所述第一對(duì)象A的字符數(shù)量,C(B,A)為所述比重值。
11. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述第二值獲取單元包括: 第二值獲取子單元,用于利用Q獲取所述第一對(duì)象中包含有所 述第二對(duì)象中相同字符的字順序相似度值; 其中,Order(B,A)為所述第一對(duì)象A中包含有第二對(duì)象B中相同的字符在所述第一對(duì) 象A中的序號(hào)排列組合,pre(Order(B,A))為所述序號(hào)排列組合中的正序數(shù),η(BΠA)為所 述第一對(duì)象A中包含有所述第二對(duì)象B中相同字符的字符數(shù)量,0 (Β,Α)為所述第一對(duì)象與 所述第二對(duì)象的字順序相似度值。
12. 根據(jù)權(quán)利要求9、10或11所述的裝置,其特征在于,所述第三值獲取單元包括: 距離值獲取子單元,用于利用
獲取所 述第一對(duì)象中包含有所述第二對(duì)象中相同的字符將所述第一對(duì)象中名稱字符分割后的字 符片段累積距離值; 其中,N為第一對(duì)象A中名稱字符的數(shù)量,Pi為所述第一對(duì)象A中包含有所述第二對(duì)象B中相同的字符在所述第一對(duì)象A中對(duì)應(yīng)的位置排序序號(hào),U(B,A)為所述第一對(duì)象A中包 含有所述第二對(duì)象B中相同的字符將所述第一對(duì)象A中名稱字符分割后的字符片段累積距 離值; 第三值獲取子單元,用于利用= --^7), 5夾取所述第一對(duì)象與 η/7+1 所述第二對(duì)象的字順序相似度值; 其中,η為所述第一對(duì)象A中包含有所述第二對(duì)象B中相同字符的字符數(shù)量,L(Β,Α)為 所述第一對(duì)象與所述第二對(duì)象的字順序相似度值。
13. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述相似度值獲取單元包括: 系數(shù)獲取子單元,用于利用ia]M1,ax)^(c^+l, c(〇〇 ^l^c+L〇+l),分別獲取所述 字包含相似度值、所述字順序相似度值及所述字距離相似度值各自對(duì)應(yīng)的權(quán)重系數(shù); 其中,ai為所述第一對(duì)象A與所述第二對(duì)象B的字包含相似度值C對(duì)應(yīng)的權(quán)重系數(shù); α2為所述第一對(duì)象A與所述第二對(duì)象B的字順序相似度值O對(duì)應(yīng)的權(quán)重系數(shù);α3為所述 第一對(duì)象A與所述第二對(duì)象B的字距離相似度值L對(duì)應(yīng)的權(quán)重系數(shù); 相似度值獲取子單元,用于利用S=aiC+α20+a3L,獲取所述第一對(duì)象與所述第二對(duì)象 的三維相似度值; 其中,S為所述第一對(duì)象A與所述第二對(duì)象B的三維相似度值。
14. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,還包括: 第一閥值判斷單元,用于在所述相似度值獲取單元獲取到所述三維相似度值之后,判 斷所述三維相似度值是否大于或等于預(yù)設(shè)第一閥值,如果是,觸發(fā)第一信息生成單元; 第一信息生成單兀,用于生成第一提不信息,所述第一提不信息用于提不對(duì)所述第一 對(duì)象進(jìn)行操作的信息。
15. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,還包括: 值獲取單元,用于在所述相似度值獲取單元獲取到所述三維相似度值之后,獲取第一 對(duì)象分別與至少一個(gè)第三對(duì)象的三維相似度值; 值組合單元,用于將所述第一對(duì)象與每個(gè)所述第三對(duì)象的三維相似度值與所述第一對(duì) 象和所述第二對(duì)象的三維相似度值組成相似度值集合; 值排序單元,用于對(duì)所述相似度值集合中的三維相似度值進(jìn)行大小排序; 第二信息生成單元,用于依據(jù)排序后的三維相似度值,生成第二提示信息,所述第二提 示信息用于提示依據(jù)所述排序后三維相似度值各自對(duì)應(yīng)的第三對(duì)象或第二對(duì)象對(duì)第一對(duì) 象進(jìn)行操作的信息。
16. 根據(jù)權(quán)利要求9所述的裝置,其特征在,還包括: 差值獲取單元,用于在對(duì)象確定單元確定所述第一對(duì)象和所述第二對(duì)象之后,在所述 第一值獲取單元獲取所述字包含相似度值之前,獲取所述第二對(duì)象中字符數(shù)量與所述第一 對(duì)象中包含有所述第二對(duì)象中相同字符的字符數(shù)量的差值; 差值判斷單元,用于判斷所述差值是否等于1,如果是,觸發(fā)第三信息生成單元,并結(jié)束 當(dāng)前名稱相似度獲??; 第三信息生成單元,用于生成第三提示信息,所述第三提示信息用于提示所述第二對(duì) 象中只有一個(gè)名稱字符不包含在所述第一對(duì)象中的信息。
【文檔編號(hào)】G06F17/30GK104462055SQ201310436119
【公開日】2015年3月25日 申請(qǐng)日期:2013年9月23日 優(yōu)先權(quán)日:2013年9月23日
【發(fā)明者】李振星 申請(qǐng)人:北京捷軟世紀(jì)信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1