本發(fā)明涉及通訊領(lǐng)域,特別是涉及一種匹配職能部門的方法、裝置及計(jì)算機(jī)設(shè)備。
背景技術(shù):
現(xiàn)有市民在向市政部門報(bào)案,以獲取想要知道的職能部門對(duì)應(yīng)的信息時(shí),需要人工接通市民的呼入電話,并人工分析報(bào)案內(nèi)容,分發(fā)到相應(yīng)區(qū)域相關(guān)職能部門。例如,當(dāng)用戶向市政部門反映垃圾隨處傾倒問題,則需要人工將該問題進(jìn)行分析,查找到對(duì)應(yīng)的智能部門。整個(gè)過程全程都需要人工參與,人工成本較高,且市政服務(wù)效率較低,不利于市政建設(shè)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種匹配職能部門的方法、裝置及計(jì)算機(jī)設(shè)備,用以解決現(xiàn)有技術(shù)的如下問題:現(xiàn)有市政服務(wù)系統(tǒng)工作時(shí),全程都需要人工參與,人工成本較高,且市政服務(wù)效率較低,不利于市政建設(shè)。
為解決上述技術(shù)問題,一方面,本發(fā)明提供一種匹配職能部門的方法,其特征在于,包括:獲取報(bào)案文本信息,得到所述報(bào)案文本信息對(duì)應(yīng)的地名信息;根據(jù)預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與所述地名信息相匹配的地名;
根據(jù)匹配到的地名和預(yù)先輸入的報(bào)案類別到預(yù)設(shè)映射數(shù)據(jù)庫(kù)中搜索對(duì)應(yīng)的職能部門。
可選的,所述根據(jù)預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與所述地名信息相匹配的地名,包括:分別計(jì)算所述地名信息與所述預(yù)設(shè)地名數(shù)據(jù)庫(kù)中各標(biāo)準(zhǔn)地名的語(yǔ)義相似度,將大于預(yù)設(shè)相似度閾值且最大的語(yǔ)義相似度對(duì)應(yīng)的標(biāo)準(zhǔn)地名作為與所述地名信息相匹配的地名。
可選的,所述根據(jù)匹配到的地名和預(yù)先輸入的報(bào)案類別到預(yù)設(shè)映射數(shù)據(jù)庫(kù)中搜索對(duì)應(yīng)的職能部門之前,還包括:對(duì)預(yù)設(shè)的報(bào)案類別訓(xùn)練樣本集采用分類算法訓(xùn)練,得到報(bào)案類別分類器,其中,所述訓(xùn)練樣本集包括多個(gè)報(bào)案類別的樣本;獲取所述報(bào)案文本信息中的報(bào)案類別相關(guān)文本信息;將所述報(bào)案類別相關(guān)文本信息輸入所述報(bào)案類別分類器,得到所述預(yù)先輸入的報(bào)案類別。
可選的,所述分類算法包括以下一種或幾種:樸素貝葉斯nb分類算法、支持向量機(jī)svm分類算法、k最鄰近knn分類算法和隨機(jī)森林分類算法。
可選的,所述報(bào)案文本信息包括:報(bào)案時(shí)呼入電話的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換后對(duì)應(yīng)的文本信息,或者,報(bào)案時(shí)發(fā)送的文本信息。
可選的,獲取報(bào)案文本信息,得到所述報(bào)案文本信息對(duì)應(yīng)的地名信息,包括:按照預(yù)定分詞方法對(duì)所述報(bào)案文本信息進(jìn)行分詞處理,得到分詞結(jié)果;對(duì)所述分詞結(jié)果進(jìn)行地名詞性標(biāo)注,得到地名詞集;
對(duì)所述地名詞集進(jìn)行命名實(shí)體識(shí)別,得到地名實(shí)體;將所述地名實(shí)體對(duì)應(yīng)的地名詞作為該地名實(shí)體的所述地名信息。
可選的,所述預(yù)定分詞方法至少包括以下之一:字典雙向最大匹配法,hmm方法和crf方法。
可選的,根據(jù)預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與所述地名信息相匹配的地名,包括:s11,獲取所述地名信息中最低等級(jí)的地名詞;s12,所述預(yù)設(shè)地名數(shù)據(jù)庫(kù)中包括標(biāo)準(zhǔn)地名,根據(jù)所述地名詞按預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與獲取到的所述地名信息相匹配的所述標(biāo)準(zhǔn)地名,其中,所述標(biāo)準(zhǔn)地名為以最低等級(jí)的標(biāo)準(zhǔn)地名詞命名的地名。
可選的,在s12之后還包括:s13,在未搜索到相匹配的地名的情況下,獲取所述地名詞的上一個(gè)等級(jí)的地名詞,并根據(jù)獲取到的所述地名詞執(zhí)行s12過程,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
可選的,s12的根據(jù)所述地名詞按預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與獲取到的所述地名信息相匹配的標(biāo)準(zhǔn)地名,包括:分別計(jì)算所述地名詞與所述預(yù)設(shè)地名數(shù)據(jù)庫(kù)中各標(biāo)準(zhǔn)地名的語(yǔ)義相似度,將大于預(yù)設(shè)相似度閾值且最大的語(yǔ)義相似度對(duì)應(yīng)的標(biāo)準(zhǔn)地名作為與所述地名信息相匹配的地名。
可選的,s11包括:按照所述報(bào)案文本信息輸入順序?qū)⑺龅孛畔⒌牡孛~進(jìn)行排列,得到所述地名詞列表;若所述地名詞為英文,則獲取所述地名詞列表中第一個(gè)地名詞作為最低等級(jí)的地名詞;若所述地名詞為中文,則獲取所述地名詞列表中最后一個(gè)地名詞作為最低等級(jí)的地名詞;
所述獲取所述地名詞的上一個(gè)等級(jí)的地名詞,包括:若所述地名詞為英文,則獲取所述地名詞列表中當(dāng)前地名詞的下一個(gè)地名詞;若所述地名詞為中文,則獲取所述地名詞列表中當(dāng)前地名詞的上一個(gè)地名詞。
可選的,根據(jù)匹配到的地名和預(yù)先輸入的報(bào)案類別到預(yù)設(shè)映射數(shù)據(jù)庫(kù)中搜索對(duì)應(yīng)的職能部門之后,還包括以下一步或幾步:將所述職能部門的電話反饋至所述報(bào)案文本信息對(duì)應(yīng)的用戶終端;為所述報(bào)案文本信息對(duì)應(yīng)的用戶終端呼叫所述職能部門;將報(bào)案信息發(fā)送到所述職能部門的終端。
另一方面,本發(fā)明還提供一種匹配職能部門的裝置,包括:處理模塊,用于獲取報(bào)案文本信息,得到所述報(bào)案文本信息對(duì)應(yīng)的地名信息;
匹配模塊,用于根據(jù)預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與所述地名信息相匹配的地名;搜索模塊,用于根據(jù)匹配到的地名和預(yù)先輸入的報(bào)案類別到預(yù)設(shè)映射數(shù)據(jù)庫(kù)中搜索對(duì)應(yīng)的職能部門。
可選的,所述匹配模塊,具體用于:分別計(jì)算所述地名信息與所述預(yù)設(shè)地名數(shù)據(jù)庫(kù)中各標(biāo)準(zhǔn)地名的語(yǔ)義相似度,將大于預(yù)設(shè)相似度閾值且最大的語(yǔ)義相似度對(duì)應(yīng)的標(biāo)準(zhǔn)地名作為與所述地名信息相匹配的地名。
可選的,還包括:訓(xùn)練模塊,用于對(duì)預(yù)設(shè)的報(bào)案類別訓(xùn)練樣本集采用分類算法訓(xùn)練,得到報(bào)案類別分類器,其中,所述訓(xùn)練樣本集包括多個(gè)報(bào)案類別的樣本;獲取所述報(bào)案文本信息中的報(bào)案類別相關(guān)文本信息;將所述報(bào)案類別相關(guān)文本信息輸入所述報(bào)案類別分類器,得到所述預(yù)先輸入的報(bào)案類別。
可選的,所述分類算法包括以下一種或幾種:樸素貝葉斯nb分類算法、支持向量機(jī)svm分類算法、k最鄰近knn分類算法和隨機(jī)森林分類算法。
可選的,所述報(bào)案文本信息包括:報(bào)案時(shí)呼入電話的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換后對(duì)應(yīng)的文本信息,或者,報(bào)案時(shí)發(fā)送的文本信息。
可選的,所述處理模塊,包括:分詞單元,用于按照預(yù)定分詞方法對(duì)所述報(bào)案文本信息進(jìn)行分詞處理,得到分詞結(jié)果;詞性標(biāo)注單元,用于對(duì)所述分詞結(jié)果進(jìn)行地名詞性標(biāo)注,得到地名詞集;實(shí)體識(shí)別單元,用于對(duì)所述地名詞集進(jìn)行命名實(shí)體識(shí)別,得到地名實(shí)體;將所述地名實(shí)體對(duì)應(yīng)的地名詞作為該地名實(shí)體的所述地名信息。
可選的,所述預(yù)定分詞方法至少包括以下之一:字典雙向最大匹配法,hmm方法和crf方法。
可選的,所述匹配模塊,包括:最低等級(jí)地名獲取單元,用于獲取所述地名信息中最低等級(jí)的地名詞;標(biāo)準(zhǔn)地名獲取單元,用于所述預(yù)設(shè)地名數(shù)據(jù)庫(kù)中包括標(biāo)準(zhǔn)地名,根據(jù)所述地名詞按預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與獲取到的所述地名信息相匹配的所述標(biāo)準(zhǔn)地名,其中,所述標(biāo)準(zhǔn)地名為以最低等級(jí)的標(biāo)準(zhǔn)地名詞命名的地名。
可選的,所述匹配模塊,具體還包括上一等級(jí)地名獲取單元,用于在標(biāo)準(zhǔn)地名獲取單元獲取到的所述地名信息相匹配的所述標(biāo)準(zhǔn)地名之后執(zhí)行:在未搜索到相匹配的地名的情況下,獲取所述地名詞的上一個(gè)等級(jí)的地名詞,并將獲取到的所述地名詞輸入標(biāo)準(zhǔn)地名獲取單元,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
可選的,執(zhí)行標(biāo)準(zhǔn)地名獲取單元時(shí),根據(jù)所述地名詞按預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與獲取到的所述地名信息相匹配的標(biāo)準(zhǔn)地名,包括:分別計(jì)算所述地名詞與所述預(yù)設(shè)地名數(shù)據(jù)庫(kù)中各標(biāo)準(zhǔn)地名的語(yǔ)義相似度,將大于預(yù)設(shè)相似度閾值且最大的語(yǔ)義相似度對(duì)應(yīng)的標(biāo)準(zhǔn)地名作為與所述地名信息相匹配的地名。
可選的,最低等級(jí)地名獲取單元,包括:順序排列子單元,用于按照所述報(bào)案文本信息輸入順序?qū)⑺龅孛畔⒌牡孛~進(jìn)行排列,得到所述地名詞列表;首地名詞識(shí)別子單元,用于若所述地名詞為英文,則獲取所述地名詞列表中第一個(gè)地名詞作為最低等級(jí)的地名詞;若所述地名詞為中文,則獲取所述地名詞列表中最后一個(gè)地名詞作為最低等級(jí)的地名詞;
所述上一等級(jí)地名獲取單元,包括:語(yǔ)言等級(jí)地名詞識(shí)別子單元,用于若所述地名詞為英文,則獲取所述地名詞列表中當(dāng)前地名詞的下一個(gè)地名詞;若所述地名詞為中文,則獲取所述地名詞列表中當(dāng)前地名詞的上一個(gè)地名詞;循環(huán)匹配子單元,用于將獲取到的所述地名詞輸入標(biāo)準(zhǔn)地名獲取單元,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
可選的,還包括:執(zhí)行模塊,用于將所述職能部門的電話反饋至所述報(bào)案文本信息對(duì)應(yīng)的用戶終端,為所述用戶終端呼叫所述職能部門,和/或,將報(bào)案信息發(fā)送到所述職能部門的終端。
另一方面,本發(fā)明還提供一種計(jì)算機(jī)存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的一種匹配職能部門的方法的步驟。
另一方面,本發(fā)明還提供一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可以在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的一種匹配職能部門的方法的步驟。
本發(fā)明有益效果如下:
本發(fā)明獲取市政服務(wù)系統(tǒng)的報(bào)案文本信息,以得到報(bào)案文本信息對(duì)應(yīng)的地名信息,根據(jù)預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與地名信息相匹配的地名,并結(jié)合預(yù)先輸入的報(bào)案類別來搜索報(bào)案文本信息對(duì)應(yīng)的職能部門,整個(gè)過程自動(dòng)確定地名信息,自動(dòng)匹配地名,自動(dòng)搜索職能部門,無需人工參與,節(jié)省了大量的人工成本,特別是對(duì)于市政服務(wù),市民可以較為快速的獲取到報(bào)案內(nèi)容的回饋,提高了市政服務(wù)效率,有利于市政建設(shè),解決了現(xiàn)有技術(shù)的如下問題:現(xiàn)有服務(wù)系統(tǒng)工作時(shí),全程都需要人工參與,人工成本較高,特別是對(duì)于市政服務(wù),市政服務(wù)效率較低,不利于市政建設(shè)
附圖說明
圖1是本發(fā)明第一實(shí)施例中匹配職能部門的方法的流程圖;
圖2是本發(fā)明第二實(shí)施例中匹配職能部門的裝置的結(jié)構(gòu)示意圖;
圖3是本發(fā)明第三實(shí)施例中計(jì)算機(jī)設(shè)備匹配職能部門的流程圖。
具體實(shí)施方式
為了解決現(xiàn)有技術(shù)的如下問題:現(xiàn)有市政服務(wù)系統(tǒng)工作時(shí),全程都需要人工參與,人工成本較高,且市政服務(wù)效率較低,不利于市政建設(shè);本發(fā)明提供了一種匹配職能部門的方法、裝置及計(jì)算機(jī)設(shè)備,以下結(jié)合附圖以及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不限定本發(fā)明。
本發(fā)明第一實(shí)施例提供了一種匹配職能部門的方法,該方法的流程如圖1所示,包括步驟s102至s106:
s102,獲取報(bào)案文本信息,得到報(bào)案文本信息對(duì)應(yīng)的地名信息;
s104,根據(jù)預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與地名信息相匹配的地名;
s106,根據(jù)匹配到的地名和預(yù)先輸入的報(bào)案類別到預(yù)設(shè)映射數(shù)據(jù)庫(kù)中搜索對(duì)應(yīng)的職能部門。
本發(fā)明實(shí)施例獲取的報(bào)案文本信息可以為市政服務(wù)系統(tǒng)的報(bào)案文本信息,以得到報(bào)案文本信息對(duì)應(yīng)的地名信息,根據(jù)預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與地名信息相匹配的地名,并結(jié)合預(yù)先輸入的報(bào)案類別來搜索報(bào)案文本信息對(duì)應(yīng)的職能部門,整個(gè)過程自動(dòng)確定地名信息,自動(dòng)匹配地名,自動(dòng)搜索職能部門,無需人工參與,節(jié)省了大量的人工成本,市民可以較為快速的獲取到報(bào)案內(nèi)容的回饋,提高了服務(wù)效率,有利于市政建設(shè),解決了現(xiàn)有技術(shù)的如下問題:現(xiàn)有服務(wù)系統(tǒng)工作時(shí),全程都需要人工參與,人工成本較高,特別是對(duì)于市政服務(wù),市政服務(wù)效率較低,不利于市政建設(shè)。
實(shí)現(xiàn)的過程中,在根據(jù)預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與地名信息相匹配的地名時(shí),可以分別計(jì)算地名信息與預(yù)設(shè)地名數(shù)據(jù)庫(kù)中各標(biāo)準(zhǔn)地名的語(yǔ)義相似度,將大于預(yù)設(shè)相似度閾值且最大的語(yǔ)義相似度對(duì)應(yīng)的標(biāo)準(zhǔn)地名作為與地名信息相匹配的地名。其中,標(biāo)準(zhǔn)地名為以最低等級(jí)的標(biāo)準(zhǔn)地名詞命名的地名或?yàn)橥暾孛?,?dāng)標(biāo)準(zhǔn)地名為完整地名時(shí),可以用完整地名信息與標(biāo)準(zhǔn)地名做相似度計(jì)算。
在根據(jù)匹配到的地名和預(yù)先輸入的報(bào)案類別到預(yù)設(shè)映射數(shù)據(jù)庫(kù)中搜索對(duì)應(yīng)的職能部門之前,還可以對(duì)預(yù)設(shè)的報(bào)案類別訓(xùn)練樣本集采用分類算法訓(xùn)練,得到報(bào)案類別分類器,其中,訓(xùn)練樣本集包括多個(gè)報(bào)案類別的樣本;獲取報(bào)案文本信息中的報(bào)案類別相關(guān)文本信息;將報(bào)案類別相關(guān)文本信息輸入報(bào)案類別分類器,得到預(yù)先輸入的報(bào)案類別。其中,分類算法包括以下一種或幾種:樸素貝葉斯nb分類算法、支持向量機(jī)svm分類算法、k最鄰近knn分類算法和隨機(jī)森林分類算法。
通過上述過程,就可以快速的獲取到輸入的報(bào)案類別,以便進(jìn)行職能部門的匹配。
由于使用服務(wù)系統(tǒng)報(bào)案的用戶不同,因此,報(bào)案方式也不同;有的可能通過電話呼叫報(bào)案,例如,在發(fā)生打架斗毆事件需要報(bào)警時(shí),則可能市民用戶會(huì)選擇通過電話主叫呼入市政服務(wù)系統(tǒng);有的可能通過發(fā)送信息進(jìn)行報(bào)案,例如,當(dāng)市民用戶想要反應(yīng)某一區(qū)域垃圾處理問題,想知道該問題歸哪里負(fù)責(zé)時(shí),則由于該問題不是迫切需要解決,因此,可能會(huì)通過向服務(wù)系統(tǒng)發(fā)送短信等方式報(bào)案。因此,本發(fā)明實(shí)施例在獲取報(bào)案文本信息時(shí),報(bào)案文本信息可以包括報(bào)案時(shí)呼入電話的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換后對(duì)應(yīng)的文本信息,或者是報(bào)案時(shí)發(fā)送的文本信息。這樣,無論用戶通過哪種方式進(jìn)行報(bào)案,都可以獲取到對(duì)應(yīng)的報(bào)案文本信息,系統(tǒng)處理性能增強(qiáng)。
本實(shí)施例通過獲取報(bào)案文本信息,進(jìn)而可以得到報(bào)案文本信息對(duì)應(yīng)的地名信息,具體處理時(shí),包括如下過程:
按照預(yù)定分詞方法對(duì)報(bào)案文本信息進(jìn)行分詞處理,得到分詞結(jié)果,再對(duì)分詞結(jié)果進(jìn)行地名詞性標(biāo)注,得到地名詞集,例如,詞性為ns的就是地名;上述過程中,分詞是和詞性標(biāo)注一起進(jìn)行的,詞性標(biāo)注是把分詞詞典中標(biāo)示的每個(gè)詞的詞性標(biāo)到分詞結(jié)果里。上述預(yù)定分詞方法可以是多種,例如,字典雙向最大匹配法、hmm方法或crf方法等。
隨后,對(duì)地名詞集進(jìn)行命名實(shí)體識(shí)別,得到地名實(shí)體,再將地名實(shí)體對(duì)應(yīng)的地名詞作為該地名實(shí)體的地名信息。實(shí)現(xiàn)時(shí),地名信息里可能包括一個(gè)或多個(gè)復(fù)合地名詞,當(dāng)包括多個(gè)復(fù)合地名詞時(shí),例如,上海市嘉定區(qū)金沙江西路,包括三個(gè)地名詞,但所指為一個(gè)地名,因此需要通過實(shí)體識(shí)別得到,實(shí)體識(shí)別得到的地名實(shí)體為包括一個(gè)地名詞或多個(gè)地名詞復(fù)合的地名信息。
通過上述過程,就可以從獲取到的報(bào)案文本信息中得到市民用戶報(bào)案涉及到的地名信息,為自動(dòng)化報(bào)案提供了堅(jiān)實(shí)基礎(chǔ)。
在根據(jù)預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與地名信息相匹配的地名時(shí),由于地名信息通常情況下可能包括多個(gè)地名詞,通常是采用地名信息與地名數(shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)地名來匹配,此處的標(biāo)準(zhǔn)地名為以最低等級(jí)的標(biāo)準(zhǔn)地名詞命名的地名。所以,在實(shí)現(xiàn)時(shí),需要根據(jù)報(bào)案文本信息的語(yǔ)言情況來確定先識(shí)別哪個(gè)地名詞,具體實(shí)現(xiàn)過程如下:
s11,獲取地名信息中最低等級(jí)的地名詞。
s12,預(yù)設(shè)地名數(shù)據(jù)庫(kù)中包括標(biāo)準(zhǔn)地名,根據(jù)地名詞按預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與獲取到的地名信息相匹配的標(biāo)準(zhǔn)地名,其中,標(biāo)準(zhǔn)地名為以最低等級(jí)的標(biāo)準(zhǔn)地名詞命名的地名。
s13,在未搜索到相匹配的地名的情況下,獲取地名詞的上一個(gè)等級(jí)的地名詞,并根據(jù)獲取到的地名詞執(zhí)行s12過程,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
具體的,s12的分別計(jì)算地名詞與預(yù)設(shè)地名數(shù)據(jù)庫(kù)中各標(biāo)準(zhǔn)地名的語(yǔ)義相似度,將大于預(yù)設(shè)相似度閾值且最大的語(yǔ)義相似度對(duì)應(yīng)的標(biāo)準(zhǔn)地名作為與地名信息相匹配的地名。
s11具體包括:按照?qǐng)?bào)案文本信息輸入順序?qū)⒌孛畔⒌牡孛~進(jìn)行排列,得到地名詞列表;若地名詞為英文,則獲取地名詞列表中第一個(gè)地名詞作為最低等級(jí)的地名詞;若地名詞為中文,則獲取地名詞列表中最后一個(gè)地名詞作為最低等級(jí)的地名詞;s13中,獲取地名詞的上一個(gè)等級(jí)的地名詞,包括:若地名詞為英文,則獲取地名詞列表中當(dāng)前地名詞的下一個(gè)地名詞;若地名詞為中文,則獲取地名詞列表中當(dāng)前地名詞的上一個(gè)地名詞。
例如,當(dāng)?shù)孛畔楸本┦泻5韰^(qū)中關(guān)村第三小學(xué)時(shí),則該地名信息對(duì)應(yīng)的多個(gè)地名詞依次為“北京市,海淀區(qū),中關(guān)村第三小學(xué)”,則在進(jìn)行匹配時(shí),從“中關(guān)村第三小學(xué)”這個(gè)地名詞開始進(jìn)行地名匹配,如果“中關(guān)村第三小學(xué)”這個(gè)地名詞沒有匹配到地名,則再使用“海淀區(qū)”進(jìn)行匹配。
當(dāng)?shù)孛畔椤癰aihuasilu,futiandistrict,shenzhencity,guangdongprovince”時(shí),則該地名信息對(duì)應(yīng)的多個(gè)地名詞依次為“baihuasilu,futiandistrict,shenzhencity,guangdongprovince”,則在進(jìn)行匹配時(shí),從“baihuasilu”這個(gè)地名詞開始進(jìn)行地名匹配,如果“baihuasilu”這個(gè)地名詞沒有匹配到地名,則再使用“futiandistrict”進(jìn)行匹配,如果“futiandistrict”沒有匹配到,則再使用“shenzhencity”進(jìn)行匹配。
由于中文和英文對(duì)地名信息表述方式不同,即中文習(xí)慣按照省市縣等由大到小順序播報(bào)或記錄地名信息,英文習(xí)慣按照縣市省等由小到大順序播報(bào)或記錄地名信息,所以,本實(shí)施例針對(duì)不同報(bào)案語(yǔ)言需要執(zhí)行不同的匹配方式,以便能夠靈活的適用報(bào)案語(yǔ)言的類型,增強(qiáng)報(bào)案系統(tǒng)的性能。
當(dāng)已經(jīng)匹配到對(duì)應(yīng)的地名后,就可以結(jié)合報(bào)案用戶預(yù)先輸入的報(bào)案類別到預(yù)設(shè)映射數(shù)據(jù)庫(kù)中搜索對(duì)應(yīng)的職能部門。對(duì)于該預(yù)設(shè)映射數(shù)據(jù)庫(kù),其存儲(chǔ)著本市各個(gè)地區(qū)內(nèi)各個(gè)職能部門的相關(guān)信息,比如,職能部門,坐落位置,職責(zé)等。
在根據(jù)匹配到的地名和預(yù)先輸入的報(bào)案類別到預(yù)設(shè)映射數(shù)據(jù)庫(kù)中搜索對(duì)應(yīng)的職能部門之后還包括以下一步或幾步:可以將職能部門的電話反饋至報(bào)案文本信息對(duì)應(yīng)的用戶終端;為用戶終端呼叫職能部門;將報(bào)案信息發(fā)送到所述職能部門的終端。如果市民用戶是通過呼入服務(wù)系統(tǒng)的方式報(bào)案,則可以直接在電話內(nèi)將對(duì)應(yīng)職能部門的電話進(jìn)行語(yǔ)音播報(bào),也可以直接為用戶轉(zhuǎn)接呼入電話帶對(duì)應(yīng)的職能部門;如果用戶是通過向服務(wù)系統(tǒng)發(fā)送信息的方式報(bào)案,則可以以信息的方式向報(bào)案用戶終端發(fā)送對(duì)應(yīng)職能部門的電話。
本發(fā)明第二實(shí)施例提供了一種匹配職能部門的裝置,該裝置的結(jié)構(gòu)示意如圖2所示,包括:
處理模塊10,用于獲取報(bào)案文本信息,得到報(bào)案文本信息對(duì)應(yīng)的地名信息;匹配模塊11,與處理模塊10耦合,用于根據(jù)預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與地名信息相匹配的地名;搜索模塊12,與匹配模塊11耦合,用于根據(jù)匹配到的地名和預(yù)先輸入的報(bào)案類別到預(yù)設(shè)映射數(shù)據(jù)庫(kù)中搜索對(duì)應(yīng)的職能部門。
本發(fā)明實(shí)施例上述整個(gè)過程自動(dòng)確定地名信息,自動(dòng)匹配地名,自動(dòng)搜索職能部門,無需人工參與,節(jié)省了大量的人工成本,市民可以較為快速的獲取到報(bào)案內(nèi)容的回饋,提高了服務(wù)效率,有利于市政建設(shè),解決了現(xiàn)有技術(shù)的如下問題:現(xiàn)有服務(wù)系統(tǒng)工作時(shí),全程都需要人工參與,人工成本較高,特別是對(duì)于市政服務(wù),市政服務(wù)效率較低,不利于市政建設(shè)。
由于使用服務(wù)系統(tǒng)報(bào)案的用戶不同,因此,報(bào)案方式也不同;有的可能通過電話呼叫報(bào)案,例如,在發(fā)生打架斗毆事件需要報(bào)警時(shí),則可能市民用戶會(huì)選擇通過電話主叫呼入市政服務(wù)系統(tǒng);有的可能通過發(fā)送信息進(jìn)行報(bào)案,例如,當(dāng)市民用戶想要反應(yīng)某一區(qū)域垃圾處理問題,想知道該問題歸哪里負(fù)責(zé)時(shí),則由于該問題不是迫切需要解決,因此,可能會(huì)通過向服務(wù)系統(tǒng)發(fā)送短信等方式報(bào)案。因此,上述報(bào)案文本信息可以是報(bào)案時(shí)呼入電話的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換后對(duì)應(yīng)的文本信息,或者是報(bào)案時(shí)發(fā)送的文本信息。這樣,無論用戶通過哪種方式進(jìn)行報(bào)案,都可以獲取到對(duì)應(yīng)的報(bào)案文本信息,系統(tǒng)處理性能增強(qiáng)。
上述匹配模塊11,具體用于:分別計(jì)算地名信息與預(yù)設(shè)地名數(shù)據(jù)庫(kù)中各標(biāo)準(zhǔn)地名的語(yǔ)義相似度,將大于預(yù)設(shè)相似度閾值且最大的語(yǔ)義相似度對(duì)應(yīng)的標(biāo)準(zhǔn)地名作為與地名信息相匹配的地名。其中,標(biāo)準(zhǔn)地名為以最低等級(jí)的標(biāo)準(zhǔn)地名詞命名的地名或?yàn)橥暾孛?,?dāng)標(biāo)準(zhǔn)地名為完整地名時(shí),可以用完整地名信息與標(biāo)準(zhǔn)地名做相似度計(jì)算。
上述裝置還可以包括與搜索模塊12耦合的訓(xùn)練模塊,用于對(duì)預(yù)設(shè)的報(bào)案類別訓(xùn)練樣本集采用分類算法訓(xùn)練,得到報(bào)案類別分類器,其中,訓(xùn)練樣本集包括多個(gè)報(bào)案類別的樣本;獲取報(bào)案文本信息中的報(bào)案類別相關(guān)文本信息;將報(bào)案類別相關(guān)文本信息輸入報(bào)案類別分類器,得到預(yù)先輸入的報(bào)案類別。其中,分類算法包括以下一種或幾種:樸素貝葉斯nb分類算法、支持向量機(jī)svm分類算法、k最鄰近knn分類算法和隨機(jī)森林分類算法。通過上述過程,就可以快速的獲取到輸入的報(bào)案類別,以便進(jìn)行職能部門的匹配。
處理模塊10具體包括分詞單元、詞性標(biāo)注單元和實(shí)體識(shí)別單元。
其中,分詞單元,用于用于按照預(yù)定分詞方法對(duì)報(bào)案文本信息進(jìn)行分詞處理,得到分詞結(jié)果。例如,詞性為ns的就是地名;上述過程中,分詞是和詞性標(biāo)注一起進(jìn)行的,詞性標(biāo)注是把分詞詞典中標(biāo)示的每個(gè)詞的詞性標(biāo)到分詞結(jié)果里。上述預(yù)定分詞方法可以是多種,例如,字典雙向最大匹配法、hmm方法或crf方法等。
詞性標(biāo)注單元,用于對(duì)分詞結(jié)果進(jìn)行地名詞性標(biāo)注,得到地名詞集;對(duì)地名詞集進(jìn)行命名實(shí)體識(shí)別,得到地名實(shí)體。
實(shí)體識(shí)別單元,用于將地名實(shí)體對(duì)應(yīng)的地名詞作為該地名實(shí)體的地名信息。
實(shí)現(xiàn)時(shí),地名信息里可能包括一個(gè)或多個(gè)復(fù)合地名詞,當(dāng)包括多個(gè)復(fù)合地名詞時(shí),例如,上海市嘉定區(qū)金沙江西路,包括三個(gè)地名詞,但所指為一個(gè)地名,因此需要通過實(shí)體識(shí)別得到,實(shí)體識(shí)別得到的地名實(shí)體為包括一個(gè)地名詞或多個(gè)地名詞復(fù)合的地名信息。
通過上述過程,就可以從獲取到的報(bào)案文本信息中得到市民用戶報(bào)案涉及到的地名信息,為自動(dòng)化報(bào)案提供了堅(jiān)實(shí)基礎(chǔ)。
為了簡(jiǎn)化識(shí)別地名詞過程的操作,匹配模塊11可以包括:
最低等級(jí)地名獲取單元,用于獲取地名信息中最低等級(jí)的地名詞;
標(biāo)準(zhǔn)地名獲取單元,用于預(yù)設(shè)地名數(shù)據(jù)庫(kù)中包括標(biāo)準(zhǔn)地名,根據(jù)地名詞按預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與獲取到的地名信息相匹配的標(biāo)準(zhǔn)地名,其中,標(biāo)準(zhǔn)地名為以最低等級(jí)的標(biāo)準(zhǔn)地名詞命名的地名。
上一等級(jí)地名獲取單元,用于在標(biāo)準(zhǔn)地名獲取單元獲取到的所述地名信息相匹配的所述標(biāo)準(zhǔn)地名之后執(zhí)行:在未搜索到相匹配的地名的情況下,獲取地名詞的上一個(gè)等級(jí)的地名詞,并將獲取到的地名詞輸入標(biāo)準(zhǔn)地名獲取單元,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
其中,執(zhí)行標(biāo)準(zhǔn)地名獲取單元時(shí),所述根據(jù)地名詞按預(yù)設(shè)語(yǔ)義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫(kù)中搜索與獲取到的地名信息相匹配的標(biāo)準(zhǔn)地名,包括:分別計(jì)算地名詞與預(yù)設(shè)地名數(shù)據(jù)庫(kù)中各標(biāo)準(zhǔn)地名的語(yǔ)義相似度,將大于預(yù)設(shè)相似度閾值且最大的語(yǔ)義相似度對(duì)應(yīng)的標(biāo)準(zhǔn)地名作為與地名信息相匹配的地名。
最低等級(jí)地名獲取單元,包括順序排列子單元和首地名詞識(shí)別子單元。
其中,順序排列子單元,用于按照?qǐng)?bào)案文本信息輸入順序?qū)⒌孛畔⒌牡孛~進(jìn)行排列,得到地名詞列表;首地名詞識(shí)別子單元,用于若地名詞為英文,則獲取地名詞列表中第一個(gè)地名詞作為最低等級(jí)的地名詞;若地名詞為中文,則獲取地名詞列表中最后一個(gè)地名詞作為最低等級(jí)的地名詞。
上一等級(jí)地名獲取單元包括語(yǔ)言等級(jí)地名詞識(shí)別子單元和循環(huán)匹配子單元。語(yǔ)言等級(jí)地名詞識(shí)別子單元,用于獲取地名詞的上一個(gè)等級(jí)的地名詞,包括:若地名詞為英文,則獲取地名詞列表中當(dāng)前地名詞的下一個(gè)地名詞;若地名詞為中文,則獲取地名詞列表中當(dāng)前地名詞的上一個(gè)地名詞。循環(huán)匹配子單元,用于將獲取到的所述地名詞輸入標(biāo)準(zhǔn)地名獲取單元,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
本實(shí)施例可以針對(duì)不同報(bào)案語(yǔ)言需要執(zhí)行不同的匹配方式,以便能夠靈活的適用報(bào)案語(yǔ)言的類型,增強(qiáng)報(bào)案系統(tǒng)的性能。
上述裝置還可以包括:執(zhí)行模塊,與搜索模塊耦合,用于將職能部門的電話反饋至報(bào)案文本信息對(duì)應(yīng)的用戶終端,為用戶終端呼叫職能部門,和/或,將報(bào)案信息發(fā)送到所述職能部門的終端。如果市民用戶是通過呼入服務(wù)系統(tǒng)的方式報(bào)案,則可以直接在電話內(nèi)將對(duì)應(yīng)職能部門的電話進(jìn)行語(yǔ)音播報(bào),也可以直接為用戶轉(zhuǎn)接呼入電話帶對(duì)應(yīng)的職能部門;如果用戶是通過向服務(wù)系統(tǒng)發(fā)送信息的方式報(bào)案,則可以以信息的方式向報(bào)案用戶終端發(fā)送對(duì)應(yīng)職能部門的電話。
本發(fā)明第三實(shí)施例還提供了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可以在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)第一實(shí)施例的一種匹配職能部門的方法。實(shí)現(xiàn)時(shí),上述計(jì)算機(jī)程序可以存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)介質(zhì)中。
例如,處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)圖3的如下過程:
s1,獲取報(bào)案文本信息。該過程中,還可以根據(jù)報(bào)案文本信息確定問題類別或投訴內(nèi)容等信息。
s2,對(duì)報(bào)案文本信息進(jìn)行分詞、詞性標(biāo)注、命名實(shí)體識(shí)別(ner,namedentityrecognition)、地名信息提取。
s3,判斷地名數(shù)據(jù)庫(kù)中是否存在與地名信息匹配度達(dá)到預(yù)設(shè)匹配度的地名。在存在的情況下,執(zhí)行s4,否則執(zhí)行s6。
s4,根據(jù)地名詞和報(bào)案文本信息中的報(bào)案類別到預(yù)設(shè)映射數(shù)據(jù)庫(kù)中搜索對(duì)應(yīng)的職能部門。
s5,將搜索到的職能部門反饋至市民用戶。
s6,按照順序查找地名信息中的下一個(gè)地名詞,返回s3。其中,該順序可能是地名信息順序方式或地名信息的倒序方式。
例如,當(dāng)市民用戶電話呼入報(bào)案“北京市海淀區(qū)中關(guān)村第三小學(xué)附近有交通事故”時(shí),則地名信息為北京市海淀區(qū)中關(guān)村第三小學(xué),則該地名信息對(duì)應(yīng)的多個(gè)地名詞依次為“北京市,海淀區(qū),中關(guān)村第三小學(xué)”,對(duì)應(yīng)的報(bào)案類別就是交通、突發(fā)事故類,則在查找智能部門時(shí),可以匹配到交警部門,則可以為市民用戶提供中關(guān)村第三小學(xué)附近交警部門的電話,以便及時(shí)處理問題。
本實(shí)施例人工本系統(tǒng)能夠?qū)崿F(xiàn)市政報(bào)案的自動(dòng)流轉(zhuǎn),提高市政服務(wù)效率,降低人工成本。
可選地,在本實(shí)施例中,上述存儲(chǔ)介質(zhì)可以包括但不限于:u盤、只讀存儲(chǔ)器(rom,read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、移動(dòng)硬盤、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)??蛇x地,在本實(shí)施例中,處理器根據(jù)存儲(chǔ)介質(zhì)中已存儲(chǔ)的程序代碼執(zhí)行上述實(shí)施例記載的方法步驟??蛇x地,本實(shí)施例中的具體示例可以參考上述實(shí)施例及可選實(shí)施方式中所描述的示例,本實(shí)施例在此不再贅述。顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計(jì)算裝置來實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來執(zhí)行,并且在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
盡管為示例目的,已經(jīng)公開了本發(fā)明的優(yōu)選實(shí)施例,本領(lǐng)域的技術(shù)人員將意識(shí)到各種改進(jìn)、增加和取代也是可能的,因此,本發(fā)明的范圍應(yīng)當(dāng)不限于上述實(shí)施例。