本發(fā)明涉及通信,具體涉及一種基于ocr識(shí)別聊天記錄消息的方法及系統(tǒng)。
背景技術(shù):
1、隨著通信技術(shù)的不斷發(fā)展以及智能終端設(shè)備的不斷迭代,人與人之間的溝通交流變得越來越便利,這體現(xiàn)為,人們通過文字書信方式溝通向通過聊天軟件溝通的全面轉(zhuǎn)變。使用聊天軟件,可以很方便地向他人發(fā)送文字、語音、圖片或進(jìn)行語音通話和視頻通話,聊天軟件溝通已經(jīng)是人們生活中不可或缺的一部分。但隨著聊天軟件功能的不斷開發(fā),其上的功能性創(chuàng)新和人性化優(yōu)化逐漸出現(xiàn)瓶頸,而目前其實(shí)還存在著許多待優(yōu)化和解決的問題。
2、例如,聊天軟件傳統(tǒng)的消息提示方式一般都是基于自身的消息通知功能,通過彈窗的方式顯示消息摘要,而這樣的提示方式存在著一些缺點(diǎn),比如用戶無法直接獲取消息的完整內(nèi)容,需要打開聊天軟件才可查看完整的消息詳情,操作流程多,閱讀不便。又比如,現(xiàn)有的彈窗提示方式也無法過濾掉消息中的垃圾信息、廣告信息等無效信息,無法依照用戶的需求靈活過濾信息。另外,現(xiàn)有的彈窗提示方式也無法自動(dòng)過濾掉消息中的重復(fù)消息,重復(fù)消息反復(fù)彈窗提示將十分影響用戶對設(shè)備的使用,導(dǎo)致使用體驗(yàn)不佳。
3、基于此,本發(fā)明意在提出一種方案以解決上述問題中的至少一個(gè)。
技術(shù)實(shí)現(xiàn)思路
1、為了克服上述現(xiàn)有技術(shù)的缺陷,本發(fā)明提供了一種基于ocr識(shí)別聊天記錄消息的方法及系統(tǒng),本發(fā)明的方法不依賴于聊天軟件自身的消息通知功能,能夠適用于不同的聊天軟件。本方法實(shí)現(xiàn)了對聊天消息的完整獲取和完整提示,便于用戶進(jìn)行閱讀。并且,本方法通過對消息進(jìn)行一系列的處理操作,還有效地提高了信息的質(zhì)量,且用戶可對某些處理操作進(jìn)行自定義設(shè)置,具有良好的靈活性和適應(yīng)性,提升了用戶體驗(yàn),具有顯著的技術(shù)優(yōu)勢和應(yīng)用價(jià)值。
2、具體技術(shù)方案如下所示:
3、本發(fā)明的第一方面,提供一種基于ocr識(shí)別聊天記錄消息的方法,所述方法包括:
4、實(shí)時(shí)或間隔地捕獲所述聊天軟件界面中新接收的消息內(nèi)容,通過ocr識(shí)別技術(shù)識(shí)別所述消息內(nèi)容,以得到所述消息內(nèi)容中完整的文本內(nèi)容;
5、對所述文本內(nèi)容進(jìn)行分析,劃分所述文本內(nèi)容中的詞匯并提取所述文本內(nèi)容中的關(guān)鍵信息,基于劃分的詞匯和關(guān)鍵信息確定所述文本內(nèi)容的類型;
6、對所述文本內(nèi)容進(jìn)行過濾,將屬于自定義過濾類型的文本內(nèi)容過濾,并將包含有自定義過濾關(guān)鍵詞的文本內(nèi)容過濾;
7、判斷剩余的文本內(nèi)容的數(shù)量,響應(yīng)于剩余文本內(nèi)容的數(shù)量多于一個(gè),對文本內(nèi)容進(jìn)行去重處理;
8、對剩余的文本內(nèi)容進(jìn)行語法校準(zhǔn)和語義校準(zhǔn);
9、將校準(zhǔn)后的文本內(nèi)容輸出至所述聊天軟件所處的終端設(shè)備和/或外部終端設(shè)備,以進(jìn)行提示。
10、在一個(gè)具體實(shí)施例中,捕獲所述消息內(nèi)容具體包括:打開所述聊天軟件界面中的新會(huì)話,對所述新會(huì)話的區(qū)域進(jìn)行截圖;所述消息內(nèi)容包含在所截取的圖片中;
11、所述“通過ocr識(shí)別技術(shù)識(shí)別所述消息內(nèi)容”包括:通過ocr識(shí)別技術(shù)識(shí)別所述所截取的圖片。
12、在一個(gè)具體實(shí)施例中,所述消息內(nèi)容包括語音消息內(nèi)容;所述方法還包括:在識(shí)別消息內(nèi)容之前,將所述語音消息內(nèi)容轉(zhuǎn)換為文本格式的消息內(nèi)容,并顯示在所述新會(huì)話的區(qū)域中。
13、在一個(gè)具體實(shí)施例中,所述“得到所述消息內(nèi)容中完整的文本內(nèi)容”還包括:判斷所述文本內(nèi)容是否已緩存,若未緩存,則對所述文本內(nèi)容進(jìn)行緩存;
14、所述“對所述文本內(nèi)容進(jìn)行分析”包括:對判斷結(jié)果為未緩存的文本內(nèi)容進(jìn)行分析;緩存的文本內(nèi)容在預(yù)設(shè)時(shí)間之后刪除。
15、在一個(gè)具體實(shí)施例中,所述方法還包括:
16、在間隔捕獲消息內(nèi)容的情況下,計(jì)算所述聊天軟件界面中消息內(nèi)容的更新頻率,使捕獲的時(shí)間間隔與所述更新頻率相匹配。
17、在一個(gè)具體實(shí)施例中,所述“提取所述文本內(nèi)容中的關(guān)鍵信息”包括:對劃分的詞匯進(jìn)行詞性標(biāo)注以及命名實(shí)體識(shí)別,從而提取出所述關(guān)鍵信息;
18、所述“將校準(zhǔn)后的文本內(nèi)容輸出至所述聊天軟件所處的終端設(shè)備和/或外部終端設(shè)備”包括:將所述文本內(nèi)容中的所述關(guān)鍵信息突出顯示,并輸出至所述聊天軟件所處的終端設(shè)備和/或外部終端設(shè)備。
19、在一個(gè)具體實(shí)施例中,所述“對所述文本內(nèi)容進(jìn)行過濾”還包括:
20、通過預(yù)設(shè)的機(jī)器學(xué)習(xí)模型識(shí)別并過濾所述文本內(nèi)容中的無效內(nèi)容。
21、在一個(gè)具體實(shí)施例中,所述“對文本內(nèi)容進(jìn)行去重處理”包括:
22、計(jì)算不同文本內(nèi)容之間的相似度,保留相似度高于預(yù)設(shè)閾值的多個(gè)文本內(nèi)容中的一個(gè);和/或,計(jì)算來源于同一消息源的不同文本內(nèi)容之間的相似度,保留相似度高于預(yù)設(shè)閾值的多個(gè)文本內(nèi)容中的一個(gè)。
23、在一個(gè)具體實(shí)施例中,所述“將校準(zhǔn)后的文本內(nèi)容輸出至所述聊天軟件所處的終端設(shè)備和/或外部終端設(shè)備”包括:將所述文本內(nèi)容發(fā)送給所述聊天軟件所處的終端設(shè)備上的應(yīng)用程序,和/或,將所述文本內(nèi)容發(fā)送給所述外部終端設(shè)備上的應(yīng)用程序;
24、所述“進(jìn)行提示”包括:所述應(yīng)用程序?qū)⑺鑫谋緝?nèi)容顯示在終端設(shè)備的屏幕上;和/或,所述應(yīng)用程序?qū)⑺鑫谋緝?nèi)容轉(zhuǎn)換為語音并通過終端設(shè)備進(jìn)行播報(bào)。
25、本發(fā)明的第二方面,提供一種基于ocr識(shí)別聊天記錄消息的系統(tǒng),包括:
26、ocr識(shí)別模塊,用于實(shí)時(shí)或間隔地捕獲聊天軟件界面中新接收的消息內(nèi)容,并通過ocr識(shí)別技術(shù)識(shí)別所述消息內(nèi)容,以得到所述消息內(nèi)容中完整的文本內(nèi)容;
27、分析模塊,用于對所述文本內(nèi)容進(jìn)行分析,劃分所述文本內(nèi)容中的詞匯并提取所述文本內(nèi)容中的關(guān)鍵信息,基于劃分的詞匯和關(guān)鍵信息確定所述文本內(nèi)容的類型;
28、過濾模塊,用于對所述文本內(nèi)容進(jìn)行過濾,將屬于自定義過濾類型的文本內(nèi)容過濾,并將包含有自定義過濾關(guān)鍵詞的文本內(nèi)容過濾;
29、去重模塊,用于判斷剩余的文本內(nèi)容的數(shù)量,響應(yīng)于文本內(nèi)容的數(shù)量為至少兩個(gè),對文本內(nèi)容進(jìn)行去重處理;
30、校準(zhǔn)模塊,用于對剩余的文本內(nèi)容進(jìn)行語法校準(zhǔn)和語義校準(zhǔn);
31、輸出模塊,用于將校準(zhǔn)后的文本內(nèi)容輸出至所述聊天軟件所處的終端設(shè)備和/或外部終端設(shè)備,以進(jìn)行提示。
32、本發(fā)明至少具有以下有益效果:
33、本發(fā)明提供的一種基于ocr識(shí)別聊天記錄消息的方法及系統(tǒng),本發(fā)明提供的方法相較于傳統(tǒng)的彈窗式消息提示方法,可不依賴于聊天軟件自身的消息通知功能,因此能夠適用于不同的聊天軟件,具有良好的適用性。本方法基于ocr識(shí)別技術(shù),能夠獲取到消息內(nèi)容中完整的文本內(nèi)容,用戶無需打開聊天軟件就可閱讀到完整的信息,降低了操作成本,提高了消息閱讀體驗(yàn)。另外,本方法通過對文本內(nèi)容進(jìn)行分析、過濾和去重操作,能夠排除文本內(nèi)容中的垃圾消息和無效信息,使得最終輸出至用戶終端設(shè)備的文本內(nèi)容具有更高質(zhì)量,且對文本內(nèi)容的處理操作可根據(jù)用戶需求進(jìn)行自定義設(shè)置,具有良好的靈活性。而通過對文本內(nèi)容的校準(zhǔn)操作,還使得輸出的文字內(nèi)容具有更好的準(zhǔn)確性,進(jìn)一步提升了用戶的體驗(yàn)。實(shí)際應(yīng)用中,本方法可以將不同聊天軟件接收到的消息進(jìn)行整合并提示,使得用戶閱讀消息更加方便。