所屬的技術(shù)人員知道,本發(fā)明可以實(shí)現(xiàn)為系統(tǒng)、方法或計(jì)算機(jī)程序產(chǎn)品,因此,本公開(kāi)可以具體實(shí)現(xiàn)為以下形式,即:可以是完全的硬件、也可以是完全的軟件(包括固件、駐留軟件、微代碼等),還可以是硬件和軟件結(jié)合的形式,本文一般稱(chēng)為“電路”、“模塊”或“系統(tǒng)”。此外,在一些實(shí)施例中,本發(fā)明還可以實(shí)現(xiàn)為在一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)程序產(chǎn)品的形式,該計(jì)算機(jī)可讀介質(zhì)中包含計(jì)算機(jī)可讀的程序代碼??梢圆捎靡粋€(gè)或多個(gè)計(jì)算機(jī)可讀的介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是一一但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤(pán)、硬盤(pán)、隨機(jī)存取存儲(chǔ)器(ram),只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊磁盤(pán)只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本申請(qǐng)中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。
背景技術(shù):
1、近年來(lái)隨著nlp(自然語(yǔ)言處理)技術(shù)的迅猛發(fā)展,nlp技術(shù)有了更多的落地應(yīng)用場(chǎng)景,如保險(xiǎn)銷(xiāo)售,售后服務(wù)等。在這些應(yīng)用場(chǎng)景中,坐席人員與客戶(hù)的互動(dòng)方式多樣且充滿變數(shù),關(guān)鍵信息的提取往往需要超越單一語(yǔ)句的直接抽取,而是要通過(guò)上下文的深入理解來(lái)推理和確認(rèn),如車(chē)牌號(hào)、身份證號(hào)、姓名、地址等敏感信息。由于關(guān)鍵信息的各個(gè)片段之間存在復(fù)雜的關(guān)聯(lián)性,不符合傳統(tǒng)機(jī)器學(xué)習(xí)模型中標(biāo)簽獨(dú)立分布的假設(shè),這使得諸如ner(命名實(shí)體識(shí)別)等經(jīng)典技術(shù)難以滿足業(yè)務(wù)需求。同時(shí),傳統(tǒng)正則表達(dá)式在智能性和靈活性上的局限,導(dǎo)致其在關(guān)鍵信息抽取方面的效能受限,尤其是在召回率方面表現(xiàn)不佳。
2、因此,亟需提供一種技術(shù)方案解決上述問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、為解決上述技術(shù)問(wèn)題,本發(fā)明提供了一種信息提取方法、系統(tǒng)、電子設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
2、第一方面,本發(fā)明提供一種信息提取方法,該方法的技術(shù)方案如下:
3、s1、確定待提取信息的話題類(lèi)型,并對(duì)所述待提取信息進(jìn)行預(yù)處理,得到預(yù)處理后的待提取信息;
4、s2、基于所述話題類(lèi)型和所述預(yù)處理后的待提取信息,提取多個(gè)關(guān)鍵信息片段,并將所有的關(guān)鍵信息片段進(jìn)行整合,得到整合信息;
5、s31、當(dāng)所述整合信息合規(guī)時(shí),將所述整合信息確定為目標(biāo)信息。
6、本發(fā)明的一種信息提取方法的有益效果如下:
7、本發(fā)明的方法提高了信息提取的準(zhǔn)確性和效率,可應(yīng)用于需要高效、精準(zhǔn)信息處理的領(lǐng)域。
8、在上述方案的基礎(chǔ)上,本發(fā)明的一種信息提取方法還可以做如下改進(jìn)。
9、在一種可選的方式中,對(duì)所述待提取信息進(jìn)行預(yù)處理,得到預(yù)處理后的待提取信息的步驟,包括:
10、當(dāng)所述待提取信息為語(yǔ)音信息時(shí),對(duì)所述待提取信息的語(yǔ)音轉(zhuǎn)寫(xiě)信息進(jìn)行修正與精簡(jiǎn)處理,得到所述預(yù)處理后的待提取信息;
11、當(dāng)所述待提取信息為文本信息時(shí),對(duì)所述待提取信息進(jìn)行修正與精簡(jiǎn)處理,得到所述預(yù)處理后的待提取信息。
12、在一種可選的方式中,基于所述話題類(lèi)型和所述預(yù)處理后的待提取信息,提取多個(gè)關(guān)鍵信息片段的步驟,包括:
13、利用大模型并結(jié)合所述話題類(lèi)型,從所述預(yù)處理后的待提取信息,提取多個(gè)關(guān)鍵信息片段。
14、在一種可選的方式中,將所有的關(guān)鍵信息片段進(jìn)行整合,得到整合信息的步驟,包括:
15、確定每?jī)蓚€(gè)關(guān)鍵信息片段之間的關(guān)系;
16、利用所述大模型,并結(jié)合所有的關(guān)鍵信息片段以及每?jī)蓚€(gè)關(guān)鍵信息片段之間的關(guān)系,生成所述整合信息。
17、在一種可選的方式中,還包括:
18、s32、當(dāng)所述整合信息不合規(guī)時(shí),返回執(zhí)行s1或s2,直至當(dāng)所述整合信息合規(guī)時(shí),將所述整合信息確定為所述目標(biāo)信息。
19、第二方面,本發(fā)明提供一種信息提取系統(tǒng),該系統(tǒng)的技術(shù)方案如下:
20、包括:處理模塊、整合模塊和第一判定模塊;
21、所述處理模塊用于:確定待提取信息的話題類(lèi)型,并對(duì)所述待提取信息進(jìn)行預(yù)處理,得到預(yù)處理后的待提取信息;
22、所述整合模塊用于:基于所述話題類(lèi)型和所述預(yù)處理后的待提取信息,提取多個(gè)關(guān)鍵信息片段,并將所有的關(guān)鍵信息片段進(jìn)行整合,得到整合信息;
23、所述第一判定模塊用于:當(dāng)所述整合信息合規(guī)時(shí),將所述整合信息確定為目標(biāo)信息。
24、本發(fā)明的一種信息提取系統(tǒng)的有益效果如下:
25、本發(fā)明的系統(tǒng)提高了信息提取的準(zhǔn)確性和效率,可應(yīng)用于需要高效、精準(zhǔn)信息處理的領(lǐng)域。
26、在上述方案的基礎(chǔ)上,本發(fā)明的一種信息提取系統(tǒng)還可以做如下改進(jìn)。
27、在一種可選的方式中,所述處理模塊中的對(duì)所述待提取信息進(jìn)行預(yù)處理,得到預(yù)處理后的待提取信息的步驟,包括:
28、當(dāng)所述待提取信息為語(yǔ)音信息時(shí),對(duì)所述待提取信息的語(yǔ)音轉(zhuǎn)寫(xiě)信息進(jìn)行修正與精簡(jiǎn)處理,得到所述預(yù)處理后的待提取信息;
29、當(dāng)所述待提取信息為文本信息時(shí),對(duì)所述待提取信息進(jìn)行修正與精簡(jiǎn)處理,得到所述預(yù)處理后的待提取信息。
30、在一種可選的方式中,所述整合模塊中的基于所述話題類(lèi)型和所述預(yù)處理后的待提取信息,提取多個(gè)關(guān)鍵信息片段的步驟,包括:
31、利用大模型并結(jié)合所述話題類(lèi)型,從所述預(yù)處理后的待提取信息,提取多個(gè)關(guān)鍵信息片段。
32、第三方面,本發(fā)明的一種電子設(shè)備的技術(shù)方案如下:
33、包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并在所述處理器上運(yùn)行的程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如本發(fā)明的信息提取方法的步驟。
34、第四方面,本發(fā)明提供的一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的技術(shù)方案如下:
35、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有指令,當(dāng)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取所述指令時(shí),使所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)執(zhí)行如本發(fā)明的信息提取方法的步驟。
36、上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。
1.一種信息提取方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的信息提取方法,其特征在于,對(duì)所述待提取信息進(jìn)行預(yù)處理,得到預(yù)處理后的待提取信息的步驟,包括:
3.根據(jù)權(quán)利要求1所述的信息提取方法,其特征在于,基于所述話題類(lèi)型和所述預(yù)處理后的待提取信息,提取多個(gè)關(guān)鍵信息片段的步驟,包括:
4.根據(jù)權(quán)利要求3所述的信息提取方法,其特征在于,將所有的關(guān)鍵信息片段進(jìn)行整合,得到整合信息的步驟,包括:
5.根據(jù)權(quán)利要求1至4任一項(xiàng)所述的信息提取方法,其特征在于,還包括:
6.一種信息提取系統(tǒng),其特征在于,包括:處理模塊、整合模塊和第一判定模塊;
7.根據(jù)權(quán)利要求6所述的信息提取系統(tǒng),其特征在于,所述處理模塊中的對(duì)所述待提取信息進(jìn)行預(yù)處理,得到預(yù)處理后的待提取信息的步驟,包括:
8.根據(jù)權(quán)利要求6所述的信息提取系統(tǒng),其特征在于,所述整合模塊中的基于所述話題類(lèi)型和所述預(yù)處理后的待提取信息,提取多個(gè)關(guān)鍵信息片段的步驟,包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括處理器,所述處理器與存儲(chǔ)器耦合,所述存儲(chǔ)器中存儲(chǔ)有至少一條計(jì)算機(jī)程序,所述至少一條計(jì)算機(jī)程序由所述處理器加載并執(zhí)行,以使所述電子設(shè)備實(shí)現(xiàn)如權(quán)利要求1至5任一項(xiàng)所述的信息提取方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有至少一條計(jì)算機(jī)程序,所述至少一條計(jì)算機(jī)程序由處理器加載并執(zhí)行,以使計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)實(shí)現(xiàn)如權(quán)利要求1至5任一項(xiàng)所述的信息提取方法。