1.一種基于llm模型的語音處理方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,所述將該發(fā)聲訴求文本數(shù)據(jù)與語言識別學(xué)習(xí)模型訴求標(biāo)簽庫中的訴求標(biāo)簽進行比對分析預(yù)測,各語言識別學(xué)習(xí)模型輸出各自的預(yù)測結(jié)果的具體方法包括:
3.如權(quán)利要求2所述的方法,其特征在于:所述對特征向量進行聚類并得到初步的聚類結(jié)果,確定聚類中心標(biāo)簽,調(diào)整聚類邊界,然后迭代更新聚類中心和邊界包括:
4.如權(quán)利要求3所述的方法,其特征在于,所述采用貪婪算法逐步調(diào)整聚類邊界,以優(yōu)化聚類結(jié)果的方法包括:
5.如權(quán)利要求3所述的方法,其特征在于:所述通過k-means算法對預(yù)處理后的標(biāo)簽特征向量進行聚類以確定最優(yōu)的聚類數(shù)量k的方法包括:對于不同的k值運行k-means算法,計算每個k值對應(yīng)的總平方誤差,獲取總平方誤差與k的關(guān)系圖,選擇總平均誤差下降幅度開始減小的點作為k值或?qū)τ诓煌膋值,獲取每個樣本的輪廓系數(shù),選擇輪廓系數(shù)平均值最高的值作為k值,或?qū)τ诿總€k值,計算k-means聚類的總平均誤差和一個參照數(shù)據(jù)集的總平均誤差,參照數(shù)據(jù)集是通過在原數(shù)據(jù)集上添加隨機噪聲生成的,然后計算兩者的差值,并選擇差值最大的作為k值。
6.如權(quán)利要求1所述的方法,其特征在于:輸入至各語言識別學(xué)習(xí)模型時需要將所述發(fā)聲訴求文本數(shù)據(jù)的格式統(tǒng)一。
7.如權(quán)利要求1所述的方法,其特征在于,根據(jù)權(quán)重信息對各語言識別學(xué)習(xí)模型輸出的預(yù)測結(jié)果進行統(tǒng)計評分,根據(jù)評分的高低獲取最匹配的發(fā)聲訴求文本數(shù)據(jù)識別結(jié)果的具體方法包括:
8.一種基于llm模型的語音處理系統(tǒng),其特征在于,包括:
9.一種計算機存儲介質(zhì),其特征在于:所述計算機存儲介質(zhì)存儲有多條指令,所述指令適于由處理器加載并執(zhí)行如權(quán)利要求1-5任一項所述的方法步驟。
10.一種電子設(shè)備,其特征在于:包括處理器和存儲器,所述存儲器存儲有計算機程序,所述計算機程序適于由所述處理器加載并執(zhí)行如權(quán)利要求1-5任一項所述的方法步驟。