本發(fā)明涉及炭黑質(zhì)量分析,具體為基于生產(chǎn)數(shù)據(jù)處理的炭黑質(zhì)量分析系統(tǒng)。
背景技術(shù):
1、傳統(tǒng)的炭黑質(zhì)量分析系統(tǒng)面臨著幾個(gè)顯著的技術(shù)問題,特別是在處理異常與正常生產(chǎn)數(shù)據(jù)的不平衡時(shí)。
2、首先,由于正常生產(chǎn)數(shù)據(jù)占據(jù)了絕大多數(shù),傳統(tǒng)系統(tǒng)在面對(duì)實(shí)際工況中罕見的異常數(shù)據(jù)時(shí),往往受限于其樣本量的缺乏,導(dǎo)致難以充分捕捉異常數(shù)據(jù)的真實(shí)分布和變化特性。這使得傳統(tǒng)模型在識(shí)別異常情況時(shí)可能表現(xiàn)不佳,容易將一些潛在風(fēng)險(xiǎn)誤判為正常,無法及時(shí)識(shí)別和響應(yīng)異常情況。
3、此外,傳統(tǒng)系統(tǒng)可能主要依賴固定的規(guī)則或閾值進(jìn)行異常檢測(cè),這種基于經(jīng)驗(yàn)的靜態(tài)方法在面對(duì)動(dòng)態(tài)生產(chǎn)環(huán)境和多變的異常類型時(shí),缺乏必要的靈活性和適應(yīng)能力。由于無法有效識(shí)別出異常數(shù)據(jù)間的復(fù)雜關(guān)系和特征差異,傳統(tǒng)系統(tǒng)的分析精度和預(yù)測(cè)能力往往受到約束。
4、而且,由于缺乏對(duì)數(shù)據(jù)特征偏離程度的量化分析,傳統(tǒng)方法難以提供詳盡的異常質(zhì)量分析,這限制了生產(chǎn)監(jiān)控系統(tǒng)對(duì)異常事件的細(xì)化管理和快速?zèng)Q策。此外,傳統(tǒng)系統(tǒng)難以處理異常數(shù)據(jù)可能引入的噪聲和偏差,這進(jìn)一步降低了異常檢測(cè)的準(zhǔn)確性和可靠性。綜上所述,這些技術(shù)問題不僅制約了傳統(tǒng)炭黑質(zhì)量分析系統(tǒng)的檢測(cè)能力和靈活性,也影響了其在動(dòng)態(tài)生產(chǎn)環(huán)境中保持高效、連續(xù)性的能力。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供基于生產(chǎn)數(shù)據(jù)處理的炭黑質(zhì)量分析系統(tǒng),以解決上述背景技術(shù)中提出的問題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:基于生產(chǎn)數(shù)據(jù)處理的炭黑質(zhì)量分析系統(tǒng),包括數(shù)據(jù)收集模塊、特征處理模塊和異常質(zhì)量分析模塊,其中:
3、所述數(shù)據(jù)收集模塊收集用于生產(chǎn)炭黑的歷史生產(chǎn)數(shù)據(jù),其中該歷史生產(chǎn)數(shù)據(jù)包括正常炭黑生產(chǎn)數(shù)據(jù)和異常炭黑生產(chǎn)數(shù)據(jù);
4、所述特征處理模塊根據(jù)異常炭黑生產(chǎn)數(shù)據(jù)中的每個(gè)異常數(shù)據(jù)點(diǎn),計(jì)算它與其他異常數(shù)據(jù)點(diǎn)之間的特征向量差;基于特征向量差,通過隨機(jī)比例生成新的異常數(shù)據(jù)點(diǎn);對(duì)異常炭黑生產(chǎn)數(shù)據(jù)中的每個(gè)異常數(shù)據(jù)點(diǎn),持續(xù)進(jìn)行特征向量差的計(jì)算以及隨機(jī)比例的生成,直到生成新的異常數(shù)據(jù)點(diǎn)的數(shù)量與正常炭黑生產(chǎn)數(shù)據(jù)中正常數(shù)據(jù)點(diǎn)的數(shù)量保持一致;
5、所述異常質(zhì)量分析模塊對(duì)異常炭黑生產(chǎn)數(shù)據(jù)中的每個(gè)異常數(shù)據(jù)點(diǎn)與其他異常數(shù)據(jù)點(diǎn)的特征向量差,進(jìn)行標(biāo)準(zhǔn)化處理,并將處理結(jié)果作為異常偏離指數(shù);根據(jù)正常炭黑生產(chǎn)數(shù)據(jù),計(jì)算正常炭黑生產(chǎn)數(shù)據(jù)中每個(gè)正常數(shù)據(jù)點(diǎn)與其他正常數(shù)據(jù)點(diǎn)的特征向量差,根據(jù)該特征向量差,確定安全偏離閾值;根據(jù)異常偏離指數(shù)與安全偏離閾值的大小關(guān)系,確定異常炭黑生產(chǎn)數(shù)據(jù)中的每個(gè)異常數(shù)據(jù)點(diǎn)的異常質(zhì)量指數(shù)。
6、作為本技術(shù)方案的進(jìn)一步改進(jìn),所述特征處理模塊生成新的異常數(shù)據(jù)點(diǎn)的過程具體包括:
7、選擇異常炭黑生產(chǎn)數(shù)據(jù)中的一個(gè)異常數(shù)據(jù)點(diǎn)作為當(dāng)前異常數(shù)據(jù)點(diǎn),從當(dāng)前異常數(shù)據(jù)點(diǎn)提取相關(guān)特征,并生成一個(gè)當(dāng)前特征向量,表示當(dāng)前異常數(shù)據(jù)點(diǎn)的屬性;
8、根據(jù)生成的當(dāng)前特征向量,計(jì)算它與其他異常數(shù)據(jù)點(diǎn)之間的特征向量差,作為異常特征向量差集;并將異常特征向量差集按照從小到大的順序進(jìn)行排序,并隨機(jī)選擇排序后的前個(gè)異常數(shù)據(jù)點(diǎn)中的一個(gè)特征向量差作為當(dāng)前特征向量差,其中通過交叉驗(yàn)證所確定,表示在排序后的異常特征向量差集中,用于隨機(jī)選擇的前個(gè)異常數(shù)據(jù)點(diǎn)的數(shù)目;
9、生成一個(gè)隨機(jī)比例,根據(jù)隨機(jī)比例和當(dāng)前向量差,生成新的異常數(shù)據(jù)點(diǎn),生成公式如下:
10、,其中表示生成新的異常數(shù)據(jù)點(diǎn);表示異常炭黑生產(chǎn)數(shù)據(jù)中的當(dāng)前異常數(shù)據(jù)點(diǎn);表示隨機(jī)比例;表示當(dāng)前異常數(shù)據(jù)點(diǎn)與其他異常數(shù)據(jù)點(diǎn)的當(dāng)前特征向量差;
11、對(duì)異常炭黑生產(chǎn)數(shù)據(jù)中的每個(gè)異常數(shù)據(jù)點(diǎn),持續(xù)進(jìn)行特征向量差的計(jì)算以及新的異常數(shù)據(jù)點(diǎn)的生成,直到生成新的異常數(shù)據(jù)點(diǎn)的數(shù)量與正常炭黑生產(chǎn)數(shù)據(jù)中正常數(shù)據(jù)點(diǎn)的數(shù)量保持一致。
12、作為本技術(shù)方案的進(jìn)一步改進(jìn),所述特征向量差的計(jì)算方法包括直接差異求和、歐式距離和余弦相似度。
13、作為本技術(shù)方案的進(jìn)一步改進(jìn),所述異常質(zhì)量分析模塊包括異常偏離指數(shù)計(jì)算單元,所述異常偏離指數(shù)計(jì)算單元計(jì)算異常偏離指數(shù)的過程具體包括:
14、根據(jù)當(dāng)前異常數(shù)據(jù)點(diǎn)與其他異常數(shù)據(jù)點(diǎn)的特征向量差所生成的異常特征向量差集中的當(dāng)前特征向量差,對(duì)該當(dāng)前特征向量差進(jìn)行標(biāo)準(zhǔn)化處理,標(biāo)準(zhǔn)化的處理公式如下:
15、,其中表示異常偏離指數(shù),表示異常炭黑生產(chǎn)數(shù)據(jù)中異常數(shù)據(jù)點(diǎn)特征向量的均值,表示異常炭黑生產(chǎn)數(shù)據(jù)中異常數(shù)據(jù)點(diǎn)特征向量的方差。
16、作為本技術(shù)方案的進(jìn)一步改進(jìn),所述異常質(zhì)量分析模塊包括異常質(zhì)量指數(shù)分析單元,所述異常質(zhì)量指數(shù)分析單元確定異常質(zhì)量指數(shù)的過程具體包括:
17、根據(jù)正常炭黑生產(chǎn)數(shù)據(jù),計(jì)算正常炭黑生產(chǎn)數(shù)據(jù)中每個(gè)正常數(shù)據(jù)點(diǎn)與其他正常數(shù)據(jù)點(diǎn)的特征向量差,將計(jì)算的結(jié)果作為正常特征向量差集;對(duì)正常特征向量差集進(jìn)行從小到大的排序;
18、使用分位數(shù)方法,選擇排序后的正常特征向量差集中的特征向量差,作為偏離的界限,并對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理,得到安全偏離閾值;
19、對(duì)異常炭黑生產(chǎn)數(shù)據(jù)中的每個(gè)異常數(shù)據(jù)點(diǎn)所計(jì)算的異常偏離指數(shù),比較它與安全偏離閾值的大小關(guān)系,其中:
20、如果,則該異常數(shù)據(jù)點(diǎn)所對(duì)應(yīng)的異常質(zhì)量指數(shù)高,并將該異常偏離指數(shù)與安全偏離閾值的差值作為該異常數(shù)據(jù)點(diǎn)的異常質(zhì)量指數(shù);
21、如果,則該異常數(shù)據(jù)點(diǎn)所對(duì)應(yīng)的異常質(zhì)量指數(shù)低,并將該異常偏離指數(shù)與安全偏離閾值的差值作為該異常數(shù)據(jù)點(diǎn)的異常質(zhì)量指數(shù)。
22、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
23、該基于生產(chǎn)數(shù)據(jù)處理的炭黑質(zhì)量分析系統(tǒng)通過選擇異常炭黑生產(chǎn)數(shù)據(jù)中的一個(gè)異常數(shù)據(jù)點(diǎn),系統(tǒng)計(jì)算出該點(diǎn)與其他異常數(shù)據(jù)點(diǎn)之間的特征向量差,然后基于該差值和隨機(jī)比例生成新的異常數(shù)據(jù)點(diǎn);這一過程持續(xù)進(jìn)行,直至生成的新異常數(shù)據(jù)點(diǎn)的數(shù)量與正常數(shù)據(jù)點(diǎn)數(shù)量達(dá)到平衡;這樣做的好處在于,通過生成模擬真實(shí)異常情況的額外數(shù)據(jù)點(diǎn),系統(tǒng)在訓(xùn)練中可以更好地捕捉異常數(shù)據(jù)分布的復(fù)雜性和多樣性;這種方法不僅提高了機(jī)器學(xué)習(xí)模型對(duì)于少數(shù)類(異常數(shù)據(jù)點(diǎn))的識(shí)別和分類能力,而且通過廣泛的模擬異常背景,增加了模型的泛化能力,避免其只對(duì)特定異常反應(yīng)敏感;此外,利用隨機(jī)比例生成新數(shù)據(jù)點(diǎn),有助于在捕獲異常特征的同時(shí)減少引入偏差,為后續(xù)的模型優(yōu)化和應(yīng)用提供了豐富且扎實(shí)的基礎(chǔ)數(shù)據(jù)。
24、以及,通過對(duì)特征向量差集進(jìn)行標(biāo)準(zhǔn)化處理,生成異常偏離指數(shù),有效地量化了每個(gè)異常數(shù)據(jù)點(diǎn)的異常程度;具體來說,通過計(jì)算每個(gè)異常數(shù)據(jù)點(diǎn)與其他異常數(shù)據(jù)點(diǎn)的特征向量差并進(jìn)行標(biāo)準(zhǔn)化,異常偏離指數(shù)用來反映這些數(shù)據(jù)點(diǎn)在特征空間中的離散程度;與此同時(shí),系統(tǒng)基于正常炭黑生產(chǎn)數(shù)據(jù)計(jì)算正常數(shù)據(jù)點(diǎn)間的特征向量差,并通過分位數(shù)選擇,確定一個(gè)用作安全基準(zhǔn)的偏離閾值;當(dāng)異常偏離指數(shù)大于這一安全偏離閾值時(shí),系統(tǒng)認(rèn)定對(duì)應(yīng)的異常數(shù)據(jù)點(diǎn)具有更高的異常質(zhì)量指數(shù);反之,則認(rèn)為其異常質(zhì)量較低。這種量化機(jī)制能夠精準(zhǔn)地評(píng)估每個(gè)異常數(shù)據(jù)點(diǎn)相對(duì)于正常工況的偏離程度,從而為生產(chǎn)監(jiān)控和早期預(yù)警提供有力支持;最終,這種機(jī)制確保了即使在數(shù)據(jù)集不平衡的情況下也能正常運(yùn)行,使得模型不僅能準(zhǔn)確檢測(cè)和分類異常情況,還有助于識(shí)別潛在風(fēng)險(xiǎn),維持生產(chǎn)穩(wěn)定性和產(chǎn)品質(zhì)量。