亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

代謝狀態(tài)確定方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)

文檔序號(hào):40375067發(fā)布日期:2024-12-20 11:57閱讀:5來(lái)源:國(guó)知局
代謝狀態(tài)確定方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)

本技術(shù)涉及數(shù)據(jù)處理領(lǐng)域,具體而言,涉及一種代謝狀態(tài)確定方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。


背景技術(shù):

1、由于技術(shù)限制、樣本采集與處理過(guò)程中的誤差、以及代謝物檢測(cè)技術(shù)的靈敏度與覆蓋度不足,代謝組學(xué)數(shù)據(jù)的缺失成為了一個(gè)普遍存在的問(wèn)題。代謝組學(xué)數(shù)據(jù)的缺失,直接導(dǎo)致了在解析生物體代謝狀態(tài)時(shí)準(zhǔn)確率的下降。目前常見(jiàn)的解決方法為:對(duì)缺失的代謝組學(xué)數(shù)據(jù)進(jìn)行插補(bǔ)后確定生物體的代謝狀態(tài)。

2、傳統(tǒng)的代謝狀態(tài)確定方法主要包括均值插補(bǔ)、中位數(shù)插補(bǔ)、眾數(shù)插補(bǔ)、回歸插補(bǔ)、k最近鄰插補(bǔ)(knn)以及多重插補(bǔ)等。這些方法各有優(yōu)缺點(diǎn),適用于不同的數(shù)據(jù)類型和缺失模式。例如,均值或中位數(shù)插補(bǔ)簡(jiǎn)單快捷,但對(duì)于非隨機(jī)缺失或高度偏態(tài)的數(shù)據(jù)可能不夠準(zhǔn)確;回歸插補(bǔ)考慮了變量間的關(guān)系,但假設(shè)數(shù)據(jù)缺失是隨機(jī)的;knn插補(bǔ)則基于相似性原則,適用于更復(fù)雜的數(shù)據(jù)結(jié)構(gòu),但計(jì)算量較大;多重插補(bǔ)則通過(guò)生成多個(gè)完整的數(shù)據(jù)集來(lái)反映插補(bǔ)的不確定性,是一種較為先進(jìn)的方法。

3、盡管存在多種數(shù)據(jù)插補(bǔ)技術(shù),但大多數(shù)現(xiàn)有方法主要針對(duì)單一類型的缺失數(shù)據(jù)進(jìn)行設(shè)計(jì),如僅處理隨機(jī)缺失、完全隨機(jī)缺失或特定類型的非隨機(jī)缺失。這種局限性使得它們難以面對(duì)復(fù)雜多變的實(shí)際應(yīng)用場(chǎng)景,進(jìn)而影響代謝數(shù)據(jù)的準(zhǔn)確性,導(dǎo)致確定生物體的代謝狀態(tài)的準(zhǔn)確性也較低。


技術(shù)實(shí)現(xiàn)思路

1、有鑒于此,本技術(shù)實(shí)施例的目的在于提供一種代謝狀態(tài)確定方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),能夠提高代謝組學(xué)和生物體的代謝狀態(tài)的準(zhǔn)確性,同時(shí)增加該代謝狀態(tài)確定方法的應(yīng)用場(chǎng)景。

2、第一方面,本技術(shù)實(shí)施例提供了一種代謝狀態(tài)確定方法,包括:采用正態(tài)分布對(duì)代謝組學(xué)的缺失數(shù)據(jù)矩陣進(jìn)行預(yù)處理,得到預(yù)處理數(shù)據(jù)矩陣;其中,所述代謝組學(xué)配置為揭示生物體在不同生理或病理狀態(tài)下的代謝狀態(tài);對(duì)所述預(yù)處理數(shù)據(jù)矩陣進(jìn)行奇異值分解,得到對(duì)角矩陣;根據(jù)所述對(duì)角矩陣更新所述缺失數(shù)據(jù)矩陣,得到第一近似矩陣;根據(jù)所述缺失數(shù)據(jù)矩陣、所述預(yù)處理數(shù)據(jù)矩陣和所述第一近似矩陣對(duì)所述第一近似矩陣中的數(shù)據(jù)進(jìn)行插補(bǔ),得到第二近似矩陣;從將所述第二近似矩陣作為所述預(yù)處理數(shù)據(jù)矩陣進(jìn)行奇異值分解開(kāi)始重復(fù),直到達(dá)到迭代條件為止,最終得到的第二近似矩陣為最終的插補(bǔ)結(jié)果;根據(jù)插補(bǔ)后的代謝組學(xué)數(shù)據(jù)確定生物體的代謝狀態(tài)。

3、在上述實(shí)現(xiàn)過(guò)程中,在對(duì)數(shù)據(jù)進(jìn)行插補(bǔ)時(shí),根據(jù)缺失數(shù)據(jù)矩陣、預(yù)處理數(shù)據(jù)矩陣和第一近似矩陣共同對(duì)第一近似矩陣中的數(shù)據(jù)進(jìn)行插補(bǔ),其中預(yù)處理數(shù)據(jù)矩陣可以用于確定缺失類型,以在插補(bǔ)時(shí)可以根據(jù)缺失類型選擇相應(yīng)的插補(bǔ)方式對(duì)缺失數(shù)據(jù)進(jìn)行插補(bǔ),可以提高代謝組學(xué)和生物體的代謝狀態(tài)的準(zhǔn)確性,同時(shí)增加該代謝狀態(tài)確定方法的應(yīng)用場(chǎng)景。另外,由于奇異值分解方法在矩陣降維和數(shù)據(jù)重構(gòu)方面具備一定的優(yōu)勢(shì),在進(jìn)行數(shù)據(jù)插補(bǔ)的方法中,采用奇異值分解的方式進(jìn)行插補(bǔ),可以降低插補(bǔ)難度,提高插補(bǔ)準(zhǔn)確性。再者,由于正態(tài)分布僅依賴均值和方差這兩個(gè)參數(shù),通過(guò)采用正態(tài)分布對(duì)代謝組學(xué)的缺失數(shù)據(jù)矩陣進(jìn)行預(yù)處理,可以簡(jiǎn)化缺失數(shù)據(jù)矩陣的處理難度,提高處理效率。

4、在一個(gè)實(shí)施例中,所述對(duì)角矩陣包括第一對(duì)角矩陣和第二對(duì)角矩陣;所述對(duì)所述預(yù)處理數(shù)據(jù)矩陣進(jìn)行奇異值分解,得到對(duì)角矩陣,包括:對(duì)所述預(yù)處理數(shù)據(jù)矩陣進(jìn)行奇異值分解,得到包含奇異值的第一對(duì)角矩陣;基于設(shè)定閾值對(duì)所述第一對(duì)角矩陣中的奇異值進(jìn)行處理,得到第二對(duì)角矩陣;所述根據(jù)所述對(duì)角矩陣更新所述缺失數(shù)據(jù)矩陣,得到第一近似矩陣,包括:根據(jù)所述第二對(duì)角矩陣更新所述缺失數(shù)據(jù)矩陣,得到第一近似矩陣。

5、在上述實(shí)現(xiàn)過(guò)程中,通過(guò)對(duì)預(yù)處理數(shù)據(jù)矩陣進(jìn)行奇異值分解,可以將高維數(shù)據(jù)降為低維數(shù)據(jù),有效減少數(shù)據(jù)的維度,降低計(jì)算復(fù)雜度。另外,通過(guò)保留奇異值對(duì)應(yīng)的特征,可以保留預(yù)處理數(shù)據(jù)矩陣中的重要信息,提高數(shù)據(jù)插補(bǔ)的準(zhǔn)確性。

6、在一個(gè)實(shí)施例中,其中,所述第一對(duì)角矩陣的獲取方式包括:利用px-mdc模型對(duì)所述缺失數(shù)據(jù)進(jìn)行分類,得到缺失類型;在所述缺失數(shù)據(jù)的缺失類型為非隨機(jī)缺失類型的情況下,對(duì)非隨機(jī)缺失類型的預(yù)處理數(shù)據(jù)進(jìn)行隨機(jī)加權(quán),得到隨機(jī)加權(quán)后的預(yù)處理數(shù)據(jù)矩陣;對(duì)隨機(jī)加權(quán)后的預(yù)處理數(shù)據(jù)矩陣進(jìn)行奇異值分解,得到包含奇異值的第一對(duì)角矩陣。

7、在上述實(shí)現(xiàn)過(guò)程中,在缺失類型為非隨機(jī)缺失的情況下,通過(guò)在插補(bǔ)之前對(duì)數(shù)據(jù)進(jìn)行加權(quán),以對(duì)已觀測(cè)數(shù)據(jù)賦予更高的權(quán)重,可以最大程度上利用可靠的數(shù)據(jù),而對(duì)非隨機(jī)缺失類型的數(shù)據(jù)降低其權(quán)重,減小缺失數(shù)據(jù)對(duì)矩陣分解的負(fù)面影響,提高模型的靈活性和穩(wěn)健性。

8、在一個(gè)實(shí)施例中,所述基于設(shè)定閾值對(duì)所述第一對(duì)角矩陣中的奇異值進(jìn)行處理,得到第二對(duì)角矩陣,包括:通過(guò)所述第一對(duì)角矩陣中的所有奇異值分別減去所述設(shè)定閾值,得到中間矩陣;保留所述中間矩陣中第一預(yù)設(shè)比例的數(shù)據(jù),得到所述第二對(duì)角矩陣;其中,第一預(yù)設(shè)比例為保留奇異值總和占總奇異值的百分比。

9、在上述實(shí)現(xiàn)過(guò)程中,在確定出第一對(duì)角矩陣后,通過(guò)設(shè)置第一預(yù)設(shè)比例,保留中間矩陣中第一預(yù)設(shè)比例的數(shù)據(jù),可以通過(guò)調(diào)整第一預(yù)設(shè)比例的數(shù)值,盡可能的保留更多的奇異值,優(yōu)化插補(bǔ)效果。

10、在一個(gè)實(shí)施例中,所述采用正態(tài)分布對(duì)代謝組學(xué)的缺失數(shù)據(jù)矩陣進(jìn)行預(yù)處理,得到預(yù)處理數(shù)據(jù)矩陣,包括:通過(guò)原始數(shù)據(jù)中代謝物未缺失的最小值替換缺失值;計(jì)算替換缺失值后的代謝物的均值和方差;基于所述均值和所述方差生成正態(tài)分布數(shù)據(jù);通過(guò)所述正態(tài)分布數(shù)據(jù)根據(jù)缺失數(shù)據(jù)的缺失類型進(jìn)行相應(yīng)的預(yù)處理,得到預(yù)處理數(shù)據(jù)矩陣。

11、在上述實(shí)現(xiàn)過(guò)程中,通過(guò)對(duì)缺失數(shù)據(jù)矩陣進(jìn)行正態(tài)分布處理,使得缺失數(shù)據(jù)矩陣中的數(shù)據(jù)分布特征更加直觀和易于解釋,簡(jiǎn)化缺失數(shù)據(jù)矩陣處理難度,提高缺失數(shù)據(jù)矩陣處理便利性。

12、在一個(gè)實(shí)施例中,所述通過(guò)所述正態(tài)分布數(shù)據(jù)根據(jù)缺失數(shù)據(jù)的缺失類型進(jìn)行相應(yīng)的預(yù)處理,得到預(yù)處理數(shù)據(jù)矩陣,包括:在缺失數(shù)據(jù)為隨機(jī)缺失類型的情況下,通過(guò)所述正態(tài)分布數(shù)據(jù)中的隨機(jī)選擇值對(duì)所述缺失數(shù)據(jù)進(jìn)行填補(bǔ);在缺失數(shù)據(jù)為非隨機(jī)缺失類型的情況下,從所述正態(tài)分布數(shù)據(jù)中挑選出小于代謝物最小值的數(shù)據(jù)對(duì)所述缺失數(shù)據(jù)進(jìn)行填補(bǔ);通過(guò)填補(bǔ)后的缺失數(shù)據(jù)矩陣得到所述預(yù)處理數(shù)據(jù)矩陣。

13、在上述實(shí)現(xiàn)過(guò)程中,在對(duì)缺失數(shù)據(jù)矩陣進(jìn)行預(yù)處理時(shí),根據(jù)缺失數(shù)據(jù)的缺失類型采用相應(yīng)的填補(bǔ)方式對(duì)缺失數(shù)據(jù)進(jìn)行填補(bǔ),可以提高填補(bǔ)準(zhǔn)確性。

14、在一個(gè)實(shí)施例中,所述根據(jù)所述缺失數(shù)據(jù)矩陣、所述預(yù)處理數(shù)據(jù)矩陣和所述第一近似矩陣對(duì)所述第一近似矩陣中的數(shù)據(jù)進(jìn)行插補(bǔ),得到第二近似矩陣,包括:根據(jù)所述缺失數(shù)據(jù)矩陣確定缺失數(shù)據(jù)的缺失位置;根據(jù)所述預(yù)處理數(shù)據(jù)矩陣確定缺失數(shù)據(jù)的缺失類型;通過(guò)所述缺失數(shù)據(jù)的缺失位置和所述缺失類型確定所述第一近似矩陣中缺失數(shù)據(jù)的缺失位置和缺失類型;根據(jù)所述第一近似矩陣中的缺失數(shù)據(jù)的缺失類型采用相應(yīng)的插補(bǔ)方式對(duì)所述第一近似矩陣中相應(yīng)的缺失位置進(jìn)行插補(bǔ),確定所述第二近似矩陣。

15、在上述實(shí)現(xiàn)過(guò)程中,在確定第二近似矩陣時(shí),根據(jù)缺失數(shù)據(jù)矩陣確定缺失數(shù)據(jù)的缺失位置,根據(jù)預(yù)處理數(shù)據(jù)矩陣確定缺失數(shù)據(jù)的缺失類型,進(jìn)而確定相應(yīng)的插補(bǔ)方式在第一近似矩陣的相應(yīng)處理處進(jìn)行插補(bǔ),可以準(zhǔn)確的將插補(bǔ)數(shù)據(jù)插補(bǔ)到對(duì)應(yīng)位置,提高第二近似矩陣的準(zhǔn)確性。

16、在一個(gè)實(shí)施例中,所述根據(jù)所述第一近似矩陣中的缺失數(shù)據(jù)的缺失類型采用相應(yīng)的插補(bǔ)方式對(duì)所述第一近似矩陣中相應(yīng)的缺失位置進(jìn)行插補(bǔ),確定所述第二近似矩陣,包括:在缺失數(shù)據(jù)為隨機(jī)缺失類型的情況下,通過(guò)正態(tài)分布數(shù)據(jù)中的隨機(jī)選擇值對(duì)所述缺失數(shù)據(jù)進(jìn)行填補(bǔ);在缺失數(shù)據(jù)為非隨機(jī)缺失類型,且所述缺失數(shù)據(jù)的缺失數(shù)據(jù)位置在所述第一近似矩陣中相應(yīng)位置處的值高于原始數(shù)據(jù)中代謝物未缺失的最小值的情況下,通過(guò)預(yù)處理數(shù)據(jù)矩陣相應(yīng)位置的第一權(quán)重值和所述第一近似矩陣中相應(yīng)位置的第二權(quán)重值對(duì)所述缺失數(shù)據(jù)進(jìn)行填補(bǔ);在缺失數(shù)據(jù)為非隨機(jī)缺失類型,且所述缺失數(shù)據(jù)在所述第一近似矩陣中相應(yīng)位置的值不高于原始數(shù)據(jù)中代謝物未缺失的最小值的情況下,通過(guò)所述第一近似矩陣中相應(yīng)位置的值對(duì)所述缺失數(shù)據(jù)進(jìn)行填補(bǔ)。

17、在上述實(shí)現(xiàn)過(guò)程中,針對(duì)不同缺失類型的缺失數(shù)據(jù),采用相應(yīng)的插補(bǔ)方式進(jìn)行缺失數(shù)據(jù)插補(bǔ),可以提高缺失數(shù)據(jù)插補(bǔ)準(zhǔn)確性,增加該數(shù)據(jù)插補(bǔ)方式可針對(duì)的缺失類型,增加應(yīng)用場(chǎng)景。

18、第二方面,本技術(shù)實(shí)施例還提供一種代謝狀態(tài)確定裝置,包括:預(yù)處理模塊,用于采用正態(tài)分布對(duì)代謝組學(xué)的缺失數(shù)據(jù)矩陣進(jìn)行預(yù)處理,得到預(yù)處理數(shù)據(jù)矩陣;其中,所述代謝組學(xué)配置為揭示生物體在不同生理或病理狀態(tài)下的代謝狀態(tài);分解模塊,用于對(duì)所述預(yù)處理數(shù)據(jù)矩陣進(jìn)行奇異值分解,得到對(duì)角矩陣;更新模塊,用于根據(jù)所述對(duì)角矩陣更新所述缺失數(shù)據(jù)矩陣,得到第一近似矩陣;插補(bǔ)模塊,用于根據(jù)所述缺失數(shù)據(jù)矩陣、所述預(yù)處理數(shù)據(jù)矩陣和所述第一近似矩陣對(duì)所述第一近似矩陣中的數(shù)據(jù)進(jìn)行插補(bǔ),得到第二近似矩陣;迭代模塊,用于從將所述第二近似矩陣作為所述預(yù)處理數(shù)據(jù)矩陣進(jìn)行奇異值分解開(kāi)始重復(fù),直到達(dá)到迭代條件為止,最終得到的第二近似矩陣為最終的插補(bǔ)結(jié)果;確定模塊,用于根據(jù)插補(bǔ)后的代謝組學(xué)數(shù)據(jù)確定生物體的代謝狀態(tài)。

19、第三方面,本技術(shù)實(shí)施例還提供一種電子設(shè)備,包括:處理器、存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有所述處理器可執(zhí)行的機(jī)器可讀指令,當(dāng)電子設(shè)備運(yùn)行時(shí),所述機(jī)器可讀指令被所述處理器執(zhí)行時(shí)執(zhí)行上述第一方面,或第一方面的任一種可能的實(shí)施方式中的方法的步驟。

20、第四方面,本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器運(yùn)行時(shí)執(zhí)行上述第一方面,或第一方面的任一種可能的實(shí)施方式中代謝狀態(tài)確定方法的步驟。

21、為使本技術(shù)的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉實(shí)施例,并配合所附附圖,作詳細(xì)說(shuō)明如下。

當(dāng)前第1頁(yè)1 2