技術(shù)總結(jié)
本發(fā)明公開了一種大量同構(gòu)稀疏矩陣的GPU加速Q(mào)R分解方法,所述方法包括如下步驟:在CPU上對稀疏矩陣A1進行QR符號分解,得到Household變換矩陣V1和上三角矩陣R1的稀疏結(jié)構(gòu);對矩陣A1各列進行并行化分層,且A1~AN具有相同的稀疏結(jié)構(gòu)V1、上三角矩陣稀疏結(jié)構(gòu)R1和并行化分層結(jié)果;CPU將QR分解所需數(shù)據(jù)傳輸給GPU;任務(wù)分配和設(shè)備內(nèi)存優(yōu)化:將對矩陣A1~AN的QR分解任務(wù)分配到GPU上的大量線程中執(zhí)行,并根據(jù)合并訪問原則優(yōu)化內(nèi)存使用;GPU中計算分層QR分解內(nèi)核函數(shù)Batch_QR。該方法利用CPU控制程序的流程,GPU處理密集浮點運算,可以大幅提高大量同構(gòu)稀疏矩陣的QR分解速度。
技術(shù)研發(fā)人員:周贛;孫立成;秦成明;張旭;柏瑞;馮燕鈞;傅萌
受保護的技術(shù)使用者:東南大學
文檔號碼:201610664905
技術(shù)研發(fā)日:2016.08.12
技術(shù)公布日:2017.01.25