一種嵌入式深度學(xué)習(xí)處理器的制造方法
【專利摘要】本發(fā)明屬于集成電路技術(shù)領(lǐng)域,具體為一種嵌入式深度學(xué)習(xí)處理器。該深度學(xué)習(xí)處理器包括:中央處理器(CPU),完成處理器學(xué)習(xí)和運(yùn)行過程中必要的邏輯運(yùn)算、控制及存儲工作;深度學(xué)習(xí)單元,深度學(xué)習(xí)算法的硬件實(shí)現(xiàn)單元,是進(jìn)行深度學(xué)習(xí)處理的核心部件。該深度學(xué)習(xí)處理器結(jié)合傳統(tǒng)CPU與深度學(xué)習(xí)組合單元,其中深度學(xué)習(xí)組合單元可由多個深度學(xué)習(xí)單元任意組合,具有可擴(kuò)展性,可針對不同的計算規(guī)模,作為人工智能應(yīng)用的核心處理器。
【專利說明】
一種嵌入式深度學(xué)習(xí)處理器
技術(shù)領(lǐng)域
[0001 ]本發(fā)明屬于集成電路技術(shù)領(lǐng)域,具體涉及一種嵌入式深度學(xué)習(xí)處理器。
【背景技術(shù)】
[0002]深度學(xué)習(xí)處理器,就是給電腦創(chuàng)造出模仿人類大腦多層大規(guī)模人工神經(jīng)網(wǎng)絡(luò)的芯片。經(jīng)過近60年的發(fā)展,人工智能已經(jīng)取得了巨大的進(jìn)步,但總體上還處于發(fā)展初期。當(dāng)前,面向特定領(lǐng)域的專用人工智能技術(shù)已取得突破性進(jìn)展,甚至可以在單點(diǎn)突破、局部智能水平的單項(xiàng)測試中超越人類智能,比如工業(yè)機(jī)器人、人臉識別、虹膜識別等。隨著計算機(jī)、互聯(lián)網(wǎng)技術(shù)的發(fā)展,谷歌、百度等公司陸續(xù)推出“AlphaGo” “百度大腦”等深度學(xué)習(xí)程序,推動著人工智能的不斷進(jìn)步。
[0003]深度學(xué)習(xí)的提出使得人工神經(jīng)網(wǎng)絡(luò)重新成為機(jī)器學(xué)習(xí)最重要的算法之一,在傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練中增加了一個預(yù)訓(xùn)練階段,即用無監(jiān)督學(xué)習(xí)對每一層網(wǎng)絡(luò)進(jìn)行一次專門的訓(xùn)練,然后才用有監(jiān)督學(xué)習(xí)對整個網(wǎng)絡(luò)進(jìn)行總體訓(xùn)練,也就是說計算機(jī)通過深度神經(jīng)網(wǎng)絡(luò),模擬人腦的機(jī)制來學(xué)習(xí)、判斷、決策。通過深度學(xué)習(xí)方法,人工神經(jīng)網(wǎng)絡(luò)的效果一舉趕上甚至顯著超過了支持向量機(jī)等其他機(jī)器學(xué)習(xí)方法。近年來,這種方法已被應(yīng)用于許多領(lǐng)域,在IBM、谷歌、微軟、科大訊飛、百度等公司很多工業(yè)級圖像和語音處理應(yīng)用上取得了非常好的效果,在近期和未來都將是人工智能領(lǐng)域的一個熱點(diǎn)研究方向。
[0004]當(dāng)今的深度學(xué)習(xí)處理多由大量的CPU及GPU堆積成大型運(yùn)算工作站,在軟件層面實(shí)現(xiàn)深度學(xué)習(xí)算法,直至2016年中國科學(xué)院計算機(jī)所發(fā)布了寒武紀(jì)神經(jīng)網(wǎng)絡(luò)處理器,真正在硬件層面上實(shí)現(xiàn)了深度學(xué)習(xí),其采用特有的深度學(xué)習(xí)處理器指令集,從運(yùn)算速度到硬件架構(gòu)上都有了質(zhì)的飛躍。但是寒武紀(jì)的缺點(diǎn)在于它無法擴(kuò)展,一款芯片只能針對一種特定的計算規(guī)模,甚至針對一種應(yīng)用,這對于人工智能在生活方方面面的推廣帶來了阻礙,將耗費(fèi)大量的時間及人力成本。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于提供一種能夠克服上述現(xiàn)有技術(shù)的缺點(diǎn)嵌入式深度學(xué)習(xí)處理器。
[0006]本發(fā)明提供的嵌入式深度學(xué)習(xí)處理器,其包括:
中央處理器,用于完成處理器學(xué)習(xí)和運(yùn)行過程中必要的邏輯運(yùn)算、控制及存儲工作; 深度學(xué)習(xí)組合單元,用于實(shí)現(xiàn)深度學(xué)習(xí)算法的硬件單元,進(jìn)行深度學(xué)習(xí)處理的核心部件。
[0007]具體地,所述深度學(xué)習(xí)組合單元可由多個深度學(xué)習(xí)單元以各種形式組成。
[0008]所述深度學(xué)習(xí)單元為深度學(xué)習(xí)算法的硬件實(shí)現(xiàn),包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)單元或GRU單元等。
[0009]所述深度學(xué)習(xí)處理器具有可擴(kuò)展性,即通過增加所述深度學(xué)習(xí)組合單元的數(shù)量或級聯(lián)所述中央處理器,擴(kuò)大計算規(guī)模。
[0010]本發(fā)明的技術(shù)效果是,通過結(jié)合傳統(tǒng)CPU與深度學(xué)習(xí)組合單元,其中深度學(xué)習(xí)組合單元可由多個深度學(xué)習(xí)單元任意組合,具有可擴(kuò)展性,可針對不同的計算規(guī)模,作為人工智能應(yīng)用的核心處理器。
【附圖說明】
[0011]圖1是本發(fā)明的嵌入式深度學(xué)習(xí)處理器的硬件結(jié)構(gòu)示意圖。
[0012]圖2至圖4是深度學(xué)習(xí)組合單元的組合結(jié)構(gòu)示例圖。
【具體實(shí)施方式】
[0013]在下文中結(jié)合圖示在參考實(shí)施例中更完全地描述本發(fā)明,本發(fā)明提供優(yōu)選實(shí)施例,但不應(yīng)該被認(rèn)為僅限于在此闡述的實(shí)施例。
[0014]圖1所示為本發(fā)明嵌入式深度學(xué)習(xí)處理器的硬件結(jié)構(gòu)示意圖,由CPU11和若干深度學(xué)習(xí)組合單元12組成,兩者協(xié)同處理,實(shí)現(xiàn)深度學(xué)習(xí)。深度學(xué)習(xí)組合單元可以僅為單個深度學(xué)習(xí)單元,如CNN(Convolut1nal Neural Network)單元或GRU(Gated Recurrent Unit)單元;也可以為多個深度學(xué)習(xí)單元組合而成,如圖2至圖4的示例圖,單元互相級聯(lián)或并聯(lián),達(dá)到所需的運(yùn)算和學(xué)習(xí)效果。
[0015]正是由于深度學(xué)習(xí)組合單元的自由度,在本發(fā)明的硬件結(jié)構(gòu)上,可以添加、刪減或任意組合深度學(xué)習(xí)單元,也可以將CPU級聯(lián),具有可擴(kuò)展性,從而達(dá)到對不同運(yùn)算規(guī)模的適應(yīng)性,可廣泛應(yīng)用于深度學(xué)習(xí)人工智能的各個領(lǐng)域。
[0016]以上通過特定的具體實(shí)例說明本發(fā)明的實(shí)施方式,本領(lǐng)域技術(shù)人員可由本說明書所揭露的內(nèi)容輕易地了解本發(fā)明的其他優(yōu)點(diǎn)與功效。本發(fā)明還可以通過另外不同的【具體實(shí)施方式】加以實(shí)施或應(yīng)用,本說明書中的各項(xiàng)細(xì)節(jié)也可以基于不同觀點(diǎn)與應(yīng)用,在沒有背離本發(fā)明的精神下進(jìn)行各種修飾或改變。
【主權(quán)項(xiàng)】
1.一種嵌入式深度學(xué)習(xí)處理器,其特征在于,包括: 中央處理器,完成處理器學(xué)習(xí)和運(yùn)行過程中必要的邏輯運(yùn)算、控制及存儲工作; 深度學(xué)習(xí)組合單元,實(shí)現(xiàn)深度學(xué)習(xí)算法的硬件單元,是進(jìn)行深度學(xué)習(xí)處理的核心部件。2.如權(quán)利要求1所述的嵌入式深度學(xué)習(xí)處理器,其特征在于,所述深度學(xué)習(xí)組合單元由多個深度學(xué)習(xí)單元以各種形式組成。3.如權(quán)利要求2所述的嵌入式深度學(xué)習(xí)處理器,其特征在于,所述深度學(xué)習(xí)單元包括卷積神經(jīng)網(wǎng)絡(luò)單元或GRU單元。4.如權(quán)利要求1所述的嵌入式深度學(xué)習(xí)處理器,其特征在于,通過增加所述深度學(xué)習(xí)組合單元的數(shù)量或級聯(lián)所述中央處理器,擴(kuò)大計算規(guī)模。
【文檔編號】G06N3/063GK106022472SQ201610342944
【公開日】2016年10月12日
【申請日】2016年5月23日
【發(fā)明人】史傳進(jìn), 陳遲曉, 張怡云, 馬睿, 丁宏偉
【申請人】復(fù)旦大學(xué)