1.一種方法,包括:
接收表征輸入圖像的數(shù)據(jù);
使用深度神經(jīng)網(wǎng)絡來處理表征所述輸入圖像的所述數(shù)據(jù),以生成所述輸入圖像的替選表示,其中,所述深度神經(jīng)網(wǎng)絡包括多個子網(wǎng),其中,所述子網(wǎng)被布置在從最低到最高的序列中,并且其中,使用所述深度神經(jīng)網(wǎng)絡處理表征所述輸入圖像的所述數(shù)據(jù)包括:通過所述序列中的所述子網(wǎng)中的每一個來處理所述數(shù)據(jù);以及
通過輸出層來處理所述輸入圖像的所述替選表示,以根據(jù)所述輸入圖像生成輸出。
2.根據(jù)權利要求1所述的方法,其中,所述多個子網(wǎng)包括多個模塊子網(wǎng),并且其中,所述模塊子網(wǎng)中的每一個被配置為:
接收由所述序列中的在前子網(wǎng)生成的在前輸出表示;
通過直通卷積層來處理所述在前輸出表示,以生成直通輸出;
通過神經(jīng)網(wǎng)絡層的一個或多個群組來處理所述在前輸出表示,以生成所述一個或多個群組中每一個的相應群組輸出;以及
連結所述直通輸出和所述群組輸出,以生成所述模塊子網(wǎng)的輸出表示。
3.根據(jù)權利要求2所述的方法,其中,所述直通卷積層為1×1卷積層。
4.根據(jù)權利要求2或3中任一項所述的方法,其中,通過所述一個或多個群組中的每一個來處理所述在前輸出表示包括:
通過神經(jīng)網(wǎng)絡層的第一群組中的每一層來處理所述在前輸出以生成第一群組輸出,其中,所述第一群組包括第一卷積層,所述第一卷積層后面跟隨有第二卷積層。
5.根據(jù)權利要求4所述的方法,其中,所述第一卷積層為1×1卷積層。
6.根據(jù)權利要求4或5中任一項所述的方法,其中,所述第二卷積層為3×3卷積層。
7.根據(jù)權利要求2至6中任一項所述的方法,其中,使用所述一個或多個群組中的每一個來處理所述在前輸出包括:
通過神經(jīng)網(wǎng)絡層的第二群組中的每一層來處理所述在前輸出以生成第二群組輸出,其中,所述第二群組包括第三卷積層,所述第三卷積層后面跟隨有第四卷積層。
8.根據(jù)權利要求7所述的方法,其中,所述第三卷積層為1×1卷積層。
9.根據(jù)權利要求7或8中任一項所述的方法,其中,所述第四卷積層為5×5卷積層。
10.根據(jù)權利要求2至9中任一項所述的方法,其中,使用所述一個或多個群組中的每一個來處理所述在前輸出包括:
通過神經(jīng)網(wǎng)絡層的第三群組中的每一層來處理所述在前輸出以生成第三群組輸出,其中,所述第三群組包括第一最大池化層,所述第一最大池化層后面跟隨有第五卷積層。
11.根據(jù)權利要求10所述的方法,其中,所述第一最大池化層為3×3最大池化層。
12.根據(jù)權利要求10或11中任一項所述的方法,其中,所述第五卷積層為1×1卷積層。
13.根據(jù)權利要求1至12中任一項所述的方法,其中,所述多個子網(wǎng)包括一個或多個附加的最大池化層。
14.根據(jù)權利要求1至13中任一項所述的方法,其中,所述多個子網(wǎng)包括一個或多個初始卷積層。
15.一種系統(tǒng),包括一個或多個計算機和存儲指令的一個或多個存儲設備,所述指令在被所述一個或多個計算機執(zhí)行時,能夠操作致使所述一個或多個計算機執(zhí)行權利要求1至14中任一項所述的相應方法的操作。
16.一種利用指令來進行編碼的計算機存儲介質,所述指令在被一個或多個計算機執(zhí)行時,致使所述一個或多個計算機執(zhí)行權利要求1-14中任一項所述的相應方法的操作。