近日,中國科學院自動化研究所曾毅研究員課題組提出基于FPGA的脈沖神經網絡硬件加速器“智脈·螢火”(FireFly),并集成了針對FPGA器件特點的DSP運算優化策略和適配脈沖神經網絡數據流模式的高效的突觸權重和膜電壓訪存系統,在硬件上實現了脈沖神經網絡的推理加速,推動了類腦脈沖神經網絡邁向實用化的發展。相關研究成果發表在IEEE Transactions on Very Large Scale Integration (VLSI) Systems上。
隨著算法機制的深入研究,類腦脈沖神經網絡性能逐步提高,但適配脈沖神經網絡的硬件落后于算法的發展。FPGA作為可編程硬件,是新興的脈沖神經網絡的理想硬件載體。然而,現有的針對FPGA的脈沖神經網絡加速器在運算和存儲效率上均有不足。
“智脈·螢火”作為具有運算和訪存優化的高吞吐率類腦脈沖神經網絡加速器,能夠有效助力解決上述問題。為了提升運算效率,該研究利用Xilinx Ultrascale器件中的專用運算模塊DSP48E2實現了脈沖神經網絡的高效運算。為了提升存儲效率,該研究設計了內存系統實現高效的突觸權重和膜電壓內存訪問。同時,“智脈·螢火”是面向邊緣型FPGA器件的加速器,在資源受限的FPGA器件上依舊能達到5.53TOP/s的運算峰值吞吐率。在現有的基于脈動陣列的SNN加速器的研究當中,“智脈·螢火”在運算吞吐率指標上相比使用同等量級的FPGA器件的研究(如Cerebon[TVLSI'22])有8.5倍的提升,使其能夠在若干深層脈沖神經網絡中依舊能達到毫秒級別的延時。作為輕量級加速器,“智脈·螢火”(FireFly)與現有的使用大型FPGA設備的脈沖神經網絡加速器相比,實現了更高的運算效率。
“智脈·螢火”是人工智能平臺“類腦認知智能引擎‘智脈’”(BrainCog)在軟硬件協同方向上的階段性成果,為進一步布局未來脈沖神經網絡在更復雜的實際場景中的應用研究奠定了基礎。下一步,該團隊將在硬件上針對FPGA器件優化、微架構設計和稀疏加速等方面持續提升“智脈·螢火”工作性能,并將其實際部署于現實場景中,如基于脈沖神經網絡的智能車的自主視覺定位導航、基于事件相機的無人機高速避障、多任務多場景下的機器人環境探索等任務。