去年空闲之余基于FPGA实现了类YOLO的轻量化的CNN加速器。为了方便,直接基于Ultra96平台进行了验证,整个加速器资源消耗还算客观,帧率基本在200FPS左右。
FPGA实现架构
硬件资源消耗:
后面打算优化架构设计,实现一种更为轻量级或者资源占用更少的CNN加速器,这样可以在低端的片子,以更少的资源和主频,达到同样的效果。先立个flag。争取这几个月实现tiny yolov3的轻量级加速器,可以在Artix50T或者7020的FPGA上,达到实时性能。
时间:2019-03-07 16:08:08
去年空闲之余基于FPGA实现了类YOLO的轻量化的CNN加速器。为了方便,直接基于Ultra96平台进行了验证,整个加速器资源消耗还算客观,帧率基本在200FPS左右。
FPGA实现架构
硬件资源消耗:
后面打算优化架构设计,实现一种更为轻量级或者资源占用更少的CNN加速器,这样可以在低端的片子,以更少的资源和主频,达到同样的效果。先立个flag。争取这几个月实现tiny yolov3的轻量级加速器,可以在Artix50T或者7020的FPGA上,达到实时性能。