面向硬件加速的通用图像卷积实验平台①阚保强(福建师范大学协和学院信息技术系,福州350003)通讯作者:阚保强,E-mail:bqkan@163.
com摘要:FPGA因具有较好的并行处理能力和灵活性,使其在卷积神经网络硬件加速计算中得到广泛的应用,但是传统的FPGA图像卷积实现中存在模块化设计以及空间开销较大的问题.
本文提出了一种面向硬件加速的通用图像卷积开发平台.
通过模块化设计,极大提高针对不同卷积核实现图像卷积开发的灵活性;另外通过图像批次处理技术,充分利用数据重复性实现内存共享,较好地降低了存储空间的开销.
实验结果表明,本文设计的平台在模块化设计方面提供了更好的可重配置架构,非常适于实验教学应用;在存储空间需求方面,当并行度提高时,BRAM的复杂度只是线性增加,这对于功耗的降低具有优势.
关键词:FPGA;硬件加速;图像卷积;并行度引用格式:阚保强.
面向硬件加速的通用图像卷积实验平台.
计算机系统应用,2021,30(2):77–82.
http://www.
c-s-a.
org.
cn/1003-3254/7778.
htmlHardwareAccelerationOrientedGeneralExperimentPlatformofImageConvolutionKANBao-Qiang(FacultyofInformationTechnology,ConcordCollege,FujianNormalUniversity,Fuzhou350003,China)Abstract:Withfineparallelprocessingcapabilityandflexibility,FieldProgrammableGateArray(FPGA)hasbeenwidelyappliedtohardware-acceleratedcomputation,especiallyinConvolutionNeuralNetworks(CNN).
However,traditionalimageconvolutiononFPGAhaslimitedmodulardesignandlargespaceoverhead.
Thisstudybuildsageneralexperimentplatformofimageconvolutionforhardwareacceleration.
Throughthemodulardesign,itgreatlyimprovestheflexibilityinimageconvolutionfordifferentconvolutionkernels.
Inaddition,animagebatch-processingsystemisadoptedtoenablememorysharingduetodatarepetition,reducingtheneedforstoragespace.
Experimentalresultspresentthattheproposedplatformboastsabetterreconfigurablearchitectureintermsofmodulardesign.
Besides,thecomplexityofBRAMonlyincreaseslinearlywithhigherparallelism,whichhastheadvantageofreducingpowerconsumption.
香港ctg云服务器香港ctg云服务器官网链接 点击进入妮妮云官网优惠活动 香港CTG云服务器地区CPU内存硬盘带宽IP价格购买地址香港1核1G20G3M5个19元/月点击购买香港2核2G30G5M10个40元/月点击购买香港2核2G40G5M20个450元/月点击购买香港4核4G50G6M30个80元/月点击购买香...
RAKsmart 商家我们肯定不算陌生,目前主要的营销客户群肯定是我们。于是在去年的时候有新增很多很多的机房,比如也有测试过的日本、香港、美国机房,这不今年有新增韩国机房(记得去年是不是也有增加过)。且如果没有记错的话,之前VPS主机也有一次磁盘故障的问题。 这不今天有看到商家新增韩国服务器产品,当然目前我还不清楚商家韩国服务器的线路和速度情况,后面我搞一台测试机进行...
RackNerd 商家给的感觉就是一直蹭节日热点,然后时不时通过修改配置结构不断的提供低价年付的VPS主机,不过他们家还是在做事的,这么两年多的发展,居然已经有新增至十几个数据中心,而且产品线发展也是比较丰富。比如也有独立服务器业务,不过在他们轮番的低价年付VPS主机活动下,他们的服务器估摸着销路不是太好的。这里,今天有看到RackNerd商家的独立服务器业务有促销。这次提供美国多个机房的高配独立...