改进RFB算法的车载实时行人检测算法研究_刘婷婷.pdfVIP免费

下载本文档

阅读 2
下载 0
格式 pdf
大小 3.29 MB
约6页
2023-03-29
收藏
评论
点赞(0)
海报
举报

www·ele169·com|59软件开发0引言在目前的行人检测中系统研发中，检测速度和检测精度是制约车载识人发展的两大难点和痛点。基于视觉的行人检测技术是近年来被重点关注和研究的一项关键技术。在多种传感器中，视觉传感器具有更丰富的信息量、更高的精确性、功能更加丰富以及更合理的成本等优势。文献[1]出了一种适用于多样复杂环境下多尺度行人实时检测的方法，该方法可自适应提取可见光或红外背景下的多尺度行人，满足实际的检测精度；文献[2]针对基于视频行人检测的深度学习检测框架计算复杂度较高的问题，提出一种改进的SSD检测框架，从而实现计算量的减少。文献[3]提出了一种头部感知行人检测网络(HAPNet)，提高了遮挡条件下的行人检测性能。针对检测速度慢这一痛点，随着边缘计算的发展，采取在车辆终端部署边缘设备的方式，不仅能够实现直接在边缘设备上处理图像数据、推断计算进行检测，还能通过一定的技术手段达到行人检测这一应用对高标准实时性的要求。本文基于RFB算法思想，对其进行改进，设计了RFB—Nano算法，并将其部署在边缘设备上，改进的算法有效地提高了检测实时性，达到精确性和实时性的有效平衡表现。1基于RFB的行人检测模型■1.1RFB模块在人类的视觉皮层中，群体感受野（PopulationReceptiveField，PRF）的规模大小是视网膜图中离心率的函数，虽然各个感受野之间有差异，但是群体感受野的规模大小与离心率都呈正相关趋势。刘等人[4]受到人类感受野RF结构的启发，提出了RFB（ReceptiveFieldBlock），以加强轻量级CNN模型中对于深层特征的提取能力，如图1所示，RFB设计了多分支结构，并且在各分支上设计了不同尺度的常规卷积和空洞卷积，并通过concat（衔接）和1*1卷积，减少特征图的通道数，生成最终的特征表达。■1.2VGG16骨架网络模型VGG16由5组共13个卷积层、3个全连接层和5个池化层组成。由于一个5*5的卷积可以由两个3*3卷积串联实现，且感受野大小仍为5*5，因此整个VGG16网络均使用了同样尺寸大小的3*3卷积核进行堆叠，这样的连接方式既减少了网络模型的参数量，多层的ReLU激活函数也使得网络有更多的非线性变化，从而使得CNN的特征提取能力更强；此外，每组卷积层后都使用了2*2尺寸的最大池化层，以缩小特征图尺寸，降低计算量；网络最后还有3个全连接层，其中前两个全连接层各含有4096个神经元，通过增加的dropout机制，随机丢掉一些全连接层节点，达到防止过拟合的作用，最后一个全连接层输出图片中每个类别的概率，图...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容