基于
改进
YOLOv5
CRNN
表示
识别
电 子 测 量 技 术E L E C T R ON I CME A S UR EME N TT E CHNO L OG Y第4 6卷 第1期2 0 2 3年1月 D O I:1 0.1 9 6 5 1/j.c n k i.e m t.2 2 1 0 3 0 3基于改进Y O L O v 5与C R N N的电表示数识别*黄 辉 肖 豪 王琼瑶 吴建强 梁志龙(五邑大学智能制造学部 江门5 2 9 0 3 0)摘 要:为了提高电表示数检测和识别的准确率,基于轻量高效的YO L O v 5 s网络提出了改进的目标检测网络。首先,在特征提取阶段添加C B AM注意力机制对图像的重要特征进行自主学习,并设计了一种特征融合网络D-B i F P N加强了对深层特征的提取;其次,引入C I OU损失函数,使目标框的回归更加稳定。对C R NN文本识别算法的主干网络进行改进,模型保持轻量化的特点,在移动端部署上有良好的前景。最后,在电表数据集上测试得出:相比于Y O L O v 5算法,所提出的算法精度均值提升了5.1 3%;相比于C R NN算法,所提出的文本识别算法准确率提升了7.4%。实验结果表明,改进后的文本检测算法对电表示数的检测精度较高,文本识别算法准确率和速度较高,满足电表示数检测识别的实际应用需求。关键词:电表示数识别;YO L O v 5;C R NN;注意力机制;文本检测中图分类号:T P 3 9 1 文献标识码:A 国家标准学科分类代码:4 6 0E l e c t r i cm e t e r i n d i c a t i o nr e c o g n i t i o nb a s e do n i m p r o v e dY o L o v 5a n dC R N NH u a n gH u i X i a oH a o W a n gQ i o n g y a o W uJ i a n q i a n g L i a n gZ h i l o n g(I n t e l l i g e n tM a n u f a c t u r i n gD e p a r t m e n to fW u y iU n i v e r s i t y,J i a n g m e n5 2 9 0 3 0,C h i n a)A b s t r a c t:I no r d e r t oi m p r o v et h ea c c u r a c yo fm e t e rr e a d i n gd e t e c t i o na n dr e c o g n i t i o n,a ni m p r o v e dt a r g e td e t e c t i o nn e t w o r ki sp r o p o s e db a s e do nt h e l i g h t w e i g h t a n de f f i c i e n tYO L O v 5 sn e t w o r k.F i r s t l y,i nt h e f e a t u r ee x t r a c t i o ns t a g e,C B AMa t t e n t i o nm e c h a n i s mi sa d d e dt ol e a r nt h ei m p o r t a n tf e a t u r e so ft h ei m a g e,a n daf e a t u r ef u s i o nn e t w o r kD-B i F P Ni sd e s i g n e dt oe n h a n c e t h ee x t r a c t i o no fd e e pf e a t u r e s;S e c o n d l y,t h eC I OUl o s s f u n c t i o n i s i n t r o d u c e dt om a k et h er e g r e s s i o no f t h e t a r g e tb o xm o r es t a b l e.T h eb a c k b o n en e t w o r ko fC R NNt e x t r e c o g n i t i o na l g o r i t h mi s i m p r o v e d.T h em o d e lm a i n t a i n s t h e c h a r a c t e r i s t i c so f l i g h t w e i g h t,a n dh a s ag o o dp r o s p e c t i nt h ed e p l o y m e n t o fm o b i l e t e r m i n a l s.F i n a l l y,t h e t e s t o n t h em e t e r d a t a s e t s h o w s t h a t c o m p a r e dw i t h t h eo r i g i n a lYO L O v 5a l g o r i t h m,t h e a v e r a g e a c c u r a c yo f t h ep r o p o s e da l g o r i t h mi s i m p r o v e db y5.1 3%;C o m p a r e dw i t ht h eo r i g i n a lC R NNa l g o r i t h m,t h ea c c u r a c yo ft h ep r o p o s e dt e x tr e c o g n i t i o na l g o r i t h mi si m p r o v e db y7.4%.T h ee x p e r i m e n t a lr e s u l t ss h o wt h a tt h ep r o p o s e dt e x td e t e c t i o na l g o r i t h mh a sh i g hd e t e c t i o na c c u r a c ya n ds t a b i l i t y,a n dt h e t e x t r e c o g n i t i o na l g o r i t h mh a sh i g ha c c u r a c ya n ds p e e d,w h i c hc a nm e e t t h ea p p l i c a t i o nr e q u i r e m e n t so fm e t e r r e a d i n gr e c o g n i t i o n.K e y w o r d s:e l e c t r i cm e t e r i n d i c a t i o nr e c o g n i t i o n;YO L Ov 5;C R NN;a t t e n t i o nm e c h a n i s m;t e x td e t e c t i o n 收稿日期:2 0 2 2-0 6-1 3*基金项目:国家自然科学基金青年基金(5 1 9 0 5 3 8 4)项目资助0 引 言 在当今,电力系统和人们的日常生活和工业生产息息相关,而智能电表应用在电力系统的各个方面。智能电表的产量和使用量迅速增长,在智能电表的自动化检定和电力系统巡检的过程中,电表读数不准确和读取速度慢是必须要解决的问题。一些款式较老的电表不具有后台采集信息的功能,检定时靠人工读数。对于具有后台数据采集功能的智能电表,检定的时候需要检查电表示数和后台收到的数据是否一致。传统人工读数的方法费时费力,并且读数准确率较低,人工抄录示数时容易出现错误,影响电表检定结果的准确性和客观性。在电表的自动化检定和电力系统的巡检时,急需一种效率高、准确率高的智能识别算法,摆脱传统人工的种种缺陷限制。目前一些团队做了有关电表示 数 识 别 的 工 作,欧 家 祥 等1提 出 了 一 种MA S K-L S TM-C NN算法来检测电表示数,比传统的M a s kR-C NN算法和F a s t e rR-C NN算法的识别精度提高了2%9%,结果表明有效解决背景信息干扰较多的问题;Z h o u等2开371 第4 6卷电 子 测 量 技 术发出了E A S T算法,利用F C N模型在样本目标上回归文符区域的轮廓,结果表明所有像素位置都输出了密集文字预测;L i n等3提出了一种改进的支持向量机和笔画宽度算法分别对文本进行检测和识别,结果表明可以有效克服字体大小不一、字符倾斜等 因素 对 识 别精 度 的 影 响;Z h a n等4提出了一种有效识别透视变换过的文本的R A R E算法,但是该方法收敛速度慢;B e l h a r b i等5提出了C R F与卷积神经网络结合的网络模型,文本检测后使用r e c u r i v eR NN模型,此模型插入了注意力机制,直接利用图像完成字符串学习,然后进行识别;Y a n g等6提出一种全卷积序列识别网络对数字进行识别,设计增广损失函数处理数字间隙,减少了计算量和模型参数,但是准确率不够高;T i a n等7提出了C P T N算法,将C NN与R NN网络相结合,同时融合空间和序列特征,但是该算法不能处理复杂文本。尽管现有的研究已经将电表示数的目标检测和识别与深度学习方法结合,但是这一研究领域仍然存在以下问题:1)现有模型训练和模型预测运算复杂、耗时长,无法满足实际的应用需求。2)电表示数检测识别任务中,难点在于示数区域在电表图像中的区域较小,不易被完整检测出来。示数中存在小数点,应用传统文本识别算法,难以解决。针对以上问题,本文提出一种电表示数检测和识别算法,将改进后的YO L Ov 5作为电表示数的目标检测算法,在特征提取网络C S P D a r k n e t 5 3中插入通道和空间维度注意力机制并且提出一种D-B i F P N替换原网络中的P AN e t,使网络可以自主学习输入图像的重要特征并且加强对图像更深层信息的特征提取。其次,引入C I OU8损失函数使预测框的回归效果更好,使目标检测的准确率和运算时间都优于 原 算 法。对 检 测 到 的 文 本 区 域,通 过 改 进 后 的C R NN(c o n v o l u t i o n a lr e c u r r e n tn e u r a ln e t w o r k)算法进行文本识别,C R NN算法无需进行文本分割,对小数点在内的数字文本识别效果准确率高,识别速度快。算法本身不受电表背光颜色、场景、字体大小不一和曝光率等问题的约束,对各种环境下采集到的图像均有较好的识别能力。1 基于Y O L O v 5算法的电表示数检测1.1 Y O L O v 5网络架构 本文使用的是YO L O v 5 s模型。YO L O v 5 s网络主要包括输入端、B a c k b o n e模块、N e c k模块以及H e a d模块。YO L O v 5 s网络的输入端增加了M o s a i c数据增强算法,使用在模型训练阶段,提高了小目标的检测效果。训练数据集时可通过自适应计算得到最佳锚框值,这有利于提升检测速度。B a c k b o n e模块主要使用C S P D a r k N e t 5 3和空间金字塔池化结构9。B a c k b o n e模块引入一种新的F o c u s结构,它对图像进行切片,把图片的宽度w及高度h信息整合到通道c维度,所以宽度w及高度h缩小成为原来的1/2,在通道方向上拼接,通道c则会增加4倍。F o c u s模块有效减少了信息丢失、提高了检测速度。空间金字塔池化结构中使用3