基于
机器
学习
有色金属
冶炼
工序
识别
繁荣
电 子 测 量 技 术E L E C T RON I CME A S U R EME N TT E CHNO L O G Y第4 5卷 第2 3期2 0 2 2年1 2月 D O I:1 0.1 9 6 5 1/j.c n k i.e m t.2 2 1 0 1 9 8基于机器学习的有色金属冶炼工序识别*汪繁荣1,2 方祖春1,2 刘宇航1 汪筠涵1(1.湖北工业大学电气与电子工程学院 武汉 4 3 0 0 6 8;2.襄阳湖北工业大学产业研究院 襄阳 4 4 1 1 0 0)摘 要:为实现生产工序的准确识别,提出基于机器学习的工序识别模型,分别选取时间卷积网络、长短期记忆网络、支持向量机构建工序识别模型,并结合某钛金属冶炼企业生产能耗数据对模型进行测试验证。首先对历史功率及工序数据进行预处理,然后根据生产特征构造用于模型训练及测试数据集,最后结合数据集对模型进行训练和测试。结果表明基于时间卷积网络的识别模型具有较高的工序识别准确率,针对测试集的工序识别准确率达9 6.9 4%。关键词:机器学习;时间卷积网络;长短期记忆网络;支持向量机;工序识别中图分类号:TM 7 1 4 文献标识码:A 国家标准学科分类代码:5 1 0.1 0 5 0N o n-f e r r o u s m e t a l s m e l t i n g p r o c e s s i d e n t i f i c a t i o n b a s e d o n m a c h i n e l e a r n i n gW a n g F a n r o n g1,2 F a n g Z u c h u n1,2 L i u Y u h a n g1 W a n g J u n h a n1(1.S c h o o l o f E l e c t r i c a l a n d E l e c t r o n i c E n g i n e e r i n g,H u b e i U n i v e r s i t y o f T e c h n o l o g y,Wu h a n 4 3 0 0 6 8,C h i n a;2.X i a n g y a n g I n d u s t r i a l I n s t i t u t e o f H u b e i U n i v e r s i t y o f T e c h n o l o g y,X i a n g y a n g 4 4 1 1 0 0,C h i n a)A b s t r a c t:I n o r d e r t o r e a l i z e t h e a c c u r a t e i d e n t i f i c a t i o n o f p r o d u c t i o n p r o c e s s e s,a p r o c e s s i d e n t i f i c a t i o n m o d e l b a s e d o n m a c h i n e l e a r n i n g w a s p r o p o s e d.T i m e c o n v o l u t i o n n e t w o r k,l o n g a n d s h o r t t e r m m e m o r y n e t w o r k a n d s u p p o r t v e c t o r m a c h i n e w e r e s e l e c t e d t o b u i l d t h e p r o c e s s i d e n t i f i c a t i o n m o d e l,a n d t h e m o d e l w a s t e s t e d a n d v e r i f i e d w i t h t h e p r o d u c t i o n e n e r g y c o n s u m p t i o n d a t a o f a t i t a n i u m m e t a l r e f i n i n g e n t e r p r i s e.F i r s t l y,t h e h i s t o r i c a l p o w e r a n d p r o c e s s d a t a w e r e p r e p r o c e s s e d,a n d t h e n t h e m o d e l t r a i n i n g a n d t e s t i n g d a t a s e t w a s c o n s t r u c t e d a c c o r d i n g t o t h e p r o d u c t i o n c h a r a c t e r i s t i c s.F i n a l l y,t h e m o d e l w a s t r a i n e d a n d t e s t e d b a s e d o n t h e d a t a s e t.T h e r e s u l t s s h o w s t h a t t h e r e c o g n i t i o n m o d e l b a s e d o n t i m e c o n v o l u t i o n n e t w o r k h a s a h i g h a c c u r a c y o f p r o c e s s i d e n t i f i c a t i o n,a n d t h e a c c u r a c y o f p r o c e s s i d e n t i f i c a t i o n f o r t e s t s e t s r e a c h e s 9 6.9 4%.K e y w o r d s:m a c h i n e l e a r n i n g;t i m e c o n v o l u t i o n n e t w o r k;l o n g a n d s h o r t t e r m m e m o r y n e t w o r k;s u p p o r t v e c t o r m a c h i n e;p r o d u c t i o n p r o c e s s r e c o g n i t i o n 收稿日期:2 0 2 2-0 6-0 3*基金项目:国家自然科学基金(6 1 9 0 3 1 2 9)项目资助0 引 言 近年来由于温室效应的不断恶化和自然资源的逐渐枯竭,可持续发展和低碳节能逐渐得到许多行业的关注与支持。我国钢铁、有色金属等冶炼行业由于其生产工艺特点,一直存在能耗高的问题,是我国减少碳排放重点关注行业之一。因此针对有色金属冶炼的生产能耗管理系统具备一定的应用前景。根据相关生产数据确定生产工序,即有助于对生产线生产过程进行实时监测,也可计算出每道工序对应的生产时间、功率,结合能耗管理系统进行详细的用能分析。同时根据电能计费的峰-平-谷规则,在确保产量等要求的情况下,对所有的生产过程进行合理的安排与规划,避开计费高峰,从而降低企业生产成本,提高生产效益,而确定生产工序有助于管理人员监测实际生产过程是否与计划保持一致,并及时做出相应的处理。目前针对少量数据、规律较明显的工序识别可以通过人工分析确定,如文献1 通过系统采集的瓦斯浓度变化规律判定掘进工作面生产工序。但是对于数据量大、逻辑关系较复杂的生产工序确定问题,人工分析实现起来较困难,或识别结果准确率难以达到应用要求。如今机器学习在机器视觉、文本识别、故障判别等领域2-3取得了一系列的成就,基于机器学习方法的分类模型在分类或识别方面拥有更强的能力,通过数据驱动的识别或分类模型能够从海量数据中学习输入与输出间的高维、非线性关系,并排除错误信息,最终做出智能诊断决181 第4 5卷电 子 测 量 技 术策4-6。本文选择常用的3种机器学习算法进行模型构建,分别为 时 间 卷 积 网 络(t e m p o r a l c o n v o l u t i o n a l n e t w o r k,T C N)、长短期记忆神经网络(l o n g s h o r t t e r m m e m o r y,L S TM)、支持向量机(s u p p o r t v e c t o r m a c h i n e,S VM)。并结合青海某钛金属冶炼企业某生产线生产能耗及生产工序信息对模型进行训练和测试,选出工序识别率准确率较高的模型,用于企业生产线实际工序识别,并结合能耗管理系统、生产管理系统,助力企业实现节能、增效目的。1 方法介绍1.1 T C N网络 时间卷积网络(T C N)是一种基于残差模块的卷积网络,其不仅具备卷积网络在数据特征提取、并行处理等方面的优势,而且通过卷积操作代替递归操作还可用于处理时序数据7。T C N的结构如图1所示,从结构图中可知,任意t时刻的输出,只和t时刻及之前的输入有关,且每一层链接到上一层时可以间隔一定距离选择数据,依次类推,可以保证输出层具有较大范围的视野,从而该模型可以学习数据的长期依赖关系。因此,结合相关激活函数T C N既可以用于构建数据预测类模型,也可用于解决故障诊断分类等问题。图1 T C N结构T C N主要结构的组成部分及介绍如表1所示。其中膨胀卷积使得模型拥有较大的视野同时减小了模型的复杂度,因此T C N可以处理长期的数据依赖关系。残差连接可以加速模型收敛,同时防止模型退化,避免出现梯度消失问题。表1 T C N各组成部分名称数学表达式说明因果卷积F(xt)=Ki=1fixt-K+i按 照 时 间 先 后 进 行 卷积操作,保证没有泄露未来信息。膨胀卷积F(xt)=Mi=0fixt-di增大每层感受野,减小卷积层数量。残差连接F(xl,Wl)=H(xl)-xl防止模型退化,模型收敛更快。式中:fi为滤波器i对应的参数,K为卷积核大小,M为滤波器个数,d为膨胀系数,Wl为l层的权重参数矩阵,H(xl)为实际目标映射值。1.2 L S TM网络 长短期记忆网络(L S TM)是一种改进的循环神经网络,相对于传统的循环神经网络R NN只能处理一定短期依赖问题,L S TM算法可用于处理长期非线性、非平稳的时间序列数据8-9。L S TM网络单元结构如图2所示。图2 L S TM网络单元结构相对于传统的循环神经网络R NN新增了门结构和单元状态,其中门结构包含类型及相关信息如表2所示1 0。表2 门结构类型及相关信息门类型数学表达式作用遗忘门ft=(Wfht-1,xt+Bf)决定单元状 态中丢弃的数据输入门it=(Wiht-1,xt+Bi)rt=t a n h(Wrht-1,xt+Br)ct=ftct-1+itrt决定单元状 态中保存的数据输出门ot=(Woht-1,xt+Bo)ht=ott a n h(ct)决定单元状 态中输出的数据 xt为t时刻的输入信息,ht为t时刻的输出信息,为s i g m o i d激活函数,t a n h 是双曲正切激活函数,xt表示当前时刻的样本输入,其中,Wf、Wi、Wr、Wo、Bf、Bi、Br、Bo为相关矩阵,ct为当前单元状态,rt表示当前时刻保存的信息。1.3 S VM算法 支持向量机(S VM)是一种运用统计学相关理论进行机器学习训练的人工智能算法1 1,主要用于解决二分类问题,其主要思想为求解以最大间隔分割训练数据的最优超平面,对于线性不可分等复杂数据,使用相关核函数将原始数据映射到高维特征空间中进行求解1 2。基于S VM的模型由于其精确、稳健,且不容易出现过拟合现象等优点在分类、回归及模式识别领域具有一定的应用前景1 3-1 4。假定给定的分类集为: