基于
概率
稀疏
注意力
IGBT
模块
剩余
寿命
工况
预测
收稿日期:修回日期:录用日期:基金项目:国家自然科学基金()资助项目作者简介:钟智伟(),硕士生,从事电力电子可靠性研究通信作者:黄亦翔,副研究员;E m a i l:h u a n g y i x i a n g s j t u e d u c n文章编号:()D O I:/j c n k i j s j t u 基于概率稀疏自注意力的I G B T模块剩余寿命跨工况预测钟智伟,王誉翔,黄亦翔,肖登宇,夏鹏程,刘成良(上海交通大学 机械与动力工程学院,上海 )摘要:为提高绝缘栅双极型晶体管(I G B T)模块跨工况剩余寿命的预测精度以提升其可靠性,针对不同工况下I G B T模块的瞬态热阻特征提出一种基于概率稀疏自注意力机制和迁移学习的剩余使用寿命预测方法搭建了I G B T模块加速老化试验台,在不同温度区间进行I G B T模块功率循环实验,采集不同工况下该模块全生命周期状态数据,计算获得I G B T模块衰退过程中的瞬态热阻变化数据,提取并筛选能准确反映I G B T模块老化状态的瞬态热阻特征,并使用所提方法开展跨工况剩余使用寿命预测实验结果表明,提出的I G B T模块剩余寿命的跨工况预测方法精度明显优于其他对比方法,特别是I G B T模块早期衰退过程中的剩余寿命预测精度得到了显著提升关键词:绝缘栅双极型晶体管模块;瞬态热阻;剩余寿命预测;概率稀疏自注意力;迁移学习中图分类号:T P ;T N 文献标志码:AR e m a i n i n gU s e f u l L i f eP r e d i c t i o no f I G B TM o d u l e sA c r o s sW o r k i n gC o n d i t i o n sB a s e do nP r o b S p a r s eS e l f A t t e n t i o nZHONGZ h i w e i,WANGY u x i a n g,HU ANGY i x i a n gX I A OD e n g y u,X I AP e n g c h e n g,L I UC h e n g l i a n g(S c h o o l o fM e c h a n i c a lE n g i n e e r i n g,S h a n g h a i J i a oT o n gU n i v e r s i t y,S h a n g h a i ,C h i n a)A b s t r a c t:I no r d e rt oi m p r o v et h ea c c u r a c yo fr e m a i n i n gu s e f u ll i f e(RU L)p r e d i c t i o no fi n s u l a t e dg a t eb i p o l a rt r a n s i s t o r(I G B T)m o d u l e sa c r o s s w o r k i n gc o n d i t i o n st oe n h a n c et h e i rr e l i a b i l i t y,a n RU Lp r e d i c t i o nm e t h o db a s e do nt h eP r o b S p a r s es e l f a t t e n t i o nm e c h a n i s ma n dt r a n s f e rl e a r n i n gw a sp r o p o s e db a s e do nt h e t r a n s i e n t t h e r m a l r e s i s t a n c e f e a t u r e s o f I G B Tm o d u l e su n d e r d i f f e r e n tw o r k i n gc o n d i t i o n s A na c c e l e r a t e da g i n gt e s tb e n c ho ft h eI G B T m o d u l e w a sd e s i g n e da n g b u i l tt op e r f o r m p o w e rc y c l i n ge x p e r i m e n t si nd i f f e r e n tt e m p e r a t u r er a n g e s,a n ds t a t ed a t ao ff u l ll i f e t i m eu n d e rd i f f e r e n t w o r k i n gc o n d i t i o n sw e r ec o l l e c t e d T r a n s i e n t t h e r m a l r e s i s t a n c ec h a n g ed a t ad u r i n gt h eI G B T m o d u l ed e g r a d a t i o nw e r ec a l c u l a t e d,a n dt h e t r a n s i e n t t h e r m a l f e a t u r e s t h a t c a na c c u r a t e l yr e f l e c t t h ea g i n gs t a t eo f t h eI G B Tm o d u l ew e r ee x t r a c t e da n ds e l e c t e d T h e s e f e a t u r e sw e r eu s e d t op r e d i c t t h eRU Lo f I G B Tm o d u l e s a c r o s sd i f f e r e n tw o r k i n gc o n d i t i o n sb a s e do nt h ep r o p o s e d m e t h o d T h ee x p e r i m e n t a lr e s u l ts h o w st h a tt h ea c c u r a c yo f t h ep r o p o s e dRU Lp r e d i c t i o nm e t h o do f I G B Tm o d u l e sa c r o s sw o r k i n gc o n d i t i o n so u t p e r f o r m so t h e r c o m p a r e dm e t h o d s P a r t i c u l a r l y,t h eRU Lp r e d i c t i o na c c u r a c yd u r i n g t h e e a r l yd e g r a d a t i o ns t a g eh a sb e e ns i g n i f i c a n t l y i m p r o v e d 第 卷 第期 年月上 海 交 通 大 学 学 报J OUR NA LO FS HANGHA I J I A OT ON GUN I V E R S I T YV o l N o A u g 上海交通大学学报第 卷K e yw o r d s:i n s u l a t e dg a t eb i p o l a r t r a n s i s t o r(I G B T)m o d u l e;t r a n s i e n t t h e r m a l r e s i s t a n c e;r e m a i n i n gu s e f u l l i f e(RU L)p r e d i c t i o n;P r o b S p a r s es e l f a t t e n t i o n;t r a n s f e r l e a r n i n g绝缘栅双极型晶体管(I n s u l a t e dG a t eB i p o l a rT r a n s i s t o r,I G B T)是一种电压驱动式功率半导体器件,具有较小的导通电阻、饱和压降及驱动电流,同时兼具较快的开关速度,这些优势特性使得I G B T在工业界被广泛应用,包括以航空航天为首的重工业领域以及电动汽车一类的新兴领域工业界调查显示,功率器件是电力电子系统中最易失效的部件之一研究证明,热疲劳是导致I G B T模块失效的最主要因素随着I G B T模块应用领域的扩大,对其可靠性和使用寿命的要求也不断提高,剩余寿命预测可为元件维修更换提供参考,减少检修和停机时间,提升系统整体可靠性I G B T剩余寿命预测的方法根据预测机理主要分为基于物理模型、基于解析模型以及基于数据驱动共类基于物理模型的方法在实际使用中,通常根据I G B T模块实际参数建立物理模型并通过有限元分析来预测剩余寿命 H u a n g等基于I G B T模块键合线的应力应变模型,建立电热力多物理场耦合模型,对键合线的寿命进行分析基于物理模型的预测方法在实际工况下难以应用,需通过专家知识建立合适的物理模型,且需要获取产品的几何、电气参数基于解析模型的预测方法根据I G B T模块运行过程的失效数据建立老化循环次数和指定物理量之间的数学模型 C o f f i n M a n s o n模型和L e s i t模型建立了结温与I G B T模块寿命之间的关系,但上述两个模型仅考虑单一物理变量的影响;N o r r i s L a n d z b e r g模型和B a y e r e r模型等考虑多物理量对寿命的影响,一定程度上提高了预测的准确性基于解析模型的预测方法需大量实验数据,且需手工建立合适的数学模型,难度大基于数据驱动的方法通过挖掘I G B T模块运行的各种数据信息,结合预测模型对寿命进行预测,无需复杂的数学建模和专家知识刘子英等以集射极关断电压峰值为失效依据,建立E l m a n神经网络模型进行I G B T模块的寿命预测;葛建文等 基于I G B T模块的壳温、结温等数据计算模块热阻,利用T r a n s f o r m e r神经网络来预测剩余寿命上述方法都是在单个工况的I G B T模块上基于故障前历史数据进行预测,而更可靠的方法是使用一个在I G B T模块完整退化过程数据上训练得到的模型来预测其他I G B T模块的寿命,但实际情况下,不同电压电流工况下I G B T模块的各种参数差别较大,模型适应性差为解决现有序列预测方法无法并行处理、效率低及跨工况预测效果差的问题,提出一种基于概率稀疏注意力与迁移学习的方法,实现从已获取全生命周期退化数据的源工况迁移到全新目标工况I G B T模块寿命预测,基于I G B T模块的加速老化试验原理,搭建试验平台,获取不同工况下I G B T模块老化过程中的瞬态热阻数据,进行跨工况剩余寿命预测对比实验.实验结果表明,本方法在I G B T模块剩余寿命的跨工况预测效果上明显优于其他对比方法 I G B T剩余寿命预测方法 概率稀疏自注意力T r a n s f o r m e r 的出现使得自注意力机制在各个研究领域占据了一定的统治地位,尤其是在序列预测方面在剩余寿命预测领域,自注意力机制已经应用于轴承 和涡扇引擎 的研究中自注意力机制本质上是对样本进行权重分配,注意力函数被用来实现这种机制,其作用是将一个查询向量和一组键值向量映射到输出向量上对于输入X RLd中的一个样本向量xiRd,首先计算出对应的查询向量、键向量、值向量:QixiWqi()KixiWki()VixiWvi()式中:Wqi,Wki,WviRddk为可训练的投影矩阵,根据获得的Qi,Ki,Vi Rdk,可以计算出输出向量:A t t e n t i o n(Q,K,V)iS o f t m a xQiKTidkVi()为了关注不同特征在不同表征子空间的信息,通常会采用多头注意力方式,表达式为M(Q,K,V)C o n c a t(hiHi)WM()hi A t t e n t i o n(Q,K,V)i()式中:WMRH dkd;dkd/H,d为嵌入空间维度;H为多头的数量但上述传统自注意力的时间复杂度和空间复杂度较高经研究发现,传统自注意力机制不同的查询值对应的注意力权值分布并非全都有所侧重,部分可能趋近于均匀分布,被称为惰性分布,相应有所侧重的部分被称为激活分布,如图所示第期钟智伟,等:基于概率稀疏自注意力的I G B T模块剩余寿命跨工况预测 图经典自注意力权重分布F i g C a n o n i c a l s e l f a t t e n t i o nw e i g h td i s t r i b u t i o n利用K L散度可以对这两种分布度量进行区分,得到第i个查询向量与对应键向量的近似概率分布评估函数 为S(qi,K)m a xjqikTjdkLLjqikTjdk()式中:qi为矩阵Q的第i行;kTj为矩阵K的第j行转置;L为样本数量;其余参数与前文保持一致图所提出的模型结构F i g P r o p o s e dm o d e l s t r u c t u r e为了将复杂度降低到O(Ll nL),随机选择MLl nL个点积对计算S(qi,K),并最终选择m个得分最高的查询值,对应的分布即为激活分布,其他分布为惰性分布,它们对应的注意力权值分布会被直接设置为均匀分布,不通过点积计算获得,整个过程大大减小了计算量,加快了计算速度其中m为模型超参数,m值越大越接近传统自注意力机制,本文通过实验权衡计算速度和准确性,确定m式()()说明了概率稀疏自注意力机制优化计算效率的数学原理,为了实际对比其计算速度优化效果,将在后文与传统自注意力机制进行对比 基于概率稀疏自注意力与迁移学习的预测模型基于概率稀疏自注意力机制和迁移学习构建的剩余寿命预测模型如图所示图中,T为当前时刻,t为起始时刻,MK MMD为多核最大均值差异I G B T模块退化过程数据包含时序信息,在不使用循环神经网络(R NN)结构的情况下,位置编码是使模型能够有效利用这种时序信息的方法 对于一个输入特征序列x(x,xL),xi Rf,f为提取特征维度,将其映射到高维空间得到V(v,vL),vi Rd,对于输入序列的位置向量p(,i,L),i为序列中每个样本的位置序号,使用正余弦位置编码方式 将其映射到相同维度的高维空间得到P(p,pL),pi Rd,最终嵌入层的输出为XVP()式()为多头概率稀疏自注意模块的输入,使得注意力机制能充分利用数据特征信息及其潜在的时间先后关系多头概率稀疏自注意模块将传统多头自注意力中单头的注意力计算方法改为前文所述的概率稀疏注意力计算方法,并加上残差连接,将序列中对预测结果影响更大的样本赋予更高的权重,使模型提取到更有效的信息后面的卷积层、池化层则是为了进一步提取深度特征,保留有效信息,去掉冗余信息,避免全连接层参数量过大最后的全连接层则是根据深度特征信息进行拟合,输出预测的剩余寿命I G B T模块在不同工况下的衰退过程特征变化规律差异较大,在一个特定工况下训练的模型很难直接预测其他工况下I G B T模块剩余寿命,故模型需要进行领域自适应,减少源域和目标域特征分布 上海交通大学学报第 卷的差异性,使其提取到的深度特征更具有泛化性本文在全连接网络层使用MK MMD 来衡量源域和目标域的差异,多核函数定义为Kkmuuku()式中:k为多核函数;ku为单个核函数;u为每个核函数的权重,则MK MMD计算公式为Dk(Dls,Dlt)nsnsinsjk(zsi,zsj)ntntintjk(zti,ztj)nsntnsintjk(zsi,ztj)()式中:ns和nt分别为源域和目标域的样本数;zsi和ztj分别为源域和目标域的特征向量最终该 模型 的 优 化 目 标 由 损 失 函 数 和MK MMD距离组成:m i nnsnsiJ(xsi),ysi)lllDk(Dls,Dlt)()式中:为模型待训练优化的权重参数;J()为有标签数据集合上的损失函数;xsi为源域样本特征向量;ysi为源域样本对应标签;第二项为多层的MK MMD距离,为权重系数,l、l为参与适配的网络层第一项中的J()本文选择均方误差(M S E)函数,对应实际情况只在源域提供有标签数据,因此该项只在源域数据集上计算式()()说明了领域自适应原理,通过修改损失函数对模型参数优化进行一定限制,从而减小不同域深度特征的差异,最终提升不同域下模型的预测性能 I G B T加速老化试验 加速老化试验原理I G B T模块在实际运行过程中的寿命周期较长,短时间内很难收集到足够的退化过程数据加速老化试验在保证相同失效机理的前提下,提升试验产品所承受的应力水平,加速其失效,目的是快速获取产品退化数据,分析失效原理,根据高应力下产品的老化规 律对正常 情况下 的 产 品 进 行 寿 命预测 绝大部分I G B T模块失效由热应力引起,加速老化试验通过对I G B T模块施加热激励来提高热应力水平,从而加速其老化过程根据应力施加方式的不同,加速老化试验采用的应力施加方式主要有恒定应力、步进应力和序进应力 恒定应力具有试验理论成熟、试验过程简单成功率高的特点,故本文将其作为施加方式根据热激励的来源,热激励施加方式包括主动激励和被动激励,前者通过提高主功率电路内的电压电流使器件自身发热以达到设定温度;后者通过改变环境温度来使器件达到设定温度主动激励的方式无需借助恒温箱类额外设备,试验方案简单、成本低且更符合实际运行工况,故选择主动热激励的方式 加速老化试验台根据加速老化试验原理,搭建加速老化试验台,其电路原理图如图所示图中,GN D为接地端,E NA为使能信号端,F P GA为现场可编程门阵列,P C为计算机,R为电阻,L为电感图加速老化试验台电路原理图F i g C i r c u i ts c h e m a t i cd i a g r a m o fa c c e l e r a t e da g i n gt e s tb e n c h加速老化试验台实物如图所示,核心试验台根据不同层的设备,分为电源层、负载层、I G B T模块层及驱动数采层温度信号采集使用的传感器为超细焊点K型热电偶,测量范围为 ,通过N I 采集卡将热电偶的电压转化为实际温度,电压电流通过N I 采集卡进行采集图 I G B T加速老化试验台F i g I G B Ta c c e l e r a t e da g i n gt e s tb e n c h第期钟智伟,等:基于概率稀疏自注意力的I G B T模块剩余寿命跨工况预测 加速老化试验方案与结果S m e t等 研究发现结温差Tj和平均结温Tj m是决定I G B T寿命的重要因素,二者的表达式分别为TjTj_m a xTj_m i n()Tj mTj_m a xTj_m i n()式中:Tj_m i n为 结 温 的 最 小 值;Tj_m a x为 结 温 的 最大值本文主要研究相同结温差下不同平均结温工况I G B T模块焊料层疲劳导致的寿命问题,瞬态热阻是表征焊料层失效程度的关键参数,因此以其作为寿命表征参数研究表明,当结温差大于 时,I G B T模块以键合线失效为主;当结温差小于 时,以焊料层失效为主 将控制I G B T模块在结温波动范围为 但平均结温不同的情况下进行加速老化试验,初始状态的电流循环曲线和温度循环曲线如图所示图中,Tj为结温,Tp为壳温,I为通过I G B T模块的集射极电流图直流老化循环曲线F i g C u r v e so fD Ca g i n gc y c l e每个循环周期开始时,I G B T模块被导通,结温Tj不断上升直至到达设定的最大值Tj_m a x,此时I G B T模块被关断并开启冷却系统,直到结温Tj下降到设定的最小值Tj_m i n,如此不断重复统一工况实验下随着循环次数不断增加,Tj_m i n和Tj_m a x不变,而不同工况实验下Tj_m i n和Tj_m a x不同实 验 选 择 的I G B T模 块 型 号 为 英 飞 凌F F R R T,最高工作温度为 ,额定电流为 A在种工况下进行加速老化试验,均出现热阻增加的焊料层失效形式,实验工况及对应结果如表所示不同工况下Tj_m i n和Tj_m a x对应图中的Tj_m i n和Tj_m a x,N为I G B T模 块 失 效 时 老 化 循 环次数在相同结温差下,随着平均结温的增加,I G B T模块寿命减少,符合S m e t等 的研究结果表老化试验工况及结果T a b A g i n g t e s t c o n d i t i o n sa n dr e s u l t s模块名Tj/Tj m/Tj_m i n/Tj_m a x/N/次I G B T I G B T I G B T I G B T模块热阻在其导通一段时间内是变化的,为了充分利用热阻信息,可根据下式计算时刻t模块的瞬态热阻:Rt h(t)Tj(t)Tp(t)Vc e_o n(t)I(t)()式中:Tj(t),Tp(t)分别为t时刻I G B T模块的结温和壳温;Vc e_o n(t),I(t)分别为t时刻I G B T模块集射极的电压和电流实际采集过程只能获得离散数据,每隔 s采集一次数据以I G B T 为例,经过不同次数老化循环周期后一个完整周期内瞬态热阻的变化曲线如图所示实验初期,瞬态热阻的变化与老化循环次数的关系并不明显,随着老化循环次数的继续增加,模块瞬态热阻的最大值明显不断增加,曲线斜率也相应变化,且瞬态热阻上升的时间即I G B T模块导通时间不断减少,这是因为随着老化循环次数的增加,模块热阻增加,结温上升速度会加快,从Tj_m i n上升到Tj_m a x需要的时间也会相应减少图则对应图中循环次数较低热阻曲线的电压电流变化过程,随着老化循环次数的增加I G B T导通的时间会相应缩短因本文提出的预测模型只能输入固定长度的序列数据,为统一不同老化循环次数数据序列长度,取前s瞬态热阻数据进行I G B T模块寿命预测,保证数据都位于热阻上升阶段(见图),避免数据所处阶段不同对预测结果造成影响图不同老化循环次数I G B T 的瞬态热阻F i g T r a n s i e n tt h e r m a lr e s i s t a n c eo fI G B T w i t hd i f f e r e n t a g i n gc y c l e s 上海交通大学学报第 卷实验与对比分析 有效数据截取I G B T模块与轴承等部件类似,在很长时间内会保持稳定的健康状态,这段时间内特征信息没有衰退信息,故无法从最初时刻开始预测剩余寿命,而应该从表现出衰退趋势的时刻开始预测基于导通后s内瞬态热阻最大值使用准则 确定模块开始退化的时刻,同样以I G B T 为例进行说明,如图所示基于前 个循环热阻最大值计算得到范围,当连续 个点超过该范围,则认为对应的老化循环次数为I G B T模块开始退化的时刻图 I G B T 开始退化时刻的确定F i g D e t e r m i n a t i o no ft h et i m ew h e nI G B T s t a r t i n gt od e g r a d e 瞬态热阻特征提取与筛选端到端模型对数据量要求大且会排除有用的人工设计,对每个循环的瞬态热阻数据进行特征提取与筛选后再输入网络模型,达到简化模型的效果共提取了 个特征,如表所示表瞬态热阻特征T a b F e a t u r e so f t r a n s i e n t t h e r m a l r e s i s t a n c e特征编号特征编号最小值X绝对中位差X 最大值X峭度X 极差X均方值X 均值X均方根X 中位数X绝对均值X 第一四分位数X方根幅值X 第三四分位数X脉冲因子X 方差X波形因子X 标准差X裕度因子X 偏度X 峰值因子X 标准误差X 双对数比率X 为了去掉与I G B T模块退化过程无关信息,对所提特征进行筛选相关性可以衡量特征的变化趋势与衰退过程的一致性,若某特征的相关性计算结果越大,说明特征能更好地表征衰退过程的变化,表达式为Co r rnu(X(u)X)(RU L(u)RU L)nu(X(u)X)(RU L(u)RU L)()式中:n为总循环次数;X(t)和RU L(t)分别为t时刻的特征值和剩余寿命比例,即剩余寿命与总寿命之比;X和RU L为所有循环的均值I G B T模块的剩余寿命应该是关于老化循环次数单调的,若某特征单调性计算结果越大,则说明其能更好地表征衰退过程,单调性的表达式为Mo nnN(X)N(X)()式中:X为特征在相邻循环的变化值;N(X)为变化值大于的数量;N(X)为变化值小于的数量为了兼顾上述两个指标,定义特征选择标准为二者的均值:Cr iCo r rMo n()截取每个实验工况下I G B T模块处于退化状态的数据作为有效数据,分别以不同工况下有效数据进行特征表征能力计算并最终取其平均值,设定特征选择阈值为 ,最终共筛选出 个有效特征作为后续模型的输入,如图所示其中,个有效特征对应图中 个绿色柱状图图衰退特征表征能力F i g D e g r a d a t i o nc h a r a c t e r i s t i ca b i l i t y 模型设置对于所有实验模型,输入为筛选得到的特征序列,输出为I G B T模块对应老化循环次数下的剩余寿命比例输入序列长度设为,即每个输入样本为x(xt,xt ),xy R 具体输入样本来第期钟智伟,等:基于概率稀疏自注意力的I G B T模块剩余寿命跨工况预测 源于不同工况下I G B T热阻特征向量的滑动窗口切分,如第个样本为x(x,x),第个样本为x(x,x),其中xy为y个老化循环热阻特征向量,因此I G B T 对应样本数为 ,I G B T 对应样本数为 ,I G B T 对应样本数为 训练集或测试集会根据工况选择对应I G B T切分得到的整个样本集参数优化方法选择随机梯度下降算法,学习率初始值设为 ,每轮训练衰减为原来的/,每次迭代使用的数据样本数量(b a t c h s i z e)设为,模型主要参数如表所示表模型结构参数T a b P a r a m e t e r so fm o d e l s t r u c t u r e网络模块具体实现参数输出尺寸输入层 嵌入层一维卷积卷积核为 概率稀疏自注意力线性变换权重为 模块注意力计算 (n,dk)合并 后处理模块层正则化 一维卷积卷积核为 一维卷积卷积核为 层正则化 一维卷积卷积核为 全局池化层 全连接模块全连接层权重为 全连接层权重为 结果对比分析使用提出的模型在个实验工况下两两进行迁移,对比了由多层感知机组成的g ML P 和经典时序模型长短期记忆网络L S TM这两个无迁移模型及这两个模型 结合传统 迁移方 法 迁 移 成 分 分 析(T C A)和C O R A L 的预测效果,如表和图所示为了直观比较各模型的预测性能,选择均方误差M S E和平均绝对误差(MA E)评价指标进行对比衡量:M S Em m r(yryr)()MA Em m ryryr()式中:yr为目标域测试集每个老化循环次数对应的真实剩余寿命比例;yr为模型预测的剩余寿命比例;m 为测试集样本数量I G B T I G B T 为一个迁移任务案例简要叙述其意义,如图(a)所示 I G B T 代表源域,即有标签数据集合;I G B T 代表目标域,该部分只有特征数据,没有剩余寿命标签;无迁移模型只使用有标签的源域数据进行监督训练,直接在目标域数据上进行预测,即训练集为有标签源域数据集,测试集为目标域数据集本文提出模型在内的迁移模型则在源域数据监督学习,在目标域数据上无监督学习并预测剩余寿命,即训练集为有标签源域数据和无标签目标域数据,测试集为目标域数据结果可知,本文提出的模型在所有迁移任务上实现了最好的预测效果,在I G B T模块退化的整个过程都能较好地预测其剩余寿命进一步分析发现进行实验的无迁移模型和迁移模型都能在I G B T模块衰退后期较好地预测剩余寿命,说明提取的I G B T模块的瞬态热阻特征在衰退后期的变化规律比较一致,差异性较小,而早期特征则有较大差异,因此迁移模型在大部分任务上的预测效果要明显优于无迁移模型 I G B T 和I G B T 的实验平均结温较接近,所有对比方法在这两个工况之间的任务预测效果都优于其他任务,符合实际情况,而这两个I G B T模块的实验工况与剩余一个工况差别都较大,对比方法效果均出现明显下降,C O R A LL S TM方法甚至在I G B T I G B T 和I G B T I G B T 任务中出现了明显的负迁移现象,证明I G B T 模块的实验数据与其余两个模块数据表不同模型预测结果T a b P r e d i c t i o nr e s u l t so fd i f f e r e n tm o d e l s方法I G B T I G B T M S EMA EI G B T I G B T M S EMA EI G B T I G B T M S EMA EI G B T I G B T M S EMA EI G B T I G B T M S EMA EI G B T I G B T M S EMA E本文模型 g ML P L S TM T C Ag ML P C O R A LL S TM 上海交通大学学报第 卷图不同模型I G B T模块剩余寿命预测结果F i g I G B Tm o d u l eR U Lp r e d i c t i o nr e s u l t so fd i f f e r e n tm o d e l s图 领域自适应前后结果对比F i g C o m p a r i s o no f r e s u l t sb e f o r ea n da f t e rd o m a i na d a p t a t i o n域间差距大,且C O R A L方法无法有效地将它们的数据映射到一个合适的空间来减小这种差距为验证本文模型使用MK MMD进行领域自适应的必要性,在个任务上进行领域自适应前(不使用MK MMD,直接在源域上训练,目标域上预测)和领域自适应后的结果对比,如图 所示领域自适应后,模型预测结果的M S E和MA E相比领域自适应前均有不同程度下降,在I G B T 和I G B T 的相互迁移上提升最小,与前文所述工况相近,无迁移模型预测效果相对较好;其他迁移任务上由于工况差别较大,不使用MK MMD进行领域自适应模型很难学习到目标域下特征在衰退过程中的变化趋势;同时,从严苛工况到相对宽松工况的迁移效果更好,例 如I G B T I G B T 优 于I G B T I G B T,I G B T I G B T 优于I G B T I G B T,分析认为是严苛工况下短时间内退化信息更明显、信噪比更高、噪声影响更小,模型能够学习到更有效的特征为了更直观显示MK MMD对模型提取特征的影响,使用t分布随机近邻嵌入(t S N E)将领域自适应前后源域和目标域数据在全连接第一层的特征向量降至维,数据从剩余寿命比例由到对应的样本中均匀抽样领域自适应前,I G B T模块不断老化过程中,目标域和源域的深度特征整体分布有很大差异,只有在老化到一定程度时,特征变化才有相对接近的变化趋势,与前文实验结果显示的所有模型在老化后半段预测效果相对更好的现象符合,如图(a)所示领域自适应后,在整个衰退过程中,模型学习到的目标域深度特征和源域分布都较接近,因此使用MK MMD进行领域自适应是必要的,如图(b)所示图 中颜色从深到浅表示输入样本的剩余生命比例标签从到为验证概率稀疏自注意力机制相比传统自注意力机制在降低计算开销、加快计算速度的同时,也能很好保持预测性能,将模型的注意力模块替换为传统注意力模块,并分别在个迁移任务下进行多次实验,得到了每种迁移任务下相对表中种对比方法表现最差的预测结果提升,如图 所示,以及第期钟智伟,等:基于概率稀疏自注意力的I G B T模块剩余寿命跨工况预测 图 领域自适应前后全连接层源域和目标域的特征表示F i g F e a t u r er e p r e s e n t a t i o no f s o u r c ed o m a i na n dt a r g e td o m a i no f f u l l yc o n n e c t e dl a y e rb e f o r ea n da f t e rd o m a i na d a p t a t i o n图 预测性能提升对比F i g C o m p a r i s o no fp r e d i c t i o np e r f o r m a n c e i m p r o v e m e n t单次迭代(b a t c h)下使用两种注意力机制模型的平均计算时间对比(G P U为R T X ),如表所示表平均计算时间对比T a b C o m p u t a t i o n a l s p e e dc o m p a r i s o n方法训练时间/s推理时间/s传统自注意力机制 概率稀疏自注意力机制 相对提升比例 使用概率稀疏自注意力机制的模型相比使用传统自注意力机制的模型在训练时间和推理时间上都缩短了超过,而二者在预测性能上基本相当,M S E提升幅度最大相差不超过,MA E提升幅度最大相差不超过,因此概率稀疏自注意力机制在大幅提升计算速度的情况下仍保持了优秀的预测性能结语为了实现更准确的I G B T剩余寿命预测来提高其可靠性,在不同工况下对I G B T模块进行了加速老化试验,提出了一种基于概率稀疏自注意力机制和迁移学习的方法,利用瞬态热阻在模块衰退过程的变化数据,实现了I G B T模块剩余寿命的跨工况预测该方法能够减小目标域样本和源域样本深度特征分布的差异,从而在所有迁移任务上达到最优效果,大幅提升了I G B T模块早期衰退过程中的剩余寿命预测精度,同时证明了两个相近工况模型迁移较容易,而两个相差较大的工况,从更严苛的工况迁移到更宽松的 工况与反向 迁 移 相 比 提 升 更 加明显参考文献:C A R AME LC,AU S T I NP,S AN CHE ZJL,e t a lI n t e g r a t e dI G B T s h o r t c i r c u i tp r o t e c t i o ns t r u c t u r e:D e s i g na n do p t i m i z a t i o nJM i c r o e l e c t r o n i c s J o u r n a l,():刘嘉诚基于机器学习算法的I G B T寿命预测研究D合肥:合肥工业大学,上海交通大学学报第 卷L I UJ i a c h e n g I G B Tl i f ep r e d i c t i o nb a s e do nm a c h i n el e a r n i n ga l g o r i t h mDH e f e i:H e f e iU n i v e r s i t yo fT e c h n o l o g y,YANGSY,B R YAN T A,MAWB Y P,e ta lA ni n d u s t r y b a s e ds u r v e y