分享
基于Moran过程的矿工违章行为惩罚机制分析.pdf
下载文档

ID:3074737

大小:383.42KB

页数:13页

格式:PDF

时间:2024-01-19

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 Moran 过程 矿工 违章行为 惩罚 机制 分析
第 38 卷第 4 期2023 年 8 月系 统 工 程 学 报JOURNAL OF SYSTEMS ENGINEERINGVol.38 No.4Aug.2023基于 Moran 过程的矿工违章行为惩罚机制分析杨雪,田阳,柴瑞瑞,邢琦钰(华北水利水电大学管理与经济学院,河南 郑州 450046)摘要:针对外部环境的高度不确定性对矿工行为的干扰,基于 Moran 过程构建了惩罚机制下的矿工违章行为的随机演化模型,分别计算了随机因素主导和期望收益主导两种情形下,矿工生产行为策略的均衡解,讨论了静态“连坐”和动态“连坐”惩罚机制对不同风险等级违章行为的规制效果.研究表明:静态“连坐”惩罚机制对违章行为的规制效果与违章行为风险等级相关,可以有效遏制矿工高风险违章行为;动态“连坐”惩罚机制对违章行为的规制效果与违章行为风险等级无关,能够有效规避静态“连坐”惩罚机制对低风险违章行为约束无效的现象.关键词:矿工违章行为;随机演化博弈;Moran 过程;“连坐”惩罚机制中图分类号:C931文献标识码:A文章编号:10005781(2023)04047413doi:10.13383/ki.jse.2023.04.004Punishment mechanism for miners violation behaviors based onMoran processYang Xue,Tian Yang,Chai Ruirui,Xing Qiyu(School of Management and Economics,North China University of Water Resources and Electric Power,Zhengzhou450046,China)Abstract:Aiming at the interference of highly uncertain external environment on miners behavior,a randomevolution model of miners violation behaviors under punishment mechanism is constructed based on Moranprocess.The equilibrium solutions of the miners production behavior strategy under the stochastic factordominance and expected payoff dominance are calculated and the regulatory effects of static and dynamic col-lective punishment mechanisms on violation behaviors of different risk levels are discussed.The results showthat the regulatory effect of the static collective punishment mechanism is related to the risk level of violationbehaviors,which could effectively curb high-risk violation behaviors of miners.The regulatory effect of thedynamic collective punishment mechanism is independent on the risk level of violation behaviors,which couldeffectively avoid the phenomenon that the static collective punishment mechanism is ineffective in restraininglow-risk violation behaviors.Keywords:miners violation behaviors;stochastic evolutionary game;Moran process;collective punishmentmechanism1引引引言言言煤炭是我国的主体能源,煤矿安全生产关系煤炭工业持续发展和国家能源安全,关系数百万矿工生命财产安全.在企业和矿工的共同努力下,煤矿安全生产形势持续稳定好转.2020 年全国煤矿安全事故总数收稿日期:20210428;修订日期:20210906.基金项目:国家自然科学基金资助项目(71573086);教育部人文社会科学研究青年基金资助项目(22YJC630002).通信作者第 4 期杨雪等:基于 Moran 过程的矿工违章行为惩罚机制分析475和死亡人数已降到 123 起/228 人1.相比发达国家,我国煤矿事故总量仍然偏大,其中我国的煤矿安全事故的 90%是由人的不安全行为所致1,在人因煤矿重大事故中,直接由矿工违章行为导致的占 55.37%2.不同于地面作业,煤矿井下作业场所是在不断发生改变,往往伴随着瓦斯、透水或冲击地压等多变、危险的作业环境.随着煤矿开采技术的提高和开采装备的改进,井下地质自然环境一般不会直接导致事故发生,而是这种不确定性地质环境与矿工不安全行为的正向耦合3.2016 年国务院安委会发布的实施遏制重特大事故工作指南构建双重预防机制的意见规定,煤矿企业应对矿工违章行为进行风险分级评定,对不同风险等级违章行为进行分级管控.在矿工作业环境的高度不确定性和消极情绪的随机因素影响下,哪些因素决定了矿工采取“安全策略”或“违章行为”的行为策略?如何设计激励机制规范矿工不同风险等级违章作业?这是煤炭行业高质量发展亟需解决的关键问题.规范矿工违章行为是煤矿安全管理的难点问题,受到了学术界日益广泛的关注.关于煤矿安全监管和矿工违章行为问题,现有研究运用系统动力学、结构方程模型以及实证分析方法,侧重于矿工安全行为影响约束因素4,5、形成机制6,7、以及煤矿安全规制有效性8,9的研究.然而,煤矿安全监管矿工作业行为问题实则表现为多方相关利益主体策略交互的博弈过程.博弈论被广泛地应用到煤矿企业监管和规范矿工违章行为的对策问题中.主要研究成果包括:矿工反生产行为控制的重复博弈模型10、煤矿安全事故产生机理的静态博弈问题11、基于动态博弈的煤矿安全监管机制设计12及煤矿企业对矿工安全规制效果比较13等.上述煤矿企业与矿工的博弈模型多集中在一次性选择(如静态博弈和动态博弈),或者基于高度遇见能力前提下的总体规划框架(如重复博弈),尚未考虑到煤矿安全主体在长期共生状态下由于内外部环境的变化持续性地策略调整问题.针对群体间参与主体相互学习、策略适应性调整特征,演化博弈理论为其提供了合理的分析框架,被广泛应用到技术溢出14、协同合作15、舆情演化16等领域.其中对于煤矿安全监管问题,研究学者采用经典的演化博弈模型,多集中于研究煤矿企业规避矿工违章行为的行为演化规律及激励机制选择17,18.然而煤矿安全监管矿工行为问题中仍然存在着以下两方面现实特征:一方面,煤矿企业的安全生产主体人员多以群组单元的形式出现(如班组、区队等),其成员数量是有限的;而经典的演化博弈理论是建立在总体无限的基础上所进行的适应性策略调整;另一方面,冲击地压、瓦斯突出、透水等造成了矿工井下作业环境的高度不确定性19,与此同时参与者的行为还会受到消极情绪等随机因素的影响20,由此造成了矿工违章行为的随机性,而经典演化博弈理论并未考虑不确定环境下随机因素对均衡的影响.基于此,有限群体环境下的随机演化博弈动态模型被提出21.在随机演化动态模型中,有限群体中个体行为选择及策略演化被当作一个随机过程,主要包括成对比较过程、Wright-Fisher 过程和 Moran 过程等22.其中,Moran 更新过程是研究和应用中最为广泛的一种随机过程机制,刻画了有限群体的演化动态23,以及每个时间步个体都以正比于其适应度的比率被选择,被选择的个体产生一个后代个体,该后代个体采取与母体相同的策略,取代种群中另外一个被随机选择的个体.关于 Moran 过程的理论研究较为丰富,最具代表性的包括 Corradi 等22使用连续逼近的方法,分析随机演化博弈中个体选择比例随时间的变化趋势;Nowak 等24推导出 Moran 过程中前后时间间隔中种群数量变化概率.另外,现有研究学者将基于 Moran 过程的随机演化博弈模型广泛应用到管理学等领域解决实际问题,主要包括电子商务25、应急反恐26,27、企业质量改进策略28、制造商生产策略29和消费者众筹30等,但对于受内外部不确定性因素随机扰动下有效规制矿工违章行为惩罚机制分析鲜有涉及.针对井下外在作业环境的高度不确定性和消极情绪等内在随机因素对矿工行为的干扰,本文提炼出矿工违章行为所具有的长期演化性和外部随机性两个基本特征和假设,基于 Moran 过程构建了“连坐”惩罚机制下的矿工违章行为随机演化模型,分析了矿工安全作业的边界条件,探究了静态“连坐”惩罚机制和动态“连坐”惩罚机制对不同风险等级违章行为的安全规制效果,以此达到对现有“连坐”惩罚机制规制效果的分析.12020 年全国煤矿发生事故 123 起、死亡 228 人.https:/ 统 工 程 学 报第 38 卷2基基基本本本假假假设设设与与与模模模型型型构构构建建建2.1基基基本本本假假假设设设假假假设设设1 煤矿安全管理者和矿工策略调整的学习行为.煤矿安全管理者和矿工会依据变化的形式不断调整自己的策略.例如,煤矿会定期开展“安全生产月”活动2,结合具体的事故案例给矿工做安全生产行为的学习和培训,矿工通过规范自身生产行为,从而达到安全生产目标.同时,煤矿管理者通过定期的隐患排查和事故案例学习等,达到对企业生产状态清晰的认识,从而调整自身的监管力度或出台新的管理条例等.假假假设设设2 矿工井下作业的内、外部环境具有高度不确定性的随机特征.煤矿井下高温、高湿的恶劣作业环境伴随着冲击地压等不确定性地质灾害对矿工生理和心理都会造成巨大影响,加之井下密闭、狭小的作业空间,矿工很容易滋生消极情绪.而情绪具有诱发性、潜伏性和多变性等特点31,对矿工的安全生产带来了高度不确定性.假假假设设设3 井下作业的矿工群体由有限个矿工成员组成.通常矿工以班组的形式下井作业,2019 年国家煤矿安全监察局发布的煤矿井下单班作业人数限员规定(试行)规定,煤矿企业应制定井下作业限员制度,如对灾害严重矿井,综掘工作面的单班人数不得超过 25 人.这里假设有限数量的矿工参与井下作业.假假假设设设4 矿工面临着采取“安全作业”或“违章行为”两种生产行为策略.矿工采取安全作业时,将会获得正常的净收益(如工资).而矿工采取违章行为,多是出于省时、省力或从众心理,违章行为将带来多于正常收益的超额收益32.假假假设设设5 煤矿企业采用“连坐”惩罚制度有效规制矿工违章行为.煤矿企业采用正向激励与负向激励相结合的方式规制矿工的违章行为,现有研究多集中于负向激励规制效果的研究.“连坐”惩罚制度相比传统责任制处罚有更强的威慑力33,已在煤矿企业规制矿工安全作业管控中广泛应用3.由此,本文研究集中于“连坐”惩罚机制的效果分析,并不涉及与非连坐惩罚机制的对比.“连坐”惩罚指的是违章作业的当事人会受到处罚,其所在班组的其他矿工也会受到连带处罚.另外,每名矿工的行为策略选择除了影响自身收益外,还将直接影响其余矿工的收益,即矿工之间存在着策略选择的博弈.2.2要要要素素素博博博弈弈弈模模模型型型同一班组矿工成员面临着可行策略集,安全作业,违章行为,记为S,C.当某矿工采取“安全作业”策略,若其他矿工也采取“安全作业”策略,此时达成安全生产合作,双方各自获得正常净收益R;若其他矿工采取“违章行为”策略,在正常净收益R的基础上,安全作业的矿工会因其他矿工的违章行为而受到“连坐”惩罚f,此时违章作业矿工会受到惩罚P34,其值存在惩罚上下限L6P6U,L为惩罚下限,U为惩罚上限.由于惩罚力度依赖于违章行为的风险等级k,若以惩罚上限U为分析基准,则惩罚力度与风险等级关系为P=kU,其中风险等级取值范围满足LU6k61.除了受到惩罚外,矿工违章行为导致矿工作业时投入的成本(时间、精力等)的减少,从而获得额外生理、心理等超额净收益35,记为V(V 0).为了有效规制矿工违章行为,煤矿企业对矿工的违章惩罚大于违章带来的超额收益,即PV.煤矿生产中,超额收益与行为风险等级成正相关4,矿工违章行为所带来的额外收益与风险等级满足V=kR.当矿工均采取“违章行为”策略时,煤矿企业为确保安全生产会加大对矿工的惩罚力度,处罚为P,其中,为惩罚系数(1).单班矿工总人数记为N,由于每名矿工的收益除与自身行为相关外,还受到其他矿工行为的影响,导致矿工间存在不同行为策略的选择问题.因此,本文主要考虑同一班组内矿工的行为选择问题,因此构建了表1 所示的单班矿工间的要素博弈22对称支付矩阵.可以看出,矿工均采用“安全作业”成为纳什均衡.22021 年全国“安全生产月”活动结束.http:/ 4 期杨雪等:基于 Moran 过程的矿工违章行为惩罚机制分析477表 1单班矿工间 22 对称随机演化博弈模型Table 122 symmetrical random evolution game model between single miner矿工 2矿工 1安全作业S违章行为C安全作业 SR,RRf,R+V P违章行为 CR+V P,RfR+V P,R+V P3基基基于于于频频频率率率依依依赖赖赖 Moran 过过过程程程的的的矿矿矿工工工违违违章章章随随随机机机演演演化化化博博博弈弈弈矿工的效用函数不仅取决于采取不同生产行为策略的期望收益,还受到诸多不确定性的随机因素影响.外在不确定性因素主要指矿工井下作业时所面临的复杂、多变的地质环境;内在随机因素主要指矿工在危险的作业环境中所滋生的消极情绪,会对矿工行为认知判断产生极大干扰.外在环境的不确定性与内在消极情绪等随机因素的耦合,使得矿工的行为策略选择呈现出高度不确定性.在单班作业人数为N的班组中,假设采取“安全作业”行为策略的矿工数量为i,其余矿工采取“违章行为”策略.采取这两种策略的矿工期望收益分别为Es=R(i 1)+(R f)(N i)N 1,i=1,2,.,N 1,(1)Ec=(R+V P)i+(R+V P)(N i 1)N 1,i=1,2,.,N 1.(2)在演化博弈动力学框架中,适应度取决于期望收益.在随机演化博弈模型中,矿工选择违章行为策略除了考虑期望收益外,也需要考虑内外部随机干扰因素.基于 Moran 过程的策略选择,需要引入一个外生变量(0661),即选择强度25,28,30.其中,在高选择强度下,效用与期望收益高度相关;在低选择强度下,效用几乎完全取决于其他外部随机干扰因素;介于两种状态之间,方便起见将效用设置为随着选择强度均匀变化36.此时构建基于随机演化博弈 Moran 过程的参与者效用函数为如下线性函数Fs=1 +Es,(3)Gc=1 +Ec.(4)基于 Moran 过程进行分析,采取“安全作业”策略的个体增加一个的概率为iFsiFs+(Ni)Gc,经过每一时间步的演化,采取“安全作业”策略的个体数量可能减少一个、不变或增加一个.其转移概率分别如下Pi,i+1=iFsiFs+(N i)GcN iN,(5)Pi,i1=(N i)GciFs+(N i)GciN,(6)Pi,i=1 pi,i1 pi,i+1.(7)在矿工生产行为策略随机演化过程中,矿工选择“安全作业”策略的人数可能增加一个、减少一个或者不变,并无其他策略选择,因此选择“安全作业”策略从状态转移到其他状态i的概率为 0,参考现有研究25,Moran 过程的一步转移概率矩阵表示为P0,0P0,10.00P1,0P1,1P1,2.000 P2,1P2,2.00.000.PN1,N1PN1,N000.PN,N1PN,N.(8)478系 统 工 程 学 报第 38 卷该过程有两个稳定状态,i=0和i=N,即全部矿工均选择“安全作业”策略或“违章行为”策略.如果群体收敛到任何一个状态,则群体将一直稳定在此状态.下面分别计算收敛到这两种状态的概率.令Xi表示选择“安全作业”策略的矿工数量从初始状态i演化到终点N的概率,由全概率公式可得Xi=Pi,i+1Xi+1+Pi,iXi+Pi,i1Xi1,i=1,2,.,N 1.(9)边界值为X0=0,XN=1.将式(5)、式(6)、式(7)代入式(9)可得Xi=1+i1j=1jk=1GkFk1+N1j=1jk=1GkFk.(10)考虑只有一名矿工选择“安全作业”策略时,最终“安全作业”策成为所有矿工稳定策略概率,由式(10)可得s=Xi=11+N1j=1jk=1GkFk.(11)同理,当只有一名矿工选择“违章行为”策略,其余N 1个个体都选择“安全作业”策略,最终“违章行为”成为单班所有矿工稳定策略概率为c=1 XN1=(G1F1G2F2.GN1FN1)/(1+G1F1+G1F1G2F2+G1F1G2F2.GN1FN1)=1/(F1G1F2G2.FN1GN1+F2G2.FN1GN1+FN1GN1+1)=11+N1j=1N1k=jFkGk.(12)分析“安全作业”策略成为稳定均衡的概率式(11)和式(12)可知,当单班矿工人员数越多,采取“违章行为”策略的效用函数G越小,采取“违章行为”策略的效用函数F越大,则“安全作业”策略成为稳定均衡的概率越大.否则,则“违章行为”策略成为稳定均衡的概率越大.由式(1)式(11)可知,效用函数G依赖于矿工安全作业收益R、矿工违章作业获得的额外收益V及受到的惩罚P,;效用函数F依赖于矿工安全作业收益R、矿工安全作业受到的“连坐”惩罚f.4演演演化化化均均均衡衡衡结结结果果果分分分析析析4.1随随随机机机主主主导导导因因因素素素下下下的的的决决决策策策分分分析析析矿工的生产行为容易受到随机因素的干扰,如井下密闭、狭小的作业空间以及恶劣的作业环境很容易导致矿工产生消极情绪,或对其他矿工的违章行为的从众心理等.这种情况经常发生在井下作业中,此时,随机因素占据了矿工行为决策的主导地位,即选择强度 0时的弱选择过程.将式(3)、式(4)代入式(11)和式(12),并在=0处进行泰勒展开得s=1N+6N(2kU+kU 3kP 2f)N+(3kR+kU 4kU+f),(13)c=1N+6N(3kR 2kU kU+f)N+(2kU+kU 3kR+f).(14)根据 Taylor23的研究,以中性漂变的固定点概率1N作为基准,研究有限总体中个体的策略选择.若s1N,c1N,s2f(2+1)U3R,则s1N,c1N,矿工选择“安全作业”策略;若k1N,s1,Rc1,则“安全作业”将成为矿工群体的演化稳定策略;若Rs1,则“违章行为”将成为矿工群体的演化稳定策略.若Rs1,Rc1,则两种策略将成为共存的混合均衡状态.4.2期期期望望望收收收益益益主主主导导导下下下的的的决决决策策策分分分析析析当矿工基于行为决策本身的成本收益进行理性决策时,即为强选择过程=1,此时不确定性因素对矿工行为的随机干扰比较小.给定某时刻采用“安全作业”的矿工数量i,通过比较两种策略的效用函数的差值,判断采用“安全作业”策略矿工数量的增减.“安全作业”与“违章行为”策略的差值表示为hi=Fi Gi,i=1,2,.,N 1.(15)将式(1)式(4)代入式(15)得h1=F1 G1=(N 1)(kU kR f)+(1 )kUN 1,(16)hN1=FN1 GN1=(N 1)(kU kR)fN 1.(17)根据 Taylor 等23理论,演化稳定策略的定义是群体中少数人采取入侵策略并被击退,则群体现有的策略称为演化稳定策略.演化稳定策略具体判断准则为:若h10,则称选择行为支持“安全作业”策略入侵“违章行为”策略;反之,若hN10且hN10,则“安全作业”策略将取代“违章行为”策略,成为演化稳定策略;若h10且hN10且hN10,则两种策略共存,此时混合策略将成为演化稳定策略;若h10,则“安全作业”成为纳什均衡.根据上述判断准则,通过分析式(16)、式(17),得到期望收益主导下矿工生产行为的演化均衡如下.命命命题题题 2(期望收益主导)当矿工基于期望收益做出生产行为决策时,当kfUR时,存在临界值N0=max(1)kUkUkRf+1,fkUkR+1,当矿工人数NN0时,“安全作业”策略将成为演化稳定策略;还存在N1=min(1)kUkUkRf+1,fkUkR+1,当矿工人数N6N1时,“违章行为”策略将成为演化稳定策略;若N (N0,N1),则两种策略的混合均衡成为演化稳定策略.当kfUR时,对于任意N,则有“违章行为”策略将成为演化稳定策略.由命题 2 知,矿工生产行为是基于期望收益主导时,针对风险等级较高的违章行为,单班矿工人员数N5煤矿安全生产“十三五规划”:重特大事故有效遏制.http:/ 统 工 程 学 报第 38 卷存在两个临界值N0和N1.若矿工人数N较小,则矿工将选择“违章行为”策略;只有当受到“连坐”惩罚的矿工数量N高于该临界值N0时,矿工才会选择“安全作业”策略.值得注意的是,随着风险等级的增加,矿工选择安全作业策略对应的矿工人数临界值是递减的.另外,针对风险等级较低的违章行为,静态惩罚机制对矿工安全规制失效,矿工将选择“违章行为”策略.煤矿企业针对受期望收益主导较强的煤矿生产辅助岗位如二线通风、机电等进行风险分级管控时,通过设置合理的单班作业人员N0,可以有效规避高风险的违章行为,而传统静态连坐惩罚制度对低风险违章行为失效.进一步地,煤矿企业可采取动态“连坐”惩罚机制规制此类违章行为.综合命题 1 和命题 2 研究结论,无论矿工的生产行为受随机因素主导还是期望收益主导,静态“连坐”惩罚机制对风险等级较低的违章行为均不能发挥有效约束,看似“无关紧要”的轻微违章行为势必会对煤矿的安全生产造成安全隐患,引发一系列连锁反应,形成“蝴蝶效应”,导致安全事故的发生.因此,如何有效降低矿工低风险违章行为的发生对煤矿企业生产安全至关重要.4.3动动动态态态“连连连坐坐坐”惩惩惩罚罚罚对对对矿矿矿工工工违违违章章章行行行为为为的的的影影影响响响针对上述分析结果可以发现,增大对违章矿工的惩罚U只能改变k的临界值,并不能影响命题 1 和命题 2 中违章行为的边界条件,命题 1 和命题 2 的结论依然成立.为增加矿工安全生产行为的可控性,借鉴 Liu 等37和李林等38的研究思路,将“安全作业”矿工的“连坐”惩罚f与违章矿工的行为风险等级k动态关联,使“安全作业”矿工与违章矿工形成“命运共同体”,对“安全作业”矿工的“连坐”惩罚由f变成kf,代入式(1)式(17),得到随机因素主导和期望收益主导下矿工均衡策略如下.命命命题题题 3当矿工生产行为由随机因素或期望收益主导时,若f1N,c0,hN10,“安全作业”策略将成为演化稳定策略.相较于命题 1 和命题 2 结果,命题 3 研究表明在动态“连坐”惩罚制度下,矿工选择“安全作业”策略的边界条件与行为风险等级k无关,即针对不同风险等级的违章行为,通过调整对“安全作业”矿工的“连坐”惩罚数值上限f的大小及对违章矿工惩罚上限U与“安全作业”矿工的正常净收益R的差值,可以有效避免静态惩罚机制对低风险违章行为约束无效的问题,提高矿工生产行为的可控性.从命题 1、命题 2、命题 3 的推论可以看出,无论是随机因素主导还是期望收益主导,静态“连坐”惩罚制度对矿工违章行为的规制效果是欠佳的(与命题推论中“针对风险等级较低的违章行为,静态惩罚机制对矿工安全规制失效”对应),动态“连坐”惩罚机制可有效规制矿工违章不同风险等级行为.上述推论在煤矿实际生产中已经得到应用,如江西丰矿集团尚庄煤矿6对矿工实施“安全伙伴”结对组合,要求“责任共担、连带考核”,其本质上是“连坐”惩罚制度在煤矿生产实际中的应用,该矿过去实行固定结对方式,但效果欠佳,原因是除了可能出现结对中的一方因工作临时调动而造成结对失效外,更重要的是依据演化博弈理论,固定结对中的成员在长期行为策略交互中会达到某一稳态,从而使“连坐”惩罚逐步退化为趋于某一固定值的静态“连坐”惩罚,降低了惩罚效果.为增加结对成员行为策略演化稳定时间、使结对矿工所受“连坐”惩罚处于长期动态变化,该矿推出随机结对方式,随机结对方式下,由于结对伙伴的动态变化(如结对伙伴的专业能力、个人性格等),矿工结对所受“连坐”惩罚也会处于长期动态变化,从而增加了“连坐”惩罚制度的有效性,促进安全生产.尚庄煤矿的案例也反映出:动态“连坐”惩罚对矿工违章行为的规制效果更佳,这与命题 1、命题 2、命题 3 的推论相吻合.5基基基于于于煤煤煤矿矿矿安安安全全全监监监管管管的的的案案案例例例分分分析析析为了验证和展示更为丰富的理论分析结果,本文以平顶山市X煤矿为例,基于前期田野调查数据进行数值仿真.X煤矿位于平顶山市区东北部约 6 km,于 1958 年 8 月开工兴建,1964 年 2 月移交投产,设计生产能力 1.2Mt/a,2019 年 2 月,河南省工业和信息化厅将该矿生产能力核减为 2.64 Mt/a.该煤矿地质条件复杂,属于煤与瓦斯突出矿井.该矿井下矿工薪酬R主要由基本工资和安全绩效两部分构成,井下矿工人6尚庄煤矿:安全结对出新招.http:/ 4 期杨雪等:基于 Moran 过程的矿工违章行为惩罚机制分析481均基本工资约为 5 000 元/月,安全绩效为 200 元,则R=5 200.该矿对矿工违章行为的处罚P取值范围为 50元5 500 元,即L=50,U=5 500,对安全作业矿工的“连坐”处罚f为 200 元,惩罚系数约为 1.2,N(N2)为单班作业矿工人数.5.1随随随机机机因因因素素素主主主导导导下下下的的的决决决策策策分分分析析析在矿工行为决策过程中,如果消极情绪等随机因素占据主导地位,弱选择强度设为1=0.000 01.考虑矿工违章行为风险等级较小时,k2f(2+1)U3R 0.129;具体违章行为风险等级分别设为k=0.5、k=0.9.根据式(11)、式(12),可以分析随机因素主导下违章行为的不同风险等级k和矿工数量N对行为策略的影响,如图 1 和图 2 所示.24681012141618200.9800.9850.9900.9951.0001.0051.0101.0151.020 N R RS ,1=0.000 01,k=0.01 RC,1=0.000 01,k=0.01 RS ,1=0.000 01,k=0.05 RC ,1=0.000 01,k=0.05图 1 随机因素主导下低风险违章行为策略演化Fig.1 The strategy evolution of low risk violation behaviordominated by random factors24681012141618200.950.960.970.980.991.001.011.021.031.041.05 N R RS,1=0.000 01,k=0.5RC,1=0.000 01,k=0.5RS,1=0.000 01,k=0.9RC,1=0.000 01,k=0.9图 2 随机因素主导下高风险违章行为策略演化Fig.2 The strategy evolution of high risk violation behaviordominated by random factors当违章行为风险等级较小时,即风险等级取值k=0.01、k=0.05.由图 1 可知,当k=0.01时,对于任意正整数N(N2),均满足命题 1 中均衡条件Rs 1.000 2 0.000 6N1.此时,“违章行为”为演化稳定策略;当k=0.05时,同样满足RS1,即随机因素主导下,矿工低风险违章行为为占优策略.当违章行为风险等级较大时,即风险等级取值k=0.5、k=0.9.由图 2 可知,当k=0.5和k=0.9时,对于任意正整数N(N2)均满足命题 1 均衡条件Rs 0.997+0.020N1,Rc 1.000 3 0.002 0N1,此时“安全作业”为演化稳定策略.由此,随机因素主导下,针对风险等级较高的违章行为,静态“连坐”惩罚安全规制是有效的,而对风险等级较低违章行为是失效的,这与第 4 节命题 1的理论结果相一致,在此不再赘述分析.5.2期期期望望望收收收益益益主主主导导导下下下的的的决决决策策策分分分析析析矿工基于不同策略的期望收益因素做出决策,弱选择强度设为2=1.同样考虑违章行为风险等级较小k=0.01、k=0.05与违章行为风险等级较大k=0.5、k=0.9两种情形.根据式 16与式 17,分析期望收益主导下违章行为的不同风险等级k和矿工数量N对行为策略的影响,如图 3 和图 4 所示.由图 3 可知,期望收益主导下,违章行为风险等级较小时,即风险等级取值k=0.01、k=0.05,即对于任意N,均满足h1N0=3时,满足h10且hN10,“安全作业”策略为演化稳定策略.当矿工人数较少时,存在N1=min2,3.当矿工人数N6N1=2时,满足h10且hN12,“安全作业”策略为演化稳定策略.由此,期望收益主导下,静态“连坐”惩罚机制对高风险违章行为的规制效果与矿工规模有关,对低风险违章行为是失效的.即从实例角度进一步验证了第 4 节命题 2 的理论结果.482系 统 工 程 学 报第 38 卷234567891020015010050050100150200N h h1,2=1,k=0.01 hN1,2=1,k=0.01 h1,2=1,k=0.05 hN1,2=1,k=0.05图 3 期望收益主导下低风险违章行为策略演化Fig.3 The strategy evolution of low risk violation behaviordominated by expected return234567891050050100150200 N h h1,2=1,k=0.9 hN1,2=1,k=0.9 h1,2=1,k=0.5 hN1,2=1,k=0.5图 4 期望收益主导下高风险违章行为策略演化Fig.4 The strategy evolution of high risk violation behaviordominated by expected return5.3动动动态态态“连连连坐坐坐”惩惩惩罚罚罚对对对违违违章章章行行行为为为的的的影影影响响响对比图 1图 4 可以发现,煤矿安全规制针对风险等级较高的违章行为是有效的,对风险等级较低的违章行为失效.引入动态“连坐”惩罚,将对选择“安全作业”矿工的惩罚与违章矿工的违章风险等级相关联,增加矿工违章行为的可控性.23456789100.998 00.998 50.999 00.999 51.000 01.000 51.001 01.001 51.002 0 NR RS,1=0.000 01,k=0.01 RC,1=0.000 01,k=0.01RS,1=0.000 01,k=0.05 RC,1=0.000 01,k=0.05图 5 随机因素主导下动态“连坐”惩罚对低风险违章行为的影响Fig.5 The effect of dynamic collective punishment on low riskviolation behavior under the dominance of random factors23456789100.950.960.970.980.991.001.011.021.031.041.05 N R RS,1=0.000 01,k=0.5RC,1=0.000 01,k=0.5RS,1=0.000 01,k=0.9RC,1=0.000 01,k=0.9图 6 随机因素主导下动态“连坐”惩罚对高风险违章行为的影响Fig.6 The effect of dynamic collective punishment on high riskviolation behavior under the dominance of random factors对比图 5、图 7 与图 1、图 3 可知,随机因素主导下,矿工违章行为风险等级较小时,即风险等级取值为k=0.01、k=0.05,当采用动态“连坐”惩罚机制时,无论矿工群体数量或多或少,均满足Rs1,Rc0且hN10,“安全作业”为演化稳定策略.同样地,对比图 6、图 8 与图 2、图 4 可知,期望收益主导下,针对矿工低风险违章行为或高风险违章行为,当采用动态“连坐”惩罚机制时,始终满足Rs1,Rc0,hN10,“安全作业”策略为演化稳定策略.这与第 4 节命题 3 的理论结果相一致.综合对比图 1图 8,可以发现:1)静态“连坐”惩罚机制对违章行为的规制效果随着违章行为风险等级变化而不同.具体表现在:随机因素主导下,针对风险等级较高的违章行为,静态“连坐”惩罚安全规制是有效的,而对风险等级较低违章行为是失效的.期望收益主导下,静态“连坐”惩罚机制对低风险违章行为是失效的;静态“连坐”惩罚机制对高风险违章行为的规制效果受矿工规模影响.2)无论是随机因素主导还是期望收益主导,动态“连坐”惩罚机制能够有效规制矿工违章不同风险等级行为.第 4 期杨雪等:基于 Moran 过程的矿工违章行为惩罚机制分析483234567891002468101214161820N h h1,2=1,k=0.01 hN1,2=1,k=0.01 h1,2=1,k=0.05 hN1,2=1,k=0.05图 7 期望收益主导下动态“连坐”惩罚对低风险违章行为的影响Fig.7 The effect of dynamic collective punishment on low riskviolation behavior under the dominance of expected return234567891050100150200250300350400450500h h1,2=1,k=0.5 hN1,2=1,k=0.5 h1,2=1,k=0.9 hN1,2=1,k=0.9N 图 8 期望收益主导下动态“连坐”惩罚对高风险违章行为的影响Fig.8 The effect of dynamic collective punishment on high riskviolation behavior under the dominance of expected return6结结结束束束语语语煤矿安全生产易受多变的地质环境与矿工消极情绪等随机因素扰动呈现不确定特征,本文构建了惩罚机制下矿工违章行为的 Moran 过程随机演化模型,分析静态“连坐”和动态“连坐”两种惩罚机制对不同风险等级违章行为的规制效果.结果表明:静态“连坐”惩罚机制能够有效遏制矿工高风险违章行为;动态“连坐”惩罚机制可以有效规避静态“连坐”惩罚机制对低风险违章行为约束无效的现象.基于此,煤矿企业通过对不同生产岗位实施差异化惩罚达到风险精准分级管控.本文采用线性函数刻画参与者的策略选择过程,未来可以进一步考虑传统线性函数的适应的边界条件.同时,“连坐”惩罚机制的有效性依赖于信息不完全程度,通过信号博弈或机制设计理论分析博弈双方信息不对称问题也是未来研究值得关注的方向.参参参考考考文文文献献献:1 李琰,赵梓焱,田水承,等.矿工不安全行为研究综述.中国安全生产科学技术,2016,12(8):4754.Li Y,Zhao Z Y,Tian S C,et al.Review of research on unsafe behavior of miners.Journal of Safety Science a

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开