分享
基于logistics回归...受害诱发因素分析和受害预测_陈家琪.pdf
下载文档

ID:2248725

大小:980.65KB

页数:7页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 logistics 回归 受害 诱发 因素 分析 预测 陈家琪
年第 期.云南警官学院学报 总第 期 收稿日期:作者简介:陈家琪,男,中国刑事警察学院公安学硕士,研究方向为侦查学。陈广,陈晶武.回归分析的判别预测功能及其应用 .数理医药学杂志,().全称为“”,中文名为统计产品与服务解决方案。:.?.基于 回归的受害诱发因素分析和受害预测陈家琪(中国刑事警察学院,辽宁沈阳)内容摘要:犯罪侵害似乎无处不在且不断改变形式。从实践看,结合犯罪预测进行侦查和打击犯罪行为,不足以有效保护公民人身财产安全,使得从犯罪行为的“受侵害”一方进行预测成为必要。其方法是根据犯罪侵害规律,确定“受侵害”诱发因素指标并进行二元 回归分析。同时,利用建立的犯罪预测模型进行个体分析,确定分析对象受侵害的可能性,而后针对受侵害高危人群及时预警以达到预防受害之目的。受害预测有利于强化侦查机关的预警预防能力,而且能够有针对性地保护公民人身财产安全。关键词:回归;诱发因素;受害预测;犯罪中图分类号:.文献标识码:文章编号:()一、研究背景和研究意义(一)研究背景现代社会犯罪形势依然严峻,每个人似乎都有遭受形形色色违法犯罪行为侵害的风险和可能性,甚至公安机关的破案技术和方法都难以应对犯罪行为的“创新”。公安机关负有预防和打击违法犯罪行为,保护公民人身财产安全的任务,犯罪研究和犯罪预测是公安机关及时预防和有效打击的基础。世界各国都不同程度地重视犯罪预测工作,有些国家甚至建立有专门的犯罪预测机构。但是,犯罪侵害是犯罪人和被害人之间的一种互动模式,两者各自以其加害原因或被害原因为作用力,相互影响,彼此互动,共同推动着侵害与受侵害的动态变化。无论是理论还是实践层面,犯罪预测领域的研究都较为丰富,但是“受侵害”预测领域的研究相对不足。从相互作用的关系上来看,对“受侵害”因素进行及时预测、预警和预防,就相应减少了“侵害”的发生。在这个过程中,受侵害诱发因素分析和预测是针对易受侵害公民预警、预防的前提。(二)研究意义任何现象都是质和量的统一,受侵害现象也不例外,定性和定量相结合会使受侵害预测更加准确。定性是根据受侵害对象的受害情况,确定高相关性的诱发因素;定量则是通过建立数学模型,应用统计方法,利用电脑技术,对诱发因素进行量化分析。具体到二元 回归分析预测之中,定性和定量分析能够对受侵害情态和趋势有一个直观、量化的描述。二元 回归是 回归中的一类数学模型,是基于电脑技术的一种统计学分析运算、数据挖掘和预测分析软件。通过利用 软件对受害者的受害诱发因素进行二元 回归运算,能分析出诱发因素与受侵害之间的关联度,并根据已建立的模型进行个体分析,从而有针对性地、高效率地对可能受侵害对象进行预测、预警以及预防受害。二、二元 回归在受害诱发因素分析及预测中的应用 回归又称 回归分析,是一种广义的回归分析模型,常用于数据挖掘、疾病自动诊断、经济预测等领域。随着模型的适用性得到一定认可,在犯罪预测领域有所应用,受侵害预测层面则有待开发。基于因变量的不同又分为二元和多元 回归,犯罪侵害中受侵害预测层面的因变量为“受侵害”和“不受侵害”二分类变量,因此采用二元 回归分析(以下统称为二元逻辑回归分析)。犯罪预测侦查是针对已确定的侦查对象,在其正在进行或者将要实施犯罪行为之时,根据所获取的情报信息和预测分析结论,在公安机关的精心部署和周密计划的基础上查缉犯罪嫌疑人。犯罪预测主要针对有行为迹象且暂未既遂的犯罪,而受侵害预测主要针对未有犯罪行为发生且有受侵害可能的情况。从时间上看,受侵害预测比犯罪预测更具有超前性,侦查机关更能预先介入;从空间上看,各地公安机关结合该地犯罪热点,筛选受侵害诱发因素并进行个体分析,预警、预防的区域性更强;从效果上看,实时感知风险并及时预防受害,对公民人身财产安全的保护更加显著。大数据背景下的犯罪预测侦查比较成熟,主要有智慧警务数据分析、算法犯罪预测、风险地域分析、回归分析等犯罪预测方法。同样,二元 回归应用于受侵害预测之中更加适合。以电信诈骗为例,电信网络诈骗铺天盖地,呈现出智能化、多样化、高科技化、组织性等特征,现阶段,我国电信网络诈骗案件破案率不足,案件侦查和打击存在较大困难。若从犯罪预测层面,难以有效实现公安机关预防打击犯罪、保护公民财产安全的职能;而根据受电信网络诈骗案件侵害诱发因素,进行二元逻辑回归分析并建立预测模型,再针对特定人群和个体进行受侵害预测并做到及时预警预防,从而能够突破当前泛式宣传、国家反诈中心 非全面检测等局限,防范和减少电信网络诈骗犯罪的发生。三、受侵害预测模型构建过程具有典型意义的“广东高考录取新生蔡淑研案”“山东高考录取新生徐玉玉案”“山东理工大学学生宋振宁案”三起因受电信诈骗致死案中,犯罪分子通过非接触的方式杀人于无形,对公民人身财产安全构成严重威胁,难以通过犯罪预测及时有效打击犯罪行为,因此从潜在受害者的角度进行受侵害预测显得更加必要。如下图 所示,基于二元逻辑回归构建受侵害预测模型。首先,根据受电信诈骗犯罪侵害热点区域,运用数理统计法收集、统计犯罪侵害信息,并确定受侵害诱发因素;其次,通过数据处理,并对数据集进行模型前提假设的检验,保证样本、参数、自变量、因变量的准确度;最后,利用 软件进行二元逻辑回归分析并建立受害预测模型,根据该模型对重点个体进行受侵害预测,并对受侵害高危个体及时预警和受害预防。图 受侵害预测模型构建及预测流程陈家琪:基于 回归的受害诱发因素分析和受害预测丁小巍,徐胜,朱飞.大数据背景下的犯罪预测侦查 .广西警察学院学报,().算法犯罪预测:是通过数据模型确定犯罪热点数量并进行聚类分析的一种犯罪预测方法。王鑫,单丽清.犯罪预测模型在机动车盗窃案中的应用 .警察技术,().魏克强,宋梅琼.电信网络诈骗案件的侦查困境及其破解 .犯罪研究,().受电信诈骗犯罪侵害热点区域:这里指采集样本数据和采集个体数据两个阶段,具体如三(一)。丁欣荣,夏军,孙树峰.智慧公安视域下运用大数据进行犯罪分析与犯罪预测研究 .上海公安学院学报,().(一)受侵害热点区域确定受侵害热点区域确定主要指两个阶段:一是在采集样本数据时,指在某个时期易受电信诈骗侵害的多个区域,某一种犯罪侵害对象的受侵害诱发因素具有共性,可从中确定受侵害诱发因素指标;二是在采集个体数据时,指受侵害热点区域的某一地,例如、三个热点区域,地以白领为主,地以大学生为主,地以底层劳动者为主。在采集样本数据时,将白领的“有强烈投资理财意向”、大学生的“缺乏社会经历”、底层劳动者的“渴望发大财”共同设为自变量;而在采集个体数据时,地公安机关仅需从受侵害的 地热点区域作出考虑,采集是否“有强烈投资理财意向”。一旦某一地点出现某种犯罪,从统计上看,该地及其附近区域在短期内很可能会发生类似的犯罪侵害事件,这即为“近重复理论”,它旨在解释某些犯罪在某一地点出现重复犯罪活动的现象。换句话说,在某个时期受某种犯罪侵害的地点并不是随机分布的,而存在有一定的规律性,集中在小范围的“热点区域”。这种时空聚集模式反映了与重复受害之间的关联。之所以确定受侵害热点区域,是因为在采集样本数据时,收集的受侵害诱发因素具有普遍性和代表性;在采集个体数据时,该地公安机关在数据采集或是预警预防上,都更具有针对性和及时性,有助于快速采、预、判、防。这是指针对易受电信诈骗侵害区域所进行的样本数据采集阶段。(二)受侵害诱发因素确定每一起刑事案件事实内容都是有一定的横向和纵向构成要素组成,犯罪主体针对何种对象,在何种思想诱因下并出于何种动机,在何时何地使用何种工具和手段实施犯罪,都有其微妙的规律。反观,犯罪侵害对象也有其规律性,即为受侵害诱发因素内部相互关系和排列状况产生的结果。被害人受侵害诱发因素具有以下六类特征:致害性、诱发性、条件性、可防控性、易感性、互动性。具体来讲,致害性是指被害人之所以受害,是因为其身上具有某些致害因素,而非随机被害;诱发性是指被害人自身致害因素,诱发并驱动犯罪人实施犯罪行为,甚至强化犯罪人犯罪意图;条件性是指被害人在特定时间到达特定地点,维持了特定状态,为犯罪人实施犯罪创造了一定条件;可防控性是指在多数情况下,被害人为保护个体人身财产安全,对致害因素的产生可防可控但无所防控;易感性是指受害人易于接受犯罪人的诱导而步入受害情境,最终被选择为侵害对象;互动性指犯罪侵害的成立是犯罪人和受害人两者之间互动的结果,揭示被害人在犯罪侵害中的辩证角色,说明犯罪侵害诱发背后深层次的发生机制。现实生活中,十有八九的人都收到过电信网络诈骗电话、短信或者陌生“好友”发送的消息,但只有部分人真正遭受侵害。究其原因,离不开警惕性差、防范意识淡薄、辨别能力弱等侵害诱发因素。在受侵害热点区域 地和 地,根据电信网络诈骗受害者笔录和未受诈骗人员调查,筛选出 个有效样本,从性别、年龄、学历、职业、收入、警惕防范意识差或分辨力弱、具备高危因素是否在 项及以上这几个因素范围内,确定四个相关性较强的因素指标,并将其作为二元逻辑回归分析的自变量,如表 所示。本模型数据集共选择样本数量 个,自变量 个,因变量为二分类变量,其中“受侵害”样本量 个,“未受侵害”样本量 个。经过模型前提假设的测算和分析,满足以下条件:自变量和因变量为分类变量;样本之间相互独立,且分类变量的分类全面且互斥;样本数量是自变量数目的 倍;自变量之间不存在多重共线性;没有明显的离群点、杠杆点和强影响点。可对该模型数据集进一步分析并建立预测模型。陈家琪:基于 回归的受害诱发因素分析和受害预测 .,.,许昆.侦查学 .北京:高等教育出版社,.表 受侵害诱发因素及其参数一览表序号受侵害诱发因素参数年龄(岁)、职业公司职员、自由职业、学生、其他群体(个体商户、事业单位、公职人员)警惕防范意识差或分辨力弱是、否具备高危因素在 项及以上:.缺乏社会经验;.网络购物频繁;.有贪图小利思想;.有寻找网络兼职行径;.渴望发大财;.有贷款理财意向;.有网络婚恋交友习惯;.对预防电信网络诈骗信息了解少是、否(三)二元 回归分析及报告在上述工作完备的基础上,使用 统计分析软件添加样本数据并设置相关参数,而后进行二元逻辑回归分析并保存模型。根据二元逻辑回归分析结果,可作出如下分析:.由表 可知,显著性为.远大于.,说明该模型与真实数据的拟合状况良好,具有统计意义,可以用作预测;.由表 可知,该预测模型对没遭受侵害的样本进行预测的正确率为.,对遭受侵害的样本进行预测的正确率为.,该模型总的正确预测率为,预测准确率较高;.由表 可知,“警惕防范意识差和分辨力弱”“具备高危因素是否在两项及以上”这两项因素的显著性值分别为.和.,值小于.,且()值 分 别 为.和.,说明对受电信诈骗侵害有极其显著的影响;而“年龄”“职业”为非独立影响因素,从一定意义上讲,对是否遭受电信网络诈骗侵害,无显著但又有着一定的影响,与其他诱因指标相互组合的结果影响着受侵害的可能性。表 霍斯默 莱梅肖检验霍斯默 莱梅肖检验步骤卡方自由度显著性.表 分类表分类表 实测预测受侵害否是正确百分比步骤 受侵害否.是.总体百分比.分界值为.陈家琪:基于 回归的受害诱发因素分析和受害预测表 方程中的变量方程中的变量标准误差瓦尔德自由度显著性()()的 置信区间下限上限步骤年龄(岁).年龄(岁)().年龄(岁)().职业.职业().职业().职业().警惕防范意识差或分辨力弱().具备高危因素是否在两项及以上().常量.在步骤 输入的变量:年龄(岁),职业,警惕防范意识差或分辨力弱,具备高危因素是否在两项及以上。(四)确立受害预测模型在上一步进行二元逻辑回归分析的过程中,将设定好的参数及数值进行保存,生成受侵害预测模型,以对下一步的个体数据进行分析和预测。在该预测模型中,并非所有被选中的受侵害诱发因素都展新出了显著的影响,有些则影响甚微,所显示的预测概率值看似也较为偏颇,但这些因素的有无仍影响预测概率的准确性。实际上,在受侵害预测模型的建立和运用过程中,必须认识到现有的判别预测不是绝对准确和完美适用的,因为任何一种预测方法,所选样本数据集必然有一定的局限性,并不能完全准确地反应总体情

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开