温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
机器
学习
社区
流浪
管理
投喂
方案
中的
应用
范嘉欣
第 39 卷 第 7 期 福 建 电 脑 Vol.39 No.7 2023 年 7 月 Journal of Fujian Computer Jul.2023 本文得到江苏省大学生创新创业训练计划项目(No.202213988017Y)资助。范嘉欣,女,2001年生,主要研究领域为物联网工程。E-mail:。刘天琪(通信作者),女,1993年生,主要研究领域为自然语言处理。E-mail:。杨宇轩,男,2000年生,主要研究领域为嵌入式技术。E-mail:。赵林林,女,2002年生,主要研究领域为软件工程。E-mail:。尹先铭,男,2001年生,主要研究领域为物联网工程。E-mail:。机器学习在社区流浪猫管理投喂方案中的应用 范嘉欣 刘天琪 杨宇轩 赵林林 尹先铭(江苏师范大学科文学院 江苏 徐州 221000)摘 要 为了对流浪猫的进食量有更好的把控,保证爱猫人士所送猫粮尽可能不被浪费,同时希望在完成短期流浪猫救助任务的同时不影响小区居民的正常生活,本文提出了一种有关社区流浪猫的管理与喂食的方案。方案结合“抓捕-绝育-放归”模式进行,主要围绕流浪猫投喂装置的投放地点选择以及当日猫粮投放量的预估展开。其中,使用相关性分析法和线性回归法预测猫粮的当日投放量,投放地点流浪猫数目预测采用 k 近邻算法。方案能够较为准确地判断出受救助的流浪猫数量并预测出次日猫粮投喂量,基本可以满足实际需要。关键词“抓捕-绝育-放归”模式;相关性分析;线性回归;k 近邻算法 中图法分类号 TP399 DOI:10.16707/ki.fjpc.2023.07.003 Community Stray Cat Feeding Scheme based on Machine Learning FAN Jiaxin,LIU Tianqi,YANG Yuxuan,ZHAO Linlin,YIN Xianming (Kewen College,Jiangsu Normal University,Xuzhou,China,221000)Abstract In order to better control the amount of stray cats,ensure that the cat food sent by cat lovers is not wasted as much as possible,and hope to complete the short-term stray cat rescue task without affecting the normal life of community residents,this paper proposes a scheme for the management and feeding of stray cats in the community.The scheme is suitable for combining TNR mode,mainly focusing on the selection of the feeding location of the stray cat feeding device and the estimation of the cat food delivery amount on the day.Among them,the correlation analysis method and linear regression method were used to predict the daily delivery of cat food,and the K nearest neighbor method was used to predict the number of stray cats at the feeding site.The scheme can accurately determine the number of rescued stray cats and predict the amount of cat food feeding the next day,which can basically meet the actual needs.Keywords TNR;Analysis of Correlation;Linear Regression;K-nearest Neighbor 1 引言 随着流浪猫数量的不断升高,部分人虐待捕杀流浪猫、部分流浪猫传播疾病等问题越来越多,严重危害社区生活以及人与动物之间的和谐相处1。流浪猫的产生大致分为两种情况:一种是宠物猫被其原主人丢弃或遗弃,另一种则为流浪猫在社区内无节制繁殖。社区相较于农村,食物较为缺乏,而流浪猫数量又一直在不断增长,迫使流浪猫不得不出没于垃圾桶附近觅食2。不科学的饮食可能导致流浪猫携带各类传染病。为防止流浪猫因缺乏食物死亡,部分爱猫人士自发地对流浪猫进行投喂。但不科学投喂会出现以下三种情况:(1)剩菜剩饭投放过多导致食物腐烂、社区内产生异味,不及时清理会影响社区环境,给环卫工人造成困扰。在不缺乏食物情况下处于发情期的猫之间可能会出现互殴、乱叫等现象,影响当地居民休息。(2)目前14 范嘉欣等:机器学习在社区流浪猫管理投喂方案中的应用 第 7 期 依照规定,如果猫伤人,则猫的管理者、饲养人需要承担责任。如果长时间喂养某只流浪猫,则该猫伤人投喂者应当对此承担次要的过错损害赔偿责任3。(3)可能使流浪猫丧失独立生存的能力。过度信赖人类可能会被虐待流浪猫者捕杀。为减少或避免以上情况发生,本文针对流浪猫的管理与投喂设计一套完整的方案。方案主要采用TNR(Trap-Neuter-Return)模式,即通过“抓捕-绝育-放归”降低城市社区流浪猫的数量,并针对流浪猫的投喂场所以及猫粮投喂量展开。在估算社区内流浪猫数量时采用了 K 近邻法(k-nearest neighbor,k-NN)算法进行判断,通过相关性分析法(Analysis of Correlation)寻找与猫进食量相关的因素,并对社区附近的流浪猫当日进食量进行预测来估算猫粮投喂量。该方案可以很好地对流浪猫进行管理并实现科学的投喂。2 理论基础 2.1 相关性分析 相关性分析方法所要查看的是两两数据之间的相关性,以一种指标来判定,查看数据里有哪些属性与目标数据的相关性较强,哪些属性与目标数据的相关性较弱。对相关性较强的数据做出保留,反之则进行剔除4。2.2 线性回归 线性回归(Linear Regression)是利用数理统计中的回归分析来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。其表达形式为 y=wx+e,e 为误差服从均值为 0 的正态分布5。2.3 K近邻法 k 近邻法是一种寻找特征空间中 k 个最相似样本并根据此 k 个样本的信息进行分类和回归的算法。其主要原理就是对一个训练数据集(其中的实例类别已定)分类时,对新的实例,根据其 k 个最近邻的训练实例类别,通过多数表决等方式进行预测6。2.4 交叉验证 交叉验证(Cross-validation)主要用于建模应用中。在给定的建模样本中,拿出大部分样本进行建模,留小部分样本用于预报刚建立的模型,并求这小部分样本的预报误差,记录它们的平方和7。3 方案实现 3.1 投喂地点 投喂地点在选取上需要注意以下两点:(1)尽可能选择对猫较为适宜的进食环境。(2)尽可能远离居民活动频繁的地点。考虑到猫对周围环境的警惕性高,投喂地点还需要满足流浪猫出没较为频繁且附近具备监控装置的要求,在防止有虐待猫癖好的人带走流浪猫的同时,也能便于后续抓捕绝育。3.2 进食量预测 为了对猫的进食量进行科学预测,需要判断流浪猫的进食量与哪些因素有关。首先找出所有常见的可能影响猫进食量的因素,并进行初步筛查。然后在筛查后的因素中选择对进食量相关性最显著的因素,判断猫的进食量与猫自身因素的关系。经初步筛查,推测在保证猫粮口感和营养满足大部分猫需要的前提下,年龄、体重、排便次数、心跳频率、猫的体温等因素可能会影响或者能在一定程度上反映猫的进食量。由于户外的流浪猫的分布相对分散且分布不均匀,导致前期统计到的流浪猫的相关数据量相对较少,无法在短时间内得到足够量的样本数量用于实验。故在探究阶段,猫的相关数据来源为实施地点周边的家猫。在征得宠物之人同意的情况下共计调查了同一小区内的近 60 只猫,分别记录了猫的年龄、体重、排便次数、心跳频率、睡眠时间、饮食量、排尿情况以及体温。在判断变量间关系时使用了相关性分析法,在预测猫的进食量时使用了线性回归法。数据采集于同一时段,猫的种类相同,所投喂的猫粮也相同。3.2.1 相关性分析 在处理数据之前,设定变量 X:体温,排便次数,心跳频率,睡眠时间,年龄,饮食量,排尿情况,体重;相关类型:person 相关系数。由此得到相关系数表。此处对数据进行可视化处理,得到图 1 所示的相关系数热力图。相关系数热力图可直观地展示了两两因素之间相关系数的值,并且可以通过图中的颜深浅来观察值 p 的大小。表 1 展示进食量和其他因素之间的 Pearson(p)值。其中“*”表示 p0.05,“*”代表 p0.01。由表 1 可知,进食量与年龄、体重、心跳频率的相关系数均大于 0,p 值均接近 0;其他因素进食量的相关系数均接近 0,p 值均大于 0.5。故与饮食量有较为显著的相关性的因素为心跳频率、年龄、体重。2023 年 福 建 电 脑 15 图 1 相关系数热力图 表 1 Pearson 相关-详细格式 进食量 年龄 体重 毛发是否健康 听力是否正常 排便次数 排尿情况 体温 皮毛 心跳 频率 睡眠 时间 相关系数 0.462*0.481*-0.054 0.212 0.163 0.220 0.094 0.127 0.306*-0.113 p 值 0.000 0.000 0.680 0.101 0.209 0.088 0.470 0.329 0.017 0.387 3.2.2 线性回归分析 根据上述结论可以得知猫的进食量与年龄、心跳频率、体重具有显著的相关性。由于实时监测每一只流浪猫的心跳需要消耗较大的成本和精力,因此在计算进食量时不考虑流浪猫心跳频率快慢对进食量变化的影响。故而以上述数据为例,记 X:年龄,体重;Y:饮食量,对数据进行多元线性回归分析,可得到表 2 所示的线性回归分析结果。其中“*”表示 p0.05,“*”代表 p0.01。表 2 线性回归分析结果(n=61)常数 非标准化系数 标准化系数 t p VIF B 标准误 Beta 体重 48.772 5.688-8.575 0.000*-年龄 5.600 1.887 0.352 2.967 0.004*1.195 R 2 2.738 1.016 0.320 2.696 0.009*1.195 由于模型中 R 方值为 0.317,故可理解为体重、年龄可以解释饮食量的 31.7%变化原因。接下来对模型进行 F 检验,发现模型通过 F 检验(F=13.474,p=0.0000.05),说明体重、年龄中至少一项会对饮食量产生影响关系。另外,针对模型的多重共线性进行检验发现,模型中 VIF 值均小于 5,意味着不存在着共线性问题;并且 D-W 值在数字 2 附近,说明模型不存在自相关性,样本数据之间并没有关联关系,模型较好。最终具体分析可知:猫的体重的回归系数值为 5.600(t=2.967,p=0.0040.01),意味着体重会对饮食量产生显著的正 向 影 响关 系。年龄 的 回 归系 数 值 为 2.738(t=2.696,p=0.0090.01),意味着年龄会对饮食量产生显著的正向影响关系。总结:体重、年龄均会对饮食量产生显著的正向影响关系。可得饮食量计算公式为:awd+=738.2600.5772.48 (1)公式(1)中:d 为进食量,w 为体重(单位 kg),a 为年龄。对于进行长期救助的流浪