第57卷第2期华中师范大学学报(自然科学版)Vol.57No.22023年4月JOURNALOFCENTRALCHINANORMALUNIVERSITY(Nat.Sci.)Apr.2023收稿日期:2021-12-23.基金项目:国家自然科学基金青年基金项目(11701161);湖北省教育厅人文社科重点项目(20D043);湖北工业大学博士启动基金项目(BSQD2020103).*通信联系人.E-mail:lifang05@sina.com.DOI:10.19603/j.cnki.1000-1190.2023.02.001文章编号:1000-1190(2023)02-0185-10函数型累积Logistic回归模型研究与应用罗幼喜,邓楠,胡超竹,李翰芳*(湖北工业大学理学院,武汉430068)摘要:该文针对响应变量为有序多分类标量数据,协变量为函数型数据构建函数型累积Logistic回归模型,并在贝叶斯分析框架下构造Gibbs抽样算法解决参数估计问题.具体解决流程为:首先,通过潜变量连接有序响应变量与函数协变量间的关系,同时对回归系数函数和回归函数型自变量选取主成分基函数进行展开,设置潜变量模型误差项服从Logistic分布.再利用Polya-Gamma变换解决模型似然函数的复杂性,并求得回归系数展开系数的后验分布从而构建Gibbs抽样算法.最后将该方法应用与模拟数据和实际空气质量指数(AQI)的分析,结果显示能较好地对模拟数据和空气质量指数(AQI)污染状况进行分类.关键词:函数型数据;主成分分析;累积Logistic回归;Polya-Gamma变换;Gibbs抽样算法中图分类号:C81;O212文献标志码:A开放科学(资源服务)标志码(OSID):先进的数据处理技术使得数据的收集更加密集和高维,进而传统的分析方法不再适用.若是将收集的密集数据看作一条潜在的曲线,研究其内在的变化特征,则能更深入对数据进行挖掘,由此加拿大统计学家Ramsay[1]于1982年提出了函数型数据分析,并在书中总结了这类数据分析的思想和技巧.继该方法提出后,截至目前已经取得许多有价值的研究成果,并在经济学、生物学、医学、气象学等领域被广泛应用.其中使用最多的是函数型数据回归模型,在国内,丁辉等[2]对该模型的不同情况进行了介绍.而在函数型数据回归模型中,若响应变量为标量,协变量为函数型数据,则是研究最多的函数型线性回归模型,它的一个重要应用便是针对标量为属性数据时的函数型Logistic回归模型,可用于函数型数据的分类问题.其中针对二分类的函数型Logistic回归模型已有大量学者对其进行了研究和讨论,如Escabias等[3]分别使用普通基函数以及主成分基函数对模型展开进行了讨论.Mousavi等[4]用不同方法对函数型Logistic回归模型的分类性能进行了比较.Denhere等[5]提出针对存在异常曲线时的稳...