分享
基于多模式特征聚合的未来商业预测_崔铭浩.pdf
下载文档

ID:2251407

大小:1.57MB

页数:9页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 模式 特征 聚合 未来 商业 预测 崔铭浩
基于多模式特征聚合的未来商业预测崔铭浩,张仁博,郭恩铭(东北大学计算机科学与工程学院,沈阳110169)通信作者:崔铭浩,E-mail:摘要:准确预测商业销售量未来趋势对于企业开发经营、政府宏观调控等至关重要.传统的数据预测方法计算时间开销大,具有主观性,而现有基于数据驱动的未来商业预测方法没有考虑到数据集中的特征多样.商业销售量数据是一个时序数据,时序数据中包含了丰富的时间窗特征、滞后历史特征和价格变化趋势特征等众多特征,先前的研究往往只注重于其中的某些特征,对于特征的融合和增强探究偏少,现有的未来商业预测方法的预测精度仍然有待提高.为此,本文提出了一种基于多模式特征聚合的未来商业预测方法,该方法首先将商业销售量数据进行预处理;然后基于特征工程提取数据集的 5 组不同的时间窗特征和其他特征;在机器学习上对于 5 组时间窗特征采用硬投票机制选择合适的模型训练,同时也采用神经网络的优化模型提取时序特征和预测结果,然后分析销售量数据集和某些特征之间的依赖关系;最后基于软投票模型完整地模型融合实现了商业销售量的高精度预测.一系列实验结果表明,本文提出的方法具有较高预测精度和效率,明显优于现有预测方法.关键词:未来商业预测;多模式;特征融合;投票机制;机器学习;深度学习引用格式:崔铭浩,张仁博,郭恩铭.基于多模式特征聚合的未来商业预测.计算机系统应用,2023,32(2):2533.http:/www.c-s- Business Forecasting Based on Multi-mode Feature AggregationCUIMing-Hao,ZHANGRen-Bo,GUOEn-Ming(SchoolofComputerScienceandEngineering,NortheasternUniversity,Shenyang110169,China)Abstract:Accuratepredictionofthefuturetrendofthecommercialsalesvolumeisofgreatimportancetothedevelopmentandoperationofenterprisesandthemacro-controlbythegovernment.Traditionaldatapredictionmethodsaretime-consumingandsubjective,whiletheexistingdata-drivenfuturebusinesspredictionmethodsdonottakeintoaccountthediversityoffeaturesinthedatasets.Thedataofthecommercialsalesvolumeistime-series,whichcontainsawealthoftimewindowfeatures,lagginghistoricalfeatures,andpricechangetrendfeatures.Previousstudiestendtofocusonlyonsomeofthesefeatures,andtheintegrationandenhancementofthesefeaturesareseldomexplored.Thepredictionaccuracyoftheexistingfuturebusinesspredictionmethodsstillneedstobeimproved.Therefore,thisstudyproposesafuturebusinessforecastmethodbasedonmultimodalfeatureaggregation,whichfirstlypreprocessesthecommercialsalesvolumedataandthenextractsfivedifferentgroupsoftimewindowfeaturesandotherfeaturesofthedatasetonthebasisoffeatureengineering.Inmachinelearning,thehardvotingmechanismisusedtoselecttheappropriatemodelforthetrainingofthefivegroupsoftimewindowfeatures.Atthesametime,theneuralnetworkoptimizationmodelisappliedtoextractthetime-seriesfeaturesandforecastresults,andthen,thedependencyrelationshipsbetweenthedatasetofthesalesvolumeandsomefeaturesareanalyzed.Finally,withthesoftvotingmodel,ahigh-precisionforecastofthecommercialsalesvolumeisachievedbycompletemodelintegration.Theexperimentalresultsrevealthattheproposedmethodhashighpredictionaccuracyandefficiency,whichisgreatlybetterthantheexistingpredictionmethods.Key words:futurebusinessforecasting;multi-mode;featurefusion;votingmechanism;machinelearning;deeplearning计算机系统应用ISSN1003-3254,CODENCSAOBNE-mail:ComputerSystems&Applications,2023,32(2):2533doi:10.15888/ki.csa.008919http:/www.c-s-中国科学院软件研究所版权所有.Tel:+86-10-62661041收稿时间:2022-06-01;修改时间:2022-07-01;采用时间:2022-07-24;csa 在线出版时间:2022-10-28CNKI 网络首发时间:2022-11-15SpecialIssue专论综述25准确预测商业销售量未来趋势对于企业开发经营、政府宏观调控等至关重要.传统的数据预测方法计算时间开销大,具有主观性,而现有基于数据驱动的未来商业预测方法没有考虑到数据集中的特征多样.商业销售量数据是一个时序数据,时序数据中包含了丰富的时间窗特征、滞后历史特征和价格变化趋势特征等众多特征,先前的研究往往只注重于其中的某些特征,对于特征的融合和增强探究偏少,现有的未来商业预测方法的预测精度仍然有待提高.为此,本文提出了一种基于多模式特征聚合的未来商业预测方法,该方法首先将商业销售量数据进行预处理;然后基于特征工程提取数据集的 5 组不同的时间窗特征和其他特征;在机器学习上对于 5 组时间窗特征采用硬投票机制选择合适的模型训练,同时也采用神经网络的优化模型提取时序特征和预测结果,然后分析销售量数据集和某些特征之间的依赖关系;最后基于软投票模型完整地模型融合实现了商业销售量的高精度预测.一系列实验结果表明,本文提出的方法具有较高预测精度和效率,明显优于现有预测方法.1引言当今世界的经济迅速发展,也带来了竞争国际化1.在商业预测中,销售量和价格是众多企业关注的,但近两年的新冠疫情的变化,国内国外的电子商务市场在其运行过程中却一直处在不断的波动中2,众多市场的大起大落,使商业现状变化更加急峻.一个企业一旦发生了经营内外环境的变化,那么如何做出一个很好的决策和计划主要取决于科学的预测,同时科学的预测依赖于企业对于经济和商业市场变化规律的认识,也依赖于企业对于预测技术的了解和熟练程度,然后让企业根据科学的预测结果做出相关的干预措施,比如确定经营目标,制订销售决策和生产计划,这有助于企业未来的发展.因此,对商业其中的一些标准衡量预测,避免非正常波动的出现,既可为企业开发经营、投资决策提供依据,又可为政府宏观调控、制定政策提供参考3,4.商业预测方法可大致分为两大类,一类是定性分析方法,另一类是定量分析方法5.定性分析方法中有经验判断预测方法和特尔菲法,前者通过个人和集体基于经验进行判断,容易受到各种心理因素的影响,后者是通过匿名方式结合专家的意见对发展做出量的推断,但是缺乏数据支持,仅代表大体方向.定量分析方法中有基于时间序列预测方法的模型6,也有基于回归分析预测法的模型7,在商业趋势稳定发展且价格没有大幅度浮动的情况下,前者可以较好地预测未来趋势,后者是广为使用的预测模型,但是采取的特征过多或者过少的时候会出现拟合异常现象,导致预测效果不是很佳.因此本文采用了每一个模型的多个特征进行组合起来,形成大量的相关特征组,提出一种基于特征融合的未来商业预测方法.该方法首先将商业销售量数据进行预处理,在预处理过程中提出了一个滑动窗口特征,依次划分 5 组不同大小和步长的窗口,然后利用机器学习中的多个模型进行训练,同时采用神经网络的优化模型收集时间特征融合到销售量的特征组中;然后对于每一个模型基于投票机制将从 5 组窗口选择出较优的模型;最后基于模型融合利用这些较优的模型得到的预测进行时间序列模型的预测,从而预测出来商业未来趋势.通过实验验证本文相较于传统方法中单一模型预测有较好的预测效果,首先是在窗口组大小的设置,对于每一个模型来说都选择了较优的窗口大小,其次基于软投票机制完成了对模型的预测结果的融合,在通过机器学习与深度学习中的单个模型预测和投票模型融合预测的对比之下在准确率评价标准下数值增加了 2.31%,误差值降低了 1.46%.2基于特征融合的商业未来预测针对未来商品销售量的预测,本文提出了一种多模式特征聚合的商业预测方法,主要由 3 部分构成,分别为数据预处理、特征选择和处理、模型融合预测,方法总体框架如图 1 所示,同时关于在特征选择和处理的环节上,对于投票模块的框架如图 2 所示.2.1 数据搜索数据探索在特征工程是非常重要的一个环节,面对数据探索,首先需要对数据集进行一个宏观分析,包括数据的缺失和重复、异常值检测以及一些数据的清洗工作8,然后本文基于数据的特征要进行对其相互关系的分析,包括计算相关性,变量可视化等,在进行数据探索中,本文可以进行一系列的特征选择,通过预处理可以清洗构造出新的数据集,为特征工程的第一步做出很重要的贡献.在日常生活中,本文经常遇见很多相关的数据类型,比如数值、分类变量、文本和图像的数据,图像数计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第2期26专论综述SpecialIssue据比其他的数据更复杂,需要进行关键点的定位和方向确定9,在其他的数据的处理中可以采用归一化、标准化以及离散化等相关的算法10进行筛选数据,把有效数据进行特征选择,才能有利于模型的选择和优化.时序数据构造时窗特征标准化校正1C Company项目集数据数据预处理特征选择和处理模型组合预测软投票模型XGBoostRF时序数据投票投票投票融合LSTMKNNCNN融合NLP图 1未来商业预测方法总体框架时间窗特征 5模型时间窗特征 4模型时间窗特征 3模型时间窗特征 2模型时间窗特征 1模型硬投票图 2投票模块框架 2.2 特征构造特征工程方法11为电子商务产品销售量的某些特征的选择提供了一些参考依据,在特征构造的时候,除了最常见的统计量特征之外本文还需要做出其他相关的特征如时间特征.mnXk假设某电子商务中商店种类有个,商品种类有个,本文可以构造一个二维向量,对于商品每一个种类来说,本文可以提供 个特征进行选择,而模型训练的选择将由这些特征所影响,本文将对每一个特征进行模型训练,这样本文对特征的选择面会扩大,这样在使用模型预测的时候,

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开