分享
基于联邦学习的电子商务企业物流服务商选择研究_王志惠.pdf
下载文档

ID:2253517

大小:1.03MB

页数:5页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 联邦 学习 电子商务 企业 物流 服务商 选择 研究 王志惠
物流科技 2023 年第 5 期 3 月上收稿日期:2022-08-27基金项目:国家自然科学基金资助项目(61877033、61833005);山东省自然科学委员会资助项目(812007100701);山东省高校青年创新团队发展计划项目(ZR2019MF021)作者简介:王志惠(1997),女,山东德州人,临沂大学信息科学与工程学院硕士研究生,研究方向:数据分析与可视化;傅德谦(1972),本文通讯作者,男,山东临沂人,临沂大学信息科学与工程学院副院长,教授,研究方向:物流信息化、智能计算、数据隐私计算。引文格式:王志惠,傅德谦.基于联邦学习的电子商务企业物流服务商选择研究J.物流科技,2023,46(5):8-12.理论研究文章编号:1002-3100(2023)05-0008-05物流科技 2023 年第 5 期 3 月上Logistics Sci-Tech March,2023(the first half)摘要:在电子商务活动中,物流服务商的选择往往是凭借主观经验加以判断,缺乏科学性。为帮助电子商务企业科学地选择适合本企业的物流服务商,文章从物流数据分布式存储的环境下,构建了一种基于联邦学习的物流服务商选择层次化架构。针对物流数据差异化问题提出了一种训练数据标准化处理方法,同时采用差分隐私算法改进模型,提高了模型的训练效率。最后,通过仿真实验验证了该方法的安全性和可行性。关键词:电商企业;物流服务商选择;联邦学习中图分类号:F713.365.1文献标志码:ADOI:10.13714/ki.1002-3100.2023.05.002Abstract:In e-commerce activities,the selection of logistics service providers is often judged by subjective experience and lacksscientific.To help e-commerce enterprises scientifically select suitable logistics service providers,the article constructs a hierarchical architecture for logistics service provider selection based on federated learning in the environment of distributed storage oflogistics data.A training data normalization method is proposed to address the problem of logistics data differentiation,while adifferential privacy algorithm is used to improve the model to improve training efficiency of the model.Finally,the security andfeasibility of the method are verified through simulation experiments.Key words:e-commerce enterprises;logistics service provider selection;federated learning0引言随着电子商务的蓬勃发展和物流服务商的逐年增多,电商平台对于物流服务商的选择也逐渐有了更高的要求。据中华人民共和国国家邮政局统计,2021 年,全国物流服务企业在中国交付累计完成量为 1 083 亿件,同比增长了 29.9%;交易规模达10 332.3 亿元,同比增长了 17.5%;物流服务总体满意度为 76.8 分1。对于物流服务商的选择,电商企业的诉求体现在成本低、货物安全、易追踪、速度快、服务质量高等方面;消费者希望速度快、服务好、货物无破损。若物流服务商选择不当,容易出现服务质量差、运输费用高、运输时间长等情况,影响消费者的购物体验和后续的购买行为,进而制约电商企业的发展2-3。随着订单量的逐年大幅增加,这些需求表现得更为迫切。信息系统的应用与普及可以极大节约电商企业与物流企业的信息共享成本,并有助于促进其合作关系4。各企业应充分利用大数据技术促进企业间的信息共享,进而提升物流服务质量和效率。然而由于现代社会更加重视个人、企业数据的隐私保护问题,国内外的数据监管法律也日趋严格5。例如 2017 年 6 月,中国提出的 中华人民共和国网络安全法 针对数据收集与处理提出约束和要求;美国在 2020 年 1 月正式生效的 加利福尼亚州消费者隐私法 (California Consumer Privacy Act,CCPA)6。针对此现象,宫晓曼7提出了一种在云计算环境中挖掘物流历史数据寻找最优物流服务商的方法;Cao K 等8将线下企业、电商平台与物流服务商考虑为一个市场,基于此开发 NE、Y、YT 三个理论模型,通过模型指导企业确定最优物流服务商。在实际场景中,物流数据分散存储,具有隐私性强、多源异构、可用性低等特征。因此,联邦学习(Federated Learning,FL)是保护数据隐私的同时解决数据孤岛问题的有效方式9。联邦学习是谷歌实验室提出来的一种用于保护数据隐私的机器学习框架10。客户可以在本地训练模型,在不违反数据隐私的情况下根据本地模型更新共同训练一个全局模型11-12。在对数据隐私要求高且存在数据孤岛问题的物流服务商选择场景中,联邦学习有着天然的适配性。综上所述,本文研究分布式环境下实现多源数据联合建模选取最优物流服务商的方法。本文主要工作如下:(1)构建物流服务商选择层次化架构,在保护数据隐私的前提下,实现联邦学习模型的应用;(2)针对物流数据差异化问题提出了一种基于联邦学习的电子商务企业物流服务商选择研究Research on the Selection of Logistics Service Providers for E-commerce Enterprises Based on Federated Learning王志惠,傅德谦(临沂大学 信息科学与工程学院,山东 临沂 276000)WANG Zhihui,FU Deqian(School of Information Science&Engineering,Linyi University,Linyi 276000,China)8物流科技 2023 年第 5 期 3 月上基于联邦学习的电子商务企业物流服务商选择研究训练数据标准化处理方法;(3)利用差分隐私算法改进 Secureboost 算法,提高了模型训练效率;(4)采用生成模拟数据进行仿真实验,验证方法的安全性和可行性。1物流服务商选择层次化架构为实现联合多方物流数据进行最优物流服务商的选择,本文设计了基于联邦学习的物流服务商选择层次化架构。如图 1 所示,分别由数据准备层、样本数据对齐层、联邦学习训练层、模型应用层 4 部分组成。本地模型本地模型全局模型联邦学习训练层数据准备层数据清洗数据分箱特征选择训练数据标准化物流仓储 C1运输企业 Cm样本数据对齐层加密样本对齐模型应用层物流服务商推荐数据训练数据采集图 1物流服务商选择层次化架构1.1数据准备层物流数据具有可用性低及标准化水平不高的特点,为提高物流数据质量和模型训练效率,数据准备层可以为模型提供高质量数据。因此,本文在数据准备层采用数据清洗、数据分箱、特征筛选、训练数据标准化等操作处理训练数据。本文参照相关文献,在前人研究的指标体系基础上从历史数据中筛选出具体指标数据用作样本数据。针对物流数据特征指标衡量单位和标准不同造成数据差异化大的问题,本文采用 Simple Additive Weighting(SAW)方法根据参数的实际意义做训练数据标准化处理。其中,公式(1)对正向参数做标准化处理,公式(2)对反向参数做标准化处理。正向参数是指对用户来说越大越好的参数,比如破损赔付数额;反向参数则是指对用户来说越小越好的参数,比如首重与续重价格。其他参数则采用 Z-score 标准化方法做训练数据标准化处理,采用 xi=xi-x把数据处理成符合标准正态分布的数据。其中x=1ni=0nxi是一列数据的均值,=1n-1ti=0nxi-x()2是一列数据的标准差。fij=fjmax-fijfjmax-fjminiffjmax-fjmin01iffjmax-fjmin=0(1)fij=fij-fjminfjmax-fjminiffjmax-fjmin01iffjmax-fjmin=0(2)1.2样本数据对齐层物流场景中数据分布式存储,物流供应链包括电商企业、物流企业、仓储企业、运输企业等。样本数据对齐层可以在各参与方建模前使用加密技术根据 ID 对齐各方样本数据,提取出共有 ID 的训练样本数据。本文采用 RSA 非对称加密算法和哈希机制的方案来对齐各方共有数据。1.3联邦学习训练层在联邦学习训练层采用加密模型参数传输方式联合多方数据训练模型。本文采用安全联邦决策树模型训练出最优划分的决策树模型,构建物流服务商选择树。为保障用户隐私和数据安全,引入可信第三方(政府、可信第三方企业)利用隐私保护技术加解密并协调训练模型。1.4模型应用层训练完成的模型可以通过封装接口用于电商企业的物流服务商选择应用中。模型应用层为电商企业提供模型应用接口,通过此层将符合用户选取指标要求的预测结果传到用户端,为电商企业提供最优物流服务商。2物流服务商选择模型与算法2.1模型整体架构本文设定的选择模型整体架构如图 2 所示,分别由 m 个企业客户端和 1 个中心服务器组成。其中,客户端由 m 个物流供应链上的企业组成,各企业间具有大致相同的物流订单 ID 索引。中心服务器是一个可信第三方(例如政府机构、安全数据共享机构)。为提高训练过程中的通信效率,本文对安全联邦决策树做了分析和改进,采用了差分隐私的思想加密传输聚合梯度值。在建模任务中,参与联合建模的企业方分为主动方和被动方。主动方提供的用户数据内包含标签值,其担任数据对齐的主要任务9物流科技 2023 年第 5 期 3 月上并主导服务器完成模型训练。被动方仅提供用户的样本数据,与主动方协作完成模型训练任务。完整训练流程如下。步骤 1:中心服务器生成密钥对,并将公钥发送至各企业。其中,公钥用于发送至各参与方加密传输梯度值,私钥用于解密接收到的密文。步骤 2:各企业以 RSA 非对称加密算法和哈希机制的加密方案实现样本对齐,提取各企业共同物流订单 ID 的样本数据。步骤 3:各企业使用对齐后的本地数据训练模型,以加密交换的方式计算各方本地模型的梯度与损失,实现模型的加密联合训练。步骤 4:各企业将本地模型的梯度值和损失加密发送至中心服务器。步骤 5:中心服务器将密文解密获得最终梯度信息,将梯度信息发送至各企业以更新本地模型参数。局部梯度本地数据数据预处理本地训练训练结果局部梯度加密传输,聚合梯度本地数据数据预处理本地训练训练结果中心服务器创建密钥对,发送公钥加密结算结果解密最终梯度值并将其更新到局部模型电商企业:C1物流仓储企业:C2物流配送企业:Cm加密样本对齐加密样本对齐图 2模型的整体架构2.2物流服务商选择算法对各企业数据集 X=x1,x2,xn使用 K 个回归树进行决策树模型y?i=k=1Kfkxi()的训练。为防止模型出现过拟合,引入正则项来控制模型的复杂度。则设定最优决策树算法目标函数为损失函数与正则项之和,以最小化损失为模型训练目标。当目标函数训练到第 t 轮时,前 t-1 轮的模型结果和复杂度都已确定,则第 t 轮的预测值可以表示为y?i()t=y?it-()1+ftxi()。可得第 t 轮模型目标函数为:Obj()t=ni=1llossyi,(yi()t

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开