面向异构流式数据的高性能联邦持续学习算法_姜慧.pdfVIP免费

下载本文档

阅读 0
下载 0
格式 pdf
大小 1.51 MB
约14页
2023-07-24
收藏
评论
点赞(0)
海报
举报

/14

2023年5月JournalonCommunicationsMay2023第44卷第5期通信学报Vol.44No.5面向异构流式数据的高性能联邦持续学习算法姜慧1,2，何天流1,2，刘敏1,2,3，孙胜1，王煜炜1,2（1.中国科学院计算技术研究所，北京100190；2.中国科学院大学计算机科学与技术学院，北京100190；3.中关村实验室，北京100084）摘要：为了缓解提供智能服务的AI模型训练流式数据存在模型性能差、训练效率低等问题，在具有隐私数据的分布式终端系统中，提出了一种面向异构流式数据的高性能联邦持续学习算法（FCL-HSD）。为了缓解当前模型遗忘旧数据问题，在本地训练阶段引入结构可动态扩展模型，并设计扩展审核机制，以较小的存储开销来保障AI模型识别旧数据的能力；考虑到终端的数据异构性，在中央节点侧设计了基于数据分布相似度的全局模型定制化策略，并为模型的不同模块执行分块聚合方式。在不同数据集下多种数据增量场景中验证了所提算法的可行性和有效性。实验结果证明，相较于现有工作，所提算法在保证模型对新数据具有分类能力的前提下，可以有效提升模型对旧数据的分类能力。关键词：异构数据；流式数据；联邦学习；联邦持续学习；灾难性遗忘中图分类号：TP302文献标志码：ADOI:10.11959/j.issn.1000−436x.2023102High-performancefederatedcontinuallearningalgorithmforheterogeneousstreamingdataJIANGHui1,2,HETianliu1,2,LIUMin1,2,3,SUNSheng1,WANGYuwei1,21.InstituteofComputingTechnology,ChineseAcademyofSciences,Beijing100190,China2.SchoolofComputerScienceandTechnology,UniversityofChineseAcademyofSciences,Beijing100190,China3.ZhongguancunLaboratory,Beijing100084,ChinaAbstract:AimingattheproblemsofpoormodelperformanceandlowtrainingefficiencyintrainingstreamingdataofAImodelsthatprovideintelligentservices,ahigh-performancefederatedcontinuallearningalgorithmforheterogeneousstreamingdata(FCL-HSD)wasproposedinthedistributedterminalsystemwithprivacydata.Inordertosolvetheprob-lemofthecurrentmodelforgettingolddata,amodelwithdynamicallyextensiblestructurewasintroducedinthelocaltrainingstage,andanextensionauditmechanismwasdesignedtoensurethecapabilityoftheAImodeltorecognizeolddataatthecostofsmallstorageoverhead.Consideringtheheterogeneityofterminaldata,acustomizedglobalmodelstrategybasedondatad...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容