基于多任务强化学习的堆垛机调度与库位推荐_饶东宁.pdfVIP免费

下载本文档

阅读 1
下载 0
格式 pdf
大小 1.87 MB
约10页
2023-05-04
收藏
评论
点赞(0)
海报
举报

/10

第49卷第2期2023年2月ComputerEngineering计算机工程基于多任务强化学习的堆垛机调度与库位推荐饶东宁，罗南岳（广东工业大学计算机学院，广州510006）摘要：堆垛机调度是物流仓储自动化中的重要任务，任务中的出入库效率、货物存放等情况影响仓储系统的整体效益。传统调度方法在面对较大规模调度问题时，因处理大状态空间从而导致性能受限和收益降低。与此同时，库位优化与调度运行联系密切，但现有多数工作在处理调度问题时未能考虑到库位优化问题。为解决仓储中堆垛机调度问题，提出一种基于深度强化学习算法的近端策略优化调度方法。将调度问题视为序列决策问题，通过智能体与环境的持续交互进行自我学习，以在不断变化的环境中优化调度。针对调度中伴生的库位优化问题，提出一种基于多任务学习的调度、库位推荐联合算法，并基于调度网络构建适用于库位推荐的Actor网络，通过与Critic网络进行交互反馈，促进整体的联动和训练，从而提升整体效益。实验结果表明，与原算法模型相比，该调度方法的累计回报值指标平均提升了33.6%，所提的多任务学习的联合算法能有效地应对堆垛机调度和库位优化的应用场景，可为该类多任务问题提供可行的解决方案。关键词：堆垛机调度；库位优化；多任务学习；深度强化学习；近端策略优化开放科学（资源服务）标志码（OSID）：中文引用格式：饶东宁，罗南岳.基于多任务强化学习的堆垛机调度与库位推荐［J］.计算机工程，2023，49（2）：279-287，295.英文引用格式：RAODN，LUONY.Stackerschedulingandrepositorylocationrecommendationbasedonmulti-taskreinforcementLearning［J］.ComputerEngineering，2023，49（2）：279-287，295.StackerSchedulingandRepositoryLocationRecommendationBasedonMulti-TaskReinforcementLearningRAODongning，LUONanyue（SchoolofComputers，GuangdongUniversityofTechnology，Guangzhou510006，China）【Abstract】Stackerschedulingisanessentialtaskinwarehousingautomation.Inbound-outboundefficiencyandstoragesituationsaffectoverallefficiency.Whenhandlinglarge-scaleproblems，traditionalschedulingmethodscannotachieveperformancebecauseprocessinglargestatespacesischallenging.Meanwhile，optimizationofrepositorylocationiscloselyrelatedtoschedulingoperation，butmostexistingworksignoreitwhenaddressingschedulingproblems.Tosolvetheschedulingproblem...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容