温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
PDCA
模型
资源管理
方法
研究
孙建刚
现代计算机Modern Computer第 28 卷 第 24 期2022年12月25日文章编号:1007-1423(2022)24-0062-05DOI:10.3969/j.issn.1007-1423.2022.24.011基于PDCA模型的云资源管理方法研究孙建刚1,刘月灿1,王怀宇1,张攀1,储方诚2,朱洪森2(1.国家电网有限公司信息通信分公司,北京100761;2.南京南瑞信息通信科技有限公司,南京210018)摘要:随着云计算技术的发展,企业级的云计算平台在数字化浪潮中占据越来越重要的地位。云资源管理是云平台运行的关键环节,要在确保云平台稳定运行的基础上提升云资源利用效率,目前大多数企业级平台已经历大规模建设阶段,在使用阶段暴露出闲置资源多、资源分配不均、缺少管理要求及统一规范等问题,故亟需构建一套科学的云资源管理方法论,实现云资源精益管理。在PDCA模型的基础上,提出了云资源管理方法,拓展管理者对云资源全过程管理的视野,挖掘痛点问题,为企业级云计算平台长效化管理提供参考。关键词:云计算;PDCA;云资源;云资源管理0引言云计算1-2是继互联网、计算机后信息时代的又一次革新。随着云计算技术的不断发展,越来越多的企业为自己搭建自有的云平台,用来承担企业的各项业务,面向内部人员提供服务。云计算技术的出现使得传统的资源管理方式不再适用于云资源管理。云计算技术用各种软硬件资源构成各种虚拟的逻辑资源,并将这些虚拟资源组成一个大的资源池,供企业各项系统使用3。Flexera2021年云状态报告数据显示,企业上云后平均浪费了 30%的云支出,云成本预算处于失控状态4。因此,如何有效地管理云平台虚拟资源是企业云管理过程中一个 重 要 的 问 题。本 文 基 于 PDCA(plan,do,check,act)管理模型提出的资源管理方法助力企业有效管控各项业务系统的资源需求,提高云资源使用率,降低成本。1基于PDCA的云资源管理理论基础PDCA模型适用于各行业的日常管理过程。PDCA循环管理是自我发现、自我完善、自我发展的质量管理活动的科学程序和规律总结,不仅是被国内外诸多领域的实践证明了的科学有效的质量管理方法,而且还是能使任何一项工作有效进行的合乎逻辑的工作程序。PDCA是一个动态循环的过程,云资源管理也是持续动态演进的一个过程。企业云平台管理人员需要主动开展云资源管理工作,建立循环往复、持续改进的云资源管理机制,以此推动云资源的充分利用,提高云资源使用率5-6。2基于PDCA的云资源管理方法参考PDCA管理方法,增加资源评价环节,以5个过程管控手段加1个评价晾晒分析,构建“5+1”资源管理模型,指导企业云管理部门持续开展资源管理工作。模型主要从资源规划、资源申请、资源分配、资源调整、资源回收5个必要环节进行云资源管理,通过资源评价反馈资源管控中各环节的问题,构成提出问题、解决问题、实现目标的云资源全生命周期闭环管理,使得云预算不再失控7。2 2.1 1资源规划资源规划通过对本年资源分配容量、资源增长趋势和用户增长量的分析,结合企业内部各部门的次年需求,统筹规划确定年度云平台扩容规模。每年年底统一开展需求统筹工作,通过收集次年业务系统建设需求及扩容需求,分析云上系 62孙建刚等:基于PDCA模型的云资源管理方法研究第24期统资源增长趋势,综合考虑云平台剩余资源情况与系统资源使用率,形成云平台资源年度规划需求。计算方法如下:年度规划需求=(新建业务系统资源需求+在运业务系统资源增长量-(平台总量80%-已分配量)资源利用率指数计算结果为云平台某组件资源需求,每个组件均需单独计算,各参数说明如下:新建业务系统资源需求:为次年上云系统资源需求,主要为新建系统上云资源需求。系统资源应根据业务系统的业务量、用户数、重要程度等参数评估测算,具体公式如下8-9:资源测算计算方法:虚 拟 CPU 核 数:vCPU=(TASKSF/(TC)/149虚拟内存(GB):vMEM=vCPUN存储资源测算方法:结构化数据容量:SD=RUUNBS+DU12+(12-1)6MU (PN+LN)PS30非结构化数据容量(KB):NSD=(DU+MU12)US2 2.2 2资源申请资源申请资源申请指在年度规划需求的基础上,系统上云时开展资源申请内容填报。(1)计划内资源申请。依照年度规划里收集的新建业务系统资源需求为计划内资源,相应业务系统上云时填报资源申请表,按需申请云平台组件资源。(2)计划外新增申请。若业务资源申请并非年度规划里的新建业务系统资源需求,或者与计划内的业务系统资源需求差异过大,应按统筹规划的资源测算标准重新评估,并根据云平台资源冗余情况考虑云平台规模调整10。2 2.3 3资源分配资源分配资源初始分配时默认按照最小化原则满足业务系统部署,根据系统部署和运行情况,按照资源调整方法逐步增加或减少分配的资源。(1)最小化分配方式。资源申请后,ECS虚机类资源规格参数默认按照最小化原则设置(详见下表),即最小资源规格分配方式;容器类资源还需按照总体容器节点需求量40%进行初期资源分配。(2)部署配置调整。系统部署时,如资源分配不能满足业务系统实际使用,存在应用服务无法正常启动、CPU内存使用率过高等情况时,参考当前系统使用率或报错信息进行调整扩容。表 1最小化资源开通规范组件名称ECSK8SRDSRedis生产ECSMaster节点规格Worker节点规格双节点版标准版CPU/C2448816324内存/G481632163264162系统盘/G50505050505050300数据盘/G100备注15个worker节点620个worker节点21100个worker节点总需求CPU4896 C内存96192 G总需求CPU96192 C内存192384 G总需求CPU大于192 C内存大于384 G 63现代计算机2022年表 2系统部署期间扩容标准产品ECS(云服务器)RDS(关系型数据库)Redis(缓存数据库)对象存储K8S节点扩容标准CPU日平均使用率40%或应用启动瓶颈为CPU规格不满足内存日平均使用率60%或应用启动瓶颈为内存规格不满足CPU日均使用率40%内存日均使用率60%内存日均使用率60%使用率超过85%总体集群使用率80%调整内容CPU规格扩容到2倍内存规格扩容到2倍CPU规格扩容到2倍内存规格扩容到2倍内存规格扩容到2倍扩容20%按当前集群规格增加1个节点2 2.4 4资源调整资源调整资源调整是指针对在云上投运的业务系统,以业务视角通过实时监控、周期评价查看分析业务系统云平台资源使用情况,及时发现闲置、需要调配的资源,提出优化建议并主动进行资源调整,定期记录运行情况,灵活、高效开展资源扩缩容工作。(1)调整策略。针对投运业务系统在定期巡检、资源告警等不同场景,实行不同的调整策略。周期性调整:针对投运超过1个月的系统,通过资源指标监控和定期巡检,每周或每月分析资源使用情况,根据资源利用率、资源闲置率等评价指标开展扩缩容。对于存在周期性规律的资源对象,可以制定定时扩缩容策略,按时执行资源扩缩容调整。告警型调整:制定相关业务系统或应用实例的资源监控指标和告警触发阈值,系统投运后实时监控。当触发阈值时,根据告警信息自动或手动完成资源调整。业务资源需求变更:在业务功能模块即将上/下线时,短期调整资源以应对已知功能模块上/下线,没有固定的触发阈值,根据实际业务资源使用情况和变更情况完成业务系统或应用实例的资源调整。(2)调整方式。当触发资源调整时,针对不同的云平台组件,结合系统部署架构,确定调整动作和调整内容,开展资源调整扩缩容工作。其中,调整动作主要分为横向扩缩容和纵向扩缩容,说明如下。横向扩缩容:针对云服务器(ECS等)、容器等,通过自动化扩充/缩减服务器数量规模来改善资源利用率,通常不需要中断业务,对业务影响最低。纵向扩缩容:通过改变单个云服务器(ECS等)、云数据库(RDS等)的CPU、内存等配置来改善资源利用率,一般需要服务重启。对系统部署方式无要求。2 2.5 5资源回收资源回收资源回收10是指针对业务系统下线、资源不再使用或闲置情况,每月定期开展资源回收工作,有效保障云资源合理充分利用。资源回收包括以下四种情况。(1)僵尸资源回收:每月度末针对资源利用率低且系统长期不使用、资源不释放的情况,开展资源回收。(2)闲置资源回收:业务系统上云后,超3个月未投运,按最小化原则降配;超6个月,则进行资源回收。(3)系统下线回收:已下线业务系统,与业务系统所属部门核实后,开展资源回收工作。(4)测试资源回收:对于已超过申请周期的测试资源开展资源回收工作。3基于PDCA的云资源管理成果本方法在某企业某数据中心云平台上实验后,成果明显。原先某个系统的100个微服务,网关服务和注册服务业务运行指标如表3所示,根据公式计算出该服务计算需求为 vCPU 4核,内存8 G。所有微服务以此方法测算总的计算需求约为 vCPU 400 核,内存 800 G,从而指导该系统需要申请的资源实例数量及规格。而原先系统人员自身评估需vCPU 550核,内存1340 G。使用该方法测算出资源需求,公式测算评估vCPU节约112核,内存节约498 GB。本环节资 64孙建刚等:基于PDCA模型的云资源管理方法研究第24期源测算方法更加精细,能够在满足业务需求,确保安全稳定运行的基础上,避免后续资源分配没有上限,造成资源浪费。表 3微服务运行指标服务名称网关服务注册服务N22TASK300300S350350F/%125125T300300C/%7575根据前期资源测算结果,按照最小化分配原则进行资源分配,实际分配总量为vCPU 160核、内存320 GB、结构化存储1600GB、非结构化存储300 GB。分配后资源分配量占总需求比例分别为:vCPU 40%,内存 40%,存储 30%,最小化分配后资源使用率分别为 vCPU 21.6%,内存36.8%,满足业务部署需求,后续根据实际业务量进行动态调整。通过巡检,分析发现另一系统资源使用率较低,对该系统部分资源实例进行手动降配,经过本次缩容调整,节省vCPU约 600核,内存约 800 GB。CPU 利用率从 3.4%提升至 27.9%,CPU利用率较调整前提高694.1%,内存利用率从15.7%提升至44.6%,内存利用率较调整前提高184.1%。该数据中心云平台开展资源回收工作,回收僵尸资源、闲置资源、系统下线后资源、测试资源。累计回收 vCPU 约 7000 核,内存约18000 G,存储约180 TB,提升了云平台整体资源使用率。4结语综上所述,本文提出了基于PDCA模型的云资源管理方法,详细分析和介绍了每个阶段的目标和方法,初步形成了科学有效的云资源管理方法论。使用该方法对云平台资源进行管理,有助于企业提升云平台资源利用率,减少云资源的浪费,降低云平台建设、使用预算,最大程度上减少在云平台上不必要的支出。本研究同时也可以为其他云平台资源管理方法研究提供思路和借鉴。参考文献:1 王珍.基于云计算分布式存储架构与容错技术探讨J.网络安全技术与应用,2022(12):56-57.2 周杨,王春林,徐金国.云计算环境中的软件定义网络技术应用 J.电子技术,2022,51(11):24-25.3 段昌淼.数据云平台技术研究与建设探讨 J.网络安全和信息化,2022(11):62-65.4 吕静.基于云技术的创新型科研项目审计系统 J.微型电脑应用,2022,38(10):46-49.5 梁雪梅.算力网络的概念与体系架构探讨 J.通信与信息技术,2022(5):32-35.6 胡志强,郭晓霞.基于自主可控技术的政务云应用与实践 J.网络空间安全,2022,13(4):70-77.7 张继元,孙建旸,王卫宏.基于储能云架构的能源工业互联网平台研究与应用 J.电气技术,2022,23(8):68-74.8 陈智明,张驰俊,蔡上,等.混合云架构下的云安全最佳实践 J.信息技术与信息化,2022(2):172