分享
区块链框架下基于优化决策树模型的大数据分类算法研究_王建芳.pdf
下载文档

ID:2326114

大小:431.88KB

页数:4页

格式:PDF

时间:2023-05-07

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
区块 框架 基于 优化 决策树 模型 数据 分类 算法 研究 王建芳
第 卷 第期佳 木 斯 大 学 学 报(自 然 科 学 版)年 月 ()文章编号:()区块链框架下基于优化决策树模型的大数据分类算法研究王建芳(兰州工商学院信息工程学院,甘肃 兰州 )摘要:近年来,虽然我国大数据技术的发展水平有所提升,但是分类算法存在分类准确性问题和计算能力问题,而在区块链框架体系下,以优化决策树模型为基础的大数据分类算法,具有数据加密的特点,能够形成分布类型的决策树模型,精准进行数据的分类处理,优化决策树算法,有效解决传统大数据分类算法的问题。基于此,分析区块链框架下基于优化决策树模型的大数据分类算法应用意义,提出几点算法技术的应用措施,旨在为增强技术发展水平而提供帮助。关键词:区块链框架;优化决策树模型;大数据分类算法中图分类号:文献标识码:引言区块链框架下以优化决策树模型为基础的大数据分类算法,主要是借助区块链本身具备的数据加密优势,组建分布式类型的决策树模型,将信息增益率和信息熵作为基础部分,合理进行目标数据集的预测分类,优化处理经典决策树算法,预先留下用来缓冲的空节点,以免在中途出现分类终止的问题,提升大数据分类算法的应用,由此可见此类大数据分类算法技术的应用具有一定的优势,值得广泛推广和研究。区块链框架下基于优化决策树模型的大数据分类算法优势以区块链框架为体系、优化决策树模型为基础的大数据分类算法,实际应用的过程中,不仅能够预防出现分类中断的现象,还能在结点分裂完成后,通过所有样本平均梯度内容对下一个叶子节点权重进行修改和调整,增强整体算法的迭代寻优性能与分类效果,改善数据信息的吞吐性能,提高并行计算的水平,在不同大数据及平均分类的过程中,准确性甚至能够达到 以上,如表所示,是某企业采用区块链框架下以优化决策树模型为基础的大数据分类算法进行不同数据集的分类处理,完成分类后每种数据集的分类准确性都已经超出 。表不同数据集的分类准确性数据集类型分类准确性 区块链框架下基于优化决策树模型的大数据分类算法应用措施区块链框架下数据信息加密措施我国在通信领域、电商领域和金融领域中,数据都具备一定的碎片化分布特点,使数据信息处理的难度增加,很容易出现隐藏性的恶意攻击数据,对用户的数据安全和隐私安全造成威胁。因此,在采用相关大数据分类算法之前,需要构建相应的区块链框架,使用同态加密的技术进行数据加密处理,在不同利益相关者数据节点方面设置密钥,将各类数据同步发送到云端系统,合理设置联盟供应链网络平台中的记账节点,确保每个节点都配置独立的公钥和私钥,完善数据加密模式的同时,使各个节点相互监督,以免发生数据垄断的问题,具体的数据加密模式如图。区块链框架内进行各类数据信息的加密处理,主要是通过分布性的形式和密码学技术措施,将各种类型服务器相互连接,通过不同区块进行不同数收稿日期:基金项目:年甘肃省教育科技创新();甘肃省科技计划资助()。作者简介:王建芳()女,甘肃兰州人,副教授,本科,研究方向:大数据。第期王建芳:区块链框架下基于优化决策树模型的大数据分类算法研究据的记录。其中,分布式记账技术的应用,能够避免对特定服务器过于依赖的问题,通过去中心化的形式,预防发生数据垄断的问题。与此同时,在整体的记账节点内存储了所有区块链企业的数据信息、数据共享的途径等,可通过哈希函数提升整体数据的安全性。另外,在对数据信息进行存储的过程中,云端系统可以作为主流的存储平台,增加数据存储的容量,提升整体数据的安全性,降低存储方面的成本,保障用户各类数据的隐私和安全。图区块链框架下数据加密模式决策树模型的构建采用大数据分类计算技术期间,应以全局的角度考虑问题,寻找最优的数据内容,提升数据分类的精确度和效率,而决策树算法属于目前我国人工智能技术发展过程中的重要部分,可全面挖掘没有规则和没有次序的样本数据训练与规则,形成相应的数学分析模型,获得最为基本的数据分类规则,之后进行各种数据集的预测,分类处理。在区块链的框架体系中,可结合每个节点的分布特点和实际情况,构建多元化的决策树模型,对数据进行同步性和高效化分类。为确保决策树模型构建的效果,需要先进行候选分裂点的生成,在各个节点中明确最为良好的数据分裂时间,之后将最为良好的数据分类点当做是核心部分实现大数据分类的目的,最终进行模型的迭代更新,进行模型性能的优化。在此过程中,节点分裂是大数据样本数据信息的增益率分析和信息熵处理的基础,因此需要重点明确节点分裂的措施,如图。在整体实践操作的过程中,要将等待分类的大数据及训练样本的数量设定为,和区块链的节点数量维持在一致状态,训练及类型的总体数量为,将其标记成为,假设在训练集合之内有任意属性是,这个属性之内涉及到个属性数据值,将其标记成为,和属性数据值互相产生对应关系的样本数量是,属性取值是的样本数量是,其中的数据值区间是,那么在区块链的框架之下,大数据集合之内的训练样本集合的信息熵就可以按照公式()进行计算:()()在特征数据集合之内添加属性,按照公式()计算:(,)()()()在完成操作之后利用公式()表示信息增益率:(,)(,)()()()从本质层面而言,进行科学合理的选择,直接影响决策树模型的应用效率效果,如果在构建模型的过程中,缺少信息商属性或是信息增益效率属性,会引发分类失误的问题,因此,在实际工作中,需要确保整体决策树模型的信息熵和信息分类属性完整性,科学进行各类决策树模型的优化和处理,从根本层面预防发生分类问题。同时,由于模型在应用的过程中可能会发生局部节点分裂受阻的现象,为了不对其他节点正常的数据分裂造成影响,应重点优化决策树算法技术,在区块链整体框架之内,预先设置缓冲空节点,将用来进行数据分列的节点属性数量设定成为,在优化的过程中就要设置数量的子节点,一旦在模型内出现属性不足的问题,这个子节点就能够按照目前已知的属性将数据分类分裂输入到空节点内,以免发生分类中断的问题。图大数据的节点分裂大数据分类处理的操作在整体的区块链框架中,要结合事前已经设置佳 木 斯 大 学 学 报(自 然 科 学 版)年的树形结构训练数据集合进行处理,采用已经优化完成的决策树模型对样本目标数据值和预测数据值进行分裂处理,通过批量分裂的方式完成操作,损失函数模型如表。与此同时,应构建和优化决策树分类模型相似程度较高的反馈网络学习系统,在完成数据分裂之后,需要对其中叶子节点的权重进行修改,即可开展下一个分裂处理的操作,第棵树相关的分类损失函数如表,在公式之内主要就是采用优化决策树模型的过程中,除了第棵树的 其他 决 策树,在模 型之 内 可以对信 息熵()数据值进行全面、动态性更新处理,使得损失函数能够维持在最低的范围之内。同时在数据训练期间,需要保证数据分类的合理性和精准度,通过对损失函数偏导数据值的计算进行处理,公式如表,在公式之内主要就是损失函数的某个阶导数,相关数据值的计算分析操作之后,就要从第棵树到棵树对数据信息进行分裂处理和更新处理,主要的公式如表。在计算分析的过程中如果能够确保均方根的误差在最低范围之内,就可以按照函数公式进行数据值地推导,在公式当中主要就是数据信息分类输出之后累积的数据。表大数据分类处理操作的函数公式函数类型公式损失函数模型(,)()分类损失函数(,()()损失函数偏导数据值()数据分类和更新()()数据值地推倒()(,()()为提升整体决策树模型的优化程度,重点进行样本分类输出数据值和目标数据值拟合度的控制,确保整体分类效果符合标准要求。考虑到区块链框架之内各个节点都能够独立性进行服务器的匹配,因此,在算法优化期间还可以按照复核样本的具体状况,将模型的某个节点复制到区块链框架内,这样不仅能够彰显出区块链框架的计算价值,还能在数据分类期间使每个节点都能互相监督,有效规避数据垄断问题的出现。同时还需在不同区块之内叶子节点更新的过程中,按照上一个级别叶子节点的情况,深入性进行各类样本的索引处理,对此次梯度全面训练和更新,按照公式()的内容进行处理:()()在进行模型的迭代更新处理期间,将批次训练的措施作为基础部分,对决策树之内的网络权重数据值进行更新处理,采用网络性的分层运算措施和技术,通过所有样本的平均梯度更新方式,对不同子节点权重的比例进行更新处理,这样可以确保整体区块链框架中,所有原始数据信息都能有效处理,提升各类数据分类处理的效率效果,进行全局的训练,如图所示。图全局训练的措施结语区块链框架下基于优化决策树模型的大数据分类算法应用,具有一定的优势,能够提升各类数据及分类的准确度和精准性,因此,在新时期的环境下,应重点运用此类技术,根据区块链框架的特点和实际情况,充分发挥其数据加密的优势和价值,合理进行决策树模型的构建和完善优化,做好大数据分类处理的操作,确保能够在整体模型之内设置能够缓冲的空节点,避免发生数据分类过程中的中断问题,确保各类数据集合的有效与合理分类优化。参考文献:杨薇薇,曾凌静区块链框架下基于优化决策树模型的大数据分类算 法 研 究 沈 阳 工 程 学 院 学 报(自 然 科 学 版),():李维基于区块链技术的多边电力交易均衡优化研究沈阳:东北大学,王峰 镀锌线材厂发展战略研究 哈尔滨:哈尔滨工程大学,(下转 页)第期常江,等:一种基于单目视觉农业机器人提取导航线的方法表不同环境导航线提取结果地震波图像数量平均耗时 准确率阴天芸豆 阴天大葱 晴天芸豆 晴天大葱 结语)对图像先进行归一化处理,采用 颜色空间,采取 的处理,采用固定阈值法和 法结合处理图像二值化,通过中值滤波以及形 态学 滤 波对得到的 图像进 行 滤波,设 置 区域,消除作物的形态影响。)利用垂直投影法提取作物行特征点,最后利用最小二乘法拟合,该算法平均运行时间约 。)试验证明,算法适合传统农作带农田环境,具有精度高、耗时少等优点。满足农田机器人作业要求。参考文献:薄江辉,王茂锋 与惯性导航系统的组合应用研究通讯世界,():孟笑天,徐艳蕾,王新东,等 基于改进 均值特征点聚类算法的作物行检测农机化研究,():姜国权,柯杏,杜尚丰,等基于机器视觉的农田作物行检测 光学学报,():王祥祥,宫金良,张彦斐基于机器视觉的玉米行导航线提取方法山东理工大学学报(自然科学版),():郭祥雨,薛新宇基于机器视觉的水稻制种田导航线提取方法 中 国 农 机 化 学 报,():,:孟庆宽,刘刚,张漫,等 基于线性相关系数约束的作物行中心线检测方法农业机械学报,():陈子文,李伟,张文强,等 基于自动 变换累加阈值的蔬菜作物行提取方法研究 农业工程学报,():张泽清,陈海,蒋浩,等基于视觉的插秧机导航线提取方法研究 中国稻米,():,(,):,(),:;(上接 页)(,):,:;

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开