温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
融合
概念
粗糙
Vague
决策
模型
杨洁
第 卷第 期重庆邮电大学学报(自然科学版)年 月 ():融合云概念的粗糙 集的三支决策模型收稿日期:修订日期:通讯作者:杨 洁 基金项目:国家自然科学基金(,);贵州省优秀青年科技人才项目(黔科合平台人才 号);贵州省科技计划项目(黔科合基础 一般);重庆市自然科学基金();贵州省普通高等学校电子制造产学研基地开放基金(黔教合 字 号);遵义师范学院博士启动基金(遵师 号);重庆市教委重点合作项目():(,);();();();();();()杨 洁,王志俊,刘 群,李 帅,徐泰华(重庆邮电大学 计算智能重庆市重点实验室,重庆;遵义师范学院 物理与电子科学学院,贵州 遵义;江苏科技大学 计算机学院,江苏 镇江)摘 要:集是模糊集的扩展模型,从正反两方面来描述事物的不确定性,粗糙 集比粗糙模糊集更具有普遍性。目前,三支决策的阈值主要是由单个专家给出,不能反映认知过程中复杂的不确定性形式。针对这一问题,提出了一种融合云概念的粗糙 集的三支决策模型。使用基于密度中心的云概念群决策方法求解损失函数,不仅保证综合评价的精度,还为损失函数提供了新的语义解释。构建了粗糙 集的三支决策模型并揭示了其误分类代价随着粒度细化而单调递减的规律。通过实验验证了该方法的可行性,克服了现有模糊集在三支决策中对事物不确定性表达不够清楚的缺点。关键词:集;模糊集;模糊熵;云综合;三支决策中图分类号:文献标志码:文章编号:(),(,;,;,):,(),:;引 言粗糙集是 在 年提出的一种处理不精确、不确定和不完备信息问题的工具。粗糙集只需要给定属性集合来划分子集,通过等价关系将离散数据划分为 个不相交的区域,不需要提供额外的专家意见和阈值。粗糙集的特性吸引了许多研究人员研究并成功应用到故障诊断、数据挖掘、图像分析等领域。但在现实生活中,研究对象的属性值除了离散的还有可能是连续的,例如,降水概率、投票、打分等。因此,等在粗糙集的基础上提出了粗糙 集,集以连续的(),()值来描述事物的不确定性。粗糙 集比粗糙集能更好地描述客观世界,符合人类的一般认知,为处理不确定性问题提供了新的角度,解决了粗糙集不能处理连续属性值的缺点。三支决策(,)是 在 年提出的一种数据分析方法。的主要思想是通过三分法将问题划分为 个子问题,通过不同的策略来解决相应的子问题。经过十几年的发展,在理论和应用方面都取得了许多进展。例如,等讨论了多粒度序贯三支决策模型;等提出了一个新的三支决策模型。另外,的思想被广泛应用于垃圾邮件过滤、推荐系统等领域。与模糊集、粗糙集、云模型等理论逐渐成为了处理不确定问题的主流工具。目前,三支决策的阈值主要是通过专家或者启发式函数给出,其中,专家直接给定的参数评价不能反映认知过程中复杂的不确定性形式。针对这一问题,本文基于粗糙 集和云模型提出了融合云概念群决策的粗糙 集的三支决策模型。通过云模型的群决策方法和 散度的平方根(,)相似性度量来得到决策阈值。其中,云模型表示的专家评价是基于专家单个评价参数得来,在保证评定过程可行性的同时更符合一般人对事物的认知情况。将云综合得到的阈值代入粗糙 集的三支决策模型中,证明了粗糙 集的误分类代价随着粒度细化而单调递减的规律。本文将 和云模型结合起来,得到了一种新的云综合方法,该方法提升了阈值的精确性和合理性。同时,将粗糙 集和三支决策结合起来提供了一个解决不确定问题的新角度,克服了现有模糊集对事物不确定性表达不够清楚的缺点。相关概念在本节中主要回顾了 集、模糊集等相关知识。设有决策系统(,),其中,为非空有限集,为条件属性,为决策属性,为所有属性的值,:是一个信息函数。定义(模糊集)模糊集设为,()是在一个全集 中,隶属度函数在 中的值是,。定义(集)集设为,集在全集 中的特征为真隶属度函数()和假隶属度函数()。()是支持 的证据所导出的 的隶属度下界,()是反对 的证据所导出的 的隶属度下界,它们二者组成了 集的隶属度。它们的值都是,且()()。当 为 连 续 集 合 时,集 表 示 为 (),()。当为离散集合时,集表示为 (),()。其中,(),()表示 的 值,()()()。实际上,模 糊 集 是 特 殊 的 集,当()()时,即 的隶属度从一个区间值变成了一个具体的值时,集就退化成了模糊集。定义(粗糙集)设有决策系统(,),其中,和,的上下近似集表示为(),()第 期 杨 洁,等:融合云概念的粗糙 集的三支决策模型。其中,是等价关系 得到的等价类,即 ,。同时,也被称为知识空间和粒度层,当()()时,称为可定义集,否则为粗糙集。全集 被划分为正区域、边界区域和负区域。个区域的表示分别为()(),()()(),()()。定义(模糊熵)设 (),()。和 是 个不同的模糊集,()是所有模糊集在 上的总和。映射:(),是 的模糊熵,满足以下几条约束关系。)当且仅当()时,(),其中,()是 的幂集,是精确集;)当且仅当()时,();)()()()()()();)对任意模糊集(),()()。其中,是 的补集。粗糙 集的三支决策模型在三支决策当中,如何获得最合理的损失参数仍然是三支决策过程当中的关键一步。其中,获得损失参数最直接的方法就是由相关方面的单个专家给出,但是由于每个人的看法和喜好不同,这又带来了新的不确定性。本文基于文献提出了 的综合云模型。不仅能对损失函数进行新的语义解释,而且能融合多个专家的评价得到一个更加合理的结果。综合云模型定义(云模型)设 在论域 上,表示为包含、和 这 个数字特征的云概念。若 是 的一次随机实现,且,则 对 的确定度()是在一个区间内规律分布的随机值。():,。其中,和 分别对应为(,),(,)。且()满足指数函数形式,()()。以上所有云滴形成的变量 的分布称为正态云模型。正态云模型与高斯分布之间存在着密切的联系。特别当 中的超熵 时,正态云模型退化成高斯分布,也被称为云模型的期望函数,表示为()。此外,根据高斯分布的 原则,正态云模型稳定时,云滴的确定度会在内外包络曲线内,其内外包络曲线形式为()(),()()。定义(基于 的综合云模型)是度量相似性的计算方法。设 是精确数值表示的定量论域,(,)和(,)是 上的 个基础云概念。可以得到表达式 ()()(),其 中,()。()表示对称 散度,是基础云,和 的对称 散度度量综合云模型。将正态云模型转变为高斯分布函数,问题就转化为关于高斯分布问题。设(,)和(,)是 和 的高斯分布函数,则存在唯一的高斯分布函数(,),使得函数()取得最小值。()定义为()()()()()()式中,()展开式为(,)()()()。为了求()式的最小值,需要对函数求导,但该函数存在 个变量,因此,需要对 个未知参数、分别求导化简,可知()在其定义域内是凸函数,所以存在其最小值。同理,因为 个凸函数相加也为凸函数,()和()也应存在最小值。所以,()存在全局最小值。求解()式的最小值,只要满足目标函数的梯度为 即可,即求得方程组()的最优解。重 庆 邮 电 大 学 学 报(自然科学版)第 卷()()()()()方程组()用正常的梯度下降法很难求得最优解,因此,使用牛顿法来解决此问题。密度中心的云综合方法多个专家决策过程当中,不同的决策者的专业水平和个人状态都是不同的,为了得到一个合适的综合评价,还需要对决策者做出的决策赋予一个权重。设高斯分布簇(,),其中,所对应的权重集合为 ,则存在唯一的高斯分布(,),使得目标函数取得最小值,从而得到()()()()()式中,。从粒认知计算来看,群决策是数据粒化的过程。因此,按照粒化数据的特异性原则,综合云应该越精确越好,在群决策的过程中,需要对云模型的分布设立范围。从上文可知,云模型的内包络曲线和外包络曲线分别是云模型分布的上下边界曲线。如果要确定综合云模型的分布范围,则需要在多个基础云之间找到一组合适的高斯分布曲线,使综合云的内外包络曲线分别求得最大和最小值。设云模型簇 (,),正态分布函数簇(,(),内外包络曲线对应的最优 值满足(,)(,()()(,)(,()()()式和()式是多变量优化问题,即需要同时满足 和 变量情况下使得()式中的值最小,在此前提下代入参数、和一组 使得()式和()式求得最小值,即可得到最大方差值 和最小方差值。由于是多变量问题,本文使用粒子群优化算法(,)求解。定义(基于密度中心的云综合)设 是论域,(,)是 上的 个基础云概念,其对应的权重集合 ,。若(,)是簇 的期望曲线关于()式的最优解,(,)和(,)是分别关于云模型簇 的()式和()式的最优解。云模型簇 基于 所得到的综合云模型(,)满足 ()()()()式最大化了综合模型内外包络曲线的差异,满足粒化中的特异性原则。在基于云综合的群决策中分别得到各损失参数的 值即为所需要的期望值。粗糙 集的三支决策模型将贝叶斯理论和粗糙集结合起来建立了三支决策模型。三支决策模型主要是由状态集和动作集组成。状态集可表示为 ,分别表示对象 属于集合 与不属于集合,动作集,分别表示将对象 分类到正区域()、边界区域()和负区域()中的决策动作。可以将这 个决策过程分别称为接受、延迟和拒绝。对象 处在不同状态下进行不同决策动作将带来不同的决策代价,如表 所示。表 决策代价 动作()()()()()()表 中,当对象 属于集合 做出了、和这 种不同的决策动作时,分别产生了、第 期 杨 洁,等:融合云概念的粗糙 集的三支决策模型和 这 种不同的决策代价。当对象 不属于集合 做出、和 这 种不同决策动作时,分别产生了、和 这 种不同的决策代价。同时,决策代价满足不等式 和。条件概率()的含义是将对象 划分到目标概念 的概率。表示对象 的所属等价类。对象 做出不同决策所产生的不同损失代价表示为()()()()()()()()如果()()且()(),则决策结果为接受,即();()如果()()且()(),则决策结果为延迟,即();()如果()()且()(),则决策结果为拒绝,即()。因为()(),可以将上面的决策规则改写为以下新的形式。()如果()且(),则决策结果为接受,即();()如果()且(),则决策结果为延迟,即();()如果()且(),则决策结果为拒绝,即()。以上决策中,阈值、和 分别定义为 ()()()()()()()定义(集的均值隶属度)对给定的决策系统(,),。是 上的一个 集。,。其中,(,)和 。如果有()()()()()()()(,),则 是 上的一个 集,将视为 的均值 集。在粗糙 集中,决策代价通常源自每层粒度的 个区域,即正区域、负区域、边界区域。又因为正区域或负区域的对象是不确定的,其对象的隶属度可能不完全是 或者是。而随着知识空间的细化,正区域和负区域的对象可能被重新分类到其他区域中,即 个不相交区域内的对象可能会随着粒度的细分而不断地发生变化,导致粗糙 集中各个粒度层的分类决策代价也会发生相应的变化。本文将分析粗糙 集中决策代价在知识空间中的变化规律。本文为了方便设 ,假定,则在粗糙 集中有 ,。设 是 上的 集,其中,区域决策代价定义如下。正区域决策代价表示为(,)()(,)()()。负区域决策代价表示为(,)()(,)()()()。边界区域决策代价表示为(,)()(,)()()。总决策代价表示为(,)()(,)()(,)()(,)()。定理 给定一个决策系统 (,),。设 为 上的 集。有(,)()(,)(),。证明 设,是非空有限集,有 ,和 ,。因为,为 重 庆 邮 电 大 学 学 报(自然科学版)第 卷简单起见,假设只有一个粒度 可以被划分为 个更细的颗粒,即(更加复杂的情况都可以从这个情况转化而来)。不失一般性有,(),即 ,。证明理论 有以下 种情形。)假设(),显然(,)()。情况 如果()和(),那么有(,)()和(,)()。()(,)()(,)()(,)()(,)()()()()()()()()()()()()()。由()()()()()()()()(),可以得到(),因此,有(,)()(,