基于聚类离散化的Dep-Miner函数依赖发现方法_仓敏.pdfVIP免费

下载本文档

阅读 1
下载 0
格式 pdf
大小 1.3 MB
约12页
2023-07-12
收藏
评论
点赞(0)
海报
举报

/12

第４７卷第３期２０２３年６月南京理工大学学报ＪｏｕｒｎａｌｏｆＮａｎｊｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙＶｏｌ．４７Ｎｏ．３Ｊｕｎ．２０２３收稿日期：２０２３－０１－０３修回日期：２０２３－０３－０３作者简介：仓敏（１９７９－）女，硕士，工程师，主要研究方向：项目评价方法、技术经济，Ｅ⁃ｍａｉｌ：ｊｙｙ＿ｃｍ２０２２＠１６３．ｃｏｍ。引文格式：仓敏，王静怡，吴霜，等．基于聚类离散化的Ｄｅｐ⁃Ｍｉｎｅｒ函数依赖发现方法［Ｊ］．南京理工大学学报，２０２３，４７（３）：３１８－３２９．投稿网址：ｈｔｔｐ：／／ｚｒｘｕｅｂａｏ．ｎｊｕｓｔ．ｅｄｕ．ｃｎ基于聚类离散化的Ｄｅｐ⁃Ｍｉｎｅｒ函数依赖发现方法仓敏，王静怡，吴霜，翟晓萌，程曦，诸德律（国网江苏省电力有限公司经济技术研究院，江苏南京２１０００８）摘要：针对已有函数依赖发现方法直接应用于连续型数据时，易导致依赖关系挖掘失败的问题，该文基于已有Ｄｅｐ⁃Ｍｉｎｅｒ方法，提出基于等间隔离散化的Ｄｅｐ⁃Ｍｉｎｅｒ（ＥＤ⁃Ｄｅｐ⁃Ｍｉｎｅｒ）和基于聚类离散化的Ｄｅｐ⁃Ｍｉｎｅｒ（ＣＤ⁃Ｄｅｐ⁃Ｍｉｎｅｒ）函数依赖发现方法。通过数据离散化，将指标的连续型数据合理地转变为类别数据。实现基于类别数据的函数依赖发现，提升函数依赖发现能力。同时，对Ｄｅｐ⁃Ｍｉｎｅｒ中的部分定理给出了基于反证法和枚举法的通俗化证明。该文将提出的ＥＤ⁃Ｄｅｐ⁃Ｍｉｎｅｒ和ＣＤ⁃Ｄｅｐ⁃Ｍｉｎｅｒ与不带有任何离散化操作的原始Ｔａｎｅ和Ｄｅｐ⁃Ｍｉｎｅｒ进行了实验对比。实验结果表明，该文的ＥＤ⁃Ｄｅｐ⁃Ｍｉｎｅｒ和ＣＤ⁃Ｄｅｐ⁃Ｍｉｎｅｒ方法将原始连续型数据转化为离散型分类，挖掘出了更多潜在的函数依赖关系。同时，ＣＤ⁃Ｄｅｐ⁃Ｍｉｎｅｒ的性能要优于ＥＤ⁃Ｄｅｐ⁃Ｍｉｎｅｒ，解决了等间隔离散化存在的边界值问题。关键词：聚类；离散化；函数依赖发现；等间隔离散化；类别数据；反证法；枚举法；边界值问题中图分类号：ＴＰ３９１文章编号：１００５－９８３０（２０２３）０３－０３１８－１２ＤＯＩ：１０．１４１７７／ｊ．ｃｎｋｉ．３２－１３９７ｎ．２０２３．４７．０３．００５ＣｌｕｓｔｅｒｉｎｇｄｉｓｃｒｅｔｉｚａｔｉｏｎｂａｓｅｄＤｅｐ⁃ＭｉｎｅｒｆｏｒｆｕｎｃｔｉｏｎａｌｄｅｐｅｎｄｅｎｃｙｄｉｓｃｏｖｅｒｙＣａｎｇＭｉｎ，ＷａｎｇＪｉｎ...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容