第47卷第3期2023年6月南京理工大学学报JournalofNanjingUniversityofScienceandTechnologyVol.47No.3Jun.2023收稿日期:2023-01-03修回日期:2023-03-03作者简介:仓敏(1979-)女,硕士,工程师,主要研究方向:项目评价方法、技术经济,E⁃mail:jyy_cm2022@163.com。引文格式:仓敏,王静怡,吴霜,等.基于聚类离散化的Dep⁃Miner函数依赖发现方法[J].南京理工大学学报,2023,47(3):318-329.投稿网址:http://zrxuebao.njust.edu.cn基于聚类离散化的Dep⁃Miner函数依赖发现方法仓敏,王静怡,吴霜,翟晓萌,程曦,诸德律(国网江苏省电力有限公司经济技术研究院,江苏南京210008)摘要:针对已有函数依赖发现方法直接应用于连续型数据时,易导致依赖关系挖掘失败的问题,该文基于已有Dep⁃Miner方法,提出基于等间隔离散化的Dep⁃Miner(ED⁃Dep⁃Miner)和基于聚类离散化的Dep⁃Miner(CD⁃Dep⁃Miner)函数依赖发现方法。通过数据离散化,将指标的连续型数据合理地转变为类别数据。实现基于类别数据的函数依赖发现,提升函数依赖发现能力。同时,对Dep⁃Miner中的部分定理给出了基于反证法和枚举法的通俗化证明。该文将提出的ED⁃Dep⁃Miner和CD⁃Dep⁃Miner与不带有任何离散化操作的原始Tane和Dep⁃Miner进行了实验对比。实验结果表明,该文的ED⁃Dep⁃Miner和CD⁃Dep⁃Miner方法将原始连续型数据转化为离散型分类,挖掘出了更多潜在的函数依赖关系。同时,CD⁃Dep⁃Miner的性能要优于ED⁃Dep⁃Miner,解决了等间隔离散化存在的边界值问题。关键词:聚类;离散化;函数依赖发现;等间隔离散化;类别数据;反证法;枚举法;边界值问题中图分类号:TP391文章编号:1005-9830(2023)03-0318-12DOI:10.14177/j.cnki.32-1397n.2023.47.03.005ClusteringdiscretizationbasedDep⁃MinerforfunctionaldependencydiscoveryCangMin,WangJin...