内容提要本书是有关数据挖掘中基于邻域概念的聚类分析和离群检测算法的专著。主要内容如下:在自然邻居概念的基础上提出了局部核心点、准聚类中心、自然核心点等概念;在局部核心点、准聚类中心和自然核心点概念的基础上提出了适用于复杂流形结构数据集的基于中心的聚类算法、层次的聚类算法和最小生成树聚类算法;对聚类评价标准概念及其现状进行分析,并提出了新的适用于复杂流形数据的聚类评价标准;还提出了无参的离群点检测算法,并利用互为领域图的信息,提出了离群簇检测算法。本书可供具有一定数据挖掘基础,并对聚类离群感兴趣的学生和研究者参考。图书在版编目(CIP)数据基于自然邻居的聚类分析和离群检测算法研究/程东东,黄金龙,朱庆生著.—上海:上海交通大学出版社,2019ISBN9787313220707Ⅰ.①基…Ⅱ.①程…②黄…③朱…Ⅲ.①数据采集研究Ⅳ.①TP274中国版本图书馆CIP数据核字(2019)第230986号基于自然邻居的聚类分析和离群检测算法研究JIYUZIRANLINJUDEJULEIFENXIHELIQUNJIANCESUANFAYANJIU著者:程东东黄金龙朱庆生出版发行:上海交通大学出版社地址:上海市番禺路951号邮政编码:200030电话:02164071208印制:江苏凤凰数码印务有限公司经销:全国新华书店开本:710mm×1000mm1/16印张:14.75字数:254千字版次:2019年11月第1版印次:2019年11月第1次印刷书号:ISBN9787313220707定价:58.00元版权所有侵权必究告读者:如发现本书有印装质量问题请与印刷厂质量科联系联系电话:02583657309前言|FOREWORD聚类分析与离群检测是数据挖掘领域中非常热门的两个研究课题。聚类分析的主要目标是将数据对象按照相似度划分成不同的簇,使得在相同簇中的数据对象彼此相似,而不同簇中的数据对象彼此不同。离群检测是找出其行为很不同于预期对象的过程。聚类分析和离群检测可广泛地应用于模式识别、图像处理、人工智能、医学、基因科学、地质学和管理学等领域。本书对聚类分析和离群检测的基础理论和算法进行了分析,对包含复杂结构数据集的聚类问题和离群检测方法进行了研究,为解决现有聚类分析和离群检测存在的问题提供了新的思路。首先,本书针对现有聚类分析和离群检测存在的效率问题,提出基于自然邻居的局部核心点的概念和用准聚类中心及自然核心点进行解决的思路。当需要对大量数据进行聚类的时候,传统的聚类算法需要大量的时间。因此,我们考虑从数据集中选出代表点,然后将剩余的数据对象划分到其代表所属的簇中。局部核...