分享
基于核KMeans和SOM神经网络算法的海况聚类分析_陈晓曼.pdf
下载文档

ID:2515870

大小:1.39MB

页数:7页

格式:PDF

时间:2023-06-27

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 KMeans SOM 神经网络 算法 海况 聚类分析 陈晓曼
第4 1卷 第3期 陕西科技大学学报 V o l.4 1N o.3 2 0 2 3年6月 J o u r n a l o fS h a a n x iU n i v e r s i t yo fS c i e n c e&T e c h n o l o g y J u n.2 0 2 3*文章编号:2 0 9 6-3 9 8 X(2 0 2 3)0 3-0 2 0 8-0 7基于核KM e a n s和S OM神经网络算法的海况聚类分析陈晓曼,苏 欢*(哈尔滨工业大学(威海)理学院,山东 威海 2 6 4 2 0 9)摘 要:为了更加高质量地利用海况数据,避免由复杂因素导致的对海况误判问题,基于KM e a n s、核技巧、自组织映射(S e l f-o r g a n i z i n gM a p p i n g,S OM)神经网络构建了自组织映射混合核KM e a n s(S OM-G a u s s i a na n dP o l y n o m i a lK e r n e l-KM e a n s,S G P K-KM e a n s)算法.克服了KM e a n s对复杂数据聚类效果不佳、核KM e a n s需要指定聚类数目和对初始聚类中心敏感的问题.通过海况数据聚类实验,将S G P K-KM e a n s算法的聚类效果与经典KM e a n s、单核KM e a n s和S OM神经网络算法进行对比分析.结果表明S G P K-KM e a n s对于海况数据聚类具有更加稳定的效果且能更加准确的识别出数据中的异常值.关键词:聚类;海况;核KM e a n s;S OM神经网络中图分类号:T P 3 9 1 文献标志码:AS e as t a t e c l u s t e r i n ga n a l y s i sb a s e do nk e r n e lKM e a n sa n dS OMn e u r a ln e t w o r ka l g o r i t h mCHE NX i a o-m a n,S U H u a n*(S c h o o l o fS c i e n c e,H a r b i nI n s t i t u t eo fT e c h n o l o g y(W e i h a i),W e i h a i 2 6 4 2 0 9,C h i n a)A b s t r a c t:I no r d e rt om a k eb e t t e ru s eo fs e as t a t ed a t aa n da v o i dm i s j u d g m e n to fs e as t a t ec a u s e db yc o m p l e xf a c t o r s,S e l f-O r g a n i z i n g M a p p i n gm i x e dk e r n e lKM e a n s(S OM-G a u s s i a na n dP o l y n o m i a lK e r n e l-KM e a n s,S G P K-KM e a n s)a l g o r i t h mh a sb e e nc o n s t r u s t e do nt h eb a-s i so fKM e a n s,k e r n e l s k i l l s a n dS e l f-o r g a n i z i n gM a p p i n g(S OM)n e u r a l n e t w o r k f o r c o m p l e xs e as t a t ed a t a.I t o v e r c o m e s t h e f o l l o w i n gp r o b l e m s,f o r e x a m p l e,KM e a n sh a sp o o r c l u s t e r i n ge f f e c to nc o m p l e xd a t a,k e r n e lKM e a n sn e e d st os p e c i f yt h en u m b e ro fc l u s t e r sa n di ss e n s i-t i v e t ot h e i n i t i a l c l u s t e r i n gc e n t e r.W i t ht h es e as t a t ed a t ac l u s t e r i n ge x p e r i m e n t,t h ec l u s t e-r i n ge f f e c t o f S G P K-KM e a n s a l g o r i t h mi s c o m p a r e dw i t h t h a t o f c l a s s i c a lKM e a n s,s i n g l e-c o r eKM e a n sa n dS OMn e u r a ln e t w o r ka l g o r i t h m s.T h ef i n d i n g ss h o wt h a tS G P K-KM e a n sh a sam o r es t a b l ee f f e c to ns e a s t a t ed a t a c l u s t e r i n ga n dc a n i d e n t i f yo u t l i e r s i n t h ed a t am o r e a c c u-r a t e l y.K e yw o r d s:c l u s t e r i n g;s e as t a t e;k e r n e lKM e a n s;S OMn e u r a ln e t w o r k*收稿日期:2 0 2 3-0 1-2 2基金项目:山东省自然科学基金面上项目(Z R 2 0 2 1 0 2 2 2 0 4 1 1)作者简介:陈晓曼(1 9 9 8),女,内蒙古呼伦贝尔人,在读硕士研究生,研究方向:数据分析通讯作者:苏 欢(1 9 8 1),女,黑龙江佳木斯人,副教授,博士生导师,研究方向:微分方程动力系统及数值解、随机微分系统、数据分析,s u h u a n t g h i t w h.e d u.c nDOI:10.19481/ki.issn2096-398x.2023.03.007第3期陈晓曼等:基于核KM e a n s和S OM神经网络算法的海况聚类分析0 引言海况是海洋与大气、海洋与海冰之间耦合的关键组成部分,对海上的运输、生产和海洋资源的开发使用等有着至关重要的作用1,2.研究者们3-6通常使用有效波高作为海洋活动中海况的使用指标,而海况对于船舶的影响往往是多种海况参数非线性耦合的结果.D o d e t等7表示在未来的研究中,多源数据的使用将为复杂现象提供更加完整的描述.海况数据用户在研究和工程应用中仍然主要依赖于数值波浪模型8,为了能够更加合理且高质量地使用海况数据,考虑利用机器学习方法对海况参数进行聚类,从而得到更加全面可靠的结果.目前国内外有一些研究通过数据挖掘对海况参数进行聚类和智能识别从而实现航速优化9-1 1.王壮1 2利用KM e a n s算法对海况数据进行聚类,智能地根据不同海况采用最佳经济航速,实验结果表 明 该 方 法 能 够 有 效 地 实 现 航 速 优 化.然 而KM e a n s聚类算法对于高维非线性数据的聚类效果并不理想,故而对于实现海况参数聚类的方法也还有待改进.在众多的聚类算法中KM e a n s1 3聚类算法应用最 为 广 泛,自 组 织 映 射(S e l f-o r g a n i z i n g M a p-p i n g,S OM)神经网络算法是全局排序的且被认为对于任意数据具有鲁棒性1 4.为克服KM e a n s算法难以处理复杂数据的不足,有学者提出利用核方法将数据嵌入高维流形,将欧氏距离替换成非线性核距 离 来 衡 量 相 似 度1 5-1 7.因 此 本 文 基 于KM e a n s、S OM神经网络算法、核技巧,构建了自组织映射混合核KM e a n s(S OM-G a u s s i a na n dP o l y-n o m i a lK e r n e l-KM e a n s,S G P K-Km e a n s)算法.针对单核KM e a n s无法全面准确地反映数据内在联系的问题,将高斯核函数与多项式核函数进行线性组合,得 到兼顾学习 能力和泛化 能力的混 合核KM e a n s来更合理的描述数据的内部联系从而提升聚类效果;由S OM神经网络算法确定混合核KM e a n s的初始聚类中心以及聚类数目,可以有效避免随机选择初始聚类中心导致的聚类效果不稳定以及易陷入局部最优的问题.本文构建了S G P K-KM e a n s聚类算法,使用夏威夷群岛北部的浮标,以1小时为分辨率选取从2 0 2 1年1月到1 2月的数据共85 8 8组进行海况参数的聚类分析,并综合考虑S C(S i l h o u e t t eC o e f f i-c i e n t)分数、CH(C a l i n s k iH a r a b a z)分数以及D B I(D a v i e sB o u l d i nI n d e x)指数对聚类的效果进行评估.实验表明,使用S G P K-KM e a n s算法对数据进行聚类所得到的聚类评估效果最好,从而本文构建的算法可以为海况的智能识别、航速优化提供更加全面准确的聚类结果,也可以为其他受海况影响的应用提供更加可靠的海况聚类结果.1 预备知识1.1 KM e a n s算法KM e a n s是一种基于划分的聚类算法,旨在最小化数据点和聚类中心之间的平均平方距离1 8.该聚类方法的思想可以归结为对样本集合X=x1,x2,xn 的划分,xi(i=1,2,n)表示数据集中第i个样本数据.通常使用欧氏距离作为距离度量.但该方法在复杂和未知形状组织的数据中表现得并不理想1 9.KM e a n s通过最小化损失函数:L(C)=hl=1C(i)=lxl i-xl2(1)来选取最优的划分.其中h表示聚类中心的数目,xl表示第l个聚类中心点,xl i表示属于第l类的数据中的第i个数据对象.1.2 核函数定义12 0 设是输入空间,H是特征空间,若存在映射(y):H使得对于任意y,z,函数(y,z)满足(y,z)=(y)(z),则称(y,z)为核函数,(y)为映射函数,式中表示内积运算.定义22 1 令为输入空间,(,)是定义在上的对称函数,若是核函数,对于任意数据x=(x1,x2,xm),称矩阵:K=(x1,x1)(x1,xm)(xm,x1)(xm,xm)为核矩阵.由文献2 0 知,只要一个对称函数对应的核矩阵半正定,该函数就可以作为核函数使用.常用的核函数有多项式核函数:(y,z)=(yz+)p(2)高斯核函数:(y,z)=e x p-y-z222(3)定理1 假设1,2是核函数,(0,1),那么 1+(1-2)也是核函数.证明:由1,2均为核函数,知1,2均为对称函数且生成的核矩阵K1,K2半正定,则(xi,xj)=1(xi,xj)+(1-)2(xi,xj)=902陕西科技大学学报第4 1卷 1(xj,xi)+(1-)2(xj,xi)=(xj,xi)即(xi,xj)是对称函数,下证该对称函数对应的矩阵K半正定.由于K=K1+(1-)K2,其中K1,K2半正定且(0,1),故对称函数对应的矩阵K半正定,从而由定理知该函数是核函数.若核函数选取不当,会将输入空间映射到不恰当的特征空间使得聚类效果不佳.高斯核函数学习能力较强泛化能力较弱;多项式核函数学习能力较弱泛

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开