分享
基于近红外光谱技术和机器学习的乳腺癌原位诊断研究_尚慧.pdf
下载文档

ID:2372908

大小:881.92KB

页数:6页

格式:PDF

时间:2023-05-10

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 红外 光谱 技术 机器 学习 乳腺癌 原位 诊断 研究
第3 4卷 第4期光 散 射 学 报V o l.3 4 N o.42 0 2 2年1 2月THEJ OUR NA LO FL I GHTS C A T T E R I NGD e c.2 0 2 2收稿日期:(2 0 2 2-1 0-1 9),修改日期:(2 0 2 2-1 1-3 0)基金项目:国家自然科学基金(6 2 1 0 5 1 4 7、6 1 3 7 8 0 8 7),中央高校基本科研基金(N S 2 0 2 2 0 3 5),南京航空航天大学前瞻布局专项基金(1 0 0 3-I L A-2 2 0 2 2)作者简介:尚慧(1 9 9 8-),女,硕士,主要研究领域为生物医学光谱学及智能诊断,E-m a i l:s h 1 0 2 3_e d u 1 6 3.c o m通讯作者:尹建华,E-m a i l:y i n n u a a.e d u.c n;王慧捷,E-m a i l:w a n g h u i j i e n u a a.e d u.c n文章编号:1 0 0 4-5 9 2 9(2 0 2 2)0 4-0 3 2 2-0 6基于近红外光谱技术和机器学习的乳腺癌原位诊断研究尚慧,吴进锦,许志兵,王慧捷*,尹建华*(南京航空航天大学生物医学工程系,南京2 1 0 0 1 6)摘 要:近红外(N I R)光谱,可提供样本丰富的结构和成分信息。机器学习主要用于数据的分析和挖掘,可以对数据进行精确分类和信息提取。本研究采用自研的N I R光谱探针技术进行乳腺癌组织的原位光谱采集并进行癌变(光谱)分析;运用基线校正(B C)、标准正态变量变换(S NV)、一阶导数二阶多项式2 1点S a v i t z k y-G o l a y平滑(1s t-2-2 1 S G)和二阶导数三次多项式2 5点S a v i t z k y-G o l a y平滑(2n d-3-2 5 S G)四种方法进行光谱预处理;结合机器学习方法,包括主成分分析(P C A)、K最近邻(KNN)、F i s h e r判别分析(F D A)及支持向量回归(S V R),进行乳腺癌变和癌旁组织的分类和判别。研究发现P C A-KNN模型的最优预测结果为基于B C+S NV,其准确率、敏感性及特异性达8 8.3 4%、9 8.2 1%、7 6.1 1%。P C A-F D A模型的最优结果为基于B C+1s t-2-2 1 S G,其准确率、敏感性及特异性达9 0.0 0%、9 8.2 1%、7 9.5 4%。S V R模型的最优结果为基于B C+2n d-3-2 5 S G,其准确率、敏感性及特异性达9 0.0 0%、1 0 0.0 0%、7 9.5 5%。论证了机器学习方法结合N I R光谱可以实现小样本量乳腺癌的高效精确诊断。关键词:近红外光谱;机器学习;乳腺癌;诊断中图分类号:O 4 3 3 文献标志码:A d o i:1 0.1 3 8 8 3/j.i s s n 1 0 0 4-5 9 2 9.2 0 2 2 0 4 0 0 9S t u d yo n i ns i t ud i a g n o s i so fb r e a s t c a n c e rb yN I Rs p e c t r o s c o p ya n dm a c h i n e l e a r n i n gS HANG H u i,WUJ i n j i n,XUZ h i b i n g,WANG H u i j i e*,Y I NJ i a n h u a*(D e p a r t m e n t o fB i o m e d i c a lE n g i n e e r i n g,N a n j i n gU n i v e r s i t yo fA e r o n a u t i c sa n dA s t r o n a u t i c s,N a n j i n g,2 1 0 0 1 6)A b s t r a c t:N e a r-i n f r a r e d(N I R)s p e c t r o s c o p yc a nc h a r a c t e r i z e t h e r i c hs t r u c t u r ea n dc o m p o s i-t i o no fd e e pb i o l o g i c a l t i s s u e.M a c h i n e l e a r n i n g i sm a i n l yu s e df o rd a t aa n a l y s i sa n dm i n i n g,w h i c hc a na c c u r a t e l yc l a s s i f yd a t aa n de x t r a c t i n f o r m a t i o n.I nt h i ss t u d y,as e l f-m a d eN I Rs p e c t r a l p r o b ew a su s e d t oc o l l e c t i ns i t us p e c t r ao f b r e a s t c a n c e r t i s s u e s a n dp e r f o r mc a r c i n o-g e n e s i s(s p e c t r a l)a n a l y s i s.F o u rm e t h o d s,b a s e l i n e c o r r e c t i o n(B C),s t a n d a r dn o r m a l v a r i a-b l et r a n s f o r m a t i o n(S NV),2 1-p o i n tS a v i t z k y-G o l a ys m o o t h i n g(1s t-2-2 1 S G)a n d2 5-p o i n tS a v i t z k y-G o l a ys m o o t h i n g(2n d-3-2 5 S G),w e r eu s e df o rs p e c t r a lp r e p r o c e s s i n g.M a c h i n el e a r n i n g m e t h o d s,i n c l u d i n g p r i n c i p a lc o m p o n e n ta n a l y s i s(P C A),K-n e a r e s tn e i g h b o r(KNN),F i s h e rd i s c r i m i n a n ta n a l y s i s(F D A)a n ds u p p o r tv e c t o rr e g r e s s i o n(S V R),w e r eu s e dt oc l a s s i f ya n dd i s c r i m i n a t eb r e a s tc a n c e r o u sa n dp a r a c a n c e r o u st i s s u e s.I tw a sf o u n dt h a t t h eo p t i m a l p r e d i c t i o nr e s u l t so fP C A-KNNm o d e lw e r eb a s e do nB C+S NV,a n d i t s a c-c u r a c y,s e n s i t i v i t ya n ds p e c i f i c i t yw e r e8 8.3 4%,9 8.2 1%a n d7 6.1 1%,r e s p e c t i v e l y.T h eo p t i m a l r e s u l t so fP C A-F D A m o d e lw e r eb a s e do nB C+1s t-2-2 1 S G,a n dt h ea c c u r a c y,s e n s i-第4期尚慧:基于近红外光谱技术和机器学习的乳腺癌原位诊断研究t i v i t ya n ds p e c i f i c i t yw e r e9 0.0 0%,9 8.2 1%a n d7 9.5 4%,r e s p e c t i v e l y.T h eo p t i m a l r e s u l t so fS V Rm o d e lw e r eb a s e do nB C+2n d-3-2 5 S G,a n dt h ea c c u r a c y,s e n s i t i v i t ya n ds p e c i f i c i t yw e r e9 0.0 0%,1 0 0.0 0%a n d7 9.5 5%,r e s p e c t i v e l y.I t ssc o n c l u d e dt h a tm a c h i n el e a r n i n gm e t h o d sc o m b i n e dw i t hN I Rs p e c t r o s c o p yc a nb ea p p l i e df o re f f i c i e n ta n da c c u r a t ed i a g n o s i so fb r e a s t c a n c e r.K e yw o r d s:n e a r-i n f r a r e ds p e c t r o s c o p y;m a c h i n e l e a r n i n g;b r e a s t c a n c e r;d i s c r i m i n a t i o n1 引言乳腺癌是女性患者中常见的恶性肿瘤,严重威胁着女性的身心健康和生活质量。根据最新的统计数据,乳腺癌已经取代肺癌成为世界患者群体最大的癌症。乳腺癌的典型症状为乳房肿块、乳房分泌物等,一般不伴有疼痛,容易被忽视导致错过最佳治疗时期。因此,为了降低女性乳腺癌的死亡率,乳腺癌早期诊断和筛查是非常必要的。现有的乳腺癌诊断方法包括数字乳房x线摄影、磁共振成像(MR I)、正电子发射断层扫描(P E T)、超声波检查等1。然而,这些方法相对主观、不精确,且对患者来说较为昂贵,仍然需要一个准确、廉价和快速的检测方法2。因此,相关研究人员尝试开发其他灵活的技术,以减少对传统诊断方法的依赖,实现早发现、早诊断、早治疗,并尽可能降低死亡率。近红外(N I R)光谱具有样品应用范围广、无需预处理、简单快速、同时检测多组分等优点。它可以反映含氢基团X-H(如C-H、O-H、S-H、N-H等化学键)的特征信息。N I R光谱具有丰富的结构和组成信息,已广泛应用于食品、农业、医药、疾病等领域。N I R光谱通常与一些机器学习算法相结合来分析化学成分含量的变化。在现有研究中,K y o h e iO k u b o3将N I R高光谱成像用于小鼠肝脏脂质分布研究,并基于偏最小二乘回归(P L S R)及支持向量回归(S V R)实现小鼠肝脏脂质的无创定量分析。V.M a t o v i c4运用支持向量机(S VM)、决策树、K最近邻(KNN)等机器学习方法,结合N I R S实现对正常血糖和高血糖的无创检测。机器学习已被用作更具体的分类方法,并展现出较高的分类精度和普适性。M u n aE.R a y p a h5收集人宫颈癌细胞、人前列腺癌细胞、正常小鼠的皮肤纤维细胞及其酚红染色细胞的N I R光谱,进行主成分分析(P C A)并建 立模型进 行 分 类。K a m a l等6设计一种基于L E D的时域近红外光谱(T D-N I R S)系统,对浸润性乳腺癌及其邻近正常组织进行衰

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开