分享
基于样本基准值的宫颈异常细胞识别方法_赵司琦.pdf
下载文档

ID:2257215

大小:869.41KB

页数:12页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 样本 基准 宫颈 异常 细胞 识别 方法 赵司琦
第 27 卷第 6 期2022 年 12 月哈 尔 滨 理 工 大 学 学 报JOUNAL OF HABIN UNIVESITY OF SCIENCE AND TECHNOLOGYVol.27No.6Dec.2022基于样本基准值的宫颈异常细胞识别方法赵司琦,梁義钦,秦健,何勇军(哈尔滨理工大学 计算机科学与技术学院,哈尔滨 150080)摘要:利用深度学习方法的宫颈异常细胞识别通常需要大量的训练数据,然而这些数据不可避免的使用不同样本的宫颈异常细胞参与模型训练,天然地缺失了单个样本内正、异常细胞内对照,导致宫颈异常细胞的识别精度不高,假阳性率高。为解决这一问题,提出了一种基于样本基准值的宫颈异常细胞识别方法。该方法首先通过 Mask-CNN 模型对宫颈细胞进行识别和宫颈细胞核分割;然后计算关键性宫颈细胞核指标,提出基准细胞概念,定义样本基准值,量化诊断标准;最后利用异常细胞核指标和模型信息完成宫颈异常细胞重分类,模拟医生对比样本内正常细胞的形态识别异常细胞,实现样本内宫颈正、异常细胞对照识别。实验表明,该方法在宫颈细胞涂片数据集上的阳性细胞查全率、阳性细胞检出准确率、样本检测准确率分别达到 84.7%、94.6%、92.4%。关键词:宫颈异常细胞识别;样本基准值;深度学习;机器学习DOI:10 15938/j jhust 2022 06 013中图分类号:TP315.69文献标志码:A文章编号:10072683(2022)06010312收稿日期:2021 08 02基金项目:国家自然科学基金面上项目(61673142);黑龙江省自然科学基金杰出青年项目(JJ2019JQ0013);哈尔滨市杰出青年人才基金(2017AYXJ013);哈尔滨理工大学杰出青年人才项目(20200203).作者简介:赵司琦(1997),女,硕士研究生;梁義钦(1998),女,博士研究生.通信作者:何勇军(1980),男,博士,博士研究生导师,E-mail:.A Method for Identifying Cervical Abnormal CellsBased on Sample Benchmark ValuesZHAO Si-qi,LIANG Yi-qin,QIN Jian,HE Yong-jun(School of Computer Science and Technology,Harbin University of Science and Technology,Harbin 150080,China)Abstract:The identification of cervical abnormal cells using deep learning methods usually requires a largeamount of training data,but these data inevitably use different samples of cervical abnormal cells to participate inmodel training,and naturally miss the positive and abnormal intracellular controls of a single sample,resulting inthe fact that recognition accuracy of cervical abnormal cells is not high,and the false positive rate is high.To solvethis problem,this paper proposes a method for identifying cervical abnormal cells based on sample benchmarkvalues.Firstly,this method identifies cervical cells and segments cervical cell nucleus by Mask-CNN model.Then we calculate the key cervical nucleus indicators,propose the concept of benchmark cells,define the samplebenchmark values,and quantify the diagnostic criteria.Finally,the abnormal nucleus indicator and modelinformation are used to complete the reclassification of abnormal cervical cells,and the abnormal cells wereidentified by simulating a doctor comparing the morphology of the normal cells in the sample.Experiments show thatthe positive cell completion rate,positive cell detection accuracy and sample detection accuracy rate on the cervicalcell smear dataset reached 84.7%,94.6%and 92.4%,respectively.Keywords:cervical abnormal cell recognition;sample benchmark values;deep learning;machine learning0引言宫颈癌是当今严重危害女性身体健康的一种恶性肿瘤。我国是宫颈癌的高发地区之一,根据中国人乳头瘤病毒(human papilloma virus,HPV)相关疾病报告显示,2018 年中国女性子宫颈癌新发病例接近 11 万,死亡病例近 5 万,伴有逐年增长和年轻化趋势1。宫颈癌患者的潜在癌变时间较长,宫颈上皮 内 瘤 变 3 级(cervical intraepithelial neoplasia,CIN3)和宫颈癌的发病平均年龄差异为 10 年,早期宫颈癌治愈率高达 91.5%。细胞学检查是目前最常用的宫颈癌筛查技术,大量实践证明该项检查技术有效降低了宫颈癌的发生率。随着图像处理技术、人工智能技术被应用于医疗领域,宫颈癌相关的智能辅助诊断系统应运而生。宫颈癌辅助诊断系统的推广与应用,一方面减少重复性人工劳动,最大程度释放病理医生效能、提高诊断正确率;另一方面使优质医疗资源下沉变为现实,提高基层医院的病理诊断水平,降低患者的治疗成本。传统检测方法通常分为两步,第一步是细胞分割,首先从宫颈细胞图像中提取出宫颈细胞,再对重叠的宫颈细胞和宫颈细胞核进一步分割与修复,第二步是细胞分类,即利用分类模型对分割得到的宫颈细胞小图片进行分类。分类模型的效果与提取特征的质量、数量息息相关。手工提取的宫颈细胞特征质量高,但数量有限;使用深度学习模型提取特征,虽然能获得庞大数目的特征,但完全依赖训练数据,缺乏定量、定性的分类标准,使宫颈细胞的分类边界模糊。宫颈细胞分割是宫颈癌辅助诊断技术中的一个重要研究方向。SONG 等2 将重叠宫颈细胞质的分割问题定义为一个具有成本函数的多个细胞的离散标记任务,利用动态多模板变形模型细化分割边界,采用多尺度深度卷积网络提取不同细胞的外观特征,在 ISBI 2015 数据集、SZU 数据集测试的 Dice 相似系 数(dice similariy coefficient,DSC)分 别 为0.89、0.84。LU 等3 利用多个水平集函数联合优化重叠细胞的分割效果,在水平集函数中添加基于轮廓长度、边缘强度、细胞形状的单项约束和基于重叠面积的成对约束。ZHOU 等4 提出一种新型实例关系网络,通过构建细胞关联矩阵以增强上下文信息,使用稀疏性约束的重叠删除模块以消除候选框的分类和定位准确性之间的不一致现象。SAHA 等5 提出了一种细胞核分割技术,该技术在聚类中添加圆形约束,在 ISBI 2014 数据集的 Dice 相似系数为0.938、召回值为 0.939,精度为0.968。PAN 等6 提出了一种宫颈细胞图像的细胞核分割方法,该方法首先去除宫颈细胞图像的背景,然后使用深卷积网络完成细胞核分割,最后引入形态作为先验知识提高分割性能。对宫颈细胞进行不同细粒度的分类研究具有重要的临床意义,常见的分类标准有 TBS(The Bethes-da system)标准(4 类)、世界健康组织分类标准(7类)以及定性诊断(2 类)。ALLEHAIBI 等7 使用esNet101 作为 Mask-CNN 的骨干网络,完成对宫颈细胞的分割,使用 VGG 网络对宫颈细胞分割结果进行细分类。AHMED 等8 在卷积神经网络的基础上,添加一个极端学习机帮助宫颈细胞分类,在Herlev 数据集上宫颈异常细胞 2 分类准确率达到99.5%,7 分类准确率达到 91.2%。SUN 等 49 提出了一个基于随机森林分类器与 eliefF 特征选择的宫颈癌诊断框架,在特征选择阶段,使用 eliefF算法对 20 个特征进行权重排序,在分类阶段,使用随机森林方法选择不同维度的特征来训练分类器。该方法在 Herlev 数据集进行 10 倍交叉验证的分类准确率为 94.44%,OC 曲线下方面积值(area un-der curve,AUC)为 0.980。WILLIAM 等10 在细胞分割时使用弱分割分类器,细胞分类时使用模糊 C均值 算 法,在 Herlev 数 据 集 测 试 时 假 阳 性 率2.53%、假阴性率仅有 0.72%。DONG 等11 提出一种 Inception v3 和人工特征相结合的细胞分类算法,使用迁移学习改善欠拟合问题,在 Herlev 数据集的准确率达到 98%。宫颈细胞切片图中细胞数量大、种类多、分布密集,目标检测算法能够直接对宫颈涂片切片图实现正、异常宫颈细胞识别,利用锚框锁定异常细胞位401哈尔滨理工大学学报第 27 卷置,不仅在速度上具有优势,同时使得宫颈细胞分类不再依赖于分割结果。XIANG 等12 在 Yolo v3 模型基础上添加级联分类任务和平滑噪声标签方法,在宫颈细胞分类获得了 63.4%的平均精确度(meanaverage precision,mAP)。郑欣等13 提出利用 es-Net50 模型作为 YOLO-v2 网络的基础特征提取模块,实现簇团宫颈细胞的识别与分类,识别准确率为75.9%。JIA 等14 在单次多边框检测网络(singleshot multiBox detector,SSD)网络基础上增加中心损失函 数,准 确 率 比 Yolo v1 网 络 高 出 7.54%、4.92%。LONG 等15 对 Mask-CNN 进行改进,添加神经架构搜索特征金字塔网络(neural architecturesearch-feature pyramid network,NAS-FPN)实现跨层连接,使用软非极大值抑制(soft non-maximum sup-pression,soft NMS)代替原来的非极大值抑制算法减少锚框的误删,提高模型在宫颈细胞病理图像细胞数据集上的准确度、召回率和分割精度。由于不同生理状态、不同年龄段的宫颈病理状态具有天然差异,宫颈细胞的形态、大小并不相同,加上采样、制片、染色等因素影响,宫颈细胞图像往往颜色多样、内容复杂。深度学习方法主要从宫颈细胞层面展开研究,极少考虑到宫颈细胞病理样本间的差异性,对宫颈异常细胞检测的影响。使用来自不同样本的宫颈异常细胞标注数据训练模型,将导致宫颈异常细胞分类标准模糊,精确率低,假阳性率高等问题。为解决上述问题,本文提出一种基

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开