第25卷第3期2023年5月大连民族大学学报JournalofDalianMinzuUniversityVol.25,No.3May2023收稿日期:2023-01-13;最后修回日期:2023-03-12基金项目:辽宁省自然科学基金项目(2020-MZLH-19);贵州省科技支撑计划项目(2021-534)。作者简介:蔡志伟(1998-),女,河北承德人,大连民族大学计算机科学与工程学院硕士研究生,主要从事图像处理研究。文章编号:2096-1383(2023)03-0261-04基于区域生长算法的汉字笔画统计与分析蔡志伟1a,1b,奚海丹2,田云松1a,1b(1.大连民族大学a.计算机科学与工程学院;b.大连市汉字计算机字库设计技术创新中心,辽宁大连116605;2.沈阳开放大学,辽宁沈阳110003)摘要:针对现阶段汉字笔画数据集划分时所含笔画类别较少的问题,设计符合汉字特征的生长控制策略和算法框架,实现汉字笔画小类别的划分。同时,采用统计学方法,对汉字不同笔画的出现频率进行分析,并探究笔画与汉字语义之间的联系,构建了新的汉字笔画数据集,为字体设计中汉字笔画拼接奠定基础。使用GB2312编码和Unicode编码对《信息交换用汉字编码字符集》中的6763个汉字及32类笔画进行编码。通过对样本数据的实验验证,算法在汉字笔画的识别和统计分析方面表现良好,构建的汉字笔画数据集为汉字的研究以及文化传承提供了有力的技术支持。关键词:汉字笔画;区域生长算法;数据集中图分类号:TP391.1文献标志码:AStrokeStatisticsandAnalysisofChineseCharactersBasedonRegionGrowingAlgorithmCAIZhi-wei1a,1b,XIHai-dan2,TIANYun-song1a,1b(1.a.SchoolofComputerScienceandEngineering;b.DalianChineseFontDesignTechnologyInnovationCentre,DalianMinzuUniversity,DalianLiaoning116605,China;2.ShenyangOpenUniversity,ShenyangLiaoning110003,China)Abstract:InviewoftheproblemthatthereareafewstrokecategoriesinthedivisionofChinesestrokedatasetatthepresentstage,agrowthcontrolstrategyandalgorithmframeworkwithChi-nesecharactercharacteristicsshouldbedesignedtorealizethedivisionofsmallcategoriesofChinesestrokes.Atthesametime,statisticalmethodsareusedtoanalyzetheoccurrencefre-quencyofdifferentstrokesofChinesecharacters,therelationshipbetweenstrokesandChinesesemanticsisexplored,andanewdatasetofstrokesofChinesecharactersisbuilt,whichlaysafoundationforthestitchingofstrokesofChin...