边缘
梯度
协方差
引导
甲骨
文字
修复
算法
第4 6卷2期2 0 2 3年6月 辽宁师范大学学报(自然科学版)J o u r n a l o fL i a o n i n gN o r m a lU n i v e r s i t y(N a t u r a lS c i e n c eE d i t i o n)V o l.4 6 N o.2J u n.2 0 2 3 收稿日期:2 0 2 3-0 1-1 5基金项目:国家社会科学基金资助冷门绝学研究专项项目(1 9 V J X 1 1 2);教育部人文社会科学研究一般项目(2 1 Y J A Z H 0 7 5);辽宁省社会科学规划基金资助项目(L 1 9 B YY 0 0 5);复旦大学“古文字与中华文明传承发展工程”规划项目(G 3 0 2 0)作者简介:宋传鸣(1 9 8 0-),男,辽宁沈阳人,辽宁师范大学教授,博士.E-m a i l:c h m s o n g l n n u.e d u.c n通讯作者:洪飏(1 9 7 1-),女,辽宁盖州人,辽宁师范大学教授,博士,博士生导师.E-m a i l:7 5 2 5 0 4 6 6 5q q.c o m 文章编号:1 0 0 0-1 7 3 5(2 0 2 3)0 2-0 1 9 4-1 4 D O I:1 0.1 1 6 7 9/l s x b l k 2 0 2 3 0 2 0 1 9 4边缘梯度协方差引导的甲骨文字修复算法宋传鸣1,2,乔明泽1,洪 飏3(1.辽宁师范大学 计算机与信息技术学院,辽宁 大连 1 1 6 0 8 1;2.苏州大学 江苏省计算机信息处理技术重点实验室,江苏 苏州 2 1 5 0 0 6;3.辽宁师范大学 文学院,辽宁 大连 1 1 6 0 8 1)摘 要:针对现有甲骨卜辞文字修复方法无法有效处理甲骨文字边缘的突起状毛刺、锯齿效应和笔划断裂等不足,提出一种边缘梯度协方差引导的甲骨文字修复算法.首先,将待处理的甲骨拓片图像进行对比度增强、形态学操作和连通域分析,提取出甲骨文字的候选修复区域;其次,利用边缘梯度的自相关矩阵计算文字边缘的局部曲率和灰度变化率,将其划分为平滑区域和笔划拐点/角点区域;最后,采用线性插值方法重构平滑区域,而利用局部梯度协方差和最小均方误差法计算最优的线性插值权重,实现拐点/角点区域的边缘定向插值重构.实验结果表明,该算法能够保持甲骨卜辞文字的原始字形特点,抑制字迹断裂、突起状毛刺、边缘锯齿效应和边缘特征退化的现象,获得边缘质量较高的甲骨文字.关键词:图像修复;甲骨文字修复;边缘梯度协方差;边缘定向插值中图分类号:T P 3 9 1.4 1 文献标识码:A甲骨卜辞文字是契刻于兽骨或龟甲上的一种古文字,作为可考证的最早文字系统,它对中国乃至世界文明溯源均有重要的研究意义.然而,龟甲和兽骨表面有齿缝、兆纹、盾纹、刻痕等纹理,又历经千年腐蚀,甲骨拓片图像中的字形常受到点状噪声和片状斑纹的干扰,往往模糊不清;同时,出土时的物理损坏又会导致文字笔划出现断裂和残缺.因此,对甲骨拓片图像的卜辞文字进行处理和修复是非常必要的1-2.借助计算机图像处理技术修复甲骨卜辞文字,既可以避免手工修复的不足,又能实现人机耦合地甲骨文字处理,有效复原断裂、毛刺、污迹、粗细不均、锯齿效应明显的甲骨边缘轮廓,是计算甲骨学领域的热点问题之一.目前,代表性的图像修复算法主要有4类,即基于偏微分方程的图像修复方法3-5、基于纹理合成的图像修复方法6-8、基于稀疏表示的图像修复方法9-1 1和基于深层神经网络的图像修复方法1 2-1 4.基于偏微分方程的图像修复方法通过信息扩散的方式可有效处理划痕等小尺度破损,却对甲骨拓片图像中的齿缝、盾纹和片状斑纹等较大面积破损的修复能力不足;基于纹理合成的图像修复方法利用结构样本和纹理样本的匹配,对拓片图像中的齿缝、盾纹的修复具有一定效果,却由于甲骨文字的笔划边缘第2期宋传鸣等:边缘梯度协方差引导的甲骨文字修复算法1 9 5 分布规律性不强,无法取得令人满意的修复质量,而且不能抑制拓片上的点状噪声;基于稀疏表示的图像修复方法采用边缘奇异的非线性表示提取图像的边缘结构先验,通过其主分量重建破损区域,但是容易在文字笔划边缘的附近引起振铃效应;基于深层神经网络的图像修复方法利用数量众多的神经元和变量对图像破损区域的像素值分布先验进行自适应的非线性拟合,表现出较高的修复效率,但是对兆纹、刻痕纹理干扰的稳健性不足,不能有效抵抗其与文字笔划的相互粘连.值得一提的是,龟甲和兽骨均属坚硬材质,甲骨文字的笔划边缘大多呈现明显的毛刺和锯齿状人工契刻痕迹.由于这些痕迹并未破坏图像的边缘和结构连续性,现有方法无法利用连通性先验对其进行有效修复.因此,上述4类图像修复方法尚无法直接应用于甲骨卜辞文字修复.对于甲骨文字字形的修复,沈娟等1 5对甲骨文字的轮廓进行边缘跟踪,采用最小夹角法提取笔划角点,进而将其作为2次贝塞尔曲线的控制点,对文字轮廓进行曲线拟合和基于欧氏距离的曲线细分.但是,该方法的角点提取过程对于噪声较为敏感,无法有效修复文字笔划的毛刺和中尺度断裂.顾绍通1 6认为甲骨文字边缘的毛刺和锯齿具备几何上的分形特性,进而对文字边缘的像素点坐标施加几何缩放变换,旨在通过降低边缘的分形数值来压缩笔划的震荡现象,实现了文字边缘的平滑效果.为了提高修复方法对点状噪声的稳健性,顾绍通等1 7采用泊松分布对噪声区域的面积分布规律进行建模,提出了一种噪声区域填充方法,在此基础上应用文献1 6 的方法完成甲骨文字修复,取得了更高的复原质量.不过,文献1 6-1 7 的方法均无法灵活控制修复后的边缘分形维数,若分形阈值过小,则无法消除毛刺和锯齿;若分形阈值过大,又会导致笔划尖端和拐点退化、转笔过于平滑的现象.而且,由于甲骨拓片图像的兆纹、刻痕等固有纹理和片状斑纹的分形维数与甲骨文字本身存在相似性,文献1 6-1 7 的方法仅能较好地抑制点状噪声,对固有纹理和片状斑纹干扰的稳健性尚有不足.于是,顾绍通1 8引进了一种分形插值函数系统,利用提取出的甲骨文字边缘特征点作为控制点,确定分形函数系,进而迭代地生成一系列插值边缘点,能够比文献1 6-1 7 更好地保留甲骨文字形的总体风格.然而,分形插值的迭代次数设置是该方法的难点之一,若迭代参数选取不当,则会加剧字形退化甚至改变文字笔划的形状.此外,针对甲骨文字边缘的突起状细小毛刺,顾绍通1 9提出对甲骨文字边缘的凹陷处施加形态学膨胀运算,对其凸出点则执行形态学开运算.由于未考虑原有文字边缘的形态约束,该方法容易在凹陷处膨胀产生新的突起毛刺,并且对字迹断裂和锯齿效应的处理效果不佳,对甲骨固有纹理和噪声的抵抗能力也有明显不足.针对上述问题,通过分析甲骨文字的字形边缘特征,本文采用边缘梯度协方差引导的方法对甲骨卜辞文字的轮廓进行修复.首先,将待处理的甲骨拓片图像进行对比度增强、形态学处理和连通域几何属性分析,提取出甲骨卜辞文字;其次,利用边缘梯度的自相关矩阵对文字边缘的局部曲率和灰度变化率进行分析,把其划分为平滑区域和笔划拐点区域;然后,对于平滑区域的文字边缘轮廓,采用线性插值方法对其进行平滑重构,而对于笔划拐点区域的文字边缘轮廓,则利用局部梯度协方差和最小均方误差法实现边缘定向插值重构.在保持甲骨卜辞字形和笔划整体风格的前提下,该算法能够克服字迹断裂、突起状毛刺、边缘锯齿和边缘特征退化等现象,完成甲骨卜辞文字的边缘轮廓修复.1 固有纹理和噪声对甲骨文字的影响分析甲骨文字的书写材料本身非常粗糙,且存在齿缝、兆纹、盾纹、刻痕等纹理.同时,甲骨难免遭受土壤的严重物理化学腐蚀,往往被点状噪声、片状斑纹和固有纹理等因素所影响2 0-2 1.本节将讨论不同噪声对甲骨文字修复所产生的干扰.首先,点状噪声是由于甲骨表面纹理粗糙、物理化学腐蚀等原因,在甲骨拓片墨拓或扫描过程中产生的一类噪声(如图1).一般来说,其像素亮度通常小于甲骨字形本身的像素亮度,并且噪声区域是孤立、离散、面积较小的.1 9 6 辽宁师范大学学报(自然科学版)第4 6卷图1 含有点状噪声的甲骨拓片示意图F i g.1 D i a g r a mo fo r a c l eb o n er u b b i n gw i t hp o i n tn o i s e其次,片状斑纹是在占卜过程中,由贞人对甲骨背面进行钻凿时产生的一类圆孔形、椭圆形、矩形等区域,又被称为“坑洞”(如图2).从外观上看,甲骨拓片图像中的这些钻凿坑洞一般表现为片状的、缺乏内部纹理结构的大面积连通区域.图2 含有片状斑纹的甲骨拓片示意图F i g.2 D i a g r a mo fo r a c l eb o n er u b b i n g sw i t hf l a k ym a r k i n g s然后,兆纹是由贞人对甲骨进行炙烤后,在钻凿附近所产生的位置分布不规律的裂痕(如图3(a).其特点是形态细长,不会产生程度较大的角度变化,多为一条长直线,面积略大.同时,兆纹和甲骨本身的裂纹在墨拓后会形成白色前景,既会影响甲骨自身的结构,在拓片图像中引起不同的噪声,又易于被计算机错误地判定为甲骨文字的一部分而难以消除.最后,盾纹是指龟腹甲上的一道道深陷的痕迹(如图3(b),而齿缝则是在甲片与甲片相接合之处出现的一道形似牙齿的纹理(图3(c).经过墨拓后,盾纹部分表现为一条又长又宽的白色、规则连通区域,而齿缝则表现为内部连通、边界存在锯齿状的白色连通区域.它们与其他干扰因素混淆在一起,同样会不可避免地影响甲骨文字修复,使处理过程变得更加复杂和困难.图3 固有纹理干扰因素示意图F i g.3 D i a g r a mo f i n t r i n s i c t e x t u r e i n t e r f e r e n c e f a c t o r s由上述可见,点状噪声、片状斑纹以及齿缝、兆纹、盾纹导致甲骨卜辞文字图像的纹理结构出现紊乱,而边缘断裂与锯齿状边缘破坏了甲骨文的字形风格,为甲骨文字的字形修复工作增添了困难.因此,本文将主要解决以下三方面问题:第一,分离甲骨卜辞文字与点状噪声、片状斑纹以及齿缝、兆纹、盾纹等固有纹理;第二,提取卜辞文字的字迹特征,检测甲骨文字的突起状毛刺和边缘锯齿;第三,保持原始甲骨卜辞文字的主要字形及其轮廓信息,以主要边缘的方向来抑制和修正突起状毛刺、边缘锯齿,并修复小尺度断裂的字迹.第2期宋传鸣等:边缘梯度协方差引导的甲骨文字修复算法1 9 7 2 甲骨文字的自动定位图4(a)所示为 甲骨文合集2 2第4 1 0号甲骨拓片的正面图像,图4(b)为拓片中的单字字形图像.从图4中可见,甲骨文字的笔划边缘存在断裂情况,点状噪声和锯齿效应非常明显.显然,这样的甲骨拓片图像不仅不利于古文字学者的直接观察研究,而且无法用于计算机的自动分析和处理.所以,为了提高甲骨拓片图像的成像质量,本文对甲骨拓片图像进行对比度增强、数学形态学操作和连通域几何属性分析等预处理,旨在将甲骨卜辞文字与点状噪声、片状斑纹以及齿缝、兆纹、盾纹等固有纹理相互分离,从而有利于后续步骤更准确地提取出卜辞文字的字迹特征.图4 甲骨拓片及其单字的图像示例F i g.4 E x a m p l e i m a g eo fo r a c l eb o n er u b b i n ga n d i t ss i n g l ec h a r a c t e r考虑到大部分甲骨拓片图像的前景和背景的对比度较高,本文对其进行线性灰度变换,目的是在扩大前景/背景亮度差异的同时,使拓片图像呈现更加明显的双峰直方图分布.进而,采用最大类间方差法计算最佳的全局分割阈值,形成候选的文字区域,即实现文字粗定位.此时,甲骨文字仍有较大概率与点状噪声、片状斑纹和固有纹理混淆在一起.由于3类干扰因素在面积、形状和连通特性上均不同于文字区域,故此利用数学形态学运算处理甲骨拓片图像,具体流程如图5所示.图5 形态学方法处理甲骨拓片的流程图F i g.5 F l o w c h a r to fm o r