2023.4电脑编程技巧与维护1概述抠图是一种技术,它通过精确估计图像中的不透明度来提取出有趣的前景。这种技术可以用来处理图像中的细节,例如,毛发和透明物体。抠图技术的数学基础模型是Porter及Duff[1]提出的图像生成模型,如公式(1)所示:Ii=αiFi+(1-αi)Biαi∈[0,1](1)在抠图的问题中,仅仅给出一幅图片I,需要计算出前景图像F、背景图像B及不透明度α,它与图像合成的求解过程相反。图像抠图的工作目标是为图像中每一个像素预测一个范围为0~1的不透明度。因为F、B、I每个像素点都由3个颜色通道组成,所以图像抠图就包含7个未知数和3个方程,这是一个病态问题。为了解决这样的计算难题,许多抠图方法采用三分图来预先标记用户指定的前景和背景部分。三分图由确定的前景区域、确定的背景区域和过度区域3个部分组成。抠图算法在这里主要的工作是估计出过度区域中像素的不透明度。自然图像抠图被广泛应用在计算机视觉任务中,例如,人工智能(AI)换脸、电影特效、虚拟现实等。2相关工作通过颜色采样的抠图方法、通过传播的抠图方法及二者结合的方法都属于传统的图像抠图方法。通过采样的抠图方法基于图像的连续性和局部相似性,假设估计未知点所需的前景F和背景B都可以在已知区域中采样得到,例如,Knockout[2]、BayesianMatting[3]、RobustMatting[4]、SharedMatting[5]。通过传播的抠图借鉴了场论的思想,把图像看作一个场,每个点都与邻域相关。每个未知点的计算都不是孤立的,而是通过对邻域像素(几何空间领域或者颜色空间邻域等)进行一定关系的计算得到不透明度,例如,ClosedForm[6]、LearningBased[7]、LargeKernelMatting[8]、KNN[9]。传统的抠图方法仅提取图像形状、颜色和纹理等浅层信息。近年来,基于深度学习的方法在各行各业都取得了显著的成就,在自然图像抠图领域也有突破性发展,神经网络具备更好的深层次语义信息提取能力,能够较好地根据图像低层次外观空间信息,对网络同层级的特征信息进行迭代复用。Xu等[10]提出了一种两阶段的模型,将图像输入模型中,经过神经网络的训练,便可估计出α图,同时还制作了自然图像抠图领域第一个较大规模的数据集。3方法3.1方法概述网络模型由生成器和判别器两个部分组成。生成器的作用是生成α图,通过训练不断生成无限接近真实图像的伪α图,生成器越好,得到的抠图结果越精确;判别器的作用是判断伪α图和真实α图,哪个为假,哪个为真。提出的模型基于改进的UNet模型作为生成...