温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
UNet
地震
波初至
拾取
研究
刘志文
第 卷第期 年月太原理工大学学报 引文格式:刘志文,王进强,王广鑫基于 的地震波初至拾取研究太原理工大学学报,():,():收稿日期:基金项目:国家自然科学基金资助项目()第一作者:刘志文(),硕士研究生,()通信作者:王进强(),博士,副教授,主要从事冲击地压监测预警、采矿工程、矿山系统工程等研究,()基于 的地震波初至拾取研究刘志文,王进强,王广鑫(北京科技大学 土木与资源学院,金属矿山高效开采与安全教育部重点实验室,北京 )摘要:基于 对波初至拾取进行研究,首先对 进行降维,并从网络结构的深度和单个 的操作两方面对原始网络进行改进;然后给模型选择损失函数和优化器,让模型能够有优化的目标和方向;接着进行数据的预处理,筛选信噪比小于 的数据出来,对其进行小波阈值去噪、归一化处理;最后是训练和验证,选择在验证集上表现最优的一个模型作为最终模型。经过 条测试集数据的测试,证明所使用方法在均值、方差、命中率项指标上均优于 和 ,其中波初至拾取的精确率高达 ,为 波初至自动拾取提供了一种新思路。关键词:地震;深度学习;波初至拾取中图分类号:文献标识码:文章编号:(),(.,.,):,;,;,:;地震波到时拾取是地震数据处理中关键的一环,拾取效率与精度直接影响震源定位的效率和精度。随着数字地震台网的大量建设,海量测震数据的产生,人工拾取 波不仅费时费力,还难以进行快速智能预警,自动化快速精确识别震相对于地震学的研究有着重要的意义。传统的 (长短时窗均值比法)方法虽然过程简单,但精度不够,对低信噪比的数据拾取效果不好,且阈值需要自己设定;利用 (赤池信息准则)来寻找全局极小值作为 波初至,虽然效果要比 好,但是计算复杂,对低信噪比数据的拾取效果不理想。年 提出 ,可跳过 系数计算,直接用地 震数 据 计算 信号 的 值。年 提出 模型用于震相的拾取,效果比 好,但是依赖于时窗长度和 系数的设定,也存在对低信噪比数据拾取效果不理想的情况。语义分割是深度学习的一个研究领域,其将图片中的每个像素点进行预测分类,并将每个类别的边缘标注出来用不同的颜色对不同类别进行填充,从而达到边缘检测和分类的目的。将地震波初至自动拾取问题看成一个二分类的问题(是否为 波初至),需要判断地震序列中的每个采样点是否是波初至。因为这一判断和语义分割问题类似,因此可以借鉴语义分割模型对波初至进行自动拾取研究。(全卷积网络)、(型网络)、都是很好的语义分割模型,在图像处理方面取得了很好的效果。是语义分割模型的先驱,它的结构全部由卷积层组成,所以叫全卷积网络,其将来自深层、粗略层的语义信息与来自浅层、精细层的外观信息相结合,以产生准确和详细的分割。形状类似字母 的形状,所以叫 型网络,它通过下采样抓住上下文的信息得到高级语义特征图,再通过上采样将图片恢复到原分辨率进行输出。基于 网络进行改进,提出了 ,相比于原始的 网络结构,每个水平层都少了一个卷积层。对波初至拾取的准确率达到了,远高于 的准确率,其对地震震相的高精度识别验证了 型网络可以很好地应用到地震 波初至的自动拾取上。赵明等基于 网络提出了 型网络对震相的拾取,将 中加入了 层,能有效防止模型过拟合,但拾取精度不佳。提出了 模型用于地震事件检测和震相拾取,模型包括多层卷积池化层、残差 网络层、双向 层、层、层,最后将其分成三部分,用于检测地震事件、波到时、波到时。波到时预测的这一部分包括一层 、局部注意力机制和多个上采样、卷积操作,最后经过 层输出波概率分布。虽然 在拾取精度上很高,但是该模型庞大臃肿、参数量太多,耗费计算资源也更大。是基于 改进的一种神经网络结构,在语义分割的任务上的表现比 好,主要是它整合了不同层次的特征,比 增加了更多的特征拼接操作。理论上可以利用 模型进行地震波拾取,但相关研究未见报道。本文首先对 网络结构进行改造,然后进行地震波到时拾取研究,并与传统方法进行对比,验证本文方法的可行性与优越性。方法和数据基于 的模型 是一个基于嵌套密集的跳跃连接的语义分割模型,结构背后的基本假设是:当来自编码器网络逐渐丰富的高分辨率特征图在与来自解码器网络的相应语义丰富的特征图融合之前,该模型可以更有效地捕捉对象的细粒度细节。为了使 能应用于地震波初至拾取,且达到很好的效果,本文基于原始网络结构在个方向进行了改进:网络降维、改变单个 中的操作和改变网络的深度。为了验证单个 中的操作对模型效果的影响,首先在保持原始网络深度不变的情况下,改变单个 中的操作,有增加或者减少单个 中一组卷积和样本归一化操作的选择,对比不同情况下在验证集上漏拾数、正确拾取数、误拾数的变化,实验结果见表从表可知增加一组操作,在误拾取和正确拾取数上的结果优于不变和减少一组操作。虽然漏拾数比减少一组效果差,但从整体上来考虑,增加一组操作的效果明显更好。结果也可以用理论来解释,增加一组卷积和样本归一化操作,可以使神经网络输出更多的特征通道数,学到更多的地震波特征,因此拾取波的效果也更好。确定每个 中的操作后,再确定网络结构的深度,分别做三组实验,在、层网络深度的情况下,网络在验证数据集上的表现,得到的结果如图所示。太 原 理 工 大 学 学 报第 卷表改变单个 中的操作模型在验证集上的表现 指标减少一组操作不变增加一组操作漏拾数 误拾数 正确拾取数 图不同网络深度模型在验证集上的表现 从图可以看出随着网络深度的增加,正确拾取数逐渐增加,漏拾数逐渐减少,误拾数不是在网络深度为时表现最优。虽然误拾数是在网络深度为时表现最优,但考虑到模型的任务主要是得到更多的正确拾取数,所以网络深度确定为层。最终确定本文模型结构如图所示。图中每个 中的操作都一样,、都是一维卷积,卷积核大小为,步长为,填充为,这样做是为了使卷积后得到的结果和一维地震序列的长度保持一样。样本归一化()操作有助于防止模型过拟合,其效果比添加 层要好。增加了神经网络各层之间的非线性关系,且可以缓解梯度消失;池化操作(即下采样)为最大池化,核大小为,步长为,经过池化后的数据长度会减半;上采样操作的缩放因子为,图本文模型网络结构图 将下采样后的样本恢复到原长度,插值方式为线性插值。跳跃连接将每个 得到的输出在特征维度上进行向量的拼接。网络结构中第一个 接收地 震 数 据 的 输 入,输 入 的 向 量 维 度 为(,),表示样本批次大小,本文中取,最后一个 的输出再经过一次一维卷积得到预测结果,输出结果的向量维度为(,)综上,本文模型和 不同之处有:)维度不同,是二维图像的语义分割模型,地震数据是一维时间序列数据,不能直接用于地震 波的拾取。对其进行降维,卷积、池化、批次归一化都降为一维操作;)网络结构的深度不同:原始网络深度为层,本文模型为层;)每个 中的操作不同:原始网络中每个 包含 (卷积)、(批次归一化)、(卷积)、(批次归一化)、的操作,本文模型多了一组卷积和批次归一化操作。损失函数与优化器的选择在本文中将微震波自动拾取看作一个二分类问题,损失函数选取交叉熵损失(),公式如下:?()式中:为微震序列信号长度,是二值化编码标签,表示有两个类别分别为波初至和非波初至,其表达式为:,其中,?为最后一层 函数计算得到概率值,其表达式如下:?()其中,为最后一层输出的张量,形状大小为(,),为样本批次大小。深度学习中常用的优化器有 (随机梯度下降)、等,本文中的模型使用的是 ,优化器是 和 的结合,能很快地找到正确方向并前进,且收敛速度快,可以让模型更快地到达全局最优值。数据预处理训练、验证、测试数据均来源于 (斯坦福地震数据集),数据集的 地址为 :第期刘志文,等:基于 的地震波初至拾取研究 ,从该地址下载好需要的数据集。从源数据中筛选出三通道信噪比都低于某个值的数据,这里选择低于 的数据。选择低信噪比的数据的原因是:高信噪比数据的波自动拾取传统算法就能做得很好,对低信噪比数据进行波自动拾取研究更有意义。选出小于 的数据共 条,每条数据长度都为 ,采样频率为 原始数据示例见图(),从图中可以看出信号信噪比低,噪声和有效信号混叠在一起,很难快速准确地确定波初至点。为了减少噪声对模型的干扰,让模型更好地学习波波形特征,对原始波形数据进行降噪处理。目前,广泛使用的微震信号降噪方法主要有以下几类:)利用有效波和噪声的频率差异去噪;)利用有效波和噪声的传播方向(视速度)差异去噪;)利用有效波和噪声的空间分布差异去噪;)利用微地震资料的区域统计差异去噪;)利用信号间的相干性区分噪声;)基于神经网络的微地震去噪方法。本文中用到的地震数据震级大部分比 小,为微震事件。针对微震信号的随机非平稳性,降噪方法选取第三类中的小波阈值滤波法。小波阈值法是以小波变换理论为中心发展而来的,小波变换在信号的低频部分具有良好的频率分辨率,在高频部分具有良好的时间分辨率 。利用这一优势,提出一种基于小波变换的小波阈值滤波算法,将其应用于微震信号降噪方面,并与维纳滤波法进行对比,证明了这种方法可以用于微震信号降噪。阈值函数选择软阈值,硬阈值函数存在不连续点,易出现伪吉布斯点,选择软阈值函数使降噪后的信号更平滑;阈值选取为固定阈值,用固定阈值或启发式阈值进行降噪与选极大极小阈值或无偏风险估计阈值进行降噪相比,前者的降噪效果比较彻底,而后者相对保守,前者降噪效果好。在微震信号降噪时,采用固定阈值或启发式阈值降噪比较完全,更为有效;小波函数选择的是 ,小波基函数与地震信号的特征类似,有更好地提取微震信号的能力,降噪效果更好。通常小波分解的频段范围与采样频率有关,若层分解,则各个频段大小为 当小波函数和采样周期选定之后,信号多分辨率分解的各层所占的频带是一定的,将各层频带与实际信号的有效频带相比较,就可以确定小波分解层数。经计算分解层数为,过大则会造成信号失真。最后对经小波阈值去噪后的波形进行归一化处理,得到的数据如图()所示,从图中可以明显看出 波初至点,去噪效果好,并且对数据进行归一化后,减少了不同振幅大小对模型特征学习的干扰。图数据降噪前后对比 将数据集中实际 波到时的前后 个点都标注为,其余标注为 选前后 个点的原因是人工拾取的波到时存在 的误差,本文数据采样频率为 ,所以是前后 个点。图是将图()中分量数据进行标注处理前后的对比图(为了让 波初至和非 波初至标签对比明显,截取了前 的数据),波到时为 图数据标注前后对比 将数据预处理好后,按照的比例划分训练集和验证集,训练数据有 条,验证数据有 条。模型训练与验证用 框架搭建本文模型网络结构,并在太 原 理 工 大 学 学 报第 卷 (谷歌提供的虚拟机)上训练和验证,配置为 的运行内存,储存,为 ,最大功耗 训练和验证样本都按批次输入到模型,每个批次的大小为 条原始数据,训练和验证的轮数为,总共花了 喂入一个批次进行 训练就是个 (时间步),总 共 有 个 ,每轮有 个 ,每 个 记录一次损失函数的值。每轮训练完再喂入验证数据集进行验证,得到模型在验证集上的表现,绘制其精确度和召回率随训练轮数变化的图像,如图()所示。由于训练数据庞大,模型在第一轮训练后几乎已经收敛,验证集上数据的精确率和召回率不随训练轮数增加有明显的增加,并且有时呈现下降的趋势,但精确率基本维持在 之间,召回率在 之间。从图()中可以看出,继续增加训练轮数,训练集上的损失值还会继续下降,但下降幅度微小,在一个微小的区间内震荡,趋于平稳,对精确率和召回率的提升可以忽略。由图()可知在第一轮训练后,验证集上的精确率就已经达到,第二轮继续提升,之后三轮保持稳定。召回率在第一轮训练后达到,第二轮有所下降,之后三轮缓慢攀升,有趋于稳定的态势。综上,选择第轮的模型作为最终模型,其在验证集上精确率和召回率分别为、图模型训练与验证过程 测试和对比测试数据集的信噪比也是低于 ,且经过和训练、验证数据一样的处理,一共有 条。为了客观评估本文网络模型在测试集上的表现,我们选取了种 常 用 的震 相 拾取 算 法 进 行 对 比:和 ,对于种方法的检测结果,以人工到时拾取结果为标准,保证结果的可靠性。为评估种