第23卷第2期2023年1月科技和产业ScienceTechnologyandIndustryVol.23,No.2Jan.,2023基于多模型融合Stacking集成学习的油田产量预测张庭婷1,潘美琪2,朱天怡3,曹煜2,张站权2,刘单珂2,贺兴3,于立军2(1.上海交通大学碳中和发展研究院,上海200230;2.上海交通大学智慧能源创新学院,上海200240;3.上海交通大学电子信息与电气工程学院,上海200240)摘要:基于机器学习前沿理论,提出一种基于多模型融合Stacking集成学习方式的组合预测方法,以国内某特高含水油田区块中多口水驱产油井历年生产历史数据为试验样本,预测其动态产油量。依据不同算法的训练原理,选取极限梯度提升树算法、长短记忆网络(LSTM)、时域卷积网络(TCN)等作为模型的基学习器,采用多元线性回归作为模型的元学习器。结果表明:融合后的Stacking模型充分发挥了各基学习器的优势,相比单一模型,融合后的Stacking模型预测平均误差较小,预测鲁棒性较好。该模型的提出对融合模型在特高含水油藏开发方面具有重要的应用意义。关键词:多模型融合;Stacking集成学习;极限梯度提升树;长短期记忆网络;时域卷积网络;产量预测中图分类号:TE341;TP181文献标志码:A文章编号:1671-1807(2023)02-0263-09收稿日期:2022-08-15基金项目:中国石油化工股份有限公司科技重大专项(P20071-4)。作者简介:张庭婷(1984—),女,重庆人,上海交通大学碳中和发展研究院,助理研究员,博士,研究方向为能源系统建模与大数据分析;通信作者于立军(1969—),男,吉林吉林人,上海交通大学智慧能源创新学院,院长助理,教授,博士,研究方向为能源大数据应用与风光发电智慧运维。油田开发指标的科学可靠预测是评价油田开发条件、编制油田开发计划、设计油田开发方案的基础和依据。油藏开发过程中,当油藏含水超过90%时,通常认为它处于特高含水期。相较中低含水油藏的开发,特高含水油藏阶段的显著特征主要表现在采油速度低、剩余油过于分散、措施效果变差、井况恶化、开发经济效益下降等方面[1-2]。目前中国大多数油田已进入高/特高含水期[3-4],这给油田的高效开发提出了更高的要求,亟须科学可靠的开发指标预测(如产量预测等)来支撑油田的开发。在对...