收稿日期:2014-02-28
作者简介:汪旭颖(1990—),女,黑龙江大庆人,硕士研究生,研究方向:信息智能分析与处理。
文章编号:1003-6199(2014)02-0130-03
摘 要:传统的油田开发动态生产预警采用独立性指标阈值判别方法,从而带来预警结果不准确、异常事件发生时报警而不是预警等问题。本课题提出一种油田生产预警模型,该方法将支持向量回归机(Support Vector Regression,SVR)用于油田生产预警中,通过分析历史生产动态数据,找到它们的变化规律,总结出生产异常警报形成模式,在油田异常事件的初期给出预警信号,提前分析处理潜在隐患,以便保证油田采收效率的稳定性。实验结果证明模型对于油田生产中发生的异常情况具有较高的预测准确性。
关键词:油田;预警;支持向量回归机
中图分类号:TP311文献标识码:A
Research on Early Warning Model of Oilfield Production Based on Support Vector Regression
WANG Xuying,YAN Chong
(School of Computer and Information Technology Northeast Petroleum University , Daqing,Heilongjiang 163318 China)
Abstract:The discrimination method of independent index threshold is used in The traditional Oilfield development dynamic production warning,so it brings inaccurate warning results or it will alarm instead of early warning when an abnormal event occurs. This paper puts forward a early warning model of oilfield production,the method uses support vector Regression (SVR) for early warning of oilfield production. By analyzing dynamic data of historical production,finding their variation,summing up abnormal alarm formation mode, giving signal in the early warning,early analyzing and processing potential risks in order to ensure the stability of oil recovery efficiency is necessary. The experimental results show that the model for oilfield production abnormal condition has a high prediction accuracy.
Key words:oilfield;early warning;SVR
1 引 言
在油田生产开发过程中,积累的生产数据包含了反映其内在变化规律的信息。通过对某种生产异常事件某时间区间的数据进行综合分析,一定会发现产生这种石油生产异常事件的数据变化规律或经验,通过有效应用这些经验,用实时油田开发动态数据可预测未来可能出现的类似生产异常事件,并在异常事件的初期进行预警,以便提前采取预防措施,避免影响生产。因此为确保原油产量的稳产和高产,需要建立生产预警体系。支持向量机(support vector machines,SVM)是 Vapnik 等人在1995年提出的一种建立在统计学习理论结构风险最小化原则之上的模式分类方法[1]。支持向量回归机是SVM在回归估计问题中的应用,与SVM相比,同样具备数学理论完备、全局优化性能好、泛化能力强、采用结构风险最小化原则等优点,同时还考虑了训练样本的拟合性和复杂性,具有较好的推广性能。因而本文提出一种基于支持向量回归机的油田生产预警模型,可对将要出现的产量异常的情况进行报警,具有较高的可行性。
2 支持向量回归机概述
回归分析又称函数估计,是多元统计分析的一个重要分支。它的基本思想是通过有限多个样本数据,建立起反映输出和输入之间联系的函数关系[2]。即给定数据样本集合:
{(xi,yi)},i=1,2,…,l,xi∈Rn,yi∈R
其中yi可取任意实数,找到一个最优函数关系y=f(x)来推断输入x所对应的输出y。这里的最优都是通过针对某一误差函数而言的,Vapnik定义的ε-不敏感误差函数[3]常用于SVM回归分析中的误差函数由于油田生产数据是非线性数据,因而下面简要讲解非线性支持向量回归机的原理。
对于非线性支持向量回归机,可通过非线性映射将样本映射到高维特征空间上,将在高维空间中的线性回归与低维空间中的非线性回归相对应,其关键问题在于在最优回归函数中选择合适的核函数K(x,y)。在高维空间中构造决策超平面,求解最大化目标函数:
计算技术与自动化2014年6月
第33卷第2期汪旭颖等:基于支持向量回归机的油田生产预警模型研究
W(α,α*)=-12∑li,j=1(αi-α*i)(αj-α*j)K(xi•xj)-
ε∑li=1(αi+α*i)+∑li=1yi(αi-α*i) (1)
约束条件:
s.t.∑li=1(αi-α*i)=0
αi,α*i∈0,C,i=1,2,…,l (2)
对应的回归函数为:
y=f(x)=∑li=1(αi-α*i)K(xi•x)+b (3)
3 基于支持向量回归机的油田生产预警模型的建立
预警是指事物发展处在复杂系统之中,各种风险因素相互依存、相互作用,当预测到事物的发展趋势可能偏离正常的轨道或产生损失时,如危险、危害、危机或灾难等不正常的状况,及时发出警报,提醒人们注意,并采取措施予以防范[4]。预警方法的优劣直接影响预警系统的结果输出。根据预警的机制,预警方法主要可以分为黑色 、白色、红色、绿色、黄色预警方法。其中黄色预警方法可划分为三类:指标预警、统计预警和模型预警。
3.1 产量预警主要方法
产量预警方法是油田中较为常用的预警方法,由于它只考虑到产量与时间这两个影响因素,因而造成预警结果准确性较低。它主要包括:单指标波动预警分析方法、基于功图量油的预警方法分析和油藏产量递减规律方法。针对油藏产量递减规律的预测预警方法有很多种,主要是按照油藏不同的递减规律采用不同的函数进行预测预警,其主要方法如下所示[5]:
表1 递减规律预警方法
油藏递减
类型
时间与产量之间
的关系
时间与累计产量
的关系
双曲线递
减函数
q(t)=q′(1+nDt)1n
Q=q′[1-(1+nDt)(n-1)n][(1-n)D]
指数递减
函数
q(t)=q′eDt
Q=q′(1-eDt)D
调和递减
函数
q(t)=q′1+Dt
Q=q′ln (1+Dt)D
直线递减
函数
q=q"(1-Dt)
Q=q′[1-(1-Dt)2]2D
其中q′为起始产油量;Q为油藏或者油井的累计产量;D为起始递减率;t为油藏开发时间;n为递减指数。
3.2 基于SVR的油田生产预警模型的建立
SVR油田生产预警模型的建立过程主要分为三个阶段:第一阶段是数据预处理阶段。将已有的油田生产历史数据先进行去噪声值处理,再将数据进行规范化处理,之后选择适当的一组作为测试样本数据;第二阶段是选择支持向量回归机的参数,确定核函数和惩罚系数,保证测试样本预测准确率达到最高;第三阶段是将测试样本数据作为输入空间,利用SVR模型得到预警结果。具体步骤如下:
1) 数据预处理。在油田生产历史数据中选择适当的一组作为样本数据,主要包括以下步骤:
(1) 缺失值的填充,“光滑”数据去掉噪声值,将人为因素及地理环境因素引起的产量异常情况排除。
(2) 数据规范化处理,把属性数据按比例缩放,是指落入一个特定的小区间内。常用的规范化方法有最小-最大规范化、z分数规范化和按小树定标规范化。本文采用最小-最大规范化:
ν′i=νi-min Amax A-min A(max ′A-min ′A)+min ′A (4)
其中max A和min A是属性A的最大值和最小值,通过计算,把A的值νi映射到区间min ′A,max ′A中的ν′i。本文的新区间取[-1,1]。
2) 选择核函数和惩罚系数c。在支持向量回归机中关键问题在于核函数的选择[6],核函数将在高维空间中的线性回归与低维空间中的非线性回归相对应,在计算复杂度基本不变的情况下解决了非线性回归问题。目前常用的核函数主要有:
(1)线性核函数:
K(xi,xj)=(xi,xj);(5)
(2)多项式核函数:
K(xi,xj)=(xi,xj)+1nn=1,2,…;(6)
(3)径向基核函数:
Kγ(xi,xj)=exp {-γxi-xj2})(7)
该式中γ为参数;
(4)Sigmoid核函数:
K(xi,xj)=tanh (γ(xi•xj)+c)(8)
该式中γ>0,c>0。
本文参照台湾林智仁教授于2001年开发设计LIBSVM软件包[7],并通过对样本进行分组交叉验证寻找支持向量回归机的最优参数。
3) 用测试样本对支持向量回归机模型进行测试,最后得到油田生产预警模型。
4 仿真结果分析
4.1 实验结果及分析
以大庆油田某采油区块的实际产油数据为例进行实验分析。
表2 SVR模型验证结果
标号
核函数
c
ε
准确率
1
多项式核函数
1
0.1
80.5%
0.01
83.2%
2
Sigmoid核函数
1
0.1
73.3%
0.01
76.1%
3
径向基核函数
1
0.1
82.8%
0.01
85.5%
4
多项式核函数
2
0.1
83.6%
0.01
84.7%
5
Sigmoid核函数2
0.1
81.4%
0.01
82.5%
6
径向基核函数
2
0.1
88.2%
0.01
92.6%
如表2所示当核函数为径向基核函数,惩罚因子为2,误差ε取0.01时模型对测试样本预测的准确率最高,准确率达到92%。
4.2 与其他方法的性能比较
BP神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一[8]。由于它具有实现任何复杂非线性映射的功能和具有自学习能力,也常用于预警研究。本文将相同油田数据样本下的SVR方法与BP神经网络方法用于油田预警进行比较,结果如下表所示。
表3 SVR方法与BP神经网络方法性能比较
测试方法
测试样本
预警正确数
正确识别率
BP神经网络
100
83
83%
SVR
100
94
94%
从上表可以看出,在相同样本情况下,支持向量回归机方法优于BP神经网络方法,预警正确率较高,由此,本文提出了基于支持向量回归机的油田生产预警模型,克服了神经网络方法的过学习、局部极小值等问题。
5 结束语
文中在对传统预警方法的学习分析基础之上,提出了基于支持向量回归机的油田生产预警模型,通过实验结果证明,本文提出的基于支持向量回归机的方法能更好地对油田生产进行预警,提供了一种有效的预警方法,具有很好的应用价值。同时,文中仅仅对油田生产的单井预警进行了初步分析和研究,其中影响油田产量的因素、生产状况预警区间的划分还要进一步研究和深化。
参考文献
[1] 邓乃扬,田英杰.数据挖掘中的新方法——支持向量机[M].北京:科学出版社,2004:51-52.
[2] 薛薇.SPSS统计分析方法及应用[M].北京:电子工业出版社,2009:234-291.
[3] VAPNIK VN.The nature of statistical 1earning theory[M].New York:Springer,1995.
[4] 罗有刚.油井生产动态预警研究[D].北京:中国石油大学,2009.
[5] 魏军. 基于抽油机效率的油田开发预警模型研究[D].大庆:东北石油大学,2013.
[6] 李卓,刘斌,刘铁男,等.基于支持向量机的抽油机故障诊断研究[J].微计算机信息,2006,22(7):209-211.
[7] CHIHWei hsu, CHIHChung chang,CHIHjen lin.A Practical Guide to Support Vector Classification[J].Taiwan.National Taiwan University.2008.
[8] 邢志伟,张辉.基于支持向量机的飞机地面结冰冰型分类预测[J].计算机技术与发展,2012,22(6):247-250.
扩展阅读文章
推荐阅读文章
花田文秘网 https://www.huatianclub.com
Copyright © 2002-2018 . 花田文秘网 版权所有