曲线拟合
曲线拟合的定义
曲线拟合是指用连续曲线近似地刻画或比拟平面上离散点组所表示的坐标之间的函数关系。推求一个解析函数y=f(x)使其通过或近似通过有限序列的资料点(xi,yi),通常用多项式函数通过最小二乘法求得此拟合函数。
曲线拟合的分析
用连续曲线近似地刻画或比拟平面上离散点组所表示的坐标之间的函数关系。更广泛地说,空间或高维空间中的相应问题亦属此范畴。在数值分析中,曲线拟合就是用解析表达式逼近离散数据,即离散数据的公式化。实践中,离散点组或数据往往是各种物理问题和统计问题有关量的多次观测值或实验值,它们是零散的,不仅不便于处理,而且通常不能确切和充分地体现出其固有的规律。这种缺陷正可由适当的解析表达式来弥补。
数学表述 设给定离散数据
(xk,yk) (k=1,2,…,m),(1)
式中xk为自变量x(标量或向量,即一元或多元变量)的取值;yk为因变量 y(标量)的相应值。曲线拟合要解决的问题是寻求与(1)的背景规律相适应解析表达式
y=f(x,b),(2)
使它在某种意义下最佳地逼近或拟合(1),?(x,b)称为拟合模型;为待定参数,当b)仅在?中线性地出现时,称模型为线性的,否则为非线性的。量
tp://wiki.mbalib.com/w/images/math/5/1/e/51e3e12f67bfed9633b6fd3533f44b0e.png" alt="e_k\equiv y_k -f (x_k ,b)">(k=1,2,…,m)
称为在xk处拟合的残差或剩余,衡量拟合优度的标准通常有
tp://wiki.mbalib.com/w/images/math/f/0/4/f04af5ea7f8098c7b7cbde92735d9aa1.png" alt="T_b \equiv \max_{1 \le k \le m}w_k \left|e_k\right|"> 或tp://wiki.mbalib.com/w/images/math/5/6/b/56ba2fa5776dda2206442af19a518c7a.png" alt="Q_b=\sum_{k=1}^m w_k e_k^2">
式中ωk>0为权系数或权重(如无特别指定,一般取为平均权重,即wk(k=1,2,…,m),此时无需提到权)。当参数b)使T(b))或Q(b))达到最小时,相应的(2)分别称为在加权切比雪夫意义或加权最小二乘意义下对 (1)的拟合,后者在计算上较简便且最为常用。
模型中参数的确定 一般的线性模型是以参数 b)为系数的广义多项式,即
f(x,b)=b0g0(x)+b1g1(x)+…bngn(x) (3)
式中g0,g1,…,gn称为基函数。对诸gj的不同选取可构成多种典型的和常用的线性模型。从函数逼近的观点来看,式(3)还能近似地体现许多非线性模型的性质。
在最小二乘意义下用线性模型(3)拟合离散点组(1),参数b可通过解方程组tp://wiki.mbalib.com/w/images/math/2/5/9/259cbdf7228f0e8f33c66f48da956ce5.png" alt="{aQ(b)\over ab_i}">=0(i=0,…,n)来确定,即解关于b0,b1,…,bn的线性代数方程组
tp://wiki.mbalib.com/w/images/math/c/6/6/c662ca0209e9a00d76df363f9470be6f.png" alt="\sum_{j=0}^n s_ij b_j=s_iy">(i=0,1,…,n), (4)
式中 tp://wiki.mbalib.com/w/images/math/9/0/4/904ced466ef5f5e3a1b0258c780253a3.png" alt="s_ij=\sum_{k=1}^m w_k g_i(x_k)g_j(x_k)"> (i,j=0,1,…,n),
tp://wiki.mbalib.com/w/images/math/9/c/1/9c15ff1be6578986697a9507fd1562de.png" alt="R_1 = \frac{L \cdot \sin \theta_2}{\sin(\theta_2 - \theta_1)}">
方程组(4)通常称为法方程或正规方程,当m>n时一般有惟一解。
至于非线性模型以及非最小二乘原则的情形,参数b)可通过解非线性方程组或最优化计算中的有关方法来确定(见非线性方程组数值解法、最优化)。
模型的选择
对于给定的离散数据(1),需恰当地选取一般模型(2)中函数f(x,b)的类别和具体形式,这是拟合效果的基础。若已知(1)的实际背景规律,即因变量y对自变量 x的依赖关系已有表达式形式确定的经验公式,则直接取相应的经验公式为拟合模型。反之,可通过对模型(3)中基函数g0,g1,…,gn(个数和种类)的不同选取,分别进行相应的拟合并择其效果佳者。函数g0,g1,…,gn对模型的适应性起着测试的作用,故又称为测试函数。另一种途径是:在模型(3)中纳入个数和种类足够多的测试函数,借助于数理统计方法中的相关性分析和显著性检验,对所包含的测试函数逐个或依次进行筛选以建立较适合的模型(见回归分析)。当然,上述方法还可对拟合的残差(视为新的离散数据)再次进行,以弥补初次拟合的不足。总之,当数据中变量之间的内在联系不明确时,为选择到相适应的模型,一般需要反复地进行拟合试验和分析鉴别。
曲线拟合是指用连续曲线近似地刻画或比拟平面上离散点组所表示的坐标之间的函数关系。推求一个解析函数y=f(x)使其通过或近似通过有限序列的资料点(xi,yi),通常用多项式函数通过最小二乘法求得此拟合函数。
曲线拟合的分析
用连续曲线近似地刻画或比拟平面上离散点组所表示的坐标之间的函数关系。更广泛地说,空间或高维空间中的相应问题亦属此范畴。在数值分析中,曲线拟合就是用解析表达式逼近离散数据,即离散数据的公式化。实践中,离散点组或数据往往是各种物理问题和统计问题有关量的多次观测值或实验值,它们是零散的,不仅不便于处理,而且通常不能确切和充分地体现出其固有的规律。这种缺陷正可由适当的解析表达式来弥补。
数学表述 设给定离散数据
(xk,yk) (k=1,2,…,m),(1)
式中xk为自变量x(标量或向量,即一元或多元变量)的取值;yk为因变量 y(标量)的相应值。曲线拟合要解决的问题是寻求与(1)的背景规律相适应解析表达式
y=f(x,b),(2)
使它在某种意义下最佳地逼近或拟合(1),?(x,b)称为拟合模型;为待定参数,当b)仅在?中线性地出现时,称模型为线性的,否则为非线性的。量
tp://wiki.mbalib.com/w/images/math/5/1/e/51e3e12f67bfed9633b6fd3533f44b0e.png" alt="e_k\equiv y_k -f (x_k ,b)">(k=1,2,…,m)
称为在xk处拟合的残差或剩余,衡量拟合优度的标准通常有
tp://wiki.mbalib.com/w/images/math/f/0/4/f04af5ea7f8098c7b7cbde92735d9aa1.png" alt="T_b \equiv \max_{1 \le k \le m}w_k \left|e_k\right|"> 或tp://wiki.mbalib.com/w/images/math/5/6/b/56ba2fa5776dda2206442af19a518c7a.png" alt="Q_b=\sum_{k=1}^m w_k e_k^2">
式中ωk>0为权系数或权重(如无特别指定,一般取为平均权重,即wk(k=1,2,…,m),此时无需提到权)。当参数b)使T(b))或Q(b))达到最小时,相应的(2)分别称为在加权切比雪夫意义或加权最小二乘意义下对 (1)的拟合,后者在计算上较简便且最为常用。
模型中参数的确定 一般的线性模型是以参数 b)为系数的广义多项式,即
f(x,b)=b0g0(x)+b1g1(x)+…bngn(x) (3)
式中g0,g1,…,gn称为基函数。对诸gj的不同选取可构成多种典型的和常用的线性模型。从函数逼近的观点来看,式(3)还能近似地体现许多非线性模型的性质。
在最小二乘意义下用线性模型(3)拟合离散点组(1),参数b可通过解方程组tp://wiki.mbalib.com/w/images/math/2/5/9/259cbdf7228f0e8f33c66f48da956ce5.png" alt="{aQ(b)\over ab_i}">=0(i=0,…,n)来确定,即解关于b0,b1,…,bn的线性代数方程组
tp://wiki.mbalib.com/w/images/math/c/6/6/c662ca0209e9a00d76df363f9470be6f.png" alt="\sum_{j=0}^n s_ij b_j=s_iy">(i=0,1,…,n), (4)
式中 tp://wiki.mbalib.com/w/images/math/9/0/4/904ced466ef5f5e3a1b0258c780253a3.png" alt="s_ij=\sum_{k=1}^m w_k g_i(x_k)g_j(x_k)"> (i,j=0,1,…,n),
tp://wiki.mbalib.com/w/images/math/9/c/1/9c15ff1be6578986697a9507fd1562de.png" alt="R_1 = \frac{L \cdot \sin \theta_2}{\sin(\theta_2 - \theta_1)}">
方程组(4)通常称为法方程或正规方程,当m>n时一般有惟一解。
至于非线性模型以及非最小二乘原则的情形,参数b)可通过解非线性方程组或最优化计算中的有关方法来确定(见非线性方程组数值解法、最优化)。
模型的选择
对于给定的离散数据(1),需恰当地选取一般模型(2)中函数f(x,b)的类别和具体形式,这是拟合效果的基础。若已知(1)的实际背景规律,即因变量y对自变量 x的依赖关系已有表达式形式确定的经验公式,则直接取相应的经验公式为拟合模型。反之,可通过对模型(3)中基函数g0,g1,…,gn(个数和种类)的不同选取,分别进行相应的拟合并择其效果佳者。函数g0,g1,…,gn对模型的适应性起着测试的作用,故又称为测试函数。另一种途径是:在模型(3)中纳入个数和种类足够多的测试函数,借助于数理统计方法中的相关性分析和显著性检验,对所包含的测试函数逐个或依次进行筛选以建立较适合的模型(见回归分析)。当然,上述方法还可对拟合的残差(视为新的离散数据)再次进行,以弥补初次拟合的不足。总之,当数据中变量之间的内在联系不明确时,为选择到相适应的模型,一般需要反复地进行拟合试验和分析鉴别。
热门专栏
热门词条
应收账款
区域货币
区间估计
金融危机
资本成本
CPI(Consumer Price Index)
汇率
资产
经济
美元
单向定单
租赁期
外汇通
服务
外汇佣金
SME
ISO
认可
增量成本
什一税
CFO
MIT
加工
销售
MG金融集团
股价反弹
抽签偿还
股利收入
技术
空头陷阱
资本
REF
市场
中国股市
中小企业
备付金率
美国
两会
价格
吊空
指数
股灾
葡萄牙币
调至市价
pt
清算
电子汇兑
税粮
下降三角形
FDI
Writer
外汇
银行
投资
管理
阴烛
MACD
width
冲账
Theta
短期同业拆借
货币
peg
外汇交易法
金融中介理论
企业
艾略特波段理论的含义
消费发展战略
黄金
巴塞尔资本协议
贴现现金流
联系汇率制度
拔档
美国贝勒大学
汇差清算率
延期付款汇票
产品
短期国际商业贷款
Exposure
集中竞价
计期汇票
金融
标准普尔(S&P)
公司
不完全竞争市场理论 (金融)
正利差
分期付款汇票
软通货
出口物价指数
资金
选择权买方
百分比回撤
无记名汇票最低报价戴维·凯特标准·普尔 500指数抵押品持平德国工业产值德国消费者物价指数成本协同效益
股票
非农就业人口
交易
道琼斯公用事业平均指数
持平
指示汇票
产品竞争力
财务指标 盈利能力比率
德国伊弗研究所景气调查
外汇实盘交易方式
外汇实盘交易指令
国际收支差额