作业帮 > 数学 > 作业

回归的定义在统计学中,我们经常可以看到“回归分析”的字眼.尽管我们知道“回归分析”是指研究因变量和自变量之间相互影响的程

来源:学生作业帮 编辑:作业帮 分类:数学作业 时间:2024/05/09 06:12:06
回归的定义
在统计学中,我们经常可以看到“回归分析”的字眼.尽管我们知道“回归分析”是指研究因变量和自变量之间相互影响的程度,可是为什么要将这种分析法称为“回归分析”法呢?
回归分析
regression analysis
研究一 个或多个随机变量Y1 ,Y2 ,…,Yi与另一些变量X1、X2,…,Xk之间的关系的统计方法.又称多重回归分析.通常称Y1,Y2,…,Yi为因变量,X1、X2,…,Xk为自变量.回归分析是一类数学模型,特别当因变量和自变量为线性关系时,它是一种特殊的线性模型.最简单的情形是一个自变量和一个因变量,且它们大体上有线性关系,这叫一元线性回归,即模型为Y=a+bX+ε,这里X是自变量,Y是因变量,ε是随机误差,通常假定随机误差的均值为0,方差为σ2(σ2大于0)σ2与X的值无关.若进一步假定随机误差遵从正态分布,就叫做正态线性模型.一般的情形,差有k个自变量和一个因变量,因变量的值可以分解为两部分:一部分是由于自变量的影响,即表为自变量的函数,其中函数形式已知,但含一些未知参数;另一部分是由于其他未被考虑的因素和随机性的影响,即随机误差.当函数形式为未知参数的线性函数时,称线性回归分析模型;当函数形式为未知参数的非线性函数时,称为非线性回归分析模型.当自变量的个数大于1时称为多元回归,当因变量个数大于1时称为多重回归.
回归分析的主要内容为:①从一组数据出发确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数.估计参数的常用方法是最小二乘法.②对这些关系式的可信程度进行检验.③在许多自变量共同影响着一个因变量的关系中,判断哪个(或哪些)自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常用逐步回归、向前回归和向后回归等方法.④利用所求的关系式对某一生产过程进行预测或控制.回归分析的应用是非常广泛的,统计软件包使各种回归方法计算十分方便.