作业帮 > 综合 > 作业

pearson系数是专门说明两变量的线性相关程度的,那么它可以作为二次非线性回归模型的建模依据吗?

来源:学生作业帮 编辑:作业帮 分类:综合作业 时间:2024/05/10 12:03:33
pearson系数是专门说明两变量的线性相关程度的,那么它可以作为二次非线性回归模型的建模依据吗?
若不能的话,那么应该以什么作为建立二次非线性回归模型的依据?急.
不能,Pearson Correlation检查两变量的线性相关程度,如果很大的话 ,比如正负0.8,0.9的样子,就说明这两个变量你中有我,我中有你,同时存在在模型中只会削弱彼此的存在感,只需要有一个在模型就ok了.你可以分2次分别抛掉这两个变量回归看看结果,择优录取.
一般来说,当方差不是齐次的时候,即你的残差图有明显的趋势效应,Y越大残差越大,此时会对Y作变换,有可能是开方,如此模型变为二次非线性回归.
再问: 非常感谢你的回答,不过好像是我没把问题表述清楚导致你误解了。这里只有两个变量。比如说x与y的pearson系数是0.5,那么可以建立y=ax+b的模型,那么可以以此为依据来建立Y=ax2+bx+c这个模型吗?或者说要建立Y=ax2+bx+c模型的 前提 除了理论依据之外还要先证明什么?
再答: 我觉得如此情况下可以尝试。Pearson系数着重变量间的线性性,离1越近说明x和y的线性关系越强,等于1的话就直接是y=ax+b了。所以Pearson系数0.5说明肯定不单单是线性这么简单,你可以尝试添加x的高次项例如x方,或者选择低次项例如x根号后进行回归。 但最标准的步骤还是先按照线性模型y=ax+b回归,然后观察残差图,如果有明显的放大趋势,Y越大残差的振幅越大,那么此时会对Y作变换,有可能是开方,如此模型变为二次非线性回归。 根号y=ax+b 也就是y=(ax+b)平方= ax2+bx+c 的形式 系数我就随意写了;当然如果振幅随Y的变大增大的很快,那么有可能你都需要三次非线性方程了。同理, 若有紧缩趋势那么用y方=ax+b 也就是上一段我说的“选择低次项例如x根号后进行回归”。