一文学会如何用Excel做回归分析
第一,“预测”。预测目标变量,求解目标变量y和说明变量(x1,x2,…)的方程。
y=a0+b1x1+b2x2+…+bkxk+误差(方程A)
把方程A叫做(多元)回归方程或者(多元)回归模型。a0是y截距,b1,b2,…,bk是回归系数。当k=l时,只有1个说明变量,叫做一元回归方程。根据最小平方法求解最小误差平方和,非求出y截距和回归系数。若求解回归方程.分別代入x1,x2,…xk的数值,预测y的值。
第二,“因子分析”。因子分析是根据回归分析结果,得出各个自变量对目标变量产生的影响,因此,需要求出各个自变量的影响程度。
希望初学者在阅读接下来的文章之前,首先学习一元回归分析、相关分析、多元回归分析、数量化理论I等知识。
根据最小平方法,使用Excel求解y=a+bx中的a和b。那么什么是最小平方法?
平行线的长度在统计学中叫做“误差”或者‘残差”。误差(残差)是指分析结果的运算值和实际值之间的差。
接着上节的回归分析的目的,我们来根据一个二手车的实例来继续说回归分析。
二手车价格的决定因素有:空调类型有无附加品(TV导航导航SR、天窗、空气囊LD TV AW) 行驶距离,颜色车检剩余有效月数、评分拍卖会地点等。
混台模型是指因子巾既包含定性数据也包含定量数据的模型。在混台模型中.把“空调”、 “TV导航”等定性因子叫做项目,把数据群(空调的“AC”,“WAC”,TV导航的“有”、“无”)叫做类别。
接下来,根据表l进行回归分析。
直接使用Excel的对表1进行回归分析时,运算结果不理想。理由如下;
以“导航”为例,各行
“有导航”+“无导航”=1
此式成立。把公式变形,
“有导航”=1-“无导航”
所以“有导航”是“0”或是“1”,由“无导航。自动决定。
线性代数中发生秩(矩阵秩)亏时,不能正确求出必要的逆矩阵。因此也不能求出回归系数。
根据表2的数据进行回归分析,操作步骤如下:
1、“工具”一“数据分析”
统计学中经常出现“自由度”,即有效信息的数量。
前面已经提到,在Excel的回归分析中,回归自由度的最大上限是16。回归自由度在(多重)回归分析、数量化理论|、混合模型中具有不同意义。表3是对回归自由度的不同意义的总结。
内容来源:Excel学习网