基础回顾

简单线性和多元线性回归理论基础请回顾:

  • 相关与回归分析基础;

  • 一元(简单线性)相关分析与回归分析;

  • 回归参数的区间估计;

  • 一元(简单线性)回归方程的假设检验;

  • 范例分析:一元(简单线性)相关与回归分析;

  • 多元线性回归分析;

线性回归的步骤不论是一元还是多元相同,步骤如下:

  • 1、散点图判断变量关系(简单线性);

  • 2、求相关系数及线性验证;

  • 3、求回归系数,建立回归方程;

  • 4、回归方程检验;

  • 5、参数的区间估计;

  • 6、预测;

范例分析

王某等人承包了某快递公司在某地的快递业务,一段时间后发现:有时候承接工作量大,完不成快递任务;有时候工作量不足,员工等待。为了制定最佳的工作计划表,王某希望估计快递员每天的工作时间(工资计件,没有偷懒现象),以便决定每天承接的快递数量。王某分析,快递员每天工作的时间与送货距离和送货次数相关。为此,他收集了由10项送货任务组成的简单随机样本数据,并根据这些数据建立二元线性回归方程。数据如下表:

项目分析

研究的目的是预测快递员运送任务所需要的时间,所以设时间为因变量;距离与次数为自变量。本题直接使用Excel计算结果。

解:1、相关次数;由于是二元回归分析,所以不做散点图,直接用回归系数判别因变量(时间)与自变量总体(距离与次数)之间的相关关系。Excel计算结果:

复相关系数R为0.9383,说明因变量时间与作为一个整体的所有自变量(距离和次数)高度线性相关。

2、回归系数及回归方程

通过Excel计算结果,可以得到回归系数及回归方程:

意义:回归系数0.042表示在固定次数的条件下,送货距离每增加1公里,行驶的时间平均增加0.042小时;同理,回归系数0.573表示在送货距离固定的条件下,送货次数每增加1次,送货的时间平均增加0.573小时。本例中,截距-0.01没有实际意义,只起调节数值的作用。

3、回归方程的检验

回归方程的检验有三种方法(回归方程显著性检验,回归系数显著性检验和相关系数显著性检验),效果相同,选择其一检验即可。Excel给出的是回归方程的显著性检验结果:

Significance F=0.000591表示统计量F=25.77422的概率值,通过与显著水平(设定为0.05)的比较,表示F值落在拒绝域,所以结论与上相同,即线性回归方程式显著的。

4、区间估计

从上表可知,在95%置信度条件下,回归系数b1的置信区间为),b2的置信区间为)。

5、预测

某个快递员某天的任务是快递3件货,最优送货路线总长为120公里,预测送货时间,并得到95%的时间区间。

通过回归方程可得预测的送货时间为6.749小时:

95%置信度下,送货时间的置信区间为:

Excei计算结果中有Se的值,但是没有包含t统计量:

t统计量值用公式:=T.INV.2T)得到2.365,所以该题中送货时间区间为:

*0.639,6.749+2.365*0.639)

)

所以该条件下送货时间区间为5.24小时~8.26小时。

数据分析网(www.a),国内领先的大数据门户,旨在帮助大数据从业人士、爱好者提供大数据新闻资讯、前沿技术、业界观点的信息平台。

相关推荐