调整后的平方

一个指标,说明添加额外的预测因素是否能改善回归模型

调整后的r平方是什么?

调整后的r平方是对回归模型中不显著的预测因子的r平方的修正版本。换句话说,调整后的r平方显示添加额外的预测因子是否改善回归模型。要理解调整后的r平方,需要理解r平方。

总结

  • 调整后的r平方是r平方的修正版本,它调整了回归模型中不显著的预测因子。
  • 与有附加输入变量的模型相比,较低的调整后r平方表示附加输入变量没有为模型增加价值。
  • 与有附加输入变量的模型相比,调整后的更高的r平方表示附加输入变量为模型增加了价值。

r的平方是什么?

r平方,也叫决定系数,用于解释输入变量(预测变量)对输出变量(预测变量)变化的解释程度。取值范围是0 ~ 1。例如,如果r平方是0.9,这表明90%的输出变量的变化是由输入变量解释的。一般来说,r方越高,说明模型越适合。考虑下面的图表:

调整后的平方

蓝线为最佳拟合线,表示变量之间的关系。这条线是经过计算的回归分析并在黄点到最佳拟合线的垂直距离(蓝色虚线)最小的地方绘制。

黄色的点表示输入和输出变量的曲线。输入变量在x轴上,而输出变量在y轴上。例如,上图包含以下数据集:

调整r平方-图数据

蓝色虚线表示输入和输出变量的图形距离最佳拟合线.r平方由所有黄点到最佳拟合线(蓝线)的距离推导而来。例如,下图将说明r平方为1:

1平方

关于r平方的问题

r -平方有一个固有的问题——额外的输入变量会使r -平方保持不变或增加(这是由于r -平方的数学计算方式)。因此,即使附加的输入变量与输出变量没有关系,r方也会增加。下面提供了一个解释这种情况的示例。

理解调整后的r平方

本质上,调整后的r平方看是否有额外的输入变量对模型有贡献。考虑一个使用比萨饼店主收集的数据的例子,如下所示:

样本数据

假设披萨店主运行两个回归:

回归1:面团价格(输入变量),披萨价格(输出变量)

回归1的r平方为0.9557,调整后的r平方为0.9493。

回归2:温度(输入变量1),面团价格(输入变量2),披萨价格(输出变量)

回归2得到的r平方为0.9573,调整后的r平方为0.9431。

虽然温度不应该对披萨的价格产生任何预测能力,但r平方从0.9557(回归1)增加到0.9573(回归2)。人们可能会认为回归2具有更高的预测能力,因为r平方更高。尽管输入变量温度对预测披萨的价格毫无用处,但它增加了r平方。这里是调整后的r平方。

调整后的r平方查看是否有额外的输入变量对模型有贡献。回归1中调整后的r平方为0.9493,回归2中调整后的r平方为0.9493。因此,调整后的r平方能够识别出输入变量温度对解释输出变量(披萨的价格)没有帮助。在这种情况下,调整后的r平方将指向模型创建者使用回归1而不是回归2。

调整后r平方的例子

考虑两个模型:

  • 模型1使用输入变量X1、X2和X3来预测Y1。
  • 模型2使用输入变量X1和X2预测Y1。

应该使用哪个模型?关于这两种模型的资料如下:

例子

比较模型1和模型2之间的r平方,r平方预测模型1是一个更好的模型,因为它具有更大的解释力(模型1为0.5923,模型2为0.5612)。

比较模型1和模型2之间的r平方,调整后的r平方预测输入变量X3有助于解释输出变量Y1(模型1为0.4231,模型2为0.3512)。

因此,应该使用模型1,因为额外的X3输入变量有助于解释输出变量Y1。

额外的资源

感谢您阅读CFI的调整r平方的指南。要想继续学习和发展你的事业,以下的CFI资源将会很有帮助:

'的搜索结果为0