生存偏差

当一个数据集只考虑“幸存的”或现有的观测数据,而不考虑不再存在的观测数据时

什么是生存偏差?

生存偏差是一种样本选择偏差当一个数据集只考虑“幸存的”或现有的观测数据,而没有考虑已经不存在的观测数据时,就会发生这种情况。

生存偏差

在金融领域,生存偏差的一个例子是,对共同基金收益的研究只使用包含关于共同基金目前存在的,并且没有包括关于不再存在的基金的数据。

共同基金可能因为各种原因被关闭,比如并购重组或糟糕的财务表现。生存偏差的另一个例子可能发生在对某些行业盈利能力的研究未能包括被收购或破产公司的财务信息时。在这种情况下,金融分析师只根据目vwin德赢吧前市场上存在的公司进行评估。

生存偏差的影响

一般来说,生存偏差倾向于得出过于乐观的结论,而这可能不能代表现实生活中的环境。之所以出现偏差,是因为“幸存的”观测结果往往由于其对困难条件的抗压能力强于平均水平而幸存下来,而忽略了由于这种条件而不复存在的其他观测结果。

回到上面的共同基金回报的例子,一项显示生存偏差的研究可能会使回报正向倾斜,因为它只考虑目前存在的共同基金。共同基金在艰难的经济条件下生存了下来经济衰退通过它们的综合细分或基金管理对市场做出反应和调整投资策略的能力。

然而,在这些基金幸存下来的经济衰退期间,其他共同基金可能因表现不佳而被迫关闭。净效应将是正向倾斜的结果,无法准确描述所有共同基金实现的实际回报。

因此,在评估共同基金的回报时(不管基金的回报率如何)时间范围),考虑所有符合研究标准的共同基金是很重要的。如果一项研究专门旨在衡量顶级或“幸存”共同基金的表现,那么它应该在研究论文的方法中披露。

生存偏差的例子

考虑以下关于共同基金回报率的信息:

样本表格-共同基金回报

假设所有基金都符合研究人员设定的标准。

如果我们只考虑仍然活跃的基金,计算出的平均回报率为9%。相比之下,如果该研究包含了符合其标准的所有可能观测值,那么计算出的平均回报率将只有3%——比生存偏差下计算出的回报率低三分之二。

因此,对于研究人员来说,仔细审查他们选择在研究中使用的信息是非常重要的。然而,这说起来容易做起来难,因为一些研究人员可能会陷入生存偏差的陷阱,尽管他们尽了最大努力来降低这种风险。

例如,当处理包含数千或数百万数据点的大型数据库时,观测数据的遗漏可能更难以跟踪。因此,数据库管理人员也有责任确保他们的数据集不包含生存偏差。这可以通过实施新的规则和程序、遵守严格的标准,或者在涉及到日志数据时对员工进行最佳实践培训来实现。

如何防止生存偏差

为了防止生存偏差,研究人员必须对他们的数据来源非常有选择性。研究人员必须确保他们所选择的数据源不会遗漏已经不存在的观察结果,以降低生存偏倚的风险。

额外的资源

CFI是全球的官方供应商财务建模和估值分析师(FMVA)™认证计划,旨在帮助任何人成为世界级的金融分析师。vwin德赢吧为了不断学习和提升你的职业生涯,以下额外的CFI资源将会很有用:

0个搜索结果