人口。

*在此条形图中,棕色条的顶端表示观察到的均值,红色线段(“误差条”)表示其周围的置信区间。

尽管误差线显示为均值对称,但并非总是如此。

还必须注意,在大多数图中,误差线并不代表置信区间(例如,它们通常代表标准误差或标准偏差)。

因此这也就是说,官方机构提供的失业率数据是估算值——很努力地猜数字,但仍然也只不过是猜的。这种“上下浮动的错误区间”在统计学中叫“置信区间”。

实际上,他们提供的数据说的是,全国范围内的失业人口数量减少了27万人——但这个数字存在一定误差,也就是置信区间,上下浮动26万3千人。显然,直接说27万人这个数字会容易理解的多。在这个具体案例中,由于数字是估算而来,因此必定会存在一定的误差。所以失业人口数量减少的实际范围是:最少7000人、最多53万3千人。

这种偏差和文章开头提到的性取向与手指长度异曲同工——过大的误差空间,将会严重影响研究本身的可信性。

在实际生活中,最能体现置信区间对我们影响的案例,就是投票。民意调查者们从总人口中选取一定的比例,向这些人提问会投给谁,然后就把得到的结果推导成全国人口在投票日可能会做出的投票选择。当选期变得胶着时,由于民意调查的置信区间过大,因此实际上他们无法判断出谁会是最后的赢家,也就无法做出正确的预测。

因此当你再在生活中看到所谓的“覆盖人口的XX百分比”时,首先应当保持理智,要清楚的认识到这个所谓的百分比必然存在着误差,接下来你要做的就是去查看相应的置信区间,也就是上下浮动的具体范围。

知道这几种统计学陷阱,就能保证你在生活中不会上当吗?不可能的。但多少会有点帮助。

以及,别忘了,“多或少”也存在着浮动偏差。

文章内容基于知识共享协议编译。文中图片除特别注明外,均来源于免版权网站,已保留原图地址。

文中任何内容如涉及侵权请联系后台处理。

转载请注明出处。

【觉得文章内容有趣?欢迎关注】

相关推荐