辛普森悖论

日期:2019年02月28日 00:00     来源:海淀统计局队

分享:
字号:        

  辛普森悖论为英国统计学家E.H.辛普森(E.H.Simpson)于1951年提出,指的是在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。

  

  比如比赛100场篮球以总胜率评价好坏,于是有人专找高手挑战20场而胜1场,另外80场找平手挑战而胜40场,结果胜率41%,另一人则专挑高手挑战80场而胜8场,而剩下20场平手打个全胜,结果胜率为28%,比 41%小很多,但仔细观察挑战对象,后者明显较有实力。除此之外,新生录取率与性别、报酬与性别等都是辛普森悖论的典型例子,即在分组比较中都占优势的一方,会在总评中反而是失势的一方。为了避免辛普森悖论的出现,就需要斟酌各分组的权重,并乘以一定的系数去消除以分组数据基数差异而造成的影响。同时必需了解清楚情况,是否存在潜在因素,综合考虑。

  

  量与质是不等价的,无奈的是量比质来得容易量测,所以人们总是习惯用量来评定好坏,而此数据却不是重要的。除了质与量的迷思之外,辛普森悖论的另外一个启示是:如果我们在人生的抉择上选择了一条比较难走的路,就得要有可能不被赏识的领悟,所以这算是怀才不遇这个成语在统计上的诠释。

  

扫一扫在手机打开当前页

标签

相关文章:
上一篇: 基础概率谬误
下一篇: 幸存者偏差