当然分为二表达方式也可以反映些现实。在实行种族隔离制度南非,黑人和白人生活在完全不同收入水平之下,而且
解。如果你看看新闻或者去任何个社会团体网站,你就会马上注意到,上面充满关于各种冲突和对立消息。
如何防范分为二错误本能
当出现以下三种情况时,你要提高警觉,有人可能会告诉你(或者你自己认为)存在个巨大差距,并触发你分为二本能。这三种情况分别是:只比较平均数、只比较极端情况和只俯视不仰视。
只比较平均数
希望大家不要误解意思,喜欢平均数,平均数是个很简便统计信息方法,而且平均数会告诉们些有用信息,现代社会离不开平均数。这本书也离不开平均数。书中有很多地方都利用各种平均数。但是对信息过度简化,通常也有可能带来误导性信息。平均数最大问题就是它用个单独数字取代大量数据分布规律。
而当们对两组平均数做比较时候,们就有可能犯个更大错误。们可能只看到两组平均数之间鸿沟,而错过两组数据之间重合部分。所谓鸿沟在事实上并不存在。
举个例子,们看下上面两张图。
左边图展示自从1965年以来,所有年份男性和女性数学考试平均成绩。右面图展示美国和墨西哥人民每年平均收入水平。你可以清晰地看到两张图表展示两组平均数之间鸿沟。男性相对于女性,美国相对于墨西哥,这两张图似乎能够清晰地表示男性数学成绩普遍要好于女性,而美国人收入是高于墨西哥人。从某种意义上来说,这个结论是有道理。但是正确到什程度呢?是所有男性数学成绩都比女性要好吗?是所有美国人都比墨西哥人更富有吗?
那让们来看下数据背后真相吧!首先让们调整下纵轴坐标比例。这样看起来,原来似乎很明显鸿沟变得非常小。然后们再来看看同样数据,它分布是什样?们来看下特定年数学成绩分布和收入水平分布。用这样方法们就可以理解,平均数背后代表数据分布究竟是什样子。
看到吧,男性和女性数学成绩分布几乎是完全重合。大多数女性和男性数学成绩是差不多。们再看看美国和墨西哥个人收入分布情况。们可以看到美国和墨西哥个人收入水平是有部分重叠。所以,当们用这种方式来分析数据时候,们就会发现这两组人:男性和女性,墨西哥人和美国人,并不是完全分为二。它们分布是有重叠,而中间是不存在鸿沟。
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。