-
《统计数字会撒谎》[12句]
达莱尔·哈夫《统计数字会撒谎》一书是由美国统计专家达莱尔·哈夫写就的传世之作,该书引发的“编造虚假信息”话题受到美国社会持续普遍的关註和美国权威媒体的激烈争论。它自50年代出版以来就不断一版再版,并被翻译成多种文字,在世界的影响力持久不衰,被誉为美国商业人士、研修人员的重要入门必修书之一。
“自从使用了某某牌牙膏,我们的蛀牙减少了23%”;
“1924级的耶鲁毕业生平均年收入是25111美元”;
真相果真如此?数字的魔力决不仅止於此!
“根据相同的收入取样,计算方法也完全正确,同一个小区居民的年平均收入可以是2000英镑,也能是10000英镑”;
只需施展一点小技巧,就能让数据麵目全非!
你是否执着於打听智力测验的结果? 你是否对电视上那些专家所言的各种标準坚信不疑?
你是否认为抽烟与成绩的好坏直接相关?抑或受高等教育与晚婚有必然联系?
你是否确信眼见为实?如果图形能让事实的1:2瞬间变为眼前的1:8呢?你还确信自己的感觉吗?
这本“故事书”般的经典之作将为您轻松揭开谜底……
作为揭露数据造假经典工具书,达莱尔·哈夫这本《统计数字会撒谎》在50年代一出版,就成为有些人的“心头大患”,他们在全世界对其进行围追堵截,因为他们相当害怕读者看到书中的真相。它诞生之后,不仅被奉为“世界统计学普及读物第一畅销书”、“25本投资经典之一”、“经典社会学读本”,而且被誉为“数据造假曝光宝典”,在世界畅销50年而不衰。达莱尔·哈夫用风趣的插图和通俗的语言把高深的统计写得像“故事书”一样精彩,这种独具一格的行文和编排使得此书更具魅力。此外,书中还给你揭露了大量至今仍被销售员、专家、记者或者广告撰稿人频频使用的“行骗工具”:有偏的样本,可以挑选的平均数,遗漏某些重要的数据,混淆因果关系,滥用一维图形等。更为重要的是,达莱尔·哈夫在书中破解了如何识破虚假统计数据。
当你麵对虚假但貌似真实的统计数据时,谁说的?他是如何知道的?遗漏了什么?是否有人偷换了概念?这个资料有意义么?
上辑:
《慎斋遗书》[5句]
下辑:
《我有个恋爱想和你谈下》[9句]
- 在处理诸如人类特征的数据时,各种平均数的数值十分接近。这些数据具有我们常说的正态分布的形态特点,在你用曲线绘制正态分布时,将看到一根鐘形的曲线,均值、中位数和众数都落在相同的点上。 0 0 0
- 事实往往在所见所闻之外。平均数、作用关系、趋势和图表总是与看上去的不一致。虽然经验告诉我们"眼见为实",但眼睛告诉我们的"真相"或许隐瞒了部分事实,或许夸大了事实。 0 0 0
- 所以,当你被告知某个数是平均数时,除非能说出它的具体种类--均值,中位数,还是众数,否则你对它的具体涵义仍知之甚少。 0 0 0
- 我们可以定量地衡量你的样本能以多大的精度代表总体,那就是:可能误差和标準误差。 0 0 0
- 有一个装着红、白两色豆子的桶,如果你想要準确知道这个桶中两种豆子的数量,你惟一能做的只有一颗一颗地数豆子。 用一种更简单的方法也可以揣测红豆的数量:抓一把豆子,假定手中红豆的比例与桶中红豆的比例相同,只要数一数手中的豆子即可。如果你的样本足够大,并且选择方法正确,在大多数情况下它能够很好地代表整体。但是,如果以上两个条件不满足,这样的样本比一个臆想好不到哪儿去,除了能够营造科学精确的假象之外,其他则根本不值一提。不幸的是,我们所看到的,或者我们自以为了解的许多事物,往往都是根据类似样本所得出的结论,这种样本可能变得有偏,由於选择方式的不合理或者容量过小,抑或两种情况同时存在。 0 0 0
- 多少才算够呢?这又是个棘手的问题。它取决於其他的因素,即你采用抽样方式所研究的总体容量有多大、变动程度有多大。值得一提的是,有时样本的规模与看上去的并不一致。 0 0 0
- 一般而言,民意调查都带有一定方向的误差。就像前文所举《文学文摘》例子的偏差一样,如果对此表示怀疑,你还可以找到许多恰当的例子来证明。在《文学文摘》的例子中,与希望代表的全体选民相比,由於偏向了比平均选民收入更高、受过更多教育、信息面更广、反应更快、举止优雅、行为保守、更多固定习惯等特点的群体,而产生了误差。 0 0 0
- 一位心理医生曾经写道:实际上每个人都有点神经质。暂且不去管这种提法是否破坏了"神经质"一词的含义,我们来看看这个医生的样本,也就是说,他观察了哪些人才得到了上述结论?事实上,他是在对他的病人进行研究后才得到了这个发人深省的结论,这和代表全体人的样本可差的是十万八千裏。想想看,如果一个人心理健全,他是永远都不会接受心理医生的治疗的。 0 0 0
- 无形的误差与有形的误差一样容易破坏样本的可信度。也就是说,即使你找不到任何破坏性的误差来源,但只要有产生误差的可能性,你就有必要对结果保留一定的怀疑。 0 0 0
- 我们试着来解释这个数字,单凭常识就知道这个数字与现实出入很大。现在,让我们找找最大误差的可能来源。是什么使那些实际上收入也许只有25111美元一半的人们最终会拥有如此丰厚的平均收入?让我们来揭开这神秘的麵纱。 可以肯定的是:耶鲁毕业生的报道基於对某个样本的分析,因为常识告诉我们,没有人能够掌握所有仍在世的1924级学生的情况,25年后,他们中的许多人已经消失在茫茫人海中。 0 0 0
- 统计这种神秘的语言,在一个靠事实说话的社会裏是如此地吸引眼球,但有时它却被人利用,并成为恶意夸大或简化事实、迷惑他人的工具。在报告社会经济趋势、商业状况、民意调查和普查的大量数据时,统计方法或者统计术语是必不可少的。但如果作者不能正确理解并恰当地使用这些统计语言,而读者又并不能真正了解这些术语的含义,那么,统计结果只能是废话一堆。 0 0 0
- 随机样本的检验方法是:总体中的每个名字或每个事物是否具有相同的几率被选进样本? 纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有不足之处,在很多情况下,获得这种样本的难度很大并且十分昂贵,以至於单纯考虑成本就会排除它。分层随机抽样是一个更经济的替代品,目前在民意调查和市场研究等领域中得到了广泛的应用。 0 0 0