跳转到路径导航栏
跳转到正文内容

数据如何被轻易操纵

http://www.sina.com.cn  2008年08月27日 11:19  新浪财经

  统计学的应用和谬用:数据如何被轻易操纵

  前参议员乔治·J·米切尔(George J. Mitchell)提交报告指出罗杰·克莱门斯(Roger Clemens)等球员使用违禁药品以提高自己在球场上的表现。而一家市场营销机构则根据统计资料分析撰写了长篇累牍的报告来证实克莱门斯的清白。但沃顿商学院的四位教授沃尔弗斯(Justin Wolfers)、延森(Shane Jensen)、怀纳(Abraham Wyner)、和布莱特劳(Eric Bradlow)却撰文对该市场营销机构所采用的方法提出了质疑,并且提出任何统计分析的有效性只能适用于其中的组成个体,而这些组成部分又可以轻易地被曲解。

  前参议员乔治·J·米切尔(George J. Mitchell)提交报告指出罗杰·克莱门斯(Roger Clemens)等其它80多位美国职业棒球大联盟(Major League Baseball)球员使用违禁药品以提高自己在球场上的表现。与此同时,这位前赛扬奖(Cy Young)得奖投手继续为自己进行辩护以证清白。在克莱门斯提交国会山立法者的证词中,还包括了一份由一家市场营销机构根据统计数字所撰写的长篇累牍的报告,以求证实克莱门斯的无辜。

  但沃顿商学院的四位教授在2月10日出版的《纽约时报》(New York Times)上联合撰文表达了另一种观点:统计分析的有效性只适用于其中的组成个体。这一论点将会得到更多的重视,因为今天的机构和个人都试图在那些越来越庞大、复杂和密集的信息量中获取意义。

  “现在,信息的消费者们都深陷数据之中,”沃顿商学院商业与公共政策教授札斯廷·沃尔弗斯(Justin Wolfers)说。“对企业、工人、政府和其它活动所进行的不断测量产生了大量的数据,并且存在众多的方法来从原始数据中得出结论。遗憾的是大部分方法都引向了错误的方向。”

  他举例说,零售连锁商店可能会对其一段时间内的运营情况进行分析,并且发现他们降低销售价格的时间段正好和整体销量下滑的时间段相一致。“那可能会让这家连锁店得出结论说低价会导致销量的减少,”沃尔弗斯说。“但可能存在真正的更深入的因果关系。在这家零售商计划提高价格以促进销量之前,他们应该对其他因素进行分析,以明确在那段时间内整体需求是否受到其它因素的影响。例如,也许该公司在滞销时期内正好在进行半年度的促销活动。如果是这样的话,那是低销量导致了价格下滑,而不是价格降低导致了销量下滑。”

  沃尔弗斯称这正说明了将统计分析应用到商业、社会科学和其它领域所存在的固有的关键性难点。“当研究者面对实验或自然科学资料时——如医学——隔离和排除无关资料一般来说相比更容易,”他指出说,“在实验中,制药公司可以随机将药物使用到一组实验对象上,并且将无效对照剂应用到另一组对象上。如果研究人员在挑选药物的实验对象上遵循了随机的原则,那么他们可以分别得出关于药物或无效对照剂效果的结论。”

  但要应用在商业环境并非那么容易。“在连锁商店的案例中,要孤立出其它种种因素的影响更加困难,”沃尔弗斯说。关于销售价格的变化,“有必要考虑天晴或下雨,或者天气炎热和寒冷等因素对销量和购物者行为的影响。”

  沃尔弗斯与沃顿的统计学教授谢恩·延森(Shane Jensen)、亚伯拉罕·怀纳(Abraham Wyner),以及市场营销学教授埃里克·布莱特劳(Eric Bradlow)共同撰写了《纽约时报》上这篇关于罗杰·克莱门斯案件的文章。文章的标题为《支持克莱门斯的报告对数据进行了精心挑选》(Report Backing Clemens Chooses Its Facts Carefully)。

  亨德里克体育管理公司(Hendricks Sports Management)撰写了那份报告以支持克莱门斯所宣称的未使用任何类固醇药物。但在《纽约时报》的文章中,学者们对该公司所采用的方法提出了质疑。“在这份克莱门斯的报告中,他们企图将克莱门斯与在1993年46岁时退役的诺兰·莱恩(Nolan Ryan)进行对比,以将这件事情化解。”作者们写道。“在这份对比中,克莱门斯的行为看起来没什么不一样:两者都在他们40多岁时收获了巨大的成功。但是如果将克莱门斯与另外两位同时代的投手蓝迪·约翰逊(Randy Johnson)和科特·席林(Curt Schilling)相比,也可以得出同样的结论。”

  沃顿商学院的研究人员们称那些对比并不完全。“报告仅仅将克莱门斯与那些在职业生涯第二阶段获得成功的投手相比较,而不是与那些同克莱门斯一样在最初就取得成功的所有投手相比较。通过这个方法,报告人为地缩小了克莱门斯的数字会显得不正常的机率,”他们写道,“统计学家将这个问题称为‘选择偏向’。”

  沃顿商学院的研究者们认为,正如零售商需要在一个价格对比分析中考虑其它选择因素对销售的影响一样,克莱门斯的表现也应该同“所有职业生涯持久的投手”进行对比。如果进行那个对比,克莱门斯在“事业第二春的表现就显得不同寻常了”,他们写道。大部分投手在他们职业生涯的早期的球场技艺会稳步得到提高,并且在30岁达到高峰,之后表现会缓慢下滑。相反,克莱门斯的职业生涯在他20来岁后期就开始下滑,并且之后在他40多岁中期时得到了提高。

  沃顿商学院的研究者们指出,“雇佣统计学家”们倾向于选择那些会对自己客户有利的对比对象。但如果分析结果不服务于任何特定观点时,统计分析会得到如何的使用呢?金融分析、计量经济学、审计、生产和运营是其中的几个领域。在这些领域,各利益方寻找无偏置的数据,以能够在面对不确定性时做出正确的决策。

上一页 1 2 下一页
【 新浪财经吧 】

我要评论

不支持 Flash
Powered By Google ‘我的2008’,中国有我一份力!

网友评论 更多评论

登录名: 密码: 匿名发表

新浪简介About Sina广告服务联系我们招聘信息网站律师SINA English会员注册产品答疑┊Copyright © 1996-2008 SINA Corporation, All Rights Reserved

新浪公司 版权所有