1  放弃直线?

还在学生时代的时候,学习心理统计是一件痛苦的事情。那个时候完全不理解心理统计为什么要这么上,我不想知道抽样分布是什么,统计的假设和前提是什么,为什么要手算一遍那些公式,方差分析对变异的分解对我以及我的很多同学来说都如听天书。这个困惑我也不会归因于所谓国内的统计教育上。因为同样的困惑到我留学之后还依然存在,存在于我做助教的心理统计课堂的学生上,存在在我自己的博士同学上。

这个困惑的高潮到来于我们一群上统计课的研究生组了一个课后学习小组,一个女同学哭着喊:“我不明白我学这些干什么,告诉我怎么点不就行了。”(大意;原话大致是I don’t understand why I have to spend the XXXX time to study this. Just tell me where to click.)

那时我突然想起我在本科时也是这么跟同学抱怨的。我们作为应用统计的学科,为什么还要去学习这些统计检验的原理?统计学家们为什么不能把统计的流程标准化,我们只需要把数据整理好,假设有没有满足,结果有没有显著,要报告什么,生成表格全都交给软件完成。这就是我那时候学习统计时的困惑与愿望。

直到我自己开始做一个大学教师,开始上一点跟统计和方法相关的课程。有一天突然看到学生在分享一个思维导图,或者说是一个决策树,根据自变量、因变量数据类型决定应该使用什么数据分析方法与具体步骤。那一刻,上面那些经历就重新涌进我的脑海。一方面,我确实敬佩每一代学生的努力与新的资料的进步,似乎真的在向我上面描述的那个愿望努力。另一方面,也感叹果然每一代学生学习统计的需求都是类似的。

想要那个图的读者只能说不好意思了,我并没有要来那张图保存。对我来说,这样一张图对我来说没有什么帮助。我仔细思考了很多要怎么否定这种做法的说辞,但我觉得这种否定其实并不必要也太过居高临下。事实上,很多领域的研究,确实可以使用一个相对简洁的统计模型里纯靠图形化界面完成统计,比如一个实验组一个对照组的实验研究。而且,即使你完全不懂统计,你也完全可以把这部分工作“外包”给会的人做,比如你的合作者、你的男朋友或女朋友、你的导师、你的同学,甚至在闲鱼上找一个出卖自己统计技能的“流水工人”。对于统计原理的理解程度完全掌握在学习者自己的手里。就如同现在在看这本书的读者,我能用来诱惑你的理由就是,如果你并不喜欢知其然而不知其所以然,做统计的时候只能按图索骥的感觉。如果你更想创造一种知道自己在做什么的错觉,这就是我写这本书想要带给你的东西。

比起直接学习决策树那样的操作指南,我想传达的学习方式完全相反——我们应该从另一种视角来看待统计。至少在心理学中常见的大部分统计方法,它们并不是待在终点的一个个独立的方框,一组数据也并不是只有一种统计分析方法。我想要带你看到的,是它们内在存在的共通性,让你即使在学习新的陌生的统计方法时,能够利用这种共通性,假装自己能更快地掌握这种新的方法。而这个过程,可能意味着相比直接打开图形化的统计软件开始学习怎么点击,你要多花一些时间,走一段弯路。

那么接下来,如果你还保持着兴趣,我们的弯路会从比较两组之间的差异开始。


  1. 一个阿里系下的二手交易平台。↩︎