这是一个帮助你度过「心理统计学带来的至暗时刻」的专栏。 倾力分享最高效的心理统计学习思路和经验,完成知识体系的最后一块拼图🧩 【💡 你将收获】 1. 最朴实的心理统计逻辑拆解,快速生成个人知识体系知识,高效学习不返工 2. 学习答疑和资料包:有问必答,不定期的连麦辅导机会,持续更新的复习资料 3. 情绪陪伴:真诚的心理按摩,平等的交流沟通,陪你到达梦想彼岸 【💰 定价说明】 季节浮动价,当前99元,11月提价129元。 一次购买终身有效 📍 愿你能在这里收获一次又一次的灵光乍现

全部文章
作者cicada头像

cicada

2023/09/22

基石06 - 抽样分布和应用

|抽样分布是怎么来的?

抽样是从总体中抽取样本的过程,03 中,我们一起学习了总体,样本和抽样。同样,学习抽样分布,我们还要再把总体和样本拉过来。

先来复习......

作者cicada头像

cicada

2023/09/21

基石05 - 正态分布

正态分布可以称得上是所有概率分布中的绝对核心,不仅是因为它最常见、最常用,对我们来说,它足够规矩和简单,借学习正态分布,我们也可以建构起理解其他概率分布的思维框架。

本章主要内容:

- 认识正态分布

- 识图:正态曲线图及各类数量关系

- 对比:标准化和标准正态分布

Let's go!

名字和地位

正态分布(normal distribution)理解的第一个难点,是它的名字,这个中文中不存在的词,一上来就困惑住了很多人。

不过作为心理学学生,我反而对你理解这个词的能力有信心。毕竟我们已经在《变态心理学》的“变态”一词上,努力纠正了我们对与变态的原本理解并建构起了“变态”是 “abnormal,非正常”的意思,那么,对于正态分布的 normal,我们也可以有类似的学习迁移——是正常的意思(但这两个词的翻译有一种异曲同工之奇怪。)

正常,意味着常见。正态分布是一种自然界中非常常见的分布,数学家高斯在正态分布中做出了突出贡献,因此正态分布也叫高斯分布。

高斯做了一个高斯钉板,直观地展示了正态分布的样子,可以在这里看看。

如果你疑惑为什么正态分布如此常见,在这个知乎问题中有进行讨论。

简单来说,自然界中的很多现象都是由多个因素共同影响的,这些因素可以来自物理、化学、生物、社会等多个领域,且这些因素之间相互独立。当许多相对独立的随机因素共同影响一个事件时,这些因素的总和或平均值会趋向于正态分布。这个规律是列维-林德伯格中心极限定理发现的。

应该不会有人考这个点的,简单增加一点可以但没用的小知识。

正态分布曲线图

日常我们研究和使用正态分布,都少不了正态分布曲线,你应该已经很熟悉了。

这张图看起来很朴实,但内含非常多信息点,也是正态分布的考点,而且大部分的计算题都是出自这张图。做计算题的日常就是在纸上画满正态曲线。

|横轴

横轴其实就是个数轴,数值从左至右增大。世界上所有的正态分布都在同一个数轴上。

当你描述某个变量的数据分布时,正态分布的横轴就是具体的变量取值,比如身高的厘米数。

但横轴也可以不表示具体变量取值,比如针对标准正态分布,图的横轴指的是 z 分数(z-score),也叫标准分数。它最早出现在课本的第四章,但其实你应该先学正态分布,再理解z分数比较好。

z 分数和原始分数可以用公式来转换,这也是计算题的一大考点,下面你会反复见到这个公式。

注意,这条曲线的末尾虽然看起来和 x 轴很近,但它和 x 轴永远无法相交,只能无限延伸、逼近 x 轴。

|纵轴

按照常理,图的纵轴一般都是所描述的对象,正态分布作为一种概率分布,那纵轴应当就是概率了。

事实上由于一些数学意义的原因,正态分布的纵轴是「概率密度」,没什么实际意义,我们更关心的概率,实际上是这条曲线和 x 轴所围成的面积

我们知道,一个随机事件的概率最大不会超过100%,也就是 1,所以这条曲线和 x 轴相围成的面积或概率总和就是 1对称轴左右各 0.5

|正态曲线

这条曲线可以简单叫做「正态曲线」,其实也是一个函数:正态密度函数。不同的概率分布有各自的概率密度函数(Probability Density Function,PDF)。这是正态分布的概率密度函数。

不过这个名词不重要,你也完全不必关心这个函数是如何推导来的,对上面这一坨公式可以高傲地一眼都不看。

你只需要记住两个参数:μ 和 σ,上面这一坨公式里重要的就是这俩参数,是一条正态曲线的唯二重要信息。有了这两个参数,我们就可以直接画出一条曲线了,所有计算题解题也都是依赖这两个参数。

1. 细说 μ 和 σ

结合下图:

μ

正态分布的均值,μ 在横轴上处于正态曲线横轴的中点。

μ 的垂线也是这条正态分布曲线的对称轴,在 μ 点上,正态曲线位于整个曲线的最高点,取到最大值(y 最大值是 0.3989)。

这条对称轴将一个正态分布分成左右相等的两部分。

σ

正态分布的标准差(Standard Deviation,SD),特别记一下这个缩写,后面我们还会学一个跟标准差很像的东西。

标准差是正态曲线的度量单位,即「一个标准异单位」。

正态分布的图从对称轴中心开始,向两边延展,在两个「肩膀靠下」的位置,曲线从向内拐,变成向外拐,这两个方向变化的地方,也就是两个拐点处,各自是 1 个标准差的距离,写作 ±1σ。

σ 的正负号表明相对于对称轴的左右位置,负号 σ 在对称轴左侧,正号 σ 在对称轴右侧。

同时,μ 和 σ 引出了第三个数:

z 分数

z 分数的意思是:正态分布中的某个数值,偏离均值 μ 有几个标准差单位,偏离几个,z 分数就是几。比如拐点那个位置对应的 x,距离 μ 有 1 个 σ,z 分数就是 1。

将 μ、σ 和 z 结合,就组成了正态分布语境中的尺子:

均值 μ 是度量的标准,也是尺子的原点,所有的度量都是相对于 μ 的差异,而不是相对于其他零点的差异。

标准差 σ 是度量的刻度,z 是刻度上的数字。我们不再使用数据原本的单位,而是统一用 z 个 σ (几个标准差)来度量正态分布中某个值与 μ 的相对距离

这是z值的计算公式,先眼熟一下,下面还会再见面的。

2. 正态分布的形状和位置

对于不同的正态分布,μ 和 σ 影响了曲线在数轴上的左右位置和高矮胖瘦形状。下图是不同 μ,不同 σ 的四个正态分布的相对差异。

可以看到:

  • μ 越小,在数轴越偏左;μ 越大,在数轴越偏右。

  • σ 越小,形状越高瘦;σ 越大,形状越矮胖(无端想到了体脂率...)。由于曲线下的总面积都是固定的 1 ,所以只有高瘦和矮胖两种搭配。

正态分布可以进行加减乘除四则运算,运算后仍然是正态分布。

加减法影响了 μ,让正态分布在数轴上左右平移。乘除法影响了 σ,让正态分布在高度宽度上上下拉伸

所有的正态分布其实都是在这个数轴上左右移动,上下拉伸得到的。

3. 正态分布上的概率

到目前为止,我们已经知道了 4 个数:对于某正态分布 N~(μσ),该正态分布的任意一点(x,y),都可以用 z 分数度量其距离均值的距离。

哦对了,别害怕,N~(μσ)是正态分布的数学写法,可以一下子省掉「这个正态分布的均值为标准差为」等 14 个汉字,不是什么吓人的东西。

至此,还差最后一点,也是最重要的一点:概率 p。作为概率分布,概率 p 肯定是最重要的东西。

根据概率密度函数,对任意正态分布上的任何一点,都可以计算对应的面积,即概率。但 21 世纪的我们不必亲自代公式,只需要背过几组数值就可以了。

如图是用概率密度函数求出来的结果,我们常用的几组数据是

  • μ±1σ 围起来的面积占到总面积的 68.26%;~z=1

  • μ±1.96σ 围起来的面积占到总面积的 95%;~z=1.96

  • μ±2σ 围起来的面积占到总面积的 95.45%;~z=2

  • μ±2.58σ 围起来的面积占到总面积的 99%;~z=2.58

  • μ±3σ 围起来的面积占到总面积的 99.73%。~z=3

你应该发现了,在这个对应关系里,μ 和 σ 的具体数值不重要,唯一影响概率的只有 z 分数,也就是某个数值距离均值的远近。所以想要知道 p 有多大,必须先知道 z 是多大,也就是用这个公式:

而对于特殊点以外的其他 z 值,可以通过查 z 值表找到,z 值表的 z 精确到小数点后两位,你可以查到如 z 为 0.02 时对应的 p 是多少。

查表时还有点小弯弯绕。

在纵轴那里我们讲到,正态分布的概率是曲线和对称轴围成的面积,而要想「围」成一个面积,你需要四条边来构成一个封闭的图形。

比如下图,你应该能很轻松地找到 34.1% 分别由哪四条边(黄色)包围。

也可以是三条边(黄色),组成几乎封闭的图形,因为正态曲线和 x 轴永远无法真的相交。

在查表的时候,要看清题目给的是左边部分的概率,还是右边部分的概率。

同时,我们还知道总面积/概率是 1,两半各为 0.5,那么已知一半,另一半的概率就可以求出来。

到目前为止,正态分布的最后一块拼图拼完了:均值 μ,标准差 σ,某值 x,z 分数 和概率 p

好了,可以出计算题了。计算题的核心也很简单,就是已知几个,求剩下那一个,大部分是求概率 p 有多大的,可以直接化简为「求阴影部分的面积」。用到的公式只有这个:

只要把这五个数的关系扒拉清楚了,题目难度不超过三年级。

标准化和标准正态分布

|为什么需要标准化?

上面的内容主要针对某个具体的正态分布,如果有一天我们要对比几个正态分布呢?

比如:

数学成绩的分布为均值73,标准差6;英语成绩的分布为均值79,标准差8

小明数学成绩和英语成绩均为80分,请问小明哪一科考得更好一点?

在这个问题里,小明的两科成绩虽然分数一样,但两科卷子都不一样,题目难度也不一样,怎样知道哪一科考得更好一点呢?

(多嘴一下:这里的“好”,其实意思是“相对于其他同学,排名更靠前”,是一种相对意义的好。你可以很烂,但只要别人比你更烂,那你也可以是不错的。)

这个情境就涉及到了多个正态分布的比较。多个正态分布的比较,依赖于分布或数据的「标准化」——将正态分布转化成标准正态分布的过程。

|标准正态分布

标准正态分布可以理解为是世界上所有正态分布的本源,是所有分布的原始内核,所有的正态分布也可以通过对标准正态分布加以改变得来。所以这里的「标准」,也可以理解为模板、标杆的意思。

标准正态分布被定义为:均值 μ=0, 标准差 σ =1 的正态分布,写作 N~(0,1)。下图中的绿色曲线,就是一个标准正态分布。

|标准化过程

如何进行标准化,就是如何将一个普通正态分布,变为标准正态分布的过程。

前面我们讲过,正态分布可以进行加减乘除四则运算,

加减法影响了μ,让正态分布在数轴上左右平移

乘除法影响了σ,让正态分布在高度宽度上上下拉伸

所有的正态分布其实都是在这个数轴上左右移动,上下拉伸得到的。

对于我们已有的任意一个正态分布 N~(μ,σ),想变成 N~(0,1),只需要两步。

第一,把现在的对称轴 μ,从 μ 移动到 0,即向左移动 μ 个单位;

第二,把现在的标准差 σ,从 σ 压缩到 1,即向中间挤压 σ 个单位。

恭喜你,公式出来了:

使用这个公式,将所有的原始数据都移动变化到标准正态分布上,就完成了标准化。标准化后,原始数据不见了,横轴只剩下一堆 z 分数。

这样,多个正态分布都被拉齐在一个标准尺度上,只需要比较 z 分数大小,就能一目了然地知道某个数值在其分布中所处的位置。

回到这个问题:

数学成绩的分布为均值73,标准差6;英语成绩的分布为均值79,标准差8

小明数学成绩和英语成绩均为80分,请问小明哪一科考得更好一点?

数学成绩的 z 分数为(80-73)/6=1.5;英语成绩的 z 分数为(80-79)/8=0.125

很显然,数学成绩好一点,距离均值有 1.5 个标准差,离均值距离更远。

|标准化和正态化

最后,对于非正态分布的数据,也可以用同样的方式进行标准化,但标准化无法改变数据的原始分布,无法将非正态分布的数据转换为正态分布,标准化后分布仍然保持原来的分布形态。

如果想把非正态的数据转换为正态,该过程叫做「正态化」,把非正态数据变为正态分布有以下常用方法:对原始值取对数,开平方根,取倒数,开平方,取指数等等,课本上提到的 T 分数也是正态化的一种方式。

但,不是一定要正态分布才行的,还是依照实际问题需求来。毕竟对于非正态分布,我们也有很多数据处理方法。

总结

至此,正态分布的全部基础知识都在这里了。结束之前,总结一下:

1. 正态分布的知识点感觉很碎,但理解难度不大,多结合图形来记忆,有很多性质结合图形其实没有太难的记忆负担。

2. 统计课本上把正态分布和标准分数分两个地方讲,可能会造成误解,建议先学正态分布(课本第六章),再学标准分数(课本第四章),明明就是一家人,不要拆开嘛。

3. 正态分布里的计算题固然重要,但还是别把重心放在那些加减法计算上。好好理解μ、σ、x、z 和 p 之间的相互关系更重要,接下来的抽样分布上难度,且在 σ 上大舞特舞,现在一定好好理解一下 σ 和 z 分数的意思,get ready!

🌟 有没讲到的会再随时补更

作者cicada头像

cicada

2023/09/05

基石04 - 分布、概率分布

讲完基本概念,下面正常的节奏应该是学统计图表和描述统计。

不,我们不要在各种描述统计的平均数中数众数中,消耗了刚培养起来的学习热情,要把“刚学完绪论后觉得自己非常能学好统计”的学习劲头留给比较难的东西,所以,我们快马加鞭地进入到推论统计。

 

别担心,我们能跳过描述统计,快速进入推论统计的一大信心是:因为这两者背后的逻辑差的还挺大的,所以你根本不需要知道描述统计的知识就可以学推论统计了。

 

本章内容:

- 分布是什么意思?

- 概率分布是什么?

- 有哪些需要关注的概率分布?

分布

如果对分布这个词没有实感,我们可以先从中文理解它:一定地区或区域内散布。这个定义里有两个点:第一,散布的主语;第二,散布在哪里。比如:人分布在公园里,矿产分布在岩石里,鱼类分布在海域里。

 

在统计情境里,主语自然就是数据了。数据分布的位置即数轴,包括数据处于数轴的绝对位置和数据间的相对位置。

对数据来说,数轴是不可见的,但通过作图,分布就能直观地展示了。这也是分布一般用图来表示的原因:在大脑中的数轴可不利于进一步思考噢。

上述关于分布的解释有点不同寻常,但是只要你能理解到就足够。只要你不是真的在试卷上回答「解释分布在统计学中的概念」这道题时,写出我在上面解释的这一通,这样理解分布是没什么问题的。

概率分布

概率分布的概念

我们在统计中提到的数据分布,往往指的是数据的概率分布——某个随机变量的某个取值出现的可能性。

概率分布进一步限定了数据分布的主语,主语不是某个数据本身,而是某个数据出现的可能性。

这个概念有些不太接地气,可能需要多花点时间来理解。比如对身高这个随机变量来说,概率分布描述了某个身高在人群中出现的概率,或可能性,而不是某个身高的具体数值。

而对于身高的具体数值分布如何,我们也关心,但是是通过描述统计来完成的。

也是从这个层面上,你可以将描述统计和推论统计区分开来:描述统计是针对样本的具体数据来完成的,是真实的计算;而推论统计是依赖概率和可能性的,是不一定准确的推论。之后所有推论统计的原理,归根结底都是概率。

概率分布的分类

和数据一样,概率分布也有很多不同的类型,不同的分布描述了不同概率事件的结果。目前,数学和统计上最常用的概率分布有十几种,感兴趣可以大概瞅一眼。

它们各自不同,但也可以相互转化,正态分布是它们其中的绝对C位,其他的概率分布都可以用数学转换的方式转化成正态分布,可以去这个视频围观一下。

最大类的区分是连续分布和离散分布,分别针对连续变量和离散变量的分布。

在心理统计中,最常用的连续随机变量分布是正态分布,最常见的离散变量分布是二项分布。

另一个重要的区分是基本随机变量的分布和基本随机变量函数的分布,后者也叫抽样分布,之后我们都会用抽样分布这个词。

具体来说,基本随机变量的分布描述了某个随机变量的取值的概率情况,比如身高。

抽样分布则描述了对一组身高样本进行进一步计算所得的统计量的分布,如均值、方差、标准差等的分布,这一组身高样本是从身高总体中抽取的。

抽样分布关注的不是总体的分布,也不是具体样本的分布,而是总体中抽取的所有样本的均值、方差、标准差等的概率分布如何。

知道了这个,我们就掌握了从总体中可以抽取到的所有样本的均值等统计量的分布规律,那么我们手里这个单一确定的样本,它的均值等统计量就可以被还原到抽样分布中的一个具体的位置,借由这个位置,我们可以进一步推论总体性质。

抽样分布是抽样调查能够进行的最重要数理依据,正是有了抽样分布的规律,我们才真的可以做抽样调查,用样本来推论总体。也就是上一节中我们提到的:统计学保障。

可以说理解透了抽样分布,推论统计就全通了。我们在05中详细讲。

课本的分类和分类标准

下图是课本上对概率分布的分类标准和类型:

对于这些分布,我们需要知道的是:

1、基础统计的学习阶段,最常接触到的概率分布有以下几种:正态分布、二项分布、t分布、F分布和χ²分布等,后三个属于抽样分布;其他的概率类型可能会在高级统计中用到,暂时可以先保持一无所知。 

2、除非题目特别提到,大部分情况下我们都用的是理论分布经验分布一般只出现在例如专家意见、校长意见这样的描述下,相当于从总体中抽了一个样本,用这个样本的统计量直接替代总体参数。

3、抽样分布和总体分布的区分,是非常重要的考点,也是推论统计重要的理解点,之后的大部分计算题其实都是在考察抽样分布。我们会在05单独讲抽样分布,到时候要打起精神来!

 

接下来,我们会按照顺序,逐一分析每个分布的特点。

作者cicada头像

cicada

2023/08/26

👋

Hi 你好呀,我是cicada,

一个想帮助你度过「心理统计学带来的至暗时刻」的学习领路人。

💡 内容定位?

本专......

作者cicada头像

cicada

2023/08/25

概念03 - 总体、样本和抽样

本篇写作逻辑:

总体和样本,样本和抽样为何重要;总体和样本的表格知识对比,总体和样本的关系整理。

总体

统计学中的总体指的是「研究对象的全部」,英文是"population",也是人口的意思。这个词一念出来,就有一种人山人海的画面感。

总体是研究问题绑定的,不能脱离研究问题来讲这个概念。

总体可以是人,可以不是人,也可以是看不见摸不到的东西。比如心理学的研究对象是人的心理现象和过程,看似研究的是人,其实研究的也不是人。

举几个例子:

某工厂生产的一批小灯泡是否符合出厂标准,总体就是该厂该批次的所有小灯泡

想知道某社区中老年人的生活幸福感,总体就是该社区的全部老年人的生活幸福感

某睡眠干预疗法是否能改善孕产期妇女的失眠问题,总体就是地球上全部的孕产期妇女在接受干预后的失眠状况

总体可以很大,无法穷尽;也可以不大。还是那句话:研究问题说了算。

比如,当该工厂这一批生产的小灯泡有且仅有10个,或者该社区的老年人只有25位。

虽说把10个小灯泡和25为老人作为总体,从研究问题上来说是成立的,但这不代表这个研究是有意义的,因为科研界对研究问题还有一些评价标准,你的导师对你也有要求。

所以概括来说,心理学研究中的总体,一般来说,都是全人类。但你也可以规定是部分人类,比如青少年、亚洲人等等。但即便如此,总体也很大,几乎都是不能穷尽的。

样本和抽样

样本是总体的一个组成部分,通过抽样所得,是抽样的结果。在接下来的学习中,我们要经常和样本这个概念打交道,是统计学和科研实践中真实的研究对象。

在我们学习样本究竟有什么特征,如何利用样本之前,还有一个问题需要解决:

为什么要研究样本呢?研究总体不行吗?

和这两个问题等同的问题是:为什么有抽样调查?为什么我们需要抽样(的过程)?

这部分的内容在课本的第14章,离总体和样本实在是有点远。但我觉得理解抽样是理解样本和总体的重要部分,如果没有抽样,就没有样本。所以我把内容提到前面来了。

为什么要抽样?

前文说到,总体可以大,也可以小。当总体不大的时候,抽样的优势确实不太明显。

比如一家20人的小公司的员工满意度,煮了10个鸡蛋熟没熟,晒了一阳台的衣服干没干。这些总体的体量不大,即便你逐个判断也完全做得来(不过即便如此,你应该也只会挑一个鸡蛋来判断一下这一锅是不是都熟了)。

但实际情况中,总体无法全部获得的情况远远多于总体可获得的情况。

其实通过上文你大概应该也感受到了,心理学的研究对象动则数亿,这个体量是任何研究都可望不可及的。实际科研中,一项能包含几万人的研究已经是诸多研究者数年才能完成的丰功伟绩了。

面对这些现实,已经不是你愿意不愿意抽样,而是你根本没能力研究总体,别无选择。也由此引出了课本上所讲的,抽样的两个好处:节省人力降低费用,节省时间提高时效性

而另一方面:统计学的原理也允许你不研究总体。统计学的这层保障很重要,失去了保障,抽样调查只能是设想,无法成为实践。

统计学保障的东西是:总体中得到的样本和总体存在某种稳定的数量关系,只需要满足几个抽样的要求,就能使抽样得到的结论可以在允许的范围内推广到总体之上。这些统计学原理即后面推论统计的核心。

至此,我们收获了一种省时省力,且可以得到不错的结论的方法,确实没必要再研究总体了。

当然啦,以上过程还有一个很重要的前提条件,那就是取样最好能反映总体的情况。

当你想研究北方人的汤圆口味偏好,却恰好把问卷发给了那群偏偏爱吃肉汤圆的北方人,这就属于抽样抽得不好。

但绝大部分情况下,只要你遵守一些抽样的规矩,别太剑走偏锋,出现这种情况的概率也不会太大。

这些规矩的基本原则是随机化原则。随机化指的是总体中的每个个体,有均等的概率被抽取组成样本,这样抽样的结果可以最大概率地保证代表性。实际操作中,随机化会通过诸如简单随机抽样、等距抽样、分层随机抽样等方式来落实,这个之后我们放在抽样方法单独讲。

不过,多说一句。不论是上述哪种方法,真实的科研过程其实很难、或根本不能,保证随机化抽样原则。也不是研究者故意不做好随机化,是实验被试真的不好找,大部分心理学实验的被试都是全世界的在校大学生,这也给很多研究结论的推广性带来了很大的挑战。

至此,你应该已经知道了,总体,样本和抽样背后的全部逻辑。不知道你有没有体会到,过程中的每一步都很现实,也很合逻辑,应用统计学就是一个很现实的、遇到问题解决问题的学科。

总体和样本的知识整理

仍然用表格来整理总体和样本的知识。内容不难,像记生单词一样记住就好。

我觉得学统计很重要的一点是,不要把它当成数学来学,而是当成外语——背单词,学语法,使用语言的过程,等同于学统计概念、学统计原理和做实际数据处理的过程。

(点击查看大图)

二者的关系的文字版

  1. 样本是总体抽样所得。抽样一定存在抽样误差,也就是总体总是不能被某样本代表。

  2. 一个研究的总体,可以是另一个研究的样本。

  3. 样本是某研究的实际对象,也是数据的实际来源。描述统计就是对样本数据的描述过程。

  4. 当想用样本的结果用来推论总体,就来到了推论统计的部分。

    同抽样误差,是推论,就不能100%正确,推论必然存在错误。但错误只要别太大,就可以接受,错误就是统计显著性

作者cicada头像

cicada

2023/08/23

概念02 - 数据类型

为什么要区分数据类型?

我发表一条暴论:任何试图区分事物间特点的行为,并不真的只是想知道差异如何,最终的目的应当是理解差异之后,找到应对差异的方法。

这就像做 MBTI 一样。知道自己是什么样的人格类型只是第一步,你希望的是能利用这个类型解释自己日常的行为习惯,理性且善意地看待自己做得不够好或一直尝试都没能成功的事情,认识和你更合拍的人,或者让自己向着某个方向改变。

换句话说,认识自己是为了对自己因材施教,如果不能进入到这个层面,区分差异就变成了贴标签,不会对我们有任何帮助。

区分数据类型也是一样。

不同的数据类型就像不同的人格特质,它们有着不同的特点和数学运算特征,也要用不一样的方法和公式来运算。所以,诸多统计方法是针对不同数据类型发展而来,区分数据类型的意义是选择最恰当的统计方法

课本只用了不长的篇幅来介绍数据类型,且只是一些文字内容,这导致它看起来不像是个重点。

但从你进入到「相关关系」这一章开始,一下子出现的各种统计方法目不暇接,看得头大,越往后翻出现的公式就越多。

题目往往考你某数据要用什么相关或统计方法,如果每次都要仔细考虑很久,翻很多次数也搞不清它们的区别,那么可能是你没有从区分数据类型的角度来记忆。

数据类型的学习上有哪些坑?

如果你已经深刻知晓了,区分数据类型对于接下来的学习是非常重要的,那你就完成了50%的任务,剩下的工作就是记住不同数据类型的名字,这部分不难,因为总共数据类型也没几种,少则2种,多则4种罢了。我们放在下一 part 来讲。

我想跟你分享几个不是很重要,但不知道就会让学习很难受的地方。

1、数据和变量的混用

学了一段时间之后,这种混用可能会下意识地出现:脑子里想的是等级数据,说出来却是等级变量。比如,等级数据和等级变量。

混用其实不影响沟通、理解和处理数据,但初学者会觉得很难受。尤其是上一道题写的还是等级数据,下一道题就变成了等级变量,可能你马上要翻翻书,确认一下到底是数据还是变量。

没关系的,是变量还是数据都可以,重点在前面,是等级还是称名,是有序还是无序。

2、翻译导致的学习困难

很多看起来不太一样的文字描述,可能只是翻译的原因。

数据类型没有那么多,但你看几本课本,可能会发现作者用了完全不一样的中文描述。

是翻译的锅,而且这种不适感会存在于整个统计学的学习中,你会持续看到很多难以从字面意义和过去的经验中理解的中文,比如,正态分布、置信区间、极大似然估计等等,直到你把这些词刻在大脑里达到随取随用的程度。

知道这一点会让脑子里混乱的系统清晰一些,当你看到出题或课本又用了新的名字,不是你学漏了,冷静下来回想你现在脑子里的中文,再看看试卷上的,都是马甲和小号罢了。

所以,区分数据类型也是记住核心差异就好。应用统计学都是实用学科,对文字游戏不感兴趣,我们也要勇于透过汉字看本质。

(之后有新的坑会再来补充)

有哪些数据类型?

(点击展开大图)

1.区分标准

个人感觉,课本上讲的区分标准本身就很难理解,如测量尺度、测量水平,仍然是「怎么理解都可以,但怎么都理解不了的中文」,所以我补充了比较好理解的区分标准。

关于区分标准没必要非常准确地背诵某位作者的原文,理解差异才是最重要的。更何况数据类型之间的差异已经明显到二分了,也就是非此即彼的程度,背诵区分标准的意义也不大啦。

2.绝对零点

这个词自带的理科气质有点吓人。所谓绝对零点,就是量表上标着0的地方,表示所要测量的属性是无。

「无」是在自然界的层次讨论的,不是尺子不够长或零点不够低的层次。所以,在绝对零之下不存在任何数值,负值是取不到的,也是无意义的。

有绝对零点的是比率数据;无绝对零点的是等距数据。

  • 身高取0时,身高属性消失了,所以身高是比率数据;

  • 摄氏温度取0时,仍然存在温度(0摄氏度),温度没有消失,所以温度是等距数据。

  • 智力量表测量的是人的智力高低,智力量表得分为0时,人仍然存在智力,只不过相对得分高的人,智力水平较低

对于不存在绝对零点的等距数据,它的零点是「相对零点」,也就是人为规定的零点。

比如,身高的绝对零点是地面(0cm)。但你也可以规定,零点为距离水平面 110cm 的地方。在这个相对零点下,身高仍然可以测量,只是每个人的身高都是(绝对零点下的身高-110)cm。

使用相对零点时,两个数值间的差异是有意义的,或者说仍然是正确的。

如我的身高170cm,妹妹的身高160cm。在110cm的人为零点下,我和妹妹的身高差还是10cm,不论人为零点变成130cm还是-130cm,差值永远不变。所以等距数据可以做加减法。

但我和妹妹身高的倍数无意义

原本我的身高是妹妹的1.0625倍,但110cm零点下,我的身高是妹妹的1.2倍,倍数会随着人为零点的改变而改变。

所以,等距数据不存在xx是xx的几倍这样的描述,比如「三点是一点的3倍」,「20度是10度的两倍」,都是不对的。

但这不意味着,温度完全不能用倍数描述。只不过不是摄氏度和华氏度单位下,温度都是等距数据罢了。这涉及到了温度的物理定义,感兴趣的话可以读:为什么不能说 20℃ 是 10℃ 的两倍?

(关于当你在统计上想刨根问底的时候,有时候会跑到了物理和数学的领地里这件事。)

总结一下。对于客观量,等距尺度下倍数不适用,可以理解为违背了客观量的定义,毕竟客观量的定义已经暗含了绝对零点是什么,如果你要改变绝对零点,那倍数自然也不成立了。

而对于大部分心理测量工具得到的心理量,如自尊、生活满意度、焦虑程度等,我们无法知道这些量的零点在哪里,它们不存在于物理世界中。因此我们只能设计出相对零点,为的是能够研究它们。

作者cicada头像

cicada

2023/08/08

概念01 - 什么是心理统计学?

认识一个学科最简单直接的方法就是看定义。不同作者写出来的定义不会字字相同,但核心肯定没差。不过,相比定义的具体内容,语言表达的问题可能更大。

比如下面这个概念:

心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的学科。

--《现代心理与教育统计学》(第四版),张厚粲,北京师范大学出版社

这个定义写得滴水不漏,但对眼睛很不友好,也不利于从中获得重要信息。所以,把定义仔仔细细地拆一下是有必要的:

心理与教育统计学是专门研究如何运用统计学原理和方法

搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息

进行科学推论找出心理与教育活动规律的学科。

重要信息如下:

1⃣️统计学原理和方法;

2⃣️搜集、整理、分析、推论随机性数据,3⃣️从数据中获得信息;

4⃣️从信息中获得心理规律。

也就是:1⃣️获得数据→2⃣️整理数据→3⃣️分析数据→4⃣️得到结论。

其中,统计学原理和方法是统计的底层逻辑

搜集、整理、分析、推论随机性数据的信息是统计的具体步骤

获得心理规律(也是心理学的研究对象)是统计的最终目的

而当你把「心理规律」替换成「数据规律」,就能适配统计学的所有分支学科了。换句话说,心理统计和其他应用统计的基本过程都是一样的,这个过程对所有数据统计都适配。

统计教材里的任何一个知识,虽然体感很遥远,但都不是白学的,有疑问的时候就回顾一下这个概念里描述的过程吧,你学的知识都能在上述过程中找到位置

定义或概念总是认识新知识的第一步,但也往往成为阻碍:一个概括了方方面面的定义一定是不具体的,不具体的东西就不好理解,不好理解的东西也难以记住。定义大部分对你而言,是不进大脑的知识。

正确使用定义的方法不是先背过它,而是把它当作一个灯塔或说明书,在学习后面的具体知识的时候,每当不理解「学这个到底干啥用的」的时候,就回过头来看看这个知识的定义,这时候,抽象的知识才有了用武之地。

下面展开说说心理统计这个概念描述的过程。

Step1 - 获得数据

获得数据的过程属于实验心理学、心理测量学和心理学研究方法等学科的内容,该过程所需的相关的技能不从统计学中获得。

再进一步地,实验心理学专注于设计实验流程、选用实验范式和操控实验变量等过程;心理测量学专注于问卷和量表等标准化工具,心理学研究方法专注于更多样的研究方法。

如何获得研究数据,应根据某个研究的具体情况具体分析。可以通过查阅相关文献了解其他研究者常用研究方法,也可以根据自己的研究问题开创新的研究范式。

不论过程如何,上述过程的最终目的是获取研究数据,然后统计学才正式进入科研流程,即数据处理阶段,毕竟统计的对象是数据,没有数据到手,统计就无法开始。

但这不意味着实验设计阶段完全不需要考虑统计学,比如,实验设计题最后都要写统计方法。这种「未雨绸缪」为的是避免发生意外,导致收集到的数据作废,无法顺利进入到数据统计阶段。收集数据可是很辛苦的,又花时间又花钱😭,是你最不想重来的步骤了。

Step2 - 数据整理

数据整理是数据统计前的工作,可以理解为在正式的数据处理过程前的一切准备阶段,因为收集到的原始数据可能存在各种各样的问题,以至于无法立刻进行统计分析。

这就类似于要在做饭前先把菜洗净、切好,才能方便下锅炒。

大概的过程有数据编码、清洗、转换和可视化等这几个过程,课本上详细讲的是可视化的阶段,也就是作图制表。其他过程的定义见这篇短文

这里我们列举几个比较常见的过程,帮助大家理解数据整理具体都在做什么。

  1. 由于现在数据统计都用统计软件(如,SPSS、SAS、EXCEL、R、Python、MATLAB等)完成,如果你是使用纸质问卷收集了量表数据,第一步是需要将纸质问卷誊到EXCEL或SPSS文件中;如果是使用程序(比如e-prime)收集实验数据,需要从程序的导出文档中找到你真正需要的数据。

  2. 数据有缺失值,且整体的数据量并不大,需要使用正确的方法填补缺失值。

  3. 数据中有明显的错误,比如收集到的量表数据,某被试所有的题目都选了同一个选项,可以推测被试没有认真作答,那该份数据可能就需要删除。判定是否为错误、无效数据,也有对应的各类方法,比如这篇文献中整理的。

  4. 为了后续操作方便,还需要对变量进行编码或打标签,比如被试编号,作为替代姓名的唯一ID;组别、性别等类别变量用阿拉伯数字编码,比如如0代表男,1代表女;0代表对照组,1代表实验组等。

  5. 数据转换,当原始数据需要进行一些运算才能成为最终的变量时,就需要对变量进行二次计算。比如,正确率=正确次数/总次数;量表某维度总分=该维度下各个题目的数值之和等等。一般会在原始数据之后,额外新建几个计算变量,并在之后的数据中只使用这些计算好的新变量,能够简化操作的过程。

数据整理的工作,可能真的只是在整理数据,这个过程可能完全不涉及统计学原理和方法。

但你需要知道,如果没有对数据的整理,后面的统计过程、操作甚至结果都可能是不正确的。看似在数据收集阶段,统计学原理没有太大的存在感,但其实每个过程有都是为了后续的统计服务的。

拓展阅读:

调查问卷如何整理数据?

统计数据整理有哪些基本步骤

问卷调查中被试不认真作答的控制与识别

Step3 - 分析数据

分析数据是根据研究目的进行数据统计,到这一步,数据统计的实感才开始出现。这个过程可能花不了多少时间,甚至比整理的时间都短;也可能遥遥无期。

包括但不限于课本上学到的:描述性统计中的求数据的平均数和标准差、中位数,数据分布是否正态等;推论统计中的 t 检验、方差分析、卡方检验等。

同时,有点「可怕」的事实是:有很大的可能,在硕士阶段(甚至本科生的毕业论文期间),你需要再学习很多高级统计的方法,比如,逻辑回归、探索性因素分析、聚类分析、结构方程模型等,并且它们将成为你的日常。

使用哪种统计方法,仍然是实验设计和研究问题决定的。但有时候你可能面临着一堆数据,知道自己的研究问题和目标,但不确定用哪种统计方法来实现。

这个问题可以化简为一句话:如何选择正确的统计检验方法。

在计算题和考试中,这个问题确实简单不少,因为备选的方案不多,只需要对每个统计方法的适用条件都理解,这个决策不难做。下图是一个基本的分析流程图(来源:Scribbr,内容是我翻译的),在基础统计阶段是够用了。

困难的是真正的科研工作中,可选的方法不明确,这时候可能只能通过学习更多统计方法和阅读研究领域的文献来解决问题了。

拓展阅读

刘红云 -《高级心理统计》

Choosing the Right Statistical Test | Types & Examples

Step4 - 得到结论

得到结论是分析数据的最后一步,数据分析完了,结论基本也就得出来了。

这两个过程的界限并没有那么清晰。比如,某个心理活动是否存在性别、年龄差异,在看到统计结果的那一刻,其实结论就出来了。

从跟你最直接相关的角度来说,得到的结论成了你在心理学其他教科书上要背的东西。

但悲伤的是,得结论的过程可能没有这么顺利,有时候你用某种统计方法得到了一个不太想要的结论,最常见的就是没有统计显著性。

虽然就这个统计过程来说,最后一步已经完成了,但你的统计分析还远远没有结束,因为得到(你想要的)结论是你的目的。你可能需要反复进行 step 3 和 step 4 的过程,甚至,回到 step 2,甚至,回到 step 1。

这个过程比较难评,真实的科研过程中,确实会存在数据驱动,也确实会存在你的导师一直要求你更换不同的统计方法,只是为了验证某个假设是否成立,不过这不是我们现在要忧虑的事情。将来的痛苦自有将来的解法,但现在,我先送出一个诚挚的祝福:不管你是否有过这样的经历,祝你之后的每一次数据处理都顺顺利利,想要的都显著。

本篇结语

至此,关于「心理统计学是什么」以及「数据统计究竟在做什么」,你应该已经心里有数了。

这一篇还没涉及到考试的重点,但仍然花了比较大的篇幅来讲,是因为我觉得,对一个东西了解得越具体,就越有助于我们克服对它的恐惧,也有利于后面知识体系的架构。在大家普遍都对心理统计怀有一种恐惧情绪的现状下,这一篇应该能帮助你减轻一些恐惧感。

知道是什么很重要,而知道为什么学它们更重要,前者帮助你走得踏实,后者帮助你走得更远。