做一个有理想的心理学人
多重复,多思考,多总结
今天开始我们谈一下统计心理学,我们肯定一直在听老师讲这两句话,统计心理学讲述了两件事情:
一是描述统计;二是推断统计。
关于统计心理学呢,其实是一门说难也不难,说简单也不太好理解的学科,比如交互作用,很多研究生同学也不明白到底什么叫做,自变量队因变量得影响因为水平的不同而不同。
统计心理学≠数学。
因为统计心理学不需要我们用数学的逻辑去推导公式,也不需要知道数字和数字之间到底有什么关系。
统计心理学,不重视数字与数字的关系,而重视数字所代表的含义。
换句话说,每一个数字都是通过被试得到的数据,而数据就代表了被试的条件状态,数字=被试,我们通过研究数字,间接的去研究了被试。
统计心理学实质目的,也就是研究被试在实验中的数据贡献大小。
有影响,还是没影响,有多大程度的影响,在多大水平下,我们可以推断,程度为多大。
这门学科有的专硕虽然不考,但是研究生阶段文献中都会运用到两因素,多因素方差分析,通过方差分析分析实验数据,所以,这门学科虽然称为是工具性学科,但是,却是心理学的核心章节。
我在18年写了一些自己的理解,然后今天又拿了出来。
我以我的理解阐述一下我对统计的理解。
统计心理学讲了一件事情——数据的处理和数据的分析。
全书总体分为两部分,描述统计和推断统计
描述统计——可以归类为数据的处理
推断统计——可以归类为数据的分析
数据的处理——
我们进行实验,实验由每个人得出不同的数字,而每个人的数字组合起来就是数据。
比如,小明,小红,小刚,三个人的反应时间为10S,15S,13S。
10S,15S,13S。这个就是数据。
而描述统计部分就说的是数据的处理。
我们已经得到了数据使10S,15S,13S,
而,下一步就是数据的处理。
首先是,集中量数——数字的集中趋势,也就是说10S,15S,13S,这三个数字往哪个方向去发展。
由此引申出三个知识点,平均数,中数,众数,还有各自的评价,各自的优缺点。
其次是,差异量数——数字的离散程度,10S,15S,13S,这三个数字有一个总体的集中趋势,但是每个数字不是正好都在这个集中趋势上,总会和这个集中趋势有所偏差。
由此引出了全距,平均差,方差,标准差,各自的特点,以及各自的优缺点。
而平均差,方差,标准差都是由之前的平均数而推广而来的。
有人会问,为神马不是众数和中数呢,也有中数和众数的推广,只不过由于受到很多的影响,反应数据不灵敏,所以我们不太用。
而,都平均数正好反应灵敏,可以进一步进行很多运算,因此受到了很广泛的运用。
平均数得到平均差,方差和标准差。
接下来,使由于标准差而引出的概念相对量数。
在标准差的基础上对公式进行了推广,
有了相关系数CV,Z分数,也有了中数的推广,百分位数和百分位差。
各自的优缺点和评价。
然后我们因为目的的不同会把这些数据进行处理,
方便我们看,所以汇总成表格,和图的方式为了便于人的计算,和观察。
这也就是我们描述统计的部分得概述内容。
推断统计,实质就是对平均数,方差,标准差的进一步分析
进一步分析的意思就是,
我们利用平均数,方差,可以做出一些客观的判断
比如,我们接下来学习的这几章。
推断统计的数学基础——讲的是数据概率的一些东西,因为推断统计,推断本身就不是一个十分准确的事情,像是英语阅读理解的seem,好像是,但是确实不是,所以,推断统计的任何一个章节都有一定的犯错误概率,因为是推断,肯定会犯错。
参数估计——讲的是平均数,方差的进一步运用,利用平均数,方差,可以推断一些东西,做出一些判断。。
数据的类型,参数,统计量,参数分布,统计量的分布。
数据的类型
我们得到的数据,并不凑是数字,可能是教授,副教授,讲师,助教。
这就是等级序列,这个不能乘除,不能加减,只能是教授比副教授大,副教授比讲师大。
所以我们把所有的数据所反映的测量水平分为四类
称名数据,等级数据,等距数据,比例数据。
(有无零点,是否能加减,是否能乘除,用生活实例举例说明各类数据)
参数——
参数,就好比是一个代词,It,它代表的是总体的描述。
群体大小,平均数,标准差,方差,相关系数,都属于参数,是描述总体的东西。
这里要说一下什么叫做标准误,
标准误就是“什么的标准差”。平均数的标准差叫平均误,方差的标准差也是平均误,就是这个意思。
统计量——
统计量呢,也是一个代词,它代表的是样本的描述。
上面的参数,是总体的描述,而统计量呢是样本的描述。
上面有群体大小,平均数,标准差,标准误,方差,相关系数都有自己的代表名字,用古希腊字母表示,而统计量呢也有对应的自己的名字,用小写字母表示。要看清楚哦。比如小写s,是样本的标准差。
参数分布——
比如,我们现在有太原市的所有人进行测试,得到了上万个数据。
这些数据呢,就是总体的数据,
这些总体数据是怎么分布的呢。
由此呢引出了两个参数的分布,也就是总体的分布
正态分布,和,二项分布。
正态分布又分为正偏态和负偏态,既然是总体的数据,我们肯定可以计算出,平均数,众数,中数。由此呢,在各个分部里面,平均数,众数,中数的位置也是不一样的。可以在各种形态分布中,比较他们之间的大小。
统计量的分布——
现在,我们讲述的是统计量的分布。
我们现在在一所共有人的高中,我们研究这人,但是经费有限,只能抽取里面的一个班50人研究。这50人,就是一个样本,这个样本的分布情况呢
就是统计量的分布
包括:正态分布,T分布,卡方分布,F分布。
T分布,卡方分布,F分布都是一种偏态的分布,在样本量足够大的情况下,趋近为正态分布。。
数据的处理的进一步发展,就是分析
把数据分析每一个层分,看看哪里值得去研究,研究又能得到哪些有用的东西
首先是概率的问题。
买彩票,是一个概率问题,扔骰子也是一个概率问题。
我想扔到6的概率是六分之一。
我们做推断统计,就需要这个概率。
因为,上次也说过,推断,是一个从已知推未知的过程。
我们利用已知的条件去推断未知的条件终究可能推断的结论是不对的。
因为我们可能犯错误。
每一次推断都可能犯错误,因为心情不好,或者其他。
我们做了一个提前的假设:你们以前在数学中也学过
就是,小概率事件,就是说,不可能事件,这个小概率可以忽略不计。
抽取一次,我们默认为绝对不会发生。
推断统计,就是在这个基础上研究的。
所以,我们做出一个结论之后,总要加上一个犯错误概率。阿尔法
在错误率为0.05或者0.01的情况下,我们可以得到。。。
所以只要加上这一句话,我们后半句话做出的结论就可以被接受,就是正确的。
参数估计,顾名思义就是利用统计量对总体参数进行判断。
因为总体数据很大,我们不能全部做测验去检验。
所以,抽一个小的样本,通过对这个小的样本检测,
然后做出小样本的推断结论。再加上那个前提小概率,把样本的结论推广到总体的结论。
参数估计,包括点估计和区间估计。
点估计,就是直接利用样本的结论,比如,我们想检测这个学校的总体身高情况。这个学校有0个人,我们只检测了50个人,然后,50个人的平均数是1.65厘米。现在我们就不做推断,直接得出结论,就是点估计。
我们直接说,这个0人的学校,平均身高就是1.65。这个就是点估计。
区间估计。
区间,就是数学中的那个区间。
还是测验0人的平均身高,我们说这些人的身高全部都在1厘米——厘米之间。这个结论是十分准确的。就是没有意义。因为所有人的身高都处于这个区间。我们再来扩大,在厘米到厘米之间。这个就比较准确了。
但是可能有错误,因为有的人可能在厘米,有的90厘米。所以,这个推断有意义,但是有一定的不准确性,还有一定的犯错误概率。
由此,我们提几个概念。
显著性水平,就是犯错误的概率,阿尔法
置信水平,就是估计的正确率,1-阿尔法=估计的正确率
置信区间,水平说的是一种概率,区间是一个区间,是在置信水平的基础上,总体参数所在区域的长度。
明天我们开始的统计心理学~
考研倒计时:天
后来有很多女人躺在我的怀抱里问我爱不爱她,
我都回答爱,
可是我最爱的那个人却从来没有问过我。
——《西西里的美丽传说》
作者/令狐少侠
排版/梦兮兮
愿努力的你到达理想的彼岸
我们陪你一路前行,加油!
如果你也觉得有用,欢迎在看星标