首页 浪子小说 其它 教育研究方法

三、离散数据的分析

教育研究方法 齐梅 3550 2024-10-22 04:35

  

  (一)描述分析

  离散数据包括计数数据和顺序数据。由于数据是离散型的,且数量化意义比较小,所以采用的描述统计分析手段主要是频次分析,即分析每个变量各个类别出现的次数,如男女两性的人数、某个选项被排在第1位的次数等。教育科学研究中,被调查者的人口统计学变量除年龄、收入等变量外,其余大都是离散型变量。当研究需要报告被调查者的代表性时,需要对各人口统计学变量进行基于频次的分析,如次数、百分数或比率。需要注意的是,一般情况下,只需要报告次数、百分数或比率其中一类分析结果即可,无须重复报告。此外,很多教育研究的调查问卷中的问题都是情况描述型的问题,如上述儿童辍学原因的问题,得到的数据也是离散型的,对这类问题的描述统计分析也主要是频次分析。

  1.Frequency过程(频数分析过程)

  Frequency过程是SPSS分析系统中用于离散数据次数分析的主要操作。该过程可以提供离散型变量的次数分布表、绘制条形图或圆形图。

  Frequency过程的操作过程如下:

  选择Analyze→Descriptive Statistics→Frequencies,打开频次分析的对话框如图12-4所示,将要统计分析的变量选入右侧“Variable(s)”框后,将“OK”键激活,就可以得到默认的频次分析,见表12-1(仅列出性别分析结果)。

  图12-4 Frequencies 对话框

  表12-1 性别频次分析表

  表12-1是SPSS的默认输出表,该表的列1代表的是变量的类别,列2代表的是次数,列3为百分数,列4为有效百分数(如果有缺失数据[1],剔除缺失数据的百分数,本例中无缺失数据,故有效百分数与百分数相同。),列5为累积百分数。我们在自己的文章中进行数据报告时,是不能直接将SPSS的表格复制使用的,为了使数据的报告更加清晰、简洁、有意义,通常需要自己制作数据报告表,如表12-1可以简化为表12-2的标准报告形式。而且,也可以将其他的变量的频次分析合并在一个统计表中进行报告。此外,还可以通过点击图12-4中的“Chart”键,选择绘制条形图或者圆形图。但是在同一份数据报告中,选择同一个变量的统计表与统计图之一即可,无须重复报告(关于统计表的要求本专题中不再重复,也不再制作论文中报告的统计表,仅贴出SPSS输出的表格)。

  表12-2 经过整理后的频次分布表

  2.Crosstabs过程(交互表分析)

  Crosstabs过程是相对复杂一些的次数分析,中文叫作交互表分析或交叉表分析,主要用于分析一个离散型变量在另外一个变量的各个分类上的次数分析。例如,以调查大学生为例,在考虑样本的代表性时,仅考虑性别构成是否均衡或者年级构成是否均衡,并不能充分反映样本的代表性。在一个有代表性的样本中,各个年级在不同的性别中应当是均衡的,或者在各个年级中,性别是均衡的。交叉分析可以提供相应的信息。

  Crosstab过程的操作过程如下:

  选择Analyze→Descriptive Statistics→Crosstabs,打开交叉分析的对话框,并将年级变量放入右侧“Row(s)”框,把性别变量放入“Column(s)”框,如图12-5所示。

  点击 “OK”键,就可以得到默认的交叉分析,见表12-3。由表12-3结果可知,该数据样本中性别的比例并不均衡,男被试偏少,年级的分布也不均衡,大三、大四被试偏少,大一、大二被试中男女被试比例失衡更严重。如果在研究中遇到这种情况,需要增加被试量提高样本的代表性。

  图12-5 Crosstabs过程对话框

  表12-3 年级 * 性别交叉分析结果输出表

  在交叉分析的对话框中,通过勾选“Display clustered bar charts”,可以输出复合条形图,如图12-6所示;在图12-5右侧“layer 1 of 1”框中放入另外一个离散型变量,则可以得到前面两个变量在第三个变量的不同类别上的交叉分布表。读者可以自行进行练习。

  图12-6 交叉分析复合条形图示例

  (二)推断分析

  离散数据的推断分析方法主要是卡方检验,用来判断某个变量的各个分类之间是否有差异,或者两个变量之间是否有关联性。由于离散数据并不满足某种特定的分布特征,离散数据的卡方检验只是一种非参数检验,检验结果比较粗略。因此,对卡方检验结果的解释要特别慎重。

  1.单个离散变量的卡方检验

  以农村儿童辍学问题研究为例,在儿童辍学的原因上,仅仅了解每种原因所占的比例(频次分析)是不够的,我们还想知道在各种原因的选择上是否有差异,这时就可以使用单个离散变量的卡方检验,来进行验证。

  单个离散变量的卡方检验的SPSS操作步骤如下:

  选择Analyze→Nonparametric Tests→Legacy Dialogs→Chi-square,打开卡方检验的对话框,将辍学原因变量放入右侧“Test Variable List”框,如图12-7所示。如果我们认为理论上选择三种原因的被试应该是相等的,则直接点击“OK”键,可以得到表12-4所示的卡方检验结果表。

  图12-7 卡方检验对话框

  表12-4 卡方分析表

  在表12-4中,行2给出的是卡方值,行3是自由度,行4是该卡方值对应的伴随概率。根据假设检验的基本原理,当检验统计量发生的概率小于0.05时,就可以拒绝零假设,接受研究假设。在本例中,零假设就是认为理论上选择三种辍学原因的被试应该是相当的,由于检验统计量卡方值6.650的伴随概率为0.036,小于0.05,我们就可以拒绝此零假设,接受研究假设,即认为三种辍学原因的选择是有差异的。至于差异的具体情况,可以根据卡方检验结果输出中的次数分布表来判断。例如,根据表12-5,可以看到出于个人原因辍学的儿童(52人)相对于出于其他原因辍学的儿童占有显著更高的比例。

  表12-5 卡方检验中的辍学原因次数分布统计表

  在单个离散变量的卡方检验中,如果研究者根据某种理论或某种假设,认为该变量的不同类别理论上的次数不相等,而是按某种比例分布的,例如,认为儿童辍学70%的原因应该归于父母,其余个人原因和学校原因各占一半,则在图12-7所示的对话框中,点选右下方的“Values”,并在其后的方框中输入“15”,点击下方的“Add”键添加至该键右侧的方框中,然后再依次输入70、15并分别添加,完成后点击 “OK”键进行分析。这样操作后的卡方检验就是针对上述假定的检验。同样,如果卡方值对应的伴随概率小于0.05,则认为该理论假定不成立,如果伴随概率大于0.05,则认为该理论假定成立。

  2.两个离散变量的卡方检验

  图12-8 双变量卡方检验对话框

  如果要考察两个离散变量之间是否有关联,即一个变量在各分类上的频次是否受另外一个变量的值的影响。例如,研究者想要了解儿童辍学的原因与儿童的性别是否有关联,则可进行两个离散变量的卡方检验。

  两个离散变量卡方检验的SPSS操作如下:

  选择Analyze→Descriptive Statistics→Crosstabs,打开交叉分析的对话框,将辍学原因变量放入右侧“Row(s)”框,性别变量放入“Column(s)”框(此操作同交叉分析表的操作,可参考图12-5),点击打开对话框右侧第二个键“Statistics”,得到如图12-8所示的对话框,勾选第一个选项“Chi-square”,再点击最下方的“Continue”键返回主对话框,点击“OK”键开始分析,得到表12-6的卡方检验结果表。

  表12-6 双变量卡方检验结果

  表12-6所示的卡方分析结果报表中,行2给出的是卡方检验的结果,也是研究者主要参考的统计分析结果,与行2对应的列2为卡方值,列3为自由度,列4为伴随概率。根据假设检验的相关规定,由于卡方检验值2.056对应的伴随概率0.358大于0.05,接受零假设,即认为儿童辍学原因与性别没有关联。

  [1] 缺失数据即被调查者在该问题上的回答缺失。——编者注

  

目录
设置
手机
书架
书页
简体
评论