SPSS 回顾:
1描述性统计分析
1.1基本描述性统计量的概念
(1)操作步骤:Analyze →Descriptive Statistics→Descriptives
(2)概念
集中趋势的统计量:平均值、中位数、众数、求和
离散趋势的统计量:方差、标准差、极差、最小值、最大值、均值标准误差 分布形态的统计量:偏度、峰度
1.2频数分析
(1)操作步骤:Analyze → Descriptive Statistics→Frequencies
(2)概念
频数(Frenquency ):变量值落在某个区间或者某个取值点的个数。
百分比(Percent ):各频数占总样本数的百分比。
有效百分比(Valid Percent):各频数占有效样本数的百分比。
累计百分比(Cumulative Percent):各百分比逐级累加起来的结果,最终取值是100。
1.3探索性分析
(1)操作步骤:Analyze → Descriptive Statistics→Explore
(2)看得懂以下图形:箱图、茎叶图、QQ 图
特别注意:以下内容都与假设检验有关。
不同的检验有不同的零假设,但基本上对检验结果的判断都遵循以下判别规则,不再赘述。
(1)如果相伴概率值(P 值或Sig. 值)小于或等于显著性水平α,则拒绝H0。
(2)相伴概率值(P 值或Sig. 值)大于显著性水平α,则接受H0。
(3)相伴概率值在spss 运行结果中查找。显著性水平可由用户自行设定,如没有特别要求可取默认值0.05。
2两总体均值比较
2.1单样本T 检验
(1)基本原理:检验样本均值与已知总体均值之间是否存在差异。
(2)操作步骤:Analyze →Compare Means→One Sample T Test
(3)原假设H0:样本均值和总体均值之间不存在显著差异。
(4)关键结果标题和统计量:One Sample Test表和其中的t 统计量和sig 值。
2.2独立样本T 检验
(1)基本原理:检验两个独立正态样本的总体均值之间是否存在显著差异
(2)应用的条件:两个样本相互独立且满足正态分布,样本数量可以不同
(3)操作步骤:Analyze → Compare Means→Independent Samples T Test
(4)原假设H0:两个独立样本的总体均值不存在显著差异。
(5)关键结果标题和统计量:
Independent Samples Test表
(a )首先,利用F 检验判断两样本的方差是否相同(方差齐性)。
方差齐性原假设H0:认为两总体方差之间不存在显著性差异,方差齐性。
Levene’s Test for…部分的F 统计量和sig 值。
(b )根据第一步结果,决定T 统计量和自由度计算公式,进而对T 检验的结论作出判断。
T Test部分的t 统计量和sig 值。取Levene’s Test for…部分有F 统计量和sig 值的行所对应的t 统计量和sig 值。
2.3 配对样本T 检验
(1)基本原理:检验两个配对正态样本的总体均值之间是否存在显著差异
(2)应用的条件:两个样本配对且满足正态分布,样本数量一般相同。配对的理解,两组同质受试样本配成对子或同一受试样本分别接受两种不同的处理。
(3)操作步骤:Analyze → Compare Means→Paired Samples T Test
(4)原假设H0:两个配对样本的总体均值不存在显著差异。
(5)关键结果标题和统计量:
Paired Samples Test表和其中的t 统计量和sig 值。
3方差分析
(1)基本原理:检验两个以上正态样本的总体均值之间是否存在显著差异。找到影响因变量变化的主要因素,确定各因素对因变量变化的影响程度。
(2)基本概念:因素(自变量)、水平、因变量、控制因素和随机因素。
(3)应用的条件:总体正态分布、方差齐性,样本随机且独立。
3.1单因素方差分析
(4)操作步骤:Analyze → Compare Means→One-Way ANOVA
Option 和Post Hoc…按钮的设置
(5)原假设H0:因素的不同水平下,因变量的总体均值没有显著性差异。或者m 个样本的总体均值都相同,即μ1=μ2=μ3=…=μm=μ。
(6)关键结果标题和统计量:
Test of Homogeneity of Variances表和其中的Levene 统计量和sig 值,做方差齐性检验。
ANOVA 表中的F 统计量和sig 值,判断多个样本的均值是否相等,从而判断可控因素是否是因变量的主要影响因素。
ANOVA 表中的Between Group值,判断组间影响的大小,即可控因素影响的大小。
ANOVA 表中的Within Group值,判断组内影响的大小,即随机因素影响的大小。
Multiple Comparisons表,根据Mean Difference值上的正负号和*号,判断哪个水平最显著。
3.2 多因素方差分析
(4)操作步骤:Analyze →General Linear Model→Univariate
Option 和Post Hoc…按钮的设置
(5)原假设H0:不同因素的不同水平下,因变量的总体均值没有显著性差异。或者m 个样本的总体均值都相同,即μ1=μ2=μ3=…=μm=μ。
Levene’sTest of …表和其中的F 统计量和sig 值,做方差齐性检验。
Test of Between-Subjects Effects表中的F 统计量和sig 值,判断多个样本的均值是否相等。从而判断不同可控因素是否是因变量的主要影响因素,并且根据F 值的大小可判断哪个可控因素影响更大。
Multiple Comparisons表,根据Mean Difference值上的正负号和*号,判断哪个水平最显著。
4非参数检验
4.1卡方检验
(1)基本原理:检验样本观察值的频数与期望频数之间是否存在显著性差异。
(2)基本概念:观测频数和期望频数
(3)操作步骤:以下两步缺一不可
Date →Weight Cases
Analyze →Nonparametric Tests → Chi-Square
有很多操作上的注意请参看ppt
(4)原假设H0:样本来自的总体分布形态与期望分布(或理论分布)不存在显著差异。
(5)关键结果标题和统计量:
Test Statistic表和其中的chi square和sig 值,做卡方检验。
4.2二项分布检验
(1)基本原理:检验观测数据是否来自二项分布总体的一种检验方法。
(2)基本概念:二分变量
(3)操作步骤:以下两步缺一不可
Analyze → Nonparametric Tests → Binomial
Test Proportion的设置与样本数据的第1个各案所处的分布区间有关系。
(4)原假设H0:样本来自的总体分布与指定的二项分布不存在显著差异。
Binomial Test表和其中的Test Prop和sig 值,做二项分布检验。Test Prop值必须和所处的类别行的期望分布值对应。
4.3游程检验
(1)基本原理:游程检验又称为链检验,主要用于检验一个变量的两个值(0和1)的分布是否呈现随机分布。
(2)基本概念:游程数的判断。如以下:
投掷硬币十次,出现正反面的变量值序列为0011101100,则游程个数为5,流程总个数为10。
(3)操作步骤:Analyze → Nonparametric Tests → Runs
(4)原假设H0:样本的总体分布是随机的。
(5)关键结果标题和统计量:
Run Test表和其中的sig 值。Number of Runs值给出游程数。
4.4单样本K-S 检验
(1)基本原理:用于检验样本数据是否服从某一特定的分布(正态分布、均匀分布、指数分布和泊松分布等)。
(2)基本概念:正态分布、均匀分布、指数分布和泊松分布
(3)操作步骤:Analyze → Nonparametric Tests → 1-sample K-S
(4)原假设H0:样本来自的总体分布与指定的理论分布不存在显著差异。
(5)关键结果标题和统计量:
1-sample K-S l Test表和其中的K-S Z和sig 值。
4.5两独立样本非参检验
(1)基本原理:对两组独立样本的分析来推断样本来自的两个总体的分布是否存在显著差异。
(2)基本概念:独立样本、秩
(3)操作步骤:Analyze →Nonparametric Tests→2 Independent Samples
(4)原假设H0:两独立样本的总体分布不存在显著差异。
Ranks 表和其中Mean Rank值,表示每个分组的平均秩。
Test Statistic表和其中的Z 和sig 值,进行非参数检验。
4.6多独立样本非参检验
(1)基本原理:对多组独立样本的分析来推断样本来自的多个总体的分布是否存在显著差异。
(2)基本概念:独立样本、秩
(3)操作步骤:Analyze →Nonparametric Tests→k Independent Samples
(4)原假设H0:多个独立样本的总体分布不存在显著差异。
(5)关键结果标题和统计量:
Ranks 表和其中Mean Rank值,表示每个分组的平均秩。
Test Statistic表和其中的chi square和sig 值,进行非参数检验。
4.7两相关样本非参检验
(1)基本原理:对两组相关样本的分析来推断样本来自的两个总体的分布是否存在显著差异。
(2)基本概念:配对样本
(3)操作步骤:Analyze →Nonparametric Tests→2 Related Samples
(4)原假设H0:两相关样本的总体分布不存在显著差异。
(5)关键结果标题和统计量:
…Ranks Test表和其中Mean Rank值,表示每个分组的平均秩。
Test Statistic表和其中的Z 和sig 值,进行非参数检验。
4.6多配对样本非参检验
(1)基本原理:对多组相关样本的分析来推断样本来自的多个总体的分布是否存在显著差异。
(2)基本概念:配对样本
(3)操作步骤:Analyze →Nonparametric Tests→K Related Samples
(4)原假设H0:多相关样本的总体分布不存在显著差异。
…Ranks Test表和其中Mean Rank值,表示每个分组的平均秩。
Test Statistic表和其中的Z 和sig 值,进行非参数检验。
5相关分析
(1)基本原理:检验两个及以上变量之间是否存在相关性。根据散点图判断是否存在相关关系,及正负方向。根据相关系数,判断总体相关的程度。
(2)基本概念:相关程度(完全相关、不相关、相关)、相关形式(线形、非线形)、相关方向(正负)。 相关系数取r=0
值范围
相关程度 无相关 微弱相关 低度相关 显著相关 高度相关 完全相关 |r|0.8 |r|=1
(3)操作步骤:
Graphs →Scatter/Dot绘制散点图
Analyze →Correlate →Bivariate 计算相关系数
(4)原假设H0:两(或多)总体线性不相关。
(5)关键结果标题和统计量:
correlation 表和其中的correlation 和sig 值,做相关性检验。Correlation 值上的*符号的个数也可以初步判断相关的程度
SPSS 回顾:
1描述性统计分析
1.1基本描述性统计量的概念
(1)操作步骤:Analyze →Descriptive Statistics→Descriptives
(2)概念
集中趋势的统计量:平均值、中位数、众数、求和
离散趋势的统计量:方差、标准差、极差、最小值、最大值、均值标准误差 分布形态的统计量:偏度、峰度
1.2频数分析
(1)操作步骤:Analyze → Descriptive Statistics→Frequencies
(2)概念
频数(Frenquency ):变量值落在某个区间或者某个取值点的个数。
百分比(Percent ):各频数占总样本数的百分比。
有效百分比(Valid Percent):各频数占有效样本数的百分比。
累计百分比(Cumulative Percent):各百分比逐级累加起来的结果,最终取值是100。
1.3探索性分析
(1)操作步骤:Analyze → Descriptive Statistics→Explore
(2)看得懂以下图形:箱图、茎叶图、QQ 图
特别注意:以下内容都与假设检验有关。
不同的检验有不同的零假设,但基本上对检验结果的判断都遵循以下判别规则,不再赘述。
(1)如果相伴概率值(P 值或Sig. 值)小于或等于显著性水平α,则拒绝H0。
(2)相伴概率值(P 值或Sig. 值)大于显著性水平α,则接受H0。
(3)相伴概率值在spss 运行结果中查找。显著性水平可由用户自行设定,如没有特别要求可取默认值0.05。
2两总体均值比较
2.1单样本T 检验
(1)基本原理:检验样本均值与已知总体均值之间是否存在差异。
(2)操作步骤:Analyze →Compare Means→One Sample T Test
(3)原假设H0:样本均值和总体均值之间不存在显著差异。
(4)关键结果标题和统计量:One Sample Test表和其中的t 统计量和sig 值。
2.2独立样本T 检验
(1)基本原理:检验两个独立正态样本的总体均值之间是否存在显著差异
(2)应用的条件:两个样本相互独立且满足正态分布,样本数量可以不同
(3)操作步骤:Analyze → Compare Means→Independent Samples T Test
(4)原假设H0:两个独立样本的总体均值不存在显著差异。
(5)关键结果标题和统计量:
Independent Samples Test表
(a )首先,利用F 检验判断两样本的方差是否相同(方差齐性)。
方差齐性原假设H0:认为两总体方差之间不存在显著性差异,方差齐性。
Levene’s Test for…部分的F 统计量和sig 值。
(b )根据第一步结果,决定T 统计量和自由度计算公式,进而对T 检验的结论作出判断。
T Test部分的t 统计量和sig 值。取Levene’s Test for…部分有F 统计量和sig 值的行所对应的t 统计量和sig 值。
2.3 配对样本T 检验
(1)基本原理:检验两个配对正态样本的总体均值之间是否存在显著差异
(2)应用的条件:两个样本配对且满足正态分布,样本数量一般相同。配对的理解,两组同质受试样本配成对子或同一受试样本分别接受两种不同的处理。
(3)操作步骤:Analyze → Compare Means→Paired Samples T Test
(4)原假设H0:两个配对样本的总体均值不存在显著差异。
(5)关键结果标题和统计量:
Paired Samples Test表和其中的t 统计量和sig 值。
3方差分析
(1)基本原理:检验两个以上正态样本的总体均值之间是否存在显著差异。找到影响因变量变化的主要因素,确定各因素对因变量变化的影响程度。
(2)基本概念:因素(自变量)、水平、因变量、控制因素和随机因素。
(3)应用的条件:总体正态分布、方差齐性,样本随机且独立。
3.1单因素方差分析
(4)操作步骤:Analyze → Compare Means→One-Way ANOVA
Option 和Post Hoc…按钮的设置
(5)原假设H0:因素的不同水平下,因变量的总体均值没有显著性差异。或者m 个样本的总体均值都相同,即μ1=μ2=μ3=…=μm=μ。
(6)关键结果标题和统计量:
Test of Homogeneity of Variances表和其中的Levene 统计量和sig 值,做方差齐性检验。
ANOVA 表中的F 统计量和sig 值,判断多个样本的均值是否相等,从而判断可控因素是否是因变量的主要影响因素。
ANOVA 表中的Between Group值,判断组间影响的大小,即可控因素影响的大小。
ANOVA 表中的Within Group值,判断组内影响的大小,即随机因素影响的大小。
Multiple Comparisons表,根据Mean Difference值上的正负号和*号,判断哪个水平最显著。
3.2 多因素方差分析
(4)操作步骤:Analyze →General Linear Model→Univariate
Option 和Post Hoc…按钮的设置
(5)原假设H0:不同因素的不同水平下,因变量的总体均值没有显著性差异。或者m 个样本的总体均值都相同,即μ1=μ2=μ3=…=μm=μ。
Levene’sTest of …表和其中的F 统计量和sig 值,做方差齐性检验。
Test of Between-Subjects Effects表中的F 统计量和sig 值,判断多个样本的均值是否相等。从而判断不同可控因素是否是因变量的主要影响因素,并且根据F 值的大小可判断哪个可控因素影响更大。
Multiple Comparisons表,根据Mean Difference值上的正负号和*号,判断哪个水平最显著。
4非参数检验
4.1卡方检验
(1)基本原理:检验样本观察值的频数与期望频数之间是否存在显著性差异。
(2)基本概念:观测频数和期望频数
(3)操作步骤:以下两步缺一不可
Date →Weight Cases
Analyze →Nonparametric Tests → Chi-Square
有很多操作上的注意请参看ppt
(4)原假设H0:样本来自的总体分布形态与期望分布(或理论分布)不存在显著差异。
(5)关键结果标题和统计量:
Test Statistic表和其中的chi square和sig 值,做卡方检验。
4.2二项分布检验
(1)基本原理:检验观测数据是否来自二项分布总体的一种检验方法。
(2)基本概念:二分变量
(3)操作步骤:以下两步缺一不可
Analyze → Nonparametric Tests → Binomial
Test Proportion的设置与样本数据的第1个各案所处的分布区间有关系。
(4)原假设H0:样本来自的总体分布与指定的二项分布不存在显著差异。
Binomial Test表和其中的Test Prop和sig 值,做二项分布检验。Test Prop值必须和所处的类别行的期望分布值对应。
4.3游程检验
(1)基本原理:游程检验又称为链检验,主要用于检验一个变量的两个值(0和1)的分布是否呈现随机分布。
(2)基本概念:游程数的判断。如以下:
投掷硬币十次,出现正反面的变量值序列为0011101100,则游程个数为5,流程总个数为10。
(3)操作步骤:Analyze → Nonparametric Tests → Runs
(4)原假设H0:样本的总体分布是随机的。
(5)关键结果标题和统计量:
Run Test表和其中的sig 值。Number of Runs值给出游程数。
4.4单样本K-S 检验
(1)基本原理:用于检验样本数据是否服从某一特定的分布(正态分布、均匀分布、指数分布和泊松分布等)。
(2)基本概念:正态分布、均匀分布、指数分布和泊松分布
(3)操作步骤:Analyze → Nonparametric Tests → 1-sample K-S
(4)原假设H0:样本来自的总体分布与指定的理论分布不存在显著差异。
(5)关键结果标题和统计量:
1-sample K-S l Test表和其中的K-S Z和sig 值。
4.5两独立样本非参检验
(1)基本原理:对两组独立样本的分析来推断样本来自的两个总体的分布是否存在显著差异。
(2)基本概念:独立样本、秩
(3)操作步骤:Analyze →Nonparametric Tests→2 Independent Samples
(4)原假设H0:两独立样本的总体分布不存在显著差异。
Ranks 表和其中Mean Rank值,表示每个分组的平均秩。
Test Statistic表和其中的Z 和sig 值,进行非参数检验。
4.6多独立样本非参检验
(1)基本原理:对多组独立样本的分析来推断样本来自的多个总体的分布是否存在显著差异。
(2)基本概念:独立样本、秩
(3)操作步骤:Analyze →Nonparametric Tests→k Independent Samples
(4)原假设H0:多个独立样本的总体分布不存在显著差异。
(5)关键结果标题和统计量:
Ranks 表和其中Mean Rank值,表示每个分组的平均秩。
Test Statistic表和其中的chi square和sig 值,进行非参数检验。
4.7两相关样本非参检验
(1)基本原理:对两组相关样本的分析来推断样本来自的两个总体的分布是否存在显著差异。
(2)基本概念:配对样本
(3)操作步骤:Analyze →Nonparametric Tests→2 Related Samples
(4)原假设H0:两相关样本的总体分布不存在显著差异。
(5)关键结果标题和统计量:
…Ranks Test表和其中Mean Rank值,表示每个分组的平均秩。
Test Statistic表和其中的Z 和sig 值,进行非参数检验。
4.6多配对样本非参检验
(1)基本原理:对多组相关样本的分析来推断样本来自的多个总体的分布是否存在显著差异。
(2)基本概念:配对样本
(3)操作步骤:Analyze →Nonparametric Tests→K Related Samples
(4)原假设H0:多相关样本的总体分布不存在显著差异。
…Ranks Test表和其中Mean Rank值,表示每个分组的平均秩。
Test Statistic表和其中的Z 和sig 值,进行非参数检验。
5相关分析
(1)基本原理:检验两个及以上变量之间是否存在相关性。根据散点图判断是否存在相关关系,及正负方向。根据相关系数,判断总体相关的程度。
(2)基本概念:相关程度(完全相关、不相关、相关)、相关形式(线形、非线形)、相关方向(正负)。 相关系数取r=0
值范围
相关程度 无相关 微弱相关 低度相关 显著相关 高度相关 完全相关 |r|0.8 |r|=1
(3)操作步骤:
Graphs →Scatter/Dot绘制散点图
Analyze →Correlate →Bivariate 计算相关系数
(4)原假设H0:两(或多)总体线性不相关。
(5)关键结果标题和统计量:
correlation 表和其中的correlation 和sig 值,做相关性检验。Correlation 值上的*符号的个数也可以初步判断相关的程度