spss软件分析方法概述

SPSS 回顾:

1描述性统计分析

1.1基本描述性统计量的概念

(1)操作步骤:Analyze →Descriptive Statistics→Descriptives

(2)概念

集中趋势的统计量:平均值、中位数、众数、求和

离散趋势的统计量:方差、标准差、极差、最小值、最大值、均值标准误差 分布形态的统计量:偏度、峰度

1.2频数分析

(1)操作步骤:Analyze → Descriptive Statistics→Frequencies

(2)概念

频数(Frenquency ):变量值落在某个区间或者某个取值点的个数。

百分比(Percent ):各频数占总样本数的百分比。

有效百分比(Valid Percent):各频数占有效样本数的百分比。

累计百分比(Cumulative Percent):各百分比逐级累加起来的结果,最终取值是100。

1.3探索性分析

(1)操作步骤:Analyze → Descriptive Statistics→Explore

(2)看得懂以下图形:箱图、茎叶图、QQ 图

特别注意:以下内容都与假设检验有关。

不同的检验有不同的零假设,但基本上对检验结果的判断都遵循以下判别规则,不再赘述。

(1)如果相伴概率值(P 值或Sig. 值)小于或等于显著性水平α,则拒绝H0。

(2)相伴概率值(P 值或Sig. 值)大于显著性水平α,则接受H0。

(3)相伴概率值在spss 运行结果中查找。显著性水平可由用户自行设定,如没有特别要求可取默认值0.05。

2两总体均值比较

2.1单样本T 检验

(1)基本原理:检验样本均值与已知总体均值之间是否存在差异。

(2)操作步骤:Analyze →Compare Means→One Sample T Test

(3)原假设H0:样本均值和总体均值之间不存在显著差异。

(4)关键结果标题和统计量:One Sample Test表和其中的t 统计量和sig 值。

2.2独立样本T 检验

(1)基本原理:检验两个独立正态样本的总体均值之间是否存在显著差异

(2)应用的条件:两个样本相互独立且满足正态分布,样本数量可以不同

(3)操作步骤:Analyze → Compare Means→Independent Samples T Test

(4)原假设H0:两个独立样本的总体均值不存在显著差异。

(5)关键结果标题和统计量:

Independent Samples Test表

(a )首先,利用F 检验判断两样本的方差是否相同(方差齐性)。

方差齐性原假设H0:认为两总体方差之间不存在显著性差异,方差齐性。

Levene’s Test for…部分的F 统计量和sig 值。

(b )根据第一步结果,决定T 统计量和自由度计算公式,进而对T 检验的结论作出判断。

T Test部分的t 统计量和sig 值。取Levene’s Test for…部分有F 统计量和sig 值的行所对应的t 统计量和sig 值。

2.3 配对样本T 检验

(1)基本原理:检验两个配对正态样本的总体均值之间是否存在显著差异

(2)应用的条件:两个样本配对且满足正态分布,样本数量一般相同。配对的理解,两组同质受试样本配成对子或同一受试样本分别接受两种不同的处理。

(3)操作步骤:Analyze → Compare Means→Paired Samples T Test

(4)原假设H0:两个配对样本的总体均值不存在显著差异。

(5)关键结果标题和统计量:

Paired Samples Test表和其中的t 统计量和sig 值。

3方差分析

(1)基本原理:检验两个以上正态样本的总体均值之间是否存在显著差异。找到影响因变量变化的主要因素,确定各因素对因变量变化的影响程度。

(2)基本概念:因素(自变量)、水平、因变量、控制因素和随机因素。

(3)应用的条件:总体正态分布、方差齐性,样本随机且独立。

3.1单因素方差分析

(4)操作步骤:Analyze → Compare Means→One-Way ANOVA

Option 和Post Hoc…按钮的设置

(5)原假设H0:因素的不同水平下,因变量的总体均值没有显著性差异。或者m 个样本的总体均值都相同,即μ1=μ2=μ3=…=μm=μ。

(6)关键结果标题和统计量:

Test of Homogeneity of Variances表和其中的Levene 统计量和sig 值,做方差齐性检验。

ANOVA 表中的F 统计量和sig 值,判断多个样本的均值是否相等,从而判断可控因素是否是因变量的主要影响因素。

ANOVA 表中的Between Group值,判断组间影响的大小,即可控因素影响的大小。

ANOVA 表中的Within Group值,判断组内影响的大小,即随机因素影响的大小。

Multiple Comparisons表,根据Mean Difference值上的正负号和*号,判断哪个水平最显著。

3.2 多因素方差分析

(4)操作步骤:Analyze →General Linear Model→Univariate

Option 和Post Hoc…按钮的设置

(5)原假设H0:不同因素的不同水平下,因变量的总体均值没有显著性差异。或者m 个样本的总体均值都相同,即μ1=μ2=μ3=…=μm=μ。

Levene’sTest of …表和其中的F 统计量和sig 值,做方差齐性检验。

Test of Between-Subjects Effects表中的F 统计量和sig 值,判断多个样本的均值是否相等。从而判断不同可控因素是否是因变量的主要影响因素,并且根据F 值的大小可判断哪个可控因素影响更大。

Multiple Comparisons表,根据Mean Difference值上的正负号和*号,判断哪个水平最显著。

4非参数检验

4.1卡方检验

(1)基本原理:检验样本观察值的频数与期望频数之间是否存在显著性差异。

(2)基本概念:观测频数和期望频数

(3)操作步骤:以下两步缺一不可

Date →Weight Cases

Analyze →Nonparametric Tests → Chi-Square

有很多操作上的注意请参看ppt

(4)原假设H0:样本来自的总体分布形态与期望分布(或理论分布)不存在显著差异。

(5)关键结果标题和统计量:

Test Statistic表和其中的chi square和sig 值,做卡方检验。

4.2二项分布检验

(1)基本原理:检验观测数据是否来自二项分布总体的一种检验方法。

(2)基本概念:二分变量

(3)操作步骤:以下两步缺一不可

Analyze → Nonparametric Tests → Binomial

Test Proportion的设置与样本数据的第1个各案所处的分布区间有关系。

(4)原假设H0:样本来自的总体分布与指定的二项分布不存在显著差异。

Binomial Test表和其中的Test Prop和sig 值,做二项分布检验。Test Prop值必须和所处的类别行的期望分布值对应。

4.3游程检验

(1)基本原理:游程检验又称为链检验,主要用于检验一个变量的两个值(0和1)的分布是否呈现随机分布。

(2)基本概念:游程数的判断。如以下:

投掷硬币十次,出现正反面的变量值序列为0011101100,则游程个数为5,流程总个数为10。

(3)操作步骤:Analyze → Nonparametric Tests → Runs

(4)原假设H0:样本的总体分布是随机的。

(5)关键结果标题和统计量:

Run Test表和其中的sig 值。Number of Runs值给出游程数。

4.4单样本K-S 检验

(1)基本原理:用于检验样本数据是否服从某一特定的分布(正态分布、均匀分布、指数分布和泊松分布等)。

(2)基本概念:正态分布、均匀分布、指数分布和泊松分布

(3)操作步骤:Analyze → Nonparametric Tests → 1-sample K-S

(4)原假设H0:样本来自的总体分布与指定的理论分布不存在显著差异。

(5)关键结果标题和统计量:

1-sample K-S l Test表和其中的K-S Z和sig 值。

4.5两独立样本非参检验

(1)基本原理:对两组独立样本的分析来推断样本来自的两个总体的分布是否存在显著差异。

(2)基本概念:独立样本、秩

(3)操作步骤:Analyze →Nonparametric Tests→2 Independent Samples

(4)原假设H0:两独立样本的总体分布不存在显著差异。

Ranks 表和其中Mean Rank值,表示每个分组的平均秩。

Test Statistic表和其中的Z 和sig 值,进行非参数检验。

4.6多独立样本非参检验

(1)基本原理:对多组独立样本的分析来推断样本来自的多个总体的分布是否存在显著差异。

(2)基本概念:独立样本、秩

(3)操作步骤:Analyze →Nonparametric Tests→k Independent Samples

(4)原假设H0:多个独立样本的总体分布不存在显著差异。

(5)关键结果标题和统计量:

Ranks 表和其中Mean Rank值,表示每个分组的平均秩。

Test Statistic表和其中的chi square和sig 值,进行非参数检验。

4.7两相关样本非参检验

(1)基本原理:对两组相关样本的分析来推断样本来自的两个总体的分布是否存在显著差异。

(2)基本概念:配对样本

(3)操作步骤:Analyze →Nonparametric Tests→2 Related Samples

(4)原假设H0:两相关样本的总体分布不存在显著差异。

(5)关键结果标题和统计量:

…Ranks Test表和其中Mean Rank值,表示每个分组的平均秩。

Test Statistic表和其中的Z 和sig 值,进行非参数检验。

4.6多配对样本非参检验

(1)基本原理:对多组相关样本的分析来推断样本来自的多个总体的分布是否存在显著差异。

(2)基本概念:配对样本

(3)操作步骤:Analyze →Nonparametric Tests→K Related Samples

(4)原假设H0:多相关样本的总体分布不存在显著差异。

…Ranks Test表和其中Mean Rank值,表示每个分组的平均秩。

Test Statistic表和其中的Z 和sig 值,进行非参数检验。

5相关分析

(1)基本原理:检验两个及以上变量之间是否存在相关性。根据散点图判断是否存在相关关系,及正负方向。根据相关系数,判断总体相关的程度。

(2)基本概念:相关程度(完全相关、不相关、相关)、相关形式(线形、非线形)、相关方向(正负)。 相关系数取r=0

值范围

相关程度 无相关 微弱相关 低度相关 显著相关 高度相关 完全相关 |r|0.8 |r|=1

(3)操作步骤:

Graphs →Scatter/Dot绘制散点图

Analyze →Correlate →Bivariate 计算相关系数

(4)原假设H0:两(或多)总体线性不相关。

(5)关键结果标题和统计量:

correlation 表和其中的correlation 和sig 值,做相关性检验。Correlation 值上的*符号的个数也可以初步判断相关的程度

SPSS 回顾:

1描述性统计分析

1.1基本描述性统计量的概念

(1)操作步骤:Analyze →Descriptive Statistics→Descriptives

(2)概念

集中趋势的统计量:平均值、中位数、众数、求和

离散趋势的统计量:方差、标准差、极差、最小值、最大值、均值标准误差 分布形态的统计量:偏度、峰度

1.2频数分析

(1)操作步骤:Analyze → Descriptive Statistics→Frequencies

(2)概念

频数(Frenquency ):变量值落在某个区间或者某个取值点的个数。

百分比(Percent ):各频数占总样本数的百分比。

有效百分比(Valid Percent):各频数占有效样本数的百分比。

累计百分比(Cumulative Percent):各百分比逐级累加起来的结果,最终取值是100。

1.3探索性分析

(1)操作步骤:Analyze → Descriptive Statistics→Explore

(2)看得懂以下图形:箱图、茎叶图、QQ 图

特别注意:以下内容都与假设检验有关。

不同的检验有不同的零假设,但基本上对检验结果的判断都遵循以下判别规则,不再赘述。

(1)如果相伴概率值(P 值或Sig. 值)小于或等于显著性水平α,则拒绝H0。

(2)相伴概率值(P 值或Sig. 值)大于显著性水平α,则接受H0。

(3)相伴概率值在spss 运行结果中查找。显著性水平可由用户自行设定,如没有特别要求可取默认值0.05。

2两总体均值比较

2.1单样本T 检验

(1)基本原理:检验样本均值与已知总体均值之间是否存在差异。

(2)操作步骤:Analyze →Compare Means→One Sample T Test

(3)原假设H0:样本均值和总体均值之间不存在显著差异。

(4)关键结果标题和统计量:One Sample Test表和其中的t 统计量和sig 值。

2.2独立样本T 检验

(1)基本原理:检验两个独立正态样本的总体均值之间是否存在显著差异

(2)应用的条件:两个样本相互独立且满足正态分布,样本数量可以不同

(3)操作步骤:Analyze → Compare Means→Independent Samples T Test

(4)原假设H0:两个独立样本的总体均值不存在显著差异。

(5)关键结果标题和统计量:

Independent Samples Test表

(a )首先,利用F 检验判断两样本的方差是否相同(方差齐性)。

方差齐性原假设H0:认为两总体方差之间不存在显著性差异,方差齐性。

Levene’s Test for…部分的F 统计量和sig 值。

(b )根据第一步结果,决定T 统计量和自由度计算公式,进而对T 检验的结论作出判断。

T Test部分的t 统计量和sig 值。取Levene’s Test for…部分有F 统计量和sig 值的行所对应的t 统计量和sig 值。

2.3 配对样本T 检验

(1)基本原理:检验两个配对正态样本的总体均值之间是否存在显著差异

(2)应用的条件:两个样本配对且满足正态分布,样本数量一般相同。配对的理解,两组同质受试样本配成对子或同一受试样本分别接受两种不同的处理。

(3)操作步骤:Analyze → Compare Means→Paired Samples T Test

(4)原假设H0:两个配对样本的总体均值不存在显著差异。

(5)关键结果标题和统计量:

Paired Samples Test表和其中的t 统计量和sig 值。

3方差分析

(1)基本原理:检验两个以上正态样本的总体均值之间是否存在显著差异。找到影响因变量变化的主要因素,确定各因素对因变量变化的影响程度。

(2)基本概念:因素(自变量)、水平、因变量、控制因素和随机因素。

(3)应用的条件:总体正态分布、方差齐性,样本随机且独立。

3.1单因素方差分析

(4)操作步骤:Analyze → Compare Means→One-Way ANOVA

Option 和Post Hoc…按钮的设置

(5)原假设H0:因素的不同水平下,因变量的总体均值没有显著性差异。或者m 个样本的总体均值都相同,即μ1=μ2=μ3=…=μm=μ。

(6)关键结果标题和统计量:

Test of Homogeneity of Variances表和其中的Levene 统计量和sig 值,做方差齐性检验。

ANOVA 表中的F 统计量和sig 值,判断多个样本的均值是否相等,从而判断可控因素是否是因变量的主要影响因素。

ANOVA 表中的Between Group值,判断组间影响的大小,即可控因素影响的大小。

ANOVA 表中的Within Group值,判断组内影响的大小,即随机因素影响的大小。

Multiple Comparisons表,根据Mean Difference值上的正负号和*号,判断哪个水平最显著。

3.2 多因素方差分析

(4)操作步骤:Analyze →General Linear Model→Univariate

Option 和Post Hoc…按钮的设置

(5)原假设H0:不同因素的不同水平下,因变量的总体均值没有显著性差异。或者m 个样本的总体均值都相同,即μ1=μ2=μ3=…=μm=μ。

Levene’sTest of …表和其中的F 统计量和sig 值,做方差齐性检验。

Test of Between-Subjects Effects表中的F 统计量和sig 值,判断多个样本的均值是否相等。从而判断不同可控因素是否是因变量的主要影响因素,并且根据F 值的大小可判断哪个可控因素影响更大。

Multiple Comparisons表,根据Mean Difference值上的正负号和*号,判断哪个水平最显著。

4非参数检验

4.1卡方检验

(1)基本原理:检验样本观察值的频数与期望频数之间是否存在显著性差异。

(2)基本概念:观测频数和期望频数

(3)操作步骤:以下两步缺一不可

Date →Weight Cases

Analyze →Nonparametric Tests → Chi-Square

有很多操作上的注意请参看ppt

(4)原假设H0:样本来自的总体分布形态与期望分布(或理论分布)不存在显著差异。

(5)关键结果标题和统计量:

Test Statistic表和其中的chi square和sig 值,做卡方检验。

4.2二项分布检验

(1)基本原理:检验观测数据是否来自二项分布总体的一种检验方法。

(2)基本概念:二分变量

(3)操作步骤:以下两步缺一不可

Analyze → Nonparametric Tests → Binomial

Test Proportion的设置与样本数据的第1个各案所处的分布区间有关系。

(4)原假设H0:样本来自的总体分布与指定的二项分布不存在显著差异。

Binomial Test表和其中的Test Prop和sig 值,做二项分布检验。Test Prop值必须和所处的类别行的期望分布值对应。

4.3游程检验

(1)基本原理:游程检验又称为链检验,主要用于检验一个变量的两个值(0和1)的分布是否呈现随机分布。

(2)基本概念:游程数的判断。如以下:

投掷硬币十次,出现正反面的变量值序列为0011101100,则游程个数为5,流程总个数为10。

(3)操作步骤:Analyze → Nonparametric Tests → Runs

(4)原假设H0:样本的总体分布是随机的。

(5)关键结果标题和统计量:

Run Test表和其中的sig 值。Number of Runs值给出游程数。

4.4单样本K-S 检验

(1)基本原理:用于检验样本数据是否服从某一特定的分布(正态分布、均匀分布、指数分布和泊松分布等)。

(2)基本概念:正态分布、均匀分布、指数分布和泊松分布

(3)操作步骤:Analyze → Nonparametric Tests → 1-sample K-S

(4)原假设H0:样本来自的总体分布与指定的理论分布不存在显著差异。

(5)关键结果标题和统计量:

1-sample K-S l Test表和其中的K-S Z和sig 值。

4.5两独立样本非参检验

(1)基本原理:对两组独立样本的分析来推断样本来自的两个总体的分布是否存在显著差异。

(2)基本概念:独立样本、秩

(3)操作步骤:Analyze →Nonparametric Tests→2 Independent Samples

(4)原假设H0:两独立样本的总体分布不存在显著差异。

Ranks 表和其中Mean Rank值,表示每个分组的平均秩。

Test Statistic表和其中的Z 和sig 值,进行非参数检验。

4.6多独立样本非参检验

(1)基本原理:对多组独立样本的分析来推断样本来自的多个总体的分布是否存在显著差异。

(2)基本概念:独立样本、秩

(3)操作步骤:Analyze →Nonparametric Tests→k Independent Samples

(4)原假设H0:多个独立样本的总体分布不存在显著差异。

(5)关键结果标题和统计量:

Ranks 表和其中Mean Rank值,表示每个分组的平均秩。

Test Statistic表和其中的chi square和sig 值,进行非参数检验。

4.7两相关样本非参检验

(1)基本原理:对两组相关样本的分析来推断样本来自的两个总体的分布是否存在显著差异。

(2)基本概念:配对样本

(3)操作步骤:Analyze →Nonparametric Tests→2 Related Samples

(4)原假设H0:两相关样本的总体分布不存在显著差异。

(5)关键结果标题和统计量:

…Ranks Test表和其中Mean Rank值,表示每个分组的平均秩。

Test Statistic表和其中的Z 和sig 值,进行非参数检验。

4.6多配对样本非参检验

(1)基本原理:对多组相关样本的分析来推断样本来自的多个总体的分布是否存在显著差异。

(2)基本概念:配对样本

(3)操作步骤:Analyze →Nonparametric Tests→K Related Samples

(4)原假设H0:多相关样本的总体分布不存在显著差异。

…Ranks Test表和其中Mean Rank值,表示每个分组的平均秩。

Test Statistic表和其中的Z 和sig 值,进行非参数检验。

5相关分析

(1)基本原理:检验两个及以上变量之间是否存在相关性。根据散点图判断是否存在相关关系,及正负方向。根据相关系数,判断总体相关的程度。

(2)基本概念:相关程度(完全相关、不相关、相关)、相关形式(线形、非线形)、相关方向(正负)。 相关系数取r=0

值范围

相关程度 无相关 微弱相关 低度相关 显著相关 高度相关 完全相关 |r|0.8 |r|=1

(3)操作步骤:

Graphs →Scatter/Dot绘制散点图

Analyze →Correlate →Bivariate 计算相关系数

(4)原假设H0:两(或多)总体线性不相关。

(5)关键结果标题和统计量:

correlation 表和其中的correlation 和sig 值,做相关性检验。Correlation 值上的*符号的个数也可以初步判断相关的程度


    相关文章

    A21 大数据模型与数据挖掘应用实战(高级)

    大数据模型与数据挖掘应用实战 [课程目标] 本数据分析与挖掘系列课程包括三个等级的课程: 1. 基础课程,专注于经营数据的统计与数据分析,适合于一般业务部门要求的数据统计与分析,内容系统且全面,由浅入深,使用工具为Excel 2010版本以 ...

    信息分析与预测-iphone手机调查问卷

    南京理工大学经济管理学院 课程考核论文 课程名称: 信息分析与决策 论文题目:大学生对iphone 手机认知情况调查报告 姓 名: 沈莉佳 麦发俊 学 号: 0907830114 0907830137 成 绩: 题目:大学生对iphone ...

    科学知识图谱绘制工具_SPSS和TDA的比较研究

    理论版)011.3(46 图 书 馆 学 研 究 2 科学知识图谱绘制工具: SPSS和TDA的比较研究 廖胜姣 [摘 要]文章从界面和数据处理功能方面.绘图功能方面以及所绘制的图谱特点这三个大方面着手,对SPSS和TDA在绘制科学知识图谱 ...

    Spss进行问卷分析的步骤

    如何用spss 软件处理问卷 (2007-07-02 19:30:04) 转载▼ 标签: spss 教程 spss 软件 spss 问卷处理 分类:电脑/科技 当我们的调查问卷在把调查数据拿回来后, 我们该做的工作就是用相关的统计软件进行处 ...

    SPSS软件在定性数据分析中的技术处理_郭梦霞

    SPSS 软件在定性数据分析中的技术处理 郭梦霞 (陕西职业技术学院管理系, 陕西西安,710000) 摘要:SPSS 全称为社会科学统计软件包,SPSS软件在数据管理.统计建模.结果报告等方面具有相当大的优势.本文主要研究的是在做定性数据 ...

    统计分析软件

    16种统计分析软件 1 SAS 统计软件 SAS 是英文Statistical Analysis System的缩写,翻译成汉语是统计分析系统,最初由美国北卡罗来纳州立大学两名研究生开始研制,1976 年创立SAS 公司, 2003年全球员 ...

    基于SPSS的试卷命题质量评估与成绩分析

    教学研究2010年3期 基于SPSS的试卷命题质量评估与 芦亚君 成绩分析 (海南医学院寄生虫学教研室,海南海口571101) 摘要:衡量教学质量的方法之一是对试卷及成绩进行科学.准确的评估.SPSS统计软件能够对相关数据进 行量化分析,得 ...

    统计学实验周鹏

    管 理 学 院 实 验 报 告 书 学 号 同 组 者 专业班级 课程名称 实验名称 实验报告具体内容一般应包括:一.实验目的和要求;二.主要仪器设备(软件);三.实验内容及实验数据记录;四.问题与建议 [1**********]6 工程管 ...

    巧用Excel解决多元非线性回归分析

    ·研究与开发· 农业网络信息 AGRICULTURENETWORKINFORMATION 2011年第1期 巧用Excel解决多元非线性回归分析 龚江,石培春,李春燕 (石河子大学农学院,石河子832003) 摘 要:非线性回归是回归分析的 ...