当前位置:首页 >> 经济学 >>

第七章统计方法与spss应用_图文


第七章:统计分析方法与SPSS应用

——探讨如何运用统计分析软件 探讨如何运用统计分析软件 SPSS对你的数据进行分析 对你的数据进行分析. 对你的数据进行分析

市场研究

本部分主要内容
? Spss简介 简介 ? 问卷编码 ? 单变量描述性统计 ? 假设检验 ? 双变量统计分析 双变量统计分析-----相关与回归分析 相关与回归分析

市场研究

第一讲 Spss概览
---SPSS是软件英文名称的首字母缩写,原意为 Statistical Package for the Social Sciences,即 “社会科学统计软件包”。但是随着SPSS产品 服务领域的扩大和服务深度的增加,SPSS公司 已于2000年正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品 “ 与服务解决方案” 与服务解决方案”,标志着SPSS的战略方向正 在做出重大调整。

市场研究

功能强大、实用与美观统一的 视窗风格——
? SPSS最突出的特点就是操作界面极为友好,它使 最突出的特点就是操作界面极为友好, 最突出的特点就是操作界面极为友好 用Windows的窗口方式展示各种管理和分析数据 的窗口方式展示各种管理和分析数据 方法的功能,使用对话框展示出各种功能选择项, 方法的功能,使用对话框展示出各种功能选择项, 只要掌握一定的Windows操作技能,粗通统计分 操作技能, 只要掌握一定的 操作技能 析原理, 析原理,就可以使用该软件为特定的科研工作服 务。 ? 非专业统计人员的首选统计软件! 非专业统计人员的首选统计软件!

菜单栏

市场研究

界面概览

工具栏

变量栏

数据区 数据变量切换

市场研究

变量工作区

市场研究

SPSS for Windows 的界面
一.SPSS 的主窗口
启动SPSS后,弹出对话框选项如下: 后 弹出对话框选项如下: 启动
1.Run the tutorial-浏览操作指导 浏览操作指导 2.Type in data-显示数据编辑窗口建立新数据文件 显示数据编辑窗口建立新数据文件 3.Run an existing query-运行一个已存在的文件 运行一个已存在的文件 4.Creat new query using Database Wizard-使用数据库向导建立 使用数据库向导建立 一个新的文件 5.Open an existing data source-打开一个已存在的数据文件,可 打开一个已存在的数据文件, 打开一个已存在的数据文件 选择“ 选择“.sav”文件 文件

市场研究

6.Open another type of file-打开一个已存在的 其它类型的文件 7.Don’t show this dialog in the future-再运行 SPSS系统时不显示该对话框,直接进入数据编辑窗 口 数据编辑窗口( Editor) 数据编辑窗口 ( SPSS Data Editor ) 或称数据编 辑器的左下角包括“ View”和 View” 辑器的左下角包括“Data View 和“Variable View 分别定义变量的值( 即数据) 两个视区 , 分别定义变量的值 ( 即数据 ) 和变量 (名称、类型等)。 名称、类型等)

市场研究

二.数据编辑窗口的主菜单 数据编辑窗口的主菜单
?Edit:文件编辑。 :文件编辑 View:浏览编辑。 :浏览编辑 File:文件操作。 :文件操作 Data:数据管理。 :数据管理 Transform:数据转换。 :数据转换 Analyze:统计分析。 :统计分析 Graphs:统计图表。 :统计图表 Utilities:实用程序。 :实用程序 Help:帮助。 :帮助 Windows:窗口控制。 :窗口控制

市场研究

三、 建立数据文件
(一)定义变量
选择“Variable View”项,定义变量(不要忘了保 ( 存) Name:变量名。不能超过8个字符 :变量名。不能超过 个字符 Type:变量类型。共8种类型,分别为: :变量类型。 种类型, 种类型 分别为:

市场研究

数值型变量( 数值型变量(Numeric) ) ① Numeric为 标准数值型变量:默认总长度 为 为8位,小数是2位。 为逗号型变量:位数同上。整数部 ②Comma为逗号型变量 为逗号型变量 分,从右向左,每3位一个逗号。 ③Dot为句号型变量 为句号型变量:位数同上。整数部分, 为句号型变量 从右向左,每3位一个圆点,但对小数位的分 割,应用逗号表示。

市场研究

字符串型变量( 字符串型变量( String) ) 变量的长度是任意的。 ④Scientific notation为科学计数型变量。 如原 为科学计数型变量。 为科学计数型变量 始数据1231.3表示成科学计数型为12.313E2; ⑤Dollar为美元型变量。在Comma型的基础上, 为美元型变量。 为美元型变量 增加一个美圆符号。 自定义型变量。 ⑥Custom Currency自定义型变量。机器自动提 自定义型变量 示选择方法。

市场研究

日期型变量( 日期型变量(Date) ) dd-mm-yy(日-月-年) 如06-05-04 mm-dd-yy(月-日-年) 如05-06-04 dd-mmmm(英文)-yyyy 如06-May-2004

当你选择Data类型后,系统会自动显示 类型后, 当你选择 类型后 日期类型,供你选择。 日期类型,供你选择。

市场研究

Width:数据或字符串的宽度 。 默认值为 : 数据或字符串的宽度。默认值为8 个字符。 个字符。 Decimal:小数位数。 :小数位数。 Label:变量标签。用来说明变量所代表的 :变量标签。 意义。 意义。

市场研究

Value:对变量值的进一步说明。如:1=男,2=女 :对变量值的进一步说明。 男 女 Missing:定义缺失值类型。 :定义缺失值类型。 系统遗漏值:数值变项读入了空白值或非数值数据,SPSS的 系统遗漏值 : 数值变项读入了空白值或非数值数据,SPSS的 数据表上显示“ 。 数据表上显示“.”。 自定义遗漏值:特殊的数据,自己指定一个值, 自定义遗漏值: 特殊的数据,自己指定一个值,计算机会作 为特殊值,计算时跳过。 为特殊值,计算时跳过。 Columns:定义数据在屏幕上该变量对应列的显示列宽 。 默 : 定义数据在屏幕上该变量对应列的显示列宽。 认值为8个字符 范围是1-255。 个字符, 认值为 个字符,范围是 。 Align:定义数据在单元中的对齐方式。 :定义数据在单元中的对齐方式。

市场研究

Measure:定义 度量变量类型 。 可有 : 定义度量变量类型 可有Scale、 度量变量类型。 、 Ordinal和Nominal。 和 。
Scale:可以是数值型、日期型和货币型变量,但不能是字符 :可以是数值型 日期型和货币型变量, 数值型、 串型变量 Ordinal: 可以是数值型和字符串型变量 , 一般要求 变量有 : 可以是数值型和字符串型变量, 一般要求变量有 较明显的次序 Nominal:与 Ordinal一样, 只是不要求变量有次序关系, 但 : 一样, 一样 只是不要求变量有次序关系, 要有较明显的类别

市场研究

? 定义变量属性,建立数据库文件 定义变量属性,
– 注意:变量名字母为首,后面可以跟字母和数字, 注意:变量名字母为首,后面可以跟字母和数字, 不超过8位 不能跟其他字符, 不超过 位,不能跟其他字符,关键词不能做变 量名 – 最好不用中文作变量名,兼容性不好 最好不用中文作变量名, – 注意宽度 – 标签 – 数值标签 – 缺失值

市场研究

(二)输入数据

选择“ 选择“Data View”项,输入变量数据 项 直接从数据编辑器中输入。 直接从数据编辑器中输入。 选择已存在的数据文件读入数据。 用“Open File”选择已存在的数据文件读入数据。 选择已存在的数据文件读入数据 读入数据。 用“Open Database”读入数据。 读入数据

市场研究

读入数据操作步骤如下: 用“Open File”读入数据操作步骤如下: 读入数据操作步骤如下 ① 在 SPSS 数 据 编 辑 器 中 按 照 “File→Open→Data”可打开“Open File”对话框; ② 在“Open File”对话框中打开“文件类型”下 拉列表框,选中所要读入数据的类型,根据路 径找到要读入的文件双击文件名即可。 ?常用的是读入 常用的是读入Excel数据。 数据。 常用的是读入 数据

市场研究

请将下面表格内容在SPSS数据编辑器中输入。 数据编辑器中输入。 例1 请将下面表格内容在 数据编辑器中输入
表1 药品名 滴眼液A 滴眼液A 滴眼液A 滴眼液B 产地 中国 日本 美国 美国 生产时间 2003/4/14日 2002/12/2日 2002/8/29日 2003/2/18日 价格 2.5元 2.7元 2.85元 3.2元 规格 8毫升 8毫升 8毫升 5毫升

市场研究

(三)编辑数据 1.修改数据 修改数据
找到所要修改的数据,激活(双击),修改即可。

2.插入或删除一行数据 插入或删除一行数据
插入行:点击所要插入的行号,点击工具栏(或击右 键)的“插入行Insert case”的图标(望远镜图标的后 面),就在此行增加一空行。 删除行:找到所要删除的行,选中,按Delete键。

市场研究

3.插入或删除一列(一个变量) 插入或删除一列(一个变量) 插入或删除一列
插入列:点击所要插入的列号,点击工具栏的“插 入列Insert case”的图标(望远镜图标的后面第2个), 就在此列增加一空列。 删除列:找到所要删除的列,选中,按Delete键。

在例1的数据文件中完成插入与删除的功能 例2.在例 的数据文件中完成插入与删除的功能 在例 的数据文件中完成插入与删除的功能.

市场研究

(四)保存分析结果 保存结果文件 在结果浏览窗口中选择菜单File==>Save,在 文件名框中键入“文件名”并回车即可.

市场研究

Export:选择输出的内容 选择输出的内容 Exprot File:填入输出的目标文件名 填入输出的目标文件名 Export What:选择输出结果的哪些部分 选择输出结果的哪些部分 File:选择网页格式和纯文本格式 选择网页格式和纯文本格式

将例1中保存的数据文件导出为文本文件 例5.将例 中保存的数据文件导出为文本文件 将例 中保存的数据文件导出为文本文件.

市场研究

第二讲 问卷和编码
? 对单选: 对单选:
– 顺序编码,1,2,3,4。 顺序编码, , , , 。

? 对多选: 对多选:
– 01编码,几个选项几个变量 编码, 编码 – 有限制数而多选了的,任意处理 有限制数而多选了的,

市场研究

一、问卷调查表的编码
(一)单选题问卷调查表的编码 一 1.题号代号不能重复,变量名称最好以英文字母为开头,字 题号代号不能重复,变量名称最好以英文字母为开头, 题号代号不能重复 母大小写均可。 母大小写均可。如A1,A2…;B1,B2…。 。 2.同一量表的题号最好有相同的识别码。如表1都用 1,a2…; 同一量表的题号最好有相同的识别码。如表 都用 都用a 同一量表的题号最好有相同的识别码 2都用 都用b …。 表2都用b1,b2…。 3.名义或类别变量的变量代码最好与其意义内涵有关。如年 名义或类别变量的变量代码最好与其意义内涵有关。 名义或类别变量的变量代码最好与其意义内涵有关 龄为AGE,年级为 龄为 ,年级为YEAR,工作类别为 ,工作类别为JOB等。 等 4.变量代码不要用中文字,如要加注部分变量的中文说明, 变量代码不要用中文字,如要加注部分变量的中文说明, 变量代码不要用中文字 可于SPSS操作中修改。 操作中修改。 可于 操作中修改

市场研究

(二)复选题问卷调查表的编码 问卷调查表
您的性别: 您的性别:1男生 您的职务: 您的职务:1主任 2女生 2组长 3教师

您认为目前教改阻力来自哪些单位?(可复选) 一.您认为目前教改阻力来自哪些单位?(可复选) 您认为目前教改阻力来自哪些单位?(可复选 1教育行政单位 2 1 2学校行政人员 3 3家长团体 4教师本身 5其他团体 您认为目前教改对哪些人会有影响?(可复选) 二.您认为目前教改对哪些人会有影响?(可复选) 您认为目前教改对哪些人会有影响?(可复选 1教师 2行政人员 3学生 4其他

市场研究

变量编码表
NU M

sex

job 1 2

A11 A12 A13 A14 A15 A21 A22 A23 A24 1 0 0 0 1 1 1 1 0 1 1 1 1 0 0 0 1 0

001 1 002 1

NUM-编码 问卷编号) NUM-编码(问卷编号) Sex-性别 性别 job-职务 职务

( 单选) 单选)

A11-A15代表第一题 个选项,选中者输入 ,未选中 代表第一题5个选项 选中者输入1, 代表第一题 个选项, 者输入0 者输入

市场研究

注意:
? 1、排序题: 、排序题:
? 如:您一般在什么情况下送礼(选择最经常送 您一般在什么情况下送礼( 礼的两个场合)? 两个场合 礼的两个场合)?
– (1)婚嫁 (2)生日 (3)搬迁新居 (4)探亲 (5)探病 (6)生子 (7)中国传统节日 (7) 西方传统节日 (8)其他 – 第一经常场合 第一经常场合______ 第二经常场合 第二经常场合________

? 对这样的排序题,可以按照要求,设计2个变 对这样的排序题,可以按照要求,设计 个变 第一经常场合” 第二经常场合” 量,“第一经常场合”和“第二经常场合”

市场研究

2、选多了 、
? 单选选了多项,或者限制多选超额 单选选了多项,

? 两种处理办法: 两种处理办法:
– 无效处理 – 随机处理,如:您的经济状况在学校属于 的经济状况在学校属于 – (1)□上层 (2)□中上层 (3)□中层 (4)□中下层 (5)□下层 – 同事选中 和2,那么,第一次遇到这种情况,我 同事选中1和 ,那么,第一次遇到这种情况, 就取第一个被选项, 就取第一个被选项,第二次遇到则取后一个被选 中项, 中项,减少数据的缺失和误差

市场研究

3、没选(缺失值) 、没选(缺失值)
? ? ? ? ? ? 用户缺失值(非系统缺失值),用 或者 或者9编码 用户缺失值(非系统缺失值),用0或者 编码 ), 比如:您的年龄是____岁。 □ □ 没填则为99 您的性别: □ 男 □女 没填则为0 注意与栏位有关

市场研究

? 4、不适用情况 、 ? 当碰到被调查者不适用的情况时,被调查者 不需要对这些问题进行作答,研究者可以用 8,98等来赋值,如果答案有8,可以用0代 替。 ? 5、最好有一个问卷编号,便于出错之后的 、最好有一个问卷编号, 修正 ? 请大家来看一份问卷,并试图进行编码 请大家来看一份问卷,并试图进行编码……

市场研究

市场研究

市场研究

?编码

市场研究

二、调查数据录入
? 在spss中直接录入 中直接录入
– 数据窗口输入 – 命令行输入

? 从foxpro数据库dbf文件中读取*****
– 注意降低版本

? 从excel文档中读取

30名被访者的资料: 名被访者的资料: 名被访者的资料 市场研究

市场研究

名被访者的资料: (续)30名被访者的资料: 名被访者的资料

市场研究30名被访者的资料: 名被访者的资料: (续) 名被访者的资料

市场研究

? 数据录入之后的校验
– 先用频数统计命令进行简单频数分布统计 先用频数统计命令进行简单频数分布统计 – 其他方法:if命令 其他方法: 命令

市场研究

SPSS进行基本统计分析 第三讲 用SPSS进行基本统计分析
例如: 例如:数据排序
选择采单Data→Sort Cases 将主排序变量从左面的列表框中选到Sort by框中, 并在Sort by框中选择按该变量的升序还是降序排 序.Ascending-升序,Descending-降序.

例1:某班级男生的身高数据(单位:厘米)
171 182 175 177 178 181 185 168 170 175 177 180 176 172 165 160 178 186 190 176 163 183

市场研究

SPSS输出的频数分布表 输出的频数分布表
受 教育程度
Cumulative Frequency Percent Valid Percent Percent 小学 1 6.3 6.3 6.3 初中 2 12.5 12.5 18.8 高中 2 12.5 12.5 31.3 大学 9 56.3 56.3 87.5 硕硕 2 12.5 12.5 100.0 Total 16 100.0 100.0

Valid

市场研究

分类数据的众数(算例) 分类数据的众数
某城市居民关注广告类型的频数分布 广告类型 人数 比例 频率(%) 112 0.560 56.0 商品广告 51 0.255 25.5 服务广告 9 0.045 4.5 金融广告 16 0.080 8.0 房地产广告 0.050 5.0 招生招聘广告 10 2 0.010 1.0 其它广告 200 1 100 合计

数据:分类数据 M0=商品广告

市场研究

顺序数据的众数(算例) 顺序数据的众数(算例)

甲城市家庭对住房状况评价的频数分布
回答类别 24 108 93 45 30 300 甲城市 户数(户) 非常不满意 不满意 一般 满意 非常满意 合计 百分比(%) 8 36 31 15 10 100

数据: 数据:顺序数据
M0=不满意 =

市场研究

SPSS的单变量描述统计命令 的单变量描述统计命令
一、 Frequencies: 频数分析 Analyze→Descriptive Statistics→Frequencies ?示例:美国汽车家庭保有量 示例: 示例

市场研究 变量值

频数 百分比

有效百分比

婚婚婚婚
Frequency Percent 未婚 149 11.9 已婚 1026 81.8 离婚离未离婚 15 1.2 离婚离离婚 4 .3 丧丧离未离婚 54 4.3 丧丧离离婚 6 .5 Total 1254 100.0 Valid Cumulative Percent Percent 11.9 11.9 81.8 93.7 1.2 94.9 .3 95.2 4.3 99.5 .5 100.0 100.0

累计百分比

市场研究

二、平均数分析

Analyze→Compare Means→Means ?示例:美国汽车家庭保有量 示例: 示例

市场研究

第四讲 假设检验(Hypothesis testing)
? 统计假设和检验统计量 所谓统计假设,就是关于总体分布特征的某种论断。 所谓统计假设,就是关于总体分布特征的某种论断。 记总体参数为θ,若要判断θ是否等于某已知数值 是否等于某已知数值θ 记总体参数为 ,若要判断 是否等于某已知数值 0, 则该参数假设可表示为: 则该参数假设可表示为: ? H0:θ= θ0 , H1:θ≠ θ0 其中,假设H0:θ= θ0就是所要检验的假设,称为原 假设或零假设;而假设H1:θ≠ θ0则称为对立假设或 备择假设。 ? 要检验某个假设是否正确,需根据样本所提供的 要检验某个假设是否正确, 信息来进行。 信息来进行。

市场研究

假设检验的内容
参数检验 8.2) (§8.2) 非参数检验 总体均值, 总体均值 均值差的检验 总体方差, 总体方差 方差比的检验 分布拟合检验( 8.3) 分布拟合检验(§8.3) 符号检验 秩和检验

假设检验的理论依据
假设检验所以可行, 假设检验所以可行,其理论背景为实际 推断原理, 推断原理,即“小概率原理” 小概率原理”

市场研究

假设检验的基本思路
? 假设检验的基本思路是首先对总体参数值提出 假设,然后再利用样本告知的信息去验证先前 提出的假设是否成立。如果样本数据不能够充 分证明和支持假设,则在一定概率条件下,应 拒绝该假设;相反,如果样本数据不能够充分 证明和支持假设是不成立的,则不能推翻假设 成立的合理性和真实性。上述假设检验推断过 程所依据的基本信念是小概率原理,即发生概 率很小的随机事件,在某一次特定的实验中是 几乎不可能发生的。

市场研究

? 用样本指标估计总体指标,其结论有的完全可靠, 有的只有不同程度的可靠性,需要进一步加以检 验和证实。通过检验,对样本指标与假设的总体 指标之间是否存在差别作出判断,是否接受原假 设。这里必须明确,进行检验的目的不是怀疑样 本指标本身是否计算正确,而是为了分析样本指 标和总体指标之间是否存在显著差异。从这个意 义上,假设检验又称为显著性检验。

市场研究

假设检验:先假定总体参数为 假设检验:先假定总体参数为? ,用一个随机样本的 来检验总体参数为?的假设是否成立 的假设是否成立。 统计量 x来检验总体参数为 的假设是否成立。

?

总体

x 样本

32%

?=38%

市场研究

? (或者说)假设检验:是建立在样本信息基础 假设检验: 假设检验 接受” 拒绝”假设的统计过程。 上,“接受”或“拒绝”假设的统计过程。 又称“显著性检验” (又称“显著性检验”) ? 所有这些听起来非常专业的技术,都是我们每 所有这些听起来非常专业的技术, 天在做的推理形式,只不过没有用“假设” 天在做的推理形式,只不过没有用“假设”或 参数”这些术语罢了。 “参数”这些术语罢了。
? 例如:比尔为什么开始系安全带了? 例如:比尔为什么开始系安全带了? ——直觉假设检验 直觉假设检验

市场研究

假设检验的五个基本步骤
? 1、开始陈述你相信存在于总体的事实,即总体均值和百分 、开始陈述你相信存在于总体的事实, 。(如 比尔相信只有10%的司机系安全带。) 的司机系安全带。) 率。(如,比尔相信只有 的司机系安全带 ? 2、抽取一个随机样本,然后测定样本统计量。(比尔发现 、抽取一个随机样本,然后测定样本统计量。(比尔发现 。( 他的朋友中有80%的人系安全带。) 的人系安全带。) 他的朋友中有 的人系安全带 ? 3将统计量与假设的参数进行比较。(比尔注意到 将统计量与假设的参数进行比较。(比尔注意到80%和 将统计量与假设的参数进行比较。(比尔注意到 和 10%有很大区别。) 有很大区别。) 有很大区别 ? 4、决定样本是否支持最初的假设。(观察到80%的司机系 、决定样本是否支持最初的假设。(观察到 。(观察到 的司机系 安全带的事实并不支持只有10%的人系安全带的假设。) 的人系安全带的假设。) 安全带的事实并不支持只有 的人系安全带的假设 ? 5、如果样本不支持假设,修正假设使得他与样本统计量一 、如果样本不支持假设, 。(驾驶员系安全带的事实事件发生率约为 驾驶员系安全带的事实事件发生率约为80%。) 致。(驾驶员系安全带的事实事件发生率约为 。)

市场研究

? 第一:提出原假设(记为H0) ? 第二:选择检验统计量 ? 第三:计算检验统计量观测值发生的概 率。 ? 第四:给定显著性水平,并作出统计决 策。

市场研究

假设检验的两类错误
所作判断 接受 H0 真实情况 H0 为真 H0 为假
正确 第二类错误 正确
(取伪) 取伪)

拒绝 H0
第一类错误
(弃真) 弃真)

犯第一类错误的概率通常记为 α 犯第二类错误的概率通常记为 β

市场研究

注 1?
一般,作假设检验时, 一般,作假设检验时,先控制犯第一类 尽量地小. 错误的概率α,在此基础上使 β 尽量地小.要 一般要增大样本容量. 降低 β 一般要增大样本容量. 不真时,参数值越接近真值, 越大. 当H0不真时,参数值越接近真值,β 越大.

注 2?
备择假设可以是单侧,也可以双侧. 备择假设可以是单侧,也可以双侧.

市场研究

注 3? 关于原假设与备择假设的选取

H0与H1地位应平等,但在控制犯第一类 地位应平等, 错误的概率 α 的原则下,使得采取拒 的原则下, 的决策变得较慎重, 绝H0 的决策变得较慎重,即H0 得到特
别的保护. 别的保护. 因而,通常把有把握的、 因而,通常把有把握的、有经验的结论 作为原假设, 作为原假设,或者尽可能使后果严重的 错误成为第一类错误. 错误成为第一类错误.

市场研究

任何检验方法都不能完全排除犯错 误的可能性. 误的可能性.理想的检验方法应使犯两类 错误的概率都很小, 错误的概率都很小,但在样本容量给定的 情形下,不可能使两者都很小,降低一个, 情形下,不可能使两者都很小,降低一个, 往往使另一个增大. 往往使另一个增大. 假设检验的指导思想是控制犯第一类 然后,若有必要, 错误的概率不超过α, 然后,若有必要,通 过增大样本容量的方法来减少 β .

市场研究

假设检验步骤(三部曲 三部曲) 三部曲
根据实际问题所关心的内容, 根据实际问题所关心的内容,建立H0与H1 为真时, 在H0为真时,选择合适的统计量V,由H1确 定拒绝域形式
给定显著性水平α,其对应的拒绝域 双侧检验 (V < V1? ) ∪(V > V ) 其中 (V <V ?α ) 左边检验 1
α α
2 2

右边检验

(V > Vα )

P(V >Vα ) = α

并作出相应的判断. 根据样本值计算,并作出相应的判断.

市场研究

? Compare Means 过程可计算对已知原始 数据资料情况下的单样本T检验(OneSample T Test)、独立样本T检验(IndependentSamples T Test)和配对样本T检验(PairedSamples T Test)

? 独立样本 检验:即用两个独立样本的原 独立样本T检验: 检验 始资料对两个总体均值之差进行比较 ? 独立样本 检验举例: 独立样本T检验举例 检验举例:

市场研究

? 例1:由以往资料知道,甲、乙两个煤矿蕴藏的煤 :由以往资料知道, 含灰量都服从正态分布并且有公共方差。 含灰量都服从正态分布并且有公共方差。现从两矿 各抽几个试样,分析其含灰率得( ): 各抽几个试样,分析其含灰率得(%):
? 甲矿 甲矿:24.5、21.3、23.5、22.4、27.1、18.6、19.8、20.7、 21.2、16.9 ? 乙矿 乙矿:15.7、24.9、25.1、23.2、18.8、19.0、19.9、26.1、 16.8、17.5、22.4、20.6
(a=0.05)? 问两矿所采煤的平均含灰率有无显著差异(a )?

解:依题意,设H0:u= u1 , H1: u ≠ u1 依题意,
(1)定义变量X(含灰量)和分类变量g(1,甲矿;2,乙矿) )定义变量 含灰量)和分类变量 ( ,甲矿; ,乙矿) 含灰量 (2) Analyze→Compare Means→ Independent-Samples T Test )

市场研究

单样本T检验
住房状况调查: 住房状况调查:推断家庭人均住房面积 的平均值是否为20平方米 平方米。 的平均值是否为 平方米。 →
[Analyze] ---[Compare Means]---[One-sample T test]

市场研究

两独立样本T检验
? 住房状况问卷调查:推断本市户口总体 住房状况问卷调查: 和外地户口总体的家庭人均住房面积的 平均值是否有显著性差异。 平均值是否有显著性差异。 ? [Analyze] ---[Compare Means]--[Independent-sample T test]

市场研究

两配对样本的t 检验
? 为研究某冲减肥茶是否具有明显的减肥效果, 为研究某冲减肥茶是否具有明显的减肥效果, 某美体健身机构对35 35名肥胖志愿者进行了减肥 某美体健身机构对35名肥胖志愿者进行了减肥 跟踪调查。 跟踪调查。首先将其喝减肥茶以前的体重记录 下来,三个月后再将其喝茶后的体重记录下来。 下来,三个月后再将其喝茶后的体重记录下来。 通过这两组样本的数据的对比分析, 通过这两组样本的数据的对比分析,推断减肥 茶是否具有明显的减肥作用。 茶是否具有明显的减肥作用。

? [Analyze] ---[Compare Means]---[Pairedsample T test]

市场研究

方差分析
? 在制定某商品广告宣传策略时,不同组 合的方案所获得的广告效果是不一样的。 广告效果可能会受到广告的形式、地区 规模、选择的栏目、播放的时间段、播 放的频率等因素的影响。人们需要研究 在影响广告效果的众多因素中,哪些因 素是主要的,它们是如何产生影响的, 哪些因素的搭配是最合理的,等等。 ? 这里可以用方差分析的方法进行分析。

市场研究

方差分析的原理
? 方差分析认为观测变量值的变化受两类 因素的影响:第一类是控制因素(控制 变量)不同水平所产生的影响;第三类 是随机因素(随机变量)所产生的影响。

市场研究

单因素方差分析举例
? 某企业在制定某商品的广告策略时,收集了 某企业在制定某商品的广告策略时, 该商品在不同地区采用不同广告形式促销后 的销售额数据, 的销售额数据,希望对广告形式和地区是否 对商品销售额产生影响进行分析。文件名: 对商品销售额产生影响进行分析。文件名: 广告地区与销售额” “广告地区与销售额” ? 原假设: 原假设:
– 不同广告形式没有对销售额产生显著影响;(即 不同广告形式没有对销售额产生显著影响;(即 ;( 不同广告形式对销售额的效应同时为0) 不同广告形式对销售额的效应同时为 ) – 不同地区的销售额没有显著差异。(不同地区对 不同地区的销售额没有显著差异。( 。(不同地区对 销售额的效应同时为0) 销售额的效应同时为 )

市场研究

非参数检验
(Anayze → Nonparametric Tests)

? 参数检验 如上例,利用样本统计量去测 参数检验(如上例, 如上例 试总体参数所做的假设)通常适用于一些 试总体参数所做的假设 特定的、严格的条件环境之下,其中一个 典型的条件就是样本资料必须来自于正态 样本资料必须来自于正态 分布的总体;当必要条件无法满足时 当必要条件无法满足时, 分布的总体 当必要条件无法满足时,我 非参数统计方法。 们可以采用非参数统计方法 们可以采用非参数统计方法。 ? 其中的样本一致性检验和独立性检验则是 使用Descriptive Statistics 中的Crosstabs 过程 完成的。(举例:) 。(举例 完成的。(举例:)

市场研究

例2:两种产品购买者所喜欢收看的电视节 : 目有无差异? 目有无差异?

? 某市场研究进行了一次调查,藉以找出两产品的购买 某市场研究进行了一次调查, 者所喜爱收看的电视节目, 者所喜爱收看的电视节目,从而为有关产品公司作广 告提供参考资料。 告提供参考资料。两产品购买者最喜欢收看电视节目 的人数调查结果如下: 的人数调查结果如下:根据以上资料判断两种产品的 购买者所喜欢收看的电视节目有无差异(a=0.05 )? 购买者所喜欢收看的电视节目有无差异(
电视节目 新闻 电视剧场 体育 实事论坛 音乐欣赏 娱乐游戏 戏剧园地 总计 甲产品 150 120 100 140 100 150 90 850 乙产品 110 170 80 100 130 130 110 830 总计 260 290 180 240 230 280 200 1680

市场研究

? 解:列联表,需要判断A产品和B产品购买 者所喜欢收看的电视节目是否一致,可采 用Chi-Square一致性检验方法。
(1)依题意,设 H0:两种产品购买者所喜欢的电视节目无 )依题意, 两种产品购买者所喜欢的电视节目无 差异。 差异。 H1:两种产品购买者所喜欢的电视节目无差异。 两种产品购买者所喜欢的电视节目无差异。 两种产品购买者所喜欢的电视节目无差异 过程----示例 (2)Spss过程 示例 ) 过程

市场研究

第五讲 双变量关系描述统计 (一)相关分析
1 定距 定距尺度 定距—定距尺度 (Pearson Cor.) )

1)相关的含义: )相关的含义 相关(Correlation)是用来作两个定距变量关系 相关 是用来作两个定距变量关系 的统计分析, 的统计分析,考察两变量是否存在共同变化的趋 如年龄与收入。 势。如年龄与收入。

市场研究

丈夫收入

妻子收入 580 600 620 750 650

如:
600 750 770 810 810

当两变量在同一方向上变化,称为有正相关; 当两变量在同一方向上变化,称为有正相关;相 正相关 反方向变化,称为负相关 无变化即无相关 负相关; 无相关。 反方向变化,称为负相关;无变化即无相关。 相关系数即用来表示相关的程度 即用来表示相关的程度。 相关系数即用来表示相关的程度。

市场研究

2)相关系数的计算公式: )相关系数的计算公式:

∑ ( x ? x )( y ? y ) r= ∑(x ? x ) ? ∑( y ? y )
i i 2 i i

2

由此公式可看出: 由此公式可看出: 1 相关就是共变异数的标准化。 相关就是共变异数的标准化。 2 相关系数 的取值范围在(-1,+1)之间。 相关系数r的取值范围在 的取值范围在( , )之间。 +1代表完全正相关;-1表示完全负相关;0 代表完全正相关; 表示完全负相关 表示完全负相关; 代表完全正相关 表示无相关。 表示无相关。

市场研究

示例: 示例:通过此题来演算相关系数。
丈夫收入 妻子收入 xi ? x y x
1 2 3 4 5 平均: 平均 : 600 750 770 810 810 748 580 600 620 750 650 640 -148 2 22 62 62

y ?y
i

(x ?x)?(y ? y)
i i

(x ? x)
i

2

(y ? y )
i

2

- 60 - 40 - 20 110 10 总计: 总计 :

8880 - 80 - 440 6820 620 15800

21904 4 484 3844 3844 30080

3600 1600 400 12100 100 17800 23139.2 3 r=0.683

市场研究

2 定序 定序尺度 (Spearman Cor.) 定序—定序尺度 ) 积差相关的公式: 积差相关的公式: 等级相关, 积差相关又称等级相关 用来考察两个定序变量间 积差相关又称等级相关,用来考察两个定序变量间 的相关关系。它的公式是由积矩相关转变而来, 的相关关系。它的公式是由积矩相关转变而来,

6∑ D r =1? N ( N ? 1)
2 2

其中,D是每一对因变量和自变量的序数的差值;N是总 的排序的序数。

市场研究

3. SPSS中的相关统计命令 中的相关统计命令
Statistics--Correlate—Bivariate(双变量相关分析) (双变量相关分析)

相关系数
市场研究

4 相关统计的输出格式
Correlations

AGE AGE Pearson Correlation Sig. (2-tailed) N 现现现现现现 Pearson Correlation Sig. (2-tailed) N 1.000 . 1254 -.079* .020 861

现现现现现现
-.079* .020 861 1.000 . 861

*. Correlation is significant at the 0.05 level (2-tailed).

人数

市场研究

(二)线性回归
1 、回归的含义: 回归的含义:
回归( 回归(Regression,或Linear Regression)和相 , ) 关同样都用来分析两个定距变量间的关系, 关同样都用来分析两个定距变量间的关系,但回 归有明确的因果关系假设。 归有明确的因果关系假设。即要假设一个变量为 自变量,一个为因变量, 自变量,一个为因变量,自变量对因变量的影响 就用回归表示。如年龄对收入的影响。 就用回归表示。如年龄对收入的影响。 ?由于回归构建了变量间因果关系的数学表达, 由于回归构建了变量间因果关系的数学表达, 由于回归构建了变量间因果关系的数学表达 它具有统计预测功能。 它具有统计预测功能。 有统计预测功能

市场研究

2 、回归的统计原理: 回归的统计原理: 两个定距变量的回归是用函数

y= f(x) ( )
来分析的。 来分析的。我们最常用的是一元回归方程

y = a + bx
其中x为自变量; 为因变量 为因变量; 为截距 即常量; 为截距, 其中 为自变量;y为因变量;a为截距,即常量;b 为自变量 为回归系数,表明自变量对因变量的影响程度。 为回归系数,表明自变量对因变量的影响程度。

市场研究

工资 440 430 420 410 400 390 380 370 360 0 1

Y=350+20x

2

3

4

工龄 5

市场研究

在统计学中,这一方程中的系数是靠 与 变量的 在统计学中,这一方程中的系数是靠x与y变量的 大量数据拟合出来的。 大量数据拟合出来的。

Y

Y=a+bx
(x,y)

X

市场研究

由图中可以看出,回归直线应该是到所有数据点最 由图中可以看出, 短距离的直线。该直线的求得即使用“ 短距离的直线。该直线的求得即使用“最小二乘方 法”,使:

? ∑( y ? y )
i i

2

?0

在拟合的回归直线方程中,回归系数: 在拟合的回归直线方程中,回归系数:

b

=



( x i ? x )( y

i

? y )
2



(xi ? x )

表示x每变化一个单位时, 与 共同变化的程度 表示 每变化一个单位时,x与y共同变化的程度 每变化一个单位时 共变异数)。 (共变异数)。 常数

a = y ? bx

市场研究

上学年数 工资 X Y

( x ? x ) ( x ? x ) ( y ? y) ( x ? x ) ( y ? y)
2

i

i

i

i

i

平均 总计 b 14.85241 a 472.1382

6 6 9 9 9 12 12 16 16 16 11.1

480 620 600 620 630 600 700 650 720 750 637

-5.1 -5.1 -2.1 -2.1 -2.1 0.9 0.9 4.9 4.9 4.9

26.01 26.01 4.41 4.41 4.41 0.81 0.81 24.01 24.01 24.01 138.9

-157 -17 -37 -17 -7 -37 63 13 83 113

800.7 86.7 77.7 35.7 14.7 -33.3 56.7 63.7 406.7 553.7 2063

市场研究

比如通过上学年数和工资的关系计算得出下列的 比如通过上学年数和工资的关系计算得出下列的 上学年数 回归公式: 回归公式: y=472+14.8x 就可知上学年数每增长1年 工资会增加14.8元; 就可知上学年数每增长 年,工资会增加 元 也可推测,上学年数为15年的人 年的人, 也可推测,上学年数为 年的人,工资收入应为 472 + 14.8 *15=694元。 元

市场研究

因变量

自变量
回归方式

市场研究

3、 SPSS线性回归的输出格式: 、 线性回归的输出格式: 线性回归的输出格式

每月工资=823.3-3.487年龄 年龄 每月工资
常数
a Coefficients

Model 1

Unstandardized Standardized Coefficients Coefficients Std. B Error Beta t (Constant) 823.3 63.540 12.958 年年 -3.487 1.497 -.079 -2.329

Sig. .000 .020

a. Dependent Variable: 现现现现现现

自变量 回归系数

标准化回归系数

市场研究

Statistics → Regression → Linear

4、 SPSS线性回归的统计命令 、 线性回归的统计命令

例3:人均国民收入与人均消费额的关系分析 : 现有1991-2003年某地区人均消费额与人均国民收入的数据, 年某地区人均消费额与人均国民收入的数据, 现有 年某地区人均消费额与人均国民收入的数据 试研究人均国民收入对人均消费额产生的影响。 试研究人均国民收入对人均消费额产生的影响。
年份 人均国民收入( 人均国民收入(元) 人均消费金额 (元) 年份 人均国民收 入(元) 人均消费金 额(元)

1991 1992 1993 1994 1995 1996 1997

393.8 419.14 460.86 544.11 668.29 737.73 859.97

249 267 289 329 406 451 513

1998 1999 2000 2001 2002 2003

1068.8 1169.2 1250.7 1429.5 1725.9 2099.5

643 699 713 803 947 1148

市场研究

? 解:该题属于一元线性回归问题。首先要判断 该题属于一元线性回归问题。 地区人均消费额( )和人均国民收入( ) 地区人均消费额(Y)和人均国民收入(X) 是否显著相关。 是否显著相关。
(1)绘制散点图(Graphs → Scatter….) )绘制散点图( ) (2)相关分析。( 相关分析。(Analyze →Correlation →Bivariate ) (3)线性回归分析。(Analyze →Regression →Linear ) 线性回归分析 ? 结果说明:示例 结果说明:

市场研究

汇报什么? 汇报什么?
? 假定你是一个公司的财务经理,掌握了公司的 假定你是一个公司的财务经理, 所有数据,比如固定资产 流动资金、 固定资产、 所有数据,比如固定资产、流动资金、每一笔 借贷的数额和期限、各种税费、工资支出、 借贷的数额和期限、各种税费、工资支出、原 料消耗、产值、利润、折旧、职工人数、 料消耗、产值、利润、折旧、职工人数、职工 的分工和教育程度等等。 的分工和教育程度等等。 ? 如果让你向上面介绍公司状况,你能够把这些 如果让你向上面介绍公司状况, 原封不动地摆出去吗? 指标和数字都原封不动地摆出去吗 指标和数字都原封不动地摆出去吗? ? 当然不能。 当然不能。 ? 你必须要把各个方面作出高度概括,用一两个 你必须要把各个方面作出高度概括, 指标简单明了地把情况说清楚。 指标简单明了地把情况说清楚。

市场研究

主成分分析
? 每个人都会遇到有很多变量的数据。 每个人都会遇到有很多变量的数据。 很多变量的数据 ? 比如全国或各个地区的带有许多经济和社会变 量的数据; 各个学校的研究、 教学等各种变量 量的数据 ; 各个学校的研究 、 的数据等等。 的数据等等。 ? 这些数据的共同特点是变量很多 , 在如此多的 这些数据的共同特点是变量很多, 变量之中, 有很多是相关的。 变量之中 , 有很多是相关的 。 人们希望能够找 出它们的少数 代表”来对它们进行描述。 少数“ 出它们的少数“代表”来对它们进行描述。 ? 介绍两种把变量维数降低以便于描述 、 理解和 介绍两种把变量维数降低以便于描述、 分 析 的 方 法 : 主 成 分 分 析 ( principal component analysis ) 和 因 子 分 析 ( factor analysis) 实际上主成分分析可以说是因子 analysis ) 。 实际上 主成分分析可以说是因子 分析的一个特例。 在引进主成分分析之前, 分析的一个特例 。 在引进主成分分析之前 , 先 看下面的例子。 看下面的例子。

市场研究

成绩数据( 成绩数据(student.sav) )
? 100个学生的数学、物理、化学、语文、历 个学生的数学、物理、化学、语文、 个学生的数学 英语的成绩如下表(部分) 史、英语的成绩如下表(部分)。

市场研究

从本例可能提出的问题
? 目前的问题是 , 能不能把这个数据的6 目前的问题是,能不能把这个数据的6 个变量用一两个综合变量来表示呢? 个变量用一两个综合变量来表示呢? ? 这一两个综合变量包含有多少原来的信 息呢? 息呢? ? 能不能利用找到的综合变量来对学生排 序呢? 序呢?这一类数据所涉及的问题可以推 广到对企业,对学校进行分析、排序、 广到对企业,对学校进行分析、排序、 判别和分类等问题。 判别和分类等问题。

市场研究

主成分分析与因子分析的概念
? 需要与可能:在各个领域的科学研究中,往往需要对反 需要与可能:在各个领域的科学研究中, 映事物的多个变量进行大量的观测, 映事物的多个变量进行大量的观测,收集大量数据以便 进行分析寻找规律。 进行分析寻找规律。多变量大样本无疑会为科学研究提 供丰富的信息, 供丰富的信息,但也在一定程度上增加了数据采集的工 作量,更重要的是在大多数情况下, 作量,更重要的是在大多数情况下,许多变量之间可能 存在相关性而增加了问题分析的复杂性, 存在相关性而增加了问题分析的复杂性,同时对分析带 来不便。如果分别分析每个指标,分析又可能是孤立的, 来不便。如果分别分析每个指标,分析又可能是孤立的, 而不是综合的。盲目减少指标会损失很多信息, 而不是综合的。盲目减少指标会损失很多信息,容易产 生错误的结论。因此需要找到一个合理的方法, 生错误的结论。因此需要找到一个合理的方法,减少分 析指标的同时,尽量减少原指标包含信息的损失, 析指标的同时,尽量减少原指标包含信息的损失,对所 收集的资料作全面的分析。 收集的资料作全面的分析。由于各变量间存在一定的相 关关系, 关关系,因此有可能用较少的综合指标分别综合存在于 各变量中的各类信息。 各变量中的各类信息。 ? 主成分分析与因子分析就是这样一种降维的方法。 主成分分析与因子分析就是这样一种降维的方法。

市场研究

? 主成分分析与因子分析是将多个实测变 量转换为少数几个不相关的综合指标的 多元统计分析方法 ? 直线综合指标往往是不能直接观测到的, 直线综合指标往往是不能直接观测到的, 但它更能反映事物的本质。因此在医学、 但它更能反映事物的本质。因此在医学、 心理学、 心理学、经济学等科学领域以及社会化 生产中得到广泛的应用。 生产中得到广泛的应用。

市场研究

? Thanks for your attention.


相关文章:
统计分析与SPSS应用教案
统计分析与SPSS应用教案 - 第一章 统计学及 SPSS 概述 教学重点:本章是全课程的总纲,主要讲述统计学的含义、统计的作用和 统计学的基本概念以及 SPSS 的基本...
统计分析与SPSS应用 试题(终稿)
统计分析与SPSS应用 试题(终稿)_数学_自然科学_专业...(学期/年论文)七八 总分 试卷内容一、论文题目:...打包后按以下方式命名:专业学号姓名,如财务管理 ...
0544SPSS统计分析与应用
统计分析| 0544SPSS统计分析与应用_远程、网络教育_成人教育_教育专区。北师大网络教育SPSS统计分析与应用作业答案 SPSS 运行管理方式不包括( )。 完全窗口菜单运行管...
统计分析与spss的应用第三版 第10章课后习题详细答...
统计分析与 spss应用(第三版) 第 10 章课后习题详细 答案 1、 (1) 聚类分析的第 1 步,1 号样本(广西瑶族)和 3 号样本(广西侗族)聚为一小类,它们 ...
SPSS数据分析的统计方法选择
SPSS数据分析的统计方法选择_计算机软件及应用_IT/计算机_专业资料。数据分析的...可以用 Spearman 相关系 数进行统计分析 七、 回归分析 1.直线回归:如果回归...
《SPSS统计分析与应用》作业一
SPSS统计分析与应用》作业一_管理学_高等教育_教育专区。北师大网络教育作业 ...SPSS统计分析方法及应用... 26页 1下载券 SPSS第章 统计分析方法... ...
《统计分析与SPSS的应用(第五版)》课后练习答案(第...
统计分析与 SPSS应用(第五版) 》 (薛薇) 课后练习答案 第 10 章 SPSS 的聚类分析 1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校...
统计分析与SPSS的应用学生复习题
统计分析与SPSS应用学生复习题_经济学_高等教育_教育专区。1、 SPSS 的数据...常用的相关分析方 法:二元定距变量的相关分析、二元定序变量的相关分析、偏相关...
SPSS软件个人实训报告
进行统计分析并解决实际问题, 做到理论联系实际并掌握统计软件SPSS使用方法。...不少于3000字,要求文字分析、数据计算 与运用统计图或统计表相结合,图文并茂...
《统计分析与SPSS的应用(第五版)》课后练习答案(第...
统计分析与 SPSS应用(第五版) 》 (薛薇) 课后练习答案 第 8 章 SPSS 的相关分析 1、对 15 家商业企业进行客户满意度调查,同时聘请相关专家对这 15 ...
更多相关标签: