当前位置:首页 >> 数学 >>

1.2


两种变量:
?定量变量:体重、身高、温度、考试成绩等等。 ? 变量 ?分类变量:性别、是否吸烟、是否患肺癌、 ? 宗教信仰、国籍等等。 ?

研究两个变量的相关关系:
?定量变量——回归分析(画散点图、相关系数r、 ? 变量 ? 相关指数R 2、残差分析) ?分类变量—— 独立性检验 ?

分类变量:变量的不同”值”

表示个体所属的不同 类别. 如:性别,是否吸烟,宗教信仰,国籍等 日常生活中我们关心这样一些问题: 1. 吸烟与患肺癌之间有无关系? 2. 秃顶与心脏病之间有无关系? 3. 性别与喜欢数学课之间有无关系? 以上问题能否用回归分析的知识来解决?为 什么?

列联表:两个分 例1.为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的 类变量的频数表
调查了9965人,得到如下结果:

不吸烟 吸烟 总计

不患肺癌 7775 2099 9874

患肺癌 42 49 91

总计 7817 2148 9965

比例 0.54% 2.28%

问:吸烟是否对患肺癌有影响? 解 从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的可 能存在差异,我们再通过不同的图表来分析

三维柱形图

不吸烟 吸烟 总计

不患肺癌 7775 2099 9874

患肺癌 42 49 91

总计 7817 2148 9965

8000 7000 6000 5000 4000 3000 2000 1000 0

不吸烟 吸烟 不患肺癌
患肺癌

二维条形图

9000 8000 7000 6000 5000 4000 3000 2000 1000 0 不吸烟 吸烟 患肺癌 不患肺癌

等 高 条 形 图

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 不吸烟 吸烟

患肺癌 不患肺癌

上面我们通过图形的分析,初步判断吸烟与患 肺癌有关系。那么,事实是否如此呢?我们需 要用统计的观点来考察这个问题

我们首先设基本事件为: H0:吸烟与患肺癌没有关系
我们下面就一般关系做一个推断

不吸烟 吸烟 总计

不患肺癌 a c a+c

患肺癌 b d b+d

总计 a+b c+d a+b+c+d

如果吸烟与患肺癌没有关系,则:

a c ? a?b c?d

a(c+d)≈c(a+b)

ad-bc≈0

因此,| ad-bc |越小,说明吸烟与患肺炎之间没有关系。

为了使样本空间有一定的代表性,我们引入一个随机变量

n(ad ? bc) K ? (a ? b)(c ? d )(a ? c)(b ? d )
2 2

总计的四项

(n=a+b+c+d(样本容量))

若,H0成立,(吸烟与患肺癌无关)则K应该很小,通过计 算我们可以得到K的观测值: k=K2=56.632

表1-12
P(K2≥k) K。
0.50 0.455 0.40 0.708 0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.82 8

说明:根据统计学家的分析: P(K2≥10.828)≈0.001

P( K 2 ? k )

0.50

0.40

0.25

0.15

0.10

0.05

0.025 0.010 0.005

0.001

k

0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

(1)如果k ? 10.828, 就有99.9%的把握认为" X 与Y 有关系" (2)如果k ? 7.879, 就有99.5%的把握认为" X 与Y 有关系" (3)如果k ? 6.635, 就有99%的把握认为" X 与Y 有关系" (4)如果k ? 5.024, 就有97.5%的把握认为" X 与Y 有关系" (5)如果k ? 3.841, 就有95%的把握认为" X 与Y 有关系" (6)如果k ? 2.706, 就有90%的把握认为" X 与Y 有关系" (7)如果k ? 2.706, 就认为没有充分的证据显示 " X 与Y
有关系"

上面的利用K2来检验“两个变量有 关系”的方法成为:独立性检验

?

说明: 两个变量X与Y独立性检验的一般方法: 1.设两个变量的值域分别为{x1,x2}{y1.,y2},列频数列联表
x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d

2.假设“X与Y无关” 3.计算变量X与Y的评判标准K2的观测值 4.利用统计概率表1-12查阅发生的概率 5.得出概率结论

例1.在研究某种新药对小白兔的防治效果时,得到下表 数据: 存活数 死亡数 总计
未用新药 用新药 总计 101 129 230 38 20 58 139 149 288

试分析新药对防治小白兔是否有效? 解:假设“新药对防治小白兔无效” 根据列联表中的数据,得到的 K 观测值k为
2

288 ? ?101? 20 ? 38 ?129 ? k? ? 8.658 ? 7.879 139 ?149 ? 230 ? 58
2

99.5%的把握判定新药对防治小白兔是有效的.

例2.某心脏病医院为了研究秃顶是否与 心脏病有关,对665名男性心脏和772名 其他病人做了研究,是否可以以99%的 把握认为秃顶与心脏病有关? 智 慧 的 闪 光

患心脏病 214 秃顶 不秃顶 451 665 总计

!

不患心脏病 175 597 772

总计 389 1048 1437

秃顶 不秃顶 总计

患心脏病 214 451 665

患其他病 175 597 772

总计 389 1048 1437

解:假设“秃顶与患心脏病无关”
根据列联表中的数据, 得K 的观测值为 1437 ? ? 214 ? 597 ? 175 ? 451? k? ? 16.373 ? 6.635 389 ?1048 ? 665 ? 772
2 2

所以有99%的把握认为”秃顶与患心脏病有关”

? 秃顶=心脏病
研究人员表示,掉头发在很大程度上 是由日渐增大的工作压力、不能充分 休息、不正确饮食和睡眠不足等因素 引起的。在接受调查的人群中,有 41%的受秃头威胁的人表示,他们一 日睡觉时间不足4小时

一般地, 假设有两个分类变量X 和Y , 它们的值域分别为 {x1 , x2 }和{ y1 , y2 }, 其样本频数列联表(称为2 ? 2列联表)为 : y2 y1 总计 x1 a b a+b x2 c d c+d
总计 a+c b+d a+b+c+d

若要推断的结论为H1:”X与Y有关系”,可如下操作: 1.通过三维柱形图和二维条形图,可以粗略地判断两个 变量是否有关系,但是这种判断不精确.

x1 x2
总计

y1
a c a+c

y2
b d b+d

总计 a+b c+d a+b+c+d 不吸烟 吸烟 总计

不患肺癌
a c a+c

患肺癌
b d b+d

总计
a+b c+d a+b+c+d

8000 7000 6000

a
主对角线

5000 4000 副对角线 3000 2000 1000 0 不患肺癌

c

d
患肺癌

b

不吸烟 吸烟

(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与 副对角线上两个柱形高度的乘积bc相差越大,H1成立的 可能性就越大

x1 x2
总计
9000 8000 7000 6000 5000 4000 3000 2000 1000 0

y1
a c a+c

y2
b d b+d

总计 a+b c+d a+b+c+d
患肺癌 不患肺癌

不患肺癌
不吸烟 吸烟 总计 a c a+c

患肺癌
b d b+d

总计
a+b c+d a+b+c+d

b

满足条件X ? x1的个体中 具有Y ? y1的个体所占的

a

d c
吸烟

a 比例为 a?b 满足条件X ? x2的个体中 具有Y ? y1的个体所占的 c 比例为 c?d

不吸烟

(2)在二维条形图中,两个比例的值相差越大,H1成立的可能 性就越大

2.利用独立性检验来考察两个分类变量是否有关系, 并且能较精确地给出这种判断的可靠程度. 具体做法是: 根据观测数据计算由

n ? ad ? bc ? K ? ? a ? b ?? c ? d ?? a ? c ?? b ? d ?
2 2

其中n ? a ? b ? c ? d为样本容量

给出的随机变量K2的值k,其值越大,说明”X与Y有关系” 成立的可能性越大.当得到的观测数据a,b,c,d都不小于 5时,可以通过查表来断言”X与Y有关系”的可信程度


相关文章:
1寸2寸及各种证件照片标准尺寸像素
整理如下: 1 寸 2 寸电子版照片标准尺寸 1寸 打印尺寸 25×35(mm) 像素 295×413(px) 2寸 打印尺寸 35×49(mm) 像素 413×626(px) 英寸=72pt(点...
模拟试卷二(答案) (1)
? ? ? 7 9 7 9 7 9 7 9 7 9 9 (2)记 D={有一只蓝球,一只白球},而且知 D= A1B3+A3B1 两种情况互斥 P( D) ? P( A1 B3 ) ? P( A3 ...
大学物理1-1测试题及答案(1,2)
a 下述判断正确的是( C ) (A) [1]、[4]正确 (B) [2]、[4]正确 (C) [3]、[4]正确 (D) 只有[3]正确 (3)在升降机天花板上拴有轻绳,其下端系...
数字信号处理-原理与实践(方勇)习题答案(1-2)
数字信号处理-原理与实践(方勇)习题答案(1-2)_理学_高等教育_教育专区。第1-1个连续信号 xa (t ) ? cos(2?ft ? ? ) ,式中 f ? 20Hz ...
1.2.1有理数练习题
1.2.1有理数练习题_IT认证_资格考试/认证_教育专区。1.2.1 有理数练习 学习目标:掌握有理数的概念。 有理数的分类: ? ? ___ ? ? ?整数 ?0 ? ?...
2+1计划
“​体​育​、​艺​术​2​+​1​项​目​”​,​根​据​学​校​的​硬​件​实​施​,​结​合​我​...
现代大学英语精读2_unit1-2 课后翻译
现代大学英语精读2_unit1-2 课后翻译_英语学习_外语学习_教育专区。Unit 1 课后习题翻译: 1、 我们像在暖房里种花那样养孩子是错误的。 我们必须让他们 接触...
高中数学文科选修1-2知识点总结2_图文
高中数学文科选修1-2知识点总结2_数学_高中教育_教育专区。高中数学选修 1-2 知识点总结第章 统计案例 1.线性回归方程 ①变量之间的两类关系:函数关系与相关...
电力电子实验-2(1)
DDB She et of Dra wn By : 4 图 1-2 电流变送器与过流保护原理图 3.零速封锁器(DZS)零速封锁器的作用是当调速系统处于静车状态, 即速度给定电压为零...
有机化学基础1.2.2
有机化学基础1.2.2_数学_小学教育_教育专区。博兴二中高二化学导学案 第 2 节 有机化合物的结构与性质 主备人 刘晓芳 审核 李周平 学习目标:掌握有机化合物...
更多相关标签:
2 | 1.4 | 0.2 | 1.5 | 1.2t | 1.6 | 1 | 1.8 |