当前位置:首页 >> 数学 >>

1.2


两种变量:
?定量变量:体重、身高、温度、考试成绩等等。 ? 变量 ?分类变量:性别、是否吸烟、是否患肺癌、 ? 宗教信仰、国籍等等。 ?

研究两个变量的相关关系:
?定量变量——回归分析(画散点图、相关系数r、 ? 变量 ? 相关指数R 2、残差分析) ?分类变量—— 独立性检验 ?

分类变量:变量的不同”值”

表示个体所属的不同 类别. 如:性别,是否吸烟,宗教信仰,国籍等 日常生活中我们关心这样一些问题: 1. 吸烟与患肺癌之间有无关系? 2. 秃顶与心脏病之间有无关系? 3. 性别与喜欢数学课之间有无关系? 以上问题能否用回归分析的知识来解决?为 什么?

列联表:两个分 例1.为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的 类变量的频数表
调查了9965人,得到如下结果:

不吸烟 吸烟 总计

不患肺癌 7775 2099 9874

患肺癌 42 49 91

总计 7817 2148 9965

比例 0.54% 2.28%

问:吸烟是否对患肺癌有影响? 解 从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的可 能存在差异,我们再通过不同的图表来分析

三维柱形图

不吸烟 吸烟 总计

不患肺癌 7775 2099 9874

患肺癌 42 49 91

总计 7817 2148 9965

8000 7000 6000 5000 4000 3000 2000 1000 0

不吸烟 吸烟 不患肺癌
患肺癌

二维条形图

9000 8000 7000 6000 5000 4000 3000 2000 1000 0 不吸烟 吸烟 患肺癌 不患肺癌

等 高 条 形 图

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 不吸烟 吸烟

患肺癌 不患肺癌

上面我们通过图形的分析,初步判断吸烟与患 肺癌有关系。那么,事实是否如此呢?我们需 要用统计的观点来考察这个问题

我们首先设基本事件为: H0:吸烟与患肺癌没有关系
我们下面就一般关系做一个推断

不吸烟 吸烟 总计

不患肺癌 a c a+c

患肺癌 b d b+d

总计 a+b c+d a+b+c+d

如果吸烟与患肺癌没有关系,则:

a c ? a?b c?d

a(c+d)≈c(a+b)

ad-bc≈0

因此,| ad-bc |越小,说明吸烟与患肺炎之间没有关系。

为了使样本空间有一定的代表性,我们引入一个随机变量

n(ad ? bc) K ? (a ? b)(c ? d )(a ? c)(b ? d )
2 2

总计的四项

(n=a+b+c+d(样本容量))

若,H0成立,(吸烟与患肺癌无关)则K应该很小,通过计 算我们可以得到K的观测值: k=K2=56.632

表1-12
P(K2≥k) K。
0.50 0.455 0.40 0.708 0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.82 8

说明:根据统计学家的分析: P(K2≥10.828)≈0.001

P( K 2 ? k )

0.50

0.40

0.25

0.15

0.10

0.05

0.025 0.010 0.005

0.001

k

0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

(1)如果k ? 10.828, 就有99.9%的把握认为" X 与Y 有关系" (2)如果k ? 7.879, 就有99.5%的把握认为" X 与Y 有关系" (3)如果k ? 6.635, 就有99%的把握认为" X 与Y 有关系" (4)如果k ? 5.024, 就有97.5%的把握认为" X 与Y 有关系" (5)如果k ? 3.841, 就有95%的把握认为" X 与Y 有关系" (6)如果k ? 2.706, 就有90%的把握认为" X 与Y 有关系" (7)如果k ? 2.706, 就认为没有充分的证据显示 " X 与Y
有关系"

上面的利用K2来检验“两个变量有 关系”的方法成为:独立性检验

?

说明: 两个变量X与Y独立性检验的一般方法: 1.设两个变量的值域分别为{x1,x2}{y1.,y2},列频数列联表
x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d

2.假设“X与Y无关” 3.计算变量X与Y的评判标准K2的观测值 4.利用统计概率表1-12查阅发生的概率 5.得出概率结论

例1.在研究某种新药对小白兔的防治效果时,得到下表 数据: 存活数 死亡数 总计
未用新药 用新药 总计 101 129 230 38 20 58 139 149 288

试分析新药对防治小白兔是否有效? 解:假设“新药对防治小白兔无效” 根据列联表中的数据,得到的 K 观测值k为
2

288 ? ?101? 20 ? 38 ?129 ? k? ? 8.658 ? 7.879 139 ?149 ? 230 ? 58
2

99.5%的把握判定新药对防治小白兔是有效的.

例2.某心脏病医院为了研究秃顶是否与 心脏病有关,对665名男性心脏和772名 其他病人做了研究,是否可以以99%的 把握认为秃顶与心脏病有关? 智 慧 的 闪 光

患心脏病 214 秃顶 不秃顶 451 665 总计

!

不患心脏病 175 597 772

总计 389 1048 1437

秃顶 不秃顶 总计

患心脏病 214 451 665

患其他病 175 597 772

总计 389 1048 1437

解:假设“秃顶与患心脏病无关”
根据列联表中的数据, 得K 的观测值为 1437 ? ? 214 ? 597 ? 175 ? 451? k? ? 16.373 ? 6.635 389 ?1048 ? 665 ? 772
2 2

所以有99%的把握认为”秃顶与患心脏病有关”

? 秃顶=心脏病
研究人员表示,掉头发在很大程度上 是由日渐增大的工作压力、不能充分 休息、不正确饮食和睡眠不足等因素 引起的。在接受调查的人群中,有 41%的受秃头威胁的人表示,他们一 日睡觉时间不足4小时

一般地, 假设有两个分类变量X 和Y , 它们的值域分别为 {x1 , x2 }和{ y1 , y2 }, 其样本频数列联表(称为2 ? 2列联表)为 : y2 y1 总计 x1 a b a+b x2 c d c+d
总计 a+c b+d a+b+c+d

若要推断的结论为H1:”X与Y有关系”,可如下操作: 1.通过三维柱形图和二维条形图,可以粗略地判断两个 变量是否有关系,但是这种判断不精确.

x1 x2
总计

y1
a c a+c

y2
b d b+d

总计 a+b c+d a+b+c+d 不吸烟 吸烟 总计

不患肺癌
a c a+c

患肺癌
b d b+d

总计
a+b c+d a+b+c+d

8000 7000 6000

a
主对角线

5000 4000 副对角线 3000 2000 1000 0 不患肺癌

c

d
患肺癌

b

不吸烟 吸烟

(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与 副对角线上两个柱形高度的乘积bc相差越大,H1成立的 可能性就越大

x1 x2
总计
9000 8000 7000 6000 5000 4000 3000 2000 1000 0

y1
a c a+c

y2
b d b+d

总计 a+b c+d a+b+c+d
患肺癌 不患肺癌

不患肺癌
不吸烟 吸烟 总计 a c a+c

患肺癌
b d b+d

总计
a+b c+d a+b+c+d

b

满足条件X ? x1的个体中 具有Y ? y1的个体所占的

a

d c
吸烟

a 比例为 a?b 满足条件X ? x2的个体中 具有Y ? y1的个体所占的 c 比例为 c?d

不吸烟

(2)在二维条形图中,两个比例的值相差越大,H1成立的可能 性就越大

2.利用独立性检验来考察两个分类变量是否有关系, 并且能较精确地给出这种判断的可靠程度. 具体做法是: 根据观测数据计算由

n ? ad ? bc ? K ? ? a ? b ?? c ? d ?? a ? c ?? b ? d ?
2 2

其中n ? a ? b ? c ? d为样本容量

给出的随机变量K2的值k,其值越大,说明”X与Y有关系” 成立的可能性越大.当得到的观测数据a,b,c,d都不小于 5时,可以通过查表来断言”X与Y有关系”的可信程度


相关文章:
1.1.2 量 词
1.1.2 量词_法律资料_人文社科_专业资料。1.1.2 一、基础过关 1.下列命题: ①中国公民都有受教育的权利; ②每一个中学生都要接受爱国主义教育; ③有人既...
1、2
12_育儿理论经验_幼儿教育_教育专区。任务 1 (1)浏览我校图书馆的所有电子文献资源。 (2)确定我校化学化工类图书馆藏位置、分类号范围。 位于图书馆三楼科技...
1和2位是反义词的成语
12位是反义词的成语_语文_小学教育_教育专区。1 和 2 位是反义词的成语: 悲喜交加 黑白分明 功败垂成 进退两难 进退维谷 轻重缓急 轻重倒置 生死存亡 生死...
1,2-丙二醇
1,2-丙二醇本标准适用于环氧丙烷法制得的丙二醇产品。 分子式:CH3CHOHCH2OH 分子量:76.10 、技术要求 工业用丙二醇应符合下列要求 指标指标项目项目 级品 ...
体育、艺术2+1项目解读
体育、艺术 2+1 项目”解读 2004 年 8 月 17 日,教育部办公厅向各省、自治区、直辖市教育 厅(教委) ,新疆生产建设兵团教育局,全国中小学课外文体活动工 程...
七年级上册数学第一章1.2练习
A.1 个 B.2 个 C .3 个 D.4 个 3、有理数 a 在数轴上对应的点上如图所示,则 a,-a,-1 的大小关系是( ) a -1 0 A.-a< a<-1 B.-a<-...
1寸2寸及各种证件照片标准尺寸像素
整理如下: 1 寸 2 寸电子版照片标准尺寸 1寸 打印尺寸 25×35(mm) 像素 295×413(px) 2寸 打印尺寸 35×49(mm) 像素 413×626(px) 英寸=72pt(点...
1.2 因动点产生的全等三角形答案
(1)小聪在研究图形时发现图中除等腰直角三角形外,还有几对三角形全等.请你写出其中三对全等三 角形,并选择其中对全等三角形证明; (2)小明在研究过程中连接 ...
1.2.3相反数 教案
1.2.3相反数 教案_数学_初中教育_教育专区。《1.2.3 相反数》教案七(1)班教材:人教版《义务教育课程标准实验教科书●数学》七年级上册 课题:1.2.3 相反...
红对勾 1-1-2
红对勾 1-1-2_高一理化生_理化生_高中教育_教育专区。红对勾 1-1-2 课后作业限时:45 分钟 总分:100 分、选择题(每小题 4 分,共 48 分,每小题只有...
更多相关标签:
2 | 1.4 | 0.2 | 1.5 | 1.2t | 1.6 | 1 | 1.8 |