当前位置:首页 >> 数学 >>

第一章 统计案例(教师版)


用孔子的教育思想来润泽每一个孩子

第一章 统计案例 1.1 回归分析的基本思想及其初步应用 (1)函数关系是一种确定关系, 相关关系式一种非确定关系, 回归分析是研究相关关系的常 用方法 ^ ^ ^ (2)回归直线方程: y=bx+a,其中:

x?

_

1 n ? xi n x ?1
n ?

y?

_

1 n ? yi n y ?1

变量样本点中心:( x , y ),回归直线过样本点的中心.

b?

?

? ( x ? x )( y
i ?1 i n ? i ?1 i

i

? y)
2

?

? ( x ? x)

a ? y? b x

?

?

? ?

(3)线性回归模型:y=bx+a+e,其中 e 称为随机误差,a 和 b 是模型的未知参数,自变量

x 称为解释变量,因变量 y 称为预报变量.
(4)残差 残差 ^ ^ 对于样本点(xi,yi)(i=1,2,?,n)的随机误差的估计值ei=yi-yi,称为 相应于点(xi,yi)的残差 残差图 残差 图法 残差平 方和 利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编 号,或身高数据,或体重估计值等,这样作出的图形称为残差图 残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这 样的带状区域的宽度越窄,说明模型拟合精度越高 残差平方和为
n

? ( yi ? y) ,残差平方和越小,模型拟合效果越好
i ?1
? 2

n

?

2

相关指 数R
2

R2 ? 1?

? ( yi ? y)
i ?1 n

? ( y ? y)
i ?1 i

?

2

R2 表示解释变量对预报变量变化的贡献率, R2 越接近
于 1,表示回归的效果越好

(5)回归分析的过程: (1)随机抽取样本,确定数据,形成样本点; (2)由样本点形成散点图,判断是否具有线性相关关系; (3)由最小二乘法确定线性回归方程; (4)由回归方程观察变量的取值及变化趋势. 例 1 某运动员训练次数与运动成绩之间的数据关系如下:
子润教育 电话:82097089 18925955199 1

用孔子的教育思想来润泽每一个孩子

次数(x) 成绩(y)

30 30

33 34

35 37

37 39

39 42

44 46

46 48

50 51

(1)作出散点图; (2)求出线性回归方程; (3)作出残差图,并说明模型的拟合效果; (4)计算 R ,并说明其含义. 【解】 (1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示.
2

(2)可求得 x =39.25, y =40.875, ?xi=12 656, ?yi=13 731, ?xiyi=13 180,
2 2

8

8

8

i=1

i=1

i=1

?
^ ∴b=
i=1

8

xi- x
8

yi- y


?xiyi-8 x y
i=1

8

^ ^ ≈1.041 5,a= y -b x =-0.003
i-8 x ?x2 i=1
8 2

?
i=1

xi- x

2

875, ^ ∴线性回归方程为y=1.041 5x-0.003 875. (3)作残差图如图所示, 由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适. (4)相关指数 R =0.985 5.说明了该运动员的成绩的差异有 98.55%的可能性是由训练次 数引起的.
2

【追踪训练】1.已知 x 和 y 之间的一组数据

x y

0 1

1 3

2 5

3 7 ( )

^ ^ ^ 则 y 与 x 的线性回归方程y=bx+a必过点 A.(2,2) 3 B.( ,0) 2 C.(1,2)

3 D.( ,4) 2 D

1 3 1 ∵ x = (0+1+2+3)= , y = (1+3+5+7)=4,.【答案】 4 2 4 2.在回归分析中,相关指数 R 的值越大,说明残差平方和( A.越大 B.越小
2

)

C.可能大也可能小 D.以上均错

子润教育 电话:82097089

18925955199

2

用孔子的教育思想来润泽每一个孩子

?
i=1

n

yi-yi

^

2

∵R =1-

2

?
i=1

n

^ 2 2 ,∴当 R 越大时,? (yi-yi) 越小,即残差平方和越小. 【答案】

n

yi- y

2

i=1

B ^ 3. 设变量 y 对 x 的线性回归方程为y=2-2.5x, 则变量 x 每增加一个单位时, y 平均( A.增加 2.5 个单位 C.减少 2.5 个单位 B.增加 2 个单位 D.减少 2 个单位 )

^ 解析 回归直线的斜率b=-2.5,表示 x 每增加一个单位,y 平均减少 2.5 个单位. C 4.设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系,根据一组样本 ^ 数据(xi,yi)(i=1,2,?,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列 结论中不正确 的是( ... ) B.回归直线过样本点的中心( x , y )

A.y 与 x 具有正的线性相关关系

C.若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kg D.若该大学某女生身高为 170 cm,则可断定其体重必为 58.79 kg 【解析】 由于线性回归方程中 x 的系数为 0.85,因此 y 与 x 具有正的线性相关关系,故 A 正确.又线性回归方程必过样本中心点( x , y ),因此 B 正确.由线性回归方程中系数的 意义知,x 每增加 1 cm,其体重约增加 0.85 kg,故 C 正确.当某女生的身高为 170 cm 时, 其体重估计值是 58.79 kg,而不是具体值,因此 D 不正确.【答案】 D
2

5.在判断两个变量 y 与 x 是否相关时,选择了 4 个不同的模型,它们的相关指数 R 分别为: 模型 1 的相关指数 R 为 0.98,模型 2 的相关指数 R 为 0.80,模型 3 的相关指数 R 为 0.50, 模型 4 的相关指数 R 为 0.25.其中拟合效果最好的模型是( A.模型 1 B.模型 2 C.模型 3
2 2 2 2 2

)

D.模型 4
2

【解析】 相关指数 R 能够刻画用回归模型拟合数据的效果,相关指数 R 的值越接近于 1, 说明回归模型拟合数据的效果越好.【答案】 6.下列命题正确的有________. ①在线性回归模型中,e 是 bx+a 预报真实值 y 的随机误差,它是一个可观测的量; ②残差平方和越小的模型,拟合的效果越好; ③用 R 来刻画回归方程,R 越小,拟合的效果越好; ④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适, 若带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高. 【解析】 对于①随机误差 e 是一个不可观测的量,③R 越趋于 1,拟合效果越好,故
子润教育 电话:82097089 18925955199 3
2 2 2

A

用孔子的教育思想来润泽每一个孩子

①③错误.对于②残差平方和越小,拟合效果越好,同理当残差点比较均匀地落在水平的带 状区域时,拟合效果越好,故②④正确. 【答案】 ②④

x y

14 12

16 10

18 7

20 5

22 3

8.已知某种商品的价格 x(元)与需求量 y(件)之间的 关系有如下一组数据:

求 y 关于 x 的回归直线方程,并说明回归模型拟合效果的好坏. 【自主解答】
5

x = (14+16+18+20+22)=18, y = (12+10+7+5+3)=7.4,
660, ?xiyi=14×12+16×10+18×7+20×5+22×3=
i=1
5

1 5

1 5

2 2 2 2 2 i=14 +16 +18 +20 +22 =1 ?x2

i=1

?xiyi-5 x y
^ 620,所以b=
i=1 i-5 x ?x2 i=1
5

5

620-5×18×7.4 ^ = 2 =-1.15,a=7.4+1.15×18=28.1, 1 660-5×18
2

^ 所以所求回归直线方程是y=-1.15x+28.1.列出残差表:

yi-yi yi- y

^

0 4.6

0.3 2.6

-0.4 -0.4

-0.1 -2.4

0.2 -4.4 ^

?
^ 2 2 2 所以 ? (yi-yi) =0.3, ? (yi- y ) =53.2,R =1-
i=1 i=1
5 5

5

yi-yi

2

i=1

≈0.994,

?
i=1

5

yi- y

2

所以回归模型的拟合效果很好. 1.2 独立性检验的基本思想及其初步应用 1.分类变量 变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 2.列联表 (1)定义:列出的两个分类变量的频数表,称为列联表. (2)2×2 列联表: 一般地, 假设有两个分类变量 X 和 Y, 它们的取值分别为{x1, x2}和{y1,

y2},其样本频数列联表(称为 2×2 列联表)为:
2×2 列联表

子润教育 电话:82097089

18925955199

4

用孔子的教育思想来润泽每一个孩子

y1 x1 x2
总计

y2 b d b+d

总计

a c a+c

a+b c+d a+b+c+d

3.等高条形图 (1)定义:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分 别对应不同的颜色,这就是等高条形图. (2)特征:等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响, 常用等高条形图展示列联表数据的频率特征. (3)用法: 观察等高条形图发现

a c 和 相差很大, 就判断两个分类变量之间有关系. a+b c+d

4.独立性检验 2 (1)定义:利用随机变量 K 来判断“两个分类变量有关系”的方法称为独立性检验.

n(ad ? bc) 2 ,其中 n=a+b+c+d 为样本容量. (a ? b)(c ? d )(a ? c)(b ? d ) (3) 独立性检验原理: 在假设 H 0 下, 如果出现一个与 H 0 相矛盾的小概率事件, 就推断 H 0
(2)公式: K ?
2

不成立,且该判断犯错误的概率不超过这个小概率

题型一:用 2×2 列联表、等高条形图分析两变量间的关系 【例 2】在对人们饮食习惯的一次调查中,共调查了 124 人,其中六十岁以上的 70 人,
六十岁以下的 54 人.六十岁以上的人中有 43 人的饮食以蔬菜为主,另外 27 人则以肉类为 主;六十岁以下的人中有 21 人饮食以蔬菜为主,另外 33 人则以肉类为主.请根据以上数据 作出饮食习惯与年龄的列联表,并利用

a c 与 判断二者是否有关系. a+b c+d

【自主解答】 2×2 列联表如下:

年龄在六 十岁以上 饮食以蔬菜为主 饮食以肉类为主 总计 将表中数据代入公式得 43 27 70

年龄在六 十岁以下 21 33 54

总计 64 60 124

a 43 c 27 = =0.671 875. = =0.45. a+b 64 c+d 60

显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关 系. 【变式训练 2】某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内
子润教育 电话:82097089 18925955199 5

用孔子的教育思想来润泽每一个孩子

向的学生 426 人中有 332 人在考前心情紧张, 性格外向的学生 594 人中有 213 人在考前心情 紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系. 【自主解答】 作列联表如下: 相应的等高条形图如图所示: 性格内向 考前心情紧张 考前心情不紧张 总计 332 94 426 性格外向 213 381 594 总计 545 475 1 020

图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看 出, 考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高, 可 以认为考前紧张与性格类型有关. 题型二 独立性检验 【例 3】见书 P13 例 1 【变式训练 3】某社区医疗服务部门为了考察人的高血压病是否与食盐摄入量有关,对 该社区的 1 633 人进行了跟踪测查,得出以下数据: 患高血压 喜欢较咸食物 喜欢清淡食物 合计 34 26 60 未患高血压 220 1 353 1 573 合计 254 1 379 1 633

问能否判断在犯错误的概率不超过 0.001 的前提下, 认为患高血压与食盐摄入量有关? 【解】 提出假设 H0:该社区患有高血压病与食盐的摄入量无关.
2

由公式计算 K 的观测值为 k=

- 60×1 573×254×1 379

2

≈80.155.

因为 80.155>10.828 因此在犯错误的概率不超过 0.001 的前提下,我们认为该社区患 有高血压病与食盐的摄入量有关 【追踪训练 2】1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟 与患肺癌有关”的结论, 并且在犯错误的概率不超过 0.01 的前提下认为这个结论是成立的, 下列说法中正确的是( )

A.100 个吸烟者中至少有 99 人患有肺癌 B.1 个人吸烟,那么这个人有 99%的概率患有肺癌 C.在 100 个吸烟者中一定有患肺癌的人 D.在 100 个吸烟者中可能一个患肺癌的人也没有
子润教育 电话:82097089 18925955199 6

用孔子的教育思想来润泽每一个孩子

【解析】 独立性检验的结果与实际问题有差异, 即独立性检验的结论是一个数学统计 量,它与实际问题中的确定性存在差异.【答案】 D 2.分类变量 X 和 Y 的列联表如下,则( )

y1 x1 x2
总计

y2 b d b+d

总计

a c a+c

a+b c+d a+b+c+d

A.ad-bc 越小,说明 X 与 Y 的关系越弱 B.ad-bc 越大,说明 X 与 Y 的关系越强 C.(ad-bc) 越大,说明 X 与 Y 的关系越强 D.(ad-bc) 越接近于 0,说明 X 与 Y 的关系越强 【解析】 由 K 的计算公式可知,(ad-bc) 越大,则 K 越大,故相关关系越强. 3.观察下列各图,其中两个分类变量 x、y 之间关系最强的是( )
2 2 2 2 2

C

【解析】在四幅图中,D 图中两个深色条的高相差最明显,说明两个分类变量之间关系最 强.【答案】 D

4.在一项中学生近视情况的调查中,某校男生 150 名中有 80 名近视,女生 140 名中有 70 名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( A.平均数与方差 C.独立性检验 B.回归分析 D.概率 )

【解析】 判断两个分类变量是否有关的最有效方法是进行独立性检验,故选 C. 【答案】 C

5.利用独立性检验来考虑两个分类变量 X 和 Y 是否有关系时,通过查阅临界值表来确 定推断“X 与 Y 有关系”的可信度,如果 k>5.024,那么就推断“X 和 Y 有关系”,这种推 断犯错误的概率不超过( A.0.25 B.0.75 ) C.0.025 D.0.975

【解析】 ∵P(k>5.024)=0.025, 故在犯错误的概率不超过 0.025 的条件下, 认为“X 和 Y 有关系”. 【答案】 C
18925955199 7

子润教育 电话:82097089

用孔子的教育思想来润泽每一个孩子

6.独立性检验所采用的思路是:要研究 A,B 两类型变量彼此相关,首先假设这两类变 量彼此________.在此假设下构造随机变量 K ,如果 K 的观测值较大,那么在一定程度上 说明假设________【答案】 无关 不成立
2 2

7.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下 表: 专业 性别 男生 女生 非统计专业 13 7 统计专业 10 20
2

为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量 K 的观测值 为 k= - 23×27×20×30
2

≈4.844.因为 k>3.841, 所以确认“主修统计专业与性别有

关系”,这种判断出现错误的可能性为________. 【解析】 因为随机变量 K 的观测值 k>3.841,所以在犯错误的概率不超过 0.05 的前 提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为 5%. 【答案】 5%
2

8.某校对学生课外活动进行调查,结果整理成下表:运用你所学过的知识进行分析, 能否在犯错误的概率不超过 0.005 的前提下,认为“喜欢体育还是文娱与性别有关系”? 体育 男生 女生 合计 【解】 21 6 27 文娱 23 29 52 合计 44 35 79

其等高条形图如图所示.

由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系, 但只能作粗略 判断,具体判断方法如下: 假设“喜欢体育还是喜欢文娱与性别没有关系”, ∵a=21,b=23,c=6,d=29,n=79, ∴K 的观测值为
子润教育 电话:82097089 18925955199 8
2

用孔子的教育思想来润泽每一个孩子

k=
2

- + + +

2


2

≈8.106.

且 P(K ≥7.879)≈0.005, 即我们得到的 K 的观测值 k≈8.106 超过 7.879, 这就意味着: “喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于 0.005,即在犯错误的概 率不超过 0.005 的前提下认为“喜欢体育还是喜欢文娱与性别有关”.

子润教育 电话:82097089

18925955199

9


赞助商链接
相关文章:
数学:第一章《统计案例》测试(1)(新人教A版选修1-2)_免...
数学:第一章统计案例》测试(1)(新人教A版选修1-2)数学:第一章统计案例》测试(1)(新人教A版选修1-2)隐藏>> 高考资源网(ks5u.com) 您身边的高考专家...
数学:第一章《统计案例》测试(2)(新人教A版选修1-2)
数学:第一章统计案例》测试(2)(新人教A版选修1-2)_数学_自然科学_专业资料。数学:第一章统计案例》测试(2)(新人教A版选修1-2) ...
数学:第一章《统计案例》素材(新人教A版选修1-2)
数学:第一章统计案例》素材(新人教A版选修1-2)_理学_高等教育_教育专区。...11、某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如...
数学:第一章《统计案例》测试(2)(新人教A版选修1-2)
数学:第一章统计案例》测试(2)(新人教A版选修1-2)_高一数学_数学_高中教育_教育专区。高中新课标数学选修( 高中新课标数学选修(1-2)统计案例测试题一、...
数学:第一章《统计案例》测试(1)(新人教A版选修1-2)
数学:第一章统计案例》测试(1)(新人教A版选修1-2)_数学_高中教育_教育...文档贡献者 张丕春 高级教师 50440 316566 3.3 文档数 浏览总量 总评分相关...
高三数学:第一章《统计案例》测试(2)(新人教A版选修1-2)
高三数学:第一章统计案例》测试(2)(新人教A版选修1-2)_数学_高中教育_教育...2014小学教师资格考试《... 2014年幼儿园教师资格考... 2014教师资格中学教育...
数学:第一章《统计案例》素材(新人教A版选修1-2)
数学:第一章统计案例》素材(新人教A版选修1-2)_高三数学_数学_高中教育_...文档贡献者 张文丰 一级教师 9430 252801 3.7 文档数 浏览总量 总评分相关...
数学:第一章《统计案例》测试(1)(新人教A版选修1-2)_免...
数学:第一章统计案例》测试(1)(新人教A版选修1-2) 隐藏>> 一、选择题 1.下列属于相关现象的是( )A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与...
人教B版选修(1-2)第一章《统计案例》word同步测试(3)
人教B版选修(1-2)第一章统计案例》word同步测试(3)_数学_高中教育_教育...文档贡献者 谢文汉 一级教师 81550 3666633 3.4 文档数 浏览总量 总评分相关...
高三数学:第一章《统计案例》测试(1)(新人教A版选修1-2)
高三数学:第一章统计案例》测试(1)(新人教A版选修1-2)_数学_高中教育_教育...2014小学教师资格考试《... 2014年幼儿园教师资格考... 2014教师资格中学教育...
更多相关标签: