当前位置:首页 >> >>

2020版高中数学第二章统计章末复习课课件新人教B版_图文

章末复习

1.随机抽样 (1)常见的抽样方法有三种:
抽样方法???简单随机抽样???抽随签机法数表,法, ?系统抽样, ?分层抽样,

(2)应用三种抽样方法时的使用原则: ①当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀, 可采用抽签法; ②当总体容量较大,样本容量较小时可用随机数表法; ③当总体容量较大,样本容量也比较大且个体均衡时可用系统抽样法; ④当总体容量较大且由明显差异的几部分构成时,采用分层抽样法.

2.用样本估计总体 (1)利用样本的频率分布表和频率分布直方图对总体情况作出估计,有
时也利用频率分布折线图和茎叶图对总体 估计.
①用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行 列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.
②茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二 是便于记录和表示,但数据较多时不方便.

(2)样本的数字特征可分为两大类:一类是反映样本数据集中趋势的, 包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差 及标准差.我们常通过样本的数字特征估计总体的数字特征.

(3)在用样本的数字特征估计总体的数字特征时应注意: ①任何一个样本数据的改变都会引起平均数的改变.特殊情况下,平均 数可能受某几个极端值的影响,而偏离一般情况. ②标准差的平方是方差,标准差的单位与样本数据的单位一致. ③用样本的平均数和标准差估计总体的平均数和标准差时,样本的平均 数和标准差只是总体的平均数和标准差的 近似.

3.两个变量之间的相互关系 (1)除了函数关系这种确定性的关系外,还有大量存在因变量的取值带
有一定随机性的两个变量之间的关系——相关关系.

(2)分析两个变量的相关关系时,我们可根据样本数据散点图确定两 个变量之间是否存在相关关系,还可利用最小二乘法求出回归直线方 程.把样本数据表示的点在直角坐标系中作出,构成的图叫散点图,从 散点图上,我们可以分析出两个变量是否存在相关关系.如果这些点大 致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具 有线性相关关系,这条直线叫做回归直线,直线方程叫做回归直线方 程.

(3)求回归直线方程的步骤:

n

n

n

①先把数据制成表,从表中计算出 ?x i,n i, ?x i2, ?x i yi;

i=1

i=1

i=1

?? ?

n

--

?x i yi-nxy

i=1

?b=

②计算回归系数 a,b.公式为? n



? ?x 2i -n x 2

?

i=1

??a= y -b x

③写出回归直线方程^y=bx+a.

例1某工厂有1 003名工人,从中抽取20人参加体检,试采用系统抽样方法 给出抽样过程.
解 系统抽样: 因为1 003=20×50+3,为了保证“等距”分段, 应先剔除3人. 第一步:将1 003个人用随机方式编号;

第二步:从总体中剔除3个人(剔除方法可用随机数表法),将剩下的1 000 个人用随机方式编号,编号分别为0 001, 0 002,…,1 000,并分成20段;
第三步:在第1段0 001,0 002,…,0 050这50个编号中用简单随机抽样抽 出1个号(如0 003)作为起始号码;
第四步:将编号为0 003,0 053,0 103,…,0 953的个体抽出,组成样本. [借题发挥] 理解并掌握三种抽样方法的联系和区别,弄清三种抽样方法 的实施步骤,确保所抽样本的公平性与合理性.

跟踪训练1.某社区对居民进行上海世博会知晓情况的分层抽样调查. 已知该社区的青年人、中年人和老年人分别有800人、1 600人、1 400 人.若在老年人中的抽样人数是70,则在中年人中的抽样人数应该是 ______. 【解析】设在中年人中的抽样人数为 x,则1 74000=1 6x00,∴x=80. 【答案】80

跟踪训练2.某单位有职工500人,其中不到35岁的有125人,35~49 岁的有280人,50岁及50岁以上的有95人,为了解这个单位职工与身 体状况有关的某项指标,要从中抽取一个容量为100的样本.请给出 抽样过程.

解 由于职工的年龄差别明显,宜采用分层抽样法. S1 确定抽取人数,510000=5,所以不到 35 岁的应抽取1525=25(人), 35~49 岁的应抽取2580=56(人);50 岁及 50 岁以上的应抽取955=19(人). S2 用简单随机抽样法或系统抽样法分别抽取 35 岁以下的 25 人, 35~49 岁的 56 人,50 岁及 50 岁以上的 19 人. 这些人就组成了要抽取的样本.

例2 某班54名学生在某次综合素质测试中总分成绩(满分710分)为:
550 544 579 609 511 572 557 599 619 519 561 572 573 604 567 588 597 548 574 539 596 584 559 567 501 590 572 565 524 617 570 544 593 540 574 541 555 597 552 567 561 562 580 570 531 548 542 564 638 570 584 596 573 566

(1)写出样本频率分布表; (2)画出频率分布直方图和频率分布折线图; (3)如果规定580分过重点大学线,则不过重点大学线的百分比约是多 少?

解 (1)最高分数 638 分,最低分 501 分,极差为 638-501=137(分)

取组距为 20,则可分为12307≈7 组,列表如下:

分组

频数

频率

[500,520)

3

0.055 6

[520,540)

3

0.055 6

[540,560)

12

0.222 2

[560,580)

20

0.370 4

[580,600)

11

0.203 7

[600,620)

4

0.074 1

[620,640] 合计

1

0.018 5

54

1.000 0

(2)频率分布直方图和频率分布折线图如图所示: (3)不过重点大学线的百分比约为3+3+5142+20≈70.37%.

[借题发挥] 用样本频率分布估计总体频率分布,主要是改变样本 数据的排列形式.如频率分布表、频率分布直方图,频率分布折线图和 茎叶图,这样可以直观地看出样本中数据的集中程度.

跟踪训练3.如图是CBA篮球联赛中,甲乙两名运动员某赛季一些场次

得分的茎叶图,则平均得分高的运动员是________.





808 650 1 24789 76532 2 1789
23

【解析】从茎叶图上可得甲的得分为:8,10,15,16,22,23,25,26,27,32, 所以可得平均值为20.4;乙的得分为8,12,14,17,18,19,21,27,28,29, 所以可得平均值为19.3,所以平均得分高的运动员是甲. 【答案】甲

跟踪训练4.甲、乙两个小组各10名学生的英语口语测试成绩如下(单位: 分):
甲组 76 90 84 86 84 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两个小组的成绩,判断哪个小组的成绩更整齐一些?

解 茎叶图如下:





6 7 499

76654432 8 024599

091

甲组成绩大致对称,中位数是84.5,乙组成绩中位数是83,因此甲 组的成绩更整齐一些.

例3 甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位: 环)如图所示.

(1)填写下表: 平均数

方差

中位数

命中9环及以上



7

1



3

(2)请从四个不同的角度对这次测试进行分析:

①从平均数和方差结合分析偏离程度;

②从平均数和中位数结合分析谁的成绩好些;

③从平均数和命中9环以上的次数相结合看谁的成绩好些;

④从折线图上两人射击命中环数及走势分析谁更有潜力.

解 (1)乙的射靶环数依次为 2,4,6,8,7,7,8,9,9,10.可知 x 乙=110(2+4+6+8 +7+7+8+9+9+10)=7,乙的射靶环数从小到大排列为 2,4,6,7,7,8,8,9,9,10,所以中位数是7+2 8=7.5;甲的射靶环数从小到大排列 为 5,6,6,7,7,7,7,8,8,9,所以中位数为 7.s2 甲=110[(5-7)2+(6-7)2×2+(7- 7)2×4+(8-7)2×2+(9-7)2]=1.2,

s乙2 =110[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10 -7)2]=5.4.于是填充后的表格如下表所示:

平均数 方差 中位数



7

1.2

7



7

5.4

7.5

命中9环及以上 1 3

(2)①甲、乙的平均数相同,均为 7,但 s2甲<s2乙,说明甲偏离平均数的程 度小,而乙偏离平均数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,可预见乙射靶环数的 优秀次数比甲多.
③甲、乙的平均水平相同,而乙命中 9 环以上(包含 9 环)的次数比甲多 2 次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不 大,说明乙的状态在提升,更有潜力.

[借题发挥] 用样本来估计总体,仅凭频率分布表及频率分布直 方图来直观呈现还不具体,还需要用数据说话,即用样本的数字特征 估计总体数字特征.众数反映的是出现次数最多的数;中位数是各数 据按由小到大排列后,中间的数或中间两数的平均数;平均数反映了 样本中各数据的平均程度,而方差和标准差则反映了样本中数据的离 散程度.

跟踪训练5.甲,乙两中学生在一年里学科平均分相等,但他们的方差不

相等,正确评价他们的学习情况是

()

A.因为他们的平均分相等,所以学习水平一样

B.成绩虽然一样,方差较大的,说明潜力大,学习态度踏实

C.表面上看这两个学生平均成绩一样,但方差小的学习成绩稳定

D.平均分相等,方差不等,说明学习水平不一样,方差较小的同学,

学习成绩不稳定,忽高忽低

【解析】平均数反映样本数据的平均水平,而方差反映的是样 本数据的波动性大小,即稳定程度. 【答案】C

例4 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为 此进行了10次试验,收集数据如下: 零件数x(个) 10 20 30 40 50 60 70 80 90 100 加工时间y(分) 62 68 75 81 89 95 102 108 115 122 (1)画出散点图; (2)求加工时间y关于零件数x的回归直线方程; (3)当加工120个零件时,对所花费时间予以估计.

解 (1)画出散点图如图.

由图可知 y 与 x 是线性相关的. (2)回归直线方程为^y=0.668x+54.96. (3)由回归直线方程^y=0.668x+54.96, 当 x=120 时, ^y=0.668×120+54.96=135.12 ≈135(分), 即加工 120 个零件时,花费时间约为 135 分钟.

[借题发挥] (1)利用散点图判断两个变量之间是否具有线性相关性, 体现了数形结合思想的应用,而用回归直线方程进行估计又体现了函数 与方程思想的应用.
(2)回归分析是寻找相关关系中非确定性关系的某种确定性.

跟踪训练 6.某考察团对全国 10 个城市进行职工人均工资水平 x(千元)

与居民人均消费水平 y(千元)调查统计,y 与 x 具有相关关系,回归直线方

程为^y=0.66x+1.562,若某城市居民人均消费水平为 7.675(千元),估计该

城市人均消费额占人均工资收入的百分比约为

()

A.83%

B.72%

C.67%

D.66%

【解析】由^y=0.66x+1.562 知, 当 y=7.675 时,x=6616103, ∴所求百分比为7.6x75=7.667151×3660≈83%. 【答案】A

当堂检测 1.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的 频率分布直方图估计,样本数据落在区间[10,12)内的频数为 ( )
A.18 B.36 C.54 D.72

【解析】 由0.02+0.05+0.15+0.19=0.41, ∴落在区间[2,10]内的频率为0.41×2=0.82. ∴落在区间[10,12)内的频率为1-0.82=0.18. ∴样本数据落在区间[10,12)内的频数为0.18×200=36. 【答案】 B

2.某产品的广告费用x与销售额y的统计数据 如下表:

广告费用x(万元) 销售额y(万元)

4235 49 26 39 54

根据上表可得回归方程^y=b^x+a^中的b^为 9.4,据此模型预报广告

费用为 6 万元时销售额为

( ).

A.63.6万元 C.67.7万元

B.65.5万元 D.72.0万元

【解析】 ∵-x =4+2+4 3+5=72,
-y =49+26+4 39+54=42,
又^y=b^x+a^必过(-x ,-y ),∴42=72×9.4+a^, ∴a^=9.1. ∴线性回归方程为^y=9.4x+9.1. ∴当 x=6 时,^y=9.4×6+9.1=65.5(万元). 【答案】 B

命题立意 本小题考查了对线性回归方程的理解及应用, 求解的关键是明确线性回归方程必过样本中心点(-x ,-y ), 同时考查计算能力.

3.为了普及环保知识,增强环保意识,某大学随机抽取 30 名学生参加环保知识测 试,得分(十分制)如图所示,假设得分值的中位数为 me,众数为 mo,平均值为-x , 则 ( ).

A.me=mo=-x C.me<mo<-x

B.me=mo<-x D.mo<me<-x

【解析】 30 个数中第 15 个数是 5,第 16 个数是 6, 所以中位数为5+2 6=5.5,众数为 5, -x =3×2+4×3+5×10+6×63+07×3+8×2+9×2+10×2=13709.
【答案】 D

4.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据 如下:
父亲身高x (cm) 174 176 176 176 178

儿子身高y (cm) 175 175 176 177 177

则 y 对 x 的线性回归方程为

A.^y=x-1

B.^y=x+1

C.^y=88+12x

D.^y=176

( ).

【解析】 因为-x =174+176+1576+176+178=176, -y =175+175+1576+177+177=176, 又 y 对 x 的线性回归方程表示的直线恒过点(-x ,-y ),所以将(176, 176)代入 A、B、C、D 中检验知选 C. 【答案】C