当前位置:首页 >> >>

2018-2019学年高中数学(人教A版)必修三配套课件:2.2.2 用样本的数字特征估计总体的数字特征 探究导学课_图文

2.2.2 用样本的数字特征估计总体的数字特征

【自主预习】 主题1:众数、中位数、平均数 1.众数是一组数据中出现次数最多的数,在频率分布直 方图中,众数应出现在哪个位置?是多少?

提示:在频率分布直方图中,众数应该出现在 频 率 最大
组距
的那一组中,它是最高的矩形的中点.

2.在频率分布直方图中,中位数应出现在哪个位置? 提示:在频率分布直方图中,中位数左边和右边直方图 的面积应该相等.

3.在频率分布直方图中,平均数是如何估计的? 提示:在频率分布直方图中,平均数的估计值等于频率 分布直方图中每个小矩形的面积乘以小矩形底边中点 的横坐标之和.

结合以上探究,试着写出众数、中位数和平均数的定义: 众数:在一组数据中,出现次数_最__多__的数据叫做这一组 数据的众数.
? 中位数:将一组数据按_大__小__依次排列,把处在_最__中__间__ 位置的一个数据(或两个数据的平均数)叫做这组数据 的中位数.

?

平均数:假设样本数据是x1,x2,…,xn, x 表示这组数据

的平均数,则

x1?x2 ???xn x?________ n_______.

主题2:标准差 1.如何考查样本数据的分散程度? 提示:最常用的统计量是样本数据的标准差.

2.样本数据的分散程度是计算样本数据的什么值? 提示:样本数据的分散程度是样本数据到平均数的平均 距离.

3.一般意义下的平均距离是什么? 提示:S= x1?x?x2?x?… … ?xn?x.
n

通过以上探究,试着写出方差与标准差公式:
假设样本数据是x1,x2,x3,…,xn, x 是平均数,则
? ? ? ? ? ? 方差:s2=__n 1 [ ___x 1 _? __x _2 _? __x _2 _? __x _2 _? __? __? __x _n_? _x __2 ] _____.
?
? ? ? ? ? ? 标准差:s=____n 1 [ ___x _1_? _x __2_? __x _2_? _x __2_? _? __? __x _n_? _x __2] ___.

【深度思考】
结合教材P76例1你认为应如何计算一组数据的标准差?
第一步:_计__算__样__本__数__据__的__平__均__数__x __. 第二步:_计__算__方__差__s_2=__n1 [__(_x_1_-__x _)_2_+_…__+_(_x_n-__x _)_2_]_. 第三步:_算__出__方__差__的__算__术__平__方__根__,_即__为__样__本__标__准__差__.

【预习小测】

1.下列刻画一组数据离散程度的是 ( )

A.平均数

B.方差

C.中位数

D.众数

【解析】选B.由方差、标准差的概念可知:方差、标准

差反映了一组数据的离散程度.

2.样本101,98,102,100,99的标准差为 ( )

A. 2

B.0

C.1

D.2

【解析】选A.样本平均数为 101+ 98+ 102+ 100+ 99=
5
100,样本方差s2= 1 [(101-100)2+(98-100)2+(102-
5
100)2+(100-100)2+(99-100)2]=2,所以标准差为s= 2 .

3.下列判断正确的是 ( ) A.样本平均数一定小于总体平均数 B.样本平均数一定大于总体平均数 C.样本平均数一定等于总体平均数 D.样本容量越大,样本平均数越接近总体平均数

【解析】选D.因为样本平均数只是估计总体的平均数, 它与总体平均数的关系不确定,因此只有选项D正确.

4.已知M个数的平均数为X,N个数的平均数为Y,则这 M+N个数的平均数为________. 【解析】这M+N个数的和为MX+NY,所以其平均数为
MX ? NY . M?N
答案: MX ? NY
M?N

【补偿训练】1.某学员在一次射击测试中射靶10次,命 中环数如下: 7,8,7,9,5,4,9,10,7,4 则:(1)平均命中环数为________. (2)命中环数的标准差为________.

【解析】(1) x ? 7 ? 8 ? 7 ? 9 ? 5 ? 4 ? 9 ? 1 0 ? 7 ? 4 ? 7 .
1 0
(2)因为s2= 1 [(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-
10
7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,所以
s=2.
答案:(1)7 (2)2

2.如图是甲、乙两人在一次射击比赛中中靶的情况 (击中靶中心的圆面为10环,靶中各数字表示该数字 所在圆环被击中所得的环数),每人射击了6次.

(1)请用列表法将甲、乙两人的射击成绩统计出来. (2)请你用学过的统计知识,对甲、乙两人这次的射击 情况进行比较.

【解析】(1)
环数 甲命中次数 乙命中次数

6 7 8 9 10

22 2

1

32

(2) x甲 ?9,x乙 ?9, s甲 2?2 3, s乙 2?1 . 因为 x甲?x乙 , s甲 2< s乙 2,
所以甲与乙的平均成绩相同,但甲发挥比乙稳定.

【互动探究】 1.一组数据中的众数只有一个吗? 提示:可能不止一个,如果两个数据出现的次数相同,并 且比其他数据出现的次数都多,那么这两个数据都是这 组数据的众数.

2.由频率分布直方图得出的中位数,一定在样本数据中 出现吗? 提示:不一定.因为频率分布直方图,不能体现样本数据, 因此由频率分布直方图得到的中位数不一定在样本数 据中出现.

3.标准差、方差的取值范围是什么? 提示:由标准差与方差的公式可知:标准差、方差的取 值范围为[0,+∞).

4.标准差、方差为0的样本数据有什么特点? 提示:标准差、方差为0时,样本数据全相等,都等于样 本的平均数,表明数据没有波动幅度,数据没有离散性.

【探究总结】 知识归纳:

注意事项:方差与标准差的关注点 (1)标准差、方差描述了一组数据围绕平均数波动的大 小.标准差、方差越大,数据的离散程度越大;标准差、 方差越小,数据的离散程度越小.

(2)标准差、方差的取值范围是:[0,+∞). (3)因为方差与原始数据的单位相同,且平方后可能夸 大了偏差的程度,所以虽然方差与标准差在刻画样本数 据的离散程度上是一样的,但在解决实际问题时,一般 多采用标准差.

【题型探究】

类型一:众数、中位数、平均数的应用

【典例1】(1)(2016·聊城高一检测)某学习小组在一

次数学测验中,得100分的有1人,95分的有1人,90分的

有2人,85分的有4人,80分和75分的各有1人,则该小组

成绩的平均数、众数、中位数分别是 ( )

A.85,85,85

B.87,85,86

C.87,85,85

D.87,85,90

(2)据报道,某公司的33名职工的月工资(以元为单位)

如下:

职 务

董事 长

副董 事长

董事

总经 理

经理

管理 员

职员

人 数

1

1

2

1

5

3

20

工 资

5500

5000

3500

3000

2500

2000

1500

①求该公司的职工月工资的平均数、中位数、众数. ②假设副董事长的工资从5 000元提升到20 000元,董事 长的工资从5 500元提升到30 000元,那么新的平均数、 中位数、众数又是什么?(精确到1元) ③你认为哪个统计量更能反映这个公司职工的工资水平? 结合此问题谈一谈你的看法.

【解题指南】(1)将数值从小到大依次排列,即可观察 众数、中位数.(2)根据众数、中位数、平均数的定义 及意义解决问题.

【解析】(1)选C.从小到大列出所有数学成绩:75,80, 85,85,85,85,90,90,95,100,观察知众数和中位数均 为85,计算得平均数为87.

(2)①平均数是:
x = 1 5 0 0 + 4 0 0 0 + 3 5 0 0 + 2 0 0 0 ? 2 + 1 5 0 0 + 1 0 0 0 ? 5 + 5 0 0 ? 3 + 0 ? 2 0 3 3
≈1 500+591=2 091(元).
中位数是1 500元,众数是1 500元.

②平均数是
x ? = 1 5 0 0 + 2 8 5 0 0 + 1 8 5 0 0 + 2 0 0 0 ? 2 + 1 5 0 0 + 1 0 0 0 ? 5 + 5 0 0 ? 3 + 0 ? 2 0 3 3
≈1 500+1 788=3 288(元).
中位数是1 500元,众数是1 500元.

③在这个问题中,中位数或众数均能反映该公司职工的 工资水平.因为公司中少数人的工资额与大多数人的工 资额差别较大,这样导致平均数偏差较大,所以平均数 不能反映这个公司职工的工资水平.

【规律总结】 1.中位数的求法 (1)当数据个数为奇数时,中位数是按大小顺序排列的 中间那个数. (2)当数据个数为偶数时,中位数为按大小顺序排列的 最中间的两个数的平均数.

2.数据特征的分析 如果样本平均数大于样本中位数,说明数据中存在许多 较大的极端值;反之说明数据中存在许多较小的极端值. 在实际应用中,如果同时知道样本中位数和样本平均数, 可以使我们了解样本数据中极端数据的信息.所以,应 当深刻理解和把握平均数、中位数、众数在反映样本 数据上的特点,并结合实际情况,灵活应用.

【巩固训练】(2016·长沙高二检测)某小区广场上有 甲、乙两群市民正在进行晨练,两群市民的年龄如下 (单位:岁): 甲群13,13,14,15,15,15,15,16,17,17; 乙群54,3,4,4,5,5,6,6,6,57.

(1)甲群市民年龄的平均数、中位数和众数各是多少岁? 其中哪个统计量能较好反映甲群市民的年龄特征? (2)乙群市民年龄的平均数、中位数和众数各是多少岁? 其中哪个统计量能较好反映乙群市民的年龄特征?

【解析】(1)甲群市民年龄的平均数为
1 3 + 1 3 + 1 4 + 1 5 + 1 5 + 1 5 + 1 5 + 1 6 + 1 7 + 1 7 = 1 5 ( 岁 ) , 1 0
中位数为15岁,众数为15岁.
平均数、中位数和众数相等,因此它们都能较好地反映
甲群市民的年龄特征.

(2)乙群市民年龄的平均数为
5 4 + 3 + 4 + 4 + 5 + 5 + 6 + 6 + 6 + 5 7 = 1 5 ( 岁 ) , 1 0
中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好
地反映乙群市民的年龄特征,而平均数的可靠性较差.

类型二:标准差、方差的应用 【典例2】甲、乙两机床同时加工直径为100cm的零件, 为检验质量,各从中抽取6件测量,数据为: 甲:99 100 98 100 100 103 乙:99 100 102 99 100 100

(1)分别计算两组数据的平均数及方差. (2)根据计算结果判断哪台机床加工零件的质量更稳定.

【解题指南】(1)由平均数和方差的定义直接求解. (2)利用(1)的结果,方差较小的质量较稳定.

【解析】(1) x 甲 = 1 (99+100+98+100+100+103)=100,
6

x 乙 = 1 (99+100+102+99+100+100)=100.
6

s 甲 2=

1 6

[(99-100)2+(100-100)2+(98-100)2+(100-

100)2+(100-100)2+(103-100)2]= 7 ,

3

s 乙 2=

1 6

[(99-100)2+(100-100)2+(102-100)2+(99-

100)2+(100-100)2+(100-100)2]=1.

(2)两台机床所加工零件的直径的平均值相同, 又 s甲2>s乙2,所以乙机床加工零件的质量更稳定.

【规律总结】计算标准差的五个步骤
第一步:算出样本数据的平均数 x ; 第二步:算出每个样本数据与样本平均数的差xi- x
(i=1,2,…,n);
第三步:算出(xi- x )2(i=1,2,…,n);

第四步:算出(xi- x )2(i=1,2,…,n)这n个数的平均数,
即为样本方差s2; 第五步:算出方差的算术平方根,即为样本标准差s.

【拓展延伸】方差的两种化简形式

方差描述一组数据围绕平均数波动的幅度.在应用时注

? ? ? ? ? ? 2

2

2

意其公式s2= x1?x ?x2?x ?? ?xn?x 的两个简化形

n

式:

①s2= n 1 [ (x12?x22?? ?xn2)?nx2] ; ②s2= n 1 [ (x ?1 2?x ?22? ? ?x ?n2)?nx ?2 ] , 其中x′1=x1-a, x′2=x2-a,…,x′n=xn-a,a是接近原数据平均数的一个
常数.

【巩固训练】从甲、乙两种玉米的苗中各抽10株,分别 测它们的株高如下:(单位:cm) 甲:25 41 40 37 22 14 19 39 21 42 乙:27 16 44 27 44 16 40 40 16 40 问:(1)哪种玉米的苗长得高? (2)哪种玉米的苗长得齐?

【解析】(1)x 甲= 1 (25+41+40+37+22+14+19+39+
10
21+42)= 1 ×300=30(cm),
10

x 乙 = 1 (27+16+44+27+44+16+40+40+16+40)= 1

10

10

×310=31(cm).

所以 x甲<x乙. 乙种玉米的苗长得高.

(2)s 甲

2=

1 10

[(25-30)2+(41-30)2+(40-30)2+(37-30)2

+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2

+(42-30)2]= 1 (25+121+100+49+64+256+121+81+
10

81+144)= 1 ×1 042=104.2(cm2),

10

s乙

2=

1 10

[(2×272+3×162+3×402+2×442)-10×312]=

1 10

×1 288=128.8(cm2).所以 s甲2<s乙2.

甲种玉米的苗长得齐.

类型三:由频率分布表或直方图求数字特征 【典例3】从某企业生产的某种产品中抽取100件,测量 这些产品的一项质量指标值,由测量结果得如下频数分 布表:

质量指 标值分

频数

[75, 85)
6

[85, 95)
26

[95, 105)
38

[105, 115)
22

[115, 125]
8

(1)在下图中作出这些数据的频率分布直方图:

(2)估计这种产品质量指标值的平均数及方差(同一组 中的数据用该组区间的中点值作代表). (3)根据以上抽样调查数据,能否认为该企业生产的这 种产品符合“质量指标值不低于95的产品至少要占全 部产品的80%”的规定?

【解题指南】(1)可由频率分布表,直接画出频率分布 直方图.(2)由频率分布直方图计算样本的平均数与方 差.(3)可利用样本来估计总体.

【解析】(1)由频率分布表直接画出频率分布直方图:

(2)质量指标值的样本平均数为: x =80×0.06+90×0.26+100×0.38+110×0.22+ 120×0.08=100. 质量指标值的样本方差为: s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+ 202×0.08=104.

(3)质量指标值不低于95的产品所占比例的估计值为 0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能 认为该企业生产的这种产品符合“质量指标值不低于 95的产品至少要占全部产品80%”的规定.

【延伸探究】 1.(改变问法)若本例中的条件不变,估计产品质量指标 值的众数出现在哪一组中?其值为多少?

【解析】由频率分布直方图可知:产品质量指标值的众 数应该出现在长方形最高的一组中,即出现在[95,105) 这一组中.其值应该是100.

2.(改变条件)在本例(3)中的“不低于95”改为“不高 于115”结果如何? 【解析】质量指标值不高于115的产品所占比例的估计 值为1-0.08=0.92.由于该估计值大于0.8,故能认为该 企业生产的这种产品符合“质量指标值不高于115的产 品至少要占全部产品80%”的规定.

【规律总结】利用频率分布直方图求数字特征的方法 (1)众数是最高的矩形的底边的中点的横坐标. (2)中位数左右两侧直方图的面积相等.

(3)平均数等于每个小矩形的面积乘以小矩形底边中点 的横坐标之和. (4)利用直方图求众数、中位数、平均数均为近似值, 往往与实际数据得出的不一致.但它们能粗略估计其众 数、中位数和平均数.

【巩固训练】某地区100位居民的人均月用水量(单 位:t)的分组及各组的频数如下: [0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22; [2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4; [4,4.5],2.

(1)列出样本的频率分布表. (2)画出频率分布直方图,并根据直方图估计这组数据 的平均数、中位数、众数. (3)当地政府制定了人均月用水量为3t的标准,若超出 标准加倍收费,当地政府说,85%以上的居民不超过这个 标准,这个解释对吗?为什么?

【解析】(1)频率分布表
分组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5]
合计

频数 4 8 15 22 25 14 6 4 2
100

频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02
1

(2)频率分布直方图如图: 众数:2.25,中位数:2.02,平均数:2.02.

(3)人均月用水量在3t以上的居民所占的比例为 6%+4%+2%=12%,即大约有12%的居民月用水量在3t以 上,88%的居民月用水量在3t以下,因此政府的解释是正 确的.