当前位置:首页 >> >>

2018-2019学年高中数学(人教A版)必修三配套课件:2.2.2 用样本的数字特征估计总体的数字特征 情境互动课_图文

2.2.2 用样本的数字特征估计 总体的数字特征

1.对一个未知总体,我们常用样本的频率分布来估 计总体的分布,其中表示样本数据的频率分布的基 本方法有哪些? 图、表、总体数据的数字特征

2.下图是某赛季东、西部球队数据,那么如何比较东 部赛区与西部赛区的优劣呢?

如果要求我们根据上面的数据,估计、比较某赛季 东部赛区与西部赛区的优劣,就得有相应的数据作 为比较依据,即通过样本数据对总体的数字特征进 行研究,用样本的数字特征来估计总体的数字特征.

1.正确理解样本数据标准差的意义和作用,学会计算 数据的标准差. 2.理解用样本的基本数字特征来估计总体的基本数字 特征.(难点) 3.会应用相关知识来解决简单的统计问题.(重点)

探究点1

众数、中位数、平均数

思考1:怎样将各个样本数据汇总为一个数值,

并使它成为样本数据的“中心点”?

1.众数的定义: 在一组数据中,出现次数最多的数

据叫做这一组数据的众数.

2.中位数的定义: 将一组数据按大小顺序依次排

列,把处在最中间位置的一个数据(或两个数据

的平均数)叫做这组数据的中位数.

3.平均数的定义:一组数据的和除以数据的个数所

得到的数.

思考2:在城市居民月均用水量样本数据的频率分布

直方图中,你认为众数应在哪个小矩形内?由此估

计总体的众数是什么? 总体的众数取最高矩形下

频率/组距

端中点的横坐标。

0.50 0.40 0.30 0.20 0.10

取最高矩形下端中点的 横坐标2.25作为众数.

O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t

思考3:在频率分布直方图中,每个小矩形的面积 表示什么?中位数左右两侧的直方图的面积应有 什么关系?
每个小矩形的面积即为所在组的频率,中位 数左边和右边的直方图的面积应该相等.

频率/组距
0.50 0.40 0.30 0.20 0.10
o 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
从左至右各个小矩形的面积分别是0.04,0.08,0.15,
0.22,0.25,0.14,0.06,0.04,0.02.
0.5-0.04-0.08-0.15-0.22=0.01,
0.5×(0.01÷0.25)=0.02,所以中位数是2.02.

思考4:平均数是频率分布直方图的“重心”,将

频率分布直方图中每个小矩形的面积与小矩形底

边中点的横坐标之积相加,就是样本数据的估计

平均数. 由此估计总体的平均数是什么?

频率/组距
0.50 0.40 0.30 0.20 0.10
o 0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

各小矩形底边中点的横坐标为:0.25,0.75, 1.25,1.75,2.25,2.75,3.25,3.75,4.25. 各小矩形的面积为: 0.04,0.08,0.15,0.22,0.25,0.14,0.06, 0.04,0.02. 0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22
+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04
+4.25×0.02=2.02(t).
所以平均数是2.02 t.
平均数与中位数相等,是必然还是巧合?
巧合

思考4:平均数是频率分布直方图的“重心”,将

频率分布直方图中每个小矩形的面积与小矩形底

边中点的横坐标之积相加,就是样本数据的估计

平均数. 由此估计总体的平均数是什么?

频率/组距

平均数的估计值等于频

0.50

率分布直方图中每个小

0.40

矩形的面积乘以小矩形

0.30

底边中点的横坐标之和。

0.20

0.10
o 0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

众数





的 数

中位数





征 平均数

频率分布直方图中最 高矩形下端的中点
中位数两边的直 方图的面积相等
频率分布直方图中每个小矩 形的面积乘以小矩形底边中 点的横坐标之和

思考5:从居民月均用水量样本数据可知,该样本 的众数是2.3,中位数是2.0,平均数是1.973,这与 我们从样本频率分布直方图得出的结论有偏差,你 能解释一下原因吗? 频率分布直方图损失了一些样本数据,得到的是一 个估计值,且所得的估计值与数据分组有关. 注:在只有样本频率分布直方图的情况下,我们可以 按上述方法估计众数、中位数和平均数,并由此估 计总体特征.

思考6:一组数据的中位数一般不受少数几个极 端值的影响,这在某些情况下是一个优点,但它 对极端值的不敏感有时也会成为缺点,你能举例 说明吗?样本数据的平均数大于(或小于)中位 数说明什么问题?你怎样理解“我们单位的收入 水平比别的单位高”这句话的含义?

如:样本数据收集有个别差错不影响中位数;大学 毕业生凭工资中位数找单位可能收入较低.
平均数大于(或小于)中位数,说明样本数据 中存在许多较大(或较小)的极端值.
这句话具有模糊性甚至蒙骗性,其中收入水平 是员工工资的某个中心点,它可以是众数、中位数 或平均数. 反应数据特点的值还有什么?

探究点2

标准差

思考1:在一次射击选拔赛中,甲、乙两名运动员 各射击10次,每次命中的环数如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 甲、乙两人本次射击的平均成绩分别为多少环?

x甲 ? 7, x乙 ? 7.

思考2:甲、乙两人射击的平均成绩相等,如图所

示,你能说明其水平差异在哪里吗?

频率 (甲)

频率 (乙)

0.4

0.4

0.3

0.3

0.2

0.2

0.1

0.1

O 4 5 6 7 8 9 10 环数 O 4 5 6 7 8 9 10 环数

甲的成绩比较分散,极差较大;

乙的成绩相对集中,比较稳定.

思考3:对于样本数据x1,x2,…,xn,设想通过 各数据到其平均数的平均距离来反映样本数据的 分散程度,那么这个平均距离如何计算?

| x1 x | | x2 x | n
含有绝对值,运算不方便.

| xn x |

标准差 (1)定义:反映样本数据的分散程度的大小,最常用 的统计量是标准差,一般用s表示.假设样本数据 x1,x2,…,xn的平均数为 x,则标准差的计算公 式是:
s ? (x1 ? x)2 ? (x2 ? x)2 ? ? (xn ? x)2 n

(2)特征:标准差描述一组数据围绕 平均数 波动的 大小,反映了一组数据变化的幅度和离散程度的大小. 标准差较大,数据的离散程度较 大 ;标准差较小, 数据的离散程度较__小____.

计算甲、乙两名运动员的射击成绩的标准差,比 较其射击水平的稳定性. 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7
s甲=2,s乙≈1.095. 由s甲>s乙,可估计乙比甲的射击成绩稳定.

例1 画出下列四组样本数据的条形图, 说明它们的异同点. (1) 5,5,5,5,5,5,5,5,5; (2) 4,4,4,5,5,5,6,6,6;
解:

(1)

(2)

(3) 3,3,4,4,5,6,6,7,7; (4) 2,2,2,2,5,8,8,8,8.

(3)

(4)

例2 甲乙两人同时生产内径为25.40 mm的一种零件. 为了对两人的生产质量进行评比,从他们生产的零 件中各抽出20件,量得其内径尺寸如下 (单位:mm):

甲: 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙: 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48 从生产零件内径的尺寸看,谁生产的零件质量较高?

解:
x甲 ? 25.401,

x乙 ? 25.406,

s甲 ? 0.037,

s乙 ? 0.068.

甲生产的零件内径更接近内径标准,且稳定程度

较高,故甲生产的零件质量较高.

说明:生产质量可 以从 总体的平均数与标准差两

个角度来衡量,但甲、乙两个总体的平均数与标

准差都是不知道的,我们就用样本的平均数与标

准差估计总体的平均数与标准差.

【变式练习】

1.某校高二年级在一次数学选拔赛中,由于甲、乙两人

的竞赛成绩相同,从而决定根据平时在相同条件下进行

的六次测试确定出最佳人选,这六次测试的成绩数据

如下:

甲 127 138 130 137 135 131

乙 133 129 138 134 128 136

求两人比赛成绩的平均数以及方差,并且分析成绩的

稳定性,从中选出一位参加数学竞赛.

[解析] 设甲乙两人的平均数分别为 x 甲 ,x 乙 ,

则 x 甲 =130+ 1 x (-3+8+0+7+5+1)=133,
6

x 乙 =130+ 1 x (3-1+8+4-2+6)=133,

6

s

2 甲

=1 x

[(-6)2+52+(-3)2+42+22+(-2)2]= 4 7 ,

s

2 乙

6
=1 x

[02+(-4)2+52+12+(-5)2+32]= 3 8

6

3

3 ,

因此,甲与乙的平均数相同,由于乙的方差较小,

所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛

比较合适.

2.设样本数据 x1,x2 , ,x10的均值和方差分别为 1 和 4,若 yi =xi +a(a 为非零常数,i=1,2, 10),则 y1,? y2 , y10 的均值和 方差分别为( )

A.1+a,4

B.1+a,4+a

C.1,4

D.1,4+a

【解析】选 A.样本数据 x1,x2 , ,x10的均值

x

'

=

1 10

(x1

+x2

+

+x10 )=1,方差

s'2

=

1 10

[(x1

-1)2

+(x2

-1)2

+

+(x10 -1)2 )=4;

新数据 x1 +a,x2 +a, ,x10 +a 的均值

1

1

x= 10 (x1 +a+x2 +a+ +x10 +a)= 10 (x1 +x2 + +x10 )+a=1+a,

新数据 x1 +a,x2 +a, ,x10 +a 的方差

s2

=

1 10

[(x1

+a-1-a)2

+(x2

+a-1-a)2

+

+(x10 +a-1-a)2 ]=4.

【总结提升】 1.考点平二均数与方差都是重要的数字特征,是对总体的一 种简明地描述,平均数、中位数、众数描述其集中趋势, 方差和标准差描述波动大小. 2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为 x ,那么 mx1+a,
mx2+a,mx3+a,…,mxn+a 的平均数是 m x +a.
(2)数据 x1,x2,…,xn 的方差为 s2. ①数据 x1+a,x2+a,…,xn+a 的方差也为 s2. ②数据 ax1,ax2,…,axn 的方差为 a2s2.

考点二
1.(2015·高考重庆卷)重庆市 2013 年各月的平均气温

(℃)数据的茎叶图如图:

则这组数据的中位数是( B )

A.19

B.20

C.21.5

D.23

2.抽样统计甲、乙两位射击运动员的5次训练成绩 (单位:环),结果如下:

运动员 第1次 第2次 第3次 第4次 第5次



87

91

90

89

93



89

90

91

88

92

则成绩较为稳定(方差较小)的那位运动员成绩的 方差为_______.

解: x甲=87+91+950+89+93=90
x乙=89+90+951+88+92=90 S 甲 2=(8 7 ? 9 0 )2? ( 9 1 - 9 0 ) 2 + ( 9 0 - 5 9 0 ) 2 + ( 8 9 - 9 0 ) 2 + ( 9 3 - 9 0 ) 2 = 4 S 乙 2=(8 9 ? 9 0 )2? ( 9 0 - 9 0 ) 2 + ( 9 1 - 5 9 0 ) 2 + ( 8 8 - 9 0 ) 2 + ( 9 2 - 9 0 ) 2 = 2
答案:2

3.现有10个数,其平均数为3,且这10个数的平方和

是100,那么这个数组的标准差是( A )

A.1

B.2

C.3

D.4

解: 由s2= 1 (x12+ x22 +…+ xn2)- x 2, 得 n
s2= 1 ×100-32=1. 10

4.甲、乙两个班各随机选出 15名同学进行测验,所得成 绩的茎叶图如图.从图中看, _____班的平均成绩较高. 【解析】结合茎叶图中成绩 的情况可知,乙班平均成绩较高. 答案:乙

5.统计某校1 000名学生的数学会考成绩,得到样本 频率分布直方图如图所示,规定不低于60分为及格, 不低于80分为优秀,则及格人数是______;优秀率为 ______.

【解析】由已知不低于60分及格,则及格的频 率为0.025×10+0.035×10+0.01×20 =0.25+0.35+0.2=0.8. 所以及格的人数为1 000×0.8=800. 不低于80分为优秀,则优秀的频率为 0.01×20=0.2. 所以优秀率为20%. 答案:800 20%

众数 样 本 中位数 的 数 字 特 平均数 征
标准差

频率分布直方图中最 高矩形下端的中点
中位数两边的直 方图的面积相等
频率分布直方图中每个小矩 形的面积乘以小矩形底边中 点的横坐标之和

进步是从看到自己的落后开始的;高明是 从解剖自己的弱点开始的.