当前位置:首页 >> >>

高中数学第2章统计2.3总体特征数的估计2.3.2方差与标准差教案苏教版必修3

。 。 。 。 内部文件,版权追溯 内部文件,版权追溯 内部文件,版权追溯
2.3.2 方差与标准差
整体设计 教材分析 “方差与标准差”这节课在上节课平均数的基础上,从实例“有甲、乙两种钢筋,检查 它们的抗拉强度”中平均数不是反映总体质量、水平的唯一特征数,在平均值相差不大的情 况下,数据的稳定程度可以作为评价对象质量高低的又一重要因素,从而说明引入方差、标 准差的必要性,同时使学生养成从多个角度看问题的习惯,锻炼了学生的创造性思维. 为了让学生充分体会“稳定性”的意义,教材中用数轴表示两组数据,形象地表现出数 据的“聚散”程度,并用极差反映数据的稳定性.当两组数据的极差相差不大时,就不适宜 用极差来表示稳定性,这时可用“方差与标准差”作为比较数据稳定性的特征数. 初中已学过方差概念,现在的教学不能停留在原有的水平上,要将用方差刻画数据的稳 定程度的理由讲清楚,充分揭示用方差作为比较数据稳定性水平的特征数的思维过程. 通过方差的单位与原数据的单位的比较,通过实际问题的分析,让学生了解到用方差反 映稳定性水平的不足之处是与原数据单位不一致,且平方后可能夸大偏差的程度等,从而引 入“标准差”的概念,这一过程应让学生在形成问题和解决问题的过程中加以探索. 三维目标 1.通过对具体案例的分析掌握样本数据的平均数、方差与标准差的基本概念和计算方 法,培养学生分析问题和解决问题的能力,激发学生探究数学问题的兴趣和动机. 2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,形成对数据处理过程 进行初步评价的意识. 3.引导学生对一些生活中实际问题的学习, 进一步培养学生的数学素养和增强学生的 数学应用意识及认真、耐心、细致的学习态度和学习习惯. 4.渗透数学来源于实践,反过来又作用于实践的观点. 重点难点 教学重点:1.通过实例理解样本数据方差与标准差的意义和作用,学会计算数据的样本 方差与标准差. 2.根据方差与标准差对事件进行科学的决策,形成对数据处理过程进行初步评价的意 识. 教学难点:1.方差与标准差的计算方法及运算的准确性. 2.用样本的基本数字特征估计总体的基本数字特征,从中进一步理解统计的基本思想. 课时安排 1 课时
教学过程 导入新课 平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的 片面判断.某地区的统计报表显示,此地区的年平均家庭收入是 10 万元,给人的印象是这个
1

地区的家庭收入普遍比较高.但是,如果这个平均数是从 200 户贫困家庭和 20 户极富有的家 庭收入计算出来的,那么它就既不能代表贫困家庭的年收入,也不能代表极富有家庭的年收 入.因为这个平均数掩盖了一些极端情况.而这些极端情况显然是不能被忽视的.因此,只有 平均数还难以概括样本数据的实际情况.
举例:有甲、乙两种钢筋,现从中各抽取一个样本(如下表)检查他们的抗拉强度(单 位:kg/mm2),通过计算发现,两个样本的平均数均为 125.

哪种钢筋的质量较好? 两种钢筋的平均数都是 125,那么,它们有没有什么差异呢?

推进新课 作出图形,作直观比较: 直观上看,还是有差异的.乙的强度比较分散,甲的强度相对集中.因此,我们还需要从 另外的角度来考察这两组数据. 例如,在作统计图、表时提到过的极差 甲的强度极差=135-110=25, 乙的强度极差=145-100=45. 它在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本 数据的信息,显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个 最高分,去掉一个最低分”的统计策略. 新知探究 1.方差(variance)的概念: 考察样本数据的分散程度的大小,最常用的统计量是方差,一般用 s2 表示.

假设样本数据是 x1,x2,…,xn, x 表示这组数据的平均数.结合上节课有关离差的讨论可
知,离差越小,稳定性就越高. 因此,通常用如下公式计算方差:

? s 2

?

1 n

n i ?1

( xi

?

x)2

.

因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,因此将其算术平方

? 根 s ?

1 n

n i ?1

(xi

?

x)2

作为样本的标准差(standard deviation),分别简称样本方差、样本标准差. 2.计算样本数据 x1,x2,…,xn 的标准差的算法是: S1 算出样本数据的平均数 x; S2 算出每个样本数据与样本平均数的差 xi-x(i=1,2,…,n); S3 算出 S2 中 xi-x(i=1,2,…,n)的平方; S4 算出 S3 中 n 个平方数的平均数; S5 算出 S4 中平均数的算术平方根,即为样本标准差. 关于方差、标准差的一点说明:

2

(1)方差、标准差是用来描述样本数据的离散程度的,它反映了各个样本数据聚集于 样本平均数周围的程度.方差与标准差越小,表明各个样本数据在样本平均数的周围越集中; 反之,方差标准差越大,表明各个样本数据在样本平均数的周围越分散.
(2)在实际应用中,方差与标准差常被理解为稳定性.例如在上面的比较两种钢筋的抗 拉强度时,方差与标准差越小意味着该产品的质量越稳定;在描述成绩时,方差与标准差越 小,说明成绩越稳定.
(3)学生思考“标准差的取值范围是什么?标准差为 0 的样本数据有什么特点?” 由标准差的定义容易得出标准差是非负的; 标准差为 0 意味着所有的样本数据都相等的特性,且与样本平均数也相等,可以构造一 个样本容量为 2 的样本:x1,x2(x1<x2),这样可以体会出两个样本数据分散程度与样本标准差 之间的关系. 应用示例 例 1 根据下列四组样本数据,说明它们的异同点. (1) 5 5 5 5 5 5 5 5 5; (2) 4 4 4 5 5 5 6 6 6; (3) 3 3 4 4 5 6 6 7 7; (4) 2 2 2 2 5 8 8 8 8. 分析:从数据的数字特征出发. 解:四组数据的平均数都是 5.0,标准差分别是 0.00,0.82,1.49,2.83.虽然它们有 相同的平均数,但是它们有不同的标准差,说明数据的分散程度是不一样的. 点评:样本的方差、标准差能说明数据的分散程度. 例 2 甲、乙两种水稻试验品种连续 5 年的平均单位面积产量如下(单位:t/hm2),试根 据这组数据估计哪一种水稻品种的产量比较稳定.
分析:巩固求方差和标准差的方法. 解:甲品种的样本平均数为 10,样本方差为 [(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02, 乙品种的样本平均数也为 10,样本方差为 [(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24. 因为 0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.
点评:1.本题若仅由 x 甲= x 乙,易产生这两种水稻的产量一样稳定的错觉.这表明在实际
问题中,仅靠期望值(即平均数)不能完全反映问题,还要研究其偏离平均值的离散程度(及 方差或标准差):标准差大说明取值分散性大,标准差小说明取值分散性小或者说取值比较 稳定、集中.
2.要对“根据这组数据估计…”的统计意义作必要的说明:第一,统计研究是以一定的 样本为依据的,对于确定的样本得到确定的统计结果;第二,统计结果具有随机性,选择不 同的样本可能得到不同的统计结果.最后还可让学生思考除了品种的优劣,影响水稻产量还 有哪些因素?根据一组数据得到的结果是否可靠?这些问题的提出会激发学生对统计学理
3

论的兴趣. 例 3 为了保护学生的视力,教室内的日光灯在使用了一段时间后必须更换.已知某校使
用的 100 只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准 差.

分析:用每一个区间内的组中值作为相应日光灯的使用寿命,再求平均使用寿命.

解:各组中值分别为 165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由

此算得平均数约为

165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+

345.5×7%+375.5×2%=268.4≈268(天).

这些组中值的方差为

1

×

100

[1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+20×(255.5-268.4)2+

25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]

=2 128.60(天 2),

故所求的标准差约为 2128 .6 ≈46(天).
答:估计这种日光灯的平均寿命约为 268 天,标准差约为 46 天. 点评:此例的目的是:掌握连续性随机变量的平均值和标准差的一种估计方法,即组中 值估计法.因为前一节例 3 已介绍了连续性随机变量的平均值的估计方法,所以处理此例时 应让学生回忆前例并主动探索解决问题的方法. 例 4 容量是 40 的样本中各数据与 30 的差的平方和是 250,样本标准差是 1.5,求样 本平均数. 分析:根据样本平均数、样本方差、样本标准差的公式解题. 解:∵(x1-30)2+(x2-30)2+…+(x40-30)2=250, 所以(x12+x22+…+x402)-60(x1+x2+…+x40)+40×302=250.

即(x12+x22+…+x402)-60×40 x +40×900=250, ①

又∵140[(x1- x )2+(x2- x )2+…+(x40- x )2]=1.52=2.25,

即(x12+x22+…+x402)-2x(x1+x2+…+x40)+40 x 2=90,

即(x12+x22+…+x402)-80 x 2+40 x 2=90,②

①-②得 40 x 2-2 400x+40×900=160,

即 x 2-60 x +896=0,( x -32)( x -28)=0,

所以, x =32 或 x =28.

4

点评:理解样本方差的含义,抓住关键点:x1+x2+…+x40=40 x ,通过数形结合,结合消
元 x1+x2+…+x40 合理解决问题. 例 5 已知一组数据的方差是 s2,将这组数据的每个数据都加上 10,求所得新数据的方
差. 分析:利用方差公式解题.
解:设原数据:x1,x2,…,xn,平均数是 x ,方差是 s2,
则新数据为:x1+10,x2+10,…,xn+10, 平均数为
则方差为 1 [(x1+10- x -10)2+(x2+10- x -10)2+…+(xn+10- x -10)2] n
= 1 [(x1- x )2+(x2- x )2+…+(xn- x )2]=s2. n
变式训练 某班有 50 名学生,某次数学考试的成绩经计算得到的平均分数是 70 分,标准差是 s, 后来发现登记有误,某甲得 70 分却记为 40 分,某乙 50 分误记为 80 分,更正后重新计算得 标准差为 s1,则 s 与 s1 之间的大小关系是( ) A.s=s1 B.s<s1 C.s>s1 D.不能确定 解析:由题意,平均数不变,所以只要看与平均数的离差的平方的变化情况.因为方差 刻画了数据相对于平均值的平均偏离程度. s 中有:(40-70)2+(80-70)2=1 000,s1 中有:(70-70)2+(50-70)2=400 所以 s>s1. 答案:C 点评:由本例及变式可推理归纳方差的性质: (1)若给定一组数据 x1,x2,…,xn,方差为 s2,则 ax1,ax2,…,axn 的方差为 a2s2; (2)若给定一组数据 x1,x2,…,xn,方差为 s2,则 ax1+b,ax2+b,…,axn+b 的方差为 a2s2, 特别地,当 a=1 时,则有 x1+b,x2+b,…,xn+b 的方差为 s2,这说明将一组数据的每一个数据 都减去相同的一个常数,其方差是不变的,即不影响这组数据的波动性; (3)方差刻画了数据相对于平均值的平均偏离程度.对于不同的数据集,当离散程度越 大时,方差越大; (4)方差的单位是原始测量数据单位的平方,对数据中的极值较为敏感.
知能训练 课本本节练习 解答: 1.甲、乙两个班的样本平均数为 160,但甲班的极差为 3,乙班的极差为 30,故甲班的
5

波动较小.
2.已知 s2=3= 1 [(k1- k )2+(k2- k )2+…+(k8- k )2], 8

而 2(k1 ? 3) ? 2(k2 ? 3) ? ...2(k8 ? 3) ? 2(k1 ? k2 ? ...? k8 ) ? 3? 8 =2 k -3,

8

8

s12=18[(2k1-6-2k+6)2+(2k2-6-2k+6)2+…+(2k8-6-2k+6)2]=4s2=12. 3.甲较稳定. 4.甲的平均值为 10,方差为 0.055;乙的平均值为 10,方差为 0.105. 点评:从练习中再次体会数据的离散程度影响对事件的客观判断,体会从平均数、离散 程度的角度对事件作出科学判断的方法. 课堂小结 1.数据的离散程度影响对事件的客观判断,体会从平均数、离散程度的角度对事件作出 科学判断的方法,方差与标准差越小,表明各个样本数据在样本平均数的周围越集中;反之, 方差与标准差越大,表明各个样本数据在样本平均数的两边越分散; 2.衡量离散程度的常用计算方法——方差与标准差,熟悉用计算器计算方差与标准差的 方法,切实掌握相关的计算公式、方法、步骤并对有关数据进行合理解释; 3.样本的有效选择对判断有重要影响,知道影响判断、决策的因素是多方面的,在对总 体作出判断之前,要充分考虑各种因素,切实体会统计的思想方法; 4.样本数据既具有随机性又具有规律性,在很广泛的条件下,简单随机抽样样本的数字 特征如众数、中位数、平均数、方差与标准差随样本容量的增加及时稳定于总体相应的数字 特征,总体的数字特征是一定的,不存在随机性. 作业 课本习题 2.3 3、5、7.

设计感想 本节课一定要让学生体会平均数反映的是一组数据的平均水平,而方差和标准差则反映 了一组数据的波动大小.在实际学习、工作中用得非常多,比如选择运动员参加大型比赛时, 要看他以前的每次测试的平均成绩,但成绩的稳定性也非常重要;学习上也是如此,稳定了 可以给最后的考试提供稳定心理.用这种与生活的息息相关性激发学生学数学的无限兴趣就 是老师最大的收获.
习题详解 习题 2.3
1. x = 1 (2×5.1+3×5.2+6×5.3+8×5.4+7×5.5+3×5.6+1×5.7)≈5.39. 30
该厂这个月的平均日产值约为 5.39 万元. 2.在全部数据中找出最小值 4.0 和最大值 7.4,两者之差为 3.4,确定全距为 3.5,以 组距 0.5 将区间[4.0,7.5]分成 7 个组.

6

x = 1 (4.25×1+4.75×2+5.25×15+5.75×28+6.25×33+6.75×18+7.25×3)=6.03, 100
估计试验田里麦穗的平均长度约为 6.0 cm. 3.(1)甲机床次品数的平均值为 1.5,乙机床次品数的平均值为 1.2,故乙机床次品数
的平均值较小;(2)甲的方差为 1.65,乙的方差为 0.82,故乙机床的生产状况较为稳定. 4.估计甲机床平均次品率约为(0×0.7+1×0.1+2×0.1+3×0.1)÷1 000=0.06%,乙机床
平均次品率约为(0×0.5+1×0.3+2×0.2+3×0)÷1 000=0.07%,故甲机床的产品质量较好. 5.(1)此样本中金属棒的平均长度约为 5.99; (2)频率分布表如下:
频率直方图如下:
(3)6×(1-0.2%)≈5.99,6×(1+0.2%)≈6.01,故合格的金属棒有 15 根,合格率约为 15÷40≈37.5%.
6.(1)频率分布表如下:
7

频率分布直方图如下:
(2)由组中值估计的总体平均数为
(57×5+65×14+73×25+81×11+89×5)× 1 =72.6,约 73 次. 60
实际总体平均数约为 72,误差约为 1. 7.施了新化肥的土地的平均每块土地产量为 20.52 kg,未施新化肥的土地平均每块土 地产量为 17.36 kg,且施了新化肥的土地产量的方差约为 83.33,未施新化肥的土地产量的 方差约为 154.88,说明用了新化肥不仅平均产量高,而且产量稳定,故可认为新化肥取得 了成功.
8