当前位置:首页 >> 数学 >>

频率分布直方图


用样本的频率分布估计总体分布

一 、教学目标
? 1 通过实例体会分布的意义和作用。 ? 2 在表示样本数据的过程中,学会列频率 分布表,画频率分布直方图、频率折线图 和茎叶图。 ? 3 通过实例体会频率分布直方图、频率折 线图、茎叶图的各自特征,从而恰当地选 择上述方法分析样本的分布,准确地做出 总体估计。

二、教学重点

与难点
? 重点:会列频率分布表,画频率分布直方 图、频率折线图和茎叶图。 ? 难点:能通过样本的频率分布估计总体的 分布。

我国是世界上严重缺水的国家之一, 城市缺水问题较为突出。

2000年全国主要城市中缺水情况排在前10位的城市

某市政府为了节约生活用水,计划在本市试行居 民生活用水定额管理,即确定一个居民月用水量 标准a , 用水量不超过a的部分按平价收费,超过a 的部分按议价收费。

①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
②为了较合理地确定这个标准,你认为需要做 哪些工作?

通过抽样,我们获得了100位居民某年的月平均用水量 (单位:t) ,如下表:

思考:由上表,大家可以得到什么信息?

1.求极差(即一组数据中最大值与最小值的差) 4.3 - 0.2 = 4.1 2.决定组距与组数
组数:将数据分组,当数据在100个以内时,

按数据多少常分5-12组。
组距:指每个小组的两个端点的距离,

极差 4.1 组数= = = 8.2 组距 0.5 3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]

4.列频率分布表 100位居民月平均用水量的频率分布表

注意:这里出来了条形图中条形的宽度。频率不仅与条形的高 度有关,而且与它的宽度有关。 为了使选择不同宽度的总体分布相同,我们用另一种图形表 示,即直方图——用面积表示概率。

5.画频率分布直方图
频率/组距 0.50 0.40 0.30 0.20 0.10 0

注意: ① 这里的纵坐标不是频率, 而是频率/组距;
直方图

② 某个区间上的频率用这个 区间的面积表示;
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t

频率 小长方形的面积 = 组距× = 频率 组距 思考:所有小长方形的面积之和等于?

画一组数据的频率分布直方图,可以按以下的 步骤进行:
一、求极差,即数据中最大值与最小值的差 二、决定组距与组数 :组距=极差/组数 三、分组,通常对组内数值所在区间, 取左闭右开区间 , 最后一组取闭区间 四、登记频数,计算频率,列出频率分布表 五、画出频率分布直方图(纵轴表示频率/组距)

频率/组距 0.50 0.40 0.30 0.20 0.10 0

0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t

如果当地政府希望85%以上的居民每月的用水量不超出 标准,根据频率分布表和频率分布直方图,你能对制定 月用水量提出建议吗? 你认为3吨这个标准一定能够保证85%以上的居民用水 量不超过标准吗?

频率/组距 0.50 0.40 0.30 0.20 0.10 0

0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t

分析:月用水量在3 t以上的居民所占的比例为6% +4%+2%=12%,即大约有12%的居民月用水量在3t以 上,88%的居民月用水量在3t以下. 因此,居民月 用水量标准定为3t是一个可以考虑的标准.

频率/组距 0.50 0.40 0.30 0.20 0.10 0

0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t

想一想:你认为3t这个标准一定能够保证85%以 上的居民用水不超标吗?如果不一定,那么哪些 环节可能会导致结论的差别?

所得到的结论的统计意义
? 3t这个标准一定能保证85%以上的居民用 水不超标吗? ? 不一定! ? 原因1、样本只是总体的代表,并且具有 随机性,不同的样本所得到的频率分布表 和直方图是不同的。 ? 原因2、明年的用水情况与今年不可能完 全一样,但应该大致一样。

高考题型:
广东文 11 题 5 分 11 .为了调查某厂工人生产某种产品的能 力,随机抽查了 20 位工人某天生产该产品 的数量 . 产 品数量 的分 组区间 为 ?45,55? , 频率/组距 ?55,65? , ?65,75? ,

?75,85? , ?85,95? ,由此得

0.040 0.035 0.030 0.025 0.020 0.015 0.010 0.005 0 45 55 65 75 85 图3 95 产品数量

到频率分布直方图如图 3,则这 20 名工人中一 天生产该产品数量在 ?55,75? 的 人 数 是
13

.

练习
1.有一个容量为50的样本数据的分组的频数如下: [12.5, 15.5) 3
[15.5, 18.5) [18.5, 21.5) 8 9 [24.5, 27.5) [27.5, 30.5) [30.5, 33.5) 10 5 4

[21.5, 24.5) 11 (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的 百分比是多少?

解:组距为3
分组 频数
3

频率

频率/ 组距

[12.5, 15.5)

[15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) [30.5, 33.5) 5 4

0.06 0.16 0.18 0.22 0.20 0.10 0.08

0.020 0.053 0.060 0.073 0.067 0.033 0.027

频率分布直方图如下:
频率 频率/ 组距

组距
0.070 0.060 0.050 0.040 0.030 0.020 0.010 12.5 15.5 18.5 21.5 24.5 27.5

0.020 0.053 0.060 0.073 0.067 0.033 0.027

所得到的结论的统计意义
? 一般的,统计得到的结果,是对于总体较 为合理的估计或预测,但其误差应该控制 在合理的范围之内。 ? 也正因为这样,统计结果的好坏,往往需 要进一步的评价,或通过理论方法的检验, 或通过实际应用的检验。

频率分布直方图的优缺点是什么? ? 频率分布表和频率分布直方图在带给 我们许多新的信息的同时,也丢失了 一些信息,如原始数据不能在分布表 和直方图中很好地体现出来。

应用举例:
例1.一个容量为100的样本,数据的分组和各组的 相关信息如下表,试完成表中每一行的两个空格.
分组 [12,15) [15,18) [18,21) 频数 6 频率 0.08 0.30 频率累计

[21,24) [24,27) [27,30) [30,33) [33,36]
合计

21
0.69 16

0.10
1.00 100 1.00

? 连接频率分布直方图中各小长方形上端的 中点,就得到频率分布折线图。
直方图(0.5组距) 0.6 0.5
频率/组距

0.4 0.3 0.2 0.1 0

思考:上例的样本容量为100,如果增至1000,其频率 分布直方图的情况会有什么变化? 假如增至10000呢?

分析:样本容量越大,这种估计越精确。但 随着样本容量的增加,作图时所分的组数增 加,组距减小,相应的频率折线图会越来越 接近于一条光滑曲线.

总体密度曲线
当样本容量无限增大,分组的组距无限缩小,那么 频率分布直方图就会无限接近一条光滑曲线——总体密 度曲线. 总体密度曲线
频率 组距

区间 (a , b) 在总体内取值的概率

产品 尺寸 (mm)

a

b

1、某赛季甲、乙两名篮球运动员每场比赛得分的原始记录 如下: (1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39 (2)乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39

茎叶图

8
茎是指中间的一列 数,表示得分的十位 3 6 8 数


0 1

4 6 3

2 5

2
3

3 8 9

叶就是从茎的旁边 5 4 生长出来的数,表示得 分的个位数。

1 6 1 6 7 9
4 9

4 1
5

0

画茎叶图的步骤: ? 1.将每个数据分为茎(高位)和叶(低位)两部 分,在此例中,茎为十位上的数字,叶为个位上 的数字。 ? 2.将最小茎和最大茎之间的数按大小次序排成一 列。 ? 3.将各个数据的叶按读数次序(或按大小次序) 写在其茎的左(右)侧。

茎叶图不仅能够保留原始数据,而且能够 展示数据的分布情况。
从运动员的成绩的分布来看,乙运动员的 成绩更好;从叶在茎上的分布情况来看,乙运 动员的得分更集中于峰值附近,说明乙运动员 的发挥更稳定。 在样本数据较少时,用茎叶图表示数据的 效果较好。它不但可以保留所有信息,而且可 以随时纪录,这对数据的纪录和表示都能带来 方便。但当样本数据较多时,茎叶图就显得不 太方便。因为每一个数据都要在茎叶图中占据 一个空间,如果数据很多,枝叶就会很长。

知识回顾
频率分布直方图
应用

1.求极差 2.决定组距与组数

步骤

3.将数据分组
4.列频率分布表 5.画频率分布直方图

频率分布折线图
频率/组距 0.50 0.40 0.30 0.20 0.10 0

0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t

连接频率直方图中各小长方形上端中点的折线,叫 频率分布折线图

当样本容量无限增大,分组的组距无限缩小,那 么频率分布折线图就会无限接近一条光滑曲线 ——总体密度曲线.
频率 组距

总体在区间(a , b)内取值的频率

S
a b

产品 尺寸 (mm)

应用举例:
例2、对某电子元件进行寿命追踪调查,情况如下:
寿命 个数
100~200 200~300 300~400 400~500 500~600

20

30

80

40

30

(1)列出频率分布表; (2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的频率; (4)估计电子元件寿命在400h以上的频率;

(1)列出频率分布表;
寿命 100~200 200~300 300~400 400~500 500~600 合计 频数 20 30 80 40 频率 0.10 0.15 0.40 0.20 累积频率 0.10

30 200

0.15 1

0.25 0.65 0.85 1

频率/组距

0

100 200 300 400 500 600 寿命( h)

(3)由频率分布表可以看 出,寿命在 100h ~ 400 的电子元件出现的频率 为 : 0.65,所以我们估计电子 元件寿命在 100h ~ 400h的概率为: 0.65.

( 4 ) .由频率分布表可知,寿 命在400h以上的电子 元件出现的频率为: 0.20 ? 0.15 ? 0.35 ,故我们 估计电子元件寿命在 400h以上的概率为: 0.35.

高考题型:
广东文 11 题 5 分 11 .为了调查某厂工人生产某种产品的能 力,随机抽查了 20 位工人某天生产该产品 的 数 量 . 产品 数 量 的 分组 区 间 为 ?45,55? , 频率/组距 ?55,65? , ?65,75? ,

?75,85? , ?85,95? ,由此得

0.040 0.035 0.030 0.025 0.020 0.015 0.010 0.005 0 45 55 65 75 85 图3 95 产品数量

到频率分布直方图如图 3,则这 20 名工人中一 天生产该产品数量在 ?55,75? 的 人 数 是 .

探究:
同样一组数据,如果组距不同,横轴、纵轴的单位 不同,得到的图的形状也会不同。不同的形状给人以不 同的印象,这种印象有时会影响我们对总体的判断。分 别以1和0.1为组距重新作图,然后谈谈你对图的印象。

例题、从某企业全体员工某月的工资表中随机 抽取 了50名员工的工资资料如下:
800、800、800、800、800、1000、1000、 1000、 1000、1000、1000、1000、1000、1000、1000、 1200、1200、1200、1200、1200、1200、1200、 1200、1200、1200、1200、1200、1200、1200、 1200、1200、1200、1200、1200、1200、1500、 1500、1500、1500、1500、1500、1500、2000、 2000、2000、2000、2000、2500、2500、2500

(1)画出50名员工的工资的频率分布直方图

一、列出频率分布表
分组

750∽ 1050 1050∽1350 1350∽1650 1650∽1950 1950∽2250
2250∽2550
频率/组距 0.0014 0.0012 0.001 0.0008 0.0006 0.0004 0.0002 0 750 1050

频数 15 20 7

频率 0.3 0.4 0.14

频率/组距 0.001 0.0013 0.00047

0 5
3

0 0.1
0.06

0 0.00033
0.0002

1350

1650 1

1950

2250

2550

新课讲授
初中我们学过用平均数、众数和中位数反映总体的 水平,用方差考察稳定程度。

我们还有一种简易的方法,就是将这些数据有条理 的列出来,从中观察数据的分布情况,这种方法就 是茎叶图。
制作茎叶图的方法

将所有两位数的十位数字作为“茎”,个位数字作 为“叶”,茎相同者共用一个茎,茎按从小到大的 顺序从上向下列出,共茎的叶一般按从大到小(或 从小到大)的顺序同行列出。

例1:某篮球运动员在某赛季各场比赛的得 分情况如下:12,15,24,25,31,31,36, 36,37,39,44,49,50 茎叶图: 茎: 十位 数字
1 2

25 45
116679

3
4 5

49
0

叶:表 示个位 数字

注: 1、重复出现的数据要重复记录,不能遗 漏;特别是“叶”部分;

2、所有的信息都可以从这个茎叶图中得到; 3、茎叶图便于记录和表示;

4、不足的是其分析只是粗略的,对差异不 大的两组数据不易分析;表示三位数以上 的数据时不够方便;

例2:甲、乙两篮球运动员上赛季每场比 赛的得分如下,试比较这两位运动员的得 分水平: 甲 12,15,24,25,31,31,36,36, 37,39,44,49,50 乙 8,13,14,16,23,26,28,33, 38,39,51,33,29





0
2 5 0 5 116679 4 9 1 2 3 4

8
3 4 6 3 6 8 9 8913

0

5

1

注:中间的数字表示得分的十位数字。
旁边的数字分别表示两个人得分的个位数。

例3: 为了了解各自受欢迎的程度,甲、乙两个网 站分别随机选取了14天,记录下上午8:00- 10:00间各自的点击量: 甲:73,24,58,72,64,38,66, 70,20,41,55,67, 8,25;

乙:12,37,21, 5,54,42,61,
45,19, 6,19,36,42,14.

你能用茎叶图表示上面的数据吗?你认为甲、 乙两个网站哪个更受欢迎?

练习.从甲、乙两品种的棉花中各抽测了 25 根棉花的纤维长度(单位:mm) , 结果如下: 甲品种: 271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 乙品种: 284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356 由以上数据设计了如下茎叶图
甲 7 5 5 8 7 3 9 8 5 7 3 5 4 3 4 5 4 1 0 2 1 0 3 1 2 27 28 29 30 31 32 33 34 35 4 2 4 2 0 1 3 6 乙

5 6 3 2 3

7 5 5 6 8 8 2 4 7 9 6 7

根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论: ① ;② .

练习: 非典期间某医院的发热门诊部对 一天接待的 16 名病人的体温进行了测 量,得到以下数据,请作出当天病人体 温数据的茎叶图。
37.5 37.6 38 39.2 39.2 38.1 38.5 39.5 39.5 37.8 37.8 38.5 39.12 38.17 38.7 39.33

2. 有两个班级,每班各自按学号随机选 出 10 名学生,测验铅球成绩,以考察体 育达标程度,测验成绩如下:单位(米) 甲 9.12 7.88 8.42 6.94 5.20 7.22 7.96 8.06 6.69 4.92 乙 8.80 8.45 7.34 7.06 6.71 8.38 9.80 8.68 6.83 5.86 两个班相比较,哪个班整体实力强一 些?

3. 从全年级的两个班调研考试成绩中每班任意 抽取 20 名的数学成绩如下(总分 150 分) 甲班: 120 118 135 134 140 146 108 110 98 乙班: 138 124 147 96 108 117 125 137 119 108 132 121 97 104 114 135 127 124 135 107 试用茎叶图分析,哪个班成绩比较稳定。 98 142 126 118 112 95 103 148 92 121 132

小结 图形 优点 缺点

频率分布
直方图

1)易表示大量数据

丢失一些

2)直观地表明分布地 情况 1)无信息损失 茎叶图

信息 只能处理样本

2)随时记录方便记录和表示 容量较小数据


相关文章:
频率分布直方图考试题
0.0 据有关调查,在一周内,某地区查处酒后驾 0.01 2 车和醉酒驾车共 500 人.如图是对这 500 人血液中 5 0.0 酒精含量进行检测所得结果的频率分布直方图,...
频率分布直方图
频率分布直方图_数学_高中教育_教育专区。高二年级数学学科教学案 主备人:马杰 审核人:杨金屿 编写日期:2009.0 2.2.2 频率分布直方图与折线图【教学内容】 ...
频率分布直方图教案
频率分布直方图教案_数学_高中教育_教育专区。第三节 用样本估计总体(1)---频率分布直方图教学目标:1.能进行样本的频率分布直方图中的有关计算,进而解决一些简单的...
频率分布直方图练习题
频率分布直方图练习题 1、 《中华人民共和国道路交通安全法》规定: 车辆驾驶员血液酒精浓度在 20~80 mg/100mL (不含 80) 之间, 属于酒后驾车; 血液酒精浓度在...
题目de04fb1fb7360b4c2e3f64f4
百度高考 数学 频率分布表、频率分布直方图、频率分布折线图、茎叶图 单选题 数学 频率分布表、频率分布直方图、频率分布折线图、茎叶图 频率分布直方图中,小长...
第八章第一讲频率分布直方图
() 成频率分布直方图(如图) ,若要从身高在 [120,130 ) , [130,140 ) , [140,150] 三组内 的学生中,用分层抽样的方法选取 30 人参加一项活动,则从...
利用频率分布直方图计算中位数
利用频率分布直方图计算中位数_销售/营销_经管营销_专业资料。利用频率分布直方图计算中位数从下列频率分布直方图中估计所有中位数与众数之和为( )元。 答案:7400 ...
用excel绘制频率分布表和频率分布直方图
用excel绘制频率分布表和频率分布直方图_计算机软件及应用_IT/计算机_专业资料。文档贡献者 karen7022011 贡献于2014-02-10 专题推荐 2014下半年教师资格...专题 ...
Excel生成频率分布表及频率分布直方图详细操作
3.生成频数分布表(直方图) 、累积频率分布表(直方图) (1)打开“工具/数据分析” ,在分析工具窗口中选择“直方图” ; 1 (2)在直方图弹出窗口(如下图所示)的...
Excel生成频率分布表及频率分布直方图详细操作
3.生成频数分布表(直方图) 、累积频率分布表(直方图) (1)打开“工具/数据分析” ,在分析工具窗口中选择“直方图” ; (2)在直方图弹出窗口(如下图所示)的“...
更多相关标签:
频数分布直方图 | 频率直方图 | 频率分布直方图练习题 | excel频率分布直方图 | 直方图 | 频率 | 频率分布图 | 频率分布直方图怎么画 |