当前位置:首页 >> 数学 >>

2.2.1 用样本的频率分布估计总体分布


2.2.1 用样本的频率分布估计总 体分布(1)

问题提出
1.随机抽样有哪几种基本的抽样方法? 简单随机抽样、系统抽样、分层抽样. 2.随机抽样是收集数据的方法,如何通 过样本数据所包含的信息,估计总体的 基本特征,即用样本估计总体,是我们 需要进一步学习的内容. 阅读教材P65-70页

我国的缺水情况
? 我

国是世界上严重缺水的国家之一。

城市缺水问题较为突出统计。

2000年全国主要城市中缺 水情况排在前10位的城市

(一) 频率分布表:
【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民 生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的 月均用水量如下表(单位:t):

100位居民的月均用水量(单位:t)
3.1 3.4 3.2 3.3 3.2 3.0 2.5 2.6 2.5 2.8 2.5 2.6 2.7 2.8 2.9 2.9 2.8 2.7 2.6 2.5 2.0 2.2 2.3 2.3 2.4 2.4 2.3 2.4 2.3 2.2 2.0 2.2 2.1 2.2 2.3 2.4 2.3 2.1 2.1 2.0 1.5 1.5 1.6 1.7 1.8 1.9 1.8 1.7 1.6 1.5 1.0 1.2 1.2 1.3 1.4 1.3 1.3 1.4 1.0 1.0 1.6 0.2 3.7 3.6 3.5 1.4 1.3 1.2 1.0 1.2 1.8 0.4 1.5 1.7 1.9 1.8 1.6 1.5 1.7 1.8 1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6 1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2

思考1:上述100个数据中的最大值和最小 值分别是什么?由此说明样本数据的变化 范围是什么? 0.2~4.3

思考1:上述100个数据中的最大值和最小 值分别是什么?由此说明样本数据的变化 范围是什么? 0.2~4.3 思考2:样本数据中的最大值和最小值的 差称为极差.如果将上述100个数据按组距 为0.5进行分组,那么这些数据共分为多 少组? (4.3-0.2)÷0.5=8.2

思考3:以组距为0.5进行分组,上述100个 数据共分为9组,各组数据的取值范围可以 如何设定?
[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].

思考4:如何统计上述100个数据在各组中 的频数?如何计算样本数据在各组中的频 率?你能将这些数据用表格反映出来吗?

100位居民的月均用水量的频率分布表
分 组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计 频数 频数 4 8 15 22 25 14 6 4 2 100 频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00

思考5:上表称为样本数据的频率分布表, 由此可以推测该市全体居民月均用水量分 布的大致情况,给市政府确定居民月用水 量标准提供参考依据,这里体现了一种什 么统计思想? 用样本的频率分布估计总体分布.

思考6:如果市政府希望85%左右的居民每 月的用水量不超过标准,根据上述频率分 布表,你对制定居民月用水量标准(即a的 取值)有何建议? 88%的居民月用水量在3t以下,可建 议取a=3.

思考7:对样本数据进行分组,其组数是由 哪些因素确定的? 对样本数据进行分组,组距的确定 没有固定的标准,组数太多或太少,都会 影响我们了解数据的分布情况.数据分组的 组数与样本容量有关,一般样本容量越大, 所分组数越多.

思考8:一般地,列出一组样本数据的频 率分布表可以分哪几个步骤进行? 第一步,求极差.

第二步,决定组距与组数.
第三步,确定分点,将数据分组. 第四步,列频率分布表.

(二) 频率分布直方图
频率/组距
0.50

思考1:为了直观反映样本数据在各 组中的分布情况,我们将上述频率分 布表中的有关信息用下面的图形表示:

0.40 0.30 0.20 0.10 0

0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t

思考2: 频率分布直方图中

频率/ 组距
0.5 0

频率 小长方形的高? 组距 小长方形的面积表示什么?
0

0.4 0 0.3 0 0.2 0 0.1 0

0.5 1 1.5 2 2.5 3 月平均用水 3.5 4 4.5 量/t

频率 =频率 小长方形的面积= 组距× 组距 所有小长方形的面积和=?
所有小长方形的面积和=1.

组距0.5 0.6 0.5 0.4 0.3 0.2 0.1 0 1 2 3 4 5 6 7 8 9 组距0.5 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0

组距0.1

组距0.1

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49

组距1.0 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 1 2 3 4 5

组距1.0

同样一组数据,如果组距 不同,横轴、纵轴单位不 同,得到的图的性状也会 不同.不同的形状给人不同 的印象,这种印象会影响 我们对总体的判断.

从图中我们可以看到 ,月均 用水量在区间[2,2.5)内的 居民最多,在[1.5,2)内次 之,大部分居民的月均用 水量都在[1,3)之间.

直方图能够很容易地表示大量数据,非常直观地 表明分布的形状,使我们能够看到分布表中看不清楚 的数据模式,但是直观图也丢失了一些信息,例如, 原始数据不能在图中表示出了.

频率分布折线图
如果将频率分布直方图中各相邻的矩形的上底边 的中点顺次连结起来,就得到一条折线,我们称这条 折线为本组数据的频率折线图.
组距0.5 0.6 0.5 0.4 0.3 0.2 0.1 0 1 2 3 4 5 6 7 8 9 组距0.5 0.6 0.5 0.4 0.3 0.2 0.1 0 1 2 3 4 5 6 7 8 9 组距0.5 组距0.5

频率折线图的优点是它反映了数据的变化趋势.如果 将样本容量取得足够大,分组的组距取得足够小,则 这条折线将趋于一条曲线,我们称这一曲线为总体分 布的密度曲线. 总体密度曲线
总体在区间(a , b)内取值的概率

练习:有一个容量为50的样本数据的分组的 频数如下: [12.5, 15.5) 3 [15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在 [15.5, 24.5)的概率约是多少? [24.5, 27.5) 10 [27.5, 30.5) 5 [30.5, 33.5) 4

解: 组距为3
分组 频数 频率 频率/ 组距

[12.5, [15.5, [18.5, [21.5, [24.5, [27.5, [30.5,

15.5) 3 18.5) 8 21.5) 9 24.5) 11 27.5) 10 30.5) 5 33.5) 4

0.06 0.16 0.18 0.22 0.20 0.10 0.08

0.020 0.053 0.060 0.073 0.067 0.033 0.027

频率 组距 0.070 0.060 0.050

频率分布直方图如下:

0.040
0.030 0.020 0.010 12.5 15.5 18.5 21.5 24.5 27.5 30.5 33.5

样本数据

⑶数据落在[15.5,24.5)范围的频率为 0.16+0.18+0.22 = 0.56

∴数据落在[15.5,24.5)内的概率约为0.56.

2. 一个社会调查机构就某地居民的月收入调查了 10000人,并根据所得数据画了样本的频率分布直方图 (如右图).为了分析居民的收入与年龄、学历、职 业等方面的关系,要从这10000人中再用分层抽样方法 抽出100人作进一步调查,则在[2500,3000)(元) 月收入段应抽出 人.
解:由直方图可得: 在[2500, 3000) (元) 月收入段共有:
10000 ? 0.0005 ? 500 ? 2500(人)
频率/组距

0.0005 0.0004
0.0003

0.0002
0.0001 1000 1500 2000 2500 3000 3500 4000

按分层抽样应抽出:
100 2500 ? ? 25(人) 10000

月收入 ( 元 )

3.

解: 由题意得, x ? 0.2 , ? x ? 4 .

20

∴ 数据落在 [10,50) 的概率约为:

2 ? 3 ? 4 ? 5 ? 0.7 . 20 20 20 20

小结:
步骤
频率分布直方图 应用

1.求极差 2.决定组距与组数

3.将数据分组
4.列频率分布表 5.画频率分布直方图

思考: 如果当地政府希望使 85% 以上的居 民每月的用水量不超出标准,根据频率分布 表和频率分布直方图,你能对制定月用水量 标准提出建议吗?

小结:画频率分布直方图的步骤
1.求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1 2.决定组距与组数(将数据分组) 组距:指每个小组的两个端点的距离 , 组数:将数据分组,当数据在100个以内时,
极差 4.1 ? ? 8.2 按数据多少常分5-12组. 组数= 组距 0.5

3.将数据分组(8.2取整,分为9组) 4.列出频率分布表.(学生填写频率/组距一栏) 5.画出频率分布直方图


相关文章:
2.2.1用样本的频率分布估计总体分布习题(2)
§2.2.1 用样本的频率分布估计总体分布习题典例分析: 例 1 在某小学 500 名学生中随机抽 样得到 100 人的身高如下表 ( 单位 cm) : (1)列出样本频率...
教案§2.2.1用样本的频率分布估计总体分布
§2.2.1 用样本的频率分布估计总体分布汶上一中 丁阳会 2010-3-20 【教材分析】 教材分析】 本节课的主要内容是学习画样本的频率分布直方图和用样本的频率分布...
2.2.1用样本的频率分布估计总体分布
2.2.1用样本的频率分布估计总体分布_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 2.2.1用样本的频率分布估计总体分布_数学_高中教育_教育专区...
2.2.1用样本的频率分布估计总体分布(第1课时)
2.2 2.2.1 用样本的频率分布估计总体分布 学案(第 1 课时) 总第 094 课时 执笔人:芦建宾 2010 年 5 月 20 日一、学习目标:学会列频率分布表、画频率...
2.2.1用样本的频率分布估计总体分布课时作业
2.2.1用样本的频率分布估计总体分布课时作业_数学_高中教育_教育专区。高二数学...[35,40]时,所作的频率分布直方图如图所示,则原始茎叶图可能是( ) 16. (...
2.2.1用样本的频率分布估计总体分布习题(1)
典例分析: 例 1 在某小学 500 名学生中随机抽 样得到 100 人的身高如下表 ( 单位 cm) : (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计该...
必修三第二章统计:用样本的频率分布估计总体分布练习
2.2.1 用样本的频率分布估计总体分布同步练习题一、选择题: 1.在某一所中学举行一次数学竞赛中,将参赛的学生成绩进行整理分组,分成 5 组,从左到 右的第一组...
导学案 2.2.1 用样本的频率分布估计总体的分布
使用时间:6 月 13 日 主备人:苍安江 知识目标:1、能列出频率分布表,能画出频率分布的条形图、直方图、茎叶图和折线图; 2、会用样本频率分布估计总体分布...
教案§2.2.1用样本的频率分布估计总体分布 教案
§2.2.1 用样本的频率分布估计总体分布【教材分析】 本节课的主要内容是学习画样本的频率分布直方图和用样本的频率分布直 方图估计总体分布这一统计思想方法,在...
更多相关标签:
样本估计总体 | 用样本估计总体ppt | 用样本估计总体 | 用样本估计总体教案 | 样本均值估计总体均值 | 样本方差估计总体方差 | 2.2用样本估计总体 | 用样本估计总体知识点 |