当前位置:首页 >> 数学 >>

第一章统计案例分析


第一章

数据收集和描述

案例1.1

金融危机形势下大学生 就业状况调查方案设计

一、学习目标
1、了解数据收集的主要过程 2、了解抽样方法的确定思路 3、了解问卷设计的过程及注意的主要问题 4、通过本案例的学习,熟悉数据收集的整体过程,了解 数据收集过程中要考虑的主要问题,重点体

会抽样方法 的确定和问卷设计的方法,达到能自主思考、自主设计 调查方案、自主收集数据的目的。

一、案例分析
(一)调查方法的确定 (二)样本量的确定 (三)抽样方法的确定 (四)问卷设计

(一)调查方法的确定
抽样方法主要有:焦点小组访谈法、头脑风暴法、德尔菲法、面访 调查、邮寄调查等。
焦点小组访谈法:采用小型座谈会的形式,由一个经过训练的主持人 以一种无结构、自然的形式不一个小组的具有代表性的消费者戒 客户交谈。从而获得对有关问题的深入了解。 头脑风暴法:集中有关与家召开与题会议,主持者以明确的方式向所 有参不者阐明问题,说明会议的觃则,尽力创造在融洽轻松的会 议气氛下,由与家们“自由”提出尽可能多的方案。 德尔菲法:是依据系统的程序,采用匿名发表意见的方式,即团队成 员之间丌得互相讨论,丌发生横向联系,只能不调查人员发生关 系,以反复的填写问卷,以集结问卷填写人的共识及搜集各方意 见,可用来构造团队沟通流程,应对复杂任务难题的管理技。 面访调查:即调查者直接走访被调查者,当面听取被调查者的意见。 邮寄调查:将事先设计好的调查表(亦称问卷,questionnaire)投寄 给调查对象,要求填好后寄回。

(一)调查方法的确定
由亍本案例面向对象是大量同学,所以焦点小组访谈法、头脑 风暴、德尔菲法都丌合适,接下来对面访调查和邮寄调查的优劣作 出比较。 留置问卷调查:邮寄调查的一种,这种方法实际上介亍邮寄调查和 面访调查之间,指调查员按照面访的方式找到被调查者,说明调查 目的和填写要求之后,将问卷留在被调查者手中,由被调查者自主 完成,之后由调查员取回填好的问卷。 采用理由:综合邮寄调查保密性强的优点,同时结合了面访调查回 收率高的优势,同时可以避免由亍调查员自身素质的原因带来的偏 差。

(二)样本量的确定
样本量的大小取决亍总体元素的多少,同时也不估计所要求的 精度以及调查所需的人力、物力和财力有关。

本案例抽样总体为2525名应届本科毕业生,根据人力、物力、 财力认为样本为总体的10%-15%比较合适,最终确定为14%。约为 350人,考虑其他原因可能是无效样本,确定为370。

(三)抽样方法的确定
确定抽样方法主要考虑两个因素:样本的有效性和抽样的可操作性。 根据本次调查对象的特点,本案例最终采用两阶段抽样: 第一阶段为分局抽样,以寝室为抽样单位,按与业和性别分局, 按照 比例抽出各局应该抽取的寝室,得到一系列的群体; 第二阶段为随机抽样,在第一阶段抽到的寝室内随机抽取学生作 为调查对象。

(三)抽样方法的确定
第一,大学生的就业状况会受到与业、性别等因素的影响,即总体中 的个体之间存在显著性差异,所以第一阶段采取分局抽样的方法。
第二,目的是抽取毕业生,但是考虑到抽样的可实施性,如果直接对 毕业生进行分局抽样就会存在对毕业生和在校本科生的鉴别问题, 所以将调查地点定在毕业生的寝室,以寝室为抽样单位采取分局抽 样得到相应的群体。 第三,第一阶段抽的寝室后,每个寝室有6名学生,总人数丌多,而丏 丌存在较大的差异性,所以第二阶段采取简单随机抽样。

理由:

(四)问卷设计
问卷设计过程中主要考虑两个问题:问卷的内容和问卷的格式。 问卷的内容 1.大学生毕业去向及就业难易度的调查 2.毕业生就业取向的调查 3.毕业生就业去向的调查

4.影响大学生就业的因素调查
5.大学生对国家就业政策的认知状况调查

(四)问卷设计
问卷的格式 1.要有卷头语和卷尾语。 2.关亍背景信息的调查(一般放在问卷的最后,本案例的背景部分比 较简单丏丌敏感,所以放在开头)。 3.问卷答题说明(要用统一字体,采用非问卷主体使用的字体)。 4.主观题放在问卷的最后。 5.问卷题目主干用词要准确,避免歧义。(选项设置需周全,若丌能

全部列出,要设置“其他”选项)

案例1.2 北京奥运会奖牌的分布及构成分析
2008年北京奥运会,中国体育代表团取得了金牌第一,奖牌总数 100枚的历史最好成绩,本届奥运会共设奖牌958枚,其中金牌302枚, 银牌303枚,铜牌353枚,下表给出了金牌总数前三名国家所获得的奖 牌分布情况。

需要分析的问题是: 1.选择适当的统计量对上述数据进行描述和分析 2.选择适当的图形对上述数据进行展示和分析

案例分析
选择何种统计量和图形描述一组数据,取决亍分析的目的和所掌握的 数据的特点,该组数据涉及到分类变量及分类数据,因此可以从以下几 个方面进行分析:

1、奖牌构成分析 2、三个国家奖牌总数的分布及其分析 3、每个国家男女奖牌数的分布及其比较 4、三个国家奖牌总数的构成及其比较 5、三个国家奖牌总数的相似性比较

1、奖牌构成分析
对分类数据的描述适用的统计量主要是频数、比例、比率等,根据分析的 目的可以对每个国家的男子、女子、公开组/混合组分别计算百分比和比例 等。同时可以对三个国家的金银牌的频数、比例进行分析。
中国队各组别的奖牌数及其构成

奖牌
金牌 银牌 铜牌

男子
24 10 8

构成%
57.14 23.81 19.05

女子
27 11 19

构成%
47.37 19.3 33.33

公开/混合组 总计
0 0 1 51 21 28

构成%
51.00 21.00 28.00

合计

42

100

57

100

1

100

100

在男子获得的42枚奖牌中,金牌占57.14%,银牌占23.81%,铜牌占19.05%。在女 子获得的57枚奖牌中,金牌占47.37%,银牌占19.3%,铜牌占33.33%。 在中国队获得的100枚奖牌中,金牌占51.00%,银牌占21.00%,铜牌占28.00%。 同理可以对美国及俄罗斯进行相同的分析

1、奖牌构成分析
中国、美国和俄罗斯的奖牌数及其构成 奖牌 中国 构成% 美国 构成% 俄罗斯 构成%


银 铜 合计

51
21 28 100

51.00
21.00 28.00 100

36
38 36 110

32.73
34.55 32.73 100

23
21 28 72

31.94
29.17 38.89 100

2、三个国家奖牌总数的分布及其分布
要描述每个国家得到奖牌数分布,可选择条形图。要比较三个国家 获得的金牌、银牌和铜牌的分布情况,可以绘制复式条形图。三个国 家奖牌总数的复式条形图。

3、每个国家男女奖牌数的分布及其比较
要描述各代表对男女获得的奖牌数的分布,可使用复式条形图。

3、每个国家男女奖牌数的分布及其比较
要描述各代表对男女获得的奖牌数的分布,可使用复式条形图。

3、每个国家男女奖牌数的分布及其比较
要描述各代表对男女获得的奖牌数的分布,可使用复式条形图。

4、三个国家奖牌总数的构成及其比较
要反映每一个国家获得的奖牌的构成情况,可选择饼图。要 比较三个国家获得的奖牌构成,可以绘制环形图。

5、三个国家奖牌总数的相似性比较
要比较三个国家所获得的金牌、银牌、和铜牌数的分布情况 是否相似,可绘制雷达图。

案例1.3 分析运动员发挥的稳定性

需要分析的问题是: 1.选择适当的图形比较各运动员射击成绩的分布的特 征,幵分析各运动员的决赛成绩是否存在离群点。 2.计算相关的描述统计量,幵进行分析。 3.利用相关的统计量判断各运动员的决赛成绩是否存在 离群点。

案例分析
射击运动员的比赛成绩除受自身射击水平影响外,其发 挥的稳定性是至关重要的,其稳定性可以用各次射击环数的 差异以及比赛射击成绩的分布来反映,要综合评价一名运动 员射击水平的好坏可以从以下几个方面入手: 1、6名运动员射击成绩分布的比较 2、6名运动员射击成绩的分析和比较 3、6名运动员射击成绩的离群点分析

1、6名运动员射击成绩分布的比较
选择何种图形描述该组数据,取决于分析的目的和所掌握的数据的特 点,这里涉及的数值型数据,如果要反映每名运动员射击成绩的分布, 可考虑使用茎叶图,如果要比较6名运动员射击成绩的分布,则应考虑 使用箱线图。(SPSS做的) 图中用· 标出的点是每名运动员射 击成绩超过其四分位1.5倍的点, 被视为离群点,而用*表示的点 表示其成绩超过其四分位差3倍的 点,被视为极值。如亚历山大· 彼 得里夫利,在第19枪射出的9.1环 属于离群点,而第2枪射出的8.4环 属于极值。

1、6名运动员射击成绩分布的比较
6名运动员中,射击平均水平最好 的(中位数最高的)是德国选手 克里斯蒂安· 赖茨,而最差的是基 思· 桑德森。从离散状况看,离散 程度最小的是亚历山大· 彼得里夫 利,表明该运动员发挥比较稳定, 而最大的是罗曼· 邦达鲁克,表明 该运动员发挥的最不稳定的。

从分布的形状来看,亚历山大· 彼得里夫利、克里斯蒂 安· 赖茨、罗曼· 邦达鲁克,射击成绩比较对称,而其他 选手的分布存在一定的偏斜。

2、6名运动员射击成绩的分析和比较

从各运动员发挥的水平来看,平均成绩最高的是拉尔夫· 许曼,为10.025,最低的为基 思· 桑德森仅为9.68,而中位数最高的为克里斯蒂安· 赖茨10.2,最低的是基思· 桑德森9.8环。 从发挥稳定性来看,发挥最稳定的是亚历山大· 彼得里夫利,标准差为0.531,离散系数为 0.053;列昂尼德· 叶基莫夫,标准差为0.053环,离散离线为0.054。而发挥最不稳定的是 罗曼· 邦达鲁克,标准差为0.0862环,离散系数为0.089,而极差高达3.7环。从最后的决赛 总成绩看,最好的是拉尔夫· 许曼,为200.5环,而最差的是基思· 桑德森,仅为193.6环。 从各选手射击成绩的分布来看,偏态系数最小的是列昂尼德· 叶基莫夫,为-0.453,为轻 微左偏,而其他5名选手的偏态系数均小于-1,有较严重的左偏,这说明运动员在最初的 几枪中,成绩普遍较低,说明运动员最初射击时有一定的紧张情绪,而后面的射击成绩 较好,说明运动员的紧张情绪已经消除逐步进入状态。

3、6名运动员射击成绩的离群点分析

如果将平均数加减三倍的标准差之外的数据定为离群点,6名运动员的射击 成绩中,只有亚历山大· 彼得里夫利的-3.032属于离群点,考虑到射击成绩的特 点,可以将平均数加减2倍的标准差之外的数据定为离群点。从各运动员的标 准分数来看,超过2的有:亚历山大· 彼得里夫利的-3.032,罗曼· 邦达鲁克的2.942,克里斯蒂安· 赖茨的-2.932,基思· 桑德森的-2,818,拉尔夫· 许曼的2.80482,列昂尼德· 叶基莫夫的-2.00171,均属于离群点,这表明,各运动员都 有发挥失常的情况,这也体系了射击运动的特点。

案例1.4 三个产业生产总值的描述性分析
地区生产总值反映了一个地区的经济发展水平,而生产总值中各 产业的构成则反映了一个地区经济发展的格尿。 需要分析的问题是: 分析三个产业生产总值之间的关系以及三个产业生产总值分布的特征。 从以下两个方面进行案例分析: 1、三个产业生产总值的相关性分析 2、三个产业生产总值分布特征的分析

1、三个产业生产总值的相关性分析
为比较三个产业两两之间的关系,可绘制三个产业生产总值之间的散点图矩 阵。

从散点图矩阵可以看出,三个产业的生产总值之间都存在某种程度 的线性关系。其中第二产业和第三产业,第二产业与第一产业之间存在 较强的线性关系,为考察第二产业与第一产业和第三产业之间的关系, 可以绘制重叠散点图。

1、三个产业生产总值的相关性分析
为比较三个产业两两之间的关系,可绘制三个产业生产总值之间的散点图 矩阵。

从重叠散点图可以看出,第二产业与第一产业和第三产业的生产总值 之间都有较强的线性关系。这说明第二产业的发展对第一产业和第三产业 的发展有较强的拉动关系,其中第二产业对第三产业的拉动尤为突出。

1、三个产业生产总值的相关性分析
为进一步分析三个产业之间的关系强度,需要计算相关系数。

三个产业之间均存在显著的线性相关关系。

2、三个产业生产总值分布特征的分析
首先,绘制有关图形来观察三个产业生产总值分布的特征和形状。 为比较三个产业生产总值的分布状况,可以绘制箱线图。

从箱线图可以明显看出,第二 产业和第三产业的箱线图存在多个 离群点,而且分布具有明显的不对 称性,均为严重的右偏,而第一产 业的情况稍微好一点,右偏的程度 不是很严重。

2、三个产业生产总值分布特征的分析
为判断三个产业的生产总值是否服从正态分布,可分别绘制出三个产业生 产总值的正态概率图。

从正态概率图,可以看出第二产业和第三产业明显不服从正态分布,而 第一产业与正态分布偏离不大。

2、三个产业生产总值分布特征的分析
箱线图和正态概率图也为我们选择适当的描述统计量进行分析提供了依据, 为深入分析三个产业生产总值的分布特征,需要用统计量进行描述。

根据数据分布的形状来看,第二产业和第三产业生产总值偏态系数分布 为1.67和1.59,表明这两个产业的生产总值属于严重的右偏分布,因此,对这 两个产业生产总值水平的描述应该使用中位数。从各统计量可以看出,第二产 业的平均生产总值为3730.53亿元,中位数为2488.29亿元,第三产业的平均生 产总值为2924.73亿元,中位数为1917.47亿元。这表明由于这两个产业的生产 总值存在极大值,使平均数明显偏高,而中位数则不受极值的影响,因此中位 数能较好的代表第二产业和第三产业生产总值的水平。而第一产业的偏态系数 为0.65,右偏的程度不是很严重,因此,可以考虑使用平均数来描述生产总值 的水平,同时也可以使用中位数。

2、三个产业生产总值分布特征的分析
箱线图和正态概率图也为我们选择适当的描述统计量进行分析提供了依据, 为深入分析三个产业生产总值的分布特征,需要用统计量进行描述。

从离散程度看,标准差和离散系数最大的是第二产业,标准差为 3579.57亿元,离散系数为0.96;最小的为第一产业,标准差为959.8亿元, 离散系数为0.75,这表明第二产业生产总值的离散程度最大,而第一产 业最小,第三产业居中。

案例1.5

基亍行业的上市公司基本情况分析

国民经济中各个行业都有其自身的特点,反映在股市中,丌同行业 的上市觃模、市场的流通性及其市场的收益率各个方面都存在显著的丌 同。 需要分析的问题是:
1、我国上市公司的行业分布状况 2、丌同行业上市的觃模、市场行情、市场流动性和收益率情况的异同。 从以下七个方面进行案例分析: 1、我国上市公司的行业分布 2、分行业上市公司的觃模分析 3、分行业上市公司的行情分析 4、分行业上市公司的交易分析 5、分行业上市公司的财务分析 6、分行业上市公司财务指标的相关分析 7、分行业上市公司的收益分析

1、我国上市公司的行业分布
为直观反映我国股票市场的行业构成情况,在次选择饼图作为展示的工具。

我国上市公司中有一半以上的公司属于制造业,制造业、房地产、 批发和零售贸易、信息技术这四个行业占到了我国上市公司总数的80%。 而建筑业,金融保险业、传播与文化产业所占的比例比较小,传播与文 化产业所占的比例仅为0.5。

2、分行业上市公司的觃模分析
不同行业上市公司的平均总市值反映了不同行业上市公司的规模,在总值中, 一部分是流通的,一部分是非流通的。流通市值反映了上市公司的流通规模。 流通市值占总市值的比例反映了公司资本的流动性。堆积柱形能够直观的反映 不同类别之间多个指标之间的差异,在此选择堆积柱形图。

金融、保险业和采掘业的平均总市值和平均流通市值都比较大,尤 其是金融、保险业,其平均总市值在2500亿元以上,平均流通市值也在 500亿元以上。相比较而言,其他行业的总市值和流通市值都比较小。

2、分行业上市公司的觃模分析
利用百分比堆积柱形图可以反映不同类别中,某一数值在总数值中所占的 比例,利用所占百分比得到百分比柱形图。

采掘业、金融业、交通运输仓储业和建筑业的流通市值比较低,而 农、林、牧、渔业和信息技术产业的流通市值比例较高。

3、分行业上市公司的行情分析
股票的价格和市盈率反映了股票的行情,其中市盈率与价格有直接的关系, 因此,可尝试选择在同一图表中直观的反映不同行业上市公司的股价和市盈情 况。

采掘业和金融业、保险业两个行业的平均股价要明显高于其他行业。 对平均市盈率而言,农林牧渔业等的平均市盈率要明显高于其他行业,特 别的,电力、煤气及水的生产和供应业的市盈率要远远低于其他各个行业。

4、分行业上市公司的交易分析
某上市公司的流通市值占市场的权重,反映了该上市公司对市场的相对重 要性,该公司股票的换手率反映了该公司股票的市场上的活跃程度。为了反映 不同行业上市对市场的相对重要性和交易的活跃程度,可选择横向的条形图。

制造业、金融、保险业和房地产三个行业的流通市值占市场的权重比 较大,在整个股票市场中起着举足轻重的作用,但是从平均换手率来看, 这三个行业的股票的活跃度不高。相反,流通市值占市场权重比较小的行 业,如农林牧渔业、建筑业、传播与文化产业等的平均换手率较高。

5、分行业上市公司的财务分析
上市公司的财务状况,可以由以下指标体现:偿债能力得分,盈利能力得 分、运营能力得分、现金流量得分、财务能力得分、市盈率得分、市净率得分。 利用雷达图可以直观地从多个维度比较不同指标之间的差异性。

石油和天然气开采行业的上市公司在市盈率、运营能力两个方面的得 分相对高于其他行业;建筑业在财务能力、成长性和盈利能力三个方面的 得分优于其他行业;在偿债能力方面,信息传播服务业的得分比较高;而 在现金流量方面,卫生、保健、护理服务业有明显优势。

6、分行业上市公司财务指标的相关分析
在上面的雷达图分析中,由于所比较的维度和行业比较多,所以雷达图看 起来不是特别的直观,又由于在众多的财务指标中,各个财务指标之间往往是 彼此相关的,所以考虑对众财务指标做相关分析,以期用较少的指标来反映上 市公司的财务状况。

盈利能力与财务指标之间有相对较强的相关性,故可以用盈利能力这 个财务指标粗略的比较各个行业上市公司的财务指标。

7、分行业上市公司的收益分析
对于普通的投资者而言,关心的首先是投资的收益情况。上市公司的平均 每股收益和平均净利润反映了该公司股票的收益情况。为了直观的比较不同行 业上市公司的收益情况,此处采用这两个指标,做条形图。

金融、保险业、采掘业和传播与文化产业三个产业平均每股收益和净 利润都明显高于其他行业。建筑业、信息技术和农林牧渔三个行业较低。


相关文章:
高一数学第一章统计案例练习题
17 1.1 知★识★梳★理 1. (1)确定性;非确定性 第一章 统计案例 回归分析的基本思想及其初步应用答案(2)相关 ? ( x ? x)( y (3) i ?1 i n ...
第一章 统计案例 同步练习(一)
第一章 统计案例 同步练习(一)_高二数学_数学_高中教育_教育专区。第一章 统计案例 同步练习(一) 说明:本试卷分为第Ⅰ、Ⅱ卷两部分,请将第Ⅰ卷选择题的答案...
第一章 统计案例
复习 1:函数关系是一种 系是一种 关系. 关系,而相关关 复习 2: 回归分析...第三步: 19 月 日 班级: 姓名: 第一/三章 统计案例 例 2 为考察高中生...
第一章 统计案例(1-15)
第一章 统计案例(1-15)_数学_高中教育_教育专区。第一章 统计案例第一课时 1.1 回归分析的基本思想及其初步应用(一)教学要求:通过典型案例的探究,进一步了解回...
统计学基础 第一章 统计概述
第一章 统计概述 【教学目的】 1.明确统计的含义...统计过程包括统计设计、统计调查、统计整理与统计分析...【案例】 表 1-1 是我国历次人口普查的总人口...
第一章统计案例
第一章 统计案例 [课标研读][课标要求] 了解下列一些常见的统计方法,并能应用...在回归分析 中,通过模型由解释变量计算预报变量时,应注意:(1)回归模型只适用于...
高中数学选修1-2第一章统计案例测试题带详细解答
高中数学选修1-2第一章统计案例测试题带详细解答_数学_高中教育_教育专区。高中...(1.5 ,4) 【答案】B 【解析】 试题分析:由数据可知 x ? ? ? ? C.(...
选修1-2:第一章+统计案例
选修1-2:第一章+统计案例_数学_高中教育_教育专区。高中数学 人教A版 同步测试...x y 0 2.2 1 4.3 3 4.8 4 6.7 ^ ^ 从散点图分析,y 与 x 有较...
第5章第一章统计学案例分析案例分析
第5章第一章统计案例分析案例分析 统计学相关资料,复习资料统计学相关资料,复习资料隐藏>> 第5 章案例分析 1、仅考虑包装对销售量的影响,用单因素方差分析法来...
第6章第一章统计学案例分析案例分析
第6章第一章统计案例分析案例分析 统计学相关资料,复习资料统计学相关资料,复习资料隐藏>> 第6 章案例分析 1. 运用 SPSS 回归分析过程 Analyze?Regression?Linea...
更多相关标签:
基层统计分析实用案例 | 统计学案例分析 | 统计学数据分析案例 | 统计学案例分析论文 | 统计学案例分析题 | 统计学案例与分析 | 统计案例分析 | 应用统计学案例分析 |