当前位置:首页 >> 数学 >>

第3讲 变量间的相关关系与统计案例


第3讲
【2013 年高考会这样考】

变量间的相关关系与统计案例

以选择题或填空题的形式考查回归分析及独立性检验中的基本思想方法及其简单 应用. 【复习指导】 高考在该部分的主要命题点就是回归分析和独立性检验的基础知识和简单应用.复 习时要掌握好回归分析和独立性检验的基本思想、方法和基本公式.

基础梳理

1.相关关系的分类 从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关 系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种 相关关系称为负相关. 2.线性相关 从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量 之间具有线性相关关系,这条直线叫回归直线. 3.回归方程 (1)最小二乘法: 使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘 法. (2)回归方程:两个具有线性相关关系的变量的一组数据: ^ ^ ^ (x1,y1),(x2,y2),?,(xn,yn),其回归方程为y=bx+a,则

? ? ?x - x ??y - y ? ?x y -n x i=1 ^ ?b=i=1 n = n ? ? ?x - x ? ?x -n x i=1 i=1 ? ^ ^ ? a= y -b x .
n n
i i i i i 2 2 i

y ,
2

其中,b 是回归方程的斜率,a 是在 y 轴上的截距. 4.样本相关系数

? ?xi- x ??yi- y ?
r= i=1 ,用它来衡量两个变量间的线性相关关系. n n ? ?xi- x ?2 ? ?yi- y ?2 i=1 i=1

n

(1)当 r>0 时,表明两个变量正相关; (2)当 r<0 时,表明两个变量负相关; (3)r 的绝对值越接近 1,表明两个变量的线性相关性越强;r 的绝对值越接近于 0, 表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75 时,认为两个变量有 很强的线性相关关系. 5.线性回归模型 (1)y=bx+a+e 中,a、b 称为模型的未知参数;e 称为随机误差. (2)相关指数 用相关指数 R2 来刻画回归的效果,其计算公式是:R2= 的值越大,说明残差 ,R2

平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2 表示解释变量 对预报变量变化的贡献率,R2 越接近于 1,表示回归效果越好. 6.独立性检验 (1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如: 是否吸烟,宗教信仰,国籍等. (2)列出的两个分类变量的频数表,称为列联表. (3)一般地,假设有两个分类变量 X 和 Y,它们的值域分别为{x1,x2}和{y1,y2},其 样本频数列联表(称为 2×2 列联表)为: 2×2 列联表 y1 x1 x2 总计
2

y2 b d b+d

总计 a+b c+d a+b+c+d

a c a+c

n?ad-bc?2 K= (其中 n=a+b+c+d 为样本容量), 可利用独立性检验 ?a+b??a+c??c+d??b+d?

判断表来判断“x 与 y 的关系”. 这种利用随机变量 K2 来确定在多大程度上可以认为“两个分类变量有关系”的方 法称为两个分类变量的独立性检验.

两个规律 (1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系 是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系. (2)当 K2≥3.841 时,则有 95%的把握说事 A 与 B 有关; 当 K2≥6.635 时,则有 99%的把握说事件 A 与 B 有关; 当 K2≤2.706 时,则认为事件 A 与 B 无关. 三个注意 (1)回归分析是对具有相关关系的两个变量进行统计分析的方法, 只有在散点图大致 呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意 义. (2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误 差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体. (3)独立性检验的随机变量 K2=3.841 是判断是否有关系的临界值, 2≤3.841 应判断 K 为没有充分证据显示事件 A 与 B 有关系,而不能作为小于 95%的量化值来判断. 双基自测 1.(人教 A 版教材习题改编)下面哪些变量是相关关系( A.出租车车费与行驶的里程 C.身高与体重 ).

B.房屋面积与房屋价格 D.铁块的大小与质量

解析 A,B,D 都是函数关系,其中 A 一般是分段函数,只有 C 是相关关系. 答案 C 2.对变量 x,y 有观测数据(xi,yi)(i=1,2,?,10),得散点图(1);对变量 u,v 有 观测数据(ui、vi)(i=1,2,?,10),得散点图(2).由这两个散点图可以判断 ( ).

A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关 解析 由题图(1)可知,各点整体呈递减趋势,x 与 y 负相关;由题图(2)可知,各点 整体呈递增趋势,u 与 v 正相关. 答案 C 3. (2012· 南昌模拟)某商品销售量 y(件)与销售价格 x(元/件)负相关, 则其回归方程可 能是( ). ^ B.y=10x+200 ^ D.y=10x-200

^ A.y=-10x+200 ^ C.y=-10x-200

解析 因为销量与价格负相关, 由函数关系考虑为减函数, 又因为 x, 不能为负数, y 再排除 C,故选 A. 答案 A 4.(2012· 枣庄模拟)下面是 2×2 列联表: y1 x1 x2 合计 则表中 a,b 的值分别为( A.94,72 B.52,50 ). C.52,74 D.74,52 a 22 b y2 21 25 46 合计 73 47 120

解析 ∵a+21=73,∴a=52,又 a+22=b,∴b=74. 答案 C 5.在一项打鼾与患心脏病的调查中,共调查了 1 671 人,经过计算 K2 的观测值 k =27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,

无关). 解析 由观测值 k=27.63 与临界值比较, 我们有 99%的把握说打鼾与患心脏病有关. 答案 有关

考向一

相关关系的判断

【例 1】?山东鲁洁棉业公司的科研人员在 7 块并排、形状大小相同的试验田上对某 棉花新品种进行施化肥量 x 对产量 y 影响的试验, 得到如下表所示的一组数据(单位: kg): 施化肥量 x 棉花产量 y (1)画出散点图; (2)判断是否具有相关关系. [审题视点] (1)用 x 轴表示化肥施用量,y 轴表示棉花产量,逐一画点. (2)根据散点图,分析两个变量是否存在相关关系. 解 (1)散点图如图所示 15 330 20 345 25 365 30 405 35 445 40 450 45 455

(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量 x 与产量 y 具有线性相关关系. 利用散点图判断两个变量是否有相关关系是比较简便的方法. 在散点图中 如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关 系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量 之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相 关关系. 【训练 1】 根据两个变量 x,y 之间的观测数据画成散点图如图所示,这两个变量 是否具有线性相关关系________(填“是”与“否”).

解析 从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性 相关关系. 答案 否

考向二

独立性检验

【例 2】?(2010· 全国新课标)为调查某地区老年人是否需要志愿者提供帮助,用简单 随机抽样方法从该地区调查了 500 位老年人,结果如下:

性别 是否需要志愿者 需要 不需要





40 160

30 270

(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否有 99%的把握认为该地区老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论, 能否提出更好的调查方法来估计该地区老年人中, 需要志愿者提 供帮助的老年人的比例?说明理由. 附: P(K2≥k) k n?ad-bc?2 K= ?a+b??c+d??a+c??b+d?
2

0.050 3.841

0.010 6.635

0.001 10.828

[审题视点] 第(2)问由 a=40,b=30,c=160,d=270,代入公式可求 K2,由 K2 的值与 6.635 比较断定.第(3)问从抽样方法说明. 解 (1)调查的 500 位老年人中有 70 位需要志愿者提供帮助, 因此该地区老年人中, 70 需要志愿者提供帮助的老年人的比例的估计值为500=14%.

500×?40×270-30×160?2 (2)K = ≈9.967. 70×430×200×300
2

由于 9.967>6.635, 所以有 99%的把握认为该地区老年人是否需要帮助与性别有关. (3)由(2)的结论知, 该地区老年人是否需要帮助与性别有关, 并且从样本数据能看出 该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先 确定该地区老年人中男、女的比例,再把老年人分成男、女两层,采用分层抽样方 法,这要比采用简单随机抽样方法更好. 独立性检验的步骤: (1)根据样本数据制成 2×2 列联表; n?ad-bc?2 (2)根据公式 K = 计算 K2 的观测值; ?a+b??a+c??b+d??c+d?
2

(3)比较 K2 与临界值的大小关系作统计推断. 【训练 2】 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落 在[29.94,30.06)的零件为优质品. 从两个分厂生产的零件中各抽出了 500 件, 量其内 径尺寸,得结果如下表: 甲厂: 分组 频数 乙厂: 分组 频数 [29.86, 29.90) 29 [29.90, 29.94) 71 [29.94, 29.98) 85 [29.98, 30.02) 159 [30.02, 30.06) 76 [30.06, 30.10) 62 [30.10, 30.14) 18 [29.86, 29.90) 12 [29.90, 29.94) 63 [29.94, 29.98) 86 [29.98, 30.02) 182 [30.02, 30.06) 92 [30.06, 30.10) 61 [30.10, 30.14) 4

(1)试分别估计两个分厂生产零件的优质品率; (2)由以上统计数据填下面 2×2 列联表,并问是否有 99%的把握认为“两个分厂生 产的零件的质量有差异”. 甲 优质品 非优质品 合 计 厂 乙 厂 合 计

n?ad-bc?2 附 K= , ?a+b??c+d??a+c??b+d?
2

P(K2≥k) k

0.05 3.841

0.01 6.635

解 (1)甲厂抽查的产品中有 360 件优质品, 从而甲厂生产的零件的优质品率估计为 360 500×100%=72%; 320 乙厂抽查的产品中有 320 件优质品,从而乙厂生产的零件的优质品率估计为 500 ×100%=64%. (2) 甲 优质品 非优质品 合 计 厂 乙 厂 合 计

360 140 500

320 180 500

680 320 1 000

1 000×?360×180-320×140?2 K2 = ≈7.35>6.635, 500×500×680×320 所以有 99%的把握认为“两个分厂生产的零件的质量有差异”. 考向三 线性回归方程

【例 3】 ?(2012· 菏泽模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记 录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据. x y (1)请画出上表数据的散点图; ^ ^ ^ (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程y=bx+a; (3)已知该厂技改前生产 100 吨甲产品的生产能耗为 90 吨标准煤.试根据(2)求出的 线性回归方程.预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) ^ ^ [审题视点] (2)问利用公式求a、b,即可求出线性回归方程. (3)问将 x=100 代入回归直线方程即可. 解 (1)由题设所给数据,可得散点图如图所示. 3 2.5 4 3 5 4 6 4.5

(2)由对照数据,计算得: ?x2=86, i i=1 x= 3+4+5+6 2.5+3+4+4.5 =4.5(吨), y = =3.5(吨). 4 4

4

4 已知 ?xiyi=66.5, i=1 所以,由最小二乘法确定的回归方程的系数为:

?xiyi-4 x ·y
^ i=1 b= 4 =

4

?xi2-4 x 2

66.5-4×4.5×3.5 =0.7, 86-4×4.52

i=1 ^ ^ a= y -b x =3.5-0.7×4.5=0.35. ^ 因此,所求的线性回归方程为y=0.7x+0.35. (3)由(2)的回归方程及技改前生产 100 吨甲产品的生产能耗,得降低的生产能耗为: 90-(0.7×100+0.35)=19.65(吨标准煤). 在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具 有线性相关关系,若它们之间有线性相关关系,再求回归直线方程. 【训练 3】 (2011· 江西)为了解儿子身高与其父亲身高的关系,随机抽取 5 对父子的 身高数据如下: 父亲身高 x/cm 儿子身高 y/cm 174 175 176 175 176 176 176 177 178 177

则 y 对 x 的线性回归方程为( A.y=x-1

). B.y=x+1

1 C.y=88+2x 解析 由题意得 x = y=

D.y=176 174+176+176+176+178 =176(cm), 5

175+175+176+177+177 =176(cm),由于( x , y )一定满足线性回归方程, 5

经验证知选 C. 答案 C

阅卷报告 15——数据处理不当导致计算错误而失分 【问题诊断】 由于大多数省市高考要求不准使用计算器,而线性回归问题和独立 性检验问题仍是近几年新课标高考的常考点,并且大多是考查考生的计算能力,就 计算方面常有不少考生因计算出错而失分. 【防范措施】 平时训练时首先养成勤于动手的习惯,亲自动手计算,再者考场上 要保持心态放松,做题时细心认真,最终可减少错误的发生. 【示例】?(2011· 安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据: 年份 需求量(万吨) 2002 236 2004 246 2006 257 2008 276 2010 286

^ (1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a; (2)利用(1)中所求出的直线方程预测该地 2012 年的粮食需求量. 实录 (1) x =2 006, y = b= ?2002-2006??236-260.2?+?2004-2006??246-260.2?+?2006-2006??257-260.2? ?2002-2006?2+?2004-2006?2+?2006-2006?2+?2008-2006?2+?2010-2006?2 ?2008-2006??276-260.2?+?2010-2006??286-260.2? + ?2002-2006?2+?2004-2006?2+?2006-2006?2+?2008-2006?2+?2010-2006?2 =6.2, 错因 求 b 时计算出错,b 值不准确.a= y -b x =260.2-6.2×2 006=-12 177. ^ ∴y=6.2x-12 177. 236+246+257+276+286 =260.2. 5

^ (2)y=6.2×2 012-12 177=297.4. 正解 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直 线方程,为此对数据预处理如下: 年份-2006 需求量-257 对预处理后的数据,容易算得, x =0, y =3.2, ?-4?×?-21?+?-2?×?-11?+2×19+4×29-5×0×3.2 b= ?-4?2+?-2?2+22+42-5×02 260 = 40 =6.5,a= y -b x =3.2. 由上述计算结果,知所求回归直线方程为 y -257=b(x-2 006)+a=6.5(x-2 006) +3.2, ^ 即y=6.5(x-2 006)+260.2.① (2)利用直线方程①,可预测 2012 年的粮食需求量为 6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨). -4 -21 -2 -11 0 0 2 19 4 29


相关文章:
第3讲 变量间的相关关系与统计案例
第3讲 变量间的相关关系与统计案例_高中教育_教育专区 暂无评价|0人阅读|0次下载 第3讲 变量间的相关关系与统计案例_高中教育_教育专区。第3讲 【2013 年高考...
第3讲 变量间的相关关系与统计案例
第3讲【2013 年高考会这样考】 变量间的相关关系与统计案例 以选择题或填空题的形式考查回归分析及独立性检验中的基本思想方法及其简 单应用. 【复习指导】 由于...
第3讲变量间的相关关系与统计案例
第3讲 变量间的相关关系与统计案例 1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系. 2 点重要区别 1. 函数关系是一种确定的关系,相关...
第十章第3讲变量间的相关关系、统计案例
第十章第3讲变量间的相关关系统计案例_数学_高中教育_教育专区。第 3 讲 变量间的相关关系统计案例 1.变量间的相关关系 (1)常见的两变量之间的关系有两...
第3讲变量间的相关关系与统计案例答案(2015金版教程讲义)
第3讲变量间的相关关系与统计案例答案(2015金版教程讲义)_高三数学_数学_高中教育_教育专区。2015金版教程第3 讲变量间的相关关系与统计案例例 1[解析] (1)C...
第十章第3讲变量间的相关关系、统计案例
第十章第3讲变量间的相关关系统计案例_数学_高中教育_教育专区。第 3 讲 变量间的相关关系统计案例 ,[学生用书 P212]) 1.变量间的相关关系 常见的两变量...
第三讲变量间的相关关系与统计案例
2 0 1 1 级特长生 概率统计 导学案 03 编写:杨俊霞 领导签字: 班级 : 姓名 : 第3讲 变量间的相关关系与统计案例 的方法叫做最小二乘法. ②回归方程:两...
高三复习第三讲变量间的相关关系与统计案例
高三复习第三讲变量间的相关关系与统计案例_高三数学_数学_高中教育_教育专区。第...即模型的拟合效果越差. 3.当 K2≥3.841 时,则有 95%的把握说事件 A 与 ...
高考一轮复习:变量间的相关关系与统计案例
我爱学习网 在线学习网 分享学习方法 励志人生 第3讲【2015 年高考会这样考】 变量间的相关关系与统计案例 以选择题或填空题的形式考查回归分析及独立性检验中...
更多相关标签:
近年医患关系案例统计 | 统计学案例 | 生活中的统计学案例 | 基层统计分析实用案例 | 统计学案例分析 | 统计学数据分析案例 | 统计案例 | 统计学案例分析题 |