当前位置:首页 >> >>

2019版高中数学 第一章 统计 1.8 最小二乘估计课件 北师大版必修3_图文

§8 最小 二乘估计

学习目标

思维脉络

1.了解最小二乘法的原理.

2.能利用回归系数公式求线

性回归方程.

3.能利用线性回归方程对总

体进行估计.

1.最小二乘法

如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这 些点与直线y=a+bx的接近程度:

[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2. 使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种

方法称为最小二乘法.

2.回归直线方程

在最小二乘法中,如果用表示1

+2

+

…+

,用表示1

+2

+…

+

,则

可以求得 b=(1-)((1-1-)+)2(+2(-2)-()22-+)…++…(+(-)-2)(-) =

1 1 +2 2 +…+ - 12+ 22+ …+ 2 -2


.

a=-b.这样得到的直线方程称为线性回归方程,a,b 是线性回归方

程的系数.

【做一做1】 已知x与y之间的一组数据如下表:

x 0 1 23 y 1 2 46

则y与x的线性回归方程y=bx+a,必过点( )

A.(2,3)

B.(1.5,3)

C.(1.5,3.25) D.(2,3.25) 解析: = 0+1+4 2+3=1.5, = 1+2+44+6=3.25. 因为回归直线必过点(, ),所以 C 正确.

答案:C

3.线性回归分析

利用最小二乘法估计时,要先作出数据的散点图.如果散点图呈

现一定的规律性,我们再根据这个规律进行拟合.如果散点图呈现

出线性关系,我们可以用最小二乘法估计出线性回归方程;如果散

点图呈现出其他的曲线关系,我们就要利用其他的曲线进行拟合.

规律总结线性回归分析的步骤:

(1)作散点图,判断两个变量是否线性相关,若是,再执行以下步骤;

(2)列表

xi,yi,2

,xiyi;
n

(3)计算,

,

∑=1xi2,

∑ xiyi;
i =1

(4)代入公式计算b,a的值;

(5)写出线性回归方程;

(6)根据回归系数的意义进行估计和判断.

【做一做2】 设有一个回归方程为 ^=-1.5x+2,则变量x增加一个
单位时( ) A.y平均增加1.5个单位 B.y平均增加2个单位 C.y平均减少1.5个单位 D.y平均减少2个单位
解析:∵两个变量线性负相关,∴变量x增加一个单位,y平均减少1.5
个单位. 答案:C

思考辨析

判断下列说法是否正确,正确的在后面的括号里画“√”,错误的画
“×”.

(1)散点图能直观地反映数据的相关程度. ( )

(2)任意一组数据都有一个对应的线性回归方程. ( )

(3)散点图中的点越集中,两个变量的相关性越强. ( )

(4)线性回归方程最能代表线性相关的两个变量之间的关系.

()

(5)线性回归方程 y=bx+a 一定过点(, )(其中 =

1 +2 +…+

,



=

1

+2 +…

+

).

答案:(1)√ (2)× (3)× (4)√ (5)√

()

探究一

探究二

探究三

思想方法 当堂检测

求线性回归方程

【例1】某市近5年的煤气消耗量与使用煤气户数如下表:

年份 x/万户 y/百万 m3

2013 1 6

2014 1.1 7

2015 1.5 9

2016 1.6 11

2017 1.8 12

(1)检验变量x,y是否线性相关; (2)求y对x的线性回归方程. 分析:根据表中的数据→作出散点图→判断是否线性相关→若是, 则根据公式求得a,b→得线性回归方程

探究一

探究二

探究三

思想方法 当堂检测

解:(1)作出散点图,由散点图知变量x,y线性相关.

(2)

=

1

+1.1

+1.5+ 1.6+ 5

1.8=1.4,



=

6

+7+9+11+ 5

12=9,

5

∑=1xi2=12+1.12+1.52+1.62+1.82=10.26,

5

∑ xiyi=1×6+1.1×7+1.5×9+1.6×11+1.8×12=66.4,

i=1

5

所以

b=∑=∑152--552

=

66.4-5× 1.4 × 9 10.26-5 × 1.42

=

12730 ≈7. 39,

=1

a=-b≈9-7.39×1.4=-1.346,

故 y 对 x 的回归直线方程为 y=7.39x-1.346.

探究一

探究二

探究三

思想方法 当堂检测

反思感悟 1.求线性回归方程通常用最小二乘法,其操作过程需

严格按照步骤进行.

2.求回归系数时,要先求 b,再用 a=-b求 a.其中求 b 的公式有





两个:b=∑=1∑(nxi(-x)-(y)i2-y)和 b=∑=∑12 --2,一般用后者求解.

i=1

=1

探究一

探究二

探究三

思想方法 当堂检测

变式训练1若在一次试验中,测得(x,y)的四组数值分别是A(1,3),

B(2,3.8),C(3,5.2),D(4,6).则y与x之间的线性回归方程是( )

A.y=x+1.9

B.y=1.04x+1.9

C.y=0.95x+1.04 D.y=1.05x-0.9

答案:B

探究一

探究二

探究三

思想方法 当堂检测

回归直线的性质 【例2】 下表提供了某种产品投入的广告费用x(单位:万元)与相 应销售金额y(单位:十万元)的几组数据,

广告费用 x/万元

13 57

销售金额 y/十万元 2 ■ 3 3.5

根据上表提供的数据,求出y关于x的线性回归方程是 y=0.25x+1.75,后来表中的某个数据被污染,则被污染的数据最有可 能是( )
A.2.8 B.2.5 C.2.6 D.3.6

探究一

探究二

探究三

思想方法 当堂检测

解析:由表中数据可得=4,而(, )在回归直线上,
因此=0.25×4+1.75=2.75,设被污染的数据为 a, 则有2++43+3.5=2.75,解得 a=2.5,故选 B. 答案:B 反思感悟回归直线y=bx+a一定经过样本点的中心(, ),根据这 一性质可以快速地确定回归直线系数的值或者根据回归系数的值
确定未知数据.

探究一

探究二

探究三

思想方法 当堂检测

变式训练2已知x,y的取值如下表所示,

x234 y546

如果 y 与 x 呈线性相关,且线性回归方程为 y=bx+72,则 b 等于

()

A.-12

B.12

C.-110

D.110

解析:由表中数据可得=3,=5,因此回归直线 y=bx+72一定经过

点(3,5),即 5=3b+72,解得 b=12,故选 B.

答案:B

探究一

探究二

探究三

思想方法 当堂检测

利用线性回归方程对总体进行估计

【例3】 对具有线性相关关系的变量x,y,测得一组数据如下:

x2 4 5 6 8 y 20 40 60 70 80

根据上表,利用最小二乘法得它们的回归直线方程为y=10.5x+a, 据此模型来预测当x=20时,y的估计值为 ( )

A.210 B.210.5 C.211.5D.212.5 解析:由数据可知=5,=54 ,代入回归直线方程得a=1.5,所以
y=10.5x+1.5,当x=20时,y=10.5×20+1.5=211.5.
答案:C 反思感悟1.利用线性回归方程对总体进行估计,关键在于正确地 求出线性回归方程. 2.利用线性回归方程进行预测和估计时,所得到的结果只是一个 估计值,而不是精确值.

探究一

探究二

探究三

思想方法 当堂检测

变式训练3(1)根据下表样本数据:

x3

4

5

6

7

y 4.0 2.5 -0.5 0.5 -2.0

得到的回归方程为y=bx+a.若a=7.9,则x每增加1个单位,y就( )

A.增加1.4个单位 B.减少1.4个单位

C.增加1.2个单位 D.减少1.2个单位

(2)从某一行业随机抽取12家企业,它们的生产量与生产费用的数

据如表所示:

企业编号 生产量 x/台 生产费用 y/万元

1 2 3 4 5 6 7 8 9 10 11 12 40 42 50 55 65 78 84 100 116 125130 140 130150 155 140150 154 165170 167 180175 185

探究一

探究二

探究三

思想方法 当堂检测

①绘制生产量x和生产费用y相应数据对应的散点图. ②如果两个变量之间是线性相关关系,请用最小二乘法求出其线
性回归方程.
③如果一个企业的生产量是120台,请预测它的生产费用.

探究一

探究二

探究三

思想方法 当堂检测

(1)解析: = 3+4+55+6+7=5, = 4.0+2.5-05.5+0.5-2.0=0.9.所以此回归直线必过点(5,0.9),代入 回归方程可得 0.9=5b+7.9,解得 b=-1.4<0,所以 x 每增加 1 个单位,y 就随之减少 1.4 个单位,故 B 正确.
答案:B
(2)解:①散点图如图所示:
②根据散点图可知,两个变量
x和y之间的关系是线性相关关 系.下面用最小二乘法求线性回 归方程:

探究一

探究二

探究三

思想方法 当堂检测

i

xi

yi

xiyi

xi2

1

40

130

5 200

1 600

2

42

150

6 300

1 764

3

50

155

7 750

2 500

4

55

140

7 700

3 025

5

65

150

9 750

4 225

6

78

154

12 012 6 084

7

84

165

13 860 7 056

8

100

170

17 000 10 000

9

116

167

19 372 13 456

10

125

180

22 500 15 625

11

130

175

22 750 16 900

12

140

185

25 900 19 600

合计 1 025 1 921 170 094 101 835 x≈85.42,y≈160.1,12x y≈164 108.904,12x2≈87 558.916 8

探究一

探究二

探究三

思想方法 当堂检测

设所求的线性回归方程是 y=a+bx,



b≈110710

094-164 108.904 835-87 558.916 8

≈0.42,

a=-b≈160.1-0.42×85.42≈124.22,

所求的线性回归方程是 y=0.42x+124.22.

(3)在线性回归方程y=0.42x+124.22中,常数项124.22可以认为是

固定费用,它不随生产量的变化而变化;0.42可以认为是可变费用的

增长系数,即每增加1个单位的生产量就增加0.42个单位的费用.将

x=120代入线性回归方程得y=0.42×120+124.22=174.62,即如果一

个企业的生产量是120台,它的生产费用约为174.62万元.

探究一

探究二

探究三

思想方法 当堂检测

线性回归方程的求法与应用

【典例】一个车间为了规定工时定额,需要确定加工零件所花费

的时间,为此进行了10次实验,收集数据如下:

零件数 x/个

10 20 30 40 50

加工时间 y/时 62 68 75 81 89

零件数 x/个

60 70 80 90 100

加工时间 y/时 95 102 108 115 122

(1)画出散点图.

(2)求线性回归方程.

(3)关于加工零件的个数与加工时间,你能得出什么结论?

分析:(1)横坐标表示加工零件个数,纵坐标表示加工时间,建立平

面直角坐标系即可绘制散点图.

(2)利用散点图中点的走势即可得出变量之间是否线性相关,然后

利用最小二乘法求出线性回归方程,利用方程得出(3)中的预测结论.

探究一

探究二

探究三

思想方法 当堂检测

解:(1)散点图如图所示.

由散点图知二者呈线性相关关系.

探究一

探究二

探究三

思想方法 当堂检测

(2)设线性回归方程为y=bx+a. 列表并利用科学计算器进行有关计算.

i 1 2 3 4 5 6 7 8 9 10 合计

xi 10 20 30 40 50 60 70 80 90 100 550

yi 62 68 75 81 89 95 102 108115 122 917

xi2

100

400 900

1 600

234 500 600 900

68 400 100

10 000

38

500

xiyi

620

1 360

2 250

3 240

4 450

5 700

7 140

8 640

10 350

12 200

55

950

x=55,y=91.7

所以 b=55398505-0100-1×05×5×55921.7≈0.668,a=-b≈91.7-0.668×55=54.96. 故所求线性回归方程为

y=0.668x+54.96. (3)由线性回归方程可以得出每多加工10个零件,就多花费6.68时.

探究一

探究二

探究三

思想方法 当堂检测

方法点睛1.解决此类问题,因为已知y与x线性相关,所以只需代入 公式进行求解,鉴于代入很烦琐,因此要分步来求解,并且要注意运 算结果的正确性.
2.根据线性回归方程来进行预测或估计时,要注意明确方程中的 各个量在实际问题的含义,不要混淆,做到有的放矢.
3.线性回归方程中的回归系数b代表x每增加一个单位,y平均增加 的单位数,而不是增加单位数,也就是说,此时对y的预测是平均预测.

探究一

探究二

探究三

思想方法 当堂检测

变式训练下表提供了某厂节能降耗技术改造后生产甲产品过程 中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几 组对应数据.

x/吨

3

456

y/吨标准煤 2.5 3 4 4.5

(1)请画出表中数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线 方程y=bx+a; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根 据(2)求出的回归直线方程,预测技改后生产100吨甲产品的生产能 耗比技改前降低多少吨标准煤?

探究一

探究二

探究三

思想方法 当堂检测

解:(1)由题设所给数据可得散点图,如图所示.

(2)由表中数据计算得

4
∑=1xi2=86,x

=

3+4 +4 5+ 6 =4. 5,y

=

2.5+ 3+4 4 +4.5=3. 5, i∑=41 xi yi =66. 5.

所以由最小二乘法确定的回归直线方程的系数为

4

b=∑=∑142 --442 = 66.856-4-4××44.5.5×23.5=0.7, =1

a=-b=3.5-0.7×4.5=0.35.

因此,所求的回归直线方程为y=0.7x+0.35.

(3)由(2)的回归直线方程及技改前生产100吨甲产品的生产能耗,

得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).

探究一

探究二

探究三

思想方法 当堂检测

1.工人月工资y(单位:元)依劳动生产率x(单位:千元)变化的线性回

归方程为y=50+80x,下列判断正确的是 ( )

A.劳动生产率为1 000元时,工资为130元

B.劳动生产率提高1 000元,则工资平均提高80元

C.劳动生产率提高1 000元,则工资平均提高130元

D.当月工资为210元时,劳动生产率为2 000元

答案:B

2.下列命题:①线性回归方法就是寻找一条贴近已知样本点的直线

的数学方法;②利用样本点的散点图可以直观判断两个变量的关系

是否可以用线性关系来表示;③通过线性回归方程y=bx+a可以估

计和预测变量的取值和变化趋势.

其中正确的命题是( )

A.①② B.①③C.②③ D.①②③

答案:D

探究一

探究二

探究三

思想方法 当堂检测

3.下表是x与y之间的一组数据,则y关于x的回归直线必过点( )

x 0 1 23 y 1 3 57

A.(2,2) B.(1.5,2)

C.(1,2) D.(1.5,4)

解 析 :

=

1+24+3=1.5,

=

1+3 +5+ 4

7=4,

由于回归直线必过点(, ),故必过点(1.5,4).

答案:D

探究一

探究二

探究三

思想方法 当堂检测

4.登山族为了了解某山高y(单位:km)与气温x(单位:℃)之间的关系, 随机统计了4次山高与相应的气温,并制作了对照表:
气温 x/℃ 18 13 10 -1 山高 y/km 2.4 3.4 3.8 6.4
由表中数据,得到线性回归方程y=-0.2x+a(a∈R),由此估计出山高 为7.2 km处的气温为( ) A.-10 ℃ B.-8 ℃ C.-6 ℃ D.-4 ℃ 解析:由题意可得=10,=4,所以 a=+2=4+0.2×10=6, 所以 y=-0.2x+6.当 y=7.2 时,-0.2x+6=7.2,解得 x=-6,故选 C. 答案:C

探究一

探究二

探究三

思想方法 当堂检测

5.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回

归方程为

^


=0.72x-58.2,张明同学(20岁)身高178

cm,他的体重应该



kg左右.

解析:用回归方程对身高为178 cm的人的体重进行预测,当x=178时,

^=0.72×178-58.2=69.96(kg).
答案:69.96