当前位置:首页 >> 数学 >>

第一题答案-4


制陶材料强度最大的工艺条件的最优化设计
摘要 本文研究的是求使制陶材料强度最大的最优工艺条件。首先对题中给出的数据进行处理 以减少由于数据间的相互关系对模型造成的影响, 然后建立多元线性回归模型。 为了得到更 好的效果,对该线性模型添加非线性项,得到非标准线性模型。通过对残差等因素的分析, 对该非线性模型加以改进, 并且用最大似然估计法进行修正, 最终得到稳健回归的改进

模型。

关键词 线性回归

二次非线性回归 显著性检验

稳健回归

一、 问题的重述
硅酸盐(Si3N4)制陶材料是一种强度高、耐磨、抗氧化和耐高温的材料, 它广泛应用于高温结构的材料中,如切割工具、齿轮、内燃机部件及航空、航天 飞行器的有关部件等。影响这种材料的强度的因素有: A:加热方案,A1=两步,A2=一步; (其中“两步”包括“一步”上的预烧结阶段). B:四种烧结添加剂 CaO,Y2O3,MgO 和 Al2O3 的总量, 1=14 摩尔%, 2=16 摩尔%, B B B3=18 摩尔%。 C:CaO 的含量,C1=0.0 摩尔%,C2=1.0 摩尔%,C3=2.0 摩尔%。 D: Y2O3 的摩尔%与 MgO 的摩尔的比率,D1=1:1, D2=1:2, D3=1:6. E:Y2O3 的摩尔%与 Al2O3 的摩尔%的比率,E1=2:1, E2=1:1, E3=1:4. F:烧结温度,F1=1800oC, F2=1850oC, F3=1900oC. G:烧结时间,G1=1h, G2=2h, G3=3h. 为了寻找使得该种材料的强度达到最高的工艺条件,特此安排了如下试验方 案,测量数据见表 1, 1.根据表 1 的测量数据,试建立合理的数学模型,并对试验结果进行分析; 2.寻找使得强度最大的最优工艺条件; 3.对你所建立的模型进行误差分析并做出评价; 4.你能否提出一种更合理的试验设计计划及试验结果的分析方法? 5.就你的研究对有关部门试写一份申报科技进步奖的报告。

表1
试验号 A 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 B 2 2 2 3 3 3 1 1 1 2 2 2 3 3 3 1 1 1

陶瓷试验方案及强度数据表
强度 F G 1 3 2 3 2 1 2 1 3 3 2 1 1 3 2 2 2 1 3 1 2 2 3 1 1 2 3 1 2 3 2 3 1 3 3 1 996.8 843.8 647.1 616.3 517.8 806.5 801.5 739.2 615.0 795.9 850.9 513.0 831.3 806.1 727.3 836.8 1001.0 783.6 816.2 667.9 552.3 526.1 933.5 803.2 863.3 627,5 854.0 921.8 665.9 981.4 908.1 643.9 716.3 937.6 796.9 714.3 534.3 552.6 498.1 882.9 964.9 846.2 797.0 583.9 937.0 990.6 718.9 912.5 627.6 584.0 862.9 955.3 824.4 617.7 596.0 499,5 940.1 1046.0 756.4 929.6 597.1 999.2 943.5 646.4 950.7 855.0 643.4 796.2 995.8 1009.0 602.1 987.3 563.9 724.8 840.9

因素 C D E 2 1 3 2 1 3 2 1 3 2 1 3 2 1 3 2 1 3 1 2 3 1 2 3 2 3 1 3 1 2 2 3 1 3 3 1 3 2 1 2 1 3 3 2 1 1 3 2 1 3 2 2 2 1

1002.0 1097.0

注:因素栏中数字“i”表示因素在试验中处于第 i 水平。

二、 基本假设
1.假设硅酸盐制陶材料的强度服从正态分布。 2.假设影响硅酸盐制陶材料强度的因素除了题中给出的取值外不再取其它 值。

三、 符号说明
x2 , x3 , x4 , x5 :CaO,Y2O3,MgO,Al2O3 的含量 x1 , x 6 x 7 , :加热方案的步骤数,烧结温度,烧结时间

y:材料强度
Y :强度的平均值
? Yi : Yi 的估计值

?i (i ? 0 , 1 ,? , 2

,14) :回归系数

? ? :回归系数的估计值

? i (i ? 0 , 1 ,? , 2

,18) :随机误差

μ :正态分布的均值 σ :正态分布的标准差

Q回 :剩余离差平方和

Q剩 :线性回归引起的误差
QT:总离差平方和 Q:离差平方和

四、问题的分析
影响材料强度的因素很多, 如果处理这些因素使每个因素所起的作用都很微 小且相互独立, 则可认为材料强度近似服从于正态分布;由于影响硅酸盐制陶材 料强度的因素有七个,都取某些特定的值,是可控变量。假设影响强度的因素之 间具有线性关系,可以进行多元非线性回归分析。然后对该模型进行修正,由于 实际上这些因素之间并不是线性关系,因此建立多元非线性回归模型,并对这个 模型进行显著性水平检验以判断其是否合理, 最后用最大似然估计法使它的回归 稳健。

五、模型的建立与求解
1. 影响强度的因素的处理 进行非线性回归时,为了排除交叉项(即形如 xi x j , i ? j 的项)的影响,对影 响强度的因素进行处理:把 B:四种烧结添加剂 CaO,Y2O3,MgO 和 Al2O3 的总量 C: CaO 的含量

D: Y2O3 的摩尔%与 MgO 的摩尔%的比率 E:Y2O3 的摩尔%与 Al2O3 的摩尔%的比率 化为 B: CaO 的含量 经过计算,得: 实验号 B(CaO) 1 0 2 1 0 2 1 0 2 1 0 2 1 0 2 1 0 2 C(Y2O3) 5/2 4 28/15 17/3 36/7 16/11 13/7 7/4 24/5 2 8/3 7/2 34/7 18/11 16/3 13/8 7/4 24/5 C: Y2O3 的含量 D: MgO 的含量 因素 单位:摩尔% 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 D(MgO) 5/2 8 56/5 17/3 72/7 96/11 26/7 21/2 24/5 12 8/3 7 68/7 108/11 16/3 39/4 21/2 24/5 E(Al2O3) 10 4 14/15 17/3 18/7 64/11 52/7 7/4 12/5 1 32/3 7/2 17/7 72/11 16/3 13/8 7/4 12/5 E: Al2O3 的含量

用 x2 , x3 , x4 , x5 分别表示 CaO,Y2O3,MgO,Al2O3 的含量。 用 x1 , x6 , x7 分别表示加热方案的步骤数,烧结温度,烧结时间。 2. 强度测量值的处理 表 1 给出的强度测量值有可能含有异常点,所以应当对测量值进行评估,去 除异常点。由于强度可以看作是正态分布的随机变量,设μ 是正态分布的均值, σ 是正态分布的标准差,而正态随机变量的取值的 99.7% 应当在(μ -3σ ,μ +3σ ) 区间范围内, 否则可认为该取值异常。 求每组试验的强度测量值的μ , , σ 列表如下:

试验 号 μ σ 试验 号 μ σ

1 859.1 119.437 10 597.48 25.1014

2 799.675 58.0813 11 862.18 109.2082

3 616.75 58.698 12 909.54 63.2938

4 579.3 32.0925 13 636.05 87.5663

5 510.375 13.8003 14 932.64 63.9665

6 980.5 91.6377 15 799.2 121.747

7 937.725 99.4984 16 640.14 55.2729

8 801.825 36.6723 17 803.05 64.0145

9 832.275 82.3448 18 979.74 31.3813

经过判断,每组强度的测量值都在各自的(μ -3σ ,μ +3σ )区间范围内, 即强度测量值没有异常点,不必去除。 因此取平均值即μ 作为 Y 值。

3.多元线性回归模型(模型一) 3.1 多元线性回归的原理 以本文中的 7 个可控变量为例,设随机变量与可控变量具有线性关系
?Y ? ? 0 ? ?1 x1 ? ? 2 x2 ? ? ? ? 7 x7 ? ? ? 2 ?? ? N (0, ? )

其中, ? 0 , ?1 , ? , ? 7 , ? 2 都是未知参数,ε 是随机误差。把 18 组实验 值带入,得: ?Y1 ? ? 0 ? ?1 x1,1 ? ? 2 x1,2 ? ? ? ? 7 x1,7 ? ?1 ? ?Y2 ? ? 0 ? ?1 x2,1 ? ? 2 x2,2 ? ? ? ? 7 x2,7 ? ? 2 ? ??? ?Ym ? ? 0 ? ?1 x18,1 ? ? 2 x18,2 ? ? ? ? 7 x18,7 ? ?18 ? 设

?1 x1,1 ? x1,7 ? ?? 1 ? ? ?0 ? ?Y1 ? ?? ? ?1 x ? ? ? ?Y ? ? x2,7 ? 2,1 ? ?1 ? , ? ? ? 2 ? ? 2 ?,X ?? ,? ? Y? ?? ? ?? ? ?? ? ?? ? ? ? ? ? ? ? ? ? ? ? ?? 18 ? ?Y18 ? ? ?7 ? ?1 x18,1 ? x18,7 ?
离差平方和 Q ? ? ( yi ? ? 0 ? ?1 xi1 ? ? ? ? 7 xi 7 ) 2
i ?1 18

用最小二乘法求 ? 0 , ?1 , ? , ? 7 ,即求解方程组:

18 ? ?Q ? ?2? ? yi ? ? 0 ? ?1 xi1 ? ? ? ? 7 xi 7 ? ? 0 ? ?? i ?1 ? 0 18 ? ?Q ? ?2? ? yi ? ? 0 ? ?1 xi1 ? ? ? ? 7 xi 7 ? xi1 ? 0 ? i ?1 ? ??1 ??? ? 18 ? ?Q ? ?2? ? yi ? ? 0 ? ?1 xi1 ? ? ? ? 7 xi 7 ? xi 7 ? 0 ? ?? i ?1 ? 7

化简该方程组,得:
? ? β = (XT X)?1 XT Y (XT X)β = XT Y

解,得:
? β = (XT X)?1 XT Y

3.2 多元线性回归模型的建立 用上述办法求得回归系数: 3071.4 3.2377 11.23 -1.0375 15.389 -2.0911 -48.786 -32.152

得到多元线性回归模型:
y ? 3071.4 ? 11.23x1 ? 15.389 x2 -48.786x3 -32.152 x4 ? 3.2377x5 -1.0375x6 -2.0911x7

(1)

把 x1 , x2 ,? x7 的值带入上式得到计算值,与题中给出的测量值比较,得到相 对误差为: -0.081687 -0.070717 0.14718 0.24375 -0.16222 0.056442 -0.047375 -0.064846 0.20271 -0.010121 0.094574 -0.10753 0.1779 -0.092577 -0.20431 0.14381 0.097644 -0.012961

计算值与测量值曲线如图:

从相对误差数据和曲线图中可以看出,计算值相对于测量值的误差很大,有 8 个点与测量值的相对误差在 10%以上。通过线性回归的显著性分析知,该线性 回归并不显著, 其拟合是不成功的,并且仅仅通过简单的剔除奇异点并不能够提 高其拟合程度。所以需要修正该模型,并且必须通过添加非线性项来提高其拟合 程度,修正的方法是建立二次非线性回归模型。 4.二次非线性回归模型(模型二)
?Y ? ? 0 ? ?1 x1 ? ? 2 x2 ? ? ? ? 7 x7 ? ?8 x8 ? ? 9 x9 ? ? ? ?14 x14 ? ? 设? 2 ?? ? N (0, ? )
, 其 中 , ?0 , ?1? , ?1 2 , ? 是 未 知 参 数 , ε 4 都

是 随 机 误 差 ,

2 2 x8 ? x12 , x9 ? x2 ,?, x14 ? x7 。把 18 组 x1 , x2 ,? x7 值带入,得:

?Y1 ? ? 0 ? ?1 x1,1 ? ? 2 x1,2 ? ? ? ? 7 x1,7 ? ?8 x1,8 ? ?9 x1,9 ? ? ? ?14 x1,14 ? ?1 ? ?Y2 ? ? 0 ? ?1 x2,1 ? ? 2 x2,2 ? ? ? ? 7 x2,7 ? ?8 x2,8 ? ?9 x2,9 ? ? ? ?14 x2,14 ? ? 2 ? ??? ?Y18 ? ? 0 ? ?1 x18,1 ? ? 2 x18,2 ? ? ? ? 7 x18,7 ? ?8 x18,8 ? ?9 x18,9 ? ? ? ?14 x18,14 ? ?18 ?

把 Y , x1 , x2 ,? x7 的值代入,用类似线性回归的方法,可以求得 回归系数

?0 , ?1 ,?, ?14 的值分别为:
-2.4086e+017 3.6129e+017 88.232 -120.26 -9.3906 1.8494 -9.4869 则二次非线性回归模型为:
y ? ?24086 ?1017 x1 ? 3.961?1017 x2 ? 288.54 x3 ? 7.781x4 ? 73.184 x5 ? 120.26 x6 ? 70.74 x7 (2) 2 2 2 2 ?1.2043 ?1017 x12 ? 133.29 x2 ? 9.3096 x32 ? 1.8494 x4 ? 9.4869 x52 ? 0.035833 x6 ? 5.8878 x7

-288.54 -7.7181 -73.184 -70.74 -1.2043e+017 133.29 0.032366 12.317

把 x1 , x2 ,? x7 的值带入以 ?0 , ?1 ,?, ?14 为系数的二次非线性回归模型方程, 得到计 算值,与题中给出的测量值比较,得到相对误差为:

1.9977 1.9153 6.7395

2.2182 2.2613 4.591

2.8536 2.1244 5.3653

3.1055 7.2741 6.7726

3.5764 4.9991 5.3239

1.827 4.8244 4.3727

计算值与测量值曲线如图:

可以看到, ?0 , ?1 , ? 8 的值明显比其他回归系数值大的多,从曲线图中可以看 出计算值与测量值严重的不一致,该二次非线性回归不显著,需要改进。

5.改进的二次非线性回归模型(模型三) 5.1 改进的二次非线性回归模型的建立 经过尝试,得出另一种二次线性回归模型
?Y ? ?1 x1 ? ? 2 x2 ? ? ? ? 7 x7 ? ?8 x8 ? ?9 x9 ? ? ? ?14 x14 ? ? ? 2 ?? ? N (0, ? )
, 其 中 , ?1 , ? 2?
2 , ?1 4 , ? 是 未 知 参 数 , ε 都

是 随 机 误 差 ,

2 2 x8 ? x12 , x9 ? x2 ,?, x14 ? x7 。

把 Y , x1 , x2 ,? x7 的值代入,可以求得回归系数 ?1 , ? 2 ,?, ?14 的值分别为: 2.0876e+005 -147.89 5.0221 -206.94 -184.09 -9.3971 4.6063 -69576 0.039679 -114.95 98.226 47.125 94.282 -10.257

改进的二次非线性回归模型为:
y ? 208760 x1 ? 206.94 x2 ? 4.6063x3 ? 114.95 x4 ? 94.282 x5 ? 147.89 x6 ? 184.09 x7
2 2 2 2 2 2 ?69576 x12 ? 98.226 x2 ? 10.257 x3 ? 5.0221x4 ? 9.3971x5 ? 0.039679 x6 ? 47.125 x7

(3)

把 x1 , x2 ,? x7 的值带入以 ?1 , ? 2 ,? , ?14 为系数的二次非线性回归模型方程,得 到计算值,与题中给出的测量值比较,得到相对误差为: -0.077239 -0.010867 -0.036657 0.028458 0.0090067 0.014374 0.038139 -0.017385 -0.0005953 0.085097 -0.037646 -0.030944 0.038745 -0.043914 -0.027059 计算值与测量值曲线如图: 0.083757 0.059472 -0.028331

观察相对误差的数据,发现这种模型的相对误差都在 10%以下,其中只有 4 个在 5%以上,计算值与测量值的曲线也吻合的比较好。把这种模型称为改 进的二次非线性回归模型。 5.2 显著性检验 显著性检验是一种检验
?Y ? ?1 x1 ? ? 2 x2 ? ? ? ? 7 x7 ? ?8 x8 ? ?9 x9 ? ? ? ?14 x14 ? ? ? 2 ?? ? N (0, ? )

是否成立的方法,主要检验 ?1 , ? 2 ,?, ?14 是否全为零。若全为零,认为该回
2 2 归不显著;若不全为零,认为回归显著。其中, x8 ? x12 , x9 ? x2 ,?, x14 ? x7 。

假设 ? 0:?1 ? 0, ? 2 ? 0,?, ?14 ? 0 ,记 Y ? 对总离差平方和进行分解:

1 18 ? Yi ,采用 F 检验法进行检验。 18 i ?1

? ? QT ? ? (Yi ? Y ) ? ? (Yi ? Yi ) 2 ? ? (Y i ? Y ) 2 ? Q剩 ? Q回
2 i ?1 i ?1 i ?1

18

18

18

18 ? ? Q剩 ? ? (Yi ? Yi ) 2 , Q回 ? ? (Y i ? Y )2 。 其中,

18

i ?1

i ?1

当 H0 成立时, Yi ? ?0 ? ? i ? ? i
Y ? ?0 ? ? ? ?

(i=1,2,…,18)

1 Q剩 ? ? 2 (17) ?2
1
2

1 Q回 ? ? 2 ( 1 4 ) ?2

Q剩 与 12 Q回 相互独立,可得: ? ?

F?

Q回 /14 ? F (14,3) Q剩 / 3

给定显著性水平 α =0.05,根据 P

?F ? F? (14,3)? ? ? 计算 F,

若 F ? F0.05 (14,3) ,则拒绝 H0,认为该回归是显著的; 若 F ? F0.05 (14,3) ,则接受 H0,认为该回归不显著。

通过 matlab 编程进行显著性水平的检验(程序见附录一) ,运行结果为: 剩余离差平方和 Q回 :20227 线性回归引起的误差 Q剩 :3.5548e+005 总离差平方和 QT:3.7571e+005 该非线性回归是显著的 6.稳健回归的改进的二次非线性回归模型(模型四) 6.1 稳健回归的改进的二次非线性回归模型的建立 在实际情况中, ?1 , ? 2 ,?, ?18 可能是近似正态分布,或含有异常点等,这就 使用最小二乘法得到的理论模型与实际模型相差较大,因此用稳健估计方法中 的最大似然估计法(M 估计)来修改模型三,使之对假设条件不很敏感,比用

最小二乘法拟合的模型有更良好的性能,可以自动发现异常数据并消除它们的 影响。 把 x1 , x2 ,? x7 的值代入模型三中,得到残差(测量值减去计算值) : 66.356 -8.8311 0.51318 -24.803 8.6904 -13.479 -77.4 35.265 22.608 -30.581 23.945 26.511 -16.486 14.469 28.86 -42.748 -35.534 22.642

残差的标准差:34.494 在所有的残差中,第 12 个点的残差最大,是残差标准的 2 倍。于是,把第 12 个点去掉,有其余的 17 个数据重新做最小二乘拟合,得到一个新的二次非 线性回归模型,求得 ?1 , ? 2 ,?, ?14 的值为: 1.8846e+005 -133.7 7 -15.314 -207.51 0 0.035833 175.93 -62795 5.8878 -144.46 110.2 156.17 -36.304

则稳健回归的改进的二次非线性回归模型(模型四) :
y ? 188460 x1 ? 207.51x2 ? 175.93 x3 ? 144.46 x4 ? 156.17 x5 ? 133.7 x6 ? 4.1593x7
2 2 2 2 2 2 ?62795 x12 ? 110.2 x2 ? 36.304 x3 ? 7 x4 ? 15.314 x5 ? 0.035833 x6 ? 5.8878 x7

(4)

6.2 误差分析 把 x1 , x2 ,? x7 的值带入以 ?1 , ? 2 ,?, ?14 为系数的二次非线性回归模型方程, 得 到计算值,与题中给出的测量值比较,得到相对误差为: -0.027426 -0.0023843 -0.0091045 -0.036798 0.0013965 0.011261 0.015483 0.017211 -0.0028661 0.02671 0.0094824 -0.0035873 -0.038121 -0.0073606 -0.027059 计算值与测量值曲线如图: 0.026906 9.3612e-005 0.026985

剩余离差平方和 Q回 :3374.5 线性回归引起的误差 Q剩 :3.5513e+005 总离差平方和 Q:3.5851e+005 残差: 23.561 -1.3693 2.4711 30.613 1.9067 -10.56 -16.989 7.2115 5.6152 -12.415 -8.8437 21.317 -14.324 2.8669 -13.732 -0.055931 -17.274

残差标准差:14.523 可以看到,经过最大似然估计法修正后的模型的误差和残差标准差都比模 型三小,显然比模型三性能好,所以我们把经过最大似然估计法修正后的模型 作为最终模型,称为稳健回归的改进的二次非线性回归模型(模型四) 。 7.强度最大的最优工艺条件的求解 由于对影响材料强度的因素进行了处理,材料的强度事实上成为加热方案, CaO,Y2O3,MgO 和 Al2O3 的含量,以及烧结温度和烧结时间的函数。因此只需

对上述因素的拟合函数讨论其达到最大值的条件即可寻找到强度最大的工艺 条件。根据模型四,材料的强度 Y 可近似表述为方程(4) 。 其中 x1 表示加热方案,其取值为 1,2;
x2 , x3 , x4 , x5 分别表示 CaO,Y2O3,MgO 和 Al2O3 的含量,其取值应满足:

? x2 ? 0,1, 2 ? x ? x ? x ? x ? 14,16,18 ? 2 3 4 5 ? x3 1 1 ? ? 1, , 2 6 ? x4 ? x3 1 ? ? 2,1, 4 ? x5
x6 表示烧结温度,其取值为 1800,1850,1900(摄氏度) ; x7 表示烧结时间,其取值为 1,2,3(小时) 。

这样,寻找到强度最大的工艺条件实质就是在满足上述约束的条件下,求 函数式(4)的极大值。而事实上因素 x1 ~ x7 之间有许多是相互独立,互不干 涉的: 其中变量 x1 , x2 , x6 , x7 分别与其他变量独立, 仅变量 x3 , x4 , x5 之间相互影响。 因此求函数式(4)的极值问题可看作求四对独立的二次函数极值和三对相互 影响的二次函数极值。可以在满足变量 x1 , x2 , x6 , x7 离散取值约束的条件下先求 出它们对应二次函数的极大值,而对余下的三个相互影响的变量 x3 , x4 , x5 对应 的项根据其约束特点作如下处理:
1 令 x4 ? ax3 , x5 ? bx3 ,其中 a ? 1, 2, 6且b ? ,1, 4 。则函数式(4)中含 x3 , x4 , x5 2

的对应项可转化为:
2 x3 (7a 2 ? 36.304 ? 15.314b2 ) ? x3 (175.93 ? 144.46a ? 156.17b)

其中 x3 ?

c ,对上式采用穷举法求其极值,这可用 matlab 编程实现。 1? a ? b

经 过 计 算 , 最 终 当 c ? 12, a ? 1, b ? 4 时 , 上 式 有 极 大 值 214.99 , 此 时
YM A X? 1 4 6 0 , . 对应各变量取值为:x1 , x2 , x3 , x4 , x5 , x6 , x7 ] ? [2, 2, 2, 2,8,1800,3] 。 3 [

上述讨论说明,强度最大的工艺条件是采用下述加热方案:每 100 单位烧

结添加剂中 CaO,Y2O3,MgO 和 Al2O3 的含量分别为 2 摩尔,2 摩尔,2 摩尔,8 摩尔,而烧结温度选择在 1800 摄氏度,加热时间为 3 小时,可使强度达到最 大值 1460.3。

六、模型评价
本文以非线性回归、显著性检验和极大似然估计为根据,建立了有关材料 强度的模型,经过分析误差(见 五、6.2)可知这个理论模型与实际模型很接 近,是一个良好的合理的模型。并且由模型给出合理的试验设计计划,见附录 三。但是估计参数时使用的是迭代法,需要给定合适的初始点;理论模型与实 际模型没有在所有的点处都完全重合。题中给出的约束条件很多,难以求解, 本文给出了一种分离相互独立和相互影响的项从而减小求解难度以求得解的 方法。

参考文献
1. 《随即数学基础》田铮 肖华勇 温显斌 编著 2. 《概率论与数理统计》徐伟 赵选民 等 编著 3. 《精通 MATLAB》 张志涌 等 编著 西北工业大学讲义 西北工业大学出版社

北京航空航天大学出版社

附录一
%求每组试验的强度测量值的μ ,σ %求多元线性回归模型的回归系数,相对误差,画计算值和测量值的曲线图 format short g; X=[1 1 1 5/2 10 5/2 1800 3 11 0 4 8 4 1900 1 11 2 28/15 56/5 14/15 1850 2 11 1 17/3 17/3 17/3 1900 2 11 0 36/7 72/7 18/7 1850 3 11 2 16/11 96/11 64/11 1800 1 11 1 13/7 26/7 52/7 1850 1 11 0 7/4 21/2 7/4 1800 2 11 2 24/5 24/5 12/5 1900 3 12 1 2 12 1 1900 1 12 0 8/3 8/3 32/3 1850 2

12 12 12 12 12 12 12

2 1 0 2 1 0 2

7/2 34/7 18/11 16/3 13/8 7/4 24/5

7 7/2 68/7 17/7 108/11 72/11 16/3 16/3 39/4 13/8 21/2 7/4 24/5 12/5

1800 3 1800 2 1900 3 1850 1 1850 3 1850 3 1800 1

]; Y=[996.8 783.6 796.9 0 0 843.8 816.2 714.3 824.4 0 647.1 667.9 534.3 617.7 0 616.3 552.3 552.6 596.0 0 517.8 526.1 498.1 499.5 0 1002.0 1097.0 882.9 940.1 0 806.5 933.5 964.9 1046.0 0 801.5 803.2 846.2 756.4 0 739.2 863.3 797.0 929.6 0 615.0 627.5 583.9 597.1 563.9 795.9 854.0 937.0 999.2 724.8 850.9 921.8 990.6 943.5 840.9 513.0 665.9 718.9 646.4 0 831.3 981.4 912.5 950.7 987.3 806.1 908.1 627.6 855.0 0 727.3 643.9 584.0 643.4 602.1 836.8 716.3 862.9 796.2 0 1001.0 937.6 955.3 995.8 1009.0 ]; Z=zeros(18,1); for i=1:18 e=5; for j=1:5 if Y(i,j)==0 e=e-1; end U(i)=mean(Y(i,:))*5/e;%计算均值 O(i)=std(Y(i,:))^2;%计算方差 O(i)=(O(i)*4/(e-1))^(1/2); end for j=1:5 if Y(i,j)<-3.*O(i)+U(i)||Y(i,j)>3.*O(i)+U(i) Y(i,j)=0; e=e-1; end end

Z(i,1)=mean(Y(i,:))*5/e; end B=inv(X'*X)*X'*Z Y1=X*B; for i=1:18 P(i,1)=(Y1(i,1)-Z(i,1))/Z(i,1); end N=1:18; plot(N,Z,N,Z,'k*',N,Y1,'r',N,Y1,'k*'); P %求多元非线性回归模型的回归系数,相对误差,画计算值和测量值的曲线图 Y =[859.1000 799.6750 616.7500 579.3000 510.3750 980.5000 937.7250 801.8250 832.2750 597.4800 862.1800 909.5400 636.0500 932.6400 799.2000 640.1400 803.0500 979.7400 ]; W=X(:,[2:8]); V=[X W.^2 ]; B=inv(V'*V)*V'*Y Y1=zeros(18,1); Y1=V*B; N=1:18; plot(N,Y,N,Y,'k*',N,Y1,'r',N,Y1,'k*') for i=1:18 P(i,1)=(Y1(i,1)-Y(i,1))/Y(i,1); end P %求改进的多元非线性回归模型的回归系数,相对误差,画计算值和测量值的曲线图

%进行显著性检验 %开始非线性拟合 W=X(:,[2:8]); V=[W W.^2 ]; B=inv(V'*V)*V'*Y Y1=zeros(size(Y,1),1); Y1=V*B N=1:size(Y,1); plot(N,Y,N,Y,'k*',N,Y1,'r',N,Y1,'k*') for i=1:size(Y,1) P(i,1)=(Y1(i,1)-Y(i,1))/Y(i,1); end P Q_MIN=Y'*Y-B'*(V'*Y) %最小离差平方和 Q_residual=Q_MIN %剩余离差平方和 Q_huigui=sum((Y1-mean(Y)*ones(size(Y,1),1)).^2) %线性回归引起的误差 Q_licha=Q_residual+Q_huigui%总离差平方和 F=(Q_huigui/size(Y,1))/(Q_residual/(size(Y,1)-size(V,2)-1)); arf=0.05; %给定显著性水平 F_x=finv(1-arf,size(Y,1),size(V,2));%计算反 F 分布 if (Q_residual<Q_huigui)&(F>F_x) display('非线性回归是显著的') else display('非线性回归是不显著的') end %以下为回归系数的显著性校验 A=inv(V'*V); T=zeros(size(V,2),1); sigma= Q_residual/(size(Y,1)-size(V,2)-1); for i=1:size(V,2) T(i,1)=B(i,1)/((sigma*A(i,i))^(1/2)); T(i,1)=abs(T(i,1)); end arf=0.45; %arf 不能太小 T_t=tinv(1-arf,size(Y,1)-size(V,2)-1) %计算反 T 分布 for i=1:size(V,2) if T(i,1)<T_t display(['回归系数' num2str(i) '显著的等于零']) B(i,1)=0; %剔除该项 end end

附录二

由于本文中预先对影响强度的因素进行了处理,把 CaO、 2O3、MgO、 2O3 Y Al 的总量和比例换算成了这四种化学成分各自的含量, 在此讨论一下用未经处理的 数据建立的模型。 方案(1) :用 CaO、Y2O3、MgO、Al2O3 的总量和比例得到的模型 回归系数: 1.7629e+005 60.334 0.033475 相对误差: -0.0035407 -0.0094603 0.0070049 -0.030148 -0.008327 0.0035506 -0.019248 0.0056222 -0.00046641 0.015815 0.0096374 -0.0061484 -0.00025972 -0.006964 0.0043542 0.018027 0.0060539 0.01326 -203.89 -58729 -21.676 -295.23 5.0381 486.2 165.01 -524.88 -342.49 -123.93 149.92

计算值和测量值的曲线图:

程序:

format short g; X=[1 1 16 1 1 1/4 1800 3 1 1 16 0 1/2 1 1900 1 1 1 16 2 1/6 2 1850 2 1 1 18 1 1 1 1900 2 1 1 18 0 1/2 2 1850 3 1 1 18 2 1/6 1/4 1800 1 1 1 14 1 1/2 1/4 1850 1 1 1 14 0 1/6 1 1800 2 1 1 14 2 1 2 1900 3 1 2 16 1 1/6 2 1900 1 %1 2 16 0 1 1/4 1850 2 1 2 16 2 1/2 1 1800 3 1 2 18 1 1/2 2 1800 2 1 2 18 0 1/6 1/4 1900 3 1 2 18 2 1 1 1850 1 1 2 14 1 1/6 1 1850 3 1 2 14 0 1/6 1 1850 3 1 2 14 2 1 2 1800 1 ]; Y =[859.1000 799.6750 616.7500 579.3000 510.3750 980.5000 937.7250 801.8250 832.2750 597.4800 %862.1800%取掉将得到很漂亮的曲线 909.5400 636.0500 932.6400 799.2000 640.1400 803.0500 979.7400 ]; %以下开始非线性拟合 W=X(:,[2:8]); V=[W W.^2 ]; %V=[X W.^2]; %线性回归不显著 %[B,BINR,R,SATA]=regress(Y,V)

B=inv(V'*V)*V'*Y Y1=zeros(size(Y,1),1); Y1=V*B; N=1:size(Y,1); plot(N,Y,N,Y,'k*',N,Y1,'r',N,Y1,'k*') for i=1:size(Y,1) P(i,1)=(Y1(i,1)-Y(i,1))/Y(i,1); end Y1-Y P

方案(2) :当 X 阵中的值取各方案序号时得到的模型 回归系数: 2391.4 60.334 83.689 相对误差: -0.0035407 -0.0094603 0.0070049 -0.030148 -0.008327 0.0035506 -0.019248 0.0056222 -0.0004664 0.015815 0.0096374 -0.0061484 -0.00025972 -0.006964 0.0043542 0.018027 0.0060539 0.01326 -165.96 -764 -21.676 -625.25 20.153 163.35 165.01 -191.83 -49.862 -338.08 88.99

计算值和测量值的曲线图:

程序:
format short g; X=[1 2 2 1 3 1 3 1 2 1 2 2 3 1 1 2 3 3 1 2 2 1 3 2 1 2 3 2 1 3 1 2 1 2 3 1 3 3 3 3 1 1 1 1 2 2 3 2 1 1 1 1 3 2 1 2 1 1 3 1 1 3 3 2 2 2 3 1 3 1 %2 2 1 1 3 2 2 2 2 3 2 2 1 3 2 3 2 2 1 1 2 2 3 1 3 3 3 3 2 3 3 1 2 2 1 2 1 2 3 2 2 3 2 1 1 3 2 2 3 2 1 3 1 1 1 1 ]; Y =[859.1000 799.6750

616.7500 579.3000 510.3750 980.5000 937.7250 801.8250 832.2750 597.4800 %862.1800%取掉将得到很漂亮的曲线 909.5400 636.0500 932.6400 799.2000 640.1400 803.0500 979.7400 ]; %以下开始非线性拟合 W=X; V=[W W.^2 ]; %V=[X W.^2]; %线性回归不显著 %[B,BINR,R,SATA]=regress(Y,V) B=inv(V'*V)*V'*Y Y1=zeros(size(Y,1),1); Y1=V*B; N=1:size(Y,1); plot(N,Y,N,Y,'k*',N,Y1,'r',N,Y1,'k*') for i=1:size(Y,1) P(i,1)=(Y1(i,1)-Y(i,1))/Y(i,1); end Y1-Y P

结论:方案(1)比本文中得到的最终模型好,而方案(2)又比方案(1) 好,这说明,X 阵的值取的越简单,得到的拟合曲线就越不精确,看起来误差就 越小。

附录三
在本文分析的基础上,可以给出进行试验的更好的思路: 用模型四进行回归系数的显著性水平检验,得到:

3.5281 3.4886 1.6462

4.3575 0.026749 3.2879

1.943 3.5266 3.464

2.2416 4.878 0.15678

3.3814 2.6865

由数据可知,第 2 项即含 x2 的项对 y 影响最大,第 7 项即含 x7 的项对 y 影 响最小。因此,进行试验时可以先改变对 y 影响大的量以对 y 进行大的调整, 再改变对 y 影响小的量对 y 进行微调,可以减少试验次数。


相关文章:
解析几何第四版吕林根课后习题答案第一章
图 1-5 9 在平行六面体 ABCDEFGH (参看第一节第 4 题图)中,证明 AC + AF + AH = 2 AG .证明 AC + AF + AH = AC + AF + AD + DH = AC +...
数据结构 第4-5章习题答案
数据结构 第4-5章习题答案_理学_高等教育_教育专区。数据结构 第4~5 章一、填空题(每空 1 分,共 20 分) 串、数组和广义表 习题答案称 1. 不包含任何...
4-专题四--课后练习题答案
3-专题三答案 5-专题五--课后练习题答...1/2 相关文档推荐 ...一切社会关系的总和 D 第三章第一节 P64 4、马克思对人的本质的科学论断确立...
高中数学必修4习题和复习参考题及对应答案
高中数学必修4习题和复习参考题及对应答案_数学_高中教育_教育专区。高中数学必修...第二象限; (2)80° ,第一象限; (3)236°50′,第三象限; (4)300° ,...
1-4多选题答案
1-4多选题答案_医学_高等教育_教育专区。市场营销多选题试题库出题卡 2 多选题 题目编号: 0101 C 最难) 教材名称 页码 市场营销学 主编 毕思勇 第一章 难度...
高二化学选修4课后习题 参考答案(全)
2/19 4. 下列关系式中正确的是 A.a<c <0 参考答案 1.A;2.B、C;3.C;4. C。 B.b>d>0 C.2a=b<0 D.2c=d>0 第二节 燃烧热能源 习题...
第一学期测练题理四答案
第一学期高三数学科单元测练题(理四 (理四)参考答案一、选择题(5 分× 8=40 分) 题号 答案 1 D 2 A 3 B 4 D 5 A 6 C 7 C 8 C 二、填空题...
人教版化学选修4课本练习题答案(最新)
人教版化学选修4课本练习题答案(最新)_理化生_高中教育_教育专区。化学选修 4 课本课后练习题答案第一第一节(P.6) 1. 化学反应过程中所释放或吸收的能量,...
基础会计学 彭卉主编 第四章第一至第四题答案
基础会计学 彭卉主编 第四第一第四题答案_理学_高等教育_教育专区。四、综合练习题 (一)练习资金筹集业务的核算 资料:中海公司 200X 年 4 月发生下列经济...
office第四套题目和答案
office第四题目答案_IT认证_资格考试/认证_教育专区。计算机国二考试选择题 一、WORD 请在【答题】菜单下选择【进入考生文件夹】命 令,并按照题目要求完成...
更多相关标签: