实验目的和要求
(1)通过上机操作使学生掌握用proc import语句将excel数据导入SAS,生成SAS数据集;(2)掌握用proc reg过程对数据进行一元线性回归分析和可转化一元线性的回归分析;(3)会正确阅读一元回归分析的运行结果,并写出回归方程。
实验步骤:
1.棉花红铃虫第一代产卵高峰日百株卵量x(粒)与百株累计卵量y(粒)的8组观测数据如下表:
棉花红铃虫第一代卵量的观测数据
1 2 3 4 5 6 7 8 | |
14.3 14.0 69.3 22.7 7.3 8.0 1.3 7.9 | |
46.3 30.7 144.6 69.2 16.0 12.3 2.7 26.3 |
(1)试建立一元线性回归方程并作回归方程的显著性检验.
代码:
data aaa1;
input i x y@@;
cards;
1 14.3 46.3 2 14.0 30.7 3 69.3 144.6 4 22.7 69.2
5 7.3 16.0 6 8.0 12.3 7 1.3 2.7 8 7.9 26.3
;
run;
proc reg data=ex4.aaa1 outest=outest;
model y=x;
plot R.*P. R.*X R.*NQQ.;
output out=out p=p R=R student=stdr cookd=cookd;
run;
截图:
一元线性回归方程
回归方程的显著性检验
(2)如果令,试求此点的预测值及置信水平的置信区间.
求预测值代码:
data out2;
set outest;
y=intercept+x*20;
keep y;
proc print data=out2;
run;
当X=20时,y的预测值是47.4584
求置信区间代码
proc means data=aaa1 clm;
run;
截图:
2.炼钢厂出钢时所用的盛钢水的钢包,在使用过程中由于钢液及炉渣耐火材料的浸蚀,其容积不断增大.经试验得钢包的容积Y与相应使用的次数X的数据如下表
钢包浸蚀数据
X | y | X | y |
2 | 106.42 | 11 | 110.59 |
3 | 108.2 | 14 | 110.6 |
4 | 109.58 | 15 | 110.9 |
5 | 109.5 | 16 | 110.76 |
7 | 110 | 18 | 111 |
8 | 109.93 | 19 | 111.2 |
10 | 110.49 |
(1)绘制Y对X的散点图,从图能否看出Y与X的函数关系
将上述的表格导入到excel表中,注意后缀为.xls格式的,否则会导入失败
代码:
proc import out=bbb1
datafile="G:\实验课作业\应用统计方法\实验四\gb.xls"
DBMS=EXCEL2000 replace;
proc plot data=Ex4.bbb1;
plot y*x="+";
run;
截图:
(2)假定Y与X的函数关系为①双曲线:,②幂函数:,③对数函数:,④负指数函数:,试作变量变换化非线性回归为线性,并用REG过程建立回归方程.
①双曲线:
代码:
data bbb2;
set Ex4.bbb1;
x=1/x;
y=1/y;
proc reg;
model y=x;
plot y*X;
run;
截图:
②幂函数:
代码:
data bbb3;
set Ex4.bbb1;
x=sqrt(x);
y=y;
proc reg;
model y=x;
plot y*X;
run;
截图:
③对数函数:
代码:
data bbb4;
set Ex4.bbb1;
x=LOG(x);
y=y;
proc reg;
model y=x;
plot y*X;
run;
截图:
④负指数函数:
代码:
data bbb5;
set Ex4.bbb1;
x=EXP(1/x);
y=y;
proc reg;
model y=x;
plot y*X;
run;
截图:
(3)比较以上四种函数关系,找出最佳的拟合曲线.
①
②
③
④
通过比对R-Square值( 就是R的平方,R方通常用来描述数据对模型的拟合程度的好坏),第四个
型函数的拟合值最高,所以最佳拟合函数为
型