• 實驗五 - - 回歸分析SAS過程(2) - 下載本文

    ?的殘差圖 (b)擬合值y

    結果分析:1) 由學生化殘差的正態QQ圖可知,其點明顯不在一條直線上;

    2) 求得有序學生化殘差與相應正態分布的分位數的相關系數?=0.94091與1相

    差較大.因此,若擬合線性回歸模型,則誤差分布與正態分布有較大的偏離;

    3) Y擬合值的殘差圖也表明Y與X1,X2不滿足線性關系,且兩個擬合值還為負

    數.由此知, 直接假定體積與直徑和樹干高度之間的線性回歸關系是不恰當的.

    ?(2)對因變量Y作Box-Cox變換

    第一步:確定變換參數?

    鑒于(1)中的殘差分析結果,我們對Y作Box-Cox變換

    Y(?)?Y??1????,??0.對不同的?值,由式SSE(?;Z(?)),并利用SAS系統proc iml ???0?lnY,過程計算SSE(?;Z(?))的值.由圖2.5給出了SSE(?;Z(?))隨?的變化曲線.

    求變換參數?的程序:

    proc iml; n=31; t=1;

    use examp2_6; read all var{x1 x2 y} into m; do i=1 to n; t=t#m[i,3]; end;

    prod=t##(1/n); j=j(n,1,1); xx=j||m[,1:2];

    h=xx*inv(xx`*xx)*xx`; do lamb=-0.5 to 0.5 by 0.01; if lamb=0 then zlamb=prod#log(m[ ,5]);

    else zlamb=(m[,3]##lamb-j)/(lamb#(prod##(lamb-1))); sse=zlamb`*(i(n)-h)*zlamb; lsse=lsse//(lamb||sse); end;

    tt=prod#log(m[ ,3]); sse0=tt`*(i(n)-h)*tt; lsse[30,1]=0; lsse[30,2]=sse0; index=lsse[>:<,];

    minlsse=index[1,2]; lambda0=lsse[minlsse,1]; print lambda0;

    create plotdata var{lambda sse}; append from lsse; z=(m[,3]##lambda0-j(n,1,1))/lambda0; outm=m[,1:2]||z; create trans var{x1 x2 z};

    append from outm; quit;

    proc print data=trans; run;

    畫SSE(?;Z(?))?(Z(?))T(I?H)Z(?)圖

    goptions reset=all; proc gplot data=plotdata; plot sse*lambda; symbol v=point i=spline; run;

    由結果給出了SSE(?;Z(?))隨?的變化曲線.

    由圖可知,SSE(?;Z(?))在??0.31時達到最小,因此,在Box-Cox變換式中取

    ??0.31.記變換后的因變量為Z,即

    Y0.31?1 Z?

    0.31第二步:對Z關于X1,X2,X3,X4擬合線性回歸模型Z?X???,利用殘差分析考察模型的合理性并作出擬合結果

    建立回歸模型Z?X???,作殘差分析程序如下: proc reg data=trans; model z=x1-x2;

    output out=c p=predict1 r=resid1 student=r1; run;

    goptions reset=all;

    proc capability graphics noprint data=c; qqplot r1/normal; run;

    goptions reset=all; proc gplot data=c; plot resid1*predict1; symbol v=dot i=none; run;

    回歸模型Z?X???及殘差分析結果輸出:





    日本黄色视频在线观看 - 在线观看 - 影视资讯 - 品尚网