根據上一節最後選定的模型,我們做一次是否有共線性的問題。在此,我們有兩種方法來判斷,(1) 變異數膨脹因子(Variance Inflation Factor,VIF) (2) 共線性診斷(Collinearity Diagnostics)。當變異數膨脹因子>10或是共線性診斷>100時,表示有共線性的問題。
做共線性的檢定可從迴歸分析的結果頁面找到「修改工作」à再次確認迴歸分析的資料是否正確=>統計值=>勾選「共線性分析」與「變異數膨脹值」。
![4-1 4-1](https://blogs.sas.com/content/sastaiwan/files/2020/02/558cf8d3c1b99.jpg)
![4-2 4-2](https://blogs.sas.com/content/sastaiwan/files/2020/02/558cf931f409e.jpg)
由上表可知,在變異數膨脹值之下沒有任何的變數有共線性的問題;但是若用共線性診斷則會發現在條件索引的值有大於100,顯示變數有共線性的問題;在此,我們處理共線性的問題是採用拿掉變數,所以試著將Weight_log從模型中刪除,再配合用逐步迴歸選取法來看我們選定的模型。
![4-3 4-3](https://blogs.sas.com/content/sastaiwan/files/2020/02/558cf9330e945.jpg)
其結果如下:
![4-4 4-4](https://blogs.sas.com/content/sastaiwan/files/2020/02/558cf933bea22.jpg)
在逐步選取法裡,最後選定的變數為Cylinders、Length、Horsepower、MPG_Highway、Invoice。而變數在迴歸裡的估計如下:
![4-5 4-5](https://blogs.sas.com/content/sastaiwan/files/2020/02/558cf934628a2.jpg)
當然,我們也可以用Mallows’ Cp 來看一下結果:修改工作=>在資料裡,將Weight_log從模型中刪除=>模型選擇「Mallows’ Cp」並打勾選下方的調整R平方、Akaike訊息準則(AIC)、Mallows’ Cp、與SBC=>執行=>詢問是否取代先前結果時,選擇「是」。
![4-6 4-6](https://blogs.sas.com/content/sastaiwan/files/2020/02/558cf935f3ac7.jpg)
![4-7 4-7](https://blogs.sas.com/content/sastaiwan/files/2020/02/558cf936e7bad.jpg)
擷取前5筆資料來看,發現無論在C(p)、調整的r平方、AIC或是SBC,我們都將選擇「模型索引1」為最佳模型,所以完整的模型為:
![4-8 4-8](https://blogs.sas.com/content/sastaiwan/files/2020/02/558cf9380110b.jpg)
我們選取「模型索引1」,其結果與逐步選取法結果一致。同時我們也解決了變異數膨脹值或是共線性診斷共線性的問題,如下表。
![4-9 4-9](https://blogs.sas.com/content/sastaiwan/files/2020/02/558cf938e3897.jpg)
資料仍保持服從常態分配的假設。
![4-10 4-10](https://blogs.sas.com/content/sastaiwan/files/2020/02/558cf939f003a.jpg)
![4-11 4-11](https://blogs.sas.com/content/sastaiwan/files/2020/02/558cf93ab3cc4.jpg)
Tags