模型診斷

0
我們將著重在討論價格為35000元(單位:美金)以下之汽車。首先我們先將資料做篩選。篩選與排序 =>變數 =>全選所有的變數拖曳至右邊 =>篩選條件 =>選擇「Invoice35000」 =>確定。完成之後,即可將所有價格小於35000元的汽車篩選出來。

2-1
接著,我們把反應變數(EngineSize)取log,並將產生出新變數且命名為EngineSize_log。從「查詢產生器」 =>將變數「Invoice」至「Length」拖曳至右邊à按右邊「計算機」一下 =>進階運算式 =>下一步
2-2
 =>函數 =>將「f(.) LOG函數」連點兩下,將自動跳至上面視窗 =>從t1裡找到EngineSize後連點兩下,將自動跳至上面視窗 =>下一步 =>欄名稱命名為「EngineSize_log」後 =>完成。
2-3
由於MPG_City及MPG_Highway有共線性之問題,因此我們只選擇MPG_Highway變數。
再來,針對解釋變數Weight來做轉換,處理方法同EngineSize;將新變數命名為Weight_log。完成之後,我們將在右邊欄名稱的位置看到新增的二個變數,確認沒有問題後 =>執行。
2-4
再一次來進行迴歸分析。分析 =>迴歸 =>線性迴歸 =>資料:EngineSize_log選至應變數;其他的變數(Invoice、Cylinders、Horsepower、MPG_Highway、Wheelbase、Length、Weight_log)選至解釋變數 =>統計值:勾選「變異數膨脹值」、「不等變異性檢定」、「Durbin-Watson統計值」 =>執行。
2-5
估計結果如下表:
2-6
變數:Invoice、Cylinders、Horsepower、Length、Weight_log均為顯著,但是Wheelbase及MPG_Highway並未達顯著。
變異數檢定結果為變異數一致,而DW檢定結果為觀測的殘差值之間為獨立。如下表:
2-7
我們亦可以從殘差圖來看預測的EngineSize_log與殘差之間的關係:
2-8
在Q-Q plot裡,其資料分佈看起來亦服從常態的假設。
2-9
其他變數與殘差之間的關係,看起來分散的很均勻。
2-10
2-11
將EngineSize以來表示,所以目前的迴歸模型為:

2-12

下一章節我們將討論模型選取。
Tags
Share

About Author

SAS Taiwan

SAS 學習資源 : https://blogs.sas.com/content/sastaiwan/

Comments are closed.

Back to Top