在一般的迴歸分析中,依變數(Y)為數值型變數,但若依變數不為連續型的數值型變數而是二元類別資料(如:男或女、存活或死亡)的型態時,則羅吉斯迴歸分析可能是被運用得最廣的方法。
資料說明:
這是1974年某研究中心探討癌症是否有緩解的資料,此資料包括病人的特徵和癌症發生是否緩解。
變量remiss是一個二元變量,其值1 表示患者的癌症有緩解,而0 表示沒有緩解。另外的6 個變數(cell,smear,infil,li,blast,temp)為影響癌症是否緩解的可能危險因素。
![10 10](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e0a7a40.jpg)
在工作的快捷選單中選擇<分析>→<迴歸(R)>→<羅吉斯迴歸(S)>
![11 11](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e0df2d9.jpg)
於左側的選單中選擇<資料>,將要指派的變數(A)中的、、、
-
、和變數拖曳至右側工作角色(T)中的屬量變數欄中;接著將要指派的變數(A)中的拖曳至右側工作角色(T)中的應變數變數欄中。
![12 12](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e121977.jpg)
在左側的選單中選擇<模型>的<回應>,在<符合模型至層級(F)>的選項中選擇 1。
![13 13](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e1533bd.jpg)
在左側的選單中選擇<模型>的<效果>,選取類別及屬量變數(V)中的、、、
-
、和變數後點選<主要>。
![14 14](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e17fcd4.jpg)
這時Cell、smear、infil、li、blast 和 temp 就會輸入到右側的效果(E)欄中。
![15 15](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e1ac295.jpg)
在左側的選單中選擇<模型>的<選取>,在模型選取法選項中選取<逐步選擇>,將下方的顯著水準選項中的進入模型改為0.3,保留在模型中改為0.35。
![16 16](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e1e4b25.jpg)
在左側的選單中選擇<模型>的<選項>,勾選模型符合評估的<Hosmer及Lemeshow配適度檢定(H)>,及條件勝算比的<Wald(A)>。
![17 17](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e2226c8.jpg)
在左側的選單中選擇<預測>,設定方式如下圖所示,最後按<執行>。
![18 18](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e25fd35.jpg)
結果如下表所示:
我們在模型選取法選項中選取了逐步選擇的方法,下表為逐步選擇的最後結果摘要表,由此表可知最終我們在6個變數中選出了li、temp 和 cell 這3個具有影響力的變數。
而模式係數可以由最大概度估計值的分析表中獲得,建立模式如下:
remiss=67.63+9.65*cell+3.87*li-82.07*temp
![19 19](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e29960d.jpg)
而由Hosmer和Lemeshow配適度檢定表中的p-value=0.5054大於α 值,表示沒有足夠的證據顯示此模型不合適。
![20 20](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e2c2ebd.jpg)
迴歸分析預測表中,除了包含原來的數據外,還有預測值(_INTO_),而IP_1 則代表remiss=1 的預測機率,若此機率值大於0.5則remiss的預測值即為1 ,反之則為0。
![21 21](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e706e3265fe.jpg)
Tags