在一般的迴歸分析中,依變數(Y)為數值型變數,但若依變數不為連續型的數值型變數而是二元類別資料(如:男或女、存活或死亡)的型態時,則羅吉斯迴歸分析可能是被運用得最廣的方法。
資料說明:
這是1974年某研究中心探討癌症是否有緩解的資料,此資料包括病人的特徵和癌症發生是否緩解。
變量remiss是一個二元變量,其值1 表示患者的癌症有緩解,而0 表示沒有緩解。另外的6 個變數(cell,smear,infil,li,blast,temp)為影響癌症是否緩解的可能危險因素。
在工作的快捷選單中選擇<分析>→<迴歸(R)>→<羅吉斯迴歸(S)>
於左側的選單中選擇<資料>,將要指派的變數(A)中的、、、
-
、和變數拖曳至右側工作角色(T)中的屬量變數欄中;接著將要指派的變數(A)中的拖曳至右側工作角色(T)中的應變數變數欄中。
在左側的選單中選擇<模型>的<回應>,在<符合模型至層級(F)>的選項中選擇 1。
在左側的選單中選擇<模型>的<效果>,選取類別及屬量變數(V)中的、、、
-
、和變數後點選<主要>。
這時Cell、smear、infil、li、blast 和 temp 就會輸入到右側的效果(E)欄中。
在左側的選單中選擇<模型>的<選取>,在模型選取法選項中選取<逐步選擇>,將下方的顯著水準選項中的進入模型改為0.3,保留在模型中改為0.35。
在左側的選單中選擇<模型>的<選項>,勾選模型符合評估的<Hosmer及Lemeshow配適度檢定(H)>,及條件勝算比的<Wald(A)>。
在左側的選單中選擇<預測>,設定方式如下圖所示,最後按<執行>。
結果如下表所示:
我們在模型選取法選項中選取了逐步選擇的方法,下表為逐步選擇的最後結果摘要表,由此表可知最終我們在6個變數中選出了li、temp 和 cell 這3個具有影響力的變數。
而模式係數可以由最大概度估計值的分析表中獲得,建立模式如下:
remiss=67.63+9.65*cell+3.87*li-82.07*temp
而由Hosmer和Lemeshow配適度檢定表中的p-value=0.5054大於α 值,表示沒有足夠的證據顯示此模型不合適。
迴歸分析預測表中,除了包含原來的數據外,還有預測值(_INTO_),而IP_1 則代表remiss=1 的預測機率,若此機率值大於0.5則remiss的預測值即為1 ,反之則為0。
Tags