作問卷分析時,遺漏值處理
作問卷分析時,資料總是不完全讓人超頭痛,
分析結果根本不符合實際!!
SAS小博士來幫你解決,誤差錯誤不再出現!!
¢ 遺漏值會如何產生呢?
-
作答不小心遺漏
-
不明瞭題意而拒絕填答
-
侵犯到私人隱私而拒絕填答
¢ 有遺漏值可能會造成哪些問題呢?
-
樣本資料減少
-
降低估計的有效性
-
造成推估上的偏誤
¢ 一般問卷處理遺漏值方法有三種:
1. 只採用填寫完整的資料
通常有遺漏值的問卷數一定不少,那這些樣本資料該怎麼辦呢?當我們有大量的樣本資料時,刪減問卷數就變得不是問題了。我們可以只採用有完整資料的問卷,不僅還是符合常態分配,分析結果絕對不會受遺漏值影響,正確無誤差!!
2. 刪除樣本個數或變數
問卷的問題百百種,受測者也是無奇不有。問卷可能會有重複或是侵犯個人隱私的問題,造成某個題項拒絕填答而產生遺漏值,或是某個受測者在填寫問卷時,因為趕時間只填答一題而造成過多的遺漏值,這時我們就可以刪除這個題項或是受測者,使這些遺漏值可以不受影響,將結果大大提升!!
3. 插補法 (*插補法只適用於量化變數(Numeric variables))
-
單一插補(Single Imputation)
我們可以利用資料之分配與平均數、中位數、眾數或迴歸預測值來估計遺漏值,不僅問項變數與受測者的樣本通通有,也比有遺漏值時要來得更符合實際結果。但缺點是完整資料與遺漏資料為多對一關係,若將遺漏值視為單一常數會低估資料的變異數與共變數,造成誤差。
1. 平均數插補法
利用變數平均數來估計遺漏值。
2. 中位數插補法
利用變數中位數來估計遺漏值。
-
多重插補法(Multiple Imputation)
改善單一插補法之缺點,利用模擬的方法,如馬可夫鍊,對於同一遺失資料點進行多次估計,在分析這些資料的平均數與變異數後產生最終的估計結果產生整體之平均數來填補遺漏值。
1. MCMC Method
利用蒙地卡羅模擬法與馬可夫鍊理論來作資料插補。
2. Monotone Method
遺失數據必須為一種單一模式,利用以下的插補方法來作資料插補。
Monotone Propensity score Method
Monotone Regression Method
3. FCS Regression Method
可指定依據完全條件式指定 (FCS) 方法作資料插補。
Tags