在做問卷調查時,分析者在回收完問卷後,常常直接針對問卷的資料進行分析,而沒有顧慮到資料的代表性。何謂資料的代表性?就是從母體抽出的樣本和母體的結構相似與否,用以辨別此資料是否可以充份表現出母體的特性。假設我們針對學校的學生進行調查,即使我們可以確實做到隨機抽樣,但是我們仍有可能抽到極端的樣本。有鑑於此,我們會對樣本做一些簡單的測驗,例如針對學生的男女比例,學院別的比例做比例的檢測,看其是否符合母體的資料組成。若一間學校的男女生比例是5:5,但是我們的樣本資料的男女生比例是2:8,這時我們就要懷疑此抽樣所得樣本的代表性了。若資料不具代表性,那麼分析所得的結果是否可以說明母體具有之特性就會被高度的懷疑。
範例中,我們使用SAS EG的範例資料CLASS,請選擇伺服器清單->伺服器->本機->資料館->SASHELP->CLASS
假設此CLASS資料是從某班級中隨機抽樣而得之樣本,在此我們假設班上同學男女比為5:5,試問,就男女比例而言,該資料是否具有代表性?
在工作的快捷選單中選擇描述->單因子次數(O)
在左側的選單中選擇資料,將要指派的變數(A)中的Sex變數,拖曳至右側工作角色(T)的分析變數的欄位中。
在左側的選單中選擇統計值,勾選二項式比例的漸近檢定(A),並可輸入欲檢定之比例0.5,然後選擇執行。
執行結果如下表,在二項式比例的表中,可知檢定的比例對象是Sex = 女,而想知道男女比例的值會不會等於0.5,可以從兩個途徑得到我們要的結果
1. 信賴區間
由下表可知其95%信賴區間為( 0.2445 , 0.7114 ),其信賴區間包含0.5,所以我們可以得知男女比例並無差異。
2. 假設檢定
由下表之H0檢定:比例=0.5中的雙邊Pr>|Z|=0.8158 大於我們一般所預設的顯著水準0.05,故在假設檢定中的決策為Not Reject H0。因此,我們的結論為「沒有充份證據顯示比例0.5」。
在左側的選單中選擇統計值,亦可勾選二項式比例的精準p值(P),另外,若使用精準p值則會需要較多的計算時間,故在右側有限制時間的選項可輸入。
由下表之H0檢定:比例=0.5中的精準檢定中雙邊=2*單邊=1 大於我們一般所預設的顯著水準0.05,故在假設檢定中的決策為Not Reject H0。因此,我們的結論為「沒有充份證據顯示比例不等於0.5」。
如果我們今天想要檢定的不是二項結果而是多個結果,例如一個學系中「四個年級」的人數,則我們可以利用卡方配適度的方法,在卡方配適度中亦有漸近檢定和精準p值兩個選擇。
Tags