Author
在分析資料時,我們常常需要將數據轉換成另外的資料型態,例如成績可以分為及格與不及格,人的年齡可以分為青年、壯年、中年及老年,然後再使用這些經過轉換的資料進行下一步的分析,例如圖表分析或是統計檢定等。
在上一篇顯示格式的轉換(FORMAT)中提到,我們可以經由將數據轉換成其他格式後,再使用這些已經轉換的資料進行下一步的分析。在此,我們示範另外一種利用查詢產生器(QUERY)的方式,亦可達成相同的目標。
在分析資料時,我們可以粗略的將資料分成類別型和數值型。若遇到單一類別型變量時,我們可以採取的分析方法有製表和做圖。在本章的實際例題演練中,將帶領大家如何在SAS EG裡繪製次數及比例分配表,來展現單一類別型變量的資料特性。
在分析資料中我們可以粗略的將資料分成類別型和數值型。若遇到單一類別型變量時,我們可以採取的分析方法有製表和做圖。在做圖的分析裡,最常被使用的有長條圖與圓餅圖。以下將帶領大家如何在SAS EG裡繪製長條圖來表現單一類別型變量的特性。
在分析資料中我們可以粗略的將資料分成類別型和數值型。若遇到單一類別型變量時,我們可以採取的分析方法有製表和做圖。在做圖的分析裡,最常被使用的有長條圖與圓餅圖。以下將帶領大家如何在SAS EG裡繪製長條圖來表現單一類別型變量的特性。 範例中,我們使用SAS EG的範例資料CARS,請選擇伺服器清單->伺服器->本機->資料館->SASHELP->CARS 在工作的快捷選單中選擇圖形->圓形圖精靈 選擇下一步 在圓形圖精靈的第2步驟主要是指派變數給角色,在圖塊(S)欄中給定欲繪製圓形圖的變數Origin,並指派欲分析變數圖塊大小(L),在此除了可以指定繪製變量的次數或比例之外,亦可以搭配其他數值性變數繪製。在此我們選擇最常用的次數來繪製圖形。選擇所需的欄位後,選擇下一步進入到下一個精靈設定。 在圓條圖精靈的第3步驟主要是修改圓形圖的外觀,在此除了可以繪製3D立體圖形,亦可在圖形上加上標籤、數值…等的設定。在這就沒有一定的設定,我們可以依照我們個人的喜好勾選或不勾選這些選項。 在圓形圖精靈的第4步驟主要是修改最後報表呈現之抬頭及頁尾的文字,在此我們先不做任何修改。 直接選擇完成。 在SAS EG的結果裡會顯示出我們剛剛所執行圓形圖工作。
在做問卷調查時,分析者在回收完問卷後,常常直接針對問卷的資料進行分析,而沒有顧慮到資料的代表性。何謂資料的代表性?就是從母體抽出的樣本和母體的結構相似與否,用以辨別此資料是否可以充份表現出母體的特性。假設我們針對學校的學生進行調查,即使我們可以確實做到隨機抽樣,但是我們仍有可能抽到極端的樣本。有鑑於此,我們會對樣本做一些簡單的測驗,例如針對學生的男女比例,學院別的比例做比例的檢測,看其是否符合母體的資料組成。若一間學校的男女生比例是5:5,但是我們的樣本資料的男女生比例是2:8,這時我們就要懷疑此抽樣所得樣本的代表性了。若資料不具代表性,那麼分析所得的結果是否可以說明母體具有之特性就會被高度的懷疑。
盒形圖是我們很常用來呈現單一數值型變量特性的圖形。利用盒形圖可以將數值資料訊息做一有效的傳達,從圖中不僅可以看出資料的最小值、最大值、下四分位數及上四分位數,這意味著盒形圖中央的盒形部份包含了資料的中間50%的部分,也可以由兩端延伸的鬚來表示資料1.5倍的內四分位距。此外,在不同群組的資料中,若要比較資料的大小或集中特性,盒形圖亦不失為一個很好的方法。
在分析中,摘要表是我們常用來表現資料的一種方法,我們可以利用摘要表的工具來產生摘要表,在此提供使用者另一種方式來製作摘要表,但是此方法只適用在類別型的資料,如果我們要繪製的表格中需要產生數值性變數的統計量,則不適用此章的方法。
我們在作資料分析時,一般可以將資料分成類別型和數值型兩種。不論哪一種類型,如何將原始的資料作一初步的整理與呈現,以使分析者可以迅速對其具有一定概念,製表或繪圖是最簡單的方法了。 針對單一數值型變量資料,繪圖及製表皆是我們可以採取的呈現方法。其中,直方圖及箱型圖是我們很常用來呈現單一數值型變量特性的圖形。 以下將介紹如何在SAS EG裡繪製直方圖。 我們以SAS EG的資料CLASS(伺服器清單->伺服器->本機->資料館->SASHELP->CLASS)為範例,假設我們欲了解該班學生身高的特性及其分布是否為常態,可以利用SAS EG的直方圖工作來呈現及檢測。
在分析資料時,我們常常會針對2個類別性變數做分析,例如性別的不同會不會造成成績考核的差異。在下列的範例資料中,我們想知道不同的車輛類型與車輛的驅動方式是否有相關?
盒形圖是我們很常用來呈現單一數值型變量特性的圖形。利用盒形圖可以將數值資料訊息做一有效的傳達,從圖中不僅可以看出資料的最小值、最大值、下四分位數、及上四分位數,這意味著盒形圖中央的盒形部份包含了資料的中間50%的部分,也可以由兩端延伸的鬚來表示資料1.5倍的內四分位距。此外,在不同群組的資料中,若要比較資料的大小或集中特性,盒形圖亦不失為一個很好的方法。
在資料為常態假設下,欲比較兩個群體的平均數是否有差異時,我們可以使用t-test檢定之。但若我們欲比較多個群體的平均數是否有差異時,則必須使用變異數分析(ANOVA)的方法來判別。 若分析的結果顯示出多組平均之間有差異時,這時我們可以更進一步進行兩兩平均數間的差異比較。 而變異數分析需有三項假設前提(獨立、常態、均質),在進行分析時也要先檢定資料是否有符合這三項假設。
在執行變異數分析時,有獨立、常態性、均值三大假設。若資料不符合常態或均值假設時,此時我們可以利用無母數的方式,檢定母體中位數是否有差異來替代檢定母體平均數,則我們就不需資料為常態性或均值的前提假設。