EG 統計大寶典

SAS Taiwan 0
敘述統計量

當我們遇到成千上萬筆的數字時,要如何可以快速得知這些資料的特性呢?這時,敘述統計量就可以提供我們一種簡單的方式來了解這浩大的資料。

SAS Taiwan 0
單一數值型變量之分析-直方圖

我們在作資料分析時,一般可以將資料分成類別型和數值型兩種。不論哪一種類型,如何將原始的資料作一初步的整理與呈現,以使分析者可以迅速對其具有一定概念,製表或繪圖是最簡單的方法了。 針對單一數值型變量資料,繪圖及製表皆是我們可以採取的呈現方法。其中,直方圖及箱型圖是我們很常用來呈現單一數值型變量特性的圖形。 以下將介紹如何在SAS EG裡繪製直方圖。 我們以SAS EG的資料CLASS(伺服器清單->伺服器->本機->資料館->SASHELP->CLASS)為範例,假設我們欲了解該班學生身高的特性及其分布是否為常態,可以利用SAS EG的直方圖工作來呈現及檢測。 

SAS Taiwan 0
單一數值型變量之分析-盒形圖

盒形圖是我們很常用來呈現單一數值型變量特性的圖形。利用盒形圖可以將數值資料訊息做一有效的傳達,從圖中不僅可以看出資料的最小值、最大值、下四分位數及上四分位數,這意味著盒形圖中央的盒形部份包含了資料的中間50%的部分,也可以由兩端延伸的鬚來表示資料1.5倍的內四分位距。此外,在不同群組的資料中,若要比較資料的大小或集中特性,盒形圖亦不失為一個很好的方法。

SAS Taiwan 0
常態檢定

在一般傳統的統計分析中,常常會需要假設資料呈常態分配。不論是原始資料或是在進行殘差分析時大多都有這個假設,所以在做分析前後都須進行資料常態的檢定。例如,我們在檢定某班級學生的體重是否為100磅時,若樣本資料數不夠多,則我們不能直接貿然的進行t檢定來檢定班級學生的體重平均是否為100磅,在此之前應該先確定資料是否有符合常態的假設的條件。 

SAS Taiwan 0
兩個類別變數的摘要表

在分析中,摘要表是我們常用來表現資料的一種方法,我們可以利用摘要表的工具來產生摘要表,在此提供使用者另一種方式來製作摘要表,但是此方法只適用在類別型的資料,如果我們要繪製的表格中需要產生數值性變數的統計量,則不適用此章的方法。 

SAS Taiwan 0
3D圓餅圖

當我們在處理兩個類別性變數時,除了可以利用表格分析呈現變數特性外,我們還可以製作簡易的3D圖形來表達其次數與比例;而利用EG所提供的功能,我們在繪製3D圖形時就變得更簡單、更容易上手了。在下列範例資料中,我們欲了解在DriveTrain變數中Origin所占的比例。

SAS Taiwan 0
分組數值資料之分析-盒形圖

盒形圖是我們很常用來呈現單一數值型變量特性的圖形。利用盒形圖可以將數值資料訊息做一有效的傳達,從圖中不僅可以看出資料的最小值、最大值、下四分位數、及上四分位數,這意味著盒形圖中央的盒形部份包含了資料的中間50%的部分,也可以由兩端延伸的鬚來表示資料1.5倍的內四分位距。此外,在不同群組的資料中,若要比較資料的大小或集中特性,盒形圖亦不失為一個很好的方法。

SAS Taiwan 0
兩獨立樣本t檢定

當我們對兩個獨立母體的平均數差有興趣時,可以藉由樣本的平均數差做為工具來進行統計檢定。 例如,我們想知道某班學生男女生的身高是否有差異,這時可以執行獨立雙樣本的t 檢定。

SAS Taiwan 0
兩相依兩母體t檢定

若我們在探討人受到刺激後,其收縮壓是否會改變;或是在服了某種降血壓的藥物後,其血壓值是否真的有降低這類型的問題,我們所收集到的受刺激前後或服藥前後所測量的血壓值,並非屬於獨立的資料。針對這種相依型態的資料,我們在分析時會先將同一樣本所提供的兩變數(前、後兩數據)相減測量其差異值,再根據此差異值進行統計分析。在SAS EG中我們並不需先進行計算差異的動作,EG直接在工作中就可以幫我們進行必要的計算。