在資料為常態假設下,欲比較兩個群體的平均數是否有差異時,我們可以使用t-test檢定之。但若我們欲比較多個群體的平均數是否有差異時,則必須使用變異數分析(ANOVA)的方法來判別。 若分析的結果顯示出多組平均之間有差異時,這時我們可以更進一步進行兩兩平均數間的差異比較。 而變異數分析需有三項假設前提(獨立、常態、均質),在進行分析時也要先檢定資料是否有符合這三項假設。
SAS Enterprise Guide
ANOVA變異數分析
無母數單因子ANOVA
在執行變異數分析時,有獨立、常態性、均值三大假設。若資料不符合常態或均值假設時,此時我們可以利用無母數的方式,檢定母體中位數是否有差異來替代檢定母體平均數,則我們就不需資料為常態性或均值的前提假設。
兩數值型變數線性相關之檢測
在做迴歸分析前,我們須先了解兩數值型變數間是否有呈現線性相關,最簡單的方式就是觀察兩變數的散佈圖。以下面兩張圖為例,雖然兩者均呈現線性相關,但相較於左圖而言,右圖的資料分布與迴歸線較為離散,所以我們可以因此而認定右圖資料不適合做迴歸分析嗎?也由於散佈圖的解說是很主觀的,如果我們只靠圖形來判別資料適不適合做迴歸分析,可能每個人的解讀結果都不相同。這時我們就需要有一個客觀的判斷準則--統計量。
簡單線性迴歸分析實例(模型建立)
迴歸分析是統計學上常用的分析方法,主要在建立一個函數(最能夠代表變數間的所有觀測資料),並用此函數來代表應變數和自變數之間的數學模式,以便觀察特定的變數來預測我們所感興趣的變數。若特定的變數(X)和有興趣的變數(Y)的數目都為一個,則我們稱此模型(Y=Bo+B1X)為簡單線性迴歸分析。