
在做迴歸分析前,我們須先了解兩數值型變數間是否有呈現線性相關,最簡單的方式就是觀察兩變數的散佈圖。以下面兩張圖為例,雖然兩者均呈現線性相關,但相較於左圖而言,右圖的資料分布與迴歸線較為離散,所以我們可以因此而認定右圖資料不適合做迴歸分析嗎?也由於散佈圖的解說是很主觀的,如果我們只靠圖形來判別資料適不適合做迴歸分析,可能每個人的解讀結果都不相同。這時我們就需要有一個客觀的判斷準則--統計量。
在做迴歸分析前,我們須先了解兩數值型變數間是否有呈現線性相關,最簡單的方式就是觀察兩變數的散佈圖。以下面兩張圖為例,雖然兩者均呈現線性相關,但相較於左圖而言,右圖的資料分布與迴歸線較為離散,所以我們可以因此而認定右圖資料不適合做迴歸分析嗎?也由於散佈圖的解說是很主觀的,如果我們只靠圖形來判別資料適不適合做迴歸分析,可能每個人的解讀結果都不相同。這時我們就需要有一個客觀的判斷準則--統計量。
迴歸分析是統計學上常用的分析方法,主要在建立一個函數(最能夠代表變數間的所有觀測資料),並用此函數來代表應變數和自變數之間的數學模式,以便觀察特定的變數來預測我們所感興趣的變數。若特定的變數(X)和有興趣的變數(Y)的數目都為一個,則我們稱此模型(Y=Bo+B1X)為簡單線性迴歸分析。
本篇我們以SASHELP中的CARS檔案為例,討論汽車的引擎大小與那些因素有相關,在調查項目裡我們選取下列變數來討論:Invoice (售價;單位:美金)、Enginesize (引擎大小;單位:1000cc數)、Cylinders (汽缸數)、Horsepower (馬力)、MPG_city (每加侖可在市區行駛公哩數)、MPG_highway (每加侖可在高速公路上行駛公哩數)、Weight (車輛重量;單位:磅)、Wheelbase(車輛軸距;單位:吋)及Length (車輛長度;單位:吋)。資料存放在sashelp裡面:本機=>資料館=>SASHELP=>CARS。