在多變量分析中,主成分分析(Principal components analysis, PCA)是一種分析、簡化數據集的技術。利用原有的變數組合成新的變數,以達到資料縮減的目的,但卻能夠保留住數據本身所提供的重要資訊。由於主成分分析主要依賴數據提供的訊息,所以數據的準確性對分析結果影響很大。
資料說明:
此例中的資料是選定某些城市在一月和七月的日平均氣溫。主要用來說明主成分分析是如何將原始變量做正交旋轉成新的變數。
![1 1](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e705845319e.jpg)
下圖是資料中一月和七月的日平均氣溫所繪製的散佈圖,由圖中可觀察到各城市一月和七月之日均溫的關係。
![2 2](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e7058483f6d.jpg)
在工作的快捷選單中選擇<分析>→<多變量>→<主成分(P)>
![3 3](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e70584aea6b.jpg)
於左側的選單中選擇<資料>,將要指派的變數(A)中的和變數拖曳至右側工作角色(T)中的分析變數欄中
![4 4](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e70584f14df.jpg)
在左側的選單中選擇<分析>,在分析(A)中選擇<共變異數>。
![5 5](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e7058538a15.jpg)
在左側的選單中選擇<標繪圖>,勾選<建立主成分計分的散佈圖(M)>及<建立模型成分圖(C)>選項,按一下<執行>
![6 6](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e705857b6f7.jpg)
結果如下表所示:
總變異數為163.474,其中第一主成分解釋了約94%的總變異,而第二主成分解釋的變異約只有6%。在特徵向量表中,PRIN1中一月(January)所占的比例比較高,因為一月的資料比七月的資料有更高的標準差(Std)11.7124。
![7 7](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e70585c7aa4.jpg)
由模型成分圖可以看出原始變數和對應的主成分變數之間的關係。
![8 8](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e7058600346.jpg)
由成分計分圖中可看出主成分是原始變量的和,第一主成分具有比所述第二主成分較大的方差正交旋轉。
實際上,第一主成分比各自原始變量(七月和一月)有較大的變異。另外,我們可觀察到落在橢圓外的3筆資料為可能的離群值。
![9 9](https://blogs.sas.com/content/sastaiwan/files/2020/02/52e7058673edf.jpg)
Tags