[匯入資料] 精靈可讓您從文字、HTML 或 PC 型資料庫檔案 (包括 Microsoft Excel、Microsoft Access 和其他常用格式) 建立 SAS 資料集。 您可以指定選項,以控制如何匯入輸入檔案以及如何將其儲存為 SAS 資料集。 您必須為特色食品商店建立每個類別號碼皆有描述標籤的 SAS 資料集。這項資料會儲存在文字檔中,而您可以使用 [匯入資料] 精靈,將文字匯入 SAS 資料集中。 在此主題中,您會使用 [匯入資料] 精靈從 FixWidth 文字檔中的資料建立名為 [Categories] 的 SAS 資料集。建立的 SAS 資料集會有兩欄:CategoryID 與 CategoryName。 -->進入學習
Author
查詢是從一或多個資料來源擷取資料的要求。在此介紹查詢與資料的幾種搭配使用方式。 -->進入學習 您已建立會依類別號碼顯示各產品之總庫存量的報表。假設您也想瞭解公司中獲利性最高與最低的產品與產品類別,以期就公司應繼續銷售的產品組合提出相關建議。您希望報表顯示下列資訊: 產品類別的標籤 (而非號碼) 各產品與產品類別的銷售所產生的總利潤 各產品與產品類別的銷售所產生的平均利潤 先依產品類別、再依產品排序的資料 怎麼做呢?-->進入學習
在做資料統計分析之前,我們都會對資料做一些處理,尤其是文字型的變數,其中可能某一段對我們的分析有特殊涵義,以電話號碼為例,區碼就是一個很重要的資訊,另外每個區域的電話長度也都不一樣,所以可以藉此特性檢查電話號碼有無錯誤,下面我們將針對下面一個簡單的資料,使用較常使用5個的文字函數做資料處理 原始資料 範例1:從電話中取出區域代碼 Step1.選擇查詢產生器 Step2.將原始資料變數拉入右側的選取資料中後,點選 Step3.選擇進階運算式->下一步 Step4.這有三大區塊,左下方是函數和變數的選擇區塊,右下方是函數的說明區塊,上方是函數輸入區塊。 在這我們用了2個函數SUBSTR和FIND,因為我們要從電話號碼中擷取部分的文字,而SUBSTR函數的用處就是擷取變數的部分字串,然而在電話號碼中的區碼有2碼也有3碼,所以我們需要FIND函數是要找尋某文字符號的位置來決定要截取的長度 用法: SUBSTR(字串或變數,截取起始位置,截取長度); FIND(字串或變數,”文字符號”) 以台北市跟南投縣的電話區域號碼為例(02)或(049) 截取的文字皆從第2個位置開始,截取長度我們利用找尋 “)” 位置的方法 FIND((02),”)”)=4 FIND((049),”)”)=5 所以我們可以利用FIND(t1.phone, ")")-2來決定長度 故我們最終的式子為: SUBSTR(t1.phone, 2, FIND(t1.phone, ")")-2) Step5.輸入欄名稱跟標籤後按完成 範例2:計算電話的長度 Step1.點選 Step2. 選擇進階運算式->下一步 Step3.藉由左下方是函數和變數的選擇區塊,輸入上方是函數輸入區塊,結果如下,後下一步。 電話的長度是全長扣掉區碼和符號的個數,用LENGTH((02)1234-5678)算出全部長度13,再利用FIND(t1.phone, ")")-2算出區碼的長度,再扣掉3個符號((,),-) 故我們最終的式子為: LENGTH(t1.phone)-(FIND(t1.phone, ")")-2)-3 Step4. 輸入欄名稱跟標籤後按完成 範例3.合併姓和名的兩個變數成為全名 Step1. 點選 Step2. 選擇進階運算式->下一步 Step3. 藉由左下方是函數和變數的選擇區塊,輸入上方是函數輸入區塊,結果如下,後下一步。 CATX("",t1.lname,t1.fname) Step4. 輸入欄名稱跟標籤後按完成 Step5.按執行 我們就可以得到我們所要的結果
在使用Enterprise Guide(EG)進行資料匯入/匯出前,須確認以下幾點注意事項: 確認使用的Office之版本,匯出之檔案必須Office 2007之後的版本。 確認sasv9.cfg檔案(檔案位於: C:Program FilesSASHomeSASFoundation9.3sasv9.cfg), 使用記事本開啟,確認其內容與下方一致。 -config "C:Program FilesSASHomeSASFoundation9.3nlsztsasv9.cfg"
在分析資料時,我們常常需要將數據轉換成另外的資料型態,例如成績可以分為及格與不及格,人的年齡可以分為青年、壯年、中年及老年,然後再使用這些經過轉換的資料進行下一步的分析,例如圖表分析或是統計檢定等。
在上一篇顯示格式的轉換(FORMAT)中提到,我們可以經由將數據轉換成其他格式後,再使用這些已經轉換的資料進行下一步的分析。在此,我們示範另外一種利用查詢產生器(QUERY)的方式,亦可達成相同的目標。
在分析資料時,我們可以粗略的將資料分成類別型和數值型。若遇到單一類別型變量時,我們可以採取的分析方法有製表和做圖。在本章的實際例題演練中,將帶領大家如何在SAS EG裡繪製次數及比例分配表,來展現單一類別型變量的資料特性。
在分析資料中我們可以粗略的將資料分成類別型和數值型。若遇到單一類別型變量時,我們可以採取的分析方法有製表和做圖。在做圖的分析裡,最常被使用的有長條圖與圓餅圖。以下將帶領大家如何在SAS EG裡繪製長條圖來表現單一類別型變量的特性。
在分析資料中我們可以粗略的將資料分成類別型和數值型。若遇到單一類別型變量時,我們可以採取的分析方法有製表和做圖。在做圖的分析裡,最常被使用的有長條圖與圓餅圖。以下將帶領大家如何在SAS EG裡繪製長條圖來表現單一類別型變量的特性。 範例中,我們使用SAS EG的範例資料CARS,請選擇伺服器清單->伺服器->本機->資料館->SASHELP->CARS 在工作的快捷選單中選擇圖形->圓形圖精靈 選擇下一步 在圓形圖精靈的第2步驟主要是指派變數給角色,在圖塊(S)欄中給定欲繪製圓形圖的變數Origin,並指派欲分析變數圖塊大小(L),在此除了可以指定繪製變量的次數或比例之外,亦可以搭配其他數值性變數繪製。在此我們選擇最常用的次數來繪製圖形。選擇所需的欄位後,選擇下一步進入到下一個精靈設定。 在圓條圖精靈的第3步驟主要是修改圓形圖的外觀,在此除了可以繪製3D立體圖形,亦可在圖形上加上標籤、數值…等的設定。在這就沒有一定的設定,我們可以依照我們個人的喜好勾選或不勾選這些選項。 在圓形圖精靈的第4步驟主要是修改最後報表呈現之抬頭及頁尾的文字,在此我們先不做任何修改。 直接選擇完成。 在SAS EG的結果裡會顯示出我們剛剛所執行圓形圖工作。
在做問卷調查時,分析者在回收完問卷後,常常直接針對問卷的資料進行分析,而沒有顧慮到資料的代表性。何謂資料的代表性?就是從母體抽出的樣本和母體的結構相似與否,用以辨別此資料是否可以充份表現出母體的特性。假設我們針對學校的學生進行調查,即使我們可以確實做到隨機抽樣,但是我們仍有可能抽到極端的樣本。有鑑於此,我們會對樣本做一些簡單的測驗,例如針對學生的男女比例,學院別的比例做比例的檢測,看其是否符合母體的資料組成。若一間學校的男女生比例是5:5,但是我們的樣本資料的男女生比例是2:8,這時我們就要懷疑此抽樣所得樣本的代表性了。若資料不具代表性,那麼分析所得的結果是否可以說明母體具有之特性就會被高度的懷疑。
盒形圖是我們很常用來呈現單一數值型變量特性的圖形。利用盒形圖可以將數值資料訊息做一有效的傳達,從圖中不僅可以看出資料的最小值、最大值、下四分位數及上四分位數,這意味著盒形圖中央的盒形部份包含了資料的中間50%的部分,也可以由兩端延伸的鬚來表示資料1.5倍的內四分位距。此外,在不同群組的資料中,若要比較資料的大小或集中特性,盒形圖亦不失為一個很好的方法。
在分析中,摘要表是我們常用來表現資料的一種方法,我們可以利用摘要表的工具來產生摘要表,在此提供使用者另一種方式來製作摘要表,但是此方法只適用在類別型的資料,如果我們要繪製的表格中需要產生數值性變數的統計量,則不適用此章的方法。
我們在作資料分析時,一般可以將資料分成類別型和數值型兩種。不論哪一種類型,如何將原始的資料作一初步的整理與呈現,以使分析者可以迅速對其具有一定概念,製表或繪圖是最簡單的方法了。 針對單一數值型變量資料,繪圖及製表皆是我們可以採取的呈現方法。其中,直方圖及箱型圖是我們很常用來呈現單一數值型變量特性的圖形。 以下將介紹如何在SAS EG裡繪製直方圖。 我們以SAS EG的資料CLASS(伺服器清單->伺服器->本機->資料館->SASHELP->CLASS)為範例,假設我們欲了解該班學生身高的特性及其分布是否為常態,可以利用SAS EG的直方圖工作來呈現及檢測。
在分析資料時,我們常常會針對2個類別性變數做分析,例如性別的不同會不會造成成績考核的差異。在下列的範例資料中,我們想知道不同的車輛類型與車輛的驅動方式是否有相關?
盒形圖是我們很常用來呈現單一數值型變量特性的圖形。利用盒形圖可以將數值資料訊息做一有效的傳達,從圖中不僅可以看出資料的最小值、最大值、下四分位數、及上四分位數,這意味著盒形圖中央的盒形部份包含了資料的中間50%的部分,也可以由兩端延伸的鬚來表示資料1.5倍的內四分位距。此外,在不同群組的資料中,若要比較資料的大小或集中特性,盒形圖亦不失為一個很好的方法。