SAS Enterprise Guide

SAS Taiwan 0
從文字檔匯入資料

[匯入資料] 精靈可讓您從文字、HTML 或 PC 型資料庫檔案 (包括 Microsoft Excel、Microsoft Access 和其他常用格式) 建立 SAS 資料集。 您可以指定選項,以控制如何匯入輸入檔案以及如何將其儲存為 SAS 資料集。 您必須為特色食品商店建立每個類別號碼皆有描述標籤的 SAS 資料集。這項資料會儲存在文字檔中,而您可以使用 [匯入資料] 精靈,將文字匯入 SAS 資料集中。 在此主題中,您會使用 [匯入資料] 精靈從 FixWidth 文字檔中的資料建立名為 [Categories] 的 SAS 資料集。建立的 SAS 資料集會有兩欄:CategoryID 與 CategoryName。 -->進入學習

SAS Taiwan 0
如何使用查詢產生器整理資料

查詢是從一或多個資料來源擷取資料的要求。在此介紹查詢與資料的幾種搭配使用方式。 -->進入學習 您已建立會依類別號碼顯示各產品之總庫存量的報表。假設您也想瞭解公司中獲利性最高與最低的產品與產品類別,以期就公司應繼續銷售的產品組合提出相關建議。您希望報表顯示下列資訊: 產品類別的標籤 (而非號碼) 各產品與產品類別的銷售所產生的總利潤 各產品與產品類別的銷售所產生的平均利潤 先依產品類別、再依產品排序的資料 怎麼做呢?-->進入學習

SAS Taiwan 0
文字函數的應用

在做資料統計分析之前,我們都會對資料做一些處理,尤其是文字型的變數,其中可能某一段對我們的分析有特殊涵義,以電話號碼為例,區碼就是一個很重要的資訊,另外每個區域的電話長度也都不一樣,所以可以藉此特性檢查電話號碼有無錯誤,下面我們將針對下面一個簡單的資料,使用較常使用5個的文字函數做資料處理 原始資料 範例1:從電話中取出區域代碼 Step1.選擇查詢產生器 Step2.將原始資料變數拉入右側的選取資料中後,點選 Step3.選擇進階運算式->下一步 Step4.這有三大區塊,左下方是函數和變數的選擇區塊,右下方是函數的說明區塊,上方是函數輸入區塊。   在這我們用了2個函數SUBSTR和FIND,因為我們要從電話號碼中擷取部分的文字,而SUBSTR函數的用處就是擷取變數的部分字串,然而在電話號碼中的區碼有2碼也有3碼,所以我們需要FIND函數是要找尋某文字符號的位置來決定要截取的長度 用法: SUBSTR(字串或變數,截取起始位置,截取長度); FIND(字串或變數,”文字符號”) 以台北市跟南投縣的電話區域號碼為例(02)或(049) 截取的文字皆從第2個位置開始,截取長度我們利用找尋 “)” 位置的方法 FIND((02),”)”)=4 FIND((049),”)”)=5 所以我們可以利用FIND(t1.phone, ")")-2來決定長度 故我們最終的式子為: SUBSTR(t1.phone, 2, FIND(t1.phone, ")")-2) Step5.輸入欄名稱跟標籤後按完成 範例2:計算電話的長度 Step1.點選 Step2. 選擇進階運算式->下一步 Step3.藉由左下方是函數和變數的選擇區塊,輸入上方是函數輸入區塊,結果如下,後下一步。 電話的長度是全長扣掉區碼和符號的個數,用LENGTH((02)1234-5678)算出全部長度13,再利用FIND(t1.phone, ")")-2算出區碼的長度,再扣掉3個符號((,),-) 故我們最終的式子為: LENGTH(t1.phone)-(FIND(t1.phone, ")")-2)-3 Step4. 輸入欄名稱跟標籤後按完成 範例3.合併姓和名的兩個變數成為全名 Step1. 點選 Step2. 選擇進階運算式->下一步 Step3. 藉由左下方是函數和變數的選擇區塊,輸入上方是函數輸入區塊,結果如下,後下一步。 CATX("",t1.lname,t1.fname) Step4. 輸入欄名稱跟標籤後按完成 Step5.按執行 我們就可以得到我們所要的結果

SAS Taiwan 0
日期函數的應用-1

做資料整理與分析時,只要資料中包含日期變數,我們常常就需要用到日期函數,它可以快速的幫你取得你想要的資訊。例如:可以利用函數取得部分資料(年月日),接下來我們會舉最常使用的日期函數的範例。 

SAS Taiwan 0
日期函數的應用-2

在分析資料時,年齡常常是一個分析的重要變數,但是年齡的資料一般不會設成固定的數值性變數,通常在分析資料時,年齡的資訊都是利用生日而獲得,在分析健保資料庫時,資料庫中是沒有年齡這一個變數,所以我們需要年齡這個變數時,亦是用資料中的生日變數獲得。因為SAS儲存日期是以距離1960/01/01的天數當作儲存資訊,故我們看到很多分析者採用(今日-生日)除上365的公式來計算年齡,但其實SAS有提供我們可以計算年數(年齡)的函數。

SAS Taiwan 0
顯示格式的轉換(一):FORMAT

在分析資料時,我們常常需要將數據轉換成另外的資料型態,例如成績可以分為及格與不及格,人的年齡可以分為青年、壯年、中年及老年,然後再使用這些經過轉換的資料進行下一步的分析,例如圖表分析或是統計檢定等。 

SAS Taiwan 0
顯示格式的轉換(二):QUERY

在上一篇顯示格式的轉換(FORMAT)中提到,我們可以經由將數據轉換成其他格式後,再使用這些已經轉換的資料進行下一步的分析。在此,我們示範另外一種利用查詢產生器(QUERY)的方式,亦可達成相同的目標。

SAS Taiwan 0
修改專案資料館

在做資料分析時,我們常常會碰到需要修改專案資料館的狀況,例如:我們將EG檔案從A電腦複製至B電腦去執行,在A電腦中我們的專案資料館是在E槽的某個指定的資料夾裡,但在B電腦中卻沒有E槽,所以將EG在B電腦中執行時就會遇到執行錯誤的情況。下列將介紹兩個方法來避免上面的問題。

SAS Taiwan 0
刪除重複性資料

在百貨公司周年慶企劃中,行銷經理想要挑出去年周年慶的客戶,作為今年周年慶公司寄送折扣商品刊物的名單。於是他想要從客戶購物資料中選出去年的所有消費者的資料。但在上百萬筆的消費帳單中,其實客戶可能只有數萬人,故行銷經理真正要找出的是這數萬筆消費者資料而非所有的銷售資料。又或是醫療單位想要從健保資料庫中挑選某疾病的病患,但是在資料庫中這些特定的病患都會看診數次,所以移除重複性的資料這個動作在處理資料時是很常用到的。 

1 4 5 6 7 8 11