資料館.資料集 sashelp.cars (永久資料館) campus.SampleData (永久資料館) work.class (暫存資料館(work可以省略不寫)) SAS 資料館介紹 完整的SAS資料集名稱為「資料館.資料集」。 把資料館想像成是抽屜;而資料集想像成是抽屜內的檔案。 SAS資料集可以分為永久資料館及暫存資料館。 存放在永久資料館內的資料,在關閉SAS操作之後仍會保留下來;相反的,暫存資料館內的資料則是在關閉SAS操作後就會自動刪除。 暫存資料館的名稱為「work」;其他的資料館名稱一律為永久資料館。 資料館名稱是可以省略的。若沒有告知資料集要存放在哪一個資料館,則一律存在暫存資料館。 有些永久資料館是一開啟SAS時就會自動建立,例如sashelp、sasuser…等。 有些永久資料館是使用者自訂。在一開啟SAS並不會自動建立,需要給定一行明確的指令後才會出現在資料館裡。 使用者自訂資料館 LIBNAME 資料館名稱 "路徑" ; 程式範例:LIBNAME campus "c:CampusData"; Libname為關鍵字且是全域的指令,可以寫在任何一個地方。 資料館名稱的命名規則:只能使用英文、數字及底線。只能使用半型的字、不能數字起頭命名、不分大小寫,資料館名稱最長為8個字元。 路徑指到存放SAS資料集的資料夾,而非指到SAS資料集。 單引號或是雙引號都可以,但務必為成對出現。 EG 指派資料館方式
Author
變數(Variable)定義 1.變數名稱的命名規則: 英文、數字及底線。 數字不能當開頭。 最長32個字元。 英文大小寫沒有差異。 2.變數名稱的型態:只區分為文字或是數值兩大類 觀察值(Observation)定義 1.文字資料: 可以是文字、數字、特殊符號及空白等。 資料內容最長為32,767個字元。 一個英文字為一個位元。 遺漏值為空白。 2.數值資料: 數值採用浮點運算(floating point)。 一律為8個位元。 最多可以儲存16或是17位數。 遺漏值為「.」,可視為負無窮大。 日期(date)定義 SAS日期是以1960年1月1日為起始值0,每往前一天減1(負值),而往後每一天加1(為正值)。 格式(format)定義 <$>格式<w>.<d> 「$」表示為文字型格式;不寫表示為數值型格式。 文字型格式指的是套用文字變數上;而數值型格式指的是套用在數值變數上。 「格式」的部份為SAS內建的格式。 「w」指的是格式的總寬度,包含資料要呈現的特殊符號、小數點及小數位數。 「.」為格式一定要給定的語法。 「d」為呈現小數位數。 格式只是改變資料呈現的樣貌,並不會改到原始資料儲存的狀態。 常見格式範例 Format Stored Value Displayed Value $4. Campus Camp 12. 12345.6789 12345 12.2 12345.6789 12345.68
簡介 SAS程式是由一個或是多個步驟(steps)組合而成,其主要可以區分為兩大步驟:DATA 步驟及PROC 步驟。 DATA步驟主要是整理資料並建立SAS資料集。 PROC步驟主要是產生出報表、圖形及管理資料等。 撰寫SAS程式起頭為:DATA敘述句(statement)或是PROC敘述句。 結束時主要是用RUN敘述句。 有少許程序(procedures)結束時改採用QUIT敘述句。 有時忽略結束的敘述句時,若還有下一段步驟,則SAS程式在執行時會知道上一段步驟已經結束。 語法 一個步驟是由多個敘述句所組成。 敘述句通常都會是關鍵字起頭;而一定是分號結尾。 程式撰寫格式 敘述句可以在撰寫程式畫面上的任何一個地方開始,也可以在任何一地方結束。 一行敘述句可以分成多行撰寫。 多行敘述句可以寫在同一行。 若程式碼不在引號裡面,則程式碼本身並沒有區分英文大小寫的問題。 程式碼之間是用空白的方式來做區隔,例如可以使用空白鍵或是Tab鍵來當作是字與字之間的區隔。 兩種方式協助我們為程式下註解或是使某段程式不執行: /*註解*/ *註解; 常見錯誤 在撰寫SAS程式時,以下為常見的錯誤類型: 語法錯誤(syntax error) 語法錯誤(Syntax Error)是指在compile時檢查語法是否正確所發生的。因此,發生語法錯誤時會立即停止,並沒有執行SAS程式。 常見的語法錯誤如下: 拼錯關鍵字。 不對稱的引號。 結尾遺漏分號。 不明確的指令(options)。 資料錯誤(data error) 資料錯誤(Data Error)是指在檢查完語法正確後,在執行的過程中發現讀入進來的資料有問題所產生。 邏輯錯誤(logic error) 邏輯錯誤(Logic Error)是指在送出程式後,其檢查語法完全正確,而在執行時也沒有出現資料錯誤的訊息,但是在看匯出的資料時卻發現資料不正確。