SAS 資料集簡介

0

 

變數(Variable)定義

1.變數名稱的命名規則:

  • 英文、數字及底線。
  • 數字不能當開頭。
  • 最長32個字元。
  • 英文大小寫沒有差異。

2.變數名稱的型態:只區分為文字或是數值兩大類

 

觀察值(Observation)定義

1.文字資料:

  • 可以是文字、數字、特殊符號及空白等。
  • 資料內容最長為32,767個字元。
  • 一個英文字為一個位元。
  • 遺漏值為空白。

2.數值資料:

  • 數值採用浮點運算(floating point)。
  • 一律為8個位元。
  • 最多可以儲存16或是17位數。
  • 遺漏值為「.」,可視為負無窮大。

 

日期(date)定義

SAS日期是以1960年1月1日為起始值0,每往前一天減1(負值),而往後每一天加1(為正值)。

 

格式(format)定義

<$>格式<w>.<d>

  1. 「$」表示為文字型格式;不寫表示為數值型格式。
  2. 文字型格式指的是套用文字變數上;而數值型格式指的是套用在數值變數上。
  3. 「格式」的部份為SAS內建的格式。
  4. 「w」指的是格式的總寬度,包含資料要呈現的特殊符號、小數點及小數位數。
  5. 「.」為格式一定要給定的語法。
  6. 「d」為呈現小數位數。
  7. 格式只是改變資料呈現的樣貌,並不會改到原始資料儲存的狀態。

 

常見格式範例

Format Stored Value Displayed Value

$4.

Campus Camp

12.

12345.6789

12345

12.2

12345.6789

12345.68

COMMA12.2

12345.6789

12,345.68

DOLLAR12.2

12345.6789

$12,345.68

COMMAX12.2

12345.6789

12.345,68

EUROX12.2

12345.6789

€12.345,68

 

Format Stored Value Displayed Value

MMDDYY10.

0

01/01/1960

DDMMYY8.

0

01/01/60

DATE9.

-1

31DEC1959

WORDDATE.

0

January 1, 1960

WEEKDATE.

0

Friday, January 1, 1960

MONYY7.

0

JAN1960

 

 

標籤(label)與格式(format)的說明

1.由於變數名稱有長度上的限制(最多32個字元),因此,我們可以使用標籤(label)的方式來輔助說明變數,標籤最多可以呈現256個字元,同時可以使用特殊符號及空白等文字。所以,「標籤」是改變「變數」呈現的樣貌

2.觀察值的呈現有時不容易了解,例如日期原始儲存的是數字,但我們不容易知道此時此刻是某年某月某日,因此,我們可以套用格式來方便我們看資料。所以,「格式」是改變「觀察值」資料呈現的樣貌

 

Tags
Share

About Author

SAS Taiwan

SAS 學習資源 : https://blogs.sas.com/content/sastaiwan/

Comments are closed.

Back to Top