Chinese

SAS Taiwan 0
如何運用SAS EM進行變數處理與衍生變數產生(下)

Transform Variables node變數轉換的案例情境說明   延續『如何運用SAS EM進行變數處理與衍生變數產生(中)』文章說明   4. 利用「Formula衍生變數編輯區」進行衍生變數處理   【情境說明】 -產生衍生變數公式編輯計算逾期週期 -運用SAS 運算函數進行變數轉換 step1.  點選參數列內的「Formulas」選項,進入衍生變數編輯區進行衍生變數處理。   圖一、Transform Variables Node參數列   step2.  點選「Formula衍生變數編輯區」視窗左上列的 (新增衍生變數鈕) 列內的「Formulas」選項,進入衍生變數編輯區進行衍生變數處理。   圖二、Formula衍生變數編輯區   step3.  點選「Build...」進入「Expression Builder」衍生變數公式編輯區。除了簡單的四則運算式編輯外,在編輯區下方提供各類運算函式,以利分析者進行進階演算式產出。 位於函數區旁的另一個頁籤,則完整列出原始資料集的變數清單,分析者無須記憶變數名稱,可透過點選拖曳方式將進階處理的變數投放入編輯區。   圖三、Formula衍生變數編輯區--新增變數   step4.  產生衍生變數一:「Delinq_Freq逾期週期」,衍生變數公式:IMP_CLAGE(貸款往來期間)/IMP_DELINQ (逾期次數)。 從「Variables List原始變數列表區」選取變數IMP_CLAGE及IMP_DELINQ,點選「Insert」將欲處理之變數置放於衍生變數公式編輯區進行上述公式編輯。   圖四、Formula衍生變數編輯區--變數公式編輯與變數命名 step5.  點選「OK」,完成衍生變數新增。   step6.  產生衍生變數二:「LOG_YOJ工作年資對數化」,衍生變數公式:LOG (IMP_YOJ)。 重複Step2、Step3 進行衍生變數新增程序,從「Functions函數區」選取 Log

SAS Taiwan 0
如何運用SAS EM 進行樣本預區隔與極值偵測(上)

  SEMMA 方法論第一步的「S」即為Sample,此處的Sample有多個意涵,一為分析樣本的定義,如何從分析母體抽取適當的樣本資料,以及如何選擇最適抽樣。SEMMA方法論告訴分析者當進行分析建模時,我們應取用樣本資料而不是直接匯入母體資料進行建模程序。同時,母體資料不一定是資料庫裡的全體觀測值,端賴分析的主題來進行分析樣本的定義與確認。

SAS Taiwan 0
如何運用SAS EM 進行變數篩選(上)

擬定分析主題後,在正式進入分析之前,分析材料的準備是資料探勘中極重要的工作環節,分析者須針對欲研究主題列示一份的變數清單,應依分析目的與假設、研究對象與範圍等列式出研究主題可能的相關變數。

SAS Taiwan 0
如何運用SAS EM繪製圖表以快速瀏覽大量資料

在SAS EM匯入分析資料後,建議讀者先運用幾個EM分析節點進行資料的檢視與瀏覽,檢視原始資料集其實是資料分析很重要的基本功能,可以培養對資料的敏感度,每一筆資料都是一個行為發生,透過直接的檢視資料,可以增加說故事的能力,甚至檢視資料的異常值,便於快速進行資料處理,以及有創意的衍生變數產生,產生精準的預測模型結果。

SAS Taiwan 0
SAS EM實戰演練-【系列3-1】輕鬆建好信用卡升等模型

○ 某銀行過去在決定普卡客戶是否能升等白金卡時,總是請專員針對申請客戶的條件一一核對,判斷客戶是否可從普卡升等白金卡,但是這樣的方法: ● 浪費人力 ● 缺乏效率 ○ 於是,某銀行決定導入SAS Enterprise Miner希望能使用資料探勘的方法,從過去大量資料中: ● 找出升等白金卡的主要條件 ● 之後客戶申請時,能夠快速決定此客戶是否能升等白金卡

SAS Taiwan 0
SAS EG&EM實戰演練-【系列3-1】零售業行銷分析

● 某公司過去在制定行銷策略時,只使用消費者的消費次數與消費間隔將消費者分群,再找出特定消費者的消費行為,這樣的分析方式: ○不易找出少數但對公司獲利有益的消費者 ○不易制定行銷策略 ● 於是,某公司現在決定導入SAS EG與EM,運用EG及EM: ○ 快速整理資料 ○ 用消費資料進行群集分析 ○ 繪製圖表

1 8 9 10 11 12 29