
擬定分析主題後,在正式進入分析之前,分析材料的準備是資料探勘中極重要的工作環節,分析者須針對欲研究主題列示一份的變數清單,應依分析目的與假設、研究對象與範圍等列式出研究主題可能的相關變數。
擬定分析主題後,在正式進入分析之前,分析材料的準備是資料探勘中極重要的工作環節,分析者須針對欲研究主題列示一份的變數清單,應依分析目的與假設、研究對象與範圍等列式出研究主題可能的相關變數。
在SAS EM匯入分析資料後,建議讀者先運用幾個EM分析節點進行資料的檢視與瀏覽,檢視原始資料集其實是資料分析很重要的基本功能,可以培養對資料的敏感度,每一筆資料都是一個行為發生,透過直接的檢視資料,可以增加說故事的能力,甚至檢視資料的異常值,便於快速進行資料處理,以及有創意的衍生變數產生,產生精準的預測模型結果。
○ 某銀行過去在決定普卡客戶是否能升等白金卡時,總是請專員針對申請客戶的條件一一核對,判斷客戶是否可從普卡升等白金卡,但是這樣的方法: ● 浪費人力 ● 缺乏效率 ○ 於是,某銀行決定導入SAS Enterprise Miner希望能使用資料探勘的方法,從過去大量資料中: ● 找出升等白金卡的主要條件 ● 之後客戶申請時,能夠快速決定此客戶是否能升等白金卡
經過前面幾篇的學習,想必大家對於EM已經相當熟悉了! 接下來我們根據前面的資料,繼續教導一些資料探勘方法(決策樹與迴歸),讓你更加瞭解如何建立模型。
● 某公司過去在制定行銷策略時,只使用消費者的消費次數與消費間隔將消費者分群,再找出特定消費者的消費行為,這樣的分析方式: ○不易找出少數但對公司獲利有益的消費者 ○不易制定行銷策略 ● 於是,某公司現在決定導入SAS EG與EM,運用EG及EM: ○ 快速整理資料 ○ 用消費資料進行群集分析 ○ 繪製圖表
購物籃分析不僅單純地可拿來做零售商品的產品購買關聯,在SAS EM裡關聯節點或購物籃節點被歸屬在SEMMA循環裡的Explore工具池裡,所以這兩個節點可以拿來當作建置預測模型時的資料瀏覽工具,更進一步可將節點結果的產出匯出當作預測模型的新衍生變數。另外,購物籃分析也可以連結分群分析,協助行銷人員做更精準的行銷設計規劃(詳細內容可參考前兩期的專欄內容)。
連續幾期介紹SAS EM決策樹的應用,各位讀者應該可以感受到SAS EM決策樹的使用彈性與功能強大。本期再介紹實務分析上決策樹常見的問題, 而SAS EM決策樹如何處理這些問題。
根據【系列3-1】使用EM得到的資料,接下來我們利用SAS Enterprise Guide來進行表格的製作。
延續上篇介紹,在現實中想要建構出必須經過抽樣、分割樣本、補遺失值...等資料準備的程序,才能建構出好的模型。