活學活用決策樹(五): 如何運用SAS EM決策樹產生系統最佳與專家調整的混合模型(1)

0
連續幾期介紹SAS EM決策樹的進階應用與分析處理,本期Dr.SAS回到SAS EM決策樹底層主要分析功能的介紹上。SAS EM決策樹提供兩種建立預測模型的模式,一為互動式建模環境(Interactive mode),另一為自動建模環境(Automatic mode)。兩種分析模式環境各自有其分析使用上的優點,同時SAS EM在SAS EM 7版本以後,也同時將兩個建模環境模式做了整合,讓建模分析人員可以針對系統最適推薦模型,進行專家調整,提供給分析者更佳彈性與實務考量的建模平台。

 
互動式建模環境(Interactive mode)
 
點選EM決策樹分析節點時,分析者若欲自建預測規則樹,則需在EM決策樹參數設定列的Interactive參數進行點選,點選後,SAS EM會自動啟動決策樹互動式建模環境(Enterprise Miner Tree Desktop Application,如圖一),此一分析環境是EM外掛的java應用環境,分析者可以透過此功能自行建置決策樹,層層調整與分析、修剪不穩定的模型規則,以及各分支的分支數的自訂和切點的調整,都可以在此互動式環境中進行。
 
 1
圖一、SAS EM決策樹參數列
 
EM決策樹互動式建模程序:
1.啟動SAS EM互動式決策樹模式(Interactive):啟動互動式模式後,會跳出一個操作視窗,視窗畫面僅顯示一個單一的母體資料節點。
 
2.執行分割節點(Split Node)功能:點選該資料節點按右鍵,點選分割節點(Split Node),開始進行建置決策樹模型程序。
 
 2
 圖二:互動式決策樹環境
 
3.選取分支重要變數
執行分割節點功能後,系統會自動產生一變數worth值報表(如圖三),此一報表可視為目標變數與投入變數間的單變量分析結果。EM決策樹會對自變數進行一連串的切割動作,並將切割結果對目標變數進行卡方檢定或F檢定,當檢定結果的p-value越小,顯示投入變數越具有重要顯著性,對目標變數的各level值越具有鑑別解釋力。
在變數worth值報表,worth值的計算即是-Log(p),透過log函數的轉換,worth越大,即表示該變數對目標變數的影響解釋越大。同時報表結果會將所有投入變數依照重要順序排列。所以,在此一階段,分析者可以透由worth值報表的結果呈現,選取重要且具有實務解釋的變數當作分枝切點。理論上,會選取worth值最大的投入變數。
 
4.重複上述第3步驟,直到長到最適樹的結果。(決策樹最適修枝方法,請參考第四期的專欄內容)。
 
3
圖三:變數worth值報表
 
EM決策樹互動式模式除了提供分析者可以自行建置與調整模型(變數重要性順序)外,也可調整分支切點與分支數,點選變數worth值報表裡的Edit Rule功能按鈕,系統會跳出下圖視窗方框,透過New split point進行切點調整。
 
4
 
 
(下期續)
Tags
Share

About Author

SAS Taiwan

SAS 學習資源 : https://blogs.sas.com/content/sastaiwan/

Comments are closed.

Back to Top