接續上期專欄Dr.SAS將要介紹如何運用SAS EM來強化類神經網路的實用性: EM類神經網路主要參數功能以及如何透過決策樹分析解決類神經網路模型解釋性。
上期介紹類神經網路實務應用的模型建構流程如下,由迴歸分析解決類神經網路的變數選擇能力,避免模型過度配適,在前置資料處理則預先透過Impute節點進行遺失值檢查與補值工作,最後透過實用的決策樹節點來解決類神經網路模型難以解釋的問題。
解決類神經網路模型解釋之模型流程設計
第一步驟、連結Metadata Node節點,改變變數角色設定
1.至Utility工具頁籤點選Metadata Node節點,拖曳至工作畫布。
2.將Neural Network分析節點與Metadata Node節點相連結。
3.點選Metadata Node節點參數設定列Tran…
4.選定新的目標變數。
將類神經網路分析的目標變數(Target)的變數角色(Role)改成Reject,類神經網路模型分析所產出的預測變數(I_Target)的變數角色改成Target。
第二步驟、決策樹分析輔助類神經網路模型之解釋
- 至Model工具頁籤拖曳決策樹分析節點,與Metadata Node節點相連結。
此處的決策樹分析的節點功能,不是在建置一預測模型,其目的是用以輔助類神經網路的分析結果。Metadata節點的功能在於更改變數的資料屬性,包含變數角色與資料型態等,所以,在模型分析流程裡,串連Metadata節點的目的,在於更改新目標變數。此處的分析,將類神經網路分析的預測值結果當作新的目標變數,將新目標變數帶入決策樹分析,由決策樹模型來解釋類神經網路各重要變數的邏輯規則。
- 執行決策樹分析並檢視決策樹預測規則。
開啟Tree圖,可以發現此時的決策樹模型結果所得到的預測規則比單獨執行一個預測模型分析的結果還要精細,也可以說明為什麼類神經網路比較準確的原因。決策樹分析解決了類神經網路模型不易解釋的缺失,由logworth值表,也可以顯示類神經網路模型變數重要性順序,由Tree圖則可以顯示一條條潛在的預測解釋規則。
圖、決策樹解釋規則
類神經網路的參數設定調整建議
如何增加EM類神經網路的模型效能與彈性,主要的相關參數設定設在 Network選項裡。
幾個重要的參數選項設定包含隱藏層層數與隱藏層處理單元數的建議:
隱藏層層數
‧隱藏層數目以一到兩層具有最好的收斂效果
‧太多或太少其收斂效果較差
‧簡單問題取一層即可,複雜問題則取兩層
隱藏層處理單元數
EM類神經網路隱藏層預設值為3層,隱藏層不宜過多,過多層數,容易導致計算時間過長以及收斂結果變差。
Tags