在百貨公司周年慶企劃中,行銷經理想要挑出去年周年慶的客戶,作為今年周年慶公司寄送折扣商品刊物的名單。於是他想要從客戶購物資料中選出去年的所有消費者的資料。但在上百萬筆的消費帳單中,其實客戶可能只有數萬人,故行銷經理真正要找出的是這數萬筆消費者資料而非所有的銷售資料。又或是醫療單位想要從健保資料庫中挑選某疾病的病患,但是在資料庫中這些特定的病患都會看診數次,所以移除重複性的資料這個動作在處理資料時是很常用到的。
演練資料:下面將以銷售資料的某一部分(10筆)來當作我們演練刪除重複性的資料
![01 01](https://blogs.sas.com/content/sastaiwan/files/2020/02/522df6b1e81ba.jpg)
我們先將資料以客戶編號先排序,發現在這10筆資料中有3個人分別做了2次消費
![02 02](https://blogs.sas.com/content/sastaiwan/files/2020/02/522df6e6e1cb0.jpg)
以下將逐步示範要如何利用EG所提供的功能達到銷售經理的要求。
Step1. 選擇資料->排序資料
![03 03](https://blogs.sas.com/content/sastaiwan/files/2020/02/522df702d5e88.jpg)
Step2. 將客戶編號拖曳至右邊工作角色視窗中的排序依據
![04 04](https://blogs.sas.com/content/sastaiwan/files/2020/02/522df7e158770.jpg)
Step3. 選擇左邊的選項,點選重覆紀錄中的只保留每個[排序依據]群組的第一筆記錄。另外取消原本勾選的在[排序依據]群組內維持原始資料順序->執行
![05 05](https://blogs.sas.com/content/sastaiwan/files/2020/02/522df85c6abc1.jpg)
Step4. 從執行的結果可以發現原本多次消費的紀錄就只被保留一筆
![06 06](https://blogs.sas.com/content/sastaiwan/files/2020/02/522df8656ee67.jpg)
Tags