十分感謝成功大學環境醫學所博士班候選人鄭雅勻熱心分享實作經驗範例~
希望藉由此經驗分享讓您練就分析資料的功力!
【認識健康保險資料庫與資料切割欄位剖析】
◆ 基本資料+原始資料:
健康保險資料庫組成的檔案,尤其以綠色字體部分在醫療公衛領域最常使用。
◆ 資料組成中英對照參考:在發表論文的時候必備
◆ 檔案間連結:使用箭頭旁邊的變項做為不同檔案之間合併的依據。
◆ 代碼說明、檔案格式:為網站上可以下載到的PDF檔案
裡面說明資料原始變項名稱與內部代碼所代表的意義。<必載祕笈>
※ 此處以健保外釋1000人教學練習檔中CD檔(門診處方及治療明細檔)反白為舉例
◆ 匯入資料:如何將原始數字格式(.DAT)的資料轉換成欄位資料
※ 此處以健保外釋1000人教學練習檔中2001年CD檔(門診處方及治療明細檔)為舉例
◆ 將資料匯入SAS-EG的介面
點選「檔案」→「匯入資料」
※此處以健保外釋1000人教學練習檔中2000年ID檔(承保資料檔)為舉例
● Enterprise Guide(EG) 介面介紹
STEP1. 將武功祕笈對照放在旁邊;,將「輸出SAS資料集」,經由「瀏覽」指定另存新檔位置 (指派專案資料館) &給予新檔案名稱。
※「指派專案資料館」:將資料永久存至指定的資料夾(舘)
STEP2.使用「固定欄位」模式:對照秘笈的變項「長度」定義黑色切割線位置,架構變數欄位。
例如:承保資料檔 ID 長度為 32 起始位置是 01-32;則在 SAS-EG 裡面的第 32 的位置點一下,就會出現黑色切割線。如果有點錯位置只要滑鼠左鍵點住黑色切割線即可以左右挪動唷!
STEP3.定義欄位屬性:
例如:承保資料檔中「ID」為英文欄位, 「個人身份證號」為中文欄位;分別填寫進去 EG 的「名稱」與「標籤」。
注意格式正確性:承保資料檔中「C」為”類別/字串”;承保資料檔中「N」為「連續/數字」; 日期變數只要格式無誤匯入SAS-EG應該就會自動辨識為「日期」變數。
STEP4. 承保資料檔ID中表頭總長度 ”107” 填入SAS-EG的「文字欄的最大紀錄長度位元組」 (代表每一筆個案資料總共只有107個字元):以利SAS-EG辨識區分每一筆不同個案資料。
最終以對照健保資料庫釋出時給予的原始”教學資料清單”excel. (檔案名稱、資料筆數、檔案大小),確認SAS-EG切割資料正確性(筆數)。
承保資料檔ID:共有 2464筆!!就恭喜您揭開健保資料庫的神秘面紗啦!
Tags