健保資料庫【系列5-3】資料處理與串聯檔案、歸戶(人)

0
thank you

STEP0.首先建立研究假說,才了解需要橫向串連哪些不同類型的資料檔案:
◆ 研究背景:
帕金森氏症(Parkinson’s disease)是中樞神經退化性疾病,症狀為動作緩慢、僵硬、顫抖及姿態不穩,好發於老年,病程長且疾病晚期會造成醫療資源及社會家庭的負擔。
◆ 研究目的:
都市化程度不同(北、中、南、東)在帕金森氏症的發生率、盛行率是否不同?
◆ 研究定義:
使用以健保外釋1000人教學練習檔中「門診醫療費用清單明細檔(CD)」定義疾病ICD-9-CM碼為332及A-Code為A221認定為帕金森氏症患者;並且串連Merge使用「承保資料檔(ID)」確認患者之居住地區。
1
請參照:【系列5-2】➔
STEP0.「指派專案資料館」模式➔此處建立「PK」資料館分析
STEP1-1. 排序ID資料並且「歸戶(人)」:點選「工作」➔「資料」➔「排序資料」
(原始ID資料「TDB_ID2000」因為包含有1,000人在2000年的加退保紀錄,所以共有2,464筆;所以進行歸戶只保留第一筆個案人口學資料 N=1,000,以利後續合併資料統計分析使用。)
2
STEP1-2. 在「資料」裡使用「ID」資料作為辨識重複觀察的「排序依據」,並且「遞增排序」
(如果想要使用最近一筆日期當作指標,「排序順序」則採用「遞減排序」)
3
STEP1-3. 在「選項」裡「重複記錄」中勾選”只保留每個[排序依據]群組的第一筆記錄
4
STEP1-4. 在「結果」裡面儲存資料位置瀏覽「本機-伺服器」裡面的「PK」資料夾。
5
STEP1-5. 另存新檔名稱「Sort_TDB_ID2001_1000P」
6
STEP1-6. 在「屬性」地方若不需要修改➔點選「執行」即可
7
STEP1-7. 在輸出資料可以看到總共1,000筆的個案資料被篩選出來。即完成歸戶(人)囉!
8
STEP1-8. 在「處理流程」處可以看到已排序的個案資料檔案。
9
10
STEP2-1. 將使用在上個單元已經合併好的「門診醫療費用清單明細檔(CD)1996_2001」;並且Merge聯結表格使用已經排序好的「承保資料檔(ID)2001」。
並在「CD_1996_2001」點選「右鍵」➔「查詢產生器」
11
STEP2-2. 在「查詢產生器」處點選「聯結表格」。
12
STEP2-3. 在「表格及連結」裡面點選「增加表格」。
13
STEP2-4. 在「開啟資料」裡面點選已經排序好的承保資料檔(ID)2001 ” Sort_TDB_ID2001_1000P”。
14
STEP2-5. 在”「表格及聯結」裡面出現連結方式EG預設為使用ID自動做「內部聯結」。
15
STEP2-6. 在交集的圓框點選「右鍵」➔點選「屬性」改變聯結方式。
(由於我們使用「門診醫療費用清單明細檔(CD)1996_2001」當作合併主體,不需要刪減資料;所以在「表格及連結」裡面改變連結方式為使用ID做”左側聯結”。)
16
STEP2-7. 在「連結屬性」點選「符合左表格中給定條件的所有列(左側聯結)」➔點選「確定」。
17
STEP2-8. 確認”「表格及聯結」裡面出現連結方式為使用ID做「左側聯結」後關閉即可。
19
STEP2-9. 回到「查詢產生器」處可以看到兩張表格的變項都出現在左側,點選t1(CD_1996_2001)的表頭出現反白後按住滑鼠左鍵整個拖曳至右側「選取資料」處。19
STEP2-10. 「查詢產生器」處左側視窗往下拉,點選t2(Sort_TDB_ID2001_1000P)的表頭出現反白後按住滑鼠左鍵整個拖曳至右側「選取資料」處。
20
STEP2-11. 「查詢產生器」最上方「查詢名稱」重新命名為「連結ID與CD」;「輸出名稱」重新命名為「MERGE_ID2001_CD_1996_2001」。
22
STEP2-12. 合併ID檔案後的資料因為包含1996年-2001年間1,000人的門急診資料,共有76,163人次的就診紀錄。
<另外請注意:由於結合兩筆不同資料來源之變項「ID」,所以合併的資料會看到內容一樣的ID與ID1同時出現;並不需要額外刪除,順便可以當作合併資料的檢誤依據喔!>
23
經過上面的招式展示後讓我們精益求精再進行一次歸戶練習:
假設現在想知道一千人承保檔案中,過去六年共有多少人使用健保資源?
 
STEP3-1. 排序合併資料並「歸戶(人)」:點選「工作」➔「資料」➔「排序資料」
(原始資料因為包含1996年-2001年間1,000人的門急診資料,共有76,163人次的就診紀錄;所以進行歸戶只保留第一筆個案資料,了解六年間共有多少人使用健保資源。)
24
STEP3-2. 在「資料」裡使用「ID」資料作為辨識重複觀察的「排序依據」,並且「遞增排序」
25
STEP3-3. 在「選項」裡「重複記錄」中勾選”只保留每個[排序依據]群組的第一筆記錄”
26
STEP3-4. 在「結果」裡面儲存資料位置瀏覽「本機-伺服器」裡面的「PK」資料夾,名稱為” Sort_Merge_ID2001_CD_1996_2001”
27
STEP3-5. 在「屬性」地方若不需要修改➔點選「執行」即可
27
STEP3-6. 在輸出資料可以看到總共957筆的個案資料被篩選出來。
(原始資料因為包含1996年-2001年1,000人的門急診資料,共有76,163人次的就診紀錄;所以進行歸戶只保留第一筆個案資料,了解六年間共有957人使用健保資源。)
28
◆ 習得本單元之功夫:就能夠解決不同資料間橫向的串聯檔案、歸戶(人)囉!
Tags
Share

About Author

SAS Taiwan

SAS 學習資源 : https://blogs.sas.com/content/sastaiwan/

Comments are closed.

Back to Top