統計的因果推論 Posts

Analytics

鈴木徳太December 20, 2024 0

時間依存性治療（Time-varying treatments）の因果推論：周辺構造モデルにおけるIPTW法

注）　本コラムは『経時的に変化する治療（Time-varying treatments）に対する因果推論』と題した以前のコラムを、時間依存性治療に関する部分と周辺構造モデルにおけるIPTW法に関する部分に分割し、内容の追加と修正を行い再構成したものの一部となります。はじめに以前のコラムでは、「時間依存性治療とはなにか」、「時間依存性治療の因果効果はどのように定義されるのか」、「定義した因果効果はどう推定すれば良いか」について紹介しました。時間依存性治療の因果効果の推定にあたっては、一般に条件付けに基づく手法（e.g., 回帰、層別化、マッチング）は不適であり、g-methods※1と総称される推定手法が広く用いられています。本コラムでは、それらの中でも直感的な理解や実装が最も容易である「周辺構造モデルにおけるIPTW法（inverse probability of treatment weighting (IPTW) of marginal structural models (MSMs)」の理論とSASでの実装方法について簡単に紹介します。コラム全体の流れは以下の通りです。時間固定性治療（time-fixed treatments）※2に対する周辺構造モデルとIPTW法の紹介 IPTW法の概要周辺構造モデルの設定がなぜ必要か時間依存性治療（time-varying treatments）に対する周辺構造モデルとIPTW法の紹介 SASでの実装まとめなお、本コラムは統計的因果推論に関する基本的な理解があることを前提としております。また、文献や書籍によっては、IPTW（Inverse probability of treatment weighting）は、単にIPW（Inverse probability weighting）と記載される場合もあります。しかし、IPW（逆確率重み付け）は治療効果の直接的な推定を目的とした治療変数に関する重み付け以外にも、打ち切りに対する補正（i.e., 打ち切り変数に関する重み付け）等でも用いられることがあり、本コラムでは前者であることを強調するためにIPTWと記載します。加えて、本コラムでは連続もしくは二値であるアウトカム（結果変数）が、研究最終測定時点でのみ測定される状況を想定します。アウトカムが生存時間（time-to-event）である場合や各時点の治療実施後に繰り返し測定される場合など※3、異なる状況における議論についてはreferenceにある文献等をご参照いただくか、著者宛に別途ご連絡いただけると幸いです。 ※1　(i) Inverse probability of treatment weighting of marginal structural models（周辺構造モデルにおけるIPTW法）、(ii) g-computation algorithm formula（"g-formula"）、(iii) g-estimation of stractural nested model（構造ネストモデルにおけるg-estimation）のという3手法の総称

Japanese

Analytics | Students & Educators

鈴木徳太November 9, 2023 0

SASによる因果推論：PSMATCHプロシジャによる傾向スコアマッチング

はじめに因果効果の推定手法の1つである傾向スコアマッチング、およびSASでの実装方法について紹介します。傾向スコアマッチングのSASでの実装にあたっては、本記事ではSAS/STAT 14.2（SAS 9.4）で追加されましたPSMATCHプロシジャを使用します。因果推論の基本的な枠組みや傾向スコア・傾向スコアマッチングの統計的理論については、詳しく解説を行いませんので、そちらに関心がある方は書籍等を参考にしていただければ幸いです。理想的なランダム化比較試験においては、ランダム化により治療群と対照群間で測定・未測定の交絡因子（confounders）の分布が期待的に等しくなるため、単純な群間比較によって治療（介入、曝露）の興味のあるアウトカムに対する効果を評価することが可能です。しかし、ランダム化が行われなかった実験研究や観察研究のデータから因果関係を見出そうとする場合には、一般に交絡（confounding）と呼ばれるという問題が生じます。これは簡単に述べると、治療群と対照群で集団の特性が異なることで2つの集団が比較可能ではない状況、治療群と対照群でのアウトカムの違いが治療だけではなく集団の特性の違いにも依存する状況を意味しています。つまり、ランダム化が行われなかった実験研究や観察研究のデータから因果効果を推定する際には、交絡を十分に制御した上で群間比較を行う必要があり、世間一般で因果効果の推定手法と呼ばれるものは、交絡を調整方法する方法だと認識していただいてよいかと思います。因果効果の推定手法は回帰や層別化、標準化など様々なものがありますが、本記事ではマッチング法に注目します。マッチング法は、治療群と対照群から類似した特徴を持つ被験者をペアとし（マッチングさせ）、マッチした対象集団において治療を受けた群と受けなかった群を比較するという方法です。　ただ、一言にマッチング法と言っても複数の交絡因子（共変量）の情報をそのまま用いる「共変量マッチング」と、共変量の情報を傾向スコアという一次元の情報に落とし込んだ上でマッチングを行う「傾向スコアマッチング」という2つの方法に大きく分かれます。初学者にとっては前者の方がより直感的な方法かと思いますが、共変量が高次元である場合や変数のカテゴリ数が多い場合にはその実施が困難になります。そのような場合にしばしば用いられるのが後者の傾向スコアマッチングです。マッチングには、治療群と対照群の構成比率やマッチング方法など様々なオプションがありますが、傾向スコアの分布が同じ（治療群と対照群が交換可能）であるmatched populationを作成するというのが共通の考え方です。また、傾向スコアマッチングの実施手順は連続である単一の共変量を用いた共変量マッチングと同様であり、大きくは以下のような手順となります。【傾向スコアマッチング法のステップ】共変量の特定、測定傾向スコアのモデル指定、傾向スコアの推定マッチングアルゴリズムの決定、マッチングの実施マッチングした対象者で構成された集団（matched population）における治療群と対照群での交絡因子の分布評価 4.で評価した共変量が不均衡である場合には2.に戻る群間比較の実施推定結果の解釈記法と仮定記法以下の記法の下で傾向スコアマッチングに関する議論を行います。アルファベットの大文字は確率変数を、小文字はその実数値を意味するものとします。なお、以降でボ－ルド体としている場合は単一の変数ではなくベクトルであることを意味しているものとします。 A：二値の治療変数 Y：観察されるアウトカム Ya：潜在アウトカム X：共変量（一般にはベクトル）仮定本記事では以下の識別可能条件を仮定します。理想的なランダム化比較試験においては研究デザインによってその成立が認められますが、観察研究ではあくまで”仮定”となります。つまり、その成立を認めることが妥当であるかどうかの議論が別途必要となることにご注意ください。また、各条件の詳細や意図する内容については本記事では取り扱いませんので、他の記事や書籍等をご参照ください。【識別可能条件 (Identifiability assumptions) 】一致性 (consistency) If Ai = a, then YiA = Yia = Yi 特にAが二値であるとき、 Yi = AYia=1 + (1-A) Yia=0 条件付き交換可能性 (conditional

Japanese

Blogs

Blogs

Tag: 統計的因果推論