経時的に変化する治療 (Time-varying treatments) に対する因果推論
はじめに 統計的因果推論に関する多くの書籍や文献では、その効果に興味のある特定の治療※1が1度だけ行われる場合の因果推論について紹介がされています。しかし、現実的には治療を複数回行い、それらの治療効果に興味がある場面も存在します。治療(介入)時点が複数ある例としては、新型コロナワクチンの接種がその最たるものかと思います。それ以外にもある集団(個人)に対して商品・サービスのレコメンド(e.g., DM、メール)を行い、その後の行動 (e.g., 購入) につながったかどうかを評価するなど、医学に限らず適用分野は多岐にわたります。 しかし、治療が複数回行われ各時点での治療レベルが異なりうる(時間の経過とともに治療が変化する)場合の因果推論は、その統計学的理論が比較的高度になってしまうこともあり、それほど認知されていないかと思います。そこで本コラムでは「治療が複数回行われた場合には因果推論を行うことがなぜ難しいのか」、「因果効果の推定はどのようにすればよいか」について可能な限り簡単に解説をし、SASでの実装方法にも触れていきたいと思います。 なお本コラムに関しては因果推論の基本的な理解があることを前提としています。必要がありましたら適宜関連書籍や因果推論に関する連載コラムを参考にしていただければ幸いです。 ※1 介入 (intervention) 、曝露 (exposure) であっても同様の議論 治療の分類("time-fixed" or "time-varying") 治療時点が複数ある場合の因果推論を理解するために重要なことは、まず治療自体を十分に理解することです。今回は簡潔な議論のために、治療は2時点 (t = 0, 1) で行われる2値変数 (e.g., 治療を受ける or 受けない) であり、アウトカム(目的変数)は研究の最終時点でのみ測定されるものとします※2。また解析の対象となる研究集団はfixed study populationであるとし※3、研究開始以降の治療による因果効果のみを興味の対象とします(研究開始以前の治療による効果は議論しない)。 ここで複数回行われる治療は、各時点の治療の取り方から以下の2つのいずれかに分類がされます。 Time-fixed treatment Time-varying treatment まず前者からその分類の定義を説明します。 治療がtime-fixedであるとは、研究対象集団におけるすべての被験者において、最初に行われる治療(ベースライン治療)が研究を通して変わらず継続的に実施されることを意味します。異なる言い方をするのであれば、一番初めの治療レベルがその後全ての治療レベルを決定する(同一なものとする)ということになります。 Time-fixed treatmentsに対する因果推論は比較的容易です。なぜならば、一番初めの治療がその後すべての治療を完全に決定するため、このコラムの後半で説明する時間依存性交絡 (time-dependent confounding) の問題は生じず、治療が一度だけ行われる場合と同様に、研究開始時点の共変量(ベースライン共変量)の調整を行うという議論に帰着するためです。すなわち、その調整を行う手法(回帰、マッチング、傾向スコアを用いた手法など)を適用することが可能です※4。 これに対し、time-fixedではない治療すべて、つまり各時点の治療が一番初めの治療レベルと異なりうる治療のことをtime-varying treatmentsと呼びます。例えば、治療を月に1回行われる運動指導とし各時点で取りうる行動が「自宅で何もしない(指導を受けない)」もしくは「運動指導を受けにいく」であるとしましょう。そして各時点での治療の選択が個人の意思に委ねられているとすると、気が向けば指導を受けますし、そうでなければ指導受けないといった判断が発生します。すなわち、各時点での治療レベルが異なる可能性があるわけです。 ここで、上記の状況における治療とアウトカムを以下のような記号で表すとします※5。 At:時点tにおける二値治療 (t = 0, 1)