JPN Academic Posts

Tag: JPN Academic

Analytics

Sang-gil LeeMay 20, 2026 0

現代社会では、あらゆる場面で膨大なデータが生み出されている。重要なのは、それを整理し、次の判断に活かすことである。そのために必要なのが分析である。分析とは、今の状況をもとに、事実やデータを整理・解釈し、何が起きているか、なぜそうなったかを考えて判断に活かすことである。つまり分析は、事実にもとづいて判断するための手段となる。なぜ分析が必要なのか分析が必要なのは、物事の原因や背景を正しく理解するためである。結果だけを見て判断すると、本当の原因を見落とすことがある。例えば売上が下がったときも、価格や売り方、客層など複数の要因が考えられる。分析をすると、見るべきポイントが整理され、思い込みに左右されにくくなる。分析がないと何が問題になるのかすべての場面で分析が必要なわけではないが、事実を確認し、根拠を持って考える姿勢は重要である。分析をせずに判断すると、原因を見誤り、見当違いの対策や無駄につながりやすくなる。さらに、成功や失敗の理由も見えにくくなり、次に活かしにくくなる。その結果、判断の質が下がり、仕事の成果にも悪影響が及ぶことがある。分析をするとどんな良いことがあるか分析をすると、判断の質が上がる。数字や事実を根拠にできるため、説明しやすく、周囲の納得も得やすくなる。また、問題や機会に早く気づけるほか、限られた時間や人手、お金を必要なところに配分しやすくなる。さらに、成功や失敗を振り返り、次に活かしやすくなる点も利点である。具体例として、小売店では販売データの分析が判断の精度を高める。例えば、小売店では、販売データを分析することで、商品がいついくらでどれだけ売れるかを把握できる。すると、必要な量だけ仕入れたり、売れやすい場所に置いたりでき、売り切れや在庫過多を防ぎやすくなる。反対に、経験や勘だけで判断すると、需要の変化に対応できず、売上低下やコスト増加につながることがある。以上のように、分析は状況を正しく理解し、よりよい判断をするために欠かせない。分析を活用すれば、原因を把握しやすくなり、問題の発見や適切な対応にもつなげやすくなる。分析を実務に活かすには、考え方や進め方を体系的に学ぶことも有効である。参考情報として、SASでは分析思考力や基礎知識を学べるトレーニングを提供している。（分析基礎トレーニング | 分析基礎トレーニング-製造業編） 2026年5月末　相吉

Japanese

Analytics

鈴木徳太December 20, 2024 0

時間依存性治療（Time-varying treatments）の因果推論：周辺構造モデルにおけるIPTW法

注）　本コラムは『経時的に変化する治療（Time-varying treatments）に対する因果推論』と題した以前のコラムを、時間依存性治療に関する部分と周辺構造モデルにおけるIPTW法に関する部分に分割し、内容の追加と修正を行い再構成したものの一部となります。はじめに以前のコラムでは、「時間依存性治療とはなにか」、「時間依存性治療の因果効果はどのように定義されるのか」、「定義した因果効果はどう推定すれば良いか」について紹介しました。時間依存性治療の因果効果の推定にあたっては、一般に条件付けに基づく手法（e.g., 回帰、層別化、マッチング）は不適であり、g-methods※1と総称される推定手法が広く用いられています。本コラムでは、それらの中でも直感的な理解や実装が最も容易である「周辺構造モデルにおけるIPTW法（inverse probability of treatment weighting (IPTW) of marginal structural models (MSMs)」の理論とSASでの実装方法について簡単に紹介します。コラム全体の流れは以下の通りです。時間固定性治療（time-fixed treatments）※2に対する周辺構造モデルとIPTW法の紹介 IPTW法の概要周辺構造モデルの設定がなぜ必要か時間依存性治療（time-varying treatments）に対する周辺構造モデルとIPTW法の紹介 SASでの実装まとめなお、本コラムは統計的因果推論に関する基本的な理解があることを前提としております。また、文献や書籍によっては、IPTW（Inverse probability of treatment weighting）は、単にIPW（Inverse probability weighting）と記載される場合もあります。しかし、IPW（逆確率重み付け）は治療効果の直接的な推定を目的とした治療変数に関する重み付け以外にも、打ち切りに対する補正（i.e., 打ち切り変数に関する重み付け）等でも用いられることがあり、本コラムでは前者であることを強調するためにIPTWと記載します。加えて、本コラムでは連続もしくは二値であるアウトカム（結果変数）が、研究最終測定時点でのみ測定される状況を想定します。アウトカムが生存時間（time-to-event）である場合や各時点の治療実施後に繰り返し測定される場合など※3、異なる状況における議論についてはreferenceにある文献等をご参照いただくか、著者宛に別途ご連絡いただけると幸いです。 ※1　(i) Inverse probability of treatment weighting of marginal structural models（周辺構造モデルにおけるIPTW法）、(ii) g-computation algorithm formula（"g-formula"）、(iii) g-estimation of stractural nested model（構造ネストモデルにおけるg-estimation）のという3手法の総称

Japanese

Analytics | Students & Educators

鈴木徳太February 16, 2024 0

時間依存性治療（time-varying treatments）の因果推論：概論

注）　本コラムは『経時的に変化する治療（Time-varying treatments）に対する因果推論』と題した以前のコラムを、時間依存性治療に関する部分と周辺構造モデルにおけるIPTW法に関する部分に分割し、内容の追加と修正を行い再構成したものの一部となります。はじめに多くの統計的因果推論に関する書籍や文献では、ある治療※1が単時点で行われる場合の因果効果の推定手法について紹介がされています。しかし、治療が複数の時点にわたって実施され、その一連の治療による効果に興味があるという状況も存在するかと思います。例えば、新型コロナワクチンの接種が我々に身近な例として挙げられ、これ以外にも顧客に対する商品のレコメンデーションなど医学分野に限らず様々な例が挙げられます。正確な定義は後述しますが、上記で挙げたような複数の時点において実施され、かつ各時点での値が異なりうる（時間経過とともにとる値が変化しうる）治療は、時間依存性治療（time-varying treatments）と呼ばれます。時間依存性治療に対する因果推論へのニーズは、近年の統計的因果推論という言葉自体の認知の広まりや個別化医療への関心の高まりに相まって増加しています。一方で、その統計学的理論の理解は点治療の状況と比較すると内容が高度になることや日本語での文献が少ないことからそれほど進んでいません。そこで、本コラムでは時間依存性治療に対する効果をどのように定義するか、問題となることは何か、どのように効果の推定を行えばよいかについて簡単に解説を行います。また、いくつかの代表的な推定手法についてはSASでの実装方法も併せて紹介を行います。なお、本コラムは潜在アウトカムモデルの枠組みの下での因果推論について基本的な理解があることを前提としています。適宜関連する書籍や文献、因果推論に関する連載コラムをご参照していただければ幸いです。 ※1　本コラムにおいては、介入（intervention）や曝露（exposure）など他の原因となる変数を治療（treatment）と同義的に用いて構わないものとする因果推論を行う上での治療分類（"time-fixed" or "time-varying"）ある治療とアウトカムとの因果関係を議論する場合、治療はtime-fixed treatments（時間固定性治療）※2、もしくはtime-varying treatments（時間依存性治療）のいずれかに分類がされます。そして、このどちらに属するかによって扱いは大きく異なります。まず、治療が時間固定（time-fixed）であるとは、対象集団におけるすべての被験者に関して、初回の治療レベルが以降のすべての時点における各々の治療レベルを決定することを指します。この状況としては大きく3つあります。治療が研究開始時点でのみ行われる 1つ目は、治療がベースラインやtime zeroとも呼ばれる研究やプロジェクトの開始時点でのみ行われる場合です。一般的な臨床試験で投与される被験薬・対照薬や、一回の投与で完全な免疫を与えるone-dose vaccine（e.g., 黄熱病ワクチン）などが実例として挙げられます。初回の治療レベルが時間経過によって不変 2つ目は、初回の治療が2回目以降の治療時点においても変わらず継続的に行われる場合です。この状況の例としては、被験薬と対照薬の複数回投与が予定される臨床試験や近年いくつかの国で導入されているベーシックインカムといったものが挙げられるかと思います。決定論的に各時点の治療レベルが定まる 3つ目は、初回の治療レベルが決定論的にその後の治療レベルを定める場合です。すなわち、初回治療での分岐以降はそれぞれ1つの治療パターンとなる場合です。例えば、A群に割り付けられた被験者は隔週で被験薬を、B群に割り付けられた被験者は毎週対照薬を投与（初回治療が被験薬なら毎週投与、対照薬なら隔週投与）されるといった実験が1つの例として考えられます。また、Aチームに配属された選手は実践練習と模擬戦を、Bチームに配属された選手は基礎練習と筋力トレーニング（初回練習が応用練習ならその後は模擬戦、基礎練習なら筋力トレーニング）をそれぞれ1日の練習メニューとして行うといったものもスポーツの領域における例として考えられます。上記の分類からも類推されるように、治療が複数時点で行われるとしても2, 3の状況に該当する場合には、因果推論を行う上での扱いは治療が単時点で行われる場合と変わらず、ベースライン共変量の調整に基づく手法が適用可能です。これはすべての個人に関して初回治療によって2回目以降の治療が決定されるため、後述する時間依存性交絡（time-dependent confounding）という問題が生じ得ないためです。次に、時間依存性治療（time-varying treatments）とは時間固定でない治療すべてを指します。すなわち、複数時点で行われる治療であり、かつ各時点でとる値が初回の治療によって決定論的に定まらない治療が時間依存性治療にあたります。例えば、月に1回のペースで運動指導プログラムをある市において行うというプロジェクトを考えてみます。ここで、「初回指導に参加した場合は何があっても絶対に毎回参加しなければならない」や「初回指導に参加しなかった場合には絶対に以降参加できない」などといった特殊な制約がない限りは、各指導日でプログラムという2つの選択肢を市民は取ることができます。そのため、この運動指導というのは時間依存性治療にあたります。この他にも疫学研究における喫煙や投薬量が被験者の状態によって変更される処方、検索履歴に応じて表示される広告（レコメンド）など様々な曝露、治療、介入が時間依存の例として挙げられます。ただし、特に疫学・医学分野においては本質的には時間依存であるものの、測定の実現可能性から時間固定とされる場合もあります。また、対照的に研究・プロジェクトの計画時点では時間固定であるものの、研究実施後には時間依存であるとみなされる場合もあります。それが割付の不遵守（コンプライアンス違反）が存在する場合の治療です。例えば、上記の時間固定である治療の2番目のシナリオで紹介した継続的に被験薬と対照薬（実薬）を投与するという臨床試験においては、試験に参加する被験者が何らかの理由（e.g., 副作用の発現）で治療法を切り替える場合があります。このような状況においては、本来は時間固定であった治療を時間依存性治療とみなして解析（補正）を行うことが可能です。 ※2　執筆時点で対応する定訳が存在しないという筆者の認識であるが、本コラムにおいては時間固定性治療という訳をあてる治療レジメン（treatment regime）ここまでは因果推論を行う上での治療分類について紹介を行いましたが、以降では治療レジメンとその分類について紹介と解説を行います。これらは、因果効果の定義やデータを用いて効果を推定する（識別のために必要な仮定を検討する）場合に非常に重要になります。ここから先は数学的な内容も入りますので、以下のように記法をおきます。基本的にはアルファベットの大文字は確率変数を、小文字はその実現値を指しています。 k：時点を表す添字（k = 0, 1, ..., K） Ak：時点kにおける二値である時間依存性治療（1: あり, 0: なし） A0：k

Japanese

1 2 3 … 26 Next

Blogs

Blogs

Tag: JPN Academic