SAS Blogs

Advanced Analytics | Analytics | Artificial Intelligence | Data Management

小林泉June 21, 2025 0

自由と統制：変化しながらもガバナンスを担保するための唯一無二のData & AIプラットフォームとは

競争に勝つためのData & AI プラットフォームに完成はない「ガウディとサグラダ・ファミリアに学ぶデータ分析基盤アーキテクチャのための原則」で考察したように、変化し続ける市場や消費者、経済環境において、企業・組織が意志決定する対象やその内容は刻々と変化していきます。また、よりよい意志決定のためのData & AI活用のためのテクノロジーも日々変化していきます。そのような環境においては、従来のようなある一時点のユーザー要件に基づいてData & AI環境を準備することは、企業・組織の俊敏性を損ない、まだ見ぬ将来への変化対応力（レジリエンシー）を弱め、結果として常に世の中のトレンドから大きく遅れた後追いのData & AI活用になってしまいます。例えば以下のような状況に陥っているとすると、それはその企業・組織の戦略がそのような常に後追いにしかならない方法論で進めていることになります。「データ統合基盤」の過ち：あらたに「データ統合基盤」(*1) を構築しようとするが蓄積するデータが決まらずプロジェクトが開始できない、あるいは完了しない。また完了したと思ったのに使われない。「Data Lakehouseツール」の過ち：アジャイル型を標榜して、クラウド型の「Data Lakehouse用」のデータベースを安価に採用したが、ユーザーの利用が進むにつれてより多くのデータが必要になってきたときに、そのデータベースのコストが指数関数的に膨れ上がる価格モデルであったため、必要なデータが結局蓄積できないという結果になった「簡易なデータ分析ツール」の過ち：上記と同様にクラウドプラットフォームにほぼ無償でついてくるAI/機械学習機能でデータ分析をスタートする企業も多いです。しかし多くの企業が「データ分析始めました」の域を出ることができず、真にビジネス課題を解決するための機能が足らないことに気づかないまま、データ分析とはこの程度のものだと思い込み、結果として「始めましたプレゼンテーション」を最後に、真にビジネス価値を創出した事例発表に至ってない。「AIガードレールツール」の過ち：生成AIのテクノロジーを活用して、自社のビジネスを成長させたいが生成AIを安全に使うためのAIガードレールツールを選定したが、いざ導入してみると、そもそも生成AIを活用してビジネス価値を出す案件がなかったり、あるいはテクノロジーの進化が速いために、必要なガバナンス機能がすぐに変わってしまい、当初の投資金額だけでなく、その投資にかかった時間や人的リソースが無駄になってしまった「データモデル」の過ち：過去の経験のベストプラクティスとしてのデータモデルを導入したが、ある時点のデータモデルとして完成しすぎていて、新たな市場の要件に対応するために新たなデータを追加しようとした際に、対応できなかった「機能特化型パッケージツール」の過ち：たとえば、金融不正対策アプリケーションにおいては、不正の手法が常に変化する中対策に必要なデータやアルゴリズム・手法をどんどん変化させていく必要があるが、限定的なデータモデル、限定的なアルゴリズムしか持たないツールを採用してしまったために、不正対策をスピード感をもって進化させられていない *1) データ統合基盤の過ち補足：そもそも日本市場・日本語でよく聞く、この「データ統合基盤」という言葉が過ちを生み出している元凶でもあります。データ・マネージメントの目的は、「欲しいときに」、「欲しい形で」、「欲しい品質で」、「欲しい人が」特定のビジネス課題を解決するという目的を達成するためにデータを活用できることです。必ずしも一か所にデータが蓄積されている必要はありませんし、データは膨大なため利用頻度や重要度に応じて格納の仕方を変える必要もありますし、目的に応じて必要なデータやその結合の仕方も変わるため、「あらかじめ統合」しておくことにもあまり意味がありません。もちろん、過去データウェアハウスの時代には、一時的に企業の構造化データを一貫性をもってER図的に定義・実装したデータモデル・データベースが非常に役立った時代もあります。特にそれはアドバンスト・アナリティクスというよりは、レポーティングやOLAPによるデータ探索目的に役立ちました。一方で、機械学習や最適化などアルゴリズム的に高度なデータ分析や、昨今のように非構造化データを扱う場合には、常に新しいデータを使いたくなることが多く、あらかじめデータモデルで定義しておくことの価値は低くなります。なぜ常に時代遅れになりがちで、AIの取り組みの役に立たないData & AIプラットフォームを構築してしまうのか？上記のような様々な過ちに企業陥ってしまうのはなぜでしょうか？　20年ほど前は一部のアナリティクス成熟度が高い（例えばこちらを参照くださいデータリテラシーが経営者の嘆きを救う）企業だけが、解決したいビジネス課題とそれを解決した時の期待効果の試算に基づいてあるいは野心的に大規模にData & AIプラットフォームへの投資を、ユーザー部門が主に自分たちの予算で企画・導入していました。その後、テクノロジーの進化と共に、プログラマーニーズ、あるいはプログラミングを主たる作業とするデータサイエンティストニーズの高まりにより、データ分析、データサイエンスの取り組みのオーナーがあたかもIT部門やアプリケーションデベロッパーかのような時代になり、Data & AIプラットフォーム投資の意志決定のオーナーがITサイドに移動しました。手段であるIT、データサイエンス、機械学習やプログラミングの底力が高まるのは良いことなのですが、それにより、「ビジネス課題解決（収益向上・コスト削減・リスクの管理）」というData & AIプラットフォームの目的定義がおざなりになり、あたかもERPを導入するかのような要件定義の仕方でData & AIプラットフォームへの投資の仕方に代わってしまいました。従来は目的ありきで作っていたものが、流行にのって作ってしまってから、後から使い方を考えるという世界に変わってしまったのです。データ統合基盤を作ったのに使われないという嘆き（前述の別ブログを参照のこと）はまさにその象徴です。一方で、昨今の責任あるAIの視点から、ビジネスニーズに沿ってなんでもかんでも自由にやっていいわけではない少し前までは、AIは、「人間の特定のタスクを置き換えるもの」という定義でしたが、昨今は違います。AIは人間とは異なる方法で知性を身につけており、ときにそれは人間の能力をはるかに超える能力を発揮します。言い換えると、AIは人間の理解ややり方が及ばない方法で、知的なアクションを行えるようになっています。これは次のようなことを意味しています。人間の仕事が奪われるという視点は近視眼的：AIはすでに人間とは異なる方法で知性を身につけているので、従来の人間のタスクをそのまま置き換えるわけではありません。もちろんAIの能力を過小に使用して人間の従来のタスクをやらせても良いかもしれませんが、それはAIの潜在能力を生かし切っていません。これまで人間にはできなかったことができるAIを、これまで人間がやってこなかった仕事の量や質に当てはめて、仕事の仕方を効率化するのではなく、「変革」することができるという視点が重要です。我々は人間社会をより良くする必要がある：一方で、人間の能力を超えた知性を人間の社会活動に取り入れることには最新の注意が必要です。人間の能力を超えた知性を人間の知性で開発されたテクノロジーだけで統制することは不可能です。かつて人間は様々な人間の能力を超えたものを開発してきました。例えば自動車です。自動車の利用を統制するには法律やルールが必要だったように、AIの利用を統制するためにはテクノロジーだけではなくルールや法律が必要になってきます。人間中心のAI活用には人間のインクルージョンが不可欠：教育機関が生徒不在で「生徒はこれが欲しいはずだ」という取り組みを実施して失敗したり、イベントやマーケティングにおいて企画フェーズに実際のオーディエンスを参加させずに（実際の声を反映させずに）企画者が勝手に良かれと思った企画が失敗に終わるケースは後を絶ちません。オーディエンスが画一的ではなく多様化している今の時代「インクルージョン」が非常に大事になってきています。これは、SAS社が提供する責任あるイノベーションのためのリテラシートレーニング（Responsible Innovation and Trustworthy AI）で学ぶ内容です。AIにはデータが必要なため適切なリテラシーがないと現実世界を切り取っただけのバイアスだらけのデータだけを真実と見なしたAIアプリケーションが構築され、人間社会の倫理と公正性が危険にさらされます。AIアプリケーションの開発プロセスに人間が介在できるData & AIプラットフォームが求められます。 Data &

Japanese

Analytics

Yumiko OharaMarch 11, 2025 0

📣2025/4/7開催📣 PharmaSUG Japan SDE 2025/SAS登壇のご案内

PharmaSUG Japan SDE 2025が今年は対面で開催されます。本イベントは、製薬・医療データに関する最新のトピックや実践的な知見を共有する絶好の機会です。 SAS Institute Japanもこのイベントに登壇し、臨床試験やリアルワールドデータの分析生産性とコラボレーションの強化についてご紹介いたします。ぜひご参加ください。 💡 開催概要 •日時：2025年4月7日（月）10:00-18:00 (9:30受付開始) •会場：中外製薬株式会社 •参加費：75 USD（Winter Webinar登録者は50 USD） •主なプログラム PharmaSUG SDE Japan 2025 – PharmaSUG •オープンソースとAIの活用 – 製薬業界における最新の技術動向 •CDISC標準の実務適用 – 規制対応に関する最新情報 •Japan Programming Head Councilによるパネルディスカッション – 業界課題と今後の展望 🔷SAS Institute Japan 講演 •登壇者：土生　敏明　Sr Business Solutions Manager, Architecture & Platform Solution

Japanese

Health Care | Life Sciences

Analytics

鈴木徳太December 20, 2024 0

時間依存性治療（Time-varying treatments）の因果推論：周辺構造モデルにおけるIPTW法

注）　本コラムは『経時的に変化する治療（Time-varying treatments）に対する因果推論』と題した以前のコラムを、時間依存性治療に関する部分と周辺構造モデルにおけるIPTW法に関する部分に分割し、内容の追加と修正を行い再構成したものの一部となります。はじめに以前のコラムでは、「時間依存性治療とはなにか」、「時間依存性治療の因果効果はどのように定義されるのか」、「定義した因果効果はどう推定すれば良いか」について紹介しました。時間依存性治療の因果効果の推定にあたっては、一般に条件付けに基づく手法（e.g., 回帰、層別化、マッチング）は不適であり、g-methods※1と総称される推定手法が広く用いられています。本コラムでは、それらの中でも直感的な理解や実装が最も容易である「周辺構造モデルにおけるIPTW法（inverse probability of treatment weighting (IPTW) of marginal structural models (MSMs)」の理論とSASでの実装方法について簡単に紹介します。コラム全体の流れは以下の通りです。時間固定性治療（time-fixed treatments）※2に対する周辺構造モデルとIPTW法の紹介 IPTW法の概要周辺構造モデルの設定がなぜ必要か時間依存性治療（time-varying treatments）に対する周辺構造モデルとIPTW法の紹介 SASでの実装まとめなお、本コラムは統計的因果推論に関する基本的な理解があることを前提としております。また、文献や書籍によっては、IPTW（Inverse probability of treatment weighting）は、単にIPW（Inverse probability weighting）と記載される場合もあります。しかし、IPW（逆確率重み付け）は治療効果の直接的な推定を目的とした治療変数に関する重み付け以外にも、打ち切りに対する補正（i.e., 打ち切り変数に関する重み付け）等でも用いられることがあり、本コラムでは前者であることを強調するためにIPTWと記載します。加えて、本コラムでは連続もしくは二値であるアウトカム（結果変数）が、研究最終測定時点でのみ測定される状況を想定します。アウトカムが生存時間（time-to-event）である場合や各時点の治療実施後に繰り返し測定される場合など※3、異なる状況における議論についてはreferenceにある文献等をご参照いただくか、著者宛に別途ご連絡いただけると幸いです。 ※1　(i) Inverse probability of treatment weighting of marginal structural models（周辺構造モデルにおけるIPTW法）、(ii) g-computation algorithm formula（"g-formula"）、(iii) g-estimation of stractural nested model（構造ネストモデルにおけるg-estimation）のという3手法の総称

Japanese